From 461f417b9dfb7b7a14fbe65cf7c9191115b3f7b0 Mon Sep 17 00:00:00 2001
From: akerr <akerr@nvidia.com>
Date: Tue, 18 Sep 2018 16:58:03 -0700
Subject: [PATCH 1/4] Checkpointing CUTLASS 1.1 release.

---
 changelog.md => CHANGELOG.md                  |   18 +-
 CMakeLists.txt                                |   91 +-
 CUTLASS.md                                    |  311 ++++
 Doxyfile                                      |    2 +-
 README.md                                     |   79 +-
 clang-format.sh                               |   17 -
 cutlass/convert.h                             |    2 +-
 cutlass/coord.h                               |  160 +-
 cutlass/core_io.h                             |   90 +-
 cutlass/cutlass.h                             |   21 +-
 cutlass/fragment.h                            |   42 +-
 cutlass/fragment_load_store.h                 |  135 --
 cutlass/fragment_multiply_add.h               |   66 +-
 cutlass/gemm/clear_accumulators.h             |    7 +-
 cutlass/gemm/dgemm_traits.h                   |   39 +-
 cutlass/gemm/fp16_sgemm_multiply_add.h        |   83 +
 cutlass/gemm/fp16_sgemm_traits.h              |  152 ++
 cutlass/gemm/gemm.h                           |  305 ++--
 cutlass/gemm/gemm_config.h                    |  145 ++
 cutlass/gemm/gemm_coord.h                     |  203 +++
 cutlass/gemm/gemm_desc.h                      |  205 +++
 cutlass/gemm/gemm_epilogue.h                  |  105 +-
 cutlass/gemm/gemm_epilogue_traits.h           |   71 +-
 cutlass/gemm/gemm_global_stream.h             |  149 +-
 cutlass/gemm/gemm_global_tile.h               |  433 +++--
 cutlass/gemm/gemm_operand.h                   |    6 +-
 cutlass/gemm/gemm_shared_stream.h             |   41 +-
 cutlass/gemm/gemm_shared_tile.h               |    2 +-
 cutlass/gemm/gemm_stream_pair.h               |  251 +++
 cutlass/gemm/gemm_traits.h                    |  460 ++---
 cutlass/gemm/hgemm_global_tile.h              |   16 +-
 cutlass/gemm/hgemm_multiply_add.h             |   18 +-
 cutlass/gemm/hgemm_swizzle.h                  |    2 +-
 cutlass/gemm/hgemm_traits.h                   |  125 +-
 cutlass/gemm/igemm_epilogue.h                 |   28 +-
 cutlass/gemm/igemm_global_tile.h              |   57 +-
 cutlass/gemm/igemm_multiply_add.h             |   16 +-
 cutlass/gemm/igemm_swizzle.h                  |   12 +-
 cutlass/gemm/igemm_traits.h                   |  149 +-
 cutlass/gemm/linear_scaling.h                 |  100 +-
 cutlass/gemm/linear_scaling_device_ptr.h      |  149 ++
 cutlass/gemm/scalar_or_pointer.h              |  129 ++
 cutlass/gemm/sgemm_traits.h                   |  139 +-
 cutlass/gemm/thread_multiply_add.h            |   30 +-
 cutlass/gemm/threadblock_swizzle.h            |  387 +++++
 cutlass/gemm/wmma_gemm_epilogue_traits.h      |   25 +-
 cutlass/gemm/wmma_gemm_global_tile.h          |  132 +-
 cutlass/gemm/wmma_gemm_multiply_add.h         |  257 ++-
 cutlass/gemm/wmma_gemm_shared_tile.h          |    9 +-
 cutlass/gemm/wmma_gemm_traits.h               |  640 ++++++-
 cutlass/iterator_access.h                     |  255 +--
 cutlass/kernel_launch.h                       |   67 +
 cutlass/load_store.h                          |  261 ++-
 cutlass/matrix_traits.h                       |  326 +++-
 cutlass/predicate_vector.h                    |    9 +-
 cutlass/reshape_tile.h                        |    2 +-
 cutlass/shape.h                               |   75 +-
 cutlass/tensor_ref.h                          |  598 ++++++-
 cutlass/tensor_ref_collection.h               |  420 +++++
 cutlass/tensor_view.h                         |  228 ++-
 cutlass/tile_allocation.h                     |  143 ++
 cutlass/tile_coord.h                          |  194 +++
 cutlass/tile_iterator.h                       |  610 +++++--
 cutlass/tile_stream.h                         |  378 +++++
 cutlass/tile_traits_standard.h                |    8 +-
 cutlass/util/complex.h                        |  457 +++++
 cutlass/util/cutlass_math.h                   |   36 +-
 .../numeric_types.h}                          |   29 +-
 cutlass/util/platform.h                       |   10 +-
 cutlass/vector.h                              |  170 +-
 cutlass/wmma_matrix.h                         |   67 +-
 cutlass/zip_fragment.h                        |  150 ++
 cutlass/zip_tensor_ref.h                      |   77 +
 cutlass/zip_tile_iterator.h                   |  287 ++++
 examples/00_basic_gemm/CMakeLists.txt         |   38 +
 examples/00_basic_gemm/basic_gemm.cu          |  492 ++++++
 examples/01_tensor_view/CMakeLists.txt        |   38 +
 examples/01_tensor_view/tensor_view.cu        |  424 +++++
 examples/02_cutlass_utilities/CMakeLists.txt  |   38 +
 .../02_cutlass_utilities/cutlass_utilities.cu |  359 ++++
 .../03_strided_batched_gemm/CMakeLists.txt    |   38 +
 .../strided_batched_gemm.cu                   |  349 ++++
 examples/04_tile_iterator/CMakeLists.txt      |   38 +
 examples/04_tile_iterator/tile_iterator.cu    |  248 +++
 examples/05_wmma_gemm/CMakeLists.txt          |   38 +
 examples/05_wmma_gemm/wmma_gemm.cu            |  353 ++++
 examples/CMakeLists.txt                       |   28 +
 media/images/cutlass-threadblock-gemm.png     |  Bin 0 -> 60809 bytes
 media/images/cutlass-tile-iteration.png       |  Bin 0 -> 76377 bytes
 media/images/cutlass-tile-structure.png       |  Bin 0 -> 116377 bytes
 .../cutlass-warp-thread-tile-structure.png    |  Bin 0 -> 179689 bytes
 media/images/gemm-hierarchy-with-epilogue.png |  Bin 256654 -> 258829 bytes
 media/images/gemm-structural-components.png   |  Bin 0 -> 245863 bytes
 tools/test/perf/CMakeLists.txt                |    8 +-
 ...ass_perf_test.cpp => cutlass_perf_test.cu} |   60 +-
 tools/test/perf/cutlass_perf_test.h           |   44 +
 tools/test/perf/gemm/bmma_gemm.cu             |  121 ++
 tools/test/perf/gemm/cublas_dispatch.h        |    4 +-
 tools/test/perf/gemm/cutlass_dispatch.h       |   33 +-
 tools/test/perf/gemm/dgemm.cu                 |   50 +-
 tools/test/perf/gemm/gemm_perf_testbed.h      |  366 ++--
 tools/test/perf/gemm/gemm_profiler.h          |  192 ++-
 tools/test/perf/gemm/hgemm.cu                 |   78 +-
 tools/test/perf/gemm/igemm.cu                 |   92 +-
 tools/test/perf/gemm/sgemm.cu                 |   64 +-
 tools/test/perf/gemm/wmma_binary_gemm.cu      |  149 ++
 tools/test/perf/gemm/wmma_gemm.cu             |  197 ++-
 tools/test/perf/gemm/wmma_integer_gemm.cu     |  455 +++++
 tools/test/perf/performance_result.h          |  107 +-
 tools/test/perf/provider.h                    |   71 +
 tools/test/perf/testbench_configs.h           |  189 +++
 tools/test/perf/testbench_options.h           |  413 +++--
 tools/test/perf/testbench_output.h            |   46 +-
 tools/test/unit/CMakeLists.txt                |   25 +-
 tools/test/unit/core/layout_verification.cu   |    4 +-
 tools/test/unit/core/layout_verification.h    |   12 +-
 tools/test/unit/core/predicate_vector.cu      |  129 +-
 tools/test/unit/core/tensor_ref.cu            |  220 +++
 tools/test/unit/core/tensor_view.cu           |  235 +++
 tools/test/unit/core/tile_iterator.cu         |  258 +--
 tools/test/unit/core/zip_tile_iterator.cu     |  173 ++
 tools/test/unit/cutlass_unit_test.cpp         |   60 +-
 tools/test/unit/cutlass_unit_test.h           |    1 +
 .../gemm/batched_strided_dgemm_128x128x8.cu   |  103 ++
 .../gemm/batched_strided_hgemm_128x128x8.cu   |  112 ++
 .../gemm/batched_strided_sgemm_128x128x8.cu   |  135 ++
 tools/test/unit/gemm/binary_gemm.h            |   77 +
 tools/test/unit/gemm/dgemm.cu                 |   13 +-
 tools/test/unit/gemm/epilogue_functor.cu      |  121 ++
 .../unit/gemm/fp16_sgemm_fp16_128x128x16.cu   |  321 ++++
 .../unit/gemm/fp16_sgemm_fp32_128x128x16.cu   |  174 ++
 tools/test/unit/gemm/gemm_nvrtc.cu            |   14 +-
 tools/test/unit/gemm/gemm_nvrtc.h             |   16 +-
 .../test/unit/gemm/gemm_shared_mem_layouts.cu |  621 -------
 tools/test/unit/gemm/gemm_testbed.h           |  615 +++++--
 tools/test/unit/gemm/hgemm_128x128x16.cu      |   30 +-
 tools/test/unit/gemm/hgemm_128x128x8.cu       |   12 +-
 tools/test/unit/gemm/hgemm_128x32x8.cu        |   10 +-
 tools/test/unit/gemm/hgemm_128x64x8.cu        |   10 +-
 tools/test/unit/gemm/igemm_128x128x32.cu      |   45 +-
 .../test/unit/gemm/igemm_128x128x32_float.cu  |   46 +-
 tools/test/unit/gemm/igemm_128x128x32_int8.cu |   48 +-
 tools/test/unit/gemm/igemm_128x32x32.cu       |   49 +-
 tools/test/unit/gemm/igemm_128x64x32.cu       |   19 +-
 tools/test/unit/gemm/igemm_32x32x128.cu       |    8 +-
 .../test/unit/gemm/{gemm.h => integer_gemm.h} |   95 +-
 tools/test/unit/gemm/run_gemm.h               |  244 +++
 tools/test/unit/gemm/sgemm_128x128x16.cu      |   93 +-
 tools/test/unit/gemm/sgemm_128x128x8.cu       |   19 +-
 tools/test/unit/gemm/sgemm_128x32x16.cu       |   66 +-
 tools/test/unit/gemm/sgemm_128x32x8.cu        |   10 +-
 tools/test/unit/gemm/sgemm_128x64x16.cu       |   64 +-
 tools/test/unit/gemm/sgemm_128x64x8.cu        |   12 +-
 tools/test/unit/gemm/sgemm_64x128x16.cu       |   12 +-
 tools/test/unit/gemm/sgemm_64x128x8.cu        |   10 +-
 tools/test/unit/gemm/sgemm_64x32x16.cu        |   10 +-
 tools/test/unit/gemm/sgemm_64x32x8.cu         |   10 +-
 tools/test/unit/gemm/sgemm_64x64x16.cu        |   10 +-
 tools/test/unit/gemm/sgemm_64x64x8.cu         |   10 +-
 .../unit/gemm/sgemm_threadblock_swizzle_nn.cu | 1481 +++++++++++++++++
 .../unit/gemm/sgemm_threadblock_swizzle_nt.cu | 1481 +++++++++++++++++
 .../unit/gemm/sgemm_threadblock_swizzle_tn.cu | 1481 +++++++++++++++++
 .../unit/gemm/sgemm_threadblock_swizzle_tt.cu | 1481 +++++++++++++++++
 .../unit/gemm/warp_multiply_add_nvcuda.cu     |  276 +++
 tools/test/unit/gemm/wmma_binary_gemm.cu      |  236 +++
 tools/test/unit/gemm/wmma_gemm.cu             |  153 +-
 tools/test/unit/gemm/wmma_gemm_epilogue.cu    |  446 +++++
 .../unit/gemm/wmma_gemm_fragment_stream.cu    |  504 ++++++
 .../test/unit/gemm/wmma_gemm_multiply_add.cu  |  629 +++++++
 tools/test/unit/gemm/wmma_integer_gemm.cu     |  630 +++++++
 tools/test/unit/util/complex.cu               |  102 ++
 tools/test/unit/util/host_tensor.cu           |  384 ++++-
 tools/test/unit/util/tensor_elementwise.cu    |  324 ++++
 tools/test/unit/util/tensor_foreach.cu        |  217 +++
 tools/test/unit/util/unique_ptr.cu            |   25 +
 tools/util/command_line.h                     |   73 +-
 tools/util/device_memory.h                    |   27 +-
 tools/util/distribution.h                     |  138 ++
 tools/util/exceptions.h                       |    2 +-
 tools/util/half.h                             |   57 +-
 tools/util/host_matrix.h                      |  264 +++
 tools/util/host_matrix_view.h                 |  205 +++
 tools/util/host_tensor.h                      |  407 ++---
 tools/util/host_tensor_view.h                 |  445 +++--
 .../device/kernel/tensor_elementwise.h        |  162 ++
 .../reference/device/kernel/tensor_foreach.h  |  112 ++
 .../reference/device/tensor_elementwise.h     |  772 +++++++++
 tools/util/reference/device/tensor_foreach.h  |   72 +
 tools/util/reference/host/gemm.h              |  270 +++
 .../util/reference/host/tensor_elementwise.h  |  478 ++++++
 tools/util/reference/host/tensor_foreach.h    |  102 ++
 tools/util/tensor_view_io.h                   |  151 +-
 tools/util/type_traits.h                      |  111 +-
 193 files changed, 29496 insertions(+), 4771 deletions(-)
 rename changelog.md => CHANGELOG.md (77%)
 create mode 100644 CUTLASS.md
 delete mode 100755 clang-format.sh
 delete mode 100644 cutlass/fragment_load_store.h
 create mode 100644 cutlass/gemm/fp16_sgemm_multiply_add.h
 create mode 100644 cutlass/gemm/fp16_sgemm_traits.h
 create mode 100644 cutlass/gemm/gemm_config.h
 create mode 100644 cutlass/gemm/gemm_coord.h
 create mode 100644 cutlass/gemm/gemm_desc.h
 create mode 100644 cutlass/gemm/gemm_stream_pair.h
 create mode 100644 cutlass/gemm/linear_scaling_device_ptr.h
 create mode 100644 cutlass/gemm/scalar_or_pointer.h
 create mode 100644 cutlass/gemm/threadblock_swizzle.h
 create mode 100644 cutlass/kernel_launch.h
 create mode 100644 cutlass/tensor_ref_collection.h
 create mode 100644 cutlass/tile_allocation.h
 create mode 100644 cutlass/tile_coord.h
 create mode 100644 cutlass/tile_stream.h
 create mode 100644 cutlass/util/complex.h
 rename cutlass/{gemm/identity_block_swizzle.h => util/numeric_types.h} (79%)
 create mode 100644 cutlass/zip_fragment.h
 create mode 100644 cutlass/zip_tensor_ref.h
 create mode 100644 cutlass/zip_tile_iterator.h
 create mode 100644 examples/00_basic_gemm/CMakeLists.txt
 create mode 100644 examples/00_basic_gemm/basic_gemm.cu
 create mode 100644 examples/01_tensor_view/CMakeLists.txt
 create mode 100644 examples/01_tensor_view/tensor_view.cu
 create mode 100644 examples/02_cutlass_utilities/CMakeLists.txt
 create mode 100644 examples/02_cutlass_utilities/cutlass_utilities.cu
 create mode 100644 examples/03_strided_batched_gemm/CMakeLists.txt
 create mode 100644 examples/03_strided_batched_gemm/strided_batched_gemm.cu
 create mode 100644 examples/04_tile_iterator/CMakeLists.txt
 create mode 100644 examples/04_tile_iterator/tile_iterator.cu
 create mode 100644 examples/05_wmma_gemm/CMakeLists.txt
 create mode 100644 examples/05_wmma_gemm/wmma_gemm.cu
 create mode 100644 examples/CMakeLists.txt
 create mode 100644 media/images/cutlass-threadblock-gemm.png
 create mode 100644 media/images/cutlass-tile-iteration.png
 create mode 100644 media/images/cutlass-tile-structure.png
 create mode 100644 media/images/cutlass-warp-thread-tile-structure.png
 create mode 100644 media/images/gemm-structural-components.png
 rename tools/test/perf/{cutlass_perf_test.cpp => cutlass_perf_test.cu} (60%)
 create mode 100644 tools/test/perf/cutlass_perf_test.h
 create mode 100644 tools/test/perf/gemm/bmma_gemm.cu
 create mode 100644 tools/test/perf/gemm/wmma_binary_gemm.cu
 create mode 100644 tools/test/perf/gemm/wmma_integer_gemm.cu
 create mode 100644 tools/test/perf/provider.h
 create mode 100644 tools/test/perf/testbench_configs.h
 create mode 100644 tools/test/unit/core/tensor_ref.cu
 create mode 100644 tools/test/unit/core/tensor_view.cu
 create mode 100644 tools/test/unit/core/zip_tile_iterator.cu
 create mode 100644 tools/test/unit/gemm/batched_strided_dgemm_128x128x8.cu
 create mode 100644 tools/test/unit/gemm/batched_strided_hgemm_128x128x8.cu
 create mode 100644 tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu
 create mode 100644 tools/test/unit/gemm/binary_gemm.h
 create mode 100644 tools/test/unit/gemm/epilogue_functor.cu
 create mode 100644 tools/test/unit/gemm/fp16_sgemm_fp16_128x128x16.cu
 create mode 100644 tools/test/unit/gemm/fp16_sgemm_fp32_128x128x16.cu
 delete mode 100644 tools/test/unit/gemm/gemm_shared_mem_layouts.cu
 rename tools/test/unit/gemm/{gemm.h => integer_gemm.h} (53%)
 create mode 100644 tools/test/unit/gemm/run_gemm.h
 create mode 100644 tools/test/unit/gemm/sgemm_threadblock_swizzle_nn.cu
 create mode 100644 tools/test/unit/gemm/sgemm_threadblock_swizzle_nt.cu
 create mode 100644 tools/test/unit/gemm/sgemm_threadblock_swizzle_tn.cu
 create mode 100644 tools/test/unit/gemm/sgemm_threadblock_swizzle_tt.cu
 create mode 100644 tools/test/unit/gemm/warp_multiply_add_nvcuda.cu
 create mode 100644 tools/test/unit/gemm/wmma_binary_gemm.cu
 create mode 100644 tools/test/unit/gemm/wmma_gemm_epilogue.cu
 create mode 100644 tools/test/unit/gemm/wmma_gemm_fragment_stream.cu
 create mode 100644 tools/test/unit/gemm/wmma_gemm_multiply_add.cu
 create mode 100644 tools/test/unit/gemm/wmma_integer_gemm.cu
 create mode 100644 tools/test/unit/util/complex.cu
 create mode 100644 tools/test/unit/util/tensor_elementwise.cu
 create mode 100644 tools/test/unit/util/tensor_foreach.cu
 create mode 100644 tools/test/unit/util/unique_ptr.cu
 create mode 100644 tools/util/distribution.h
 create mode 100644 tools/util/host_matrix.h
 create mode 100644 tools/util/host_matrix_view.h
 create mode 100644 tools/util/reference/device/kernel/tensor_elementwise.h
 create mode 100644 tools/util/reference/device/kernel/tensor_foreach.h
 create mode 100644 tools/util/reference/device/tensor_elementwise.h
 create mode 100644 tools/util/reference/device/tensor_foreach.h
 create mode 100644 tools/util/reference/host/gemm.h
 create mode 100644 tools/util/reference/host/tensor_elementwise.h
 create mode 100644 tools/util/reference/host/tensor_foreach.h

diff --git a/changelog.md b/CHANGELOG.md
similarity index 77%
rename from changelog.md
rename to CHANGELOG.md
index d9ff1d5dd..73c2f7689 100644
--- a/changelog.md
+++ b/CHANGELOG.md
@@ -1,6 +1,22 @@
 # NVIDIA CUTLASS Changelog
 
-## [1.0.1](https://github.com/NVIDIA/cutlass/releases/tag/v1.0.1) (2018-06-11)
+
+## 1.1.0 (2018-09-19)
+  * Turing Features
+    * WMMA GEMM targeting TensorCores - INT8, INT4, INT1
+  * Batched Strided GEMM
+  * Threadblock rasterization strategies
+    * Improved performance for adverse problem sizes and data layouts
+  * Extended CUTLASS Core comonents
+    * Tensor views support arbitrary matrix and tensor layouts
+    * Zip iterators for structuring multiple data streams
+  * Enhanced CUTLASS utilities
+    * Reference code for tensor operations in host and device code
+    * Added HostMatrix<> for simplified matrix creation
+  * Examples
+    * Basic GEMM, tensor views, CUTLASS utilities, batched GEMM, WMMA GEMM
+
+## 1.0.1 (2018-06-11)
 
   * Intra-threadblock reduction added for small threadblock tile sizes
     * sgemm_64x128x16, sgemm_128x128x16, sgemm_128x64x16, sgemm_128x32x16, sgemm_64x64x16, sgemm_64x32x16
diff --git a/CMakeLists.txt b/CMakeLists.txt
index 5a53fae55..fdd51ae88 100644
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -55,11 +55,21 @@ endif()
 find_package(CUDA)
 find_package(Doxygen QUIET)
 
+###################################################################################################
+#
+# Configure CMake variables
+#
+###################################################################################################
+
+find_library(CUBLAS_LIBRARY cublas HINTS
+                                   ${CUDA_TOOLKIT_ROOT_DIR}/lib64
+                                   ${CUDA_TOOLKIT_ROOT_DIR}/lib/x64)
+
 # By default we want to build in Release mode to ensure that we're getting best performance
 if (NOT (CMAKE_BUILD_TYPE OR CONFIGURATION_TYPES))
   set(CMAKE_BUILD_TYPE Release CACHE STRING "Choose build level" FORCE)
   # We do support Debug or Release builds
-  set_property(CACHE CMAKE_BUILD_TYPE PROPERTY STRINGS "Debug" "Release")
+  set_property(CACHE CMAKE_BUILD_TYPE PROPERTY STRINGS "Debug" "RelWithDebInfo" "Release")
 endif()
 
 if(WIN32)
@@ -68,27 +78,59 @@ if(WIN32)
 endif()
 
 if (WIN32)
-  # Enable more warnings and treat as errors
-  string(APPEND NVCC_FLAGS " -Xcompiler /W3 -Xcompiler /WX")
+    # Enable more warnings and treat as errors
+    string(APPEND NVCC_FLAGS " -Xcompiler /W3 -Xcompiler /WX")
 
-  # Disable excess x86 floating point precision that can lead to results being labeled incorrectly
-  string(APPEND NVCC_FLAGS " -Xcompiler /fp:strict")
+    # Disable warning on Unicode characters
+    string(APPEND NVCC_FLAGS " -Xcompiler /wd4819")
 
-  # Verbose option
-  if (${CUTLASS_NVCC_VERBOSE})
-      string(APPEND NVCC_FLAGS " -v")
-  endif()
+    # Disable excess x86 floating point precision that can lead to results being labeled incorrectly
+    string(APPEND NVCC_FLAGS " -Xcompiler /fp:strict")
+
+    # Verbose option
+    if (${CUTLASS_NVCC_VERBOSE})
+        string(APPEND NVCC_FLAGS " -v")
+    endif()
 endif(WIN32)
 
-# Configure CUDA options
-set(CUTLASS_NVCC_ARCHS             "50;60;61;70"  CACHE STRING "The SM architectures to build code for.")
-set(CUTLASS_NVCC_KEEP              OFF            CACHE BOOL "Keep intermediate files generated by NVCC.")
+set(CUTLASS_NVCC_ARCHS "50;60;61;70;75" CACHE STRING "The SM architectures to build code for.")
+set(CUTLASS_NVCC_EMBED_CUBIN ON CACHE BOOL "Embed compiled CUDA kernel binaries into executables.")
+set(CUTLASS_NVCC_EMBED_PTX ON CACHE BOOL "Embed compiled PTX into executables.")
+set(CUTLASS_NVCC_KEEP OFF CACHE BOOL "Keep intermediate files generated by NVCC.")
 
+#
+# NOTE: running with asan and CUDA requires the following environment variable:
+#
+#  ASAN_OPTIONS=protect_shadow_gap=0:replace_intrin=0:detect_leaks=0
+#
+# without the above environment setting, an error like the following may be generated:
+#
+#  *** Error: Could not detect active GPU device ID [out of memory]
+#  ...
+#  ==9149==ERROR: LeakSanitizer: detected memory leaks
+#  ...
+#
+if(ENABLE_ASAN)  # https://github.com/google/sanitizers/wiki/AddressSanitizer
+  string(APPEND NVCC_FLAGS " --compiler-options -fsanitize=address --compiler-options -fno-omit-frame-pointer")
+  string(APPEND CMAKE_EXE_LINKER_FLAGS " -fsanitize=address")
+endif()
+
+###################################################################################################
+#
+# Configure CUDA build options
+#
+###################################################################################################
+
+# Set NVCC arguments
 foreach(ARCH ${CUTLASS_NVCC_ARCHS})
-  string(APPEND NVCC_FLAGS " -gencode arch=compute_${ARCH},code=sm_${ARCH}")
+  if(CUTLASS_NVCC_EMBED_CUBIN)
+    string(APPEND NVCC_FLAGS " -gencode arch=compute_${ARCH},code=sm_${ARCH}")
+  endif()
+  if(CUTLASS_NVCC_EMBED_PTX)
+    string(APPEND NVCC_FLAGS " -gencode arch=compute_${ARCH},code=compute_${ARCH}")
+  endif()
 endforeach()
 
-
 if (CUTLASS_NVCC_KEEP)
     string(APPEND NVCC_FLAGS " -keep")
 endif()
@@ -99,11 +141,8 @@ else()
   string(APPEND NVCC_FLAGS " -lineinfo")
 endif()
 
-if (UNIX)
-  string(APPEND NVCC_FLAGS " -Xcompiler -Wconversion")
-endif()
-
 string(APPEND NVCC_FLAGS_DEBUG " -g")
+string(APPEND NVCC_FLAGS_RELWITHDEBINFO " -O3")
 string(APPEND NVCC_FLAGS_RELEASE " -O3")
 
 # define NDEBUG for release mode to disable assertions
@@ -111,11 +150,13 @@ string(APPEND NVCC_FLAGS_RELEASE " -DNDEBUG")
 
 if (CUTLASS_NATIVE_CUDA)
   set(CMAKE_CUDA_FLAGS "${NVCC_FLAGS}")
-  set(CMAKE_CUDA_FLAGS_DEBUG "${NVCC_FLAGS_DEBUG}")
   set(CMAKE_CUDA_FLAGS_RELEASE "${NVCC_FLAGS_RELEASE}")
+  set(CMAKE_CUDA_FLAGS_RELWITHDEBINFO "${NVCC_FLAGS_RELWITHDEBINFO}")
+  set(CMAKE_CUDA_FLAGS_DEBUG "${NVCC_FLAGS_DEBUG}")
 else()
   set(CUDA_NVCC_FLAGS ${NVCC_FLAGS})
   set(CUDA_NVCC_FLAGS_DEBUG ${NVCC_FLAGS_DEBUG})
+  set(CUDA_NVCC_FLAGS_RELWITHDEBINFO ${NVCC_FLAGS_RELWITHDEBINFO})
   set(CUDA_NVCC_FLAGS_RELEASE ${NVCC_FLAGS_RELEASE})
 endif()
 
@@ -128,6 +169,11 @@ file(GLOB CUTLASS_GEMM RELATIVE ${CMAKE_CURRENT_SOURCE_DIR} cutlass/gemm/*.h)
 file(GLOB CUTLASS_UTIL RELATIVE ${CMAKE_CURRENT_SOURCE_DIR} cutlass/util/*.h)
 file(GLOB CUTLASS_DEVICE RELATIVE ${CMAKE_CURRENT_SOURCE_DIR} cutlass/device/*.h)
 file(GLOB CUTLASS_CORE RELATIVE ${CMAKE_CURRENT_SOURCE_DIR} cutlass/*.h)
+###################################################################################################
+#
+# Define build targets
+#
+###################################################################################################
 
 source_group("cutlass\\gemm" FILES ${CUTLASS_GEMM})
 source_group("cutlass\\util" FILES ${CUTLASS_UTIL})
@@ -156,9 +202,9 @@ add_custom_target(cutlass_ide SOURCES
 if (DOXYGEN_FOUND)
     # DOT is available. Enable graph generation in the documentation
     if (DOXYGEN_DOT_EXECUTABLE)
-        set(CUTLASS_ENABLE_DOXYGEN_DOT              ON            CACHE BOOL "Use dot to generate graphs in the doxygen documentation.")
+        set(CUTLASS_ENABLE_DOXYGEN_DOT ON CACHE BOOL "Use dot to generate graphs in the doxygen documentation.")
     else()
-        set(CUTLASS_ENABLE_DOXYGEN_DOT              OFF            CACHE BOOL "Use dot to generate graphs in the doxygen documentation." FORCE)
+        set(CUTLASS_ENABLE_DOXYGEN_DOT OFF CACHE BOOL "Use dot to generate graphs in the doxygen documentation." FORCE)
     endif()
 
     if (CUTLASS_ENABLE_DOXYGEN_DOT)
@@ -177,6 +223,5 @@ if (DOXYGEN_FOUND)
     )
 endif()
 
-
-#add_subdirectory(examples/gemm)
 add_subdirectory(tools)
+add_subdirectory(examples)
diff --git a/CUTLASS.md b/CUTLASS.md
new file mode 100644
index 000000000..7dea0f372
--- /dev/null
+++ b/CUTLASS.md
@@ -0,0 +1,311 @@
+![ALT](/media/images/gemm-hierarchy-with-epilogue-no-labels.png "Complete CUDA GEMM decomposition")
+
+# CUTLASS
+
+This document is intended to accompany the CUTLASS source code, to describe the interaction between
+CUTLASS core components, and to identify their role in implementing GEMM computations efficiently in CUDA.
+
+1. [Design Patterns](#S-design-patterns)
+2. [General Matrix Multiply](#S-general-matrix-multiply)
+3. [Core Components](#S-core-components)
+4. [Utilities](#S-utilities)
+
+# <a name="S-design-patterns"></a> 1. Design Patterns
+
+CUTLASS strives to achieve the highest performance possible on NVIDIA GPUs while also offering a
+flexible composition that an be easily applied to solve new problems related to Deep Learning and
+linear algebra. Though we intend to make CUTLASS as simple and straightforward as possible, given
+a tradeoff between simplicity and performance, CUTLASS chooses performance. Consequently, several
+design patterns are necessary to yield a composable structure while also satisfying these performance
+objectives. This section is intended to provide more detail.
+
+* [Sequencing and Nesting](#S-patterns-sequencing-nesting)
+* [Tiles and Iterators](#S-patterns-tiles-iterators)
+* [Host-side Params](#S-patterns-host-side-params)
+* [Composable Shared Memory](#S-patterns-composable-shared-memory)
+
+## <a name="S-patterns-sequencing-nesting"></a> Sequencing and Nesting of Collective Primitives
+
+CUTLASS embodies a design paradigm exemplified by the [CUB library](https://nvlabs.github.io/cub/) for expressing collective operations. Objects expose an interface for a problem that is then decomposed into concurrent subtasks executed by cooperating threadblocks, warps, and threads. For example, a grid-level object may be constructed with base pointers to the start of a GEMM operation, add a threadblock-dependent offset to partition the problem, and then compute a per-threadblock GEMM. This in turn performs some operations as a collection of cooperating threads, while it may partition other parts of the task into warp-level subtasks. 
+
+## <a name="S-patterns-tiles-iterators"></a> Tiles and Iterators
+
+Efficient dense linear algebra computations emphasize data movement to match the execution of mathemtical operators to the flow of data. Consequently, CUTLASS defines a rich set of primitives for partitioning a tile of data among participating threads, warps, and threadblocks. CUTLASS applies the familiar iterator design pattern to provide an abstraction layer to (1.) access these tile objects and (2.) traverse a sequence of objects embedded in a higher level data structure. These subpartitions are typically defined by compile-time constants
+specifying element type, size, and data layout. CUTLASS refers to subpartitions as _tiles_.
+
+_Iterators_ are familiar design patterns in C++ that provide an abstraction for accessing individual
+elements in memory as well as traversing over a collection. GEMM kernels in CUTLASS depend on accessing
+a sequence of tiles from global memory, from shared memory, and in registers. Consequently, _tile iterators_
+are prevalent throughout the CUTLASS implementation.
+
+The canonical CUTLASS tile iterator template is defined in [cutlass/tile_iterator.h](cutlass/tile_iterator.h).
+
+## <a name="S-patterns-host-side-params"></a> Host-side Params structure
+
+Several CUTLASS template classes exhibit a pattern in which problem-specific internal state is known at kernel launch time and remains invariant throughout the execution of a kernel. For example, tile iterators compute several offsets based on the strides of the input tensor that is added to an internal pointer when loading the elements of a tile. These are computed from the tensor stride and never updated; the per-thread internal state consists only of the internal global memory pointer.
+
+CUTLASS can take advantage of this CUDA grid-invariant property by constructing the object in host code and passing a composed parameters structure to the kernel. This confers two benefits: (1.) invariant state is held in constant memory, and (2.) there is no overhead to compute the initial state by each thread.
+
+The design pattern in CUTLASS is for classes with nontrivial constructors to define `struct Params` as an inner class which contains grid-invariant state. These should define a constructor and an `initialize()` method. The `Params` structure should also include a data member corresponding to each data member in the parent class, so these too can be properly constructed in host code. The parent class should define a constructor which accepts `Params const &` as its first argument.
+
+For example, `cutlass::gemm::Gemm<>` should define `struct cutlass::gemm::Gemm::Params`. The latter should define data members for each data member in `cutlass::gemm::Gemm<>`. 
+
+
+## <a name="S-patterns-composable-shared-memory"></a> Composable shared memory allocation
+
+Shared memory requires explicit effort by the programmer to allocate and de-allocate. CUTLASS follows the paradigm introduced by [CUB](https://nvlabs.github.io/cub/) to define composed structures for storing data intended to be held in shared memory. Any object requiring shared memory storage for itself or its data members should define a child structure called SharedStorage. This holds data needed by the class and also instantiates SharedStorage objects for each data member.
+
+To be consistent, this pattern defines a convention in which classes define internal shared memory storage requirements. Classes should consider all SharedStorage structures to be opaque other than their own child class. When the lifetimes of child objects are known to be non-overlapping, unions may be used to alias multiple SharedStorage objects to the same shared memory region and reduce overall SMEM capacity.
+
+## <a name="S-patterns-loop-unrolling"></a> Loop Unrolling
+
+CUTLASS requires tiles of data to be stored in registers for high-bandwidth access. Simultaneously, high-throughput math instructions
+must be issued concurrently with memory instructions to hide latency with relatively few concurrent threads. These objectives are
+achieved by unrolling loops whose iteration counts are known at compile time.
+
+Consequently, most loops within the CUTLASS GEMM implementation are specified by constant values and template arguments. The CUDA compiler
+is able to unroll the loop bodies, map array elements to registers, and construct an efficient instruction schedule.
+
+## <a name="S-patterns-loop-unrolling"></a> Templates
+
+CUDA C++ templates and modern generic programming techniques enable CUTLASS device code to span a large design space.
+
+This design space includes:
+* Mixed precision arithmetic and data storage
+* Kernels specialized for layout and problem size
+* Support for kernel fusion
+
+Moreover, templates provided a structured approach to collecting compile-time constants such as tile dimensions. These
+must be template arguments to target static array allocation and take advantage of loop unrolling, constant folding,
+and function inlining.
+
+# <a name="S-general-matrix-multiply"></a> 2. General Matrix Multiply
+
+The following figure illustrates the hierarchical GEMM computation embodied by CUTLASS. Each stage depicts a nested level of tiling which corresponds to a layer of concurrency within the CUDA execution model and to a level within the memory hierarchy, becoming increasingly finer moving left to right.
+
+![ALT](/media/images/gemm-structural-components.png "CUTLASS GEMM Structural Components")
+
+## Threadblock-level GEMM
+
+The CUTLASS GEMM kernel partitions the _C_ matrix into a 2D tiling of threadblocks.
+Each threadblock computes a matrix product whose outer dimensions _M_ and _N_ are compile-time constants. The
+GEMM's _K_ dimension is partitioned into tiles and iterated over by the GEMM _mainloop_. The shape of the matrix
+multiply operation performed by each iteration of the mainloop is referred to as _OutputTile_.
+
+The threadblock loads a sequence of tiles from global memory and stores this data to shared memory. The iterative
+access and traversal of tiles in global memory are performed by a _TileLoadIterator_, and storing to a circular
+buffer in shared memory is performed by a _GlobalLoadIterator_. 
+
+**[Global Load Stream](cutlass/gemm/gemm_global_stream.h)** manages loading of the threadblock-scope multiplicands to the GEMM kernel. It owns an iterator into global memory for loading tiles of data, a TensorAllocation in shared memory to hold the resulting tile, and an iterator for writing the tile into this allocation. A transformer exists to optionally transform the data as it is loaded which may of use to perform type conversion or, in the case of int8 GEMM, transpose 4x4 tiles held in registers.
+
+The Global Load Stream template contains members defined by the following templates:
+
+* [GemmGlobalIteratorAb](cutlass/gemm/gemm_global_tile.h)
+* [Transformer](cutlass/convert.h)
+* [GemmSharedStoreTileAb](cutlass/gemm/gemm_shared_tile.h)
+
+## Warp-level GEMM
+
+The threadblock's _OutputTile_ is partitioned among the warps, and each computes a warp-level matrix product.
+Data is loaded from shared memory into registers, and math instructions are dispatched to CUDA Cores or Tensor Cores.
+
+[**Shared Load Stream**](cutlass/gemm/gemm_shared_stream.h) manages loading of warp-level multiplicands from shared memory into registers. This owns an iterator for fetching data and the destination fragments for holding the results. 
+
+* [GemmSharedLoadTile{A,B}](cutlass/gemm/gemm_shared_tile.h)
+
+**Matrix Multiply** computes a matrix product operation on data held in registers. Specializations exist for thread-level instructions such as single-precision fused multiply-add as well as warp-level matrix operations targeting TensorCores. 
+
+* [WMMA Multiply Add](cutlass/gemm/wmma_gemm_multiply_add.h)
+
+## Thread-level GEMM
+
+SGEMM, IGEMM, HGEMM, and DGEMM are computed by SIMT math instructions issued by thread-level matrix multiply
+procedures. 
+
+* [ThreadMultiplyAdd](cutlass/gemm/thread_multiply_add.h)
+* [IGEMM specialization](cutlass/gemm/igemm_multiply_add.h)
+* [HGEMM specialization](cutlass/gemm/hgemm_multiply_add.h)
+
+## Epilogue 
+
+The [**epilogue**](cutlass/gemm/gemm_epilogue.h) iteratively selects a subset of accumulator elements held by a warp, writes them to shared memory, and loads them by different threads such that a threadblock-scoped tile store operation will make contiguous, striped accesses to global memory. Thus, the flow of data utilizes the following components:
+
+1. [Transformer](cutlass/convert.h) for converting the data types of accumulator elements
+2. [GemmSharedStoreTileD](cutlass/gemm/gemm_shared_tile.h) to store to shared memory specialized to the accumulator layout.
+3. [GemmSharedLoadTileD](cutlass/gemm/gemm_shared_tile.h) to load the data from shared memory.
+4. [GemmGlobalIteratorC](cutlass/gemm/gemm_global_tile.h) to load a tile from global memory.
+5. A [functor](cutlass/gemm/linear_scaling.h) to compute an element-wise operation on the matrix product and source data (such as alpha*AB+beta*C).
+6. [GemmGlobalIteratorD](cutlass/gemm/gemm_global_tile.h) to write the output to global memory.
+
+## GEMM Traits
+
+[**cutlass::gemm::GemmTraits**](cutlass/gemm/gemm_traits.h) collects the structural properties of a complete GEMM computation into a single template class. As a result, the Traits classes encapsulate the the iterators and transformers for all supported GEMM operands and layouts. Low-level details needed by Traits (such as scalar types for operands, thread-block tile size, number of scalar elements per memory access within each phase, number of stages in shared memory, as well as other implementation-specific properties of the GEMM computation) are specified in class [**cutlass::gemm::GemmConfig**](cutlass/gemm/gemm_config.h).
+
+
+# <a name="S-core-components"></a> 3. Core Components
+
+CUTLASS GEMM kernels are implemented by a set of Core components for interacting with mathematical tensor and matrix
+objects as well as constructing efficient CUDA kernels.
+
+* [Tensor views](#S-core-tensor-views)
+* [Shape](#S-core-shape)
+* [Tile structure](#S-core-tile-structure)
+* [Fragment](#S-core-fragment)
+* [Predicate vector](#S-core-predicate-vector)
+
+## <a name="S-core-tensor-views"></a> Tensor View
+
+Matrices and tensors are typically represented as n-D arrays held in linear memory with a single base pointer and a stride vector. Element _i_ of the stride vector indicates the offset in linear memory between consecutive elements in dimension i. Consequently, the linear offset for an arbitrary element specified as an n-tuple may be computed as the dot product of the coordinate and the stride vector.
+
+CUTLASS provides abstractions for interacting with multidimension tensors in device memory.
+Consequently, we define a hierarchy of pointer-like types for referencing tensors.
+
+`T *` - raw pointer to elements of type T
+
+`cutlass::TensorRef<T, Rank>`  - reference to a tensor of elements of type T and given rank. Includes a mapping function and associated stride vector for accessing elements in linear memory.
+
+`cutlass::TensorView<T, Rank>` - extends `TensorRef<>` by adding bounds information. This is a complete mathematical object which may be used as the argument to CUTLASS functions.
+
+The above provide an identity maping of a logical index space to linear memory. An element
+at logical coordinate X has an offset computed as follows:
+```
+offset = dot(X, stride)
+```
+where `dot()` computes the inner product of X and a vector of "strides."
+
+CUTLASS 1.1 introduces a mapping function and an additional "storage rank" to offer a flexible way to
+map the logical index space of the tensor to memory. The mapping function maps a coordinate
+of rank _R_ to an index space of rank _S_. The linear offset is computed as:
+```
+offset = dot( MapFunc(X), stride )
+```
+where stride is a vector of rank _S_.
+
+CUTLASS kernels make extensive use of vectorization of memory accesses for efficiency and
+correctness. Consequently, we enforce a constraint on the strides used by mapping functions
+such that:
+
+1. The "fastest-changing" stride is always 1 thereby mandating that consecutive elements in
+   that rank are consecutive in linear memory.
+
+2. The fastest changing rank is always last in the stride vector and not explicitly stored.
+
+Thus, the stride vector used by mapping functions has length of one fewer than the rank of the
+storage tensor. These constraints are consistent with the BLAS interface of passing matrices as
+a tuple consisting of a pointer and a "leading dimension." In fact, these are rank=2 tensors
+whose fastest changing dimension is 1, and only the strided dimension is explicitly represented.
+
+A typical mapping function might simply map the rows and columns of a matrix, a rank=2 tensor,
+to linear memory such that (1.) elements in the same column are consecutive in memory
+(column-major), or (2.) elements in the same row are consecutive (row-major). These can be
+accomplished by two different mapping functions whose stride vector is length=2. The first
+element is the "leading dimension."
+
+The requirement that the fastest-changing stride always be of unit size need not be a limitation.
+To implement "sparse" computations or matrix operations in which matrix elements have arbitrary
+stride along both row and column, define a mapping function whose storage rank is 3. This permits
+two elements of the stride vector to have a non-unit value.
+
+`cutlass::TensorView<>` extends this concept by including a size vector to specify the bounds of
+the index space. The value of each coordinate in the size vector defines the half-open range of
+indices whose smallest value is zero.
+
+## <a name="S-core-shape"></a> Shape
+
+To avoid complicated template metaprogramming, CUTLASS targets fixed compile-time tile sizes specified
+by a four-dimensional template `cutlass::Shape<>`. This defines the following dimensions, mirroring
+the NHWC tensor format used for convolution in Deep Learning frameworks.
+
+- `D`: depth of tensor
+- `H`: first strided dimension
+- `W`: contiguous sequence of tensor elements
+- `C`: number of channels, usually used for vectorized access
+
+Template specializations of `Shape` appear as arguments to numerous dependent template classes which
+must specify compile-time constant tile sizes.
+
+## <a name="S-core-tile-structure"></a> Tile Structure
+
+Tiled structures express an arrangement of data in memory as well as a logical mapping of concurrent CUDA
+threads to the problem space. For example, the CUTLASS GEMM 
+
+Tiled structures can be defined using the `cutlass::TileTraits<>` concept which defines the following
+members. Collectively, these members offer a flexible way to define a 4-D subpartition of an integer
+lattice, partition its elements among a collection of threads, and map each unique thread ID to a unique
+offset.
+
+- _Tile_ (concept `Shape<>`) - describes the dimensions of the tile in terms of scalar elements
+- _Delta_ (concept `Shape<>`) - describes the distance along each logical dimension between items
+- _Iterations_ (concept `Shape<>`) - describes the number of items along each logical dimension
+- _ThreadOffset_ (concept _functor_) - implements `Coord<4> operator()() const` to determine a thread's
+  initial offset in the logical 4-D coordinate space
+
+The following figure illustrates the CUTLASS tile structure. The overall shape, 16-by-16, is partitioned into
+vectors of length two among 32 threads. The elements stored by thread 9 are highlighted.
+
+<img src="/media/images/cutlass-tile-structure.png" alt="CUTLASS tile structure" width="30%" />
+
+The `cutlass::TileTraits<>` definition that describes this arrangement may be defined as follows:
+
+```
+struct ExampleTileTraits {
+
+  /// Overall shape of tile
+  typedef Shape<1, 16, 16, 1> Tile;
+
+  /// Distance along each dimension of accesses
+  typedef Shape<1, 4, 1, 1> Delta;
+
+  /// Number of memory accesses performed by each thread
+  typedef Shape<1, 4, 1, 1> Iterations;
+
+  /// Offset function - maps each thread to a unique starting offset within the 4D tile
+  struct ThreadOffset {
+
+    CUTLASS_DEVICE Coord<4> operator()() const {
+
+      typdef Shape<1, 16, 8, 2> Vectorized;
+
+      return make_Coord(
+        0,                              // depth "D" dimension
+        threadIdx.x / Vectorized::kW,   // horisontal "H" dimension - first strided dimension
+        threadIdx.x % Vectorized::kW,   // vertical "W" dimension - contiguous dimension
+        0
+      );
+    }
+  };
+};
+```
+
+## <a name="S-core-tile-iterator"></a> Tile Iterator
+
+The iterator design pattern provides an abstraction for accessing the items in a collection in sequence. Basic
+operators defined by iterators consist of accessing an item - either a load or store - followed by traversal to
+the next item in sequence.
+
+<img src="/media/images/cutlass-tile-iteration.png" alt="CUTLASS tile access and traversal" width="50%" />
+
+To offer a generic solution that spans numerous data types and layouts, CUTLASS defines the _TileIterator_ concept.
+This concept provides access to a sequence of _tiles_ embedded in a tensor in addressable memory. 
+
+The canonical CUTLASS tile iterator template is defined in [cutlass/tile_iterator.h](cutlass/tile_iterator.h).
+
+## <a name="S-core-fragment"></a> Fragment
+
+A fragment is analogous to `std::array<>` in that it is a constant-sized array of elements. Typically backed by storage in the SM's register file, CUTLASS `Fragment<>` objects are used to store tiles. For threadblock- and warp-scope operations, the contents of these tiles are distributed across the partipcipating threads. In such cases, a thread's `Fragment<>` contains the part of the tile held by that thread.
+
+## <a name="S-core-predicate-vector"></a> Predicate Vector
+
+SIMT architectures utilize predicated execution in place of control flow when conditional code sequences are fairly short, on the order of a few machine instructions. While CUDA C++ does not include constructs at the language level for predication, PTX makes this explicit, and compilation to SASS is assumed to aggressively utilize predication. Typical applications are to initialize a sequence of bits used to mask memory operations and use these bits as predicates guarding memory load and store instructions. 
+
+CUTLASS provides `PredicateVector` defined in [cutlass/predicate_vector.h](cutlass/predicate_vector.h) to manage a statically-sized bit vector, store them into general purpose registers, and efficiently access them in sequence. By storing four predicates per byte in hardware registers, the CUDA compiler is able to issue specialized instructions to achieve very efficient unpacking. 
+
+
+# <a name="S-utilities"></a> 4. Utilities
+
+CUTLASS implements efficient matrix multiply computations on GPUs. It is accompanied by an extensive utility
+framework offering features such as:
+
+* [cutlass::half_t](tools/util/half.h) - a host-side half-precision type
+* Components for allocating and initializing [host-side and device-side tensors](tools/util/host_tensor.h) usable by CUTLASS
+* Reference implementations of [GEMM](tools/util/reference/host/gemm.h) and [element-wise operations](tools/util/reference/host/tensor_elementwise.h)
diff --git a/Doxyfile b/Doxyfile
index 51cec529b..1d96f3770 100644
--- a/Doxyfile
+++ b/Doxyfile
@@ -58,7 +58,7 @@ PROJECT_LOGO           =
 # entered, it will be relative to the location where doxygen was started. If
 # left blank the current directory will be used.
 
-OUTPUT_DIRECTORY       = docs
+OUTPUT_DIRECTORY       = doxygen
 
 # If the CREATE_SUBDIRS tag is set to YES, then doxygen will create 4096 sub-
 # directories (in 2 levels) under the output directory of each output format and
diff --git a/README.md b/README.md
index 56473a286..d5bd15ef7 100644
--- a/README.md
+++ b/README.md
@@ -1,10 +1,10 @@
 ![ALT](/media/images/gemm-hierarchy-with-epilogue-no-labels.png "Complete CUDA GEMM decomposition")
 
-# CUTLASS 1.0
+# CUTLASS 1.1
 
-_CUTLASS 1.0.1 - June 2018_
+_CUTLASS 1.1.0 - September 2018_
 
-CUTLASS 1.0 is a collection of CUDA C++ template abstractions for implementing
+CUTLASS 1.1 is a collection of CUDA C++ template abstractions for implementing
 high-performance matrix-multiplication (GEMM) at all levels and scales within CUDA.
 It incorporates strategies for hierarchical decomposition and data movement similar
 to those used to implement cuBLAS.  CUTLASS decomposes these "moving parts" into
@@ -22,14 +22,27 @@ point (FP64) types.  Furthermore, CUTLASS demonstrates CUDA's WMMA API for targe
 the programmable, high-throughput _Tensor Cores_ provided by NVIDIA's Volta architecture
 and beyond.
 
-CUTLASS 1.0 has changed substantially from our preview release described in
-the [CUTLASS Parallel For All](https://devblogs.nvidia.com/parallelforall/cutlass-linear-algebra-cuda)
-post. We have decomposed the structure of the GEMM computation into deeper, structured
-primitives for loading data, computing predicate masks, streaming data at each level of
-the GEMM hierarchy, and updating the output matrix.
+CUTLASS 1.1 is described in the [CUTLASS Documentation](CUTLASS.md) and the accompanying
+[Doxygen documentation](https://nvidia.github.io/cutlass).
+We describe the structure of an efficient GEMM in our talk at the
+[GPU Technology Conference 2018](http://on-demand.gputechconf.com/gtc/2018/presentation/s8854-cutlass-software-primitives-for-dense-linear-algebra-at-all-levels-and-scales-within-cuda.pdf).
 
-CUTLASS 1.0 is described in the [Doxygen documentation](https://nvidia.github.io/cutlass)
-and our talk at the [GPU Technology Conference 2018](http://on-demand.gputechconf.com/gtc/2018/presentation/s8854-cutlass-software-primitives-for-dense-linear-algebra-at-all-levels-and-scales-within-cuda.pdf).
+# What's New in CUTLASS 1.1
+
+* [CUTLASS Documentation](CUTLASS.md)
+* [Examples](examples/)
+  * Basic GEMM, tensor views, CUTLASS utilities, batched GEMM, WMMA GEMM
+* Turing Features
+  * [WMMA GEMM targeting TensorCores](tools/test/unit/gemm/wmma_integer_gemm.cu) - INT8, INT4, INT1
+* [Batched Strided GEMM](tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu)
+* [Threadblock rasterization strategies](tools/test/unit/gemm/sgemm_threadblock_swizzle_nt.cu)
+  * Improved performance for adverse problem sizes and data layouts
+* Extended CUTLASS Core comonents
+  * Tensor views support arbitrary matrix and tensor layouts
+  * Zip iterators for structuring multiple data streams
+* Enhanced CUTLASS utilities
+  * [Reference implementations](tools/util/reference) for tensor operations in [host](tools/util/reference/host) and [device](tools/util/reference/device) code
+  * Added `HostMatrix<>` for simplified matrix creation
 
 # Performance
 
@@ -39,11 +52,11 @@ CUTLASS primitives are very efficient.  When used to construct device-wide GEMM
 they exhibit performance comparable to cuBLAS for scalar GEMM
 computations. The above figure shows CUTLASS performance relative to cuBLAS
 for large matrix dimensions (M=10240, N=K=4096) running on an NVIDIA Titan V GPU
-when compiled with CUDA 9.2.
+when compiled with CUDA 10.0.
 
 # Compatibility
 
-CUTLASS requires CUDA 9 and performs best with [CUDA 9.2 Toolkit](ttps://developer.nvidia.com/cuda-toolkit) or later.
+CUTLASS requires CUDA 9 but performs best with [CUDA 10.0 Toolkit](ttps://developer.nvidia.com/cuda-toolkit) or later.
 
 |**Operating System** | **Compiler** |
 |-----------------|----------|
@@ -63,7 +76,7 @@ any Maxwell-, Pascal-, or Volta-architecture NVIDIA GPU.
 |NVIDIA Tesla P100|
 |NVIDIA Tesla V100|
 |NVIDIA TitanV|
-
+|NVIDIA GeForce RTX 2080 TI, 2080, 2070|
 
 # Building CUTLASS
 
@@ -79,7 +92,7 @@ $ git submodule update --init --recursive
 ```
 
 CUTLASS can be build with CMake starting version 3.10. By default CUTLASS will build kernels
-for CUDA architecture versions 5.0, 6.0, 6.1 and 7.0. To reduce compile time you can specify
+for CUDA architecture versions 5.0, 6.0, 6.1, 7.0 and 7.5. To reduce compile time you can specify
 the architectures to build CUTLASS for by changing the CMake configuration setting
 `CUTLASS_NVCC_ARCHS`.
 
@@ -107,13 +120,12 @@ $ ./tools/test/unit/cutlass_unit_test
 ...
 ...
 [----------] Global test environment tear-down
-[==========] 481 tests from 24 test cases ran. (5954 ms total)
-[  PASSED  ] 481 tests.
+[==========] 946 tests from 57 test cases ran. (10812 ms total)
+[  PASSED  ] 946 tests.
 ```
 
 All tests should pass, though the exact number of tests may vary over time.
 
-
 # Project Structure
 
 CUTLASS is arranged as a header-only library with several example test programs
@@ -128,28 +140,41 @@ templates in the cutlass/gemm directory.
 
 ```
 cutlass/
-    gemm/
-    util/
-    <core API components>
+  gemm/
+  util/
+  <core API components>
 ```
 
 Several tools and test programs are also distributed with the CUTLASS library. They are
 contained in the following directories.
 
 ```
+examples/
+  00_basic_gemm/
+  01_tensor_view/
+  02_cutlass_utilities/
+  03_batched_gemm/
+  04_tile_iterator/
+  05_wmma_gemm/
 tools/
-    test/
-        unit/
-            core/
-            gemm/
-        perf/
-    util/
-        <utilities>
+  test/
+    unit/
+      core/
+      gemm/
+    perf/
+  util/
+    reference/
+      device/
+      host/
+    <utilities>
 ```
 
 The `test/unit/` directory consist of unit tests implemented with Google Test that demonstrate
 basic usage of Core API components and complete tests of the CUTLASS GEMM computations.
 
+The `tools/util` directory contains CUTLASS utilities including reference implementations of GEMM and
+several element-wise tensor operations.
+
 # Performance Profiling
 
 The `test/perf/` directory contains a command-line utility for launching each of the GEMM kernels.
diff --git a/clang-format.sh b/clang-format.sh
deleted file mode 100755
index b2570d914..000000000
--- a/clang-format.sh
+++ /dev/null
@@ -1,17 +0,0 @@
-#!/bin/bash
-
-set -e
-
-function formatFiles {
-    for f in `find "$1" -type f -name "*.$2"` ; do
-        COMMAND="clang-format -i $f"
-        echo $COMMAND
-        $COMMAND
-    done
-}
-
-formatFiles "cutlass" "h"
-formatFiles "tools/test" "h"
-formatFiles "tools/test" "cpp"
-formatFiles "tools/util" "h"
-
diff --git a/cutlass/convert.h b/cutlass/convert.h
index 933d68a82..b4d0f8edd 100644
--- a/cutlass/convert.h
+++ b/cutlass/convert.h
@@ -28,7 +28,7 @@
 */
 #pragma once
 
-#include <cutlass/fragment.h>
+#include "cutlass/fragment.h"
 
 namespace cutlass {
 
diff --git a/cutlass/coord.h b/cutlass/coord.h
index 431c9bf1a..625a22723 100644
--- a/cutlass/coord.h
+++ b/cutlass/coord.h
@@ -28,7 +28,8 @@
 
 #pragma once
 
-#include <cutlass/cutlass.h>
+#include "cutlass/cutlass.h"
+#include "cutlass/util/platform.h"
 
 namespace cutlass {
 
@@ -44,20 +45,27 @@ struct Identity {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 /// Statically-sized array specifying Coords within a tensor
-template <int N_>
+template <int Rank_, typename Index_ = int>
 struct Coord {
   //
   // Type and constant definitions
   //
 
-  static int const N = N_;
+  /// Number of elements in Coord
+  static int const kRank = Rank_;
+
+  /// Number of elements in Coord, aliased for compatibility
+  static int const N = Rank_;
+
+  /// Index type used to store elements
+  typedef Index_ Index;
 
   //
   // Data members
   //
 
   /// Indices
-  int idx[N];
+  Index idx[kRank];
 
   //
   // Methods
@@ -65,25 +73,72 @@ struct Coord {
 
   /// Default ctor initializes uniformly
   CUTLASS_HOST_DEVICE
-  Coord(int value = 0) {
-    for (int i = 0; i < N; ++i) {
+  Coord(Index value = 0) {
+    for (int i = 0; i < kRank; ++i) {
       idx[i] = value;
     }
   }
 
   /// Constructs from an array of integers
   CUTLASS_HOST_DEVICE
-  Coord(int _idx[]) {
-    for (int i = 0; i < N; ++i) {
+  Coord(Index _idx[]) {
+    for (int i = 0; i < kRank; ++i) {
       idx[i] = _idx[i];
     }
   }
 
+  /// Constructs from an array of integers
+  CUTLASS_HOST_DEVICE
+  Coord(Coord<kRank> const &coord) {
+    for (int i = 0; i < kRank; ++i) {
+      idx[i] = coord[i];
+    }
+  }
+
+  /// Returns a slice of the Coord which may be larger or smaller in rank
+  /// than this.
+  template <int Slice>
+  CUTLASS_HOST_DEVICE
+  Coord<Slice> slice(int start = 0, Index identity = 0) const {
+    Coord<Slice> result;
+    for (int i = 0; i < Slice; ++i) {
+      if (i + start < kRank) {
+        slice[i] = idx[i + start];
+      }
+      else {
+        slice[i] = identity;
+      }
+    }
+    return result;
+  }
+
+  /// Returns true if Coord is non-zero.
+  CUTLASS_HOST_DEVICE
+  operator bool() const {
+    for (int i = 0; i < kRank; ++i) {
+      if (idx[i]) {
+        return true;
+      }
+    }
+    return false;
+  }
+
+  /// Returns true if Coord is uniformly zero.
+  CUTLASS_HOST_DEVICE
+  bool operator!() const {
+    for (int i = 0; i < kRank; ++i) {
+      if (idx[i]) {
+        return false;
+      }
+    }
+    return true;
+  }
+
   /// Element-wise addition
   CUTLASS_HOST_DEVICE
   Coord operator+(Coord const& b) const {
     Coord c;
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       c.idx[i] = idx[i] + b.idx[i];
     }
     return c;
@@ -93,7 +148,7 @@ struct Coord {
   CUTLASS_HOST_DEVICE
   Coord operator-(Coord const& b) const {
     Coord c;
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       c.idx[i] = idx[i] - b.idx[i];
     }
     return c;
@@ -103,7 +158,7 @@ struct Coord {
   CUTLASS_HOST_DEVICE
   Coord operator*(Coord const& b) const {
     Coord c;
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       c.idx[i] = idx[i] * b.idx[i];
     }
     return c;
@@ -113,7 +168,7 @@ struct Coord {
   CUTLASS_HOST_DEVICE
   Coord operator/(Coord const& b) const {
     Coord c;
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       c.idx[i] = idx[i] / b.idx[i];
     }
     return c;
@@ -122,7 +177,7 @@ struct Coord {
   /// In-place addition
   CUTLASS_HOST_DEVICE
   Coord& operator+=(Coord const& b) {
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       idx[i] += b.idx[i];
     }
     return *this;
@@ -131,7 +186,7 @@ struct Coord {
   /// In-place subtraction
   CUTLASS_HOST_DEVICE
   Coord& operator-=(Coord const& b) {
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       idx[i] -= b.idx[i];
     }
     return *this;
@@ -140,7 +195,7 @@ struct Coord {
   /// In-place multiplication
   CUTLASS_HOST_DEVICE
   Coord& operator*=(Coord const& b) {
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       idx[i] *= b.idx[i];
     }
     return *this;
@@ -149,22 +204,22 @@ struct Coord {
   /// In-place division
   CUTLASS_HOST_DEVICE
   Coord& operator/=(Coord const& b) {
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       idx[i] /= b.idx[i];
     }
     return *this;
   }
 
   /// Member access operator
-  CUTLASS_HOST_DEVICE int& operator[](int dim) { return idx[dim]; }
+  CUTLASS_HOST_DEVICE Index& operator[](int dim) { return idx[dim]; }
 
   /// Member access operator
-  CUTLASS_HOST_DEVICE int const& operator[](int dim) const { return idx[dim]; }
+  CUTLASS_HOST_DEVICE Index const& operator[](int dim) const { return idx[dim]; }
 
   /// Computes the dot product of two Coord instances
   template <typename T>
   CUTLASS_HOST_DEVICE T dot(Coord const& b, T sum) const {
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       sum += idx[i] * b.idx[i];
     }
     return sum;
@@ -174,7 +229,7 @@ struct Coord {
   template <typename T>
   CUTLASS_HOST_DEVICE T dot(Coord const& b) const {
     T sum = T(0);
-    for (int i = 0; i < N; ++i) {
+    for (int i = 0; i < kRank; ++i) {
       sum += idx[i] * b.idx[i];
     }
     return sum;
@@ -182,29 +237,29 @@ struct Coord {
 
   /// Gets the index of a given Coord element
   template <int Dim>
-  CUTLASS_HOST_DEVICE int& at() {
+  CUTLASS_HOST_DEVICE Index& at() {
     return idx[Dim];
   }
 
   /// Access via index; may limit unrolling potential
   CUTLASS_HOST_DEVICE
-  int& at(int dim) { return idx[dim]; }
+  Index& at(int dim) { return idx[dim]; }
 
   /// Gets the index of a given Coord element
   template <int Dim>
-  CUTLASS_HOST_DEVICE int const& at() const {
+  CUTLASS_HOST_DEVICE Index const& at() const {
     return idx[Dim];
   }
 
   /// Access via index; may limit unrolling potential
   CUTLASS_HOST_DEVICE
-  int const& at(int dim) const { return idx[dim]; }
+  Index const& at(int dim) const { return idx[dim]; }
 
   /// Determines if two Coord<> objects are equal
   CUTLASS_HOST_DEVICE
-  bool operator==(Coord<N> const& b) const {
+  bool operator==(Coord<kRank> const& b) const {
     bool equal = true;
-    for (int i = 0; equal && i < N; ++i) {
+    for (int i = 0; equal && i < kRank; ++i) {
       equal = (idx[i] == b.idx[i]);
     }
     return equal;
@@ -212,12 +267,12 @@ struct Coord {
 
   /// Not equal
   CUTLASS_HOST_DEVICE
-  bool operator!=(Coord<N> const& b) const { return !(*this == b); }
+  bool operator!=(Coord<kRank> const& b) const { return !(*this == b); }
 
   /// Clamps a coordinate to a range specified by maximum and minimum values
   CUTLASS_HOST_DEVICE
-  Coord& clamp(Coord<N> const& max, Coord<N> const& min = Coord<N>()) {
-    for (int i = 0; i < N; ++i) {
+  Coord& clamp(Coord<kRank> const& max, Coord<kRank> const& min = Coord<kRank>()) {
+    for (int i = 0; i < kRank; ++i) {
       idx[i] = __NV_STD_MAX(__NV_STD_MIN(idx[i], max.idx[i]), min.idx[i]);
     }
     return *this;
@@ -225,13 +280,35 @@ struct Coord {
 
   /// Returns the product of all elements
   CUTLASS_HOST_DEVICE
-  int count() const {
-    int product = idx[0];
-    for (int i = 1; i < N; ++i) {
+  Index count() const {
+    Index product = idx[0];
+    for (int i = 1; i < kRank; ++i) {
       product *= idx[i];
     }
     return product;
   }
+
+  /// Less than operator
+  CUTLASS_HOST_DEVICE
+  bool operator<(Coord<kRank> const &b) const {
+    for (int i = 0; i < kRank; ++i) {
+      if (!(idx[i] < b[i])) {
+        return false;
+      }
+    }
+    return true;
+  }
+
+  /// Less than or equals operator
+  CUTLASS_HOST_DEVICE
+  bool operator<=(Coord<kRank> const &b) const {
+    for (int i = 0; i < kRank; ++i) {
+      if (!(idx[i] <= b[i])) {
+        return false;
+      }
+    }
+    return true;
+  }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
@@ -266,21 +343,10 @@ Coord<4> make_Coord(int _0, int _1, int _2, int _3) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/// Getter
-CUTLASS_HOST_DEVICE
-Coord<2> get_Coord_hw(Coord<3> const& coord) { return make_Coord(coord[1], coord[2]); }
-
-/// Getter
-CUTLASS_HOST_DEVICE
-Coord<2> get_Coord_hw(Coord<4> const& coord) { return make_Coord(coord[1], coord[2]); }
-
-/// Getter
-CUTLASS_HOST_DEVICE
-Coord<3> get_Coord_hwc(Coord<4> const& coord) { return make_Coord(coord[1], coord[2], coord[3]); }
-
-/// Getter
-CUTLASS_HOST_DEVICE
-Coord<3> get_Coord_dhw(Coord<4> const& coord) { return make_Coord(coord[0], coord[1], coord[2]); }
+template <typename Shape_>
+CUTLASS_HOST_DEVICE Coord<3> make_Coord_from_shape() {
+  return make_Coord(Shape_::kD, Shape_::kH, Shape_::kW);
+}
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/cutlass/core_io.h b/cutlass/core_io.h
index cceea4c06..849a7613f 100644
--- a/cutlass/core_io.h
+++ b/cutlass/core_io.h
@@ -22,8 +22,6 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#pragma once
-
 /*! \file
     \brief Helpers for printing cutlass/core objects
 */
@@ -33,12 +31,96 @@
 #include <iosfwd>
 #include <typeinfo>
 
-#include <cutlass/coord.h>
+#include "cutlass/coord.h"
+#include "cutlass/vector.h"
+
+namespace cutlass {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
 
 template <int Rank>
-std::ostream& operator<<(std::ostream& out, cutlass::Coord<Rank> const& coord) {
+std::ostream& operator<<(std::ostream& out, Coord<Rank> const& coord) {
   for (int i = 0; i < Rank; ++i) {
     out << (i ? ", " : "") << coord.idx[i];
   }
   return out;
 }
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to enable formatted printing of CUTLASS scalar types to an ostream
+template <typename T>
+struct ScalarIO {
+
+  /// Value to print
+  T value;
+
+  /// Default ctor
+  ScalarIO() { }
+
+  /// Constructs from a value
+  ScalarIO(T value): value(value) {}
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Default printing to ostream
+template <typename T>
+inline std::ostream &operator<<(std::ostream &out, ScalarIO<T> const &scalar) {
+  return out << scalar.value;
+}
+
+/// Printing to ostream of int8_t as integer rather than character
+template <>
+inline std::ostream &operator<<(std::ostream &out, ScalarIO<int8_t> const &scalar) {
+  return out << int(scalar.value);
+}
+
+/// Printing to ostream of uint8_t as integer rather than character
+template <>
+inline std::ostream &operator<<(std::ostream &out, ScalarIO<uint8_t> const &scalar) {
+  return out << unsigned(scalar.value);
+}
+
+/// Printing to ostream of vector of 1b elements
+template <>
+inline std::ostream &operator<<(
+  std::ostream &out, 
+  ScalarIO<cutlass::Vector<cutlass::bin1_t, 32> > const &scalar) {
+
+  for (int i = 0; i < 32; i++) {
+    out << int(scalar.value[i]);
+    out << ((i != 31) ? ", " : "");
+  }
+  return out;
+}
+
+/// Printing to ostream of vector of 4b signed integer elements
+template <>
+inline std::ostream &operator<<(
+  std::ostream &out, 
+  ScalarIO<cutlass::Vector<cutlass::int4_t, 8> > const &scalar) {
+
+  for (int i = 0; i < 8; i++) {
+    out << int(scalar.value[i]);
+    out << ((i != 7) ? ", " : "");
+  }
+  return out;
+}
+
+/// Printing to ostream of vector of 4b unsigned integer elements
+template <>
+inline std::ostream &operator<<(
+  std::ostream &out, 
+  ScalarIO<cutlass::Vector<cutlass::uint4_t, 8> > const &scalar) {
+
+  for (int i = 0; i < 8; i++) {
+    out << unsigned(scalar.value[i]);
+    out << ((i != 7) ? ", " : "");
+  }
+  return out;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/cutlass/cutlass.h b/cutlass/cutlass.h
index 19600ec8f..097714c02 100644
--- a/cutlass/cutlass.h
+++ b/cutlass/cutlass.h
@@ -47,7 +47,9 @@
 // CUTLASS_DEVICE is an error if not compiling device code
 #endif
 
-// CUTLASS_PRAGMA_UNROLL inserts a CUTLASS_PRAGMA_UNROLL if supported by the compiler
+#define CUTLASS_ASSERT(x) assert(x)
+
+// CUTLASS_PRAGMA_(UNROLL|NO_UNROLL) optimization directives for the CUDA compiler.
 #if defined(__CUDA_ARCH__)
 #if defined(_MSC_VER)
 #define CUTLASS_PRAGMA_UNROLL __pragma("unroll")
@@ -61,7 +63,22 @@
 #define CUTLASS_PRAGMA_NO_UNROLL
 #endif
 
-#define CUTLASS_ASSERT(x) assert(x)
+#define CUTLASS_GEMM_LOOP CUTLASS_PRAGMA_NO_UNROLL
+
+// A small helper class to dump a type at compile time
+// Usage:: DumpType<Class>::Class
+template <typename T>
+struct DebugType {};
+
+template <typename T>
+void DebugTypeFunc(T const& t) {
+  T::t;
+}
+
+// A small helper class to dump a compile time constant at compile time
+// Usage: DumpValue<Class::kConstant>::kConstant
+template <int Value>
+struct DebugValue {};
 
 namespace cutlass {
 
diff --git a/cutlass/fragment.h b/cutlass/fragment.h
index 886b11405..6a93d779c 100644
--- a/cutlass/fragment.h
+++ b/cutlass/fragment.h
@@ -29,9 +29,9 @@
 #pragma once
 
 #include <assert.h>
-#include <cutlass/shape.h>
-#include <cutlass/util/cutlass_math.h>
-#include <cutlass/vector.h>
+#include "cutlass/shape.h"
+#include "cutlass/util/cutlass_math.h"
+#include "cutlass/vector.h"
 
 namespace cutlass {
 
@@ -72,7 +72,7 @@ provides access to element at (d, h, w, c)
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <int kAlignment_>
+template <int alignment>
 struct StorageType {
   typedef uint64_t Type;
 };
@@ -108,9 +108,11 @@ struct Fragment : public AlignedStruct<kAlignment_> {
   typedef Element_ Element;
   /// The number of elements.
   static int const kElements = kElements_;
+  /// Alignment
+  static int const kAlignment = kAlignment_;
 
   /// Clear a fragment.
-  CUTLASS_DEVICE void clear() {
+  CUTLASS_HOST_DEVICE void clear() {
     // Avoid element-wise access for sub 32b element type
     if (kAlignment_ >= 8 && (kElements * sizeof(Element)) % 8 == 0) {
       uint64_t* ptr = reinterpret_cast<uint64_t*>(storage);
@@ -135,14 +137,10 @@ struct Fragment : public AlignedStruct<kAlignment_> {
   }
 
   /// The accessor.
-  CUTLASS_DEVICE Element& operator[](int i) {
-    assert(i < kElements_);
-    return reinterpret_cast<Element*>(storage)[i];
-  }
+  CUTLASS_HOST_DEVICE Element& operator[](int i) { return reinterpret_cast<Element*>(storage)[i]; }
 
   /// The accessor.
-  CUTLASS_DEVICE Element const& operator[](int i) const {
-    assert(i < kElements_);
+  CUTLASS_HOST_DEVICE Element const& operator[](int i) const {
     return reinterpret_cast<Element const*>(storage)[i];
   }
 
@@ -188,35 +186,35 @@ struct FragmentIterator {
 
   /// Ctor.
   template <typename OtherFragment_>
-  CUTLASS_DEVICE FragmentIterator(OtherFragment_& fragment, int offset = 0)
+  CUTLASS_HOST_DEVICE FragmentIterator(OtherFragment_& fragment, int offset = 0)
       : pointer(reinterpret_cast<Element*>(&fragment[offset])) {
     static_assert(OtherFragment_::kElements >= Fragment::kElements, "");
   }
 
   /// The accessor.
-  CUTLASS_DEVICE AccessType const& at(int d, int h, int w, int c = 0) const {
+  CUTLASS_HOST_DEVICE AccessType const& at(int d, int h, int w, int c = 0) const {
     int const imm = ComputeOffsetFromStrides<Strides>::get(d, h, w, c);
     return reinterpret_cast<AccessType const&>(pointer[imm]);
   }
 
   /// The accessor.
-  CUTLASS_DEVICE AccessType& at(int d, int h, int w, int c = 0) {
+  CUTLASS_HOST_DEVICE AccessType& at(int d, int h, int w, int c = 0) {
     int const imm = ComputeOffsetFromStrides<Strides>::get(d, h, w, c);
     return reinterpret_cast<AccessType&>(pointer[imm]);
   }
 
   /// The accessor.
-  CUTLASS_DEVICE AccessType const& operator[](int i) const {
+  CUTLASS_HOST_DEVICE AccessType const& operator[](int i) const {
     return reinterpret_cast<AccessType const&>(pointer[i * kElementsPerAccess]);
   }
 
   /// The accessor.
-  CUTLASS_DEVICE AccessType& operator[](int i) {
+  CUTLASS_HOST_DEVICE AccessType& operator[](int i) {
     return reinterpret_cast<AccessType&>(pointer[i * kElementsPerAccess]);
   }
 
   /// Is the iterator valid?
-  CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const { return true; }
+  CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const { return true; }
 
   /// The pointer.
   Element* pointer;
@@ -246,28 +244,28 @@ struct FragmentConstIterator {
 
   /// Ctor.
   template <typename OtherFragment_>
-  CUTLASS_DEVICE FragmentConstIterator(OtherFragment_& fragment, int offset = 0)
+  CUTLASS_HOST_DEVICE FragmentConstIterator(OtherFragment_& fragment, int offset = 0)
       : pointer(reinterpret_cast<Element const*>(&fragment[offset])) {
     static_assert(OtherFragment_::kElements >= Fragment::kElements, "");
   }
   /// Create from non-constant FragmentIterator
-  CUTLASS_DEVICE FragmentConstIterator(
+  CUTLASS_HOST_DEVICE FragmentConstIterator(
       FragmentIterator<Fragment_, Iterations_, AccessType_> const& rhs_)
       : pointer(reinterpret_cast<Element const*>(rhs_.offset)) {}
 
   /// The accessor.
-  CUTLASS_DEVICE AccessType const& at(int d, int h, int w, int c = 0) const {
+  CUTLASS_HOST_DEVICE AccessType const& at(int d, int h, int w, int c = 0) const {
     int const imm = ComputeOffsetFromStrides<IterationsStrides>::get(d, h, w, c);
     return reinterpret_cast<AccessType const&>(pointer[imm]);
   }
 
   /// The accessor.
-  CUTLASS_DEVICE AccessType const& operator[](int i) const {
+  CUTLASS_HOST_DEVICE AccessType const& operator[](int i) const {
     return reinterpret_cast<AccessType const&>(pointer[i * kElementsPerAccess]);
   }
 
   /// Is the iterator valid?
-  CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const { return true; }
+  CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const { return true; }
 
   /// The pointer.
   Element const* pointer;
diff --git a/cutlass/fragment_load_store.h b/cutlass/fragment_load_store.h
deleted file mode 100644
index a7d272e9e..000000000
--- a/cutlass/fragment_load_store.h
+++ /dev/null
@@ -1,135 +0,0 @@
-/***************************************************************************************************
- * Copyright (c) 2017, NVIDIA CORPORATION.  All rights reserved.
- *
- * Redistribution and use in source and binary forms, with or without modification, are permitted
- * provided that the following conditions are met:
- *     * Redistributions of source code must retain the above copyright notice, this list of
- *       conditions and the following disclaimer.
- *     * Redistributions in binary form must reproduce the above copyright notice, this list of
- *       conditions and the following disclaimer in the documentation and/or other materials
- *       provided with the distribution.
- *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
- *       to endorse or promote products derived from this software without specific prior written
- *       permission.
- *
- * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
- * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
- * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
- * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
- * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
- * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
- * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
- * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
- *
- **************************************************************************************************/
-/*! \file
-    \brief Defines accessors for loading and storing fragments to memory efficiently.
-*/
-#pragma once
-
-#include <cutlass/load_store.h>
-#include <cutlass/vector.h>
-
-namespace cutlass {
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-template <IteratorFragment::Kind kIteratorFragment,
-          int kAccessSize,
-          typename Scalar_,
-          MemorySpace::Kind Memory_,
-          typename FragmentElement_,
-          int kStride>
-struct FragmentLoad {};
-
-template <int kAccessSize,
-          typename Scalar_,
-          MemorySpace::Kind Memory_,
-          typename FragmentElement_,
-          int kStride>
-struct FragmentLoad<IteratorFragment::kWmmaMatrix,
-                    kAccessSize,
-                    Scalar_,
-                    Memory_,
-                    FragmentElement_,
-                    kStride> {
-  /// The output type.
-  typedef FragmentElement_ AccessType;
-
-  /// The load function.
-  static CUTLASS_DEVICE void load(AccessType& value, Scalar_ const* pointer, int offset) {
-    value.load(&pointer[offset], kStride);
-  }
-};
-
-template <int kAccessSize,
-          typename Scalar_,
-          MemorySpace::Kind Memory_,
-          typename FragmentElement_,
-          int kStride>
-struct FragmentLoad<IteratorFragment::kScalar,
-                    kAccessSize,
-                    Scalar_,
-                    Memory_,
-                    FragmentElement_,
-                    kStride> {
-  /// The output type.
-  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
-
-  /// The load function.
-  static CUTLASS_DEVICE void load(AccessType& value, Scalar_ const* pointer, int offset) {
-    Load<Scalar_, kAccessSize, Memory_>::load(value, pointer, offset);
-  }
-};
-
-template <IteratorFragment::Kind kIteratorFragment,
-          int kAccessSize,
-          typename Scalar_,
-          MemorySpace::Kind Memory_,
-          typename FragmentElement_,
-          int kStride>
-struct FragmentStore {};
-
-template <int kAccessSize,
-          typename Scalar_,
-          MemorySpace::Kind Memory_,
-          typename FragmentElement_,
-          int kStride>
-struct FragmentStore<IteratorFragment::kWmmaMatrix,
-                     kAccessSize,
-                     Scalar_,
-                     Memory_,
-                     FragmentElement_,
-                     kStride> {
-  /// The input type.
-  typedef FragmentElement_ AccessType;
-
-  /// The store function.
-  static CUTLASS_DEVICE void store(AccessType const& value, Scalar_* pointer, int offset) {
-    value.store(&pointer[offset], kStride);
-  }
-};
-
-template <int kAccessSize,
-          typename Scalar_,
-          MemorySpace::Kind Memory_,
-          typename FragmentElement_,
-          int kStride>
-struct FragmentStore<IteratorFragment::kScalar,
-                     kAccessSize,
-                     Scalar_,
-                     Memory_,
-                     FragmentElement_,
-                     kStride> {
-  /// The input type.
-  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
-
-  /// The store function.
-  static CUTLASS_DEVICE void store(AccessType const& value, Scalar_* pointer, int offset) {
-    Store<Scalar_, kAccessSize, Memory_>::store(value, pointer, offset);
-  }
-};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-}  /// namespace cutlass
diff --git a/cutlass/fragment_multiply_add.h b/cutlass/fragment_multiply_add.h
index 36a4d6f6a..de2c8052f 100644
--- a/cutlass/fragment_multiply_add.h
+++ b/cutlass/fragment_multiply_add.h
@@ -27,52 +27,59 @@
 */
 #pragma once
 
-#include <cutlass/fragment.h>
+#include "cutlass/fragment.h"
 
 namespace cutlass {
 namespace gemm {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Scalar_>
+template < typename ScalarAlphaBeta_, 
+  typename ScalarAccum_, 
+  bool fragMul2 = true /*number of element per fragment is multiple of 2*/
+>
 struct FragmentMultiplyAdd {
   /// The shape of the instruction.
   typedef Shape<1, 1, 1, 1> InstructionShape;
-  /// The type for A.
-  typedef Scalar_ ScalarA;
-  /// The type for B.
-  typedef Scalar_ ScalarB;
-  /// The type for C and D.
-  typedef Scalar_ ScalarC;
+  /// The type for alpha and beta
+  typedef ScalarAlphaBeta_ ScalarAlphaBeta;
+  /// The type for accumlator
+  typedef ScalarAccum_ ScalarAccum;
 
   /// Ctor.
   CUTLASS_DEVICE FragmentMultiplyAdd() {}
 
   /// Multiply : d = a*b.
   template <typename FragmentB_, typename FragmentCd_>
-  CUTLASS_DEVICE void multiply(Scalar_ a, FragmentB_ const& b, FragmentCd_& d) {
+  CUTLASS_DEVICE void multiply(ScalarAlphaBeta a, FragmentB_ const& b, FragmentCd_& d) {
+#if defined(__CUDACC__) && __CUDA_ARCH__ >= 530
     int const kReduction = FragmentB_::kElements / FragmentCd_::kElements;
     for (int j = 0; j < FragmentCd_::kElements; ++j) {
-      d[j] = a * b[j * kReduction + 0];
+      d[j] = b[j * kReduction + 0];
       for (int k = 1; k < kReduction; ++k) {
-        d[j] += a * b[j * kReduction + k];
+        d[j] += b[j * kReduction + k];
       }
+      d[j] = a * ScalarAlphaBeta(d[j]);
     }
+#endif
   }
 
   /// Multiply : d = a*b + c.
   template <typename FragmentB_, typename FragmentCd_>
-  CUTLASS_DEVICE void multiply_add(Scalar_ a,
+  CUTLASS_DEVICE void multiply_add(ScalarAlphaBeta a,
                                    FragmentB_ const& b,
                                    FragmentCd_ const& c,
                                    FragmentCd_& d) {
+#if defined(__CUDACC__) && __CUDA_ARCH__ >= 530
     int const kReduction = FragmentB_::kElements / FragmentCd_::kElements;
     for (int j = 0; j < FragmentCd_::kElements; ++j) {
-      d[j] = a * b[j * kReduction + 0] + c[j];
+      d[j] = b[j * kReduction + 0];
       for (int k = 1; k < kReduction; ++k) {
-        d[j] += a * b[j * kReduction + k];
+        d[j] += b[j * kReduction + k];
       }
+      d[j] = a * ScalarAlphaBeta(d[j]) + ScalarAlphaBeta(c[j]);
     }
+#endif
   }
 };
 
@@ -80,15 +87,13 @@ struct FragmentMultiplyAdd {
 
 #if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)
 template <>
-struct FragmentMultiplyAdd<half> {
+struct FragmentMultiplyAdd<half, half, true> {
   /// The shape of the instruction.
-  typedef Shape<1, 1, 2, 1> InstructionShape;
-  /// The type for A.
-  typedef half ScalarA;
-  /// The type for B.
-  typedef half ScalarB;
-  /// The type for C and D.
-  typedef half ScalarC;
+  typedef Shape<1, 1, 1, 1> InstructionShape;
+  /// The type for alpha and beta
+  typedef half ScalarAlphaBeta;
+  /// The type for accumlator
+  typedef half ScalarAccum;
 
   /// Ctor.
   CUTLASS_DEVICE FragmentMultiplyAdd() {}
@@ -97,17 +102,19 @@ struct FragmentMultiplyAdd<half> {
   template <typename FragmentB_, typename FragmentCd_>
   CUTLASS_DEVICE void multiply(half a, FragmentB_ const& b, FragmentCd_& d) {
 #if defined(__CUDACC__) && __CUDA_ARCH__ >= 530
-
-    // Assemble a half2 from a.
-    __half2 const a_half2 = __half2half2(a);
     // The input.
     __half2 const* b_half2 = reinterpret_cast<__half2 const*>(&b[0]);
     // The output.
     __half2* d_half2 = reinterpret_cast<__half2*>(&d[0]);
 
-    int const kReduction = FragmentB_::kElements / FragmentCd_::kElements;
+    // Assemble a half2 from a.
+    __half2 const a_half2 = __half2half2(a);
+
+    int const kReduction = (FragmentB_::kElements / FragmentCd_::kElements);
+
     for (int j = 0; j < FragmentCd_::kElements / 2; ++j) {
       d_half2[j] = __hmul2(a_half2, b_half2[j * kReduction + 0]);
+
       for (int k = 1; k < kReduction; ++k) {
         d_half2[j] = __hfma2(a_half2, b_half2[j * kReduction + k], d_half2[j]);
       }
@@ -115,6 +122,7 @@ struct FragmentMultiplyAdd<half> {
 #endif
   }
 
+
   /// Multiply : d = a*b + c.
   template <typename FragmentB_, typename FragmentCd_>
   CUTLASS_DEVICE void multiply_add(half a,
@@ -122,17 +130,19 @@ struct FragmentMultiplyAdd<half> {
                                    FragmentCd_ const& c,
                                    FragmentCd_& d) {
 #if defined(__CUDACC__) && __CUDA_ARCH__ >= 530
-    // Assemble a half2 from a.
-    __half2 const a_half2 = __half2half2(a);
     // The inputs.
     __half2 const* b_half2 = reinterpret_cast<__half2 const*>(&b[0]);
     __half2 const* c_half2 = reinterpret_cast<__half2 const*>(&c[0]);
     // The output.
     __half2* d_half2 = reinterpret_cast<__half2*>(&d[0]);
 
+    // Assemble a half2 from a.
+    __half2 const a_half2 = __half2half2(a);
+
     int const kReduction = (FragmentB_::kElements / FragmentCd_::kElements);
     for (int j = 0; j < FragmentCd_::kElements / 2; ++j) {
       d_half2[j] = __hfma2(a_half2, b_half2[j * kReduction + 0], c_half2[j]);
+
       for (int k = 1; k < kReduction; ++k) {
         d_half2[j] = __hfma2(a_half2, b_half2[j * kReduction + k], d_half2[j]);
       }
diff --git a/cutlass/gemm/clear_accumulators.h b/cutlass/gemm/clear_accumulators.h
index 441370f4c..3a2f33752 100644
--- a/cutlass/gemm/clear_accumulators.h
+++ b/cutlass/gemm/clear_accumulators.h
@@ -27,7 +27,7 @@
 */
 #pragma once
 
-#include <cutlass/vector.h>
+#include "cutlass/vector.h"
 
 namespace cutlass {
 namespace gemm {
@@ -39,11 +39,12 @@ struct ClearAccumulators {
   /// The shared storage.
   struct SharedStorage {};
 
-  /// Ctor.
-  CUTLASS_DEVICE ClearAccumulators() {}
   /// Ctor.
   CUTLASS_DEVICE ClearAccumulators(SharedStorage& shared_storage) {}
 
+  /// Ctor.
+  CUTLASS_DEVICE ClearAccumulators() {}
+
   /// Clear the fragment.
   template <typename Fragment_>
   CUTLASS_DEVICE void clear(Fragment_& fragment) {
diff --git a/cutlass/gemm/dgemm_traits.h b/cutlass/gemm/dgemm_traits.h
index 0bbc2210b..5c0559020 100644
--- a/cutlass/gemm/dgemm_traits.h
+++ b/cutlass/gemm/dgemm_traits.h
@@ -27,13 +27,13 @@
 */
 #pragma once
 
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/gemm_epilogue.h>
-#include <cutlass/gemm/gemm_epilogue_traits.h>
-#include <cutlass/gemm/gemm_global_tile.h>
-#include <cutlass/gemm/gemm_shared_tile.h>
-#include <cutlass/gemm/gemm_traits.h>
-#include <cutlass/gemm/thread_multiply_add.h>
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/gemm_epilogue.h"
+#include "cutlass/gemm/gemm_epilogue_traits.h"
+#include "cutlass/gemm/gemm_global_tile.h"
+#include "cutlass/gemm/gemm_shared_tile.h"
+#include "cutlass/gemm/gemm_traits.h"
+#include "cutlass/gemm/thread_multiply_add.h"
 
 namespace cutlass {
 namespace gemm {
@@ -41,10 +41,10 @@ namespace gemm {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 template <
-    /// The tile size for the GEMM KxNxM.
+    /// The tile size for threadblock-level GEMM (K-by-N-by-M).
     typename OutputTile_,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_,
     /// The number of scalars per LDG for A.
     int kScalarsPerLdgA_ = 1,
     /// The number of scalars per LDG for B.
@@ -62,7 +62,7 @@ struct DgemmConfig
           /// The tile size for the GEMM KxNxM.
           OutputTile_,
           /// The functor to do the math in the main loop.
-          ThreadMultiplyAdd<AccumulatorsPerThread_, Shape<1, 4, 8>, double, double, double>,
+          ThreadMultiplyAdd<ThreadGemmShape_, Shape<1, 4, 8>, double, double, double>,
           /// The number of scalars per LDG for A.
           kScalarsPerLdgA_,
           /// The number of scalars per STS for A.
@@ -82,7 +82,14 @@ struct DgemmConfig
           /// The number of scalars per LDS for D.
           1,
           /// The number of stages in shared memory.
-          2> {};
+          2,
+          /// kResidueSeparate
+          false,
+          /// kResidueInPrologue
+          false,
+          /// kLaunchBounds
+          false
+          >{};
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
@@ -91,12 +98,12 @@ template <
     MatrixLayout::Kind kLayoutA_,
     /// The layout for B.
     MatrixLayout::Kind kLayoutB_,
-    /// The output tile.
+    /// The tile size for threadblock-level GEMM (K-by-N-by-M)
     typename OutputTile_ = Shape<8, 64, 128>,
     /// The functor to use in the epilogue.
     typename EpilogueFunctor_ = LinearScaling<double>,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_ = Shape<8, 8, 8>,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_ = Shape<8, 8, 8>,
     /// The number of doubles loaded in one LDG for A.
     int kScalarsPerLdgA_ = 1,
     /// The number of doubles loaded in one LDG for B.
@@ -105,7 +112,7 @@ template <
     typename Index_ = int,
     /// The DGEMM config.
     typename GemmConfig_ =
-        DgemmConfig<OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_>,
+        DgemmConfig<OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_>,
     /// The traits class for the epilogue.
     typename GemmEpilogueTraits_ =
         SimplifiedGemmEpilogueTraits<GemmConfig_, EpilogueFunctor_, Index_> >
diff --git a/cutlass/gemm/fp16_sgemm_multiply_add.h b/cutlass/gemm/fp16_sgemm_multiply_add.h
new file mode 100644
index 000000000..534b8c899
--- /dev/null
+++ b/cutlass/gemm/fp16_sgemm_multiply_add.h
@@ -0,0 +1,83 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Template implementing matrix multiply-add operations on fragments.
+*/
+#pragma once
+
+#include "cutlass/fragment.h"
+#include "cutlass/gemm/thread_multiply_add.h"
+namespace cutlass {
+namespace gemm {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Template performing matrix multiply-add operation within a thread
+template <typename ThreadGemmShape_,
+          typename ThreadsPerWarp_>
+struct ThreadMultiplyAdd<ThreadGemmShape_, ThreadsPerWarp_, half, half, float> {
+  /// The shape of the instruction.
+  typedef Shape<1, 1, 1, 1> InstructionShape;
+  /// The shape of a thread-leveel matrix multiply accumulate.
+  typedef ThreadGemmShape_ ThreadGemmShape;
+  /// Aliased to "AccumulatorsPerThread" for compatibility. Expect to be renamed in CUTLASS v2.0
+  typedef ThreadGemmShape AccumulatorsPerThread;
+  /// The number of threads per warp.
+  typedef ThreadsPerWarp_ ThreadsPerWarp;
+  /// The number of accumulators per warp.
+  typedef typename ShapeMul<ThreadGemmShape, ThreadsPerWarp>::Shape AccumulatorsPerWarp;
+  /// The type for A. specialized to half
+  typedef half ScalarA;
+  /// The fragment for A.
+  typedef Fragment<ScalarA, AccumulatorsPerThread::kW> FragmentA;
+  /// The type for B. specialized to half
+  typedef half ScalarB;
+  /// The fragment for B.
+  typedef Fragment<ScalarB, AccumulatorsPerThread::kH> FragmentB;
+  /// The type for C and D. specialized to float
+  typedef float ScalarC;
+  /// The accumulators.
+  typedef Fragment<ScalarC, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW, 16> Accumulators;
+
+  /// Ctor.
+  CUTLASS_DEVICE ThreadMultiplyAdd() {}
+
+  /// Multiply : d = a*b + c.
+  CUTLASS_DEVICE void multiply_add(FragmentA const& a,
+                                   FragmentB const& b,
+                                   Accumulators const& c,
+                                   Accumulators& d) {
+    for (int j = 0; j < AccumulatorsPerThread::kH; ++j) {
+      for (int i = 0; i < AccumulatorsPerThread::kW; ++i) {
+        d[j * AccumulatorsPerThread::kW + i] = static_cast<ScalarC>(a[i]) * static_cast<ScalarC>(b[j]) + c[j * AccumulatorsPerThread::kW + i];
+      }
+    }
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace gemm
+}  // namespace cutlass
diff --git a/cutlass/gemm/fp16_sgemm_traits.h b/cutlass/gemm/fp16_sgemm_traits.h
new file mode 100644
index 000000000..361186455
--- /dev/null
+++ b/cutlass/gemm/fp16_sgemm_traits.h
@@ -0,0 +1,152 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Defies structural properties of single-precision GEMM where any number of the input/output
+    could be fp16 or fp32. The accumulator type stays in fp32
+*/
+#pragma once
+
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/gemm_epilogue.h"
+#include "cutlass/gemm/gemm_epilogue_traits.h"
+#include "cutlass/gemm/gemm_global_tile.h"
+#include "cutlass/gemm/gemm_shared_tile.h"
+#include "cutlass/gemm/gemm_traits.h"
+#include "cutlass/gemm/fp16_sgemm_multiply_add.h"
+
+namespace cutlass {
+namespace gemm {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <
+    /// The tile size for the GEMM KxNxM.
+    typename OutputTile_,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_,
+    /// The type for A
+    typename ScalarA_,
+    /// The type for B
+    typename ScalarB_,
+    /// The type for C
+    typename ScalarC_,
+    /// The type for D
+    typename ScalarD_,
+    /// The number of scalars per LDG for A.
+    int kScalarsPerLdgA_ = 1,
+    /// The number of scalars per LDG for B.
+    int kScalarsPerLdgB_ = 1>
+struct Fp16SgemmConfig : public GemmConfig<
+                         /// The scalar type for A.
+                         ScalarA_,
+                         /// The scalar type for B.
+                         ScalarB_,
+                         /// The scalar type for C.
+                         ScalarC_,
+                         /// The scalar type for D.
+                         ScalarD_,
+                         /// The tile size for the GEMM KxNxM.
+                         OutputTile_,
+                         /// The functor to do the math in the main loop.
+                         ThreadMultiplyAdd<ThreadGemmShape_, Shape<1, 4, 8>, ScalarA_, ScalarB_, float /*for sgemm accum is float*/>,
+                         /// The number of scalars per LDG for A.
+                         kScalarsPerLdgA_,
+                         /// The number of scalars per STS for A.
+                         kScalarsPerLdgA_,
+                         /// The number of scalars per LDS for A.
+                         4,
+                         /// The number of scalars per LDG for B.
+                         kScalarsPerLdgB_,
+                         /// The number of scalars per STS for B.
+                         kScalarsPerLdgB_,
+                         /// The number of scalars per LDS for B.
+                         4,
+                         /// The number of scalars per LDG for C and STG for D.
+                         1,
+                         /// The number of scalars per STS for D.
+                         4,
+                         /// The number of scalars per LDS for D.
+                         1,
+                         /// The number of stages in shared memory.
+                         2> {};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <
+    /// The layout for A.
+    MatrixLayout::Kind kLayoutA_,
+    /// The layout for B.
+    MatrixLayout::Kind kLayoutB_,
+    /// The output tile.
+    typename OutputTile_ = Shape<8, 128, 128>,
+    /// The type for A
+    typename ScalarA_ = half,
+    /// The type for B
+    typename ScalarB_ = half,
+    /// The type for C
+    typename ScalarC_ = half,
+    /// The type for D
+    typename ScalarD_ = half,
+    /// the Type for alpha and beta,
+    typename Scalar_ = half,
+    /// The functor to use in the epilogue.
+    typename EpilogueFunctor_ = LinearScaling<Scalar_, FragmentMultiplyAdd<Scalar_, float/*accumulator type*/> >,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_ = Shape<8, 8, 8>,
+    /// The number of floats loaded in one LDG for A.
+    int kScalarsPerLdgA_ = 1,
+    /// The number of floats loaded in one LDG for B.
+    int kScalarsPerLdgB_ = 1,
+    /// The index.
+    typename Index_ = int,
+    /// The SGEMM config.
+    typename GemmConfig_ =
+        Fp16SgemmConfig<OutputTile_, 
+                        ThreadGemmShape_, 
+                        ScalarA_,
+                        ScalarB_,
+                        ScalarC_,
+                        ScalarD_,
+                        kScalarsPerLdgA_, 
+                        kScalarsPerLdgB_>,
+    /// The traits class for the epilogue.
+    typename GemmEpilogueTraits_ =
+        SimplifiedGemmEpilogueTraits<GemmConfig_, EpilogueFunctor_, Index_> >
+struct Fp16SgemmSgemmTraits : public SimplifiedGemmTraits<
+                         // The layout for A.
+                         kLayoutA_,
+                         // The layout for B.
+                         kLayoutB_,
+                         // The config.
+                         GemmConfig_,
+                         // The epilogue.
+                         GemmEpilogue<GemmEpilogueTraits_>,
+                         // The index.
+                         Index_> {};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace gemm
+}  // namespace cutlass
diff --git a/cutlass/gemm/gemm.h b/cutlass/gemm/gemm.h
index c50a3f04b..6340ab4f3 100644
--- a/cutlass/gemm/gemm.h
+++ b/cutlass/gemm/gemm.h
@@ -31,16 +31,17 @@
 #include <cuda.h>
 #endif
 
-#include <cutlass/coord.h>
-#include <cutlass/util/platform.h>
-
+#include "cutlass/coord.h"
+#include "cutlass/util/platform.h"
 namespace cutlass {
 namespace gemm {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+/// GEMM kernel with launch bounds specified
 template <typename Gemm_>
-__global__ /*__launch_bounds__(Gemm_::kThreads)*/ void gemm_kernel(typename Gemm_::Params params) {
+__global__  __launch_bounds__(Gemm_::kThreads)
+void gemm_kernel(typename Gemm_::Params params) {
   // Declare shared memory.
   __shared__ typename Gemm_::SharedStorage shared_storage;
 
@@ -52,28 +53,37 @@ __global__ /*__launch_bounds__(Gemm_::kThreads)*/ void gemm_kernel(typename Gemm
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Scalar_, typename Index_ = int>
-struct GemmDesc {
-  /// The dimensions of the GEMM.
-  Index_ m, n, k;
-  /// The alpha/beta scaling values.
-  Scalar_ alpha, beta;
-  /// The source matrix A.
-  void const* d_a;
-  /// The stride for A.
-  Index_ lda;
-  /// The source matrix B.
-  void const* d_b;
-  /// The stride for B.
-  Index_ ldb;
-  /// The source matrix C.
-  void const* d_c;
-  /// The stride for C.
-  Index_ ldc;
-  /// The destination matrix D.
-  void* d_d;
-  /// The stride for D.
-  Index_ ldd;
+/// GEMM kernel without launch bounds specified
+template <typename Gemm_>
+__global__ /* __launch_bounds__(Gemm_::kThreads) */
+void gemm_kernel_nolb(typename Gemm_::Params params) {
+  // Declare shared memory.
+  __shared__ typename Gemm_::SharedStorage shared_storage;
+
+  // Construct the GEMM object.
+  Gemm_ gemm(params, shared_storage);
+  // Run GEMM.
+  gemm.multiply_add();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Partial specialization for launching the GEMM kernel with or without launch bounds
+template <typename Gemm, bool WithLaunchBounds>
+struct Launch {
+  Launch(typename Gemm::Params params, dim3 grid, dim3 block, cudaStream_t stream = 0) {
+    gemm_kernel<Gemm><<< grid, block, 0, stream >>>(params);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Partial specialization for launching the GEMM kernel with or without launch bounds
+template <typename Gemm>
+struct Launch<Gemm, false> {
+  Launch(typename Gemm::Params params, dim3 grid, dim3 block, cudaStream_t stream = 0) {
+    gemm_kernel_nolb<Gemm><<< grid, block, 0, stream >>>(params);
+  }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
@@ -100,86 +110,52 @@ struct Gemm {
   /// The index.
   typedef typename Traits::Index Index;
 
+  /// Define the mainloop iteration size
+  typedef typename Traits::MultiplyAdd MultiplyAdd;
+
   /// The number of threads.
   static int const kThreads = Traits::GemmConfig::kThreads;
 
-  /// The params.
-  struct Params : public Traits::Params {
-    CUTLASS_HOST_DEVICE int initialize(Index m,
-                                       Index n,
-                                       Index k,
-                                       ScalarEpilogue alpha,
-                                       ScalarA const* d_a,
-                                       Index lda,
-                                       ScalarB const* d_b,
-                                       Index ldb,
-                                       ScalarEpilogue beta,
-                                       ScalarC const* d_c,
-                                       Index ldc,
-                                       ScalarD* d_d,
-                                       Index ldd) {
-      GemmDesc<ScalarEpilogue, Index> desc;
-      desc.m = m;
-      desc.n = n;
-      desc.k = k;
-      desc.alpha = alpha;
-      desc.beta = beta;
-      desc.d_a = reinterpret_cast<void const*>(d_a);
-      desc.lda = lda;
-      desc.d_b = reinterpret_cast<void const*>(d_b);
-      desc.ldb = ldb;
-      desc.d_c = reinterpret_cast<void const*>(d_c);
-      desc.ldc = ldc;
-      desc.d_d = reinterpret_cast<void*>(d_d);
-      desc.ldd = ldd;
-      return Traits::Params::initialize(desc);
-    }
-  };
+  // Number of warp-level multiply-accumulate steps executed by each warp.
+  static Index const kWarpGemmSteps =
+      Traits::GemmConfig::AccumulatorsPerWarp::kD / MultiplyAdd::InstructionShape::kD;
 
+  // Make sure we have at least 2 unrolling steps or our pipeling is not going to work.
+  static_assert(kWarpGemmSteps >= 2, "The pipelining assumes at least two steps");
+
+  /// Use the params object defined in traits
+  typedef typename Traits::Params Params;
+
+//
+// Static function members
+//
+
+/// Support for NVRTC
 #if !defined(__CUDACC_RTC__)
   /// Launch the kernel.
   static __host__ cudaError_t launch(Params const& params,
                                      cudaStream_t stream = cudaStreamDefault) {
-    // Setup the grid.
-    dim3 grid;
-    grid.x = (params.m + Traits::OutputTile::kW - 1) / Traits::OutputTile::kW;
-    grid.y = (params.n + Traits::OutputTile::kH - 1) / Traits::OutputTile::kH;
-
-    // The number of threads.
-    dim3 block;
-    block.x = kThreads;
 
     // Launch the kernel.
-    void const* params_ = reinterpret_cast<void const*>(&params);
+    Launch<This_, GemmTraits_::GemmConfig::kLaunchBounds>(
+      params, params.grid, params.block, stream);
 
-    return cudaLaunchKernel(reinterpret_cast<void*>(&gemm_kernel<This_>),
-                            grid,
-                            block,
-                            const_cast<void**>(&params_),
-                            0,
-                            stream);
+    return cudaGetLastError();
   }
 
   /// Launch the kernel.
   static __host__ cudaError_t launch(CUfunction kernel,
                                      Params const& params,
                                      CUstream stream = CU_STREAM_LEGACY) {
-    // Setup the grid.
-    dim3 grid;
-    grid.x = (params.m + Traits::OutputTile::kW - 1) / Traits::OutputTile::kW;
-    grid.y = (params.n + Traits::OutputTile::kH - 1) / Traits::OutputTile::kH;
-
-    // The number of threads.
-    dim3 block;
-    block.x = kThreads;
 
     // Launch the kernel.
     void* params_[] = {const_cast<void*>(reinterpret_cast<void const*>(&params))};
 
-    // return cudaLaunchKernel(reinterpret_cast<void*>(&gemm_kernel<This_>), grid, block,
-    //  const_cast<void**>(&params_), 0, stream);
     CUresult result = cuLaunchKernel(
-        kernel, grid.x, grid.y, grid.z, block.x, block.y, block.z, 0, stream, params_, 0);
+        kernel,
+        params.grid.x, params.grid.y, params.grid.z,
+        params.block.x, params.block.y, params.block.z,
+        0, stream, params_, 0);
 
     if (result != CUDA_SUCCESS) {
       return cudaErrorLaunchFailure;
@@ -189,39 +165,41 @@ struct Gemm {
 
 #endif
 
+  //
+  // Methods
+  //
+
   /// Ctor.
   CUTLASS_DEVICE Gemm(Params const& params_, SharedStorage& shared_storage_)
       : params(params_), shared_storage(shared_storage_) {}
 
-  /// Consume a single iteration of the loop.
-  template <bool kIsLastIteration>
-  CUTLASS_DEVICE void consume_tile(typename Traits::GlobalLoadStream& global_stream,
-                                   typename Traits::SharedLoadStream& shared_load_stream,
-                                   typename Traits::MultiplyAdd::Accumulators& accumulators,
+  /// Computes a warp-level GEMM on data held in shared memory
+  template <bool Residue, bool LastIteration>
+  CUTLASS_DEVICE void consume_tile(typename Traits::GlobalLoadStream& global_to_shared_stream,
+                                   typename Traits::SharedStream& shared_load_stream,
+                                   typename MultiplyAdd::Accumulators& accumulators,
                                    Index outer_k) {
-    // If that's the last "load iteration" update the predicates.
-    if (!kIsLastIteration) {
-      global_stream.move_to_residue<false>(outer_k);
+    // If residue portion and not calculating residue in prolog, update residue predicates now.
+    if (Residue && outer_k <= Traits::OutputTile::kD) {
+      global_to_shared_stream.residue(outer_k);
     }
 
-    // Load data for the next iteration of the main loop.
-    if (!kIsLastIteration) {
-      global_stream.copy();
+    // Load data for the next iteration of the main loop (unless it's the last iteration).
+    if (!LastIteration) {
+      global_to_shared_stream.copy();
     }
 
-    // The unrolling steps for the main loop.
-    int const kUnrollingSteps =
-        Traits::MultiplyAdd::AccumulatorsPerWarp::kD / Traits::MultiplyAdd::InstructionShape::kD;
-
     CUTLASS_PRAGMA_UNROLL
-    for (int step = 0; step < kUnrollingSteps - 1; ++step) {
+    for (int step = 0; step < kWarpGemmSteps - 1; ++step) {
       // Trigger the copy from shared memory for the next A/B values.
       shared_load_stream.copy(step + 1);
+
       // Make sure the values are available for the current iteration to do the multiply-add.
       shared_load_stream.commit(step);
 
+      MultiplyAdd multiply_add;
+
       // Do the math on the fragments of the current iteration.
-      typename Traits::MultiplyAdd multiply_add;
       multiply_add.multiply_add(shared_load_stream.fragment_a(step),
                                 shared_load_stream.fragment_b(step),
                                 accumulators,
@@ -232,28 +210,25 @@ struct Gemm {
     Traits::shared_load_fence(true);
 
     // Commit the data in shared memory for A/B.
-    if (!kIsLastIteration) {
-      global_stream.commit();
+    if (!LastIteration) {
+      global_to_shared_stream.commit();
     }
-
     // Make sure the data is in shared memory.
     Traits::shared_store_fence(true);
 
-    // Trigger the loads for the next iteration (if needed).
-    if (!kIsLastIteration) {
+    if (!LastIteration) {
       // Move to the next stage for the load (if it makes sense).
       shared_load_stream.inc_stage();
       // Trigger the copy from shared memory for the next loop iteration.
       shared_load_stream.copy(0);
     }
-
     // Make sure the values are available for the current iteration to do the multiply-add.
-    shared_load_stream.commit(kUnrollingSteps - 1);
+    shared_load_stream.commit(kWarpGemmSteps - 1);
 
     // Do the math on the fragments of the current iteration.
-    typename Traits::MultiplyAdd multiply_add;
-    multiply_add.multiply_add(shared_load_stream.fragment_a(kUnrollingSteps - 1),
-                              shared_load_stream.fragment_b(kUnrollingSteps - 1),
+    MultiplyAdd multiply_add;
+    multiply_add.multiply_add(shared_load_stream.fragment_a(kWarpGemmSteps - 1),
+                              shared_load_stream.fragment_b(kWarpGemmSteps - 1),
                               accumulators,
                               accumulators);
   }
@@ -262,76 +237,112 @@ struct Gemm {
   CUTLASS_DEVICE void multiply_add() {
     // Swizzle the IDs of the block (to enable better cache behavior).
     typename Traits::BlockSwizzle block_swizzle;
-    dim3 block = block_swizzle.swizzle();
-
-    // Scale the id.
-    block.x *= Traits::OutputTile::kW;
-    block.y *= Traits::OutputTile::kH;
+    Coord<3> threadblock_offset =
+        block_swizzle.get_threadblock_offset(make_Coord_from_shape<Traits::OutputTile>());
 
     // We may want to use shared memory to clear the registers.
     typedef typename Traits::ClearAccumulators ClearAccumulators;
 
     // The streams to read A/B from global memory to shared memory.
-    typename Traits::GlobalLoadStream global_stream(params, shared_storage, block);
+    typename Traits::GlobalLoadStream global_to_shared_stream(
+        params.global_to_shared_stream,
+        shared_storage.main_loop.global_to_shared_stream,
+        shared_storage.main_loop.threadblock_tile.reference(),
+        params.problem_size.knm(),
+        threadblock_offset);
+
+    // update A and B pointer offset based on batch_id and batch_stride_offset
+    //global_to_shared_stream.add_pointer_offset(block_swizzle.get_batch_id(), params.batch_stride_A, params.batch_stride_B);
+    global_to_shared_stream += make_Coord(block_swizzle.get_batch_id(), 0, 0);
 
     // Create the accumulator clear.
-    ClearAccumulators clear(shared_storage.main_loop.clear);
+    ClearAccumulators clear;
 
-    // By how much we unroll the main loop.
-    Index const kUnroll = static_cast<Index>(Traits::OutputTile::kD);
-
-    // If we do not have enough steps in the main loop, trigger the residue code.
-    global_stream.move_to_residue<true>(params.k);
+    // Deal with residue in prolog.
+    global_to_shared_stream.move_to_residue(params.problem_size[0], Traits::OutputTile::kD);
 
     // Fetch the fragments for A and B from global memory.
-    global_stream.copy();
+    global_to_shared_stream.copy();
 
     // Copy the elements to shared memory (after transformation if needed).
-    global_stream.commit();
+    global_to_shared_stream.commit();
 
     // Make sure the data is in shared memory.
     Traits::shared_store_fence(false);
 
-    // Rollback to the beginning of the GEMM-K dimension. It may have no impact.
-    global_stream.rollback();
-
-    // The unrolling steps for the main loop.
-    int const kUnrollingSteps =
-        Traits::MultiplyAdd::AccumulatorsPerWarp::kD / Traits::MultiplyAdd::InstructionShape::kD;
-
-    // Make sure we have at least 2 unrolling steps or our pipeling is not going to work.
-    static_assert(kUnrollingSteps >= 2, "The pipelining assumes at least two steps");
+    // Rollback to the beginning of the first tile (if residue exists).
+    global_to_shared_stream.rollback(params.problem_size[0] % Traits::OutputTile::kD);
 
     // The stream of data from shared memory to fragments.
-    typename Traits::SharedLoadStream shared_load_stream(params, shared_storage);
+    typename Traits::SharedStream shared_load_stream(
+        params.shared_stream,
+        shared_storage.main_loop.threadblock_tile.reference());
 
     // Trigger the copy from shared memory for the 1st stream.
     shared_load_stream.copy(0);
 
     // Allocate the accumulators.
-    typename Traits::MultiplyAdd::Accumulators accumulators;
+    typename MultiplyAdd::Accumulators accumulators;
+
     // Clear the accumulators.
     clear.clear(accumulators);
 
-    // The loop index.
-    Index outer_k = params.k - kUnroll;
+    // Initial index
+    Index outer_k = params.problem_size[0] - Traits::OutputTile::kD;
 
-    // Enter the main loop and iterate.
-    for (; outer_k > 0; outer_k -= kUnroll) {
-      consume_tile<false>(global_stream, shared_load_stream, accumulators, outer_k);
-    }
+    // Check if we are computing residue in prolog or not.
+    if (Traits::GemmConfig::kResidueInProlog) {
 
-    // Residual loop.
-    for (; outer_k > -kUnroll; outer_k -= kUnroll) {
-      consume_tile<true>(global_stream, shared_load_stream, accumulators, outer_k);
+      // Execute all mainloop iterations but the last one.
+
+      CUTLASS_GEMM_LOOP
+      for (; outer_k > 0; outer_k -= Traits::OutputTile::kD) {
+        consume_tile<false, false>(
+            global_to_shared_stream, shared_load_stream, accumulators, outer_k);
+
+      }
+
+      // Don't load data for the last "residue" portion since we've already computed the residue.
+      CUTLASS_GEMM_LOOP
+      for (; outer_k > -Traits::OutputTile::kD; outer_k -= Traits::OutputTile::kD) {
+        consume_tile<false, true>(
+            global_to_shared_stream, shared_load_stream, accumulators, outer_k);
+
+      }
+    } else {
+      // When kResidueSeparate = true, execute all mainloop iterations but the last two without any
+      // consideration for K-residue or predicate updates. This improves the steady state of some
+      // kernels.
+      if (Traits::GemmConfig::kResidueSeparate) {
+
+        CUTLASS_GEMM_LOOP
+        for (; outer_k > Traits::OutputTile::kD; outer_k -= Traits::OutputTile::kD) {
+          consume_tile<false, false>(
+              global_to_shared_stream, shared_load_stream, accumulators, outer_k);
+
+        }
+      }
+
+      // Execute remaining tiles with K-residue predicate updates enabled.
+
+      CUTLASS_GEMM_LOOP
+      for (; outer_k > -Traits::OutputTile::kD; outer_k -= Traits::OutputTile::kD) {
+        consume_tile<true, false>(
+            global_to_shared_stream, shared_load_stream, accumulators, outer_k);
+
+      }
     }
 
     // Epilogue.
     typedef typename Traits::Epilogue Epilogue;
-    Epilogue epilogue(params.epilogue, shared_storage.epilogue, params.m, params.n);
-    epilogue.epilogue(cutlass::make_Coord(0, block.y, block.x), accumulators);
+    Epilogue epilogue(params.epilogue, shared_storage.epilogue, params.problem_size.knm());
+    epilogue.epilogue(accumulators, threadblock_offset, block_swizzle.get_batch_id());
   }
 
+  //
+  // Data members
+  //
+
   /// The params.
   Params const& params;
   /// The shared storage.
diff --git a/cutlass/gemm/gemm_config.h b/cutlass/gemm/gemm_config.h
new file mode 100644
index 000000000..76df0add6
--- /dev/null
+++ b/cutlass/gemm/gemm_config.h
@@ -0,0 +1,145 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *   * Redistributions of source code must retain the above copyright notice, this list of
+ *     conditions and the following disclaimer.
+ *   * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *     conditions and the following disclaimer in the documentation and/or other materials
+ *     provided with the distribution.
+ *   * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *     to endorse or promote products derived from this software without specific prior written
+ *     permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+  \brief Defines properties of GEMM computation that impose some constraints on caller.
+*/
+#pragma once
+
+#include "cutlass/shape.h"
+
+namespace cutlass {
+namespace gemm {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <
+    /// The scalar type for A.
+    typename ScalarA_,
+    /// The scalar type for B.
+    typename ScalarB_,
+    /// The scalar type for C.
+    typename ScalarC_,
+    /// The scalar type for D.
+    typename ScalarD_,
+    /// The threadblock tile size for the GEMM KxNxM.
+    typename OutputTile_,
+    /// The functor to do the math.
+    typename MultiplyAdd_,
+    /// The number of scalars per LDG for A.
+    int kScalarsPerLdgA_,
+    /// The number of scalars per STS for A.
+    int kScalarsPerStsA_,
+    /// The number of scalars per LDG for A.
+    int kScalarsPerLdsA_,
+    /// The number of scalars per LDG for B.
+    int kScalarsPerLdgB_,
+    /// The number of scalars per STS for B.
+    int kScalarsPerStsB_,
+    /// The number of scalars per LDS for B.
+    int kScalarsPerLdsB_,
+    /// The number of scalars per LDG for C and STG for D.
+    int kScalarsPerLdgCAndStgD_,
+    /// The number of scalars per STS for D.
+    int kScalarsPerStsD_,
+    /// The number of scalars per LDS for D.
+    int kScalarsPerLdsD_,
+    /// The number of stages in shared memory to do single/double/triple-buffering.
+    int kStages_,
+    /// If true, residue is computed in mainloop. If false, separate loops are instantiated.
+    bool kResidueSeparate_ = false,
+    /// Is residue performed in prologue?
+    bool kResidueInProlog_ = false,
+    /// If true, kernel is launched with CUDA launch bounds specified
+    bool kLaunchBounds_ = true>
+struct GemmConfig {
+  //
+  /// The scalar for A.
+  typedef ScalarA_ ScalarA;
+  /// The scalar for B.
+  typedef ScalarB_ ScalarB;
+  /// The scalar for C.
+  typedef ScalarC_ ScalarC;
+  /// The scalar for D.
+  typedef ScalarD_ ScalarD;
+
+  /// The tile.
+  typedef OutputTile_ OutputTile;
+  /// The functor to do D = A*B + C.
+  typedef MultiplyAdd_ MultiplyAdd;
+  /// The shape of the instruction.
+  typedef typename MultiplyAdd::InstructionShape InstructionShape;
+  /// The shape of warp-level GEMM
+  typedef typename MultiplyAdd::AccumulatorsPerWarp AccumulatorsPerWarp;
+  /// The accumulators.
+  typedef typename MultiplyAdd::Accumulators Accumulators;
+
+  /// The number of warps.
+  typedef typename ShapeDiv<OutputTile, AccumulatorsPerWarp>::Shape Warps;
+  /// The default warp size (32 threads per warp).
+  static int const kWarpSize = cutlass::kWarpSize;
+  /// The numnber of threads.
+  static int const kThreads = ShapeCount<Warps>::kCount * kWarpSize;
+
+  /// The number of scalars per LDG/STS/LDS for A.
+  static int const kScalarsPerLdgA = kScalarsPerLdgA_;
+  static int const kScalarsPerStsA = kScalarsPerStsA_;
+  static int const kScalarsPerLdsA = kScalarsPerLdsA_;
+
+  /// The number of scalars per LDG/STS/LDS for B.
+  static int const kScalarsPerLdgB = kScalarsPerLdgB_;
+  static int const kScalarsPerStsB = kScalarsPerStsB_;
+  static int const kScalarsPerLdsB = kScalarsPerLdsB_;
+
+  /// The number of scalars per LDG for C.
+  static int const kScalarsPerLdgC = kScalarsPerLdgCAndStgD_;
+
+  /// The number of scalars per STS/LDS/STG for D.
+  static int const kScalarsPerStgD = kScalarsPerLdgCAndStgD_;
+  static int const kScalarsPerStsD = kScalarsPerStsD_;
+  static int const kScalarsPerLdsD = kScalarsPerLdsD_;
+
+  /// The number of accumulators that are going to be fed from one LDS A/B.
+  static int const kAccumulatorsPerLdsA = kScalarsPerLdsA / InstructionShape::kD;
+  static int const kAccumulatorsPerLdsB = kScalarsPerLdsB / InstructionShape::kD;
+
+  /// The number of stages in shared memory to implement double, triple, more-buffering.
+  static int const kStages = kStages_;
+
+  /// If true, mainloop is instantiated twice. The first instantiation contains no predicate
+  // updates and is more efficient for some kernels. If false, only a single mainloop is
+  // instantaited.
+  static bool const kResidueSeparate = kResidueSeparate_;
+
+  /// If true, residue is computed in the prologue.
+  static bool const kResidueInProlog = kResidueInProlog_;
+
+  /// If true, kernel is launched with launch bounds specified
+  static bool const kLaunchBounds = kLaunchBounds_;
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace gemm
+}  // namespace cutlass
diff --git a/cutlass/gemm/gemm_coord.h b/cutlass/gemm/gemm_coord.h
new file mode 100644
index 000000000..8e36bb043
--- /dev/null
+++ b/cutlass/gemm/gemm_coord.h
@@ -0,0 +1,203 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief GemmCoord is a structure derived from Coord<4> that specifies a location within the
+      coordinate system of a GEMM problem.
+*/
+
+#pragma once
+
+#include "cutlass/cutlass.h"
+#include "cutlass/coord.h"
+#include "cutlass/util/platform.h"
+
+namespace cutlass {
+namespace gemm {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// GemmCoord is a structure derived from Coord<4> that specifies a location within the
+/// coordinate space of a GEMM problem.
+struct GemmCoord : public Coord<4, int> {
+
+  /// Integer-valued index
+  typedef int Index;
+
+  /// Base type is a Coord of rank=4
+  typedef Coord<4, Index> Base;
+
+  /// GEMM K dimension - inner dimension of the GEMM problem
+  static int const kK = 0;
+
+  /// GEMM N dimension - columns of the output C matrix
+  static int const kN = 1;
+
+  /// GEMM M dimension - rows of the output C matrix
+  static int const kM = 2;
+
+  /// Batch dimension - for generalizing to larger problems
+  static int const kBatch = 3;
+
+  //
+  // Methods
+  //
+
+  /// Default ctor
+  CUTLASS_HOST_DEVICE
+  GemmCoord() { }
+
+  /// Constructs from Coord<3> and a batch
+  CUTLASS_HOST_DEVICE
+  GemmCoord(Coord<3, Index> const &coord, Index _batch = 0): Base(make_Coord(coord[0], coord[1], coord[2], _batch)) { }
+
+  /// Constructs from Coord<4>
+  CUTLASS_HOST_DEVICE
+  GemmCoord(Coord<4, Index> const &coord): Base(coord) { }
+
+  /// Constructs from an array of coordinate elements
+  CUTLASS_HOST_DEVICE
+  GemmCoord(Index coord[4]): Base(coord) { }
+
+  /// Helper to construct from a K, N, M, batch variables
+  CUTLASS_HOST_DEVICE
+  GemmCoord(Index k, Index n, Index m, Index batch = 0): Base(make_Coord(k, n, m, batch)) { }
+
+  /// Returns the GEMM M coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & m() const { return this->at(kM); }
+
+  /// Returns reference to the GEMM M coordinate
+  CUTLASS_HOST_DEVICE
+  Index & m() { return this->at(kM); }
+
+  /// Returns the GEMM N coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & n() const { return this->at(kN); }
+
+  /// Returns reference to the GEMM N coordinate
+  CUTLASS_HOST_DEVICE
+  Index & n() { return this->at(kN); }
+
+  /// Returns the GEMM K coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & k() const { return this->at(kK); }
+
+  /// Returns reference to the GEMM K coordinate
+  CUTLASS_HOST_DEVICE
+  Index & k() { return this->at(kK); }
+
+  /// Returns the GEMM batch coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & batch() const { return this->at(kBatch); }
+
+  /// Returns reference to the GEMM batch coordinate
+  CUTLASS_HOST_DEVICE
+  Index & batch() { return this->at(kBatch); }
+
+  /// Obtains a Coord<3> from GemmCoord
+  CUTLASS_HOST_DEVICE
+  Coord<3> knm() const {
+    return make_Coord(k(), n(), m());
+  }
+
+  /// Obtains a Coord<2> from GemmCoord
+  CUTLASS_HOST_DEVICE
+  Coord<2> nm() const {
+    return make_Coord(n(), m());
+  }
+
+  /// Obtains a Coord<2> from GemmCoord
+  CUTLASS_HOST_DEVICE
+  Coord<2> km() const {
+    return make_Coord(k(), m());
+  }
+
+  /// Obtains a Coord<2> from GemmCoord
+  CUTLASS_HOST_DEVICE
+  Coord<2> kn() const {
+    return make_Coord(k(), n());
+  }
+
+  //
+  // Coord operators
+  //
+
+  /// Element-wise addition
+  CUTLASS_HOST_DEVICE
+  GemmCoord operator+(Base const& b) const {
+    return GemmCoord(Base::operator+(b));
+  }
+
+  /// Element-wise subtraction
+  CUTLASS_HOST_DEVICE
+  GemmCoord operator-(Base const& b) const {
+    return GemmCoord(Base::operator-(b));
+  }
+
+  /// Element-wise multiplication
+  CUTLASS_HOST_DEVICE
+  GemmCoord operator*(Base const& b) const {
+    return GemmCoord(Base::operator*(b));
+  }
+
+  /// Element-wise division
+  CUTLASS_HOST_DEVICE
+  GemmCoord operator/(Base const& b) const {
+    return GemmCoord(Base::operator/(b));
+  }
+
+  /// In-place addition
+  CUTLASS_HOST_DEVICE
+  GemmCoord& operator+=(Base const& b) {
+    Base::operator+=(b);
+    return *this;
+  }
+
+  /// In-place subtraction
+  CUTLASS_HOST_DEVICE
+  GemmCoord& operator-=(Base const& b) {
+    Base::operator-=(b);
+    return *this;
+  }
+
+  /// In-place multiplication
+  CUTLASS_HOST_DEVICE
+  GemmCoord& operator*=(Base const& b) {
+    Base::operator*=(b);
+    return *this;
+  }
+
+  /// In-place division
+  CUTLASS_HOST_DEVICE
+  GemmCoord& operator/=(Base const& b) {
+    Base::operator/=(b);
+    return *this;
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace gemm
+} // namespace cutlass
diff --git a/cutlass/gemm/gemm_desc.h b/cutlass/gemm/gemm_desc.h
new file mode 100644
index 000000000..80f4b3655
--- /dev/null
+++ b/cutlass/gemm/gemm_desc.h
@@ -0,0 +1,205 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Implements a software-pipelined efficient GEMM.
+*/
+#pragma once
+
+#include "cutlass/tensor_ref.h"
+#include "cutlass/gemm/gemm_coord.h"
+
+namespace cutlass {
+namespace gemm {
+
+/// GEMM problem description
+template <
+    /// Source accumulator matrix type
+    typename AType_,
+    /// Destination accumulator type
+    typename BType_,
+    /// Source accumulator matrix type
+    typename CType_,
+    /// Destination accumulator type
+    typename DType_,
+    /// Scalar type for alpha and beta
+    typename SType_,
+    /// Index type for dimensions and strides
+    typename Index_ = int
+> struct GemmDesc {
+  //
+  // Type definitions
+  //
+
+  /// Index type for dimensions and strides
+  typedef Index_ Index;
+
+  /// Source accumulator matrix type
+  typedef AType_ AType;
+
+  /// Tensor reference to A operand
+  typedef TensorRef<AType const, 2> TensorRefA;
+
+  /// Destination accumulator type
+  typedef BType_ BType;
+
+  /// Tensor reference to B operand
+  typedef TensorRef<BType const, 2> TensorRefB;
+
+  /// Source accumulator matrix type
+  typedef CType_ CType;
+
+  /// Tensor reference to C operand
+  typedef TensorRef<CType const, 2> TensorRefC;
+
+  /// Destination accumulator type
+  typedef DType_ DType;
+
+  /// Tensor reference to D operand
+  typedef TensorRef<DType, 2> TensorRefD;
+
+  /// Scalar type for alpha and beta
+  typedef SType_ SType;
+
+  //
+  // Data members
+  //
+
+  /// The dimensions of the GEMM.
+  GemmCoord problem_size;
+
+  /// The alpha scaling values.
+  SType alpha;
+
+  /// The source matrix A.
+  TensorRefA A;
+
+  /// batch stride for A operand
+  long long batch_stride_A;
+
+  /// The source matrix B.
+  TensorRefB B;
+
+  /// batch stride for B operand
+  long long batch_stride_B;
+
+  /// The beta scaling values.
+  SType beta;
+
+  /// The source matrix C.
+  TensorRefC C;
+
+  /// batch stride for C operand
+  long long batch_stride_C;
+
+  /// The destination matrix D.
+  TensorRefD D;
+
+  /// batch stride for D operand
+  long long batch_stride_D;
+
+  //
+  // Methods
+  //
+
+  /// Default ctor
+  CUTLASS_HOST_DEVICE
+  GemmDesc(): problem_size(0, 0, 0, 1), alpha(1), beta(0) {}
+
+  /// Constructor for basic GEMM with batch count = 1
+  CUTLASS_HOST_DEVICE
+  GemmDesc(Coord<3> _problem_size,
+           SType _alpha,
+           TensorRefA const &_A,
+           TensorRefB const &_B,
+           SType _beta,
+           TensorRefC const &_C,
+           TensorRefD const &_D
+  ):
+    problem_size(_problem_size[0], _problem_size[1], _problem_size[2], 1),
+    alpha(_alpha),
+    A(_A),
+    batch_stride_A(0),
+    B(_B),
+    batch_stride_B(0),
+    beta(_beta),
+    C(_C),
+    batch_stride_C(0),
+    D(_D),
+    batch_stride_D(0) {}
+
+  /// Constructor for basic GEMM with batch count = 1
+  CUTLASS_HOST_DEVICE
+  GemmDesc(GemmCoord _problem_size,
+           SType _alpha,
+           TensorRefA const &_A,
+           TensorRefB const &_B,
+           SType _beta,
+           TensorRefC const &_C,
+           TensorRefD const &_D
+  ):
+    problem_size(_problem_size.k(), _problem_size.n(), _problem_size.m(), 1),
+    alpha(_alpha),
+    A(_A),
+    batch_stride_A(0),
+    B(_B),
+    batch_stride_B(0),
+    beta(_beta),
+    C(_C),
+    batch_stride_C(0),
+    D(_D),
+    batch_stride_D(0) {
+
+    assert(_problem_size.batch() == 1);
+  }
+
+  /// Constructor for strided batch GEMM GEMM
+  CUTLASS_HOST_DEVICE
+  GemmDesc(GemmCoord _problem_size,
+           SType _alpha,
+           TensorRefA const &_A,
+           long long _batch_stride_A,
+           TensorRefB const &_B,
+           long long _batch_stride_B,
+           SType _beta,
+           TensorRefC const &_C,
+           long long _batch_stride_C,
+           TensorRefD const &_D,
+           long long _batch_stride_D
+  ):
+    problem_size(_problem_size),
+    alpha(_alpha),
+    A(_A),
+    batch_stride_A(_batch_stride_A),
+    B(_B),
+    batch_stride_B(_batch_stride_B),
+    beta(_beta),
+    C(_C),
+    batch_stride_C(_batch_stride_C),
+    D(_D),
+    batch_stride_D(_batch_stride_D) {}
+};
+
+}  // namespace gemm
+}  // namespace cutlass
diff --git a/cutlass/gemm/gemm_epilogue.h b/cutlass/gemm/gemm_epilogue.h
index bc2530777..d9469bb55 100644
--- a/cutlass/gemm/gemm_epilogue.h
+++ b/cutlass/gemm/gemm_epilogue.h
@@ -29,26 +29,15 @@
 */
 #pragma once
 
-#include <cutlass/convert.h>
-#include <cutlass/coord.h>
-#include <cutlass/fragment.h>
+#include "cutlass/convert.h"
+#include "cutlass/coord.h"
+#include "cutlass/fragment.h"
 
 namespace cutlass {
 namespace gemm {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename T>
-CUTLASS_DEVICE bool is_zero(T x) {
-  return x == T(0);
-}
-
-#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)
-CUTLASS_DEVICE bool is_zero(half x) { return reinterpret_cast<int16_t&>(x) == int16_t(0); }
-#endif
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 template <typename GemmEpilogueTraits_>
 struct GemmEpilogue {
   /// The traits class.
@@ -85,9 +74,7 @@ struct GemmEpilogue {
   /// The shared store transformer for D.
   typedef typename Traits::SharedStoreTransformerD SharedStoreTransformerD;
   /// The iterator to load D in shared memory.
-  typedef typename Traits::SharedLoadIteratorD SharedLoadIteratorD;
-  /// The shared load transformer for D.
-  typedef Copy<typename SharedLoadIteratorD::Fragment> SharedLoadTransformerD;
+  typedef typename Traits::SharedLoadStreamD SharedLoadStreamD;
 
   /// The index.
   typedef typename Traits::Index Index;
@@ -100,33 +87,28 @@ struct GemmEpilogue {
   /// Ctor.
   CUTLASS_DEVICE GemmEpilogue(Params const& params_,
                               SharedStorage& shared_storage_,
-                              Index m_,
-                              Index n_)
-      : params(params_), shared_storage(shared_storage_), m(m_), n(n_) {}
+                              Coord<3> const& _problem_size)
+      : params(params_), shared_storage(shared_storage_), problem_size(_problem_size), functor(params_.functor) {}
 
   /// Execute the epilogue.
-  CUTLASS_DEVICE void epilogue(Coord<3> const& block, Accumulators& accumulators) {
-    if (is_zero(params.functor.beta)) {
-      epilogue_with_or_without_beta<true>(block, accumulators);
+  CUTLASS_DEVICE void epilogue(Accumulators& accumulators,
+                               Coord<3> const& block = make_Coord(0, 0, 0),
+                               int batch_id = 0) {
+    if (functor.source_required()) {
+      epilogue_with_or_without_beta<true>(accumulators, block, batch_id);
     } else {
-      epilogue_with_or_without_beta<false>(block, accumulators);
+      epilogue_with_or_without_beta<false>(accumulators, block, batch_id);
     }
   }
 
-  template <bool kBetaIsZero_>
-  CUTLASS_DEVICE void epilogue_with_or_without_beta(Coord<3> const& block,
-                                                    Accumulators& accumulators) {
-
-    // The problem size.
-    Coord<3> const bounds = cutlass::make_Coord(0, n, m);
-
-    // The functor.
-    Functor functor(params.functor);
+  template <bool kSourceRequired>
+  CUTLASS_DEVICE void epilogue_with_or_without_beta(Accumulators& accumulators,
+                                                    Coord<3> const& block,
+                                                    int batch_id) {
     // The C fragment.
     typename GlobalLoadIteratorC::Fragment fragment_c;
     // The transformed C fragment.
     typename GlobalTransformerC::OutputFragment transformed_c;
-
     CUTLASS_PRAGMA_UNROLL
     for (int h = 0; h < Iterations::kH; ++h) {
       // Compute pointer and predicate offsets for C and D global iterators.
@@ -136,6 +118,7 @@ struct GemmEpilogue {
                Iterations::kW +
            params.stride_h) *
           h;
+
       int const predicate_offset =
           ((params.iterator_d.predicate_inc_h * (GlobalStoreIteratorD::Iterations::kH - 1) +
             params.iterator_d.predicate_inc_advance) *
@@ -145,32 +128,40 @@ struct GemmEpilogue {
 
       // The iterator to load the elements of the C matrix.
       GlobalLoadIteratorC global_load_iterator(
-          params.iterator_c, bounds, block, pointer_offset, predicate_offset);
+          params.iterator_c, problem_size, block, pointer_offset, predicate_offset);
+
+      // update C pointer offset based on batch_id and batch_stride_offset
+      //global_load_iterator.add_pointer_offset(batch_id * params.batch_stride_offset_c);
+      global_load_iterator += make_Coord(batch_id, 0, 0);
+
       // The transformer for C.
       GlobalTransformerC transformer_c;
       // The transformer for D.
       GlobalTransformerD transformer_d;
       // The iterator to store into the D matrix.
       GlobalStoreIteratorD global_store_iterator(
-          params.iterator_d, bounds, block, pointer_offset, predicate_offset);
+          params.iterator_d, problem_size, block, pointer_offset, predicate_offset);
+
+      // update D pointer offset based on batch_id and batch_stride_offset
+      //global_store_iterator.add_pointer_offset(batch_id * params.batch_stride_offset_d);
+      global_store_iterator += make_Coord(batch_id, 0, 0);
 
-      // The transformer to transform before storing to shared memory.
       SharedStoreTransformerD shared_store_transformer;
       typename SharedStoreTransformerD::OutputFragment shared_store_transformed_d;
 
-      // The iterator to store to shared memory.
-      SharedStoreIteratorD shared_store_iterator(params.shared_store_iterator_d,
-                                                 shared_storage.shared_stream.store);
+      SharedStoreIteratorD shared_store_iterator(
+          params.shared_store_iterator_d,
+          reinterpret_cast<typename SharedStoreIteratorD::Scalar*>(shared_storage.data()));
 
-      // The iterator to load from shared memory. TODO: Use a stream.
-      SharedLoadIteratorD shared_load_iterator(params.shared_load_iterator_d,
-                                               shared_storage.shared_stream.load);
+      SharedLoadStreamD shared_load_stream(
+          params.shared_load_stream_d,
+          reinterpret_cast<typename SharedLoadStreamD::Scalar*>(shared_storage.data()));
 
       CUTLASS_PRAGMA_UNROLL
       for (int w = 0; w < Iterations::kW; ++w) {
         // Load the C matrix into fragment.
-        if (!kBetaIsZero_) {
-          iterator_load(global_load_iterator, fragment_c);
+        if (kSourceRequired) {
+          global_load_iterator.load_post_increment(fragment_c);
         }
 
         // Make sure we can write to shared memory.
@@ -180,33 +171,33 @@ struct GemmEpilogue {
         int const offset = (h * Iterations::kW + w) * SharedStoreIteratorD::Fragment::kElements;
 
         shared_store_transformer.transform(accumulators, offset, shared_store_transformed_d);
-        shared_iterator_store(shared_store_iterator, shared_store_transformed_d);
+        shared_store_iterator.store_post_increment(shared_store_transformed_d);
 
         // Make sure the data is in shared memory.
         shared_store_fence();
 
         // Copy the accumulators back to registers from shared memory.
-        typename SharedLoadIteratorD::Fragment fetched_d;
-        shared_iterator_load(shared_load_iterator, fetched_d);
+        shared_load_stream.copy();
+        shared_load_stream.commit();
 
         // Do the math.
         typename GlobalTransformerD::InputFragment fragment_d;
 
-        if (kBetaIsZero_) {
-          functor.evaluate(fetched_d, fragment_d);
-        } else {
+        if (kSourceRequired) {
           // Transform C fragment.
           transformer_c.transform(fragment_c, transformed_c);
           // Do the math.
-          functor.evaluate(fetched_d, transformed_c, fragment_d);
+          functor.evaluate(shared_load_stream.fragment(), transformed_c, fragment_d);
+        } else {
+          functor.evaluate(shared_load_stream.fragment(), fragment_d);
         }
 
         // Transform D fragment.
-        typename GlobalTransformerD::OutputFragment transformed_d;
-        transformer_d.transform(fragment_d, transformed_d);
+        typename GlobalTransformerD::OutputFragment global_transformed_d;
+        transformer_d.transform(fragment_d, global_transformed_d);
 
         // Copy the results to global memory.
-        iterator_store(global_store_iterator, transformed_d);
+        global_store_iterator.store_post_increment(global_transformed_d);
       }
     }
   }
@@ -222,7 +213,9 @@ struct GemmEpilogue {
   /// The shared storage.
   SharedStorage& shared_storage;
   /// The dimensions of the GEMM.
-  Index m, n;
+  Coord<3> problem_size;
+  // The functor.
+  Functor functor;
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/cutlass/gemm/gemm_epilogue_traits.h b/cutlass/gemm/gemm_epilogue_traits.h
index c06fc2502..c6aff71e1 100644
--- a/cutlass/gemm/gemm_epilogue_traits.h
+++ b/cutlass/gemm/gemm_epilogue_traits.h
@@ -27,13 +27,13 @@
 */
 #pragma once
 
-#include <cutlass/convert.h>
-#include <cutlass/coord.h>
-#include <cutlass/gemm/gemm_global_stream.h>
-#include <cutlass/gemm/gemm_shared_stream.h>
-#include <cutlass/gemm/linear_scaling.h>
-#include <cutlass/reshape_tile.h>
-#include <cutlass/tile_iterator.h>
+#include "cutlass/convert.h"
+#include "cutlass/coord.h"
+#include "cutlass/gemm/gemm_global_stream.h"
+#include "cutlass/gemm/gemm_shared_stream.h"
+#include "cutlass/gemm/linear_scaling.h"
+#include "cutlass/reshape_tile.h"
+#include "cutlass/tile_iterator.h"
 
 namespace cutlass {
 namespace gemm {
@@ -57,8 +57,8 @@ template <
     typename SharedStoreIteratorD_,
     /// The shared store transformer for D.
     typename SharedStoreTransformerD_,
-    /// The iterator to load D from shared memory.
-    typename SharedLoadIteratorD_,
+    /// The stream to load D from shared memory.
+    typename SharedLoadStreamD_,
     /// The number of iterations in the epilogue.
     typename Iterations_,
     /// The iterations strides.
@@ -86,8 +86,8 @@ struct GemmEpilogueTraits {
   typedef SharedStoreIteratorD_ SharedStoreIteratorD;
   /// The shared store transformer for D.
   typedef SharedStoreTransformerD_ SharedStoreTransformerD;
-  /// The iterator to store D in shared memory.
-  typedef SharedLoadIteratorD_ SharedLoadIteratorD;
+  /// The stream to store D in shared memory.
+  typedef SharedLoadStreamD_ SharedLoadStreamD;
   /// typedef typename GemmConfig::EpilogueIterations Iterations;
   typedef Iterations_ Iterations;
   /// The iterations strides.
@@ -118,14 +118,15 @@ struct GemmEpilogueTraits {
     typename GlobalStoreIteratorD::Params iterator_d;
     /// The params for the D shared store iterator.
     typename SharedStoreIteratorD::Params shared_store_iterator_d;
-    /// The params for the D shared load iterator.
-    typename SharedLoadIteratorD::Params shared_load_iterator_d;
+    /// The params for the D shared load stream.
+    typename SharedLoadStreamD::Params shared_load_stream_d;
     /// The functor params.
     typename Functor::Params functor;
 
     /// Setup the params.
     template <typename GemmDesc_>
     CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const& desc) {
+
       // The parameters for the functor.
       int error_code = functor.initialize(desc);
       if (error_code) {
@@ -133,20 +134,27 @@ struct GemmEpilogueTraits {
       }
 
       // At the end of the H iteration, we jump over a number of columns.
-      this->stride_h = desc.ldd * Delta::kH;
+      this->stride_h = desc.D.leading_dim() * Delta::kH;
       // Nothing to do here.
       this->stride_w = 0;
-
       // Setup the params for the global memory iterator for C.
-      error_code = iterator_c.initialize(
-          reinterpret_cast<ScalarC const*>(desc.d_c), desc.ldc, desc.n, stride_w, Delta::kW);
+      error_code = iterator_c.initialize(desc.C.data(),
+                                         desc.batch_stride_C,
+                                         desc.C.leading_dim(),
+                                         desc.problem_size[1],
+                                         stride_w,
+                                         Delta::kW);
       if (error_code) {
         return error_code;
       }
 
       // Setup the params for the global memory iterator for D.
-      return iterator_d.initialize(
-          reinterpret_cast<ScalarD*>(desc.d_d), desc.ldd, desc.n, stride_w, Delta::kW);
+      return iterator_d.initialize(desc.D.data(),
+                                   desc.batch_stride_D,
+                                   desc.D.leading_dim(),
+                                   desc.problem_size[1],
+                                   stride_w,
+                                   Delta::kW);
     }
   };
 
@@ -155,13 +163,20 @@ struct GemmEpilogueTraits {
     // The storage for the store iterator.
     typename SharedStoreIteratorD::SharedStorage store;
     // The storage for the store iterator.
-    typename SharedLoadIteratorD::SharedStorage load;
+    typename SharedLoadStreamD::SharedStorage load;
   };
 
   /// The shared memory to swizzle the data in the epilogue.
   struct SharedStorage {
     // The storage for the shared stream D.
     StreamSharedStorage shared_stream;
+
+    //
+    //
+    //
+
+    CUTLASS_DEVICE
+    ScalarD* data() { return reinterpret_cast<ScalarD*>(&shared_stream.load); }
   };
 };
 
@@ -192,7 +207,10 @@ struct GemmEpilogueTraitsHelper {
   /// The traits class to build the iterator to store to shared memory for D.
   typedef GemmSharedStoreTileDTraits<
       // The pointer is float.
-      typename Functor::Scalar,
+      // typename Functor::Scalar,
+      // Functor::Scalar is alpha, beta type, in mixed precision, alpha and beta may not be the same with accumulation.
+      // In this case Functor::ScalarAccum is needed
+      typename Functor::ScalarAccum,
       // The output tile size.
       typename GemmConfig_::OutputTile,
       // The number of warps.
@@ -221,7 +239,10 @@ struct GemmEpilogueTraitsHelper {
   /// The traits class to build the iterator to load from shared memory for D.
   typedef GemmSharedLoadTileDTraits<
       // The pointer is float.
-      typename Functor::Scalar,
+      // typename Functor::Scalar,
+      // Functor::Scalar is alpha, beta type, in mixed precision, alpha and beta may not be the same with accumulation.
+      // In this case Functor::ScalarAccum is needed
+      typename Functor::ScalarAccum,
       // The output tile size.
       typename GemmConfig_::OutputTile,
       // The number of warps.
@@ -242,6 +263,8 @@ struct GemmEpilogueTraitsHelper {
                            IteratorAdvance::kH,
                            MemorySpace::kShared>
       SharedLoadIteratorD;
+  /// The stream to load D.
+  typedef SharedLoadStream<SharedLoadIteratorD> SharedLoadStreamD;
 
   /// The traits class to build the iterator to load data from global memory for C^N.
   typedef GemmGlobalTileCdTraits<
@@ -314,8 +337,8 @@ struct SimplifiedGemmEpilogueTraits : public GemmEpilogueTraits<
                                           typename Helper_::SharedStoreIteratorD,
                                           // The shared store transformer for D.
                                           typename Helper_::SharedStoreTransformerD,
-                                          // The iterator to load D from shared memory.
-                                          typename Helper_::SharedLoadIteratorD,
+                                          // The stream to load D from shared memory.
+                                          typename Helper_::SharedLoadStreamD,
                                           // The number of iterations.
                                           typename Helper_::Iterations,
                                           // The strides between iterations.
diff --git a/cutlass/gemm/gemm_global_stream.h b/cutlass/gemm/gemm_global_stream.h
index ec675a38f..6ea72cf30 100644
--- a/cutlass/gemm/gemm_global_stream.h
+++ b/cutlass/gemm/gemm_global_stream.h
@@ -29,9 +29,10 @@
 */
 #pragma once
 
-#include <cutlass/convert.h>
-#include <cutlass/gemm/gemm_global_tile.h>
-#include <cutlass/iterator_access.h>
+#include "cutlass/coord.h"
+#include "cutlass/convert.h"
+#include "cutlass/gemm/gemm_global_tile.h"
+#include "cutlass/tile_allocation.h"
 
 namespace cutlass {
 namespace gemm {
@@ -39,6 +40,8 @@ namespace gemm {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 template <
+    /// Identifies multiplicand
+    GemmOperand::Kind Operand,
     /// The load iterator.
     typename LoadIterator_,
     /// The store iterator to copy to shared memory.
@@ -46,7 +49,9 @@ template <
     /// The transformer to be applied after the data has been copied from global memory.
     typename Transformer_>
 
-struct GlobalLoadStreamBase {
+struct GlobalLoadStream {
+  /// Indicates the type of GEMM operand
+  static GemmOperand::Kind const kOperand = Operand;
   /// The load iterator.
   typedef LoadIterator_ LoadIterator;
   /// The transformer.
@@ -75,6 +80,15 @@ struct GlobalLoadStreamBase {
   typedef typename LoadIterator::Pointer Pointer;
   /// The index.
   typedef typename LoadIterator::Index Index;
+  /// The tile
+  typedef typename LoadIterator::Tile Tile;
+
+  /// Shared memory allocation for the tile
+  typedef TileAllocation<typename StoreIterator::Scalar, typename StoreIterator::Tile>
+      ThreadblockTileStorage;
+
+  /// Tensor reference to threadblock tile
+  typedef typename ThreadblockTileStorage::TensorRef ThreadblockTileRef;
 
   /// The params.
   struct Params {
@@ -82,56 +96,73 @@ struct GlobalLoadStreamBase {
     typename LoadIterator::Params load_iterator;
     // The store iterator.
     typename StoreIterator::Params store_iterator;
+    // Offset to residue.
+    Index offset_to_residue;
 
     /// Setup the params.
-    template <typename GemmDesc_>
-    CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const& desc, Pointer pointer, Index ld) {
-      int error_code = load_iterator.initialize(desc, pointer, ld);
+    CUTLASS_HOST_DEVICE int initialize(Pointer pointer,
+                                       long long batch_stride,
+                                       Index ldm,
+                                       Index _offset_to_residue) {
+
+      offset_to_residue = _offset_to_residue;
+      int error_code = load_iterator.initialize(pointer, batch_stride, ldm);
       if (error_code) {
         return error_code;
       }
-
       return store_iterator.initialize();
     }
   };
 
-  /// The amount of storage in shared memory needed to store the tile.
-  typedef typename StoreIterator::SharedStorage SharedStoreStorage;
+  /// Contains private storage in shared memory needed by the objects within this class. Note,
+  /// this is *NOT* the shared memory allocation for the GEMM threadblock tile. That necessarily
+  /// exists outside this class, as it is also needed by the warp-level shared=>RF stream.
+  struct SharedStorage {};
 
-  /// The storage in shared memory needed by that stream.
-  union SharedStorage {
-    // The load iterator.
-    typename LoadIterator::SharedStorage load_iterator;
-    // The store iterator.
-    SharedStoreStorage store_iterator;
-  };
+  //
+  // Static member functions
+  //
+
+  /// Maps a coordinate in the GEMM's (K, N, M) coordinate system to global memory
+  CUTLASS_DEVICE static Coord<3> project_coordinate(Coord<3> const& coord, Index d_offset = 0) {
+    bool const kKstrided =
+        GemmMultiplicandTraits<typename LoadIterator::Tile, kOperand, kLayout>::kKstrided;
+    Coord<3> tile_coord = ProjectOperand<kOperand, kKstrided>::project(coord);
+    return make_Coord(
+        tile_coord[0] + d_offset, tile_coord[1], tile_coord[2] / LoadIterator::Tile::kC);
+  }
 
   /// Ctor.
-  CUTLASS_DEVICE GlobalLoadStreamBase(Params const& params,
-                                      SharedStorage& shared_storage,
-                                      Coord<3> const bounds,
-                                      Coord<3> const& block)
-      : load_iterator(params.load_iterator, bounds, block),
+  CUTLASS_DEVICE GlobalLoadStream(
+      Params const& _params,
+      SharedStorage& shared_storage,
+      ThreadblockTileRef const& threadblock_tile_ref,
+      Coord<3> const bounds,
+      Coord<3> const& _threadblock_offset)
+      : params(_params),
+        multiplicand_bounds(project_coordinate(bounds, 1)),
+        threadblock_offset(project_coordinate(_threadblock_offset)),
+        load_iterator(params.load_iterator,
+          project_coordinate(bounds, 1), /*multiplicant_bounds*/
+          project_coordinate(_threadblock_offset) /*threablock_offset*/),
         transformer(),
-        store_iterator(params.store_iterator, shared_storage.store_iterator)
-
+        store_iterator(params.store_iterator, threadblock_tile_ref.data())
   {
+    load_iterator.initialize_predicates(multiplicand_bounds, threadblock_offset);
     fetched_fragment.clear();
   }
 
+
   /// Load the data from shared memory to the fetch fragment.
-  CUTLASS_DEVICE void copy() { iterator_load(load_iterator, fetched_fragment); }
+  CUTLASS_DEVICE void copy() { load_iterator.load_post_increment(fetched_fragment); }
 
   /// Commit the data.
   CUTLASS_DEVICE void commit() {
     transformer.transform(fetched_fragment, transformed_fragment);
-    iterator_store(store_iterator, transformed_fragment);
+    store_iterator.store_post_increment(transformed_fragment);
     store_iterator.inc_stage();
   }
 
-  /// Move to the beginning of the residue code. That's a new code path in CUTLASS 1.0.1.
-  CUTLASS_DEVICE void move_to_residue(Index k) { load_iterator.move_to_residue(k); }
-
   /// Execute the residue code.
   CUTLASS_DEVICE void residue(Index k, bool skip_clear = false) {
     load_iterator.residue(k);
@@ -140,9 +171,43 @@ struct GlobalLoadStreamBase {
     }
   }
 
-  /// Rollback to the beginning of the GEMM-k dimension.
-  CUTLASS_DEVICE void rollback() { load_iterator.rollback(); }
+  /// Move to the residue portion.
+  CUTLASS_DEVICE void move_to_residue(Index k, Index kTileK) {
+    Index kResidue = k % kTileK;
+    if (kResidue) {
+      residue(kResidue);
+    }
+    load_iterator.add_pointer_offset(params.offset_to_residue * load_iterator.stride_advance());
+  }
 
+  /// Rollback to the beginning of the first tile
+  CUTLASS_DEVICE void rollback(void) {
+    load_iterator.initialize_predicates(multiplicand_bounds, threadblock_offset);
+
+    int const kBlock = kOperand == GemmOperand::kA
+                           ? (kLayout == MatrixLayout::kColumnMajor ? Tile::kH : Tile::kW)
+                           : (kLayout == MatrixLayout::kRowMajor ? Tile::kH : Tile::kW);
+
+    load_iterator.add_pointer_offset(-(params.offset_to_residue + kBlock) *
+                                     load_iterator.stride_advance());
+  }
+
+  /// Adds a Coord<3> to the underlying global load iterator
+  CUTLASS_DEVICE GlobalLoadStream &operator+=(Coord<3> const &offset) {
+    load_iterator += offset;
+    return *this;
+  }
+
+  //
+  // Data members
+  //
+
+  /// Parameters
+  Params params;
+  /// Multiplicand bounds
+  Coord<3> multiplicand_bounds;
+  /// Threadblock offset
+  Coord<3> threadblock_offset;
   /// The iterator.
   LoadIterator load_iterator;
   /// The fragment to fetch from shared memory.
@@ -155,28 +220,6 @@ struct GlobalLoadStreamBase {
   StoreIterator store_iterator;
 };
 
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-template <
-    /// The load iterator.
-    typename LoadIterator_,
-    /// The store iterator to copy to shared memory.
-    typename StoreIterator_,
-    /// The transformer to be applied after the data has been copied from global memory.
-    typename Transformer_ = Copy<typename LoadIterator_::Fragment> >
-
-struct GlobalLoadStream : public GlobalLoadStreamBase<LoadIterator_, StoreIterator_, Transformer_> {
-  /// The base class.
-  typedef GlobalLoadStreamBase<LoadIterator_, StoreIterator_, Transformer_> Base;
-
-  /// Ctor.
-  CUTLASS_DEVICE GlobalLoadStream(typename Base::Params const& params,
-                                  typename Base::SharedStorage& shared_storage,
-                                  Coord<3> const& bounds,
-                                  Coord<3> const& block)
-      : Base(params, shared_storage, bounds, block) {}
-};
-
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 }  // namespace gemm
 }  // namespace cutlass
diff --git a/cutlass/gemm/gemm_global_tile.h b/cutlass/gemm/gemm_global_tile.h
index 1cc3b3377..a355ebea0 100644
--- a/cutlass/gemm/gemm_global_tile.h
+++ b/cutlass/gemm/gemm_global_tile.h
@@ -27,14 +27,14 @@
 */
 #pragma once
 
-#include <cutlass/coord.h>
-#include <cutlass/util/platform.h>
+#include "cutlass/coord.h"
+#include "cutlass/util/platform.h"
 
-#include <cutlass/gemm/gemm_operand.h>
-#include <cutlass/matrix_traits.h>
-#include <cutlass/predicate_vector.h>
-#include <cutlass/reshape_tile.h>
-#include <cutlass/tile_iterator.h>
+#include "cutlass/gemm/gemm_operand.h"
+#include "cutlass/matrix_traits.h"
+#include "cutlass/predicate_vector.h"
+#include "cutlass/reshape_tile.h"
+#include "cutlass/tile_iterator.h"
 
 namespace cutlass {
 namespace gemm {
@@ -80,20 +80,24 @@ struct GemmGlobalTileTraits {
   static int const kAccessSize = kAccessSize_;
   /// The memory space.
   static MemorySpace::Kind const kMemorySpace = MemorySpace::kGlobal;
-
   /// The tile shape
-  typedef typename ReshapeTile<Tile_, kAccessSize_>::Tile Tile;
+  typedef Tile_ Tile;
+  /// The vectorized tile shape
+  typedef typename ReshapeTile<Tile_, kAccessSize_>::Tile VectorizedTile;
   /// The threads shape
-  typedef typename ReshapeThreads<Tile, Threads_>::Threads Threads;
+  typedef typename ReshapeThreads<VectorizedTile, Threads_>::Threads Threads;
   /// The relative offset between two elements in the H/W dimension in adjacent threads.
-  typedef Shape<1, 1, Tile::kC> ThreadsDelta;
-
+  typedef Shape<1, 1, VectorizedTile::kC> ThreadsDelta;
   /// The strides in each dimension between different loads/stores.
   typedef Shape<0, Threads::kH, Threads::kW * kAccessSize> Delta;
+
   /// Strides for immediate offset computation
   typedef Shape<0, 0, Threads::kW * ThreadsDelta::kW, kAccessSize> ImmediateOffsetStrides;
   /// The number of iterations needed to load/store the tile.
-  typedef Shape<1, Tile::kH / Threads::kH, Tile::kW / Threads::kW, Tile::kC / kAccessSize>
+  typedef Shape<1,
+                VectorizedTile::kH / Threads::kH,
+                VectorizedTile::kW / Threads::kW,
+                VectorizedTile::kC / kAccessSize>
       Iterations;
 
   typedef GemmMultiplicandTraits<Tile, kOperand, kLayout> MultiplicandTraits;
@@ -165,7 +169,6 @@ struct GemmGlobalIteratorAb
                               Index_> {
   /// This class.
   typedef GemmGlobalIteratorAb<TileTraits_, Index_> This_;  /// The base class.
-
   typedef TileLoadIterator<TileTraits_,
                            typename TileTraits_::Scalar,
                            TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH
@@ -175,6 +178,8 @@ struct GemmGlobalIteratorAb
       Base;
   /// The layout.
   static MatrixLayout::Kind const kLayout = TileTraits_::kLayout;
+  /// The tile
+  typedef typename TileTraits_::Tile Tile;
   /// Fragment type loaded by the iterator
   typedef typename Base::Fragment Fragment;
   /// The scalar.
@@ -195,8 +200,9 @@ struct GemmGlobalIteratorAb
 
   struct Params : public BaseParams {
     /// Initializes params to load a strip-mined tile, given pointer and stride_h.
-    template <typename GemmDesc_>
-    CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const& desc, Scalar const* ptr, Index stride_h) {
+    CUTLASS_HOST_DEVICE int initialize(Scalar const* ptr,
+                                       long long stride_d,
+                                       Index stride_h) {
       Index inc_d = 0;
       Index inc_advance = 0;
       // Move by some columns for each iteration in the H dimension.
@@ -221,99 +227,36 @@ struct GemmGlobalIteratorAb
                       (Base::Iterations::kH - 1) * inc_h;
       }
 
-      // The dimensions of the tile.
-      int const kH = TileTraits_::Tile::kH;
-      int const kW = TileTraits_::Tile::kW * TileTraits_::kAccessSize;
-
-      // Move to the residue.
-      Index const kBlock = kAdvance == IteratorAdvance::kH ? kH : kW;
-      // The jump in the gemm-k dimension.
-      Index const stride = kAdvance == IteratorAdvance::kH ? stride_h : 1;
-
-      // Compute the offset to the residue and how to "come" back.
-      Index const kResidue = desc.k % kBlock;
-      if (kResidue > 0) {
-        move_to_residue_offset = (desc.k - kResidue) * stride;
-      } else {
-        move_to_residue_offset = (desc.k - kBlock) * stride;
-      }
-
-      Base::Params::initialize(ptr, 0, stride_h, 1, inc_d, inc_h, 0, inc_advance);
+      Base::Params::initialize(
+          ptr, stride_d, stride_h, 1, inc_d, inc_h, 0, inc_advance);
       return 0;
     }
-
-    // The extra offset to control moving to the residue.
-    Index move_to_residue_offset;
   };
 
-  /// Ctor.
-  CUTLASS_DEVICE GemmGlobalIteratorAb(Params const& _params,
-                                      const Coord<3>& bounds,
-                                      const Coord<3>& block,
-                                      ThreadOffset thread_offset_func = ThreadOffset())
-      : params(_params) {
-    thread_offset = thread_offset_func();
-    // The column.
-    Index block_h = thread_offset[1];
-    // The contiguous dimension.
-    Index block_w = thread_offset[2];
+  /// Offset of an individual lane from the start of the tile
+  Coord<4> thread_offset;
+  /// The parameters
+  Params params;
+  /// The predicates.
+  PredicateVector predicates;
 
-    // Add the blocks indices.
-    if (kAdvance == IteratorAdvance::kH) {
-      block_h += block[1];
-      block_w += block[2];
-
-    } else {
-      block_h += block[2];
-      block_w += block[1];
-    }
-
-    // Setup the pointer.
-    params.pointer += (block_h * params.stride_h + block_w);
-
-    // Initialize predicates
-    initialize_predicates(bounds, make_Coord(0, block_h, block_w));
-  }
-
-  /// The accessor.
-  CUTLASS_DEVICE void get(typename Base::AccessType& value, int d, int h, int w, int c) const {
-    int const imm =
-        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(0, 0, w, c);
-    Load<Scalar, TileTraits_::kAccessSize, MemorySpace::kGlobal>::load(value, params.pointer, imm);
-  }
-
-  /// Increment the pointer in the H dimension.
-  CUTLASS_DEVICE void inc_h() { params.pointer += params.inc_h; }
-  /// Increment the pointer in the D dimension.
-  CUTLASS_DEVICE void inc_d() { params.pointer += params.inc_d; }
-  /// Increment the pointer to move to the next iteration.
-  CUTLASS_DEVICE void inc_advance() { params.pointer += params.inc_advance; }
-
-  /// Initialize the predicates.
-  CUTLASS_DEVICE void initialize_predicates(const Coord<3>& bounds, const Coord<3>& block) {
+  CUTLASS_HOST_DEVICE void initialize_predicates(const Coord<3>& bounds, const Coord<3>& block_offset) {
     // Setup the masks to control loads.
     predicates.fill(0);
 
-    int bounds_h, bounds_w;
-    if (kAdvance == IteratorAdvance::kH) {
-      bounds_w = bounds[2] - block[2];
-      bounds_h = bounds[1];
-
-    } else {
-      bounds_w = bounds[1];
-      bounds_h = bounds[2] - block[1];
-    }
-
     // Fill in the bits of the predicate vector.
     for (int d = 0; d < Base::Iterations::kD; ++d) {
       for (int h = 0; h < Base::Iterations::kH; ++h) {
         for (int w = 0; w < Base::Iterations::kW; ++w) {
           for (int c = 0; c < Base::Iterations::kC; ++c) {
-            bool flag = w * Base::Delta::kW < bounds_w;
+            bool flag = w * Base::Delta::kW + thread_offset[2] + block_offset[2] < bounds[2];
             if (kAdvance == IteratorAdvance::kH) {
-              flag = flag && (h * Base::Delta::kH + d * Base::Delta::kD) < bounds_h;
+              flag =
+                  flag &&
+                  (h * Base::Delta::kH + d * Base::Delta::kD) + thread_offset[1] + block_offset[1] <
+                      bounds[1];
             } else {
-              flag = flag && (h * Base::Delta::kH) < bounds_h;
+              flag = flag && (h * Base::Delta::kH) + thread_offset[1] + block_offset[1] < bounds[1];
             }
             int const bit = ComputeOffsetFromShape<typename Base::Iterations>::get(d, h, w, c);
             predicates.set(bit, flag);
@@ -323,31 +266,44 @@ struct GemmGlobalIteratorAb
     }
   }
 
-  /// Move to residue portion.
-  CUTLASS_DEVICE void move_to_residue(Index k) {
-    // Store the pointer and the predicates.
-    stored_pointer = params.pointer;
-    stored_predicates = predicates;
+  /// Ctor.
+  CUTLASS_HOST_DEVICE GemmGlobalIteratorAb(Params const& _params,
+                                           const Coord<3>& bounds,
+                                           const Coord<3>& threadblock_offset,
+                                           ThreadOffset thread_offset_func = ThreadOffset())
+      : params(_params) {
+    thread_offset = thread_offset_func();
+    // Setup the pointer.
+    params.pointer += ((threadblock_offset[1] + thread_offset[1]) * params.stride_h +
+                       (threadblock_offset[2] + thread_offset[2]));
 
-    // Move the pointer to the residue.
-    params.pointer += params.move_to_residue_offset;
+  }
 
-    // The dimensions of the tile.
-    int const kH = TileTraits_::Tile::kH;
-    int const kW = TileTraits_::Tile::kW * TileTraits_::kAccessSize;
+  /// Increment the pointer in the W dimension.
+  CUTLASS_HOST_DEVICE void inc_w() { Base::inc_w(); }
+  /// Increment the pointer in the H dimension.
+  CUTLASS_HOST_DEVICE void inc_h() { params.pointer += params.inc_h; }
+  /// Increment the pointer in the D dimension.
+  CUTLASS_HOST_DEVICE void inc_d() { params.pointer += params.inc_d; }
+  /// Increment the pointer to move to the next iteration.
+  CUTLASS_HOST_DEVICE void inc_advance() { params.pointer += params.inc_advance; }
 
-    // The unrolling factor.
-    int const kUnroll = kAdvance == IteratorAdvance::kH ? kH : kW;
-
-    // Clear the predicates for the residue. TODO: We can do something smarter.
-    int const kResidue = (int)(k % (Index)kUnroll);
-    if (kResidue > 0) {
-      residue(kResidue);
-    }
+  /// Loads a single fragment element from memory
+  CUTLASS_HOST_DEVICE void load_element(
+      typename Base::AccessType& value, int d, int h, int w, int c) const {
+    int const offset =
+        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(0, 0, w, c);
+    Load<Scalar,
+         Base::kAccessSize,
+         Base::kMemorySpace,
+         Base::kFragmentElementType,
+         typename Base::FragmentElement,
+         Base::Tile::kW,
+         Base::kAccessSize * sizeof(Scalar)>::load(value, params.pointer, offset);
   }
 
   /// That's the residue! Update the predicates.
-  CUTLASS_DEVICE void residue(Index k) {
+  CUTLASS_HOST_DEVICE void residue(Index k) {
     // The coordinates of the thread.
     Index block_h = thread_offset[1];
     // The contiguous dimension.
@@ -375,26 +331,63 @@ struct GemmGlobalIteratorAb
     }
   }
 
-  /// Rollback to beginning of first tile and initialize predicates.
-  CUTLASS_DEVICE void rollback() {
-    params.pointer = stored_pointer;
-    predicates = stored_predicates;
-  }
-
-  /// Is the iterator valid?
-  CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const {
+  /// Is the valid?
+  CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const {
     int const bit = ComputeOffsetFromShape<typename Base::Iterations>::get(d, h, w, c);
     return predicates[bit];
   }
 
-  /// Offset of an individual lane from the start of the tile
-  Coord<4> thread_offset;
-  /// The parameters
-  Params params;
-  /// The pointer.
-  typename Base::Scalar const* stored_pointer;
-  /// The predicates.
-  PredicateVector predicates, stored_predicates;
+  /// Adds a vector offset to the iterator
+  CUTLASS_HOST_DEVICE GemmGlobalIteratorAb & operator+=(Coord<3> const &offset) {
+
+    long long _offset = offset.template dot<long long>(
+      make_Coord(params.stride_d, params.stride_h, params.stride_w)
+    );
+
+    params.pointer += _offset;
+    return *this;
+  }
+
+  CUTLASS_HOST_DEVICE void add_pointer_offset(Index offset) { params.pointer += offset; }
+
+  CUTLASS_HOST_DEVICE Index stride_advance(void) {
+    Index stride = params.stride_h;
+    if (kAdvance == IteratorAdvance::kW) {
+      stride = params.stride_w;
+    }
+    return stride;
+  }
+
+  template <typename Fragment>
+  CUTLASS_HOST_DEVICE void load_post_increment(Fragment& fragment) {
+    typename Base::FragmentIterator frag_iterator(fragment);
+    for (int d = 0; d < Base::Iterations::kD; ++d) {
+      for (int h = 0; h < Base::Iterations::kH; ++h) {
+        for (int w = 0; w < Base::Iterations::kW; ++w) {
+          for (int c = 0; c < Base::Iterations::kC; ++c) {
+            if (valid(d, h, w, c)) {
+              load_element(
+                  reinterpret_cast<typename Base::AccessType&>(frag_iterator.at(d, h, w, c)),
+                  d,
+                  h,
+                  w,
+                  c);
+            }
+          }
+          if (w < Base::Iterations::kW - 1) {
+            inc_w();
+          }
+        }
+        if (h < Base::Iterations::kH - 1) {
+          inc_h();
+        }
+      }
+      if (d < Base::Iterations::kD - 1) {
+        inc_d();
+      }
+    }
+    inc_advance();
+  }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
@@ -433,6 +426,8 @@ struct GemmGlobalIteratorCd : public TileIteratorBase<TileTraits_,
   struct Params {
     /// The pointer.
     Pointer pointer;
+    /// The stride in the D dimension
+    long long stride_d;
     /// The stride in the H dimension to setup the thread in the block.
     Index stride_h;
     /// The strides to increment the pointer.
@@ -443,17 +438,23 @@ struct GemmGlobalIteratorCd : public TileIteratorBase<TileTraits_,
     Index predicate_offset;
 
     /// Setup the params.
-    CUTLASS_HOST_DEVICE int initialize(
-        Pointer pointer, Index ld, Index bound, Index epilogue_stride_w, Index epilogue_delta_w) {
+    CUTLASS_HOST_DEVICE int initialize(Pointer pointer,
+                                       long long batch_stride,
+                                       Index ldm,
+                                       Index bound,
+                                       Index epilogue_stride_w,
+                                       Index epilogue_delta_w) {
       // The pointer.
       this->pointer = pointer;
+      // Stride per batch
+      stride_d = batch_stride;
       // Each column of the matrix.
-      stride_h = TileTraits_::ThreadsDelta::kH * ld;
+      stride_h = TileTraits_::ThreadsDelta::kH * ldm;
       // Each thread output 1 column per iteration. The stride between columns is given by the
       // number of scalars that are loaded per LDS for B.
-      inc_h = ld * TileTraits_::kStrideH;
+      inc_h = ldm * TileTraits_::kStrideH;
       inc_advance =
-          (ld - ld * TileTraits_::kStrideH * (Base::Iterations::kH - 1)) + epilogue_stride_w;
+          (ldm - ldm * TileTraits_::kStrideH * (Base::Iterations::kH - 1)) + epilogue_stride_w;
 
       predicate_offset = bound;
       predicate_inc_h = TileTraits_::kStrideH;
@@ -464,75 +465,173 @@ struct GemmGlobalIteratorCd : public TileIteratorBase<TileTraits_,
     }
   };
 
+  /// Parameters.
   Params params;
   /// Offset of an individual lane from the start of the tile
   Coord<4> thread_offset;
+  /// The predicates for the row.
+  cutlass::PredicateVector<Base::Iterations::kW> predicates;
 
   /// Ctor.
-  CUTLASS_DEVICE GemmGlobalIteratorCd() {}
+  CUTLASS_HOST_DEVICE GemmGlobalIteratorCd(Params const& _params,
+                                           const Coord<3>& bounds,
+                                           const Coord<3>& block_offset,
+                                           ThreadOffset thread_offset_func = ThreadOffset())
+      : params(_params) {
+    thread_offset = thread_offset_func();
+    // Prepare the vector of predicates.
+    for (int i = 0; i < Base::Iterations::kW; ++i) {
+      predicates.set(i, thread_offset[2] + i * Base::Delta::kW < bounds[2]);
+    }
+  }
 
   /// Ctor.
-  CUTLASS_DEVICE GemmGlobalIteratorCd(Params const& params,
-                                      const Coord<3>& bounds,
-                                      const Coord<3>& block,
-                                      int offset = 0,
-                                      int pred_offset = 0,
-                                      ThreadOffset thread_offset_func = ThreadOffset())
-      : params(params) {
+  CUTLASS_HOST_DEVICE GemmGlobalIteratorCd(Params const& _params,
+                                           const Coord<3>& bounds,
+                                           const Coord<3>& block,
+                                           int offset = 0,
+                                           int pred_offset = 0,
+                                           ThreadOffset thread_offset_func = ThreadOffset())
+      : params(_params) {
     thread_offset = thread_offset_func();
     // Each warp works on a different column of the tile.
     int const h = thread_offset[1] + block[1];
     // Each lane writes a different element.
     int const w = thread_offset[2] + block[2];
     // Setup the pointer.
-    this->params.pointer += ((h * params.stride_h + w) + offset);
+    params.pointer += ((h * params.stride_h + w) + offset);
 
     // Prepare the vector of predicates.
     for (int i = 0; i < Base::Iterations::kW; ++i) {
       predicates.set(i, w + i * Base::Delta::kW < bounds[2]);
     }
-    this->params.predicate_offset -= (h + pred_offset);
-  }
-
-  /// The accessor.
-  CUTLASS_DEVICE void get(typename Base::AccessType& value, int d, int h, int w, int c) const {
-    int const imm =
-        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(0, 0, w, c);
-    Load<Scalar, TileTraits_::kAccessSize, MemorySpace::kGlobal>::load(value, params.pointer, imm);
+    params.predicate_offset -= (h + pred_offset);
   }
 
   /// Increment the pointer in the C dimension.
-  CUTLASS_DEVICE void inc_c() {}
+  CUTLASS_HOST_DEVICE void inc_c() {}
   /// Increment the pointer in the W dimension.
-  CUTLASS_DEVICE void inc_w() {}
+  CUTLASS_HOST_DEVICE void inc_w() {}
   /// Increment the pointer in the H dimension.
-  CUTLASS_DEVICE void inc_h() {
+  CUTLASS_HOST_DEVICE void inc_h() {
     params.pointer += params.inc_h;
     params.predicate_offset -= params.predicate_inc_h;
   }
   /// Increment the pointer in the D dimension.
-  CUTLASS_DEVICE void inc_d() {}
+  CUTLASS_HOST_DEVICE void inc_d() {}
   /// Increment the pointer to move to the next iteration.
-  CUTLASS_DEVICE void inc_advance() {
+  CUTLASS_HOST_DEVICE void inc_advance() {
     params.pointer += params.inc_advance;
-    this->params.predicate_offset -= params.predicate_inc_advance;
+    params.predicate_offset -= params.predicate_inc_advance;
   }
 
-  /// The accessor.
-  CUTLASS_DEVICE void set(typename Base::AccessType const& value, int d, int h, int w, int c) {
-    int const imm =
-        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(0, 0, w, c);
-    Store<Scalar, TileTraits_::kAccessSize, MemorySpace::kGlobal>::store(
-        value, params.pointer, imm);
+  /// Adds a vector offset to the iterator
+  CUTLASS_HOST_DEVICE GemmGlobalIteratorCd & operator+=(Coord<3> const &offset) {
+    long long _offset = offset.template dot<long long>(
+      make_Coord(params.stride_d, params.stride_h, 1)
+    );
+    params.pointer += _offset;
+    return *this;
   }
 
-  /// Test the validity of the iterator.
-  CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const {
+  /// Loads a single fragment element from memory.
+  CUTLASS_HOST_DEVICE void load_element(
+      typename Base::AccessType& value, int d, int h, int w, int c) const {
+    int const offset =
+        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(d, h, w, c);
+    Load<Scalar,
+         Base::kAccessSize,
+         Base::kMemorySpace,
+         Base::kFragmentElementType,
+         typename Base::FragmentElement,
+         Base::Tile::kW,
+         Base::kAccessSize * sizeof(Scalar)>::load(value, params.pointer, offset);
+  }
+
+  /// Stores a single fragment element into memory.
+  CUTLASS_HOST_DEVICE void store_element(
+      typename Base::AccessType const& value, int d, int h, int w, int c) {
+    int const offset =
+        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(d, h, w, c);
+    Store<Scalar,
+          Base::kAccessSize,
+          Base::kMemorySpace,
+          Base::kFragmentElementType,
+          typename Base::FragmentElement,
+          Base::Tile::kW,
+          Base::kAccessSize * sizeof(Scalar)>::store(value, params.pointer, offset);
+  }
+
+  /// Test the validity of the
+  CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const {
     return predicates.at(w) && params.predicate_offset > 0;
   }
 
-  /// The predicates for the row.
-  cutlass::PredicateVector<Base::Iterations::kW> predicates;
+  /// add pointer offset
+  CUTLASS_HOST_DEVICE void add_pointer_offset(Index offset) { params.pointer += offset; }
+
+  /// Loads and increments iterator
+  template <typename Fragment>
+  CUTLASS_HOST_DEVICE void load_post_increment(Fragment& fragment) {
+    typename Base::FragmentIterator frag_iterator(fragment);
+    for (int d = 0; d < Base::Iterations::kD; ++d) {
+      for (int h = 0; h < Base::Iterations::kH; ++h) {
+        for (int w = 0; w < Base::Iterations::kW; ++w) {
+          for (int c = 0; c < Base::Iterations::kC; ++c) {
+            if (valid(d, h, w, c)) {
+              load_element(
+                  reinterpret_cast<typename Base::AccessType&>(frag_iterator.at(d, h, w, c)),
+                  d,
+                  h,
+                  w,
+                  c);
+            }
+          }
+          if (w < Base::Iterations::kW - 1) {
+            inc_w();
+          }
+        }
+        if (h < Base::Iterations::kH - 1) {
+          inc_h();
+        }
+      }
+      if (d < Base::Iterations::kD - 1) {
+        inc_d();
+      }
+    }
+    inc_advance();
+  }
+
+  template <typename Fragment>
+  CUTLASS_HOST_DEVICE void store_post_increment(Fragment& fragment) {
+    typename Base::FragmentIterator frag_iterator(fragment);
+    for (int d = 0; d < Base::Iterations::kD; ++d) {
+      for (int h = 0; h < Base::Iterations::kH; ++h) {
+        for (int w = 0; w < Base::Iterations::kW; ++w) {
+          for (int c = 0; c < Base::Iterations::kC; ++c) {
+            if (valid(d, h, w, c)) {
+              store_element(
+                  reinterpret_cast<typename Base::AccessType&>(frag_iterator.at(d, h, w, c)),
+                  d,
+                  h,
+                  w,
+                  c);
+            }
+          }
+          if (w < Base::Iterations::kW - 1) {
+            inc_w();
+          }
+        }
+        if (h < Base::Iterations::kH - 1) {
+          inc_h();
+        }
+      }
+      if (d < Base::Iterations::kD - 1) {
+        inc_d();
+      }
+    }
+    inc_advance();
+  }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/cutlass/gemm/gemm_operand.h b/cutlass/gemm/gemm_operand.h
index 737f993f0..2b4dcdc91 100644
--- a/cutlass/gemm/gemm_operand.h
+++ b/cutlass/gemm/gemm_operand.h
@@ -28,9 +28,9 @@
 */
 #pragma once
 
-#include <cutlass/matrix_traits.h>
-#include <cutlass/reshape_tile.h>
-#include <cutlass/util/platform.h>
+#include "cutlass/matrix_traits.h"
+#include "cutlass/reshape_tile.h"
+#include "cutlass/util/platform.h"
 
 namespace cutlass {
 namespace gemm {
diff --git a/cutlass/gemm/gemm_shared_stream.h b/cutlass/gemm/gemm_shared_stream.h
index c6ff7bd97..df20bd6ca 100644
--- a/cutlass/gemm/gemm_shared_stream.h
+++ b/cutlass/gemm/gemm_shared_stream.h
@@ -28,7 +28,8 @@
 */
 #pragma once
 
-#include <cutlass/gemm/gemm_shared_tile.h>
+#include "cutlass/tensor_ref.h"
+#include "cutlass/gemm/gemm_shared_tile.h"
 
 namespace cutlass {
 namespace gemm {
@@ -56,6 +57,11 @@ struct SharedLoadStream {
                 "");
   /// The output fragment.
   typedef TransformedFragment Fragment;
+  /// Scalar data type
+  typedef typename Iterator::Scalar Scalar;
+
+  /// Reference type to a tensor
+  typedef TensorRef<Scalar, 4> TensorRef;
 
   /// The params.
   struct Params {
@@ -73,29 +79,38 @@ struct SharedLoadStream {
   CUTLASS_DEVICE SharedLoadStream() {}
 
   /// Ctor.
-  CUTLASS_DEVICE SharedLoadStream(Params const &params, SharedStorage &shared_storage) {
-    this->initialize(params, shared_storage);
+  CUTLASS_DEVICE SharedLoadStream(Params const &params, TensorRef const &ref) {
+    this->initialize(params, ref);
   }
 
   /// Initialize the stream.
-  CUTLASS_DEVICE void initialize(Params const &params, SharedStorage &shared_storage) {
+  CUTLASS_DEVICE void initialize(Params const &params, TensorRef const &ref) {
     // The iterator.
-    iterator = Iterator(params.iterator, shared_storage);
+    iterator = Iterator(params.iterator, ref.data());
     // The transformer.
     transformer = Transformer();
   }
 
   /// Load the data from shared memory to the fetch fragment.
-  CUTLASS_DEVICE void copy(FetchedFragment &fetched) { shared_iterator_load(iterator, fetched); }
+  CUTLASS_DEVICE void copy() { iterator.load_post_increment(fetched[0]); }
 
   /// Load the data from shared memory to the fetch fragment.
-  CUTLASS_DEVICE void copy(int d, FetchedFragment &fetched) {
-    shared_iterator_load(iterator, fetched, d);
-  }
+  CUTLASS_DEVICE void copy(int step) { iterator.load(fetched[step % 2], step); }
 
   /// Commit the data.
-  CUTLASS_DEVICE void commit(FetchedFragment &fetched, TransformedFragment &transformed) {
-    transformer.transform(fetched, transformed);
+  CUTLASS_DEVICE void commit() { transformer.transform(fetched[0], transformed[0]); }
+
+  /// Commit the data.
+  CUTLASS_DEVICE void commit(int step) {
+    transformer.transform(fetched[step % 2], transformed[step % 2]);
+  }
+
+  /// Returns the fragment for the given step
+  CUTLASS_DEVICE TransformedFragment &fragment(int step = 0) { return transformed[step % 2]; }
+
+  /// Returns the fragment for the given step
+  CUTLASS_DEVICE TransformedFragment const &fragment(int step = 0) const {
+    return transformed[step % 2];
   }
 
   /// Increment the stage.
@@ -103,8 +118,12 @@ struct SharedLoadStream {
 
   /// The iterator.
   Iterator iterator;
+  /// Fetched fragment
+  FetchedFragment fetched[2];
   /// The transformer.
   Transformer transformer;
+  /// Transformed fragment
+  TransformedFragment transformed[2];
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/cutlass/gemm/gemm_shared_tile.h b/cutlass/gemm/gemm_shared_tile.h
index 7c61e0229..78fb1f205 100644
--- a/cutlass/gemm/gemm_shared_tile.h
+++ b/cutlass/gemm/gemm_shared_tile.h
@@ -27,7 +27,7 @@
 */
 #pragma once
 
-#include <cutlass/gemm/gemm_operand.h>
+#include "cutlass/gemm/gemm_operand.h"
 
 namespace cutlass {
 namespace gemm {
diff --git a/cutlass/gemm/gemm_stream_pair.h b/cutlass/gemm/gemm_stream_pair.h
new file mode 100644
index 000000000..0a6df15ed
--- /dev/null
+++ b/cutlass/gemm/gemm_stream_pair.h
@@ -0,0 +1,251 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Defines a pair of GEMM tile streams
+*/
+#pragma once
+
+#include "cutlass/convert.h"
+#include "cutlass/matrix_traits.h"
+#include "cutlass/reshape_tile.h"
+#include "cutlass/tile_allocation.h"
+#include "cutlass/tile_iterator.h"
+
+#include "cutlass/gemm/clear_accumulators.h"
+#include "cutlass/gemm/gemm_config.h"
+#include "cutlass/gemm/gemm_global_stream.h"
+#include "cutlass/gemm/gemm_operand.h"
+#include "cutlass/gemm/gemm_shared_stream.h"
+#include "cutlass/gemm/threadblock_swizzle.h"
+
+namespace cutlass {
+namespace gemm {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Collect the global load streams for multiplicands.
+template <typename StreamA_, typename StreamB_, bool kResidueInProlog_>
+struct GlobalLoadStreamPair {
+  //
+  // Type definitions
+  //
+
+  /// Stream for A multiplicand
+  typedef StreamA_ StreamA;
+
+  /// Stream for B multiplicand
+  typedef StreamB_ StreamB;
+
+  /// Parameters object
+  struct Params {
+    /// Parameters object for StreamA
+    typename StreamA::Params stream_a;
+
+    /// Parameters object for StreamB
+    typename StreamB::Params stream_b;
+
+    /// Default constructor
+    CUTLASS_HOST_DEVICE
+    Params() {}
+
+    /// Constructs a global load stream pair Params object
+    CUTLASS_HOST_DEVICE
+    Params(typename StreamA::Params const &_params_A, typename StreamB::Params const &_params_B)
+        : stream_a(_params_A), stream_b(_params_B) {}
+  };
+
+  /// Assumes the A stream defines the index type
+  typedef typename StreamA::Index Index;
+
+  /// Shared memory allocation for threadblock-scoped GEMM tile
+  typedef ZipTileAllocation<typename StreamA::ThreadblockTileStorage,
+                              typename StreamB::ThreadblockTileStorage>
+      ThreadblockTileStorage;
+
+  /// ZipTensorRef to threadblock tiles
+  typedef typename ThreadblockTileStorage::TensorRef ThreadblockTileRef;
+
+  /// Defines a structure containing shared storage for each pair
+  struct SharedStorage {
+    typename StreamA::SharedStorage stream_a;
+    typename StreamB::SharedStorage stream_b;
+  };
+
+  //
+  // Data members
+  //
+
+  /// Stream for A multiplicand
+  StreamA stream_a;
+
+  /// Stream for B multiplicand
+  StreamB stream_b;
+
+  //
+  // Methods
+  //
+
+  /// Ctor.
+  CUTLASS_DEVICE GlobalLoadStreamPair(Params const &params,
+                                      SharedStorage &shared_storage,
+                                      ThreadblockTileRef const &threadblock_tile_ref,
+                                      Coord<3> const &bounds,
+                                      Coord<3> const &block_offset = make_Coord(0, 0, 0))
+      : stream_a(params.stream_a,
+                 shared_storage.stream_a,
+                 threadblock_tile_ref.first,
+                 bounds,
+                 block_offset),
+        stream_b(params.stream_b,
+                 shared_storage.stream_b,
+                 threadblock_tile_ref.second,
+                 bounds,
+                 block_offset) {}
+
+  CUTLASS_DEVICE
+  GlobalLoadStreamPair & operator+=(Coord<3> const offset) {
+    stream_a += offset;
+    stream_b += offset;
+    return *this;
+  }
+
+  /// Trigger the copies from shared memory to registers.
+  CUTLASS_DEVICE void copy() {
+    stream_a.copy();
+    stream_b.copy();
+  }
+
+  /// Commit the data.
+  CUTLASS_DEVICE void commit() {
+    stream_a.commit();
+    stream_b.commit();
+  }
+
+  /// Execute the residue code.
+  CUTLASS_DEVICE void residue(Index k, bool skip_clear = false) {
+    stream_a.residue(k, skip_clear);
+    stream_b.residue(k, skip_clear);
+  }
+
+  /// Move to residue.
+  CUTLASS_DEVICE void move_to_residue(Index k, Index kTileK) {
+    if (kResidueInProlog_) {
+      stream_a.move_to_residue(k, kTileK);
+      stream_b.move_to_residue(k, kTileK);
+    } else if (k < kTileK) {
+      residue(k, true);
+    }
+  }
+
+  /// Rollback to beginning of first tile.
+  CUTLASS_DEVICE void rollback(bool kRollback) {
+    if (kResidueInProlog_ && kRollback) {
+      stream_a.rollback();
+      stream_b.rollback();
+    }
+  }
+};
+
+/// Collect the global load streams for multiplicands.
+template <typename StreamA_, typename StreamB_>
+struct SharedStreamPair {
+  //
+  // Type definitions
+  //
+
+  /// Stream for A multiplicand
+  typedef StreamA_ StreamA;
+
+  /// Stream for B multiplicand
+  typedef StreamB_ StreamB;
+
+  /// Parameters object passed to load iterators
+  struct Params {
+    ///
+    typename StreamA::Params stream_a;
+
+    ///
+    typename StreamB::Params stream_b;
+  };
+
+  /// Shared memory allocation for threadblock-scoped GEMM tile
+  typedef ZipTensorRef<typename StreamA::TensorRef,
+                       typename StreamB::TensorRef >
+      ThreadblockTileRef;
+
+  //
+  // Data members
+  //
+
+  /// The stream for A.
+  StreamA stream_a;
+
+  /// The stream for B.
+  StreamB stream_b;
+
+  //
+  // Methods
+  //
+
+  /// Construct with the composable structure
+  CUTLASS_DEVICE SharedStreamPair(Params const &params, ThreadblockTileRef const &threadblock_tile_ref)
+      : stream_a(params.stream_a, threadblock_tile_ref.first),
+        stream_b(params.stream_b, threadblock_tile_ref.second) {}
+
+  /// Trigger the copies from shared memory to registers.
+  CUTLASS_DEVICE void copy(int step) {
+    stream_a.copy(step);
+    stream_b.copy(step);
+  }
+
+  /// Commit the data.
+  CUTLASS_DEVICE void commit(int step) {
+    stream_a.commit(step);
+    stream_b.commit(step);
+  }
+
+  /// The fragment A.
+  CUTLASS_DEVICE
+  typename StreamA::TransformedFragment const &fragment_a(int step) const {
+    return stream_a.fragment(step);
+  }
+
+  /// The fragment B.
+  CUTLASS_DEVICE
+  typename StreamB::TransformedFragment const &fragment_b(int step) const {
+    return stream_b.fragment(step);
+  }
+
+  /// Increment the stage.
+  CUTLASS_DEVICE void inc_stage() {
+    stream_a.inc_stage();
+    stream_b.inc_stage();
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace gemm
+}  // namespace cutlass
diff --git a/cutlass/gemm/gemm_traits.h b/cutlass/gemm/gemm_traits.h
index cb57c4d5c..fd6efb466 100644
--- a/cutlass/gemm/gemm_traits.h
+++ b/cutlass/gemm/gemm_traits.h
@@ -27,117 +27,27 @@
 */
 #pragma once
 
-#include <cutlass/convert.h>
-#include <cutlass/gemm/clear_accumulators.h>
-#include <cutlass/gemm/gemm_global_stream.h>
-#include <cutlass/gemm/gemm_operand.h>
-#include <cutlass/gemm/gemm_shared_stream.h>
-#include <cutlass/gemm/identity_block_swizzle.h>
-#include <cutlass/matrix_traits.h>
-#include <cutlass/reshape_tile.h>
-#include <cutlass/tile_iterator.h>
+#include "cutlass/convert.h"
+#include "cutlass/matrix_traits.h"
+#include "cutlass/reshape_tile.h"
+#include "cutlass/tile_allocation.h"
+#include "cutlass/tile_iterator.h"
+#include "cutlass/kernel_launch.h"
 
+#include "cutlass/gemm/clear_accumulators.h"
+#include "cutlass/gemm/gemm_config.h"
+#include "cutlass/gemm/gemm_desc.h"
+#include "cutlass/gemm/gemm_stream_pair.h"
+#include "cutlass/gemm/gemm_global_stream.h"
+#include "cutlass/gemm/gemm_operand.h"
+#include "cutlass/gemm/gemm_shared_stream.h"
+#include "cutlass/gemm/threadblock_swizzle.h"
+#include "cutlass/gemm/gemm.h"
 namespace cutlass {
 namespace gemm {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <
-    /// The scalar type for A.
-    typename ScalarA_,
-    /// The scalar type for B.
-    typename ScalarB_,
-    /// The scalar type for C.
-    typename ScalarC_,
-    /// The scalar type for D.
-    typename ScalarD_,
-    /// The output tile size for the GEMM KxNxM.
-    typename OutputTile_,
-    /// The functor to do the math.
-    typename MultiplyAdd_,
-    /// The number of scalars per LDG for A.
-    int kScalarsPerLdgA_,
-    /// The number of scalars per STS for A.
-    int kScalarsPerStsA_,
-    /// The number of scalars per LDG for A.
-    int kScalarsPerLdsA_,
-    /// The number of scalars per LDG for B.
-    int kScalarsPerLdgB_,
-    /// The number of scalars per STS for B.
-    int kScalarsPerStsB_,
-    /// The number of scalars per LDS for B.
-    int kScalarsPerLdsB_,
-    /// The number of scalars per LDG for C and STG for D.
-    int kScalarsPerLdgCAndStgD_,
-    /// The number of scalars per STS for D.
-    int kScalarsPerStsD_,
-    /// The number of scalars per LDS for D.
-    int kScalarsPerLdsD_,
-    /// The number of stages in shared memory to do single/double/triple-buffering.
-    int kStages_,
-    /// Do we do the residue in the prologue?
-    bool kResidueInPrologue_ = false>
-
-struct GemmConfig {
-  //
-  /// The scalar for A.
-  typedef ScalarA_ ScalarA;
-  /// The scalar for B.
-  typedef ScalarB_ ScalarB;
-  /// The scalar for C.
-  typedef ScalarC_ ScalarC;
-  /// The scalar for D.
-  typedef ScalarD_ ScalarD;
-
-  /// The tile.
-  typedef OutputTile_ OutputTile;
-  /// The functor to do D = A*B + C.
-  typedef MultiplyAdd_ MultiplyAdd;
-  /// The shape of the instruction.
-  typedef typename MultiplyAdd::InstructionShape InstructionShape;
-  /// The number of accumulators per warp.
-  typedef typename MultiplyAdd::AccumulatorsPerWarp AccumulatorsPerWarp;
-  /// The accumulators.
-  typedef typename MultiplyAdd::Accumulators Accumulators;
-
-  /// The number of warps.
-  typedef typename ShapeDiv<OutputTile, AccumulatorsPerWarp>::Shape Warps;
-  /// The default warp size (32 threads per warp).
-  static int const kWarpSize = cutlass::kWarpSize;
-  /// The numnber of threads.
-  static int const kThreads = ShapeCount<Warps>::kCount * kWarpSize;
-
-  /// The number of scalars per LDG/STS/LDS for A.
-  static int const kScalarsPerLdgA = kScalarsPerLdgA_;
-  static int const kScalarsPerStsA = kScalarsPerStsA_;
-  static int const kScalarsPerLdsA = kScalarsPerLdsA_;
-
-  /// The number of scalars per LDG/STS/LDS for B.
-  static int const kScalarsPerLdgB = kScalarsPerLdgB_;
-  static int const kScalarsPerStsB = kScalarsPerStsB_;
-  static int const kScalarsPerLdsB = kScalarsPerLdsB_;
-
-  /// The number of scalars per LDG for C.
-  static int const kScalarsPerLdgC = kScalarsPerLdgCAndStgD_;
-
-  /// The number of scalars per STS/LDS/STG for D.
-  static int const kScalarsPerStgD = kScalarsPerLdgCAndStgD_;
-  static int const kScalarsPerStsD = kScalarsPerStsD_;
-  static int const kScalarsPerLdsD = kScalarsPerLdsD_;
-
-  /// The number of accumulators that are going to be fed from one LDS A/B.
-  static int const kAccumulatorsPerLdsA = kScalarsPerLdsA / InstructionShape::kD;
-  static int const kAccumulatorsPerLdsB = kScalarsPerLdsB / InstructionShape::kD;
-
-  /// The number of stages in shared memory to implement double, triple, more-buffering.
-  static int const kStages = kStages_;
-
-  /// Do we do the residue in the prologue?
-  static bool const kResidueInPrologue = kResidueInPrologue_;
-};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 template <enum MatrixLayout::Kind, typename GemmConfig_>
 struct GemmTileTraitsHelperA {};
 
@@ -416,60 +326,6 @@ struct GemmTileTraitsHelperB<MatrixLayout::kRowMajor, GemmConfig_> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename GemmTraits_, bool kResidueInPrologue_ = GemmTraits_::kResidueInPrologue>
-struct GemmResidue {
-  /// Move to residue portion.
-  template <bool kIsPrologue>
-  static CUTLASS_DEVICE void move_to_residue(typename GemmTraits_::GlobalLoadStreamA& stream_a,
-                                             typename GemmTraits_::GlobalLoadStreamB& stream_b,
-                                             typename GemmTraits_::Index k) {
-    // The new code path in CUTLASS 1.0.1: We treat the residue in the prologue so we can have
-    // complete main loops after that. It helps simplify the logic in the main loop.
-    if (kIsPrologue) {
-      stream_a.move_to_residue(k);
-      stream_b.move_to_residue(k);
-    }
-  }
-
-  /// Rollback to beginning of first tile and initialize predicates.
-  static CUTLASS_DEVICE void rollback(typename GemmTraits_::GlobalLoadStreamA& stream_a,
-                                      typename GemmTraits_::GlobalLoadStreamB& stream_b) {
-    stream_a.rollback();
-    stream_b.rollback();
-  }
-};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-template <typename GemmTraits_>
-struct GemmResidue<GemmTraits_, false> {
-  /// Move to residue portion.
-  template <bool kIsPrologue>
-  static CUTLASS_DEVICE void move_to_residue(typename GemmTraits_::GlobalLoadStreamA& stream_a,
-                                             typename GemmTraits_::GlobalLoadStreamB& stream_b,
-                                             typename GemmTraits_::Index k) {
-    // The index.
-    typedef typename GemmTraits_::Index Index;
-    // By how much we unroll the main loop.
-    Index const kUnroll = static_cast<Index>(GemmTraits_::OutputTile::kD);
-
-    // Call the residue code. That's the same path as CUTLASS 1.0.0.
-    if (kIsPrologue && k < kUnroll) {
-      stream_a.residue(k, true);
-      stream_b.residue(k, true);
-    } else if (k <= kUnroll) {
-      stream_a.residue(k, false);
-      stream_b.residue(k, false);
-    }
-  }
-
-  /// Rollback to beginning of first tile and initialize predicates.
-  static CUTLASS_DEVICE void rollback(typename GemmTraits_::GlobalLoadStreamA& stream_a,
-                                      typename GemmTraits_::GlobalLoadStreamB& stream_b) {}
-};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 template <
     /// The GEMM configuration.
     typename GemmConfig_,
@@ -488,27 +344,27 @@ template <
     /// The index.
     typename Index_ = int,
     /// The tool used to clear accumulators.
-    typename ClearAccumulators_ = ClearAccumulators<typename GemmConfig_::Accumulators::Scalar> >
+    typename ClearAccumulators_ = ClearAccumulators<typename GemmConfig_::Accumulators::Element> >
 
 struct GemmTraits {
-  /// This class.
+  /// This traits
   typedef GemmTraits<GemmConfig_,
-                     GlobalLoadStreamA_,
-                     GlobalLoadStreamB_,
-                     SharedLoadStreamA_,
-                     SharedLoadStreamB_,
-                     Epilogue_,
-                     BlockSwizzle_,
-                     Index_,
-                     ClearAccumulators_>
-      This_;
+    GlobalLoadStreamA_,
+    GlobalLoadStreamB_,
+    SharedLoadStreamA_,
+    SharedLoadStreamB_,
+    Epilogue_,
+    BlockSwizzle_,
+    Index_,
+    ClearAccumulators_> This_;
+
+  /// The struct that consumes this Traits
+  typedef typename cutlass::gemm::Gemm<This_> KernelClass;
 
   /// The configuration.
   typedef GemmConfig_ GemmConfig;
   /// The output tile.
   typedef typename GemmConfig::OutputTile OutputTile;
-  /// Is the residue treated in the prologue?
-  static bool const kResidueInPrologue = GemmConfig::kResidueInPrologue;
 
   /// The stream to load A from global memory to shared memory.
   typedef GlobalLoadStreamA_ GlobalLoadStreamA;
@@ -544,18 +400,30 @@ struct GemmTraits {
   /// Clear the accumulators.
   typedef ClearAccumulators_ ClearAccumulators;
 
-  /// The params.
-  struct Params {
-    /// The dimensions of the GEMM.
-    Index m, n, k;
-    /// The params for the A stream.
-    typename GlobalLoadStreamA::Params global_stream_a;
-    /// The params for the B stream.
-    typename GlobalLoadStreamB::Params global_stream_b;
-    /// The params for the A stream from shared memory.
-    typename SharedLoadStreamA::Params shared_stream_a;
-    /// The params for the B stream from shared memory.
-    typename SharedLoadStreamB::Params shared_stream_b;
+  /// Assemble the global load streams for A/B.
+  typedef GlobalLoadStreamPair<GlobalLoadStreamA,
+                               GlobalLoadStreamB,
+                               GemmConfig::kResidueInProlog>
+      GlobalLoadStream;
+
+  /// Memory needed to store the threadblock-scoped GEMM tile
+  typedef typename GlobalLoadStream::ThreadblockTileStorage ThreadblockTileStorage;
+
+  /// Assemble the shared load streams for A/B.
+  typedef SharedStreamPair<SharedLoadStreamA, SharedLoadStreamB> SharedStream;
+
+  /// Parameters object constructable on the host.
+  struct Params : public KernelLaunchConfiguration {
+
+    /// GEMM problem size
+    GemmCoord problem_size;
+
+    /// Parameters object for the global load stream
+    typename GlobalLoadStream::Params global_to_shared_stream;
+
+    /// Parameters object for the shared load stream
+    typename SharedStream::Params shared_stream;
+
     /// The params for the epilogue.
     typename Epilogue::Params epilogue;
 
@@ -563,21 +431,36 @@ struct GemmTraits {
     template <typename GemmDesc_>
     CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const& desc) {
       // Set the problem size.
-      this->m = desc.m;
-      this->n = desc.n;
-      this->k = desc.k;
+      problem_size = desc.problem_size;
 
-      // Initialize the iterator for A.
-      int error_code =
-          global_stream_a.initialize(desc, reinterpret_cast<ScalarA const*>(desc.d_a), desc.lda);
+      // Compute grid dimensions
+      BlockSwizzle block_swizzle;
+      this->block = dim3(GemmConfig::kThreads);
+      this->grid = block_swizzle.get_grid_layout(
+        problem_size,
+        make_Coord_from_shape<OutputTile>());
 
+      // Compute offset to residue.
+      Index gemm_k = problem_size[0];
+      Index offset_to_residue = (gemm_k % OutputTile::kD) ? gemm_k - (gemm_k % OutputTile::kD) : 0;
+
+      // Initialize parameters objects for
+      int error_code = global_to_shared_stream.stream_a.initialize(
+        desc.A.data(),
+        desc.batch_stride_A,
+        desc.A.leading_dim(),
+        offset_to_residue
+      );
       if (error_code) {
         return error_code;
       }
 
-      // Initialize the iterator for B.
-      error_code =
-          global_stream_b.initialize(desc, reinterpret_cast<ScalarB const*>(desc.d_b), desc.ldb);
+      error_code = global_to_shared_stream.stream_b.initialize(
+        desc.B.data(),
+        desc.batch_stride_B,
+        desc.B.leading_dim(),
+        offset_to_residue
+      );
 
       if (error_code) {
         return error_code;
@@ -586,24 +469,81 @@ struct GemmTraits {
       // The epilogue.
       return epilogue.initialize(desc);
     }
-  };
 
-  // The storage for A.
-  template <typename GlobalLoadStream_, typename SharedLoadStream_>
-  union StreamSharedStorage {
-    // The storage needed by the global stream.
-    typename GlobalLoadStream_::SharedStorage global;
-    // The storage needed by the shared stream.
-    typename SharedLoadStream_::SharedStorage shared;
+    /// Helper to construct a GEMM params using a BLAS-like API
+    CUTLASS_HOST_DEVICE int initialize(Index m,
+                                       Index n,
+                                       Index k,
+                                       typename Epilogue::Scalar alpha,
+                                       ScalarA const* d_a,
+                                       Index lda,
+                                       ScalarB const* d_b,
+                                       Index ldb,
+                                       typename Epilogue::Scalar beta,
+                                       ScalarC const* d_c,
+                                       Index ldc,
+                                       ScalarD* d_d,
+                                       Index ldd) {
+      GemmDesc<ScalarA, ScalarB, ScalarC, ScalarD, typename Epilogue::Scalar> desc(
+        GemmCoord(k, n, m, 1),
+        alpha,
+        TensorRef<ScalarA const, 2>(d_a, lda),
+        TensorRef<ScalarB const, 2>(d_b, ldb),
+        beta,
+        TensorRef<ScalarC const, 2>(d_c, ldc),
+        TensorRef<ScalarD, 2>(d_d, ldd)
+      );
+
+      return this->initialize(desc);
+    }
+
+    /// Helper to construct a batched GEMM params
+    CUTLASS_HOST_DEVICE int initialize(Index m,
+                                       Index n,
+                                       Index k,
+                                       typename Epilogue::Scalar alpha,
+                                       ScalarA const* d_a,
+                                       Index lda,
+                                       long long int batch_stride_A,
+                                       ScalarB const* d_b,
+                                       Index ldb,
+                                       long long int batch_stride_B,
+                                       typename Epilogue::Scalar beta,
+                                       ScalarC const* d_c,
+                                       Index ldc,
+                                       long long int batch_stride_C,
+                                       ScalarD* d_d,
+                                       Index ldd,
+                                       long long int batch_stride_D,
+                                       Index batch_count) {
+
+      GemmDesc<ScalarA, ScalarB, ScalarC, ScalarD, typename Epilogue::Scalar> desc(
+        GemmCoord(k, n, m, batch_count),
+        alpha,
+        TensorRef<ScalarA const, 2>(d_a, lda),
+        batch_stride_A,
+        TensorRef<ScalarB const, 2>(d_b, ldb),
+        batch_stride_B,
+        beta,
+        TensorRef<ScalarC const, 2>(d_c, ldc),
+        batch_stride_C,
+        TensorRef<ScalarD, 2>(d_d, ldd),
+        batch_stride_D
+      );
+
+      return this->initialize(desc);
+    }
   };
 
   // The storage for the main loop + prologue.
   struct MainLoopSharedStorage {
-    // The storage to shuffle the A matrix in shared memory.
-    StreamSharedStorage<GlobalLoadStreamA, SharedLoadStreamA> stream_a;
-    // The storage to shuffle the B matrix in shared memory.
-    StreamSharedStorage<GlobalLoadStreamB, SharedLoadStreamB> stream_b;
-    // The storage to clear the accumulators if needed.
+    /// Stores the threadblock tile
+    ThreadblockTileStorage threadblock_tile;
+
+    /// Storage for GEMM global stream
+    typename GlobalLoadStream::SharedStorage global_to_shared_stream;
+
+    /// Storage for clearing accumulators
     typename ClearAccumulators::SharedStorage clear;
   };
 
@@ -615,108 +555,18 @@ struct GemmTraits {
     typename Epilogue::SharedStorage epilogue;
   };
 
-  /// Assemble the global load streams for A/B.
-  struct GlobalLoadStream {
-    /// Ctor.
-    CUTLASS_DEVICE GlobalLoadStream(Params const& params,
-                                    SharedStorage& shared_storage,
-                                    dim3 const& block)
-        : stream_a(params.global_stream_a,
-                   shared_storage.main_loop.stream_a.global,
-                   cutlass::make_Coord(0, params.k, params.m),
-                   cutlass::make_Coord(0, 0, block.x)),
-          stream_b(params.global_stream_b,
-                   shared_storage.main_loop.stream_b.global,
-                   cutlass::make_Coord(0, params.k, params.n),
-                   make_Coord(0, 0, block.y)) {}
-
-    /// Trigger the copies from shared memory to registers.
-    CUTLASS_DEVICE void copy() {
-      stream_a.copy();
-      stream_b.copy();
-    }
-
-    /// Commit the data.
-    CUTLASS_DEVICE void commit() {
-      stream_a.commit();
-      stream_b.commit();
-    }
-
-    /// Move to residue portion.
-    template <bool kIsPrologue>
-    CUTLASS_DEVICE void move_to_residue(Index k) {
-      GemmResidue<This_>::move_to_residue<kIsPrologue>(stream_a, stream_b, k);
-    }
-
-    /// Rollback to beginning of first tile and initialize predicates.
-    CUTLASS_DEVICE void rollback() { GemmResidue<This_>::rollback(stream_a, stream_b); }
-
-    /// The stream for A.
-    GlobalLoadStreamA stream_a;
-    /// The stream for B.
-    GlobalLoadStreamB stream_b;
-  };
-
-  /// Assemble the shared load stream for A/B.
-  struct SharedLoadStream {
-    /// Ctor.
-    CUTLASS_DEVICE SharedLoadStream(Params const& params, SharedStorage& shared_storage) {
-      stream_a.initialize(params.shared_stream_a, shared_storage.main_loop.stream_a.shared);
-      stream_b.initialize(params.shared_stream_b, shared_storage.main_loop.stream_b.shared);
-    }
-
-    /// Trigger the copies from shared memory to registers.
-    CUTLASS_DEVICE void copy(int step) {
-      stream_a.copy(step, fetched_a[step % 2]);
-      stream_b.copy(step, fetched_b[step % 2]);
-    }
-
-    /// Commit the data.
-    CUTLASS_DEVICE void commit(int step) {
-      stream_a.commit(fetched_a[step % 2], transformed_a[step % 2]);
-      stream_b.commit(fetched_b[step % 2], transformed_b[step % 2]);
-    }
-
-    /// The fragment A.
-    CUTLASS_DEVICE typename SharedLoadStreamA::Fragment const& fragment_a(int step) const {
-      return transformed_a[step % 2];
-    }
-
-    /// The fragment B.
-    CUTLASS_DEVICE typename SharedLoadStreamB::Fragment const& fragment_b(int step) const {
-      return transformed_b[step % 2];
-    }
-
-    /// Increment the stage.
-    CUTLASS_DEVICE void inc_stage() {
-      stream_a.inc_stage();
-      stream_b.inc_stage();
-    }
-
-    /// The stream for A.
-    SharedLoadStreamA stream_a;
-    /// The fragments to fetch A.
-    typename SharedLoadStreamA::FetchedFragment fetched_a[2];
-    /// The fragments to transform A.
-    typename SharedLoadStreamA::TransformedFragment transformed_a[2];
-    /// The stream for B.
-    SharedLoadStreamB stream_b;
-    /// The fragments to fetch B.
-    typename SharedLoadStreamB::FetchedFragment fetched_b[2];
-    /// The fragments to transform B.
-    typename SharedLoadStreamB::TransformedFragment transformed_b[2];
-  };
-
   /// The memory fence for shared loads.
   static CUTLASS_DEVICE void shared_load_fence(bool in_loop) {
     if (SharedLoadStreamA::Iterator::kRequiresLoadFence ||
         SharedLoadStreamB::Iterator::kRequiresLoadFence) {
-      __syncthreads();
+        __syncthreads();
     }
   }
 
   /// The memory fence for shared stores.
-  static CUTLASS_DEVICE void shared_store_fence(bool in_loop) { __syncthreads(); }
+  static CUTLASS_DEVICE void shared_store_fence(bool in_loop) {
+      __syncthreads();
+  }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
@@ -735,7 +585,10 @@ struct SimplifiedGemmTraitsHelper {
                             MemorySpace::kShared>
       SharedStoreIteratorA;
   /// The stream to load A from global memory to shared memory.
-  typedef GlobalLoadStream<GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA>
+  typedef GlobalLoadStream<GemmOperand::kA,
+                              GlobalLoadIteratorA,
+                              SharedStoreIteratorA,
+                              GlobalTransformerA>
       GlobalLoadStreamA;
 
   /// The global iterator to load B from global memory.
@@ -750,7 +603,10 @@ struct SimplifiedGemmTraitsHelper {
                             MemorySpace::kShared>
       SharedStoreIteratorB;
   /// The stream to load B from global memory to shared memory.
-  typedef GlobalLoadStream<GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB>
+  typedef GlobalLoadStream<GemmOperand::kB,
+                              GlobalLoadIteratorB,
+                              SharedStoreIteratorB,
+                              GlobalTransformerB>
       GlobalLoadStreamB;
 
   /// The iterator to load A from shared memory.
diff --git a/cutlass/gemm/hgemm_global_tile.h b/cutlass/gemm/hgemm_global_tile.h
index f14dbb311..9d5ffe850 100644
--- a/cutlass/gemm/hgemm_global_tile.h
+++ b/cutlass/gemm/hgemm_global_tile.h
@@ -29,10 +29,10 @@
 */
 #pragma once
 
-#include <cutlass/coord.h>
-#include <cutlass/gemm/gemm_global_tile.h>
-#include <cutlass/matrix_traits.h>
-#include <cutlass/reshape_tile.h>
+#include "cutlass/coord.h"
+#include "cutlass/gemm/gemm_global_tile.h"
+#include "cutlass/matrix_traits.h"
+#include "cutlass/reshape_tile.h"
 
 namespace cutlass {
 namespace gemm {
@@ -63,14 +63,14 @@ struct HgemmCrosswiseGlobalTileTraits : public GemmGlobalTileTraits<
   /// The threads.
   typedef typename Base::Threads Threads;
   /// The threads strides.
-  typedef Shape<1, 2, Base::Tile::kC> ThreadsDelta;
+  typedef Shape<1, 2, Base::VectorizedTile::kC> ThreadsDelta;
   /// The strides in each dimension between different loads/stores.
   typedef Shape<Base::Threads::kH * 2, 1, Base::Threads::kW, Base::kAccessSize> Delta;
   /// The number of iterations needed to load/store the tile.
-  typedef Shape<Base::Tile::kH / Base::Threads::kH / 2,
+  typedef Shape<Base::VectorizedTile::kH / Base::Threads::kH / 2,
                 2,
-                Base::Tile::kW / Base::Threads::kW,
-                Base::Tile::kC / Base::kAccessSize>
+                Base::VectorizedTile::kW / Base::Threads::kW,
+                Base::VectorizedTile::kC / Base::kAccessSize>
       Iterations;
   /// Computes the thread offset in (H, W) based on thread ID
   struct ThreadOffset {
diff --git a/cutlass/gemm/hgemm_multiply_add.h b/cutlass/gemm/hgemm_multiply_add.h
index ebbdd06e8..7217d82c5 100644
--- a/cutlass/gemm/hgemm_multiply_add.h
+++ b/cutlass/gemm/hgemm_multiply_add.h
@@ -28,9 +28,9 @@
 */
 #pragma once
 
-#include <cutlass/fragment.h>
+#include "cutlass/fragment.h"
 
-#include <cutlass/gemm/thread_multiply_add.h>
+#include "cutlass/gemm/thread_multiply_add.h"
 
 namespace cutlass {
 namespace gemm {
@@ -38,16 +38,18 @@ namespace gemm {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 /// Template performing matrix multiply-add operation within a thread
-template <typename AccumulatorsPerThread_, typename ThreadsPerWarp_>
-struct ThreadMultiplyAdd<AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half> {
+template <typename ThreadGemmShape_, typename ThreadsPerWarp_>
+struct ThreadMultiplyAdd<ThreadGemmShape_, ThreadsPerWarp_, half, half, half> {
   /// The shape of the instruction.
   typedef Shape<1, 1, 2, 1> InstructionShape;
   /// The number of accumulators per thread.
-  typedef AccumulatorsPerThread_ AccumulatorsPerThread;
+  typedef ThreadGemmShape_ ThreadGemmShape;
+  /// Aliased for compatibility. Will be removed for CUTLASS v2.0.
+  typedef ThreadGemmShape AccumulatorsPerThread;
   /// The number of threads per warp.
   typedef ThreadsPerWarp_ ThreadsPerWarp;
   /// The number of accumulators per warp.
-  typedef typename ShapeMul<AccumulatorsPerThread, ThreadsPerWarp>::Shape AccumulatorsPerWarp;
+  typedef typename ShapeMul<ThreadGemmShape, ThreadsPerWarp>::Shape AccumulatorsPerWarp;
   /// The type for A.
   typedef half ScalarA;
   /// The fragment for A.
@@ -88,9 +90,9 @@ struct ThreadMultiplyAdd<AccumulatorsPerThread_, ThreadsPerWarp_, half, half, ha
         int const k0 = (2 * j + 0) * (AccumulatorsPerThread::kW / 2) + i;
         int const k1 = (2 * j + 1) * (AccumulatorsPerThread::kW / 2) + i;
 
-        // Compute the product a[i] * b[j].H0_H0.
+        // Compute the product a[i] * b[j].low.
         d_half2[k0] = __hfma2(a_half2[i], __low2half2(b_half2[j]), c_half2[k0]);
-        // Compute the product a[i] * b[j].H1_H1.
+        // Compute the product a[i] * b[j].high.
         d_half2[k1] = __hfma2(a_half2[i], __high2half2(b_half2[j]), c_half2[k1]);
       }
     }
diff --git a/cutlass/gemm/hgemm_swizzle.h b/cutlass/gemm/hgemm_swizzle.h
index ebec0d468..2ecd00881 100644
--- a/cutlass/gemm/hgemm_swizzle.h
+++ b/cutlass/gemm/hgemm_swizzle.h
@@ -29,7 +29,7 @@
 #pragma once
 
 #include <cuda_fp16.h>
-#include <cutlass/fragment.h>
+#include "cutlass/fragment.h"
 
 namespace cutlass {
 namespace gemm {
diff --git a/cutlass/gemm/hgemm_traits.h b/cutlass/gemm/hgemm_traits.h
index b08645bf4..2261bb4b3 100644
--- a/cutlass/gemm/hgemm_traits.h
+++ b/cutlass/gemm/hgemm_traits.h
@@ -27,18 +27,18 @@
 */
 #pragma once
 
-#include <cutlass/convert.h>
-#include <cutlass/reshape_tile.h>
+#include "cutlass/convert.h"
+#include "cutlass/reshape_tile.h"
 
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/gemm_epilogue.h>
-#include <cutlass/gemm/gemm_epilogue_traits.h>
-#include <cutlass/gemm/gemm_global_tile.h>
-#include <cutlass/gemm/gemm_shared_tile.h>
-#include <cutlass/gemm/gemm_traits.h>
-#include <cutlass/gemm/hgemm_global_tile.h>
-#include <cutlass/gemm/hgemm_multiply_add.h>
-#include <cutlass/gemm/hgemm_swizzle.h>
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/gemm_epilogue.h"
+#include "cutlass/gemm/gemm_epilogue_traits.h"
+#include "cutlass/gemm/gemm_global_tile.h"
+#include "cutlass/gemm/gemm_shared_tile.h"
+#include "cutlass/gemm/gemm_traits.h"
+#include "cutlass/gemm/hgemm_global_tile.h"
+#include "cutlass/gemm/hgemm_multiply_add.h"
+#include "cutlass/gemm/hgemm_swizzle.h"
 
 namespace cutlass {
 namespace gemm {
@@ -48,46 +48,52 @@ namespace gemm {
 template <
     /// The tile size for the GEMM KxNxM.
     typename OutputTile_,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_,
     /// The number of scalars per LDG for A.
     int kScalarsPerLdgA_ = 2,
     /// The number of scalars per LDG for B.
     int kScalarsPerLdgB_ = 2>
-struct HgemmConfig
-    : public GemmConfig<
-          /// The scalar type for A.
-          half,
-          /// The scalar type for B.
-          half,
-          /// The scalar type for C.
-          half,
-          /// The scalar type for D.
-          half,
-          /// The tile size for the GEMM KxNxM.
-          OutputTile_,
-          /// The functor to do the math in the main loop.
-          ThreadMultiplyAdd<AccumulatorsPerThread_, Shape<1, 4, 8>, half, half, half>,
-          /// The number of scalars per LDG for A.
-          kScalarsPerLdgA_,
-          /// The number of scalars per STS for A.
-          kScalarsPerLdgA_,
-          /// The number of scalars per LDS for A.
-          8,
-          /// The number of scalars per LDG for B.
-          kScalarsPerLdgB_,
-          /// The number of scalars per STS for B.
-          kScalarsPerLdgB_,
-          /// The number of scalars per LDS for B.
-          8,
-          /// The number of scalars per LDG for C and STG for D.
-          2,
-          /// The number of scalars per STS for D.
-          8,
-          /// The number of scalars per LDS for D.
-          2,
-          /// The number of stages in shared memory.
-          2> {};
+struct HgemmConfig : public GemmConfig<
+                         /// The scalar type for A.
+                         half,
+                         /// The scalar type for B.
+                         half,
+                         /// The scalar type for C.
+                         half,
+                         /// The scalar type for D.
+                         half,
+                         /// The tile size for the GEMM KxNxM.
+                         OutputTile_,
+                         /// The functor to do the math in the main loop.
+                         ThreadMultiplyAdd<ThreadGemmShape_, Shape<1, 4, 8>, half, half, half>,
+                         /// The number of scalars per LDG for A.
+                         kScalarsPerLdgA_,
+                         /// The number of scalars per STS for A.
+                         kScalarsPerLdgA_,
+                         /// The number of scalars per LDS for A.
+                         8,
+                         /// The number of scalars per LDG for B.
+                         kScalarsPerLdgB_,
+                         /// The number of scalars per STS for B.
+                         kScalarsPerLdgB_,
+                         /// The number of scalars per LDS for B.
+                         8,
+                         /// The number of scalars per LDG for C and STG for D.
+                         2,
+                         /// The number of scalars per STS for D.
+                         8,
+                         /// The number of scalars per LDS for D.
+                         2,
+                         /// The number of stages in shared memory.
+                         2,
+                         /// kResidueSeparate
+                         false,
+                         /// kResidueInPrologue
+                         true,
+                         /// kLaunchBounds
+                         false
+                         > {};
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
@@ -147,7 +153,6 @@ struct HgemmTileTraitsHelperA<MatrixLayout::kRowMajor, GemmConfig_>
       GemmConfig_::kScalarsPerLdgA>
       GlobalTileTraits;
 
-  /// The skew.
   static int const kSkewA = 128 / sizeof(half) / GlobalTileTraits::Threads::kW / 2;
 
   /// The traits class to build the iterator to store data to shared memory for A^T.
@@ -215,7 +220,6 @@ struct HgemmTileTraitsHelperB<MatrixLayout::kColumnMajor, GemmConfig_>
       GemmConfig_::kScalarsPerLdgB>
       GlobalTileTraits;
 
-  /// The skew for B.
   static int const kSkewB = 128 / sizeof(half) / GlobalTileTraits::Threads::kW / 2;
 
   /// The traits class to build the iterator to store data to shared memory for B^N.
@@ -266,8 +270,8 @@ template <
     typename OutputTile_,
     /// The functor to do the math in the epilogue.
     typename EpilogueFunctor_,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_ = Shape<8, 8, 16>,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_,
     /// The number of halfs loaded in one LDG for A.
     int kScalarsPerLdgA_ = 2,
     /// The number of halfs loaded in one LDG for B.
@@ -276,8 +280,7 @@ template <
     typename Index_ = int>
 struct HgemmTraitsHelper {
   /// The HGEMM config.
-  typedef HgemmConfig<OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_>
-      GemmConfig;
+  typedef HgemmConfig<OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_> GemmConfig;
   /// The GEMM config for A.
   typedef HgemmTileTraitsHelperA<kLayoutA_, GemmConfig> GemmTileTraitsHelperA;
   /// The GEMM config for B.
@@ -296,7 +299,10 @@ struct HgemmTraitsHelper {
                             MemorySpace::kShared>
       SharedStoreIteratorA;
   /// The stream to load A from global memory to shared memory.
-  typedef GlobalLoadStream<GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA>
+  typedef GlobalLoadStream<GemmOperand::kA,
+                              GlobalLoadIteratorA,
+                              SharedStoreIteratorA,
+                              GlobalTransformerA>
       GlobalLoadStreamA;
 
   /// The iterator to load B from global memory.
@@ -312,7 +318,10 @@ struct HgemmTraitsHelper {
                             MemorySpace::kShared>
       SharedStoreIteratorB;
   /// The stream to load B from global memory to shared memory.
-  typedef GlobalLoadStream<GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB>
+  typedef GlobalLoadStream<GemmOperand::kB,
+                              GlobalLoadIteratorB,
+                              SharedStoreIteratorB,
+                              GlobalTransformerB>
       GlobalLoadStreamB;
 
   /// The iterator to load A from shared memory
@@ -354,8 +363,8 @@ template <
     typename OutputTile_ = Shape<8, 128, 128>,
     /// The functor to do the math in the epilogue.
     typename EpilogueFunctor_ = LinearScaling<half>,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_ = Shape<8, 8, 16>,
+    /// Tile size for warp-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_ = Shape<8, 8, 16>,
     /// The number of halfs loaded in one LDG for A.
     int kScalarsPerLdgA_ = 2,
     /// The number of halfs loaded in one LDG for B.
@@ -367,7 +376,7 @@ template <
                                          kLayoutB_,
                                          OutputTile_,
                                          EpilogueFunctor_,
-                                         AccumulatorsPerThread_,
+                                         ThreadGemmShape_,
                                          kScalarsPerLdgA_,
                                          kScalarsPerLdgB_,
                                          Index_> >
diff --git a/cutlass/gemm/igemm_epilogue.h b/cutlass/gemm/igemm_epilogue.h
index 0d6998031..2ad24f32c 100644
--- a/cutlass/gemm/igemm_epilogue.h
+++ b/cutlass/gemm/igemm_epilogue.h
@@ -28,13 +28,13 @@
 */
 #pragma once
 
-#include <cutlass/convert.h>
-#include <cutlass/fragment.h>
-#include <cutlass/gemm/gemm_global_stream.h>
-#include <cutlass/gemm/gemm_shared_stream.h>
-#include <cutlass/gemm/igemm_global_tile.h>
-#include <cutlass/reshape_tile.h>
-#include <cutlass/tile_iterator.h>
+#include "cutlass/convert.h"
+#include "cutlass/fragment.h"
+#include "cutlass/gemm/gemm_global_stream.h"
+#include "cutlass/gemm/gemm_shared_stream.h"
+#include "cutlass/gemm/igemm_global_tile.h"
+#include "cutlass/reshape_tile.h"
+#include "cutlass/tile_iterator.h"
 
 namespace cutlass {
 namespace gemm {
@@ -269,8 +269,8 @@ struct IgemmEpilogueTraits : public GemmEpilogueTraits<
                                  typename Helper_::SharedStoreIteratorD,
                                  // The shared store transformer for D.
                                  typename Helper_::SharedStoreTransformerD,
-                                 // The iterator to load D from shared memory.
-                                 typename Helper_::SharedLoadIteratorD,
+                                 // The stream to load D from shared memory.
+                                 typename Helper_::SharedLoadStreamD,
                                  // The iterations.
                                  typename Helper_::Iterations,
                                  // The strides between iterations.
@@ -294,9 +294,8 @@ struct IgemmEpilogue : public GemmEpilogue<GemmEpilogueTraits_> {
   /// Ctor.
   CUTLASS_DEVICE IgemmEpilogue(typename Base::Params const& params_,
                                typename Base::SharedStorage& shared_storage_,
-                               typename Base::Index m_,
-                               typename Base::Index n_)
-      : Base(params_, shared_storage_, m_, n_) {}
+                               Coord<3> const& _problem_size)
+      : Base(params_, shared_storage_, _problem_size) {}
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
@@ -309,9 +308,8 @@ struct IgemmEpilogue<GemmEpilogueTraits_, true> : public GemmEpilogue<GemmEpilog
   /// Ctor.
   CUTLASS_DEVICE IgemmEpilogue(typename Base::Params const& params_,
                                typename Base::SharedStorage& shared_storage_,
-                               typename Base::Index m_,
-                               typename Base::Index n_)
-      : Base(params_, shared_storage_, m_, n_) {}
+                               Coord<3> const& _problem_size)
+      : Base(params_, shared_storage_, _problem_size) {}
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/cutlass/gemm/igemm_global_tile.h b/cutlass/gemm/igemm_global_tile.h
index 3f594ac6a..7a9c1573a 100644
--- a/cutlass/gemm/igemm_global_tile.h
+++ b/cutlass/gemm/igemm_global_tile.h
@@ -32,9 +32,9 @@
 */
 #pragma once
 
-#include <cutlass/coord.h>
-#include <cutlass/gemm/gemm_global_tile.h>
-#include <cutlass/matrix_traits.h>
+#include "cutlass/coord.h"
+#include "cutlass/gemm/gemm_global_tile.h"
+#include "cutlass/matrix_traits.h"
 
 namespace cutlass {
 namespace gemm {
@@ -67,10 +67,10 @@ struct IgemmGlobalTileTraits : public GemmGlobalTileTraits<
   /// The strides in each dimension between different loads/stores.
   typedef Shape<Base::Threads::kH * 4, 1, Base::Threads::kW, Base::kAccessSize> Delta;
   /// The number of iterations needed to load/store the tile.
-  typedef Shape<Base::Tile::kH / Base::Threads::kH / 4,
+  typedef Shape<Base::VectorizedTile::kH / Base::Threads::kH / 4,
                 4,
-                Base::Tile::kW / Base::Threads::kW,
-                Base::Tile::kC / Base::kAccessSize>
+                Base::VectorizedTile::kW / Base::Threads::kW,
+                Base::VectorizedTile::kC / Base::kAccessSize>
       Iterations;
 
   /// Computes the thread offset in (H, W) based on thread ID
@@ -86,24 +86,11 @@ struct IgemmGlobalTileTraits : public GemmGlobalTileTraits<
 
  public:
   /// The threads strides.
-  typedef Shape<1, 4, Base::Tile::kC> ThreadsDelta;
+  typedef Shape<1, 4, Base::VectorizedTile::kC> ThreadsDelta;
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/// Deprecated. Please use IgemmGlobalTileTraits instead.
-
-template <GemmOperand::Kind kOperand_,
-          MatrixLayout::Kind kLayout_,
-          typename Scalar_,
-          typename Tile_,
-          typename Threads_,
-          int kAccessSize_>
-struct IgemmContiguousGlobalTileTraits
-    : public IgemmGlobalTileTraits<kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_> {};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 template <typename TileTraits_, typename Index_ = int>
 struct IgemmGlobalIteratorAb : public GemmGlobalIteratorAb<TileTraits_, Index_> {
   /// The base class.
@@ -114,11 +101,11 @@ struct IgemmGlobalIteratorAb : public GemmGlobalIteratorAb<TileTraits_, Index_>
   /// Constructor.
   CUTLASS_DEVICE IgemmGlobalIteratorAb(typename Base::Params const& _params,
                                        const Coord<3>& bounds,
-                                       const Coord<3>& block,
+                                       const Coord<3>& threadblock_offset,
                                        ThreadOffset thread_offset_func = ThreadOffset())
-      : Base(_params, bounds, block, thread_offset_func), in_residue_(false), mask_(0xffffffff) {
+      : Base(_params, bounds, threadblock_offset, thread_offset_func), mask_(0xffffffff) {
     // The number of elements read in a single iteration.
-    int const kBlock = TileTraits_::Tile::kW * TileTraits_::kAccessSize;
+    int const kBlock = TileTraits_::Tile::kW;
     // The residue.
     int const kResidue = (int)(bounds[1] % kBlock);
 
@@ -129,28 +116,12 @@ struct IgemmGlobalIteratorAb : public GemmGlobalIteratorAb<TileTraits_, Index_>
     }
   }
 
-  /// The accessor.
-  CUTLASS_DEVICE void get(typename Base::AccessType& value, int d, int h, int w, int c) const {
-    Base::get(value, d, h, w, c);
-    if (in_residue_) {
-      reinterpret_cast<uint32_t&>(value) &= mask_;
-    }
+  CUTLASS_DEVICE void load_element(
+      typename Base::AccessType& value, int d, int h, int w, int c) const {
+    Base::load_element(value, d, h, w, c);
+    reinterpret_cast<uint32_t&>(value) &= mask_;
   }
 
-  /// Move to residue portion.
-  CUTLASS_DEVICE void move_to_residue(typename Base::Index k) {
-    Base::move_to_residue(k);
-    in_residue_ = true;
-  }
-
-  /// Move back to the beginning of the first tile.
-  CUTLASS_DEVICE void rollback() {
-    Base::rollback();
-    in_residue_ = false;
-  }
-
-  /// Are we in the residue?
-  bool in_residue_;
   /// The mask to clean up the values.
   uint32_t mask_;
 };
diff --git a/cutlass/gemm/igemm_multiply_add.h b/cutlass/gemm/igemm_multiply_add.h
index 5a8baec53..5ff6c7c1b 100644
--- a/cutlass/gemm/igemm_multiply_add.h
+++ b/cutlass/gemm/igemm_multiply_add.h
@@ -28,9 +28,9 @@
 */
 #pragma once
 
-#include <cutlass/fragment.h>
+#include "cutlass/fragment.h"
 
-#include <cutlass/gemm/thread_multiply_add.h>
+#include "cutlass/gemm/thread_multiply_add.h"
 
 namespace cutlass {
 namespace gemm {
@@ -38,16 +38,18 @@ namespace gemm {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 /// Template performing matrix multiply-add operation within a thread
-template <typename AccumulatorsPerThread_, typename ThreadsPerWarp_>
-struct ThreadMultiplyAdd<AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int> {
+template <typename ThreadGemmShape_, typename ThreadsPerWarp_>
+struct ThreadMultiplyAdd<ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int> {
   /// The shape of the instruction.
   typedef Shape<4, 1, 1> InstructionShape;
-  /// The number of accumulators per thread.
-  typedef AccumulatorsPerThread_ AccumulatorsPerThread;
+  /// Shape of the thread-level GEMM (K-by-N-by-M)
+  typedef ThreadGemmShape_ ThreadGemmShape;
+  /// Aliased for compatibility. Will be removed in CUTLASS v2.0
+  typedef ThreadGemmShape AccumulatorsPerThread;
   /// The number of threads per warp.
   typedef ThreadsPerWarp_ ThreadsPerWarp;
   /// The number of accumulators per warp.
-  typedef typename ShapeMul<AccumulatorsPerThread, ThreadsPerWarp>::Shape AccumulatorsPerWarp;
+  typedef typename ShapeMul<ThreadGemmShape, ThreadsPerWarp>::Shape AccumulatorsPerWarp;
   /// The type for A.
   typedef int8_t ScalarA;
   /// The fragment for A.
diff --git a/cutlass/gemm/igemm_swizzle.h b/cutlass/gemm/igemm_swizzle.h
index 77cf7118d..fbb68d143 100644
--- a/cutlass/gemm/igemm_swizzle.h
+++ b/cutlass/gemm/igemm_swizzle.h
@@ -27,7 +27,7 @@
 */
 #pragma once
 
-#include <cutlass/fragment.h>
+#include "cutlass/fragment.h"
 
 namespace cutlass {
 namespace gemm {
@@ -82,6 +82,11 @@ struct IgemmSwizzle {
           int a2 = src_int[i2];
           int a3 = src_int[i3];
 
+          // // DEBUG.
+          // if (threadIdx.x == 0) {
+          //     printf("a=0x%08x 0x%08x 0x%08x 0x%08x\n", a0, a1, a2, a3);
+          // }
+
           int b0, b1, b2, b3, c0;
           asm volatile("prmt.b32 %0, %1, %2, 0x0040;" : "=r"(b0) : "r"(a0), "r"(a1));
           asm volatile("prmt.b32 %0, %1, %2, 0x0040;" : "=r"(c0) : "r"(a2), "r"(a3));
@@ -99,6 +104,11 @@ struct IgemmSwizzle {
           asm volatile("prmt.b32 %0, %1, %2, 0x0073;" : "=r"(c0) : "r"(a2), "r"(a3));
           asm volatile("prmt.b32 %0, %1, %2, 0x5410;" : "=r"(b3) : "r"(b3), "r"(c0));
 
+          // // DEBUG.
+          // if (threadIdx.x == 0) {
+          //     printf("b=0x%08x 0x%08x 0x%08x 0x%08x\n", b0, b1, b2, b3);
+          // }
+
           dst_int[i0] = b0;
           dst_int[i1] = b1;
           dst_int[i2] = b2;
diff --git a/cutlass/gemm/igemm_traits.h b/cutlass/gemm/igemm_traits.h
index 82f8de5cd..5bceeda92 100644
--- a/cutlass/gemm/igemm_traits.h
+++ b/cutlass/gemm/igemm_traits.h
@@ -29,18 +29,18 @@
 */
 #pragma once
 
-#include <cutlass/convert.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/gemm_epilogue.h>
-#include <cutlass/gemm/gemm_epilogue_traits.h>
-#include <cutlass/gemm/gemm_global_tile.h>
-#include <cutlass/gemm/gemm_shared_tile.h>
-#include <cutlass/gemm/gemm_traits.h>
-#include <cutlass/gemm/igemm_epilogue.h>
-#include <cutlass/gemm/igemm_global_tile.h>
-#include <cutlass/gemm/igemm_multiply_add.h>
-#include <cutlass/gemm/igemm_swizzle.h>
-#include <cutlass/reshape_tile.h>
+#include "cutlass/convert.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/gemm_epilogue.h"
+#include "cutlass/gemm/gemm_epilogue_traits.h"
+#include "cutlass/gemm/gemm_global_tile.h"
+#include "cutlass/gemm/gemm_shared_tile.h"
+#include "cutlass/gemm/gemm_traits.h"
+#include "cutlass/gemm/igemm_epilogue.h"
+#include "cutlass/gemm/igemm_global_tile.h"
+#include "cutlass/gemm/igemm_multiply_add.h"
+#include "cutlass/gemm/igemm_swizzle.h"
+#include "cutlass/reshape_tile.h"
 
 namespace cutlass {
 namespace gemm {
@@ -52,49 +52,52 @@ template <
     typename OutputTile_,
     /// The output type.
     typename ScalarD_,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_>
-struct IgemmConfig
-    : public GemmConfig<
-          /// The scalar type for A.
-          int8_t,
-          /// The scalar type for B.
-          int8_t,
-          /// The scalar type for C.
-          ScalarD_,
-          /// The scalar type for D.
-          ScalarD_,
-          /// The tile size for the GEMM KxNxM.
-          OutputTile_,
-          /// The functor to do the math in the main loop.
-          ThreadMultiplyAdd<AccumulatorsPerThread_, Shape<1, 4, 8>, int8_t, int8_t, int>,
-          /// The number of scalars per LDG for A.
-          4,
-          /// The number of scalars per STS for A.
-          4,
-          /// The number of scalars per LDS for A.
-          16,
-          /// The number of scalars per LDG for B.
-          4,
-          /// The number of scalars per STS for B.
-          4,
-          /// The number of scalars per LDS for B.
-          16,
-          /// The number of scalars per LDG for C and STG for D.
-          1,
-          /// The number of scalars per STS for D.
-          4,
-          /// The number of scalars per LDS for D.
-          1,
-          /// The number of stages in shared memory.
-          2,
-          /// Enable the code path that deals with the residue in epilogue.
-          true> {};
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_>
+struct IgemmConfig : public GemmConfig<
+                         /// The scalar type for A.
+                         int8_t,
+                         /// The scalar type for B.
+                         int8_t,
+                         /// The scalar type for C.
+                         ScalarD_,
+                         /// The scalar type for D.
+                         ScalarD_,
+                         /// The tile size for the GEMM KxNxM.
+                         OutputTile_,
+                         /// The functor to do the math in the main loop.
+                         ThreadMultiplyAdd<ThreadGemmShape_, Shape<1, 4, 8>, int8_t, int8_t, int>,
+                         /// The number of scalars per LDG for A.
+                         4,
+                         /// The number of scalars per STS for A.
+                         4,
+                         /// The number of scalars per LDS for A.
+                         16,
+                         /// The number of scalars per LDG for B.
+                         4,
+                         /// The number of scalars per STS for B.
+                         4,
+                         /// The number of scalars per LDS for B.
+                         16,
+                         /// The number of scalars per LDG for C and STG for D.
+                         1,
+                         /// The number of scalars per STS for D.
+                         4,
+                         /// The number of scalars per LDS for D.
+                         1,
+                         /// The number of stages in shared memory.
+                         2,
+                         /// kResidueSeparate
+                         false,
+                         /// kResidueInPrologue
+                         false,
+                         /// kLaunchBounds
+                         false> {};
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename OutputTile_, typename AccumulatorsPerThread_>
-struct IgemmConfig<OutputTile_, int8_t, AccumulatorsPerThread_>
+template <typename OutputTile_, typename ThreadGemmShape_>
+struct IgemmConfig<OutputTile_, int8_t, ThreadGemmShape_>
     : public GemmConfig<
           /// The scalar type for A.
           int8_t,
@@ -107,7 +110,7 @@ struct IgemmConfig<OutputTile_, int8_t, AccumulatorsPerThread_>
           /// The tile size for the GEMM KxNxM.
           OutputTile_,
           /// The functor to do the math in the main loop.
-          ThreadMultiplyAdd<AccumulatorsPerThread_, Shape<1, 4, 8>, int8_t, int8_t, int>,
+          ThreadMultiplyAdd<ThreadGemmShape_, Shape<1, 4, 8>, int8_t, int8_t, int>,
           /// The number of scalars per LDG for A.
           4,
           /// The number of scalars per STS for A.
@@ -128,8 +131,12 @@ struct IgemmConfig<OutputTile_, int8_t, AccumulatorsPerThread_>
           4,
           /// The number of stages in shared memory.
           2,
-          /// Enable the code path that deals with the residue in epilogue.
-          true> {};
+          /// If true, separate mainloop is instantiated from residue
+          false,
+          /// Compute residue in prolog?
+          true,
+          /// Launch bounds?
+          false> {};
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
@@ -162,7 +169,7 @@ struct IgemmTileTraitsHelperA<MatrixLayout::kColumnMajor, GemmConfig_, Index_>
       GemmConfig_::kScalarsPerLdgA>
       GlobalTileTraits;
 
-  // The iterator.
+  /// The global load iterator.
   typedef GemmGlobalIteratorAb<GlobalTileTraits, Index_> GlobalLoadIterator;
 
   /// The traits class to build the iterator to store data to shared memory for A^N.
@@ -208,7 +215,7 @@ struct IgemmTileTraitsHelperA<MatrixLayout::kRowMajor, GemmConfig_, Index_> {
       GemmConfig_::kScalarsPerLdgA>
       GlobalTileTraits;
 
-  // The iterator.
+  /// The global load iterator.
   typedef IgemmGlobalIteratorAb<GlobalTileTraits, Index_> GlobalLoadIterator;
 
   /// The traits class to build the iterator to store data to shared memory for A^N.
@@ -281,7 +288,7 @@ struct IgemmTileTraitsHelperB<MatrixLayout::kColumnMajor, GemmConfig_, Index_> {
       GemmConfig_::kScalarsPerLdgB>
       GlobalTileTraits;
 
-  // The iterator.
+  /// The global load iterator.
   typedef IgemmGlobalIteratorAb<GlobalTileTraits, Index_> GlobalLoadIterator;
 
   /// The traits class to build the iterator to store data to shared memory for B^N.
@@ -345,7 +352,7 @@ struct IgemmTileTraitsHelperB<MatrixLayout::kRowMajor, GemmConfig_, Index_>
       GemmConfig_::kScalarsPerLdgB>
       GlobalTileTraits;
 
-  // The iterator.
+  /// The global load iterator.
   typedef GemmGlobalIteratorAb<GlobalTileTraits, Index_> GlobalLoadIterator;
 
   /// The traits class to build the iterator to store data to shared memory for B^N.
@@ -404,13 +411,13 @@ template <
     typename ScalarD_,
     /// The functor to do the math in the epilogue.
     typename EpilogueFunctor_,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_ = Shape<32, 8, 8>,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_ = Shape<32, 8, 8>,
     /// The index.
     typename Index_ = int>
 struct IgemmTraitsHelper {
   /// The IGEMM config.
-  typedef IgemmConfig<OutputTile_, ScalarD_, AccumulatorsPerThread_> GemmConfig;
+  typedef IgemmConfig<OutputTile_, ScalarD_, ThreadGemmShape_> GemmConfig;
   /// The GEMM config for A.
   typedef IgemmTileTraitsHelperA<kLayoutA_, GemmConfig, Index_> GemmTileTraitsHelperA;
   /// The GEMM config for B.
@@ -418,7 +425,6 @@ struct IgemmTraitsHelper {
 
   /// The iterator to load A from global memory.
   typedef typename GemmTileTraitsHelperA::GlobalLoadIterator GlobalLoadIteratorA;
-
   /// The default transformer for A.
   typedef typename IgemmTransformerA<GemmTileTraitsHelperA::kLayout,
                                      GlobalLoadIteratorA>::Transformer GlobalTransformerA;
@@ -429,12 +435,14 @@ struct IgemmTraitsHelper {
                             MemorySpace::kShared>
       SharedStoreIteratorA;
   /// The stream to load A from global memory to shared memory.
-  typedef GlobalLoadStream<GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA>
+  typedef GlobalLoadStream<GemmOperand::kA,
+                              GlobalLoadIteratorA,
+                              SharedStoreIteratorA,
+                              GlobalTransformerA>
       GlobalLoadStreamA;
 
   /// The iterator to load B from global memory.
   typedef typename GemmTileTraitsHelperB::GlobalLoadIterator GlobalLoadIteratorB;
-
   // The default transformer for B.
   typedef typename IgemmTransformerB<GemmTileTraitsHelperB::kLayout,
                                      GlobalLoadIteratorB>::Transformer GlobalTransformerB;
@@ -445,7 +453,10 @@ struct IgemmTraitsHelper {
                             MemorySpace::kShared>
       SharedStoreIteratorB;
   /// The stream to load B from global memory to shared memory.
-  typedef GlobalLoadStream<GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB>
+  typedef GlobalLoadStream<GemmOperand::kB,
+                              GlobalLoadIteratorB,
+                              SharedStoreIteratorB,
+                              GlobalTransformerB>
       GlobalLoadStreamB;
 
   /// The iterator to load A from shared memory.
@@ -501,8 +512,8 @@ template <
     typename ScalarD_ = int,
     /// The functor to do the math in the epilogue.
     typename EpilogueFunctor_ = LinearScaling<typename IgemmEpilogueScalar<ScalarD_>::Scalar>,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_ = Shape<32, 8, 8>,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_ = Shape<32, 8, 8>,
     /// The index.
     typename Index_ = int,
     /// The helper class.
@@ -511,7 +522,7 @@ template <
                                          OutputTile_,
                                          ScalarD_,
                                          EpilogueFunctor_,
-                                         AccumulatorsPerThread_,
+                                         ThreadGemmShape_,
                                          Index_> >
 struct IgemmTraits : public GemmTraits<
                          // The config.
diff --git a/cutlass/gemm/linear_scaling.h b/cutlass/gemm/linear_scaling.h
index 979c93f96..a12fc5f19 100644
--- a/cutlass/gemm/linear_scaling.h
+++ b/cutlass/gemm/linear_scaling.h
@@ -1,3 +1,4 @@
+
 /***************************************************************************************************
  * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
  *
@@ -27,18 +28,31 @@
 */
 #pragma once
 
-#include <cutlass/fragment_multiply_add.h>
+#include "cutlass/fragment_multiply_add.h"
 
 namespace cutlass {
 namespace gemm {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+template <typename T>
+CUTLASS_DEVICE bool is_zero(T x) {
+  return x == T(0);
+}
+
+#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)
+CUTLASS_DEVICE bool is_zero(half x) { return reinterpret_cast<int16_t&>(x) == int16_t(0); }
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 /// Functor to compute linear combination of fragments
-template <typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd<Scalar_> >
+template <typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd<Scalar_, Scalar_> >
 struct LinearScaling {
   // The scalar.
   typedef Scalar_ Scalar;
+  // The accumulator Type
+  typedef typename FragmentMultiplyAdd_::ScalarAccum ScalarAccum;
   // The adapater.
   typedef FragmentMultiplyAdd_ FragmentMultiplyAdd;
 
@@ -47,6 +61,21 @@ struct LinearScaling {
     /// The alpha/beta scaling params.
     Scalar alpha, beta;
 
+    //
+    // Methods
+    //
+
+    // Constructor
+    CUTLASS_HOST_DEVICE
+    Params(Scalar _alpha = 0, Scalar _beta = 0) : alpha(_alpha), beta(_beta) {}
+
+    /// Initialize the parameters
+    CUTLASS_HOST_DEVICE int initialize(Scalar _alpha, Scalar _beta) {
+      alpha = _alpha;
+      beta = _beta;
+      return 0;
+    }
+
     /// Initialize the parameters.
     template <typename GemmDesc_>
     CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const& desc) {
@@ -56,14 +85,53 @@ struct LinearScaling {
     }
   };
 
+  //
+  // Data members
+  //
+
+  Params params;
+
+  //
+  // Methods
+  //
+
   /// Ctor.
-  CUTLASS_DEVICE LinearScaling(Params const& params) : alpha(params.alpha), beta(params.beta) {}
+  CUTLASS_DEVICE LinearScaling() { }
+
+  /// Ctor.
+  CUTLASS_DEVICE LinearScaling(Params const& _params) : params(_params) {}
+
+  /// Method to determine whether the source accumulator matrix C is ever needed. This method
+  /// may always safely return true, though better performance is possible if the source accumulator
+  /// matrix is never loaded unnecessarily.
+  CUTLASS_DEVICE
+  bool source_required() const {
+    return !is_zero(params.beta);
+  }
 
   /// Evaluate the functor.
   template <typename FragmentA_, typename FragmentB_>
   CUTLASS_DEVICE void evaluate(FragmentA_ const& accum, FragmentB_& output) {
     FragmentMultiplyAdd mad;
-    mad.multiply(alpha, accum, output);
+    mad.multiply(params.alpha, accum, output);
+
+  }
+
+  /// Evaluate the functor, without using fragment in the API
+  template <typename ScalarAccum, typename ScalarOutput, int size>
+  CUTLASS_DEVICE void evaluate(ScalarAccum const *accum, ScalarOutput *output) {
+    Fragment<ScalarAccum, size> FragAccum;
+    Fragment<ScalarOutput, size> FragOutput;
+#pragma unroll
+    for (int i = 0; i < size; i++) {
+      FragAccum[i] = accum[i];
+      FragOutput[i] = output[i];
+    }
+    evaluate(FragAccum, FragOutput);
+#pragma unroll
+    for (int i = 0; i < size; i++) {
+      output[i] = FragOutput[i];
+    }
   }
 
   /// Evaluate the functor.
@@ -71,12 +139,28 @@ struct LinearScaling {
   CUTLASS_DEVICE void evaluate(FragmentA_ const& accum, FragmentB_ const& old, FragmentB_& output) {
     FragmentMultiplyAdd mad;
     FragmentB_ tmp;
-    mad.multiply(beta, old, tmp);
-    mad.multiply_add(alpha, accum, tmp, output);
+    mad.multiply(params.beta, old, tmp);
+    mad.multiply_add(params.alpha, accum, tmp, output);
   }
 
-  /// The alpha/beta scaling factors.
-  Scalar alpha, beta;
+  /// Evaluate the functor, without using fragment in the API
+  template <typename ScalarAccum, typename ScalarOutput, int size>
+  CUTLASS_DEVICE void evaluate(ScalarAccum const *accum, ScalarOutput const *old, ScalarOutput *output) {
+    Fragment<ScalarAccum, size> FragAccum;
+    Fragment<ScalarOutput, size> FragOutput;
+    Fragment<ScalarOutput, size> FragOld;
+#pragma unroll
+    for (int i = 0; i < size; i++) {
+      FragAccum[i] = accum[i];
+      FragOutput[i] = output[i];
+      FragOld[i] = old[i];
+    }
+    evaluate(FragAccum, FragOld, FragOutput);
+#pragma unroll
+    for (int i = 0; i < size; i++) {
+      output[i] = FragOutput[i];
+    }
+  }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/cutlass/gemm/linear_scaling_device_ptr.h b/cutlass/gemm/linear_scaling_device_ptr.h
new file mode 100644
index 000000000..5dc845da4
--- /dev/null
+++ b/cutlass/gemm/linear_scaling_device_ptr.h
@@ -0,0 +1,149 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Implements the BLAS linear scaling function alpha*AB + beta*C
+*/
+#pragma once
+
+#include "cutlass/cutlass.h"
+#include "cutlass/gemm/scalar_or_pointer.h"
+#include "cutlass/gemm/linear_scaling.h"
+
+namespace cutlass {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace gemm {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Functor to compute linear combination of fragments. This is intended to support passing scalars
+/// either by value from the host or by reference to device-side scalar elements. This is inspired
+/// by cuBLAS's device pointer mode.
+template <typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd<Scalar_, Scalar_> >
+struct LinearScalingDevicePtr : public LinearScaling<Scalar_, FragmentMultiplyAdd_> {
+
+  /// Linear Scaling class used
+  typedef LinearScaling<Scalar_, FragmentMultiplyAdd_> Base;
+
+  // The scalar.
+  typedef typename Base::Scalar Scalar;
+
+  /// The parameters.
+  class Params  {
+  private:
+    /// Alpha scalar
+    detail::ScalarOrPointer<Scalar> alpha_;
+
+    /// Beta sclaar
+    detail::ScalarOrPointer<Scalar> beta_;
+
+  public:
+    //
+    // Methods
+    //
+
+    // Constructor
+    CUTLASS_HOST_DEVICE
+    Params() {}
+
+    // Constructor
+    CUTLASS_HOST_DEVICE
+    Params(
+      Scalar alpha,
+      Scalar beta
+    ):
+      alpha_(alpha),
+      beta_(beta) {}
+
+    // Constructor
+    CUTLASS_HOST_DEVICE
+    Params(
+      Scalar const *alpha_ptr,
+      Scalar const *beta_ptr
+    ):
+      alpha_(alpha_ptr),
+      beta_(alpha_ptr) {}
+
+    /// Initialize the parameters
+    CUTLASS_HOST_DEVICE int initialize(
+      Scalar alpha,
+      Scalar beta) {
+
+      alpha_ = alpha;
+      beta_ = beta;
+
+      return 0;
+    }
+
+    /// Initialize the parameters
+    CUTLASS_HOST_DEVICE int initialize(
+      Scalar const *alpha,
+      Scalar const *beta) {
+
+      alpha_ = alpha;
+      beta_= beta;
+
+      return 0;
+    }
+
+    /// Initialize the parameters.
+    template <typename GemmDesc_>
+    CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const& desc) {
+
+      alpha_ = desc.alpha;
+      beta_ = desc.beta;
+
+      return 0;
+    }
+
+    /// Gets the alpha scalar
+    CUTLASS_HOST_DEVICE
+    Scalar alpha() const {
+      return alpha_;
+    }
+
+    /// Gets the beta scalar
+    CUTLASS_HOST_DEVICE
+    Scalar beta() const {
+      return beta_;
+    }
+  };
+
+  //
+  // Methods
+  //
+
+  /// Ctor.
+  CUTLASS_HOST_DEVICE LinearScalingDevicePtr(Params const& _params) {
+    this->params.alpha = _params.alpha();
+    this->params.beta = _params.beta();
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace gemm
+} // namespace cutlass
diff --git a/cutlass/gemm/scalar_or_pointer.h b/cutlass/gemm/scalar_or_pointer.h
new file mode 100644
index 000000000..7c4b4b75d
--- /dev/null
+++ b/cutlass/gemm/scalar_or_pointer.h
@@ -0,0 +1,129 @@
+
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Implements the BLAS linear scaling function alpha*AB + beta*C
+*/
+#pragma once
+
+#include "cutlass/cutlass.h"
+
+namespace cutlass {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace detail {
+
+/// Helper class defines an object  which operates as either a scalar or a pointer. If the pointer
+/// is non-null, it is dereferenced when the object is accessed.
+template <typename Scalar_>
+class ScalarOrPointer {
+public:
+  /// Underlying scalar type
+  typedef Scalar_ Scalar;
+
+private:
+  //
+  // Data members
+  //
+
+  /// Scalar value
+  Scalar scalar;
+
+  /// Pointer to use if non null
+  Scalar const *ptr;
+
+public:
+
+  //
+  // Methods
+  //
+
+  /// Default ctor
+  CUTLASS_HOST_DEVICE
+  ScalarOrPointer(): scalar(0), ptr(nullptr) {}
+
+  /// Object behaves as a scalar
+  CUTLASS_HOST_DEVICE
+  ScalarOrPointer(Scalar const &val): scalar(val), ptr(nullptr) {}
+
+  /// Object behaves as a scalar
+  CUTLASS_HOST_DEVICE
+  ScalarOrPointer(Scalar const *ptr_): scalar(0), ptr(ptr_) {}
+
+  /// Returns true if is pointer
+  CUTLASS_HOST_DEVICE
+  bool is_pointer() const {
+    return bool(ptr);
+  }
+
+  /// Gets the pointer value
+  CUTLASS_HOST_DEVICE
+  Scalar const *get_ptr() const {
+    return ptr;
+  }
+
+  /// Gets the pointer value
+  CUTLASS_HOST_DEVICE
+  Scalar get_scalar() const {
+    return scalar;
+  }
+
+  /// Assigns to a scalar and sets pointer to nullptr
+  CUTLASS_HOST_DEVICE
+  ScalarOrPointer &operator=(Scalar const &scalar_) {
+    scalar = scalar_;
+    ptr = nullptr;
+    return *this;
+  }
+
+  /// Assigns to a pointer value
+  CUTLASS_HOST_DEVICE
+  ScalarOrPointer &operator=(Scalar const *ptr_) {
+    ptr = ptr_;
+    return *this;
+  }
+
+  /// Access the element
+  CUTLASS_HOST_DEVICE
+  Scalar get() const {
+    if (ptr) {
+      return *ptr;
+    }
+    return scalar;
+  }
+
+  /// Accesses the element
+  CUTLASS_HOST_DEVICE
+  operator Scalar() const {
+    return get();
+  }
+};
+
+} // namespace detail
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/cutlass/gemm/sgemm_traits.h b/cutlass/gemm/sgemm_traits.h
index 66b767748..8ce7f58e2 100644
--- a/cutlass/gemm/sgemm_traits.h
+++ b/cutlass/gemm/sgemm_traits.h
@@ -27,13 +27,13 @@
 */
 #pragma once
 
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/gemm_epilogue.h>
-#include <cutlass/gemm/gemm_epilogue_traits.h>
-#include <cutlass/gemm/gemm_global_tile.h>
-#include <cutlass/gemm/gemm_shared_tile.h>
-#include <cutlass/gemm/gemm_traits.h>
-#include <cutlass/gemm/thread_multiply_add.h>
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/gemm_epilogue.h"
+#include "cutlass/gemm/gemm_epilogue_traits.h"
+#include "cutlass/gemm/gemm_global_tile.h"
+#include "cutlass/gemm/gemm_shared_tile.h"
+#include "cutlass/gemm/gemm_traits.h"
+#include "cutlass/gemm/thread_multiply_add.h"
 
 namespace cutlass {
 namespace gemm {
@@ -43,46 +43,53 @@ namespace gemm {
 template <
     /// The tile size for the GEMM KxNxM.
     typename OutputTile_,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_,
     /// The number of scalars per LDG for A.
     int kScalarsPerLdgA_ = 1,
     /// The number of scalars per LDG for B.
-    int kScalarsPerLdgB_ = 1>
-struct SgemmConfig
-    : public GemmConfig<
-          /// The scalar type for A.
-          float,
-          /// The scalar type for B.
-          float,
-          /// The scalar type for C.
-          float,
-          /// The scalar type for D.
-          float,
-          /// The tile size for the GEMM KxNxM.
-          OutputTile_,
-          /// The functor to do the math in the main loop.
-          ThreadMultiplyAdd<AccumulatorsPerThread_, Shape<1, 4, 8>, float, float, float>,
-          /// The number of scalars per LDG for A.
-          kScalarsPerLdgA_,
-          /// The number of scalars per STS for A.
-          kScalarsPerLdgA_,
-          /// The number of scalars per LDS for A.
-          4,
-          /// The number of scalars per LDG for B.
-          kScalarsPerLdgB_,
-          /// The number of scalars per STS for B.
-          kScalarsPerLdgB_,
-          /// The number of scalars per LDS for B.
-          4,
-          /// The number of scalars per LDG for C and STG for D.
-          1,
-          /// The number of scalars per STS for D.
-          4,
-          /// The number of scalars per LDS for D.
-          1,
-          /// The number of stages in shared memory.
-          2> {};
+    int kScalarsPerLdgB_ = 1,
+    /// Whether to specify launch bounds
+    bool kLaunchBounds = true>
+struct SgemmConfig : public GemmConfig<
+                         /// The scalar type for A.
+                         float,
+                         /// The scalar type for B.
+                         float,
+                         /// The scalar type for C.
+                         float,
+                         /// The scalar type for D.
+                         float,
+                         /// The tile size for the GEMM KxNxM.
+                         OutputTile_,
+                         /// The functor to do the math in the main loop.
+                         ThreadMultiplyAdd<ThreadGemmShape_, Shape<1, 4, 8>, float, float, float>,
+                         /// The number of scalars per LDG for A.
+                         kScalarsPerLdgA_,
+                         /// The number of scalars per STS for A.
+                         kScalarsPerLdgA_,
+                         /// The number of scalars per LDS for A.
+                         4,
+                         /// The number of scalars per LDG for B.
+                         kScalarsPerLdgB_,
+                         /// The number of scalars per STS for B.
+                         kScalarsPerLdgB_,
+                         /// The number of scalars per LDS for B.
+                         4,
+                         /// The number of scalars per LDG for C and STG for D.
+                         1,
+                         /// The number of scalars per STS for D.
+                         4,
+                         /// The number of scalars per LDS for D.
+                         1,
+                         /// The number of stages in shared memory.
+                         2,
+                         /// kResidueSeparate
+                         false,
+                         /// kResidueInPrologue
+                         true,
+                         /// kLaunchBounds
+                         kLaunchBounds> {};
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
@@ -95,8 +102,8 @@ template <
     typename OutputTile_ = Shape<8, 128, 128>,
     /// The functor to use in the epilogue.
     typename EpilogueFunctor_ = LinearScaling<float>,
-    /// The number of accumulators per thread.
-    typename AccumulatorsPerThread_ = Shape<8, 8, 8>,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_ = Shape<8, 8, 8>,
     /// The number of floats loaded in one LDG for A.
     int kScalarsPerLdgA_ = 1,
     /// The number of floats loaded in one LDG for B.
@@ -105,7 +112,7 @@ template <
     typename Index_ = int,
     /// The SGEMM config.
     typename GemmConfig_ =
-        SgemmConfig<OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_>,
+        SgemmConfig<OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, false>,
     /// The traits class for the epilogue.
     typename GemmEpilogueTraits_ =
         SimplifiedGemmEpilogueTraits<GemmConfig_, EpilogueFunctor_, Index_> >
@@ -123,5 +130,43 @@ struct SgemmTraits : public SimplifiedGemmTraits<
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+/// Helper to define SGEMM traits using Launch Bounds
+template <
+    /// The layout for A.
+    MatrixLayout::Kind kLayoutA_,
+    /// The layout for B.
+    MatrixLayout::Kind kLayoutB_,
+    /// The output tile.
+    typename OutputTile_ = Shape<8, 128, 128>,
+    /// The functor to use in the epilogue.
+    typename EpilogueFunctor_ = LinearScaling<float>,
+    /// Tile size for thread-level GEMM (K-by-N-by-M)
+    typename ThreadGemmShape_ = Shape<8, 8, 8>,
+    /// The number of floats loaded in one LDG for A.
+    int kScalarsPerLdgA_ = 1,
+    /// The number of floats loaded in one LDG for B.
+    int kScalarsPerLdgB_ = 1,
+    /// The index.
+    typename Index_ = int,
+    /// The SGEMM config.
+    typename GemmConfig_ =
+        SgemmConfig<OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, true>,
+    /// The traits class for the epilogue.
+    typename GemmEpilogueTraits_ =
+        SimplifiedGemmEpilogueTraits<GemmConfig_, EpilogueFunctor_, Index_> >
+struct SgemmLBTraits : public SimplifiedGemmTraits<
+                         // The layout for A.
+                         kLayoutA_,
+                         // The layout for B.
+                         kLayoutB_,
+                         // The config.
+                         GemmConfig_,
+                         // The epilogue.
+                         GemmEpilogue<GemmEpilogueTraits_>,
+                         // The index.
+                         Index_> {};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 }  // namespace gemm
 }  // namespace cutlass
diff --git a/cutlass/gemm/thread_multiply_add.h b/cutlass/gemm/thread_multiply_add.h
index 20dca1596..b95dee58a 100644
--- a/cutlass/gemm/thread_multiply_add.h
+++ b/cutlass/gemm/thread_multiply_add.h
@@ -27,7 +27,7 @@
 */
 #pragma once
 
-#include <cutlass/fragment.h>
+#include "cutlass/fragment.h"
 
 namespace cutlass {
 namespace gemm {
@@ -35,20 +35,23 @@ namespace gemm {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 /// Template performing matrix multiply-add operation within a thread
-template <typename AccumulatorsPerThread_,
+template <typename ThreadGemmShape_,
           typename ThreadsPerWarp_,
           typename ScalarA_,
           typename ScalarB_,
-          typename ScalarC_>
+          typename ScalarC_,
+          MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor>
 struct ThreadMultiplyAdd {
   /// The shape of the instruction.
   typedef Shape<1, 1, 1, 1> InstructionShape;
-  /// The number of accumulators per thread.
-  typedef AccumulatorsPerThread_ AccumulatorsPerThread;
+  /// The shape of a thread-leveel matrix multiply accumulate.
+  typedef ThreadGemmShape_ ThreadGemmShape;
+  /// Aliased to "AccumulatorsPerThread" for compatibility. Expect to be renamed in CUTLASS v2.0
+  typedef ThreadGemmShape AccumulatorsPerThread;
   /// The number of threads per warp.
   typedef ThreadsPerWarp_ ThreadsPerWarp;
   /// The number of accumulators per warp.
-  typedef typename ShapeMul<AccumulatorsPerThread, ThreadsPerWarp>::Shape AccumulatorsPerWarp;
+  typedef typename ShapeMul<ThreadGemmShape, ThreadsPerWarp>::Shape AccumulatorsPerWarp;
   /// The type for A.
   typedef ScalarA_ ScalarA;
   /// The fragment for A.
@@ -70,9 +73,18 @@ struct ThreadMultiplyAdd {
                                    FragmentB const& b,
                                    Accumulators const& c,
                                    Accumulators& d) {
-    for (int j = 0; j < AccumulatorsPerThread::kH; ++j) {
-      for (int i = 0; i < AccumulatorsPerThread::kW; ++i) {
-        d[j * AccumulatorsPerThread::kW + i] = a[i] * b[j] + c[j * AccumulatorsPerThread::kW + i];
+    if(kLayout_ == MatrixLayout::kColumnMajor) {
+      for (int j = 0; j < AccumulatorsPerThread::kH; ++j) {
+        for (int i = 0; i < AccumulatorsPerThread::kW; ++i) {
+          d[j * AccumulatorsPerThread::kW + i] = a[i] * b[j] + c[j * AccumulatorsPerThread::kW + i];
+        }
+      }
+    }
+    else {
+      for(int i = 0; i < AccumulatorsPerThread::kW; ++i) {
+        for(int j = 0; j < AccumulatorsPerThread::kH; ++j) {
+          d[i * AccumulatorsPerThread::kH + j] = a[i] * b[j] + c[i * AccumulatorsPerThread::kH + j];
+        }
       }
     }
   }
diff --git a/cutlass/gemm/threadblock_swizzle.h b/cutlass/gemm/threadblock_swizzle.h
new file mode 100644
index 000000000..fe7a3be7f
--- /dev/null
+++ b/cutlass/gemm/threadblock_swizzle.h
@@ -0,0 +1,387 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Defies functors for mapping blockIdx to partitions of the GEMM computation.
+*/
+#pragma once
+
+#include "cutlass/coord.h"
+#include "cutlass/gemm/gemm_coord.h"
+
+namespace cutlass {
+namespace gemm {
+
+struct swizzleDirection {
+  enum Kind { Boustrophedon, OneDirection };
+};
+// helper template function
+template <enum swizzleDirection::Kind>
+CUTLASS_DEVICE int getLinearIdx(int groups) {
+  // groupCols is not needed for OneDirection Swizzle
+  return blockIdx.y * gridDim.x + blockIdx.x;
+}
+template <>
+CUTLASS_DEVICE int getLinearIdx<swizzleDirection::Boustrophedon>(int groups) {
+  // reverse blockIdx.x for some columns
+  if ((blockIdx.y / groups) % 2 == 1)
+    return blockIdx.y * gridDim.x + (gridDim.x - blockIdx.x - 1);
+  else
+    return blockIdx.y * gridDim.x + blockIdx.x;
+}
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/*!@defgroup IdentityBlockSwizzle Identity Block Swizzle
+@{
+    Block Swizzle provides the mapping logic between a block in the physical memory of Matrix C and
+Thread Block
+    Identiy Block Swizzle effective maps blocks in leading dimension order (column major) with
+thread block
+    in leading dimension order (blockIdx.x)
+    blockIdx.z is mapped with batch_count for batched GEMM
+@}
+*/
+struct IdentityBlockSwizzle {
+  /// Ctor. aka ColumnMajorBlockSwizzle<1>
+  CUTLASS_HOST_DEVICE IdentityBlockSwizzle() {}
+
+  /// Swizzle the block index.
+  CUTLASS_DEVICE dim3 swizzle() { return blockIdx; }
+
+  ///
+  CUTLASS_HOST_DEVICE dim3 get_grid_layout(GemmCoord const &problem_size,
+                                           Coord<3> const &OutputTile) {
+    /*OutputTile and problem_size are both in KNM order*/
+    dim3 grid;
+    grid.x = (problem_size.m() + OutputTile[2] - 1) / OutputTile[2];
+    grid.y = (problem_size.n() + OutputTile[1] - 1) / OutputTile[1];
+    grid.z = problem_size.batch();
+    return grid;
+  }
+
+  ///
+  CUTLASS_DEVICE Coord<3> get_threadblock_offset(Coord<3> const &OutputTile) {
+    dim3 block = swizzle();
+    Coord<3> threadblock_offset =
+        make_Coord(0, block.y * OutputTile[1], block.x * OutputTile[2]);
+    return threadblock_offset;
+  }
+
+  ///
+  CUTLASS_DEVICE int get_batch_id() {
+    dim3 block = swizzle();
+    return block.z;
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/*
+ColumnMajorBlockSwizzle<1, OneDirection> is equivalent with IdentityBlockSwizzle
+groupCols has the effect of controlling the schedulling of thread blocks
+settings with different groupCols can contribute to the overall performance by affecting L2 cache
+hit rate
+
+consider a regular thread block mapping btween matrix C and different thread blocks
+note that C is column major, and the leading dimension of thread block id is blockIdx.x
+
+let's look at an example where gridIdx.x = 6, gridIdx.y = 7, gridIdx.z = 1
+(blockIdx.x, blockIdx.y)
+mapping between threadblockID and C matrix:
+-------------------------------------------------------
+(0,0) | (0,1) | (0,2) | (0,3) | (0,4) | (0,5) | (0,6) |
+-------------------------------------------------------
+(1,0) | (1,1) | (1,2) | (1,3) | (1,4) | (1,5) | (1,6) |
+-------------------------------------------------------
+(2,0) | (2,1) | (2,2) | (2,3) | (2,4) | (2,5) | (2,6) |
+-------------------------------------------------------
+(3,0) | (3,1) | (3,2) | (3,3) | (3,4) | (3,5) | (3,6) |
+-------------------------------------------------------
+(4,0) | (4,1) | (4,2) | (4,3) | (4,4) | (4,5) | (4,6) |
+-------------------------------------------------------
+(5,0) | (5,1) | (5,2) | (5,3) | (5,4) | (5,5) | (5,6) |
+-------------------------------------------------------
+
+A ColumnMajorBlockSwizzle<1, OneDirection> will imply the above order where threadblocks are
+launched in a column major
+
+A ColumnMajorBlockSwizzle<2, OneDirection> swizzles things a little,
+-------------------------------------------------------
+(0,0) | (3,0) | (0,2) | (3,2) | (0,4) | (3,4) | (0,6) |
+-------------------------------------------------------
+(0,1) | (3,1) | (0,3) | (3,3) | (0,5) | (3,5) | (1,6) |
+-------------------------------------------------------
+(1,0) | (4,0) | (1,2) | (4,2) | (1,4) | (4,4) | (2,6) |
+-------------------------------------------------------
+(1,1) | (4,1) | (1,3) | (4,3) | (1,5) | (4,5) | (3,6) |
+-------------------------------------------------------
+(2,0) | (5,0) | (2,2) | (5,2) | (2,4) | (5,4) | (4,6) |
+-------------------------------------------------------
+(2,1) | (5,1) | (2,3) | (5,3) | (2,5) | (5,5) | (5,6) |
+-------------------------------------------------------
+
+so in memory, it would apprear that we work on 2 columns at a time rather than 1
+Note that the index here really represent how each block maps to memory
+
+A ColumnMajorBlockSwizzle<1, Boustrophedon> is similar to ColumnMajorBlockSwizzle<1, OneDirection>
+except that every column flips the ordering against the previous one
+-------------------------------------------------------
+(0,0) | (5,1) | (0,2) | (5,3) | (0,4) | (5,5) | (0,6) |
+-------------------------------------------------------
+(1,0) | (4,1) | (1,2) | (4,3) | (1,4) | (4,5) | (1,6) |
+-------------------------------------------------------
+(2,0) | (3,1) | (2,2) | (3,3) | (2,4) | (3,5) | (2,6) |
+-------------------------------------------------------
+(3,0) | (2,1) | (3,2) | (2,3) | (3,4) | (2,5) | (3,6) |
+-------------------------------------------------------
+(4,0) | (1,1) | (4,2) | (1,3) | (4,4) | (1,5) | (4,6) |
+-------------------------------------------------------
+(5,0) | (0,1) | (5,2) | (0,3) | (5,4) | (0,5) | (5,6) |
+-------------------------------------------------------
+
+similarily, A ColumnMajorBlockSwizzle<2, Boustrophedon> looks like
+-------------------------------------------------------
+(0,0) | (3,0) | (2,3) | (5,3) | (0,4) | (3,4) | (5,6) |
+-------------------------------------------------------
+(0,1) | (3,1) | (2,2) | (5,2) | (0,5) | (3,5) | (4,6) |
+-------------------------------------------------------
+(1,0) | (4,0) | (1,3) | (4,3) | (1,4) | (4,4) | (3,6) |
+-------------------------------------------------------
+(1,1) | (4,1) | (1,2) | (4,2) | (1,5) | (4,5) | (2,6) |
+-------------------------------------------------------
+(2,0) | (5,0) | (0,3) | (3,3) | (2,4) | (5,4) | (1,6) |
+-------------------------------------------------------
+(2,1) | (5,1) | (0,2) | (3,2) | (2,5) | (5,5) | (0,6) |
+-------------------------------------------------------
+
+*/
+
+template <int groupCols, enum swizzleDirection::Kind swDirection>
+struct ColumnMajorBlockSwizzle {
+  /// Ctor.
+  CUTLASS_HOST_DEVICE ColumnMajorBlockSwizzle() {}
+
+  /// Swizzle the block index.
+  CUTLASS_DEVICE dim3 swizzle() {
+    assert(gridDim.z == 1);
+    int linearIdx = getLinearIdx<swDirection>(groupCols);
+    dim3 swizzledBlockIdx;
+    int currGroupCols = groupCols;
+    int prevGroupCols = groupCols;
+
+    if ((gridDim.y % groupCols != 0) && ((blockIdx.y + (gridDim.y % groupCols)) >= gridDim.y)) {
+      // last colmuns if gridDim.y is not divisble by groupCols
+      currGroupCols = gridDim.y % groupCols;
+    }
+
+    swizzledBlockIdx.x = (linearIdx / currGroupCols) % gridDim.x;
+    swizzledBlockIdx.y =
+        linearIdx % currGroupCols + prevGroupCols * (linearIdx / (prevGroupCols * gridDim.x));
+    swizzledBlockIdx.z = blockIdx.z;
+
+    return swizzledBlockIdx;
+  }
+
+  ///
+  CUTLASS_HOST_DEVICE dim3 get_grid_layout(GemmCoord const &problem_size,
+                                           Coord<3> const &OutputTile) {
+    dim3 grid;
+    grid.x = (problem_size.m() + OutputTile[2] - 1) / OutputTile[2];
+    grid.y = (problem_size.n() + OutputTile[1] - 1) / OutputTile[1];
+    grid.z = problem_size.batch();
+    return grid;
+  }
+
+  ///
+  CUTLASS_DEVICE Coord<3> get_threadblock_offset(Coord<3> const &OutputTile) {
+    dim3 block = swizzle();
+    Coord<3> threadblock_offset =
+        make_Coord(0, block.y * OutputTile[1], block.x * OutputTile[2]);
+    return threadblock_offset;
+  }
+
+  ///
+  CUTLASS_DEVICE int get_batch_id() {
+    dim3 block = swizzle();
+    return block.z;
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/*
+
+consider a regular thread block mapping btween matrix C and different thread blocks
+note that C is column major, and the leading dimension of thread block id is blockIdx.x
+
+let's look at an example where gridIdx.x = 6, gridIdx.y = 7, gridIdx.z = 1
+(blockIdx.x, blockIdx.y)
+mapping between threadblockID and C matrix:
+-------------------------------------------------------
+(0,0) | (0,1) | (0,2) | (0,3) | (0,4) | (0,5) | (0,6) |
+-------------------------------------------------------
+(1,0) | (1,1) | (1,2) | (1,3) | (1,4) | (1,5) | (1,6) |
+-------------------------------------------------------
+(2,0) | (2,1) | (2,2) | (2,3) | (2,4) | (2,5) | (2,6) |
+-------------------------------------------------------
+(3,0) | (3,1) | (3,2) | (3,3) | (3,4) | (3,5) | (3,6) |
+-------------------------------------------------------
+(4,0) | (4,1) | (4,2) | (4,3) | (4,4) | (4,5) | (4,6) |
+-------------------------------------------------------
+(5,0) | (5,1) | (5,2) | (5,3) | (5,4) | (5,5) | (5,6) |
+-------------------------------------------------------
+
+A RowMajorBlockSwizzle<1, OneDirection> will effectively transpose the map
+
+-----------------------------------------------
+(0,0) | (1,0) | (2,0) | (3,0) | (4,0) | (5,0) |
+-----------------------------------------------
+(0,1) | (1,1) | (2,1) | (3,1) | (4,1) | (5,1) |
+-----------------------------------------------
+(0,2) | (1,2) | (2,2) | (3,2) | (4,2) | (5,2) |
+-----------------------------------------------
+(0,3) | (1,3) | (2,3) | (3,3) | (4,3) | (5,3) |
+-----------------------------------------------
+(0,4) | (1,4) | (2,4) | (3,4) | (4,4) | (5,4) |
+---------------------------------------------
+(0,5) | (1,5) | (2,5) | (3,5) | (4,5) | (5,5) |
+-----------------------------------------------
+(0,6) | (1,6) | (2,6) | (3,6) | (4,6) | (5,6) |
+-----------------------------------------------
+
+It would aprear in memory we are working on 1 row at a time
+
+A ColumnMajorBlockSwizzle<2, OneDirection> swizzles things a little bit more
+-----------------------------------------------
+(0,0) | (1,3) | (2,0) | (3,3) | (4,0) | (5,3) |
+-----------------------------------------------
+(1,0) | (0,4) | (3,0) | (2,4) | (5,0) | (4,4) |
+-----------------------------------------------
+(0,1) | (1,4) | (2,1) | (3,4) | (4,1) | (5,4) |
+-----------------------------------------------
+(1,1) | (0,5) | (3,1) | (2,5) | (5,1) | (4,5) |
+-----------------------------------------------
+(0,2) | (1,5) | (2,2) | (3,5) | (4,2) | (5,5) |
+---------------------------------------------
+(1,2) | (0,6) | (3,2) | (2,6) | (5,2) | (4,6) |
+-----------------------------------------------
+(0,3) | (1,6) | (2,3) | (3,6) | (4,3) | (5,6) |
+-----------------------------------------------
+
+so in memory, it would apprear that we work on 2 rows at a time rather than 1 row
+Note that the index here really represent how each block maps to memory
+
+A RowMajorBlockSwizzle<1, Boustrophedon> is similar to RowMajorBlockSwizzle<1, OneDirection>
+except that every column flips the ordering against the previous one
+
+-----------------------------------------------
+(0,0) | (1,6) | (2,0) | (3,6) | (4,0) | (5,6) |
+-----------------------------------------------
+(0,1) | (1,5) | (2,1) | (3,5) | (4,1) | (5,5) |
+-----------------------------------------------
+(0,2) | (1,4) | (2,2) | (3,4) | (4,2) | (5,4) |
+-----------------------------------------------
+(0,3) | (1,3) | (2,3) | (3,3) | (4,3) | (5,3) |
+-----------------------------------------------
+(0,4) | (1,2) | (2,4) | (3,2) | (4,4) | (5,2) |
+---------------------------------------------
+(0,5) | (1,1) | (2,5) | (3,1) | (4,5) | (5,1) |
+-----------------------------------------------
+(0,6) | (1,0) | (2,6) | (3,0) | (4,6) | (5,0) |
+-----------------------------------------------
+
+similarily, A RowMajorBlockSwizzle<2, Boustrophedon> looks like
+-----------------------------------------------
+(0,0) | (1,3) | (2,3) | (3,6) | (4,0) | (5,3) |
+-----------------------------------------------
+(1,0) | (0,4) | (3,2) | (2,6) | (5,0) | (4,4) |
+-----------------------------------------------
+(0,1) | (1,4) | (2,2) | (3,5) | (4,1) | (5,4) |
+-----------------------------------------------
+(1,1) | (0,5) | (3,1) | (2,5) | (5,1) | (4,5) |
+-----------------------------------------------
+(0,2) | (1,5) | (2,1) | (3,4) | (4,2) | (5,5) |
+---------------------------------------------
+(1,2) | (0,6) | (3,0) | (2,4) | (5,2) | (4,6) |
+-----------------------------------------------
+(0,3) | (1,6) | (2,0) | (3,3) | (4,3) | (5,6) |
+-----------------------------------------------
+
+*/
+
+template <int groupRows, enum swizzleDirection::Kind swDirection>
+struct RowMajorBlockSwizzle {
+  /// Ctor.
+  CUTLASS_HOST_DEVICE RowMajorBlockSwizzle() {}
+
+  /// Swizzle the block index.
+  CUTLASS_DEVICE dim3 swizzle() {
+    assert(gridDim.z == 1);
+    int linearIdx = getLinearIdx<swDirection>(groupRows);
+    dim3 swizzledBlockIdx;
+    int currGroupRows = groupRows;
+    int prevGroupRows = groupRows;
+
+    if ((gridDim.y % groupRows != 0) && ((blockIdx.y + (gridDim.y % groupRows)) >= gridDim.y)) {
+      // last columns
+      currGroupRows = gridDim.y % groupRows;
+    }
+
+    swizzledBlockIdx.x =
+        linearIdx % currGroupRows + prevGroupRows * (linearIdx / (prevGroupRows * gridDim.x));
+    swizzledBlockIdx.y = (linearIdx / currGroupRows) % gridDim.x;
+    swizzledBlockIdx.z = blockIdx.z;
+
+    return swizzledBlockIdx;
+  }
+
+  ///
+  CUTLASS_HOST_DEVICE dim3 get_grid_layout(GemmCoord const &problem_size,
+                                           Coord<3> const &OutputTile) {
+    dim3 grid;
+    grid.x = (problem_size.n() + OutputTile[1] - 1) / OutputTile[1];
+    grid.y = (problem_size.m() + OutputTile[2] - 1) / OutputTile[2];
+    grid.z = problem_size.batch();
+    return grid;
+  }
+
+  ///
+  CUTLASS_DEVICE Coord<3> get_threadblock_offset(Coord<3> const &OutputTile) {
+    dim3 block = swizzle();
+    Coord<3> threadblock_offset =
+        make_Coord(0, block.y * OutputTile[1], block.x * OutputTile[2]);
+    return threadblock_offset;
+  }
+
+  ///
+  CUTLASS_DEVICE int get_batch_id() {
+    dim3 block = swizzle();
+    return block.z;
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace gemm
+}  // namespace cutlass
diff --git a/cutlass/gemm/wmma_gemm_epilogue_traits.h b/cutlass/gemm/wmma_gemm_epilogue_traits.h
index 0fafacf90..f35264dda 100644
--- a/cutlass/gemm/wmma_gemm_epilogue_traits.h
+++ b/cutlass/gemm/wmma_gemm_epilogue_traits.h
@@ -27,18 +27,18 @@
 */
 #pragma once
 
-#include <cutlass/wmma_matrix.h>
+#include "cutlass/wmma_matrix.h"
 #ifdef CUTLASS_USE_WMMA_API
 
-#include <cutlass/convert.h>
-#include <cutlass/coord.h>
-#include <cutlass/gemm/gemm_global_stream.h>
-#include <cutlass/gemm/gemm_shared_stream.h>
-#include <cutlass/gemm/linear_scaling.h>
-#include <cutlass/gemm/wmma_gemm_global_tile.h>
-#include <cutlass/gemm/wmma_gemm_shared_tile.h>
-#include <cutlass/reshape_tile.h>
-#include <cutlass/tile_iterator.h>
+#include "cutlass/convert.h"
+#include "cutlass/coord.h"
+#include "cutlass/gemm/gemm_global_stream.h"
+#include "cutlass/gemm/gemm_shared_stream.h"
+#include "cutlass/gemm/linear_scaling.h"
+#include "cutlass/gemm/wmma_gemm_global_tile.h"
+#include "cutlass/gemm/wmma_gemm_shared_tile.h"
+#include "cutlass/reshape_tile.h"
+#include "cutlass/tile_iterator.h"
 
 namespace cutlass {
 namespace gemm {
@@ -89,7 +89,7 @@ struct WmmaGemmEpilogueTraitsHelper {
                             MemorySpace::kShared,
                             Index_,
                             WmmaMatrix,
-                            IteratorFragment::kWmmaMatrix>
+                            FragmentElementType::kWmmaMatrix>
       SharedStoreIteratorD;
 
   /// The shared store transformer for D.
@@ -114,6 +114,9 @@ struct WmmaGemmEpilogueTraitsHelper {
                            MemorySpace::kShared>
       SharedLoadIteratorD;
 
+  /// The stream to load D.
+  typedef SharedLoadStream<SharedLoadIteratorD> SharedLoadStreamD;
+
   /// The traits class to build the iterator to load data from global memory for C^N.
   typedef WmmaGemmGlobalIteratorCdTraits<
       // The pointer is float const.
diff --git a/cutlass/gemm/wmma_gemm_global_tile.h b/cutlass/gemm/wmma_gemm_global_tile.h
index dbd57f6b5..ce369d0eb 100644
--- a/cutlass/gemm/wmma_gemm_global_tile.h
+++ b/cutlass/gemm/wmma_gemm_global_tile.h
@@ -27,7 +27,7 @@
 */
 #pragma once
 
-#include <cutlass/gemm/gemm_global_tile.h>
+#include "cutlass/gemm/gemm_global_tile.h"
 
 namespace cutlass {
 namespace gemm {
@@ -68,22 +68,13 @@ struct WmmaGemmGlobalIteratorCdTraits : public GemmGlobalTileTraits<GemmOperand:
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 template <typename TileTraits_, typename Index_ = int>
-struct WmmaGemmGlobalIteratorCd : public TileIteratorBase<TileTraits_,
-                                                          typename TileTraits_::Scalar,
-                                                          IteratorAdvance::kH,
-                                                          MemorySpace::kGlobal,
-                                                          Index_> {
+struct WmmaGemmGlobalIteratorCd : public GemmGlobalIteratorCd<TileTraits_, Index_> {
   /// This class.
   typedef WmmaGemmGlobalIteratorCd<TileTraits_, Index_> This_;
   /// The traits.
   typedef TileTraits_ Traits;
   /// The base class.
-  typedef TileIteratorBase<Traits,
-                           typename TileTraits_::Scalar,
-                           IteratorAdvance::kH,
-                           MemorySpace::kGlobal,
-                           Index_>
-      Base;
+  typedef GemmGlobalIteratorCd<Traits, Index_> Base;
   /// Override the strides in each dimension between different loads/stores.
   typedef Shape<0, 0, Base::Delta::kW, Base::Delta::kC> ImmediateOffsetStrides;
   /// The layout.
@@ -99,47 +90,36 @@ struct WmmaGemmGlobalIteratorCd : public TileIteratorBase<TileTraits_,
   typedef Index_ Index;
   /// The thread offset functor.
   typedef typename TileTraits_::ThreadOffset ThreadOffset;
+  /// Base parameters.
+  typedef typename Base::Params BaseParams;
 
   /// The params.
-  struct Params {
-    /// The pointer.
-    Pointer pointer;
-    /// The stride in the H dimension to setup the thread in the block.
-    Index stride_h;
-    /// The strides to increment the pointer.
-    Index inc_h, inc_advance;
-    /// The column offset to compute the predicate for the columns.
-    Index predicate_offset;
-    /// The strides to increment the predicate offset.
-    Index predicate_inc_h, predicate_inc_advance;
-
+  struct Params : public BaseParams {
     /// Setup the params.
-    CUTLASS_HOST_DEVICE int initialize(
-        Pointer pointer, Index ld, Index n, Index epilogue_stride_w, Index epilogue_delta_w) {
+    CUTLASS_HOST_DEVICE int initialize(Pointer pointer,
+                                       long long batch_stride,
+                                       Index ldm,
+                                       Index n,
+                                       Index epilogue_stride_w,
+                                       Index epilogue_delta_w) {
       // The pointer.
-      this->pointer = pointer;
+      BaseParams::pointer = pointer;
+      // Stride between GEMMs
+      BaseParams::stride_d = batch_stride;
       // Setup the base stride. One "group of threads" per column.
-      stride_h = ld;
+      BaseParams::stride_h = ldm;
       // Each thread output 1 column per iteration. .
-      inc_h = ld * TileTraits_::Threads::kH;
-      inc_advance = inc_h + epilogue_stride_w;
+      BaseParams::inc_h = ldm * TileTraits_::Threads::kH;
+      BaseParams::inc_advance = BaseParams::inc_h + epilogue_stride_w;
 
-      predicate_offset = n;
-      predicate_inc_h = TileTraits_::Threads::kH;
-      predicate_inc_advance = predicate_inc_h + epilogue_delta_w;
+      BaseParams::predicate_offset = n;
+      BaseParams::predicate_inc_h = TileTraits_::Threads::kH;
+      BaseParams::predicate_inc_advance = BaseParams::predicate_inc_h + epilogue_delta_w;
 
-      // It worked.
       return 0;
     }
   };
 
-  Params params;
-
-  Coord<4> thread_offset;
-
-  /// Ctor.
-  CUTLASS_DEVICE WmmaGemmGlobalIteratorCd() {}
-
   /// Ctor.
   CUTLASS_DEVICE WmmaGemmGlobalIteratorCd(Params const& params,
                                           const Coord<3>& bounds,
@@ -148,61 +128,37 @@ struct WmmaGemmGlobalIteratorCd : public TileIteratorBase<TileTraits_,
                                           int const pred_offset = 0,
                                           ThreadOffset thread_offset_func = ThreadOffset())
 
-      : params(params) {
-    thread_offset = thread_offset_func();
-    // Each warp works on a different column of the tile.
-    int const h = thread_offset[1] + block[1];
-    // Each lane writes a different element.
-    int const w = thread_offset[2] + block[2];
-    // Setup the pointer.
-    this->params.pointer += ((h * params.stride_h + w) + pointer_offset);
+      : Base(params, bounds, block, pointer_offset, pred_offset, thread_offset_func) {}
 
-    // Prepare the vector of predicates.
-    for (int i = 0; i < Base::Iterations::kW; ++i) {
-      predicates.set(i, w + i * Base::Delta::kW < bounds[2]);
-    }
-    this->params.predicate_offset -= (h + pred_offset);
+  /// Loads a single fragment element from memory
+  CUTLASS_DEVICE void load_element(
+      typename Base::AccessType& value, int d, int h, int w, int c) const {
+    Base::load_element(value, d, h, w, c);
   }
 
-  /// The accessor.
-  CUTLASS_DEVICE void get(typename Base::AccessType& value, int d, int h, int w, int c) const {
-    int const imm =
-        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(0, 0, w, c);
-    Load<Scalar, TileTraits_::kAccessSize, MemorySpace::kGlobal>::load(value, params.pointer, imm);
-  }
-
-  /// Increment the pointer in the C dimension.
-  CUTLASS_DEVICE void inc_c() {}
-  /// Increment the pointer in the W dimension.
-  CUTLASS_DEVICE void inc_w() {}
-  /// Increment the pointer in the H dimension.
-  CUTLASS_DEVICE void inc_h() {
-    params.pointer += params.inc_h;
-    params.predicate_offset -= params.predicate_inc_h;
-  }
-  /// Increment the pointer in the D dimension.
-  CUTLASS_DEVICE void inc_d() {}
-  /// Increment the pointer to move to the next iteration.
-  CUTLASS_DEVICE void inc_advance() {
-    params.pointer += params.inc_advance;
-    params.predicate_offset -= params.predicate_inc_advance;
-  }
-
-  /// The accessor.
-  CUTLASS_DEVICE void set(typename Base::AccessType const& value, int d, int h, int w, int c) {
-    int const imm =
+  /// Stores a single fragment element into memory
+  CUTLASS_DEVICE void store_element(
+      typename Base::AccessType const& value, int d, int h, int w, int c) {
+    int const offset =
         ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(d, h, w, 0);
-    Store<Scalar, TileTraits_::kAccessSize, MemorySpace::kGlobal>::store(
-        value, params.pointer, imm);
+    Store<Scalar,
+          Base::kAccessSize,
+          Base::kMemorySpace,
+          Base::kFragmentElementType,
+          typename Base::FragmentElement,
+          Base::Tile::kW>::store(value, Base::params.pointer, offset);
   }
 
-  /// Test the predicate.
-  CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const {
-    return predicates.at(w) && params.predicate_offset > 0;
+ public:
+  template <typename Fragment>
+  CUTLASS_DEVICE void load_post_increment(Fragment& fragment) {
+    Base::load_post_increment(fragment);
   }
 
-  /// The predicates for the row.
-  cutlass::PredicateVector<Base::Iterations::kW> predicates;
+  template <typename Fragment>
+  CUTLASS_DEVICE void store_post_increment(Fragment& fragment) {
+    Base::store_post_increment(fragment);
+  }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/cutlass/gemm/wmma_gemm_multiply_add.h b/cutlass/gemm/wmma_gemm_multiply_add.h
index 5968350e0..328e43adb 100644
--- a/cutlass/gemm/wmma_gemm_multiply_add.h
+++ b/cutlass/gemm/wmma_gemm_multiply_add.h
@@ -27,9 +27,9 @@
 */
 #pragma once
 
-#include <cutlass/wmma_matrix.h>
+#include "cutlass/wmma_matrix.h"
 #ifdef CUTLASS_USE_WMMA_API
-#include <cutlass/fragment.h>
+#include "cutlass/fragment.h"
 
 namespace cutlass {
 namespace gemm {
@@ -42,15 +42,17 @@ template <MatrixLayout::Kind kLayoutA_,
           typename ScalarB_,
           MatrixLayout::Kind kLayoutC_,
           typename ScalarC_,
-          typename AccumulatorsPerWarp_,
+          typename WarpGemmShape_,
           typename InstructionShape_>
 struct WmmaGemmMultiplyAdd {
   /// The shape of the instruction.
   typedef InstructionShape_ InstructionShape;
   /// The number of threads per warp. That's a dummy configuration.
   typedef Shape<1, InstructionShape_::kH, InstructionShape_::kW> ThreadsPerWarp;
-  /// The dimensions.
-  typedef AccumulatorsPerWarp_ AccumulatorsPerWarp;
+  /// Dimensions of the warp-level GEMM (K-by-N-by-M)
+  typedef WarpGemmShape_ WarpGemmShape;
+  /// Aliased for compatibility. Will be removed in CUTLASS v2.0
+  typedef WarpGemmShape_ AccumulatorsPerWarp;
   /// The type for A.
   typedef ScalarA_ ScalarA;
   /// The type for B.
@@ -102,6 +104,251 @@ struct WmmaGemmMultiplyAdd {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Specialization for WMMA GEMM with binary operands
+template<typename WarpGemmShape_>
+struct WmmaGemmMultiplyAdd <MatrixLayout::kRowMajor,
+                            Vector<bin1_t, 32>,
+                            MatrixLayout::kColumnMajor,
+                            Vector<bin1_t, 32>,
+                            MatrixLayout::kColumnMajor,
+                            int,
+                            WarpGemmShape_,
+                            Shape<128, 8, 8> >{
+  /// The shape of the instruction.
+  typedef Shape<128, 8, 8> InstructionShape;
+  /// The number of threads per warp. That's a dummy configuration.
+  typedef Shape<1, 4, 8> ThreadsPerWarp;
+  /// Dimensions of the warp-level GEMM (K-by-N-by-M)
+  typedef WarpGemmShape_ WarpGemmShape;
+  /// Aliased for compatibility. Will be removed in CUTLASS v2.0
+  typedef WarpGemmShape_ AccumulatorsPerWarp;
+  /// The type for A.
+  typedef Vector<bin1_t, 32> ScalarA;
+  /// The type for B.
+  typedef Vector<bin1_t, 32> ScalarB;
+  /// The type for C and D.
+  typedef int ScalarC;
+  /// The number of iterations.
+  typedef typename ShapeDiv<AccumulatorsPerWarp, InstructionShape>::Shape Iterations;
+
+  /// The element for A.
+  typedef WmmaMatrix<GemmOperand::kA,
+                     MatrixLayout::kRowMajor,
+                     Vector<bin1_t, 32>,
+                     InstructionShape> ElementA;
+  /// The fragment for A.
+  typedef Fragment<ElementA, Iterations::kW> FragmentA;
+
+  /// The element for B.
+  typedef WmmaMatrix<GemmOperand::kB,
+                     MatrixLayout::kColumnMajor,
+                     Vector<bin1_t, 32>,
+                     InstructionShape> ElementB;
+  /// The fragment for B.
+  typedef Fragment<ElementB, Iterations::kH> FragmentB;
+
+  /// The element for C.
+  typedef WmmaMatrix<GemmOperand::kC,
+                     MatrixLayout::kColumnMajor,
+                     int,
+                     InstructionShape> ElementC;
+  /// The fragment for C.
+  typedef Fragment<ElementC, Iterations::kH * Iterations::kW> Accumulators;
+
+  /// Ctor.
+  CUTLASS_DEVICE WmmaGemmMultiplyAdd() {}
+
+  /// Multiply : d = a*b.
+  CUTLASS_DEVICE void multiply_add(FragmentA const& a,
+                                   FragmentB const& b,
+                                   Accumulators const& c,
+                                   Accumulators& d) {
+    for (int j = 0; j < Iterations::kH; ++j) {
+      for (int i = 0; i < Iterations::kW; ++i) {
+        // The input elements.
+        ElementA const& elt_a = a[i];
+        ElementB const& elt_b = b[j];
+        ElementC const& elt_c = c[j * Iterations::kW + i];
+
+        // The output element.
+        ElementC& elt_d = d[j * Iterations::kW + i];
+
+        // The wmma instruction.
+        nvcuda::wmma::bmma_sync(elt_d,
+                                elt_a,
+                                elt_b,
+                                elt_c,
+                                nvcuda::wmma::experimental::bmmaBitOpXOR,
+                                nvcuda::wmma::experimental::bmmaAccumulateOpPOPC);
+      }
+    }
+  }
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Specialization for WMMA GEMM with signed 4-bit integer operands
+template<typename WarpGemmShape_>
+struct WmmaGemmMultiplyAdd <MatrixLayout::kRowMajor,
+                            Vector<int4_t, 8>,
+                            MatrixLayout::kColumnMajor,
+                            Vector<int4_t, 8>,
+                            MatrixLayout::kColumnMajor,
+                            int,
+                            WarpGemmShape_,
+                            Shape<32, 8, 8> >{
+  /// The shape of the instruction.
+  typedef Shape<32, 8, 8> InstructionShape;
+  /// The number of threads per warp. That's a dummy configuration.
+  typedef Shape<1, 4, 8> ThreadsPerWarp;
+  /// Dimensions of the warp-level GEMM (K-by-N-by-M)
+  typedef WarpGemmShape_ WarpGemmShape;
+  /// Aliased for compatibility. Will be removed in CUTLASS v2.0
+  typedef WarpGemmShape_ AccumulatorsPerWarp;
+  /// The type for A.
+  typedef Vector<int4_t, 8> ScalarA;
+  /// The type for B.
+  typedef Vector<int4_t, 8> ScalarB;
+  /// The type for C and D.
+  typedef int ScalarC;
+  /// The number of iterations.
+  typedef typename ShapeDiv<AccumulatorsPerWarp, InstructionShape>::Shape Iterations;
+
+  /// The element for A.
+  typedef WmmaMatrix<GemmOperand::kA,
+                     MatrixLayout::kRowMajor,
+                     Vector<int4_t, 8>,
+                     InstructionShape> ElementA;
+  /// The fragment for A.
+  typedef Fragment<ElementA, Iterations::kW> FragmentA;
+
+  /// The element for B.
+  typedef WmmaMatrix<GemmOperand::kB,
+                     MatrixLayout::kColumnMajor,
+                     Vector<int4_t, 8>,
+                     InstructionShape> ElementB;
+  /// The fragment for B.
+  typedef Fragment<ElementB, Iterations::kH> FragmentB;
+
+  /// The element for C.
+  typedef WmmaMatrix<GemmOperand::kC,
+                     MatrixLayout::kColumnMajor,
+                     int,
+                     InstructionShape> ElementC;
+  /// The fragment for C.
+  typedef Fragment<ElementC, Iterations::kH * Iterations::kW> Accumulators;
+
+  /// Ctor.
+  CUTLASS_DEVICE WmmaGemmMultiplyAdd() {}
+
+  /// Multiply : d = a*b.
+  CUTLASS_DEVICE void multiply_add(FragmentA const& a,
+                                   FragmentB const& b,
+                                   Accumulators const& c,
+                                   Accumulators& d) {
+    for (int j = 0; j < Iterations::kH; ++j) {
+      for (int i = 0; i < Iterations::kW; ++i) {
+        // The input elements.
+        ElementA const& elt_a = a[i];
+        ElementB const& elt_b = b[j];
+        ElementC const& elt_c = c[j * Iterations::kW + i];
+
+        // The output element.
+        ElementC& elt_d = d[j * Iterations::kW + i];
+
+        // The wmma instruction.
+        nvcuda::wmma::mma_sync(elt_d, elt_a, elt_b, elt_c);
+      }
+    }
+  }
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Specialization for WMMA GEMM with unsigned 4-bit integer operands
+template<typename WarpGemmShape_>
+struct WmmaGemmMultiplyAdd <MatrixLayout::kRowMajor,
+                            Vector<uint4_t, 8>,
+                            MatrixLayout::kColumnMajor,
+                            Vector<uint4_t, 8>,
+                            MatrixLayout::kColumnMajor,
+                            int,
+                            WarpGemmShape_,
+                            Shape<32, 8, 8> >{
+  /// The shape of the instruction.
+  typedef Shape<32, 8, 8> InstructionShape;
+  /// The number of threads per warp. That's a dummy configuration.
+  typedef Shape<1, 4, 8> ThreadsPerWarp;
+  /// Dimensions of the warp-level GEMM (K-by-N-by-M)
+  typedef WarpGemmShape_ WarpGemmShape;
+  /// Aliased for compatibility. Will be removed in CUTLASS v2.0
+  typedef WarpGemmShape_ AccumulatorsPerWarp;
+  /// The type for A.
+  typedef Vector<uint4_t, 8> ScalarA;
+  /// The type for B.
+  typedef Vector<uint4_t, 8> ScalarB;
+  /// The type for C and D.
+  typedef int ScalarC;
+  /// The number of iterations.
+  typedef typename ShapeDiv<AccumulatorsPerWarp, InstructionShape>::Shape Iterations;
+
+  /// The element for A.
+  typedef WmmaMatrix<GemmOperand::kA,
+                     MatrixLayout::kRowMajor,
+                     Vector<uint4_t, 8>,
+                     InstructionShape> ElementA;
+  /// The fragment for A.
+  typedef Fragment<ElementA, Iterations::kW> FragmentA;
+
+  /// The element for B.
+  typedef WmmaMatrix<GemmOperand::kB,
+                     MatrixLayout::kColumnMajor,
+                     Vector<uint4_t, 8>,
+                     InstructionShape> ElementB;
+  /// The fragment for B.
+  typedef Fragment<ElementB, Iterations::kH> FragmentB;
+
+  /// The element for C.
+  typedef WmmaMatrix<GemmOperand::kC,
+                     MatrixLayout::kColumnMajor,
+                     int,
+                     InstructionShape> ElementC;
+  /// The fragment for C.
+  typedef Fragment<ElementC, Iterations::kH * Iterations::kW> Accumulators;
+
+  /// Ctor.
+  CUTLASS_DEVICE WmmaGemmMultiplyAdd() {}
+
+  /// Multiply : d = a*b.
+  CUTLASS_DEVICE void multiply_add(FragmentA const& a,
+                                   FragmentB const& b,
+                                   Accumulators const& c,
+                                   Accumulators& d) {
+    for (int j = 0; j < Iterations::kH; ++j) {
+      for (int i = 0; i < Iterations::kW; ++i) {
+        // The input elements.
+        ElementA const& elt_a = a[i];
+        ElementB const& elt_b = b[j];
+        ElementC const& elt_c = c[j * Iterations::kW + i];
+
+        // The output element.
+        ElementC& elt_d = d[j * Iterations::kW + i];
+
+        // The wmma instruction.
+        nvcuda::wmma::mma_sync(elt_d, elt_a, elt_b, elt_c);
+      }
+    }
+  }
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 }  // namespace gemm
 }  // namespace cutlass
 
diff --git a/cutlass/gemm/wmma_gemm_shared_tile.h b/cutlass/gemm/wmma_gemm_shared_tile.h
index 7d15b260f..1a90e2f10 100644
--- a/cutlass/gemm/wmma_gemm_shared_tile.h
+++ b/cutlass/gemm/wmma_gemm_shared_tile.h
@@ -28,18 +28,15 @@
 */
 #pragma once
 
-#include <cutlass/wmma_matrix.h>
+#include "cutlass/wmma_matrix.h"
 #ifdef CUTLASS_USE_WMMA_API
 
-#include <cutlass/gemm/gemm_operand.h>
-#include <cutlass/reshape_tile.h>
+#include "cutlass/gemm/gemm_operand.h"
+#include "cutlass/reshape_tile.h"
 
 namespace cutlass {
 namespace gemm {
 
-template <class>
-struct Debug {};
-
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 template <MatrixLayout::Kind kLayout_,
diff --git a/cutlass/gemm/wmma_gemm_traits.h b/cutlass/gemm/wmma_gemm_traits.h
index 790120163..65ffb50bf 100644
--- a/cutlass/gemm/wmma_gemm_traits.h
+++ b/cutlass/gemm/wmma_gemm_traits.h
@@ -27,19 +27,19 @@
 */
 #pragma once
 
-#include <cutlass/wmma_matrix.h>
+#include "cutlass/wmma_matrix.h"
 #ifdef CUTLASS_USE_WMMA_API
 
-#include <cutlass/convert.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/gemm_epilogue.h>
-#include <cutlass/gemm/gemm_epilogue_traits.h>
-#include <cutlass/gemm/gemm_global_tile.h>
-#include <cutlass/gemm/gemm_shared_tile.h>
-#include <cutlass/gemm/gemm_traits.h>
-#include <cutlass/gemm/wmma_gemm_epilogue_traits.h>
-#include <cutlass/gemm/wmma_gemm_global_tile.h>
-#include <cutlass/gemm/wmma_gemm_multiply_add.h>
+#include "cutlass/convert.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/gemm_epilogue.h"
+#include "cutlass/gemm/gemm_epilogue_traits.h"
+#include "cutlass/gemm/gemm_global_tile.h"
+#include "cutlass/gemm/gemm_shared_tile.h"
+#include "cutlass/gemm/gemm_traits.h"
+#include "cutlass/gemm/wmma_gemm_epilogue_traits.h"
+#include "cutlass/gemm/wmma_gemm_global_tile.h"
+#include "cutlass/gemm/wmma_gemm_multiply_add.h"
 
 namespace cutlass {
 namespace gemm {
@@ -53,12 +53,16 @@ template <
     MatrixLayout::Kind kLayoutB_,
     /// The tile size for the GEMM KxNxM.
     typename OutputTile_,
+    /// The input type.
+    typename ScalarA_,
+    /// The input type.
+    typename ScalarB_,
     /// The output type.
     typename ScalarC_,
     /// The accumulator type.
     typename Accumulator_,
-    /// The number of accumulators per warp.
-    typename AccumulatorsPerWarp_,
+    /// Tile size for warp-level GEMM (K-by-N-by-M)
+    typename WarpGemmShape_,
     /// The shape of the WMMA instruction.
     typename InstructionShape_,
     /// The number of scalars per LDG for A.
@@ -67,9 +71,9 @@ template <
     int kScalarsPerLdgB_>
 struct WmmaGemmConfig : public GemmConfig<
                             /// The scalar type for A.
-                            half,
+                            ScalarA_,
                             /// The scalar type for B.
-                            half,
+                            ScalarB_,
                             /// The scalar type for C.
                             ScalarC_,
                             /// The scalar type for D.
@@ -78,12 +82,12 @@ struct WmmaGemmConfig : public GemmConfig<
                             OutputTile_,
                             /// The functor to do the math in the main loop.
                             WmmaGemmMultiplyAdd<kLayoutA_,
-                                                half,
+                                                ScalarA_,
                                                 kLayoutB_,
-                                                half,
+                                                ScalarB_,
                                                 MatrixLayout::kColumnMajor,
                                                 Accumulator_,
-                                                AccumulatorsPerWarp_,
+                                                WarpGemmShape_,
                                                 InstructionShape_>,
                             /// The number of scalars per LDG for A.
                             kScalarsPerLdgA_,
@@ -100,21 +104,29 @@ struct WmmaGemmConfig : public GemmConfig<
                             /// The number of scalars per LDG for C and STG for D.
                             16 / sizeof(ScalarC_),
                             /// The number of scalars per STS for D.
-                            16 / sizeof(ScalarC_),
+                            16 / sizeof(Accumulator_),
                             /// The number of scalars per LDS for D.
-                            16 / sizeof(ScalarC_),
+                            16 / sizeof(Accumulator_),
                             /// The number of stages in shared memory.
-                            1> {};
+                            1,
+                            /// If true, residue is computed in mainloop. If false, separate loops are instantiated.
+                            false,
+                            /// Is residue performed in prologue?
+                            true,
+                            /// If true, kernel is launched with CUDA launch bounds specified
+                            false> {};
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <enum MatrixLayout::Kind kLayout_, typename GemmConfig_>
+template <enum MatrixLayout::Kind kLayout_,
+          typename GemmConfig_,
+          typename ScalarA_>
 struct WmmaGemmTileTraitsHelperA {};
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename GemmConfig_>
-struct WmmaGemmTileTraitsHelperA<MatrixLayout::kColumnMajor, GemmConfig_>
+template <typename GemmConfig_, typename ScalarA_>
+struct WmmaGemmTileTraitsHelperA<MatrixLayout::kColumnMajor, GemmConfig_, ScalarA_>
     : public GemmTileTraitsHelperA<MatrixLayout::kColumnMajor, GemmConfig_> {
   /// The base config.
   typedef GemmTileTraitsHelperA<MatrixLayout::kColumnMajor, GemmConfig_> Base;
@@ -173,8 +185,8 @@ struct WmmaGemmTileTraitsHelperA<MatrixLayout::kColumnMajor, GemmConfig_>
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename GemmConfig_>
-struct WmmaGemmTileTraitsHelperA<MatrixLayout::kRowMajor, GemmConfig_> {
+template <typename GemmConfig_, typename ScalarA_>
+struct WmmaGemmTileTraitsHelperA<MatrixLayout::kRowMajor, GemmConfig_, ScalarA_> {
   /// The layout.
   static MatrixLayout::Kind const kLayout = MatrixLayout::kRowMajor;
 
@@ -251,13 +263,276 @@ struct WmmaGemmTileTraitsHelperA<MatrixLayout::kRowMajor, GemmConfig_> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <enum MatrixLayout::Kind kLayout_, typename GemmConfig_>
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Specialization for WMMA GEMM with binary operands
+template <typename GemmConfig_>
+struct WmmaGemmTileTraitsHelperA<MatrixLayout::kRowMajor, GemmConfig_, Vector<bin1_t, 32> > {
+  /// The layout.
+  static MatrixLayout::Kind const kLayout = MatrixLayout::kRowMajor;
+
+  /// The input scalar.
+  typedef typename GemmConfig_::ScalarA Scalar;
+  /// The scalar stored in shared memory.
+  typedef typename GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar;
+
+  /// GemmConfig_::OutputTile::kD is in number of 'bits'. TileTraits expects number of 'Scalar'.
+  /// Divide by 'kBitsPerScalar' to get the number in 'Scalar'.
+  static int const kBitsPerScalar = sizeof(Scalar) * 8;
+
+  /// WMMA matrix
+  typedef WmmaMatrix<GemmOperand::kA,
+                     MatrixLayout::kRowMajor,
+                     Vector<bin1_t, 32>,
+                     typename GemmConfig_::InstructionShape>
+      WmmaMatrix;
+
+  /// The traits class to build the iterator to load data from global memory for A^T.
+  typedef GemmGlobalTileTraits<
+      // That's A.
+      GemmOperand::kA,
+      // A is row-major.
+      MatrixLayout::kRowMajor,
+      // The pointer is float const.
+      Scalar const,
+      // The tile has size KxM in GEMM's terminology.
+      Shape<1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD / kBitsPerScalar>,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      Shape<1,
+            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kBitsPerScalar),
+            GemmConfig_::OutputTile::kD / kBitsPerScalar>,
+      // The number of scalars per LDG (LDG.32 or LDG.128, etc).
+      GemmConfig_::kScalarsPerLdgA / kBitsPerScalar>
+      GlobalTileTraits;
+
+  /// The skew.
+  static int const kSkew = 16 / sizeof(MultiplyAddScalar);
+  /// The tile.
+  typedef Shape<GemmConfig_::kStages,
+                GemmConfig_::OutputTile::kW,
+                GemmConfig_::OutputTile::kD / kBitsPerScalar + kSkew>
+      Tile;
+
+  /// The traits class to build the iterator to store data to shared memory for A^N.
+  typedef GemmSharedStoreTileAbTraits<
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile has size KxM in GEMM's terminology.
+      Tile,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      typename GlobalTileTraits::Threads,
+      // The number of scalars per STS (STS.32 or STS.128, etc).
+      GemmConfig_::kScalarsPerStsA / kBitsPerScalar>
+      SharedStoreTileTraits;
+
+  /// The number of elements loaded in one LDG.
+  static int const kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;
+  /// The traits class to build the iterator to load from shared memory for A.
+  typedef WmmaGemmSharedLoadTileATraits<
+      // The layout of the matrix.
+      MatrixLayout::kRowMajor,
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile in shared memory.
+      Tile,
+      // The number of warps.
+      typename GemmConfig_::Warps,
+      // The strides between warps.
+      GemmConfig_::InstructionShape::kW * Tile::kW,
+      // The number of iterations to load the data.
+      Shape<1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW>,
+      // The stride between iterations.
+      Shape<GemmConfig_::InstructionShape::kD / kBitsPerScalar, 0, kScalarsPerW * Tile::kW>,
+      // The shape of the instruction.
+      typename GemmConfig_::InstructionShape>
+      SharedLoadTileTraits;
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Specialization for WMMA GEMM with unsigned 4-bit integer operands
+template <typename GemmConfig_>
+struct WmmaGemmTileTraitsHelperA<MatrixLayout::kRowMajor, GemmConfig_, Vector<uint4_t, 8> > {
+  /// The layout.
+  static MatrixLayout::Kind const kLayout = MatrixLayout::kRowMajor;
+
+  /// The input scalar.
+  typedef typename GemmConfig_::ScalarA Scalar;
+  /// The scalar stored in shared memory.
+  typedef typename GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar;
+
+  /// GemmConfig_::OutputTile::kD is in number of 'int4'. TileTraits expects number of 'Scalar'.
+  /// Divide by 'kInt4PerScalar' to get the number in 'Scalar'.
+  static int const kInt4PerScalar = sizeof(Scalar) * 2;
+
+  /// WMMA matrix
+  typedef WmmaMatrix<GemmOperand::kA,
+                     MatrixLayout::kRowMajor,
+                     Vector<uint4_t, 8>,
+                     typename GemmConfig_::InstructionShape>
+      WmmaMatrix;
+
+  /// The traits class to build the iterator to load data from global memory for A^T.
+  typedef GemmGlobalTileTraits<
+      // That's A.
+      GemmOperand::kA,
+      // A is row-major.
+      MatrixLayout::kRowMajor,
+      // The pointer is float const.
+      Scalar const,
+      // The tile has size KxM in GEMM's terminology.
+      Shape<1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD / kInt4PerScalar>,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      Shape<1,
+            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kInt4PerScalar),
+            GemmConfig_::OutputTile::kD / kInt4PerScalar>,
+      // The number of scalars per LDG (LDG.32 or LDG.128, etc).
+      GemmConfig_::kScalarsPerLdgA / kInt4PerScalar>
+      GlobalTileTraits;
+
+  /// The skew.
+  static int const kSkew = 16 / sizeof(MultiplyAddScalar);
+  /// The tile.
+  typedef Shape<GemmConfig_::kStages,
+                GemmConfig_::OutputTile::kW,
+                GemmConfig_::OutputTile::kD / kInt4PerScalar + kSkew>
+      Tile;
+
+  /// The traits class to build the iterator to store data to shared memory for A^N.
+  typedef GemmSharedStoreTileAbTraits<
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile has size KxM in GEMM's terminology.
+      Tile,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      typename GlobalTileTraits::Threads,
+      // The number of scalars per STS (STS.32 or STS.128, etc).
+      GemmConfig_::kScalarsPerStsA / kInt4PerScalar>
+      SharedStoreTileTraits;
+
+  /// The number of elements loaded in one LDG.
+  static int const kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;
+  /// The traits class to build the iterator to load from shared memory for A.
+  typedef WmmaGemmSharedLoadTileATraits<
+      // The layout of the matrix.
+      MatrixLayout::kRowMajor,
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile in shared memory.
+      Tile,
+      // The number of warps.
+      typename GemmConfig_::Warps,
+      // The strides between warps.
+      GemmConfig_::InstructionShape::kW * Tile::kW,
+      // The number of iterations to load the data.
+      Shape<1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW>,
+      // The stride between iterations.
+      Shape<GemmConfig_::InstructionShape::kD / kInt4PerScalar, 0, kScalarsPerW * Tile::kW>,
+      // The shape of the instruction.
+      typename GemmConfig_::InstructionShape>
+      SharedLoadTileTraits;
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Specialization for WMMA GEMM with signed 4-bit integer operands
+template <typename GemmConfig_>
+struct WmmaGemmTileTraitsHelperA<MatrixLayout::kRowMajor, GemmConfig_, Vector<int4_t, 8> > {
+  /// The layout.
+  static MatrixLayout::Kind const kLayout = MatrixLayout::kRowMajor;
+
+  /// The input scalar.
+  typedef typename GemmConfig_::ScalarA Scalar;
+  /// The scalar stored in shared memory.
+  typedef typename GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar;
+
+  /// GemmConfig_::OutputTile::kD is in number of 'int4'. TileTraits expects number of 'Scalar'.
+  /// Divide by 'kInt4PerScalar' to get the number in 'Scalar'.
+  static int const kInt4PerScalar = sizeof(Scalar) * 2;
+
+  /// WMMA matrix
+  typedef WmmaMatrix<GemmOperand::kA,
+                     MatrixLayout::kRowMajor,
+                     Vector<int4_t, 8>,
+                     typename GemmConfig_::InstructionShape>
+      WmmaMatrix;
+
+  /// The traits class to build the iterator to load data from global memory for A^T.
+  typedef GemmGlobalTileTraits<
+      // That's A.
+      GemmOperand::kA,
+      // A is row-major.
+      MatrixLayout::kRowMajor,
+      // The pointer is float const.
+      Scalar const,
+      // The tile has size KxM in GEMM's terminology.
+      Shape<1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD / kInt4PerScalar>,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      Shape<1,
+            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kInt4PerScalar),
+            GemmConfig_::OutputTile::kD / kInt4PerScalar>,
+      // The number of scalars per LDG (LDG.32 or LDG.128, etc).
+      GemmConfig_::kScalarsPerLdgA / kInt4PerScalar>
+      GlobalTileTraits;
+
+  /// The skew.
+  static int const kSkew = 16 / sizeof(MultiplyAddScalar);
+  /// The tile.
+  typedef Shape<GemmConfig_::kStages,
+                GemmConfig_::OutputTile::kW,
+                GemmConfig_::OutputTile::kD / kInt4PerScalar + kSkew>
+      Tile;
+
+  /// The traits class to build the iterator to store data to shared memory for A^N.
+  typedef GemmSharedStoreTileAbTraits<
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile has size KxM in GEMM's terminology.
+      Tile,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      typename GlobalTileTraits::Threads,
+      // The number of scalars per STS (STS.32 or STS.128, etc).
+      GemmConfig_::kScalarsPerStsA / kInt4PerScalar>
+      SharedStoreTileTraits;
+
+  /// The number of elements loaded in one LDG.
+  static int const kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;
+  /// The traits class to build the iterator to load from shared memory for A.
+  typedef WmmaGemmSharedLoadTileATraits<
+      // The layout of the matrix.
+      MatrixLayout::kRowMajor,
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile in shared memory.
+      Tile,
+      // The number of warps.
+      typename GemmConfig_::Warps,
+      // The strides between warps.
+      GemmConfig_::InstructionShape::kW * Tile::kW,
+      // The number of iterations to load the data.
+      Shape<1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW>,
+      // The stride between iterations.
+      Shape<GemmConfig_::InstructionShape::kD / kInt4PerScalar, 0, kScalarsPerW * Tile::kW>,
+      // The shape of the instruction.
+      typename GemmConfig_::InstructionShape>
+      SharedLoadTileTraits;
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <enum MatrixLayout::Kind kLayout_,
+          typename GemmConfig_,
+          typename ScalarB_>
 struct WmmaGemmTileTraitsHelperB {};
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename GemmConfig_>
-struct WmmaGemmTileTraitsHelperB<MatrixLayout::kRowMajor, GemmConfig_>
+template <typename GemmConfig_, typename ScalarB_>
+struct WmmaGemmTileTraitsHelperB<MatrixLayout::kRowMajor, GemmConfig_, ScalarB_>
     : public GemmTileTraitsHelperB<MatrixLayout::kRowMajor, GemmConfig_> {
   /// The base config.
   typedef GemmTileTraitsHelperB<MatrixLayout::kRowMajor, GemmConfig_> Base;
@@ -316,8 +591,8 @@ struct WmmaGemmTileTraitsHelperB<MatrixLayout::kRowMajor, GemmConfig_>
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename GemmConfig_>
-struct WmmaGemmTileTraitsHelperB<MatrixLayout::kColumnMajor, GemmConfig_> {
+template <typename GemmConfig_, typename ScalarB_>
+struct WmmaGemmTileTraitsHelperB<MatrixLayout::kColumnMajor, GemmConfig_, ScalarB_> {
   /// The layout.
   static MatrixLayout::Kind const kLayout = MatrixLayout::kColumnMajor;
 
@@ -394,6 +669,267 @@ struct WmmaGemmTileTraitsHelperB<MatrixLayout::kColumnMajor, GemmConfig_> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Specialization for WMMA GEMM with binary operands
+template <typename GemmConfig_>
+struct WmmaGemmTileTraitsHelperB<MatrixLayout::kColumnMajor, GemmConfig_, Vector<bin1_t, 32> > {
+  /// The layout.
+  static MatrixLayout::Kind const kLayout = MatrixLayout::kColumnMajor;
+
+  /// The input scalar.
+  typedef typename GemmConfig_::ScalarB Scalar;
+  /// The scalar stored in shared memory.
+  typedef typename GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar;
+
+  /// GemmConfig_::OutputTile::kD is in number of 'bits'. TileTraits expects number of 'Scalar'.
+  /// Divide by 'kBitsPerScalar' to get the number in 'Scalar'.
+  static int const kBitsPerScalar = sizeof(Scalar) * 8;
+
+  /// WMMA matrix
+  typedef WmmaMatrix<GemmOperand::kB,
+                     MatrixLayout::kColumnMajor,
+                     Vector<bin1_t, 32>,
+                     typename GemmConfig_::InstructionShape>
+      WmmaMatrix;
+
+  /// The traits class to build the iterator to load data from global memory for B^N.
+  typedef GemmGlobalTileTraits<
+      // That's B.
+      GemmOperand::kB,
+      // A is row-major.
+      MatrixLayout::kColumnMajor,
+      // The pointer is float const.
+      Scalar const,
+      // The tile has size KxM in GEMM's terminology.
+      Shape<1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD / kBitsPerScalar>,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      Shape<1,
+            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kBitsPerScalar),
+            GemmConfig_::OutputTile::kD / kBitsPerScalar>,
+      // The number of scalars per LDG (LDG.32 or LDG.128, etc).
+      GemmConfig_::kScalarsPerLdgB / kBitsPerScalar>
+      GlobalTileTraits;
+
+  /// The skew.
+  static int const kSkew = 16 / sizeof(MultiplyAddScalar);
+  /// The tile.
+  typedef Shape<GemmConfig_::kStages,
+                GemmConfig_::OutputTile::kH,
+                GemmConfig_::OutputTile::kD / kBitsPerScalar + kSkew>
+      Tile;
+
+  /// The traits class to build the iterator to store data to shared memory for B^N.
+  typedef GemmSharedStoreTileAbTraits<
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile has size KxM in GEMM's terminology.
+      Tile,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      typename GlobalTileTraits::Threads,
+      // The number of scalars per STS (STS.32 or STS.128, etc).
+      GemmConfig_::kScalarsPerStsB / kBitsPerScalar>
+      SharedStoreTileTraits;
+
+  /// The number of elements loaded in one LDG.
+  static int const kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;
+  /// The traits class to build the iterator to load from shared memory for B.
+  typedef WmmaGemmSharedLoadTileBTraits<
+      // The layout of the matrix.
+      MatrixLayout::kColumnMajor,
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile in shared memory.
+      Tile,
+      // The number of warps.
+      typename GemmConfig_::Warps,
+      // The strides between warps.
+      GemmConfig_::InstructionShape::kH * Tile::kW,
+      // The number of iterations to load the data.
+      Shape<1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW>,
+      // The stride between iterations.
+      Shape<GemmConfig_::InstructionShape::kD / kBitsPerScalar, 0, kScalarsPerW * Tile::kW>,
+      // The shape of the instruction.
+      typename GemmConfig_::InstructionShape>
+      SharedLoadTileTraits;
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Specialization for WMMA GEMM with unsigned 4-bit integer operands
+template <typename GemmConfig_>
+struct WmmaGemmTileTraitsHelperB<MatrixLayout::kColumnMajor, GemmConfig_, Vector<uint4_t, 8> > {
+  /// The layout.
+  static MatrixLayout::Kind const kLayout = MatrixLayout::kColumnMajor;
+
+  /// The input scalar.
+  typedef typename GemmConfig_::ScalarB Scalar;
+  /// The scalar stored in shared memory.
+  typedef typename GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar;
+
+  /// GemmConfig_::OutputTile::kD is in number of 'int4'. TileTraits expects number of 'Scalar'.
+  /// Divide by 'kInt4PerScalar' to get the number in 'Scalar'.
+  static int const kInt4PerScalar = sizeof(Scalar) * 2;
+
+  /// WMMA matrix
+  typedef WmmaMatrix<GemmOperand::kB,
+                     MatrixLayout::kColumnMajor,
+                     Vector<uint4_t, 8>,
+                     typename GemmConfig_::InstructionShape>
+      WmmaMatrix;
+
+  /// The traits class to build the iterator to load data from global memory for B^N.
+  typedef GemmGlobalTileTraits<
+      // That's B.
+      GemmOperand::kB,
+      // A is row-major.
+      MatrixLayout::kColumnMajor,
+      // The pointer is float const.
+      Scalar const,
+      // The tile has size KxM in GEMM's terminology.
+      Shape<1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD / kInt4PerScalar>,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      Shape<1,
+            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kInt4PerScalar),
+            GemmConfig_::OutputTile::kD / kInt4PerScalar>,
+      // The number of scalars per LDG (LDG.32 or LDG.128, etc).
+      GemmConfig_::kScalarsPerLdgB / kInt4PerScalar>
+      GlobalTileTraits;
+
+  /// The skew.
+  static int const kSkew = 16 / sizeof(MultiplyAddScalar);
+  /// The tile.
+  typedef Shape<GemmConfig_::kStages,
+                GemmConfig_::OutputTile::kH,
+                GemmConfig_::OutputTile::kD / kInt4PerScalar + kSkew>
+      Tile;
+
+  /// The traits class to build the iterator to store data to shared memory for B^N.
+  typedef GemmSharedStoreTileAbTraits<
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile has size KxM in GEMM's terminology.
+      Tile,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      typename GlobalTileTraits::Threads,
+      // The number of scalars per STS (STS.32 or STS.128, etc).
+      GemmConfig_::kScalarsPerStsB / kInt4PerScalar>
+      SharedStoreTileTraits;
+
+  /// The number of elements loaded in one LDG.
+  static int const kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;
+  /// The traits class to build the iterator to load from shared memory for B.
+  typedef WmmaGemmSharedLoadTileBTraits<
+      // The layout of the matrix.
+      MatrixLayout::kColumnMajor,
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile in shared memory.
+      Tile,
+      // The number of warps.
+      typename GemmConfig_::Warps,
+      // The strides between warps.
+      GemmConfig_::InstructionShape::kH * Tile::kW,
+      // The number of iterations to load the data.
+      Shape<1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW>,
+      // The stride between iterations.
+      Shape<GemmConfig_::InstructionShape::kD / kInt4PerScalar, 0, kScalarsPerW * Tile::kW>,
+      // The shape of the instruction.
+      typename GemmConfig_::InstructionShape>
+      SharedLoadTileTraits;
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Specialization for WMMA GEMM with signed 4-bit integer operands
+template <typename GemmConfig_>
+struct WmmaGemmTileTraitsHelperB<MatrixLayout::kColumnMajor, GemmConfig_, Vector<int4_t, 8> > {
+  /// The layout.
+  static MatrixLayout::Kind const kLayout = MatrixLayout::kColumnMajor;
+
+  /// The input scalar.
+  typedef typename GemmConfig_::ScalarB Scalar;
+  /// The scalar stored in shared memory.
+  typedef typename GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar;
+
+  /// GemmConfig_::OutputTile::kD is in number of 'int4'. TileTraits expects number of 'Scalar'.
+  /// Divide by 'kInt4PerScalar' to get the number in 'Scalar'.
+  static int const kInt4PerScalar = sizeof(Scalar) * 2;
+
+  /// WMMA matrix
+  typedef WmmaMatrix<GemmOperand::kB,
+                     MatrixLayout::kColumnMajor,
+                     Vector<int4_t, 8>,
+                     typename GemmConfig_::InstructionShape>
+      WmmaMatrix;
+
+  /// The traits class to build the iterator to load data from global memory for B^N.
+  typedef GemmGlobalTileTraits<
+      // That's B.
+      GemmOperand::kB,
+      // A is row-major.
+      MatrixLayout::kColumnMajor,
+      // The pointer is float const.
+      Scalar const,
+      // The tile has size KxM in GEMM's terminology.
+      Shape<1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD / kInt4PerScalar>,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      Shape<1,
+            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kInt4PerScalar),
+            GemmConfig_::OutputTile::kD / kInt4PerScalar>,
+      // The number of scalars per LDG (LDG.32 or LDG.128, etc).
+      GemmConfig_::kScalarsPerLdgB / kInt4PerScalar>
+      GlobalTileTraits;
+
+  /// The skew.
+  static int const kSkew = 16 / sizeof(MultiplyAddScalar);
+  /// The tile.
+  typedef Shape<GemmConfig_::kStages,
+                GemmConfig_::OutputTile::kH,
+                GemmConfig_::OutputTile::kD / kInt4PerScalar + kSkew>
+      Tile;
+
+  /// The traits class to build the iterator to store data to shared memory for B^N.
+  typedef GemmSharedStoreTileAbTraits<
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile has size KxM in GEMM's terminology.
+      Tile,
+      // The threads are distributed as warps x 32 (the traits may reorganize).
+      typename GlobalTileTraits::Threads,
+      // The number of scalars per STS (STS.32 or STS.128, etc).
+      GemmConfig_::kScalarsPerStsB / kInt4PerScalar>
+      SharedStoreTileTraits;
+
+  /// The number of elements loaded in one LDG.
+  static int const kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;
+  /// The traits class to build the iterator to load from shared memory for B.
+  typedef WmmaGemmSharedLoadTileBTraits<
+      // The layout of the matrix.
+      MatrixLayout::kColumnMajor,
+      // The pointer.
+      MultiplyAddScalar,
+      // The tile in shared memory.
+      Tile,
+      // The number of warps.
+      typename GemmConfig_::Warps,
+      // The strides between warps.
+      GemmConfig_::InstructionShape::kH * Tile::kW,
+      // The number of iterations to load the data.
+      Shape<1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW>,
+      // The stride between iterations.
+      Shape<GemmConfig_::InstructionShape::kD / kInt4PerScalar, 0, kScalarsPerW * Tile::kW>,
+      // The shape of the instruction.
+      typename GemmConfig_::InstructionShape>
+      SharedLoadTileTraits;
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 template <
     /// The layout for A.
     MatrixLayout::Kind kLayoutA_,
@@ -401,14 +937,18 @@ template <
     MatrixLayout::Kind kLayoutB_,
     /// The output tile.
     typename OutputTile_,
+    /// The input type.
+    typename ScalarA_,
+    /// The input type.
+    typename ScalarB_,
     /// The output type.
     typename ScalarC_,
     /// The accumulator type.
     typename Accumulator_,
     /// The functor to do the math in the epilogue.
     typename EpilogueFunctor_,
-    /// The number of accumulators per warp.
-    typename AccumulatorsPerWarp_,
+    /// Tile size for warp-level GEMM (K-by-N-by-M)
+    typename WarpGemmShape_,
     /// The shape of the WMMA instruction.
     typename InstructionShape_,
     /// The number of halfs loaded in one LDG for A.
@@ -422,18 +962,20 @@ struct WmmaGemmTraitsHelper {
   typedef WmmaGemmConfig<kLayoutA_,
                          kLayoutB_,
                          OutputTile_,
+                         ScalarA_,
+                         ScalarB_,
                          ScalarC_,
                          Accumulator_,
-                         AccumulatorsPerWarp_,
+                         WarpGemmShape_,
                          InstructionShape_,
                          kScalarsPerLdgA_,
                          kScalarsPerLdgB_>
       GemmConfig;
 
   /// The GEMM config for A.
-  typedef WmmaGemmTileTraitsHelperA<kLayoutA_, GemmConfig> GemmTileTraitsHelperA;
+  typedef WmmaGemmTileTraitsHelperA<kLayoutA_, GemmConfig, ScalarA_> GemmTileTraitsHelperA;
   /// The GEMM config for B.
-  typedef WmmaGemmTileTraitsHelperB<kLayoutB_, GemmConfig> GemmTileTraitsHelperB;
+  typedef WmmaGemmTileTraitsHelperB<kLayoutB_, GemmConfig, ScalarB_> GemmTileTraitsHelperB;
 
   /// The iterator to load A from global memory.
   typedef GemmGlobalIteratorAb<typename GemmTileTraitsHelperA::GlobalTileTraits, Index_>
@@ -447,7 +989,10 @@ struct WmmaGemmTraitsHelper {
                             MemorySpace::kShared>
       SharedStoreIteratorA;
   /// The stream to load A from global memory to shared memory.
-  typedef GlobalLoadStream<GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA>
+  typedef GlobalLoadStream<GemmOperand::kA,
+                              GlobalLoadIteratorA,
+                              SharedStoreIteratorA,
+                              GlobalTransformerA>
       GlobalLoadStreamA;
 
   /// The iterator to load B from global memory.
@@ -462,7 +1007,10 @@ struct WmmaGemmTraitsHelper {
                             MemorySpace::kShared>
       SharedStoreIteratorB;
   /// The stream to load B from global memory to shared memory.
-  typedef GlobalLoadStream<GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB>
+  typedef GlobalLoadStream<GemmOperand::kB,
+                              GlobalLoadIteratorB,
+                              SharedStoreIteratorB,
+                              GlobalTransformerB>
       GlobalLoadStreamB;
 
   /// The iterator to load A from shared memory.
@@ -472,7 +1020,7 @@ struct WmmaGemmTraitsHelper {
                            MemorySpace::kShared,
                            Index_,
                            typename GemmTileTraitsHelperA::WmmaMatrix,
-                           IteratorFragment::kWmmaMatrix>
+                           FragmentElementType::kWmmaMatrix>
       SharedLoadIteratorA;
   /// The stream to load A from shared memory.
   typedef SharedLoadStream<SharedLoadIteratorA> SharedLoadStreamA;
@@ -483,7 +1031,7 @@ struct WmmaGemmTraitsHelper {
                            MemorySpace::kShared,
                            Index_,
                            typename GemmTileTraitsHelperB::WmmaMatrix,
-                           IteratorFragment::kWmmaMatrix>
+                           FragmentElementType::kWmmaMatrix>
       SharedLoadIteratorB;
   /// The stream to load B from shared memory.
   typedef SharedLoadStream<SharedLoadIteratorB> SharedLoadStreamB;
@@ -518,14 +1066,18 @@ template <
     MatrixLayout::Kind kLayoutB_,
     /// The tile size for the GEMM KxNxM.
     typename OutputTile_ = Shape<64, 128, 128>,
+    /// The input type.
+    typename ScalarA_ = half,
+    /// The input type.
+    typename ScalarB_ = half,
     /// The output type.
     typename ScalarC_ = float,
     /// The functor to do the math in the epilogue.
     typename EpilogueFunctor_ = LinearScaling<ScalarC_>,
     /// The accumulator type.
     typename Accumulator_ = ScalarC_,
-    /// The number of accumulators per warp.
-    typename AccumulatorsPerWarp_ = typename WmmaGemmAccumulatorsPerWarp<OutputTile_>::Shape,
+    /// Tile size for warp-level GEMM (K-by-N-by-M)
+    typename WarpGemmShape_ = typename WmmaGemmAccumulatorsPerWarp<OutputTile_>::Shape,
     /// The shape of the WMMA instruction.
     typename InstructionShape_ = Shape<16, 16, 16>,
     /// The number of scalars per LDG for A.
@@ -538,10 +1090,12 @@ template <
     typename Helper_ = WmmaGemmTraitsHelper<kLayoutA_,
                                             kLayoutB_,
                                             OutputTile_,
+                                            ScalarA_,
+                                            ScalarB_,
                                             ScalarC_,
                                             Accumulator_,
                                             EpilogueFunctor_,
-                                            AccumulatorsPerWarp_,
+                                            WarpGemmShape_,
                                             InstructionShape_,
                                             kScalarsPerLdgA_,
                                             kScalarsPerLdgB_,
diff --git a/cutlass/iterator_access.h b/cutlass/iterator_access.h
index e94beb734..b961766bb 100644
--- a/cutlass/iterator_access.h
+++ b/cutlass/iterator_access.h
@@ -27,16 +27,14 @@
 */
 #pragma once
 
-#include <cutlass/fragment_load_store.h>
-#include <cutlass/load_store.h>
-#include <cutlass/predicate_vector.h>
-#include <cutlass/shape.h>
+#include "cutlass/load_store.h"
+#include "cutlass/predicate_vector.h"
+#include "cutlass/shape.h"
 
 namespace cutlass {
 
 ///////////////////////////////////////////////////////////////////////////////////////////////////
-
-/// Loads a fragment from an input iterator
+// Used by convolution
 template <typename InputIterator, typename Fragment>
 CUTLASS_HOST_DEVICE void iterator_load(InputIterator &iterator, Fragment &fragment) {
   typename InputIterator::FragmentIterator frag_iterator(fragment);
@@ -45,12 +43,12 @@ CUTLASS_HOST_DEVICE void iterator_load(InputIterator &iterator, Fragment &fragme
       for (int w = 0; w < InputIterator::Iterations::kW; ++w) {
         for (int c = 0; c < InputIterator::Iterations::kC; ++c) {
           if (iterator.valid(d, h, w, c)) {
-            iterator.get(reinterpret_cast<typename InputIterator::AccessType &>(
-                             frag_iterator.at(d, h, w, c)),
-                         d,
-                         h,
-                         w,
-                         c);
+            iterator.load_element(reinterpret_cast<typename InputIterator::AccessType &>(
+                                      frag_iterator.at(d, h, w, c)),
+                                  d,
+                                  h,
+                                  w,
+                                  c);
           }
         }
         if (w < InputIterator::Iterations::kW - 1) {
@@ -68,138 +66,21 @@ CUTLASS_HOST_DEVICE void iterator_load(InputIterator &iterator, Fragment &fragme
   iterator.inc_advance();
 }
 
-/// Loads a fragment from a shared memory input iterator
-template <typename InputIterator, typename Fragment>
-CUTLASS_DEVICE void shared_iterator_load(InputIterator &iterator, Fragment &fragment) {
-  typename InputIterator::FragmentIterator frag_iterator(fragment);
-  for (int d = 0; d < InputIterator::Iterations::kD; ++d) {
-    for (int h = 0; h < InputIterator::Iterations::kH; ++h) {
-      for (int w = 0; w < InputIterator::Iterations::kW; ++w) {
-        for (int c = 0; c < InputIterator::Iterations::kC; ++c) {
-          int const offset =
-              ComputeOffsetFromStrides<typename InputIterator::ImmediateOffsetStrides>::get(
-                  d, h, w, c);
-
-          FragmentLoad<InputIterator::kIteratorFragment,
-                       InputIterator::Tile::kC,
-                       typename InputIterator::Scalar,
-                       InputIterator::kMemorySpace,
-                       typename InputIterator::FragmentElement,
-                       InputIterator::Tile::kW>::load(frag_iterator.at(d, h, w, c),
-                                                      iterator.data(),
-                                                      offset);
-        }
-      }
-    }
-  }
-}
-
-/// Loads a fragment from a shared memory input iterator
-template <typename InputIterator, typename Fragment>
-CUTLASS_DEVICE void shared_iterator_load(InputIterator &iterator, Fragment &fragment, int d) {
-  typename InputIterator::FragmentIterator frag_iterator(fragment);
-  for (int h = 0; h < InputIterator::Iterations::kH; ++h) {
-    for (int w = 0; w < InputIterator::Iterations::kW; ++w) {
-      for (int c = 0; c < InputIterator::Iterations::kC; ++c) {
-        int const offset =
-            ComputeOffsetFromStrides<typename InputIterator::ImmediateOffsetStrides>::get(
-                d, h, w, c);
-
-        FragmentLoad<InputIterator::kIteratorFragment,
-                     InputIterator::Tile::kC,
-                     typename InputIterator::Scalar,
-                     InputIterator::kMemorySpace,
-                     typename InputIterator::FragmentElement,
-                     InputIterator::Tile::kW>::load(frag_iterator.at(0, h, w, c),
-                                                    iterator.data(),
-                                                    offset);
-      }
-    }
-  }
-}
-
-/// Loads a fragment from an input iterator, masked by a predicate iterator
-template <typename InputIterator, typename Fragment, typename ConstPredicateAdapter>
-CUTLASS_HOST_DEVICE void iterator_load_post_increment(InputIterator &iterator,
-                                                      Fragment &fragment,
-                                                      typename InputIterator::Index offset,
-                                                      ConstPredicateAdapter predicate_adapter) {
-  for (int d = 0; d < InputIterator::Iterations::kD; ++d, iterator.inc_d()) {
-    for (int h = 0; h < InputIterator::Iterations::kH; ++h, iterator.inc_h()) {
-      for (int w = 0; w < InputIterator::Iterations::kW; ++w, iterator.inc_w()) {
-        if (predicate_adapter.at(d, h, w, 0)) {
-          int idx = InputIterator::Tile::kC *
-                    (w + InputIterator::Iterations::kW * (h + InputIterator::Iterations::kH * d));
-
-          Load<typename Fragment::Element, InputIterator::Tile::kC, InputIterator::kMemorySpace>::
-              load(reinterpret_cast<typename InputIterator::AccessType &>(fragment[idx]),
-                   iterator.data(),
-                   offset);
-        }
-      }
-    }
-  }
-}
-
-/// Loads a fragment from an input iterator
-template <typename InputIterator, typename Fragment>
-CUTLASS_HOST_DEVICE void iterator_load_post_increment(InputIterator &iterator,
-                                                      Fragment &fragment,
-                                                      typename InputIterator::Index offset = 0) {
-  TrivialPredicateTileAdapter pred;
-  iterator_load_post_increment(iterator, fragment, offset, pred);
-}
-
-/// Loads a fragment from an input iterator
-template <typename InputIterator, typename Fragment, typename ConstPredicateAdapter>
-CUTLASS_HOST_DEVICE void iterator_load_post_increment(InputIterator &iterator,
-                                                      Fragment &fragment,
-                                                      ConstPredicateAdapter pred_it) {
-  iterator_load_post_increment(iterator, fragment, 0, pred_it);
-}
-
-template <typename InputIterator, typename Fragment, typename ConstPredicateAdapter>
-CUTLASS_HOST_DEVICE void iterator_load(InputIterator const &_iterator,
-                                       Fragment &fragment,
-                                       typename InputIterator::Index offset,
-                                       ConstPredicateAdapter predicate_adapter) {
-  InputIterator iterator(_iterator);
-  iterator_load_post_increment(iterator, fragment, offset, predicate_adapter);
-}
-
-/// Loads a fragment from an input iterator
-template <typename InputIterator, typename Fragment>
-CUTLASS_HOST_DEVICE void iterator_load(InputIterator const &iterator,
-                                       Fragment &fragment,
-                                       typename InputIterator::Index offset = 0) {
-  TrivialPredicateTileAdapter pred;
-  iterator_load(iterator, fragment, offset, pred);
-}
-
-/// Loads a fragment from an input iterator
-template <typename InputIterator, typename Fragment, typename ConstPredicateAdapter>
-CUTLASS_HOST_DEVICE void iterator_load(InputIterator const &iterator,
-                                       Fragment &fragment,
-                                       ConstPredicateAdapter pred_it) {
-  iterator_load(iterator, fragment, 0, pred_it);
-}
-
-///////////////////////////////////////////////////////////////////////////////////////////////////
-
-/// Stores a fragment to an output iterator
 template <typename OutputIterator, typename Fragment>
 CUTLASS_HOST_DEVICE void iterator_store(OutputIterator &iterator, Fragment &fragment) {
   typename OutputIterator::FragmentIterator frag_iterator(fragment);
   for (int d = 0; d < OutputIterator::Iterations::kD; ++d) {
     for (int h = 0; h < OutputIterator::Iterations::kH; ++h) {
       for (int w = 0; w < OutputIterator::Iterations::kW; ++w) {
-        if (iterator.valid(d, h, w, 0)) {
-          iterator.set(reinterpret_cast<typename OutputIterator::AccessType const &>(
-                           frag_iterator.at(d, h, w, 0)),
-                       d,
-                       h,
-                       w,
-                       0);
+        for (int c = 0; c < OutputIterator::Iterations::kC; ++c) {
+          if (iterator.valid(d, h, w, c)) {
+            iterator.store_element(reinterpret_cast<typename OutputIterator::AccessType &>(
+                                       frag_iterator.at(d, h, w, c)),
+                                   d,
+                                   h,
+                                   w,
+                                   c);
+          }
         }
         if (w < OutputIterator::Iterations::kW - 1) {
           iterator.inc_w();
@@ -215,104 +96,6 @@ CUTLASS_HOST_DEVICE void iterator_store(OutputIterator &iterator, Fragment &frag
   }
   iterator.inc_advance();
 }
-
-/// Stores a fragment to a shared memory output iterator
-template <typename OutputIterator, typename Fragment>
-CUTLASS_DEVICE void shared_iterator_store(OutputIterator &iterator, Fragment const &fragment) {
-  typename OutputIterator::FragmentConstIterator frag_iterator(fragment);
-  for (int d = 0; d < OutputIterator::Iterations::kD; ++d) {
-    for (int h = 0; h < OutputIterator::Iterations::kH; ++h) {
-      for (int w = 0; w < OutputIterator::Iterations::kW; ++w) {
-        for (int c = 0; c < OutputIterator::Iterations::kC; ++c) {
-          int const offset =
-              ComputeOffsetFromStrides<typename OutputIterator::ImmediateOffsetStrides>::get(
-                  d, h, w, c);
-
-          FragmentStore<OutputIterator::kIteratorFragment,
-                        OutputIterator::Tile::kC,
-                        typename OutputIterator::Scalar,
-                        OutputIterator::kMemorySpace,
-                        typename OutputIterator::FragmentElement,
-                        OutputIterator::Tile::kW>::store(frag_iterator.at(d, h, w, c),
-                                                         iterator.data(),
-                                                         offset);
-        }
-      }
-    }
-  }
-}
-
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/// Stores a fragment to an output iterator, masked by a predicate iterator
-template <typename OutputIterator, typename Fragment, typename ConstPredicateAdapter>
-CUTLASS_HOST_DEVICE void iterator_store_post_increment(OutputIterator &iterator,
-                                                       Fragment const &fragment,
-                                                       typename OutputIterator::Index offset,
-                                                       ConstPredicateAdapter predicate_adapter) {
-  for (int d = 0; d < OutputIterator::Iterations::kD; ++d, iterator.inc_d()) {
-    for (int h = 0; h < OutputIterator::Iterations::kH; ++h, iterator.inc_h()) {
-      for (int w = 0; w < OutputIterator::Iterations::kW; ++w, iterator.inc_w()) {
-        if (predicate_adapter.at(d, h, w, 0)) {
-          int idx = OutputIterator::Tile::kC *
-                    (w + OutputIterator::Iterations::kW * (h + OutputIterator::Iterations::kH * d));
-
-          Store<typename Fragment::Element,
-                OutputIterator::Tile::kC,
-                OutputIterator::kMemorySpace>::
-              store(reinterpret_cast<typename OutputIterator::AccessType const &>(fragment[idx]),
-                    iterator.data(),
-                    offset);
-        }
-      }
-    }
-  }
-}
-
-/// Stores a fragment to an output iterator
-template <typename OutputIterator, typename Fragment>
-CUTLASS_HOST_DEVICE void iterator_store_post_increment(OutputIterator &iterator,
-                                                       Fragment const &fragment,
-                                                       typename OutputIterator::Index offset = 0) {
-  TrivialPredicateTileAdapter pred;
-  iterator_store_post_increment(iterator, fragment, offset, pred);
-}
-
-/// Stores a fragment to an output iterator
-template <typename OutputIterator, typename Fragment, typename ConstPredicateAdapter>
-CUTLASS_HOST_DEVICE void iterator_store_post_increment(OutputIterator &iterator,
-                                                       Fragment const &fragment,
-                                                       ConstPredicateAdapter pred_it) {
-  iterator_store_post_increment(iterator, fragment, 0, pred_it);
-}
-
-/// Stores a fragment to an output iterator, masked by a predicate iterator
-template <typename OutputIterator, typename Fragment, typename ConstPredicateAdapter>
-CUTLASS_HOST_DEVICE void iterator_store(OutputIterator const &_iterator,
-                                        Fragment const &fragment,
-                                        typename OutputIterator::Index offset,
-                                        ConstPredicateAdapter predicate_adapter) {
-  OutputIterator iterator(_iterator);
-  iterator_store_post_increment(iterator, fragment, offset, predicate_adapter);
-}
-
-/// Stores a fragment to an output iterator
-template <typename OutputIterator, typename Fragment>
-CUTLASS_HOST_DEVICE void iterator_store(OutputIterator const &iterator,
-                                        Fragment const &fragment,
-                                        typename OutputIterator::Index offset = 0) {
-  TrivialPredicateTileAdapter pred;
-  iterator_store(iterator, fragment, offset, pred);
-}
-
-/// Stores a fragment to an output iterator
-template <typename OutputIterator, typename Fragment, typename ConstPredicateAdapter>
-CUTLASS_HOST_DEVICE void iterator_store(OutputIterator const &iterator,
-                                        Fragment const &fragment,
-                                        ConstPredicateAdapter pred_it) {
-  iterator_store(iterator, fragment, 0, pred_it);
-}
-
-///////////////////////////////////////////////////////////////////////////////////////////////////
-
 }  // namespace cutlass
diff --git a/cutlass/kernel_launch.h b/cutlass/kernel_launch.h
new file mode 100644
index 000000000..ee37b2fda
--- /dev/null
+++ b/cutlass/kernel_launch.h
@@ -0,0 +1,67 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *   * Redistributions of source code must retain the above copyright notice, this list of
+ *     conditions and the following disclaimer.
+ *   * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *     conditions and the following disclaimer in the documentation and/or other materials
+ *     provided with the distribution.
+ *   * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *     to endorse or promote products derived from this software without specific prior written
+ *     permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+  \brief Defines structures and helpers to launch CUDA kernels within CUTLASS.
+*/
+
+#pragma once
+
+#include "cutlass/cutlass.h"
+
+namespace cutlass {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Structure containing the basic launch configuration of a CUDA kernel.
+struct KernelLaunchConfiguration {
+
+  /// CUDA grid dimensions
+  dim3 grid;
+
+  /// CUDA threablock dimensions
+  dim3 block;
+
+  /// Bytes of dynamically allocated SMEM in addition to static SMEM
+  size_t dynamic_smem;
+
+  //
+  // Methods
+  //
+
+  /// Constructs a KernellaunchConfiguration object
+  CUTLASS_HOST_DEVICE
+  KernelLaunchConfiguration(
+    dim3 _grid = dim3(1,1,1),
+    dim3 _block = dim3(1,1,1),
+    size_t _dynamic_smem = 0
+  ):
+    grid(_grid),
+    block(_block),
+    dynamic_smem(_dynamic_smem) { }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/cutlass/load_store.h b/cutlass/load_store.h
index 5cb5eb672..db09dd0a4 100644
--- a/cutlass/load_store.h
+++ b/cutlass/load_store.h
@@ -27,8 +27,7 @@
 */
 #pragma once
 
-#include <cutlass/vector.h>
-
+#include "cutlass/vector.h"
 namespace cutlass {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
@@ -44,45 +43,68 @@ struct MemorySpace {
   };
 };
 
+/// Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix
+struct FragmentElementType {
+  enum Kind { kScalar, kWmmaMatrix };
+};
+
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 template <typename Scalar_,
-          int Lanes_,
+          int kAccessSize,
           MemorySpace::Kind Memory_,
-          bool = (Lanes_ > 1),
-          size_t = (sizeof(Scalar_) * Lanes_)>
+          FragmentElementType::Kind kFragmentElementType = FragmentElementType::kScalar,
+          typename FragmentElement_ = Scalar_,
+          int kStride = 1,
+          size_t size = (sizeof(Scalar_) * kAccessSize)>
 struct Load {
   /// The output type.
-  typedef typename Vectorize<Scalar_, Lanes_>::Type AccessType;
+  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
 
   /// The load function.
-  static CUTLASS_DEVICE void load(AccessType& dst, Scalar_ const* pointer, int offset) {
-    dst = reinterpret_cast<AccessType const*>(&pointer[offset])[0];
+  static CUTLASS_HOST_DEVICE void load(AccessType& dst, Scalar_ const* pointer, int offset) {
+    dst = *reinterpret_cast<AccessType const*>(pointer + offset);
+  }
+
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Partial specialization for 16b loads
+template <typename Scalar_, int kAccessSize, MemorySpace::Kind Memory_>
+struct Load<Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2> {
+  /// The output type.
+  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
+
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& dst, Scalar_ const* pointer, int offset) {
+    reinterpret_cast<uint16_t&>(dst) = reinterpret_cast<uint16_t const*>(&pointer[offset])[0];
   }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Scalar_, int Lanes_, MemorySpace::Kind Memory_>
-struct Load<Scalar_, Lanes_, Memory_, true, 4> {
+template <typename Scalar_, int kAccessSize, MemorySpace::Kind Memory_, int kStride>
+struct Load<Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4> {
   /// The output type.
-  typedef typename Vectorize<Scalar_, Lanes_>::Type AccessType;
+  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
 
-  /// The store function.
-  static CUTLASS_DEVICE void load(AccessType& dst, Scalar_ const* pointer, int offset) {
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& dst, Scalar_ const* pointer, int offset) {
     dst.registers[0] = reinterpret_cast<uint32_t const*>(&pointer[offset])[0];
   }
+
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Scalar_, int Lanes_, MemorySpace::Kind Memory_>
-struct Load<Scalar_, Lanes_, Memory_, true, 8> {
+template <typename Scalar_, int kAccessSize, MemorySpace::Kind Memory_, int kStride>
+struct Load<Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8> {
   /// The output type.
-  typedef typename Vectorize<Scalar_, Lanes_>::Type AccessType;
+  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
 
-  /// The store function.
-  static CUTLASS_DEVICE void load(AccessType& dst, Scalar_ const* pointer, int offset) {
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& dst, Scalar_ const* pointer, int offset) {
     uint2 tmp = reinterpret_cast<uint2 const*>(&pointer[offset])[0];
     dst.registers[0] = tmp.x;
     dst.registers[1] = tmp.y;
@@ -91,13 +113,13 @@ struct Load<Scalar_, Lanes_, Memory_, true, 8> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <MemorySpace::Kind Memory_>
-struct Load<double, 2, Memory_, true, 16> {
+template <MemorySpace::Kind Memory_, int kStride>
+struct Load<double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16> {
   /// The output type.
   typedef typename Vectorize<double, 2>::Type AccessType;
 
-  /// The store function.
-  static CUTLASS_DEVICE void load(AccessType& dst, double const* pointer, int offset) {
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& dst, double const* pointer, int offset) {
     double2 tmp = reinterpret_cast<double2 const*>(&pointer[offset])[0];
     dst[0] = tmp.x;
     dst[1] = tmp.y;
@@ -108,13 +130,13 @@ struct Load<double, 2, Memory_, true, 16> {
 
 #if defined(__CUDACC_VERSION_MAJOR) && __CUDACC_VERSION_MAJOR < 10
 // WAR bug in NVCC where the upper and lower half of the register end up being the same
-template <MemorySpace::Kind Memory_>
-struct Load<half, 8, Memory_, true, 16> {
+template <MemorySpace::Kind Memory_, int kStride>
+struct Load<half, 8, Memory_, FragmentElementType::kScalar, half, kStride, 16> {
   /// The output type.
   typedef typename Vectorize<half, 8>::Type AccessType;
 
-  /// The store function.
-  static CUTLASS_DEVICE void load(AccessType& dst, half const* pointer, int offset) {
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& dst, half const* pointer, int offset) {
     int2 tmp = reinterpret_cast<int2 const*>(&pointer[offset])[0];
     dst.registers[0] = tmp.x;
     dst.registers[1] = tmp.y;
@@ -129,13 +151,13 @@ struct Load<half, 8, Memory_, true, 16> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Scalar_, int Lanes_, MemorySpace::Kind Memory_>
-struct Load<Scalar_, Lanes_, Memory_, true, 16> {
+template <typename Scalar_, int kAccessSize, MemorySpace::Kind Memory_, int kStride>
+struct Load<Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16> {
   /// The output type.
-  typedef typename Vectorize<Scalar_, Lanes_>::Type AccessType;
+  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
 
-  /// The store function.
-  static CUTLASS_DEVICE void load(AccessType& dst, Scalar_ const* pointer, int offset) {
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& dst, Scalar_ const* pointer, int offset) {
     uint4 tmp = reinterpret_cast<uint4 const*>(&pointer[offset])[0];
     dst.registers[0] = tmp.x;
     dst.registers[1] = tmp.y;
@@ -147,29 +169,45 @@ struct Load<Scalar_, Lanes_, Memory_, true, 16> {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 template <typename Scalar_,
-          int Lanes_,
+          int kAccessSize,
           MemorySpace::Kind Memory_,
-          bool = (Lanes_ > 1),
-          size_t = (sizeof(Scalar_) * Lanes_)>
+          FragmentElementType::Kind kFragmentElementType = FragmentElementType::kScalar,
+          typename FragmentElement_ = Scalar_,
+          int kStride = 1,
+          size_t size = (sizeof(Scalar_) * kAccessSize)>
 struct Store {
   /// The output type.
-  typedef typename Vectorize<Scalar_, Lanes_>::Type AccessType;
+  typedef typename Vectorize<FragmentElement_, kAccessSize>::Type AccessType;
 
   /// The store function.
-  static CUTLASS_DEVICE void store(AccessType const& src, Scalar_* pointer, int offset) {
-    pointer[offset] = src;
+  static CUTLASS_HOST_DEVICE void store(AccessType const& src, Scalar_* pointer, int offset) {
+    pointer[offset] = *reinterpret_cast<Scalar_ const*>(&src);
   }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Scalar_, int Lanes_, MemorySpace::Kind Memory_>
-struct Store<Scalar_, Lanes_, Memory_, true, 4> {
+template <typename Scalar_, int kAccessSize, MemorySpace::Kind Memory_>
+struct Store<Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2> {
   /// The output type.
-  typedef typename Vectorize<Scalar_, Lanes_>::Type AccessType;
+  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
 
   /// The store function.
-  static CUTLASS_DEVICE void store(AccessType const& src, Scalar_* pointer, int offset) {
+  static CUTLASS_HOST_DEVICE void store(AccessType const& src, Scalar_* pointer, int offset) {
+    uint16_t* addr = reinterpret_cast<uint16_t*>(&pointer[offset]);
+    addr[0] = reinterpret_cast<uint16_t const&>(src);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename Scalar_, int kAccessSize, MemorySpace::Kind Memory_, int kStride>
+struct Store<Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4> {
+  /// The output type.
+  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
+
+  /// The store function.
+  static CUTLASS_HOST_DEVICE void store(AccessType const& src, Scalar_* pointer, int offset) {
     uint32_t* addr = reinterpret_cast<uint32_t*>(&pointer[offset]);
     addr[0] = src.registers[0];
   }
@@ -177,13 +215,13 @@ struct Store<Scalar_, Lanes_, Memory_, true, 4> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Scalar_, int Lanes_, MemorySpace::Kind Memory_>
-struct Store<Scalar_, Lanes_, Memory_, true, 8> {
+template <typename Scalar_, int kAccessSize, MemorySpace::Kind Memory_, int kStride>
+struct Store<Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8> {
   /// The output type.
-  typedef typename Vectorize<Scalar_, Lanes_>::Type AccessType;
+  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
 
   /// The store function.
-  static CUTLASS_DEVICE void store(AccessType const& src, Scalar_* pointer, int offset) {
+  static CUTLASS_HOST_DEVICE void store(AccessType const& src, Scalar_* pointer, int offset) {
     uint2* addr = reinterpret_cast<uint2*>(&pointer[offset]);
     addr[0] = make_uint2(src.registers[0], src.registers[1]);
   }
@@ -191,13 +229,13 @@ struct Store<Scalar_, Lanes_, Memory_, true, 8> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <MemorySpace::Kind Memory_>
-struct Store<double, 2, Memory_, true, 16> {
+template <MemorySpace::Kind Memory_, int kStride>
+struct Store<double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16> {
   /// The output type.
   typedef typename Vectorize<double, 2>::Type AccessType;
 
   /// The store function.
-  static CUTLASS_DEVICE void store(AccessType const& src, double* pointer, int offset) {
+  static CUTLASS_HOST_DEVICE void store(AccessType const& src, double* pointer, int offset) {
     double2* addr = reinterpret_cast<double2*>(&pointer[offset]);
     addr[0] = make_double2(src[0], src[1]);
   }
@@ -205,13 +243,13 @@ struct Store<double, 2, Memory_, true, 16> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Scalar_, int Lanes_, MemorySpace::Kind Memory_>
-struct Store<Scalar_, Lanes_, Memory_, true, 16> {
+template <typename Scalar_, int kAccessSize, MemorySpace::Kind Memory_, int kStride>
+struct Store<Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16> {
   /// The output type.
-  typedef typename Vectorize<Scalar_, Lanes_>::Type AccessType;
+  typedef typename Vectorize<Scalar_, kAccessSize>::Type AccessType;
 
   /// The store function.
-  static CUTLASS_DEVICE void store(AccessType const& src, Scalar_* pointer, int offset) {
+  static CUTLASS_HOST_DEVICE void store(AccessType const& src, Scalar_* pointer, int offset) {
     uint4* addr = reinterpret_cast<uint4*>(&pointer[offset]);
     addr[0] = make_uint4(src.registers[0], src.registers[1], src.registers[2], src.registers[3]);
   }
@@ -219,4 +257,123 @@ struct Store<Scalar_, Lanes_, Memory_, true, 16> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+template <typename Scalar_,
+          int kAccessSize,
+          MemorySpace::Kind Memory_,
+          typename FragmentElement_,
+          int kStride,
+          size_t size>
+struct Load<Scalar_,
+            kAccessSize,
+            Memory_,
+            FragmentElementType::kWmmaMatrix,
+            FragmentElement_,
+            kStride,
+            size> {
+  /// The output type.
+  typedef FragmentElement_ AccessType;
+
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& value, Scalar_ const* pointer, int offset) {
+    value.load(&pointer[offset], kStride);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <int kAccessSize,
+          MemorySpace::Kind Memory_,
+          typename FragmentElement_,
+          int kStride,
+          size_t size>
+struct Load<Vector<bin1_t, 32>,
+            kAccessSize,
+            Memory_,
+            FragmentElementType::kWmmaMatrix,
+            FragmentElement_,
+            kStride,
+            size> {
+  /// The output type.
+  typedef FragmentElement_ AccessType;
+
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& value, Vector<bin1_t, 32> const* pointer,
+                                       int offset) {
+    value.load(&pointer[offset], kStride * 32);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <int kAccessSize,
+          MemorySpace::Kind Memory_,
+          typename FragmentElement_,
+          int kStride,
+          size_t size>
+struct Load<Vector<int4_t, 8>,
+            kAccessSize,
+            Memory_,
+            FragmentElementType::kWmmaMatrix,
+            FragmentElement_,
+            kStride,
+            size> {
+  /// The output type.
+  typedef FragmentElement_ AccessType;
+
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& value, Vector<int4_t, 8> const* pointer,
+                                       int offset) {
+    value.load(&pointer[offset], kStride * 8);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <int kAccessSize,
+          MemorySpace::Kind Memory_,
+          typename FragmentElement_,
+          int kStride,
+          size_t size>
+struct Load<Vector<uint4_t, 8>,
+            kAccessSize,
+            Memory_,
+            FragmentElementType::kWmmaMatrix,
+            FragmentElement_,
+            kStride,
+            size> {
+  /// The output type.
+  typedef FragmentElement_ AccessType;
+
+  /// The load function.
+  static CUTLASS_HOST_DEVICE void load(AccessType& value, Vector<uint4_t, 8> const* pointer,
+                                       int offset) {
+    value.load(&pointer[offset], kStride * 8);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+template <typename Scalar_,
+          int kAccessSize,
+          MemorySpace::Kind Memory_,
+          typename FragmentElement_,
+          int kStride,
+          size_t size>
+struct Store<Scalar_,
+             kAccessSize,
+             Memory_,
+             FragmentElementType::kWmmaMatrix,
+             FragmentElement_,
+             kStride,
+             size> {
+  /// The input type.
+  typedef FragmentElement_ AccessType;
+
+  /// The store function.
+  static CUTLASS_HOST_DEVICE void store(AccessType const& value, Scalar_* pointer, int offset) {
+    value.store(&pointer[offset], kStride);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 }  // namespace cutlass
diff --git a/cutlass/matrix_traits.h b/cutlass/matrix_traits.h
index 77e8b7062..08a43a99a 100644
--- a/cutlass/matrix_traits.h
+++ b/cutlass/matrix_traits.h
@@ -27,13 +27,327 @@
 */
 #pragma once
 
+#include "cutlass/coord.h"
+
 namespace cutlass {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/// Describes layouts of matrices
+/// MatrixCoord wraps Coord<2, int> to provide a helper for accessing named dimensions. Classes
+/// expecting a coordinate in the rank=2 index space of a matrix should use MatrixCoord.
+struct MatrixCoord : public Coord<2, int> {
+
+  /// Integer-valued index
+  typedef int Index;
+
+  /// Base type is a Coord of rank=2
+  typedef Coord<2, Index> Base;
+
+  /// Rows dimension
+  static int const kRow = 0;
+
+  /// Columns dimension
+  static int const kColumn = 1;
+
+  //
+  // Methods
+  //
+
+  /// Default ctor
+  CUTLASS_HOST_DEVICE
+  MatrixCoord() { }
+
+  /// Constructs from Coord<2>
+  CUTLASS_HOST_DEVICE
+  MatrixCoord(Coord<2, Index> const &coord): Base(coord) { }
+
+  /// Helper to construct from a row and column
+  CUTLASS_HOST_DEVICE
+  MatrixCoord(Index row, Index column): Base(make_Coord(row, column)) { }
+
+  /// Returns the row of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & row() const { return this->at(kRow); }
+
+  /// Returns the row of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index & row() { return this->at(kRow); }
+
+  /// Returns the column of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & column() const { return this->at(kColumn); }
+
+  /// Returns the column of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index & column() { return this->at(kColumn); }
+
+  //
+  // Coord operators
+  //
+
+  /// Element-wise addition
+  CUTLASS_HOST_DEVICE
+  MatrixCoord operator+(Base const& b) const {
+    return MatrixCoord(Base::operator+(b));
+  }
+
+  /// Element-wise subtraction
+  CUTLASS_HOST_DEVICE
+  MatrixCoord operator-(Base const& b) const {
+    return MatrixCoord(Base::operator-(b));
+  }
+
+  /// Element-wise multiplication
+  CUTLASS_HOST_DEVICE
+  MatrixCoord operator*(Base const& b) const {
+    return MatrixCoord(Base::operator*(b));
+  }
+
+  /// Element-wise division
+  CUTLASS_HOST_DEVICE
+  MatrixCoord operator/(Base const& b) const {
+    return MatrixCoord(Base::operator/(b));
+  }
+
+  /// In-place addition
+  CUTLASS_HOST_DEVICE
+  MatrixCoord& operator+=(Base const& b) {
+    Base::operator+=(b);
+    return *this;
+  }
+
+  /// In-place subtraction
+  CUTLASS_HOST_DEVICE
+  MatrixCoord& operator-=(Base const& b) {
+    Base::operator-=(b);
+    return *this;
+  }
+
+  /// In-place multiplication
+  CUTLASS_HOST_DEVICE
+  MatrixCoord& operator*=(Base const& b) {
+    Base::operator*=(b);
+    return *this;
+  }
+
+  /// In-place division
+  CUTLASS_HOST_DEVICE
+  MatrixCoord& operator/=(Base const& b) {
+    Base::operator/=(b);
+    return *this;
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Defines data layouts of various matrix formats usable by TensorRef and other classes.
+//
+// The following define classes satisfying the TensorRefMapFunc concept. These must support the
+// following operations, where func is an instance of type TensorRefMapFunc.
+//
+//   Coord<TensorRefMapFunc::kStorageRank> = func(Coord<kRank>);
+//
+// Though not required to be usable by TensorRef, each of the following also define a helper
+// function to map the "leading dimension" to an appropriate stride vector. Implementations
+// following this convention should also implement the following static method:
+//
+//   Coord<TensorRefMapFunc::kStorageRank> stride = TensorRefMapFunc::stride(leading_dim);
+//
 struct MatrixLayout {
+
+  /// Enumeration defining fundamental contiguous layouts.
   enum Kind { kRowMajor, kColumnMajor };
+
+  //
+  // TensorRefMapFunc definitions for common layouts
+  //
+
+  /// Mapping function for row-major matrices
+  struct RowMajor {
+    static int const kStorageRank = 2;
+    /// Maps (i, j) to (i, j)
+    CUTLASS_HOST_DEVICE
+    Coord<kStorageRank> operator()(MatrixCoord const &coord) const {
+      return coord;
+    }
+  };
+
+  /// Mapping function for column-major matrices
+  struct ColumnMajor {
+    static int const kStorageRank = 2;
+    /// Maps (i, j) to (j, i)
+    CUTLASS_HOST_DEVICE
+    Coord<kStorageRank> operator()(MatrixCoord const &coord) const {
+      return make_Coord(coord.column(), coord.row());
+    }
+  };
+
+  /// Mapping function for interleaved matrices. Matrix is structured
+  /// as row-major arrangement of fixed-size columns.
+  template <int Interleave>
+  struct RowMajorInterleaved {
+
+    /// Rank of storage n-D array
+    static int const kStorageRank = 3;
+
+    /// Interleaving size
+    static int const kInterleave = Interleave;
+
+    /// Maps (row, col) to (row, col, row)
+    CUTLASS_HOST_DEVICE
+    Coord<kStorageRank> operator()(MatrixCoord const &coord) const {
+      return make_Coord(
+        coord.row() / kInterleave,
+        coord.column(),
+        coord.row() % kInterleave
+      );
+    }
+
+    /// Helper to compute stride vector from leading dimension
+    CUTLASS_HOST_DEVICE
+    static Coord<kStorageRank> stride(int ldm) {
+      return make_Coord(
+        ldm * kInterleave,
+        kInterleave,
+        1
+      );
+    }
+  };
+
+  /// Mapping function for interleaved matrices. Matrix is structured
+  /// as column-major arrangement of fixed-size rows.
+  template <int Interleave>
+  struct ColumnMajorInterleaved {
+
+    /// Rank of storage n-D array
+    static int const kStorageRank = 3;
+
+    /// Interleaving size
+    static int const kInterleave = Interleave;
+
+    /// Maps (row, col) to (col, row, col)
+    CUTLASS_HOST_DEVICE
+    Coord<kStorageRank> operator()(MatrixCoord const &coord) const {
+      return make_Coord(
+        coord.column() / kInterleave,
+        coord.row(),
+        coord.column() % kInterleave
+      );
+    }
+
+    /// Helper to compute stride vector from leading dimension
+    CUTLASS_HOST_DEVICE
+    static Coord<kStorageRank> stride(int ldm) {
+      return make_Coord(
+        ldm * kInterleave,
+        kInterleave,
+        1
+      );
+    }
+  };
+
+  /// Mapping function for scenario in which layout is row-major or column-major but this information
+  /// is only available at runtime.
+  struct ContiguousLayout {
+    /// Arbitrary storage rank
+    static int const kStorageRank = 3;
+
+    /// Dimension of rows
+    static int const kRow = 0;
+
+    /// Dimension of columns
+    static int const kColumn = 1;
+
+    /// Mapping function defined by runtime variable. Returns coordinates in n-D storage array
+    /// as (matrix row, matrix colum, 0)
+    CUTLASS_HOST_DEVICE
+    Coord<kStorageRank> operator()(MatrixCoord const &coord) const {
+        return make_Coord(coord.row(), coord.column(), 0);
+    }
+
+    /// Helper to construct a stride vector based on contiguous matrix layout and leading dimension
+    CUTLASS_HOST_DEVICE
+    static Coord<kStorageRank> stride(MatrixLayout::Kind layout, int ldm) {
+      if (layout == MatrixLayout::kRowMajor) {
+        return make_Coord(ldm, 1, 1);
+      }
+      return make_Coord(1, ldm, 1);
+    }
+  };
+
+  /// Mapping function for block-linear matrices. Matrix is structured
+  /// as column-major arrangement of 2D tiles (that are column-major).
+  template <int BlockRows, int BlockColumns>
+  struct ColumnMajorBlockLinear {
+
+    /// Rank of storage n-D array
+    static int const kStorageRank = 4;
+
+    /// Interleaving size in rows dimension
+    static int const kBlockRows = BlockRows;
+
+    /// Interleaving size in columns dimension
+    static int const kBlockColumns = BlockColumns;
+
+    /// Maps (row, col) to (col, row, col, row)
+    CUTLASS_HOST_DEVICE
+    Coord<kStorageRank> operator()(MatrixCoord const &coord) const {
+      return make_Coord(
+        coord.column() / kBlockColumns,
+        coord.row() / kBlockRows,
+        coord.column() % kBlockColumns,
+        coord.row() % kBlockRows
+      );
+    }
+
+    /// Helper to compute stride vector from leading dimension
+    CUTLASS_HOST_DEVICE
+    static Coord<kStorageRank> stride(int ldm) {
+      return make_Coord(
+        ldm * kBlockRows * kBlockColumns,
+        kBlockRows * kBlockColumns,
+        kBlockRows,
+        1
+      );
+    }
+  };
+
+  /// Mapping function for block-linear matrices. Matrix is structured
+  /// as row-major arrangement of 2D tiles (that are row-major)
+  template <int BlockRows, int BlockColumns>
+  struct RowMajorBlockLinear {
+
+    /// Rank of storage n-D array
+    static int const kStorageRank = 4;
+
+    /// Interleaving size in rows dimension
+    static int const kBlockRows = BlockRows;
+
+    /// Interleaving size in columns dimension
+    static int const kBlockColumns = BlockColumns;
+
+    /// Maps (row, col) to (row, col, row, col)
+    CUTLASS_HOST_DEVICE
+    Coord<kStorageRank> operator()(MatrixCoord const &coord) const {
+      return make_Coord(
+        coord.row() / kBlockRows,
+        coord.column() / kBlockColumns,
+        coord.row() % kBlockRows,
+        coord.column() % kBlockColumns
+      );
+    }
+
+    /// Helper to compute stride vector from leading dimension
+    CUTLASS_HOST_DEVICE
+    static Coord<kStorageRank> stride(int ldm) {
+      return make_Coord(
+        ldm * kBlockRows * kBlockColumns,
+        kBlockRows * kBlockColumns,
+        kBlockColumns,
+        1
+      );
+    }
+  };
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
@@ -45,4 +359,14 @@ struct GemmOperand {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+/// Transformation applied to matrix operands
+struct MatrixTransform {
+  enum Kind {
+    kNone,       /// no operation
+    kConjugate,  /// conjugate
+  };
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 }  // namespace cutlass
diff --git a/cutlass/predicate_vector.h b/cutlass/predicate_vector.h
index 81668577e..4a37d017d 100644
--- a/cutlass/predicate_vector.h
+++ b/cutlass/predicate_vector.h
@@ -28,12 +28,13 @@
 */
 #pragma once
 
+#include <assert.h>
 #include <stdint.h>
 
-#include <cutlass/cutlass.h>
-#include <cutlass/shape.h>
+#include "cutlass/cutlass.h"
+#include "cutlass/shape.h"
 
-#include <cutlass/util/platform.h>
+#include "cutlass/util/platform.h"
 
 namespace cutlass {
 
@@ -114,7 +115,7 @@ struct PredicateVector {
   // Make sure no one tries to put more than 8 bits in a byte :)
   static_assert(kPredicatesPerByte <= 8, "kPredicatesPerByte must fit within an actual byte");
   // Make sure the "offsetted" bits fit in one byte.
-  static_assert(kPredicateStart + kPredicatesPerByte < 8,
+  static_assert(kPredicateStart + kPredicatesPerByte <= 8,
                 "The offsetted predicates must fit within an actual byte.");
 
   /// Storage type of individual elements
diff --git a/cutlass/reshape_tile.h b/cutlass/reshape_tile.h
index 55aebfcaf..67faa602a 100644
--- a/cutlass/reshape_tile.h
+++ b/cutlass/reshape_tile.h
@@ -27,7 +27,7 @@
 */
 #pragma once
 
-#include <cutlass/shape.h>
+#include "cutlass/shape.h"
 
 namespace cutlass {
 
diff --git a/cutlass/shape.h b/cutlass/shape.h
index 4f6b222ee..b8c0c66f3 100644
--- a/cutlass/shape.h
+++ b/cutlass/shape.h
@@ -27,7 +27,7 @@
 */
 #pragma once
 
-#include <cutlass/cutlass.h>
+#include "cutlass/cutlass.h"
 
 namespace cutlass {
 
@@ -128,6 +128,17 @@ struct ShapeDiv {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+template <typename A_, typename B_>
+struct ShapeDivCeiling {
+  typedef Shape<(A_::kD + B_::kD - 1) / B_::kD,
+                (A_::kH + B_::kH - 1) / B_::kH,
+                (A_::kW + B_::kW - 1) / B_::kW,
+                (A_::kC + B_::kC - 1) / B_::kC>
+      Shape;
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 template <typename A_, typename B_>
 struct ShapeMax {
   typedef Shape<(A_::kD > B_::kD ? A_::kD : B_::kD),
@@ -150,12 +161,12 @@ struct ShapeMin {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Shape_, int kElementsPerAccess>
+template <typename Shape_, int elementsPerAccess>
 struct ShapeStrides {
   typedef Shape<Shape_::kH * Shape_::kW * Shape_::kC,
                 Shape_::kW * Shape_::kC,
                 Shape_::kC,
-                kElementsPerAccess>
+                elementsPerAccess>
       Shape;
 };
 
@@ -167,7 +178,7 @@ struct ShapeStrides {
 */
 template <typename Shape_>
 struct ComputeOffsetFromShape {
-  static CUTLASS_DEVICE int get(int d, int h, int w, int c) {
+  static CUTLASS_HOST_DEVICE int get(int d, int h, int w, int c) {
     // clang-format off
     return d * Shape_::kH * Shape_::kW * Shape_::kC +
            h * Shape_::kW * Shape_::kC +
@@ -179,73 +190,19 @@ struct ComputeOffsetFromShape {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/**
-* @brief Compute the offset for the given coordinates in a cube with a depth of 1
-* @tparam kSh Elements in the H dimension
-* @tparam kSw Elements in the W dimension
-* @tparam kSc Separation between two elements in "elements"
-*/
-template <int kSh_, int kSw_, int kSc_>
-struct ComputeOffsetFromShape<Shape<1, kSh_, kSw_, kSc_> > {
-  static CUTLASS_DEVICE int get(int d, int h, int w, int c) {
-    return h * kSw_ * kSc_ + w * kSc_ + c;
-  }
-};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-/**
-* @brief Compute the offset for the given coordinates in a cube with one channel and a depth of 1
-* @tparam kSh Elements in the H dimension
-* @tparam kSw Elements in the W dimension
-*/
-template <int kSh_, int kSw_>
-struct ComputeOffsetFromShape<Shape<1, kSh_, kSw_, 1> > {
-  static CUTLASS_DEVICE int get(int d, int h, int w, int c) { return h * kSw_ + w; }
-};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 /**
 * @brief Compute the offset for the given coordinates in a cube
 * @tparam A \ref layout_concept where each dimension of the cube specifies the corresponding stride.
 */
 template <typename Strides_>
 struct ComputeOffsetFromStrides {
-  static CUTLASS_DEVICE int get(int d, int h, int w, int c) {
+  static CUTLASS_HOST_DEVICE int get(int d, int h, int w, int c) {
     return d * Strides_::kD + h * Strides_::kH + w * Strides_::kW + c * Strides_::kC;
   }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/**
-* @brief Compute the offset for the given coordinates in a cube with a depth of 1
-* @tparam S_h Stride in the H dimension in scalars
-* @tparam S_w Stride in the W dimension in scalars
-* @tparam S_c Stride between two scalars.
-*/
-template <int S_h_, int S_w_, int S_c_>
-struct ComputeOffsetFromStrides<Shape<1, S_h_, S_w_, S_c_> > {
-  static CUTLASS_DEVICE int get(int d, int h, int w, int c) {
-    return h * S_h_ + w * S_w_ + c * S_c_;
-  }
-};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-/**
-* @brief Compute the offset for the given coordinates in a cube with one channel and a depth of 1
-* @tparam S_h Stride in the H dimension in scalars
-* @tparam S_w Stride in the W dimension in scalars
-*/
-template <int S_h_, int S_w_>
-struct ComputeOffsetFromStrides<Shape<1, S_h_, S_w_, 1> > {
-  static CUTLASS_DEVICE int get(int d, int h, int w, int c) { return h * S_h_ + w * S_w_; }
-};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 /**
 * @brief Decompose threadId.x into coordinate of a cube whose dimensions are specified by Threads_.
 * Afterwards compute the offset of those coordinates using Strides_
diff --git a/cutlass/tensor_ref.h b/cutlass/tensor_ref.h
index 8ef31e3b8..09134190c 100644
--- a/cutlass/tensor_ref.h
+++ b/cutlass/tensor_ref.h
@@ -27,125 +27,613 @@
 */
 #pragma once
 
-#include <typeinfo>
-
-#include <cutlass/coord.h>
-#include <cutlass/cutlass.h>
-#include <cutlass/vector.h>
+#include "cutlass/coord.h"
+#include "cutlass/cutlass.h"
+#include "cutlass/vector.h"
 
 namespace cutlass {
 
-////////////////////////////////////////////////////////////////////////////////////////////////////
+///////////////////////////////////////////////////////////////////////////////////////////////////
 
-/// Structure modeling a pointer and stride into a tensor
-template <typename Storage_, int Rank_>
+/// Default mapping function from coordinates in a tensor's index space into the n-D array held
+/// in memory. Assumes StorageRank = Rank
+template <int Rank>
+struct IdentityTensorMapFunc {
+  static int const kStorageRank = Rank;
+  CUTLASS_HOST_DEVICE
+  Coord<Rank> operator()(Coord<Rank> const &coord) const {
+    return coord;
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/* \brief Structure modeling a pointer and stride into a tensor.
+
+  A tensor consists of an index space with Rank_ dimensions. It is stored in memory modeled
+  as an n-D array, where n = StorageRank_. A mapping function maps the logical coordinates of the
+  tensor's index space into the n-D array, and a stride vector maps the n-D array to linear memory.
+
+  CUTLASS requires the n-D array's least significant, "fastest changing" dimension to
+  be contiguous in memory. It therefore has a stride of 1 and is not stored. Construction is offered
+  from vectors of full StorageRank and of the 'compact' rank, though it is in error to construct
+  with the least significant stride != 1.
+
+  The requirement that the least significant dimension be consecutive enables numerous optimizations
+  and assumptions about vectorizing memory accesses throughout CUTLASS. It also matches various
+  BLAS conventions in which only the "leading dimension" or most significant stride of a rank=2
+  matrix is provided.
+
+  This does affect the ability of constructing arbitrary "sparse" 2-D matrices in memory where all
+  stride elements are > 1. This can be overcome by defining a custom mapping function and a
+  StorageRank of 3 or more.
+
+
+  Examples:
+
+  (These examples use helpers for matrix layouts defined in cutlass/matrix_traits.h)
+
+  1. Column-major matrix may be represented as a rank=2 tensor:
+
+    TensorRef<float, 2, MatrixLayout::ColumnMajor> A(ptr_A, make_Coord(ldm, 1));
+
+  2. Row-major matrix may be represented as a rank=2 tensor:
+
+    TensorRef<float, 2, MatrixLayout::RowMajor> B(ptr_A, ldm);
+
+  3. An interleaved matrix may be represented as a rank=2 tensor:
+
+    TensorRef<int8_t, 2, MatrixLayout::ColumnMajorInterleaved<32> > C;
+
+  4. Defining a sparse matrix with arbitrary strides in each dimension
+
+    struct ContiguousLayout {
+
+      /// Arbitrary storage rank
+      static int const kStorageRank = 3;
+
+      /// Mapping function defined by runtime stride configuration
+      CUTLASS_HOST_DEVICE
+      Coord<3> operator()(MatrixCoord const &coord) const {
+          return make_Coord(coord.row(), coord.column(), 0);
+      }
+    };
+
+    typedef TensorRef<float, 2, ContiguousLayout> ContiguousTensorRef;
+
+    // Construct the TensorRef object from a pair of stride values
+    ContiguousTensorRef D(ptr_D, make_Coord(row_stride, column_stride));
+
+
+  5. A helper exists to define a TensorRef for a contiguous matrix whose layout
+     is not known at compile time.
+
+    MatrixLayout::Kind layout;   // Could be MatrixLayout::kRowMajor or MatrixLayout::kColumnMajor
+    int ldm;                     // leading dimension
+
+    ContiguousTensorRef E(ptr_E, ContiguousLayout::stride(layout, ldm));
+
+*/
+template <
+  /// Data type of element stored within tensor
+  typename Storage_,
+  /// Rank of logical tensor
+  int Rank_,
+  /// Maps a Coord<Rank_> in the logical tensor index space to the internal n-D array
+  typename MapFunc_ = IdentityTensorMapFunc<Rank_>,
+  /// Rank of internal n-D array
+  int StorageRank_ = MapFunc_::kStorageRank,
+  /// Index type used for coordinates
+  typename Index_ = int,
+  /// Index type used for offsets and pointer differences
+  typename LongIndex_ = long long
+>
 class TensorRef {
  public:
   /// Data type of individual access
   typedef Storage_ Storage;
 
-  /// Rank of tensor
-  static int const Rank = Rank_;
+  /// Logical rank of tensor index space
+  static int const kRank = Rank_;
+
+  /// Mapping function from logical coordinate to internal n-D array
+  typedef MapFunc_ MapFunc;
+
+  /// Rank of internal storage
+  static int const kStorageRank = StorageRank_;
+
+  /// Index type
+  typedef Index_ Index;
+
+  /// Typically, strides in memory can be very large
+  typedef LongIndex_ LongIndex;
+
+  /// Coordinate in logical tensor space
+  typedef Coord<kRank> TensorCoord;
+
+  /// Coordinate in storage n-D array
+  typedef Coord<kStorageRank> StorageCoord;
+
+  /// Stride vector in storage coordinage space - assumes least significant stride
+  /// is 1 and does not store it.
+  typedef Coord<kStorageRank - 1> StrideVector;
+
+  /// Tensor reference to of constant value
+  typedef TensorRef<
+    typename platform::remove_const<Storage>::type const,
+    Rank_,
+    MapFunc_,
+    StorageRank_,
+    Index_,
+    LongIndex_> ConstTensorRef;
+
+  /// Require at least rank=1. Mathematically, a rank=0 tensor would be considered to be a
+  /// scalar, but degenerate cases such as these are difficult to accommodate without
+  /// extensive C++ metaprogramming or support for zero-length arrays.
+  static_assert(kRank > 0, "Cannot define a zero-rank TensorRef");
+
+  //
+  // Definitions included for backwards compatibility - to be removed in next major release
+  //
+
+  /// Coordinate in logical tensor space
+  typedef TensorCoord Coord_t;
+
+  /// Logical rank of tensor index space
+  static int const Rank = kRank;
 
  private:
-  //
-  // Data members
-  //
 
-  /// Pointer to storage element
+  /// Pointer
   Storage* ptr_;
 
-  /// Stride information
-  Coord<Rank> stride_;
+  /// Stride vector - fastest-changing stride assumed to be 1 and not stored
+  StrideVector stride_;
+
+  /// Maps a logical coordinate to an n-D array's tensor space
+  MapFunc coord_map_;
 
  public:
+
   //
   // Methods
   //
 
-  /// Default ctor
+  /// Helper for 1-D memory. All higher ranks are projected onto the fastest changing rank.
   CUTLASS_HOST_DEVICE
-  TensorRef() : ptr_(nullptr) {}
+  TensorRef(Storage *ptr = nullptr): ptr_(ptr) {
+    for (int i = 0; i < kStorageRank - 1; ++i) {
+      stride_[i] = 1;
+    }
+  }
 
-  /// Constructs from a pointer, size, and stride
+  /// Helper to construct from a pointer and single stride element for 2-D pitch linear memory.
+  // Higher ranks are projected onto the fastest-changing rank.
   CUTLASS_HOST_DEVICE
-  TensorRef(Storage* ptr, Coord<Rank> stride) : ptr_(ptr), stride_(stride) {}
+  TensorRef(Storage* ptr, Index ldm) {
+    ptr_ = ptr;
+    for (int i = 0; i < kStorageRank - 1; ++i) {
+      stride_[i] = ldm;
+    }
+  }
+
+  /// Constructs from a single pointer and stride vector
+  CUTLASS_HOST_DEVICE
+  TensorRef(Storage* ptr, StrideVector const& stride) : ptr_(ptr), stride_(stride) {
+
+  }
+
+  /// Constructs from a pointer and a stride vector of size kRank. If fastest changing
+  /// stride is not 1, construction fails and subsequent calls to good() will return false.
+  CUTLASS_HOST_DEVICE
+  TensorRef(Storage* ptr, StorageCoord const& stride) {
+    // Fastest-changing stride must be one
+    if (stride.at(kStorageRank - 1) == 1) {
+      ptr_ = ptr;
+      for (int i = 0; i < kStorageRank - 1; ++i) {
+        stride_[i] = stride[i];
+      }
+    }
+    else {
+      // Fastest-chaning stride must be 1.
+      reset();
+    }
+  }
+
+  /// Enables conversion from TensorRef of non-const type
+  CUTLASS_HOST_DEVICE
+  TensorRef(
+    TensorRef<
+      typename platform::remove_const<Storage>::type,
+      kRank,
+      MapFunc,
+      kStorageRank,
+      Index,
+      LongIndex> const &ref
+  ):
+    ptr_(ref.data()) {
+    for (int i = 0; i < kStorageRank - 1; ++i) {
+      stride_[i] = ref.stride(i);
+    }
+  }
+
+  /// Returns a reference to constant-valued tensor
+  CUTLASS_HOST_DEVICE
+  ConstTensorRef const_ref() const {
+    return ConstTensorRef(*this);
+  }
+
+  /// Updates only the pointer
+  CUTLASS_HOST_DEVICE
+  void reset(Storage* ptr = nullptr) {
+    ptr_ = ptr;
+  }
 
   /// Updates the pointer, stride, and location within a TensorRef
   CUTLASS_HOST_DEVICE
-  void reset(Storage* ptr = nullptr, Coord<Rank> stride = Coord<Rank>(0)) {
-    ptr_ = ptr;
-    stride_ = stride;
-  }
-
-  /// Conversion function
-  template <typename T>
-  TensorRef<T, Rank> convert() {
-    Coord<Rank> converted_stride;
-    for (int i = 0; i < Rank - 1; ++i) {
-      converted_stride[i] = stride_[i] * Extent<Storage>::kValue / Extent<T>::kValue;
+  void reset(Storage* ptr, StorageCoord const & stride) {
+    // Fastest-changing stride must be one
+    if (stride.at(kStorageRank - 1) == 1) {
+      ptr_ = ptr;
+      for (int i = 0; i < kStorageRank - 1; ++i) {
+        stride_[i] = stride[i];
+      }
+    }
+    else {
+      // Fastest-changing stride must be 1 - this is an error.
+      reset();
     }
-    converted_stride[Rank - 1] = stride_[Rank - 1];
-
-    return TensorRef<T, Rank>(reinterpret_cast<T*>(ptr_), converted_stride);
   }
 
   /// Returns true if the TensorRef may be safely accessed
   CUTLASS_HOST_DEVICE
-  bool good() const { return ptr_ != nullptr; }
+  bool good() const {
+    return ptr_ != nullptr;
+  }
 
   /// Returns the pointer to referenced data
   CUTLASS_HOST_DEVICE
-  Storage* data() const { return ptr_; }
+  Storage * data() const { return ptr_; }
 
   /// Returns the stride of the tensor
   CUTLASS_HOST_DEVICE
-  Coord<Rank> const& stride() const { return stride_; }
+  StorageCoord stride() const {
+    StorageCoord ld;
+    for (int i = 0; i < kStorageRank - 1; ++i) {
+      ld[i] = stride_[i];
+    }
+    ld[kStorageRank - 1] = 1;
+    return ld;
+  }
 
   /// Returns the stride of the tensor in the given dimension
   CUTLASS_HOST_DEVICE
-  int const& stride(int dim) const { return stride_.at(dim); }
+  Index stride(int dim) const {
+    // fastest-changing stride assumbed to be 1
+    if (dim + 1 >= kStorageRank) {
+      return 1;
+    }
+    return stride_.at(dim);
+  }
 
   /// Returns the maximum stride element as the 'leading dimension'
   CUTLASS_HOST_DEVICE
-  int leading_dim() const { return __NV_STD_MAX(stride_[1], stride_[2]); }
+  Index leading_dim(int idx = 0) const { return stride(idx); }
+
+  /// Maps a logical coordinate to an n-D array in memory
+  CUTLASS_HOST_DEVICE
+  StorageCoord map(TensorCoord const &coord) const {
+    return coord_map_(coord);
+  }
 
   /// Computes the offset of an index from the origin of the tensor
   CUTLASS_HOST_DEVICE
-  long long offset(Coord<Rank> const& coord) const {
-    return stride_.template dot<long long>(coord);
+  LongIndex offset(TensorCoord const& coord) const {
+    return stride().template dot<LongIndex>(map(coord));
   }
 
   /// Returns a reference to the element at a given Coord
   CUTLASS_HOST_DEVICE
-  Storage& at(Coord<Rank> const& coord) const { return ptr_[offset(coord)]; }
+  Storage& at(TensorCoord const& coord) const {
+    return ptr_[offset(coord)];
+  }
 
-  /// Element-wise accessor
-  Storage& operator[](Coord<Rank> const& coord) const { return at(coord); }
+  /// Returns a reference to the element at a given linear index
+  CUTLASS_HOST_DEVICE
+  Storage& at(LongIndex idx) const { return ptr_[idx]; }
 
   /// Returns a reference to the element at a given Coord
   CUTLASS_HOST_DEVICE
-  Storage& at(int idx) const { return ptr_[idx]; }
+  Storage& operator[](TensorCoord const& coord) const {
+    return ptr_[offset(coord)];
+  }
 
-  /// Element-wise accessor
-  Storage& operator[](int idx) const { return at(idx); }
-
-  /// Adds an offset to the pointer
+  /// Returns a reference to the element at a given linear index
   CUTLASS_HOST_DEVICE
-  TensorRef& advance(Coord<Rank> const& b) {
-    ptr_ += offset(b);
+  Storage& operator[](LongIndex idx) const { return ptr_[idx]; }
+
+  /// Adds an offset to each pointer
+  CUTLASS_HOST_DEVICE
+  TensorRef & add_pointer_offset(LongIndex delta) {
+    ptr_ += delta;
     return *this;
   }
 
   /// Returns a TensorRef offset by a given amount
   CUTLASS_HOST_DEVICE
-  TensorRef operator+(Coord<Rank> const& b) const { return TensorRef(ptr_ + offset(b), stride_); }
+  TensorRef operator+(TensorCoord const& b) const {
+    TensorRef result(*this);
+    result.add_pointer_offset(offset(b));
+    return result;
+  }
 
   /// Returns a TensorRef offset by a given amount
   CUTLASS_HOST_DEVICE
-  TensorRef operator-(Coord<Rank> const& b) const { return TensorRef(ptr_ - offset(b), stride_); }
+  TensorRef& operator+=(TensorCoord const& b) {
+    add_pointer_offset(offset(b));
+    return *this;
+  }
+
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorRef operator-(TensorCoord const& b) const {
+    TensorRef result(*this);
+    result.add_pointer_offset(-offset(b));
+    return result;
+  }
+
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorRef& operator-=(TensorCoord const& b) {
+    add_pointer_offset(-offset(b));
+    return *this;
+  }
 };
 
-////////////////////////////////////////////////////////////////////////////////////////////////////
+///////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// Partial specializations to handle degenerate cases.
+//
+///////////////////////////////////////////////////////////////////////////////////////////////////
 
-}  // namespace cutlass
+/// Specialization for rank=1 case with no internal StrideVector
+template <
+  /// Data type of element stored within tensor
+  typename Storage_,
+  /// Rank of logical tensor
+  int Rank_,
+  /// Maps a Coord<Rank_> in the logical tensor index space to the internal n-D array
+  typename MapFunc_,
+  /// Index type used for coordinates
+  typename Index_,
+  /// Index type used for offsets and pointer differences
+  typename LongIndex_
+>
+class TensorRef<Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_> {
+ public:
+  /// Data type of individual access
+  typedef Storage_ Storage;
+
+  /// Logical rank of tensor index space
+  static int const kRank = Rank_;
+
+  /// Mapping function from logical coordinate to internal n-D array
+  typedef MapFunc_ MapFunc;
+
+  /// Rank of internal storage
+  static int const kStorageRank = 1;
+
+  /// Index type
+  typedef Index_ Index;
+
+  /// Typically, strides in memory can be very large
+  typedef LongIndex_ LongIndex;
+
+  /// Coordinate in logical tensor space
+  typedef Coord<kRank> TensorCoord;
+
+  /// Coordinate in storage n-D array
+  typedef Coord<kStorageRank> StorageCoord;
+
+  /// Stride vector in storage coordinage space - assumes least significant stride
+  /// is 1 and does not store it.
+  struct StrideVector { };
+
+  /// Tensor reference to of constant value
+  typedef TensorRef<
+    typename platform::remove_const<Storage>::type const,
+    Rank_,
+    MapFunc_,
+    kStorageRank,
+    Index_,
+    LongIndex_> ConstTensorRef;
+
+  //
+  // Definitions included for backwards compatibility - to be removed in next major release
+  //
+
+  /// Coordinate in logical tensor space
+  typedef TensorCoord Coord_t;
+
+  /// Logical rank of tensor index space
+  static int const Rank = kRank;
+
+ private:
+
+  /// Pointer
+  Storage* ptr_;
+
+  /// Maps a logical coordinate to an n-D array's tensor space
+  MapFunc coord_map_;
+
+ public:
+
+  //
+  // Methods
+  //
+
+  /// Helper for 1-D memory. All higher ranks are projected onto the fastest changing rank.
+  CUTLASS_HOST_DEVICE
+  TensorRef(Storage *ptr = nullptr): ptr_(ptr) { }
+
+  /// Constructs from a single pointer and stride vector
+  CUTLASS_HOST_DEVICE
+  TensorRef(Storage* ptr, StrideVector const& stride) : ptr_(ptr) {
+
+  }
+
+  /// Constructs from a pointer and a stride vector of size kRank. If fastest changing
+  /// stride is not 1, construction fails and subsequent calls to good() will return false.
+  CUTLASS_HOST_DEVICE
+  TensorRef(Storage* ptr, StorageCoord const& stride) {
+    // Fastest-changing stride must be one
+    if (stride.at(kStorageRank - 1) == 1) {
+      ptr_ = ptr;
+    }
+    else {
+      // Fastest-chaning stride must be 1.
+      reset();
+    }
+  }
+
+  /// Enables conversion from TensorRef of non-const type
+  CUTLASS_HOST_DEVICE
+  TensorRef(
+    TensorRef<
+      typename platform::remove_const<Storage>::type,
+      kRank,
+      MapFunc,
+      kStorageRank,
+      Index,
+      LongIndex> const &ref
+  ):
+    ptr_(ref.data()) {
+  }
+
+  /// Returns a reference to constant-valued tensor
+  CUTLASS_HOST_DEVICE
+  ConstTensorRef const_ref() const {
+    return ConstTensorRef(*this);
+  }
+
+  /// Updates only the pointer
+  CUTLASS_HOST_DEVICE
+  void reset(Storage* ptr = nullptr) {
+    ptr_ = ptr;
+  }
+
+  /// Updates the pointer, stride, and location within a TensorRef
+  CUTLASS_HOST_DEVICE
+  void reset(Storage* ptr, StorageCoord const & stride) {
+    // Fastest-changing stride must be one
+    if (stride.at(kStorageRank - 1) == 1) {
+      ptr_ = ptr;
+    }
+    else {
+      // Fastest-changing stride must be 1 - this is an error.
+      reset();
+    }
+  }
+
+  /// Returns true if the TensorRef may be safely accessed
+  CUTLASS_HOST_DEVICE
+  bool good() const {
+    return ptr_ != nullptr;
+  }
+
+  /// Returns the pointer to referenced data
+  CUTLASS_HOST_DEVICE
+  Storage * data() const { return ptr_; }
+
+  /// Returns the stride of the tensor
+  CUTLASS_HOST_DEVICE
+  StorageCoord stride() const {
+    StorageCoord ld;
+    ld[kStorageRank - 1] = 1;
+    return ld;
+  }
+
+  /// Returns the stride of the tensor in the given dimension
+  CUTLASS_HOST_DEVICE
+  Index stride(int dim) const {
+    // fastest-changing stride assumbed to be 1
+    return 1;
+  }
+
+  /// Returns the maximum stride element as the 'leading dimension'
+  CUTLASS_HOST_DEVICE
+  Index leading_dim(int idx = 0) const { return 1; }
+
+  /// Maps a logical coordinate to an n-D array in memory
+  CUTLASS_HOST_DEVICE
+  StorageCoord map(TensorCoord const &coord) const {
+    return coord_map_(coord);
+  }
+
+  /// Computes the offset of an index from the origin of the tensor
+  CUTLASS_HOST_DEVICE
+  LongIndex offset(TensorCoord const& coord) const {
+    return stride().template dot<LongIndex>(map(coord));
+  }
+
+  /// Returns a reference to the element at a given Coord
+  CUTLASS_HOST_DEVICE
+  Storage& at(TensorCoord const& coord) const {
+    return ptr_[offset(coord)];
+  }
+
+  /// Returns a reference to the element at a given linear index
+  CUTLASS_HOST_DEVICE
+  Storage& at(LongIndex idx) const { return ptr_[idx]; }
+
+  /// Returns a reference to the element at a given Coord
+  CUTLASS_HOST_DEVICE
+  Storage& operator[](TensorCoord const& coord) const {
+    return ptr_[offset(coord)];
+  }
+
+  /// Returns a reference to the element at a given linear index
+  CUTLASS_HOST_DEVICE
+  Storage& operator[](LongIndex idx) const { return ptr_[idx]; }
+
+  /// Adds an offset to each pointer
+  CUTLASS_HOST_DEVICE
+  TensorRef & add_pointer_offset(LongIndex delta) {
+    ptr_ += delta;
+    return *this;
+  }
+
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorRef operator+(TensorCoord const& b) const {
+    TensorRef result(*this);
+    result.add_pointer_offset(offset(b));
+    return result;
+  }
+
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorRef& operator+=(TensorCoord const& b) {
+    add_pointer_offset(offset(b));
+    return *this;
+  }
+
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorRef operator-(TensorCoord const& b) const {
+    TensorRef result(*this);
+    result.add_pointer_offset(-offset(b));
+    return result;
+  }
+
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorRef& operator-=(TensorCoord const& b) {
+    add_pointer_offset(-offset(b));
+    return *this;
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/cutlass/tensor_ref_collection.h b/cutlass/tensor_ref_collection.h
new file mode 100644
index 000000000..b2972e184
--- /dev/null
+++ b/cutlass/tensor_ref_collection.h
@@ -0,0 +1,420 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Introduces TensorRefCollection concept and defines TensorRefBatch and TensorRefArray. 
+*/
+
+#pragma once
+
+#include "cutlass/tensor_ref.h"
+
+namespace cutlass {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// TensorRefCollection is a concept for storing a logical collection of TensorRef objects. Classes
+// satisfying the TensorRefCollection concept must support the following:
+//
+//   // Define storage type
+//   typedef typename TensorRefCollection::Storage Storage;
+//
+//   // Define a type for offsets in memory
+//   typedef typename TensorRefCollection::LongIndex LongIndex;
+//
+//   // Define a ConstIterator type satisfying TensorRefIterator
+//   typedef typename TensorRefCollection::ConstIterator TensorRefIterator;
+//
+//   // Implement a begin() method.
+//   TensorRefIterator iterator = collection.begin();
+//
+//
+// TensorRefIterator is a concept for accessing an element in a TensorRefCollection. Classes
+// satisfying the TensorRefIterator concept must support the following:
+//
+//   // Define a TensorRef type accessed by the iterator
+//   typedef typename TensorRefIterator::TensorRef TensorRef;
+//
+//   // Access the TensorRef
+//   TensorRef ref = *iterator;
+//
+//   // Pre-increment and post-increment
+//   ++iterator;
+//   iterator++;
+//
+//   // Pre-decrement and post-decrement
+//   --iterator;
+//   iterator--;
+//
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// This satisfies TensorRefCollection and stores a collection of TensorRef objects that
+/// have identical strides. TensorRef objects are separated by a linear stride.
+template <
+  /// Data type of element stored within tensor
+  typename Storage_,
+  /// Rank of logical tensor
+  int Rank_,
+  /// Maps a Coord<Rank_> in the logical tensor index space to the internal n-D array
+  typename MapFunc_ = IdentityTensorMapFunc<Rank_>,
+  /// Rank of internal n-D array
+  int StorageRank_ = MapFunc_::kStorageRank,
+  /// Index type used for coordinates
+  typename Index_ = int,
+  /// Index type used for offsets and pointer differences
+  typename LongIndex_ = long long
+>
+struct TensorRefBatchStrided: 
+  public TensorRef<Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_> {
+
+  //
+  // Type definitions
+  //
+
+  /// Underlying TensorRef type
+  typedef TensorRef<Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_> Base;
+
+  /// Storage type
+  typedef typename Base::Storage Storage;
+
+  /// Index type
+  typedef Index_ Index;
+
+  /// Typically, strides in memory can be very large
+  typedef LongIndex_ LongIndex;
+
+  /// Coordinate in logical tensor space
+  typedef Coord<kRank> TensorCoord;
+
+  /// Tensor reference implied by the TensorRefBatchStrided
+  typedef Base TensorRef;
+
+  /// Constant iterator over tensors implied by TensorRefBatchStrided
+  class ConstIterator {
+  public:
+    /// TensorRef returned by the iterator
+    typedef Base TensorRef;
+
+  private:
+
+    /// Reference to the parent TensorBatchRef object
+    TensorRefBatchStrided const &ref_;
+
+    /// Offset from the base TensorRef pointer 
+    LongIndex offset_;
+
+  public:
+
+    /// Constructs a ConstIterator from a parent TensorRefBatchStrided
+    CUTLASS_HOST_DEVICE
+    ConstIterator(
+      TensorRefBatchStrided const &ref, 
+      LongIndex offset = 0): ref_(ref), offset_(offset) { }
+
+    /// Obtains a TensorRef pointed to by the iterator
+    CUTLASS_HOST_DEVICE
+    TensorRef *operator() const {
+      TensorRef ref(ref_);
+      ref.add_pointer_offset(offset_);
+      return ref;
+    }
+
+    /// Advances the iterator to point to the next tensor
+    CUTLASS_HOST_DEVICE
+    ConstIterator &operator++() {
+      offset_ += ref_.tensor_stride;
+      return *this;
+    }
+
+    /// Advances the iterator to point to the next tensor
+    CUTLASS_HOST_DEVICE
+    ConstIterator operator++(int) {
+      ConstIterator ret(*this);
+      offset_ += ref_.tensor_stride;
+      return ret;
+    }
+
+    /// Returns an iterator advanced by (idx) amount
+    CUTLASS_HOST_DEVICE
+    ConstIterator operator+(Index idx) {
+      return ConstIterator(ref, offset_ + ref_.tensor_stride * idx);
+    }
+
+    /// Advances this iterator by (idx) and returns a reference to self
+    CUTLASS_HOST_DEVICE
+    ConstIterator &operator+=(Index idx) {
+      offset_ += ref_.tensor_stride * idx;
+      return *this;
+    }
+
+    /// Moves to the previous tensor
+    CUTLASS_HOST_DEVICE
+    ConstIterator &operator--() {
+      offset_ -= ref_.tensor_stride;
+      return *this;
+    }
+
+    /// Moves to the previous tensor
+    CUTLASS_HOST_DEVICE
+    ConstIterator operator--(int) {
+      ConstIterator ret(*this);
+      offset_ -= ref_.tensor_stride;
+      return ret;
+    }
+
+    /// Returns an iterator moved forward by (idx) amount
+    CUTLASS_HOST_DEVICE
+    ConstIterator operator-(Index idx) {
+      return ConstIterator(ref_, offset_ - ref_.tensor_stride * idx);
+    }
+
+    /// Moves this iterator by (idx) and returns a reference to self
+    CUTLASS_HOST_DEVICE
+    ConstIterator &operator-=(Index idx) {
+      offset_ -= ref_.tensor_stride * idx;
+      return *this;
+    }
+
+    /// Returns the difference in offset between two iterators
+    CUTLASS_HOST_DEVICE
+    Stride operator-(ConstIterator const &it) {
+      return offset_ - it.offset_;
+    }
+  };
+
+  //
+  // Data members
+  //
+
+  /// Stride between tensors
+  LongIndex tensor_stride;
+
+  //
+  // Methods
+  //
+
+  // Default ctor
+  CUTLASS_HOST_DEVICE
+  TensorRefBatchStrided(): tensor_stride(0) { }
+
+  // Constructs form a tensor reference and 
+  CUTLASS_HOST_DEVICE
+  TensorRefBatchStrided(TensorRef const &ref, LongIndex _tensor_stride = 0): 
+    TensorRef(ref), 
+    tensor_stride(_tensor_stride) { }
+
+  /// Gets the pointer offset
+  CUTLASS_HOST_DEVICE
+  LongIndex get_pointer_offset(Index idx) const {
+    return idx * tensor_stride;
+  }
+
+  // Returns a reference
+  CUTLASS_HOST_DEVICE
+  TensorRef at(Index idx) const {
+    TensorRef ref(*this);
+    ref.add_pointer_offset(get_pointer_offset(idx));
+    return ref;
+  }
+
+  /// Returns an iterator
+  CUTLASS_HOST_DEVICE
+  ConstIterator begin() {
+    return ConstIterator(*this);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// This satisfies TensorRefCollection and stores a collection of TensorRef objects. This is a
+/// structure of arrays in that the individual members of the TensorRef are held in distinct arrays.
+///
+/// Note, TensorRef maps a logical coordinate space to an n-D array with rank kStorageRank. It
+/// maintains a stride vector of similar rank, but the least significant rank is defined to be 1.
+///
+/// The least significant stride of 1 is not stored, and therefore the number of stride arrays is 
+/// kStorageRank - 1.
+template <
+  /// Data type of element stored within tensor
+  typename Storage_,
+  /// Rank of logical tensor
+  int Rank_,
+  /// Maps a Coord<Rank_> in the logical tensor index space to the internal n-D array
+  typename MapFunc_ = IdentityTensorMapFunc<Rank_>,
+  /// Rank of internal n-D array
+  int StorageRank_ = MapFunc_::kStorageRank,
+  /// Index type used for coordinates
+  typename Index_ = int,
+  /// Index type used for offsets and pointer differences
+  typename LongIndex_ = long long
+>
+struct TensorRefArray {
+  //
+  // Type definitions
+  //
+
+  /// TensorRef type obtained from the TensorRefArray
+  typedef TensorRef<Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_> TensorRef;
+
+  /// Element pointed to by the TensorRef
+  typedef Storage_ Storage;
+
+  /// Index type
+  typedef Index_ Index;
+
+  /// Typically, strides in memory can be very large
+  typedef LongIndex_ LongIndex;
+
+  /// Rank of the stride vector
+  static int const kStorageRank = TensorRef::kStorageRank;
+
+  /// TensorRefIterator over TensorRef objects in TensorRefArray 
+  class ConstIterator {
+  public:
+
+    /// TensorRef returned by the iterator
+    typedef Base TensorRef;
+
+  private:
+    /// Reference to the TensorRefArray
+    TensorRefArray const &ref_;
+
+    /// Index into TensorRefArray
+    int idx_;
+
+  public:
+
+    /// Constructs a ConstIterator over the TensorRef objects
+    CUTLASS_HOST_DEVICE
+    ConstIterator(TensorArrayRef const &ref, int idx = 0): ref_(ref), idx_(idx) { }
+
+    /// Obtains a TensorRef pointed to by this iterator
+    CUTLASS_HOST_DEVICE
+    TensorRef *operator() const {
+      return ref_.reference(idx_);
+    }
+
+    /// Advances to next TensorRef
+    CUTLASS_HOST_DEVICE
+    ConstIterator &operator++() {
+      ++idx_;
+      return *this;
+    }
+
+    /// Advances to next TensorRef
+    CUTLASS_HOST_DEVICE
+    ConstIterator operator++(int) {
+      ConstIterator ret(*this);
+      idx_ ++;
+      return ret;
+    }
+
+    CUTLASS_HOST_DEVICE
+    ConstIterator operator+(Index idx) {
+      return ConstIterator(ref_, idx_ + idx);
+    }
+
+    CUTLASS_HOST_DEVICE
+    ConstIterator &operator+=(Index idx) {
+      idx_ += idx;
+      return *this;
+    }
+
+    CUTLASS_HOST_DEVICE
+    ConstIterator &operator--() {
+      --idx_;
+      return *this;
+    }
+
+    /// Advances to next TensorRef
+    CUTLASS_HOST_DEVICE
+    ConstIterator operator--(int) {
+      ConstIterator ret(*this);
+      --idx_;
+      return ret;
+    }
+
+    CUTLASS_HOST_DEVICE
+    ConstIterator &operator-=(Index idx) {
+      idx_ -= idx;
+      return *this;
+    }
+
+    CUTLASS_HOST_DEVICE
+    ConstIterator operator-(Index idx) {
+      return ConstIterator(ref_, idx_ + idx);
+    }
+  };
+
+  //
+  // Data members
+  //
+
+  /// Base addresses
+  Storage **pointers;
+
+  /// Array of strides
+  Index *strides[kStorageRank - 1];
+
+  //
+  // Methods
+  //
+
+  // Default ctor
+  CUTLASS_HOST_DEVICE
+  TensorArrayRef() { }
+
+  // Construct from pointers to arrays to strides
+  CUTLASS_HOST_DEVICE
+  TensorArrayRef(
+    Storage **_pointers,
+    Index _strides[kStorageRank - 1]): pointers(_pointers) { 
+
+    // Copy pointers to strides arrays
+    for (int i = 0; i < kStorageRank - 1; ++i) {
+      strides[i] = _strides[i];
+    }
+  }
+
+  // Returns a TensorRef at the given index in the collection
+  CUTLASS_HOST_DEVICE
+  TensorRef at(Index idx) const {
+    Coord<kStorageRank - 1, Index> stride;
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < kStorageRank - 1; ++i) {
+      stride[i] = stride_[idx][i];
+    }
+    return TensorRef(pointers[idx], stride);
+  }
+
+  /// Returns an TesnorRefIterator over the TensorRef objects in this collection
+  CUTLASS_HOST_DEVICE
+  ConstIterator begin() {
+    return ConstIterator(*this);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/cutlass/tensor_view.h b/cutlass/tensor_view.h
index 89c6bd571..4ef99e027 100644
--- a/cutlass/tensor_view.h
+++ b/cutlass/tensor_view.h
@@ -24,51 +24,110 @@
  **************************************************************************************************/
 /*! \file
     \brief Defines a structure containing strides and a pointer to tensor data.
+
+    TensorView is derived from TensorRef and contributes bounds to the tensor's index space. Thus,
+    it is a complete mathematical object and may be used in tensor algorithms. It is decoupled from
+    data storage and is therefore lightweight and may be embedded in larger tensor objects or
+    memory structures.
+
+    See cutlass/tensor_ref.h for more details about the mapping of the logical tensor index space to
+    linear memory.
 */
 
 #pragma once
 
 #include <cmath>
 
-#include <cutlass/cutlass.h>
-#include <cutlass/tensor_ref.h>
+#include "cutlass/cutlass.h"
+#include "cutlass/tensor_ref.h"
 
 namespace cutlass {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/// Host-side reference implementation of tensor operations
-template <typename T>
-class TensorView : public TensorRef<T, 4> {
+/// Defines a view into a logical tensor
+template <
+  /// Data type of element stored within tensor
+  typename Storage_,
+  /// Rank of logical tensor
+  int Rank_ = 4,
+  /// Maps a Coord<Rank_> in the logical tensor index space to the internal n-D array
+  typename MapFunc_ = IdentityTensorMapFunc<Rank_>,
+  /// Rank of internal n-D array
+  int StorageRank_ = MapFunc_::kStorageRank,
+  /// Index type used for coordinates
+  typename Index_ = int,
+  /// Index type used for offsets and pointer differences
+  typename LongIndex_ = long long
+>
+class TensorView : public TensorRef<Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_> {
  public:
-  /// Reference and stride
-  typedef TensorRef<T, 4> Base;
+  /// Base tensor reference
+  typedef TensorRef<Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_> Base;
 
-  /// Reference and stride
-  typedef Base TensorRef_t;
+  /// Tensor reference to of constant value
+  typedef TensorRef<
+    typename platform::remove_const<Storage_>::type const,
+    Rank_,
+    MapFunc_,
+    StorageRank_,
+    Index_,
+    LongIndex_> ConstTensorRef;
 
-  /// Reference to constant type
-  typedef TensorRef<T const, 4> ConstTensorRef_t;
+  /// Base tensor reference
+  typedef Base TensorRef;
 
-  /// Rank of tensor
-  static int const Rank = TensorRef_t::Rank;
+  /// Storage type
+  typedef typename Base::Storage Storage;
+
+  /// Index type
+  typedef typename Base::Index Index;
+
+  /// Coordinate in logical tensor space
+  typedef typename TensorRef::TensorCoord TensorCoord;
+
+  /// Coordinate in storage n-D array
+  typedef typename TensorRef::StorageCoord StorageCoord;
+
+  /// Stride vector in storage coordinate space
+  /// Least significant stride is = 1 and not stored
+  typedef typename TensorRef::StrideVector StrideVector;
+
+  /// TensorView of constant value
+  typedef TensorView<
+    typename platform::remove_const<Storage>::type const,
+    Rank_,
+    MapFunc_,
+    StorageRank_,
+    Index_,
+    LongIndex_> ConstTensorView;
+
+  //
+  // Definitions included for backwards compatibility - to be removed in next major release
+  //
+
+  /// Coordinate in logical tensor space
+  typedef TensorCoord Coord_t;
+
+  /// Logical rank of tensor index space
+  static int const Rank = Base::kRank;
 
   /// Type used to compute the offset of an element to the base of a tensor
-  typedef int Offset_t;
+  typedef typename Base::LongIndex Offset_t;
 
-  /// Coordinate into tensor
-  typedef Coord<Rank> Coord_t;
+  /// Base class
+  typedef TensorRef TensorRef_t;
+
+  /// TensorRef to const-valued type
+  typedef typename TensorRef::ConstTensorRef ConstTensorRef_t;
 
  private:
   //
   // Data members
   //
 
-  /// Pointer to pitch-linear memory
-  TensorRef_t ref_;
-
   /// Dimensions of coordinate (independent of stride)
-  Coord_t size_;
+  TensorCoord size_;
 
  public:
   //
@@ -79,91 +138,126 @@ class TensorView : public TensorRef<T, 4> {
   CUTLASS_HOST_DEVICE
   TensorView() {}
 
-  /// Constructs a Tensor_view from a TensorRef and size
+  /// Constructs a TensorView from a TensorRef and size
   CUTLASS_HOST_DEVICE
-  TensorView(TensorRef_t const& _ref, Coord_t const& _size) : Base(_ref), size_(_size) {}
+  TensorView(Base const& _ref, TensorCoord const& _size) : Base(_ref), size_(_size) {}
 
-  /// Returns true if the Tensor_view is bound to some memory
+  /// Constructs a TensorView from a pointer, a stride vector, and size
   CUTLASS_HOST_DEVICE
-  bool good() const { return ref().good(); }
+  TensorView(
+    Storage *ptr,
+    StrideVector const &stride,
+    TensorCoord const& size
+  ):
+    Base(ptr, stride), size_(size) {}
 
-  /// Returns a pointer to data
+  /// Constructs a TensorView from a pointer, a stride vector, and size
   CUTLASS_HOST_DEVICE
-  T* data() const { return ref().data(); }
+  TensorView(
+    Storage *ptr,
+    StorageCoord const &stride,
+    TensorCoord const& size
+  ):
+    Base(ptr, stride), size_(size) {}
 
   /// Updates the reference and size of a Tensor_view object
   CUTLASS_HOST_DEVICE
-  void reset(TensorRef_t const& _ref = TensorRef_t(0), Coord_t const& _size = Coord_t()) {
+  void reset(Base const& _ref = Base(), TensorCoord const& _size = TensorCoord()) {
     Base::operator=(_ref);
     size_ = _size;
   }
 
-  /// Accesses the tensor reference pointing to data
+  /// Accesses the size
   CUTLASS_HOST_DEVICE
-  TensorRef_t& ref() { return *this; }
-
-  ///
-  CUTLASS_HOST_DEVICE
-  ConstTensorRef_t const_ref() { return ConstTensorRef_t(data(), stride()); }
-
-  /// Accesses the tensor reference pointing to data
-  CUTLASS_HOST_DEVICE
-  TensorRef_t const& ref() const { return *this; }
+  TensorCoord const& size() const { return size_; }
 
   /// Accesses the size
   CUTLASS_HOST_DEVICE
-  Coord_t const& size() const { return size_; }
-
-  /// Accesses the size
-  CUTLASS_HOST_DEVICE
-  int size(int dim) const { return size_.at(dim); }
-
-  /// Accesses the stride
-  CUTLASS_HOST_DEVICE
-  Coord_t const& stride() const { return ref().stride(); }
-
-  /// Accesses the stride
-  CUTLASS_HOST_DEVICE
-  int const& stride(int dim) const { return ref().stride(dim); }
+  Index size(int dim) const { return size_.at(dim); }
 
   /// Assigns the Tensor_view
   CUTLASS_HOST_DEVICE
   TensorView& operator=(TensorView const& _tensor) {
-    Base::operator=(_tensor._ref);
+    Base::operator=(_tensor);
     size_ = _tensor.size_;
     return *this;
   }
 
-  /// Returns the index of an element
-  CUTLASS_HOST_DEVICE
-  Offset_t offset(Coord_t const& coord) const { return ref().offset(coord); }
-
   /// Determines whether a location is within a tensor
   CUTLASS_HOST_DEVICE
-  bool contains(Coord_t const& coord) const {
-    for (int dim = 0; dim < Rank; ++dim) {
-      if (coord.at(dim) >= size_.at(dim)) {
+  bool contains(TensorCoord const& coord) const {
+    CUTLASS_PRAGMA_UNROLL
+    for (int dim = 0; dim < Rank_; ++dim) {
+      if (coord[dim] >= size_[dim]) {
         return false;
       }
     }
     return true;
   }
 
-  /// Element-wise accessor
+  /// Returns a TensorRef pointing to the first element of the tensor.
   CUTLASS_HOST_DEVICE
-  T& at(Coord_t const& coord) const { return ref().at(coord); }
+  TensorRef ref() const {
+    return TensorRef(*this);
+  }
 
-  /// Element-wise accessor
-  T& operator[](Coord<Rank> const& coord) const { return at(coord); }
-
-  /// Element-wise accessor
+  /// Returns a TensorRef pointing to the first element of the tensor.
   CUTLASS_HOST_DEVICE
-  T& at(Offset_t idx) const { return ref().at(idx); }
+  ConstTensorRef const_ref() const {
+    return ConstTensorRef(*this);
+  }
 
   /// Returns a Tensor_view given location and size quantities
   CUTLASS_HOST_DEVICE
-  TensorView<T> subview(Coord_t const& location, Coord_t size) const {
-    return TensorView<T>(ref() + location, size.clamp(size_ - location));
+  TensorView subview(TensorCoord const& location, TensorCoord size) const {
+    return TensorView((*this) + location, size.clamp(size_ - location));
+  }
+
+  /// Returns the number of scalar elements needed to store tensor
+  CUTLASS_HOST_DEVICE
+  size_t capacity() const {
+    int max_rank = 0;
+
+    StorageCoord mapped_size(this->map(size()));
+
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < Base::kStorageRank; ++i) {
+      if (!i ||
+        this->stride(i) * mapped_size[i] > this->stride(max_rank) * mapped_size[max_rank]) {
+        max_rank = i;
+      }
+    }
+    return this->stride(max_rank) * mapped_size[max_rank];
+  }
+
+  /// Returns a TensorView offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorView operator+(TensorCoord const& b) const {
+    TensorView result(*this);
+    result.add_pointer_offset(this->offset(b));
+    return result;
+  }
+
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorView& operator+=(TensorCoord const& b) {
+    this->add_pointer_offset(this->offset(b));
+    return *this;
+  }
+
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorView operator-(TensorCoord const& b) const {
+    TensorRef result(*this);
+    result.add_pointer_offset(-this->offset(b));
+    return result;
+  }
+
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  TensorView& operator-=(TensorCoord const& b) {
+    this->add_pointer_offset(-this->offset(b));
+    return *this;
   }
 };
 
diff --git a/cutlass/tile_allocation.h b/cutlass/tile_allocation.h
new file mode 100644
index 000000000..81db797f9
--- /dev/null
+++ b/cutlass/tile_allocation.h
@@ -0,0 +1,143 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Defines a fragment based on a Shape<> template.
+*/
+#pragma once
+
+#include "cutlass/shape.h"
+#include "cutlass/fragment.h"
+#include "cutlass/tensor_ref.h"
+#include "cutlass/zip_tensor_ref.h"
+
+namespace cutlass {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Class for storing a tile in memory and accessing it through a tensor ref
+template <typename Scalar_, typename Shape_>
+struct TileAllocation {
+  //
+  // Type definitions
+  //
+
+  /// Scalar element
+  typedef Scalar_ Scalar;
+
+  /// The actual storage (may differ from the scalar type)
+  typedef typename StorageType<sizeof(Scalar)>::Type Storage;
+
+  /// Size of the allocation in units of scalars
+  typedef Shape_ Shape;
+
+  /// Strides
+  typedef typename ShapeStrides<Shape, 1>::Shape Strides;
+
+  /// Defines the tensor reference for this allocation
+  typedef TensorRef<Scalar const, 4> ConstTensorRef;
+
+  /// Defines the tensor reference for this allocation
+  typedef TensorRef<Scalar, 4> TensorRef;
+
+  //
+  // Data members
+  //
+
+  /// Storage
+  Storage storage[Shape::kD][Shape::kH][Shape::kW][Shape::kC];
+
+  //
+  // Methods
+  //
+
+  /// Returns a pointer to the raw data
+  CUTLASS_DEVICE
+  Scalar *data() { return reinterpret_cast<Scalar *>(&storage[0][0][0][0]); }
+
+  /// Returns a const pointer to the raw data
+  CUTLASS_DEVICE
+  Scalar const *data() const { return reinterpret_cast<Scalar const *>(&storage[0][0][0][0]); }
+
+  /// Returns a TensorRef object pointing to the data
+  CUTLASS_DEVICE
+  TensorRef reference() {
+    return TensorRef(data(), make_Coord(Strides::kD, Strides::kH, Strides::kW, Strides::kC));
+  }
+
+  /// Returns a TensorRef object pointing to the data
+  CUTLASS_DEVICE
+  ConstTensorRef reference() const {
+    return ConstTensorRef(data(), make_Coord(Strides::kD, Strides::kH, Strides::kW, Strides::kC));
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Manages a pair of tile allocations as if they are one allocation
+template <typename First_, typename Second_>
+struct ZipTileAllocation {
+  //
+  // Type definitions
+  //
+
+  /// First tensor allocation
+  typedef First_ First;
+
+  /// Second tensor allocation
+  typedef Second_ Second;
+
+  /// Defines the tensor reference for this allocation
+  typedef ZipTensorRef<typename First::TensorRef, typename Second::TensorRef> TensorRef;
+
+  /// Defines the tensor reference for this allocation
+  typedef ZipTensorRef<typename First::ConstTensorRef, typename Second::ConstTensorRef>
+      ConstTensorRef;
+
+  //
+  // Data members
+  //
+
+  /// First tensor allocation
+  First first;
+
+  /// Second tensor allocation
+  Second second;
+
+  //
+  // Methods
+  //
+
+  /// Returns a TensorRef object pointing to the data
+  CUTLASS_DEVICE
+  TensorRef reference() { return TensorRef(first.reference(), second.reference()); }
+
+  /// Returns a TensorRef object pointing to the data
+  CUTLASS_DEVICE
+  ConstTensorRef reference() const { return ConstTensorRef(first.reference(), second.reference()); }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/cutlass/tile_coord.h b/cutlass/tile_coord.h
new file mode 100644
index 000000000..b3d809bc3
--- /dev/null
+++ b/cutlass/tile_coord.h
@@ -0,0 +1,194 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Defines a coordinate used for the CUTLASS 4-D tile structure. 
+*/
+
+#pragma once
+
+#include "cutlass/coord.h"
+
+namespace cutlass {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// TileCoord wraps Coord<4, int> to provide a helper for accessing named dimensions. Classes
+/// expecting a coordinate in the rank=4 index space of a CUTLASS tile structure should use TileCoord. 
+template <typename Index_ = int>
+struct TileCoord : public Coord<4, Index_> {
+  
+  /// Index type
+  typedef Index_ Index;
+
+  /// Underlying Coord<4>
+  typedef Coord<4, Index> Base;
+
+  /// D dimension
+  static int kD = 0;
+
+  /// H dimension
+  static int kH = 1;
+
+  /// W dimension
+  static int kW = 2;
+
+  /// C dimension
+  static int kC = 3;
+
+  //
+  // Methods
+  //
+
+  /// Default ctor
+  CUTLASS_HOST_DEVICE
+  TileCoord() { }
+
+  /// Constructs from Coord<3> and infers coord[kC] = 0
+  CUTLASS_HOST_DEVICE
+  TileCoord(Coord<3, Index> const &coord): 
+    Base(make_Coord(coord[0], coord[1], coord[2], 0)) { }
+
+  /// Constructs from Coord<4>
+  CUTLASS_HOST_DEVICE
+  TileCoord(Coord<4, Index> const &coord): Base(coord) { }
+
+  /// Constructs from an array of coordinate elements
+  CUTLASS_HOST_DEVICE
+  TileCoord(Index coord[4]): Base(coord) { }
+  
+  /// Helper to construct from a row and column
+  CUTLASS_HOST_DEVICE
+  TileCoord(Index d, Index h, Index w, Index c): Base(make_Coord(d, h, w, c)) { }
+
+  /// Returns the D element of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & d() const { return this->at(kD); }
+
+  /// Returns the D element of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index & d() { return this->at(kD); }
+
+  /// Returns the H element of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & h() const { return this->at(kH); }
+
+  /// Returns the H element of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index & h() { return this->at(kH); }
+
+  /// Returns the W element of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & w() const { return this->at(kW); }
+
+  /// Returns the W element of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index & w() { return this->at(kW); }
+
+  /// Returns the Celement of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index const & c() const { return this->at(kC); }
+
+  /// Returns the C element of the coordinate
+  CUTLASS_HOST_DEVICE
+  Index & c() { return this->at(kC); }
+
+  /// Gets H and W dimensions as a Coord<2>
+  CUTLASS_HOST_DEVICE
+  Coord<2> hw() const {
+    return make_Coord(h(), w());
+  }
+
+  /// Gets H, W, and C dimensions as a Coord<3>
+  CUTLASS_HOST_DEVICE
+  Coord<3> hwc() const {
+    return make_Coord(h(), w(), c());
+  }
+
+  /// Gets D, H, and W dimensions as a Coord<3>
+  CUTLASS_HOST_DEVICE
+  Coord<3> dhw() const {
+    return make_Coord(d(), h(), w());
+  }
+
+  //
+  // Coord operators
+  //
+
+  /// Element-wise addition
+  CUTLASS_HOST_DEVICE
+  TileCoord operator+(Base const& b) const {
+    return TileCoord(Base::operator+(b));
+  }
+
+  /// Element-wise subtraction
+  CUTLASS_HOST_DEVICE
+  TileCoord operator-(Base const& b) const {
+    return TileCoord(Base::operator-(b));
+  }
+
+  /// Element-wise multiplication
+  CUTLASS_HOST_DEVICE
+  TileCoord operator*(Base const& b) const {
+    return TileCoord(Base::operator*(b));
+  }
+
+  /// Element-wise division
+  CUTLASS_HOST_DEVICE
+  TileCoord operator/(Base const& b) const {
+    return TileCoord(Base::operator/(b));
+  }
+
+  /// In-place addition
+  CUTLASS_HOST_DEVICE
+  TileCoord& operator+=(Base const& b) {
+    Base::operator+=(b);
+    return *this;
+  }
+
+  /// In-place subtraction
+  CUTLASS_HOST_DEVICE
+  TileCoord& operator-=(Base const& b) {
+    Base::operator-=(b);
+    return *this;
+  }
+
+  /// In-place multiplication
+  CUTLASS_HOST_DEVICE
+  TileCoord& operator*=(Base const& b) {
+    Base::operator*=(b);
+    return *this;
+  }
+
+  /// In-place division
+  CUTLASS_HOST_DEVICE
+  TileCoord& operator/=(Base const& b) {
+    Base::operator/=(b);
+    return *this;
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/cutlass/tile_iterator.h b/cutlass/tile_iterator.h
index 5d39c4f80..51e577949 100644
--- a/cutlass/tile_iterator.h
+++ b/cutlass/tile_iterator.h
@@ -28,10 +28,13 @@
 */
 #pragma once
 
-#include <cutlass/fragment.h>
-#include <cutlass/load_store.h>
-#include <cutlass/predicate_vector.h>
-#include <cutlass/vector.h>
+#include "cutlass/coord.h"
+#include "cutlass/tensor_ref.h"
+#include "cutlass/fragment.h"
+#include "cutlass/load_store.h"
+#include "cutlass/predicate_vector.h"
+#include "cutlass/vector.h"
+#include <cstdio>
 
 namespace cutlass {
 
@@ -61,12 +64,6 @@ as a Coord<4>.
 struct IteratorAdvance {
   enum Kind { kD, kH, kW };
 };
-
-/// Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix
-struct IteratorFragment {
-  enum Kind { kScalar, kWmmaMatrix };
-};
-
 ///////////////////////////////////////////////////////////////////////////////////////////////////
 
 /**
@@ -77,7 +74,7 @@ template <typename Tile_,
           typename Delta_,
           typename Iterations_,
           typename ThreadOffset_,
-          int kAccessSize>
+          int AccessSize>
 struct TileTraits {
   /// Shape of the tile
   typedef Tile_ Tile;
@@ -89,11 +86,52 @@ struct TileTraits {
   typedef Iterations_ Iterations;
 
   /// Functor that returns the logical coordinate of each entity's initial offset in the tile
+  //
+  // ThreadOffset should be a functor defined like:
+  //
+  // struct ThreadOffsetExample {
+  //   CUTLASS_DEVICE
+  //   Coord<4> operator()() const {
+  //      return make_Coord(0, threadIdx.y, threadIdx.x, 0);
+  //   }
+  // };
+  //
   typedef ThreadOffset_ ThreadOffset;
+
+  /// Strides for immediate offset computation
+  typedef Shape<0, 0, 0, 0> ImmediateOffsetStrides;
+
+  /// Access size
+  static int const kAccessSize = AccessSize;
 };
 
 ///////////////////////////////////////////////////////////////////////////////////////////////////
 
+/// Functor computing a predicate given the logical position of an access
+template <typename Delta_>
+struct RegularTilePredicateFunctor {
+  typedef Delta_ Delta;
+
+  /// Dimensions of the bounding volume
+  Coord<3> bounds;
+
+  /// Constructs a predicate functor given the bounds of a tensor
+  CUTLASS_HOST_DEVICE
+  RegularTilePredicateFunctor(Coord<3> _bounds) : bounds(_bounds) {}
+
+  /// Computes the predicate given the logical position of an access
+  CUTLASS_HOST_DEVICE
+  bool operator()(Coord<3> iteration, Coord<3> offset) const {
+    return (iteration[0] * Delta::kD + offset[0] < bounds[0]) &&
+           (iteration[1] * Delta::kH + offset[1] < bounds[1]) &&
+           (iteration[2] * Delta::kW + offset[2] < bounds[2]);
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename T>
+struct DumpType {};
 /// Iterator for accessing a stripmined tile in memory
 template <typename Traits_,
           typename Scalar_,
@@ -101,7 +139,7 @@ template <typename Traits_,
           MemorySpace::Kind MemorySpace = MemorySpace::kGeneric,
           typename Index_ = int,
           typename FragmentElement_ = Scalar_,
-          IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar,
+          FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar,
           typename Skew_ = Shape<0, 0, 0, 0> >
 struct TileIteratorBase {
   /// concept TileTraits
@@ -117,7 +155,7 @@ struct TileIteratorBase {
   static IteratorAdvance::Kind const kAdvance = Advance_;
 
   /// Specifies iterator storage fragment type (Scalar or WmmaMatrix)
-  static IteratorFragment::Kind const kIteratorFragment = IteratorFragment_;
+  static FragmentElementType::Kind const kFragmentElementType = FragmentElementType_;
 
   /// Source or destination memory space
   static MemorySpace::Kind const kMemorySpace = MemorySpace;
@@ -144,18 +182,19 @@ struct TileIteratorBase {
   typedef typename Traits::ThreadOffset ThreadOffset;
 
   /// The number of scalars accessed per load/store.
-  static int const kAccessSize = Tile::kC;
+  static int const kAccessSize = Traits::kAccessSize;
 
   /// The elements loaded/store by one instruction.
   typedef typename Vectorize<FragmentElement, kAccessSize>::Type AccessType;
 
   /// The size of storage needed per fragment
   static int const kFragmentSize =
-      (kIteratorFragment == IteratorFragment::kWmmaMatrix ? 16 : sizeof(AccessType));
+      (kFragmentElementType == FragmentElementType::kWmmaMatrix ? 16 : sizeof(AccessType));
   /// The storage.
   typedef Fragment<Scalar, ShapeCount<Tile>::kCount, kFragmentSize> Storage;
   /// The fragment.
   typedef Fragment<FragmentElement, ShapeCount<Iterations>::kCount * kAccessSize> Fragment;
+
   /// The fragment iterator.
   typedef FragmentIterator<Fragment, Iterations, AccessType> FragmentIterator;
   /// The fragment const iterator.
@@ -172,25 +211,61 @@ struct TileIteratorBase {
 
   /// Parameters to the iterator
   struct Params {
-    Index stride_d;
+
+    //
+    // Dat members
+    //
+
+    long long stride_d;
     Index stride_h;
     Index stride_w;
 
-    Index inc_d;
+    long long inc_d;
     Index inc_h;
     Index inc_w;
 
-    Index inc_advance;
+    long long inc_advance;
+
+    //
+    // Methods
+    //
+
+    /// Constructs params
+    CUTLASS_HOST_DEVICE
+    Params() : stride_d(0), stride_h(0), stride_w(0), inc_d(0), inc_h(0), inc_w(0) {}
+
+    /// Constructs params
+    CUTLASS_HOST_DEVICE
+    Params(long long _stride_d,
+           Index _stride_h,
+           Index _stride_w,
+           long long _inc_d,
+           Index _inc_h,
+           Index _inc_w,
+           long long _inc_advance)
+        : stride_d(_stride_d),
+          stride_h(_stride_h),
+          stride_w(_stride_w),
+          inc_d(_inc_d),
+          inc_h(_inc_h),
+          inc_w(_inc_w),
+          inc_advance(_inc_advance) {}
+
+    /// Constructs params with a stride vector
+    CUTLASS_HOST_DEVICE
+    Params(Coord<4> const &stride) {
+      initialize(stride);
+    }
 
     /// Initializes params
     CUTLASS_HOST_DEVICE
-    int initialize(Index _stride_d,
+    int initialize(long long _stride_d,
                    Index _stride_h,
                    Index _stride_w,
-                   Index _inc_d,
+                   long long _inc_d,
                    Index _inc_h,
                    Index _inc_w,
-                   Index _inc_advance) {
+                   long long _inc_advance) {
       stride_d = _stride_d;
       stride_h = _stride_h;
       stride_w = _stride_w;
@@ -203,61 +278,79 @@ struct TileIteratorBase {
       return 0;
     }
 
+    /// Initializes the parameters object from a vector of strides
     CUTLASS_HOST_DEVICE
-    int initialize(Index _stride_d, Index _stride_h, Index _stride_w) {
+    int initialize(Coord<4> const &stride) {
+      return initialize(stride[0], stride[1], stride[2]);
+    }
+
+    /// Initializes the parameters object from a vector of strides
+    CUTLASS_HOST_DEVICE
+    int initialize(long long _stride_d, Index _stride_h, Index _stride_w) {
       stride_d = _stride_d;
       stride_h = _stride_h;
       stride_w = _stride_w;
 
       inc_w = stride_w * Delta::kW;
       inc_h = stride_h * Delta::kH - stride_w * Delta::kW * (Iterations::kW - 1);
+      inc_d = stride_d * Delta::kD - stride_h * Delta::kH * (Iterations::kH - 1) -
+              stride_w * Delta::kW * (Iterations::kW - 1);
+
+      inc_advance = 0;
 
       if (kAdvance == IteratorAdvance::kH) {
         // Advance in the H dimension.
-        inc_d = 0;
+        inc_advance = Tile::kH * stride_h;
       } else if (kAdvance == IteratorAdvance::kW) {
         // Advance in the W dimension.
-        inc_d = stride_w * Tile::kW - stride_h * Tile::kH;
+        inc_advance = Tile::kW * stride_w;
+
       } else {
         // Advance in the D dimension.
-        inc_d = stride_d;
+        inc_advance = Tile::kD * stride_d;
       }
 
-      inc_advance = 0;
+      inc_advance -= stride_d * Delta::kD * (Iterations::kD - 1) +
+                     stride_h * Delta::kH * (Iterations::kH - 1) +
+                     stride_w * Delta::kW * (Iterations::kW - 1);
 
       return 0;
     }
 
+    /// Gotta have this
     CUTLASS_HOST_DEVICE int initialize() {
       stride_d = 0;
       stride_h = 0;
       stride_w = 1;
 
-      inc_d = inc_h = inc_w = inc_advance = 0;
+      inc_advance = 0;
+      inc_d = inc_h = inc_w = 0;
 
       return 0;
     }
   };
 
   /// Is the iterator valid?
-  CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const { return true; }
+  CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const { return true; }
 
   //
   // Static function members
   //
 
   /// Initializes a predicate vector
-  template <typename PredicateIterator>
-  CUTLASS_DEVICE static void initialize_predicates(PredicateIterator predicate_it,
-                                                   Coord<3> const &bounds,
-                                                   Coord<3> const &offset = make_Coord(0, 0, 0)) {
+  template <typename PredicateIterator, typename PredicateFunctor>
+  CUTLASS_HOST_DEVICE static void initialize_predicates(PredicateIterator predicate_it,
+                                                   PredicateFunctor const &predicate_func,
+                                                   Coord<3> const &offset) {
+    CUTLASS_PRAGMA_UNROLL
     for (int d = 0; d < Iterations::kD; ++d) {
-      bool enable_d = (d * Delta::kD + offset[0] < bounds[0]);
+      CUTLASS_PRAGMA_UNROLL
       for (int h = 0; h < Iterations::kH; ++h) {
-        bool enable_h = (h * Delta::kH + offset[1] < bounds[1]);
+        CUTLASS_PRAGMA_UNROLL
         for (int w = 0; w < Iterations::kW; ++w) {
-          bool enable_w = (w * Tile::kC * Delta::kW + offset[2] < bounds[2]);
-          predicate_it.set(d, h, w, 0, enable_d && enable_h && enable_w);
+          bool enable = predicate_func(make_Coord(d, h, w), offset);
+          predicate_it.set(enable);
+          ++predicate_it;
         }
       }
     }
@@ -301,7 +394,7 @@ template <typename Traits_,
           MemorySpace::Kind MemorySpace = MemorySpace::kGeneric,
           typename Index_ = int,
           typename FragmentElement_ = Scalar_,
-          IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar,
+          FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar,
           typename Skew_ = Shape<0, 0, 0, 0> >
 struct TileLoadIterator : public TileIteratorBase<Traits_,
                                                   Scalar_,
@@ -309,7 +402,7 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
                                                   MemorySpace,
                                                   Index_,
                                                   FragmentElement_,
-                                                  IteratorFragment_,
+                                                  FragmentElementType_,
                                                   Skew_> {
   /// Base class
   typedef TileIteratorBase<Traits_,
@@ -318,7 +411,7 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
                            MemorySpace,
                            Index_,
                            FragmentElement_,
-                           IteratorFragment_,
+                           FragmentElementType_,
                            Skew_>
       Base;
 
@@ -329,13 +422,13 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
   typedef typename Base::Scalar Scalar;
 
   /// Fragment element
-  typedef typename Base::FragmentElement FragmentElement;
+  typedef FragmentElement_ FragmentElement;
 
   /// Specifies in which dimension post-increment accesses advance.
   static IteratorAdvance::Kind const kAdvance = Base::kAdvance;
 
   /// Specifies type of iterator fragment storage (Salar or WmmaMatrix)
-  static IteratorFragment::Kind const kIteratorFragment = Base::kIteratorFragment;
+  static FragmentElementType::Kind const kFragmentElementType = FragmentElementType_;
 
   /// Source or destination memory space
   static MemorySpace::Kind const kMemorySpace = Base::kMemorySpace;
@@ -364,6 +457,9 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
   /// Memory access type
   typedef typename Base::AccessType AccessType;
 
+  /// The number of scalars accessed per load/store.
+  static int const kAccessSize = Base::kAccessSize;
+
   /// Fragment definition
   typedef typename Base::Fragment Fragment;
 
@@ -388,21 +484,80 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
   /// The pointer type
   typedef Scalar const *Pointer;
 
+  /// Tensor reference for the load iterator
+  typedef TensorRef<Scalar const, 4> TensorRef;
+
   /// Parameters
   struct Params : public BaseParams {
     /// Pointer to memory
     Scalar const *pointer;
 
+    //
+    // Methods
+    //
+
+    /// Initialize params to access storage object
+    CUTLASS_HOST_DEVICE
+    Params() : pointer(0){ Base::Params::initialize(); }
+
+    /// Initialize params to access storage object
+    CUTLASS_HOST_DEVICE
+    Params(Scalar const *ptr) : pointer(ptr) { Base::Params::initialize(); }
+
+    /// Constructs with a CompactTensorRef<>
+    CUTLASS_HOST_DEVICE
+    Params(TensorRef const &ref): pointer(ref.data()) {
+      Base::Params::initialize(ref.stride());
+    }
+
+    /// Initialize params to access storage object
+    CUTLASS_HOST_DEVICE
+    Params(Scalar const *ptr,
+           long long _stride_d,
+           Index _stride_h,
+           Index _stride_w,
+           long long _inc_d,
+           Index _inc_h,
+           Index _inc_w,
+           Index _inc_advance)
+        : pointer(ptr) {
+      Base::Params::initialize(
+          _stride_d, _stride_h, _stride_w, _inc_d, _inc_h, _inc_w, _inc_advance);
+    }
+
+    /// Initialize params to access storage object
+    CUTLASS_HOST_DEVICE
+    Params(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)
+        : pointer(ptr) {
+      Base::Params::initialize(stride_d, stride_h, stride_w);
+    }
+
+    /// Initializes params to access a raw pointer
+    CUTLASS_HOST_DEVICE
+    int initialize(TensorRef const &ref) {
+      pointer = ref.data();
+      return Base::Params::initialize(ref.stride());
+    }
+
     /// Initialize params to access storage object
     CUTLASS_HOST_DEVICE
     int initialize(SharedStorage const &storage) {
       pointer = &storage[0];
+      Base::Params::initialize();
+      return 0;
+    }
+
+    /// Initialize params to access storage object
+    CUTLASS_HOST_DEVICE
+    int initialize(Scalar const *ptr) {
+      pointer = ptr;
+      Base::Params::initialize();
       return 0;
     }
 
     /// Initializes params to access a raw pointer
     CUTLASS_HOST_DEVICE
-    int initialize(Scalar const *ptr, Index stride_d, Index stride_h, Index stride_w) {
+    int initialize(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w) {
       Base::Params::initialize(stride_d, stride_h, stride_w);
       pointer = ptr;
       return 0;
@@ -411,10 +566,10 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
     /// Initializes params
     CUTLASS_HOST_DEVICE
     int initialize(Scalar const *ptr,
-                   Index _stride_d,
+                   long long _stride_d,
                    Index _stride_h,
                    Index _stride_w,
-                   Index _inc_d,
+                   long long _inc_d,
                    Index _inc_h,
                    Index _inc_w,
                    Index _inc_advance) {
@@ -443,11 +598,13 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
   int stage;
 
   //
-  // Static member functions
+  // Predicate initialization
   //
 
-  /// Initializes a predicate vector
-  template <typename PredicateIterator>
+  /// Initializes a predicate vector using a RegularTilePredicateFunctor
+  template <
+      /// Predicate iterator
+      typename PredicateIterator>
   CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it,
                                                  Coord<3> const &bounds,
                                                  Coord<3> const &block_offset = make_Coord(0,
@@ -455,8 +612,23 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
                                                                                            0)) {
     Base::initialize_predicates(
         predicate_it,
-        bounds,
-        block_offset + make_Coord(0, thread_offset[1], thread_offset[2] * Tile::kC));
+        RegularTilePredicateFunctor<typename Traits::Delta>(bounds),
+        block_offset + make_Coord(thread_offset[0], thread_offset[1], thread_offset[2]));
+  }
+
+  /// Initializes a predicate vector using an arbitrary predicate functor
+  template <
+      /// Predicate iterator
+      typename PredicateIterator,
+      /// Functor computing predicates
+      typename PredicateFunctor>
+  CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it,
+                                                 PredicateFunctor const &functor,
+                                                 Coord<3> const &block_offset) {
+    Base::initialize_predicates(
+        predicate_it,
+        functor,
+        block_offset + make_Coord(thread_offset[0], thread_offset[1], thread_offset[2]));
   }
 
   //
@@ -475,41 +647,27 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
       : params(_params), stage(0) {
     thread_offset = thread_offset_func();
 
-    Index block_offset_h = 0;
-    Index block_offset_w = 0;
-    if (kAdvance == IteratorAdvance::kH) {
-      block_offset_h = block_offset[1];
-      block_offset_w = block_offset[2];
-    } else {
-      block_offset_h = block_offset[2];
-      block_offset_w = block_offset[1];
-    }
+    Index pointer_offset = Index((block_offset[0] + thread_offset[0]) * params.stride_d) +
+                           Index((block_offset[1] + thread_offset[1]) * params.stride_h) +
+                           Index((block_offset[2] + thread_offset[2]) * params.stride_w);
 
-    params.pointer += block_offset[0] * params.stride_d +
-                      (block_offset_h + thread_offset[1]) * params.stride_h +
-                      (block_offset_w + thread_offset[2] * Tile::kC) / Tile::kC * params.stride_w;
+    params.pointer += pointer_offset;
   }
 
   /// Constructs a tile load iterator
   CUTLASS_HOST_DEVICE
   TileLoadIterator(Params const &,
-                   SharedStorage &shared_storage,
+                   Scalar const *ptr,
                    Coord<3> const &block_offset = make_Coord(0, 0, 0),
                    ThreadOffset thread_offset_func = ThreadOffset())
       : stage(0) {
-    int const offset = thread_offset_func()[2];
-    params.pointer = &shared_storage[offset];
-  }
+    params.pointer = ptr + thread_offset_func()[2];
 
-  /// Returns the current pointer
-  CUTLASS_HOST_DEVICE
-  Scalar const *data() const { return params.pointer; }
+    params.stride_d = 0;
+    params.stride_h = 0;
+    params.stride_w = 1;
 
-  /// The accessor.
-  CUTLASS_DEVICE void get(AccessType &value, int d, int h, int w, int c) const {
-    int const imm =
-        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(d, h, w, c);
-    Load<Scalar, Base::kAccessSize, kMemorySpace>::load(value, params.pointer, imm);
+    params.inc_d = params.inc_h = params.inc_w = params.inc_advance = 0;
   }
 
   /// Increment in the D dimension
@@ -524,8 +682,21 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
   /// Increment in the next dimension
   CUTLASS_HOST_DEVICE void inc_advance() { params.pointer += params.inc_advance; }
 
+  /// Loads a single fragment element from memory
+  CUTLASS_HOST_DEVICE void load_element(AccessType &value, int d, int h, int w, int c) const {
+    int const offset =
+        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(d, h, w, c);
+    Load<Scalar,
+         kAccessSize,
+         kMemorySpace,
+         kFragmentElementType,
+         FragmentElement,
+         Tile::kW,
+         sizeof(FragmentElement) * kAccessSize>::load(value, params.pointer, offset);
+  }
+
   /// Increment the stage.
-  CUTLASS_DEVICE void inc_stage() {
+  CUTLASS_HOST_DEVICE void inc_stage() {
     if (Tile::kD > 1) {
       int const kStageSize = Tile::kH * Tile::kW * Tile::kC;
       if (stage == Tile::kD - 1) {
@@ -538,7 +709,27 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
     }
   }
 
- public:
+  /// Adds a vector offset to the iterator
+  CUTLASS_HOST_DEVICE TileLoadIterator & operator+=(Coord<3> const &offset) {
+    long long _offset = offset.template dot<long long>(
+      make_Coord(params.stride_d, params.stride_h, params.stride_w)
+    );
+
+    params.pointer += _offset;
+    return *this;
+  }
+
+  /// Adds a raw offset to the pointer
+  CUTLASS_HOST_DEVICE void add_pointer_offset(Index offset) { params.pointer += offset; }
+
+  CUTLASS_HOST_DEVICE Index stride_advance(void) {
+    Index stride = params.stride_h;
+    if (kAdvance == IteratorAdvance::kW) {
+      stride = params.stride_w;
+    }
+    return stride;
+  }
+
   /// Loads a fragment and advances the iterator to the next tile.
   template <typename Fragment, typename PredicateIterator>
   CUTLASS_HOST_DEVICE void load_post_increment(Fragment &fragment, PredicateIterator pred_it) {
@@ -547,11 +738,12 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
     for (int d = 0; d < Iterations::kD; ++d) {
       for (int h = 0; h < Iterations::kH; ++h) {
         for (int w = 0; w < Iterations::kW; ++w, ++pred_it) {
-          if (*pred_it) {
-            Load<typename Fragment::Element, Tile::kC, kMemorySpace>::load(
-                reinterpret_cast<AccessType &>(frag_iterator.at(d, h, w, 0)), data(), 0);
+          for (int c = 0; c < Iterations::kC; ++c) {
+            if (*pred_it) {
+              load_element(
+                  reinterpret_cast<AccessType &>(frag_iterator.at(d, h, w, c)), d, h, w, c);
+            }
           }
-
           if (w < Iterations::kW - 1) {
             inc_w();
           }
@@ -587,6 +779,19 @@ struct TileLoadIterator : public TileIteratorBase<Traits_,
     typename PredicateVector::TrivialIterator pred_it;
     load(fragment, pred_it);
   }
+
+  /// Loads a fragment without advancing the iterator..
+  template <typename Fragment>
+  CUTLASS_HOST_DEVICE void load(Fragment &fragment, int d) {
+    FragmentIterator frag_iterator(fragment);
+    for (int h = 0; h < Iterations::kH; ++h) {
+      for (int w = 0; w < Iterations::kW; ++w) {
+        for (int c = 0; c < Iterations::kC; ++c) {
+          load_element(reinterpret_cast<AccessType &>(frag_iterator.at(0, h, w, c)), d, h, w, c);
+        }
+      }
+    }
+  }
 };
 
 ///////////////////////////////////////////////////////////////////////////////////////////////////
@@ -626,7 +831,7 @@ template <typename Traits_,
           MemorySpace::Kind MemorySpace = MemorySpace::kGeneric,
           typename Index_ = int,
           typename FragmentElement_ = Scalar_,
-          IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar,
+          FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar,
           typename Skew_ = Shape<0, 0, 0, 0> >
 struct TileStoreIterator : public TileIteratorBase<Traits_,
                                                    Scalar_,
@@ -634,7 +839,7 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
                                                    MemorySpace,
                                                    Index_,
                                                    FragmentElement_,
-                                                   IteratorFragment_,
+                                                   FragmentElementType_,
                                                    Skew_> {
   /// Base class
   typedef TileIteratorBase<Traits_,
@@ -643,7 +848,7 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
                            MemorySpace,
                            Index_,
                            FragmentElement_,
-                           IteratorFragment_,
+                           FragmentElementType_,
                            Skew_>
       Base;
 
@@ -660,11 +865,14 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
   static IteratorAdvance::Kind const kAdvance = Base::kAdvance;
 
   /// Specifies type of iterator fragment storage (Salar or WmmaMatrix)
-  static IteratorFragment::Kind const kIteratorFragment = Base::kIteratorFragment;
+  static FragmentElementType::Kind const kFragmentElementType = Base::kFragmentElementType;
 
   /// Source or destination memory space
   static MemorySpace::Kind const kMemorySpace = Base::kMemorySpace;
 
+  /// The number of scalars accessed per load/store.
+  static int const kAccessSize = Base::kAccessSize;
+
   /// Index type
   typedef typename Base::Index Index;
 
@@ -707,21 +915,71 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
   /// IteratorBase parameters
   typedef typename Base::Params BaseParams;
 
+  /// Pointer to underlying type
+  typedef Scalar *Pointer;
+
+  /// Tensor reference for the store iterator
+  typedef TensorRef<Scalar, 4> TensorRef;
+
   /// Parameters
   struct Params : public BaseParams {
     /// Pointer to memory
     Scalar *pointer;
 
+    //
+    // Methods
+    //
+
+    // Default constructor
+    CUTLASS_HOST_DEVICE
+    Params() : pointer(0) {}
+
+    // Default constructor
+    CUTLASS_HOST_DEVICE
+    Params(Scalar *ptr) : pointer(ptr) { Base::Params::initialize(); }
+
+    /// Constructs with a CompactTensorRef<>
+    CUTLASS_HOST_DEVICE
+    Params(TensorRef const &ref): pointer(ref.data()) {
+      Base::Params::initialize(ref.stride());
+    }
+
+    // Default constructor
+    CUTLASS_HOST_DEVICE
+    Params(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w) {
+      initialize(ptr, stride_d, stride_h, stride_w);
+    }
+
+    // Default constructor
+    CUTLASS_HOST_DEVICE
+    Params(Scalar *ptr,
+           long long _stride_d,
+           Index _stride_h,
+           Index _stride_w,
+           long long _inc_d,
+           Index _inc_h,
+           Index _inc_w,
+           Index _inc_advance) {
+      initialize(ptr, _stride_d, _stride_h, _stride_w, _inc_d, _inc_h, _inc_w, _inc_advance);
+    }
+
     /// Initialize params to access storage object
     CUTLASS_HOST_DEVICE
     int initialize(SharedStorage &storage) {
       pointer = &storage[0];
-      return 0;
+      return Base::Params::initialize();
+    }
+
+    /// Initialize params to access storage object
+    CUTLASS_HOST_DEVICE
+    int initialize(Scalar *ptr) {
+      pointer = ptr;
+      return Base::Params::initialize();
     }
 
     /// Initializes params to access a raw pointer
     CUTLASS_HOST_DEVICE
-    int initialize(Scalar *ptr, Index stride_d, Index stride_h, Index stride_w) {
+    int initialize(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w) {
       Base::Params::initialize(stride_d, stride_h, stride_w);
       pointer = ptr;
       return 0;
@@ -730,10 +988,10 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
     /// Initializes params
     CUTLASS_HOST_DEVICE
     int initialize(Scalar *ptr,
-                   Index _stride_d,
+                   long long _stride_d,
                    Index _stride_h,
                    Index _stride_w,
-                   Index _inc_d,
+                   long long _inc_d,
                    Index _inc_h,
                    Index _inc_w,
                    Index _inc_advance) {
@@ -762,11 +1020,13 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
   int stage;
 
   //
-  // Static member functions
+  // Predicate initialization
   //
 
-  /// Initializes a predicate vector
-  template <typename PredicateIterator>
+  /// Initializes a predicate vector using a RegularTilePredicateFunctor
+  template <
+      /// Predicate iterator
+      typename PredicateIterator>
   CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it,
                                                  Coord<3> const &bounds,
                                                  Coord<3> const &block_offset = make_Coord(0,
@@ -774,8 +1034,23 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
                                                                                            0)) {
     Base::initialize_predicates(
         predicate_it,
-        bounds,
-        block_offset + make_Coord(0, thread_offset[1], thread_offset[2] * Tile::kC));
+        RegularTilePredicateFunctor<typename Traits::Delta>(bounds),
+        block_offset + make_Coord(thread_offset[0], thread_offset[1], thread_offset[2]));
+  }
+
+  /// Initializes a predicate vector using an arbitrary predicate functor
+  template <
+      /// Predicate iterator
+      typename PredicateIterator,
+      /// Functor computing predicates
+      typename PredicateFunctor>
+  CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it,
+                                                 PredicateFunctor const &functor,
+                                                 Coord<3> const &block_offset) {
+    Base::initialize_predicates(
+        predicate_it,
+        functor,
+        block_offset + make_Coord(thread_offset[0], thread_offset[1], thread_offset[2]));
   }
 
   //
@@ -794,25 +1069,22 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
       : params(_params), stage(0) {
     thread_offset = thread_offset_func();
 
-    params.pointer += block_offset[0] * params.stride_d +
+    params.pointer += (block_offset[0] + thread_offset[0]) * params.stride_d +
                       (block_offset[1] + thread_offset[1]) * params.stride_h +
-                      (block_offset[2] + thread_offset[2] * Tile::kC) / Tile::kC * params.stride_w;
+                      (block_offset[2] + thread_offset[2]) * params.stride_w;
   }
 
   /// Constructs a tile store iterator
   CUTLASS_HOST_DEVICE
-  TileStoreIterator(Params const &,
-                    SharedStorage &shared_storage,
-                    Coord<3> const &block_offset = make_Coord(0, 0, 0),
-                    ThreadOffset thread_offset_func = ThreadOffset())
+  TileStoreIterator(Params const &, Scalar *ptr, ThreadOffset thread_offset_func = ThreadOffset())
       : stage(0) {
-    int const offset = thread_offset_func()[2];
-    params.pointer = &shared_storage[offset];
-  }
+    params.pointer = ptr + thread_offset_func()[2];
+    params.stride_d = 0;
+    params.stride_h = 0;
+    params.stride_w = 1;
 
-  /// Returns the current pointer
-  CUTLASS_HOST_DEVICE
-  Scalar *data() const { return params.pointer; }
+    params.inc_d = params.inc_h = params.inc_w = params.inc_advance = 0;
+  }
 
   /// Increment in the D dimension
   CUTLASS_HOST_DEVICE void inc_d() { params.pointer += params.inc_d; }
@@ -827,7 +1099,7 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
   CUTLASS_HOST_DEVICE void inc_advance() {}
 
   /// Increment the stage.
-  CUTLASS_DEVICE void inc_stage() {
+  CUTLASS_HOST_DEVICE void inc_stage() {
     if (Tile::kD > 1) {
       int const kStageSize = Tile::kH * Tile::kW * Tile::kC;
       if (stage == Tile::kD - 1) {
@@ -840,25 +1112,43 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
     }
   }
 
-  /// The accessor.
-  CUTLASS_DEVICE void set(AccessType const &value, int d, int h, int w, int c) {
-    int const imm =
-        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(d, h, w, c);
-    Store<Scalar, Base::kAccessSize, kMemorySpace>::store(value, params.pointer, imm);
+  /// Adds a vector offset to the iterator
+  CUTLASS_HOST_DEVICE TileStoreIterator & operator+=(Coord<3> const &offset) {
+    params.pointer += offset.template dot<long long>(
+      make_Coord(params.stride_d, params.stride_h, params.stride_w)
+    );
+    return *this;
+  }
+
+  /// Adds a raw offset to the pointer
+  CUTLASS_HOST_DEVICE void add_pointer_offset(Index offset) { params.pointer += offset; }
+
+  /// Stores a single fragment element into memory.
+  CUTLASS_HOST_DEVICE void store_element(AccessType const &value, int d, int h, int w, int c) {
+    int const offset =
+        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(d, h, w, c);
+    Store<Scalar,
+          kAccessSize,
+          kMemorySpace,
+          kFragmentElementType,
+          FragmentElement,
+          Tile::kW,
+          sizeof(FragmentElement) * kAccessSize>::store(value, params.pointer, offset);
   }
 
- public:
   /// Stores a fragment and advances to the next tile.
   template <typename Fragment, typename PredicateIterator>
-  CUTLASS_HOST_DEVICE void store_post_increment(Fragment &fragment, PredicateIterator pred_it) {
-    FragmentIterator frag_iterator(fragment);
+  CUTLASS_HOST_DEVICE void store_post_increment(Fragment const &fragment, PredicateIterator pred_it) {
+    FragmentConstIterator frag_iterator(fragment);
 
     for (int d = 0; d < Iterations::kD; ++d) {
       for (int h = 0; h < Iterations::kH; ++h) {
         for (int w = 0; w < Iterations::kW; ++w, ++pred_it) {
-          if (*pred_it) {
-            Store<typename Fragment::Element, Tile::kC, kMemorySpace>::store(
-                reinterpret_cast<AccessType &>(frag_iterator.at(d, h, w, 0)), data(), 0);
+          for (int c = 0; c < Iterations::kC; ++c) {
+            if (*pred_it) {
+              store_element(
+                  reinterpret_cast<AccessType const &>(frag_iterator.at(d, h, w, c)), d, h, w, c);
+            }
           }
           if (w < Iterations::kW - 1) {
             inc_w();
@@ -877,23 +1167,103 @@ struct TileStoreIterator : public TileIteratorBase<Traits_,
 
   /// Stores a fragment and advances to the next tile.
   template <typename Fragment>
-  CUTLASS_HOST_DEVICE void store_post_increment(Fragment &fragment) {
+  CUTLASS_HOST_DEVICE void store_post_increment(Fragment const &fragment) {
     typename PredicateVector::TrivialIterator pred_it;
     store_post_increment(fragment, pred_it);
   }
 
   /// Stores a fragment without advancing the iterator.
   template <typename Fragment, typename PredicateIterator>
-  CUTLASS_HOST_DEVICE void store(Fragment &fragment, PredicateIterator pred_it) const {
+  CUTLASS_HOST_DEVICE void store(Fragment const &fragment, PredicateIterator pred_it) const {
     TileStoreIterator _store_it(*this);
     _store_it.store_post_increment(fragment, pred_it);
   }
 
   /// Stores a fragment without advancing the iterator.
   template <typename Fragment>
-  CUTLASS_HOST_DEVICE void store(Fragment &fragment) const {
+  CUTLASS_HOST_DEVICE void store(Fragment const &fragment) const {
     typename PredicateVector::TrivialIterator pred_it;
     store(fragment, pred_it);
   }
+
+  /// Loads a single fragment element from memory
+  CUTLASS_HOST_DEVICE void load_element(AccessType &value, int d, int h, int w, int c) const {
+    int const offset =
+        ComputeOffsetFromStrides<typename Base::ImmediateOffsetStrides>::get(d, h, w, c);
+
+    Load<Scalar,
+         kAccessSize,
+         kMemorySpace,
+         kFragmentElementType,
+         FragmentElement,
+         Tile::kW,
+         sizeof(FragmentElement) * kAccessSize>::load(value, params.pointer, offset);
+  }
+
+  /// Loads a fragment and advances the iterator to the next tile.
+  template <typename Fragment, typename PredicateIterator>
+  CUTLASS_HOST_DEVICE void load_post_increment(Fragment &fragment, PredicateIterator pred_it) {
+    FragmentIterator frag_iterator(fragment);
+
+    for (int d = 0; d < Iterations::kD; ++d) {
+      for (int h = 0; h < Iterations::kH; ++h) {
+        for (int w = 0; w < Iterations::kW; ++w, ++pred_it) {
+          for (int c = 0; c < Iterations::kC; ++c) {
+            if (*pred_it) {
+              load_element(
+                  reinterpret_cast<AccessType &>(frag_iterator.at(d, h, w, c)), d, h, w, c);
+            }
+          }
+          if (w < Iterations::kW - 1) {
+            inc_w();
+          }
+        }
+        if (h < Iterations::kH - 1) {
+          inc_h();
+        }
+      }
+      if (d < Iterations::kD - 1) {
+        inc_d();
+      }
+    }
+    inc_advance();
+  }
+
+  /// Loads a fragment and advances the iterator to the next tile.
+  template <typename Fragment>
+  CUTLASS_HOST_DEVICE void load_post_increment(Fragment &fragment) {
+    typename PredicateVector::TrivialIterator pred_it;
+    load_post_increment(fragment, pred_it);
+  }
+
+  /// Loads a fragment without advancing the iterator..
+  template <typename Fragment, typename PredicateIterator>
+  CUTLASS_HOST_DEVICE void load(Fragment &fragment, PredicateIterator pred_it) const {
+    TileStoreIterator _load_it(*this);
+    _load_it.load_post_increment(fragment, pred_it);
+  }
+
+  /// Loads a fragment without advancing the iterator..
+  template <typename Fragment>
+  CUTLASS_HOST_DEVICE void load(Fragment &fragment) const {
+    typename PredicateVector::TrivialIterator pred_it;
+    load(fragment, pred_it);
+  }
+
+  /// Loads a fragment without advancing the iterator..
+  template <typename Fragment>
+  CUTLASS_HOST_DEVICE void load(Fragment &fragment, int d) {
+    FragmentIterator frag_iterator(fragment);
+    for (int h = 0; h < Iterations::kH; ++h) {
+      for (int w = 0; w < Iterations::kW; ++w) {
+        for (int c = 0; c < Iterations::kC; ++c) {
+          load_element(reinterpret_cast<AccessType &>(frag_iterator.at(0, h, w, c)), d, h, w, c);
+        }
+      }
+    }
+  }
 };
-}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/cutlass/tile_stream.h b/cutlass/tile_stream.h
new file mode 100644
index 000000000..7790605a0
--- /dev/null
+++ b/cutlass/tile_stream.h
@@ -0,0 +1,378 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Implements the tile stream concept, composing an iterator with a transformation. Offers
+      split-phase semantics, separating the initiation of an asynchronous memory operation with a
+      fence forcing it to complete.
+*/
+#pragma once
+
+// clang-format off
+
+#include "cutlass/convert.h"
+#include "cutlass/tile_iterator.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace cutlass {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Generic stream for loading and transforming fragments
+template <typename Iterator_, typename Transformer_ = Copy<typename Iterator_::Fragment> >
+struct TileLoadStream {
+  //
+  // Type definitions
+  //
+
+  /// TileLoadIterator
+  typedef Iterator_ Iterator;
+
+  /// Transformer
+  typedef Transformer_ Transformer;
+
+  /// Fragment fetched from source memory
+  typedef typename Iterator::Fragment Fragment;
+
+  /// Output fragment from transformer
+  typedef typename Transformer::OutputFragment TransformedFragment;
+
+  /// Tensor reference expected by the stream
+  typedef typename Iterator::TensorRef TensorRef;
+
+  /// Empty predicate vector struct
+  struct PredicateVector {};
+
+  /// Index type
+  typedef typename Iterator::Index Index;
+
+  /// Parameters object used to construct generic load stream
+  struct Params {
+    /// Parameters to the iterator
+    typename Iterator::Params iterator;
+
+    //
+    // Methods
+    //
+
+    /// Default constructor
+    CUTLASS_HOST_DEVICE
+    Params() {}
+
+    /// Constructor with iterator params
+    CUTLASS_HOST_DEVICE
+    Params(typename Iterator::Params const &_iterator) : iterator(_iterator) {}
+  };
+
+  //
+  // Data members
+  //
+
+  /// Iterator to load tiles
+  Iterator iterator;
+
+  /// Fragment loaded via iterator
+  Fragment fetched_fragment;
+
+  /// Transformation applied to fragments
+  Transformer transformer;
+
+  /// Transformed fragment from transformer
+  TransformedFragment transformed_fragment;
+
+  //
+  // Methods
+  //
+
+  /// Ctor
+  CUTLASS_DEVICE
+  TileLoadStream(Params const &_params, TensorRef const &_ref)
+      : iterator(_params.iterator, _ref) {}
+
+  /// Ctor
+  CUTLASS_DEVICE
+  TileLoadStream(Params const &_params,
+    Coord<3> const &threadblock_offset = make_Coord(0, 0, 0)
+  ): iterator(_params.iterator, threadblock_offset) { }
+
+  /// Loads a tile and increments the iterator
+  CUTLASS_DEVICE
+  void copy() { iterator.load_post_increment(fetched_fragment); }
+
+  /// Commits the fetched fragment and applies a transformation
+  CUTLASS_DEVICE
+  void commit() { transformer.transform(fetched_fragment, transformed_fragment); }
+
+  /// Accesses the loaded, transformed fragment
+  CUTLASS_DEVICE
+  Fragment &intermediate_fragment() { return fetched_fragment; }
+
+  /// Accesses the loaded, transformed fragment
+  CUTLASS_DEVICE
+  TransformedFragment &fragment() { return transformed_fragment; }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Generic stream for transforming and storing fragments
+template <typename Iterator_, typename Transformer_ = Copy<typename Iterator_::Fragment> >
+struct TileStoreStream {
+  //
+  // Type definitions
+  //
+
+  /// TileLoadIterator
+  typedef Iterator_ Iterator;
+
+  /// Transformer
+  typedef Transformer_ Transformer;
+
+  /// Source fragment
+  typedef typename Transformer::InputFragment Fragment;
+
+  /// Transformed fragment, compatible with Iterator::Fragment
+  typedef typename Transformer::OutputFragment TransformedFragment;
+
+  /// Tensor reference expected by the underlying iterator
+  typedef typename Iterator::TensorRef TensorRef;
+
+  /// Empty predicate vector struct
+  struct PredicateVector {};
+
+  /// Index type
+  typedef typename Iterator::Index Index;
+
+  /// Parameters used to construct the stream
+  struct Params {
+    /// Parameters to the iterator
+    typename Iterator::Params iterator;
+
+    //
+    // Methods
+    //
+
+    /// Default constructor
+    CUTLASS_HOST_DEVICE
+    Params() {}
+
+    /// Constructor with iterator params
+    CUTLASS_HOST_DEVICE
+    Params(typename Iterator::Params const &_iterator) : iterator(_iterator) {}
+  };
+
+  //
+  // Data members
+  //
+
+  /// Iterator to store tiles
+  Iterator iterator;
+
+  /// Transformation applied to inputs
+  Transformer transformer;
+
+  /// Source fragment
+  Fragment source_fragment;
+
+  /// Transformed fragment from transformer
+  TransformedFragment transformed_fragment;
+
+  //
+  // Methods
+  //
+
+  /// Ctor
+  CUTLASS_DEVICE
+  TileStoreStream(Params const &_params, TensorRef const &_ref)
+      : iterator(_params.iterator, _ref) {}
+
+  /// Ctor
+  CUTLASS_DEVICE
+  TileStoreStream(Params const &_params,
+                  Coord<3> const &threadblock_offset = make_Coord(0, 0, 0)
+  ): iterator(_params.iterator, threadblock_offset) { }
+
+  /// Stores a fragment and increments the iterator
+  CUTLASS_DEVICE
+  void copy() {
+
+    transformer.transform(source_fragment, transformed_fragment);
+    iterator.store_post_increment(transformed_fragment);
+  }
+
+  /// Stores a fragment and increments the iterator
+  CUTLASS_DEVICE
+  void copy(Fragment const &frag) {
+    source_fragment = frag;
+    copy();
+  }
+
+  /// Commits the store operation
+  CUTLASS_DEVICE
+  void commit() {}
+
+  /// Accesses the transformed fragment
+  CUTLASS_DEVICE
+  Fragment &fragment() { return source_fragment; }
+
+  /// Accesses the fragment after trasnforming
+  CUTLASS_DEVICE
+  TransformedFragment &intermediate_fragment() { return transformed_fragment; }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Generic stream for loading and transforming fragments
+template <typename Iterator_,
+          typename PredicateFunctor_ =
+              RegularTilePredicateFunctor<typename Iterator_::Traits::Delta>,
+          typename Transformer_ = Copy<typename Iterator_::Fragment> >
+struct PredicatedTileLoadStream : public TileLoadStream<Iterator_, Transformer_> {
+  //
+  // Type definitions
+  //
+
+  typedef TileLoadStream<Iterator_, Transformer_> Base;
+
+  /// TileLoadIterator
+  typedef Iterator_ Iterator;
+
+  /// Predicate functor
+  typedef PredicateFunctor_ PredicateFunctor;
+
+  /// Transformer
+  typedef Transformer_ Transformer;
+
+  /// Fragment fetched from source memory
+  typedef typename Base::Fragment Fragment;
+
+  /// Output fragment from transformer
+  typedef typename Base::TransformedFragment TransformedFragment;
+
+  /// Parameters object used to construct generic load stream
+  typedef typename Base::Params Params;
+
+  //
+  // Data members
+  //
+
+  /// Predicates
+  typename Iterator::PredicateVector predicates;
+
+  //
+  // Methods
+  //
+
+  /// Ctor
+  CUTLASS_DEVICE
+  PredicatedTileLoadStream(Params const &_params,
+                          Coord<3> const &bounds,
+                          Coord<3> const &threadblock_offset = make_Coord(0, 0, 0))
+      : Base(_params, threadblock_offset) {
+    this->iterator.initialize_predicates(
+        predicates.begin(), PredicateFunctor(bounds), threadblock_offset);
+  }
+
+  /// Loads a tile and increments the iterator
+  CUTLASS_DEVICE
+  void copy() { this->iterator.load_post_increment(this->fetched_fragment, predicates.begin()); }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Generic stream for transforming and storing fragments
+template <typename Iterator_,
+          typename PredicateFunctor_ =
+              RegularTilePredicateFunctor<typename Iterator_::Traits::Delta>,
+          typename Transformer_ = Copy<typename Iterator_::Fragment> >
+struct PredicatedTileStoreStream : public TileStoreStream<Iterator_, Transformer_> {
+  //
+  // Type definitions
+  //
+
+  typedef TileStoreStream<Iterator_, Transformer_> Base;
+
+  /// TileLoadIterator
+  typedef Iterator_ Iterator;
+
+  /// Predicate functor
+  typedef PredicateFunctor_ PredicateFunctor;
+
+  /// Transformer
+  typedef Transformer_ Transformer;
+
+  /// Fragment fetched from source memory
+  typedef typename Base::Fragment Fragment;
+
+  /// Output fragment from transformer
+  typedef typename Base::TransformedFragment TransformedFragment;
+
+  /// Parameters object used to construct generic load stream
+  typedef typename Base::Params Params;
+
+  //
+  // Data members
+  //
+
+  /// Predicates
+  typename Iterator::PredicateVector predicates;
+
+  //
+  // Methods
+  //
+
+  /// Ctor
+  CUTLASS_DEVICE
+  PredicatedTileStoreStream(Params const &_params,
+                           Coord<3> const &bounds,
+                           Coord<3> const &threadblock_offset = make_Coord(0, 0, 0))
+      : Base(_params, threadblock_offset) {
+    this->iterator.initialize_predicates(
+        predicates.begin(), PredicateFunctor(bounds), threadblock_offset);
+  }
+
+  /// Stores the fragment and increments the iterator
+  CUTLASS_DEVICE
+  void copy() {
+    this->transformer.transform(this->source_fragment, this->transformed_fragment);
+    this->iterator.store_post_increment(this->transformed_fragment, predicates.begin());
+  }
+
+  /// Stores the fragment and increments the iterator
+  CUTLASS_DEVICE
+  void copy(Fragment const &frag) {
+    this->source_fragment = frag;
+    copy();
+  }
+
+  /// Commits the store operation
+  CUTLASS_DEVICE
+  void commit() {}
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
+
+// clang-format on
diff --git a/cutlass/tile_traits_standard.h b/cutlass/tile_traits_standard.h
index 14ecd01ab..9145c5da9 100644
--- a/cutlass/tile_traits_standard.h
+++ b/cutlass/tile_traits_standard.h
@@ -28,7 +28,7 @@
 */
 #pragma once
 
-#include <cutlass/tile_iterator.h>
+#include "cutlass/tile_iterator.h"
 
 namespace cutlass {
 
@@ -204,6 +204,9 @@ struct TileTraitsStandard {
   /// Number of participating warps
   static int const kWarpCount = kThreads / kWarpSize;
 
+  /// By default, do not do scalar loads
+  static int const kAccessSize = 1;
+
   // Static assertions
   static_assert(!(ShapeCount<Tile>::kDhw % kThreads),
                 "Tiling undefined if elements not divisible by threads.");
@@ -223,8 +226,7 @@ struct TileTraitsStandard {
   typedef typename Traits::Delta Delta;
 
   /// Delta between each thread's access
-  /// TODO MTA this is wrong for sure, but Delta is used for stride computation at the moment
-  typedef Delta ImmediateOffsetStrides;
+  typedef Shape<0, 0, 0, 0> ImmediateOffsetStrides;
 
   /// Number of accesses
   typedef typename Traits::Iterations Iterations;
diff --git a/cutlass/util/complex.h b/cutlass/util/complex.h
new file mode 100644
index 000000000..260a3abd2
--- /dev/null
+++ b/cutlass/util/complex.h
@@ -0,0 +1,457 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#pragma once
+
+#include <cuComplex.h>
+#include "cutlass/cutlass.h"
+#include <iosfwd>
+
+namespace cutlass {
+namespace platform {
+
+//////////////////////////////////////////////////////////////////////////////////////////////////
+
+//
+// Accessors for CUDA complex types
+//
+
+/// Returns the real part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+CUTLASS_HOST_DEVICE
+float const &real(cuFloatComplex const &z) { return z.x; }
+
+/// Returns the real part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+CUTLASS_HOST_DEVICE
+float &real(cuFloatComplex &z) { return z.x; }
+
+/// Returns the real part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+CUTLASS_HOST_DEVICE
+double const &real(cuDoubleComplex const &z) { return z.x; }
+
+/// Returns the real part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+CUTLASS_HOST_DEVICE
+double &real(cuDoubleComplex &z) { return z.x; }
+
+/// Returns the imaginary part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+CUTLASS_HOST_DEVICE
+float const &imag(cuFloatComplex const &z) { return z.y; }
+
+/// Returns the imaginary part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+CUTLASS_HOST_DEVICE
+float &imag(cuFloatComplex &z) { return z.y; }
+
+/// Returns the imaginary part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+CUTLASS_HOST_DEVICE
+double const &imag(cuDoubleComplex const &z) { return z.y; }
+
+/// Returns the imaginary part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+CUTLASS_HOST_DEVICE
+double &imag(cuDoubleComplex &z) { return z.y; }
+
+//////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Class for representing and manipulating complex numbers with conversions from built-in CUDA
+/// complex types.
+template <typename T>
+class complex {
+ public:
+  /// Type alias for scalar type
+  typedef T value_type;
+
+ private:
+  //
+  // Data members
+  //
+
+  /// Real part
+  T _real;
+
+  /// Imaginary part
+  T _imag;
+
+ public:
+//
+// Methods
+//
+
+/// Constructor
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+  CUTLASS_HOST_DEVICE
+  complex(T r = T(0), T i = T(0)) : _real(r), _imag(i) {}
+
+/// Conversion from cuFloatComplex
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+  CUTLASS_HOST_DEVICE
+  complex(cuFloatComplex const &z) : _real(platform::real(z)), _imag(platform::imag(z)) {}
+
+/// Conversion from cuDoubleComplex
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+  CUTLASS_HOST_DEVICE
+  complex(cuDoubleComplex const &z) : _real(platform::real(z)), _imag(platform::imag(z)) {}
+
+/// Accesses the real part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+  CUTLASS_HOST_DEVICE
+  T const &real() const { return _real; }
+
+/// Accesses the real part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+  CUTLASS_HOST_DEVICE
+  T &real() { return _real; }
+
+/// Accesses the imaginary part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+  CUTLASS_HOST_DEVICE
+  T const &imag() const { return _imag; }
+
+/// Accesses the imaginary part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+  CUTLASS_HOST_DEVICE
+  T &imag() { return _imag; }
+
+/// Converts to cuFloatComplex
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+  CUTLASS_HOST_DEVICE
+  operator cuFloatComplex() const { return make_cuFloatComplex(real(), imag()); }
+
+/// Converts to cuDoubleComplex
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+  CUTLASS_HOST_DEVICE
+  operator cuDoubleComplex() const { return make_cuDoubleComplex(real(), imag()); }
+};
+
+//
+// Accessors for complex template
+//
+
+/// Returns the real part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE T const &real(complex<T> const &z) {
+  return z.real();
+}
+
+/// Returns the real part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE T &real(complex<T> &z) {
+  return z.real();
+}
+
+/// Returns the imaginary part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE T const &imag(complex<T> const &z) {
+  return z.imag();
+}
+
+/// Returns the imaginary part of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE T &imag(complex<T> &z) {
+  return z.imag();
+}
+
+//
+// Output operators
+//
+
+template <typename T>
+std::ostream &operator<<(std::ostream &out, complex<T> const &z) {
+  T _r = real(z);
+  T _i = imag(z);
+  return out << _r << "+i" << _i;
+}
+
+//
+// Non-member operators defined for complex types
+//
+
+/// Equality operator
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE bool operator==(complex<T> const &lhs, complex<T> const &rhs) {
+  return real(lhs) == (rhs) && imag(lhs) == imag(rhs);
+}
+
+/// Inequality operator
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE bool operator!=(complex<T> const &lhs, complex<T> const &rhs) {
+  return !(lhs == rhs);
+}
+
+/// Addition
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> operator+(complex<T> const &lhs, complex<T> const &rhs) {
+  return complex<T>(real(lhs) + real(rhs), imag(lhs) + imag(rhs));
+}
+
+/// Subtraction
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> operator-(complex<T> const &lhs, complex<T> const &rhs) {
+  return complex<T>(real(lhs) - real(rhs), imag(lhs) - imag(rhs));
+}
+
+/// Multiplication
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> operator*(complex<T> const &lhs, complex<T> const &rhs) {
+  return complex<T>(real(lhs) * real(rhs) - imag(lhs) * imag(rhs),
+                    real(lhs) * imag(rhs) + imag(lhs) * real(rhs));
+}
+
+/// Scalar Multiplication
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> operator*(complex<T> const &lhs, T const &s) {
+  return complex<T>(real(lhs) * s, imag(lhs) * s);
+}
+
+/// Scalar Multiplication
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> operator*(T const &s, complex<T> const &rhs) {
+  return complex<T>(s * real(rhs), s * imag(rhs));
+}
+
+/// Division
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> operator/(complex<T> const &lhs, complex<T> const &rhs) {
+  T d = (real(rhs) * (rhs) + imag(rhs) * imag(rhs));
+
+  return complex<T>((real(lhs) * (rhs) + imag(lhs) * imag(rhs)) / d,
+                    (imag(lhs) * (rhs)-real(lhs) * imag(rhs)) / d);
+}
+
+/// Scalar Division
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> operator/(complex<T> const &lhs, T const &s) {
+  return complex<T>(real(lhs) / s, imag(lhs) / s);
+}
+
+/// Scalar divided by complex
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> operator/(T const &s, complex<T> const &rhs) {
+  T d = (real(rhs) * (rhs) + imag(rhs) * imag(rhs));
+
+  return complex<T>((s * (rhs)) / d, -(s * imag(rhs)) / d);
+}
+
+/// Addition
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> &operator+=(complex<T> &lhs, complex<T> const &rhs) {
+  lhs = (lhs + rhs);
+  return lhs;
+}
+
+/// Subtraction
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> &operator-=(complex<T> &lhs, complex<T> const &rhs) {
+  lhs = (lhs - rhs);
+  return lhs;
+}
+
+/// Multiplication
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> &operator*=(complex<T> &lhs, complex<T> const &rhs) {
+  lhs = (lhs * rhs);
+  return lhs;
+}
+
+/// Scalar multiplication
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> &operator*=(complex<T> &lhs, T s) {
+  lhs = (lhs * s);
+  return lhs;
+}
+
+/// Division
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> &operator/=(complex<T> &lhs, complex<T> const &rhs) {
+  lhs = (lhs / rhs);
+  return lhs;
+}
+
+//
+// Non-member functions defined for complex numbers
+//
+
+/// Returns the magnitude of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE T abs(complex<T> const &z) {
+  return sqrt(norm(z));
+}
+
+/// Returns the magnitude of the complex number
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE T arg(complex<T> const &z) {
+  return atan2(imag(z), real(z));
+}
+
+/// Returns the squared magnitude
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE T norm(complex<T> const &z) {
+  return real(z) * real(z) + imag(z) * imag(z);
+}
+
+/// Returns the complex conjugate
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> conj(complex<T> const &z) {
+  return complex<T>(real(z), -imag(z));
+}
+
+/// Projects the complex number z onto the Riemann sphere
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> proj(complex<T> const &z) {
+  T d = real(z) * real(z) + imag(z) * imag(z) + T(1);
+  return complex<T>((T(2) * real(z)) / d, (T(2) * imag(z)) / d);
+}
+
+/// Returns a complex number with magnitude r and phase theta
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> polar(T const &r, T const &theta = T()) {
+  return complex<T>(r * cos(theta), r * sin(theta));
+}
+
+/// Computes the complex exponential of z.
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> exp(complex<T> const &z) {
+  return complex<T>(real(z) * cos(imag(z)), real(z) * sin(imag(z)));
+}
+
+/// Computes the complex exponential of z.
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> log(complex<T> const &z) {
+  return complex<T>(log(abs(z)), arg(z));
+}
+
+/// Computes the complex exponential of z.
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> log10(complex<T> const &z) {
+  return log(z) / T(log(T(10)));
+}
+
+/// Computes the square root of complex number z
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> sqrt(complex<T> const &z) {
+  return sqrt(T(2)) / T(2) *
+         complex<T>(sqrt(sqrt(norm(z)) + real(z)),
+                    (imag(z) < 0 ? T(-1) : T(1)) * sqrt(sqrt(norm(z)) - real(z)));
+}
+
+/// Computes the cosine of complex z.
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> cos(complex<T> const &z) {
+  return (exp(z) + exp(-z)) / T(2);
+}
+
+/// Computes the sin of complex z.
+#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex<T> with a
+                            // host-only type
+template <typename T>
+CUTLASS_HOST_DEVICE complex<T> sin(complex<T> const &z) {
+  return (exp(-z) - exp(z)) * complex<T>(T(0), T(1) / T(2));
+}
+
+//////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace platform
+}  // namespace cutlass
diff --git a/cutlass/util/cutlass_math.h b/cutlass/util/cutlass_math.h
index 0ecdc4382..e3b46ef35 100644
--- a/cutlass/util/cutlass_math.h
+++ b/cutlass/util/cutlass_math.h
@@ -30,7 +30,7 @@
  * \brief Math utilities
  */
 
-#include <cutlass/util/platform.h>
+#include "cutlass/util/platform.h"
 
 namespace cutlass {
 
@@ -128,4 +128,38 @@ CUTLASS_HOST_DEVICE value_t lcm(value_t a, value_t b) {
   return temp ? (a / temp * b) : 0;
 }
 
+/**
+ * log2 computation, what's the
+ * difference between the below codes and
+ * log2_up/down codes?
+ */
+template <typename value_t>
+CUTLASS_HOST_DEVICE value_t clz(value_t x) {
+  for (int i = 31; i >= 0; --i) {
+    if ((1 << i) & x) return 31 - i;
+  }
+  return 32;
+}
+
+template <typename value_t>
+CUTLASS_HOST_DEVICE value_t find_log2(value_t x) {
+  int a = 31 - clz(x);
+  a += (x & (x - 1)) != 0;  // Round up, add 1 if not a power of 2.
+  return a;
+}
+
+/******************************************************************************
+ * Min/Max
+ ******************************************************************************/
+
+template <int A, int B>
+struct Min {
+  static int const kValue = (A < B) ? A : B;
+};
+
+template <int A, int B>
+struct Max {
+  static int const kValue = (A > B) ? A : B;
+};
+
 }  // namespace cutlass
diff --git a/cutlass/gemm/identity_block_swizzle.h b/cutlass/util/numeric_types.h
similarity index 79%
rename from cutlass/gemm/identity_block_swizzle.h
rename to cutlass/util/numeric_types.h
index e1bdb2e00..d8094a256 100644
--- a/cutlass/gemm/identity_block_swizzle.h
+++ b/cutlass/util/numeric_types.h
@@ -1,5 +1,5 @@
 /***************************************************************************************************
- * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ * Copyright (c) 2018, NVIDIA CORPORATION.  All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without modification, are permitted
  * provided that the following conditions are met:
@@ -22,27 +22,26 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-/*! \file
-    \brief Defies functors for mapping blockIdx to partitions of the GEMM computation.
-
-    Currently, we only implement an identity mapping.
+/*!
+    \file
+    \brief
 */
 #pragma once
 
 namespace cutlass {
-namespace gemm {
 
-////////////////////////////////////////////////////////////////////////////////////////////////////
+///////////////////////////////////////////////////////////////////////////////////////////////////
 
-struct IdentityBlockSwizzle {
-  /// Ctor.
-  CUTLASS_DEVICE IdentityBlockSwizzle() {}
+//
+// Definitions for 1-bit binary and 4-bit integer types
+//
 
-  /// Swizzle the block index.
-  CUTLASS_DEVICE dim3 swizzle() { return blockIdx; }
-};
+struct bin1_t {};  // 1-bit binary type
 
-////////////////////////////////////////////////////////////////////////////////////////////////////
+struct int4_t {};  // 4-bit signed integer type
+
+struct uint4_t {};  // 4-bit unsigned integer type
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
 
-}  // namespace gemm
 }  // namespace cutlass
diff --git a/cutlass/util/platform.h b/cutlass/util/platform.h
index 2a44c10e6..3fd7c897d 100644
--- a/cutlass/util/platform.h
+++ b/cutlass/util/platform.h
@@ -110,9 +110,17 @@
 #include <type_traits>  // For integral constants, conditional metaprogramming, and type traits
 #endif
 
-#include <cutlass/cutlass.h>
+#include "cutlass/cutlass.h"
 
 #endif
+
+//-----------------------------------------------------------------------------
+// OS
+//-----------------------------------------------------------------------------
+#if defined(WIN32) || defined(_WIN32) || defined(__WIN32) && !defined(__CYGWIN__)
+#define CUTLASS_OS_WINDOWS
+#endif
+
 /******************************************************************************
  * Macros
  ******************************************************************************/
diff --git a/cutlass/vector.h b/cutlass/vector.h
index a66dfdef7..aeababb66 100644
--- a/cutlass/vector.h
+++ b/cutlass/vector.h
@@ -31,7 +31,8 @@
 #include <cuda_fp16.h>
 #endif
 
-#include <cutlass/util/platform.h>
+#include "cutlass/util/numeric_types.h"
+#include "cutlass/util/platform.h"
 
 namespace cutlass {
 
@@ -80,13 +81,43 @@ union Vector {
   uint32_t registers[kRegisters];
 
   /// Accessor to the ith lane.
-  CUTLASS_DEVICE Scalar const& operator[](uint32_t i) const { return scalars[i]; }
+  CUTLASS_HOST_DEVICE Scalar const& operator[](uint32_t i) const { return scalars[i]; }
   /// Accessor to the ith lane.
-  CUTLASS_DEVICE Scalar& operator[](uint32_t i) { return scalars[i]; }
+  CUTLASS_HOST_DEVICE Scalar& operator[](uint32_t i) { return scalars[i]; }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+template <>
+union Vector<half, 1> {
+  /// The scalar type.
+  typedef half Scalar;
+
+  /// The number of elements in the vector.
+  enum { kLanes = 1 };
+  /// The size of the vector.
+  enum { kVectorSize = kLanes * (int)sizeof(Scalar) };
+  /// The number of registers needed to store the vector.
+  enum { kRegisters = kVectorSize < 4 ? 1 : kVectorSize / 4 };
+
+  // Make sure that the vector type makes sense.
+  static_assert(kVectorSize <= 16, "Vector type is too large");
+
+  /// The aligned storage to make sure we have good alignment.
+  AlignedStruct<kVectorSize> aligned_;
+  /// The associated array of scalars.
+  uint16_t scalars[kLanes];
+
+  /// Accessor to the ith lane.
+  CUTLASS_HOST_DEVICE Scalar const& operator[](uint32_t i) const {
+    return reinterpret_cast<Scalar const&>(scalars[i]);
+  }
+  /// Accessor to the ith lane.
+  CUTLASS_HOST_DEVICE Scalar& operator[](uint32_t i) {
+      return reinterpret_cast<Scalar&>(scalars[i]);
+  }
+};
+
 #if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)
 
 template <int kLanes_>
@@ -112,19 +143,124 @@ union Vector<half, kLanes_> {
   uint32_t registers[kRegisters];
 
   /// Accessor to the ith lane.
-  CUTLASS_DEVICE Scalar const& operator[](uint32_t i) const {
+  CUTLASS_HOST_DEVICE Scalar const& operator[](uint32_t i) const {
     return reinterpret_cast<Scalar const&>(scalars[i]);
   }
   /// Accessor to the ith lane.
-  CUTLASS_DEVICE Scalar& operator[](uint32_t i) { return reinterpret_cast<Scalar&>(scalars[i]); }
+  CUTLASS_HOST_DEVICE Scalar& operator[](uint32_t i) {
+      return reinterpret_cast<Scalar&>(scalars[i]);
+  }
 };
 
 #endif
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+/// Vector definition for 1-bit binary datatype
+template <int kLanes_>
+union Vector<bin1_t, kLanes_> {
+  /// The scalar type.
+  typedef bin1_t Scalar;
+
+  /// The number of elements in the vector.
+  enum { kLanes = kLanes_ };
+  /// The size of the vector.
+  enum { kVectorSize = kLanes / 8 };
+  /// The number of registers needed to store the vector.
+  enum { kRegisters = kVectorSize < 4 ? 1 : kVectorSize / 4 };
+
+  static_assert((kLanes >= 8) && !(kLanes % 8),
+                "May only construct vectors of bin1_t that are multiples of 8 bits.");
+
+  /// The aligned storage to make sure we have good alignment.
+  AlignedStruct<kVectorSize> aligned_;
+  /// The data in registers.
+  uint32_t registers[kRegisters];
+
+  /// Default Constructor
+  CUTLASS_HOST_DEVICE
+  Vector() {}
+  /// Constructor to convert from uint32_t type
+  CUTLASS_HOST_DEVICE Vector(uint32_t value) { registers[0] = value; }
+  /// Accessor to the ith lane.
+  CUTLASS_HOST_DEVICE bool operator[](uint32_t i) const {
+    return ( (registers[i / 32] & (1 << (i % 32))) != 0 );
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Vector definition for 4-bit signed integer datatype
+template <int kLanes_>
+union Vector<int4_t, kLanes_> {
+  /// The scalar type.
+  typedef int4_t Scalar;
+
+  /// The number of elements in the vector.
+  enum { kLanes = kLanes_ };
+  /// The size of the vector.
+  enum { kVectorSize = kLanes / 2 };
+  /// The number of registers needed to store the vector.
+  enum { kRegisters = kVectorSize < 4 ? 1 : kVectorSize / 4 };
+
+  static_assert((kLanes >= 2) && !(kLanes % 2),
+   "May only construct vectors of int4_t that are multiples of 8 bits.");
+
+  /// The aligned storage to make sure we have good alignment.
+  AlignedStruct<kVectorSize> aligned_;
+  /// The data in registers.
+  uint32_t registers[kRegisters];
+
+  /// Default Constructor
+  CUTLASS_HOST_DEVICE
+  Vector() {}
+  /// Constructor to convert from uint32_t type
+  CUTLASS_HOST_DEVICE Vector(uint32_t value) { registers[0] = value; }
+  /// Accessor to the ith lane.
+  CUTLASS_HOST_DEVICE int operator[](uint32_t i) const {
+    return (registers[i / 8] >> (i % 8 * 4) & 0x0f)
+              - 16 * (registers[i / 8] >> (i % 8 * 4 + 3) & 0x01);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Vector definition for 4-bit unsigned integer datatype
+template <int kLanes_>
+union Vector<uint4_t, kLanes_> {
+  /// The scalar type.
+  typedef uint4_t Scalar;
+
+  /// The number of elements in the vector.
+  enum { kLanes = kLanes_ };
+  /// The size of the vector.
+  enum { kVectorSize = kLanes / 2 };
+  /// The number of registers needed to store the vector.
+  enum { kRegisters = kVectorSize < 4 ? 1 : kVectorSize / 4 };
+
+  static_assert((kLanes >= 2) && !(kLanes % 2),
+    "May only construct vectors of uint4_t that are multiples of 8 bits.");
+
+  /// The aligned storage to make sure we have good alignment.
+  AlignedStruct<kVectorSize> aligned_;
+  /// The data in registers.
+  uint32_t registers[kRegisters];
+
+  /// Default Constructor
+  CUTLASS_HOST_DEVICE
+  Vector() {}
+  /// Constructor to convert from uint32_t type
+  CUTLASS_HOST_DEVICE Vector(uint32_t value) { registers[0] = value; }
+  /// Accessor to the ith lane.
+  CUTLASS_HOST_DEVICE int operator[](uint32_t i) const {
+    return registers[i / 8] >> (i % 8 * 4) & 0x0f;
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 template <typename Scalar_>
-CUTLASS_DEVICE void make_zero(Scalar_& x) {
+CUTLASS_HOST_DEVICE void make_zero(Scalar_& x) {
   x = Scalar_(0);
 }
 
@@ -137,15 +273,29 @@ struct Vectorize {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename Element_>
-struct Vectorize<Element_, 1> {
-  typedef Element_ Type;
+template <int kLanes_>
+struct Vectorize<Vector<bin1_t, 32>, kLanes_> {
+  typedef Vector<bin1_t, kLanes_ * 32> Type;
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <int kLanes_>
+struct Vectorize<Vector<int4_t, 8>, kLanes_> {
+  typedef Vector<int4_t, kLanes_ * 8> Type;
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <int kLanes_>
+struct Vectorize<Vector<uint4_t, 8>, kLanes_> {
+  typedef Vector<uint4_t, kLanes_ * 8> Type;
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 template <typename Scalar_, int kLanes_>
-CUTLASS_DEVICE void make_zero(Vector<Scalar_, kLanes_>& vec) {
+CUTLASS_HOST_DEVICE void make_zero(Vector<Scalar_, kLanes_>& vec) {
   for (int i = 0; i < Vector<Scalar_, kLanes_>::kRegisters; ++i) {
     vec.registers[i] = 0;
   }
diff --git a/cutlass/wmma_matrix.h b/cutlass/wmma_matrix.h
index c4d8a0b54..61c4ed272 100644
--- a/cutlass/wmma_matrix.h
+++ b/cutlass/wmma_matrix.h
@@ -28,20 +28,23 @@
 #pragma once
 
 #if defined(__CUDACC__) && (!defined(__CUDA_ARCH__) || __CUDA_ARCH__ >= 700)
-
-// Dependent header files should use the following macro to guard all code using
-// nvcuda::wmma:: to enable compilation for CUDA Compute Capabilities < sm_70.
-// Earlier shader models not support Tensor Cores.
 #define CUTLASS_USE_WMMA_API
 
+#if defined(__CUDACC__) && (__CUDACC_VER_MAJOR__ >= 10) && (!defined(__CUDA_ARCH__) || __CUDA_ARCH__ >= 750)
+#define CUTLASS_USE_SUBBYTE_WMMA
+#endif
+
 #include "stdio.h"
 
+#if __CUDACC_VER_MAJOR__ >= 10
+#include <mma.h>
+#else
 #include <crt/mma.h>
-#include <cutlass/fragment.h>
-#include <cutlass/load_store.h>
-#include <cutlass/matrix_traits.h>
-#include <cutlass/shape.h>
-#include <cutlass/vector.h>
+#endif
+#include "cutlass/fragment.h"
+#include "cutlass/matrix_traits.h"
+#include "cutlass/shape.h"
+#include "cutlass/vector.h"
 
 namespace cutlass {
 
@@ -61,6 +64,34 @@ struct WmmaLayout<MatrixLayout::kRowMajor> {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+/// Statically maps cutlass types to nvcuda::wmma datatypes
+template <typename Type_>
+struct WmmaDataType{
+  typedef Type_ Type;
+};
+
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+/// Statically maps cutlass::Vector<bin1_t, 32> to nvcuda::wmma::experimental::precision::b1
+template<>
+struct WmmaDataType<Vector<bin1_t, 32> > {
+  typedef nvcuda::wmma::experimental::precision::b1 Type;
+};
+
+/// Statically maps cutlass::Vector<int4_t, 8> to nvcuda::wmma::experimental::precision::s4
+template<>
+struct WmmaDataType<Vector<int4_t, 8> > {
+  typedef nvcuda::wmma::experimental::precision::s4 Type;
+};
+
+/// Statically maps cutlass::Vector<uint4_t, 8> to nvcuda::wmma::experimental::precision::u4
+template<>
+struct WmmaDataType<Vector<uint4_t, 8> > {
+  typedef nvcuda::wmma::experimental::precision::u4 Type;
+};
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 /// Adapter to nvcuda::wmma fragment load and store operations
 template <GemmOperand::Kind kOperand_,
           MatrixLayout::Kind kLayout_,
@@ -81,7 +112,7 @@ struct WmmaMatrix<GemmOperand::kA, kLayout_, Scalar_, WmmaShape_>
           WmmaShape_::kH,
           WmmaShape_::kD,
           /// The scalar.
-          Scalar_,
+          typename WmmaDataType<Scalar_>::Type,
           /// The layout.
           typename WmmaLayout<kLayout_>::Layout> {
   /// This type.
@@ -117,7 +148,7 @@ struct WmmaMatrix<GemmOperand::kB, kLayout_, Scalar_, WmmaShape_>
           WmmaShape_::kH,
           WmmaShape_::kD,
           /// The scalar.
-          Scalar_,
+          typename WmmaDataType<Scalar_>::Type,
           /// The layout.
           typename WmmaLayout<kLayout_>::Layout> {
   /// This type.
@@ -188,6 +219,18 @@ struct WmmaMatrix<GemmOperand::kC, kLayout_, Scalar_, WmmaShape_>
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-}  // namespace cutlass
+// WmmaMatrix cannot be used in a Union and thus in cannot be used in our Vector implementation.
+// The only use of WmmaMatrix in in combination with Vectorize has kLanes == 1. Due to this it is
+// safe to keep the Vector->Scalar conversion for WmmaMatrix.
+template <GemmOperand::Kind kOperand_,
+          MatrixLayout::Kind kLayout_,
+          typename Scalar_,
+          typename WmmaShape_>
+struct Vectorize<WmmaMatrix<kOperand_, kLayout_, Scalar_, WmmaShape_>, 1> {
+  typedef WmmaMatrix<kOperand_, kLayout_, Scalar_, WmmaShape_> Type;
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+}
 
 #endif  // defined CUTLASS_USE_WMMA_API
diff --git a/cutlass/zip_fragment.h b/cutlass/zip_fragment.h
new file mode 100644
index 000000000..37a788614
--- /dev/null
+++ b/cutlass/zip_fragment.h
@@ -0,0 +1,150 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Models a pair of fragments
+*/
+#pragma once
+
+#include <assert.h>
+
+#include "cutlass/cutlass.h"
+#include "cutlass/shape.h"
+#include "cutlass/util/cutlass_math.h"
+#include "cutlass/vector.h"
+
+namespace cutlass {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/**
+* @brief A template defining \ref fragment_concept
+* @concept{fragment_concept}
+*/
+template <typename First_, typename Second_>
+struct ZipFragment {
+  /// First fragment object
+  typedef First_ First;
+
+  /// Second fragment object
+  typedef Second_ Second;
+
+  /// This class.
+  typedef ZipFragment<First, Second> This_;
+
+  //
+  // Data members
+  //
+
+  /// First fragment object
+  First first;
+
+  /// Second fragment object
+  Second second;
+
+  //
+  // Methods
+  //
+
+  /// Default ctor
+  CUTLASS_DEVICE
+  ZipFragment() { }
+
+  /// Copy ctor
+  CUTLASS_DEVICE
+  ZipFragment(First const &_first, Second const &_second): first(_first), second(_second) { }
+
+  /// Clear a fragment.
+  CUTLASS_DEVICE void clear() {
+    first.clear();
+    second.clear();
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to construct a ZipFragment object
+template <typename First, typename Second>
+CUTLASS_HOST_DEVICE
+ZipFragment<First, Second> make_ZipFragment(First const &first, Second const &second) {
+  return ZipFragment<First, Second>(first, second);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Zips two convert operations
+template <typename First_, typename Second_>
+struct ZipConvert {
+  /// First convert operator
+  typedef First_ First;
+
+  /// Second convert operator
+  typedef Second_ Second;
+
+  /// Defines the input zip fragment
+  typedef ZipFragment<typename First::InputFragment, typename Second::InputFragment> InputFragment;
+
+  /// Defines the output zip fragment
+  typedef ZipFragment<typename First::OutputFragment, typename Second::OutputFragment>
+      OutputFragment;
+
+  //
+  //
+  //
+
+  /// First transformer
+  First first;
+
+  /// Second transformer
+  Second second;
+
+  //
+  //
+  //
+
+  /// Ctor.
+  CUTLASS_DEVICE ZipConvert() {}
+
+  /// Ctor.
+  CUTLASS_DEVICE ZipConvert(First const &_first, Second const &_second): first(_first), second(_second) { }
+
+  /// Transform a fragment.
+  CUTLASS_DEVICE void transform(InputFragment const& src, OutputFragment& dst) {
+    first.transform(src.first, dst.first);
+    second.transform(src.second, dst.second);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to construct a ZipConvert object
+template <typename First, typename Second>
+CUTLASS_HOST_DEVICE
+ZipConvert<First, Second> make_ZipConvert(First const &first, Second const &second) {
+  return ZipConvert<First, Second>(first, second);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace cutlass
diff --git a/cutlass/zip_tensor_ref.h b/cutlass/zip_tensor_ref.h
new file mode 100644
index 000000000..d2cff9e0c
--- /dev/null
+++ b/cutlass/zip_tensor_ref.h
@@ -0,0 +1,77 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Defines a structure containing a pair of TensorRef-like objects
+*/
+#pragma once
+
+#include "cutlass/coord.h"
+#include "cutlass/tensor_ref.h"
+
+namespace cutlass {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename First_, typename Second_>
+struct ZipTensorRef {
+  /// First tensor ref
+  typedef First_ First;
+
+  /// Second tensor ref
+  typedef Second_ Second;
+
+  //
+  // Data members
+  //
+
+  /// First TensorRef
+  First first;
+
+  /// Second TensorRef
+  Second second;
+
+  //
+  // Methods
+  //
+
+  CUTLASS_HOST_DEVICE
+  ZipTensorRef() {}
+
+  CUTLASS_HOST_DEVICE
+  ZipTensorRef(First const& _first, Second const& _second) : first(_first), second(_second) {}
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Constructs a ZipTensorRef
+template <typename First, typename Second>
+CUTLASS_HOST_DEVICE
+ZipTensorRef<First, Second> make_ZipTensorRef(First const &first, Second const &second) {
+  return ZipTensorRef<First, Second>(first, second);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace cutlass
diff --git a/cutlass/zip_tile_iterator.h b/cutlass/zip_tile_iterator.h
new file mode 100644
index 000000000..f8ba4eee3
--- /dev/null
+++ b/cutlass/zip_tile_iterator.h
@@ -0,0 +1,287 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+/*! \file
+    \brief Constructs an iterator that owns two tile iterator instances
+*/
+
+#pragma once
+
+#include "cutlass/coord.h"
+#include "cutlass/zip_tensor_ref.h"
+#include "cutlass/zip_fragment.h"
+
+namespace cutlass {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Constructs an iterator from a pair of iterators
+template <typename First_, typename Second_>
+class ZipTileIterator {
+ public:
+  /// First iterator type
+  typedef First_ First;
+
+  /// Second iterator type
+  typedef Second_ Second;
+
+  /// Params object
+  struct Params {
+    /// Parameters of first iterator
+    typename First::Params first;
+
+    /// Parameters of second iterator
+    typename Second::Params second;
+
+    /// Constructs a parameters object
+    CUTLASS_HOST_DEVICE
+    Params() {}
+
+    /// Constructs a parameters object
+    CUTLASS_HOST_DEVICE
+    Params(typename First::Params const &_first, typename Second::Params const &_second)
+        : first(_first), second(_second) {}
+  };
+
+  /// Fragment type
+  typedef ZipFragment<typename First::Fragment, typename Second::Fragment> Fragment;
+
+  /// Predicate vector
+  typedef typename First::PredicateVector PredicateVector;
+
+  /// Index type
+  typedef typename First::Index Index;
+
+  /// Tensor reference
+  typedef ZipTensorRef<
+    typename First::TensorRef,
+    typename Second::TensorRef> TensorRef;
+
+  //
+  // Data members
+  //
+
+  /// First iterator
+  First first;
+
+  /// Second iterator
+  Second second;
+
+  //
+  // Methods
+  //
+
+  /// Default constructor
+  CUTLASS_DEVICE
+  ZipTileIterator() {}
+
+  /// Constructs a zip iterator from params
+  CUTLASS_DEVICE
+  ZipTileIterator(Params const &_params, Coord<3> const &threadblock_offset = make_Coord(0, 0, 0))
+      : first(_params.first, threadblock_offset), second(_params.second, threadblock_offset) {}
+
+  /// Constructs a zip iterator from iterator instances
+  CUTLASS_DEVICE
+  ZipTileIterator(First const &_first, Second const &_second) : first(_first), second(_second) {}
+
+  /// Constructs a zip iterator from iterator instances
+  CUTLASS_DEVICE
+  ZipTileIterator(TensorRef const &ref) : first(ref.first), second(ref.second) {}
+
+  /// Constructs a zip iterator from iterator instances
+  CUTLASS_DEVICE
+  ZipTileIterator(Params const &_params, TensorRef const &ref):
+    first(_params.first, ref.first), second(_params.second, ref.second) {}
+
+  //
+  // Predicate initialization
+  //
+
+  /// Initializes a predicate vector using a RegularTilePredicateFunctor
+  template <
+      /// Predicate iterator
+      typename PredicateIterator>
+  CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it,
+                                                 Coord<3> const &bounds,
+                                                 Coord<3> const &block_offset = make_Coord(0,
+                                                                                           0,
+                                                                                           0)) {
+    first.initialize_predicates(predicate_it, bounds, block_offset);
+  }
+
+  /// Initializes a predicate vector using an arbitrary predicate functor
+  template <
+      /// Predicate iterator
+      typename PredicateIterator,
+      /// Functor computing predicates
+      typename PredicateFunctor>
+  CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it,
+                                                 PredicateFunctor const &functor,
+                                                 Coord<3> const &block_offset) {
+    first.initialize_predicates(predicate_it, functor, block_offset);
+  }
+
+  //
+  // No predicates
+  //
+
+  /// Loads a fragment and increments without predicates
+  template <typename Fragment>
+  CUTLASS_DEVICE void load_post_increment(Fragment &fragment) {
+    first.load_post_increment(fragment.first);
+    second.load_post_increment(fragment.second);
+  }
+
+  /// Loads a fragment and increments without predicates
+  template <typename Fragment>
+  CUTLASS_DEVICE void load_post_increment(Fragment &fragment,
+                            Coord<4> const &offset) {
+    first.load_post_increment(fragment.first, offset);
+    second.load_post_increment(fragment.second, offset);
+  }
+
+  /// Loads a fragment without predicates
+  template <typename Fragment>
+  CUTLASS_DEVICE void load(Fragment &fragment) const {
+    first.load(fragment.first);
+    second.load(fragment.second);
+  }
+
+  /// Loads a fragment without predicates
+  template <typename Fragment>
+  CUTLASS_DEVICE void load(Fragment &fragment,
+                            Coord<4> const &offset) const {
+    first.load(fragment.first, offset);
+    second.load(fragment.second, offset);
+  }
+
+  /// Stores a fragment and increments without predicates
+  template <typename Fragment>
+  CUTLASS_DEVICE void store_post_increment(Fragment const &fragment) {
+    first.store_post_increment(fragment.first);
+    second.store_post_increment(fragment.second);
+  }
+
+  /// Stores a fragment and increments without predicates
+  template <typename Fragment>
+  CUTLASS_DEVICE void store_post_increment(Fragment const &fragment,
+                            Coord<4> const &offset) {
+    first.store_post_increment(fragment.first, offset);
+    second.store_post_increment(fragment.second, offset);
+  }
+
+  /// Stores a fragment without predicates
+  template <typename Fragment>
+  CUTLASS_DEVICE void store(Fragment const &fragment) const {
+    first.store(fragment.first);
+    second.store(fragment.second);
+  }
+
+  /// Stores a fragment without predicates
+  template <typename Fragment>
+  CUTLASS_DEVICE void store(Fragment const &fragment,
+                            Coord<4> const &offset) const {
+    first.store(fragment.first, offset);
+    second.store(fragment.second, offset);
+  }
+
+  //
+  // With predication
+  //
+
+  /// Loads a fragment and increments, using predicates
+  template <typename Fragment, typename PredicateIterator>
+  CUTLASS_DEVICE void load_post_increment(Fragment &fragment, PredicateIterator pred_it) {
+    first.load_post_increment(fragment.first, pred_it);
+    second.load_post_increment(fragment.second, pred_it);
+  }
+
+  /// Loads a fragment with predicates
+  template <typename Fragment, typename PredicateIterator>
+  CUTLASS_DEVICE void load(Fragment &fragment, PredicateIterator pred_it) const {
+    first.load(fragment.first, pred_it);
+    second.load(fragment.second, pred_it);
+  }
+
+  /// Loads a fragment and increments, using predicates
+  template <typename Fragment, typename PredicateIterator>
+  CUTLASS_DEVICE void store_post_increment(Fragment const &fragment, PredicateIterator pred_it) {
+    first.store_post_increment(fragment.first, pred_it);
+    second.store_post_increment(fragment.second, pred_it);
+  }
+
+  /// Loads a fragment with predicates
+  template <typename Fragment, typename PredicateIterator>
+  CUTLASS_DEVICE void store(Fragment const &fragment, PredicateIterator pred_it) const {
+    first.store(fragment.first, pred_it);
+    second.store(fragment.second, pred_it);
+  }
+
+  //
+  // Advances the iterators
+  //
+
+  /// Increments store iterator to next tile
+  CUTLASS_DEVICE ZipTileIterator &increment(int count = 1) {
+    first.increment(count);
+    second.increment(count);
+    return *this;
+  }
+
+  /// Increments to next tile
+  CUTLASS_DEVICE ZipTileIterator &operator++() { return increment(); }
+
+  CUTLASS_DEVICE ZipTileIterator &operator+=(int count) { return increment(count); }
+
+  /// Adds a vector offset to the underlying iterators
+  CUTLASS_DEVICE ZipTileIterator &operator+=(Coord<3> const &offset) {
+    first += offset;
+    second += offset;
+    return *this;
+  }
+
+  /// Increments store iterator to previous tile
+  CUTLASS_DEVICE ZipTileIterator &decrement(int count = 1) {
+    first.decrement(count);
+    second.decrement(count);
+    return *this;
+  }
+
+  /// Increments to subsequent tile
+  CUTLASS_DEVICE ZipTileIterator &operator--() { return decrement(); }
+
+  /// Decrements to previous tile
+  CUTLASS_DEVICE ZipTileIterator &operator-=(int count) { return decrement(count); }
+
+  /// Adds an offset to both iterators
+  CUTLASS_DEVICE void add_pointer_offset(Index offset) {
+    first.add_pointer_offset(offset);
+    second.add_pointer_offset(offset);
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namspace cutlass
diff --git a/examples/00_basic_gemm/CMakeLists.txt b/examples/00_basic_gemm/CMakeLists.txt
new file mode 100644
index 000000000..144263fff
--- /dev/null
+++ b/examples/00_basic_gemm/CMakeLists.txt
@@ -0,0 +1,38 @@
+# Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+#
+# Redistribution and use in source and binary forms, with or without modification, are permitted
+# provided that the following conditions are met:
+#     * Redistributions of source code must retain the above copyright notice, this list of
+#       conditions and the following disclaimer.
+#     * Redistributions in binary form must reproduce the above copyright notice, this list of
+#       conditions and the following disclaimer in the documentation and/or other materials
+#       provided with the distribution.
+#     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+#       to endorse or promote products derived from this software without specific prior written
+#       permission.
+#
+# THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+# IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+# FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+# FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+# BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+# OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+# STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+# OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+
+
+set(EXAMPLES_BASIC_CUTLASS_GEMM_SOURCES
+  basic_gemm.cu
+)
+
+if (NOT CUTLASS_NATIVE_CUDA)
+  # cuda_add_executable does not take interface include directories into account
+  # Let's fetch them and pass them to CUDA.
+  get_target_property(CUTLASS_INCLUDES CUTLASS INTERFACE_INCLUDE_DIRECTORIES)
+  include_directories("${CUTLASS_INCLUDES}")
+endif()
+
+cutlass_add_executable(
+  00_basic_gemm
+  ${EXAMPLES_BASIC_CUTLASS_GEMM_SOURCES}
+)
diff --git a/examples/00_basic_gemm/basic_gemm.cu b/examples/00_basic_gemm/basic_gemm.cu
new file mode 100644
index 000000000..d6911c1f6
--- /dev/null
+++ b/examples/00_basic_gemm/basic_gemm.cu
@@ -0,0 +1,492 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+/*
+  This example demonstrates how to call a CUTLASS GEMM kernel and provides a naive reference
+  matrix multiply kernel to verify its correctness.
+
+  The CUTLASS Gemm template is instantiated in the function CutlassSgemmNN. This is kernel computes
+  the general matrix product (GEMM) using single-precision floating-point arithmetic and assumes
+  all matrices have column-major layout.
+
+  The threadblock tile size is chosen as 128x128x8 which offers good performance for large matrices.
+  See the CUTLASS Parallel for All blog post for more exposition on the tunable parameters available
+  in CUTLASS.
+
+  https://devblogs.nvidia.com/cutlass-linear-algebra-cuda/
+
+  Aside from defining and launching the SGEMM kernel, this example does not use any other components
+  or utilities within CUTLASS. Such utilities are demonstrated elsewhere in other examples and are
+  prevalent in the CUTLASS unit tests.
+*/
+
+// Standard Library includes
+#include <iostream>
+#include <sstream>
+#include <vector>
+
+//
+// CUTLASS includes needed for single-precision GEMM kernel
+//
+
+// Defines cutlass::gemm::Gemm, the generic Gemm computation template class.
+#include "cutlass/gemm/gemm.h"
+
+// Defines cutlass::gemm::SgemmTraits, the structural components for single-precision GEMM
+#include "cutlass/gemm/sgemm_traits.h"
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// This function defines a CUTLASS GEMM kernel instantiation, constructs its parameters object,
+// and launches it on the CUDA device.
+//
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Define a CUTLASS GEMM template and launch a GEMM kernel.
+cudaError_t CutlassSgemmNN(
+  int M,
+  int N,
+  int K,
+  float alpha,
+  float const *A,
+  int lda,
+  float const *B,
+  int ldb,
+  float beta,
+  float *C,
+  int ldc) {
+
+  // Define type definition for single-precision CUTLASS GEMM with column-major
+  // input matrices and 128x128x8 threadblock tile size.
+  //
+  // Note, GemmTraits<> is a generic template defined for various general matrix product
+  // computations within CUTLASS. It is intended to be maximally flexible, and consequently
+  // it contains numerous template arguments.
+  //
+  // To keep the interface manageable, several helpers are defined for plausible compositions
+  // including the following example for single-precision GEMM. Typical values are used as
+  // default template arguments. See `cutlass/gemm/gemm_traits.h` for more details.
+  //
+  typedef cutlass::gemm::SgemmTraits<
+    cutlass::MatrixLayout::kColumnMajor,   // layout of A matrix
+    cutlass::MatrixLayout::kColumnMajor,   // layout of B matrix
+    cutlass::Shape<8, 128, 128>            // threadblock tile size
+  >
+    GemmTraits;
+
+  // Define a CUTLASS GEMM type from a GemmTraits<> instantiation.
+  typedef cutlass::gemm::Gemm<GemmTraits> Gemm;
+
+  // Construct and initialize CUTLASS GEMM parameters object.
+  //
+  // One of CUTLASS's design patterns is to define parameters objects that are constructible
+  // in host code and passed to kernels by value. These may include pointers, strides, scalars,
+  // and other arguments needed by Gemm and its components.
+  //
+  // The benefits of this pattern are (1.) a structured, composable strategy for passing host-constructible
+  // arguments to kernels and (2.) minimized initialization overhead on kernel entry.
+  //
+  typename Gemm::Params params;
+
+  int result = params.initialize(
+    M,     // GEMM M dimension
+    N,     // GEMM N dimension
+    K,     // GEMM K dimension
+    alpha, // scalar alpha
+    A,     // matrix A operand
+    lda,
+    B,     // matrix B operand
+    ldb,
+    beta,  // scalar beta
+    C,     // source matrix C
+    ldc,
+    C,     // destination matrix C (may be different memory than source C matrix)
+    ldc
+  );
+
+  if (result) {
+    std::cerr << "Failed to initialize CUTLASS Gemm::Params object." << std::endl;
+    return cudaErrorInvalidValue;
+  }
+
+  // Launch the CUTLASS GEMM kernel.
+  Gemm::launch(params);
+
+  // Return any errors associated with the launch or cudaSuccess if no error.
+  return cudaGetLastError();
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// The source code after this point in the file is generic CUDA using the CUDA Runtime API
+// and simple CUDA kernels to initialize matrices and compute the general matrix product.
+//
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Kernel to initialize a matrix with small integers.
+__global__ void InitializeMatrix_kernel(
+  float *matrix,
+  int ldm,
+  int rows,
+  int columns,
+  int seed = 0) {
+
+  int i = threadIdx.x + blockIdx.x * blockDim.x;
+  int j = threadIdx.y + blockIdx.y * blockDim.y;
+
+  if (i < rows && j < columns) {
+    int offset = i + j * ldm;
+
+    // Generate arbitrary elements.
+    int const k = 16807;
+    int const m = 16;
+    float value = float(((offset + seed) * k % m) - m / 2);
+
+    matrix[offset] = value;
+  }
+}
+
+/// Simple function to initialize a matrix to arbitrary small integers.
+cudaError_t InitializeMatrix(float *matrix, int ldm, int rows, int columns, int seed = 0) {
+
+  dim3 block(16, 16);
+  dim3 grid(
+    (rows + block.x - 1) / block.x,
+    (columns + block.y - 1) / block.y
+  );
+
+  InitializeMatrix_kernel<<< grid, block >>>(matrix, ldm, rows, columns, seed);
+
+  return cudaGetLastError();
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Allocates device memory for a matrix then fills with arbitrary small integers.
+cudaError_t AllocateMatrix(float **matrix, int ldm, int rows, int columns, int seed = 0) {
+  cudaError_t result;
+
+  size_t sizeof_matrix = sizeof(float) * ldm * columns;
+
+  // Allocate device memory.
+  result = cudaMalloc(reinterpret_cast<void **>(matrix), sizeof_matrix);
+
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to allocate matrix: "
+      << cudaGetErrorString(result) << std::endl;
+    return result;
+  }
+
+  // Clear the allocation.
+  result = cudaMemset(*matrix, 0, sizeof_matrix);
+
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to clear matrix device memory: "
+      << cudaGetErrorString(result) << std::endl;
+    return result;
+  }
+
+  // Initialize matrix elements to arbitrary small integers.
+  result = InitializeMatrix(*matrix, ldm, rows, columns, seed);
+
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to initialize matrix: "
+      << cudaGetErrorString(result) << std::endl;
+    return result;
+  }
+
+  return result;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Naive reference GEMM computation.
+__global__ void ReferenceGemm_kernel(
+  int M,
+  int N,
+  int K,
+  float alpha,
+  float const *A,
+  int lda,
+  float const *B,
+  int ldb,
+  float beta,
+  float *C,
+  int ldc) {
+
+  int i = threadIdx.x + blockIdx.x * blockDim.x;
+  int j = threadIdx.y + blockIdx.y * blockDim.y;
+
+  if (i < M && j < N) {
+    float accumulator = 0;
+
+    for (int k = 0; k < K; ++k) {
+      accumulator += A[i + k * lda] * B[k + j * ldb];
+    }
+
+    C[i + j * ldc] = alpha * accumulator + beta * C[i + j * ldc];
+  }
+}
+
+/// Reference GEMM computation.
+cudaError_t ReferenceGemm(
+  int M,
+  int N,
+  int K,
+  float alpha,
+  float const *A,
+  int lda,
+  float const *B,
+  int ldb,
+  float beta,
+  float *C,
+  int ldc) {
+
+  dim3 block(16, 16);
+  dim3 grid(
+    (M + block.x - 1) / block.x,
+    (N + block.y - 1) / block.y
+  );
+
+  ReferenceGemm_kernel<<< grid, block >>>(M, N, K, alpha, A, lda, B, ldb, beta, C, ldc);
+
+  return cudaGetLastError();
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Allocate several matrices in GPU device memory and call a single-precision
+/// CUTLASS GEMM kernel.
+cudaError_t TestCutlassGemm(int M, int N, int K, float alpha, float beta) {
+  cudaError_t result;
+
+  //
+  // Define several matrices to be used as operands to GEMM kernels.
+  //
+
+  // Compute leading dimensions for each matrix.
+  int lda = M;
+  int ldb = K;
+  int ldc = M;
+
+  // Compute size in bytes of the C matrix.
+  size_t sizeof_C = sizeof(float) * ldc * N;
+
+  // Define pointers to matrices in GPU device memory.
+  float *A;
+  float *B;
+  float *C_cutlass;
+  float *C_reference;
+
+  //
+  // Allocate matrices in GPU device memory with arbitrary seeds.
+  //
+
+  result = AllocateMatrix(&A, lda, M, K, 0);
+
+  if (result !=  cudaSuccess) {
+    return result;
+  }
+
+  result = AllocateMatrix(&B, ldb, K, N, 17);
+
+  if (result !=  cudaSuccess) {
+    cudaFree(A);
+    return result;
+  }
+
+  result = AllocateMatrix(&C_cutlass, ldc, M, N, 101);
+
+  if (result != cudaSuccess) {
+    cudaFree(A);
+    cudaFree(B);
+    return result;
+  }
+
+  result = AllocateMatrix(&C_reference, ldc, M, N, 101);
+
+  if (result != cudaSuccess) {
+    cudaFree(A);
+    cudaFree(B);
+    cudaFree(C_cutlass);
+    return result;
+  }
+
+  result = cudaMemcpy(C_reference, C_cutlass, sizeof_C, cudaMemcpyDeviceToDevice);
+
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to copy C_cutlass matrix to C_reference: "
+      << cudaGetErrorString(result) << std::endl;
+
+    cudaFree(C_reference);
+    cudaFree(C_cutlass);
+    cudaFree(B);
+    cudaFree(A);
+
+    return result;
+  }
+
+  //
+  // Launch CUTLASS GEMM.
+  //
+
+  result = CutlassSgemmNN(M, N, K, alpha, A, lda, B, ldb, beta, C_cutlass, ldc);
+
+  if (result != cudaSuccess) {
+    std::cerr << "CUTLASS GEMM kernel failed: "
+      << cudaGetErrorString(result) << std::endl;
+
+    cudaFree(C_reference);
+    cudaFree(C_cutlass);
+    cudaFree(B);
+    cudaFree(A);
+
+    return result;
+  }
+
+  //
+  // Verify.
+  //
+
+  // Launch reference GEMM
+  result = ReferenceGemm(M, N, K, alpha, A, lda, B, ldb, beta, C_reference, ldc);
+
+  if (result != cudaSuccess) {
+    std::cerr << "Reference GEMM kernel failed: "
+      << cudaGetErrorString(result) << std::endl;
+
+    cudaFree(C_reference);
+    cudaFree(C_cutlass);
+    cudaFree(B);
+    cudaFree(A);
+
+    return result;
+  }
+
+  // Copy to host and verify equivalence.
+  std::vector<float> host_cutlass(ldc * N, 0);
+  std::vector<float> host_reference(ldc * N, 0);
+
+  result = cudaMemcpy(host_cutlass.data(), C_cutlass, sizeof_C, cudaMemcpyDeviceToHost);
+
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to copy CUTLASS GEMM results: "
+      << cudaGetErrorString(result) << std::endl;
+
+    cudaFree(C_reference);
+    cudaFree(C_cutlass);
+    cudaFree(B);
+    cudaFree(A);
+
+    return result;
+  }
+
+  result = cudaMemcpy(host_reference.data(), C_reference, sizeof_C, cudaMemcpyDeviceToHost);
+
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to copy Reference GEMM results: "
+      << cudaGetErrorString(result) << std::endl;
+
+    cudaFree(C_reference);
+    cudaFree(C_cutlass);
+    cudaFree(B);
+    cudaFree(A);
+
+    return result;
+  }
+
+  //
+  // Free device memory allocations.
+  //
+
+  cudaFree(C_reference);
+  cudaFree(C_cutlass);
+  cudaFree(B);
+  cudaFree(A);
+
+  //
+  // Test for bit equivalence of results.
+  //
+
+  if (host_cutlass != host_reference) {
+    std::cerr << "CUTLASS results incorrect." << std::endl;
+
+    return cudaErrorUnknown;
+  }
+
+  return cudaSuccess;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Entry point to basic_gemm example.
+//
+// usage:
+//
+//   00_basic_gemm <M> <N> <K> <alpha> <beta>
+//
+int main(int argc, const char *arg[]) {
+
+  //
+  // Parse the command line to obtain GEMM dimensions and scalar values.
+  //
+
+  // GEMM problem dimensions.
+  int problem[3] = { 128, 128, 128 };
+
+  for (int i = 1; i < argc && i < 4; ++i) {
+    std::stringstream ss(arg[i]);
+    ss >> problem[i - 1];
+  }
+
+  // Scalars used for linear scaling the result of the matrix product.
+  float scalars[2] = { 1, 0 };
+
+  for (int i = 4; i < argc && i < 6; ++i) {
+    std::stringstream ss(arg[i]);
+    ss >> scalars[i - 4];
+  }
+
+  //
+  // Run the CUTLASS GEMM test.
+  //
+
+  cudaError_t result = TestCutlassGemm(
+    problem[0],     // GEMM M dimension
+    problem[1],     // GEMM N dimension
+    problem[2],     // GEMM K dimension
+    scalars[0],     // alpha
+    scalars[1]      // beta
+  );
+
+  if (result == cudaSuccess) {
+    std::cout << "Passed." << std::endl;
+  }
+
+  // Exit.
+  return result == cudaSuccess ? 0 : -1;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/examples/01_tensor_view/CMakeLists.txt b/examples/01_tensor_view/CMakeLists.txt
new file mode 100644
index 000000000..24ab8018a
--- /dev/null
+++ b/examples/01_tensor_view/CMakeLists.txt
@@ -0,0 +1,38 @@
+# Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+#
+# Redistribution and use in source and binary forms, with or without modification, are permitted
+# provided that the following conditions are met:
+#     * Redistributions of source code must retain the above copyright notice, this list of
+#       conditions and the following disclaimer.
+#     * Redistributions in binary form must reproduce the above copyright notice, this list of
+#       conditions and the following disclaimer in the documentation and/or other materials
+#       provided with the distribution.
+#     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+#       to endorse or promote products derived from this software without specific prior written
+#       permission.
+#
+# THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+# IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+# FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+# FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+# BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+# OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+# STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+# OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+
+
+set(EXAMPLES_TENSOR_VIEW_SOURCES
+  tensor_view.cu
+)
+
+if (NOT CUTLASS_NATIVE_CUDA)
+  # cuda_add_executable does not take interface include directories into account
+  # Let's fetch them and pass them to CUDA.
+  get_target_property(CUTLASS_INCLUDES CUTLASS INTERFACE_INCLUDE_DIRECTORIES)
+  include_directories("${CUTLASS_INCLUDES}")
+endif()
+
+cutlass_add_executable(
+  01_tensor_view
+  ${EXAMPLES_TENSOR_VIEW_SOURCES}
+)
diff --git a/examples/01_tensor_view/tensor_view.cu b/examples/01_tensor_view/tensor_view.cu
new file mode 100644
index 000000000..e885e6eee
--- /dev/null
+++ b/examples/01_tensor_view/tensor_view.cu
@@ -0,0 +1,424 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+/*
+  This example demonstrates operations using TensorRef<> and TensorView<> as well as their explicit
+  equivalent functionality in CUDA code.
+
+  CUTLASS provides abstractions for interacting with multidimension tensors in device memory.
+  Consequently, we define a hierarchy of pointer-like types for referencing tensors.
+
+    T *                             - raw pointer to elements of type T
+
+    cutlass::TensorRef<T, Rank>     - reference to a tensor of elements of type T and given rank.
+                                      Includes a mapping function and associated stride vector for
+                                      accessing elements in linear memory.
+
+    cutlass::TensorView<T, Rank>:   - extends TensorRef<> by adding bounds information. This is a
+      public TensorRef<T, Rank>       complete mathematical object which may be used as the argument
+                                      to CUTLASS functions.
+
+  The above provide an identity maping of a logical index space to linear memory. An element
+  at logical coordinate X has an offset computed as follows:
+
+     offset = dot(X, stride)
+
+  where dot() computes the inner product of X and a vector of "strides."
+
+  CUTLASS 1.1 introduces a mapping function and an additional 'rank' to offer a flexible way to
+  map the logical index space of the tensor to memory. The mapping function maps a coordinate
+  of rank R to an index space of rank S. The linear offset is computed as:
+
+    offset = dot( MapFunc(X), stride )
+
+  where stride is a vector of rank S.
+
+
+  The complete template declaration for cutlass::TensorRef<> is as follows.
+
+    template <
+      /// Data type of element stored within tensor
+      typename Storage,
+
+      /// Rank of logical tensor
+      int Rank,
+
+      /// Maps a Coord<Rank> in the logical tensor index space to the internal n-D array
+      typename MapFunc = IdentityTensorMapFunc<Rank>,
+
+      /// Rank of internal n-D array
+      int StorageRank_ = MapFunc::kStorageRank,
+
+      /// Index type used for coordinates
+      typename Index = int,
+
+      /// Index type used for offsets and pointer differences
+      typename LongIndex = long long
+    >
+    class TensorRef;
+
+
+  CUTLASS kernels make extensive use of vectorization of memory accesses for efficiency and
+  correctness. Consequently, we enforce a constraint on the strides used by mapping functions
+  such that:
+
+    1. The "fastest-changing" stride is always 1 thereby mandating that consecutive elements in
+       that rank are consecutive in linear memory.
+
+    2. The fastest changing rank is always last in the stride vector and not explicitly stored.
+
+  Thus, the stride vector used by mapping functions has length of one fewer than the rank of the
+  storage tensor. These constraints are consistent with the BLAS interface of passing matrices as
+  a tuple consisting of a pointer and a "leading dimension." In fact, these are rank=2 tensors
+  whose fastest changing dimension is 1, and the stride vector is of length 1.
+
+
+  A typical mapping function might simply map the rows and columns of a matrix, a rank=2 tensor,
+  to linear memory such that (1.) elements in the same column are consecutive in memory
+  (column-major), or (2.) elements in the same row are consecutive (row-major). These can be
+  accomplished by two different mapping functions whose stride vector is length=2. The first
+  element is the "leading dimension."
+
+  The following mapping functions demonstrates mappings for these canonical matrix layouts. In
+  both cases, the logical index space is referenced by coordinates of the form (row, column).
+
+  // cutlass/matrix_traits.h
+  struct MatrixLayout {
+
+    //
+    // TensorRefMapFunc definitions for common layouts
+    //
+
+    /// Mapping function for row-major matrices
+    struct RowMajor {
+
+      /// Storage rank = 2 implies stride vector: (ldm, 1)
+      static int const kStorageRank = 2;
+
+      /// Maps (row, col) to (row, col)
+      CUTLASS_HOST_DEVICE
+      Coord<kStorageRank> operator()(Coord<2> const &coord) const {
+        return coord;
+      }
+    };
+
+    /// Mapping function for column-major matrices
+    struct ColumnMajor {
+
+      /// Storage rank = 2 implies stride vector: (ldm, 1)
+      static int const kStorageRank = 2;
+
+      /// Maps (row, col) to (col, row)
+      CUTLASS_HOST_DEVICE
+      Coord<kStorageRank> operator()(Coord<2> const &coord) const {
+        return make_Coord(coord[1], coord[0]);
+      }
+    };
+  };
+
+
+  The requirement that the fastest-changing stride always be of unit size need not be a limitation.
+  To implement "sparse" computations or matrix operations in which matrix elements have arbitrary
+  stride along both row and column, define a mapping function whose storage rank is 3. This permits
+  two elements of the stride vector to have a non-unit value. The map function defined in
+  `cutlass::MatrixTraits::ContiguousLayout` is an example.
+
+  ```
+  /// Mapping function for scenario in which layout is row-major or column-major but this information
+  /// is only available at runtime.
+  struct ContiguousLayout {
+    /// Arbitrary storage rank
+    static int const kStorageRank = 3;
+
+    /// Dimension of rows
+    static int const kRow = 0;
+
+    /// Dimension of columns
+    static int const kColumn = 1;
+
+    /// Mapping function defined by runtime variable. Returns coordinates in n-D storage array
+    /// as (matrix row, matrix colum, 0)
+    CUTLASS_HOST_DEVICE
+    Coord<kStorageRank> operator()(MatrixCoord const &coord) const {
+        return make_Coord(coord.row(), coord.column(), 0);
+    }
+
+    /// Helper to construct a stride vector based on contiguous matrix layout and leading dimension
+    CUTLASS_HOST_DEVICE
+    static Coord<kStorageRank> stride(MatrixLayout::Kind layout, int ldm) {
+      if (layout == MatrixLayout::kRowMajor) {
+        return make_Coord(ldm, 1, 1);
+      }
+      return make_Coord(1, ldm, 1);
+    }
+  };
+  ```
+
+  cutlass::TensorView<> extends this concept by including a size vector to specify the bounds of
+  the index space. The value of each coordinate in the size vector defines the half-open range of
+  indices whose smallest value is zero.
+*/
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+// Standard Library includes
+#include <iostream>
+#include <vector>
+
+//
+// CUTLASS includes
+//
+
+// Defines cutlass::Coord<>
+#include "cutlass/coord.h"
+
+// Defines cutlass::TensorRef<>
+#include "cutlass/tensor_ref.h"
+
+// Defines cutlass::TensorView<>
+#include "cutlass/tensor_view.h"
+
+// Defines cutlass::MatrixLayout
+#include "cutlass/matrix_traits.h"
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// Column-major matrix access
+//
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Define a rank=2 tensor modeling a column-major matrix
+typedef cutlass::TensorView<
+  int,                                    // storage element is of type int
+  2,                                      // tensor has rank=2 logical index space
+  cutlass::MatrixLayout::ColumnMajor      // column-major mapping function
+> TensorViewColumnMajor;
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Kernel to copy a matrix from raw memory into a cutlass::TensorView
+__global__ void MatrixCopyColumnMajor(
+  TensorViewColumnMajor destination,      // destination tensor accessed by TensorView
+  int const *source,                      // source matrix accessed using cuBLAS-style pointer
+  int ldm) {                              //   and leading dimension
+
+  // Compute unique row and column for each thread
+  int row = threadIdx.x + blockIdx.x * blockDim.x;
+  int column = threadIdx.y + blockIdx.y * blockDim.y;
+
+  // Define a coordinate based on the thread's row and column
+  cutlass::Coord<2> coord = cutlass::make_Coord(row, column);
+
+  // Bounds test
+  if (coord < destination.size()) {
+
+    // Access the element
+    destination.at(coord) = source[row + column * ldm];
+  }
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Launches kernel MatrixCopyColumnMajor()
+cudaError_t TestMatrixCopyColumnMajor() {
+  cudaError_t result;
+
+  int const M = 32;     // number of rows
+  int const N = 16;     // number of columns
+
+  int const ldm = 40;   // matrix leading dimension
+
+  //
+  // Allocate source and destination matrices
+  //
+
+  int *Destination;
+  int *Source;
+
+  int const matrix_capacity = ldm * N;                          // number of elements in memory needed to store matrix
+  size_t const sizeof_matrix = sizeof(int) * matrix_capacity;   // size of matrix in bytes
+
+  // Allocate destination and source matrices
+  result = cudaMalloc((void **)&Destination, sizeof_matrix);
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to allocate destination matrix on device: " << cudaGetErrorString(result) << std::endl;
+    return result;
+  }
+
+  result = cudaMalloc((void **)&Source, sizeof_matrix);
+  if (result != cudaSuccess) {
+    cudaFree(Destination);
+    std::cerr << "Failed to allocate source matrix on device:" << cudaGetErrorString(result) << std::endl;
+    return result;
+  }
+
+  // Clear destination matrix in device memory
+  result = cudaMemset(Destination, 0, sizeof_matrix);
+  if (result != cudaSuccess) {
+    cudaFree(Destination);
+    cudaFree(Source);
+    std::cerr << "Failed to clear destination matrix: " << cudaGetErrorString(result) << std::endl;
+    return result;
+  }
+
+  //
+  // Initialize matrix
+  //
+
+  std::vector<int> source_host(matrix_capacity, 0);
+
+  // Procedurally generate input results using several arbitrary constants.
+  int const magic_row_stride = 2;
+  int const magic_column_stride = 3;
+
+  for (int j = 0; j < N; ++j) {
+    for (int i = 0; i < M; ++i) {
+      source_host.at(i + j * ldm) = i * magic_row_stride + j * magic_column_stride;
+    }
+  }
+
+  // Copy to device memory
+  result = cudaMemcpy(Source, source_host.data(), sizeof_matrix, cudaMemcpyHostToDevice);
+  if (result != cudaSuccess) {
+    cudaFree(Destination);
+    cudaFree(Source);
+    std::cerr << "Failed to copy from host to source matrix: " << cudaGetErrorString(result) << std::endl;
+    return result;
+  }
+
+  //
+  // Define a TensorView<> pointing to the destination matrix
+  //
+  TensorViewColumnMajor destination_view_device(
+    Destination,                            // pointer to base of matrix in device memory
+    cutlass::make_Coord(ldm, 1),            // stride vector
+    cutlass::make_Coord(M, N)               // bounds of matrix
+  );
+
+  //
+  // Launch kernel to copy matrix
+  //
+
+  dim3 block(16, 16);
+  dim3 grid((M + block.x - 1) / block.x, (N + block.y - 1) / block.y);
+
+  MatrixCopyColumnMajor<<< grid, block >>>(destination_view_device, Source, ldm);
+
+  result = cudaGetLastError();
+  if (result != cudaSuccess) {
+    std::cerr << "Kernel MatrixCopyColumnMajor() failed: "
+      << cudaGetErrorString(result) << std::endl;
+
+    cudaFree(Destination);
+    cudaFree(Source);
+
+    return result;
+  }
+
+  //
+  // Copy results to host memory
+  //
+
+  std::vector<int> dest_host(matrix_capacity, 0);
+
+  result = cudaMemcpy(dest_host.data(), Destination, sizeof_matrix, cudaMemcpyDeviceToHost);
+
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to copy destination matrix to host memory: "
+      << cudaGetErrorString(result) << std::endl;
+
+    cudaFree(Destination);
+    cudaFree(Source);
+
+    return result;
+  }
+
+  //
+  // Verify result
+  //
+
+  // Define a TensorView for use in accessing host memory
+  TensorViewColumnMajor destination_view_host(
+    dest_host.data(),                          // pointer to base of matrix in host memory
+    cutlass::make_Coord(ldm, 1),               // stride vector
+    cutlass::make_Coord(M, N)                  // bounds of matrix
+  );
+
+  // Verify against procedurally computed results
+  for (int j = 0; j < N; ++j) {
+    for (int i = 0; i < M; ++i) {
+
+      // computed result
+      int expected = i * magic_row_stride + j * magic_column_stride;
+
+      // access data by computing explicit offsets
+      int got_explicit = dest_host.at(i + j * ldm);
+
+      // access data in host memory through a TensorView
+      int got_view = destination_view_host.at(cutlass::make_Coord(i, j));
+
+      if (got_explicit != expected) {
+
+        std::cerr << "Error at element (" << i << ", " << j
+          << ") accessed through explicitly computed offset - expected: " << expected
+          << ", got: " << got_explicit << std::endl;
+
+        return cudaErrorUnknown;
+      }
+
+      if (got_view != expected) {
+
+        std::cerr << "Error at element (" << i << ", " << j
+          << ") accesed through TensorView<> on the host - expected: " << expected
+          << ", got: " << got_view << std::endl;
+
+        return cudaErrorUnknown;
+      }
+    }
+  }
+
+  return cudaSuccess;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Entry point for tensor_view example.
+//
+// usage:
+//
+//   02_tensor_view
+//
+int main() {
+
+  cudaError_t result = TestMatrixCopyColumnMajor();
+
+  if (result == cudaSuccess) {
+    std::cout << "Passed" << std::endl;
+  }
+
+  return (result == cudaSuccess ? 0 : -1);
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/examples/02_cutlass_utilities/CMakeLists.txt b/examples/02_cutlass_utilities/CMakeLists.txt
new file mode 100644
index 000000000..f59281e05
--- /dev/null
+++ b/examples/02_cutlass_utilities/CMakeLists.txt
@@ -0,0 +1,38 @@
+# Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+#
+# Redistribution and use in source and binary forms, with or without modification, are permitted
+# provided that the following conditions are met:
+#     * Redistributions of source code must retain the above copyright notice, this list of
+#       conditions and the following disclaimer.
+#     * Redistributions in binary form must reproduce the above copyright notice, this list of
+#       conditions and the following disclaimer in the documentation and/or other materials
+#       provided with the distribution.
+#     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+#       to endorse or promote products derived from this software without specific prior written
+#       permission.
+#
+# THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+# IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+# FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+# FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+# BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+# OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+# STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+# OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+
+
+set(EXAMPLES_CUTLASS_UTILITIES_SOURCES
+  cutlass_utilities.cu
+)
+
+if (NOT CUTLASS_NATIVE_CUDA)
+  # cuda_add_executable does not take interface include directories into account
+  # Let's fetch them and pass them to CUDA.
+  get_target_property(CUTLASS_INCLUDES CUTLASS INTERFACE_INCLUDE_DIRECTORIES)
+  include_directories("${CUTLASS_INCLUDES}")
+endif()
+
+cutlass_add_executable(
+  02_cutlass_utilities
+  ${EXAMPLES_CUTLASS_UTILITIES_SOURCES}
+)
diff --git a/examples/02_cutlass_utilities/cutlass_utilities.cu b/examples/02_cutlass_utilities/cutlass_utilities.cu
new file mode 100644
index 000000000..296699325
--- /dev/null
+++ b/examples/02_cutlass_utilities/cutlass_utilities.cu
@@ -0,0 +1,359 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+/*
+  This example demonstrates several CUTLASS utilities in the context of a mixed-precision
+  floating-point matrix product computation.
+
+  These utilities are intended to be useful supporting components for managing tensor and matrix
+  memory allocations, initializing and comparing results, and computing reference output.
+
+  CUTLASS utilities are defined in the directory `tools/util`, and definitions appear
+  namespace `cutlass::` or an inner namespace therein. Operations in `cutlass::reference::` have
+  both host-side and device-side implementations, and the choice to use device-side initialization
+  and host-side verification in this example was arbitrary.
+
+
+  cutlass::half_t
+
+    This is a host-only implementation of a half-precision floating-point type. It requires no
+    specialized hardware support from the CPU and emulates arithmetic operations. Device-side code
+    should use CUDA's `half` type.
+
+
+  cutlass::HostMatrix<>
+
+    This template class simplifies the creation of a rank=2 tensor with either a column-major or
+    row-major layout in memory.
+
+    This class offers methods device_view() and host_view() to provide TensorView objects for
+    device- and host-side memory allocations.
+
+
+  cutlass::reference::device::TensorInitialize()
+
+    This template function initializes the elements of a tensor according to either a procedural
+    definition or a random distribution. The function in namespace `cutlass::reference::device::`
+    uses a CUDA kernel to perform this initialization, relying on CURAND to compute random numbers.
+
+
+  cutlass::reference::host::Gemm()
+
+    This template function computes the general matrix product. This template supports unique
+    data types for each matrix operand, the internal accumulation type, and the scalar parameters
+    alpha and beta.
+
+
+  cutlass::reference::host::TensorEquals()
+
+    Compares two tensors of identical rank and returns true if values are bit equivalent.
+
+*/
+
+// Standard Library includes
+#include <iostream>
+#include <sstream>
+#include <vector>
+
+// CUTLASS includes needed for mixed-precision GEMM kernel
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/fp16_sgemm_traits.h"
+
+//
+// CUTLASS utility includes
+//
+
+// Defines operator<<() to write TensorView objects to std::ostream
+#include "tools/util/tensor_view_io.h"
+
+// Defines cutlass::HostMatrix<>
+#include "tools/util/host_matrix.h"
+
+// Defines cutlass::half_t
+#include "tools/util/half.h"
+
+// Defines cutlass::reference::device::TensorInitialize()
+#include "tools/util/reference/device/tensor_elementwise.h"
+
+// Defines cutlass::reference::host::TensorEquals()
+#include "tools/util/reference/host/tensor_elementwise.h"
+
+// Defines cutlass::reference::host::Gemm()
+#include "tools/util/reference/host/gemm.h"
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Define a CUTLASS GEMM template and launch a GEMM kernel.
+cudaError_t Cutlass_FP16_SgemmNN(
+  int M,
+  int N,
+  int K,
+  cutlass::half_t alpha,
+  half const *A,
+  int lda,
+  half const *B,
+  int ldb,
+  cutlass::half_t beta,
+  half *C,
+  int ldc) {
+
+  // Define a CUTLASS Gemm using mixed-precision floating-point.
+  //
+  // A, B, C, D are half-precision. Internal accumulation is in single-precision.
+  //
+  // Note, we use CUDA's `half` type for device-side code including CUTLASS GEMM kernels.
+  //
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half,   // A type
+    half,   // B type
+    half,   // C type
+    half,   // D type
+    half    // Scalar type: alpha, beta
+  >
+    GemmTraits;
+
+  // Define a CUTLASS GEMM object.
+  typedef cutlass::gemm::Gemm<GemmTraits> Gemm;
+
+  // Construct and initialize CUTLASS GEMM parameters object.
+  typename Gemm::Params params;
+
+  int result = params.initialize(
+    M,                  // GEMM M dimension
+    N,                  // GEMM N dimension
+    K,                  // GEMM K dimension
+    half(float(alpha)), // scalar alpha - This is a legal conversion from cutlass::half_t to CUDA's half.
+    A,                  // matrix A operand
+    lda,
+    B,                  // matrix B operand
+    ldb,
+    half(float(beta)),  // scalar beta - This is a legal conversion from cutlass::half_t to CUDA's half.
+    C,                  // source matrix C
+    ldc,
+    C,                  // destination matrix C (may be different memory than source C matrix)
+    ldc
+  );
+
+  if (result) {
+    std::cerr << "Failed to initialize CUTLASS Gemm::Params object." << std::endl;
+    return cudaErrorInvalidValue;
+  }
+
+  // Launch the CUTLASS GEMM kernel.
+  Gemm::launch(params);
+
+  // Return any errors associated with the launch or cudaSuccess if no error.
+  return cudaGetLastError();
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Allocate several matrices in GPU device memory and call a single-precision
+/// CUTLASS GEMM kernel.
+cudaError_t TestCutlassGemm(int M, int N, int K, cutlass::half_t alpha, cutlass::half_t beta) {
+  cudaError_t result;
+
+  //
+  // Construct cutlass::HostMatrix<> using the half-precision host-side type.
+  //
+  // cutlass::HostMatrix<> allocates memory on both the host and device corresponding to rank=2
+  // tensors in column-major layout. Explicit synchronization methods are offered to copy the
+  // tensor to the device or to the host.
+  //
+
+  // M-by-K matrix of cutlass::half_t
+  cutlass::HostMatrix<cutlass::half_t> A(cutlass::MatrixCoord(M, K));
+
+  // K-by-N matrix of cutlass::half_t
+  cutlass::HostMatrix<cutlass::half_t> B(cutlass::MatrixCoord(K, N));
+
+  // M-by-N matrix of cutlass::half_t
+  cutlass::HostMatrix<cutlass::half_t> C_cutlass(cutlass::MatrixCoord(M, N));
+
+  // M-by-N matrix of cutlass::half_t
+  cutlass::HostMatrix<cutlass::half_t> C_reference(cutlass::MatrixCoord(M, N));
+
+  //
+  // Initialize matrices with small, random integers.
+  //
+
+  cutlass::Distribution dist;
+
+  // Uniform random distribution from -4 .. 4. Values are truncated to integers.
+  dist.set_uniform(-4, 4);
+
+  // Arbitrary RNG seed value. Hard-coded for deterministic results.
+  int seed = 2080;
+
+  cutlass::reference::device::TensorInitialize(
+    A.device_view(),                                // concept: TensorView
+    seed,
+    dist);
+
+  cutlass::reference::device::TensorInitialize(
+    B.device_view(),                                // concept: TensorView
+    seed * 2,
+    dist);
+  cutlass::reference::device::TensorInitialize(
+    C_cutlass.device_view(),                        // concept: TensorView
+    seed * 3,
+    dist);
+
+  // Copy C_cutlass into C_reference so the GEMM is correct when beta != 0.
+  cutlass::reference::device::TensorFill(C_reference.device_view(), C_cutlass.device_view());
+
+  // Copy the device-side view into host memory
+  C_reference.sync_host();
+
+  //
+  // Launch the CUTLASS GEMM kernel
+  //
+
+  result = Cutlass_FP16_SgemmNN(
+    M,
+    N,
+    K,
+    alpha,
+    A.device_data(),
+    A.leading_dim(),
+    B.device_data(),
+    B.leading_dim(),
+    beta,
+    C_cutlass.device_data(),
+    C_cutlass.leading_dim()
+  );
+
+  if (result != cudaSuccess) {
+    return result;
+  }
+
+  //
+  // Verify the result using a host-side reference
+  //
+
+  // A and B were initialized using device-side procedures. The intent of this example is to
+  // use the host-side reference GEMM, so we must perform a device-to-host copy.
+  A.sync_host();
+  B.sync_host();
+
+  // Copy CUTLASS's GEMM results into host memory.
+  C_cutlass.sync_host();
+
+  // Compute the reference result using the host-side GEMM reference implementation.
+  cutlass::reference::host::Gemm(
+    cutlass::gemm::GemmCoord(K, N, M),  // problem size  (type: cutlass::gemm::GemmCoord)
+    alpha,                              // alpha         (type: cutlass::half_t)
+    A.host_ref(),                       // A             (concept: TensorRef)
+    B.host_ref(),                       // B             (concept: TensorRef)
+    beta,                               // beta          (type: cutlass::half_t)
+    C_reference.host_ref(),             // C             (concept: TensorRef)
+    float(0)                            // Accumulator initial value passed as argument to deduce
+  );                                    // internal accumulation data type as float.
+
+  // Compare reference to computed results.
+  if (!cutlass::reference::host::TensorEquals(C_reference.host_view(), C_cutlass.host_view())) {
+
+    std::cerr << "Error - CUTLASS mixed-precision GEMM kernel differs from reference." << std::endl;
+
+    //
+    // On error, print C_cutlass and C_reference to std::cerr.
+    //
+    // Note, these are matrices of half-precision elements stored in host memory as
+    // arrays of type cutlass::half_t.
+    //
+
+    // Result of CUTLASS mixed-precision GEMM kernel
+    std::cerr << "CUTLASS:\n" << C_cutlass << std::endl;
+
+    // Result of reference computation
+    std::cerr << "Reference:\n" << C_reference << std::endl;
+
+    // Return error code.
+    return cudaErrorUnknown;
+  }
+
+  // Passed error check
+  return cudaSuccess;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Entry point to cutlass_utilities example.
+//
+// usage:
+//
+//   01_cutlass_utilities <M> <N> <K> <alpha> <beta>
+//
+int main(int argc, const char *arg[]) {
+
+  //
+  // Parse the command line to obtain GEMM dimensions and scalar values.
+  //
+
+  // GEMM problem dimensions: <M> <N> <K>
+  int problem[3] = { 128, 128, 128 };
+
+  for (int i = 1; i < argc && i < 4; ++i) {
+    std::stringstream ss(arg[i]);
+    ss >> problem[i - 1];
+  }
+
+  // Linear scale factors in GEMM. Note, these are half-precision values stored as
+  // cutlass::half_t.
+  //
+  // Values outside the range of IEEE FP16 will overflow to infinity or underflow to zero.
+  //
+  cutlass::half_t scalars[2] = { 1, 0 };
+
+  for (int i = 4; i < argc && i < 6; ++i) {
+    std::stringstream ss(arg[i]);
+
+    ss >> scalars[i - 4];   // lexical cast to cutlass::half_t
+  }
+
+  //
+  // Run the CUTLASS GEMM test.
+  //
+
+  cudaError_t result = TestCutlassGemm(
+    problem[0],     // GEMM M dimension
+    problem[1],     // GEMM N dimension
+    problem[2],     // GEMM K dimension
+    scalars[0],     // alpha
+    scalars[1]      // beta
+  );
+
+  if (result == cudaSuccess) {
+    std::cout << "Passed." << std::endl;
+  }
+
+  // Exit.
+  return result == cudaSuccess ? 0 : -1;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/examples/03_strided_batched_gemm/CMakeLists.txt b/examples/03_strided_batched_gemm/CMakeLists.txt
new file mode 100644
index 000000000..564bc6310
--- /dev/null
+++ b/examples/03_strided_batched_gemm/CMakeLists.txt
@@ -0,0 +1,38 @@
+# Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+#
+# Redistribution and use in source and binary forms, with or without modification, are permitted
+# provided that the following conditions are met:
+#     * Redistributions of source code must retain the above copyright notice, this list of
+#       conditions and the following disclaimer.
+#     * Redistributions in binary form must reproduce the above copyright notice, this list of
+#       conditions and the following disclaimer in the documentation and/or other materials
+#       provided with the distribution.
+#     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+#       to endorse or promote products derived from this software without specific prior written
+#       permission.
+#
+# THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+# IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+# FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+# FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+# BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+# OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+# STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+# OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+
+
+set(EXAMPLES_STRIDED_BATCHED_GEMM_SOURCES
+  strided_batched_gemm.cu
+)
+
+if (NOT CUTLASS_NATIVE_CUDA)
+  # cuda_add_executable does not take interface include directories into account
+  # Let's fetch them and pass them to CUDA.
+  get_target_property(CUTLASS_INCLUDES CUTLASS INTERFACE_INCLUDE_DIRECTORIES)
+  include_directories("${CUTLASS_INCLUDES}")
+endif()
+
+cutlass_add_executable(
+  03_strided_batched_gemm
+  ${EXAMPLES_STRIDED_BATCHED_GEMM_SOURCES}
+)
diff --git a/examples/03_strided_batched_gemm/strided_batched_gemm.cu b/examples/03_strided_batched_gemm/strided_batched_gemm.cu
new file mode 100644
index 000000000..e7d387b6c
--- /dev/null
+++ b/examples/03_strided_batched_gemm/strided_batched_gemm.cu
@@ -0,0 +1,349 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#include <iostream>
+#include <vector>
+#include "cutlass/cutlass.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+
+/*
+This example demonstrates how to use cutlass to compute a batched strided gemm.
+In this example, both A and B matrix are non-transpose and column major matrix
+batched_C = batched_A x batched_B
+As an example, matrix C can be seen as
+-----------------------------------------------------------
+(0,0,0) | (0,0,1) | (0,0,2) | (1,0,0) | (1,0,1) | (1,0,2) |
+-----------------------------------------------------------
+(0,1,0) | (0,1,1) | (0,1,2) | (1,1,0) | (1,1,1) | (1,1,2) |
+-----------------------------------------------------------
+(0,2,0) | (0,2,1) | (0,2,2) | (1,2,0) | (1,2,1) | (1,2,2) |
+-----------------------------------------------------------
+(0,3,0) | (0,3,1) | (0,3,2) | (1,3,0) | (1,3,1) | (1,3,2) |
+-----------------------------------------------------------
+(0,4,0) | (0,4,1) | (0,4,2) | (1,4,0) | (1,4,1) | (1,4,2) |
+-----------------------------------------------------------
+(0,5,0) | (0,5,1) | (0,5,2) | (1,5,0) | (1,5,1) | (1,5,2) |
+-----------------------------------------------------------
+           batch 0          |           batch 1
+where we denote each element with (batch_idx, row_idx, column_idx)
+In this example, batch size is 2, M is 6 and N is 3
+The stride (batch_stride_C) between the first element of two batches is ldc * n
+
+matrix A can be seen as
+---------------------------------------
+(0,0,0) | (0,0,1) | (1,0,0) | (1,0,1) |
+---------------------------------------
+(0,1,0) | (0,1,1) | (1,1,0) | (1,1,1) |
+---------------------------------------
+(0,2,0) | (0,2,1) | (1,2,0) | (1,2,1) |
+---------------------------------------
+(0,3,0) | (0,3,1) | (1,3,0) | (1,3,1) |
+---------------------------------------
+(0,4,0) | (0,4,1) | (1,4,0) | (1,4,1) |
+---------------------------------------
+(0,5,0) | (0,5,1) | (1,5,0) | (1,5,1) |
+---------------------------------------
+     batch 0      |      batch 1
+, where batch size is 2, M is 6 and K is 2
+The stride (batch_stride_B) between the first element of two batches is lda * k
+
+matrix B can be seen as
+-----------------------------
+(0,0,0) | (0,0,1) | (0,0,2) |
+----------------------------- batch 0
+(0,1,0) | (0,1,1) | (0,1,2) |
+-------------------------------------
+(1,0,0) | (1,0,1) | (1,0,2) |
+----------------------------- batch 1
+(1,1,0) | (1,1,1) | (1,1,2) |
+-----------------------------
+, where the batch size is 2, N is 3 and K is 2
+The stride (batch_stride_C) between the first element of two batches is k
+
+
+*/
+
+cudaError_t cutlass_strided_batched_sgemm(float const *A,
+  int lda,
+  long long int batch_stride_A,
+  float const *B,
+  int ldb,
+  long long int batch_stride_B,
+  float *C,
+  int ldc,
+  long long int batch_stride_C,
+  float alpha,
+  float beta,
+  int m, 
+  int n,
+  int k,
+  int batch_count) {
+  // create a cutlass traits
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  
+  // create a CUTLASS GEMM object.
+  typedef cutlass::gemm::Gemm<SgemmTraits> Gemm;
+  
+  // Construct and initialize CUTLASS GEMM parameters object.
+  typename Gemm::Params params;
+  
+  int result = params.initialize(
+    m,                  // M dimension for each batch
+    n,                  // N dimension for each batch
+    k,                  // K dimension for each batch
+    alpha,              // scalar alpha
+    A,
+    lda,
+    batch_stride_A,     // distance in memory between the first element of neighboring batch
+    B,
+    ldb,
+    batch_stride_B,     // distance in memory between the first element of neighboring batch
+    beta,               // scalar beta
+    C,                  // source matrix C
+    ldc,
+    batch_stride_C,     // distance in memory between the first element of neighboring batch
+    C,                  // destination matrix C (may be different memory than source C matrix)
+    ldc,
+    batch_stride_C,    // distance in memory between the first element of neighboring batch
+    batch_count
+  );
+  
+  if (result != 0) {
+    std::cerr << "Failed to initialize CUTLASS Gemm::Params object." << std::endl;
+    return cudaErrorInvalidValue;
+  }
+  
+  // Launch the CUTLASS GEMM kernel.
+  Gemm::launch(params);
+  result = cudaDeviceSynchronize();
+  if (result != cudaSuccess) {
+    std::cerr << "kernel launch result = " << result << std::endl;
+  }
+  return cudaGetLastError();
+}
+
+template<typename T> 
+cudaError_t strided_batched_gemm_nn_reference(std::vector<T> const &A, 
+  int lda,
+  long long int batch_stride_A,
+  std::vector<T> const &B, 
+  int ldb,
+  long long int batch_stride_B,
+  std::vector<T> &C, 
+  int ldc,
+  long long int batch_stride_C,
+  T alpha,
+  T beta,
+  int m,
+  int n,
+  int k,
+  int batch_count) {
+  /*
+  strided batched gemm NN
+  */
+  
+  cudaError_t result = cudaSuccess;
+
+  if (A.size() < lda * k * batch_count) {
+    std::cout << "the size of A is too small" << std::endl;
+    return cudaErrorInvalidValue;
+  }
+  if (B.size() < ldb * n) {
+    std::cout << "the size of B is too small" << std::endl;
+    return cudaErrorInvalidValue;
+  }
+  if (C.size() < ldc * n * batch_count) {
+    std::cout << "the size of C is too small" << std::endl;
+    return cudaErrorInvalidValue;
+  }
+  
+  for (int batch_idx = 0; batch_idx < batch_count; batch_idx++) {
+    for (int n_idx = 0; n_idx < n; n_idx++) {
+      for (int m_idx = 0; m_idx < m; m_idx++) {
+        T accum = beta * C[batch_idx * batch_stride_C + n_idx * ldc + m_idx];
+        for (int k_idx = 0; k_idx < k; k_idx++) {
+          accum += alpha 
+            * A[batch_idx * batch_stride_A + k_idx * lda + m_idx]
+            * B[batch_idx * batch_stride_B + n_idx * ldb + k_idx];
+        }
+        C[batch_idx * batch_stride_C + n_idx * ldc + m_idx] = accum;
+      }
+    }
+  }
+
+  return result;
+}
+
+int main() {
+  int const m = 16;
+  int const n = 24;
+  int const k = 8;
+  int const batch_count = 3;
+
+  // A, B are non-transpose, column major
+  int const lda = m;
+  int const ldb = k * batch_count;
+  int const ldc = m;
+
+  int const count_A = batch_count * lda * k;
+  int const count_B = ldb * n;
+  int const count_C = batch_count * ldc * n;
+
+  // the memory is batched along K dimension
+  long long int batch_stride_A = static_cast<long long int>(lda) * static_cast<long long int>(k);
+  long long int batch_stride_B = static_cast<long long int>(k);
+  long long int batch_stride_C = static_cast<long long int>(ldc) * static_cast<long long int>(n);
+
+  // alpha and beta
+  float alpha = 1.0f;
+  float beta = 2.0f;
+
+  cudaError_t result = cudaSuccess;
+
+  // allocate the host memory
+  std::vector<float> host_A(count_A);
+  std::vector<float> host_B(count_B);
+  std::vector<float> host_C(count_C);
+  std::vector<float> result_C(count_C);
+
+  // allocate the device memory
+  float *A;
+  float *B;
+  float *C;
+
+  result = cudaMalloc(&A, count_A * sizeof(float));
+  if (result != cudaSuccess) {
+    std::cerr << "cudaMalloc result = " << result << std::endl;
+    return result;
+  }
+  result = cudaMalloc(&B, count_B * sizeof(float));
+  if (result != cudaSuccess) {
+    std::cerr << "cudaMalloc result = " << result << std::endl;
+    return result;
+  }
+  result = cudaMalloc(&C, count_C * sizeof(float));
+  if (result != cudaSuccess) {
+    std::cerr << "cudaMalloc result = " << result << std::endl;
+    return result;
+  }
+
+  // fill A
+  for (int b_idx = 0; b_idx < batch_count; b_idx++) {
+    for (int col_idx = 0; col_idx < k; col_idx++) {
+      for (int row_idx = 0; row_idx < m; row_idx++) {
+        host_A[row_idx + col_idx * lda + b_idx * lda * k] = static_cast<float>(row_idx + col_idx * lda + b_idx * lda * k);
+      }
+    }
+  }
+  // fill B
+  for (int b_idx = 0; b_idx < batch_count; b_idx++) {
+    for (int col_idx = 0; col_idx < n; col_idx++) {
+      for (int row_idx = 0; row_idx < k; row_idx++) {
+        host_B[row_idx + col_idx * ldb + b_idx * k] = static_cast<float>(n + k * ldb + batch_count * k) - static_cast<float>(row_idx + col_idx * ldb + b_idx * k);
+      }
+    }
+  }
+  // fill C
+  for (int b_idx = 0; b_idx < batch_count; b_idx++) {
+    for (int col_idx = 0; col_idx < n; col_idx++) {
+      for (int row_idx = 0; row_idx < m; row_idx++) {
+        host_C[row_idx + col_idx * ldc + b_idx * ldc * n] = 1.f;
+      }
+    }
+  }
+
+  // ref memory
+  std::vector<float> ref_A(host_A);
+  std::vector<float> ref_B(host_B);
+  std::vector<float> ref_C(host_C);
+  // copy host memory to device
+  result = cudaMemcpy(A, host_A.data(), count_A * sizeof(float), cudaMemcpyHostToDevice);
+  if (result != cudaSuccess) {
+    std::cerr << "cudaMemcpy result = " << result << std::endl;
+    return result;
+  }
+  result = cudaMemcpy(B, host_B.data(), count_B * sizeof(float), cudaMemcpyHostToDevice);
+  if (result != cudaSuccess) {
+    std::cerr << "cudaMemcpy result = " << result << std::endl;
+    return result;
+  }
+  result = cudaMemcpy(C, host_C.data(), count_C * sizeof(float), cudaMemcpyHostToDevice);
+  if (result != cudaSuccess) {
+    std::cerr << "cudaMemcpy result = " << result << std::endl;
+    return result;
+  }
+
+  // run cutlass
+  result = cutlass_strided_batched_sgemm(A, lda, batch_stride_A, B, ldb, batch_stride_B, C, ldc, batch_stride_C,
+    alpha, beta, m, n, k, batch_count);
+  if (result != cudaSuccess)
+    return result;
+
+  // copy device memory to host
+  result = cudaMemcpy(result_C.data(), C, count_C * sizeof(float), cudaMemcpyDeviceToHost);
+  if (result != cudaSuccess) {
+    std::cerr << "cudaMemcpy result = " << result << std::endl;
+    return result;
+  }
+
+  //compare with reference code
+  result = strided_batched_gemm_nn_reference(ref_A, lda, batch_stride_A, ref_B, ldb, batch_stride_B, ref_C, ldc, batch_stride_C,
+    alpha, beta, m, n, k, batch_count);
+  if (result != 0)
+    return result;
+
+  if (ref_C != result_C) {
+    std::cout << "CUTLASS strided batched gemm does not run correctly" << std::endl;
+    return cudaErrorUnknown;
+  }
+
+  // free memory
+  result = cudaFree(A);
+  if (result != cudaSuccess) {
+    std::cerr << "cudaFree result = " << result << std::endl;
+    return result;
+  }
+  result = cudaFree(B);
+  if (result != cudaSuccess) {
+    std::cerr << "cudaFree result = " << result << std::endl;
+    return result;
+  }
+  result = cudaFree(C);
+  if (result != cudaSuccess) {
+    std::cerr << "cudaFree result = " << result << std::endl;
+    return result;
+  }
+
+
+  if (result == cudaSuccess) {
+    std::cout << "Passed." << std::endl;
+  }
+
+  // Exit.
+  return result == cudaSuccess ? 0 : -1;
+}
diff --git a/examples/04_tile_iterator/CMakeLists.txt b/examples/04_tile_iterator/CMakeLists.txt
new file mode 100644
index 000000000..0e74d12db
--- /dev/null
+++ b/examples/04_tile_iterator/CMakeLists.txt
@@ -0,0 +1,38 @@
+# Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+#
+# Redistribution and use in source and binary forms, with or without modification, are permitted
+# provided that the following conditions are met:
+#     * Redistributions of source code must retain the above copyright notice, this list of
+#       conditions and the following disclaimer.
+#     * Redistributions in binary form must reproduce the above copyright notice, this list of
+#       conditions and the following disclaimer in the documentation and/or other materials
+#       provided with the distribution.
+#     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+#       to endorse or promote products derived from this software without specific prior written
+#       permission.
+#
+# THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+# IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+# FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+# FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+# BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+# OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+# STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+# OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+
+
+set(EXAMPLES_BASIC_CUTLASS_GEMM_SOURCES
+  tile_iterator.cu
+)
+
+if (NOT CUTLASS_NATIVE_CUDA)
+  # cuda_add_executable does not take interface include directories into account
+  # Let's fetch them and pass them to CUDA.
+  get_target_property(CUTLASS_INCLUDES CUTLASS INTERFACE_INCLUDE_DIRECTORIES)
+  include_directories("${CUTLASS_INCLUDES}")
+endif()
+
+cutlass_add_executable(
+  04_tile_iterator
+  ${EXAMPLES_BASIC_CUTLASS_GEMM_SOURCES}
+)
diff --git a/examples/04_tile_iterator/tile_iterator.cu b/examples/04_tile_iterator/tile_iterator.cu
new file mode 100644
index 000000000..40d5e5519
--- /dev/null
+++ b/examples/04_tile_iterator/tile_iterator.cu
@@ -0,0 +1,248 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+/*
+  This example demonstrates how to use the TileIterator in CUTLASS to load data from addressable
+  memory, and store it back into addressable memory.
+
+  TileIterator is a core concept in CUTLASS that enables efficient loading and storing of data from
+  and to addressable memory. The TileIterator accepts a TileTraits type, which defines the shape of a 
+  tile and the distribution of accesses by individual entities, either threads or others.
+
+  In this example, a LoadTileIterator is used to load elements from a tile in global memory, stored in 
+  column-major layout, into a fragment, and a corresponding StoreTileIterator is used to store the
+  elements back into global memory (in the same column-major layout).
+
+  https://devblogs.nvidia.com/cutlass-linear-algebra-cuda/
+
+  This example uses CUTLASS utilities to ease the matrix operations.
+*/
+
+// Standard Library includes
+#include <iostream>
+#include <sstream>
+#include <vector>
+
+// CUTLASS includes
+#include "cutlass/tile_iterator.h"
+#include "cutlass/tile_traits_standard.h"
+
+//
+// CUTLASS utility includes
+//
+
+// Defines operator<<() to write TensorView objects to std::ostream
+#include "tools/util/tensor_view_io.h"
+
+// Defines cutlass::HostMatrix<>
+#include "tools/util/host_matrix.h"
+
+// Defines cutlass::reference::device::TensorInitialize()
+#include "tools/util/reference/device/tensor_elementwise.h"
+
+// Defines cutlass::reference::host::TensorEquals()
+#include "tools/util/reference/host/tensor_elementwise.h"
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// This function defines load and store tile iterators to load and store a M-by-K tile, in
+// column-major layout, from and back into global memory.
+//
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename Traits>
+__global__ void cutlass_tile_iterator_load_store_global(
+  float const *input,
+  float *output,
+  int M,
+  int K) {
+
+    // Define a tile load iterator
+    typedef cutlass::TileLoadIterator<
+        Traits,                         // the Traits type, defines shape/distribution of accesses
+        float,                          // elements are of type float
+        cutlass::IteratorAdvance::kH,   // post-increment accesses advance in strided (as opposed to
+                                        //     contiguous dimension 
+        cutlass::MemorySpace::kGlobal   // iterator loads from global memory 
+        > TileLoadIterator;
+
+    // Defines a tile store iterator
+    typedef cutlass::TileStoreIterator<
+        Traits,                         // the Traits type, defines shape/distribution of accesses
+        float,                          // elements are of type float
+        cutlass::IteratorAdvance::kH,   // post-increment accesses advance in strided (as opposed to
+                                        //     contiguous) dimension
+        cutlass::MemorySpace::kGlobal   // iterator stores into global memory
+        > TileStoreIterator;
+
+    // Defines a predicate vector for managing statically sized vector of boolean predicates
+    typedef typename TileLoadIterator::PredicateVector PredicateVector;
+
+    // The parameters specified to the iterators. These include the pointer to the source of
+    // addressable memory, and the strides and increments for each of the tile's dimensions  
+    typename TileLoadIterator::Params load_params;
+    typename TileStoreIterator::Params store_params;
+
+    // Initializing the parameters for both of the iterators. The TileLoadIterator accesses the
+    // input matrix and TileStoreIterator accesses the output matrix. The strides are set
+    // identically since the data is being stored in the same way as it is loaded (column-major
+    // mapping).
+    load_params.initialize(input, M*K, M, 1);
+    store_params.initialize(output, M*K, M, 1);
+   
+    // Constructing the tile load and store iterators, and the predicates vector
+    TileLoadIterator load_iterator(load_params);
+    TileStoreIterator store_iterator(store_params);
+    PredicateVector predicates;
+
+    // Initializing the predicates with bounds set to <1, K, M>. This protects out-of-bounds loads.
+    load_iterator.initialize_predicates(predicates.begin(), cutlass::make_Coord(1, K, M));
+
+    // The fragment in which the elements are loaded into and stored from.
+    typename TileLoadIterator::Fragment fragment;
+
+    // Loading a tile into a fragment and advancing to the next tile's position
+    load_iterator.load_post_increment(fragment, predicates.begin());
+    // Storing a tile from fragment and advancing to the next tile's position
+    store_iterator.store_post_increment(fragment);
+}
+
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+// Launches cutlass_tile_iterator_load_store_global kernel
+cudaError_t test_cutlass_tile_iterator() {
+  cudaError_t result = cudaSuccess;
+
+  // Creating a M-by-K (128-by-8) tile for this example.
+  static int const M = 128;
+  static int const K = 8;
+  // The kernel is launched with 128 threads per thread block.
+  static int const kThreadsPerThreadBlock = 128;
+  // Define the tile type
+  typedef cutlass::Shape<1, 8, 128> Tile;
+
+  // CUTLASS provides a standard TileTraits type, which chooses the 'best' shape to enable warp 
+  // raking along the contiguous dimension if possible.
+  typedef cutlass::TileTraitsStandard<Tile, kThreadsPerThreadBlock> Traits;
+
+  // M-by-K input matrix of float
+  cutlass::HostMatrix<float> input(cutlass::MatrixCoord(M, K));
+
+  // M-by-K output matrix of float
+  cutlass::HostMatrix<float> output(cutlass::MatrixCoord(M, K));
+
+  //
+  // Initialize input matrix with linear combination.
+  //
+
+  cutlass::Distribution dist;
+
+  // Linear distribution in column-major format.
+  dist.set_linear(1, 1, M);
+
+  // Arbitrary RNG seed value. Hard-coded for deterministic results.
+  int seed = 2080;
+
+  cutlass::reference::device::TensorInitialize(
+    input.device_view(),                                // concept: TensorView
+    seed,
+    dist);
+
+  // Initialize output matrix to all zeroes.
+  output.fill(0);
+
+  // Launch kernel to load and store tiles from/to global memory.
+  cutlass_tile_iterator_load_store_global<Traits><<<
+      dim3(1, 1, 1),
+      dim3(kThreadsPerThreadBlock, 1)
+    >>>(input.device_data(), output.device_data(), M, K);
+
+  result = cudaDeviceSynchronize();
+
+  if (result != cudaSuccess) {
+    return result;
+  }
+
+  // Copy results to host
+  output.sync_host();
+
+  // Verify results
+  for(int i = 0; i < M; ++i) {
+    for(int j = 0; j < K; ++j) {
+      if(output.at(cutlass::make_Coord(i, j)) != float(M*j+i+1)){
+        std::cout << "FAILED: (" << i << ", " << j
+                  << ") -- expected: " << (M*j+i+1)
+                  << ", actual: " << output.at(cutlass::make_Coord(i, j))
+                  << std::endl;
+        result = cudaErrorUnknown;
+        break;
+      }
+    }
+  }
+
+  return result;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Entry point to tile_iterator example.
+//
+// usage:
+//
+//   04_tile_iterator
+//
+int main(int argc, const char *arg[]) {
+  
+  // Properties of CUDA device
+  cudaDeviceProp device_properties;
+    
+  // Assumne the device id is 0.
+  int device_id = 0;
+
+  cudaError_t result = cudaGetDeviceProperties(&device_properties, device_id);
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to get device properties: " 
+      << cudaGetErrorString(result) << std::endl;
+    return -1;
+  }
+
+
+  //
+  // Run the CUTLASS tile iterator test.
+  //
+
+  result = test_cutlass_tile_iterator();
+
+  if (result == cudaSuccess) {
+    std::cout << "Passed." << std::endl;
+  }
+
+  // Exit.
+  return result == cudaSuccess ? 0 : -1;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
diff --git a/examples/05_wmma_gemm/CMakeLists.txt b/examples/05_wmma_gemm/CMakeLists.txt
new file mode 100644
index 000000000..ab048532c
--- /dev/null
+++ b/examples/05_wmma_gemm/CMakeLists.txt
@@ -0,0 +1,38 @@
+# Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+#
+# Redistribution and use in source and binary forms, with or without modification, are permitted
+# provided that the following conditions are met:
+#     * Redistributions of source code must retain the above copyright notice, this list of
+#       conditions and the following disclaimer.
+#     * Redistributions in binary form must reproduce the above copyright notice, this list of
+#       conditions and the following disclaimer in the documentation and/or other materials
+#       provided with the distribution.
+#     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+#       to endorse or promote products derived from this software without specific prior written
+#       permission.
+#
+# THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+# IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+# FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+# FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+# BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+# OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+# STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+# OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+
+
+set(EXAMPLES_BASIC_CUTLASS_GEMM_SOURCES
+  wmma_gemm.cu
+)
+
+if (NOT CUTLASS_NATIVE_CUDA)
+  # cuda_add_executable does not take interface include directories into account
+  # Let's fetch them and pass them to CUDA.
+  get_target_property(CUTLASS_INCLUDES CUTLASS INTERFACE_INCLUDE_DIRECTORIES)
+  include_directories("${CUTLASS_INCLUDES}")
+endif()
+
+cutlass_add_executable(
+  05_wmma_gemm
+  ${EXAMPLES_BASIC_CUTLASS_GEMM_SOURCES}
+)
diff --git a/examples/05_wmma_gemm/wmma_gemm.cu b/examples/05_wmma_gemm/wmma_gemm.cu
new file mode 100644
index 000000000..2b1e3567f
--- /dev/null
+++ b/examples/05_wmma_gemm/wmma_gemm.cu
@@ -0,0 +1,353 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+/*
+  This example demonstrates how to call a CUTLASS GEMM kernel using Turing integer WMMA.
+
+  The CUTLASS integer WMMA Gemm template is instantiated in the function Cutlass_S8_WmmagemmNN. This
+  is kernel computes the general matrix product (GEMM) using integer arithmetic accelerated by Turing
+  WMMA and assumes all matrices have column-major layout.
+
+  The threadblock tile size is chosen as 128x128x8 which offers good performance for large matrices.
+  See the CUTLASS Parallel for All blog post for more exposition on the tunable parameters available
+  in CUTLASS.
+
+  https://devblogs.nvidia.com/cutlass-linear-algebra-cuda/
+
+  This example uses CUTLASS utilities to ease the matrix operations.
+*/
+
+// Standard Library includes
+#include <iostream>
+#include <sstream>
+#include <vector>
+
+// CUTLASS includes needed for WMMA GEMM kernel
+#include "cutlass/wmma_matrix.h"
+
+// This example works only when this MACRO is defined in "cutlass/wmma_matrix.h"
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+
+// Defines cutlass::gemm::Gemm, the generic Gemm computation template class.
+#include "cutlass/gemm/gemm.h"
+
+// Defines cutlass::gemm::WmmaGemmTraits, the structural components for WMMA GEMM
+#include "cutlass/gemm/wmma_gemm_traits.h"
+
+//
+// CUTLASS utility includes
+//
+
+// Defines operator<<() to write TensorView objects to std::ostream
+#include "tools/util/tensor_view_io.h"
+
+// Defines cutlass::HostMatrix<>
+#include "tools/util/host_matrix.h"
+
+// Defines cutlass::reference::device::TensorInitialize()
+#include "tools/util/reference/device/tensor_elementwise.h"
+
+// Defines cutlass::reference::host::TensorEquals()
+#include "tools/util/reference/host/tensor_elementwise.h"
+
+// Defines cutlass::reference::host::Gemm()
+#include "tools/util/reference/host/gemm.h"
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// This function defines a CUTLASS GEMM kernel instantiation, constructs its parameters object,
+// and launches it on the CUDA device.
+//
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Define a CUTLASS GEMM template and launch a GEMM kernel.
+cudaError_t Cutlass_S8_WmmagemmNN(
+  int M,
+  int N,
+  int K,
+  int alpha,
+  signed char const *A,
+  int lda,
+  signed char const *B,
+  int ldb,
+  int beta,
+  int *C,
+  int ldc) {
+
+  // Define type definition for 8-bit signed int WMMA CUTLASS GEMM with column-major
+  // input matrices and 128x128x128 threadblock tile size.
+  //
+  // Note, A and B are 8-bit signed int. C and D are 32-bit int. .
+  //
+  typedef cutlass::gemm::WmmaGemmTraits<
+    cutlass::MatrixLayout::kColumnMajor,   // layout of A matrix
+    cutlass::MatrixLayout::kColumnMajor,   // layout of B matrix
+    cutlass::Shape<128, 128, 128>,         // threadblock tile size
+    signed char,                           // A type
+    signed char,                           // B type
+    int,                                   // D type
+    cutlass::gemm::LinearScaling<int>,     // functor to do the math in the epilogue
+    int,                                   // accumulator type
+    cutlass::Shape<128, 32, 32>,           // warp tile size
+    cutlass::Shape<16, 16, 16>,            // WMMA instruction tile size
+    16,                                    // scalars every time a thread loads from A
+    16                                     // scalars every time a thread loads from B
+  >
+    GemmTraits;
+
+  // Define a CUTLASS GEMM type from a GemmTraits<> instantiation.
+  typedef cutlass::gemm::Gemm<GemmTraits> Gemm;
+
+  // Construct and initialize CUTLASS GEMM parameters object.
+  typename Gemm::Params params;
+
+  int result = params.initialize(
+    M,     // GEMM M dimension
+    N,     // GEMM N dimension
+    K,     // GEMM K dimension
+    alpha, // scalar alpha
+    A,     // matrix A operand
+    lda,
+    B,     // matrix B operand
+    ldb,
+    beta,  // scalar beta
+    C,     // source matrix C
+    ldc,
+    C,     // destination matrix C (may be different memory than source C matrix)
+    ldc
+  );
+
+  if (result) {
+    std::cerr << "Failed to initialize CUTLASS Gemm::Params object." << std::endl;
+    return cudaErrorInvalidValue;
+  }
+
+  // Launch the CUTLASS GEMM kernel.
+  Gemm::launch(params);
+
+  // Return any errors associated with the launch or cudaSuccess if no error.
+  return cudaGetLastError();
+}
+
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Allocate several matrices in GPU device memory and call an integer
+/// CUTLASS WMMA GEMM kernel.
+cudaError_t TestCutlassGemm(int M, int N, int K, int alpha, int beta) {
+  cudaError_t result;
+
+  //
+  // Construct cutlass::HostMatrix<> using the integer host-side types.
+
+  // M-by-K matrix of signed char
+  cutlass::HostMatrix<signed char> A(cutlass::MatrixCoord(M, K));
+
+  // K-by-N matrix of signed char
+  cutlass::HostMatrix<signed char> B(cutlass::MatrixCoord(K, N));
+
+  // M-by-N matrix of int
+  cutlass::HostMatrix<int> C_cutlass(cutlass::MatrixCoord(M, N));
+
+  // M-by-N matrix of int
+  cutlass::HostMatrix<int> C_reference(cutlass::MatrixCoord(M, N));
+
+  //
+  // Initialize matrices with small, random integers.
+  //
+
+  cutlass::Distribution dist;
+
+  // Uniform random distribution from -4 .. 4. Values are truncated to integers.
+  dist.set_uniform(-4, 4);
+
+  // Arbitrary RNG seed value. Hard-coded for deterministic results.
+  int seed = 2080;
+
+  cutlass::reference::device::TensorInitialize(
+    A.device_view(),                                // concept: TensorView
+    seed,
+    dist);
+
+  cutlass::reference::device::TensorInitialize(
+    B.device_view(),                                // concept: TensorView
+    seed * 2,
+    dist);
+
+  cutlass::reference::device::TensorInitialize(
+    C_cutlass.device_view(),                        // concept: TensorView
+    seed * 3,
+    dist);
+
+  // Copy C_cutlass into C_reference so the GEMM is correct when beta != 0.
+  cutlass::reference::device::TensorFill(C_reference.device_view(), C_cutlass.device_view());
+
+  // Copy the device-side view into host memory
+  C_reference.sync_host();
+
+  //
+  // Launch the CUTLASS GEMM kernel
+  //
+
+  result = Cutlass_S8_WmmagemmNN(
+    M,
+    N,
+    K,
+    alpha,
+    A.device_data(),
+    A.leading_dim(),
+    B.device_data(),
+    B.leading_dim(),
+    beta,
+    C_cutlass.device_data(),
+    C_cutlass.leading_dim()
+  );
+
+  if (result != cudaSuccess) {
+    return result;
+  }
+
+  //
+  // Verify the result using a host-side reference
+  //
+
+  // A and B were initialized using device-side procedures.
+  A.sync_host();
+  B.sync_host();
+
+  // Copy CUTLASS's GEMM results into host memory.
+  C_cutlass.sync_host();
+
+  // Compute the reference result using the host-side GEMM reference implementation.
+  cutlass::reference::host::Gemm(
+    cutlass::gemm::GemmCoord(K, N, M),  // problem size  (type: cutlass::gemm::GemmCoord)
+    alpha,                              // alpha         (type: int)
+    A.host_ref(),                       // A             (concept: TensorRef)
+    B.host_ref(),                       // B             (concept: TensorRef)
+    beta,                               // beta          (int)
+    C_reference.host_ref(),             // C             (concept: TensorRef)
+    int(0)                              // Accumulator initial value passed as argument to deduce
+  );                                    // internal accumulation data type as int.
+
+  // Compare reference to computed results.
+  if (!cutlass::reference::host::TensorEquals(C_reference.host_view(), C_cutlass.host_view())) {
+
+    std::cerr << "Error - CUTLASS WMMA GEMM kernel differs from reference." << std::endl;
+
+    //
+    // On error, print C_cutlass and C_reference to std::cerr.
+    //
+
+    // Result of CUTLASS WMMA GEMM kernel
+    std::cerr << "CUTLASS:\n" << C_cutlass << std::endl;
+
+    // Result of reference computation
+    std::cerr << "Reference:\n" << C_reference << std::endl;
+
+    // Return error code.
+    return cudaErrorUnknown;
+  }
+
+  // Passed error check
+  return cudaSuccess;
+}
+#endif // defined CUTLASS_USE_SUBBYTE_WMMA
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Entry point to wmma_gemm example.
+//
+// usage:
+//
+//   05_wmma_gemm <M> <N> <K> <alpha> <beta>
+//
+int main(int argc, const char *arg[]) {
+
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+  // Properties of CUDA device
+  cudaDeviceProp device_properties;
+
+  // Assumne the device id is 0.
+  int device_id = 0;
+
+  cudaError_t result = cudaGetDeviceProperties(&device_properties, device_id);
+  if (result != cudaSuccess) {
+    std::cerr << "Failed to get device properties: " 
+      << cudaGetErrorString(result) << std::endl;
+    return -1;
+  }
+
+  if ((device_properties.major * 10 +  device_properties.minor) < 75) {
+    std::cerr << "This example needs to run on a Turing device." << std::endl;
+    return -1;
+  }
+
+  //
+  // Parse the command line to obtain GEMM dimensions and scalar values.
+  //
+
+  // GEMM problem dimensions.
+  int problem[3] = { 128, 128, 128 };
+
+  for (int i = 1; i < argc && i < 4; ++i) {
+    std::stringstream ss(arg[i]);
+    ss >> problem[i - 1];
+  }
+
+  // Scalars used for linear scaling the result of the matrix product.
+  int scalars[2] = { 1, 0 };
+
+  for (int i = 4; i < argc && i < 6; ++i) {
+    std::stringstream ss(arg[i]);
+    ss >> scalars[i - 4];
+  }
+
+  //
+  // Run the CUTLASS GEMM test.
+  //
+
+  result = TestCutlassGemm(
+    problem[0],     // GEMM M dimension
+    problem[1],     // GEMM N dimension
+    problem[2],     // GEMM K dimension
+    scalars[0],     // alpha
+    scalars[1]      // beta
+  );
+
+  if (result == cudaSuccess) {
+    std::cout << "Passed." << std::endl;
+  }
+
+  // Exit.
+  return result == cudaSuccess ? 0 : -1;
+
+#else
+  std::cerr << "CUTLASS WMMA GEMM targeting Turing Tensor Cores features requires CUDA 10." << std::endl;
+  return -1;
+#endif // defined CUTLASS_USE_SUBBYTE_WMMA
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
diff --git a/examples/CMakeLists.txt b/examples/CMakeLists.txt
new file mode 100644
index 000000000..23e75d409
--- /dev/null
+++ b/examples/CMakeLists.txt
@@ -0,0 +1,28 @@
+# Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+#
+# Redistribution and use in source and binary forms, with or without modification, are permitted
+# provided that the following conditions are met:
+#     * Redistributions of source code must retain the above copyright notice, this list of
+#       conditions and the following disclaimer.
+#     * Redistributions in binary form must reproduce the above copyright notice, this list of
+#       conditions and the following disclaimer in the documentation and/or other materials
+#       provided with the distribution.
+#     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+#       to endorse or promote products derived from this software without specific prior written
+#       permission.
+#
+# THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+# IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+# FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+# FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+# BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+# OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+# STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+# OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+
+add_subdirectory(00_basic_gemm)
+add_subdirectory(01_tensor_view)
+add_subdirectory(02_cutlass_utilities)
+add_subdirectory(03_strided_batched_gemm)
+add_subdirectory(04_tile_iterator)
+add_subdirectory(05_wmma_gemm)
diff --git a/media/images/cutlass-threadblock-gemm.png b/media/images/cutlass-threadblock-gemm.png
new file mode 100644
index 0000000000000000000000000000000000000000..80b86c766019cf4ab46824e97afcbb18cd2ef6ec
GIT binary patch
literal 60809
zcmeFaXH=Bi)-H$vQ4kanQL>=00R;ugNkv2fK}kg@Kt*yaa>j%R2&jli7D<u{$wd|g
z36eu0IZDn@gd*Mf8us>_+dsbU9^K!)cbqY{gW;y?4Qs8Lp68iU-<wKul;rf}BqSu1
z*RNesAtBjo4}a+Q?}q=A{v7uee(bVSk-JQSZD5>$zw9->bmI~UNoEkm<{eV_`vIG4
zT6QEPCxwwey96|2TuDe~n6F>Cq~@$Q-Am?t)NrV3;jdUHDy8iUqG}=`Y>v0o&S++K
zs2;tQ$<7@apn7sS@V?64_ygByuK2ND3+A{+7tj8EeBY7F+&e7dd~V`gpI<(%Q(W_m
zUR^l3R4P!^d8%m1K{(<m4cwgM{uy>G@{^U}Fbetkobo9T^0Rth1ugRP-ku@k)kv~-
zVUUL<>Aa6aUhKZbMf5KCc~OY<zwmWdVFe{6B}GL=@(<g0IQWfb*oZ!zdsz=6x44K6
zdHHg2I7oVha)HpHzXN}a#P-;YHOzEm^xxmLCs8r%uF$Uidyv~dH|N5Zu8&5n%yi2|
zwP1CNCR&psCYDV?eQ7uyr@v*&_)x)rf;zh%KR}+cI#*3T?rMNpYhu0euJqkUl{QxA
zgn3$;c!N1^s65KG>~^epN^Qh*|J;vPFVHxLefRDikucSfu9J^X*O`*}9<23ZABOZE
z{m+||4$E^WzB%VKi&j@n)kyEkw=Q#AwaTsz#O>w}fEx~6v9PePx3?FWd$(^*AqCfx
z@7jUYP3O$`^6Z4cu}*4~Na$$}4rWo?E7Dw}!va@e1sfb{YHB_|p`2<<Zhd`Lr;dX)
ze}6zKX84P#KVhWZIL0H<v8&XhDEG`!jJMtE()E0+-tdro+mo>9V}<eY@w@iy8*j54
z{t{qB^IRuBAobg~Z_$!&S7l|BqmYHl@v8B|eG*mZ-;5BlY&oQ`v%OWH`0K`gsTrk2
z`LS?UMZt*sJ#3cfnxRU6TBUUD+?M<;7O%}amIv9eHVrMpJEQdx1iSOMKaylm9Hd5(
z+_#IOMZpsF6*{DL?j1Qc@kJetM#o5bq;Y1HZWE`}$}F#;2O|@#w=KK#;PWK+^yb4-
zU6w}E$+A8-M2XkuhjzCF@MvY;^)4NQ)xoD}8RYF-<Hg#0J57JPW97<9A!PCGoY%HH
z9KHK>s%T0^k@@UKsi~d<yN#6@2c-k|WJ7s%;a28LGvD)`4RN15Sx!`!ndmR`a(6Ed
zn>R*J?CWUEaM;)rhL4r;QHm1FHEZ{S4Pp&`h!KQKN4?vnb>Uw1^DqJ9aBIGN!=tFK
zQmbCEs4ISnun9&Sn<r2LMs>#}oIkAZCJ9Sm(UUxk91(aAC#*A%<A~IW%8+q!edFLR
zW?I_zB;^<!PQ<)uZiu{^mpIyA=)l8Av6qB(>0y~&Wf3XcD&{HAjS06>hbcTPu8Q1Q
zH0~TO3iqktdjDpz4l4<X)@AfbI=iPl*OipuaKy98`?kl)1-*H5-0~D`02}OeHFu>t
z?41L54GZ<v*<nUh_|{URw4mYEXnUjdjs@~LE7+*S8xe3Q`}3{!fA5s8t?i;8Ezf8}
zl-t_;o$LeEXCsH@b1rtnvKKne&@(Zm2UO5DXt}b!5ioABF55Dal9Kspl@49Fmy&KP
zIoADpm;^!T?X|c(_nocP3fkufetv*f32j<GQWLDMI++Sf%p~RRT>FaaUw&WnU=Nv?
z(`*_}<z{kPqEeJRdRN#FzcHeH=S#@z`Zwog1lv>8k*|Z*HIknlA{Sx*b#){3bucBc
zpLVqvkCm_^3OlE<_XT7TuQQ@OSQSziC62n3kd}2A^)U=tA`;tl0l(BYZ{9FVx?Yi$
zrAA#G{b|;(hs;K*UoeT;oAj4%y*Y1ChktffE9=UQgi^EK!rT>lA&WO*B!~AQZjQA>
z1$`roKf!6P&x5!eCgoAs8J>y5;ouOhkgpB-^Ksk=zsEuH%e&OSeED){&+?({np-v{
zr#Lvm(@8%4-|>q7FP-ZDv#+xz&2;6ON5^?n(0!?_3~Lu1njicuy|vt`Mna+#cHZDi
z`6IIW;VaG%1uiN@NPBsL#}SKZffaC^>2jF<)=d1M5XuYZxU0;oOv_`1Yh<=)uC%(k
z+MR?X@};nK-#$wE$mX4CB&vvl{ad!ep*(WVVX}>{bnV@Z2qE^X&prrg?_{6j;P{dz
zwIO8Phc0$rc>46Igv;W1nazvRy<<^M(d#6lQ=3bTV{#<>vpgB)LwQT?eBQTYLXB+G
zKo<B%xS(lop~L7f<7yQ+s~KyrR#A`ghosge1ibiM@e<Vt4m>#ui`GiwS5MVzd0W1<
z+UItN-A68r-*8#=W|5<%$Jsg*sR-x9t%1=9YhIQ3r=D!v+pA?e+Z%JE&1^_;`e@ki
zxsg6(24@s*WLz1dG_^Cgvpx6m!5&{58FzR0rO|o^ZX~=A-<>*LdFnKi;Yi!lcFOH<
z20_tY+w1)vtGX&GFV|B@#!{lhowRp~e83B>JxdyztbW06#AB-g=D9IfmVq<tFTHVF
zX499Z>V&A^k>&oRXxGaaL6^mmk28lNTOr=926=5hLcSaXU(P7o=GS?VeH66=&r6G%
z>5?TCVid=)y?&v}t|Yt`tSp7a5#crV<V)KqZOnP?D1h0x`{EuRMq#Oj$Uh+A!&4T0
z=_wD23`6=2v6C`3ENewbD%`>Xw*J08HR|wCZTltkE+J$cGM@76$9$iJSkHiL0IGua
zG0xWEFzP-fM8<iZA@a-U0<ot&AD<vkNQ)soiA6J2(B77T+iv>(e|%ea7F3br3=xi@
z{da-I&xfQHA=W`m`TF{7ccFv%-MjBPX_(*g^}{jg;lH>8jxI3F=FlI{y~%{);^Mk>
z>lTq(>a52jT5h##NncUA4(i~qk$^<COMFWLi!QL;-dv|Rc4qB+s6G|5gb7E(ZjbfX
zXSD8?UZ$oda<rjZ>k58s@2~gY4&?Dz>hapydLXbQpqd~b!s5AB&PaN4Xn5EfH~6F&
z0^--ujN9c8X*d+m(HK7%n(WZ`64ZZr5uIz@-}mp=O5NI6<q6(xJZhX~KheUYk#>&k
z6PI5qPeyS|q3_~Ijez5{rU2&HU)a~Yx@Nks=j$M~g1CZgu}{!&t(aiYvu6h*!(t=^
z=h{;{raQBZqxmhnE_kRwq?zq4TGg>GQBT!4Yn~w6Z`&xj8Yy~A=@weogV2t@5s#x6
zwu%fB5x3`b-<Zkocd31UE3WRb+aKp-a1J-wop1eiw^GW@*iYMA8}(?{cX4qMg62jV
zWaErtVC#zPtUkl?FE5Xqo8=Y$xlU5BPGc7!D&O428S|uYCa+t`&CGLoycx_+tLUlc
zywhxt>FD9-OPKG1f1Jg647#$S0*$GpeLya90(Dk9=N!$6R^e_q02VWBA>8U>-O_8<
zuV44|^({m%Elg-m>ALThLk)zRV>7K-D%&f3Y3eIPf0)#-4TA@XT06$2ata>AYj6_W
zngGoSRnfK#{r)ak72!VTxUlN9`Uqh@-NI$qt9Gx|*<SO!ecSG>D18q?ivnM-=f+Io
zEBIoOX=@^R$Z%Cq1ntQ*eP;6xY;UWww8vC>zS&mEYF~GnmVk#W9E5r{ISdA)lV`C$
z=)>Ylm`sRCyc$3+xxF@gNNR0>Mp<G3f=-@Ar|tYeIqbR3HiJImQaQ6sn%^n#m9!Q5
z+NV0s_GpQlxp60_439U*84Y#lccf{>b$2T69jB478MyD*TvCEHhFJPR$RQ-BuM5+e
zWtgm&;4<EHQkTVC0}@?h4khFMQV*k;kH#aLuFYzHZfpmxWt|97bN2xo72hMLg{*o^
zM)?z$MzajRY8Q>`@cPf)NV4vILdh`N7*hs^*_)hJ<(o-d!?5)FNU-hqTCLC{@}Zg#
zL{2Nb)-3Xu@)xxmy<pPx_Tq!xMz{8R+?s4p&37f3Ws6CQeQJu8F>iZ+E63zky0BZK
zT*v%t9joR5qm`W2u|?ukhE9yaI3`W_o-$94f&<gha}dJv5>rqa*uSz8!63h7=u77&
zT$VkZHgz*iGt+B(DW;t7wFW*#{c9omEMm23Gp`||LEF^}g6*}ZS+Vu%`Yb7i2f8fP
z3+q(1dBHZ7KteA-_an;ua&l{e*kwx^cPDa>B{Y~rlE+Iq%6Yh$cF|LAbMP@nysGw0
z(au8$rc4TVN$+efky0FcZ<luVL~}{~CvS?}jls`8{cdxTr1!(BFT%03S2onWt6fM1
zp-@oa^V{x}>%knEnZ%avaS<d!YT1j4J@u=cK7qSKD{I8dHUtMCFfb7R<)qA$y)k<!
z5)M-I&7_v5Xr!B2HU@Jxf*VPjImUEFr!4@#I~iTD2+4ZAz3Z}XF{J-S4p*+!ygVI}
zVZ<x(%XFS9J$cHr`b2+Np34DVo2(&5IeJRis^^>HJw?u1Iz8vuTz{#4DG%Zs-@2Ck
zSqLSjOikp)M^4LYvS=SwBKL(Gh6nA*SxiaAhC_M)F}OZam7Mhb`MRoI+B+Zj9Ex|1
z)qReAL|%V}vT3%Eo(^qu37lVT2oEYnEm;k9F=hjNjp2&4Y?aGILTH^|YqNUcVl7X7
zbkdMKLpm2}JA5?8W%PtOM!V9FmO_dt2}c~0-Z8c85bUVGYk8=p9LhNBvxk{>qTObF
z{aaTp#d4g#eYiv1n_ek40HL`a{q0{*a95^*PlLyvq$W=DJL65UMr@MY!I1jvId&T2
zT|KhBmuBgbXz5Y0en+|9<s6rCUwe640W3K`#*>)rwmMrrW_-qvcPZoJ^-c4P5+Nuw
z_4kxHU9jxRQI=Yd2XAa7Hs4hY9yLNCx7Fb$muW!ZLUK~{WM}r+vl9Y&R=tpBGchnQ
z(9kT6#dtM@3r>NLIw*Pj!ERE|?R8_jrzD0oEeQ&8fsCSeE1nMY8{#QbZ5f~dF%dtz
zu~5ZQAH9M*lAxPXHjU0PY0lbJNL7eAii&MSi&lk<+qo0kQR#y3%n1`oG2sP=3+ep|
z2a=Kv=SnxQVd6A@I!r_K#0BljBO=~XTwdFo<S%t0Y#xjyYL|JIgr~sScj|RO&0AAW
z$(70lF^fGE)i@R(z|;FI2y*|$?_cZv4uhX67<s8sSEy=VA3|yBrK5;aUQo@tcilXU
zDq^L8!(T%wTEYb^IOS+Im!x){^TH6+9@=DWK{`-|*F{EMUhXo_$bFsc_-P&6R4y~j
zeXVHfH4Fc}YDh^Bu}GzDeCsW8n)=dwUdD@SDhG2~+pG14u-4c3o3WRPY4tr^+IGVM
z!rBz}hO^*Ab22;+LiX}^`msrmf-N}^DH{`S9SxR8m&>F1;dWoKi%jDhK~!p~P5|-(
zez}?~HB5s22_)-Rkm)E;j*&7l{YZ;KL+X1_AnFNKU;K3%^8_h>F^5SL|FEw|XPAq3
zi`@>O7i_T%QrwJ6&A}vi>BCYH1I1<>s06U~)aLj!F1N}0Yw_|S+~A!BS|2nvxbACI
zN!J!^&kYkt>M10FdfMQJSRUW7e80dUiTR5IXNU*K?b1*gdO^&R_A3@tuLKL}%W*B`
z4%S8-{PR;8W&8R|+4%WwA*+QWTkCr(?y8o*Y|;kQzyfw*@AhDI@_F@3-SN9<xnnU$
zUJ-CDvT!JuA)hzuy7dNgy6_de(_SwxMY@i+m-bBQDqf%^rfPsKhKoC4b5R_Bq<x=5
zF%Dol{=9{M*|0^O2u0i0EKju7XJ)agqq(~4uIz&#lUzh^UUHeO-C8o?-EGZ6`{Z2B
zw#z#CR)Th6x!_Ov4Qn;Y&S+(gKrE=c@-(d~#Hw$6+(f`h42re!eLLfEL1~rmx_ev&
zw%SusWYT<0BLF~T;f<;O*hBXdC~&D1Qa56~F2J%HH%9kP7lMTW)Po$uN;>^w02owD
zh6`FQOWvjm)k+>p0Sh%^+XF{7x1lSYAiX*ND6IM;<o=JmcH~habu?R#A3vVy&gZH7
z63EnD<TM8re(C1o*TU%4ey<%$;hw|pqe*a5#Y#Ilui%GMAnRx-BRMwtY)JmDfx%qS
zoRoRVQEoL8s3G(FJ&Opjg!<dBjgI~C(3^B9v5+}Pe+JORcnEnjy+s{$h8K&@=oRBU
zw}=o{{c9o2g}!-XqH(V_>`MqQRy)_MoRCyfE^OI#)ZN-?%K+Rc?6DZGHXfD|G7W=y
zQ${kW0G>|BV8@qU$MPL5-k2>CSmiht`=@U!!?g(40TRF>5+&s#<pB;o!nd`#(Rp0F
zf%c5%Jd#k_h1n)z5(wqeDGUvirG{URO;O1+4#`_Wz0a5sH&mg`NVNlxWCa)%#O|yW
z@|N#b{iVHUYIpyU>96r&@7}$OEncksII&!VGwUlZ2oqt7dUc3FsIKeQGM5+J83G|c
zHLAQUmlo~=mEVBAW$j;B`#OjvkGI>?-rlYB({&#77KD9OO={R$?eB*)GE~ns`PvIM
ze45v={Ib^Sbf>@t4#GrTgm9yx@t?H?tT8c@Qp!9wRnl|QSpXwuMiNy-)>xf82M}Q$
zIuXZ=B0g*L5qp(;b=fX{adWv<Iq6139@MN5(YasOP110#On1g@h?ys349ka#*p1c=
zQ0$g%cJAuGLqYS$X1X6kiKQ|N7%2|e6XT!tE%NGiIl(u}k2XthZr7=w+jFK+5DwSa
zyn-C;_@V9Ozx1oxA%}w4eb+qWEw}*ho%#U;B>i0nN%`}5<RiQHz-}VgtOLtLta~OP
z`0?$fM|IKE)ay%QjYAYQJpnu(VxN5u<r^hHW|Tx3t60(gEz_X>$`@M^tXj}&k6lo%
z!e6=%AasTZ=Rm1l^s^$H*Fv8@b*e2D#b?9ov3Rc#Dq|zIgG42YQko~@d&T^v3A0~9
z0`WPfs^%KPvRgy~ToHDOT`uqf&55ryxU5;;G(urTDz*?3DZQ@du6H`>`Mz4=TECr^
zL*5m1!39_q2o~g}jX3NQ^59pF3t4ulrKoY4>wA=yEPP=wV$1FcNCiOBhsE<-czbgn
zWIO^dGS3Z9A|4+<{z2bsD>tlKGq5s*a4!lQlB*Z<5N|#VmAZlD3qTJ5b%<c%_x@wq
zJpFj0uI|7-K2RMGCa2{-y6u+C$-#m6aihkMF6)pb)T50Gm{CyHX9%XomB0!cu^9{&
z$9h}6@3tzc*N*!Pb#sT}y)(u`@}XH4omm5v@22o^a)-?2SNmeEvoZt~UZ2TK<VUdL
ze>N*M&$4?TWJN94H(#*J)kVe`R0ZamG=G{t=G-+I7bL}Rr!`=Oo-m<g5XvzkoanV{
zlmz!vNZ5CX8U5k*CG${l9Q7+}!$CUc_NPC)gy=R@w3m8pT<(9k14%*4+1ocJ$j33K
zoOMj|G}5&pmB}}1Jo?80+=S51_qbK~8U06i^z-L2P|7;>d*tVanpBC;;(p}#vd7@O
zgUiS^O0XIHq?)88Xy<5lNcJ*B*@tBjrvRO#>drD$$o`A%9ax>X)9eMi6V(rJ^4G5I
zms)sFQMlZq0H$Uzx;xGOpdQ)Qu>KA)w3KK>RQxj}C}SKTS^5zY7Tp)8*K<4cHUOLt
zeXI#t2tcvM4UwXEK0StaD}^oSK-=9I*OzJ0%kQ!M3hug&I{Qm6PDLqAD?1U275r{4
z$R6hUN&ue3Qe+*wA}2Ss&t<jO=~2}I@De#45N>36zBh=^wUL?@<qiNmg5=WAPs*en
zl2tW^9DKqaz$a~X;w#!ZBi_fa1x;Hj&XD(fa&<p%XZ-Nj4mNX9W4`yztD?{9m!dla
zY)0KxkeZ#27yZ{2h@wm1ztRym75|#qfTWsP#O5O-@7Lw@sk>-js`vMEj_u_-V1`da
ziUFQ8JnAX&IyH({u8gl7@O*O%eci%h8e+xmv)Lw@fi6(T^*Ij*KuU`bK$o~WWE0O+
zg-}Tu)*ki1qze}IGQKngw6;87?5Kwupb_<T-UvPL`;3+P@<iQRo#_^~X>k9t+?&At
z=G+~~wuEY~pmkj*5`F{*D45K8FZnKV04xs$#3O6-!HfA9OI!(Gf><EtyO=9v-mT>K
z<LPY!2uig<i>I}v8Cy8XolR6jhZQ`1s=!+?@@yyt;tW1;;!DVE0#uJCXPdrDEmpH1
zIB>v-mr^&l(w}ZBFAML_Zwl8i68l{tAVAOj4fMpuNWoY%MdUdjS>s8F3@Lgg#IJm1
z5{9*}kh*q{A&YK86|-Aip-At2$Rq`6PBak#%H7wY9Dboj@!oBS<K>^YRN|4`uKsZ^
z0El|<a?heOg5gNL2MiGk-`Xbws&^n$bNq`;y;fOzOD*myr8$P1Xj(#?Os#MEI0UuS
z8+aRT^^{0JBit7%@qxsnDqC7(fQA4|(-BVF>zcGhdak!x-+jTm^Q4Wsb<s?oK%pDw
zKM0pk%#axXBp#49d5Jv&coH(}NKrc^FCXnbU=*m%idS#(0`F(Z!T**}co&>xD-n1V
z3y6Y>_XeP*22P36U1_TfQV(#^5xy7fM}T+|w)pk|)_3xJh-R`%0;CNIXS*;^M&tRJ
zY}V!n2N|1=0KCrA1W^tudtKU_Wu9AK0vNymq|`|vM?l5Aph|7D0-$3sDNW-^9|t*u
z0QKAA>DDCW0b;boB9e1Ij*E{!rAs#TW)UjR=#@k&1poexs7Y@%&?+gMPj2YUHSYk-
z#o+GUI{X<0MMa5Y&kI)jm+1Zo;Qwntb^lEW;eT%X&!PE04gLMk-u`EA|Igqt{&SN5
zcRk71!f|5EBE!Zbbx%=fNkSW-Znu9^Y!5N*nFemz2Sld;p97wn;#aDFw=$%Z9Pq;t
z;r?gG#q9U9b5;$MKjJHz<_8b`I}I<#aciV$0;aZnXhfp2J^p%dUFcpBA4F4u@OAKO
z-9r0P_jNY*rIC7un(E9KoQ>-m=!H63)?fA8wR2eBvdt{u81LZI9O<REDyn_Y8!L@*
z+?YKefL#uu2P|HoQ34@pfkj;a^wel~wd^m5;rVl1;bubUtT<+<>f@V+>K6-kp}c%g
zPM{!_DuQwg66-XAO6+BCpvBK<e)y=kr(pN5*E>Rw3Sj8B8>%?;;C$E%c7v-vQ~~zG
zKI?VrmoI;U^5AL^vj?aN%=x%9KMVk>n&-9SnZ18r^pBJ!@)Fux{`&P3qPF*dvB;fs
z0bcksr7)6~)$Q`U`cEPhsQ4x1eFi|OV=4*qS{@F7+*Vaoyb=AF{|8j^VjXvcpboN;
zoFa$EAdv|_@UOp4z`cYtPd!;hR_-}~HA^G3n;`4?J7?E|`h305edz|%B{p{Uv4$vf
z4iYa!cJPZvmD3pJK7HB{3MR3K4$py5i#YHx=Ev>1u%Lh_w*4-@gb8HF7T*Wn^qvg5
zK3Y<opI?Pc6sYQOV99=8O%TxKKqhglUP+gG<nU7-K2~5-;pSSU?gfNUZ(0-pk^DNl
ze%>0X&wy4&c>EwcM$C6oAaL0khRgsqm-RcEIW!3gyuhyySDzZHr2sNePN?{d%|uHA
zg7pkdCWPwo)7+Q-A<{YW&jp}pT3`I0Jv3P_+<)PJ{=K~T<o<U!;z+P^-QEFZIB6td
zSI{oIpl+ysf}`iZ_cZV}Q#>TpM!V-ZVMFgLvi<$uK-*uJ`#`k_G$QN(vO*;MzPQER
zz%{>U$F+pcL1ooKeagD87?{>`|MRUUV||!gsN<ocM3C11i{As>&`uqXkhMfnG1ujB
zK>I*q;674Koqb?T;$NOd5DP196y+-qiU>k%*nS-}x(DoF`7;htb#X~9EG%f}0iXie
zHM4|slLh7Hh2biIBqc!`qLppry<M~T>eVX%LSAvJ%a1idy_((WXU7Z{aFK%=rFRi1
z@hp0j7){B*Lkj!HOHkY9bz3RO%k$F=-Wq(yB%Y_4c^6nQ3jotP!@u;ExUslRXMzTc
zj!R_(@RQyGyQExQx+F9D^LH!Sl2vJFXwm~>?Kfrpj{!yfmvXcO9TYvyadP!QWoml?
zX*(Vs%B5;l706`7)8O(i+hT?WKrS7CRI!IclcgK80y>`)Gd#iS(|P8hrjJN>j1aai
zok)yG^9OG3(l`y;kBw)h&A})*YA6MuReUKR*7rN<-`-Bu%zT$<Z<Boh(fw6l_;si>
zhRs041~1b_t;QE5MSR~$pI1>)F@-HsDx&-AChLrET8jx-F(AMBfjhwE`IJuI%+5Bd
z&q|cqUNgvUS2BNch^6ntozK9Kc=q5hM&`FS0K-rBK&Z29+JC<p6qoozFSrvfJ=$kv
z{w>E1G#xo^_2Ggt`q`Y5G2qEE-Paex>w`I!fy2+OtRo%&4Ev;s@|<i-HZph4u?FTg
z-DABQy&oy4o?ovBp#y0|VA_`uPn)!DC^fyd2uPXCc95G<_C@Yo**1YMTkxVPyd=-9
zcaM$yX?cW9npg#>FZYWAj9hl?)ma@!&?+I<&fvYZG0DcL^cFVk5VHgh3QsUnW-0e?
z7P45xZT)$>Qg^^h`~z7N6hiU7$zl5+k*9!644(k-OsfT@#T@WLz+ea_*hcUh`h|&{
zmXg{AC7ddgR>rk9FJQ^S5W3h)-X;{_sA5nkbuEI)YU-Q;GO2krVkI3ogThPiwGnxt
zWqz*)h$(lIk{>;zd6ToJumYgwFxu*be=|ar{czxw<eq~b=h^Y|pA;Wo(kB9?-Q9%&
zDiMFxTNTiP^gWY0cfpI`S8f8V<NNGc4n97i(Qv53S37Y^2$X{63Wy%i<1Elh^`U(I
z;Ja5pQSiOFkz|qqM5Y=R-6<CSn)a;r1!oL+D+VcdoR(kDQ*gMf!T&hDTa&P?8f3Rp
z(QY%jgFBbNL{{|xLhi~0n3ar*vFY{r_&CrF+CGIqb|R2Tx}qWY1)x?bJt)eJ>cdU_
zzXMa09hhjH4ivq*Ir-7QK7cDW*UwzM-c8V2o$K$nplnhDF=yIme6p&XW#S|-8oi*Y
zOY{G5L}9Fl_^O_&+TmYTh!T^)iqJ;{ZYjYUI2aj#eoTBdOB8rp;<^4k6qe0|Zc4Hz
zH<WPYb)E!J`3+uNnpIx#t6UtQbpU^#*O@s&Ljy~bE(n^70AJtpI(s%s0Y&Z7`*6D)
z>^m&|L26r(ll2t2``VySW@e@l+eJ67?hC2ih%th0i0NM(nGD)D>mKkEX2%VE12q7Q
z094%+A@s#0yApul!pnk;1q0g#AYFjenVWAvc3YP*(a{;>4F>>Z2B}L3ULVNN<UXTw
z*Q5tvLt52c7i&1{6Ym4m(*f(U0arb}CJ}*cgahdhG${deR<Co<hXAarj#8%3^B|~a
zA1FYmoPT^DC-w>kxIN?`jhm=|fCfODh=S$usck@Y%?<C}y9evub`2khLStk>xT*E(
z{MNko$>j<f<u^AR3#CBS+PaI73?ZY&g7O=vU}<$h74f$7sB?HK7{0dGLM5HCz4ZqG
zXu)fm%O%8hK1L(TlE2ST=Sp4sA?eNATNjcutcn-Dz`pj>8M1;Jg`8X09{ATZukkXl
zf*XWU8dL8ls^i@UpR|Mn)1+yB)cS`%r~ig+Z0pL0)Sx^7FspW1o=8OR2AGvus2Wi1
z!ZrgRH`kZUZ(Q}tK3+ibZ|@Jm{1z-6Q_^K`a(K!ci0?n4lWV3v_{lrh|1T7x5d(&3
zf`#}2d@~TkEpc-vraEF?$so~BXC^06uf$b5F2-tV>+G4y_YljpH{d`8l?TMQFZv2S
zk;zvt^m3voK*Z7itos<{S*eX_0VX6$W*avO=`fjw0+ek=2X?wS|M?Kjkt54d^8kUG
z`5&2rkR<Ln{YES5$uXTlwF2Ak&-C2itBz3c;x3v`c4TC*N2EUp-RX6kE9ue$Aqwax
zG#PRSutl>iS3v}<or`s_2Tm5Nnfa-Ux&TpC{qr0rv4JeodI0G$#ozh-#He**+<zOC
zc4l-AYQV(S;b}P4#NqtkD3S~T2dO<6&&D4y4eP$O98A!7%;G-(00Pc&9uzimr3CD|
zK9PnqkXbS%vE^#J_IN8=gzVqb7C^)y?`fvK8pvoW6r}{2Cd9Ukub{X6;CZkffAQ!R
zyuHhwxk)`hu=PFHD-|C%g+nAaeeh{QdS^YT(=164j5${-0|Gs~_Y80|9f9xW#Igl%
zqJb0j#q-QiF^S#F8;V4<+kg6T+wUMRgWz|iY-=T=(^U+-BA067vy~LM{J8$xBOcPl
zkN||M>>#ep)a#ssFHn;C*d>JH(GX`E$*f{-4F{|q!gRd_<#cztj<9(@=yCBDl9<b(
zcT0+%VAaQ6BOm>{C;HS(O-{$V2~jgVJuv5Mj%jO-|KbFc8bUfUjAHiVwLBR)$KY*0
zSxCzEpF=nc>=I!2^%_M$0jWW@YYtmkhyc3j4?Gang(aU}@ft$m;y?1;Mf6Pg^N8Fc
zFVPsn8&%oCCuoG*`rE>0E83G{Jk4}XGW1I7@Q1bEnq~DVd;kiI`#gY|)^FrkJleWE
zK%HS^zJF#LIPGH)do1z5v1bb+&?>_Jt)#1`zJ6E>uiXNyf@LU>J@Fe<kAYsZ24@bN
z3Q^QV=%nxuA@tvAY(<D8toNnZGRf~3^%n+omOuekZIRo02ka|B(6-Ys6yaeN_c~hR
z)4~KD2EFNk##2QNL|B(15I=~vv7}v2psNaR=M+RD7T;IM`_rY>LRK<Jrd|~SW{bb0
z@anGx$X1l!oEwBCjt1=#R7g9746hIfOsY;j7@t7vl}lFtavCh2rh;(fdQs}D*L?a`
zd1Amo<`eY1zJCpE91m!N27pm80z7|i69jSw;+0lVQu)#GVUuqbQUM>;oK_kKZUF%P
z@&2zZ>NEXiWw|BR{iU#eXY=}u*xCKCt=pJ;YfS%QYV@dgiQH=Mp9g}_RxP`x8PZs0
z_xW-FyWN+Y<&0GKX<*UoaQMv=wu?Z|n=SbKI(UXskh+3-p@CtCfT|0+DCh_<v$qFc
zi>bZX#cl@Cw0W26JXwJ<@%f4?TneOR26<gfpi<W_^F(MVrHpoK$S9h0uRvwO3<)ek
zghHAm1_2%YQ*-|-pm!cdfv5RPJ>^y4Ip_J?*%N23tyVfiDcPDZWg#LYgtw^WfTITT
z`Bbr+Rbvf<k(d88GLWTu*L#CNsn2B$S~u_(yWRcaBs%NXLNCQR%_)bjs8_G<2}MB>
z^dpyp&u=~Nv-wQvmkNCP=ieXKc6Z+da*2$R{(|%Tz_Y#+XI|lz!}w*V3_<?@i*bR*
z7z&wRm6W`GIcK!<Wil6d^Lmb-1!GcWWhLmKGr>|pQ@%Dx7Ii_qS*r_b^Bf!`9$n^;
zy_%gBa5{GQR|&w04HvRZc?7iB+1R-WvNdYhx%mr~NG+<JZ<T(})>9x8>Ih&Icv68+
zXou=J)1WH4J?qHtimf8V)0SY6`Unj%I(Dw%*Clf1hbQ4s2KxDB)tZ6mrmI;oQt;Qy
zPy40<?LN*5hi+_azo#55q{P`eoHouT7XLmi2bhaHo!eh(Cw>=Z%80ZLg|8V0nx;<U
zXXTpYO@oLrvh^t6?|{5+?T5G!x`lq0u<(s7LWkHj&;%l4*u34_h!IH4<Y02aa)5Z%
zp&+i#u`n@Nax_T&dXW|6MI4?(Y#BgADm*`G$B(Vhk>JvrtjbxRXWBXn6jR-xfWY71
zP*+oXMfHh6o0Sf!0ir?E4}Kv(QB4DKK`Br-hE;R@v*8}3>1B2fb0w?XIe)(eG<SgL
zV-|8pxKeEj)NgJp)8}bKpZ=;kDKWWTJKI3E#5nc2AeBSs-nAd<jvV`8d1C{(jfR%*
z5lGf_@hgm1f0emr=!E$AabqpH>ImVvhols6w;y0bQbIr~P((oP<s)a|8)VXOPPBNS
zD*Sn-QZc#U<v}Deu^%{nWe|sVlK;A06D}O~47MJuHa;t>&)Eaa$S8{8m-&PRrNSuz
z4+Pqr(_JN?Sb=;*kmi025(SkhzJ#clZLTf!yDtT7FKAtaceVXm*?*t&*LHDWL0!fV
zvM;C^Ga(D@$_F0}PbzG8zw!44)K!t*pEB8<!<J#f*3nwwzwrm-!-zn7&%T4slgUXy
zktP$m6hO<zf9KQQ?A`Oy2xem%i%AGa8m(Ys>CS2&o#wGb`g^pZvVT23T!Sdz>)36n
zZP9#SoQ%c&gWZ^t0Obfd0#vnL9+qc<1E|j=>8jQ}))>R$&Xx+1c#_fFLkZ3(>v0rR
zj*#!UDM!AcKdyRQl;3mm+X89tnqMlH>T+!Gt5-+2K0*SY1iD)g-S@(7*YADqkKky?
z(g1Nt=R?KBPs6E%(6PiV9(4^!^KG{&JAHZh_J3&yzoMDkLMq&A@6ub?enM2hsw8(*
zdV9f30}YO%+Wk8J>*vpJZ<CIw{CHdd_3|ur+Fy0jKY#V=f>jUhwmxB^bqoMJBVIYM
z`@_$8aN`j0-DV5M{zmMSDFRXlSg5I5ra|YLUfSXX70huO8iUav_VEzo&@4;W3(rn?
zkqtC|AZQS|v3*`U9!sZpHQf1eTQC$5RU_e;5Q2AyAO;A9(JW$;A3-e9lW)mD`|Y{&
z(3RcnNmuX6*DjDTn;dRn&?XuCA>}bm0y$Bc*ADm$=vp$A^b*7jU5T=ZD98o?=HYEb
zb<XkOq-^(bQ9=8Ssy|@N=wnLgni#L`PKeHDv!lz1kY3bPbOPja=^VBzH#@pO%yH<-
z8MtYr)jVg6dn9i6nIF&l=^2k!nWqP=d`_17KoA9=R#wH|KI(TLLi90DbPdG7oI2t#
zidcoP#TA{Ge%jgZegjj#ROlPahs}jzI%$h1fggJCLPAVJAsYi-N2OxqFR%aiMIFHw
zK$+kOiUX*aerCa2kU976&H*vpBPtdt3yv&?pGNt+=b?j1-0_SMYu&1*^7ZS@ystqS
z&vEM18{cWL`b%FhvW8IsFD5lk|LlSI0cx>6!m0T92$8Te$X&j6m-=Tr#E%5{xe!)G
z<%m(k=3qJ5oPLR`>3}skS?c{42`^qA=})Xrnk(C}vY0NvsA0<fs{!L4g1=2vst>*5
z8YVcnY!NuZ54nVUzX*AO!wjbY7SeC?Id@?}&X<Q(7gqNN<aWuGk3!-YozpV(dLYUD
zY>~CH<-wV~U%~>{a5%8CV*UK3S6nnok=I0Xqkgt_{J`5D9`qdJ#?*%!8h+Kg`R<A@
zX87v9=rZ!H8z-->$*jM!9dC-h8W1f>xW`&%M|$t?y1beddskKErBU75;G7p<T(WS#
zyF+WD1E<m{Qf{8;T5^N;;YV+A9XKFYw&S^}j?#^tTY^Rw369YwXl$AJ`jltD>vsbC
z5Zd<6y@a#`ImZ*`YVZ(r`W6=)CM#gq_TsO}v*y1#Tzi&M@X-^qa(cWE{=+d7lgz7k
zZ)+we#txfAYK&J#<;~iY=F}CwYGv*z++E0_opwi8aw<g|)lEF}Fh)CtdXq7?4~@Qj
zd3m(noVYThn?D;+NC1KK#zYcJWu+|H>x9DS3fg(;-^=;H0Bw5eOC=NYh4*vnsCGO`
z9wOBoWI4uAJC_nCzjkIPLEoc$RiO0BY_H>Z6P8_Wn}H^qPsp+C%L{h5xVW8E%y?6S
z$3`BUJFTyIR=W9jKKp(D>J<hkE$jnm?6wIVTcB9PXBwz|eLYvU)S#15);9vK&wbE)
z3=+SvCzLUsgWgYWgkSKSE6I<0x7}Lil~EI1m9AT)C?~G&<QJyap^<LOZ`~$TSkdpP
zv)1brmus-Gk}kFRVIAsv5GnAP7cX3;(S1#|(JXfsQVP%qkfonEfA_<&#y96(20wLz
zT&y?8l&~^0<uuc^+`nTbX*1ARw%ujmVTQqw1+hrmZ>|llt(6T8QJMNDuFUl>fYaFA
z-dLPy<(zDF`5r<C9V~?au}zFZ)`<`ZxfY##4|oz&>0B+-c@)vRc97Pe9|ck*FE)+j
zT40d$W~;I)l<(^yD7{;t&kqiBkOxhU8hU3<?z`7^wpjpuC}fv1!&zUqlMkh;r)n20
zdK*Fl0=;_hIR`Ey7CG(LoXXMF)z?n@bRK<&F4$4+b(m<e+9J{>MeDbOw6!ZqIZijF
zX{kmCx@9XxP5IO1>((gVWSS5-tD2|?um)ej$XyRJ$gytT)3d8r@6dB2K!xZAk!Mn%
zWaOp4eaO*UM)~(IKE#9eh<B<ZLxRAlJ${3p@mDX?j~9AOjlwsr1ZRXRT=(rP_1JoL
zBAASFa-)WmrF6N4f|9<+t@VaO3aSiE3Uq{_`s**1bf{!)!cdAjU$R!VYm`_=ucuoH
z*yaxSQRj(-t9~)B&-O!#?~tL_yYJAfu<P;%Fqh4>;Z^8@*320ntMnf`qrd&tkJcX)
zW1FzYXLQBp#$u9o=0C3uekOAqKirO6uuCZdCo$E1H8(NNvh!VQ24oAv24CFcx<s{v
z9^@4e@Dcsaao6*$m~w_!`-9X^G{i{THNO)T+y3O8Jysua-nd~oOu*}n7@=rkST6AR
z`S)HsecFt)gc=}^Hoh=qNC3VK(C%AqtW_^VM&YC%Y?^imx7hch4=M@dv^*N`Z^jls
zl;7EZ$}ksz-%)^>O<UqI5kfI=G3WA!T4Yq4C!EvY60Wi)Th%oEYAyTe$G%}`8MP04
zO@{g}>sLM^Y+U1XQoQz5>DrnCyXd;fZGXWF=35#s3I5md8JA7>dJS^7&xw<Iedoe`
z(>B#M9R4D>hipZ?c_Kp2Tfkv5{@B^R<}zB{8{x$w9>n;q4X3@lxBMT8CyJF4?#x%m
zqCRWC^>DCESDqO$4t;Z+iN#Aq$k9u&u7*x>pWa_MX(_$_{Bq@+MJ7&6ay#ul$yWLH
zRW<B1sEdbx*IYKEn2_fEiE3Rh%nXnDP`#fPUBBwC@6nzQi2jQgFABE_Q&6$hFRGRt
zHR^sWdRdw-HTNMqPO_c%PGGPcEA~F?Z~TsRV~BgK3d#R5!==snO##AsUd!VTE@~xc
z4=?<=L=R$y<z+l*1+4p?LGeQt-5@VGwe>F_XdJGkzrKBjhw_)i;|JqoD~n!t`X&DP
z8=3jVH2+=1|9QIq=n(u(8U1b%{1Ku4=@I;!xcT!b5EAHD)c%|H`ER`a06HLbug4?=
zsDiEaBY(u_0TnbCcbiZ-Mxy@Vz<#W~W^i*8?=ji7oxG%YMgVWhahQI^XbE01V%Y=#
zwSJ3+-<gGH?(GK+d{vgfLjEM^Y}m0wR7_o>Ms@S&4X$bqm+kb1UlOmJfdIe*sYjvb
zmi3BY?Gc5$)nA&ZcdA%;;@(M_wx@g_DBpVdGBA?ZHZ(N6lY*Kv@)%Zsf75ekn<=a|
zZ<_vh_axH03{4UGxn?2jB2_>uK_46pOt|2>e9oiy>{v{OzZETRJcmcsb!D1S({8)^
zg}zUkD3%!jyZnCV;Sgw>-KRIaT2_)4s{nv~)Jl8O%1Ce!DPA*1dvmroVmTmb2D%x1
zr0QNo*O~m5iKPPcln1)fR8)o#%a{mMW42P*m%+i|LLN8toj|~+R}vBY@<PbucbBS{
z!9l_nYdQF%JR0_&pM*R(EG7yMC}P@j+`Rw&du7Ny4s?E{?-E`Chk&PdPyi3KC#I{0
zYi46OC^*dn;F=T8<#)ydMJ4`FK-4VY#9lwQ$pJ4;aL7>k&JwEcnY@j}jQ|Ezg3E4h
zULnUF(8MK@f;U%Gd`5*w+1l2EQ%#zIrr9t_H|@d)uU;O3uE?jJTdtJHo7}1b3FRHz
zP`2fmF8SupjnoXcP-I8`_UwqJZp0Z~Y290hRSat>tN`HZgItgjao<htgU6dVZ6;!Q
zXz<vr+}q{5wbvKF@;xrb&N<uK_AoiMwFW|4*Z$2?jk|AE(x{<9!ROQU<^BO{btVOQ
zv6Utn${g!3ey{Gl8%b89o#!^1N(*uEs-ML?Qv^Ht|9s^^9C<PK+{VS5Q5~5EZQ+6n
z06$uLYrMU)?KHu~RU_l$NvrAN3EeuoJ7z{!463Mh7OHA(zi%t6I!yH)r?HzKZ!W=$
z*p8GPI6%DG!Y|uK?cqF9-8Woy$cJ%dEmo#zdm*T{Yqf9+3tf@dm)0jg-?QxhaOb<S
z^o<kJo+E9^{ZRj%vU#4pu>0~KGBH~T>`U0BWIoquiLu6T!P6&CCK}b#6K`hb7&pFd
z8hi0Fn5NHj!{G+)UpH^pycB(4{Cp_idS?q7EsG(hI(Q4JXWjFKG^8y}tCt>yzNLCH
zK13b|2U8=%Gt9`i?hWI&j>6@~2?}H1Yl7v9ge{4#;ZF35PlJN+f%!cu`OqIARtmEC
zO@~SJPOp=J%6EOogMU7t2pr8IAPRLK@DWMH9WAb1zwQFZpAb8F_tWEBC(CxxhCZK1
zMTrTUOtS2}cV8Ztvb;_ZdSnXQW;WJv!|a@HEp%sM&jJ(B`{9o4e15?zM-QTXhodff
zz;a(D`n-2*o+Sgb^FZmx7i@mV&ZY>drf>D{gyiPEUjQLPcyA-LOaI*p{W2Tl;ND+q
z37S<2yA+*#CHdO(gq9#_C7@0Q=u)B3+ia8;esxCcayN^|a_mRG8xwv^poQoMD$liD
zJ=fteuo-{=hBn9f1Tl)9I#;^AP&F4E9F(F7e6?n}wt9N9ZV@DqWV?%|-hlZHGYESs
zbptDtW!64)+kS#2LU>27$nnOF5U!<sDyDb%41HRf?76iC8GutQx>vFxaWk8I=byqT
zmNV7XoMrgi>Y<POWiaAhJ~%HlLdM6R09af4$I413kq@oJ)9;ahZ@<jU13m3WAj3}+
zGQ;>#rSIWMe{_o5*{n@uUH%gf_C4)W8iM9x@|}`8zB`qEvVh3r6E2vwo%_&Bj8`h%
zx}C1gNg*GaFud1Mx<FFQRlm1T*mMJOB(1D_o&!T|y5a3lm6ep-p)+nbYIHMMwTyzX
zsgPfb<+n#fEY$*inlRg2pYkfxKu)t!^)x4^#A;7j&Uqlk?Z&oEV4+djQur^>tJv@+
zc5?rU;-|@Wg`8U`D5b_)XBcP1?^du*sSuYZnAhUdlGi91G!R^R185V~2kv6)HIv%8
z7VD*W5RN-HFzP-Sa22rs_=3GGj|y6lBwKi^KmD#up-J=<=P<XZ=z{)^tBU>tY~9xO
zhV7IuM{fQ5TQWJfItD)<iqPpeDJnX;y`j8)V4!TLL~)=VU(d6Uvo@8nVOnH%Z{Q=J
zjNa9?vKNtz)>|)zpdG^S>u8Lt*jN0u7_UA-n@e5HWtd^^DS{7F1ymMlA4vNjZ;iky
z54%v~N<Xu?z2!!R-<%uD68h7fl;ixwUG4Q@x%Hb-sT%b-+(7CgSf;*yqN1rK)CuN$
ztX-pRpk5)Ttu<FDan0Y`cdl1E*+$+K68zi}Xu4AfZJ+>F?3%ooYrP=K{6+}(j)?o3
zR~cJE4#bzlF1@!Gw_TQuv>RQyBHz7J+P-n8cQ<(%udbN=^zjfg``I2ixh&1}r<<Vm
zY4IpLll{BY277tV_$>8tu6ZaexBa5J3#b<qP2Qd2tkSYRsR_-&zz9srLmLn~h-7$n
zw&t8J_g|j>midVMTzVSh(s6RDiK~4_s`4$gbPAXIbLM0Y3GP4hK`PGRzyYsb+pjhH
zX(>QSC6D|02L)kuR<Bwfl<O;g5h0v$pg8*6@{#O+alDy0&>0;p<>s3oD%>e~$9MWP
z*BaG?ZedPG$QslE#B*@0plyT#&0}u3iBF$`rp83`jcWEoq<Y!LfrlBz+8~<bWZ<vJ
zdK}4`Tj(tk-kPya$k9D%tR6sxvm0Z<N2E_FVzsh`VVp$3v#YI%8Tn@I{PTT}Mon|3
zkN<hFHPI6fL1v`xQ2@@r>|PCegNLY8dPDXFo2<RyY(bKzO3V4F-gR(7g_yWf>3aQR
z8qshlu6Bp8=@zAwx2${fK!=T-UoOY|*rWO-gD$7ZHeaz)lk#K_8qXb%0)ntNbf<d`
zv^pi0WUa1%O6~VRhf^?DLet%SIY1cS9EvnZkZ<O`ZyNIoJk7ye07d16jr_6@beX41
zeRw-zt}8d=X^=D{IxI4BanPqeSCXH95s0Au9(V58z%I6Dc=_Nrx8`7yiqtxpclr$A
zhn8LLW-}XGs|I^wlJhvB1x}NJFu^m~A~~SN{O1y=K@{#@DI%oagjy<ih1TPNapbmv
z1ITBJ)#2oB4FkQsU!vSl_cW<y8X;B7YeOd)40zvXu6v9y`bI86o)+OvAwN;tzBKr8
z#o+q&^M@qcE_MT6N&v4G*(D5gBrP;vb*xOb^HES1T#)H*by<3L=Fp!(g#!U_fF+90
zAgqtYbd-8b<z$R2T)+NC*!n6QC2dt;)xf``2oqPfBy2*`1gnA=*E0x4FhAl|f41@0
z<clq|Qel5RcywxC|A9EzdzqC0ad+ocZ#s>(Qix<Rk&Mr<!(@kM(==x8S~h}60#eSs
zjt5Fem*<8H^Uj~&7_AG7e*Si@WxB-UPrFXW$*(WB1}*0{fV^dZ*2C0G_eVCA5USBi
zuK?05nH~8MHcl~DWvHmlQ=ljRLH?EeimHm~LlP7AXHJg<9VP2K@EPq_YuWrRCS6*x
zC#{nqwlM;nXej|-Bkgw@;-cCv4$i4#`~3iHuX=uR&tzM{ESU0vVr5ngX{0QI?m<WE
zwZMw@%=lAFMpNHwbq_D5NOWIQ3e4|Y_@t6hD;>zVZav`3ZeCs!N-DKBu!Wx{r9;mz
zehq*=&i()fX(yl$wzoH|xmlP70gvgh039Jnfz;o6E6t|nP?RzZez>z|PfTLLP2FH7
z@$LOrbwTJj*-;i}_;nRxJW_8<5yxflZU-h;GRszPJN~YF5JjHtDeMpo@lh*WuE`)c
zbm-EwDCE6(`SM=LiMQiKiTRIP5B6>J6JR>T8&Co|MBb#+T@C`DVv4a}_TtfySf@Zi
zzNuv~{Xmt@o_{9Veesqh>T{azhWWWdrGUr%Uit|uUxUXsKQ5^7z}y%=bC}#<>R3no
zGb+dpanF8yAPtY&8Y?r!;(0t~wpHT+W>Gk<&}lB-kV*V%a$HNP&tsz5`l5GzL>VBz
zPHm}9OYA`sYkh9kJT<$ko{8I=pc<p2a@_{<leSl1p;TI4K)r9~79-WmzgCjGH+_Af
zszz*4a<#2&r3)G7RSQNk1CR#uxwnllR%U;(@YSm*ah^ZjZsdAY>P1=2mi4b?C)sg|
z{H{)=dznt1K7Cd6=-N%PgQebu*y7VO5h>>Wr{k1wc00TemeaUjS+zs!+)ttVdc4ed
z&gdle{?2cGt1UM+%VXSCo4tJ{?GTe{y&b<>L&Jj1@0t;jsg?$$_MHFY1pogz9Ogf_
z{ohqo{lDzIq5mAI{~W3Rbe#O}Hz({rcKaW@{g2)L7wlHV2j)1u@!Ewn^Zb*md4gnF
z02(Tw8$Iaw`MV&tH!}Zn<j4__l=H*zwsd5S4-Cct*#*zxKV}CGaQYl#v4Tzmz@8i~
zi^9;6Y{5N{c!NqK>X<n~;6G!LmXea{tJ_uZFlmTeOsva7wt@VM`o@X|`gEj7?1tFY
zhG$m@?W)R>vAA#v7u$gqvIbM2P=Sc=zlo?8N<l;lEgaCn5ZxKh9A&8(C8n;GP)VEv
zaU~56;qd+uZogDs-NH0L%>c6pt%-Crm(8QuS?wH?SX>KJbm?DQTvaM6cVYD65Fm+?
z#PQF5sW6s{)XHlhGS9e?d5C;IV1C#P1cWdpP(v$#Su%Vq?YVfxmoJl;sj?)P@-zxV
zSoCvDUJzmvff|kgC7MQzhX#5gCku2o08tkn;cdSDECh#)6|@}5;XxpT?wxo3y!`ry
z1{gJv!40GolNcC9;m%rzBO>#~@~tdG+MiOh4-E}Ln~fb*uQN@tk4iHi!I0u*{i*L6
zL~D?cQ89|#hFihQ^WJ(_0Xq9oPG#mO^e0)dkY>8w*rpllExP;T)R&~Gy*9f0VXp3N
z=CjC@Qr`WXSWhUy2JAFso*aZBdFN^F@1(>0FnEzU7r$*LV(ju%hq5$>5uwuw#1uZv
zuGf+X>$^xqP6H$pL<L<Y0zt>_%$uV@X6e)te;x1&<w42hL7AigAa6BHkv;})q$cs}
z{~(9O0F42V6A$e4tiA2p>=vlWTouD$7>or8iBTh-{S#l=rfuSmQ+Ec208(1}@uoW;
z@9%=)$VM~+EDe}kDA@u1)HZAf0ITmfeZf_j>sXoqqb-V|pFaBl$$fN11|}C2BJbb7
zhhZW#sCjlDTo+8w0pV79)?{l^BQn@@?|>Jyb%3O_)oB}=!0I?)Y%FzuRml4B`H*Kr
zFq}nK(sj9MHE(&k(+((n=!K&_iXu`0D?sqt+0g%apMH!WG|9kNSZCI+pm2^3ZhV-?
zfC5<#kj9POd;5ga;dGLpH5Y$w4u%Am3I?6xhz2rV@Xh4jWl*@~^cj&?`+>Im2aV(w
z<zYH3uT#1<L=h6wAYSA!^*R_enggbhLtjk=gB!*{v8$$r3<;?Yfnk+mWHWHG!Jd>$
zpORPamTf>rzU6mx($S+pHvTjqU~4ipLrtUWo%KXyF~^{0v2!Li-LvWbnXKqH?Owhx
z*cCf67fL$mZVz2BZuif$3afznetku3;~^%YwH{H~fF^@j1=FXEEVc41!nDRH8HBCc
z1oviH!N6={12SBpAf#+~67;-6EPG0iJmVo%hxsteLHJ!7`p}hj2UggK>$yJ+#a(=I
z4ECn3A5*E5`8nzGaII^e8B9ljAqV+H`JI`z<lrRF8S?6504cCKEt#V&dvKYc{DOIk
zFqKi7Jb)*p9VE9f+CW7`1)08EB6ZF$|E`=>g-+%k5?kT2FYRzFka<oAXkeh#eB5m`
z*SqDYO_+S7)jd26L^h)-K^^4gp#NY1G2)F~1^0(iz?O)4{hwK=_mPZT^$Y-E-BH7k
zZF8x8?x&BV%Jc6Y@(T!H60vz(TkEP~4o!AdK`e++Zo<<I+T#3=oo!hy=-f+kk$0#A
z?6v+Rb_5h%(2FGts=Ia+2>rjG(1wA;b1(y!PNXViy04@NPK1U&98aUJ98)7?fVv(u
z9`TC6bPw1(aX9U8Qm0VaFhtQB&Lqje^$Oa7hc-j<8X0=&q}m)X*bI@=g~6}xuL4|8
zfk>;s-DJu0ApI(!+61{_*a7&p^Fa(Lj&&13G}l32kfvX%qVE8cd*NssQ6cvQQ7tdH
zO(2n7`D;b7r$j|NiNl|?Gj;$Bn?m|OkxxYfr^^fQbQ!RUAp07#>Mi^suddewQ9TT_
z$SGC*2rAn3VG!7n=z-RQ_nMLtj49N(3uB-~>J;S_72EF4uz~Wc#plQC_Wkz`Mjq(E
z`2_{_gSZlusRVtPZ#(Yk1|2e^*d7CT!_S||Nj|=ldkhB;2*NjHzVne7v?YjStDm3L
zH@>I}GmAy+$DeC?I8OHzEJ1JHSx`;GQGo8nO_|khI$ir0%xCJD3WedoZ*TPPVAYb3
z9D-l^GgCtY@3(id{v#vzV0!TrfxuK~k^^A8;4>EpLj(N$z~@8}?tnLieJp`clTDmn
z1ARCf8(RZ10H;A*d545#&3m?x&<_*oPJte6!~PI7!?-~+)+5v*5|SzESct$tS)T`Y
zEHaGqgJF@R7E*@r^pmN`eEc97$_%FqX|VBdJjg7e8Dj>mHvlMaA0inb`wnxIpozGz
z*u{a&6NE4<(w;p%Np2sZ1z>w6zia|?0mjY1495orU#c;M3riz4pF=<Df-~%Q@JpbP
zUpjB2)WUQNP)7ppZOl{f`C)SY=k5`lurMjV2?UuiBPTq_t^(}QgP)U~4M?<I-+MSn
z?vG8(5<!X&?Z0nlOEL;Z>6I(nL46DHn6~xNI5LSGd)~GOf+8#+&VE8=>3q*Tcur_p
zFoc_p8Vp1N{>s+Nq!mN~6Pt@%a`wwW6C!A@{dgpgLObl0bJ%E)6)o`C13>H5^ME*h
zwnUNvwX^EALkFtMJhrMC7|;kfH_UtduzuX?8>obl#;H87%02VAJ!Di!cSI1ym<D=l
zN`Hqx0*qo6VxyZh7ExGb(~8bQH&OBUJAaTzSxY@(fKg+FMz3vEeF|hvh%j_{14cH>
z1W_PhY1~sDksr$G-H#E?I*9j;f2fx4BMQ|FcI?12M2$>-7?ILCRM1BLXdm5$=--P2
zaSwm0p)Z1T?tTX~%I1d%nRGuQBNrPYZ}=gwB|-2wJvnsw2}INQv;BMOzi`uscHCG<
zFzl&H?$x}6?V5~S0ew-FgiDrGPquMTVjUZ920}IDaQLX~?NqNMFb`i4jPAZ~7s_l3
zYSc$Tl1P8rCxf3i8$dth>Aj-_{SpDfeK?rn1057Eq`kIb<)m%QPGEpg1WkGd+^j>_
zNf*+>c5QIc=ZnfIAtwX`R3AE!ke+t{gF$vAZCn_N+ijBvZ7rkF`0FZC0UT;QWAP=<
zIN=@}892LyYd4|a4F>adD<Yl`S=EtQTvxWSGQ=a^lI50<z9SRKxx7WwSuocN?5>q@
zC^GcrOMd7o1BkZ(vb>DqMR}Ok1gg_m95RUXk$xbIL-WJcdcrJw185?oJ#oTxtAZ31
zzEz6s25>Um39q2J=S{k?5Az;S2<~3`?)%gk>6d$4b@<2jT(SyCh4xn%A_Rx%w2iRK
z7nopl0S4FErP=A&+S(%hh7q#4OVE)K;hQakN$`0#P&v_Gp}xY7y&p-<zyK05VJ&H^
zSjbTCXs{X}9km4|Y;00n%c|Lg=_Z4V;C$-6UDirp{5&1DhUl4|0)b_zPL-^CHIRm<
z(trW4^g8w5h!nv<yoFW;XVC4YXHVV)3S=8p;CHB;tW?n;P;V&IQWIB}B)ozN&qq;6
zFWx+o3Ee;&g0j2%gez;NCtjsl=9SiiXA@MlJ$lsC5RK03GzKEQV3xOCrZcPR{(kXU
z|5V87#-B;p%$cBV%1L+D8@-UEQzJfhW7l^L7{3Igm<(p#d7aV8t5b~WhUs<?*b|{i
z5k{XvliFk%G2ixUUDS;V+WQuH5K5sLNK@JzOt@rgrTbCY9JEh$OqRB%$?UV`M@}yC
z4|2G#*+|YGgjYl+W&S>itf7@5<da!nc`15mV&acGLkkCtxiv{-n#l2lbQRfr$27I%
z7ElS-RTP}{8LmBx+;asQ$hD+RU`$q!BEanKhp90j9%q4JVLxxV`S90@tD@nC<4+i@
z_V-Z6*u(IFe2Y&0^XHoteT-o|0Ce>#M2R`9mH8bTsy%@rWo1H~5I8%+BMop|pq8`f
z%He`Gcl>J*dW#i@?>;uf4gdTBV$Icpn1p>M@QedeYo`n^!eOcFInlB@QWqvrPu6J$
zc`5X%v>D7oSb=fO<L*`O8%-b^1gT^M40Qwsnt)?uVX+?l^!nw?ccX2XWsy>FPT-m+
zY-yhl?yv=8ufh{P%AW+?rU8d7jETCK*DN^=o%d#2udYK=cFzA`@6DsJUc<1_=0Srb
zLjx6+dCDw9LJCR5o4GQRc`A~SjA@i9ghYmy%=1v9gv?TjLZ-|_gme9B*KU97{Bh1%
z-#KTkbH26qUv2OE{)XqdpZmV<>%Oj2Geu&fSvmc64v4j_pLac!cWLPWyD)@DpIo&P
z1ssxSoHz{%scpK1IDKtJSiJ#}U?UeXm-v=~*&y65Mtcs$Em^jwpOYE-atCQzcxs=}
zKexzW8(%mM613#(PBoXeF5t;$H7NBx1j`=-bnglAT1F+DfA&K&-cy~3OOoRi)Hq5u
zm-Li?4nmwJ$X%hEYCgR45%mHrA3lIbj3MeAT0$7jD(}-8hRH1V_bQY_{<+Ar1+6}u
zxj8yFHz-md926Lc#<F!otQ-ynn-0e|3Ai7i271-MRwXxzanrQlv9VgR!*dNhc&s~&
zIKQKx)4dlO`W8{8V_j<sV{5JKRmMExLLuNGs|H>77)ed_Xu<f`2%L5ZYJ&0FssraN
zbNi+BbFVsXc#W=1oV+`K-!U`dT+klMZX<LY2h$PYUkYKaBK=B*?94n4pw^=uZEX;&
zzHq~rUeNqrwum;Q%G73_6-1!lK10kkS~h!?BOvb-FnxH)t;0<_BzZm$vVbxcjf;}W
z1<6PQT^>EHyTe7uE<?%8@j;W*DF=rsR1njN-%y_nEmyip3k|mh8C|?vLK+V$j**is
zsoFCj<~FR%dCuI9w&qkm#>dviq)oI1y^B4`dm2eE%FZK8;=RbBi0M+xkfk4eQerRo
zsFxSm?}kDFy1#_wfJIn|5;0(7&!W5$lM@A-vPV(bozGd*&*UKe&Z_pxkMXL(qj(gQ
zm92WQ@)f6jYFGVP6Eql^|IvL+6%(?N91;1u9`VvkT`6*8m^$o))Wo72N*RnU{V`qL
zTI}zxyynVf6-r^QsH(!aP1`4ip6o@;GE%sS9FuE12O`FHT^)9<$M4OF;lsWyVs(hw
zH3hth7aa4A`^s4CTGUCa6H+qQG1!9^_eOI5LjTHKRuQk0{DYsg7Yr=hT3j))oeF8~
zPnh@JaK&k^3fX~qWUfeku20?m6kXYb?dA73U?$O!vSU9XY}$G=bk&l`!;#V>qkfoT
zFtL0?OHApCTFG9U9<+?~<~UaKc&fidBy|6rJhrRX$&`2kWT-QlBs_~0pQ|J&M-n2^
z62qQ6_t(iIzmwU$60=o_w=y4tw7&DQ3HysaFG|TXDQEaB*iD~ZTi?1O9|>Y@tFJFH
z*o;ATW;G;|wK`=Im@Rsj^He##X0wMgUwff*TG(sOf1dJc+xWF9UHP&7N^Zz*jk!%U
z6Bb)r>Mt#!O)3mcgUA$Z?Srwwn3*$x<{@^iL!Whyu@X9%v!4R5gebLrLg?gEd``W6
zd)T*AdR1X!j!BwSYiODg$7<?4@+cM;BOW_s?m{7ri)BT7G@I{UiD7w2)6m|polA?(
zHuI<}tSl)Nrs)&3yZu<AY%a=6r?&Nmw|KBDGr>&4mm|oEGUO46QlfeCG5IU==4!O-
zh$uf5)i?$c!&2L05X`>hQBh%1`yvKU8;f&K^!{wpzYgJP^SagE1F>Pr3~p}Sm^W?S
zaTtTfK_Ym_r@t{iK$Ge^atNQr(MmjZG`g$98@V33+D|KC+T5#j_<l9v3lPPk`~e%z
z*uurVSCf*zAiu`p>SXlCMz5@rEyiYDmKhnnxnF-JJbUOW)cY?LDQANborIqW%YOhV
z@jFuPS9EtzO3TVZ^uoGe;6R6Kr^`?(G3|<(W+P&`VO$c5>4f0AhPfN+Wi^SA_(1?`
z*YZynLZSM8qIz=cN=os1<UYhs<I>K#j6rJ*pG$J=^TfE?3`E33WmffzAkrdIg_F&b
zNGyXpkG@yS|C;d{b)%(Ij{B)?)&>2980s7^mz$UvU%HdHrOt8Ga6r?HQmMFx-eo6;
zWj2}cAvXcdsXB1+GI3b#<b*}h89|qg$EJIf`X?0$;p6sj22}52-#3F;6U!(^%!Yd=
z>EvhNehyV(5F`_tD_^>oMTQML?IUD7Bl8$@Yg(5vw0}ywM`)BA>&nVvSP+@TLcI*-
zz^p<BEtgiJ4Q6ghkCnD(G9BJc)-V0|)x8?yIS{YhDnU*xsVVSX7nx@fkdqM0v3>4i
z35Lvkl2MDQgDF49tLsuD<Qm0ImSssP4>9y*6iI+p*q6q2Cn``jz*4A1$q*94L`pa-
zL3a2i4j+lGrMr#o_Bc0cbb=IVNYaCM5u6TA<@(0OVcLf=azv4Lo0dyDJv4{<mja;{
zO$dc}LGfD9rAu+<6^HIxi9AxGiuCuGW!i9%DHzp_@fx~XZoiB{h4QgKEkDD<?%k4?
z&rqtDPcG+j?YWKIRy20_iK%9Pll&8Zl0Mx~XY5)@?^fVqN%GpkAK~y|ixX&d1j~cG
zt-4F~v@J4Y(59@>S=aG?sOXtiw~YW2d&A%nnHJtw$`C@~!}#+(xGIH16%)}g>YK3X
zbKpMG1=c9MX9;ty*fL#WR9mfuRFCve0&LhWvoJ>Gsk|0Qv3BtYye8E5YahqwHFhL2
znb(B!?G(CjY^K>A%LvD=)!5R-<L~B;Bus&S9HwL^GEdEI7aNtdvm|INo1b5AZ(<}B
zyo<Rh(aLiZZyGv2ts!4L)-vXO_UACJ2|f31BQx0$*=fvDA)(SSus9LCm31oYdEnxb
zJ^&h`c=71$R&Y+j;eVy;<Ip37jqBgFADhU$%WFKo1kA~4tV=qR=^E|L9fH*<hvb|U
zF!Oa{W;rR^tbb_=n%WnS>Sx2|seWx!U_V8_hvaO1oSk;2@r|$zF|UEA6=xp}n}WbZ
z#CrJ{TN=X!!M-eaCna^-%Ncw%c^NxYg*~%XNngR>JvklVRKVcbC#v-@R&oC0UTLI%
zDHIFwaTrEh;~pVo3gKO2F{W6sB{8?mORagIo$O$pEM6b^Ff7NSJtJPzSpmo{2%wP-
zuWO;*!<Wg;6pIOs?Se6NeX1QBO!iF$-^B($ceL;G8}Z3N&28V(61^+cZ*j*0fHLbm
za4PzkY4kN}Qf!)?sU@K&quv9oNV`uRKYJv5d$_x%?5~3E%1w^QinY=4ZR@8Zoj-=%
za6WIsuC6n{c+?pKhY}494FFuTX@{yo_`YGLznkijR~oe8XNU3%tfPf2!^2*uz@TjC
z=79hOKno>&)O#IVjX#g-#QSp$&qBrN`lRP1Z?}Sj*VJgIzI+bt&~A3`u1piLI*_0Z
zPaH>-goM(C6Y-e0zO^4n7Di<hQ=&NsKICVHt$T{x5(*gF8>Via9*qm9iLq4&n(eSe
z(!5pY<uy9D$DE~aW;Frak1ai?fxF7k(gwA5kUftNUBx<i-S1S-0M+hiKMs+ed}c>R
zOgK21bxyzBYOM2$(1&ha4Lh$ezp~5_mn?p2Dk>M9HuZz{?H<4K@E?q%q}yG(S;}ch
zNX-s>*s_CEaIioPa<nSz#gWCgx=7fGE+wTWdV4M%QX29al@2y5SW&K@*RmY>meqkH
zhKLP4(D0F}>E9$pmJQH%9Tv2BYFa!Ut1`5K>hh=KNEBuC=WcT&O}@WsG`|Ou3LD+r
z$M#5k#(e)rPJiE*b4z<SP~1rFi*l{IP+JB?Ca)#^6O9W?<}t|6>F2Zx2^m{I&UJ3Q
zxZ9WKbq4qz5)=JQ8=;JERaURh%neBv2q33E!R&W<sz;~Op*WwrHvjAv=#}@?$BddL
z6q-gp2^ST9<j>I}ca$e1J#o`E%JONj|M+mT8^C(xf}2G~m@ADl0z4*QAugYVNn;S*
zI&rp_ugrn15GTcL_yic(_7`@D9g54_DsgAc(#DW&JbIULn;?6ooqlpBTW;+D<mxpe
z`Ebi$aPV+WIj)9f;z4RBK0ZDah~C*sKwK61ZyUwfI=(BNCd)qtXwZ?OJekvNMgV{p
zLy~+vYKn!u7+p~v<RXj40%dyxd0=A(m8mi_+IAy8GB}KbKQ`*I;~^mL%Ju7aaDukh
zT#={svr~}4d3Bd1qNUyE&s)YI_T~>aA|ExGuJ#JEmpSm6eU|%^))JvA<hPNP>^a&(
zJ}LAd<l)dKCCWLm5UYmR7obwvp~W#om5P~bBIgY|+&{lPswEE+z=2^Rk^Hc?_<{yO
zOJsg_0QnqRTEyDx@<G!gNplcWkGGB&!~tEJPmN}~guK;J-WbP=Th)e+_OMh<r=zy}
zAuf}y$w1W*uSkcgXl|8^{y2Tz5*OkH0s3KNFd6W!)Leg@i+Ca!@DN=~sfvOE)2iLB
zJ)AGp0m9Ywlc%8=4k-p#Hzs2rUtcVFHA<;3UK{o3!vBGSx`y%^yF<eF+6X%l9y}T2
zZC?C)scmWIj$Zy$p+1)V0h7IMC-9?Z0D9Div>qBW)A6%%Vvriv=WEDLg%VpqTJ3RS
z_a4XAq<DM;xn*QDR|7+Fw(4mHV~hKdW;))Bdi7@fhn+KGtW8IDk#H!?Vq6xd<3!i|
z`>6XT5gt-&Haj6}v0L{wWzR3fs<cWSY17IXLzV#+v8mzL_Id{}=9a7h3F{jisg#nf
zA{D{pN{D!?E{NWBU~~0MShaYAqe0I_Aom+Z0ip;*xePTPKsIO(KN?wE=6p7!>i=jd
zwkZ&xDQXHK08gVIboFmuhE=wJp>L_-Lq|f$J(vs}6|N3QPOq1!T`HJ5ymjs^Grrla
zI%bs4`U#-af>EjmT)#53vQgW3`-QT|b|R2bENFX*o}@fXt_p7LZ>ZIxe)M8avk<RX
z|57iF#HyL0wowBA!k9fy0nfBe<BmFhj7FXztnX&BO69je(Bjti7;A{8yhIXP0_`4W
z!^3JW6@tktm)0J$G=_%<zWJccOq=lwHY|G#R16{uo&~5dumfAc8EVgvpN4yeS-;vj
zTycA`t20(bjg`l!M^lN1s>Yuql6}_L*{*yw-L>!6lTG}FY~wk2v4rcT-oVsEdUXp@
zoGD)eTJQShUMCm6i;<`NmT;yGGFiwssJ9q6i@1-zMs+D-fYgv3ie=MH_tpb>R+{%&
zI#@NGN7zw>ZC3fzPri%<b$g^q@}?Tq=&BY#`zi0%7a$SH7=I&^aOC&#lMK*E(#FI|
z6&%cG-xU>1ZsLMm-=P#jcu3KDT@x?A_Cj;w?d-R0w(-{8uel3r-f<jj`&PbocVIvO
zf50wi4AcdVq#o&{WukUq$+r1)#6B;@R+#+rtt(7HJ$nH<D>%#w2FTDL$$a<5HX8?T
z{ZcaBBOks@rovyirw4+e^DIh{b6rti_eBO^R25EX<<ogEv2hzK4!9?PnisBJ^~>J~
zkQv>7*z$j31wCI#NNBe2nZu^(bjHi}8yG&p)rfEC*EL<a=s0S;z&a2$1GB08?w~_f
zQVd)h+(Kdy#v`5^-6*u3CKB!ZvZ4Ke0*xRMerOJH!_Ct;IqpFqM`WoU#$kzlTd!Xn
z5E!@%$|#y4see|U;N{t|GKu!%Vox_uy5+vv>J0M<NzC0_XjI?la($OO^Xp21isMSF
zJ}V4C{YcHCSO<y)IM3F*VKVl|cSj0C4U<3sp=&U=t^+}(p}u2;{yeq-<iR@z4h7t}
zvB^zNr@*-|jPNGN<h7@w0<tGLT<FjrG_TY>nB{KNdB?yuo+sYQBvXv(GgO}lZ#?M9
z*Hn2_VPd69`PZv13F6R%pnd<+suYzNPf2Ee=L1u3`EV+ab?R{IlB?9m9%#aQD(M-Y
zJsz@SOsk7e-e7BLMD|hA1gh_Y)IoL!$Wv@L84d}}iU%_uPnDWVa}5TbTK$d{z^{Ix
zQ);&2Q6SkSd)V2l=k{)u7<<qVy*wW)j&Q?3yvb+}7aXZnAJfwYD8!g4Xdrgh^qlcF
zQh61N8KIOoNIa&Q_b9`bjI?g@K~60n`ieCuf(dgbw775mIWmA!#VjQsGg(4dzaO>%
z`i>8d$T|CAOB{?i_+mPbu>KU}KvWPLey<WQcDBGa{yEVDY2BfFydxS3r05n>!Fh$D
zu9ac5Ll;;?uxy_JUei`9AkefMK|wjjO=#n-3mIYdG#RryI;zA@93AcaOtFOTi$!bR
zPExs)4^P36ur`A(oa&5y0=o%CC}TNUS%`boYRHRHlQ5e6ltO-L9o-y78ORkw4KKs*
zKqr3aRBesX+FwQcn5)i!q&q}sJmz_s@iNXW9!Tm}wjOMLLZ}Bi6~WKp`46wm?G3@$
zQlO2;b)VTV(f3BmtZ^TINEDJ~#My0JTFqLcxFNq3K>{SUdB?o=v%<hd9FW=^)0#x-
zKjm?>sv*}ykVC8)&k|=H8hh&kMyR6+cQck_<l=Ad_}wh>0HlXUGBY*Pw@=jBja0S(
z4>0?(f^sY7rG=>n+97aHpj$lpl9@7<IHbO+AY?zgbPd?RJIvoeYQwZuPPPc>8A=&K
znx|&<)L_eNCBuJj)~~J`@?Yg;ZlN(H<_)pl$|1G>Q@g}3+8}%qqC?Y5p$<-qC?mu2
zYwU!{vc-hTnuW*aMEU0qySs5LJXV`K8+Hc%2!wwQ0KpU^v9D-Bq`hgbiHtq;{o1uv
zljZF<3BQv1(%q@tjllx;36ETk7X`JJy1Vm-!1H+zCo&$25?WChFyT2HGhK)&<<LR+
z8(T8Gw$i!V9L)!0R>Dn4NRKJcd{A~IT<y@I`jB#He_UR;glmo_)va%QC#T-V`D`M7
zjl+#1X7m+-?8m#Es=%90D;yEaWMYa1J~1a-qjUdPh?C~_<-l0EYybSz8Fmu+2l_GC
zO-Qn{53QKWOq-7<GCSz~ptv&Dy&5hZX#g7}96Gdw(o^dSMKn-Q7z*JpaEJluJb9Z?
zm^!U#1Q+7qMj#4jTUV2l7{%lv?ud#QYJ&r6t$dKlEIj{$BJ;Us5J&0&bPnL7bD00q
zgdx94f+2<5E=YIu;K-?YfYw#ll*0jrxiz-v88n-97VYKga138q>3+m;da%WqX#=cm
zB%0&r+#jH_Z+jjw5<a~rrmzDYJ&l>KF>BWcpVArFB{3DFo7)2O%7eC_E1-A^M@2{u
zj1#!8zbQey@X6dwB6h7N)$IH5BnAF+1iGFqz}bE=T<%w-%151vU|*2D{=<!U+U?sl
zMGh~i(1)fv5ee$Z#@eR`Ur!^yt!^gkzSp8wsG^&czABl5@@%ZUZZCQ25~095yJYU=
zuxi+7L3?$!;j68g&)Wkzbi-f`r$x!#y2D3UyY0Nh)&Z(ktrU(F`5z9QvbPb0U4Z+i
zUvYYb9#(=|@&gC6G(4E_I9XYuU!Y{@QE0orI<S7mZk@t(nL$IGBXPX1-Ch+u1(cGL
zBF111W%50W;*(Ozwt^53>@tWVmw`S|E9(NiB<s{HETcU&r3L+g|MVG7=)6LU0uoX?
ze(aC6xyO3yh;stQh%7PmDyl%+zx)`bSnF-aDxxnEB}DeLW+qP){+%!zR8?&x?E6yN
zBrX@YtDS0-ru-0NP4$2~SQS|yGE}O|wvn6PLdeGco<Isq!0Ck6&smL?!IBGIr)S-(
z<>;Cr0cIiJK{Uu9J&Gy&8|6|OPgWCNM3XD;Z+?rU*P_@o1bw-F@KKECwtc23GwUZy
zOB*eGJr?RN%aaOOzrj__yLuf)Bey&T=vA|ed+c&JJeBM9cMiRM8rL4aT!MTWU`|Sq
z@5_El1?32#ROq=FpISqR+5t`G@Ho=xFVUfu+5fbM&?1IFBJ~{jMiDIl8cY0(L9PPi
zCro`V4~hdR4Eu+96lx<63C~ImR(zuK<Z}6XX>U)*=3bzIja+7r`2+rWrfNEVBY6(t
zNtu%{(G-~NIm({oi%JO#7Im{#*nDTu_69;YQ+I9Jma#4`O0m+jvNOf_T^{|CB3e?)
znQ=fXgyV^eMD>{=c*XRLX=k{6wQ79i*Vu5mZZCYWCjmjiAV=-BLm70XST2@f+iDjk
zC`NZc%Ga?lzLq3$e_##e!UDI%p1~$cM$x#C;rRGutk%LV%R7T7Bl=@{zyfQ1o@?Ao
zRGfVsla59>uuK`64%&1b=69yBU0vokvRoS+Hfs5f;A7}E9dw)9ir!%rgY%iH+Yb8I
zY#ygnZB-N*4TF4xb!ZE8NC0UYTdbMNCj?oI9luYsMi(7JzabfId5^B$nUwJnWGKc0
zoygVz%c1y-P4DYNQqBogr#g)EaekTUOUA6tFK`^XUcyIK9>QsDH<XTiUzdPi);)(6
zlF2Y@!Ce9EmCY9v(z;0c`Xx4V(w%z=crZJlpYN!d;g^HIUxKF2YQ(j#=;c85$pMfR
z27|icBs7YA3ld4su_++d70Fd9^?<vhZ9u>caba#0O{VEvh6fIAL90M#^oQOj+SK)A
z=PNlU=!yXhVyCc2Ln3x{b}NviZ$PIY&eV{yZr##V+81v?x+6T`pn(ML7m#(ruN<#j
zdHxE?g_nZyd!XJXDwl{yF3zkHFCiFqNMvUnm+|pq$I`!LIDG)`EQ#la&{op2gOBD*
z(EIG)t2QG&XH9!@x8oqScryZeZ7XNJTkm!T6${THqBjND+&R3}MRb^94%Hx3_9jpV
zNX&oD{Q2NoQ(2Tk)1NOUlzHYJ7FoMZB9RBFJqT9l&t5_!&4J}{B>^%fxq0ayXplP6
zX)=&C6>6!we?hoKCY)Qht+OB}eA7}kcX?VszY@og`!`I+5>$aHwP=p+Uq<R>|3^3g
z|E~}a{@0KGdRe|4|F`fu{@3IEUyt{H3PI@qUkj=2vpK3Pq%8+Pr%L!I(*&K0{L?So
zb*lgAFCzyGdY0Y%Rpdhsw<0^wKOi8$&ktt>@9w^JU~&EM{j>gb0ys!$Xm-i}KgsL*
z|M+Wr@FMRW>P(cAl@AVrZU6!=f1fGp4|HI&zcoq`%DV?L0GTY4V){+4yOl{#0`CJ^
zf+O1R@3YL}mIgbC&W`=|rZ{7?k@1ab#gFg}kckwq*MwC6)!l#Sb}uyplYw=y5-{$x
z=2ZnVtdj({3BqdwGXbsKvFs5b&4s;&eaqi3-;R|$rGJVIYC!Lm5?J=`B}nc592PwI
zD_FEV_{H<HYwcDbZU+YD3o`KnMAaV2sOyEI-P8!zRp2yiK249^3?ZK1biY@Ad4q4C
zcB8UOF&{*-M6j4B3VV8bKm|4r3pWS<0f2d{3x4PDuX+iqSd@xHl#!@9z};0>fMf5r
z%x6}380;L|dCy*DjKz2dh`-CO{aL$qOyp)omzVAE4+Xbb@+)iv2pWB?8c16u3*WR;
zo5N9ya7jv*pe>{Y-M3|bHpM=l&$uudF!(|GYAkJ01n$WjpiBUsK&b_Y-fFP=g$tax
zFZkX3Lux#>8R`Y6TTsBJaDj|VKrHt)32dC}E>WmH4-KWq9l>1ZAHw9VT{j3I7<YeE
zPR=ZVkuBB84m!R-0L%@Lf!$MoM{p=T|Gg;rZUtg(EPPQ%hLsX@2eqF04G^oU{>MK|
z=vJWg$0N*%D$+_n>yZOsPc|l=QbwQS*nhtfe+b!sI?Ge~ZXkg{k+apuKM`LWPD4=I
zSN&mn=4~Nqh-mU`Ztm^{`z~hnlaJ9*WL&oD&kFP1V7uQXw7C*>l9FHiQqn^ZF4pqX
z5ya_#Z=fPFuaQ{=^eyd3g1LqZ49{PNN3!LgP9fg%NJTIzQQc355|)C5LhCf@vcLa7
z`9<)^^7nuT@p%kOAlQYcCLll&qGbP&No~2vhF}C6R0f8L+8Zk<__sTt+*r2m&tBRh
z++Dr=zyE?C`M*eA6%DW@45U$-%dIwKBBQ)`%z*2IXmOe7zwFn#^FKXIz}i4ZX%q{Q
zkScB+!we1vZr&3*7jX6fhVplywWIB3N6Si#uoERlN#M?*=W3=ep#cqNba4LK;nG1b
zT2P@?-Pj2dYUc^?R|zV7vI!6(I2)b4e0A|0RNrlByQ>Ka_A%yPkIKfESbZJao9ITc
z)Y0r;-<P00FwuQeYE9jjp9F4TFrn+;fE-^kob%pcnh>$Te@z!&h+-!H4-r_TqJ_Xm
ziY|_y-_Cj}Ru+_22T3jPfk=9nj6n1uhHYFQe+tNhNpBQ6>hoaGp%Gqf+d3RWe@MSD
zeYG<MmC0i=Ej{u0)Llu7R?f^)hBrFpkn#OP9QKgWA%J%F8)a-~WC1P9M89AM$&~OT
zXb9hgPJwIzfaL#tL|Vi)eo4rz(GZBG#Yv!-wdmSHFi_a8=Ov0a-44eIS+4X6$Vw^B
zPXb2%`{$%XZChYO%YXa2MqQLdAs`c$H!UmP*g}%Oz9tgwh5zA?ryJyVhxtt<D(L|L
zzuRZ-;RN%WYhfbZd7jWd`$LuXyx_;dg}^oZ%0Bz>p-l{8%}Nj8a-9viNQ9?SP=-#5
zk5?Fgq<|9wOb{-;A`wtCQ`UKLJD|%aRtNpzF$~E-??M|bnsE59Zno06woZy*l!C7M
zu#jrO8RtY)fxXP*zkm0ue==HrV?Fs=va*JTJsA9|sbKq5)dJ#0%jwpWrtD%F8S>7Y
z#%7fcwvbON1}Z^8%W3Mg84uPEYQXXdA)rzV9lFLq!fGL8#T`$8+m(E>C%aA0{^ClP
z*}rMsFUcXRKiXC?;F&QoffIA5-t;Nx0<HTAC)L)BKtQ@v0X!wV^N-|bgb3{HbJf>d
z%iUBls=+&djgACjHVBG_HZy>etFYolXLn)G{w9sD<0li|JH)%esF466v_qo|cC!HW
z-e-QvH+BjS&X;R3qq<jT9@uAt`7P|b(%$>pDICn`+c!C7M(9FI9RP|U7qxCO;o*g~
zfoRey9R;$MTSn`>pr1Pb+Vr;ZK?DoWMqk&T`*ltE(qHS5SRkMqzJ2?ac`q^W1jS2u
zYn0#(5~A`MAQm7_YaI%gxrSL8I9&rBE7N)yVDT<%fH;VBu6{PbH}6-tm);6~pD_SI
z<B@H;3W)tFt7GkZ{is<E?B5?YuuON7&!Cdvh-y7Nd{Fx&9jRdLh7toG+9FI2-Baf#
z)JlId?VtH^G;9YCP0-?jDq11K>M=)F2j9s)ETsn6?BJn<PrFFr(0Ce6)zm!?Osw`=
z<b5|-j<u>8YCV3(N1bp1{G_%fF=b>1m=ZBN&{!{_ia|YCy-`m-HPCqyrw4|?P<pr}
z&?43Pn!UMy@8WZnEoK8g3)oB+ElDl#5v$#M1S3SxzJMo}ZakftZ~0z`cw=j#yBd#=
z;hd|H?P3yh`f7S&fN9M}`m+ZP($48^Lo5&*1o)A&Sy8k1JTZXq4-T-W@H2ZqW*(v>
z-3mmj*)UfJA_9;vGX=UCw0k2`2O4Z4Lq;QB2g;Yl0ciIrC?u&R1PQ9gD+D9-hWU*>
z+DQ^K1|2lTz<eG6?h(yijlX}OrZb;l^U`wb%qsc<ActU_1*pv6@DK{~snlwU2ySSK
zn{3|JwS^Skcz&pML7*ky-h}_Q$MjGe_^4+B98<%Qr{zS6JjKV5rJQ-sZ(A8EM0R*V
zELh8@LWB0=aitln-TxkXz>~w6!ESsFu$gO%=Nkz*aY9~OnT`~5@+j7Gos!|<PTskk
zhV#1Bz?d#rHcL0V;u3RnpvF}Fj<KXZFG;_&Bqz(NW3I;$ypFppZ_wpc*6g+V&mHF3
zEgmA>$H_oMk)G|^d+vgSe)a%<hoJI4hCiJ9+yDzM1eCJYBy~mH5BjYp_&M<0tr%ph
zMw=3DW=mXt5|xh($;(mT$*H(C?rb7$m>2sK&fDop?~E|c!t&<ribBFW#Q3v=?KCkL
zs)n-?+l(Cc@~T*0QZl*mylw?o?uYZl_k#e3@2BkR;8a~-8N7{KM+DMUt)+6WX3&WZ
zb^Ph|^m~RxTBtIZQ@=!fR%4*N?W>=?&L&3jx8bUdghD!=lvE}`k*6JEN@*MQ+dP5x
zyJnk46)?C$TzZVH5gX=$2tI@R&`V4*2`b*+nNLevOUd{FfO3C;sXgI^bLF3`q<tp|
z4F({!(b=!z$7GQM)*goWwmoRnjK*z{ldjlhpP_32Q9M(yp73yano|lS5Y}F*FVxYW
zgAGY8x&+$RclP>MDiyuka^;hj4k4I>=b(qVxbGrRUH^0N-zw(W@Bj~J#jAG&D^!>|
z$aX(^ehM?2mNhlnf^}%9%fXO<rDe=Cc9gD_`b2m!o^N)e(lr(VG6ppsB|o|$_7dR)
z3>9-r9&mFYYM(m&(nu#D83hL$naCg|>!`3O2r~zQU}$Kq0|n#>EQW`dkwl*(76bgP
zTR9dUp>wm@nNF+@!szEy0|Ns$N(2q|BYfmOz9(biaD}rxuaU(S!!YoCQv3mWR?5uY
ztRV59oxAJg?`StVwt+Qp$}N%l3&KGznnmDv69{eVG4Q&3Ufqq0jTLBt!Z|Sk=*N3T
zpU&+wVXEO%AdH4wC)Vi02*Q}_$9A%kJwF+oiYYK0Fd>E1^xqdmL(*EpD-LEo^%*xI
zdu{P4^cnf-LScPXJ2=~#a>on@fHBhzB%H8<dZ9(60jEd5NgBS~Vxd6F188i_v=T=f
zoON!0FJna8lj%ak?Naa+yR>!gaqGGeWV$-5mLzqAMGiERLir2`n-jOkD4m88SR3O(
zK3f94S5SK;+FnIy$JqNe5t8%x0LEHH&|O38ug#_MO{~S@*UUE)mDj`m6Sf1B;UM0u
z^e84+j1Qw-3DX8fsVAogB~#J(B4p?hcT!f1Rb}f1hg74v54yUU#f{C4s6+T|{av0A
zelIKJFm>Hgb1jk_IGBjM0YO73Vpq39mLf`)6lO)@-1~B?6{9AnGqDTRf4oE-A^H?U
zQ!NU6-1NjU7SV|$rpS(~VRc4xD@UPqYQIfBMmWy=#Gyek;`QOt5ne(<Ny~z5j0Nk6
z*YMYo4C(*P*$N?7(FYj3kdAkXqVqC(J0nm}C5$tA{IsspwxLpNIjLbvgJ7&x4-G^M
z4`Ny^!5uGN@z}9r=neV#K?F5tvqkM7lNCr!S)*x>y&z~SI=fYp%N4UqNG@Hv%9e9!
zL|B3W0@T@@ar&k)#%|R!`vyKMWOe=YP2-$v)y=hv4BJreiBwch4G+KqRwFhVZ3?-e
z*&!pB999m_ol!&8Gst0C3f^&6VRnN@>lyc}id56+&n|$Ig2AqL<Nzom%YkC%_<n*s
z{@?fJmpo=hSY0$-IpHYKm$$V;v1shshSnWKC({blX~C1|AK#NPwvesBlP!Q$eP%=?
zcRv!J^p8*LV*@b0IJG}SCswTwEHA=2ZO0-%i8i|)e_%SyjcFuAq=>K$Kfb&L3ofCf
z<$<x<RdORzw=BIjb0ogT7FW5m@HWGV;jiqP3$<s)-UuYPHGuw}Lcuj0&#d%U^e@{>
zzR#(-Rb+`m5g(;t5j!O?|9-#}Gas26NlwOZqAU-5ZDzr_AdOk1)L=6<Mi8Z=Pibm8
zXhQKocZ}g+V|;g_Nmk8Q>i%8c4+Lp`yst1r{{xxe?(EG>sLC*_nJh>QvTxn5fZff~
z(kb0Ky&VR5v_pjpsAGuBog&EY%>*M#NK_2dPv}KEu6*p)^bAKdM1-Z)h%_$3=D^>H
z7T9V)Kd#iA!lTA(ZUJ|G78$TszFqwE*6cvja<Jvj4~Gt}c8s~lgmc>+j!BrrOFXnC
z+uxi8!G12R7@n^*G=%BIlQ^%nl$+^!y9hf@Tf)9bh7GE7?4W*b((MC3XD|GGI5*Yz
zUisE;QgGcoAu*9PQ&2)|0_Q2&XinDQ2W*0l%va+E9n)f;VeH|i=8i3wT?WA<=8aGm
zg(KMr<Meu`fyNgXszbTYW91aE!MyL*;8%S$G0~fWfu}>bF+q0WMcCij(`MUV@^c@`
zWNP>yJ>H^fHQ<t@TJs?cnz%2K0z0y{bRc8OSSVqg)jrv}ld(0K^yVF-p#;lgPt~HZ
z6A5TN%Dqa^tL`6OD>J}^c5GSzSoj)Aox)AcC<g@{F$p$l<?)~8E54Jo7+aC?aXs(w
z{PF%A2+h~v<w!w3Hk0kJ95M4Z6vR49OSgHOS?lN{iOCv%<0iIn7f|^Hra`?8KOrLX
z*YdiWS4|6ADmU7U6y^xpSgI5XCmb;~IUp%7oDHr$(;V_NNBMgV^CpkB($SGJjZf&x
zf;U<FSj}OrMR5^qRqBkX>j<gx-%(``IYW81p!?$Gj(9kgvbRK7nkM1&3ok%24^fZW
z)~hID;R2>8ckkQ60<!Q&g-?)*jlw?bU2Hd0Gjb5MAZv~`eU8u?O&%U%d`g6eN4DUv
z^|jnK*pYqr5RaxV_)t$iwlIr|en((zYbNOCLXokfmm{mt*!m8uG2w_6pS!zJuUN^2
zj7WK<?Q52U8>&Xt6HE{!wQVt1=<5q-2m9%N_a_n|4x!`B_LC^&Pz?;=o(y}ub;<Y2
z3lu6;=;>=0g3KyDYdjJ=i~>yE_7x60%bYdb&s<(h$A`B&D2(-b<K~1TY`**tSHE`i
zt~>-Dbrmdap@<cy6~KsZ(!HTzh7E&F=bwmR99{sL`;>L2;8<3Ru5(BHFj~f>Pz0S}
zgvWU9&p%z{9Q+@H5|#V}M??LEXJLP5brtHZFDfe+G51MW(aa|mp{Goki{Yk}fE`Dy
zXx7DSAACGU?{n*#3#}G1k5@pBb{V&Vb1|#%u>+M^sVdYuFzDCZOibP#c<|FR`Onbs
zB_E1GqW*%faO0vUZ5;;g{=#K0$toyRBlMltn6n#`xjp%xN6<@!lm(t<Rm1`Y^#i8W
zg!9M0)5?0c?%c@$vk3?dF~(&~ZTHhC>CX_dIFqQTrk|1IVHh3%o5}v4m`47eidy%X
z>JYtFW9nsPlh9QdUC4u~gP`{9ZU-TIY~-fg5!DYwAw8!Rdeg(c5#?m^=_j#O-u4`1
z6fjYkHpER_{D|&2!Q%zTWANkqObkz*qIrl}cukkXa5!~A1`OkA6Fe$qeedo3#&9;(
z)Zd`|)TXXccnP@TQfcwzGV7$dP7$t12bG71+mpXa7+P<+wby@RyW-*d7c^I7tZLr9
z&UX(5#Y>IHU-u_(t7c8ks>#qQm{EHFqqAq%1drLCX4<;~qkWg6C11@%*;}uW5dAJ7
z+(*lyp;WWs3lr(S`GxfjK9M^vRn4Y1_&BcVx$b=PvhOuR>e*p%A#xk4X})Y5Uzh6Z
zQ6^R5?Y-J6QGd|)Tv@5qBAv(<-!QMedvu-`^;9=BJaq`m7`%5bG!V1R7r;y&fA1-+
zn)uLSZ`+EabmB>#WVw&WM4e{<IVVNkps3x%rP9XGA|+=w>>if;>h(w^{r9r5BKoG|
zVHv$hoQ;i)jB4ywujGW^n~M_FN)-_Pe_S6cExUTQpnPe?wqy(gWytz!deSk~tTSdI
zEv((VK7h1FcAq$9fJtcJ`XFVoORcZ#T3aPgMt!k7ls)_*)3T58==~_mu}sC24ByjD
zk|`yVG?QCXMD1k^?szeE>&xz0@9}BegKB&^)oj?qpfA@)R$YsGI%o3u?wC&S#kjzW
z7XsP#iyRpLx_=bZ((S1_pFHyO^Wmh$<U#L?+?5tA_z%~fW_~#tS$uZKWT(m8gID~<
zN@)<qfpcl^62)F)ztU27U~GImp|^E<>mprWroZV9uJ+w$bdl+K|1qVc#>phgo@%Dt
zma-*=`MJ|SQsRz=qy<&fitmcx%M4<<q2u0B{qc#$uvq!iCr=fO9Q@f&`5rlR+gf>|
z^!Tbf6};{DMdBwWQeB^&3%n#9(BE&WxqnI2!@~nP@cj8X6K87WJy*u7!j=xsY(44X
z^L6*3bFxT|R;*ajLtNc)8ylPL_S#%q>;z{ssh*lu*IzU`w(EKSx{aTT+D^O-jt`zr
z-~Hx_y|n03;48xzAG>F*^R1U2>?L{JK5iqIYLc*C=-i&JSLQ9-D-*W{#}+v}e>2<b
zuh_Ev7A(1B$Omc}zn{7EEv&Ko$%Oc%{+IlTXTyolsUHVk*Fnjxw3xQ#{Qb~w)vxzB
zj#@XqZZY9_bC~ocQYeg5ByCq|Z<J$H5t1<%#;7r|{Ac#!HlKeyGRqVvfAmv6b$!37
z@L781^}YW6a?GSfGm|mBCBKPXllp6pxN=Nv>Gj`oIR897!>i?XMt51Prw0Y2ykGdR
zm`NSF9eTR=#|uR+PR?Dsb|ut>@1zgjHXeR|qrqDhvacR1>G~#ocGEqM>kYSYn=MHs
zADv?5u(A0iCid@Lev@49v!3V8=FKOZlriYE*}V5TJ^MY5Si0)qb9XiK6%-Zk=B|5X
zt3swfDsShhBii#~-;993$fjudbL(UiSoLLDHZEM=c)hagT->v*YNFiq1{-h#-gZWB
z4K>I`#l?pl2eS|@XJ;>JGVM$FbqCw+)bYYt%K2PQe%o;J^qQ)D?)CW`N2^A)o#hhD
z@erP0x09PXl7H~R!TlsNGc%;=0A*LLQAWLG^|6Rec*`B;hdO+LK|Sm8?NDk|cjw;X
z*ryOPRdhwzS}(-B#X@pZK=)_bz*FA;e9z(wXY#Y>&qFvh&l?!5d|hz)dq&FE^K-xM
z>MDGg^ANMX+p0`ybE|n!@m-!0*?8;5`){%drq)LED}P_jVuvR!E(an<x!Ku(Oxe?d
z<m@*7ey~XVCMf;=FBZN&Bgb}+g-7Rk|7@NskGNZE>PCaIe_lmx>0ORxrN}q;AFam(
zvytBxY9G57ykh6C+tJ*AxY74mih4qnMfs5{Cy(S^*kd3bqeE4!Lf#nR&PCe8#s=#g
zV<#sklxKJLA5q#~O@sYbcRQKRnuD}%&5J&R17`!jN?yEUvgTkVbu~@HhTiJ*SN=Nj
z@$u+*ZSW$d=@D(%WQb+NcQW7qxcXwoxt*0SpN-z{&S}-S&Uc!XB+GM;<M{y&yVa1j
z7&p#BHUa<@pL%uV=i=kDn`Y&=qj{ndmG3}pVAxep_2V7Qzn95bt!{2Uh#SLVgtZQj
z;<ZrDU(aU`DTo^b|CgtjCWZysn2ukXZwM&j{vIx1@oH3u@88RfB`z1$*y`?nj2z#^
zZPF6A>3gY~=GtIGK>q{{M+g^5lJ$W1%4>Xg{&}h=XnQF>6kTenu1*4!HzB$A02bjn
zhYImtc24Q-^zo+kd1f)syhkNAbjM%Y{&S1{T%o#T%yWZf_W_>k5U0^(st|}F)>UYN
z&N<m@EbQ-dM*ANKr{#_sL~VabfBg5;8M2F4VTBv$vQkf@S6lZ!#+E(ju+QXWu(@<V
znbJ#|t#^~YzDxB<O^vL|K16l=o%Z(1J-=UM%4^~Y5jcpE(e!8m^?C81i?Bw6{5iOq
zv3S0(&eC!2^R$wqVW>0R?{`R>zXOBt-rg_Vf7IQ&b>Y{Fsk3Ww?ov@yd`;b#Cd-zU
zdoWP?NIsKGjLvo;&5-1*tSp?whskKi?f!FLJsb0@zdDm|iNt4gK77Ml%pm0)X7}RX
z8`JI~dZwXnge3K!4~3@cyx<5fo~O*o$`T*26;xx`{-xvh#>$W*!;txU%oJuLs((L<
ziU++(34@17`QIZsDlh)NsCFh2sx9X0jjgHLSoclWh;@I*zK8v8XTHB0d*RHWg^{J>
zx5iD?GzR<rd0acIY4+}5C2fpjHs&DlnN{B`bT>D!a9ymn{OgY*F5FHAt=@nYieNJL
z*YTbB`2kTGGHkiVc=_$Tsi>Z)IDMVC?d28MRy$u*_wV-;ABAATdDc%0F`QKA!+*bv
zXIt;3c3O{qzB5``Z1TzP-6r~f-ylAMu}wx9GZY-y7-qjVhO`~c_&2-NnH2uVEkC5l
zl^^l`5q0g_DKdTcy5I3IK*yHN=??$T$c2Y0ar0Qpyq*`+3x6pJ|4QA|H5(0X{a(*G
zFI&F0XYM7jC_lJ`Er898Ezn-w(tYb~Qj7ULPTd204u<``0a|<61qB@;D{_m2l9KYz
zyF-AiCdC~2?z24XR`Qr^uh-R=2YWwooKEs=C|~~UKQA7L#w`wO>;Js>?~?0nIaIUi
zTsNKWTV;2Zx033w6)Ap^x2O8eo0I=OaXB)(_{%^YxqWQb66;<LeQu0()aIsnNq_S9
z#?kH}tVcC8G(am2{(WD^Hs47eQ+gGQUAA*)gtBhoI1?#w{MtW}8w(7==__4b=hM@9
z|J)ZgXiR)t>O4Jj@!V$Li$i)FC&@DZE`B&kVNNB#pulbymD<nUa>t;DT`hU_QTBT#
z+#MD4+r`dLy`MQB>df%_h6;2b{SKG+1Yk($mi~FMM4VJ*rHm}P$~W<%;z?d=cJR54
zH2;3;oDTFrN>KF!5%}|=SKIBp{eJ#l0;}_glt14=x4IP{THjUkUZ?oI8gz*^+lLPy
z2x#Qqy?uz32Z%^Xl^L9T<NeIpz#9Dw&I9VM9Dg0hj`<Xnl+L!ca85!HN&0ueo+hgX
z4=uj+<I6B?XUER?b8Mu%rg0G!6LT8*p!t!d!tiHs>!HuDZZ`MWk`(RU>B%=y8f<aC
zk%%5Kzc(tP2Z#*q?d_nFDE|2vR&45=5p(6siIySW!&y21{Q#u#&S+}FCiK{!4<Ohi
zEz5U_63y3oYAjLtGD%+u+pC+%Z~h6sWW8c@Gc!?OH<zNf-1Yu>4(8ZpPxN*29@QW(
zboBI4JlB*>uIst_dtcD@vU70_L%V=p9@gFW{+tfj8iUjBX9GEPv%himD#Qs`^M^MI
zUy1m(o%;TsIQ6QJp66BNvV{0V_xw(69P<loq#c7_K*^)}&MQcGW*{9#C}70o`hDLp
z>7S?FcDwkwI(6e7b}{wu^R2q{%o|GG-p9Z7GHBA1Wz&;Q*rOGZ<@sq1+npQgQZ!nd
zo^1{OG-%q=)TepzS@*3xmc6zElyvbbBX3<FX}%V!)y{6uA3e5@#~t#U|E^U)73X%{
zfJglOgX_Q9pn*?J0%&HevgSe8f=#&SI@$@om1oh2rSLvtb@BM1V$T8zaANtX>xub9
z9+R}Y5>5MYSx!#QFLjX|$rUxfBFqz=cvfcyks!W<)5-ZRJWMG&B%hke$OoD=rWiGS
zNe$02&32oK5uWl~QLCSEx+PC8xw2NPCOnruc*%N8TG5jD=WlU`cQ5UUjF$YhqZ2g?
zt)4U*S+qQHo~~m)U2#C<Q`b4>@$~ZBO?3M0Tz8rOx+`F32D^Y9E90&>`{C<DI<eCH
z=|FwV%5QABMtiuq$>^7aS0ahJv$OeOH}uyCG6qEUAVBbHFnQJ5wE-U1W@ZDuz59~~
zefVJLeM-vyOJK@Yey^X$hC$EZ;$(Vm2#4vbfdFCNqt^rJQ)ecl5#ok@JOI$jyOx_U
zSCuG}yQJoW9^~Y{VUGAxEoj}aB(OW^+`ctO50th&wEbAbJ-tI<f-<P~;^*Dpirn7p
zZOA<mU%mXc-}xV(O>9zPm5b*RL)iMR%$U86keWZQ#P`?gLB&+rK%{VNcdvPS2Llgv
z-GadcCUJ2cD_5Fb7C`GVBDKiq;_l2paY8{s0dr>Q>q}3?#KdHTZ;tV7ZEZy$1hRJH
z=FO0u&2BN~{Q+yY(9^U2et|v9@-w`2@(VlN@2}7IKc?z350SC#;raoY+P))c8!nji
zEym^BYoAkEKiFcuZA;jLhJbVq5xwjk*@lOv>BTP(dVXPk>}wd09AtBl^4lrfn<pD2
zyWa*LSGzK~K#|KNM^Q+_F#V!pX*A+d(dBt*j}_$p_c8XQmb<-qb+*6r70zlJ&<Cy$
z4!3uePh2tHl4D?C;B|Xl^3&{W?{5zzTs5qe*J?!_a;|G=pyFy+BgMtVg?U77;p9tG
z{kM~oIUXfrwm9S7a$jl}575l3@9YqF{=s-Y7Z#%T_n*J=>%dhbKcfz&T*37Eo_(6i
zQ#%!<>WH-{B<;R=?x$Bl!aKcFuzVAXNnf($qL#+>$gbrZ86_1u8b8*3WE57o$LUrj
zb!?J~x?-U1#QRfdY3tG^{8$=UioV!FNB-euaH}lQ@PvezdcNb#@&@P12dnAZ!cS<G
zGp|3PveZ*1oc%kvwDt~yzaDx5))d^MCTm!m(6Hp&cuoO3)Y0DFYsaS(k3T#J8XFq}
z^y5#u0|H3E?TE$Y1|*-&PwMWxob|h}S3iRZ_SjL#l^6zx?*3gFjEszg&DGHyl|6IB
zJYwdMh?tn}`1d6q!GVp<i3TAz`5scxvS%UcSzfT@;<QWc{E=|~<KYLb*58{HYHv}+
z4Nr<ZR7}np7CdxQm33VCQq3$|VqER<o5{x&g7f`M!#_Pe_hyXTe~)yOyT`n7O0$21
z6N7lz_y&?`p!;%%iZ>7Y?>!7XU8Gh;zWD9o`ahW)H;Iahis)sa^#OJhXR+XuCr`i~
zc+Tr!W0U7NMCg>+9EwYbX~zOce**XuLbDEbs*&6cV8Z2VJ_)>W<AqoBK{>(Q<xM$O
z9Xsgh=^w5sJ-c`B-g=gXg8~BExW*Z^)RyPnaL$Px1<%TGTD`uqt<4#bq9XbSc{ZP*
z5L8@LwD>~pK;_1N5_SrYYf52!Yo8l71r>*n${H!1@tioNqV%LOsV(UGjfjrCnIfCp
zv3U|s&q4-DoxEjS=OwsLC2bShwCmvcfh2vKl}b^PI~(_Z%UtRo&=;~wR!tQfR93Eg
zt+9}CWim)#*iycAv1EGpN$WEzrk)eWk8##m4qs1Qd(x$g{AEje8f~h&{(0^*Z-*;8
zOtg;puDx2VnWk+|d*yvGsZ+!9eYRO!j7jwJ*BYtC^PHS<eteZE!hY3RNFes_SBE#>
z5pN1x+fd(w@|Q1PMoq}O5gXt}n-98e-A;Ja5Lq$WklpeXz;bmp#g~=2<%KF)Pt(&w
zMQmeDmrc)snDBLYI5jo(>H5PhyYxNZqo2No>l4hNG~{{_Na<*ne;XUGN-7n7wso|#
zlqZ>|e5DA6X;CC!u(W)!xEgc57%7<=AHO~9JMgR4)6RcZ_|_}oG~LdD4)?JkjfBHY
zYWL*d=xpno-NeAR2HiC?pZ7N+gxsmP-mqK~@ve+_7;atZI730RyLerdr0vcNopD;E
zEkRS9oFyrRgB5{oPy6R-o+`A&y>p$tml(KYw`RoOXZh&FI3>H@k?H+kaFVR5V%Phw
z!XbBQVWj(tmt^Lf$)ycurio|r*`ro0RPX!utl$V;U$N3^lBd-p@6zPsyLYLTp13b9
z=FPviPD=jt{5H2<5$ld+;_Usj@1Vs@>Fj+~It%#>+m3xKEYPx}x28I^)^z>wsc6TT
z6|U4K>!00*%JsF>Wd{$;QK01i<kKGz!uIuqMhojUf0WPbQ|+9btlp;Y6-WV;eQ`2X
zQj7cTjw?P!7Uw_z3`Ta>b%J?Dqn@;^prSu@*zkO$%XH*}2gOz&-8;fPP=XloNL`<^
z9Ui5KxBJ|jW^+it<cIL66t&5RbG~k+mpA$6I61kGNYQSK+hU=$&4!D$PE@wYsw3@G
zp)zU$^+P!6+?Tf<H0n?cX5;v*SMnK$=Q#c6d(~n3?#%Blyn8A<*DG&+@r_$o#rF?`
zJp0`xomL1aH4_-m?WU;SYEs#O8k1qkesS0GJ4RBA2My{x#imc21YSj9+%fK6KDqLS
z)bCS@%Z}hmJUfFX?tVq<wHHjla;5j;jfcc2RWO3_kwzP51b|rLbOMfBzh=TqxCE)i
z80!Z|Tib@B8Sl-PE?qiDdE^11xkyQQ)1F7v_1gs-8{Y6wHm1y*p=n{<K)O1UWy3qg
zfH7juC*=(<27LPuLdI}vx9a!#c{nT6MAUEiwjWB6zbflgoxSyU^o5h|hxEToH8H)M
zR5!x<ZRgbXcVIt7mD=sJb`-Yi^vahOZ2ytJ+tpY36o3Zi(zz3Td9RwN?<w50DA~L@
zX>~Y`ymbv*<9Loaa&`5D>GQ}k{K)C$`QSzywP!+{iORD6pg3FVq<r*4>5?C-y9~nZ
zm(FT#DAiuf7>y3U`7ZXfMYTSUhR(E~MylBK<_97hyq?8*x}EEiy6HPGcl>0-P+@Pf
zU{WQ$<?qU6$ZoY+JKP4ZHv$7U92mYDjFgR$VSGec=Z!G386=OPcjmqg2Nb@Y#PLvH
zR#!)`Arr-2rdTnnoQUdbWo-PrfE_0kYm6W<64F8{|FmY)j%z~7%E|<u(?XiZs+87f
znMUJqxg!ThGO+h*bFs0r6MZDz=10KLGGvu@{epaMaX8PoGn44)V#fU?S6)AxJ~bjW
z`(+_PD>*q%`s}?}^XVO?I7eILrTNl#Sa-724d$CqWND6HjH9M%OOdnqU|F9yaJT+#
zp2N`c%?y%Smp>`2V%kSrd3a{%%1K+&!ZO49WqJ-$dtxt$wzPW*TC|-g4cr^Vp?t`}
z!C|843Q1gTdZwJoqD@`*dy>`-t&2ajycq5~Hg+ck2M?yq>A9^j{MPC7ee~aojN@vM
zO%%j9jm<sQ3RpEKQdOQsWBb{&XDS{`rjiM&tlLUTN-o~q&=xM{$e#1eY4a|XRK9>}
z^c!2|Z#`tbyfFf$ZFgTEOLE!@`(!=c>HVJwjtU+B6vIJTLF?GG+}zw0_TVkNbaZsP
zEYQf$m|}lRs5sVBSyxeS-HOxr;LqyH{yxVl-I2A|NGXrzu8fiFOB?1ctkvexnRKih
z@=T4M8uTh03oA?Pahcv3+n6yuZxc0;N!R6sMWlR5=fxp|jk%wgOAoL9@nc@2c5}n{
zrvTHZyhj(V--wpqXYRMlb0NCGrdGjiq_gW&oPY^?Y`nXQ(&}lilvBxdP3adK=nh54
zEV9<r)m>R?;17NB&}6{Nr*B>)Pvx9&)<FG}fG_sEm8QR+8t{^_yHHOplR>}sfTFbr
zV0ZM>8<N3$iCy8QRifjl>Q!7^oRGjWnAh>>_+9YApE_djJ@Jf|7MK$n4pfI9K&HU|
z1i)5weS%v^9!aR`KG}Sp*WFQ1;+)XSw==TcbJb+3-6SbfTt`<IL4e&~>*0;O5#H0c
zUa$GG@h6gUQ6^fZhn>GIzY!Sg193N@HHz=QG4SZkc;9-|x#Mn<maYVedxJn|sbSdc
zW9mSoP_1ZxTAuOOm6kz+94mPAz8NTmS9^NK-rXsrv0%h~)9blrTEq_NXC6ThN__n&
zBCc=T?R|=EaKP*HlEz}-nzJoDI|ZU${Op%1&eNd0-{v;1vRC=MU%=555%ZGkOXdYC
zMqhDU+Oowzh@1O+{g<XIUW+eEDJOUP{0kX8l+e@DOR`{TO<TGjw_X<lWS+~{y$=H)
z>hZ-dHQPC+pIxorccD63s`QI_DTQ||C<FZ~rWHy*uO`l*xHyBOwvAUMuyMD$JvB+S
z|1qYzhqi@Ki84I?<nlz%`U=Y7y(HvHUSh_NV6pZ&s|>>w)mHxmxt?wL?9NM?rpCR?
z!?Q+TnsHbR8FOh#Z3yswZYo%IsN*Sh>9)+*F?Shbmp?GU-JZ(I$Z)cAs=PrdHNv<n
z;i{%wBCVmjYMHuV`ROFp>Ep*zzI3x)3^zU(s9tKN<X-Ubz(w(eHJjzU#4qhqcF}1O
zkL*9)dvZv~uSC&ZCqOsGH`+q@0*#z_;KANS_e&d3C;%}{xwyW;xblJb+tRmt4YGb`
z_ZMz+EOXV&Q*j)W2Ay8t`MjP>{S`2xO>chhpB?YcNIHGp+xyeZa>u7;=)Tx_&D}_Q
z3#2@M%7C`8kuz`{><d(Dj~+jU*zt19vscj~2~l_KL_;^A1k1E#+qfRxi`?ZJLdG@p
z4YxzZ{y{i6Hu~4kHh*I%eEarY)KuPM8S&4-=f<nApE$i+hK570arC(Ftd8O|kJF1P
zy<(9=tfw-j1oho*O}`rUNw(<IO6M{bH;wYE#(a&_i|#-n)tz**(uZP`>y91z$;uL0
zY(sjB$4!fj-#)8Yvzfu8AUk{7Z<2Ja`y8dr^_!{;Y$Wb^@iJ-B*z@vs(KP#yMG;FM
z-mK;d{Bv&V+O58G=MF^bz4!zj`c*VtB+?_HU$g86ltLdY<|WF!QSr%g7-~IXU%+s!
z52~WEWYHTcSGh4Y^Wp#p2S;s{j#k%GLF<pZEEVptQqj<$hAn|lA*~xALk@qDRxrl7
zf(TU<C}=GFIEwMyy<%H`0adZ8t26I$2$XaUTNoHL<y#0xGQ_AN!JyMWWB$HG%~U6e
zUjCV9MOzkc#g)zs#mo1uRg@I*@}0?;lD|>&(BSOpjJ(UdSLW8fFpYHgmEFh2(|M)8
ztLv)JZpYF1?^m|XmG~+rsew$i`q9wGOq(e=J^|_Wto*?qM{VswsU=CL@k$1fh`I-)
zg`&xQ0zqjjD|i1+a4S!e(eReHuoyxhcX4s49vp(U2%Bz!z?!p=-EDF|w|+iM*qU(=
zEZK>f8LWc^s8`E(G&b51wQ$nW7?rMvZ%>z8zJ!o@bj$(-Ldln^NLvk$Z<@=oO4WM)
z1l0J823-EU+~eLHyA%y{Dt7$_OV8<Co_~Il{(#g{$+RQOz{2zl-$tgaFoEghypWLl
z&rB&!s$LPYOF`!(uIj|~)qdmgNi2_xJ7bvNX=`dSh!1!OSH}hn?*5*1^NhjR-6*$%
zQSQEpC7sh%$^y$alrBg!U!Z!Wkfu#J@#Kx#C`#-G(yphf!RD-Ac)DChHR+=^2Tfcb
zlPmj^wzlslef;<lV*hXbj-L9sOlbhZz@HmcL505C5+V-53rJ`KbR#RbL_v7>T-kZa
zMlGRkRF~(^1tOYPHzs%40N0USxy=5qy5PlXD=XylIc7~q?>ATN5V6_ge=Avut3g@`
z@FY5yADto+bjl+OfRLM*IDZOHs|#v)QZ2fn<b}uzZD)pK?m_yfWuy=H&_v5Gr#c>P
zt?oy2Kp|-<<4mlfS!dORz!BN~$`MQ33Zd;~JEyqJ!qZmF_{TPZvZ?&OF}B)IHU_Wt
zld>IJ-00R1Y-QHEyzM^AO|RTe1M;d+{@-~zPNVeOV457!{n;FFVNQ>XzM{GyxaC`h
zeV?+X8#DbQ6gyj2(w6dPBz<fd@2)yk)u2Dq!IDMQIqDf2?|v<D3F0HMqu>J=sV_KG
z&}EH{5kpOy`;C|VuKkWqaf(0Hh;)fp2)V>~JJJ5?S?k>n8oJ6K_v@D+Gs*h8+O__&
z@&2vxdX!t#HWXx;zn5g{@bcJWrcC$4vD>LOK{dRrRZo^9Jl8y6jg_2#36rr|^?Ehq
zhe5BDm~}<C84sh3ZZ53Jc6zQ+yVgR>?{s1c53fRux=A4aze%$<&J}JznJTQ?GNz86
z<@ua(8ZVmOFJtZ~(S4L0Fn^czg!75V9?K7jT6fn+RP?4FM7(IsPBx#jcXT|lw5!1x
zD?ZWSanl|0iHM#gMG#~tH*E^uskgco%p!;0YMM*Yp^`s?;pDyKv3<P^OAnD(W?xt+
zse5zzAvfhpX2lRLAKT`Kr<$(5Tw1y|=vaPu{>!13>7!-MX<r`eORV@P*q{04#pCE!
z%V+aO>nMW)gf8wgy;>-FQ!kH}^V%9Nt<syzIVw4?TxWTlW14!OJ2zH%M6yX->r88)
zXp-Uu4|73_@8T3!_1AZ*`RQj2c4xfY*DDqE@wxmJ+wb3GZ1+^Y{GEqrhH!{nKa*k&
zs$a&Vo6u0)wOJPerVP7x^CYLO^*IA8`*+VD9yl4rnQWeZJmqQ72~dkD*RQ9VMoJGx
z!FdiVd0E+etT9?<IbaTti8U<i`Ub8~pxC1!@J%w3)+}uU=1Esb=vKDgp+TqrB0qwv
z2@6XC0`5z8KDVD~$QL$}%}ox;o4kkTHq9xS@Dx=^xO};j$JtU(73UcBGJ)o;GR}n;
z%^AS)#;NWaH{~5~N?%{pmOegiA96W*6_A3D8AD}H`9sdiihLk@v2Zp=yPSxURBWP)
zu#&obN=eDCR_j{jYdOJ+18EU66)rm;9!)J6T6$~SJ#yFN-1?hd1`@??ZB}pR8d!>V
zMLzgAHn7X!!taw5Nc%P;G+0B~l%plN6zA%7?we!G5evx17yI5IYf${gmeFIDmX_-L
z@?;$h=`4T%Rp>DAd1OQq@#2EFez|)}N{WrhsfI0#jCu%@Q^cTCtNPUj3-HFzH?9Ib
z6K1t9pd<(F=}b_nKM89zj}OM=kMO=){u@YRqDi{xz<cz-Wzk8;*Z*5>-yN4@8@Dgg
z)GlpFp`}4-prwJ5qM@NuC}|L>&`$0KB`u!N5NR*krAb54kU}XHDU@~^?{Vodp7;0p
z{Qi5Nf1VHS`?{~|yw3AGkK_1ii7lK-w-b35d1`V_X)D$!5(Uykb||l>io4w{_ZDs3
zkGh$!Yhy9P?P@pH9eKI=5+-Q{GqHA)Mf;KK$|X71^0co$@TB(3MQK|5xDSigHtHS|
z1$8F0PL{&~4#l*rr`hO~k=QmwY%xkX*IDwJmXfx}t4nr4J}5-$cR(g?^dcPUl6*O=
zJUn7rPUPLd&#YauE2ag!h+~sit7~c?z0H0k_V(><Wdk*<Vq{LOouH<Zw)}|FNsS?o
zBVvz)@7OXVabMu)6X}QMAmV*onD>(#WKz$(4Uv<R%d=~@LqL`zQ^)jcDc0-%xOS(O
z<7Td9U{k8nQKKpi&)!e{`dO!s9&l1By{NHDT2%k_^SZi1_teMy5*-d5f@1tG75Pd9
zY>{52ED<6{27{V+Pta-Y8Gh#!mY8^GuZ#Lw8jEv5c6)b^95PF$`BoycqfL6|>A1<X
zxyR9S&JQGfN*+1%oO!uq_|}snc{*03cF!;KiJr>L%nTYAi5FE>eZ_`80JcUDZ~<G^
z)eRFXWg2nEBo-uwN~hm@H)Xo0_+uOG0{2h_RXC{WLPZ7DH`b2a%1!9e@z6V2$ZV#g
z8NH<U)Uju@G!yDp=!Xyr!vN`ko<NLsLGQ5OWa}m+rE;{kJ4yYl%fY;jQ-Jg8&7F^b
z;E0DGPc@%@81e0crBnIl{B`8yHTUcs>N(bAf9wtH_@<~5U3_5owrg_w8`$=ZID9M<
zIQ42N`{dJZmX8@TiuBB;=!1Nnp^TSMqsnicE?U}I`Qz)2Vb{A9YMX|6o-x*t1P88O
zY+juIF;jon>xXB}t#<UNyha+oTp@cM)SGF{?I*SPr}j$oO%rt%Fn}e#u~_9SzeB@}
zI9Uz>)b0|-HyDu)pWU#~>ET4Lanp8*;%0>*50}D~yI~0v!P+HXPp7mCw@u21Se>!W
zw%N%$&stmK<K+D3a7KoPhCX`af@K--_ys9I(+FEwN+T-M{0dpZfBJeqQ3#M@qW)kD
z$p3HngOq7u*ZfD%kn2n7^F-tPcVlzd*<~*8Gj}=UvIu0xGGqbQpW1arQbWI|Fu_bp
z<2NFs$n3V<nUx=G5n%qg@`1ui)7RyTiUCqNqs4p^;<-(dOU8ey4=y7yc2nS?-bd5#
z-^J0-V689JT&&=jz0m8b5N&0{;rFX)I#c&o+g!6bx$NNlfYI5+ZDu=z{%T%kd^6jB
zXQwgxxA-Bn*kNF8ht9N9S|7s+XWT--R+9g`pU<G7acBa$8vXYJM!sPH)B{oW*i<RU
z;E}&h{GB^@I5a{2iTeF<_j&`h@b7c)9-N<=x;ruA_r?Uk2;E=r2#to(sVQI#cofbh
zmmK&PaDo*tS{PMdoL}ALI>LM>x%7W^Uxhlmx;!z{<8RCdjjGG^$-~)w8@XgpF-67w
zudl>M`}yrgvh$yPkjSq0bwKo0vH_)Y&EI|TVQ02=>%R8&wV<Zc)~5e=|5+vZPC%_u
zre137#miv@()5h~IqYzgva<Oo@SsZB@EaFlKOiExPp|ywjlPZh6d4ZmuQ(ba_$%&k
zDcrYb&uLfJOmOQlrsz*|_fSSP$+kPi;b{H_v`A(jiT>w@z;;I!9n?C7O`9}+x8i}8
zVA@-Mp6^_fMVxnYBD<Mn*dMSAumT%5CZQIZk&(fpS>5&v^1_dx5*g^%{*g=1r==uZ
z{sM*!J4fESH3$0C>o;$%T)zAp^iqu{GJiPI`JnuE=|au0tFTeX^<SG1oqKdr9FHHr
zytMDn!U0So9J%TWeg5Oeif4yT+*jDzSo|9?7HmexA^D`TvJV#QcQakerjSd)Dlam!
z9q~!TUr&#a6kuxk{?CB5|L4<+c09Gu&>y)@^96hOZ%_qv?fH$cGyn5(`SS@$Ndwur
z=6blg++P+O7#c_!(l}#Gj_{u+$ThoqdvxRde1QiN2Q!xOdO!Qw!Dc|3vgbCV(El6W
zV%6j<gGjr5LZi?s1pWPGSlt%qN0t>U8x^n6^Agr#8Qme@&_1eXVHpxD*GvGSn17{R
zYYRb5X6pZpTG*evHZ2S?5}{nf>1b_z_EoS}_O`!2U-?FLO%kx}f4?P~4+*BB-R?X*
z;ys>Ef~mG?{B`{~Agv`MKp+?W4MG@?5Dg(AR`|iIFd*^%^SBUI{v$5QKL8^vJwmg*
ztSmXV(YU|2Du6S{KwNrGA@vyYes=8dV}UP$p%q}ptK@0+d#A$a^aj@dXcpKPC4OkS
zl;Z!fI|Qx;?C&s9bG4X%3kZmr;agA<KrVX6V@~tf;6Em7#&v!LtoR*FGVw8+otb&|
z`{)4*rl4Lp{GK}Gy7Bm0%?EY>_U-=N3sWa3VaIH2*jZWsATjVW2!ICPI!S6g{-Vf=
zR?44Oh|{X0lL16Jq=<o(`}4vBoG<q>-U{oQTbOEcAMY-h7K<Iu+V;2chwP=L5I~^X
z@w$I*Z_NPB^Neoy{`c=+JoeBOuWaHl_+$Jp%lf-rB&5;*z$5?{e4yWSr<{D%vGz=E
zcb)at`hN_mfr&{MYWzND@}L)pjk}Edi1`P|98nKGN_Gjo9Q~mj7?T3}9sl_rkZBOV
z1&~18tYG~w>>g8YxM;HeJym(P*Ly;)@p;Zg4wG-Kg^OG6dnK3w%pYaoM;yUrkf0Px
zVI?E!VDg=jwAo-OX$7x|y5LWOp7u2yroWy^)HyOL>apuL^EC;`6bS>l-2c<=7m?fE
z{^8bvX2k_5aexDdrUgkI^d~|jf1Mq+LKKUE9e9+TJvKE(IG3L=NRs?B12l|lnuouP
zj7SO1F|3<fzkZ&Mt5%W%SN;h&nLkCKSy{e451{82!NbWd7lgx7g)Tcc#~<>bq<`l%
zp{*7k-jKOX1HiMNk2mWIOqT+h9)#$n&IE2YXCEnWxvNH5s9MRa?__$^*u*73D&=2S
z`Mf+#^s*|!9E@R`0V?iTBxCC`U~dzU3!8o;s3HiU<837`LO+>94#j@Oi&JTDmG@lp
zCIAiusO%3^#xMgd90D^74R!y3fO-*r`PDxw14x`hHvd|h&eoM|H0tmjCA;@D`Tm4S
zm}dkm^=Hq7JNLTZs7na04}8O?ml4B5gd)LVsdZ;Hdao{?9avq`VYApkF0{)dA@taJ
z6<Sqi!4o1zfQlRxibRvou5HZ?DYtLuXKRmK+_9tKt>HTxN1puIsn>M*AzKo?isQFg
zZ=ahuGM~SH-A5X>dL`;>wPyqOT63`IgdZIGGVIjvY>;QGmw3T)P{Y<%sNe2wNUv-q
zL-)0v&Z2#i;}*4>KPNx^p!D<rrvV@mVPTB3<*FoOW=>8_-85eHtR1Cn(EfJpt~0oz
zbA<lx_t#z%cRe%#N2b3sV^j0l!T}Vuw6vgTkwYnFmk%DlD!#EHO5)+%Ljm=D5jj~|
zVkT*?`F5P=lUr==uG-95d(LmH;B#~jn$V{joiE>o_KlqKnrd*R-sh*A<lDX~(hJ_c
z|5pCV#`)-qa`zi+>54DC?tJ%-cZvPG*JZ}sWB4Mtxw8@k_U#)8;?PQbcR>aNO1;g}
z%}Y(*uI9Mf+uNHnSxm;T;y`;>R~PD&fnl=Ym`EGn*VNSHW@HolKKnSii>9U~EiLU%
zPfAKk{r*FMo>qL5tQ9aX8WRQE@JM2~sI~*a%g)QIuBvKSEww(TbFAfoC!1gZ**5w`
zc06*w7d8JN%?a{GT5JoV-<w-w8g{bq`}gng7%zRJ!BF}Js#)!UGp@+p3wUAMOv|~E
zcw8yG$*4*SYynC6vMRqt>s4=d33F1pF0(2X|Bx^S&)qNcjX7Bu6ckkS<HG#>JVXLV
zGnUqIa&zzSn43W2>9SspkFP|nTb6e;W=yLaHUlmg+CAom)KX_g8{UE-3jk09`?(M6
zw`_3$FYx}1stOfUC|@G2Z=`olaodqIcUyE-xauAq&3Ii5bi~Zaz5qCqK8|)uLlfm}
zxmQ&D{#23zmgZsGs!gpcoz?MYM%-WRDuCJXfBYeb4Cv6Gf9Zd0RfOpBUsBak2pKK^
zC1W_9ZpOb~6XcFFV_N>ip6$wo8<sy2X7By`!kwr>{jUp$kf1Dm;6O6~Aay_b-?6M)
z=Lx|h>`>U@?@q9{xL`GjijEFi6UoKJ7r{6cyY9Ld))&Z;vjg>nXf{lIe-B~`{2+<x
z`mI|E&>Jf0xGQri3Lhny6u_@Tr5GJ=591B~^RSTBW+*%{tlJsps_hTh{7!rKD~zg*
z0eD6FsfN!{O-0K#N3EL<FdGz(v%zLrdPrTj7GD(Gvw#0>$)l=}ksR<~Aqy>pX#qzn
zVw#%2+8)6*$bw?s6Aawj*Q{KhD){3`V*z>>fU$hw<7}n-T2JR6CWfUsK{gly85*!c
z)HO95!e8EqjWvS+6OiEG#vhKtBgc-8jh%c~Bx6oNaFQ`#0W2XX0X%aMq=j`_ob0eb
zk?To$dTHqb4v1Fn2Ek&i{@J5gytQlB0^t=oef19V)Q=6(4BL7#%NJpe8LdvB41n3o
zIrt$rsp?a1(DH=#0+m$3`7b8Ay1I`G3^6oNTYJr=4>%SKe2Np3lclI9q1e>x3=HO!
zz8|+-ALKb+u17gQSa|RGCc#e}%*@|s#;lP8gRR#m<VzgZ!n2fDYDJe&j~{J=OaZ!s
zEiEm_n$vtf&Wv<!Lzf#x`AM+MQH<{E$;CIY@)1|5_&do4f?{Yv$*VAH!4Nd}o=*@G
zwHWp0<>8UM4HxDgv+?NBqe$w1K=l;B&e2M$^%Mn10C7W}kNKEhh++``EF#*%5z9XD
zoT~(_mht8SI%phSfi6A4C`3+(8M-yVqobJ&NSx6*`xkL4(BXi-s{Uj9POy8~#16ke
z8xN*r-&MIV3Z9p*Uah4A*~kPE&v<Wy029h4rBIiLE4UQL>D>a^rhYI0Yy6;2&!muW
z5x$HVK<MCbHL<_xHn-9l?x&CP^IgxKYrL!E1=172VTInu&I)8b7<y8IzD7(r1-2w+
z+YqXqC`JIIh!U0jx)q1ZJs0jr+rQ2tW3z`wR0YVaXUulC0p?I#R8(&hE(*elL3Uk3
zgO=hx)jd-xg&PJdkwi)fThZh3qQy9+K;*+ae9HP7D%BY$VJ3XNy}j{vJeL-xVQx;g
z+@rqttfpplmq2Xq7N6!P4wiDKV<3p3yc1POx^W+WVn`d{k$z!oz{SmNR^*nlBEPie
zJuz|tG6X&pfFTBi_7*t17CKk>LVe=v@USRf(i}?)%oIW48;ZQI8?TD>RhfouQ(+xr
zrJ&~_t?IQwAtn24-Z#vYOv?lp8E{xX<HF)%JUY*-k0`2GTMM{G>>bs<OxI^T4?!WE
zJBZLnGDI+jze6-o7#0=v3Ohx6o1>#6rYA=mSRV&($}QRLX_m*2^EmE|-$j7I0?yN?
z9lL%2*fB3WG#nmw%wv=Y0g~&Ra+E=yfbcZp!Gj0+`55z-zW|erK}YyFZUx{&oYT#l
zHkB=K2E^>Qva))?OL?T+b64A**yEH-#u${~?ED=o9DhJ0y)H5pHUVMlJCKb-Lm3(w
zd3(OU+5h^0nHkR=%hRVvVYU|*7QlMFa@+DFdZ=zWsNmMJRJW327{(I;GE^cVL(wxj
zkxjjg*Q6U~X-N&zZ_efZVXg?YVwhr1R^MC~v+`r(O}|+UN4H%uY61cRd{8YXC@5&3
z?Yg+ObsR;irAg{(rz%9Lz35Ioh1T~E*9+@mPmMPV3X)qLLiw}A(F-q@P_@a*`t&AW
zVvtrY++K}JiUF3cghSdk?6Xs#9nKk&%*FDh1t;i35etQ`+Ty~GGZ%4YV7Ga(7Y3if
z97kiyS$jL1;t3lY8$cMHoI;C%sJbnEG92sh)=2?kFc(nj>G4|fz!8H%s}3o~OF#hw
zUGf3Medu-N9HD^ZTS-X?8ep5&WZ{*;en!55i{X$ZBO`;ss!YvKPyd2{M$~6@0(-!n
ziIuetk{*vtPu}Rvogx#X{VM31u73xW9N0k+C&T}-*oX}P4~}7=_RxSJ&K#)PAa6YB
zTPt>068hyBb@eLa2)Bb8G5gQF`27B_(eNh1qu2n79&>3XkM?zM_9x(mR_D=rDnR44
z@@URA+z8U>>^B52xT#5p70ArqBOuB9?ZW_~>bg2%2%lTsFn{3*n^RFy(f5*Y|Ne}J
ze4N!AucNF0O}lgy3AlLcNsk^qN=y_ONyhy7uxzX@T!=k}X3fm@Ug0Y$E^avg`M^y8
z4+I<&=?QL?v!$h_o15F=!-sWsU%=#{YXUT=9uF~K8D+{5WXRY@5azIeA_=IaprB`>
z1E1{lwqOjl{kz`so!s!nokYV0^YPuqNdOScZ4Qroe?N;6{Vbdejsm5MFRMz}IZrK-
z4I8X5zZQ@#Hl2;$>3|+Jtet}&1u7r>B@BlGtG7f!kq8$^50NPL_pFj&ZYcIcQES+&
z$M>h>kD*2oky8z;0017p5#$2^FejG8DhhE#9W$<ltQy>;q%n(_n4e!MIfP*2SR{!=
zs;*We{4_ouBl>?4i{QdPgPd-D^hc(@^-NDs8=*g?M%<sOvrvR+_&9dx*!Vc6tUE%c
zP;6-B^A{9oqilvNH0<$x|K1Xj3{K#Cp`3f0<mC$?C5W|#b$3VDlJ;}O!+5|>=syj2
z2m|=3ukT>8ZaikxH`q}?x6Bmj2SlnWFM~#$d0mvF1Dgxm-(&dI7QMP>K)gCX<lJ>3
z4}GzF@;i1Ub|-3rhVnDak_V5eu2)S{Gg|l%MZky8pXd5&XpKE0!Ixwe(p}-;{IRJN
z=u*g67OFg)2gK2!D?+pbhw#{t0V|C<P&{h?KxwTZ<rdTs1LsggN4l*_r8ho5dlt`x
zj)10y2FOR%6Y*x(dFThXaC38WKt<hw@ar<X#01qlJKbMA>FhLaxb_5)?d-a)t~q!p
zfP}*Gi4X#RhX9O-xeR15i9*E!f%#7w4c<KuLQ^Z>f;fuI7Mv32-4vj00AWasFNbNY
zZ!tw!SOyP?9g3hqc7ggMV6>Q(o|Tu^7%kBQR6Ah{KsDS$Pv~h$@<>|Ot}(tqJ@^>Q
zk2)l`X)v28gy^LTdp8OT3&Y7&8M?Yo%X(Re3NXr#1sW1F&V7Ax5d@Il(Y6v25~il6
z+GGHa&&UJ!S@^}^#rO9Wen>MI<8jtC4BIgc)H=u*LV7T-{92j5We^9gP_sOGR1b;8
zr`We~UrkdDx7eq^>!BHecdv~me_ihy?(N#z_FfB<(P9q+gM+!{odvi1z~X$KuZl;Y
z3RuX?IK1(kiB~(3s$v2y;NrU}567mRSg|;Tg9Oq@ugzR56E(ko$&R>P7~*o{0!5gz
zi=@P}=R?X3XkW#XkwesccTUP6#IKUAJu#U*RIHT7e4b!<c3IY5M=!jy8H!WfbGRv1
z+*BP_pRj!_rr4;hcbk~FxVq9!W!qE`XWiZDzCpHxytNy``)H(Doje)1{dFDQrIJ@2
zz$-F*8W;zC7IU9rRaM#bm@oudbplh3?u(V;<r^WmBn_2d<Dm>XV~jfh`{28^xGI%<
zhw?>CkG>N92@hqIqE9VrZ*LE)-#>T`QLd%9vLAZ26ciNoDJDhL(avKB%N^e-7<;hg
zbv}0BKH&o$kBdM@q!2pn=U+}=;qweLP$klOb?2=(xCpbV$uXI7*Yn8x7}-nA7hqLE
zU&6)n#^JMD<8>r!G&D66Iq!c&{Fk`Wy~<JDq5=X)>K~xUP~W0;TFo|cCc#K!R2P2w
z_#qgaZ{Fzs;5GGa%!hC96A+`N4Td|xno}__NI>+DizovvoTMt)WmQepHfEL4THn25
zE=Xbk$!Xb9PE)uNBq;JXff}})T8YJCCcvSX{JWoZ^Zr{Av9V&GP3*DW&=j?zR{7M4
zA-6%rT+*pam;L>rr9tDsCF>YF_1TWIPvSOmlh$zYa|F?2JGkN8#S6$l0ffeB$;EPv
zkh{Eq)=+vWQl~nN(Mr*#`YNqC*q9?`W}{ti64YtaTXV+_URs=YKXvL<UM$pP(^3LM
zL!AKFy+DY%4DSozw0QDJB<2D!Nv!O}V}cd-e8u^TNXy}A%nMHQf8bo}&-ejVXy>gK
zp0i2&44nt&5VD+}#x_AT@#M&k9Xm=J5)m;$UV`f?0{ksnoTC#H)gi&#N2QGq;yeSe
zf9(PmBCo9CEn@ICS~ih9m{nsBf?ST^IE!uHc_Lxk=+79QuIwUhGXPIX;R**HSd6&b
zq{H{=eVjeLytmM?5rQh~B%(HqxqbZj@oRD^MCV7|L|fL&A*TB@+}r!|{(f$KX^+(~
z?AVGiikPUqUMtfXp(2xj1{AnzU%n)Ul*lojpp$MY7=@vG9S1|F1q#?qt0hd^B@Yk$
zyYS-np}|2!j@vswO=5ngMp|#iMx7y4Q8>B0@ot}mb7fPpeMZT=Q0yVJ1)X&B^7DJj
zy~@Q(g9a~DFH;SX=FptD0$rMwnR#y4%RzDx`$VJ;M|w?iu5;z_0GqO1#Tjz}M1wF<
z&7f4foMNOODWq+{yP!x(U3qjbKhf$c0rlEQ1Ehzhp#?J^ADBDZ+ALO1qoqK}1XHhm
z-Pwtxaqsqx{u~?OxU8vZXhaTYtv`_nn~%z)?lyTs!{o7>0KzcVFORB)cOef@@q_p2
zF7q&rYJ*&%M1s?tF(XUv;fuNr1ucp4pD;H47`(!s$KfE;iAU-Ir1s*4u70&ewdD>z
zkBRHH0+57)Zn207p+<K$QpCcd2L?Ep1*g7g7lKBZPKw+$%DfUE`ovU7H|3~#w!K6&
ztZuQQklD*NHz%hH6NJ-JRGz}`S+lI89*l<3UrkO9s?v|ySy*<hMk^GC+~+19jwn+}
zDGC`0KJ`6GeTe=3hV&!>q*RmJH@^$yY^tbG8E$#PB}p5U=>&7BwR`1Qw9bwl#n^{+
z;RmT7?q)hPh(QTDc&|HG3DI*&Q#nZbA@tEZFF@=z1b7^kenuaFA_@u`OgW^>J`*Ce
zvLwKIt#Sk4IpEijZpb|?hFJp-BWF$|8Ju@!2NZ<jjrFKuzDNUhc&bp%4XK}t3hYaB
zbH`D-IX<~ju8&}Ow70YzjQylTC8a~$eu8l(0~$V=n01Sn-6y`Oren)-{wHdtkg>{3
zGs;}&*zh?OCRTHvmq|lV%MLm^HG*_Q%)vA(d34gWC%3bT=nE~3=uq(s7Vpv0LaB|z
z{A9fLtpT!lajRLy<lw;sl5HVC<a+Z%5ALezF``0MR`Djyc$@JBwuxP?Ut<qbuR180
zYKJtvhW!G9&SYbyRbPm`e(e!7$n~@txL_ifO|z?zp4Ex)SI^*J#8MB&L-CWGg$;9;
zpWWGYQFmf`n%zs2T){?y4o8pWRDl-+nQ|h0kQfFXSwIS&bC05BU}Pjj!AvKrtp@un
z;c%R?55)PTJ?X4k;asI!8}1;M$zf=u$9AbnJp+3tGrT*_ZGPrVyg0fIOzI`{(6Axf
z0)PkR_y`8AxY~SIDO7=rm^OmfV4G{#E|OQF*qV95N8$W&aHxowA<`getAaui#3pTf
z;0KKBS8Un@>x8nF20bD%Z6tG;&fynW52@a&s@;Z>^{^w>s_MJoi~&E(x#fd^H=gbV
z^MeV}xUA$5%%2L52V&!dZ#b04_j+7QkQ1*Kp1mrFj-Qeb9%0Y+mB&9Lqcy)8%qkr2
z=`jvI6SObm&Er)slSowhNN~V4_oq2=18P+-*C>a<NCqiX?;V$lUMm+gbI=j{vL#cQ
zR0bEZ)<YIDvBE)ttNPjy{(wee-?-vL5=gWOWC~@op??01RfK0@LCk{3YBWF&cw?hX
zOcg5dK?=4g3}6`9+ffnK*tp%;V3A2iJ}YG~q|0Gnw0OD;rxgyy#D0k*h+gz~w;E+k
zc%=v;W#&W0<{(PLC0w#6ThyZ3l&_#P5uz}no|Z&EDWV(a&A9HRhIbUC?SxGR8={*#
zI*bf0R^JFN$kV{@w;quGBs#dBlJW|wEp|bDwE0e}*4-IgC5z~axYrv9*n-?`k!a*h
zgd@GyPto6NPn7A??yp)og~2RGPk|!u=jV5P(m<O1_6VkFi#-Hqf+<*6rN|d?n!!U<
zOV^*UZNqH~qpqd8Xgd1cbEsuw36~!=%cf^3T=vX87b@>VU?%Q6Krz8lw=z#qLx;d$
z4hy0+o+P{lGoZhI`a~*2njF1R24Q{QL^&ds508avYiq%tXIJOwz*O3{R3nK-*33kU
za?hd7?5d<}6j$VLAV&+7|BhMc5lQFJO5bBvMFWEU*^kF2H^$`08N4>ZG?hkoY)MEx
zDX+@1eYwH-;CO!>i>$0{8}KKg4^6PmK<Bl5rFLXkEg}T5o_03^`SA4j$BobGStduM
zm61yj0=2cTAWwN9UYE4G6^FtD8D6LAbL@laeQYtdh}};|;15BGM1E@6J~KN@J>)A;
z7e05Z5()P1AB3b(6RN!TS7N6thg*n0M@eO3w0Ac$1Gvg~vSgs2<Vwx`5PD*7W>M$f
ze#J*6Qzi{bXXz*RF3yY|T@L9=JIrj?YuSy4fk`c~-Q`>NE`oyTwinGTr~*j6EBiY9
zk~q6m=7e%bXh&~I$7b@^T}fK(_K$LNi#->L4oj9=R``bTb*k>7B}R=U?~X;xDVmz;
zyFdzN1%Nb=mWK9)D?*@zZ$K^`GuYzNCqk03YXdi*=y`3B4})G=(BvF31TZE>C^Zw^
z3t^qA6^vVq4KSidpzPHe6marT(LtJvf}kBnxT#i2o=Lctep)h};TH1z^$H2WVx`A0
zX}hn;G!At<q~Bjqc0d3}wQF}KHj2fiy~LcLNM0fp6h%tgcaRgn!j2+Ee(!mVwWcuL
z($=sdh~*hFwaCR*!IH&L&TSMfNQTDR(?Y<00vaLi>fnZ&l@n~VWr<F6H#SM%H6z3>
zT|OqTsA{95ROh37MN-R0R_q?VWPac<t@XOgv(Hj)A#xAgb&v8!wyun}CqhfLBuHJ}
zYR*~VSan^u8C?ccNswp}7QySzC0<PEbg$wHAlAGR+N9NXgP^d5B^edE3`c?9Wqx(c
z!~yk}C=)LaKifd1jQGxB^9*2|gv1ZVj%gL5n6BJ|i1&e#7e6%hv7eLi3J9^`oRnbf
z(DJXxTvSQdQK^;>qvPIgx$@MzqDN6%j}rs8)7zlywP~TomtPN65CmoS|M|xhyN7VU
zIJ+mCRurP?2p!AQROyqar9Psf%`u74q0CX<rSUCNKc<TTeuV`EtilJ$T`?Rk8`xIQ
z{pgl-Go2hNqnRvfuz#OajFiz<K)C_sp*jb<7s~TY&%3%V0PqWp^Ci}RM4UP*y7fkg
zNLl_NM_mX(9U$XCITsNTk;fA=q}~`we(&ulGf!Jp)hbnz`xlpvN1OdQhysM*kdhxW
zP$Li@>qnu4vwTCOI*f9b4Jj%#v>7q(4BZJLN3kuVIqu|?>EfYE7egg&<GKna4H+2j
zD2pZAl3B<w?KOsM!K`Aop@r+n>zA#qEOc3vZ)*%m#&a^QdP<jOB!j|4iQ_CNDVc>$
zX_b$k#Mrx!a2@f!D9_y8dVC+sE$L}#FZ51*QCYT-gb!)L5C;`8G5rKJ>U5V7X=R_C
zJ9oxORi4GXy?A5EBi<BY$swEF-gI@*(6z??AOsQ~9Jm`~zP|Jv{MP})*52V^946Dr
zrgJFt%_6I>d*#n)jcz=)c3A8Ief>7nd5~S-@k}ZUK{nfraMu48>hg7V3UPY@b|Em*
zZK(&7h}q+y%(tQ@P$N$jmW|wts7)bd9%^RL%tX~QQ4vj&j@x9{%8=L^p+tmPnZ^hX
zQ9ve$45$I(33ptYIsN$VZWStb_J2D@Tj|~kZ`!m;M#iAKSuyJ)N{}d^h+C+T>R@EC
t1jLR0|C>j|Dg8g`N)Z?4O!~gGf??Qk>sm6})hqDdUUeO{3{^|t{{bXs{M!Hk

literal 0
HcmV?d00001

diff --git a/media/images/cutlass-tile-iteration.png b/media/images/cutlass-tile-iteration.png
new file mode 100644
index 0000000000000000000000000000000000000000..552c67126c0b26ccab8d4fe82d6d6adcac210bce
GIT binary patch
literal 76377
zcmeFZcT|(>_BD!aW5bSYLBNJ62q*|h7g3O|R3Q`<=@2mVuA-vSyL3@{-P91OmEJ><
zBoL4qAOr|Kly8N-&;9Q2e4ab*827I`#&K-M4kWz1?^D*AYtFfzxA)W(nD(>oXJBAp
zQoMUxgMnf90t3UY!M!`-C*l$%67atr4jKx#81h<Ali-`(=CZ1?3=9Rq2i70$f$#U(
z-_>(qU^pvE|Jot+AjzG9VJlVfwyc(`(R2c%tCseF-_a8%c6-=aQ%=b4VYAM!m@F^P
z^D^|v@49!}vUB$%*%aTq=2sm<l3$&xT0RE<&M@CnJVUfA^YgqKLr^*Aa7KtiTjxl`
zjH`^bN})H5XPOf<Fz~18|F}+%oc#Nhl4L#K->)KELlA$zx-@qN{r9VTzhsd+wqJhu
z?n|IQ90SA6w~QG2BQP*LJ9Zd#VEYvV7svnG3+_9E784WGqyO5Y=lj_-f58<W3=5zw
zEiIG0*GR|JCFfvJ;M%Rj!7`iuF2o_Ym(b7mQ695{UzUkJH7DTRn}2qcJ6UT^!K)Qi
z1i{SAY`~#SN}Ms?Wx#ED7knV%iB)f&VZq}&%pw9c>+@fH8C5ax^GA*MQ5Dv`c{Q7h
z`QnU{OFvCKmZq;6Ytx_cl4VAiqN-}uSgf_y&&nm7H4MznpT{2{lRW1YvAf|D_XI<U
zMjqr6`Wr8gz#Fc=_Wkn)eVESe-yVan$KiixKHj7c+!@LLz5xUG-y!+$V)*a=`0qCO
zZ%q7en)q)v_%Ag0FDUviDEco#{{K`PoC_lR-LM~g7E}6SB+IbES!R7!PE9SyvhYW_
z(^U25+Ek`ydaR}Y`V!u5ajI8cO-%$_+J44|+9C=cu3DSS=4&GV`r$8(^I4zsiz%&t
zwqqBoh|Q%`QEcg5Rn@?E?^wkhGvMdbeML||HAV93##$mQ9M*_io4tjm%Crh<6dz);
zJ6qIy-Brjo^zCu(o=i;zyU!|!+j6-(&@wn&aj`^Oyckvm@nmIoNZi$GTo7AY-`Hr?
znez6~#icDd`_1)LW3R>TudfcYI2O>M!I@vKV=?B5Pz5e5I11VB!7MO|67FG8qh7S7
zn2U&v3*8MHG)j#q_T=h1wM|`WQHwT{EL%PM^#G^q;PaaGQGuvY=fTg<V@=S={^sI4
zMy^Az-ZAs)5B&9GtR=2ZlG-dv^u&4#Um5DK2tF;=se%~EtC%T=$0Kj)ekEWWnxgpd
ze?5|;ed;f^#D=R&yS2uPnc>bw8#?Rd>X$6d^joLd9%X0GWy(>F6M;7<l~lFW`B4)S
zla^w>6zq6{3%v|A->Nz0zC4rLF@s0v$MBz|7udH?cW3M7YosbEDZQgl*-{U}u8LfW
zU!oB0Vr}N&sisD}4Mvvy1*$^`c}7(@75vvwydS6cN+WN6S0O$E4<&4pW2d5&`@&Ut
z{^go2FM|<hxZyB7dceJ@8tF9EqdK*WCVC5DPhu$5w7l|39$LAu-9RO3w2_?!voRKD
zcL7~Ds=1GK(qjfwx4CsN=#)^JBdHUXjxWr#2c?P|Q{t0A2*tA)xqhi8EWx^|phEfl
zIL&_#z0g1EH&Uu!VihGb^NN7mjValOvOYf2bFn^GmChVI`}K^Vzw7_@Q{nBO9{U4j
z&GfHN#hpR-Y=c0hKkIYhefVBP7HRu}{)@mVTza(qK79Yr<(cRe^@o?w|9^Mkr>94C
zih?d-HYT(4)g;Kp!qz?SVgH11p@Svo-<(J1*KC#xAOBPE$(yX9;Y;Y4m>4tM$)``B
znkP8*;O%O>Dn~@b#c?W#6lXH7?mqI<$B)y&&P8S|L7xZ%Fi}gR&eJ~&>Xea0pDnM3
zTxWhETmRzX>)WGs;q12@jnu}TT!i-fnbKQ2I#ChBF!y=-C0R<0s<A=spLX6^j8U5*
zdMzhJ^%uY9;QRD?85X<PVwWZhpMFYKm*Y#07I9(W#TN(oVP7$B&PUf+^cj1vnpW*N
z@Qt51L9E$Q<W5+q+1gMKR<)jZdXl_4o+PuefJNKlOU>Ij())MnH^Fk3rZx)^U5A-e
zafH$mDVNDE#VMDG_GDZu{8EQtmRa?9qDNlkd}Bn!i8%jCpRLVPLS_+sh*Gr#aS;~1
zC+6l&8C+;=x_U4EYHo7fDI=yuLzn*44cwRo=MDRZ-`^Y!LyY_Uv3)Ts7VoKCG<~E?
ztb6q()c3WBo;^E6aA@18li3Un4Si%@EX<PI2QjNBN3X~LgQ9QBn;m7;RtatPo-FOD
zYT8Ui?>S~3tq_lliy~N^48w}0T=YOzctw_6!l-IC^YzMT1JqlkZ>+*r4>+ut<}atm
zqk8nr6?03bj~PnX-TdVBjY-rZsMp9Nmm^LGL1&^&8zVw@y|?7Gct|N5J|x!mip9tx
z)+U*}8f%@`VL|kywk#>o0)$%Idz_a0UE<(_#o0Q!SzeR#O#<l3`q&aP_fAD_64Qf$
zgjcWicOkb1GgXz@es=2`+infIb=+aGykk9HD2WpnnjFmZeG74A=@Z1e$=Os*A^Lv3
zcinNmr{NG_4YeZ|sN6}Og7lx-pQt$OCElg7dnbL%-AE20B%&HGZ;wZwjfk|gHw-L2
zR{9>6E`!O$9(^M*Q#M>lZOt~W*@XB)3*?Ixv338lhsD6L<4z!(D6%If#*#@2)>Hpf
zeobCD?R>CgC*%mM)gC50h?{ECt0U^ttKY}&9biJe+RvPa8H*Knn(TrVlE(*0XJrAa
zP7iHB_m$Cyj^H{RXxbFD0Wsc|zi@1ElSYZ=)y-3i<Y`U8BA?3#vRcNM*wV97OPr|a
z)WCjRLVnq=cSUW|_|2L1RtZYPWz96$H&HBlMb%rIv{X)dI2`TQi+AeLi#Bp6^&0!w
zy18tQ%WP%#>y1ZbWL$z<<ufa>>UNx6AM`zZh0;o=A}!MsoMBEMNV{6SERnD-4uv51
z#xX2B9L9j0omZ}uel=O#16ORBCU6AZ?~GWS>?RZWAYC=qjUpQ~(^T&Nus4{A%6Z&{
z;fA39N}l%hfPm+8L7j$%hM<s;kWFYpLO<HhIM8{#HDU25>_qcZ+HdH88G%M>-x)7P
zJY1gXhbNaD4iGZ(*>F<DohJJ-9(E>m-l<rh==jv~4*h0f9wJPs4|-(Jfs+$QdQ%jS
z3)voBCBy0z^x5=;*Gx_@1rRMBIqbp~xc~g?(fq1TuKwuA$oro5Po`b`>yXiP8QZk8
zbu3wg*pn5gf&Tsu$V;i3DJ>m6dnH6=6zG|`Q&CB&d^8H-Y2@)<U1p<eVb8A{n<tLc
zI9U5ZayGR8vIpYY-N%nV?*BzDy~p?SlfvN!@?n|v4~30?KUc64QWQxja~M~H=y3V+
zWq%fdC_?poBX4Z67!F9-jvLnaF&89xw&m$Y0$zer=`hukD<XRJR4;_etbRQmfp6Dy
zlNFjW3|9h02SNx|<DL9w;<tjwDjt1%?a(SVPD)Q2D7B4)o8D0b46gxwanIgQS7T4=
z;z)xzDP+Y)A0Fvpt<PnTH@!{IIrJR!Z7veOwL$U0CD3R08Nm{pmYLIgxq0ZLKfi|R
z!?pRpQ;%;^z;>2{eC52Iztr}kP$;XejAV_Q+=cvx<vIE#O715A@#D8%>|c2Ka<|aY
z(?Vv=_85JS3)|^W;zrY(f2BG`dhi~69~vHhJ~=Qb$a{4(x=m(l{SPMA_dzC1+d1@5
ztKhkR@+EG^_U1J^$SJ)Zrp(`ASueXkHY&<&E$H%py7D!%=0D$tsL36Iz}5J2-*FY<
zwLO>;$j*%Br$Yb9#N=mmlK-@jRu-%g?et_x>9vXTSQiypWbShU?u(xMzY@8`wn9*M
zOxs4BNi5!LsgDkY0DqDsoVQardGN~lf1v~RZ5&|Iu)a#wP9Oq6VwZ3>D7Lu&MsoIh
zG~#mAf=Zj@#YJ9}byj-2F9CPjcBJQe-%d=4Z`4r?p9noLz1+{-XHplWjj>Dfz1f|$
z$<x&<;v0(S&QXrK0y(4k&C&B|Dls2FHaeb&J~JvJCDlK*=u8=?f^?K1?!*dNRw+<M
z@5dhkXx6QqoGU{28RlzKQc}vwZbVA=_4TEdFc3y{<c_kjN%(B8H-vMm$6i;w<A6dH
zl6V<%OPG0eGDZZkd!7-*$tQ0j0qTVyiq_-~qpTgaW5SK2p<hXkm$*I2CB1nNh#*iY
z>Z=g<$t9zBzp!1mxc5mu5MWbxo}omfBZMsDVvA4`|H&`)xdWXr#e@{aa9G1XzJCwk
zlregjjZxle7J7Fl1Qiz^F627<Fu2YnjhZ~K_A7Ty?%T&5mVJe(Cwdo{pH&coPK#+A
zz?VHW=?=QJ=nnhEP|3VImNjW@aY{W-q~$s@18S-m!GICQmcngM9+s-lZRwDQ?L2t<
z_Sn+OaPX8?m;wyY-}frvHa`NjgWCJ6Uos7bhljQ0nnw3m<xSkWijr`ie$btxpkF-j
zgtkOZ^%Pf#OZzy?kLC&0mb4wH)Z=GoX6}YahJAXS#~rSbhVHF!u?uYL%G69v(@?+~
zGR&YP9)5my^t^nAuH8-TF2MY$EiJLa_(D^Ex7wo?h6hjIxMz3MPQyVo_dk!bEFJbc
z@iYwAve`Ly)DOR?Aefn&Isv3`7;oiCP}M}{@f;M3?41(E-bufQX=!L6^%bR`z)=F3
zIHfCLYx|5jbj+Z#N40mP8)@eSvI>XU#|E9RZ*85yrUwta-al0td@j3`zqryl6tR(O
zrNHDLBYj&%MWxDp@j{!~+Ew@1-ST1iK9KSP2x~+Cw!#^F#+qX^%N;EfROkPcaLyq~
zT(gfxB;ZV+eo_b)!TPml>Y8=e_-x&(G1Wivsxeoo`>fpSyUD@pM+#Zlhr7ja*O}Q}
zFp*kywY7Orqd{E(1B4ZX8+-tp#rF@UcXRuw9|!JPb!TZq_JnmG5F_2ZK*Gjdw=8rd
zX;huiMN)_VkDGE7xzGHu=xw{${1-;fbs-i>x#txGeuJ`m=eXkpv3~bVu>~e|oIdOK
z536V%-8W{^(0S}~@j-{LFZU@bDt5MVDMw{|xU#^THnV#*0g?H_s?2+1Er#?h<F!sn
z=yIk_t})ZCkT7E{OoE{4yFYxEru)p+j%ZA!sm6)lsz8k@MK0Foa{hbV+WYKaE<A=U
zu2}D{htK_+*aZlq&H&8du{vtt_rp>lq}CtCVzH`lPx8oD`ws*fZLBTEiP{Zh>k3FE
zUNd=prPq<g|IDaPH{vFy`<(K0g)^CFe41F}GcGsrJie%XzWgpKTeuT89p8Ltwiz}}
z)m@h(xGts_5K;(!{of<+*Z8usGHI{1gB+4SRT%x=wLUf;Duz7<6`&?+O82v(fT;^4
zQYB?&A=Nt<{={^@b%k}Oq2M-L_H<a>apDLwGuIEkg|zQ8>xvldx95j!aK)JeZBSOr
z2c0H)D(H?bLd+%bP7jXih>P0~-sGc%p3m0<#H>@ImU!z7ddE`;cmI@Bhqi+rcNQy`
zE<HKrS1su$u%tW@Z-}W5Q@^T<+>kysWq`4TXS$nDaF<LpYl($z*cTIVx#j&eIi0?0
zFPe<drjG_v``)CX6J=nde)&WBILxwELEJKO*Rd3WmCEbGoC6<ZeW7r-`k-QsL?%gl
zi91hctY+QMzS+GV#-)7Wv;H|LXUvDd{}A@}o<;G9y=~p=cEUY3XZQUH7vxlLK4m!p
zk#H`7LYRDR$#V`?d9mK1K8OWEUVp9{!8R(EZ+7fh4M)X=gnST9JJ+VdS&Jzups^j0
zM{<1>L|mSN(G0qdkcujw;Dgnmc=)A`Y@CQ~>~+h|EbZ)4Tm0Gv<M+@rXtjzxAqXMc
z10y{-oBt#YNT0Xv>ge?Fp$Q*_ZgD{AoJ`_fEo;hEBWDe*&qT#XM0AONcTtX#6G0MO
zfhK?r4fS(20-blFSA``(<}y0VZUJ40tT8n%e4+?Jdw$ENE%XErI!h{E{k%t&Q4McF
zR)4x$0*_sT9Pb@F^-lm?Wgv=J!A2d+T)l}*a6WJb4TW5NuHHs6Bc?<Qw>^<jup1@=
zLh6Kj4L)ImNxVaFQ#@mb*u@>Ef5NuI4k0f2Ew~^@??CNigD=e`_PW;vbLQ&_=oi=j
zePiz5q&$`)@HATnA@kN8z~Mkvv^buDtR=8QZIcnT?wPJPmO=SZ2!DM4w<LX}^!xYk
z8TWb=hnj`jDxu1$a3p;!s`&dZLYNx4>jK%L6BF}Ng8~D!nfSyUy$__j!b3l9jJTYo
zM_V8r=j6;UR}yXkCP@3<(qy-Csac|y<BN#xVDPNQLBhJ{3e%hG5|m$A@?+^q-eG~+
z3@H7bzs^CjMfR5q!(anO4hpbzrCyrYFNR_}@^5(K=FgAeU*Q*VkO)_)<M{lKx0I4m
z*&p57KgjZMA|P`Xm?$vaqK>s_KY2g%_-FtjOW8a7mXd=FvAW8PXPHg#$=w3Gj_E;u
z^!#TCi?<aNfZfq3vc{&h07_N}WQ9xcPy+}C+OrTu!iia3;S)*<5HMJonT5?;Pg4VS
z+K1v{@GTVCgsoEE=}}wc_<-Sw9Ecld4;(3li1*6qmcoCS-rfF_G)QcfKtsLCdc!IB
z@+wx}@7AbJy^wC6ff!^?rUV22%a=*&hwfZO@m^=Cx^_8Ur|07xe=VaEG(@#qS(7cS
z+QBcr60qP?m7{0+D_kI#LrQ}M^5*T^Yi&1PzI*v}xK<H^;JnplQ0<8!@&3tziDa}o
zHQK!zBj%9i-a-wM|Iq`vfUDN5oFN1O7`r|<rgRU=TE}Ms2$mobdgb>@2r5z+sM8>S
zUNI~$K14D0*(f2sv3U`SH&F{gvF+c#@t|-3;k`4eH4F`SHPbt!(Qtw(_15nH03<%x
zYcY^A66>6L4bz2+N&XK*5Y_;Z?f)&5#kV&@Tq=2UX!;P(Td3bm*UtU<e?akF^jqY<
z4nB}&f<y43X*bXHxw<rg7r)1z_8+kTeAs_#&qMW|4fzs+k0|@mgTDvL_>4qe4b>vg
z)p=k5T4RLjyty2|ZnI7${|@axAA`I%To>#^N{#05oRv*5RpmVaapvC&hwZyPtH52_
zCQX}$@$8z@1L{I2@A2A)2fs(ad&R^n>c2bMw+??hEOXuK-j$$ef=-@+-oI!ft)yJN
zqFNRFISC1TD1Kz*Nv?&qpK}Nj%F1kD=>Vs7nqXPo<4rwhFyj}{1qB5#R1gO{vDj#S
zLmmuJsk*|J4#g$B^zv9iK_QOWE)-W{&B=mEknyP=DZT$merdE+ugEM6(N_{v`sQ^x
z<c&_gIJWmMoxxiZhCj)tZ*eE?pRy1rqsc*xO`jn7aoYI>i)x6%VFWs(b4)GnQ|{53
zp4>QRbGp-I{q4JVonOR)<Ls)%q@@QIWIIA1Ssm0qp9fWJ3G)*dpft*7%BQXqN1LLp
zI~`vp0%fp7!YahIKpkFX+H?{gsyKjkU~7F`hUa@-5WBT)#w)YjclQ?iq?QRn4r9$?
z@KyQ)Fk=mEMnd}=@Y%h8k3>Xsw1Bbq{78cci`xtVb6z1RLW`a-dp&Ji-5bKVm{_m3
zm-d%f>)MW+E&6eoyHsy1;RPzD1>aV+^t*j~%>@7PB1)%$Q8RZ4ePy;WSH~HBS<|dO
z<SczT{Y^SKMe=B;sV5;Fb|L<HC<{@eSi)zi&)okcpCEjoFE|mZA5C>Br>>0qxF0GC
z6CIx1s<DnhWJ|9M`d+(sE%rK8)#m}_A1Aj$_z_B<eEb}$tOy1eeW%(}<`XN^AF?*e
zJg;7{$+-WicCpu(lbxNs=<b953PeWAX<Z|?(UM*xiAP^|Z?ku(zo4wa*$lXiv)kTH
z6JD@5C0q$*MCJaufhrI61o3V<edoTuG6!5@luohA%}L>}Cjo+P0#TsF<TLw)(cMO0
zF1RRQ8JI-iI7A+PW{C5jo^vgCp%^9KdIhBO18Rxb6hs`al_5V|DSg!cHGoi8&;MXC
z&RKrw;F1V=S!FXqQ_T%(RrBWekMwgt=+%Jq5QYc%Hc?<%^6K?kS{#y9()F(vCYA9w
zK(vrs?W$MD-d{6O0p4)wlLDt#F_3XMOtF6q5R<Dwht~i}?$YnnJ3I7E*b)kS`4vdA
z-7|!Abxwz@Z8H7lzCnnVz^Kw=*k)wL6{AYmwnVA4!|&8!uV}wV;))w^byXUgnl95n
zlYiyV>oG+|5t*sf@CvK*351%}u{gS-u)WY{8>Q5w7P~MG<GA%F31;+?5ja80b4HE_
zkTsx^>g_wn&!4B6uGTvK=RYJ(lKbRk#W9HBHvIFofoxn+S+9*<hxVxA;+<~Yx&@e`
z#P;y%8}>ln&{v)9LkX7|t;MbAnsu&g*E+^#;$vbiW9iF|#n|%^EW4l!aN82ABjH?2
z?rbojH@;;j_dNCZ@s3$U^e@Ot>rnOJ64*p+{^aDegPDtZ3d>fYY9Z`UA`Y|glRn+n
zLtkH+CwY}Vv4=~EC?L*Hugm02<KnZniF^Cg?Xm`3p)q@dpayD5l#<})u2cDzH0bIz
zPS+tuCD6|8XC#OiRV5`2(<{scaymLXFreB@Fn;&98Q!Rl)mAcSDD1RCIemTo0T(1a
z(kzqlEYFD;C*&n&W@e|#Y6p)><R$GQGt~r9TjWE*PqMy$M8ZmNqmI#CcK@(9GFz*`
z^c(+Y#$mEZK+}4`egS5Uk5dvhSXO@wg}y@$j)*|z`Cig(o=%BFJoesL>`mL1<8XR3
zs)7suyn;)DeDdCEQ-7H4*ZweiflJ`)8?%^t*3ciegF)$-No_y}Nw4mKA7qHhE05Pc
z^Z%Y3d0`6G4n(KkYdy&-F@l|jSVrgHXPqNgvP!Li^)a#Gpj0g<l6F=6KGt8_3GksC
zE(ePl1e8LrwjIAGl0NLcqF0y#c}du+%c8Gv6hIbP_s-zoO3J^drgPCRU%mu-Vrs-3
zc#zbevBK7cg@w)6Pjmk^?cRKn{P>)dlwsB^Y;;4Pjm50<^ys?wVdOtt-akJ6bY!r&
z+Spv5c~Xq@C9&T=+_N{sK=bxI6%4k{uhLQQ!7_5~{%v|Z^7P7szdpc#iffHsLyg@1
zfB4`NQ`3H+kHxj<<O$Tb)`YUBX@`~e{&v339J2&(=V)VO4Mg+z@BgGlGOfG)egqoi
z>t>Suu42E0Mn<MOB*r{Dw)eLH;ZkTlf0|mt8pMA(EiXQy4bV+YtZzYf_wUC_=>pFo
z9-W+wZ-yM<7gYtlj_mmTSRH%Y7)oD#_R)2)hHcl*?7aC~Dvc|WE~mn$B6W>2hs#L5
z_E0|jhMSAf8f%3zT!V{!4*vWlq6IcBP|YOm@K^TVPQg8mhQ`LVk#O~DP<&&A%p1j3
zcyIsl+ff}{`Q%Ia{`UA5jkwhsE8KK_kKemvv>!X-_x}FLh80y*n#YrTj8c^%1x*_#
zelF4%%^?Qe-_FG6xfB2%;!j4C!#Rm@uO9w>6zanJip-NhjS#mIo0x+Ppvrmk%YXRu
zZzt<PH8obql^pO|h8=tF>hB-x#wX37AboLclQup1gN}`pA<Df4o$@!Md)h=R=LG3x
z6_g7J!`c<&K$2g4_Vqv9>mQc2pb`(bPv!b?xZmwgw%oIq>G!wL_A%T~ty4QotK*Bp
z#CI`J%(09|SbslGNp}>;uu=>a5+w(`X}16QgV#P&#;t%GU;Fv<0eoub?=N@lrg>vg
ztGF^FryuMr)g<Zug&i*$e!EueZOWiJbehcst`d|+SZCQqZ%7P#cl`FD&M=6d*$;fS
z=HW**O3&(nO8?Dx{^=N{s;(aV_U$TE%1+1DAd#suetygN+dX(S!@Zi67U#(Dv<wn-
zczC!f=jVO3WHd2|0BraFfzuDt1(y4%yWYr=I#Z=Mf=Rn>48Y(*%-^x=k7A3CUm(V3
zJ}7t$wK=)T7NP~nO-N&8iAR>S1V4%fFe_UcQQ-_#(kpociuThaI8#USRV?yAE&*sD
zi(>FaC`gF_!qcnu*`y|kAF8XXYbt;WKf~Ri;PI=GCBS4@x<;Z8$g`;R2A$;N9XJQ_
zBYm%to5(<SbD;t2ieOKM4ky5(cHae-fiOG_FX=9zNj%z)*q$t>-Bt|C4KV+<66-t!
z76nblHdv=tf6Fobg{DoI@kH8mQJYehZBVIvnaA?Xwp?-JZ2NshZjPj04*5D$ETerT
z>1V;GKK{cFVDiX5lPK*~PW7VP6SBo!&+pA%n=YTqOOSNyEVi_w;uKYyo0rIV%TOXf
zU%)=%l)9bzPnakN1S;>9+Vnxe3q;blZ6Mj1qDU8|VIHJWBlRGC*+%dI=+OmbrGX6i
z?W*_sPpB+#4R$qd3ls?A*;Xq6>`O599UUFuR>-)Q{1pVjkE^)&MF=l4n=2-^cs~7N
zdS#m}vv8xr0q`|{^~&R_ZE>28_dx<ve7y>Al^%zR^<|4T+k7@*x?_MBo&4XhQpDyx
zz{(1T;o86wiJHZpxF{F%QHbCIP<I1-De;dHJ>h=6au?&F9Iebw=p-P|P1ycqBhL-j
z`2b>tQX9DN!P~N<uhdx&CEpqc>&eg`_w8*OT3gi=75ggPsPm&uLV|)S)<-5T*ow4#
z%ealzaW6M?!~v*jCZ+2ZpWYXIQZG!e;N!*Ik30rN{KnOlu$*-Alr+rw5My1M!npA$
zUKh7l`*r(Tx<P*(Q{-Ni$5%2VEP`0cAi4Lc;BWEjBT7X6f&!vjk0R31qh0Qp34pf+
z)fg=>KHWOz_2By{TXuDDvv~To4i`xz<-JR@=@a7By3vN3Ka@C@`}3D8x%CjP7DSdC
z_hG%iYITDp<N)*)B(!q6fV*QhT?`0E7$)dsXn^Hs=+v!^>wLE$`yImV)U@+Xd$mjr
zbOeu+@1lWbRz$wqPF{-)>nI*4pG=Jsvb;lOW96Q|zTfe4=4YyCu?UKeS(U5D{H2vy
zp%hvENh=diPIJ%HFl|P>`E!H{gxAY=BO@auY&!glBb^Cp;YXC_-1XUcM6x@3>dDp?
z9nPkm->Z}J;3?EFF*TCkVK3$jP1x0Jj1_!^5(o%W?;p&|MvfiUL{FhlZqz=amuQok
ze(CyfF4{esM|%c-flbD{(oIgMeO4NL2Ru6Ej-+Gk?6!c8<vl>-G*5J+%eia7hydg6
zUHa$siQdD~E5%xw5=pKfZHH?$Cwr3~UJFNJMoCyT-enl^K7$bm9F9Qh0ve<DnT%OG
z^vJzF=mx%mVhK^3pZ36E0G>~jtDx2+keH#Iq8Zv)-21VXanI$1B@4EWne_pWZ_3ft
z!>i+4mJXpmfP11Bqfk%+|0g2iV(tgqYZkWQRDT7!g~_J<gR%5x*_}*{W$E=<(Lgr!
z9Alq=+<?G$teO=|auBh)TT>02E0fzl4UwUahk5{P1VO;<;@HWul$xz-k*iRD2c2R(
z%+cJ~2w<=W3X1!nKksMe$q*6tV(^KDGA9?f5!l1PAHpB}0{T57rNXOv<(I!-aaViB
z{qxwPyP;6;-bdHh+o0f%HuiP{ZJ*#ap3q}=DbisoSKYvaT%nn6R`-3RHQw^F!}ypp
zNibh4vykXR#8oo;-yUE}U0R%x8cYeFSsw`x4Zmm_%u&^(RvXYKWv0@z>u{xZrp6xR
zCDR@3<(q50H2(65FPAk@HZ!dbV<Srw1$mAneBAYp9qmi~Vdp8YH9UamH^}Oeva9Jg
zpC6I>q>zqN!mZ4afCe{PohRJOst56LcB}rn5m-`^L{E=x^C=8Itd_Q~<cKdFOY;Dq
zdIQu=6WBWml=OP?x9t3CEAbaM@k>x5oAw5&^=8~3c3nSluayri>D?ksX>?0dYgu&X
zyR+wMU69Xd0Zd?V(oS3nFLgYLb{8qLZog9Y)I&1yy2L4A9<Q#902*b>4(4O!@)?P)
zJTJ;C7U`>xZUq6SP#Zu%_V*}(VTbhuNro|aU+9wN&6pTcm3v?`VRN~rsy47`*0mJh
z7}W8}1>|qGFogI1j0|`n`xC%c%({JhM0dobq+Ec2{%4GwyL)-7r})$NX=mPx+9j&R
znBjS}Cx7`17{Nv-9oRWutP5cg!jx{#gE_F5&>ev!-gDqJQ$T{2ivx$2PUW3#pA}uV
zK0|l_;l)AXyX5PGryj2{pd9>|*p_B0D4S$Ep9-*}@c>9kNm8TR-+-((5dkC7g$#(i
z*SuuU97hgRu7aLXX+!~u59C!_@pp%|Gr1b*p}+Y47S!py*ibDDbHea52>ma1KOCtK
zO*?!>ba`W$=pu614_Jpb$KA5fvIWd}voXg<;~MX@wtp%!StNKG0HTAfjIM#aJPWK>
z`Os@Nn8qzYd*-I5F*<u$v<`D|a|1bUu`tmAtD6j2G*sGcpxVnLDUxHXppHX`{Yx@+
zlnV?yKz43S8E?@c@X0F=9*R%@P5Qz0b6owm&1ZDU`}4lQAf;pPhrap6kp|n7Zz_li
z?RcbMW0TXB2L+tQA@*5botzuM6k}O-<Kh=|-3X3Y)wJ_BM!Lm~;X%yI&EwLBcl>rN
zxX(cy(HRLNHsFl64f4*Y6!JP^lu;JSl@%n4l|55X3EWumqmgS!!VS1OxSd3OoZs-~
zS9TVj<2e2|sCz+(WwtxIExpsV^czR@3ZJ|^q#{kd0U^mmh4bYe{T~ovyl7;!c7?Kl
zu?JZgd-OEKgX@Uev+j$Nrs6Noh=|Z_Rk;W>hotLlyqE(t48HSf`ZauarQY^PzAxdm
zFCnP07v;D;mB)@@_@+}s@L_!DPxB?a51|mAA&6&JF91rRluFUPYb4*l1_AtwWG@{N
zAB_tdblqGXZ-L2#=$&@{@r|JoXR|yPog*>M3rXKkTg7;1C~u89v9pgX-3~?UoBU~*
z__X4{+e9IrjoG9WkJ{<^fQALBH?6Zy8_s1@6QH5|K%{`IXXG}5MBFRhTH9y{kUJc2
zSi#VA2N_&L*et~g@#oG4D6abGbteU=F5adrte1Why4W3k>k12oPr9D(rfX-KDqB*?
z>9N8let&;|Aus#KA)%qktd0QJ0ISWw5)IV}*-U}@)QrrrHiBur3Go8#NOTYC0IG=(
za=;dNifG*G7q~)?-$gDyd|Zm&kf(_9R<`Jz47;yajq5#%%bOc;F{x||TCBd&fw#|e
z`JVU5YV^Fu1&lVv(?;M23tc_ZQU<(pmzfHpT3A@vx{|YMZC#z+p_iLIl9xHT;|Yyw
zelxSz4F)r5eu&BD#q0VLr`|i(n;mwWc4?B#51>k3Yo@jlC7s6Iy;YY2bV4__^rv=X
zgaK_nAJqvi5%NYi`iw97FD;9(H7C_u)=`#4jEB8OT_{2(m3C^>(*D7Oc=lPJoDlr*
z6?7psNz`?+_C#2|xx4<Ac_}>~LGd3{<;wBwm_&0wx5U#UZcfGNqmQW?@}^YAf5x)#
z;g=WmGNOVCgyBW1B?vl->yMwfQt6=xtSWTw$!bq-=DCf;zak#^WYnO_M#7YV-L_nN
zadUJN0+cpaS(&V><^@bkYpe9dYL*8`?V3Zx(W*5CyG-!`jm5+1$!M+PcA4@D#a+}5
z{Iwnlgp+;g@(;y<`If5GkCmo1)F|Yn$ELPnm5j~2c7sCK7qxd6(8|&LWB@S`CP52_
zoHzjZJ89Q7%gzhY=kSKel71yMdSV<oLYL{fvm%YI0{103+`i&M>Kv^A!V&Dz`2)Fb
z8q#VvFoCVJ3-6XA{O2RqIyEP=zhw?z)+TCZ%^c-3c5Stpw5;iI+2`_Eq)o2IT@5*L
zS-Z_a$)rtjQ7U!H9l4T}J}llg(Y)m|Dz_cQ?momM#7x;%^>`>n^qH#`3s?vDcqjB~
z)OkFTAW}=(4*ewMcC;bNLzh$1s-^U4PBCc%IJv5CLR1<b$|HW%S>@gMC!$oU^kT%?
z^c#z|4V>mA^}N3H5~2M|dP#?blx?(I-qawzq+~0x^Yd~sYEd$H{nx38dw&tnp?^S&
z?p}2;EYmswq66g%o|b_cpBl?o_s(ry*2tU#^9Sww!c|z}RiwQ;6FeN#M1AzKA{rY3
zx5Y{CeK9!d4D=;H=PR9C>?dx+vqVj?SG3W-T%pL+xf#D7Y*G&QjLh3lXp-<q;-qZ!
zCd+gCYIr3XdV0S=YZ+2X466d8J!ls^d<eh1JR_D<E>Tv=m0qRe%lL;QI)dPL#ehRE
zh+RTSSey7h=-b^Jrtf9gRpD=f)pc!&JaujhEF)kLfS{!sBY3B10N^+%06?V@K(z)g
zA;$c47#^-+$=HD{PMA`kw_jz>KCXuJQC>c%vLwk#UZve_!}`tV)H%qp7^`|}E40bT
z$JEvY&Q{*2#hPcE-_A;3Vlb99z{GJ|Js+=QN;FfJ6sD~ZRvI}atI%sUVw4}D_~Q!5
z5`|^_(8lrwqW9!<seszN(SmQA9p&_($Mp40hstI0sp=}H5hStNAnW<^mq!DfBDAFm
zv+PRI<=H+v^4Wm~#&zkW00M_OCNif~Z_>@Zerr7DY~njrPj3$w^|m58)nQFvNs8*c
z*9puNYuhT(U2UzA`aM6fM_DpK$4xqJ43iU?-o>5B&FCS27QF>6*GDd=q^3fFMi-Le
zGmn*A%D9B~8S}rSbsfg90zxp|FaUKgkkYTt8FFk*d<yn_?EYu&W59azAz;0vD{IGm
z;e(3%&MmRp%w5t#np)$09b-9#%;;v9$B!SY)FplR3^IN}gj4I#mDa@`<H3qj>cm}2
zj_&|Q!I5N{fL_V#OYE-2i}v*j_OFfsB-QMw=DnjHIB$5P(PLB&d>dSWkZ_`UlypGE
zP1SF7JZ-kMxpD06`TI@4iGijs2<j*`<tE7CI?st|yw|Y!2{7zTcUguKK<d}wH%!?|
zmpEJF5I0l7AtBxLWL~;$>bU3HTJxp0uIVj1muffs!)nUAJjqhsO7nFj^%Xu@Lds=f
zewExbye=IdK+l_@J8K-Ws|4+mv`>z>Q&xYt^p%oO#No=NK0oJyEwx25X8GX!X5w&M
z7ctB0-n->@oK@Vyb8lxlj74uEgNq0}^Y}T^R?@yxiP^Z7&FHK}jkXcPE#i!4!&1kN
z>ZZ!zjmcA0SeI^HzT=%z>`^r74^Q=Xsb_O3cnL3W`4UcYj+`9)Zu;fL9ws)Ct`5TL
z&q+p3&xhiJ-yed&4yt##PN1(^6<u!fk{w*Gvd|t%+jUDF^zY+jFvPAv*=osoLc!?n
z6%nLpgt#D&ZH@Q^^kJsuP4C%^DG_l0o2~HUrB~x9JMSAszbthLLu+YL?yy%T_E+as
z%Is4^LU)3BTVif3M8-VGL-hja)li45-5ufD3^8dpPb|LH(7y~y^F(K=a^iwG3J+6u
zOaSd2noup-!;MxCoFz?#8rGzGB%YoO|2eKea}>=t^u|94P1oAhW-RXdI-SGqfax}#
zI&lf@-7%v#6+#es@N3IQ9j9$KJu|hoWbw9JcCac&n$(?`$0GA<F%%E|{@$lbzEPv)
zP&D$bq%RzO(l<I_X0+Ie+~EqGXA9;B(*IbME?@7=_=MY%skfbjmN7L0aPxX3Eu0<$
zf3!g7E7`rTt2~x3a&s#yvG5z*c=Yw<Ij=QGD3w?Y9Ygh`{G{0=!2%1Qimvi$rZv;?
zAXZhhAKbf1KARZQvv$o4!sN?K$=XcgbFLphepK6w>GmaIs?`Oe*KoA*UhZ-?pO44H
z#G5?suuw8vs@O$o%<Xs9TFD`2<x&>Fzvp~1uz6)}xW#eD32h`;=HejLfDKM87yHZe
zir$^z0d0AC`H&>V%U@7am!=Y`Jav)8gvsN$N`6JVt=sCWX^GfaclYn?ZsSk32XI{v
z(`_7xAFs*@r%3FT;X1weYUf*IoYR0{OJ(oYG<y}Lek<=5QaJz+&^N4!Z@PwwdW?JG
zK!Ji+l@5ybws*Nk*Tr!;;O?P?p(i7yD^ON&^9!be`*pRLbVU5qLDuW_3tz5%l=C|T
z1XDFQsMRIN*O?0UKZVEuF}c^kA+X5#^hLFJ3&`7k^H90gA90)?+%*!lZ&LzI2f_D8
zbnct3cU~Yy&!v>P$M>e<TnOHF-O|<mXyU3*&^1>~xAP6x*+Gc%U;AKsz(>j~{`yWN
z9^}MTuR{jZHL!Do%c2WB9Wg2(TsvOq3L38Njc~<O<=5mJcsqT)uZvVj^?04`+KL>i
zsL`qrR`4dD+=e@KH<8?&vzw_!>PS3N(h40pv02>h;jT=1CF3gPHxuezb^ybth{6l>
zIOu4$DLP3d^qzKl1(`Ix!+^Mvnn(L0^n?vH1&IHpOoa=@8{|!|R>$|E1Fqi|WOtlc
z%u}QDb-o^N0NM^X?)E#~us(WrZJA;R+x4O=#t^8neHYM0D6hq*neqe5606mb>E>!O
zT8vX)zIzQIJlvFpmqhfPyYBS2*VFkw;VYUYf4;hZ0b>YdmvaLcphmrhbbuYHH)A~b
z=T)1Ze}M&X0W=@TXYPQhu+2g{?-$BMNs42sV;78jnYO40@6HF{N2w3)9DYq+h{tw1
zpw6o|G5_xo88m5#^?dlo&fKSYIKla|C~3OGfeZa~U_YN1F^{vLsn>NyJp_O3Ji0oM
zoEYal+t0C@bl&sU6hTri=Kavy*x_)ajiJHYBRya!ezP}T{UXp6W8i1V(M)fBvFE^a
zQnQ-9*4H35(L8`!ATD~${a^w8GZTEQan)y5pz%Zas~Z7mKPZQ^h+EX8EwCqfgFYk0
zaaiV}fySjw)D&%Hj)T%7L#uZ7P(DoT5A(30ZpKdp>Q7eL{k1$|SH&$#-I_PrJEGHl
z3#xVr#|Z%Hk7D=JM;r)Rvs_(p7K^C*wO5GG<4a==YP_q00>O)iS}nKR7mYvIre2Wf
zuYJvDG!yr2d8$k%hiaI$Vexvrlp`^m)wNN0s4@4_9Evx1<5AIamtB=9D{Z}WL*9<^
zgs3_!9Z#;><R<1b8g_;9q7QLtAWe&m+ZOtHFa}a>#6LXr`RCWm8kcEk0R<0!TQcpz
z{31IB6{lbU#=~UGozF}fp^or(6zM!G|7&D9JJ|jLtSfp)n%86Z_aJ=6RG)bh6vVHY
z7O>i+k&3KZ?0NW-QAr%u|D{k=b_VNA+;lDu@1e2F7-NuCAdt%DvDNtlQ4qOYe6m`9
zbz<k*`zA813wom+l%GOmr4STv5qSMDx4F)q{c;^62(AEjHVA(fY1I3LqdmQGB+IH!
zYBcAejhAMIREIKCR@c0#>C4AQX*fP2hG`c@J8j%O?h4hYeY2hNOI*eeU+<ysK<VzU
z<o0rykU)EcBJK<36J}-&E4^GkjtA8Gd9yAn6S2ijx;7)2UmnCfFAtZtHy1{F&K9Gx
zbIl=%)$ICw?UqCrRN?f-2u2RqhftP&p%@$G>uN6soDy0%b8Jb8?~{$D3G>L;NlU@4
zCV?6PcbXp^e5Zr4B5~+lA~X-CpQpHbg1~#2^}5AmSLWEMSIMG-57UNTD)1_M(CG+G
zKqkj7qu*r>UGu1H(e*G+`bC>3$6+gNdpu~!<;4D44<ipsd%$_+N25Q%Uz-FN0(vF5
zczK(yV~&Aq%w4l1r?7U^#d@Q?6*w=$=&c5xIaKy-bJsO4_v*wcniGKz4+RIXo-vdc
zwtcmU$~gDesrKj*`w)bwe4fjonq9)30T%8x@14uTVgp8s18e?XQMCHKl!#A<cGlY}
zh9Qh8$w`OSo|cSnC?=Y}UYnn}px#@OC|c{P<Td7oe3{=%QTLQZ`l~+#|NbS}cxZbW
z>qr{=v-(8*U>AU*l*Zh1HGyJU$9Z|8$4A}qc~tE-mj#*mDL1vCTtX11Of^`=`J+`f
zz*^k$6b#2%@4=!Mo|uT#KQR3H`7R(VEjv>hfNoIHl>RD<WL_n|S0QQ}jDH!aN?fk0
z7F?T4Rxm2n-Y)Y|%_BNbou8No_vA@&_tK{SB$g1`##X&vabWl!p|b1k>QYwD1$Q5>
zwW=8)W%l)>DZNSL3Wq`>)e9bB`|O|4yA4tJ^XKCdU>{Z0<huvy$JV$XGD5yeDS*`v
z1|_pK3$3ZUUOvDNR1!&-Pq<(}geZKC*3CC^9}NgNn0u6w*<t?VxER>`!WpvfRA;S%
zr@JLaC>`J_$OrbTqxh?#@F#wdqbD%spT<+x0H{lu1g*S1Gg6w;L=FvYSyGwpSDjp6
z8Zg$}*sR!(;d4VxMbB9#+KsJxuP-$^C+>KvuyMP6i(bt>A6)`1s%9UuoCFRhx>Tbs
zHX5NUP^A@|&>#eTPdMv*CwHJY+*QGM6X~84#b#GI2Mz_NM9+ym$a2`)PADgi?E8l9
zU!gm7P-XHk-2pb0SD_aC%4jL4sI_w-yUzVZVw&v~Fb@tFUl}P0OsGr}mH9EZ^P@yp
z!3Hu4PRw=>`-_WK&|2VVWWZ<D`<9#X<A>OIe8RHMV!n~&7NW(Yq!K-;GFH_MTr)j`
zxBB1ozAmW$wpx76LhZ%*_Gel*HXIWK622UTHYHsDa*y{&0XL`j!rU!ty@|S3MQ*Ke
zUS*b534SKqtH#)FU*O5fM4DB!#9|kolCwB5tiE=UlIw-#LvJoVXIy-+I<@O?zh_gf
zpFC-w)Ycb2&Z<;YBv?C97bCOK+W9(FuZ1#wC}l-aiGz-o^D`bZ6+^Xg9Ig|gew@Pj
z&KpdkJ)2XzTB)4wBlp=;X3A*;l`=J>J&nT18fs{rm-X#%_t8e}Y^nM8ZY8lLGd*!`
z6QOnS4IVSJsX)<w&#hgD#lqb`C<;#&=yzr5RuuIZwx)b!c0nw%wweeJc$>E%cy+t6
z@eLI-7+nGHE#Jda1sb$XMr8SFl!x`!VgYxe`!72mm(8qtx9PXo#%SGy3vUI-YhFC{
z-hZi{5?$^PkWa``3KEN$qgAN~FGX1mLh&szl#%q^5h4SaP%LW$PJvk~LBfUZNC7A6
zf-4xvypQoN=0ZLT^*)3%L{>OW=|E>ObXJ0Gdx>`5qT}P8f&3k+@2?I4!K|SSq7w}a
zLlDYdGqE{Ow4Vh#oZGFNuniU1t5H)aJ|D*iysO7$X0y#ll9Tp`|7rlE@Z3o;GgP*W
z3;$1X2`3_XfX!##u+&SSmQtAef)FK%={_!>?pm7?%XSg1H;F03P);@)w_X~gzk4$2
zGm2J!{;(Y}rts-h>*Cze1SW*04pL>^Ypjwh+hp+ppEcUXxY|2=(<$*Uex%>U-tQMB
z!W-W)?aLPB9#x%ei>z$Wjzg37xrMLEZD5SP$6U`Z{ZScv@qk;2>JB45I}M*|8$-_l
z|NP)y|2meT+&|psDs>TT;{o4-Os$8_1Pm}svmO_{-{PyM`VY%2l5ian(wSPPP?v(R
z(kt!fSqwej3f=hlI8|vltyyir>8kg5;={sg*KAv&$ZW^3r8dOTUTxIz3a{QUVT6cn
z)6dw#UeTCJ>y4fWKD>)W6~cMi2rbMdB8H6#z=x(9N%h5OUBAd0QmN>)eb3*VaMCVM
z#KNCSIOhivW0rqCl_=_}5NoI``&iTe{yj$xc3JHN(VshIY!Ru}*dEtm467{L&uD!%
zo0MBi>H76vv1+B~#Kv2pOq;uRu?NOfk+`U8@2RbtvVp9zMA(ZL6IhI^A5C?M`BQPe
z!L>qXZHau^S^Z<~a+x_fIj;_|G|tEebM%91l`Q8sS@1641;6DVaz{s&npUejmy#dt
z7}3#}xY0r*+@SOxsA7tCH;(&NRp{SlW4GQXag}S!JS_6zh%@L^P_~4NzN7bHY&D*u
z`<yD9(r-m&G@3y3{JcE&#BQKNtb1}MCM=i=H>JWLID)X#<EADrUkmtg(X1S(5KuHZ
zq}){!B{A*H_faED4sGGzcGc$=mu|4OVL95kg`|>xxF*iI@>`I3KiEwTk!o6cJr<~;
zboO3jHzrr?Gdlc_2t>(s1j%dBg*cOwux8gW@D7k<sh4w(%VV|8E&MH{`dy5aqf5p!
zl*C2TE`=HoqXpOM_!&2!&WxI+xrl7aWy3mZr=8#fB6rkAqTN5M6!>>57e#z@Tw(M`
z8o5nX?C~XyV2+c^4d=JoV<ac{d51qYBG;d+QA{8GQ;nnVmnf-tMb(U>p8cw0*C+K&
zFT?evh3QZ3Z^QdBm?ST4by@^vrzxp3U0a-1$&0L9sFmQaA*p>daQ;Rf<xNbUb6bt<
z&97c#m1@_c7SE67SC5HPruW1!I=Ia2<M(4E)KtB!>m$Y2t+KS|a}6F38X5`Zn+aD_
z?zk9i(J^vgeec4ribG?Y`Q}?z-FC#N>b87z`@|~iPcSD{Ku5tOuq$AepnwKJKZtGv
zn0F!+2Pk?Yz^Oawdr{e}Xe~Kn)sy+AT%{pte3fbJ3O_l^fS-9(sw#4Mb>G0FQ`P=5
z3er@2@Lofil$M^Zd_MTL_LtD^BFFnmndY&i!M$UzHDpoHs4ysV$WU-(De`G`><Z=l
zu6pu>N}H&^SItXO1!BIp8o`y+L7;X%X#0FY-7#$|99Sy@B!y#ws!g)?#&mCP&NR!R
zm83nls7>M?HTn}9QruhVS5E*JAA!%tuQ_*9PVNc8L%!r@bXW44uJF>zZ1bYcYm+6N
z9(($vu1KxYd5k1DwBYUO$Vfd5-sQOQwUORi@fj2GRjy9K-oEJRpDma6sK~3$a2xk@
zOKT^0_H6~Qw%Z%Hf7(~Us@i-`X}G~-YO{2sFpko`Qn@k1C`CIwBVm!E8>eM6KbF#*
z5^%caOTg#5-<<7FA3DKqAC>3NN%c_C7~4^kck9#H?j&7)73ApstT-yw+&hBz0Y>}I
zR3DifHApK@FpmBxa~e%#D`{R1{n55LTWT=HUeL76{XDNv{BoxYGFYtc9@78zz7YI<
z%fx|wiKW?6Qo|e4CY~9h{X%Cts3es(ws1*`I@Po2yU<|!9{eZD`AC-SdVDu8dUAv7
z2U=k(DsoFH$8KDkGES|ew9WVEP0&IS<U!QnPNU-(si6@aQeiFD`_*{wO9tJ?K6nzT
ztdqL5yUnN8U3$?SC$N05e~f02dfsc3aE4CK@?FS^e;n?@m1a&WInK>fjV;QoIiQkA
zNOYKsG(I@c?x{0_7JAd*at#xB(ah+nHD6#Gf>Mc|dWc+mzEz{sAkS50Tx9C;80Y=^
z+{5Bf3+p-SgBN8RZ7=QBK{78Y>FhE@&)uoY@=CCqXt}X)y;oNbseTWm{UmD-EvwD0
z?umQt%zVFum7^KM4(W5-NoXJZ;&@Hce)m}S1WFrkD+hV`<@pzc#5X9mDs1$Nyzh;G
z2G^>MrU+O2$S-V-Lh!$Q3FUVpv6Z82Gu4!QIeFEPud9p4eq27j!K!F9Ke9CKzd7Ic
z*@@WFY%3D@zTWOrt+~-tWmN?vM#=5TbylA%2;Jnbq>kh1<{YyWu6Ly;1H+6>u3kQc
z@=)<5B$lB(K&zwkcjxNK1qV<b=Nicchqr|&bOr-1B&6pP<-;ppQRe)2`)M{!^?k90
zqHeviHO{|wW1RM(rj9Y)Aq3@2C<=*ONSoVISS>Pfndym;Vmqd>f%64f^wdbt|CBA+
zHt(N`h-&%K@L91xN#aS@icigaEv_t~-skffG`}pe|5Hc3<mWHk_MJrz70c|7>SWsS
zcbf&!tSVTa3$qH6)!#>AFpfmscGOrJReLXjmc@>-p;I+qFdl?E8i_g~fzvl@HXaxq
z_f|Y5R&Sduiwwnwyda!ILtiNfk@B}aakckOgd}))>6ShXd+~x$z8k~kbMdl=CnIM~
z?L!bR|G<>|Px11#o0hGBUeV}}Xk$(xH#3~~meH@>XP?rCV5EnOHSkroh@s23z~kv{
z-8v(^%JC=cd}Wb*&}aKUwc&4)JkNA&)v|gg@RknICn%!aU!{4DYrmoihgEJrzv0K^
zpCKW*a=G!;so}mK`<3R9rhdP<ANkuEm;>)#`oz09SIM`CpyYaYZa;=ou)Hsu5_3fH
z2Bzi^=f<z5eC{-s<<}b8*+ggj({Ox4cu~4)leVl4_qA)71o0LLBNS~k+L(g{(+|SM
zc{EtKd6={d`p)uNy99H1aiKZAu6wSpRQbhY<-KWq!)T%)=s&sOVz7aZRD7wMTrxKw
zpDlp6Fubm@mv*>_f(NnMi{3_|cmdAV$Z<u~^KPx_CK1%)-<yD&T})^>J;@V=&$ur~
zL*e0+2soDm_&jL;EXF)14<z(eEbne0BkUGAWTYLsGT2KC9h%=q=o)VXk3f}~iu=*b
zwqHuz(S}fVA4LO%e}S7DFXd|HM8+{=N{;TId4ZZhHXJu{C(Bq5V-Tpp?NL=M2rm~9
zb?;mdn3T6wZsSiR=w#|t&F7-wxDG3PsVyQmBqZbr3wrc58wc10wl>$SfBp4H;`O0^
zB=>oRG+}EIMHCxz_q{t|@VpBCIYYq2xNIMqffnhyRTMRt0B5}b^J@f&3RJl0zQ_IL
zCAK)n5JL5we9ewszdROk7Ti@Hc9Z=cR7004_chWeu*J3xq4ee@C?#P$!4%>EUHVf%
zVBbYM9s`A_4ZLG?yEX3fui;_qp332MDg}<@i0khcD{-1~3&X<^0j@yhj4|oSW>H}l
zm5_A-r@|v5p3n_Ch%KY1KbXPgizu^C1|JL=*G<MB4kLgmB^bQY7~Oo~(!x^Xni8<1
z2(U|XtHqZ+{;{9>8k+rKKA^%9p9)pr(5rMU==U8jr#G#*%n)m8?qi{^;^eVNS<?E6
zBbSjOi0CuunGOs4(H<^|r4v+%qw+|*?5E$DdZ9JOqiTSddlkB&z)cNho)?Spx>cMA
zRowAGSM|m%2~w9ONr7|Y9L8%r0j*u~9(-iQ^{fNH3Rc_n6{3RaXDdOwf?hB*Y%l78
zv<S_VGjp!;xLZzJy2jlSq?A}Vj3QGzTa4%}@lD4JOmixcJX@EHH@n~%l^<j0f?0*L
zz{Us1jkp2_DQp~9!~v%xK<7n9cs(>|i2{!e9p-Jx{cfm89yIjVdl7wPh+{K^g5j_>
znPBjr)q+Jp(xmnv^>xlwkja3;`~*ri@QfWMSSx=xMreiJc>$g8Fu=|4iPf9szL3AU
zW6{W5Lz{QGu887Ua2*Z*50?@9)rU91%?pNvJZNb9d72EJ!QRm7f=h6!zG|g^B?JMX
zSHI*f1%~<Mcdq(eWf<g%!6F;4ug85n%xWu5e^hW^y?jX?nXL_eJOni7RKu}Ed^&IZ
z{qdD<*u`F%h3J~f)g}Ri-$6wV$r}x7uMewR;v8R$ls@{l2HM_ryGsiep~98)(*(fC
z^aRuMTHm4vS|9B52(3vnKCqkpZ42BNvwCvz;7=Q$%3mh++9?NfOxc>swI#Ayce{@+
zV4Lc`fB$JP0%wQ>0%7v_$2+LdbLe(1P(Wa;GS$ujlZ1oABA`oCf$f2fjZI4|8YF>@
zU4LBo*`MH2Y9pqLqBU@Ha&d9Rh(37*4U}Nw*Fe$0n9FtH0{!5Oj-Hy<NIXy+eT2_I
zad(uGZ;m(GZf&x8EIcsf&898rZ4ev;;(;i|VWRjAtp@H*bX1zP#*+*%hV)h60bH;X
zP#z@`%Tv8=8J2MVRsTmTj|N;>v=OcCJ<+5Lf%=>w-&H?&Vb7kw6B=2MSCp%2b&2K>
zoijRk{3`C@J5j+P!h8b4`t&k|(CC)3AYoJBv7E;t<q1lW5fPL7px`T5&)~QbdT7E0
zYwdt0k8bd+4nRjPY)_|S1zQP-A;LYLkI=i}X}8_Gp;!VdrZ+FZs49r+f-G@>Q$b)-
zCfY-n6YyY5s$gvE_Z;t$4|8D;Q16S2aQmE}a7ki$tktNv+#|^tZ9~j`+>sxBiM}}S
zx5CSVukAZc?4M3+&LXbhZBPAJZ{>4QF0EyOP7S3)m-*rKe)!r4U%rRf34CJfzNL^O
zrU^zh2eZAl<g!J$Q)dgvH)WBAP)V@<k@6vh+{S)&0d1b-bM0DgnTxVK(iV=U__t&x
z!{b|)9HCsAHUkX;iOrGZ|0@TXL<fC4?YY0cG$20rvd0GN@3Fwx{T;>9XBX3}Yxo~v
z?nk1H1@3EI6chv)0Jl+on=wfkQR-uqKJ<c_4HIYh`9{!W@1H6mh$iTL{2yi={MFzr
z@}6uFsri-g^R?@VtxU?h?g*cYMALT;B!E7Qs0*olg~sXmWHO%XwC7HFHkG-V^MSv~
ztFL{IVT*K;xRYpy!~ct~>wu?vfB%i!j!LCcsE`oK450{F85to|vYjJ@%u^{1A(`1L
z`y}%?SuJ~Ik8?QLd+&Mv&llZ$yFdN!>vezk^}AQcIp6ac&+~rXL*I5~sL4C~u3krU
zKZY@SM9*={_SHo~H)7CBg<?;m{;+^2og~d2vPj$LvS&D5N8H9FEHoS2mamd%@q8(4
z5Vsl1xxeu2JeKDR8E-!r>u<CDA)G;f?I-jgf8iz2;=3)~h?<-58Cxw^E2T`5`mXtm
zgAy)j@SHsL2dQe^mP}6^Kx&R+tOF0tyB!zj{_@z)%xBj);r_BDn{vVWFwHXiDz)oB
zg;$RfMY{gt$oP%kq_)%$D(>4n=iXw1qr?9$JF?iLw32nz&@C}u<AY4EC`AeuKLbhZ
ze@nO?>1KZ+Oo8j-2<CpD`9XZF?B|R6k-7{edwx|z5{Y`|SY=erYrB4dmE5aW&@TJn
zbGaVsqQ+-z0xOg*zVaxVvj9`XTTv$y0-t>C_AF$!SsXbWl!+=UA0Ipo?;W{Un*Bm^
z&6XRm@earQmZ~>5!z!5gaGG>~4?Y7VsLZP+^{TNMP}eEQaeF(2aN7!O75qiEni7?~
zp$<BPJSbGe9l71`d9)oUvX(2escK$1CfaOJQ1UHBab0VXbUJpPb^j5p2d#*`rQ>c<
z-$NHykKkD&p7iB0QPa&)cQo+E1Rsq(_z0Er|0yk@Ox(&8J*=B!AUiap?bEuM;Z(`R
zN8X1(hl?EKJcq`GX5|9-Y&$deF7e$?{}O$8P;DoT)+*`j_v#j&P>1oCQulqAmYT+@
zy|W@zu3WixYpuq6DXG_<P|?_WzxI2-RmNfH2PB>(C`~|fQjFDqqb2kkzYi54#rvZW
z)xZ4QLo>%lc03{Oqr$`o7XnvSkjmrrohIIX3*Y+PmvFgy&g^>WtxRV&dRfXd#q5^H
zmEXXd1C=xF8^V}pY50_xE>l<Ib)>v>!qATYjPgwOke6K9y1p;mC0RvJYhR{ptr%&{
z9$hpQYgvh;^a}M{b>I2Dpk6CrB@JLhq6BSPgM(j^*UI+>VH%1N19ippjB<_CnAzlS
z-dyu6;a^>#d_T1fwg@{AE?2*8%UAMkz5$`bjn{+Y<|;2;Th<0$^siO(K>Jd@6_DD#
z92zAQZ~RmWY9o15$Pe2|&>S5Z%?xIQ-vN8m`sL`)G{H<uUlVVGO4(jl<;NWt6QE_<
zXos(s^F?U$hJ@DgZEVW3^RrY;`t+jPx~PAB-_V!X4)fmbjzQ5J%h!oCldXD5!WSi9
z2snxJyMi8G<Cm?P9)Z_SJH79f3GWVV`kjl{=AL_oPAy<a+DF2~mT5tC17{g5L1>F?
z?~m<5&TeNHVT?nM0LTL2Ozh%|K8Y*Ff?Wf=&Vd7}Vs*sL40u`rbg9;;Qx2NV^7!g1
zCWtZY(39IDxg%`6O+bm1-sI<XqwZ7<fKx&LJyf-*`juYdgJ2V#SUYWyyNHC3J!-qv
z<BgF^$)%s9KODwYmAQB}zBA4Xs<|XR>gbW#QKsl0>&J{sRgLxdKH-J$>7sryR{Ysp
zlyfMc+4|qzJQ>%b^GRey)Esl(c_5gli%&7ja*%HAvEI`)%`_vYqNBF4@f&ka!eP}J
z=j{Fk8pHp69XJ(aTC0S$w@C3#IFvsb%^Us5!V>jR)u3s|+F9=I3S{Wl(&2p{FIf_O
z_KD1MT@cQW6OZm?Kun<i^9?aZdS{B_Na0?dmsaWqn(n=O33t}&s*7%_{?glcKu^bU
ze){`^5x-lI^YGi3f_%9Nky+<76oa{{lfAlD>kTcVqX+$s?x$nsdAGy<_@5pZPJt~(
z+Dnxl+72rz4`|iT?AcxL>sG7&VyJ31kxlQsP?Ty-tQcw9_&G)om1%#x+qre0D4*jL
zBl;%Id78-btrw+#?fsbyNAa&D^7vBud|55rCcD-D_q1N}&KbN7oB5uz374YENw}?z
ze-x)!2+f8w{kqTuSLQPIGq-5QRBG2mlvNS9EMI+U-e{4pFHY~!5JGO%XBykOTX^H+
z`D#?FOPnC~?a`q_w2q&q7rHAoZJDEo*#^$`&#!He-;cF9DgFKYK9<ssrESw%H@ve_
zwJ)!2|7xQ-=iM({s#1V9y}{+BL~$tFNqs8%7#lxxJ8pBQ&r4@_M$Xm!<!^MBk1;xP
zxXHSC0gLR{3B!%C0Oi^4O6^ZGex<6IV+&g2Be$q#l-vU{>6uy9Hmbi74|TE!R&9Bv
zg!@Re)!42>6iVZg8-71z#u&rorhub3Znsn+49^+UPTNY&EY=H7qMZlVcRiy%-OYSn
ziRUL>nK1WaWg81TmxW`F+Ah{UT<FR)nI@ox(3V1WmNV(bc-9xgjAzc^Zp7MwYbD~{
z*LfPZI6G?Fr8fPpl-JkDrYYA!-IGoPzuXtq-dQv%+!f3RvfpF*%YJs`WpimXKdL3#
zqzO?&EF1mS)Pv90znXfti<UwbcM&RnPdPEnd7=arB}u^`kA}wa-J3VJL3WkF7NwrN
z3y4!~1H#UZJ#k7xX8OGW7gzu;rbnzahwt`KJfou(1echz_*Gr<+qXk>muzj3MxMe>
zW&8V)s2<ATsUhNr-0g9aw^F>0%WR`W3XIGj=g(}Da8M&$Z{^5cdWDTI$d6F*W%UJS
z(CkoilvUWa2Q8Jw*Yf*giaz8mg!J`k!v_U3spJs3P{(ljpra+j(EJSs4-SV*G>ka|
zN$)KI88L_>t^!G_ks&Ze1r^Irm@Wa>Ol7*q*G2o&5+l;3USW`o-b<5Saee!~>ok`x
z&gU(*#obI<0<R-8j?|ebpvbBxsPuz!zb?8$Bk|-4kZ`Q2j)8HCjZNlS7i3`2lRMjH
z{bk#}*EAV~o{>w&%GZlL%9wE0gU$d46s#;SLLYV(AHs)f0SyZ1_p6NtNzjE(z!+Z_
zhYo?}Kf<(;1e&1H=|+c#mxQ+OYcpZn_3b$`H1=%BkP>L;9UUD=FA@kI!ex~(H;oOo
zm+=E1HIVyZpcD4KF1QPxaUAEKSFZZjW)tanS*n_>^(z9oW#-B;SE@gLA10>pIrq+J
zuV_D$#IWJ97SGMU)y^-TNDS7FDSxkDN>q)n5x1GV{|uT7beX^CFbr^cM+>M~D^-$$
z?Rvm$^)w7iM7n)$r2C;FGaMKCebX&M><79Jv+3MO>8R(kDrGSYeV`l<U_)8XaV?`|
z6L#>RtOUK5DPHW^?iPRGLK$IzcXtnUmtQSm>gszL&t|!2yFL9_Rp--duV;XLr#4u4
z@wONSTeuphz9`hxL8;}igHd4;jGv=b;uFh!YhQiPOu2j5E&kSrV9L<<=~nM-_4d$S
zP8aeAn^G`R-jnFUXL-EzUiX=pVckz0&Sf60J^`DfXsT`Xg>;21)=Mr|vF9OPoiRzI
zz=Yg#=)7o7qqyPD`CdF6l9Ap{yH7@zt3rI!*>NLV5xhz~myMN7ymD;d{MM%jK#`Uj
zO@pVn6OFR+OTxFu1TF46#v}_hwoJ-k+0K6;L^ghHr(x@ZF%?MPNmb`_*XcO86Pxgk
zTm)zc+05YS!kaDu9%YqaSqLhpaGl&wN=kX#g^Y<=)j;=%rX2=Hg*lkG2lMOgpcqB8
znfBeF2*C-|MS|K8fRL<#ghUbYk`=a((+q4IL*UI#M0;Pi@A8tGYD#bESQt!JH=YAJ
zbMvix6`;v#V^#k^gnyU>nkgmg2)n0c4r4&-fe^S>EkVKNBNe{AZ(s=uzZRS{dO{sW
z0ML3lX)qLiAP+1-W&Al1Q)JDykOGkY*_AN)I|A6@XWI*GcD3wDcz3X@wO6e{0Vc5?
zbA%}m`)DN?OSJ<FKE|cQLg1l^mlt8bB(EZ1&C=XG*q4Ma1>TR^ZPBgk6`SknQ`V%U
zXKXmLUOk4*kr$eSb4;6EpLS{QSpKxzeMPNkvQ*VPQ7Ot^Q!`M2tkDh>4puerl}rKE
zTJ60(tHMnXzJTSmQf{Q6aqA~*Sh`@(+^**-9FsBRXjnz5Sq82mwMIZ_mss;^7za{T
zGAIGzFEIZF$5haMCF$g9j*P=IG_C0|GG!OSsnZJEr>E6mEyjLcsV@hBbQ*|E^4{#!
z9Jg+Q$p^p&;2sX3VF&noASP|AeldV_fORLhQUnJFgIK1l7g#h{UNquKp_Dxaj@Iv8
zdVy}A)OuXZC=dP{f*g{^Ju%U-v4j&S_xql7!s$W`xCr;slk>X_j-NMf#tSb{e6X%^
zf<FK7D3#3LrH`aNpB~l4mb8`!L-r-_{g>Yzm!b6x+ah=$`Q|}LGt)f-`iw>o8^kkv
z=ORmZdAVG@;adWHIal<3!Hu?(D}hcJq=EAw(IUdBs;+JA>x2&h5fy?py~x%|T@Kq)
zT3kE_TEYw=44|epmsX8vTAm@6#U<>b+f-EE5Wb3AXh2=Dl47P!y28+DGj>Dz@p_~D
zTKWnUI#5677nO6a_(C@VzF+_L7KKjvfYP|nt*PUdlGkiTx?Mk@*SZ?!3&IXxO68&B
zI)83+l#7CWCgxWa|GUNJozOZbJPb;7J3Tb>J&p!d3TyA)`8Rk_ZFKHdMt{qoIrQip
zEN$CeR#AiBO(T##pn*AhrOxmtU=^yS3)56gcC%mZI-Wak`Rn{RZL|2{F@t1sH`-<!
zBg^FFyY`uXcNM?CpLY8C%h{9@ru>hg*qnu$a%KE$e&hGy+b@3M5AKpZn@OjN0Tb#M
zz>^27lQrFi-~^9QQ9Ox@vERM!Knd#%+5w|uUWB_Y#J3$%d|bwbIcG>t`Nmp;Ob^%Q
zEqmN;*Z_%0&-i}sW;3>tQ~DhYOwRxDRS@9!-Ht3vt=lRL3(kMNkbnPZwXko60`aFG
zZT9?u{wI+XF%NNKmsh7BzkjehbcYq(8o#e}&SRt$f<x7k2$pYm?pp&5o>PiwnGiJw
zXEpY`vQ@aPthk2r{N`~5t?afRujC1NNsYxq4oU+eWSvN(7a$KrKpyzgBZW;{8+^<)
z)3s9#_Us6IBwhXGdDxcSG+hlU3hPF3SmRW%>)OH2V5wyW$XO)US>d8Jh=q5yiKNF!
z2ExSA$VY1{NGd8tw&>1G(q(Bvn9%J$^C}VY-Mi4zqWP|rVz2TD3k!2_ph2Jr=D{iw
z)4j4yk)>DzR^~e0cl}XHyCSKqz#a(E&$EN)ik{#Wi@n`y<~kCgk_^RPKPlpU!{VG@
zd3rV)4L&aWd6A8Yg+-bnN+vGc%VJ}TJAoB1A|<_We+D@(n?ppxprcXt7rb#9fj6qX
z4IFiF?U_?Uip5x&LO_)>(XE=@QAS|!rlO((&V!&vLp)Ety3|x1fMEj?g+pT{mJ+?g
zAmWwjj-h*aDRgMatTx0G3?KK14DLr*Wxf5@;Ia?yPK^NFY6u=Ef0R`=48C|70YF2<
zZpXv5qUrZ|>yGV?8onZ$g}{#hE4rIiX4R3;c8k;=+1b@#j04Cg2H?ZMdU|^hNk#$g
z_R8d>^X_7%=guaU`F{gP!ZhwaPOqgOSAW4jl<EO$vj|I~Pb9#?NpQ%)V@8apNH7GF
zV3wJTjyxDm1j#eZfh+?3U#Y*;U13g~dlMrwIn}0OZp<<@Gt~tqbpeK5Q81D9J$L+8
zwhapW77(4Drsrkf=cSaY58)<7EDt~4`PNm>RW2rKKE#0ogLQ9em|WRIZbCx9^S#Gv
zfOP_NS)dLC8J-Z61wdO%U<_E8-QPe%e+(Q*Nmff6eqmU5fbsFhS|M>UH+nhRP0jz)
zYv43fPK`JB>IUO)ORUZlqaPlZJCFF$9z1fyw(FVVVXqniRd2)rOJ0Kc8ea9?hl4rk
zYN5^WT`Vd1eQ!uqSKu>>v9e-Pq52AxmXwpTHvU?wy@(&ri4eEXTet5$Pb(E(U{1_R
z`A(4Q?E%V_v}IzxCFh8Cms%97sp`B@%)V3A2=hu#?)AIMih7d)_+a3Q*KHQVvU5X!
zJ5z>)%p=J!mwVkfr4%~QC6A*{$y60e?_Qm}HZY0cThoUN)Y}3wj1F5KKOgVllwaEe
zpe@iZ9+d;z5OhXht;kc0d>&uT!FT=r{cr1G&eDakg!QR%H|G8Ocm3k8k6sWf_`oX4
z?Zh);$+j;TJQk9ad0?i1A+N-Ao=+H<y1v8_H{c}W0*V)3n0EzkX?O1C69o^nnv1fT
z6%WuO-~tL#1C{o7{XaMSa@b)vxt9m$N0wDN>ET8@7Eo*FA<UnfLduvKwlG`kj`Wpq
z=O>UZUIj*PF*s%p-NIWdo~j2Uhb7A(FcpXS6iny_cg6JYhg}{Ievw}4YMzY6qr?O`
zb&AGhUHAY;bDxI_JMbCT+yl}|3=2O$8(SjGN9?(sN56Z*aWT*XE7C4k$57e#C8O?P
z&o&o7ZLTQ(e&^Y9J2u=pEpDu*Ohz8TiA2DB>`h@N=Lzy@{CyU%v)DWso7Xp*64iOg
z^1xPhhJl?OJA7*CgFp34z0){L=6BdnU4HO}frJM_=m2g*k9Q)0u-&;S&f@OEd^N!o
zDJZOZ<Wx0Hl%BQ1r+(5CAO$DJ0xLIot@eX|POu*gD5R~Eb#i%h@edFmE^3gHvAH)s
z6s+2{b3+S5b_spOp3Q(%U8D)l3ef=cMxpf5&qj&hwaX)_dTja7{vBakQrQ^{O$S6^
z2Cuvq@2f+3oKJ4x<`2|Um#%<fY*aJUWj8d;11T@qj@-)q_C$ntxfcu|&Fd5KeH7q9
zAVsE|uV{L5_AL>XnJUvFY~1n(=nt3JSy^Q!hwI|KTbLC>FFDSQL4gI-@Zx2Lj$&*r
zdUIEU9AOKd7i=;>sw{OJ#>j^+AE&Bu2I>sd4|Ax`adP+W{eoU8MNB(w>P+j*0D&b|
zaNIs2H4V6{gs+ybCu}^g>UjG~jyaf5v<DQU?CtGAH(fWvjDsl_G>1X`QS+0QY=+=g
z{R3vV(VuJ}1OUWBM#QXf*m$bD-WeXcJZ71w?w1M<zc(hi<exiFT`S|gSNw)yhp31M
zGUn4faabpYg?{5V?&afzpHw$XTK@d)TO@Ogm3aJRCHKB;0>yRZHE@Ijsu>+xE$qT@
zepPT-XeUYb5QWzaC-T4<@xF>s)^ota5@gok!WMMHGjEfG0ha2I)in-8bE>R+B~-90
z!Sfb;ySMM7I~U=rYNE`P;fjW!4Ax{|<$qYHveUf$#D@SLqlxH-#Cfa_yzBa8T?|}?
z;00Sr1T~6D%;e(@{cdHO{p@awi)o6rI4`kd0BO=XLN9Dw*x-|EB>ndW{V{VR$Ibf=
zJ&OIp9yOc6Wm#o|>q`7VVEL=oKmPEZ8aSe0+RO?rcxj!oRes++%a#l_9dC&}PO9~u
zU_Wcwaz;L|*t}xul*-M0w1Vm2o?7P5$uIwSrzG02A`nd0K-izWB&v<L=bm;3p9^@~
zpctQB6lN6N_)z3L<iCvx%Kb*pZzd%2kAw<o7Dr1iC}E&5iEfgvsvNF1R|L+!%+6+t
z_xCge^8xi}8l2v4W!`rCtSfOq4%1a+L3>6a^qi-#GK;E?tP3H-)L)m9b|sqlK{r1S
z*0YrJ;f6avpna<~E7J&)+Xn}kuh(5H3s!v^(7>Q*ftV35(SP&s@MzGbwVO5g!y9E`
zb*aHWRKCn}5mqsjd>XHh`$=B=g`36I^g`!J6AY}-WMVoyLi7P%SU$T7x_)G7q5^=0
zd(mRfLC@`!t9L1*yBz{$p`V%*!X?B7Q`d$Bv1uXj&#O(UTLV>+iK@Qnm8y}R1JOj8
z!z$mp$sq)=I;|K7E#5@7#ALA-11||KvcUe!S;g3-&z<9ahk@cbeDn!-3#Hw&Y(H5p
zQ5eq~D)%j?n>8yl{4~swda~h?IX+&mAY`Kuyiyd%PGGsPRr1^0Qd{(%Rj3G<Ij<^8
z-Z|}XpQ3flGSmtmYPwOL-Mozf2Ui93e_mY;^ERf>zona#bYk1?l4;&NWj~4^ZcGj{
zV1HNV@Z#001%O?^lT+~S_noy)FW~4O*flT!HX*RDReIp`S7)}U4cP~V;sRhOUaAC;
zLX7_~n0C@7YotlmyH5U9{{t3Zf_icrvcX4+Nh+I4_@*gU=kc5#ZbT5MC*G_3YT`ll
zb>z91gee!8q1gov$nu&T+d)Bd=-@$aklP_dXrpRilvr0DgaPYD?)b;0Tm2V{Qm1X}
za!di3CDt<CcC^gi_b)iIhm&;w%d;aMAyiS=Vg$a3>}c)fJc{?FEa~p@{^n@_%RC`M
z`$SF1$!;6y!=Y3Pgv(*CTHhBSzD~Lkp;aveA_h3z<fcFf#+>$z>2KO-)%0mNs5A*n
zJMYykuuZ-euR11R86C=yG6Zf-mvl|o8&$^*LzOmhSh6{(wl{&Rc*XKH#^*rAtn}83
z;N^wH3;?=}V!(gVr&|!0X}KA1-2xLHNWlWG7uY&>HS`z(5Fbf%Rz!a^30PK)F-kVQ
zo`v`H?k+s>h3SeRx5yd<ZH-K|g1otK`dxD{F}3*wgTwK*<`N0A7Yb$YtQ7TPr!pFG
zWgl<{!U3u|RidzO|B)lHB}<KQOs^(T$&G9zHD6;*Z3{20h=H7w<=h^ZJ7YAtula9S
zKwxtft&Sjbu-qM#`Q$HBY6WLZeU|KBuC{x~d^exEgHc!r2P4&yBx_r-mON-1U=T&@
z=6kTAv37&9%J%UT!js4?7VV|-F2bFiHY0cb>G)g^p?5eRKTG4M8sr^Qsc|CmxXd#s
zu3_T0(GB)CiTFKz8K7eG=9HjRq1%j%c?&^bSWf<exnX1<B!IDl8RcHt&({=hxJ~c5
zN29Rjeeti{4(P3Wl)8D$=NCW`VE)4J62H&xqrNX4Pd2a9QjB<d*tIYX8ojSWFL8H1
z!oV<ua2hK80haZ<lvf@?5r)Gd3dD`Va*(?Ia?o3@9S();+DDS_BI|Hh{30;YueGUm
zIefahb`Wt?E1Jo-@;kMqHg(-jCJI(kpVEsffb+;{JdoY-oB;gP4dG|&D<h@^fdkTC
z7o$?Hp!d8i4NqUrlR+9|ns<-CMTV^uO+vBJ`>*QmS}XlfK%a3?rhbwe0q@lKxO^+V
zU*L{&oeZ4PZM`tITxNq$2^01|^o(C!nyC*pzp$N&R2vpDmnpsHv(}Ys89kvtD2ytb
zX$8e&b0@|j<{Q~wE+mcdf>YH8mpt<0-DQtkfrv0tli{?(Q?4WS(UYxs-ufHs#?hvM
zW<apG0!by*$GbA$Fpdfy#aSs(iSlY(R^cxr-Cw6ET6?CWoWxA-{t!JKlFDfd?QT)%
zTu|X;uvJx}^{i8vqf#SxCA5e7iyyX9wVuzO)hZ1orkjy}u^Ru2TR=6B^;lj^BcI@P
zP8bl&*XfX@7VG#mzNFcshR*5WRQCuIl+yCjHNOI7=kaXe&XQPi#HotTnzH1%#<FDF
zIbBbfb1>?U%sLqf2%T_lFSk&ElH%^#bV3}B8e5|n)}IuzOk9xb4wT^$irX>*B6J4a
zx=XGHq7IR+{|JkDSPJq+yoiWs2uZD>DueFJga9`iV*FO5j-+&*Rzx49qB29@1~sh*
zk<YyC5~$DCo!t<F<F{JFx7J;Pf$;VBeBs=>@98lBV^ua`-3isHt)9T*U~NMQFq|sL
zijeJs`LA?eS3`>blXB){TzE5ncKdvX^RS(T{hpAFQ~{Q##zzr}dfvQT*UitT`DLN6
z%Q!92a~i35UhVBks}hJ^pyd@^nks9r_Es|^`uV&Yc0}XD`K_KXpF)xShO>bQ^O9T9
zH&HbiLJk}qa|RCka#H^|23aZyMha}igoIUpwls569(byoa?ip2qe`*n7QH^JfYTR_
z<RZj2PLsD845Vg1Z{3Hq$Ut<O5Eg>@kIe{C!{HY6aqCXHWUxe1k5jzUoT|@v#11NU
zINje8SHQ8S2IdsZ%*>`>WxWsP6yO`M=B0b=*f9VVs}P&aNMg^(Ie+lEvxh$pMu?_C
zZs#5_8aI86=&}I;;on}mi0@-#l7^nuR&QCvAOXy@p`1j*f&eGfENp6O0*hq{%ft{_
zPk9)$<N#mG9)Ms`aO4G9K2D&8rX9Tcjcn=8-+r`CGOWL>vBPcN<=`E9in6%z8>Gd#
zNf`A_4wzfsgOcUxHT3jp%TPEE8w!V;{D26Mc<oh#Su=+*jH#K)C%n1#CAle7hn2A}
ze+o8h@ryv_gcBITjpUfdI<~>-gS9h@)2#NQ_Ua3hk3>U40Ksy7sxpn1lT&Ex7MdF>
znb!VV;UH!<!7=>-jtX}25hlu3ZH+Xwx3>D`&7t$S*s$8q)Zg{}b;pT&I5URptV@$5
z2)6Xss>V@?OnsOA{Xz)lAA8NKF2!bO)Ky4UH8!c?v4s@;xBl%s4Mktl!Vt*eLeAfL
zat5A^5(~I8Xklj|*-Xm%E%NLnDMlfEAXzL&Axwnz1@iEcAh-ZdUBmh~B|W&f0T?-P
z#|_pC2F%Id5@2|Bc^#u}a~M_SU4qd-)2(}+MYXvOw$jsJXOV>11VV2I+(dB{0o<EH
zGOd6K>6s=3eAIbxn`v<Ph!=u%8!YsyNRSb{0z!iXl)hpCf}zerzYAqNGBFSncLKFP
z1>|}3Y>%<Js-og!(~CIcfjAX0SzfG;@)XeolI!0avfB@w2!Z>U4Q$R2(zOTddA@=Z
zVZ4oD2<PiSYOsK3Pk79CMt@20?q1Ptht9J;6Yk6zbsUS|?bOAG5Io>(uT8Vk${c)9
ziSJd7R}(h)@+y5<YTCrIe3UyGKeDig^V3|fv&&K*I$YkqyC*tdWNu8uFl_QmtnR?_
ziFv=^l3CG}B`|u#lOvF8JN5+1#Xci!VQ<b@q}zww71xv-2Hj!PASGr~$J&4ke1-|B
z*}OsUD^O#W;H0c`BQMtT15J$SlY2fY<Dq;~XYj(LD=GcrVz3oDS;KVYm3zE1XK08J
zkNwxf7`$?W;QhHi?H$u5#^i@9BpR(F559_YmZv3<oO_R0(*UGr*ET_6S-_w>^VGfY
zUdI$(UMt-T{!?1@q?0A|Y8CvXONN!fkR8U3`wD0y^x!sN-Q5ZSZjkTQ5Z%917``Sj
z=!tEZ18=$%i%!XPvv+Wa)SiB4a@ACvoo7(OjXDG(yb`Jy>j8uD+1}KSIA6fAlWtXy
z)ly$yF%i${SatK306#I~umtZ}0LQKaCWcH9C&8{94j)LAQy?H=Y8fFxfanFc;$bd@
z1ipcB3~HnjdH}DVzU*2vFnvnF7mKB>jD6e3gafQiGuJ)?nHh}f*fi^dGeRh2*#HX?
zoT32QVbT6H1;Z#VILp@t1Xyr<*Py+mA7F0={^SP25NpO=d9f1)Tmj&Sj-;mXo77#)
zwgR@f`}(>GgJMK?c_wgzFcqFZL#^cXCQg#m#NwC$z`0bckW_@N4UgBEBu-Y6g$*8u
ziJMpgeeJsNFpqEqxPTaMqis&qb_Sy0pm~;bZWVb^H8+fb^mcMCjBKxw%TIhbnL4dS
zJ6!IjgRR(?m+Tg-mbdh=+IynPe&V%VZ?MCMP(_>)cfN+{xV|4$;<CBG-3sVZOUBGP
zVWul}x^g_a)O4_IvK+Z)4PRBAdy?LdaNo}|p%iY970DkcnC<GJq!ZALy_fNqcy|KM
zdZ2+#gz0nr&_QmYeYB2CaC1;AS~{EnS`(03^Q=rC=Zq51FfqN4jvh*vfDzPW2mx+N
zaPCCLG9qw%zbyy*08@fZ3;P>CKR<|!L6Ysjs}M<iA<S6JSE4`;$1p5}187Rf1Bk5P
zj{w<n;Pz?2=-v1(9eB6@IEpucH92^ffZZqJAdjdw;ePnXPkg=->&~d(757B`8vBF-
z3soc_JG;DyG8Zwl7kYF#^H*T^acCTm^%qX%*N2K&B5`GL<T?ENo`4eW<sp?k#&1cr
zAN%)^ou`XNoVMiA9}Bl1lypkFaG`Z{E3JJ7NKAm!Ux8~|G@9w)b#AntzD}LoJh8&8
z+m}m0BhY|paIl1e*|=tD@raInhJH3ZPJd2Bkv7}Ow(WV?bT3rt4(;z7MV3?BO68@U
z%igO82^x+MlAUHV_(@(hqX2%^Xxq#mrXf5z3&ZVh41OX)D$J-QvSLcq4}HDG7YHyV
zf<F$AwhkmaS|VQP<J*8u`y}l(P;Ad2e^*kx2R3nBwIiqw=6Y||6Ym_We__lt<H|z~
zJptnbexJAf!-4@pb|-D6!p#pFMX4rtFo#{AqDyaZwAEz&nGnwRaN3}+U~8@x`!hIh
zoVPE8=NVva-!soS#a-mAOqvv7j_jouIAYk4*S(u(FsHjz@Ls0B4t0|m+~}Y^;m;?J
z_ad#XQ;r>Jb8fg~5+hyTt6A4+bsDw}tcVeQX>@Ax_j*U0NRx*H!38ApSbl}{J67uD
z)h>qdf#q?!YNO~Q%iQFaE=h$z=MsH?Qx(rHPIaB>xf=?Y+Q<r@X19(TGciNLXDK-F
zWbXIhQVoM=zg6Y!Ua@^N8M)4&`YodlsJbR6RUfAv!L|hisENsbek18?k$;7O-f1bm
zK82uv#u=fDuF`+SQv?LkNGGeHt>3Ei7iECBflz0MENA_jfqS>wr)teVy-(dc2GcR>
z55ycR1&^l<^Q2F2Md}3S_8#M1fo~O9r$DdUxWI->W=rom4XaLh{#kl18PzCVPK&Rj
ztMor)9`9cGRW&F%yFKP*ZSQuwF+{3lHWfX|nKcGst#Aia!Is`JIwS$|qKVJtTbbrg
zqpnz-sQ;VR_dg#we9k8qz$*05Qq-3_zpzAwy9+DO(QdO_yxZJT3S%wP)(G-XB{y|*
z={DaGTd#)EcUSe+{2u>Pwgd6HCe_W(=_J+ZQ!IszTNr=}i|_;IC`Baj#K4@va1WK1
zE@g&JI`fv>JR-nTxatC0Bp}HB{z43=4-vOXZ0qRYO<^dM<G7OVZY+Sj5<%>1>(FkG
zOuu+5zw}X}la}OlrRUeGq*n7Bf1l~Kheelf1qHF%GQtZ5x(<1I2xIDN0tCQ>-Lr#C
zyVp6vz|&bYDA%G6%5l3>LQm^xKSjUPxP$)sHG(H``_@0D5@NL&&8+-CBr0PUKHsTM
zJp>fW@3BJ~pjKv?eDn`F1Ng9|^6I({txt`=v?;RIoW{Dh=9T?FUxz$_Yda-<+5_#J
zSEt}Ljb5nyCc%0^csEV>-VY!!5aM31k_*4ji*LAznp416<>ZPQ3`8d~F0TzD5fR%(
zMLCSy)1fX`Wr@vyT7`axL=z71pNZkTm0_nP$*1{?1GmP}WJoizPBIL}9VNZoXqbxd
z3Ht?ZUD}0kq^`Hx>jHPAjGytoc>J&FWlJW92-AfSvcT^Bw0=TlB2K1$Kyd1iHMmS7
z6#D;;R_kY;_y*BA50xCyJ0sf#P=?8OUJD@*(&_vI5+eAqCao5J00rb&|6*VsqgY{L
z3R}<z7M-p-NbL~O+wV&R#=e&m^>A=t48NXd%i;ol^_Ta{7p1SPZS?P6I7)42oxD>p
z`G=7vZP*RCnSd|)he0+q6->uLc3`@n>hGuh<BQbulORgG+Ib^~fqRwq_j`&blUHb0
z`Bnl~DsGfxf_W<g1cM^093dOJzaG^qN#vVM={k7@EkAu|eMA{}1`sHl9}opvupNY?
zF#3_Uw?Q|CZe>-^MHLiY70Fy9<r2hh?6q=xGlxD~pX*5}0xFL`;}eMXWZv~Dl%IEj
z8egz@rC`is_jgf0>?nWJK^(&#_Fd~dahs6}?M(C_gQu{-u;+UiGhiN!Y2=(4!M&`V
zV+sHB`?PjT7=Az4q3bXiV$r5ijQSisQdV*4AO870UFcm&%YA9^J2~4>-d{ypZvTsW
z`X5>aTo8<ysGc(gYrK9K&$i-4C?-vr&uA17Z%?VOu`+*)_~SbrDf1#QJN(+Uzo+sg
zVI`TbhhXaSH$(ULBve<7%}_}N?2~PbD9p&Ch-wAlWg?vU$NrhZM+`q_!);z;j3(QX
z78{@Pz%1!dF*ZI_Y&{<oSUg~6t0~!)*>n<z23-lCv*BW8YcGd}TTZt^X&!M`Z4cj4
zOaTz#eSWS3hA(a6>QhQaohAzC%NoW*2usxsT&R(^l-l;7bcNgFkNXyGk1*;a;?$U)
zg2z$rcgOv<zjl4$$&|gWiFGdojx)yTXFI4HfcqIx=afe>p8T7g|N8?&sI`}gl}V^$
z0?xxv{{j;5y0Sx%a`N4aCpUi4qkn&Bl2^}iXn$4Mj9(=&%dW^hxX019Bhzbxjg9bR
zXCJVf<swvj8#>OYE>r9>7Mj0q8UAbb_A~a;Zkd)9B7&DKHkQ5YUv&G$-2LBs4A69j
zB6*FJ3tm**80Fbs%4Jjsn|V$KpL1;a_jN&%7Q&-F6GLu7HpI}a`6w4p!=%||g}iHW
zRg(YjV~t<5>}A)*^lH!Uop~)=H9pF8{jDwil<6tE^_n0m<#s_~8AtxzVB5^h({OUb
zargh@jk}B&k0du!Wjh_wx4rV~>SgDVez#*uvp5V^4^V`EKP%i{C|YG-b@@i|er@K*
z&a?N0Y|YGkp7+q-@}u9+PI$zMEzYaTh(pcAz@x?twF&Xr9T7jY&fqoT;i3fAelYNi
z^qf88k55-*?#;70{{O9DigaFUQjY#0Ka;*90N&~Oqv2lrL}$8wBb@_O`hAqh4Fq|2
zLd`f~37ItU-tH6k6!Cgf*!tE5rka1Mf8bG*Z)UD|Xxi?h5%2?U?dvX#-d%ex(%y5w
zP~uf=w@1U!J@gX8Dz?jWwLs_`!>VxMe^*A+aCVVgDBi@1>WIRYLiID26`4QRmY8=y
zXs%Ix&zz6&-m(;TFG51Sc{T+;;|t<}eydB(WvCdXto&9+T-D5`xU_Tt`q+f_|8z2h
ze|0jMFoP@^1}m5Z>7b}w0LoxGX8a#~aE*x^5MTso)G-)z#{n7zFF{H(^jt+$hQE^M
zt1zp^w)N`)*U&YW41+b1cW|)T{7)cRs1H{bql}`s&RWy++CH}62t6;dCKA*#QocBM
zC|Hzy<1+N*zBAx77blYW=$33oHKbxH!*DqSwHm5bIePGn+z$^(A>4yxTtKXL`!e7T
zj5sLRy$L~xw$;$UAQa&n3s3!kwq9jFbCX!cPnZoe;!%wsLQ1bfFC46|BFu_-v<-vP
zR<O+;Bhj~LX|%3=KNHf=O-(&ONSUA{z1fyI4RJ|rY@I;31NcVP2&S1#c&vJIDCE7f
z89fCK^f|oy%a<tvriKrB>uiY@MG!WHWJrAg+OesvUwzqmc_18fnH+J3kYz^PWN%gD
z`qQzWHYph<t<2yc%^8B}w)Oya5C<v8;&dh>$jAb^X5b&0$v2nn-?qvH$$SG^sclkP
zWx)lB4rH$MqxpVa#lt8ZiKX)sq{Y)aO;t;sJ3St!5?=#=lvxaR46;E0&k`4EftbTt
zaLz^E^Ft(Z9@<WTs9OD=Yia`FN5j{M)hs;{I}Q=@ZIB{FGkhGKb;VOYk)0#!=M%`t
zx%R0%{V?6bpN~P?U1Eo1Uclvm)pt*m%!Yr{Qd#i{SD;}SqMGMum%D=-wT-<8;mJD5
zq#D|J@n*xi(i~BObgi=Nv^PB=7KO)VY<o+6*-W=)&$O6kM8fY$7dMt5!J7nx`33-)
zfDnb=xGvBQfeSd%7F?TsqJcZnl@EFY7*8?B49}V}%V^r5Jy*m>KE=+I!fbeP$zg3y
zWL*UU$?oF^VH~4(bAnlz8D}*s;+xp!r#Llk(Un<<P>VNj+VpwX*AnKiTkzSt_?{|d
z<lgQsd`{<dcP;>umqA{~+p+Mp4sLW=InIe>i@&ERM&-JB?a;5#2r)?lc+aUsRXYRY
zAOe)d7cCtK!?tR1itUi+?hK}3WMj8pAnv{fgaxt(5i)7O88#$q6BwIeHtE1Qod#Ar
z4;GRjbRaekB;9uK{h=r`ew+lt_6YozhXe7kD+XS`@QndR3v<W=Wq|osDa8OMs#(u{
zKd2C3%(etc4Vb=&=kU0E*gj-^<!SDKJfnI@rOyMS7XXy3&D|inT>bfh#q3F!eIj6_
z-;X$hfw#QBamEt^1Zy-VG#vjZ+Cnpc*oMP%;Q=DDpcIm%pxFg3UIh~)Nv$$MK9r&R
zM3+9&A<(&<@Jy2)mmIC!5d9^{75m~#_#wIN#{!lmBzralXO?Rs4>!rbNgl3uVT=O|
z3M?Toaw|MK3s5N)dJ#(N6Vwwmts$Hn34_RdGTE)uD}>X~&{z#0?43nYex*#o|9bVe
z>er14lJMGjj`(g3P)`t`s=aj!uw4Qb$}2Fi1+ZAvZveo^Le?>oe<KMm1(1CjzPO~M
z1a_Wi=WA{qh+aVQ?!ey^erW~@0#|D$wr2us8Ge{G6ll`GL1O{T7SOdM+Po7ygFtNv
zhWL>*!>Y_nEennCJHcPSg5n$#lm6#Nn}Lmwh5%^r@kUNTB%B=(!et=RL+0XRn+pgS
zO9JtKFu;VV#JRbL$WAu^q|bWnDq8%w?-k=kC*L>Fc13zgcW*7(_Dew}X>T(^Nhz}J
zD#&U@6!p50*tjR~H?#pGerDb<E-%Z<(n_V}sRN*7OCYDMEG2nvH`?{IA`jQ`gSAIK
zz;MsSlWE5<dB@3Z5|#NTRyE)U1){U5K~^3b)!tI}d@IxEoO2;sY!}ObW7YDMgwJ^C
z8VLXUsHbd{__kOcc3Bndvb@>k1TGL~t`kNWP_lAW9IiPMV(Es<WBGKA+8FT*=&WZO
z@^}+6{Xe*2mh(qFCM&NKMoF^3LD8WVaxCwH>+2T>MLV+kN2Tg?CXKgYr2;4f=Og9y
zwH-@|Os06t<Ir0CKV|9N+D!1EuruWB2ztL6xO2WUos8So>c+RUdD+eHooAQ#$u<;@
zr@VLsIaY+%f8YooIN*B))Ws4EH*yxZ#MU^*o|4~e#aRlYADzTW{PE_`98<jYi4mqz
zJ<)P`)Hi=|RH|cA^@~PemNIwK^3DI#d--00JdZ2Y#Z&ZL126MM)9lM^K9IJrvHw80
z`GH97GZjp%6rILr$khJ@Rr-nl_i+gF;f>w+xO<X+3gPA%j=$rxmCmNmMqRJ`PF~lP
zQVlCYSG&~t%>OQR(oeL_eAM{6e8<jkFFly=%z@f@RW<jY&ZP$q$%hqwn7la|5PBIS
zhh#Ip(RP`dnPpWnujOByr-qWTU#_t2Ij7@7-2R#`pu-)+ga1<uQjn2JY`&F(vZRNu
zP{|&#j#ce7`@A<$!GVIB5Cfp8d+>b-v~k(7FZBGKudv$F($eH@Q_dz3E5Yavh*6MD
zVIa7l)k?Kt&=*{c|Kh~4{#4l;@X|5PLmdxf&seeV%kJIn9JsgMK!h-2IYTEVVWq5G
z<HeNS6PI8Aso1mOMVXewM#;$7+_=3Hrl%MotOXd*dnmScyam-m=HbD7S{EMzMC|}t
zpDgWthUzQuEO;ROf|V6`FG^Qvw1K0gbvVgBrqm4xCS<s8H-{zl_Jw>eEX)+X8ZpXx
z4PWmFB$Tf4hvie%#mw(fP(PW&;Q_VF4$2b&pz>PSU8s$Q(NjE)wq9Z+9#Su%(gL@>
zXGv`jdV3N+B>;0N)SDhl>%Zsg#x#XPaHK%e%p+)1r(aLzO}57l;$n*Be$gnv%!Xld
z(~hvuNL?#@f9{*7sPCK1{J0?bH<sXE`vYu6;IA^TXnzX}3xpiV8!!0nQdHkxEI7!X
z@Vj0{yk{S1yuv(a4PMKAm!veCfD{c3F#9WqdEmp)LAa65M<^g;I(PbU>T=8v)y3BW
zOV$6J24b1c@*zi%g{9<D)Fuc3e-^c50|JnQ%a8-io1<)>o0`*V_hbmn(cYJN7yvmr
z!Fh`3@SV!q373r-I)D?|LVZorm4fpGdQ#6WKKqVzPmx7?C$WL+h0JRkk;BUg#?ng3
zN@)NLf;@H!k=ol8F7=SeAK4k0uUZEA`s&lsN*<PkkIO6<a685g5~UN5$phh0khNkE
z79a4SBYj)@1t7M*)=Gs)md4kAr95%*BcS;;jWDU9IC}o`gA<a6L(>}+^pCJ>G9IK8
zd=U4JW783Q{gZ1(%e$vwMH>eLRnjbGYlP){7#JX&=)Da*-CO@a&RH=2^2&WybguYg
zpL9PUApcglB4BDw2DHOtUh!7`&;%W&wNoB$Q<SMu&39gA5WS$K0t<1+VP)7VBQ@{c
z%DktaAn9e#SIKV!Rh=Cj_pTyrEm(Rmo|Z4V1Ism5e|B<5{ZwieEb6$03-XWe=UWER
z=ROBUJ2>GM%I&yY6D<vk@lAVB|K&fhZK!HzIZ1E!;~3mhv%}B-GM!*%nfwe+X&p{j
zpRDL>mWeGF*w|!0r9wcn1~?)wtH=fAMOu9=MbT*r*5B8Z<8}&wI~ADNoaB0yV-i61
zx+QY_+$&a`eIivO1S$vgJ2Emc0lhu}X15&vsBM3w#}0^?jBJUb@e12wxvB_5RE`|g
zKW_q#A{+rWuE_2K%UKxOuG~B9&{2jppixAF0W=$kye*?4mIEesb$OQEGTgK;PM2U!
zvY^lya6<UhF^;dn2M3J7?PdRzT5bxwz&AiW>Zk!(MWT%;TBcMbrEgtdfcQ+bI5(wj
zIb)3(8N1+3n*Uk*eQF5kO!m%WmTXGEfj5J12Kp0L_h3P5lL(rAu@YY`3Kb|>w9<`I
zAa}1qg*`B;H1CVc4q!!-mOH<EDZ^ex3KAtHrG!@b8zLaIgvh*Fh_Zdx4^iYHHhX~n
z)dJKWP)$Nar$9?Fu<5tIBH*P~GC7=?nG9CIpk!J9<`g1a2C(S&xd8~gdmo(wsH+)2
zA+;kcqWU1ovDZbh3`NH!r&^V8=G%l2&h8K+?k*@?VfN*H6Nr4akVb9q@j%`C>+)$6
z*ir>2L>wQ2fejQ?U2|5>Dy4}(>P}3KydT=K;a7-a1itvHNgHnFjZ!D#i4m9jnvf#&
zn_HTDVMl$6YJzImB`arp4`53@Xp%;V&`0H7G2_G}RDtUcCY1+Y2X2qPT83?cFb-f1
zf*)$kg7~X!2!{ckg^3&yGt39Xy~w@C`Od*<-tqnAws+W@(6K=DoYd>1cVe{vp9kpm
zzQYoALLI%eXw5-xjru7qM-asn6lR4u9QAvmoa1HTp;_<-2}du9$a&wCVJ7XbwWESZ
zNJwj+3U}XdJhcV=8?kORzBpw`-v#*EZk4NPgZga=;i{OwI|JFIv8`K*A@dQWHfoq(
z1Sf=hnl_Hx66MtnN~$$LM=Hvzv{LmxV$%?q>6#8wje>LK-|v9iRI~|KahdC87K9x;
z8gTD2uqAs^;1NJpv_q~AxAvwH%b?)kC5V)h)|fVliQlBsZoC9!Wz(2F8y{0MVinqJ
z+I5Q`#TK`2v947DtDXwSygyerAoc(aw1Vbk#ViB+`{$pPVu|6f@nBY77cb1l#s(R`
z1NC4-DG*S(&?Ai~80v|@_vFK@EWuvOG;O@@TLG;q99VL*5y_#2g@p+gu)tupU46WE
zt30|n^?mr=*{U+Ej=*SY0v%YN#Q=N&qUyJ00`A+|PvdCFki3XU1%T$u8u8Ynr&!7I
z6&-v0?vu4DM>oDeePAQ{26=aQ;Vw&;RSpZ>?i0=!)y)uK(GNqoc&qL=fDy$Gg<P^)
ziHY7TBJftUW~FWGbJ2w^(!rXU=VEAUNiw84B9wH9soRBuYh(JRLDv0tvB}qWfxJt3
z^n5s62nb8vZl~}Mhp~s3Vitddyn;xxp4k)f9!D>nt`bFjvh9At(Hj{R#d{<^CfXh{
z!{9K4e%sfs@YE<R*S+Fs@hPCoKFe^u_AI8K<LD8*ue)jWlrl{_#9W%D(}G%KiVu9w
zDkd$hz^;4+1cRn5<q!66e0ocQ8{bX*_~YmF$3^U^_<c(0>t6u((?7|bt+2rRA5E=9
zA|J`o)E7jf7UJ<s)iG3IsfJEs3AzsFAvZ;p3q(E10IUFwNjVP=$civg-Pk2j4VmpM
zxCA{F<$yB(=Rcy`Jo`naW@>6`CPa(6ad%p~`PkS@K~qI5WaE=8IO|s90>=k<VFf@`
zj+Vw#)=T&Y&@#o!y;BA+Q}|jZE>jEvVXL=G510;8ItO(!&EC;W)BQi6Z4>I6+@SFN
zrpWrBRV|@}xKAlB;mO}(SF}_^+^$-%DzNP4yS)m^?O?#2I(-dKvF(cUxn|mW8`cLZ
z!-pR@T|CLLYT@#S?byW(ymkGe(7O%(|5yqcJN9P&G;)!K=I58c$M0z8)xXl%&n6sb
zEF2BaxUYY=8kiQR{@%^2PE@phN0OQ@-m80hcc~8RdI+BZzEQv9*RB|7?1+J%l8;W`
zU}Oa5ycGFM#z>y$FUuaRL#BS$ITE<?ee%3h5(X2lk=z|^)(XS>TNPQat|rQDd`GnC
z<QSBR>N*P8*F1O`44}v3EJwYsPmQg*$#tY(xWCm{yoFQ+c$3_R3JW?Pv}q~v{os15
zxn>sgJ4lbXaMbri$C+!&h2dTk&TM-vbKm(@?Jp86xJJZS&ylL2Q8Bs)#cO1z)i`C@
zMlS>oLuV&9&C0Q!&*Sp?!g6tKY>PMxUHi7w^73F;=CwaJUv!A8%eI2q8{S$s=B`_=
zjnAlQ1di%aou~23fLR^;t&*a*f1Y|n@3+QTc5<d&`TWfj>mlFMVe@yJ?55ECjeKI8
z9CY&vdB<g1{okl{aV~9$_pVvIFgb%c7Z@P{%CJ%_X~3zud?W0!R_3VMKedBwx;VRT
z{&Y#csE}S8*NB0?C`}l+LrJ|}4gqE6TQGkFtG;faTvMbn;1a4-KEz*5b7B1nnkhlc
z#3F=2R@PTM4CHea3P_><;hg?&@RvOWnyaYHVX$ikZ)HozZa!94)-Bz9klE0)-4F60
zi&4OdOiN8gY!m?1L;`LZ@T+;B2z$~NF3h(CK&;L{nLqI*4M<dw_zObw`kA*G7G&pc
z_Y3(&(ZgV0^UC#X=cen*YyLt=jqV}8^0St+mt8BY^b511^30sGdpY20T_vcD1l9M#
z&CSgT^6b!Bh}28sh?cTY0IHlfu7O_~LIUbuGA$O!SgXueKc#PrfWgV2fle2Qs6>J4
z6yoJ&0hpZV)DLke`r6>i$zfNC1Qm^Z{e93Ps2mAw_|bVTYCx%E7!oT`9F{=ZF_W@f
ztdZq3uIWiqodVx<HNp%8d$XGpfWZU!qyrLn2~crR_9WC0AXzU3v>9agC0GPigPcx=
zl40n4rupDWS-7f;I~CE|7H0#&7UGjfK@MTl3tvI$!s>IB=|rLr*E~F87^aN!K>q4O
zT!Cy$H+Od^)dX+DfhwIn2_cq_I-0lERJI`wpAMaHucF)@`}5b_>Br2sFR|f9j_DP1
zV1Bb4A(<hQLBkKMwyqLyI6#F6y8+yK2XIt9=;pzyyDH#<xHtU5@-WeStKQ0%YG5yZ
zD{woqN{&_0IMWV57?N5x)r5Sx_E1QH!vMlU6EG+b*mdyCwb9|9)Ar!55oa<7&|$6K
z8n%8o*5o0`uz(l~l@!$@NOipgXklP-g$D2+hk<z6nAr*+9*A!NYiu{T)F9&MWt$7Q
zpFmz3Xc-WPi#Cw6uQFrpz`vl(hov^nP$8G1)?^RGGz<lh)Lg5rL4Zy}G;Ct)Jizop
zg4PLu!c{s?fou1`&*pp#X87*v^ZfRFALPE)z|ROl!!D0_U~cUJpbp!Lhb}@=-ff$u
z?1~B;S6xDn*XpQM%RZxf9X1BgJ*GI>UI3H9_nOl|=ub)ouM)&njj0v2&t_-$1e&6=
z+P5DzS;Z^G1|1s)As$%+5Xx0J5KK^zu%d)2a6XACLf%S)<-QUWRLH8_@}ZaP-m){+
zBL%x_{#?iEKm$U%!8IWtl6>K=PsJDK1F#Pkj$r5srYeZtW+=2kFy)CyWkVMUtnRfa
z>NEx%$Pf8!dtnoRk-vf^1pJz}+`1RRP?9~G$A<TH=tBh{0}IaFsTzQutznmg8v@`9
zyyk5=Fv$T2+7&1^khMA!mA^b}F8B~ST*d4FU_u5a7j+5%bZP=IT=A>iNWt5PQuZIB
zVCEYzitCU@xa>kr+#}EYb#J`X$dNsJhaQ=|uA0Tkz^H#z*HvVy?;y+%-2|_C5En%J
zZed&Crr$?*DFF2htQp`V3DC<{mX_8a3{1iNM9FH8h6Gi%e~)^u3s0*^XRPDDH!c5z
z|CXSjX@bH6`5=DP^EW4;efNI*HrQqlxZ0Kp2YWIhJ`#ra?p-te7xudXVdAq1i64~5
z&FpMLL8KEL3w=`qr7mTlwf7nM>mu`AP_Svxp_UUP@;W_)?&|5mj0YSgKoAU>VWth|
zgoRtz$?|`Me=+1m5*X@05;|o7bmk3Tyhn+y=fUN`Tz+2H(|OX*{Bqj_qLFQ4Ny|h3
zcp!e4W`+Kj`O$Mt+U(^{&Vjz4-&%(zU<Opz>_)I1$zx}TZL%z*ct7+R{{DHcb38Yq
z4y<h=kvZP%7{&Y3W9X8iZdYZ?OGu0{dz8(cUicS-uF5bF;{j2|x44*KoTC#qd-V9w
zv32#L(iwgq*0p=oe~1{AZPwZ#MTaqIp_i=%B3`(WOZ7_k+Su0di^66NfTTfqerD;=
z8~GFX)>4Jd&yH63!%c+1d~tJ#3p3;2Tk1O#O>jqR1?8%(*zffVxYu!NpFSl`sM>#c
zm9qiM=JKt#K6WQB2qOcQHRG$_hot}Z&x1iQWHltzz5$b0<j+f$4rh;IvSf=+<TX2A
z1siH`z(Z{G&`WIQOX|*Ab>uA@ae(g7)nC@KxhEfZ!Can5DO0|r<TO9{;zCvKm^nC*
zDS|zCuv_xd-LXQoNlUHDQ)kGHZ6S};RofQn8qXJ>jN7SpVE>L2pP$5T*%z)O*yJ`7
z-sq>Ph1Il3Xc3Iq>-E=e3h{T0pLdDB!xx`DxnFV@_m?v#cS%2e^mM<HGU}kIo^T1v
ztbYzCvG}9($w7L)d1pHMuq0bl+D!J0jzhlgDIsx@iwn=6CI{k1q9?5sdPkYf2zFhG
z<_`)>39LuDL<M)zV**8OI;PS+MLRnL=fm>Jv(-#&;NCn<(UJN3g;u`(ZaNE7yUdqb
zqW7L<Wkd*2;SAYTh$h?KELO2DSCR4rK3VrlHInYvrrWkva0*&*lKa9qS5%jt%VMw-
z3cj_=QQn;$nIrlXn#(_XMVI9B7oCOD%O=I=q{w|LM1s?2-$tHfHFmMsIGx-DZTbN|
zy^#)aT}LM|ca<-gL+L_Xsc1a5e!!jn?3_YVndpL4Y~PTGiCY%0B(deb6(gGc0M74)
z*6}0vi7T;uWQ_+?^v_h6!*VdoRbQ%BRtnU~%ZCkJFr{Qq>W|5@Ls6zO$*&i1S8q8g
z@vg8;E4b6tC#oj)T=%$o^=kU){l=oO?(St<i(Hj%j0oqPt=fn>o_ubBz)xzko-pY5
z`VoX?{BB@JW@+RXEfNpw#5fOy<zuXPlE;jK$VRfnmXl~y7Ca(&N3!3s?tA#q)8_JK
z^sk0R@1IPJtSZ!S<frra2)OB~T)zH5!Rwq}_Ij6%i^@p-4;ovuXHPUuT2x9c?o;i@
zh=};So0hik`O@XHcbPz8FjRK^`tn(ndBb?na8oYxbks8aFemtF&h$D4WZJ6R_ehNl
zIR$&aO)>8s5iT-MI+#elMf#4S#!S|E%3vmG<LQUn96qB4=$COU1tg;RNNLk-MBaRg
zJgqwa#g*2Y8M+@B=cVlaJ+1r{pDJE2H@C=@oSkm1;dUDxfFFvR(yqq@1W%AhO$zhO
zLv}2uO%i$|hRA*K8MB|6*|l0f6f>eJ_T%`7Cte~SovEXtaNAKFP@p~Y;y)bAz1Wcj
zQB4E=?=keGIxTBxxrs4G=Kb<c*aP`WsqutGcRezmbT*=*lXOcAV}%MGtB^JSWUe!l
ztvOL~eX%v&Zo*b5kL6R!%AWkkH&~X7-d?|Y^{JcSi%M5f&Z4>xs)^u&F|8=3aBB9+
zE&Cgd;e<oBj~CtTr)4<$TAZVFgl%^r|BuMz_!V9!9tP85PLmz#&&@HDEg91lo*3N0
zd^}%O_lJSJdG{McRVSRR3<ft*!;RG|^7xM3+|l3~#9(3iGArXMu_fzAhZ?}Rs$jV0
zq`PSo$L;S}ir;@=Q>U7FuKgiE=`ZfQEO8XvsoO?d$=sjdZbw)H?sHBT4FG!sC$<FY
zWx$b-1O7|D?a76QW4HAc;6{3(wH02IU#g>lYW0^|Y%XMfv|Ih=%{icaYg^Z=g6d#K
z{NmwUR}<|%{zoS>%t<SvbC+2T{`RM?5VxE?n0x+xZ0sV1O7M7R5!h7c#KjexZ`HTz
z4Y8%d@xjJH!^eYf3x1DF*0x77kg(MTf&&N<?xRqEGT_Il0vFPbr&o!Ar~bXPDLSY(
zu~tBRId%FW5u!V>s!4zPDJe911X4qEPGl5ankZ&)roVsYJNDRb&+8<5bGYTXn;*lo
zj6CC&q6$G_u_W?S?u8cje?QOV?&9+DA&`Ot9{s9zCep11XKqfvcc<<~FUe)xoWLIn
zb*w_b`7ir6>tEjJL+C<1b>~h5X;bN=EMD>7&Xn))%>BZ`lGUm6AKyN7=ny0s-iCS@
zkH<UjRNZS~>YA0&-gAwpc^Wx{;8|`uEbaCYLQfSF53+kM?cego$44dhI&JQwHv2)W
zCOrspYez5pUisg5arv3Ff&xrIazB_<TmD#)PaOEsZ{6E$40CLYuJD=zID`LwQHmD;
zgSUl}{D{BWu3Wp<FqIw^e^w)dgSunos{b6c0)w*=r6<u9zwOEG7JI_)?ghpD#WWej
zEdw|{OK6o~aJrYedUY<%v06g&v{~z?`cd%>-)6y&>`rscBB7&+H6jD@TDI=ly&L)S
z@E5EuTL5ujTL{*JIeUt3;KuL!&I48O7gSZx(7A!Qgi9TG4X_h*7?)P&I-%JZ7mt(K
z;A@Y&1|xpa<$eV~1BY=3&SUqg;GLt)N*x@6!#4Wy+nOs2$@f>PE$6`^jGo8nO@oK?
z&i0r8`vq@OImP-EoV*5nX9G<?RA*O0;XUU<JTLLTU(%+8H=wB-)SpF09$h^>3r;)P
zHd=KF#l^*7Ct+bxM+fVaK7U`k>qfu#FeFuTaJ1;byzZlEBgY?q%)S}YINvpRfbm?7
zn>ly}Em1x_)zJXU?^}fzavZ_(L+!_HQp`9+O+64IIXDdk{o<(&f94Tabz<hS*k7^Y
z#K8EZta@o1i^S=7ex{m{%|CWOoaidyKu>4TQ-lUZxe*`|+lY6lkfKjekPg?9eu=QV
z4CHO<6<NasT=KF*DeQe#e)K+i5wrQf7K=nz+B^8poQVk!|LnP4!K#jFsKW+EBcHx6
zdHn3pLacGz2%wQWn*Xq{px^-R^5OT5vmoVf$&c+A>TB)j6(!FD>BQg1X9}cNb4n_7
zhhv(GP(a40ub;8V2BRcw6)O{(<Txpht%9`gK^(Tvj14`SJu1RpiF8bkZ1(qK<%43<
zgbm7%It@#?^!CIx9xFgyzwSZZjV6AE{?*sdFDA>W<0W&tv0di$Sx;IawZwL?&Y$1W
zrU=b0P+TMz`8xn{FF-wbkWS*8f)AAf>)D=RlHhs>2Uz2hX-Qbj!gJAw_W7Zr80V{3
zze7Im?mc^!jmCJSw7<4y+cvrx0<(kTLO#PoL9~sH4FvLH7HY#x`tRChTDwBP!!_a-
zRV7dgshNFRk#eW$etzFs3-TS>Xs6%Q0~`(b2f!tr7&(;>(C6?Q{rCy8U08Lt3T&l0
z@LuAxpviRyOa1xkpVR%dy$}ykT|2r+B0GZyYdLOLNE^66sV3_zgU?^erTQ9}!NNf9
z7G`-mf3bCR>N2^l)HFG_M<)z36-D1~Dr(XVeP4rHIrP}(0{XOr{Q2|lmQWC>ITx1>
zCg*>cOiF9TYViwKE$f-ThZ#0>lK4>LLjTEw3YV0CW#=0@?qi*mJ@QF*RR7b~LjSZ|
zpeqB-sdN8(|8rpkxZei0?z?m!qEyMr<mvpWdy`RTcq$-WK$|mEL3r9{yn6{QG?oMy
zQYo=;h6Zw3>``HV`SPWGZmk2p4y!c_*ul8a{k(<QeDX4g*s`CO8xt~zp=TPljp8!W
z?xWwkY14f=#by{ydS`7*cmqU0(+~K<{OvwQpvn{zdqQ%btbw?Ro1okyKk_{a_blnT
zOihIN4&nX$tq*D|GC5cv+-^@ks>4qUjkqTEKrTuYw7m76n)r@aY(QS?0E*rqdhXOg
z!IFANu7tc;_sps2g-YAJ&dSWZnJ6_5Xp&#NcmWTr&0Gr)sS*!}K){+uvDy2y7BvD?
zlToN}J|0kR*uz7dz2NK6A87I;{4w(Ep!rfZ)Uy4&Vm7EU_>^@28^!;%_nu)<W!u_l
zwYJ)7n?+j@X#*;`l_rP+CO|<zBo|3rktBsh5J8ezQKVZ51~QT@P*RaGAuT95h*f}s
zB}sxxrhxlSaG$-;wmg6C{m$J#KA)#|pb=KBHP@VDylIR-l#Ngy>PSqk^-r&@oZh9%
zs7^LFUyvptQDCPm`K#Nf>Z@0pG9puv40NP<SsWD?cr}dsexqB6xE)XwPuWs+ukkNo
z=^wuM>A$$)0$$KlP~-(}<S=aU1`E#D&vI^Se)Z}V@)s=df`M7qDbZ>l!l-Fb(f3--
zz_I4TW304t`z!6(L1@nI>m}BLUJ+ATqI{`#Uv2upQ^E1ykh~@(<(M4s@#9D0lHRv+
z$&#pKya?=7C|{`9rtrQPY8us5U_(t?NFq<utzFx+kRuA*-i>A}&Gqx*K2_pAu3GXj
z*=x)exm0&#?UP0ixo&N3Z3QKu|3fcQ9E~-N`qU~BY6F-Jc^(@iCCmI~mW7yw*yPb-
zqoa)!AJ4~l4eQGFrlk<b)nYas7cXNGfB}V(wkX`I!sz5NY(a)lbb*b|1Uw?OWs6u@
zMrkj=IcKyr;Wib86L~!z$@gwZ9Ngk7u&uV|(QpSQX4a!%#mjQCM$e#K`}Bv~mfZQe
ztHp05RL@e=YmOBv`1G6~=_!rSvo>WMG&F2e6yGW<Yp|fN={_0m3VZGqtO;M=nmW(l
zPtmTU$jj-gR8L=Pa5|Gdy_n(e?_VO3^AWsHT@0tbHu~O|`>g}uuEwU@#{pUk_-y?G
zgMff??Sr3pELLa%&=vY9W@;AN^H;`qmq$DWv~~<zFSgFD2xH>Z65MUaXvJIW>)GcU
zW~oKT#B?nFvh8ea3&xB}AAj8oTj>b=<~C#}A_!>7ZM-nSSe2%b6H=La#ga;oj7EWk
zrOjuhSX^yV;b<TJoalYL_cST|KA)zE>vbnjYaV2;9J<luSkjX<<IoXoR=*$A3tx56
zyPjD-!;i-~_v;QfbHGNv%kBews>r!7Sh#iFw?zr%r*eXQ?vg|$fSDYo$B&D7`53R^
zakNv;MlKtHIMO6IqlgU!sGC=R4t+lFZ~QeL04t7RDSGpsf(5O-j^ST7L8q6b6RSzD
z4$N$ix!afDJ@}5j@Y{lm@}u%>CzL!O&_yrxIVA7x-FBjs*RP!xJF{vuvC*C@Q(ABI
ztSc*dT?s$4IQ8t=X$7C`vZZ|DAX4gPF|`u&q&%N~*-mplHb=c}u9DMYjjXu1y;3y=
zV+Zy=WAMxFV2{|LzVI44r^=>=+BGlRaog%bYr!tQn>fduGnyVT14L<hIsj8|DSC{M
zg<ozYY{2e#4&h=LL{Kke^{Yq-*HuPaTU%UQ9Qq?)3{AvI=Q$XE{<^V%sI084w6rr2
zc<cgImBV-+Vn6P05EB-*Mk|F)7@8>yBjZcgjm7nxo1AC?n*cFZ=Jti?iFpogman}b
zr0#SVW4!?b9>Z1w71F0s&2yQ~Ei-`{*j>o%U*Oey*|;QCgFQ`7ig5sPW9_`(N9}Z1
zpp*jydm3*%;%t(C{S+k^V?xidC|M?b6e7*4s;V)3k|XR79FBn8i9-<fjExS~Z5zV}
zGDbgj;_=xT)IVbG-Mf!H;zcY!(RDU8ua9Wa*VtxN{_87kQ3H=wL@_;o_H6z7^+OFs
zabXa$Bt+Jl@ulmZ&faKgVup|8eCX)Wdnx*fw{h`pt8HE=x^%OjJlW-SHA+=VO3K;9
z2uA5jmru=w@_p!rc1;w_Y_9d?|CKhD!Pi`iU27dpyiA5Z_wCQX4&_gNj0?Jg)7kFz
zgU5c6Hsqz>-DBeTN?JrPZ}X_fCM|YMOiaR{3UpcnsaIIHr7T5o-V1Lb5dxom5#yCM
zzn5Rgsi->G=V_&eA+;^jH09`(`PrxjP%~KxM+uAm^1FFJYJu_#!G|5&+gzia{V=f^
zN{@uVI=7HdOgZ0jdgA%gzyFr=WTyKE!_>VYX<LhmuB7~I5mu#_ZX&y;p~`)1Abuf}
z#-`9wJuPI8zgzGX*r7z+H_1u?5?pAZ6N!Qd^P2icPefFG&c=H&{!sE$l;BvKQ@xIK
zz-Ah@q2F+q)0@b)?w@wWm?55auRH>!jB~M4mcs1~kz6w1seOF8N?YcuvNEN2n>vj7
zKERhgHc%0T$?7$G+f`~pu3fou8*vtGd?(v76^0A+v=JNbh$l_cvD~fAFmbwjJtqF%
z3I#W(%V7mVw1!Od-}c69Xk$+Ww>Q^*KE8xW(NtgI2oQFetcEZF83G@SFUt%sEGimR
z9lM3Xa>Qekc3@`B>8{I**2V0<9eMUmiiJ8JxdvOFx)+<gejYWD-}Z6rPj#jW4P~z{
zU1!}C*naB3zOAPRjvM%O`)Tprj5gohC*Lx@_MxV~pnO1zd$_K(4-2Ii2C^61+0f(v
z7DTFed%^kpIT7hG*>CK_=FmHz0|N16;eQB@zXdL3c{g*$LNx~m2ketqQ)A9A3j*qH
z!S&ZZpMyTlTHpXmsKGXjg|l;Yb@dcf3*JmikGYK$iZ_)F$MAPr9oZY!ukS;l_de`~
zLQ*b0k>me?Ur?||COyBxEAf=#yHYV~+9r8<sxXJC6`f1ZIq~iZ)_&ml@H^-s`g@wZ
zFjaMASJ_eJehfvcX{4SRHV)=}ohN3Zr6zhovkiS~qu+drid)&IxEV%u@C)WzlswT<
z?Nv+UX#rX!b94Kt2g?r9-n(BXZ9-h1(-Fo~Zu!1qK4$R~C;}5V`qi}{Hre?y-Y%;-
zv}f8!QL}Gbx9+KZm|9k|jFgm4QHUJ9d3LJi{{6bjoojx<CN?1Av^xmvlGg&Yge2qM
zw(iW`ozwzf5tYtS^dN%UPnFxZ+**hZ<_~vwE-G=g)|;cYFDxcnigf0zrKMN%LzN|O
za;5W<X7opT;x>%gQqve1(#lgqQ*h_Y`x%#L^-yM(hY9NqWY%cwGIn1=4#1H=rB!Ei
zK`h{cjRg`6h2OCmRxOY4Dn0w1txdeA&+VP8_m*-;717vorE6|K{IrOv7IW*?EqwZW
zF)`g@f8Dr&P=#DP7zy)yHbaW5Q4;^8MZaFgt<Q>)T{=XkTllfiwb@qOPgiai8pW-f
z1*`!PkOdz55mD1D(<f*Zgtg&QX)<&Es#8x)*si}w9lKVmK-+Vb0sakPFQ-ufuTk9K
z%kv^BBB5*VVV*iw#cEMh+_rbg5oW*bddAR~qDmls&uOnPwZ0E)1(jJx<H7<>nKU0?
z@?c2_=%7@eU#`5x6&Bibq{m5facfA|Z*_&uHVHY80M5`}$5C>&cMW#2TCobn=%;(%
zKK^T+YR5uk19`UHN=r+_359r^Qv09-nVPq^DCY?@mnB{?mZf=T_OtXa8&CAk^2<!$
z&Uz+J32zo|?5k~#a|lCveTu)~>)DH#9kO{*f)X4A)*+0({GbE$uWy`p4F#Cac+R+C
zk6%WuZGHcKDB{o3UziszT=?|qlSmDiw9s5bg9pAVq*O}gH;5|fZV|9}aMrxP?UE+v
z8XXm-S;IrzXiE!=;fRBamn>PgZk_Xov4PFlqkOMlpZ}>PpXVt|Iq<kor4emFbCSXb
zv|pb_CB!0>4s;w1_$<W~G0v+B<I37I?VB14ye9A}*zz@BDqZiy?l8pbjF6os)UjGj
zliGPs<&{eF5>sW5zkUGd<Wi_+Tc(DZ+REP!J;F%twDX^LH)Q}2!hL&rM>?@jaHZ%*
z2x#MS%U-?e-@S1S&n?k=j*N4MZr;`9s&=IGY$^Ep!!(`7%!XW7N33N#MR8XYp(uCs
zOXrD2B$L|TbFd-`_-0p4VjWI@zCh}nRkG-x8E#{~`Qm%nBB9P=(WBTn((hMnttjx*
zS(|;=x*K>|_C{(~`?#ox{(ZxUkJY#7vT`AK4+E+ol}k4<!`YQzHgZtr`0McL?J^>>
z8Wb2UdXm&*!UBA0BrWCgLAFPj&f4#MhM3%T<b>YIkh7D_-fM0f-92b(Sj^9)YKT15
z9KTZTfXV<NO*X~gcVo5c_;a&0&8-|!#E{RDP<&e`E%EmTQbLZaG%dp}@CPZ7n)OR+
z;jbDL<(zMl?Hq4Rp>2m0o9{wxtxZEq|7rO(%`zJ|sy1oNs)-m|qrOK~)%N{RQ)X#d
znK?$-J(rGS+4i8iMt1YAFcqG40444e^$wbr0mSy#oW85?>)Ce}w_Z<J_~9;h8G9rD
z&9tjNK2G6F{KwU^Vsp<#?H=OyFut5w6S5CGpy-H_l(_P_=!wSU>vsbK5vG-kr6X#K
zSrKK18H?A_oG+zYRZ%;RuB<cj%DJKA^8W9?{QZ|Q68af^k3#51TI_5(@ZzS7U2K9*
zJY#U`H_(2d?5w!6Z-vglz}#&dU)CJ$=b7`KtWY{2B4^3n5%0}=qvhMzsWe)%QDVIa
zQ%F7Vd`ar%Z%cabxjXgs^$B8<-5vw#ePm5|Fw(Wt6Y@cBhvKb;Od?=>TXZWgl<G+%
zaE<i0wTV~I_bZT^ahvz&15Yz8{{jI+FhDA2)T3392fp>h7`uFWotbg)x*{hCF_J%c
z${vtGX@{%0%XN&~gH3QO{|j*JZ(!MX8gyf1<u)(d8iOhgdq{82nUocfo_kFTh(kNS
z!fVW$v-aDr<kycx)V<T#Wc_l}dwLZR{;Ew>E(#Yzbm$NQzf3UPv-=8wl(D^QS_ead
zcyt3lopy6sg)}WQjijs(cc4=q(GKSVqN&0D0~i2#o>dD%l6m~a%!O7SznysdNaL=|
zu-)5LZCwYhQVQt#JT8**XzPozvbxcF0K#J#vw7S(O7P9|=O;l<@m!RYbC-$9xeq;P
zTD1P__dZN%CRswy7`N5@SU6cn?REop2f**`_!*A6&Q~8Z3BE8>&^jg)paBQEm6O;|
zO7^I!`P6QLEHSeygGE+AyUUM~>((8C@LQgloHsx{b}R;9;)l4ZQCQEc*5sf1^hc_W
zxV#grrnQ!!fCx+g>7lG4UV@JpY^whh64vUeetEF*v^~BBazydiTr`l-&Lbj;iR+h7
z;zTG7y`3InslYsP<VgSaK{Og{&i$ajAQavtEiT!L0|!yRkkqum*_Ixhf~gG9OI!tb
zqjS2AHl!_zyK2{v-4Cu`JnRsL&l37YqO}PjZE9}7JzNBYCHtG>uc`;#YFe~izy;$?
zf=o}=6ATJRpxubT<Ej;&n9ty}6=INv0=+Ok+^hrEDJdx{WsVzy=dg<J7@QH03Jg}n
zPB<4KAu>tv`6<{qgbjcP*<7g(>UTX=d(#vhy|VkC%$2lS)2(_gc56qUA{Y{4|H41G
z%>+CxCsGSO1Ct7r4|pfV;J=Iy07BQ_QB%UWNbqn1cD^QHYPxM%$hJC%V(J_%9I|v)
zwEA*^y3gfmA%N|S%DT|2wYheqGR-O(zP_y+81=*Ma~w`C-d8|-!nCkc%~zg1+oNQ&
z%W?>UD1El(t>1RKJOvI0+a+SY`^g-5#m7!tb0!S>VWLekN_`G6##9vpDhitQmj_MZ
zp4|wk?WjZKQiDqYp5mK6U=Yh+qV;TZ2$iwB<CUl=O3wMpp9K|j3EzWYRseKugEQJo
zxAh!{_*GL=bLY;-O8earr8Yb~Obxc)$z>LdX^=aXKm37T{D6}in6;rEuL;&9*xaty
zf@dqbb?Y!7xB>jS-JR>rL6RwrRQL__G=+tPc$62TAi-LTt?3OL@7p+q5D&q>Dzc@j
zvQjMee&^o$sG8n&e%m88N_N8z+$vw@Mk~83i@QHsK>7}a$H1A@8RN+X<8BSJN=k-_
zAyO?FZ!s2aT5w8Rz<W&WNC1fqeYCSIU?_HbO+4`j;5FbZ!TnOyv1)hdMh$?!X@F(+
ziX=`KjQ1yFQHR{R6*mP`#mC1ZrOyI?k9aUjQbX?E?HpJ72ymEd+;6l7`+C3!*fLMy
z67T+QeK0s<xoIDeQ5N@(h3ALb{g^x=!m*?|-)JafC;Y~jZEmPthRAKB#CL${Iti*L
zTZFh}Q@8eL^x<x_9Qt(h9>DCfKc<wd_Ttj*05)*+VOb1isf)G@zSiq5V`I-|CU}JF
zVz*T!aN)*V*>0u5TNf=_gnkD0MZy_;h*KYmj}1M@Mr+<S1w18K^D$wo{?n#vs8C8m
zLNiE8$#E{_rz2{LjKU&c{yMB^lxZUs-XOR@UV@5rr=|!giq|g|++?x4h%-H!LW!fO
z<)bk#So9l@oh=~{U<#a>A5i_-g@2A)OQidPf?;7{J(r5F@i@9f)+3A^ke6G7D-g+k
zksj4EYQ$N>*m@7uKkyBax(UZM-<|~F35K{u8nO-dmJ7tH`mG+YPuxLf)O^t@T1@=8
zjVs6UrFi{4wQ^BYL_PXUZ@zW;@=xNzT-qZxNVmT3&amr3X+yoEJXuGPoju_wv)nu+
zX_pscD_A9M<KHyz7C+i9FNr`xE@4eI8O-ECKk4#Og-P;Q;R<?%G7wL>qM+4pR|#7L
z*r0E%R8uc|fgHKwo=yC`Zs)?hZma0muoGYc_RyN}gY8=ZEwUkrr?E0#EeM#$<80L{
z0rZ5Z^cGp~FXxs8amHq3@wh6=Pg0i_2+|sJvql0lrFZ-r%SxdfJ_cUZZS-S##B{o?
z_rKGslqXm2v|^A~9m^8-f-C>Vjf3T;EYw5=pDxD>S==GlUXvKqxDDc!o!|W4cYAu+
zNb$}EgTzX=Rb{XIZ~BeNGqATR-{Z6=-=F`T;Rj>=wz^N|PpmY2@Sh7>za`{O%yF~e
zBKC6v$&&R2{nIRX5Wf^n|68|CvFw=boP8vFTlLJB**tFYP$1A5Y4pIEw(4L-4D5df
zi{8kC+@(x}HCjPo5ZxRn&OyQ>EP8(y%sAo6>sy;{goRCD2VACVH(T6=KylJ}P4j{U
zc~m2huB4=<rn}dbR7uyFq`D6~D9s7h;`M#Puv#f#TLpUP$uC#N14s4NDc_c)f68;Z
z+ysw*OZk=iANo~qM+cz4IDm)dJ(|Pg5y_plwzkHJUt>E6&k%Rvp|js^Ka}8TFb2fE
z@5Xl%DF<#i>^x^J1f=y1n|neA{k-EaCuq4#*JftJNft=JG1{+(ME3VHJlJHaOi{WY
ziF2RiMWHZ`?>8cQLPn(X1QF{Zt)X4J_RhXn)=_bBR?n}kkY}Mss+y{;h%3LDh?A+8
zvHj1OF#}n%Zu`7Gzt{+lCZm5x=k`v4qkwd~>C9@>6>$GoDALf3@G*gffDDCrnIyOS
z`@d(-YuAOnR=eF|_(xGOF_X*_hrx>CSnHoQRnRQ<1aZ>$&ss`$<HlG35lW-=WuHHP
zp5$TB?>cP-qW7c>En0f9WIR=?CkSooK+YL&+^!_lCKLVU6VdZ;ANvFQJ21(boynja
zNq1e<^HU>EMzC$si65623>9wc$!$^9XzL?0Y77S7K0fzKGrg^^V?9i76Yxd}D!BC#
z2dW{ef3A*}LUg9b$A?9I>4NDF5X3+_Y75pdP)FYko|_$sy}-}gGXpP$0;@uXYC`J(
zkxI^Z2u!|Jq7^|09B4o*9oU~8pt6lg$-reS*xu{S@mEe>Ps9o!QkMw`Fmm3hGTL+#
z?J=##4o9cNyX9u5b_S)Y**`fy+q3$7j4MtM#P;ft0t)A|fPoOku{HE~^qhY9@L`~(
zvE>k<WkU}^j`AQ4+z{x<pz~eIAQMSGeA5p<CZmV%&YDG`l+MCXjRR%mX4atWB;s8p
za~vk!@lU_KYu4|HdM+XHPWERo#HL>u`iwhGGWX7PlxI)(Wc_*FSlE)Kk#(>%<Ad=P
z%WZ4dKC%BLft_k9to1-GH@JVHLGzMpsdg$w4F8fWOz*(O^bR1~7V!xs_7r{0<T+g;
z&OBb9A_Qiz<{6f&&cTClELC9sA=Ilj<VnF&Fpg+w+lQaQ?DaGiG)+}+9$0viS??E{
zwjYb7I<<i~G;!qw;4P^`C56&C_eC*8HNBUVxH}Vj0l<Q{CRGeHxJ*1CNZ(O?B}G9U
zZi0;uhkFfOd_hQXFdMVq6_`cWRz$UCO+GQpylWUWv}f?~XNU2&C_kJyQ9qwTbck52
zn0%kQWZu1(r?CjOY}qndyTLTp?gG{v)iGE`fH8{4U;k!W3UT#k^YPEiaS1L0h>Y1i
z$uX+G?D;A5dd?q(K7`c6mA)hRIQk(iOF5vk1P7*syLab)DJ73puXTEK+S+QLh=Ym;
zI*{cXXPT3t|IU-8cKGl+m;5gwn8w5HPxg9MQc`uqt_9U%U3I*Ua|UU4Ce;~7usoLD
zhQk5XF|-Xt-aSxmGjwHRXgT2$qwe3=W8-I3EA?I!>6{*Y<Hn8Z?I<S(!UDIWr33;c
zx{I3;ft7)ydp>&bhwf+jmM(pHS5_<N3vdonW8>q!(hfR-o*Io%MxD?He3YVB#l<!V
zovs{#T!6WqCI6IU>u~nt{5_y3vY(uh<R4kg$@o*~>p%F)LJH;GB_5mM|EaJ3^3ZE}
z(F`8dAI0!BwiT54DbSM?%nRmK0xcx+7A9tKCA*Ma7o!5lHl3IcT(Lt-ulU8BIde+g
zb{aKizA7!%R9CO^;xPRxE(e;RW(SfC;Ohn6y8iU;TTLD!7FUctj2kvfAJ*3XOEBRl
z%WK90+Um^v_wN&7jj0|8V;BEO$E4Y)UE5@`=|<gac+v+a-c@ZIJUe49=BV1_z21t-
zPK!oM!a2>5dd|?d$A;Y5RN&<#Ox4i5^ZUL|Yp*B=5d*f(8fj1N5H`9{_ZD#B*3o<`
zR%|`=$QxU)byj>b43cRJK^yIB%d9EhSHi)d7)a!H+Fk`>jaOLN<x!8~3v4sa=eEe4
zXv=KK_dp7QP6P9NetAW@XMc`*TdvTC4KN<=k}cmIK1;bogK?hQUG*zZNKeAu?O_f?
z@IFx){zZab?4FsWwJTcmE28~L=Y;F86NuWgUrkM(BPbrIjDMqk8^`RX;j~kFO}PB(
zYF$nhN>B$!$Mm*}kt4ACXFpu_V{DFnL`&^h>zhQUu<foXXN~R>IPl=prpWU)`h~Y{
z-(G>y9bhj~)@Pr;&O$6q0@VO$rBM&Ie=vx69iWXVEh+iJlym!i&6=I(a26v6M(1_s
z^9~k_h@95e(eF_u2ZXHF7(*t3A}hk#7_Cy%tYAjUGe+%os@_nS&w=NezJ7iNM~OrV
zV_-G&A1>?LxaYpUDW(%?`v=mVRPHM3LU;drQ;Tq7j|_69vCJ?ctitzlHy7Jw+UGX-
zeM(>AU@KLirT=aq64tBwOkNG+xd07*lnIDYGvfTwe*Sf~b7FTRUgz%;dwLi2eb7Es
zcak0i`3l{tXB=^L4Oxz{O-VmlTr<9q*p?q}fL_cX@Z!s|GC}kifiq%9U$DyQr$3wj
z*2uIEyK(SJ;^;?}z6&c)p~?2qVtj#@hu%#;t%j<B;5FLp4^W3xXD1jj+pXsP?ml!P
zBy7prg5P-prQr$Xqb?YQ2k;p-3+}=bG>}Go>1V}`d?n^G#6WV@H5Xn*hyP1++3np$
zT`zQ1sfAE+4xVDKj{S4>=0Bc+5u5H~95Rgimb`7Cq779-&2%LCbjS!uGdkShBVXe=
zEsQ4>61OYOt$c1+6Q$J1s99#q76%;o==)ZpFhJjf`@3r7()O}A&@(RkT<pP!;0z`-
zMxQP~XvB9xds>DyJ9bhSZS&(oMt&>7>%B`$OHZ!r)*>?z*fCL3TfN5J#bv>*yuYNm
zi#Iwer*3(Tg_E(v^d#CRumd{v2;WZw?bMO9aN@-Zy;JOjM>X2nw`&IpXg=-l9=Uzs
z&LA;i!WW;ZztuC&e@Bb{qC|gj0THSxG9`AnY(P?ix@(2CZZcGM@g07$y)Q2FWLYSd
z?bqmuXW`XzuvHy1F1bSnhc-A%DD|7Zqj#!lfz{UaMx~|DAfE&7Oh)Ias;X-2y?a9u
z_H!j@H67SfFdq3%pqyvi9$4Q3s|iIfP!*|~C}_c`y#v`>)ti#0w)MOz6z^20=a~xi
zKx8iBBYSdBF=EFKY{dr-BrgNxlT~BV4O^Zw<|o+r`uKpkEorZP^+O?}wo}4fYdAcv
zR#y`88f{q&AB2&{)HYl@O69^SvG0CVF;qS|c-^mqm|yN07d*|E^_4V(YR+?%RlJyq
zlN5SPOt?^d7j;Ez;hxD^7^3~y53PjTFYT(FE_>(^MO^;7ZyKfaAed~<jm>cAcisiV
ze{rZ^Dk4Og-4QbW{;Bm&uO|xCpWRUKVZ+|$@cy#kNQTsNI~t8<ViN50=~}^9+#fCa
zO-J#DVQ0c(5FMS6Hq3H})*rxpKF?9z?|n95Cw77shzZ<BC-<(nNS#t^X;+B?zXUwq
z{%m9ALRjGKovrKw&2~r{KG@+L`?@wfKj7>DB-_5%t_36T<3+*4+Svk3^15wxcu%tC
z2WJ&TXPM9V9oy9w6;F^9`<F|YyauO*p<H3zq3Z2?xwH&GvhaK|<aRfKo9Cg7pgb~~
zBLL>k`49wX*kEKykD?Qc>(rfx_`n+r=bco+1|*<8Hy)Cj&dZUK=qjA73P#&1a2ly9
zD_aM|uhO&Zc%FURM(SBp%KSyl;^`VXb2;dQtt)~Ji?QdVrO;)ow#b9Jsqw#YquF!d
z6kuuUbb*4$?dLDEP}|IdXvz`K@LKKf+5FdUC`w3l4~6Xlb9@5b6<9=_r=mm7qbb}O
z$9R8+*l_0uja=@`6DuJv;kyIjO=vKB0SE+_>bfOk8?{_9v9`M%><&~bD9REts^=Uu
zIT|=Fok2Y!ELMk@l-GB0k3pg7=;+iq5arEfV-H!*PMjV~zjQpWT)S>ve@MeCh)8RK
zsam!sOefiH>@X05HO$l8xQA_1fA4@nyygVC-(U-LYz17Tl+(K-wwwa7zfwz0ZH|J`
zC7v7Iqbq%@%i)?l-JPYH{I};%azw)5zwCO#0Y+&0DTN@V2MS3hN{+_MvM-H<dak<%
z0<R~WQ}S1pT>go=hiPq}qKevfZEFb&zlbZ=lK#@Z$~?1kb%%C&aY}f2_{Rl5@+?=p
z?JGWyJ?FQtE{WuR4k}19Kk@4|e<7Nv$%P`j`U~T?SvxL_?}&fPn|&IZz|n#k*LmPp
zRn$A?3|GmR{K*Sua6Js8sN1OUb;ze-Cgt;Pn&-~Xt0^}JmnYa`oF`FsN4lhkg1z`#
z8$;=GY6%9kr@9&Cg2w=B`BwFe4i7Ak(z+;b(_lwU=a8i251Rj*6)ojm?BW*vOGyXm
ztSHq55I_TNg8+JcPNo93lE919hxMB_ZMuarNdGCex!V6y9O|&4{cF$adOq(xheLwy
z=%YxPvaR}j-0RCLS)6QcG|8zxK^_vqD|A?m%||l@emk^7=(*iL!CnX3?|{9PS1rK-
zeTDtuYR1DDD&M_;^WnqFuR?DM#sBV{RL~W83#xO56qk$+_LRMRnac?@c4A+<_A?<<
zN=i#f|E&KrvR>rDOnv2y`l_^S*W@Ghl5j?8nkluGr1-@y0s6@8(MA18V88n81cie-
zI#aq+r}l%;l%bw9)`WD;$Syvv*2b_XeY+EtN`;6rltt$CePKhr<rw6MWE_w{2}Ey7
z_5)~uQ7E}Xs7wxRAPD8qF5AE~-iX-C`}f62yXSTn--0&^G!$qMuz3AI6gnL|q4vb7
z4H^anPD%%8I3TSk?_#F#{MoZ-8-OW<+O-9(g>k4|-XTb@yvjLbn#+W~2jmZw9RXDs
zIO80n|K4r6SJN{HPivD*Pvhs3sdG3J2#3N%Q3}0+ZDB8%Q)}zCuY3^<*wo9gNoy2x
z(4t*3!<kWQ=@!0R%rN|yatAhU6NK#-^`F`-_^OJ(MQCc2mSVBF;N#LQfMTbwtVPS5
zhwc?KMD~?+DUE;fa|;~>mE7$BuAm>FUlh4f_OBnTk&sA2wd995N8AZ++-!jn<Ui`N
zuk*`lnvZIWVxvdO3J24P!K}IYwZSVO(F!mC&Lj3DR|IcJ#no0MB{^Lg29HL^fp3J(
z5RJUJN#+4U@i<*HcjfSzmZJRVx396hfYw=eD@O6eE{nn9nYde1w#5VF2m02E=KVzq
zSTLLgTTrgsHiYx-#*adiMl`^xA&tOUA^=r@;FH=`6A4lX<4W3QDGlwUQs1C-95mc|
zsyBQzD)iQ^U#4!(Yedc}A9HX>;rK($!t@+-V_d|b^}}}5)#Q|EH7c{~=c3(i2Z`1`
zJMiw^#2POg*3N=rlC8P9xmX@?u4ZuNmk3`q+XpmA4=Wmn<^&=)2csT4#u~&@lUbmC
zGu+QwSXgKT%V`HW9zA;W<jD-O=FzkaCz_9`Nrq-;_N5c%QB+tse&@NF;McrhD?n?%
zVl~tZ5|%aTQ!JWy!d}UG>f(0B8~Z4q_-A2R3>(2sHP`~whIa^q4f5rWOTiYOCAdjX
zc<R3k%h)T+>0p*x0A<|>%bMZ+;3240EZ2@1x+OHF^CD2mK8+P(op5|#bwm7<^@~8K
zgyFQK)8)H86~$Ljp8So{9MAZ^fmX#f!V)!|NjT4=xj%pN*|TT31AKrl-CD_z+a_O;
zb3DHh%Gf;PrK(+<vFa6y{3LeB@nX3TtMupr+Y#@6b5+6y3^Qa=-}}{Jcwa9NidTdq
zu(EYJ4|H{5APQVS+G8^lR`dARl=Hj<2>%IRJ#nT4ppZzt{o7r<*aV5A*k*O7%@b5)
z+qdxk4nyE&)j9EImYvn{Qke9k<TG~~kCQX=H;vm{IPe72UA^xJ9u_EEeb4S8UIfeX
zU&U{wsfb;Fa}Yw<TOdU2&-|v!<D8Y)55f_N$EuK8m(R^Jv+FWg{L@doe)plS*AH93
zUQ~5{L~uijb=8LNUFDzRMk)88*n+j*lYjXf9?$Z`nySi(2M@~a-%jIo_<Q%l3iXY%
z@jv0K2lm^#^q*^b<jPA`|F#Y23`{c>sMoR5ht~u*@u-t_=rN%O1?%0(F{EZ3&w}Qy
zV0!Cj9(U<L^eaSrT)l?ED+XXPb^mCCoH-BMp|^<m=FJa*$QNp#zNUW)XB+G$20RGA
z@B}g<3C+&c9GEok$k=5ggYG-O+&c=bSMBJSfD8Mt;NXw2MCq_awsf^*U_+2k^I#_#
zGc`L?)vmB)8&B=-Oa<mJWG4!ppAQQlr`0R}prF{IHy00D!hR^vLQymF1}Dv{htU4}
zuwYN&a@}QVJAU}{&YgsRwSPeunD~w;a{k5sMI?9!*(%D)^+jE9H})Tk%^sNae#tw@
zq0-_kxgQ>W2!SKn!HDIYbgE6+EwH60EiZ#jtMlI-7YFM>r-!^l_6f1*4W~T<=5<m<
z<zmxw*JPp(VG}W<F%m7)C1k^AsNoL+=*Y8jY}F*Sk&fXwQqpUE-XV+&IA6in+6XQU
zn>FKr-*1Q5R78M*p>qNZ8exaP6T!y!#>xWqjn~jq!L*g#U_W6}dhF<!3pEDb`c&v(
zON8-4yN+{*eL4WGb%5j0|IpvvU|eP=loZ;E`Xn?bxPJ?_*_-ggLF)ka16+e9C<jDT
zZ^iL8e+*GKDC@f5E2<a`!DVgBBU>)21?YwChksPxzn@zbHh!;Un8;>;-@l!zj}Dp<
zmIVmh$QwZB^92M2z3MH3#(?g#9~?eMj=1YSK0cQ(gJ7j>3PZbSwex=4mKfz5L-Tf1
z=h)`sI2~kNOj}wTfhlM0gnzOPc`y5O`*wrc`dW8U&hgI6@=2?03+(<5u~T?Dma!(J
zOD!w7p+3of<E?G10Ozd+#q}Qws}7<XmNq9Er_b#OFj_W`LV3F#Fv29|>i|5-6geJ5
zo8&Rl7rz0ej*La|Qh`2fN~2%GChlv%;D=N?XklY(=Ye*TJXRLk^$*^uGXQ5cc`)rE
z5NMzTpcRY_5XS=s@;%fCBIx<$Zj%XWO+UqvxT#0OZ5+&Zc_9=8Yi_keG2TEZPR0*F
za_|oZ3Wknk&wfz_CaH~J$AcinWowf|i8x__<mizcQchlj(*tlI{I$;LZ$T}U_U>Mw
zpbL?C!w(Jflx&n^N6?xPF#%`E{-9nm(XeFL5?tKSrxut8HNHULqu<`%Tq*Pc538kP
z#(O;EnyW7mBqt8X)C05a{XecF&qXlLt_fk^UddYoHw9oscfV0IddqBT{Y@l3F&SJK
z63OgPV$W14HuvbSQM$jBkI%XxITbVH<i3h;AX>52b3+?T+-fxTj-5Mqs;E4N-*KF*
zZuBUfXKG#b*#LQ7Ds%@<5*asdf+xBGC(E$iZYWPccI{PD`^>uNl(6mO$01nN3>6=v
zl_te+iBVqc@)J`uMlT`?8OyayO}^Su(H%hGpj+0;;TVy(6Z=`a15r$F5(I6r;{QE~
z5$>)lHz2w=n1`dB621x(mp}cz&JTs(ke%*g9=ox33IwitC@lM*0Apx{&|1l-n3s9|
z#Ib~x3>O3kh8x(m66tBm%btr{dHqDG5}1;)C~)>x5>qn&2Oj4IrFc)LDPuN(`e%9u
zrs;<sPb*mPq4*bOaRu^_>=B8GE(z-YeS7!H1=SpNZ8-@PmzuJik8ilEs(j=K*%<AC
zRZXd|0gsO8-$`C3E3&&FYH7m;C8Y@nxT)r$-7*{J3NYpQe6+-C0m(l^+xDs%yX{6T
zqu6dRwr_GEFi==EqQ$*lwT>sFu<#g(DqJ1Eyc-;>aznGK_6k6F)MBf`Ri=MH8w=z|
z0Bd7~j@0>-A_gtXvMhAUr?jEZSMM%@igASK9vF_$0qzA58^}LV)&!RP_19kn$Bdcw
zqDLZPR0_k-8-!f$V!06+sO_%>qkX%I7<crWG@2Zt1;7Fv*%kC6Qu(UpEr{_F`!`t~
zR=|*Q0jha0-Bp7p>ig?UtMsv#Qe{pZ)mOCClbpZ`i5ueb8i1~W^jNjkVUK+_mD4u&
zoKlwF8{vC;w-WM+JRC~B_wZS<eFN?Qi3WYZ9sYtN=$@B7+Ba<VJ^7<a`4P0>n>SnR
z>3wam+wg^fDRyR7gb?|u+Yl)E@nx}#<Y~(#&2sTz8PTBMmv*2c!#-E}Y{`-(W8&9W
zH(=y_@kuNb>X?;Bd`%Z=(-t5~drVyO0#A@>$54eWvr(KoQ=|;U4ZQ}jk=UR|Cpi#}
zef#PmnME_J%W#WTYVd^uTKA$)Wm?+r${+lNb-35b{l~>uJ$Yj94;cPj405a-3QQgN
z)AJAoQry*$!&G~19|k9p-ki_}JL=9XWs2A_jSLOt@Mtt1^qDK`=UQ7NKN?`geivj1
zaHp^pZyfe^Yw4CtBD?A*s3~pbEo#Bt&v97dc^k}5Y)<Qy56V<9($}xWLd5eBXih$C
z+pt7HKww1cT6C`9rgY1))z1CMrC`VCJLAc3e5tunb>9+x{=~lT>hU4>0F45B0y4lM
z+uR?Kf^!8Y2@qPuYShFR6dDQJvqc_gEoWl;I#8cvUSMW!>tX(mp12IS_nfiV6nS;P
zbzJU%H6TW32i*khTv)!ve2h4DW^D@A>qhsHJEd15sa0D&Q*SQfX`Y#crV&luwKTAp
z#8hPo+Q8rd1ABg>$Cz(%a%3}6^HTpv$ZM#~0JQg{<s^J>RQb;BLtQ#X*-r7zG6?6x
zV=!vgzmkH2lH5u&s@exIWCE&w$BrHA*tGGUI%rOPCES^4FOi`izlZxTm8T&YZy8=X
zM6PG+tVD3~dT<u@%%qgkkurPH^)zQM*yM=nti@|xU13+2dwBJ1AUq9Cvh(RmKv~mY
z;!wTO@nk`W%8Hhg2zMo*PPNk;NDmy`PvQs5cftQbtE#wNz2X<S6WC8?jg{~FAK-H$
zN&|OG-8s^=*sV!G>ex$?YSIV+Vf?OU{oApl;e{Ls7j$pgD2aRcyJkO>(UTrO*`yE8
zP|7jzL+ezo{XJ>QsL*!03xFn(f2_Pcpwp68lXeFt!}kyZurH4;Vx!c|)`*1|2k0Gc
z(;CIZ+dN+>%85YiGPT!%Pe_chtb);<3#aXxn0aTR$a)%NB2k%u`rF<fslHA2sz|A4
zVNHRXX?)7NFaE4ue{rZYA4vXz+74p?48swB7LT4eNTs%q78MqP;<wTnPN+47r-9Yk
z7Q7#z(Z)4<&Mf)<szF6-4@5;j$)ug>cYB*lQnSpSp$qzJ=!txfa8H~TguHzD65mA3
z$;|2x?N4&V=y(76YZ0hd2!wEGj7HpSD=)UL=~>~G*G1>}8W%=vP=xDg@FtULE&Ku7
zMfZSwN8{_)hI+npY8Ql@=XpyWUD)3vv1VL%PU|Kow#}j_zEuD5qwDf|MB=KQsog^n
z4kGsK1cQD}!DeQIT<f?Lle*S6>%RRKFiYYV+_rsq{Ucb<3Ja|ZTP_v<3Q*l<V_iGo
zO5Ie@NOa46vIIKqc5UAlc=P5GK0ZX;Z7=W;;k||>4AEEQ!E)d^Tw>ml-nbxQ*M;lG
z^-~@j>>Lc{NxP0fcyN1I%pTN@?0KcTR<ywKhV3{6vN%v<{D`#%hMBPCS<?>yFlX}V
z;?TsNj-8SSUXTt~*G1hd*h&kRblT-~7vU^9H$M!>cgw^sfuY5r@`<)ojf2`o)vXE2
z0nJ8<1C@eL?(<u{2c@I;!b(a~lAP3TVos6ld74*v-_IF)uLeLbW2K!`=i&+^cx=9I
z9OMKej-29vZc8H^p9yYo+P+0F3W{;AcyaPI`ZnAZ0XhN(M2stz`&5$PjE0T$&eM!X
z+yTOBFkU+?7568`a;spIVssAv`?7uYPZ2!YF7312JDHJW$cS6>YlJW0n<M+?5yKVD
zx#{B1D-g}dSd#R`#I456&@j`gVr|Vwyth#9;8==!S$oY%@w*4mqZw8>@X;s&7+MUZ
zR7aPLYQ?dty$vq_47rCP-UnXwvb1!*sg9-Y^URtz%}~CnZ4npSV{Rq&%(R9{K=g4@
zJn=Qn`s!a$a3vhEXl4qVq!(A%rF}5O>!PBW{|ZOhu8G+;pu;LnT()7D3+`3+0y3Xz
zZ2PI+w=Y_aERRDjGv}8EF-1jB?5LLR-(e(8ywl7;T^yw4etN#J;N=p_STVZsJJeY_
ze;TX1;asHII@D1QrzG65u1W_IB6*V~nG|cr05Edm_JRnVSYPqUd9>mbJ~7l@L_XV@
zBeF?IsL(HR7mwDSqMM5?hh(XA7YQu-kw+2vp8$aU57#g$eHViA-ITo=b(H#U#_Qt<
zZQB2>_+6NWK-xa`$(ETYf`H>g1&FjvqJ1nF{%{wYkpdH0upNS@b_eh?L3J~1=qyO3
z5P?|zd3Fq&bi!~eVKO(#A(?Dz7kgs%(o!a1sDDYkX&yl2Lh-9t(w?8LUA>CNDO?Ru
zGz;k`c7p2fH0dn7@Yp}glqO6*9odoiqj(7|r%Ofv5=qrbbBLi4mY)946%`fKMC83#
zUzg95%<VnfOv-Mel(PzX4=COPF_Bst8hTVq!>v$vftzFt_P0$*<R-Xf6YyOoH5WM)
z!_{qyxLH6lq~8JuR8Ast=PNLQz{gX1;i2jK5iD34K)h3s-nA<lnw9$a*6k_WL!pQ$
z?Ax<b7nL2(pD*xWrNZt|PKs!Dl1bJ<;bu5cH0?>hlFg`0bw4ZoWyAhk;h9}f<RI#X
zKo*(U8KIgB`j<csDEd&0%tOnWj}rvENXR?f<Lr|9uYQ^*0fBNTmTI=`1j;P9t3J(+
zHGqf~6eQNWc0C#0kha4J{V{<>P=N!9uqFyabnMWXC$+wSxh(eYzNp7ltDM~kf-n9I
z=|C9(^hq*LT5S_3nG37ium{3F-DWBZ5ax7?uk2E$Wd2a(SF{9?y+|-sz;;|BjH3Az
zC`X?T!HJ<FVn9OU@(Imxd)63Ig0#yV;b1K@Ed?`#8R=858c3}&Gc%E+MzU;yjC_vT
z;M9ik>ZG@ulHykTXgcE;<6N*E{;}%x9*7Z~w}MIXz?Ox~kZ$=7Og0e;GKu_$5y`;r
zJ5-5VLGKh(;@$fNu9(w6!bnn2<IKqheokZ0?iFM>7chuXSZ!_v1f(}TgA^<H_U-t{
zTDsCm+d6_Z5wW<9YS~RlEImfrV{r+0qBMIjk1wjf9w)&|C~3>(Uy#oEqg_+J0&3A0
zYBn|<a9*da1ZeXn?=%z7`fil|Q|PX=PZ?^u;-gUmI`lAYY;`3OWrl_#QK&Uz+K$N^
zrls`&FBhWg@?nP0UJw}M2qNTQEH<-*k>KD}@F89D1oRALUD8{^)J%d*@-+}<)@Rt=
z<t!l+wGeWj9eld4?XSQ<f>~_s26Bu<6jxAiPV{zL^0fPKsFE3W<k4Z#odL!)_XBD?
zr>%%He)^BqRt7n#0TvXo^+MGP(aF^&Un#<=)I<#5HlEIX$>5hgVBz&40|&WY7s|WU
z_|gxr9xnF!Fo323x8=PhAcT{BfsPPg^MTI*G~?svH<&};5bz5V&X##_w)pawe-6@8
z&v+IqMEEs)l~ezr>ISxks*!Xo_d?Ut70SdlM%cCa{y*@5$9F{6L)eG6kOe&jZs715
ze_qCn9Tor+EAQqt?YPZrxBrh7+EdQY%5&V5#8nC4MItPm39$=|ZUDA-6_|2(eX`)5
zWnzZq4-W6nJ4`Y-@JjYa>G4trJQ_}X@Zbb08k7$;ITsv}8jV?yBMo}L@VM)bhD9YM
zwPqWvN{?<6DDjj&na@iiAeU^tq8d6fq73YR4B5w6z6dWR>RWfF1E(1LSo^%)TbW0S
z<||Rtd3~1iXMh~T?JB-;W0AdqE3ec2@Q%42o~0R(+kImq_#Y0-|DV6tdoD@EKoQ)O
zd4kvHHj#tz6LkAY6sJ86Iduz6!+GIV5(}w+)gf8BN3?PZCo5>##Ve`u#2RRuj)Kki
z$r-ps&LL{dXv6YVJZ_oy+{Yj|VbnK=jnf3kC0rezgEM%kJ>E{+j9eiG6+bibDmL|W
z*DuGu_xsP3%g1A%b2HDvj74Ofw5UoR;Po(<&(Cx96I3$mvGg2$!YhODd(4!M5h*8Z
z1+vu&yWrP|=)XN??j$KD=0v{>mU<R7aW{W4Ls%yUbqmIeb^MnPP?$!-w1a|LArWb9
zg~D$W4PkwgCO}g)VuAb@eTXpquD}1iOh6MUeq^rMCYoLyj02j^=okEr1GRpe(FNY0
zkBL*A#Fh~`#NzJ8yd1Ob5I;Fj(f#NY!!tc_AS?|g&W2Omp-(V_QaCYBxZN%ViOdtJ
z%I5-q3iBFw#mUG@vvz#{_o5QMr*O2SW9$IqmvImUm^do?^>Bh}Ul*|@L|Bnj_O&1)
zTml#RemFl1%8>O@dTaBMw3VxY@J$`;?r+b`f=Xlb-6cUP2`D4{SY7hORdepHyMdR+
zQBpgH_OsF6X2?IA$|t)jncoHl{y&(0C^-aS3-v@QJ5HX%TP-R?_d%Pxl$kvplN6%A
z9#d`&np#>+_p|8M{~lAm2Ct(hd=BKgTX6J}3+yO#1oSw`gIrI?sWNlkO4zKGU|sf`
zr204ialRB8LzErE2n^miw;9j%;RSK=eFOtXuKWx8yO}6giP8EM6V(Q|q^t0;6!IBZ
zJ&e2%4=d136C8uc|6?Cg*GlMdZ`~%(QnLm6&LBn!m^bBF@EkxH{Li>L=TPSi!tTQ{
z@sUvtY6u19KoGf1XANPcYq9sAn!=hPpVsX?R<Ey{*p~z|?8NK4<wC@(o3mVNv?L2~
zsXVLB)FlKLuzX?OsgA;D_Qn+}NH{>B#J)+d0306GZZjy9;Ef3e$(rO#G(16wZ6Eh|
z4(8y_=O2!S$r9%$3EBGsvk0lnaqGaPj1)?GMmX<AWii^<K56wqNv+=*fFY`HKI>l9
zbbx6bL2~05dD?Nt^F=Xa4iM7?;SmmDSwvt7=);u)2+J4wX|)c;^0kOEj1aQMavS?I
z0PCzD0+BPJEaKmRwcIanwrQ!xo!_%aaxat}EhWQs1>?@xN&vzf+HN60vcqsI|112k
z4rk6>$=pN3Yz);1LP3#GG7QeF;^r&AJLSK_MIF7o3{_y|kOOf>VJcbl@|$X|pQ`<@
z7*i<4t*3>?%`6lT*Z|h0hUpd0QnPL_#}6Sf3wEONEOLDiBn>ie2<mVviC+X#Xy**L
zA`_>=_egC|{C{DXK#FhXJfFt}U$tLL%iy#XUy?>iDx@eAr(q!VVUZ60U%1Z&{&-jN
z-``Nj0HLvr2%-V9@w<0#eSuxuMSfZvsjI@gXed-|`(a0@{sO#7SVZLWWQjc+A%azI
zpI-j`clnf4M8T=;0Li`_NDXTjuLPCzvlbD%NKLM0-P%~8FNxkSAz;%|A4ki91jD(E
zD|S{Z<Xt}>E$l*r#F+Xt4aw8wPrUWM(TK9i*@<iLgEeR&Q8BCyMypK0oWE6~Cq%*l
zGZ`yB_CMKe@I&FVXXyBbzGmPhPeY*qPZcQwyT^|d%xMDw@mw+#2r4n4FD3zEJvm{X
zBk@i1Ww9H3mXXM1{3qg&Z(KF@EVC<jVz<yq(j7&2HeOI?!C&Lk?>F|0SsC&={Nr|k
zd*a*cmQ%y>BeN$8B=7SwGwQB^g}<UQOU}kGUZ3&i*_9<@-Mzfj90$_(sHiMMA&J3r
z=Ex&!TCT|J5KLIc*g(Q^nv?R{BGJu4Jn^)LXEZHEPt((L97?n!7Q2ywBsfR*@FFJc
zfATdOlg*_gEdtke9933UMsmu@@gjz1X?r)f{yR}KYEgqqEn8ryXwkR(4HY?#mi=Qg
z^ExyPN(8)ehy|tN`P}6a)gGI~#QJs@wawoTcS^K;9}AmY8oX3qQTBuc+5-hN%2YIT
zq^5&IZm9Qg!w&^H=Zkd`gRfn?hN`+v2F+9Dw7oyHyM&p+uQFK8th@r;_&rb@=!)Uh
z5t%pA&=liihzWKi1LGv`_&kbtD$r+yyJ2SI!sW|l^Zj885&0F8vSiuQ<dToDI}|+2
zLKRAaB>k>muO)$VNPsbzg@DOZFPMnA*lW9J>awvz0v!vlEtdZS=xARdnhE^kR+k{8
zFj(&2zaKecIT}risb}LjTyf2HNdMW^*HMG9$J+28h05BS9Y1~?2L@c3j!*X0t~G1j
zX_R=5Okei=9hn^86;mf1h}N}+?!m1|uUq74=`F`to#&Z)E%R1v*(0=qk1sk-arn6e
zt)zcVO+?E{*f+7WtHGqSSgmQhf`SJ+CHWET=v?qTrnqbzXwVHrq+c(61dQA?sH32N
zGDj{4avK4IE0Gr2qOUQ3*n<@yYA|BFN+CfydcFdp-x`FXleaYX{KOkt1bSWCY)ON+
zW2pg_`6m{~;CUv(Mr)?g(B95zU+Cqq4QZVPrZXd2WF#ef&KGcVflT0ZlrYIGw+~v?
zcm8x_`sHQru$IXUOKJw`KM%`N&^#QYHwwyY?Bu=}{2WtDPqfHxKP{6q`{;sba-Qio
za_WGa#ceTVL+aT6ojcD6iWI<75Va2O`;*xJX3|fmKtM_Y1p&yfQGCD8_Ak^l0L5Q{
z>HxP1s0Q4BMFE^1sBb!&3Y1`Z`EOzAFf04Z(qw7uUskNR4dDv2Ol`(<5;(Us&}WlS
zH+E+53Le>E8O|iXNYgqW#Dr(gQchC$jqa!TG|qxV$m<eJh!snfMB)uYP797EVe^0(
zPjlgCc0Yad`$TE|-AQ7>h=|j#^lZDYi%AT5(%3Z{!q5yRMCqQJQ-R<y04gvq-7}#l
z7G~!&^dH)+S8}=*1Fg_Z0qUhHj|1rTV+|0GcSq$WKpMXdFs|LG8v7(i=Rf<;lzXDU
z_(_T5!x|bILVo1Jc0(0DKIVub)ghjeu0A_<#!l4lwPx6U%V49D9mxRKnm-JRtonAe
zQf0ebmnjrLz;1k~6J{9D+a25FvJyFBPo6wMJ`1!j;*f#@yY)FK{(zf*@G@)RKSu{3
zrkt{46Nrqz%gP4%TYd49E3H7e7Bd{pRrPh*p_O1bv25~)qG`;|!q2$j;MHS{)?JeI
z&dHF!+%uM-ru_|y$kpqEjI?zB`LY!G>zVT&|F^(wN^mV2G&C78xev|HUjU(_XQ8aB
z8YZ!_M5sJd&mXxGf#V#7=m4R~?50%Q1I*I#=QyTT^Ce`0P$n7R5jvpoz=Rb&e}0`L
zjj1U){rt^cluJh!XM%dbEow2xM^HftY#twRf>brDn08z$-5E~M^<0E~9R+FAWxwqR
zd)cyO5I*cL;lP-~ymr-D!xC!+&OzYV1G{4nHfGkGi!@n7D=GQ6kA#cd8xbvifL<3E
zXOJA)QPQKh0Q&p%6TzF0T(s!`tnS&y#;VoJz$v(KVoNC4*!0N2eoy!=5Gkb`Lvzno
zqR)eK;~_q*RSXzQ1&imlz3)eZ!@`t6>MUBPV)c%5NmB?k%5`c&=x;m4+37Y)oYV{7
z-ru+f4|)-BD+#O{{@_ICf&yg=QFRiAX)}DPSa5v%Hj8U4h-UXoZVo>`&6t?mT!Oe3
z_6?h(@6REUY}8g=$V&mjM5qIM`VE*AGLVfEI9jMgEwbXnG>O(_-PD@)9oY-sByN+W
zQrg>4Dw%<_991N23F67OJG|ff3N17PE-s&w4YTw{U~yHOSTI9CGpFwa&`}9_c{fC#
zzo|Z}<x<wv{2i;!TW&y5(BRE5?mamhb++ed7lHIfOQ(Zsm{9`^Gf|d0<CdVjB|Z_r
zNQftuU&P9us#yL8dref6N1qiM5hSJ}#7*vxXO~f~!<o~OWb>-kB}@&Rf{#WE*=<tN
zy(Y#x-nWblbag7Oqm~T9_91NH%%6U~4P#+!>tiPnomNF6@pfqJQT6ljseITsufGs%
zi)Nft!*NV$!k)I8>ND*WN<t9+-=W1@rSo>eQKDk63j<oxp9_vA?7-)^5I17dlg^jv
z4l`cI<=FQwf>A>0-380mCdA(y3<Yn7MY%yp$WAeUkl2qSSZ$-7$2U1)Mv*02A*k8Y
z_dscH6xbi(^+CVMNat_NWpYv1(kd%0RUEe0hfbuOwrW_0k-f{SgO8_sgc95XqxCof
zGur1>+K0&&51l#4mw1iNe_qNnT=xVaGx>N65hzc*eM-HY6?xTVJBI#azd8d$V_zZp
zcuWORx!(-CpqxnhP#TiRtV9ndW|Z=50Z&&m#Zv2PDxh<eAO<~_mEftcxej~m<fWp1
zRL_r5!9)ZEQypn48qUx`=AO&1omSyJAHK}@&H4=%Crv6I!hn$I2t@cmON-A{7MvO_
zy9NDN*z9fV{cV*KiDt@Ldb>^arVB{~^lkZ+iJ&e0r_die(GwA&w0!AO|LY{!u}q+(
zkTH!lRBlt!Lbu&_=_DPK$WD%?c9G1zqR+E2U_%MsFr?!YGAc_*B7m;mYCmJsKZq58
z4SX{z6U~Jd1ZZZzp-0+rss#3tu>scAsDWF6ipMyTUY~NNM`h|+BBaI+44m)==mnsG
zs{t>-qUG4(O(6b>LFl7|nNBp)#WARpDd9MW(25<L`w7yUwn?nm3EKb3Xfn0Edr1zC
ziYRqZl(LkG#<Q{x4JhsU*IY6rA0FPyL1A8ofu-8e%@~lREjLEFYpvrp85#Y5FamBX
zklL~j2PKCS92z=~gsW;$C{wXy5P;<(5}dG>J?%7fEm>7SJaqD`5coA3sPzB}deVhv
z2a`!)UcHZJ;R3ql51MrpPDVwLwua{J&b0_K9XKb*J%saQGHXkU4HwUUw@+*kpO?Nv
zY*IRpsHtU}Jyriq6VcO6Mw0FEig2MP;G{8??jl0ZNkn9z=uGL{(JBUssn|Rz+a#6_
zM2|-=YsPZLjlh$!5<g2ob?nQDi5S6~QSB3|TP)683G!enqkzyFI6UAh0)1kh?~cGm
z;H+JkFMi$DwGF`@glcr7EkO19kDG-)!ulWd3BDIgtOglwh&4FiHmtow-U$zvk4Z8I
z>O8B92>^~5PMnW*AmvK3uyJMwW7=Rn4is`PJKI2cq75NxMiO37Gj}iU5QI|Qc!XMn
zVCy?O3}~U#q1J!wAIVz#d)U+!6Rlq3mXrO_t>ys)rO5$)QJNSolhgq4Gx0YB`0$;K
z0bn2j4?T!y2wJv@y7}i-a=l*TtzJ{!6EkTuU@r*8Bl#m>O$;!!hfEyAAruhc{HPdk
z1&B67#zn%lPc^%Q5HnRnlt7>k+{BF_AoQR5ZU1~(2E++4JVKlVwqOE=FTyNhHyWao
zBf;%32~DKGpT$7PJ(<wh(E+9g0S<Qqb(ZDb$nCE+25YCacW-$^@00;08zu_8Zisvk
zP;@tph%VVGFF%58vM;2O2NpPlh<K`GC{S|**W)?gM^HU_wl)D*)bEp!9om@e;IdB!
z8=+|SR*Pw_Y#xG=bddGfQOU7nmf8xaMOBF$R5NAtHktXs#Vi_~&NsXrYLl7xt7{xt
zzWlhc$Y81?%lWHGEwLMe^ZME3IQM!x&l$6O7lRK6j@sR-jWGIIYR+xt@1X5WcRvfH
z)&SB(l6!jPigwx882m7|j(9YdqS9Z{$FIJZ&;QEHR&idIO`=jj06@@S%u`t4aftIW
z-YXvP(Ndp(=Xy!3&~(Z|jNtipgI?(QzxmZeYKikEYPRwUbMh7tKU@<%*>PE7Hrl_>
zF``gZ5RQ0nMq1-Akm>-abXCiEr5I7B85}sUaK(!F{@})eU_tKNS!CFe%P=pD{?`-K
z`y`zO^$;*Y18(<cUhWX@3!IW5!082~Y(mgAdgs2;VqTsGiVDe~at>%5&WB;Dv!Tu}
z6j|%v5*5E_uR<;S<zdn4s+@2^d1GEU`hzGj{ORLw<)y&=KNURk|H02~jRJ*?=>TQ+
z!Mt2mlvV+8)wE|l?5xzrTVv%+UXSJN_DJtlh@k`y+BZ{JYx}43fd!<Q{C4CPMb12K
zHB>lP5zK*j#^Br^*MFOQM|tGBUPeY{?b=A-RfxPxuicIGf1W?Bz<>NH5jdc}9}$S=
z1%18cM)uRNi}%kQMt<t1<J>mhA0hYV-Mf%PzFyd+_P^xL@h$dcWoF8SV9o+80osRs
zrb4z%?F5-<9jXx3(>#F5MAak5q3rQw`IKff58x=NYKFE(smv$R4M&$e3ljW_sWO3_
z7ko@??v;^jU;YDS_*=&G$rw~1n5cwF1U)?m(&vds{2lD9FGvBh5@cfHhYt(3`U1PX
zz6LNO01C6)OJ{-Zg$BH2<7?<m6fo-^n;h}XJ5Qxw3bFG}yX2jUiH>gn>OQfwM67gg
ztkPKgt~!FfiqeK}5_FkC94AP%fg9sbcn$x$0tp9-5H<)E999QsTM-Eb$cg*xN}rt}
z@p@NL*^%_tY8@@>HLC>$?N25sU((dj$opI@N)A$#KN~k}fS3k`1$Zb6?Erjz^)ob0
zjC$3@>sZ2O5vbD$cn8JU(wYT|L*eA~#~GB>WXq6#_z$lM+4xazp#v=`aYbMNbQy6*
zsUPgUMvW)UCNQEIB<kBiVGg}8jw)iM%tjZ2-6YNZtkA}de#oK;`hrZgY#3*VSr-wm
zwlxXqu(*D$BvBTS7Mx^)0w|0m4i5RJm>IK-U=3LqaI4)DzUV{R-o*un)xR+OcXx&d
zI3yHm7}?T~beE4Xn`E50$B~R1;GEIm-`~@GiCz0C)h^i~)<pPH(*2e>TEFqj{{hCr
zruP06$sqyw<dN%HxL4mE*R2g>cZBPGSs*CFDc3tu++FVZbeSdVAm4U4QcT{>KDI-3
zX@L0Tg{0#dA>x4WOAZd7XKeskS#Z25e=G)!4^DFuGC(e!)Y%2*@8GTRu(3(_`kY=L
z@iTRJAp}jDEb+VA*QZ1i_bB|rcq_%q27vzID8J|Y4&#ji5STC-91C&;?FB|<7;0`6
z7H&t8LeAugvWa0OB6R6@hkKV9%7V;w2#$@ZQCFoCp9Cl9UFmfY&(=E><5k5B5;uJM
zP`3`@N%LzcB2+<c;1Ow%1lfvsG6vVlbW-L68H#bx7mzwMZgYG|0zMPy6e<q+{K@Rr
zWbA-GqDh%3)1d!*ReBO=DW>*9W5Jg_$rX~>g&2<`Lq=h#4X3?_8Gw*mh+f-)L4JZM
z$lBk|DBGYF`jI)0OaX!;d;;T?xETRZl`t-b!ND|Yt|<j|XrUb+H|>2~+@{e~#sKDz
zW}hvx=g)q3ksqmGq4xR1&+Uz``1#dw?mz2iT{MGZ2X_j@%0|#;o}QlIkXF0CUzF!F
zvPKlL;eRAyaYK!z0)|f0lCwJ!aL3;i5mprRQ#08UJXz)N@g#!zx3=qGGLBkWlHu!R
z+rR9$C=^GEqzY#|lm$3}rAP~sG&eJ%kFuJ^_34RMOF*J+i)tP~$lVOGP)<!&0fCcq
zM!{G7Oulw&vd{g$Ut9Qf{_6j|FO#D^|I^pTwW}<s(q1dlAO}w>aV6HZQ7~r|ZxK~G
z3pyw=Ufh#)zImY5*d7MM^s$lS@Y@9Nk&N*>%`zCJZEsAcpN8tHej@oi4xWkR(u~Lw
z%*k>~JJ>7(e*v9^BXX2Ik~}dY8PbLA6|>pySd)=sGIk@75RR@9g)|!{#C`wFE(DP`
z>$^O%=O;FEoZufP44yz77P}E*;-|>XYZ~iz$-WO~;(I0ou^Q3{g9o&b?q_Vl2xax;
ze!1Q>6>webN}?r8$KYriv0FmDGG9>99lg_l=tYP=QE!pyM0UH8=-m#uo@Ba#uxF!C
zMy@4xU#_2E%4bLv@-b!%+&Das7?%lqgLRlOfdgu&*yZs>B!P|qF6+V&By13z?T{a0
z%delP@rLsiy*R`0;S+m))ciH1x$k|uv%qfCh7Bqk+2e&$h)xRn0`&vfUci77X1SS|
z-e_+;+%qxWgHu7jIIOHQJ{^V+NA6P_l5oy>AMjwpaRG(0a25V9{wy3ocm@9Kcuj19
q_;c6~=N<l>SNQr3AFi(+^NJaht=WEm_FM9A_9<)bN!oSj?EeG$%%$A`

literal 0
HcmV?d00001

diff --git a/media/images/cutlass-tile-structure.png b/media/images/cutlass-tile-structure.png
new file mode 100644
index 0000000000000000000000000000000000000000..a8fc35203d0e73e6de8e447e417afce990309360
GIT binary patch
literal 116377
zcmeFZcT|(>*DZ<-MVbv!5ZI`IfPnN4Dk>rZO7EaZ@4bUqKu|yhL^>!v6e0Ak2q?XU
z4nZk_KnM^*3GJ-t?{~iM+;P7%#y$7mG0q<+V{bPG$osy}v!1o)nscrl`ao5Y_BhjV
z3JMBZrMtJ(DJUq9QBWKyJ9ZG>>G`Kl7XEX<RbBBWMM39<dHBm=%Nr^;C@6{|sdpY7
zfxlBZ-PLoYpkNm#|9e1KH^qm7Vn0La)(uTB<Hhl#UKg5n_g5a`$KP`>Rw^%*jqy@G
z7d&^L_Q1{KCv1G!iLuAIF9+WJ=W^QR7avT0irB>_Cwv8Tmx}F_i+%8<z;%!OV>-hh
z_~zGleU>D<a7#&|)xy%k=!9{CwUyO1xIVm`*i0}cf4{7t31a{IRqVxUhyQ#vseU;4
z?^}jp4JZD5^;G%fIr8(tuW}z$`11t?|7}xvaCkLj9HTk#=c|e{|Ko>sJIL&9PRX^%
zY)(G!>_rL&?)hPM<>Us9JdIRUBarZk74Ov)6rM-Hg|Cm!PEAdv%XFq)+Sr_mlwa#s
z=%hBIyCCs4F>$d5K7Oh3&Hwv5^<!dUO1$iJU<a#H@1mZfa){!o>*W9Zx*fBkpN$SG
zRQ#i=#rul(0ELqr`Ek3?di8ybZ8)KS-<5}g{M4OC$$yR<bY$9hiDXX{h;dIKF#TDT
zLD%3``+zU)Z`c!GyYdd(*UM2*bT<o{9iw<E_RY4r>2R>q*;hy5Bdh*=@IcANJE0)<
z#IKT!+P`m5P?SiJSG+_I=eBv@^ca_?!_0eA*cHZp=b$u#BJ9Ca>NJ+{94eY$!mk$L
zld-CO7ffC>oJcxAL7_k1WEZieCA34&0-rSUOxy0=JPrKJ*%SZT&W0l`8BaFZ>MkFq
zNDY_J`s_EB@q{qj;i}%TKAYeuM`#!Be0`dq<Fhbq5VLa+lleh~O*YaqxSx|9G&H4~
zh3|XLQ^2oQScMD4zW)_CM|}`Jz2x!h`<4_GPs=7Bm;Goz_w8qr0e8AM6-C1l_cTjb
zyr*Y-BAWZ*xhXM*{8Xpl(SQGWbc@oyU&8R{FI{=_ZoQ(Qu;M01qLuB)_T9LK6P-s+
zUW7+F@@Jio6`p52eeT<q6ymXp9jpQ226-jQ8WJeK?eLuMj18;k@TMg%|I-CYg&8q<
zU5n-u{I4_^cFRmS;3L~U3Ld7oZZN50W(-^VC4S)er<)WMiClk{`lPY&2nYEvbUXZ6
zC%)Id|3!eq=l|EI#Y#M29hoA@ZI-E)vXtI==ia@rsMTY1bRLj18e%pp;oLu6PycbL
zwNcM)T}Vji+4JY8Pn}8}gzx76$BBx45BmtO|LfWMpI#ci`Tyvk{+|zn75HCSGdWsX
zTGe8$T}UTV{6VijXJ*dAxk(na{qV2DUm|$p#tkhktzW->=@@&@oK}<RDYezHZ1T1}
zEgT$A`TXA-EiyySLi$Xw-A+l=p7)N7aEixzW2MJ}h3G3nY!|9+g^f*2@ag*c2^G<c
z6?!-CGgW<L65t>ZiQy3u5uu?}$B)}wVmxOo(Q5bT(IXEJ4|{w2>({Rv8XDT!<qcx0
z9^SYSRBWQBm*ZCMF#fHvQDBTaQ{|ypTWhP^nAYN<Lx)bEKCN)`rslasl(9;OrIOOm
zug{OhXcuS=U%GfPdY$yR@Qt#uadMcykx>%X*U!)I$&>Wn&a)HB=XK%)R<jEV)(He<
zRn-C3ZXWRqo-B{6>v)lAX=zejM~@!0tz=du?(OaI5F{lf?}fa4nG>Yp@2SR|^#;+7
z@E`Q9Q;y}AnyO3-*BI9B%Y3uYjacR#Y^}Db{UB}NC2Fqct>dqwZ|N1|jXU5QGpHdx
zyZo!sX38xO=bEJ4S|e0olbn!Xps$~MFm*+Fu)s)b*6964Zf@@H-;Y^5lSbWxb<oWP
z_zC~qay2Wd?;iE4*6voHKYi-2tDcrAoI(f{)|k9f{;6NTmMB7V%Wm$IH4V+YpH$~1
zZf+&&B$V;JtjHK%ox1I%YN?FeBS|ves~NGzxj|9L5#M1<pLyGdeBGjp!onK!j{XY<
zyW1Ou+1bl^8x}UVVmijFJr^nvl1g{)ZjNE(25WsiWBkNRI1U^*kRa|DuvCeOUK+?B
zo$L7=LUaBTArK*cfHA(cX0^`r>$42y*j#*e&o|LQLt(FFQ|W8i@qR_k7U$BCRzF?c
zp+odCslv&}YX;doXKHI|WMpNHh(>(+UCFWn^*b&bZ_bO{{V493?7z{_-`}syUwMl-
zzF^?d<89pHIolp*J6OQS&E4a@S5UpwdtQy<>+m<<t?g~w?9|per(ZXd7NQpl1BeJF
z$st^wrv@vkju)Sc_mQ+4x)$SIiZ>4Ygv?<kr0nk~8c8RieKwZ-hs|T>-(Z4;3Y(2k
zew~Suqveh|2j<2q3FDsV{12V97%9}oXT?Z|p)ZeCemA+hyGu2i_!CjB)hrTDVyk!7
zsZ<oiN}YKK_YexwF4K2ec1K3^yErHAyBmgV&%~Ncl-e=|v6s{|H@poStlgOK-QV3n
zoSrALzi()07&P|9Nu#$^A?71lW$X5L@qxPwCW8e|jiyRnU9uZv@_Q@vqFna`^h@sU
za)}>q>JPed^{Qs%mM?mHVsCd_t24z1%Pq>qvt^9_F!c2uz1*fLX>Hy|(xyLK8egNq
zU~*)F_W5*oceniRyqcQ)Zi&xBCLWp9AD6_(oSyqcb=u%Fo*Nq)=Fz=a94#+Y2%%#O
z*i56O;aN5gEI=OpiIu>v6&z@ML3KL%oZ#aZ>!Hl8ek~C!`<pHDd(&L<4@s+S0{a8y
zb?)QtgO$G^A`7Or8`<_AOid>yCPqg`i%)ndC~%5T8?hv`x3|X{`^^93O6jju#cY+M
z1Eks6ztVk>WcKDJ+V_*UY1YSkA-_C;kbu4*?U8rq0r?(AH;%G;O%7Y8Xg%&tSHe!e
zVUw@R%WH>CKXT+qPQ3iiawF2ROZ&hBl|cC2-@kv4EjLB3CMPEs5JpY*Njl*s4psA<
z;Yl%`D9=Ixg1WKs-u@nXUn5ROpJhZKVCA*7wKYFgFi!%61SVF%MAh^dU!k?>+}ERQ
zJI&&C?*PH&5p3{qga+%@OY`!s(nbaBOtGPT@wJ`D8NK$lFrs&j%N>$>5!(6c8$HHL
zL^mPS^@qDnwZ0qcxY3PDOtMDH!$VY-rRCexQEL4!t_WJRfAn3dR5Y>-KU)*fkgDox
zWi`jPw;Ym{>~l}{2dk{lmHa4UXXhg1%Z=XaMcLVNFBy$D2kZArExVF8H#aL?G3!g?
zqqH}i+>=*VS2bs~(7Zf6{FT%1Q+B4gE-6Oz%k}8?4FB-Gt*E#^uNGK*^k*)S>56KS
z6v}vpQl8WkY3#Rh8|9gVK?m;dMn|8qd|3|5VIH_x)DjKv%5P2{qCJ!3KB0Q(_6(fN
zdFiE!scQ7@5@ar%mP6{BePUrC%G+^u`X|r+Y0mpj3Z_>iBqXGzw=wejm0><mH1zf3
zgN2u<XmD_fP&y|5zeBnDGtn+>eD%9HM`^dYNn#MYZ}Z!*4Sc{xHTgX_JHD7CPda9?
zcG@6z;-hF4_eoSO6*aX++mcrOJ&#<96G3U(Y3!evGk*;;wNOe0RXs}V*6hP~kGX!o
z9cSNOolNZ28kR3;M{qsDAHZ8!BCU6ny~}mHWu@^gG2S{X8=2-4#!IJKUCiRj7pjvy
zLNmR~H-eR~AX`wL(l|<w30w)n2U#}NTB9sdh7X?^GhSj1Z!w~Z3AD^9mo6~LdQm$@
z8|_(CxL<K%Q%mSi&3!6{`*wSW>fZoM)0Q$=HL&)aPSju6WB8!`-<?N}HZ_f?<;@dO
z|LRWoFIfEhxBjE=ut{ooKqx#pW%I93r+#t%-~9^ecu*QL>G1b-_P-aVP9s{<B%Rw}
zKlQioaXRV54PX{tPnC@p8@ekyC?C_E{PV{3*S0g~6|%xMPf$VA0<Vhhif91R@M_55
zw=tdbn>`>H^0ysIH7}iglh)Vb^Xl-wAHnb*<)5FORL}R|)^p`NoP=Bd^9F@g-D_F1
zIh_`X!mjVb@!5a7t?SBD>VI#a;(ut$oNh$N#<EGeJb^4P?YT5o?TPRCtcXA$AkKIN
z1RNWKX;b`Gf5NHS2yWTN*ULLj)Tktg&CJe9F@JrXt;u-iOtu$hdiu=SvjYPIQoQ6_
zNKN|Z+KUhALCzKyv&H6ZvmFWLUMs(6+F}cJi*9yNGxGPp7quOjo|zF95s@(PeFsUL
zCyV;*Roz-2VlXYU7+j)BAvBy>yg<Lyrsvb`kp=^#0N|abrlyxKUz(enW8zv!B+{o(
zpCB*d(Dm}Nvi_LPB)Ij?A3r4a)#L(segP<u_E_u|)OrWqVx(4?yOY+4`x;R_)PA&V
z9`8BfRM6ViHkfaaC4_XDX~m6}``Q+fm$n;wj3%u~Q%466<%WnwF<lcdsq@<<5t+Je
zObeY?M@nsDuj+kzhitA2p=TTTf%aD0&Z>E0X~~O(2Qx%ks90EJHZPw%d2)pnFjGuS
z%=z=@M-H{_!GpQDxFmY|#6l*RyY4t#Jkt<#2qWfv$G5noL{r)oo*+TYzPHn`(j|jM
zw;$OWv-f%+>HX(@qZvK(Av*tn)t_9i83l|>ZDQyO<_e8Utlpi?&2}8CcsR3@xIa={
zT+AZvG4xCG;r!pGd-5RrwHIfR_M>97=C~VnPEJl%R#v*Yx|*8N$uV@tkLPA*cmMF7
z@68CIV{w`2+k<r-UU}Wxde2;#o&C|~@~<c^wPZ2-5y%s=*1hRa@`r|opftwEGnogD
zSGjL(ZFMHp-ZnBCAILYrg$l!Z$(OfLmKqG?=@CY33v0J#6QJ!It#F>|Op@Nfqf_3!
zEArh~g6Lt9bV<+6Z5^%>jgE=&U+Ym+{&4l-fq@<xDk>^^`oSCJ!!u)Ow8`zqOJkL6
zfjbaKnd@%|v&ghJ0=i#PVYT*Odt@djF_43;yB9X>h}9b6M)jRlCaP@+jLl6NX0gQq
z1IJo&d4PW)t7AwDg=$JlJr?>2$;l2O4->`9ElW#FnHnM3D$~-~|M|ysZLX)4I8<b|
z4do%<pnPe(n*Q9i$y`K1)%u9-QCg<-U$tVRb^g^J(S!iUcknQQ`+M)-pJFkw>>2KM
z&?~h;RpaZbEjr?#Jv$f^o}0^q;|~nnfBW`?ynH<tYr|(fK7aF5y@vTvME{H6;M}`v
zAFn+cDY5367&LV4Fpo7FC^V^`oHVu13@=rKGvi4&7!9|fx_v`hBjt1M^i?v^^OX8I
z@B>fptU{=?c6MrCyn5BH{i7h9Qe_ntmAiLeMMkRKzrTpC-+y)T(psK#fVK5}nnFl#
zUtgEKu~LG|kb>kYk%&Vfbm{|kqs?(asi~<Hk&}~?%gf6E3l1Ejw9+|DNjZzb@NUn{
z%ycT2D8MRlaB%49=^dqK9V;?x`Q7w7md`+2S9fk|$}Hqa5-vU~H`ivSHHKNtPQq#O
zsoX7TmFk6FWr5n+c-u^<Zsx7gh{8G_c+}Hes`u~RTO|-&CkF1hJ=tEH|16Jh<t@A*
z?l9J!rl6GzOOL=nk6`;VT`5YF(k(Sc0CzFQm4P19VcFZ={RP5@&!8;(0SblUMw0t@
z3JOE3!@=DL@7=p6x4YH{(My{EO%Fh!Q7FfmX8Pe#@H?_TYjfGzS70~7!j6Xr5Et_t
z%0-?E@bIWdL=PL+`f%er!%ko3<n);D<@o2H>xcHBe8VPkB)a3m={AyOeIcZgHmKYt
zIDdM@Pe#k^VNozAN^{o7V#!YqC#ct<pAMG2zLk9E&5*kue}7d{Qu3=YL@iNb1y%z$
zQi||MC3Fs$9?frlbKdnQM=Z^Gp>%_ChoYjQwB)wS<VLB?{S~o=mm0FiNL^amBS;Ay
zDI(EHN%=<c@7|@6dUG_gAVU7KW&9!s6(meVMMb^6y&*H+vq~KMtVr*x>34zF8B*ay
zn!-_9PXHhyB;vD%x5W>PjO-&PL_f-_Jo!F2D9*#vn*5-zyE|2Ugz-YD;_chF=jZ1E
z!o$I~)z;QFGBSc-N)oVqZP7PM-frlGHk!YGPtV9uNs+5HsShAsw|s4;nf>kCx1HVH
zq``c45fL|Re~v;hO;3@>*`#&=C9n~t2H1rKS69~rZ`2c2)lL#|VPk0=QQQMJxH8qk
zTaPKzA!psxtz$I5{1_M*SmgY4sc4^zmf^=Lk+nOwm}YG9%X&V*at{v==lcr$B4F@%
z^f?+HettQXW7ivfw^<chs|yPYWoJDHO2ygP*_D)(`~hi?SC{XO0n~f?l)}7Y_>(sT
z2!OMMxVW5eCm0w+O&gv<D3>|RVb<bZf0U>^dGf@`=}WKF7~DfgrRaN}9yo#I^1$@&
z{d*z1p)U^ORVNw9b=v9V38090pfv8p<$w9|rJ_PY+FzYT%Iz3rE+?I}g5qK!%iG&$
zSXfw2ol-Y3DO^m?${IaT9F?1s^Ru(FAU~hDu|ZEu8y*^JO&py`L}q7a*ZFU&E}z2-
zx=jCo^N6ISF}JW-8ZB4zy;Gf`mLhlPC|!Su#6r!><H1o<rC2N$!pi~D7F-D)n2#@C
zr_k75@;Vt0G$fGkuGgxpqC%G{JP7B@H`=Cl&sKD^T(J%IxTB^uvjdhQ?DcB`fuIpV
z$0}0+1<`+dJ!#FN5dvwQCTD0!cY9s1GtA>|Aavw@o{<i$vcBswA?Fq1;^Gt|E)-od
zhjmrGf8R~J#FB?<{Ydb=?aj>>UIAJi#_sAor&0n)^O-6MQ0z261k<s^zkmOGVPQ1U
z`wrY5h0`8+qphFV?w6GHGEJuh^o9(GslL3z%WI2|eeXWkomP!$R+3{iD6@+Li~vOw
zvIWli*1AJcU@fAi#!vu`^LTw=;5N<}h>>O`(a81Z>vtR+9Nu9D#()0&DJUoyj)*W5
za1>ZOikX?oF-6F1l1R<X&B>W}`cWvTJWnQSyhj*D)XmKnhl+qr=(Hi<Sj95=#!&tJ
zBC0!*Q!@{toem$>)YMG0zn(_Rbj`FOM#uO(8ykLVO2fp&L|3;0Py+yHA~cSpCDu`t
zJJlXI{i4TB5H_VAKi;xK_c9?UI_oDQA~HQaolS8if3>^Rc5rUaDx>uBrAuazLm*!c
zRXBh4FtV_)*shv*ptrr&r$&AJ_#&KEk9bM9?G5}sU>D_k_e#tmTk}^h77y$Wi<0k_
z|CZ@745FZ*K(OxfN`8_A!@ilP?Z9SbRaMpQ-V@)?P^RVlN%xbaN*&R4kWE@Ojg5@~
zjb)_-RQV9GTLg@NQI#8hqE=rNvNP3b&cxZ-v89KBi<l}+Q`q#I3JOrL>+Ob%hmn@h
z<61R^F^sr>;_%s8X<>sDc&mENPC(0+p>+_d<m=b3V?<-ZCu)6D))Yy%^q}h+hniz!
zYm0mJE2oSMgr8D}0M{BDys*CeU}tA1{`9$Cv325&b-edz+o-6yjF_01h=`^hH67hj
zZ-(;Co6lUz;l_yzgLufAB_$#<GBsu`5j{OU;X1vQamTL%veMFuS^wxSi2^_dxU0f%
zYZba^kxQ4Rppf`XK=S_pSu0<^6p$wb(jw%8a1-B;DJk{d1Pkd|27s#&#p&tkQLHNf
zBms3^c`hd>2kDPl&aWaY97*?QoiCDeEYtMpN>cOi^{hungBMFY4+lrTeDmf_oUo<C
zSVa-wE(l3-2mR$yqey4un>RG{^z?Le+6BnsVvDZi+JIdW)Dlb*f2NQIWL5(M#KF%P
zxE@ps6JH@Qu`+lvNLrzxp^!wn>E670b&QraKPRV03?T7PrE3=9q<!Sx51@St4J*};
z7;IsodD~o>0(vb8r2^<30IDG~qTzc}laX^1Lz0xc%K$m2HZ*~l!q?E!qS(bW^tyIh
zQ^cYyi#oIrBXm)EJis1ZxBEF#u2{g0Nz|s_eb6Wt@*I@O1jo9q2<fGdBG&4#4aIs;
z2n-EtU=eS>K5PEuiG-sEZ%hzCKnBWf^9K(eq{#UfRAF<gm#P-pO!kV`M;Yrkn}FaT
zAWU|#(cBtRo=bV*rSzpy<@TeQnC6T9nR!rew^nB$qe~5tS6k@GU3GPJvvVcy!oI?B
zkA62cW@xU$k*<-Y+J5N}JV&?wpOi6Yt9GXM?dBV3P?@D!(>;?U>>Nz!SftkGvr<@P
zyuJVinFK&hN%IPJ0A5s74=+kedM{6Y)iHE#g7vC)oBw1Fxz7WRz4KHvY<k)G@d_&&
z8=E|d$Nse*gNNyHwGa>=KYqMI&mrZpC}Gu|`tFh<ph2CC+m1bS=rVf)gHd-L6t7M}
ziNM7^<(bDoJ#lk$ua8V!p(fK`{QP9<E&JhT&6}z|jn=pi%_C{Id<(hBp)_)pk{Lp&
zc;u3SZ=$1s3<GT%&if*SoJwF?UeXAZfS^N1qZi)3eS70MB>*l--iXkMh_b-vevnPb
zkzoP(o1Fa09ZgiW_ivXG9v$^8S%Bhul<vaE#6-W|6zjonKs{w;WB>zW-3F8k5QpVC
z(zIII+5n_oQMp>svS@opgom?;+3BL|{N3}C_~Z~@zFY&Qk!m}3(bdI;F6lZoJ*$ka
zkx_n!rpB7doVm94hh!uY*`?b?evH4B+PcC4efRdIAz?bb1mo-Jo}~*7Z&!-}508zF
z0hpYdn}eN6w9!`tRx$O)bJ*9jXU?Qw)zQ+z4I^7-g4h|DeShmd$85|mzU0c_t9D<o
zK$lmSm6he?<v~piKdh+v(Gxd9glw~**4qY+2Y|xJ3zF)JV-u6N!r6Nk7Z;(QtS1f_
z;8P}X<>&#+vy6<k7_04?ni@T%MJ=IIT3;@3ZwCM&21&l}$(oZ;7>~n?p1!<~i7O@G
z`-I4~bkF%(kE-#9Vz0x(qFHFicXxNq9zRxPn?6oUO9siNrm1Cv)$mJWGWgGe5|8Wi
z^7Bi%P9%kuy@`y}vF@=@*VZ1;4by)YF&W0dJKL3F0^B%crjH*bfan8+ld{(P<ql~Z
zKwTU3OHe(3%EiGm0=a7c8CP1UX&TS(>H70e;|X%rFTY_3@AZ)27Qo)?t5LmgjYo%=
zN9%{o1spv^B!C3|5;EuUv9Ys12a4JqMa5B#Fn|Lkr<un5BiUJe<mKhn5?kU0-ALCX
z*X;qovD__&E_U)RbOE1kzZP>C`xq6ap`p=-&?yA?L&qfYBU#py>EXkNBNf15!Eq$B
z?S#-OfR8yET+$8cJGo)j%6yAJCVxngJ4{7hNz0dz%5|WZ1P$O6Q*CT)ECz%5gED~k
zkM4HT!As5Cn~xkZFLU+-d7<z=x8i!6Mv)oYNZv}p{ep~IOLT^THSX>E_wVC{jdTay
zHj=ULYhQB$qMB+BhdYyVn}f{q0IJBHhzpW{)S7c#vwGlu1<jhRwjXAR!3l=?GE%B=
zKJwM8?r*?Xj23alGP08Ij_)<O(A>#qTCmA3{N?lL(Jwf{stgx%3JbehTLCr>d<X~#
zfIc&;l0lg{tKQ`N#>R$@aV`P@!LKT>m7AFfchVI>Yi-KL%)Bt`%{F2!MFN<`!^6Wc
z;+s|P7{TI$6v*%O)v_zW;ItUgaCrcV;=rARg@r-k<u|G_^qJ29&}KL5{?6Ii`T0@$
zf%UAO!AlYnx~O~AKk5{<_V;#)%}}9B9#4?>-iz%|nJMMu<Rp0q_{xck!v@r59jA$j
zjvfkPr_B<TiFozONxMX?wL*42XTnu)xXgYO!ZOjFtD6#9h|<D;`V1g@|APC48x{62
z1@XiIC><W=&Z?-Q=ZYh~KA(@P@dl$n69l5=ix1Iemz;wEu2=pJ<Mmlz%#m*&{`7K=
zF!No6ypAPT4=Pw4fG!t$C(suQfZA<s)kj){H!pWqnZc8i%j<&&slVLr-n|QtGm3YA
zB4%QOh7Qtgap+-OJ_0cc+)tJJf{Uvw)G1(l@}X-0C1pe&h{%<d6+r1LzZ>3mSv!_r
z9{K0u#hcr(#`miExwtTp#{q|TV!Luzc1Q{Sm3m%YUQi^2F|#FCS<G3!f{uaJn};mJ
zt&w>@UW8jxa_i=;oQT(l|2hhsf=-;fNexw$1&Yi4`)??Bpg$t_HWkihKqXM_C`Ph&
zbaqYv#(;*T+-?}iXVwcBF0iqop#|4IKT%FDQW=?<9)L&d>WqiS;4!c$1Z;6mjitFc
zfJlIFmp~q&7PlXHg7(jWy!^NF$e69Avq<s_bhPV(Zty-T%GTBvk(*o6SF*9VttP6a
zp#h|Laz}#rsCZ(Tvg&KKE^9glqg@W@hX&ZrpF1~)$Fs4r7W5Vr=fBJ<f+&DYfzcpu
zNNPBl&N*@7L^l+GZ~~+$upI!%2IYk?;fv=ptZ@4Io&yLM4WGT8Em%G%Er2O<a&jQp
z^Mz_0^}c@n3PE`R5OB64oQu{NUbNR#IKBLi6PacK8V2aSeV|EzrTdhcdYu{e(HS@q
z2w#s0v>a++;6rRIBZ~%z5*QN6hsBU(7g!Bk2y`L7`Mq4KY)E(fgb@e(<;%BbETOoJ
zC<DOlHn5RdljONZZVF%piFsZ0)YN?jn!WlN(^m#tqw7P8a|{u0_gkh)H4+5Pf?FG*
zcTQ51RK9=aPqUSF^4!g~Ze9Q1-$Tus-xLYZ^)`@C2Q<b&H=&W1YL6bJQLgI)Ou|66
zg$mK@ZLrPA%#2tx4BRCG!lOHO430uUZmyKy<`<V*C{e&R0u1B9kMNBwg08BnqT)U=
z?C`I~V1JFQ91vyTVvwIwQ~xm!gp*iUN5Z;x$!2M-whMOwd}#E>SXz5pXQ_O=_LXie
z`|VYOvPIDEdPmXTm?W~a;+P_A*$MT05eH0!wBP2k_8Ts&M6TUy*|r?X#nn_?QltcP
z_<qu<&Wq%|wXy~d<1q-RK(YAE#OSCdN(gdrWB|Jfi3c=J=u%)SpHtGt3z@f0|BR}|
zTgE`+4M^S{XaqxFT&a$cJL<=~OVBc)t34fYhi81gy`UoVN+s5P!Srm&Z{JQHk-r0N
zeNswFV0I`_kifhRyZS*RNE8wl?laE#9?JMiG%O-wfWK<3SDD<+7#JkP#(Dw~2+K&u
z4}d*<96=CMQ3)R~2Bf(@6V@p$P}R_IonZ<%66_DG6EFL{#CKxQ5V*=^3~MSz+isth
za>xFQy83Vj@F=&CkW0hU1F*j50e8YJ6UVF|$n*;yIzYWbmNFIvmXQ$;fMP9GT>D6u
z{wEAjkFKxiN>o7a1{BOT@<OO!Y64CwfF1e^5)TBD7+|HC#q!|KPH8o;-kfG;hDCRZ
zIZ><Z3&}x}lk?90Z8x`)UQ#<W6V+Esm*{Aq)fh%*?Pjs+l&Lv>e|56;6@j}0P|6dN
zjBNGvr0(`nu|Ft!_#$xGj0_AYICivF0-)yn1Y$H%;$frpwq;u)UrlT?0X7G2tQ_Ox
zh8q!;k{W5dLnI@%ueHNdnZjE;7<qD}Vv@2>FfmC1m#|P+9{_9^#48(UcPxPqeSoka
z8<_O<^#O4p-FbW7fkJ~kzW(&UAyP^>bPybuFH5BK+Cf)3;^<SoC(ZE3RRWFR2_S<y
zBT`aK9z1yKUXHUkMomp^H9=3<-rn|vNF~Snop2_g!hsKrUg}PJ&S>a&lpJ&RXTkGg
z*@3Z>z*|#7;(q${X@gm`Lz4mcm!M%|zBcz)mH6Mt^Rd?gudc2x?_W43S8T4~Xtc@9
zh$=kkD3$mF3uZ!rWv!dmdL%CamT8@J*}+51-+zB_h#SAoQ)r3Vtq{WJPEC}wkG2`z
z)N{B>@bEA1<L?o{uTMBpnXgxn9J0n6I;)ek4>+NmWB;dm6G!xJb4|HKN^meG*RT(W
z+9s0RkyFOMp8>~H3ADFmM?5r`9<ZhU^U5aJzAQC!^9<yO^6fi!Ad?{WHv;!PA?Se^
zC<IxVUS|0^P%j4Abd1sC_5dAX!PF50Jm(cz*V*<qf%=;4>>tR9g!%iqcKncOK+W^M
zbLUQ>aV;w(?UR@8WKR!*^g@<v<8I!(xwnnp5BNoG(%tr`F?if#)E+Lc69g1ldHIUA
z$He~LMt%MAH)^<|QMJeJPqhG-4$(p2ekBaN1Y*3+3E_~yc8P;<vQ98FZv&C<zA&J2
zWMZMq9V-J*#Sh&-xB^DNVBnt2CgqmBt^`>H`EDaDGID>xWS{ioQsfnXNK0d$Xn!68
z6ry!~flRXgyxd4%4~tV-St->ezrRC}nu_`GLCV0Z5I8S5x;YW@+lxr4LGD3;y3NNx
zsfxT<CJ|~#Vm9cQ4U?VUj6U9twBlo+M8O-*h4O<r;o#axK<{K$dHm5ky_UZo1%#a=
zmk$E1dYq0ZSvZ~TOhO#I<}}$r*6)EF0vU;HF!6>H*+mw$x&rq!>`A4A#((5-FokR^
z2{|4;pjCrv&S~fM--g}-<WWeyE{)DQY?)P6`b7U<-(EsSCbyLuYO)#c@{lBGE?lbr
z7zto=wt%JeSQ^ta@6^L(KvEaIt8K({<;vZA_o|>@aaVO#$Qq6iTyP46`-MEKP7(;*
zYJ;Y6tlL^UL}_>ocm(v`dO5TS1xD2Y+oR|ubbTNs$3glts0d1MzPtsUdtX;zo4DYK
z($Z0h7g53l;+L)uMQ;q61RCvfxr0i-=mjo?`-u`gv`H4UAEG-VWdKW`VqhSK$nT^<
zZ*9y*#V`Zy?h}x<a`D)!xouvf_T_+iY$^w1z0I$QiFrVZhR;Yerel*c%-?}J^P6b0
z^(w;A-+vd`CASTRfoy+#Z$=x$ux--H*aI{$5&)vffCRJ`2o;{eNSW2Ukas)xjZJ28
zq=M5)*lJ_dWSOmIX2%N>PN~WV6|l`Rq`A*fEj8u2`1n*<^k>FtiAK+#Fc5)Ku?B7(
zJ4u}HQ&jlz<HucEdvdy64S=5h2=&<-=<%@Mu{41j<DQDQZVfq~F3kG93-Jp3mQRNR
zzAoo8K6t9YHK{m<R0s7;%a1sn;yoJ&RIVhVYxHG&=nIcl4#J9NVRT<JGV7H7Z!i>i
zh$YO9b0``{dnP1#Zl}IRjv$65?PcaZO*sg-g*FQnzOW@Mbxt{08u~VL`kJ{f`*3ws
z4<ZQ#hNHhIX2v<rGfLw@o?hhWv?;W}l&svcWb;gbcq~Q^uT_i^$7Pu!tLMz8<eU%9
z)Cz9jvkLVsMvF{2@Ds?5i`>*VhElPa3Oj7ZsL;eFOT4lWKUYT%BEq+?-Dfv8TY`I|
zf8%r|51z|nfMZxk%syNI_kuZ51nDqw$Y(xyv6?+HE3K1e_q?;K;IgKhr}_T3nONnY
zV+HfF!F4+`0%*tvP|Q6VWrK|acim%3pk0R;n}CxF{ujqe+a<v@vfTnCzwt8rgkIo+
zW<i*mP4=Y$Khp1aimZ}g8-lhX=B~0b0HR>nYgfo}^D{uY$!}D48M$_dI()PcXx#>X
zOeC1oI0OU=!H6Zl`IR1|AZ&6Q7kVAG@>O`a|4I{MR8-Ug7CYutpy3Z9>sBMZeBN36
z=^yVlzyJZXfg9^GX*>U}pWjX&aC>u~BY9*WeLJkR18UNU?8Z6LIJgv+s`0sX3o?bf
z;9O$H`aXEj4U!8glbm0m;cg{Dq%H*e(ttUPRSS*wS>W5Q(<djyI5si6kIMWU)U>qz
zb7>)aVDLfgM6yV0vy8w8RHxM)rKHS_mtXmQ8d$h1K<t2|Cfp@6_1>3;8xMGBck(%X
ze;(qrFPuPsyf4}n*3^z?LTZ4i^UCfPWEFCVUo(9=h(2~(vn56awE^N0;<p+EzhmGw
z^TxTGufY=bG9*NPx#19cvsqk!`Ce1mVv^^?7HP0PIVL6}Vk$CV?K3#Uy7Yb>giVo0
z=@{1s)b;}VbV1gqq;_n<+D`)1OGohKfNr(`HX*4F>`m*`xx94`vSv>{0pC9gn$?j|
zg}L0QE%d_CpB`CTk%2o?khfx@qWVBD3jg5VtHIR^ww)Y1-UNY~<!|+SL;>PIpxtOu
zf(t9ZuWr!uLX0QvIdUc?6|hc2B3Om|;|2SKz3;m#+jOh(c?(;hp}%5=)<XUEINoN+
zw9w@_**GImyY?RIYh#0j&Z5u~>?~~^9a`ptX*v_`$vT4tWV|NjsH3f&SrfQmfL13_
zn`}O7-2tSs2zHi<>gEtByme~!syysE?u2F1#&J5j&d$!gCa?#A4d@I|N*Ng)iIT$n
z{GGHLI?xY~Kp*htyl}GDZ>rMyl<hGLIem@<nc^MLxSv8i6Xe_5g96Cw51GwxhS%gg
zM1ik^oPP_8XM3D57pSSAVewEvWpvk05$ES<+@I6@9n6Z%ca~WUE?RMppB<Ei<S?As
zVk9vB!C(4Othe+we@{t!wHSWgxiCN9T^r1W8gcgVo|Z4Ahx8oUeWwDPLYr$|*NPk7
zj6)TbAsu74GONE;4||vQk<Bg2BCJ*%C2Z0D;$ISw%|Zg}F0l`qn>s5H5!LxCsnvW_
zy&pHuk}cVjrTm73Vb)3;$1BJS{uB<4-d!AqzNtpW-vq4I|GU@aKU^#S-&^ki7yj4I
zWccR)Mo<y%hHSa{Uz#w0-~2z1`Tz57dLhZ!85|8yPyc&tfE+yzj3-V^0-Z>n&48D~
zP17GZV3I+-TKdm#kv$zC4oM6A`KhO%dAd{sCj_pAQEL$SK_ZvN5f2_Z<nQMfy-Xx(
zjTq0JYAtlJ&l-3A4xLo`yfgjr<1Sk3F(%{#jH5L->2d&O#S~+tXyRRt#8XOrZ>=_(
zB`zjka_9?k&_|bkr}b@+%NPCNEsggW;pmUE)}O__bV&V-)<wII5qnjugM<*!Kxk1I
z>dxX`q@<+y7r0VsEl**qk>8F)4>uEPd?Tv;U*V=4Fh*25ES{B4;z29c)bgkm5K3B=
zyf18=V$?Lt0ug=fgMmXO;6$h~MtXYI0&Ci!-+`dgi4WZ0hI$S3;uy#^CR?pKV@^s*
zK4CrqQvlih2pwSmxv~px3P62D6%|9!G33l#;pQeAQ^?5}vMmrayJUbm`Sp3@w{IZO
zC56{Sj~m2;@#{IgTy`wL+^Usk=E9oQdrAA_%eE>uw@kc#y#zBXA9z??F{)_NKzU)s
z?^UwKT?!amfRE1?eMwkYn3Hoh&N6u()Ve`NuZQJ1+1XZr-JsI2p~%|WB9v)XsD@QN
zL?W^C&IB(M)GbWPeqYL7`WjenKr|9ijT34j+lieASNs9EgO4VIR6y7PcYE5O(r#)x
z2~@7;ut~s{`HWHJ9_US<-luw?7usr!&@rB+;3c*nDFIKU8L)P(6@%r@HfU53*=R`u
zQfnbm9z4KA>%QJzAV|qLvb83RgobX2T$kC%Y!X+BpAZjEZdKI?xf=3GL({N0jNAuL
za<<Cg`8{Uz<{iMY*lK2yJI{p8lt|)3aH`JtWdY}crfo5DHyrNYGzSijsUCz^E&D{0
zdncA~2O^m1kb+cGwt5cw0x-(N#$f1oV6UzkRh0m{CnTg^8^W#-3?zpHqBhpQ0+cec
zAP+KFhP#}Ksw!|-t7Pl<Rd*rOve$62Ifz3xa$Ks3AXLo-2YrgD9(fO-E@1Olh)>+x
zx2by?z*yyfc}p#ILh3sh1%SLv@Hv%>2Oa<mj0dyS2_Ax|C<>Hdu$-x(tm)|J>cHSs
zdUVWbEM@})6VwJsD~Q_~DuZ{GIM5u>Kb#Q<*5Yx~@eI(=ga84?c#9uCjGIEdL3AU?
z;48otXs+=G=-r*2d&<f&D`4^B#<vo+bc`5&$B9h8Cl%CyC11JJfrpSw9Ej^2B@|2{
z#K6MfjUBO;2iu5}|44fJW$`s@ty!&p;D~)E8}@Q@v2gSa-BJCisgqSzQkK;C84Sii
zSGNR?2H6F48X-*X4rk!Px0?)hrDD7@P-!Zlq((-1LbJv)_-i0kHN==!7F^!fq}5F|
ztfMlOYd&IQ{3#!LKob+~>|4ov1^;-^f8R{Q$>?U~fb$^IC7=K0=&C~`O^j`I@o3xl
z^_kiN)vZ$gVkfN$_inA}g$3TVyx4+Vd~%He(a4%{V1v^>abdOK4e$27ik%8X-6*xu
zCqewWQnC=Fk)I1+5TQEyaqH9L##6ifuXUPnQ%hw+c*&)+8AdUl=7y5AR8-u2d@%7*
zyV}Z2MU%!+iMi||)LK1m-y7E?Rap@%R1k(HxwBR1`h|yz-?7iKsk%c~z_WvDe!`@I
ztvN{1;Oi#HxvX105Jpq=+(-0w^BJkaNzT94LtqaN2agpvV@mpsT|7;%jD0+;7M(uO
z_o2d4=Sn??1M8LCq4Jj+Z2T8dOHa(yWkro<>L)~rMl&_NAIIh7juh~%_IsB1>J~K?
zk(N$L<y%+G;iojlx>L1Tot~#Pzwly`M!BIpV-s<^;gWXk>=}lm&6Q$P&>TaX4Od>e
zxtI-I@hP51zwvlH5p_QfbOc^*s)9nb6(TKAa5RvH8!MaSMzpkEqEOPdw)8wKFf#%?
z`1{j{KjJe`Vmdld5f~v0IxQYGtVu4;(N6!;O>$AHgvj;iiY%Ku78^ULt$Ay3aAS>#
z3hgAZ(|bmH$KXg<?5Et^d?L}iuC5Ne13X&}KdO)W`PZ&Gpgd=E6b)IpWu+0dNfGYe
z-j%BbC7sKy)mh=LP2R@QE3K`oB+^~^`XV680|E*viZspQ3iI;pt%jIRI9=n(eSYs5
za%6P=gpQ`>kom-3=*5kGPZkmkhnSmKSJzdihZD|hHN1Z>Cn}mdRT>bm2m1km>YUqW
ziZivxm94rgaHdH$`mQd0A{B^r@&gy;**I7F?v5acyoUE?Js3fobZrGI8QJv#_DSDe
zdnOoa1pDV!%D$hb`uj5s4B|HZuOK5<VP^Xb$_s`oR(2ah26=a*Qg)tnr`~Ybye$?U
z5<{*EHE_Ivbpe)=Or!V`u^I0jO)?h8qdS1w$=Q8S1(F1ikvegMTWDIGm8mJ@J;K?m
zo4}O{3JLvwugsa5o?h`Qc!7t2LTSMS0J>%i_v~3M@UbxMurcQPyct{&;GwPGBQ4nU
z0Ga7ZMCpKdF}^VM*kcKlcJM*$0@uz1&YgYGY-rfz#{Q;yR!|_swexiK4Hr){`_2Hr
z^D#PlF1W^46NJ<n_k|Cow&KyT0`tSdzajrRz<kh%f1!NWDA6Ahp$(eo0yJ8zNkFA?
zfa#4E9o#mdOTOOp>%k<nx`sw!6_y9s1arB68p^+X!IlonjaRw`y1VP$yx9vEI&tdM
z?+9kxQEeT(tkYzanp|9=n31K|j8VSd)R)fc9O^7F2Vi>ck!_k|70%!-a*$Zcooby0
zXJd);)SZBsb{xNz>D{J<PB1(y6jXzjWEo;w3kKWiHi53qp2$5D2M4>Bh$I+vxRazd
zzN}HV9!o`-^}pu3E-dZIuddHEz*|u9=`Xu?<nZAu3E+d>f`a8U*>J!;fz@}h2=+I3
z+SlLUlTATE?@>0tWoRvp1yDg1QxVbyu-rb3JJE&UCY9Nm?gLT{z2k@4*c1TP5eW7b
z5;D;$Rrle;vL`>GLE9;B3@Ha8jO@z=QO`-?1bA%gQ&UaBVNGTvv&`}@?d3cA^8yWn
zIZ#M{7@^K}`7(TPln2)@FfjU01|20&9l}7)RDobGc|=2e;-mALl@_K`90nZZRg~tZ
zf@=_VY_dLXklH~^y791Q@mJ&a&NjLbm|Mj721%&!t2!Jh=+XM?7G^rc(SATZgfoe@
z0=F~b>23z29ECvC?W=F4NI3r%uUiQRdA0f%HQeXZ#l=rBND)5M28aF3`eGajBK`8k
zi{Ic^3mqTazD>$hag^O%Ly}3M!f&A7+8%8IfD;>5K2pJG>~#Ysv>a=R1K=d6W<QrJ
zRbUrD9_h(RZg`7Gaw|{Vud4!X7AoD_q$C#5;5=@3C{dp+B=_VNvYV4#E-s&<-d9aH
zw*Vy=5Kc`B$6nWs+~4yYsK(1x+K<Zc>4AM61PxrNu^N{~l9JXB5KPFpf{cPd*+xD$
zcen-;BE<g{L6ES?qb9iQ&V7fEe882Fs?oCRvGp}^2?$cM7mOkSt(OC$s~)a)XZKKR
zn=(jV;A5IPO7GBf;^9m^oG$DwAODtzNm*d1ij?2mBr~BtZ(|KzLZv#Gu2ivKyA0}W
z;2t5Rexnx8ogeY}6!0+_wXL+kDzMeA_0|_7dEZAl?%^B*<xQ`1F}``Ha{cMgPW~-2
z&>XP^0<V)v*rFT$;tU!pWIM2t$N{Ya?CZewhvos`eOc!b?+#r8{twaVNIr$F``<%P
zk9Rj8IePShoZ)h~<BsdsXJBPG!p(gM21?NLi<pS>&u+}jfYY>&G-MW70DSq(2ZMn9
zZM5f{sgW%9eM2|UBL+~)ft#IxbL9&9lfy@<0`hhNsr?bGh%b-PRGQy<p|Le15SVka
zIH>@%dxhxnfhSf^c9V-%alwlA`9wpVjrxBNp~x)x3@D4Qu`-FOzUghywVoN5jW?7r
zAM`|Au6P>LK_W?2SBZb{-gvMM9Ho#WW}L(K`hOP)eueHzV!RPdiQQ*>W)zO<#St%f
z&WvZJeXT;jHQF1$9%p|Q^G8Ye#Z6HCriJk~FB8N=I;Wqho%f#LXsH!U2=^|Rc3;04
zYju^t7t!!`G$SM9_N`kI|IxkJu&KKL9NIFuHw$I*J#!3Mc%pbZMQ&@T#hL$%98;7y
z|MfeA<2kJ1fwU88p{aBKUlS>ls{i?W27`%IH|{h2m2WUl|8K|b?e+iDK#Nn^zb8gv
zAULgT!H(;Ip!MIulSGDt3b^J_XSRzs{`6Xte*d{$v+w^;^DI_!@S}}67v*j}`}3m>
zl9&F|@c+msLfp~s7cLflI*tuo{AKwj5_#?^<LZiFKwUGsi?A$OS2u8qVj_%_by>Sk
zg~^R$?UWVa7)|M+tVrSss;ax1ItRn4L^<;~SV<RT`x)(=<n{vlJr18c{rLVD!5LA`
zto{o;LLsm38^@Iv)h4oDcDj*Mki*4z%Ic=U^vNf(M@cC)w%ITB87`P|+~c|LktUhw
z=n|%)m$5>S9A`dIa;7>|z92)cD?}fwA-aO4&{gpx?#FNLxY+Wk$aMeCyNAJ8cgxzZ
zY{^B4&T(ZVD?E5ws$x{jeWjFX?a~p>^6#1hA1ALbq}9JD^y}6J+9Cc1W;u+>HG9bJ
zr&t2A-9k2{>rxvjF@HGo`XPBtpwm$J?SPEo7|Q`xk=JDjl?fd!3GIpr?KONB^H~;C
zkC27k(J0-7(pv23<gc1#W3YKc)BvLiHfS($!JNwwSO&-fD2r4&2l%~U(4;dnE2CqL
zeWWh#I5jnRaT3L+o~;tTTgl1Vm9Ytp3U_T3;ZliySJ0Z8ftiX{YA16GN=XsYbaAD=
zc~W&w33^{px!Y}WqP83HNg*m8?{f0XA1k<V22rOKg`(5fcXtxJWM$aY4T*7_#`~}P
zzUzEklR<Je_I-COiuaP8wHIyc&F2gV9JT))w62J=GkVStKkWY9`gIrKk^c{N#0~j~
zy-T8fHZ%0I@%iU1X84g_A$qBl{s~%ru~`YU+wDu2GE>|85jV1YKJ%?wQ-7|QnytBZ
z<PMYP&AwXacoz3wT!Mna7#I}2!Hy5ugUk|>Xa7KZmRhJ8VRo$9hK#d1*YhzwoxgnC
z1I7-Gbsql8lM20V<}s@)7{4_t!?i|WPRZ$<KXh=X!(ZoPj=##(T@&gB=KD$+dc}?H
zXqz(gcpf5M!az6W>C=yTs}gdoEv{RhK5vIjWaxNOe#>>XW`A!xaJbIDuD9(2AGBAA
zrE4{?_*$Bpn_F8sS7G9HJ8_-&WRkb$IyBg7^}|Z@^~a7KlL!&V3M9%0?v=w>9kh3#
zw2%iDK<1_e6ss*BDR-Hdm-o^og)Ts9P^DX6ec)9jAue9J6!rf78d>+&83}010WW!>
z9`X*}#W>}|?pBhtCo8DvlG8?HA|5aouOOI!U<zd$NQ55C0fdZi^_MT*@;kq}0=Gw{
zD=T}HlvwaE`51bd>qD$>U5b26_diIxEbm7_M7|XLpRU7bm2BgMx8d_<{4Ay<4>8fw
zP8YuZJ#>_P({pWHah;Bg!?U22l=)MZcd|YzZzp`W;tg{XQz^@R<XzdiL&hh!EM`AI
z+vW#DJx~tSYi+4j_K#%L0D|v=As`s3jp$T{*+f7`0U}^`2ftKR6;j5rOhIZOQg(fa
zK4AG!M%MkfPf6G8M?`#Mn6FF$8*$Ua!+fwnTy|&Kk+h*E=kH#gxt#7Bzo}NH8$%Au
zQThVmD4%$B3<}Qd%hCKv{QC1u{o5-@6+grD^SPV>ug-U)ZXHh2I?Z;@su)TA7mni3
zoDGohaogWO?>pYS`K_{)5f?G?n~W508_kb8)*I2*>Px{b_>ln#h^hsu-#`pm?^d8E
zk0lqrd-nWL#0Bo1^>P#45-W3W?;9y{yKLUmC*5noO_s#>9o<EWx9p)qIw6RB$_>uw
zmSow|WbA!<yfte@ug~yMsQPV0UfDM_LYcl`>bKMDfvNTLNmiWe<rAZV*gSp0>8&j|
z);L2LFa^#=VEw_8c>R`&p<yCuxt`^CsWk5A*l)6+o?)A9L#0Yg_Euv<XqmOOw9Fl+
zn#h{NjLvu^xG6!7lmi{(U!3;A5BB|q5zfXbp-7_MotNE)SZ!2)+^6GF8c$@4Uw17$
z@_&V?{6q@WdcdNw%V<C!kFGVNRgB5b6}e-dz$(=@pLQ!rRM5SNpRjqA@a-mY>We6@
z#@=lU<~(%r^)noX;T!_+NPCxs{C&pF!lc6K7bry=zlX__vP4jqECIP=4@$AQo#c)L
z;tA%2>ER&nf;k>W9s~pg)XY@fZ@9&4HyXms(Srx%nIC{Rx@Idd43%8x&42Z3f3vSl
zv_vgDkTntpe=!{usr`+JT*1mF&hj4@P@gwzph)=Nb*{|G-!^$kOZUYG;g~O?7HHSO
z_=BgPyMge<ww6^iv!MCOY+R(+NBNH8XH5g=pL;7b9C@H&E4q@KWs?+XTimt&$o<sX
zm6A^O@KTh+@A4-f6(@uWuNHH%=$h%sF0SwDo=(xR>A1St7c#rGHQRS}AxxM8qu~Cf
z?rXG8{EoUtYFR}(2WwMi_893&^)rOgI-#^~B(A7kMzkew1Q&WdhuLn>dHbPlu5Ek4
zRRZ=DVX?(xOO==Nf>YQ+&r|K2rpFi`*xTd4>j-li**z}R`|ryNCYWMSvCJ9{Osb?S
z!nCN&w7sFv%_5qKUpk6H<g#+VVL7G3!vq=JEgAy|cn*sW)~Hy^T;BWFQ<ZQI&Gcfi
zk=LSv<4Wo{#hOWXiazyEPk&SsOORyl$WqMD%%JU`0%tp<r+Ftfu)#y;CW+Poo5CWP
z`yB~$jYN~XFsxu~JaPVz8sjsen3R-4nR_sN0cHZ2ER5wh0+${o&AIL@wUqDQZv_VK
z_x7sikAu_>2D&xF@wEg*mpVU`C?m+2Ba3eqCAB*foNwej9vFyQJ+5Jr*6QuI>&_aJ
zY%`%dqqQ43Iyt1kMeF}c^&irG1E<uVKSbH=OTNka(j~0k?0aA<^*#PZZ9b2@bM|@B
z?lr8<vu7$sFS&Wds_EnQ9lltk5BluW2uwcK@Gp<w<WbX-P1}=-oE2Y@vi6e8DheHR
zHLrEgpQ~p~aQ9Vl03<3BbR*M|UO3<t>bnWn`nTDq{GkW8Lw~jw@v{zYJ=%VV@Xtcf
zCDIe`B5d-0`e@^{OJ!HmW^B3_B2W$-xe<JhRdJZK0YjEUqH|&<YzvF;;w&dj%#5g#
zlgwI`^JYR<IQdZbA3T@)PJ_3sx~wm%$55Z%jm05upli@oQK|dhU8V>1>GEm$Q^DH>
z$DsfwLBUzsQL}K5IipC|>&rZ<hvvTEu6p~^C|Sx4Q5NZQY$$FuwQD@RYgmsRv2c3-
z&bJesa=oNGH`X$7A?+ax9oYQLx`EA*_)eDm*NO#f4h}4~b=SU*$xV#Oj2KFOr<t?3
zdFc(6P}9o+w>3%Te5IrLV0f(iW0-5LE3tvL1+WE>7ePTmbsg0nQk<Nb<U!SVzKa(x
z{%Azkqw36Z^7Cnr9eefq^#TM5%&7#!SQ`w#LEjd6Uf7~P`ymV`GG8;j{`m1@FRzOA
zH(|RF3@~7qD4ud%y0xoItqW+X5eBdsvU=G71C0f@19c~3(|mRcBa21w+BJXQxPIeI
zM|_lwkDF-EI_g>Os+_iNR$$6hc@Z0TZ9e_{aF0~@kYHc$y#?jl?zEB9`aKifR(*vD
zm3FCda${o>BV#hnW7m4C9=q9vDJ@$09n5q6KJk3u`zPGd{GLoUd+~0U{_i0<p=u=~
z8+%+OgX?AwOrlO$`bCa2N=dca{6<BymFrD?4$KXuEsyuIFCbOnQc>Rvhb?HOcW>Tj
z6kR#gPQ28fKb6P1C#H7V(db4dr?F)Wg@&fpk!SMirwb3{5&{oO*xI=6`m3nFIp5o{
zrv7@2aGAbz+@^aM)$e1YfBotF`zPu?9|O2XC$Oj1itijIJ(2CdfQiv(PpdSz|0rmM
zO6=W3&it%6p&>)@Z)53{{v}#{g%|AZ5R2>3L|Q>2%A)Onuw~S6%GB2Bpt5JaG^JdO
zj}?a*GmT&Q(m?Cx0G3QZ3E;<J5>o@uteDt<-XLY-ILOw?J!tNi%!J69fi*|k(fg&9
zk1H5D=KFf|-E;3*2n@Pv<$M1=By5>)S>;_jKmOBDe9Y!9Q+d%5CgjW)Z*b>U^$Ang
zc48Cu);NVFhF?&MU@Q*vxks`yB<$??$ucrBlIP3e@{rGcatKPG(Su+?#;*<6cPq1^
z;QtAclr-LcMGZJv7#suikp650h#~+f$qLR=UA{Ch?g{>b$8Z>c1#AqVS0fLRO79_9
z?UC*a+V&q{sxQwvWX!Ek1^mp;+JOV$ZPmJQ@Zdq1;>fPQ%*WTE=lsYiG7VYL@>Z9)
zdxpWdjrc>tX2QTsZe7!$wx0r@+?JnmUP|lb;A7E>I=O+8b%y!b=k6Ax#%eK+*P@Qb
zG2e+>T1oC$EcbOV)6=up#)}E?i+FQr|B(2ndregco#G(X;^T1LgOVp`%nTOXIWkQc
zZT7<>p3}HZ;my|eMFQ#gLi`yG+XALX;Tt3ly&D-CTAYYh-&0tIojoI@DU$2flf3OW
zV-l_R*(_?ybN(?CyCCFPSW-vKL6pXCMy$;G4u1SPet#$~!D~tIyKHbpOSjUJ;1i_2
zJ(u^Xv>O9>nVlWc1s7orGgS3<*2f^De6N+95o&~o?-FY^rT<pe><Yb%ICHM}!;=<%
zCWI})<iY^vF1lpfj(fcAqlkRwhnQ*Rg}SxU*>xog{rJ%1rE=3(og>-*T&z2J5e%R(
z4u8)}DeG2Tw}R-bCcW)*PRUXxc3Pb3P~N=4nxTQEKk5r_n~nV1fnV&iBaddWBD~|#
z#<|}2a8K&ILgz<+Vh@GgNpls~D;JhfIFb2sW_lWCm#2UQN(2KC403^g_fy*JFzXyl
zl|{n;*JLhk&QRWI^7{6jPNtsuK$wRai0j#V`&y~P-o_@k^BZsuTS}jAetJo=1(c94
zud5QfXNp67`*zckm{XaKpD6IkUFK#>$;W?+txM+FueXozy<m{RKiQk4E#5Cj{YIs9
zmQME}`}U!HTwWlmoSIHVp(>%8A1M`qbsp%~HMzDV^>}>zsglBV>S9Ea4N8e^UBCLQ
zw2b?(G0Lqill~#^LoGAWm2DRpm5N9z+Oo{Us^=HCu6K!vW!Q$#qld?Y259Dfi>%x>
zA4pI8R{VPG`=N>ETn7&YKdfTk@to=N%x+Z6!YQo90Z;RcORK+b9*qzBIr~A7lXFow
z4>Qz~dxM^;c=llAy!}mu#HT%(hXxdql>GncrW~SW>^=yjs|Sn~L%9ZK2n-)wJ_B!c
z8;xkQY9DnYT)k?u&>p!VOfNH|1o|)cquA;@oay~DeZogvhz_pl-MNuAtii-D0TGu+
zx(GqZ_KP9A^$5=)z6q=b=Pf;DTbq1pbvlfJt-vQ3_hJF%aSX~5<ZZI|`!`ay6-oko
z#|iLY@BtSEh5t8Z>n9R?^Dl$TzR60)e1)N%%}uXeTCVWp!zDamz2oOENK3on$W3$_
zNQ!5+SSk_5Hs>5q*?EY$93LQ%6=sOwLA!xprz9x%u6w?_@U!QYnPuOw0=fT$D-{Lg
zws#Fm1z9osXYM}GkDPnJD;7O6eAxT3LX4=zRKP-A*`5gcdYiS~6E(t@+$?0JYe4tS
z(tee4Yf^XfUNTR;Pptb<AJoP_feW6uw><>~_Xa4r?0@@menbT8$EI25V7IIM2UP5B
z6MHzGx~Ba%_TKs{>wItf#vTWe85spZz!*VrC=pOv5m6CP=|+$S5$RS@6cJGo>F!p#
zF%YEtL{3U+I0<R#=lD8%KkK^Idj5dtUh8)4ANDAE#`hENI$lRjSI$}Ssq2~}WABAj
ztlB9?r$_szjomb}xmpz^DCs<oZI2b6<!u!sC%hBLSD<e>^6}ZY!A`q5B}ZL~dBkLJ
zgtFX*dDKEv_5~m0imNyL9)S*__Li8Px*hb+qpa<Kl1gal*~*Bqj1Rp}dR1zzQ^sDj
zN05xq>ryoKnI`2=UAR;5{&ky99r+Loi+J6qh&F!oBOy;i^N{+_o+e`!VcQd8Vx^ED
zL(*~fECyd161{7+uGO!3KuL~AHPKm;%d&X4AUrcuz)jEL4M)CtL8id|Bx4zh`$f|6
zB=)z$uPYz!P=9x1L140MfaFP{WzW5_pX!c%ikaNXpOifPeShio7+=WUI4$RTul!)-
zc=EJa8zs%9k+qIrTG{sNeL)#qhXZTp6*@{j%wKwIG~dytVY%d;bB+04o4ktWZOdr`
zvn%O)U2g{OH_~tUgG@y}m=grt5HZ9J0z^#AQ7B>z4Elz99)2y&acQHj<5}pIB=i3>
zzrd$GaP`8I_3^*kNG72by#5S^uAZVkYw7mKQ-A1_hKUSw$|kZHrEIIBu>_<X*S*n0
zy>RiO&Xa3;5Sl}s0%0F=5@gTvcI6R*@p*YF9&g1SUCF)ol<G03m0h~>&30?0MBb)8
zTkqWAm`Ju5Gr1ckyl(z!Oa~Ymg<d?KOV=$+q}`okof2oZua;BpcCxYX3uE_lcT0Bf
z&PkvSdmZ8^VW59rZiIpEP`~=1@u|7=$f|^cTgZEhcXR)foiUMTo^NJl5p?;9ZCUeK
z4uMg=n`|64MR9E_ze!LuW1hv5;*LOLv(3b~Ngv$`Xi~&J8X#Q4cJ{>pJ?VQ~+wW~8
z_3|iFxBMvj2&+9urLIOzb1>}>U3q<(FJa)_!R?GEjC9-HH+{w|e=fSlQ2zobg*Ac+
z$M8u3b9&w2$NSJ)T*;O?Ke4esmP0ypLd#-&bHD1D>>9hKV^ZlpU*uK$#1bDhSd)T3
z^kzhppR!S;MlWu)3^p^d^Hf$2XVX!LU=x2oZL8d?(|(o|B4SZ~CdmA*?C9HVmfn8K
zBC;pt>;~*2XxPqtDbigqHOp`7(9FJ9Y<nkTR|or{FS$kA%W_6d+;aF$_#l)-NXT;b
z?jV7t=*BqxszdAqwb`A!<g<%^yn8A9+}MISM<({X*i!6%Rz;<o(t#S8a?ov+OUf*R
zCO~w3p><DBpB(z0X3_;&(cJ8;tEfcyACTJ9(G8@XIcTY(sAw}kdR-(t3-aN*x~pzq
zF1xF5n+)Mh=6t&H$lk8GmVa@_B$q(Yp4%ns7M=pTJ`|mbUl<p?H+-!&X=SQSsZqN!
zZFgLK(n9l1Hqo!in>!3u0un#%%@OcTFO(Bleb%Q%5>oSjH1IJ@@tkt{f}EcnM{qWa
zi8S#68P`$O=lgJs8*BpcGUcg1x+9X#UjOt*+fSFth-ucERJr<Kjo&N}>@#^FCSl7J
zAW*+NIlhQZ?1sPwDi0i}Q0s90^m#@vkDLl36;o4ud@BH3#y=kPcvT(~bG{Qf!4QNr
zNVRh@A%QG`z@I_&<FYtWU0XZAEv<8YLAkV2Qi7dDN!6+*B`td3pv%JzcNNu^qAwRj
zwX2_+QM7H3-_NU4z^+b=&f_c>SW~3)=*~aKzMs*gw7K6v*<RU+Q>2NMw5@NR{(P!=
zdY4y3M8kHorcV#T8MQTy!|6oboTA#Hr+jonRkeziEBwC311eo}?tASSjv+f17_+I<
zWuG^y32a+Sdn_k+-7Y+Efsu)k5%YNjdez?_{ar$^12jl(O=eqU0I+(P<{23t2D@cE
z6Me+#F$k6Y{QP<Yf`bd4=7ur-Y5O0^4~C<m5GN>K=pETWmZDKRal}e*;Wy<Wu|Pj>
z=Z7+~X)7+3<WzpCd*vymb6FRaBh-#G<t3NxVx%P8Z)j?slaiMC9bb!Sh@;CBhEXeD
z7E5J;h~igUOhiQcMj!6*7_RM!IpweGoZ!7l6Os9FTUenq;|cY?i4?MnDm%+$>p_`F
zDsBez*Ctn$f);$*RIZd(3TL}VR-Y7Dbc<Jzu74~X(ja|8TqRatdvHP-#}LYu{-L3%
zwvv+X(I0ALxM^yK{y0Xz$xswuzy1>H4d`UC#1(83)3J#mt13;6iTPNjZl|ZGhqiC&
zHQ5|FL&G72MMSBDkdG~Kofjcpv+`YfCE}Q{nY6tv<e1a&rD%a;QDgbf*>4ywDeBIt
zRlO@}2suX;#idA>X~w+IWL@o{-^h(?0wi;LO$j0E6*ir<wG9XPCQuP4i&>-GvbPny
zJfgzdyWCLOQKWedmw;whtM;{F1A$Rr)t4P4&6oQ9=S`T<El8J>s%UFq<LovwZabfL
zMaX<HC{~%Rt(ElCDJ7ZZipf98WrlA@3JX3upW*WEk#q`xE_Z%@9-1ngP>@8~Q%GEA
z)XrKJL&Szf@fL6u=#^_~Y6=PpkU6697&gpay^oHL{b~>|5CxFTY<Mx<4k9#@rmY!s
z1>-5H(6z+p13dvs0|sJk5uK8cG>A0Iw+pDL-dnt!GbLu4nk--=6q<gJboHpq^Lxy5
zxkt~Hk!qu;%=Of-8`QKphzjmfT!@hWyJ<1GCPimydc0e-tcaA>W1upf7vh+^j0hn&
zI>M($OhVPH!^TXci7nYP@Gnc@&rT^tnVtTYDsiFDv{IK<G&4sMXq@jw=JI~&dpdW(
z(LF{-xy!6R`J2f}`Lp_4?(ijXTsP+vZ(j*;USJgXQClxWofm?-%e<(+>g^h{w9YNL
zGznRxzm$VN9XE1$u3plS)@7dM6Sko*>3?=aC%T}(5mPZJ|D$dKTnuLReV_*=<zB|=
zPT-2bSVHm*t>J>u(qxwd2A~ql7eQk*g>DWV!D@_HK^Z}?7E2A$P(yP#__S#Y{?^53
z3}A<LK<MTsfAON%;$`4C=Ztb>XlPWF<(_2ee~4zJPuW;i<Ns~glFxi8SSq3~Ix|gB
zz>XAKLjLQuhIU>3uDUfYBda`P7h1PV0|9YV<TT+%?MrPH>=!k8D3q%@_m%tFE2is&
zoc61{U-FQ1jc>28s^ybiRGWznGmvwQic}sd{Xu;=Dm*ovzm!f+!$CoLfp34jip%;8
zTlP>?HD`|dv6vY0N~J1|vwFZn*Mrr&b>vc`1s0q4b94*+lx6u#(+Lk^X%6#l&*5BP
zOn-lk6<O%^$Ic;dB(o>)Il13ot`bGBp}jJW^&R<@0<HSCFSH$@Bf}w)<woLUy;)gN
z<$@0(icuMf^a7mtnmPgH*oP_zpbRKSWCiBSfh~#LwKkBauf)j)3a#>T4-E}6v6s($
z<^bUX(`<1PN??Qdzj(n5C<LU4U2|UZ?@$)Qxold%D?#<xC$8*6N{Z^9S=-~2#}|yg
z3(n>H)lK-Syzj`Ec2OSUudlJ4>oqfPr(+GWTov{IU3BZ3Ur*2hNhZ`1V$0r@)<@l<
zJ1}M1zpd_#+psQmU3O&9agn-&ZAO8KHPdHq(a^V7m@o6_=2yOPvZu33Q{TD$!F|D`
zgogRcrwkO`gfD0uVQHWGcw?@?Y_9+OTr*qt@lR$=w1;xbIyysczHv9})w;<NX{e)P
zvey}_mwmg3g!v8Lmq&7FwtL;n`@ZsWcyT7eTVnhYqoT&mdO;8OvgLuRbE!i03dTW?
z`vev0`K;1&$}XjySUP>g?2_n%we*a{d>}DJk-p(F14aS|ICTC87#YV~RT9bIeW0$0
znQLQQepe{dKtO3>)(4vM?9a>1EDR79g|FjCKz-NcEcv8JMq<WbfK=V6`?#ueimPWe
zM@~#>%B)9-A&Xnb+IQ`_L67?KK()DDOU9u)8);I)HJbG54_^!DU~l%{PCio{;qIPR
zX#INRz--F2ctTuDk<nV@T>WOKq5GI=KdV#M8VbBi&LKYyTDKiP(Ud$*MGh%)ZcR1#
zw65xCw8L4$Mr`p`usWr#l{HktP0xMx`SPb#61`|9k5H|B$b_pwNcYjE#;T`ldCe@`
zT947=#a_+rJd*E|v@3|gFkz42lFsd&OS~KR6QVyVy$Sj#>K|zN+$cEg6Pr-&AS++|
zBR0{BtMdE?D;iesR-a#wCQU~;%4S;U%ec7#j;jsK2E?92X(lf7^pGtYe|WG1Fdhs7
zLb?wv=OJNR69}flxEeH}luncne|=3XJtd`OQ=dm>b$Hqwot##gpj4UQ?TwSW$7`>u
zzvQSBaFUU`{k*zfaJe&KG|A3Ted+md!VFukkLlZKzCOM1?J=K3nXge<MzmMRgrs_f
zWXcPAIy010wO+f;=_9tVUcgrN#jJ^k$*eNP+i#{M`$NS;bqV(icDu+?E6#L`w{|-4
z>jvqu?LF1}vQjBD<Wy?0&I|L|_9$abzXyjD!;Gb0dM%y~+#@KqFRgZm(uZy9>7?$C
z$G<<%yN7QN$6PyUmLiy5Kexm4@^d~R->iha+GoF_{3+%y7udk|&VOOF?XxZA_Kh3$
zUq1}5{5hOwZ6rzGnEQ8xgZ-1!@4nkVODauGN<x*%3V{@$#aFLhCFU_E{9Y;p?uXN|
zK12Wz9*DCcTw?{e41%@*lTJPJf#asw?`<kP*A<OFdZuR#(!|!aMH?xljJ1EVU1(c+
zc!AQKoITdtGcPL;NF%74s4i8*ZCzDnwCC;ZTdDc2e%r~^0!?E2>6fL1o}D38I0%LN
z3Cx5SYb=Nfv_Dg%lV}OiY0LE4O*3CoAN24NB~i9C#(P(ZZ~GrYK`##5bW-uV71)LU
zZ2GG;HFT`I+IBu?nA!j82zP=EE&qx3m91**_r2ZHtsK&x>zCRwt5=<%oH{+V@17v>
zy`^gvW<^E4ce<|<cOd%WF>wi-A<4N<lsX;><Ei40-GaTp@9!BMW9t>DUK<sj^JxrT
z<q`1oPmBE9=C*i`o&YEF(NewFY7nVoFf1(W&~eOA@7lxg2e?OR<_7;RJ)m|0XKIdQ
z+_#S?^MW0e)3*PXTzk8^Dm^wexD*ldUKdOP&BoKL80liu%`cTp^tjHM*>r6;zk0?p
zsL&{=&^l+i#*j2St!<DHug(;xBCP8F`GUs%BW%uFC!a8mnl;+>sqQ@`QPyi#gN|~T
zz?GcPpT#`<5+%KBYeqJk$BnKTQ)GPZJ{6NI;k(TDE02=wiX*3!wCZik8-{EB>-?;8
z5;jwBD6rm6pvjGp5UT9v?_B#PJeQknq%T1+@44DIab!33sc?gI>KgC^ad`~d6AiSE
zOx@`c$yCMSZ-t*<c>D00iq#F?C;c%K^4+NB4}P}Kwmw2fwy3Nn<@Da#A6#=Pu>-qX
z*ikC;9q==)33Ax=xH!N!KpoQi`Qq9uStdnw^+E_S5$_^nzvN+d=gtqz#R@<Z4n>=>
z&l}*R`W%<l5a^khB!zqBo4j==UFfOEur|7&U}Ne*>6J>ErdtiUuYFakVE^tEV0gC+
zmABC`oKj&wb+lqmHlK<dP{~&28S-;#c=p_|MzJ?5io$|D!e``Ml}qic$Tz~5mA_Nu
z0@WzRtgF7@&`_$5Gp4!hT#!F)u%fnKi>4@|Dk12#JloMW;cc%~)t3TzPUN|Jsbzk8
zAeX3SUipWmFqsOY`GL?RH5bfnwY(p)Q_R)v>XUNs-%ejY$0q#c!p@MlRCM3W*Ez4t
zm3G=U9pcJc@hNjpkbQu#{#=AZt}&|42zP6s{<;6`=~F@wi}60Dk}WD|C81W^k*03Y
zXfaOCr4U?Zj7(9_d#+#-60`!7AK<E4eJG}nmb;d#>~QU~==;VZg>x642rzvqy75oN
z_FWp`(&;S*nqCWC`HMbVw9`0sYkB`Pd7Q@Sah@*o!st7;vaE)cM_DB|PI?Vetb{*@
zJ~W~0o(gq*zbfFkRmv=B+qSf1Nfpnj!d)hgFBTU3%t~1fI*~G;Yb+FgxKJ51xHlqH
zfg&bJ!8A+GWi#xx)CDcwgva}w)k-fLq?pz9PqJ0nFbA)^Jm#$4cRX)%>^!pE9s~+F
zMR0nf76U2U)~#d`?Oh6OD{Eoz03v;~Jdo=VDtJEq3u<aX+1Inj=+NcEwBGj;@q_Dr
z_~>7O8Vv`9eT<aO<lwV(o}~8fLx`G==2H1%o$+fOZR$s&wbc{i>QXk(Z6tWmn-|>|
zqh^+LvDK%`3`}WtuY9c>EZvnZTdlO|xvl;!3)^B^7d=&arCC#Zh>&FyCH=U@cZ$Iy
zw|wUL`C*Eyv)%mV%d>U+Teg|F;mTi>TF4~_NiAa>g{}PS_<66L>T`_-pVA`?Q_UFD
zudP^k(&O{t(ji0Ij*kfn2zq}wVH+2vxN`udLBT6SJ(~?knlon#(7_~R=%S8yK#;FD
zHQhE;yZqYV4Y&5n_s6VA;<ACO>oTEzBACsQ4(?B`Ic6(x!6CZEULte#6xrGI(hB{U
z%gs29Zr;`pb|k-pcF%LC&NCmV$gz3fmE^6e7!hoI;I`1C2+2FQo*eAy3bDRMvDg}=
zedDo;ul>2;PS^JnViu3we66G+<GgykRqCEB9<tna|43B$wPX9t>N1WEf0ky`)vk1=
zJEXtfzi=;u^v}FXX<9`Y$6bR%GGp1{6WO(~m~3u9&`D@0RdSBwmcrf3!NZe3O*J_^
zU5-N&@r*lUy{r*rNZ!hA$65d?T4}8Gng?WI4l|}s%R_-g@`?$25Dsk+`v4CM@**JB
zEg#R?44Zgw6o-U_009*r7k9?Wi|OZT@VLg@*iC+$aE|n>6j#@{Li++c*#{a4)LVL`
zCyj&nH2LeF8AdQYZ4bVu*IFEVkktBc$3BLw<a{a#^N49mZQYwal=#fdu@DS&oMMh$
z4%uZ1Tao<Y*_6})x_x2vTs8dWgC6|iu6Fw>Op~;K@Uv9}Nz(i#W;)3$c9I!Q3F;H2
zCYeqKk2>Er78O;r1x?Kid%a|f+3%iP1ewRXs#nKl@g!3&I6FJ5s|O=CMjr=ASWwxL
zhBQ)@F(Xsg&|u%|bP5ZGC{uj-@?&nUm3@A^{p8uRo$4KLPMD*?0~ie+x3jqOeA31Q
zQ3E)`W%(BP0uWY9YnKoE;ah2GX~C=`;vJ$LjjkdVi6$txr4)jkYTm)UPEWpAYzPV%
zfkVA=<!<jDo~YK?@<_YBEerJPuHnVBC!!yH*g{hHIvfzx$yD!>DrfDj+_&xH)jn=g
ze5^*T-7U#geW4k%nn^aDNtaeO9l7!r>cyaZm5_ziwiAqshBrjim*V$Q=jdOgBA>|}
zKDVJl-J5exbv1)c)6cU|WtaPBZiTNMHgcWqQt2*Aa|X9eWEoP6d$gCtg1XZm&-Jf;
zr7!<Ff1}Y?@$c7fd6M4cH`@$wo@wLwC*zc6c760dMJ2-?_pH1R&fF=dgFhS9{y8_J
zl3H8f_&E7QewpmmOQ!?pg^szXf2#En*9JGz#JlQ-AIt&>sMf~JKg^@}-av2ps1t7q
zh_WjxVXMCES+VDFm>?9NpP7L`#~fXHGP&oG1uiO_LeVT&zCKbvUU>Go&+nIklR>%S
zSEJTZTKW+)%L<5u1V#eQXl!BAXcg0JEKSVoUfJ#8;d|uUekIFP^Sb7v+3dB4xcG+J
zRdQ7Qo|>h06!27~^_YuyS`1t8j;*Fox^1g#nj$F#eD>00zEbo`ay5pnEb8OL7s1Cq
z=|-g~@4Pd!LVn6cux-=_7&#Rs|ET+ID(DuQQ;1{xf=c+Gd%o>yi%PxT8*aGBEU+V9
z#Z!l}ys(mWh4NV6-Z(U%xNd^RsNtebPSZ*V``>NPCM?%2)UOr@@GzM0V^p+fNHNn_
zVRW?Qj0EGF@vU2jMA_Kc6M>Sf6$n!~KcM4MnAaSY58%y!*{bi`?Fao|n(OFTi1*$?
zldp?EUC^lO+{yIeK}>ioO@{=Cq<x6<dU7)wO&StU=W0G#$XovXCmW$dVyhU}*|Fo%
z!-v~<?V>yp;?9p$*yD2=L<q2&LYcRFKY79+?&?U4(q{P1EG<oAix6R`^NHrfgQ)*P
z3ms6LKsR~|v*x%TAx~BV;Q<Xy2GDGtb;ZQSE`&kdvq{kQ0e11-5LsOjaNMoSs(9n3
z9EXQ-uKHrKa;t-(y0UxKxopm!l5&#h`n%;NegBu1SMTlqjhEvx8gl&H?c*0tO&&6F
zXsej6KDDWCCf;kIGW{;(r?yPmh=5C)_x;93{&Kgfv|iJc6kmm?-LwMv&-qpNoH{q(
za$m5qQD!o$5pxA;xhjd;G%LLpsSm6gcx&xfN=jQq1-eS|TmEvoeQ228#I1fVUN$Z1
zkG`2G-{@-V;v#ZU>mG7r4KQTD?9aTZ0w7utfHn|`Oq@^{!zd$E2<bzF<Q(PvnT^%y
zOfZ<|%c};385aUogSmFqJ&PZ1WDU_Rz3INjI!6(zr`r_B%;cpkX_lMonetxd8`e|}
zt=$zo`hv7_6fHEPl&XNLtIPiwj|Hfjg`%qDFy2<}G_o6fOC(bQ*8LR(mKd~r+{D-k
z4Ml=%|NJxY6eIcHy_gareNl7LDU`i>RdmYiO1lsANt1^xZ2-e3cpvNi^yQ9(Cjv2F
zjamGh3mJvOA?Wn%++liY%e21R2a`12IGv(TC0SoZXYMbriwrwV2USV%@^GD^&JX#t
zOiJ5A5kIztBzJMD@Z+9IBeS1of0{(LRRk&rr|(MF{B3=CTdMbFbt);l1xY5;qNY$(
zuKe!{3Fcv#P7!>+!gs1nd>dK3@maK&XQ9#5fw{~b!``&@$E-s8%8esJ40N=~Z(S2d
zDx<_zCim{;Mf%5c^{w-)GrjH{L6T}a1%%fraaq|gJIhdcLoPcFP7aRhxi5{49odVL
zpq03#`|bm5UE_8p&=mxpwQ#er{w?>;<kOXNNhxQG`O89{k%cLbFV#GiyIjUmC$yt5
zfw%Fmk<i(#iU!*8hR*hakxa&R2dfftrlvc*yu22zA_z9vbgvlD!*~kl&VxGEnW-yb
z8H_Xj(4h%rw|F%3Bb^;D1tRmH&=ekXW#t0Ou}u&YC@6bj+)-X$9*9Lv6vJR^1hz)*
z)7mOBxAGnHeU1SOCP`T_g2n>(6|6ecV~XmO4g~jaReWtFrqm}(ebw+?awc!|5hF+4
zxgps)E(5v7=WM+9Q2G;A%3ZkT#sfPTI$cBM-lA-a{&uMooI>%^331;ZvX!-w6O7qy
zY8~f%Q|p5Mq8l*nPo8-%tyg8jnIa~!u4#C@Vd|oLgq3p*XZlmEgq@{LrcKJN3t1^&
zPb-B6UE+7YS2+E<P5U)UqV#%0N->qz-`l+!YBA>kK!S&sLysMlNsJ8w@yB5i@(r8f
zO+>_$#pLAaJXQ(!HK_M5`mv;sTu1bTemF{ZxY`uYQ(Izgw7nLN6gl;)U&4xo4c1@H
zKT+b($sFtGE1EwxVZr7+I{D`jBfYH4S58~cu;qDr%ko|hzuLi_prF97f6wmwSKnjl
z#d5l&t_sKDwwzwe5ZtUE#XdF+K5M1{;MS7v&p)F_nwqW|C!bvY`O~DT#+p7ny8b%-
zHNO{<t;aq9lX>5*E=oMXrd!?iI1}U5sPcuA2HL{v0%B|p7pj8yrp#VuD@?sSX?T(L
zwBlp6@^kh>fAF8^{JF{!%KzK97)3YLb=fJso&&co>GDTKj``pE=!uq!&FExvbb_vN
z>t#9D2kjMI3#I0&{w=l77)*MMSG=wdS6&}((Mj*E*ftfDr%B_iLCgO(zdeC=>^6!O
z`Exd;$oq`8c3sZ)r@b$$v_F5IOP>F^y_KWdmZHCs7_{3n&F4d6d@zS+dY|vi!jL&j
zjvSsvGoA&D>yHl@vm-zl*+%tu-?)>&dawcfB{3mE2hV73q|xDxb0+F~eGu9Tg;mQ5
z^_<3l>SR%#sL-I6(m{&&%f1MsGKci#nFS*<um2xT2TCi=6tu=j)|iAKh3~*TEjO!4
z0<DmcpP+-Tk^7y}<!Za(;qM9NX&n3{o{p9Ts`N|DAA;`Kj7g@}cvz-5{kX!P5}0hZ
z7_T$_m)8#U*b0h_n%L)=^}3&BMzfMO${~f<mEE(JKiCapcx6>_=Pr#tofhxy8iC}|
zcN`?!h-n2OB+M)1zLjuO<DuZO$)5iDdV@LvQx!UoPDzUM4|6fOHC5%l#L!5249GR`
zot}CBSw-8tzInCg?^J<J(&@R+-YS+fKjyT)b?zb8HCClGw>}Q8T?yTtY~-5K{<uT(
zTSD{j2M$c8sQG*BV%O9J3v+!}l-yBXTM~{J;%vlt`aFce)(66?fl%j$jZo=HcJ?au
z?bETt$3(x{K7H3OqOG4UTe`Jj_~>D~?Z>3j-VOQ2)&;T$XX+RUTo-zt;~e?PC3x?j
zq@CmHv-^)WUHrKUPYa6t7Vl<~RD1byshH*1v~j6<3za$JH+r@p5jG7w-34vtnqF@b
zne0qaO&vRjoRw4m!dvCObT;uy#)~^64Cz>zhfVusG^Hwvd2%B#Ls$`#*mR_&O|4wz
z0v&D6)?(@Bep!r$b^`;)(pe*{Ho7OBan!cS4?q1dY-3PQ&!$0}JE6E!z4=x+pQ~H?
zwC^}&_s<yLW4yNZ2%^g7<9XJHg~~ByOH)b-EMJSC+p1IDQN?(2#U&y@T+><hZMpXz
zB+m`Ujy65q5u_(UDgI4>J?DgEXiRSeI$3^=y;>#eYin0cZ~?#Dde!-YSI}EM^YbqE
zBJE`M*(oQ_N_O28m{}YMLziNpN?_(nYsEIphkfrzTHZDVQ4+lG%|5h0@1iNvurEHh
zwA8KtYA5sL7Fd;_`$kOThB<!!YTzf9r~mmWE?_mGyNieqk&h7Y3_{~&F*pO#9k1z^
z(6KmOj|uC&H1~RMj4U_29g8JpzZl+b;@Q@oDzSLxak7}RtYxX)++j-DLd4@1yM+h^
z8^JA2DoH9W7<EZ`cTVClNo!oeq@Ib%maqkB(?VL$e(@3EV#kc48^)?PaL56a7#?4F
zL0TGFPd6Yn7zaWaWYGHK8m=P$f0ZmIP?UyHFhD$FeLWhJg@jp>+`u_@fm>f*Ang)|
z4so%zb?r7hF!AgC=L>pC>aeeX=OgV|9#KL}*LAzN-l=&HP&d<%R2nygT?STz_?7b~
z{^_9t*2AIbFD;dCx{XL@<DDFGs6F!Q&+n;R&>OA8KW3|?H<~E1p8Vgpl>ghF@J_U2
z!(UfzqZQ>fs$&=-TpFmTB#Wi-H=ueKXCLCjK|!Dn@T)1}PX=Mn`FUG*yE@bx!~gpA
zyOJ&!^+xvq88sFsif^BQ_5Fu-VA6;e_+ZWN#U>Xr829UksmN!yN*TX3X+Fw6^zzM{
z;s5!&yym2T{_{%TwDC8?5nqb@q7PHuvw!}+X$+YAGyncKRi@N`K0INy`Q5`+G>pDC
z!&H9Kb#;aF`x}{Kx`tf>qPxh|CE*8F<C#tyks1p2mab3itVs@cFs&<gIdc}0SI`hX
z(o8(-T0O^8Dn4y5KdB`oZ0+sxHMdWI)`z{1MtH*B=|{=DyBt5IlLnBZjM?CAmaNW!
zZ%=J@p0b+$bD9(+cbswVHjlL*0aV*6mFN#&r?}@FCr;eC(VK)61!Eh##ax7j-eoj6
zzwz1`PsvG3xY($(Y0?y%k)czV2V(nZXD5$NeM4IK3$LA%Pc;H>=^pQHNMNVP%c=Ip
zle;>da+dCWUC^c$6RF&<)F&2u!Dl2$b0U1;^MnQGs(q#M@Z<n@!vUR|hS&xxxtbEY
z48@O%hf2b-lAlrT2<2HX_Otm$(MzP&aZX3Lu8tOTJ^CR2-9^Yy<x%;&x-RuR^ZTXu
z>9cLzCJICrdc>Iu?)_e17X^rva>yH};xeCXtCH9Lmwh|MLmiBBsZV6f!Q{w<L#6in
z-<pl^Lp#YnWZhj$veUXs$l*a2wAazH#o#70M@r!wwUEbJpE`mcg7$E`e0>qm6Sy4V
z)KaBew<-`Uto!J$0kMR6gRvq?#{SI4+@C+y-hKP*W9%_oJy&ecb$tbD#j=U4TAatC
zlu~s`$$MFa*!AGFbztCjqCK^P;0HnJ8{jIC(Qr}c%E&t)sL^5|P?pYTZAY7cqmVY#
z8QH8Peb#iEWm&7^-*jFcQkb1H03+yj@njx?6R2MZd>o2BhBlv{I?atp*bIJojtMYA
z6$m~p=MT&1vGORus+IeYf2OQt*sP*`2EE7!$T2CRO<zOj^?^)uTp3G*;IQu`Ku-^$
zV{ri{kxUESt#IO4_r_GQ)$lOs@8jAKG>Ww)D)0!kIRs2%FbxO?z|<!C`~AH3PC_AD
z#z0R$LZMK4Mx0#A?v1Y!P;<x(%&P&;NIWHhHmG4Yun}3Ax9c2$1R`FMa}%@9gmMNQ
z(d)pCSbQ%9wf#8@*TzDoF($F2V`AQF=Jyi72zVEszH6WNL#M3lKI)ozx7|jTM|71!
z-66p7018U+WM<K~9>ZRipj5|H-+v9w2-Ok_6R2}U$dv>)%+(}}7t1f8oJ5Q;5)Xrp
zJu8eK8#{^=KgL694C0gW{C(uJw8Ob=Qk*(9<oU5y<&u&zGXSGXH#a6A=Y1D-Se%>t
zX3gu9gq03tqHvc=QJ$mc*;p!bJNcS00&MdI{$mF0h;d$yPzou16(|eToo~|kdHnpu
znsNkS*qN34G2~{<lmV!g)E5;9ifsYZ;_YFhYtvruuid%RbTYGKW3j82npy;adBj5V
zSSvu_ucfANk}|ZjEIO&ro*hFBs~|da0gqN|9|IuEIsgTa7dK3z48A-YSWXQ40H<Lw
zSc;CG4)`4l^Z|r$DLube*lG5bkn8gIk&(oKRos+@ixY_a$AuwU$1x2rs!*ocj4W;F
zKw!AwG<V?5>pEuMs8-g^pCds*44JGap3WvMu7h6E#39c^2!~Ed08kOQ-K)*l2}F!O
z_f^Y)`yhJtSywUF6f=<vq7H9%cV_{i2-<wt$&)@nTDU`Q3j@i*BfNtn^h)Z5tE~#g
zrHf=HvsNCc??K>FNH3}JbO7p!H%_sLT;R~_Bm*&VqFm^kkdSe&_b<i^o-Pq2N99zN
z<bGWc90^0ei>H6#KSuYkc&yDlW^w-FbhEAz_nr)kQ-zatv-arwCa(PMQ+DG@G)!85
zF#Nv$<C8*!v)RR)H_uyGtU+m%qL|{cRSHMCMwx5n{cWkQ2?r?DmVpT!SD&swt#?fj
zbdR49lyRLrnTirk-*STkMCc=UN2o#Y=#=~<?y8oWT(hDOItSa3c85LA>kAHj9v*hr
zue(}U)CqK4Wjby0LUw00nB|lX9?inpfbMQ>G!^~CS4_}HRQguBQE+ma@dT!f&Mjz<
z*fY=I66HF6{PXeq(b(R^HH>@rig}b{tDKPb-Rk4FO$M+K5k1dUv)lYm&9rY{LXXpk
zc6GIO&kF|;-kggxYcWtV&H-Nd^T((14#{S*`_Xu{QK*iKby8%oJ@wvGVSCO^EzchN
zNsE<=Cb9AcxGinLXwyaE5x$q)TwBX3->~Z(t`|v7xdM{`g0)%rH}4>YNliJIU2Odm
zG}?)IdABkDP*bb{T#47~bKx!Rm7R)0gkJ$P*w|53G*vx&_ayV=0}kk`+m=P}C%1cX
zvjh}E&EMekz4@uj#Q9xbZB_&y1@)QIGV1*-EP^(}#Qv+MW4ID@YUpl99m8z1zj0-g
z$KrIp(Vnq~r|c)xmg*QZAcX+C=4K;<Gx%~^0tP042@uD}0>Q~o8N*Re>P+K0y@g%_
zyR3Y3y|T-ShllfNzVRNKgQqH(?;pXxIXlEd=J(nF{0+kKPD*C@Us!_YvWTrE+)uz9
z@HLJ^yeBs4EY^YC7<d7_&XjaU&f>orQU+Gr6cy@&=b~W;7vVBx)AuY|IzFECELw)u
zP3!mv%C4s|1Mrw!!@J72t|V4tf675AFdM%>cpZC+7tj|T*YDId#Ufj!+?|{ZAtwLm
z%jEEt--`%rRO=alTO;8XN)}uP9{_r77wvt&9oTP`YmIX>qh-8F$F5x&#T6J1Lb~^<
zj=_u>wpEO1?azHQz;QdSFU-T8LCwg}5<Cyn&>J0Rv9Kti{$IZQM)TL^^ybFvK>ENJ
zFKj>2bm$@pL;GO8T8YLhVx)2NN335&_B7w=e*vl8G)oLE)k@4&fIw}aG6TZkC~h|R
zTY&m}2ll9S3;_CLgV9bG4D5}^TEe|07~r(uQE1OADJiK4=kZQ@-L<4B$%Rr+;d-=X
ztn0<RY67`JLAmshxO=Nu%qI@>hunp)VNY-eEzp!{vt~3j7T~z3osRm|J@{{eQ;3sX
z)#bq)xE(ltS?t2KZw%YH668@h6;KKb+rvfret5F3y;X?pohqzqda#4qsA0{@dL}F<
zM+el?Y0R}2+>A;Z$hcicOg!Pd*5a`$_`Wk>nE-wK%?lN77ucXaJY`99z3{Za1$r)g
zM(eI$bXZtFLgUH(CrPS+BaFVBh1+M7@)83%YiQCqay^keZ=O+j(aE7&>_0mJ1OQo$
zyGU`nvIo0u{Gy3405i%;pGR1v(j}#vE<1@Xel=LkpQ7*EK|_EF`v^)T&JMT-bwu7!
z&NQlXoa^dyAB5hvqJlfWH$}0ACLo~K!|4$_@8Dds%ydJ@LI<<R0h4Of{NRGQPv~@v
z@F?R6@=|AKxrYa)b3q{#K*${6ni(k>?H{z_^ULG(v2!x_0Kq{lY;<b?y>vGX&9cYl
zbTzzdAP!t89f18Sigy=;Y(u~sI>}jc;Gef;GL3cJDMw;%01seWoo|LdEK+uqbZBpQ
z#<Q+{+jZ>XvmYz(UuegIF7wMI6-KElE2#DTgh{G^+lp=Ap(QYeXkOqu545?<S!`cA
zhTF)l++D1uw$$T|mR^(xN>5>DZF=2TOFw?3mGK>4Y7oip9~hX_3(kHSc!LGbJ;c?v
zD(;-$>zuk%9wi#P%fN$dpdI82I+m?_F~0I#Isnc`yac(=ocZ?U<;Q8a>7ma)ssVxY
z^HV(v$70bF#@$s@+bU#%#m>H&vepY#OHHxt)(<iL>4H;)-zqtR#0!fA{2T@+Uk^bX
zdFEg5Ed}xATd0hMw~y3^h~H~P##0scx=M;x?6trDK*<ko;n1Y_9MQ(p38E{jnvMMf
z26h}db$z;x8@(G%82kH}$=7W<P2-a9C}hab%X@9N$h5PHhU~;c2gS_m>UojU0@^?)
z^d9N0_pd!XwDi?Ff6-Ic@p(x(^WHq#^>@tuuLf9>Y>LCJmtH%G_;F79I;m<nsebJI
znA#bv-0LS`t>V@(R(|=|=x5rK*;UV7JpKGKwHZXk4)G-ZetV?N-=SF1m}~x!8;^0v
z?MA0weFxJVp^4ny`i6v_0-<5;9EFmI@aD=>FaZuV4(KqeGiWX8suiP@hK0Kom!-ZJ
zI<WEPJd&=Ag8tu;Ug1dWk1LV&d_4EDOQ1eE+)7o9v2f&x&xoYRa&D`Bxvghq9r<8>
z`IQCd2n+XNSp%0smlIX;4Zh92cN(qpZOn{ItfRw!INN71g%?zaO{{+pdCZ=F!1qAd
z)@i4)^^n1JepC9pjowog`)>0%>|Q-1R9|5Kgz34v0SnXIl$TbQsLaow`h5?G4DrPg
zDR|{>8F@rJjME+)uE;OZ5)c1W{BKG}P`vABfivy6%xr@WA&h=nkf@S>%IdDX>J51L
z^7}vkBL~LV&k!`+Hads+F>p-KMU2<ZCStmh$c@R4m^S^FDo;hsgj}=fLAz06wX-pd
zzKTFHBUB?c0FlggGbi((I)yRf1;9)b5)w9ulEs^UUn%DxN@E|7`H9}ux44Akz6|9t
zyjpXaSOIjnw{hL}5I9teK|c663=ZD<Z{C}V;*ULx)8I?GOb+ve$n^<h0$mzT|L+G)
z_kG`_UW|(Zfs14J^y}~l!3ZI%UcAgJB)$Lrkd}Dq&-l(FU>X3cGa|D`N5tVxgk&mu
z2k$UBYzf2cTgLxpvXWhrdZXRAGY1hchM%=DvbSHnzirpBKy)Bcz_uf>#zZgm-*;dl
z3#i1shYufO`m9=R)DXkf*^Iybh^Si;URD2>{z!ZW|9@n8n#H=?J)2v(8kQbfDn`6X
zDk|Vgl1yC_&%TSu?)l~aLM8b>Stj=1=Kb#l9sT#QHqhXwM_u*BD!hOFT}l4`i3bI`
z1b({`|G}Oh6$9Kv+Vu(DzbuyF|HU%#r8D04|NbZ~ezc>r((S)Lnho9duYaE?tmK;3
zM{cjM{kM$tzc?%Z{uW`z+eQ)?VdTp=MsWA3sQwqQ#cY?n#E~as=YRdlx9<PRUitM~
zRNT^fNp5G_7xcAc2>U-Os)mEW`v3Yx*!%|0&RFmBmDlRuDLz#vsAV%M)+s8Un8C4V
zFSr?~ZrFX?Dc^>(!CYvFS*~z7s5re&@q^`5CoT8MZ&f0Ea}mt_>n?)@7A#9G#ht<X
zN9<&e@wVL#b8J`h(Uq}3=cA$7dOFd*YypVP*~j7aZ0h;5Q*m1FZKA^0IKNYF;)sQp
zbEnJuVy7%qLsElFYj^Rto5ph<cHP+(Tva`!(*uIW)R{)coejmO<%)erp0M`)V(fHs
z_BFh_{Z_V=ee!qCMc-xRj~P3rZW;H{q#d1#-PWVlAVw|T`kV98r<T(rg2vO19PIuq
z_Px@ku<{n+9spwJkB!8COGn<qR*9k{l15`olb)eg?f5vO89;|6%ipULSQcn%@*c}R
zFZddqOBW*+6$r%2l`bYnzJNO-p%H0aJIWdw$|8E+_ih^(9W5~TaQyv&%ZX`uw+?D!
zzXH!$bK`ECZtd3&t7<~^#ibP#j?k2eyJ_Bv8OnWjvzxjiqv^CmIxbOTh4RPG$xdwj
z*7N$NfU*7giIS7ir8lj<eV#bxj)IYs!+t~c9lZ^ui=NL5WmzITH_HbyIvQB4?<Xv1
zi+oTYXN)-IaZZivvA=~_RlVzXubRZWN9@~P#)OEJ-<hl03<nXh17%x4K_5PPBoJXz
z5>Q^=7cC{@FjbeCJO)FVkRXQ07fsC+8!r2xvpmz^nq$ptYV1#nVRR4Dv2a6C3Xfp8
z2e-*!F~_=0jS<FeFvfuzE&QFJ*o}>eQJU@gX!_&4q9D-jFpx^JMGX;|;l6$QCX{s=
z!Q6X)ACj(DAt9q+d7!Kcb8{hkj*=i;?!r%Z?C2~k>`G1f9o;@mZ@`_P``S0mgIm`%
zB0B3R)RrkBszb~4lMh>;+PZo^c(4fDL6>~HSAM>}gk$QsOR@PtLv+;m&vES<M->$#
zJ3F;IKOUm<g@j$};Y#ngv@AOW6XU1?g@u)n$uuuten!=y<6xuuWc$R5`{0*9+Z{?V
z!Vp_iVphu3U>CCpfz_nhU=Azh9BeZb`zmSNG<5sCQaB^$=ifu&2>nG<(_27gfO090
zm0-Q5>hL!1mg2>W2{nZcKM-Ilot*X(l()U2%7j7tBLs62P5mcNOtKeBcWm-9>+YY%
zD-cGe+ZKtu%$q%;X{<rrtrw>OzpqGQ{NfD*y)RCa+<cX`id?)2H9=;^!GYOKd+c7$
zxw-z{(`+cb+b*i7$?6P;04Mj@$;iX+gY*n+yOsOQ{n~d-Cu~c%SmErL5}V-Wp5unf
z?2f?-bLupAH1PV`Py8D1dwG3oI29OOR;&=lcP`=~dFgkBPa`|cI%OyQnGAa^A9#A2
zo0;KBVC?Zx;Thhz4aKO$fux6B@+a*g@)Uavsi;a`RX+8Oc-Tb<+-9F~*z0VeD!GKg
zVvMt!n4BPJnhuQ&`&>x(m<H-$UL`>9K4Y+C_V76kl_L~w1=qkkh567278q?c2v5h?
zVF33H26{U>V9xyTVba~g{xT-PA?=ASEBMat*txUl@97#NxXL_tfs;f{p?n&|P@H=j
z%&b%~`mAN)_Bc&zm($nU(ulp*m`bTBNi19SLb)cTPSq)??&LIRBhL0DCy^m-L!EH;
z<4VKOKVrRw+4aiHsH1Wz9Is4n&nh0&;TJU2GSpe<X>1e%zToitKIVm<qNRtYbgp05
z(X|R6=~3ykdzD{Xq9GLEwAAL1YmG>&rmV%@O|`e@`fxg7CGfP=Ekf1JK_OATzKDDV
zut#PG-&@^^ebT<*1uK739_rzBwv21hQBs0KCs!sPZ`>6DgiUB1va_+7{g_BwydmtJ
zrja|21n0UUBYbL{W(ScwD<!G|s0-lezb@%VVaPXT<wntj(j&WT|Fn_cYkRPJ5r=_s
z3~>x0endep^hz1ilu(@fC%BGAx=fvoN09;rBC%Uv{s`afI!^}(R$Z!3$(`>Xkr=;u
z^CqQC0SP$l6YM=c7AHr>S!B$7sYPjzx)@NSf&TvglzYYn5)u>35v7?m11A(cS8}E7
z4T$(M7cVx13R#i<G3UO6><t|Fm{ZdWT*afJnFAt7#GxZ0Q2ZVkkr)@vw2p=AK}%8r
z0E1BG_#EK6(HlTP94R6ys<m1{GvbsxT~iD@h=llfyh&1Vbe2yMA7Qiv*DzamN>A|;
zN?`ElbodVyRsx_Kj5noH*-mvY6V(FQ5igtYS$6;+0T}*AJu5CFL*Do&MmmsmX#bd6
zxlMaZsbr)vGV@esj&KeVz@}!abk>%_Af+n10-}uzhV1Aag>c~jIBH`{o;Z4xU`$pL
zfF>xE2&B|wR(D5m=%87QgT*cpM7KHEsuaA3C(9a2E6IIn^T_5N?>VT?<KT&7SR5>W
zOt_78WcE?>ltc|zfZPwu=!ny%ul5n;Wqix!KOXTUwN5Oo8!a4ZGu=Rz{sTnjvmzqJ
z7=Ix!ejrnRL**6oz}K%gONipJGqbX0vfP3Mpv`n~<-R^<*&))|xhG{BWIfJh0-cO8
z(%7MKrL#;<nP6Xs50)>aTXCc}e<Z4BSX^y7Lpuq=<I>t(Bf;yHz<VT2Fiw_$Fx^S?
z1L3VOJUBQix(UNY^TBUvbN0fC9MdV&SKv&dyYYe69S$mz1PW<Hq|XUeNIUmXI8lMD
z+=`W59PQicE#JOY1<waeJ;I5I7gd+=IV>oxS4#wc6lhz(or1{oC>~D2e;`)FN#qQg
zjJ~kCZLos_+1r|umXrlphN{XuWBC5cU0YeX9p$K)oB!anDXDya4djr@r@E`;j?;JU
zlALmpVN<|6G{VV(<=$qRCql;^-Ovj0c(MDsb36>I6Q*L}kdS;NSmOT!xurZX4vz#Z
zS)dfXF&KoxMvs}Q?S_Mt-U$%6H`mKImxywj=kfNXzV#^wp&na*H|21L*2CvIU7HOs
zwnf-GNnSVpNhWJ#((dWZX8+}mfP;h&jSJTGQ5j4rDkav?+&{u>?t9?0po+#eX&OdU
zjEyqyZZllNm@|@LrwyC}V=xWR{@7*uV(lX}&l=#L!kB<;m}BHB9!wQ)E|hmty{@{l
z*kz^q*`b|Yf@l?>hFDGs^XN1TOkVS2mFO)?X(-0zS#roGO6_fjfqdfS;+jO2geX5a
zDJUpJ!Z?u_ZpR2E(Fp-X%6E2Zfqy&GHYrqIlZs}pq)M#@WV%Yr^wIE3DOaVYrk10F
z4RawG`lGyqG3I}6p}IY=@aK!{{*=<_y1Vn=?<#Gf?~f{eXihutebAvjqaZ5y`2YFI
zQ^8>b5}<?E)YdL&DJl;9W9N_GfMyY)3m&v_vpNbc&?pjc5*8T!K7-00Gz8;cmdsQm
zzBorNViX!uF^sjN=Kv{QK0*N^Uq){a)2h&$bm5dlEf0h~IG=<GIp$(C3h0{*-Ey5y
z9telKOyptKiTriG7vscG`I^Cc8I~Vfm`edi2X_hK$!D`yQ2Sa<ZoQM+oB2v0y916+
z@-@p76QQ0vE{f=SXyWR{-hkQR6&GjcqANfDLkf&lym901?HQ5D`?IrmSN#{RWBM3%
z&Gr$BM|FL@W#}$uqz;lUu$$nLl!5{z4C%M~+DsJ&@+xtV%){5m4dcxKI&BcxE^HgZ
z0~_v1npwB1@riqQ?-OqVLrUarupseXygK)3JH~o(kz&Hx88?GbLs%gy4mcISRyW4H
zIK(9CZ}slm4`V(A1Mpu-_67()(euPdz&Fw9CH>mmkR6_XsBDp~YRb~^O*s)PcPFRi
zv%5kywCwB_P@9;SLF}noHHw|({{0a>Q91>7c2nhiqwpwNBkkuTy2?9yw+Yv*+)|DN
z2vwRjDJ9N$ohL<|T-uO8Buq_r5fSaUWoSqMa^YD6quofaOve7FUQL3lhSt_IczCDZ
z=oH>H#FX=#JWsA^YXXL15haRbhRV4ZVVI55k;wysd}?Z|JN2GDgp)HhwYiB&(<`hS
zU~3vf1Wt;Ht#>EHYyGy;^?HaXs4jHq>cZ=M<C3v7{|QAnCK6MH#DpYaeLIPFu8jx(
zueWUG-379FCX61h4OKZwQJR~bx}*#p@fG6A=Yr1;tZ8Kn_K_v4v^`2{mis^ZgqE}7
z8~q8Rrmr7bK}#DN9!3x_KDk)M8Ey9Y*{?j2ek)E`DjF@ARiBn8y+3o}L=qMRB51UB
z>Ii`-hJE3KjDiUa8+`3x1Wd5t;YgQ9*LDUlWjn@v*sQ~^{x%jjIvmbWzc0d4b!Ns|
z(98>ieUri10!ULZ9&0Lu0_hN8RT#hmu?&p19W5*@0N=JB01^r}-DF92E>K0|e$BcW
zr>-d}wXJ!khUb|y$6(VSBr%`n7$6&f{0Iur6_ZRB{Cyn72uUJv$fJ*}ng6woL}Ho!
zQeWTx0bVhLmpGD`U64{>KpZ&(_z)^eN+z_UjlED2&kof#GBDlv-u&jIO4_yHX7-W6
zK@;!icQJOmvNWAZtIF3TyWY{Ogoqd;BFwO8+<MxJ7RJDB$%<F5)Sy5GXGL*5D`=qL
zxnPZnl`H1nJB!F{Cr*r_yUjRaY;0^!HBnL?4yLj;`azh!MjTNJSpYiLFcLNW+e790
zk>+AdG^(nrBU=N~{|u;zm;Kog(^#NkOi-}^YeuObw!NP)@Av^4aH1EavHBJ;m4j&+
z8QdpNwnlej#(2YVoev(L^^xq#H*UlTWvIOaJyL3VytlMC>#TmoZ-!d0uc>GGz*3+g
zM8G`9f1&)0)oq%Z+~=lHP{VDP_|Osx9&yiot`tNp2w`+92V@sv$(rXIM$B>ni>-%Z
zaf3knU`A`vQ<R&ObV68IV>#F1BfQJzgHbAG?ZVvhq~?g_f49?jSJRxdn|Ji}(T1bL
z%`=QGgAaD~*a&h@8e5zJUx9=`2!SXp7p7$7mX416k`h-OmC#l+$mH0df``yi13ToD
zp$zwg1=&0_IVWcxbC5_zu=;?NL5R$RmJ&QSvdK~+imQ1Fk>VOUzXqza@&0`zUS8PD
z&2mMmwmyvwx;f~t0RE#kT!*woG*A242lnb{YxkTH8^_@mj=CZP?eW`%LkGB&mYa9N
zND%UcHq9`h{GB3HA+KKDg*zuY0F%Tb2F3z&+l0XP@dcP-JSFCZhqOG>1>x90F0wN}
zckce&1|59P^dQ$1etre<^Wu2BtW_Y~$7vXNC3h78QX$;$&n8EJrwt4YCLOlmo0Fu5
z<K%%CK|zj~G=vrR8BtNpSU!N;Eg}_jPuv$~jm)kK6KUon4<0;tC01lVX(n+p8*jBH
zIa`_^bxl~jR^W?72?Qs@FRhBJik4P4WJnYDuHzuXWx%r$7Y%6&v;&<>^zhy)-0;dS
zUH4tQip$H$Xc(^)5Qrd{{O18<J33T&4`Q!@U6ZShM)6_`_FAJ^RbCXd{Fv3YhGh~K
zrG)Zd|8R1eA=R#V`P^r3{D#I*oBEPEo)ckmC*AZ0XFATyQhZj-?l#!R93+-W7|Lg`
zMX%bqb0_?)ckS45)<^zg*Wc{y6!q8@GMU_;z4_;o;7Lx-aiYbDK^9Cx#Z_QA;d?*G
z$mpzcP}F(e#NIy7K4DP-E)?kRgzt~s|HmIu%6Ppi@HM;zVBuO%(kE54wKX&}bab#b
z1}GGCrthkJ-!s%)Cg&#(3|%GwI*97PCX!s9gx~cBeW~nbvb~b|4zGz|Ypk=xV5azq
z(NS2<jTT%&Y@WO|3i!&a3JUoH&e*2%va-~)v=Uw3M#RUu6T$HCTmSAodo1>_n$&e`
zd|Ev~zi(d)g~26D;r#gr%v){pOuT?s#Ec2_f3Qr)U12;{ZQ_X&0Mi%<G7wwv_x2Wi
z?xYv%%-_O@?;md-dZ7SaW<_Hk{^p2xvFB?tpFW&5Z@e$e;g&UP9vFrW)=*LI6?uM7
zU8K;ybDyE+kT24-Z9`QhGCVxJ8(>+}U6oZ;A{63Hemjbl=937@ILqJW_tIzH=F2}f
z`Ek`-xa*trqsNO^Q5&~^o<08;v<JDq8$KXYAQl>yxutQz!eRm-jsz#IN%+93;%eaR
zXgE+0=N{uK_18YFS5yBSx^6zXJ_a}ALx;NSsN~Gw`T4BN2pVN`OeSIC@T>o@?IE1Y
zN!!NLe%X!s!2OPUAB~s5M!vx=#$MC~tlOWZV?GAl2*g}f1J5KT;w`b>CpZM1tzfE+
zazSZI?$_&~!-@x#s3uGWa2S9n*HBw)gD2>c@b>LBO;Sh4<A)C`s;VfH4Mlk}9>(wn
zVIFDeJBZn43vw!B@_~uI^1iaA7o^3hp4EAqieF#K$D6mF`&{_6iVL%|Lk#5!w&Tac
z&*<5w<DpcJ36i-IX@fBmefl<(o4Qy{9b}0$kG%Uw*5PSAv$(^0Wk6O|7Wa0sX)D{%
z=gt^!JW1lv<hSfboKjIyAqaIl(kZ-|jZ22vXcPVt9~juSVRF>A2|dm8Qc_r1Y28?k
zmt6FKOQjZlg9I006Cgi^#>TpX2X7K@RSQn++^_JZV4x6RogPV#aB)v8SI<pVQdJe&
zyRjZRqqsy);5*YYUpo0jOfdmhd(9;&sZV%!Di~_Qaf~RoGT88jnpy$=3^B?{KTdvt
zd(8%BE(H9*z&$6m@Dull$nO%?f-mkSjz?`X*1ZO0ULj5nOuHb3wm>)B=hyqQ9lJ5<
zkDD5#K`{x5O^euHEtjT4+r94at$8d?i8MSN-`M<V<uYAtdq7RkR90PYEau+U7(Jd3
zAq>8J-h9i9ie-GC8DhQJ*cN*~KYhfBkpgw$iLBD44VRIK8TSt9KW=gK&N**bvyRAj
ztp?jP)P*&|mG1jGgcpFJVYTDS(8w{de!#kx=eu*wE+bM<wX?RCa%-Q|l!#YdQD5`x
zb2o0Z;Of>lFsK(AXlZRN|Jm;YH%p856lI9{fZYFwhexRM=nkfX2a_LRMNOr->ZGKn
z*VomFVz3AgZJh6)f6@>i5>IV{2V!zmR?Kd;$LcG6A#5yzz;6yo(mulZ7d^eXL>hQK
zzh>Cbk#1Na9$J&@r9I!DAu9ZeEBj&|77*h;T<A`)?3iNGIm}jQu;|^`A(m0V=P!Df
zM^RIAwP!u$I<8PeieTZr|MBCF^b!1Ph!1{3orUnb9dTsGtw$@1lP*1W9mzvyQo}Qm
zu^=M_TqgQ=UvKa0T7+=1<Ra(ElM5*YR~OmY*=6qMBd$U;0xS~|WB|~KNHTW^SAy4d
zW##yF*!?`kvg-KNRfy_*!SFFS{wAT!M4+Idq!ia|1??vx;K<MxF&5NfG=7j%RpDfF
zi0m(49iV&0`skSJFpQYLt@OBEKZ_d-_Yo8{a7{;Qir9$L{2j{0xYOp=WN)qH;9l-v
z&&<dWEFX=0{n~bdwhohW!H*w>YV4(^X2P5>JaL5q*1!hZdk0(&Tt@{7&lvb(;54LB
zhKK<rUHmUqEFjYT*Lh-fLH{@77Z<-^`h<~-Rm@o_b_GKr=u^@J)ptbcp_ECe8X|*U
zzqq);W_U-`=%7E7+1;fk2cPr!IW>Gpyj0FERJn<$=)kMjuiJo7S>h>3-A}~2y(MQc
zay6wTVYKQ95ET&;yDZ(_F*H5hhY(MCCO4ltd8OO?NV_&d8GO58$RSaJL(>&Qbe}6K
zMhRRO88+8aD6rj}HAMQ3#n&v)+eJhG_l!RLJY@Xz;upp$cerE%`R>g0=bz10k93E{
z-*~N0-Ri7%6-Y}+s4TrYU{|h*m5-ipHlhp^!7)Md4EH~BL<FS;D7;iXI|!dgKcr>2
zSCGyk8i!?~4cxhq`!&>z0Fd@d+UEe_Hw_@$;lok*0boyVTxgicG`qvMgX<9RTJ-eB
zM$9KqpH^CpMl!3D5gBvx#ECPGKcdu$gpn#_hxd^%4kQ4f{KoRX9N8JaFO9VtL$88>
zw87%Eengo?O<xd$nTf6H%fP@u(mFSr7gi&L-`U79015^S2{BO=f<U7;jF-U*!TYwU
z<;urHJ}M}vGQ(L3>QQKSlT*M!WUAq48e`AnM22idBmcIT``S-na742Gq9wcgycG|p
zQ0N}hF*Aq1c%gUu_tr>MIr&?OuQp2k1;hEdRy7AmiWwJ;jf{ZH&NXTND0=qzi4$Mc
zxB8mYv4T*7i)`O^Ul=$=jPrQJ^rlf(wO8Hp5so0vNlZ+{CjjOh`=uD`uR)Yv`maNW
z4$;xIqAq~YhzQTCsuHuZW)Y^s0A#ar-G+o`atoO})+2J^-~Z<0n~Cw^HtWoauO4va
z+R^X+<HgqI4BnxE-9YI=nPu4Sf-IARSj&>xhxr~Ff%A;~6VKTOSpiZp8jQ^QW64uk
zy8G2oZ3jHext*o;%VtIO*6e3a^1k``4k((f?tMM|6c;zz7C4Vke;@yZx3}z={|b@y
z0zQClxx2>IoTub=r`fn8bNAwKq9bP7zGDZf50-eTsbUxT_uYpRJ}Wh2VxggJz&z}d
zu*WNX;<1Zv^FDH#-S@7*w@5J;dldP-%7*ESchN8oy1(FkjxzP%STUbAF!M>rPK~7p
z02p%P+{fFtZY^8fT{TjOSQa*CbF#OP>$C4Y$7es*a-5g9skSy1iyO0UkCo)ko;?e?
zSy!2x3nI^P9J)8Ls8+%n_OZvQp_PGhOYZH<m#c+_ox8oy`^)hEO4dvc{O#3bfsyAo
zJi6it6!HJ?^2F9aGKCMtxKl*-+s`_wC!mty4*<19$tV0^)d>LRaJZ+WU|P%)&!#bu
zmVIR}7;LKd&>dX)fuO3-(Z~0IO&>$NcAVXUnNc_$o<S%)?os?$xU58ti=IWo-4$CQ
zytD7Z_lnBO6y2aqui(f*36|VlOC41?yBx0&!w~m|rS*TS$9ZTl))J2tmYb8a<z6{b
z7o2eDC)s*X?_@tfPv3!RIHEda_n){Mo@H{vn@3JAJtKqk3MV?sOPk!{P8xiSPtU(|
z9pK_Os@_Rox&U$YU;LDRKsF&}5TVX)`vx^MDoFvaUY&wiLUAP_4hVTpj3B9fH}S+B
zCvMHsw00nL@s-)yc8Qz6j{Lr@*wPuu_i}P_h&#PA>o}&ng@ws$RO(0s@Cd^mS@fd<
zJ>dM{nG=PgU&9W&@GfNalYCZI(>QUakaxn`D0nFz`vx&zP$G}{I~+s6zPZWJNg;>F
z*ZF%KtOSXp^r0V33NlI_9@U@2Z-Q;^(uRneSzEtjTt=#jot@Z|5iWr`#Ov38wTEXn
zRbO`jZ~)bnR`;Zgj9wf(X5GOKh-IGP0ffW_39DilukgxKV$1)y^tacYBAn74#U}GC
z{||fb6;x%qt&M8iY8wz034&m|3@9Rk<gB6?5Rfckq5_hm<ZMJm1r?PHB1je_E73p@
z$vFoF$w8b>a`>MYd+oiePSv^CXJ717_4mc9ZkNiO-}i<wo;0>?tA`v72wbLli}G&W
zhcgKZ1BHXv#=QaL6<O|&1um9n`Z6#f3nJB^Z@S%Pk&{%a8PEzeF{<!Ew&8Ihu_D7N
zgYBf5iP0EtMEsv7CMNK&1DU|F-rylc&mhwk@UGfOJ*uzfxc3#T2JiZEvF8p!#~Y<;
zo}e%B*2?)D=*VP(h!Q3qod8(=mMdj)O(bX}KYFxT<rHUiR57CmAVBR5(^rz`5p38@
zQ!&FWp%lEuZ<X?~2>|v{(a{_t)<>-}-sm-XSE`de`9c&|^<eGWyx7>&`jiQ*?5ZkI
z2eVLgQh_2DK+VjxLoV&tEbt{ztz9i&99z)sg}YC-KwviuU6CuaYQM5^{i8RrJyi~v
z4l^KE^Do53gw3LN7N~b@oR3FOu7k;tINe(x;z^Mv*(V5;fKj-6bOxC%Z83x)ldV;#
z${{HqfGs_(?_HyaN~G`9L&wu5*AY?)soQF0ZS5T7`vD<kVqy|YD=-C~gBe(Sa>YeO
zWbC)+M?9stP^5*P2tSq)>4asc>WfBAZ8Y}7&MIIy1Wtq=$mrn1*fnIZ866TgTT)Lx
z%fbIbsGhMy=`zWML+tps20fHIWbl<bS>V?UkL&#vBe#1J;kI--uj1p+esX;nP9Js)
zH82V~G3^<igrp>?*3+`GvN)XpQbogg(bv~!>dikspp^Goq|(=CW_C6cdjpp(CELyf
zKwlWB@OIn+I9R7fS|am;{QM#-z*SPLKdeR<E&8gzRUi^ID(<o>n?Mx#63nZCjm12F
z!9sIboSzBW3$(A66HoXF&Tj&lqQXK*psjWbSqP2T3?xDkNi6TxstchQ#cN_jhpokp
z#7Pu$THiz5{NwZUJKINJ#VZA%)-e4PAA~Y~Oib#~BkbnT&{6YOkMZ_?+1EU8*n;{O
zO03ugp}Lc|k=0_>G)Rv*WE+t~BFI4^H8+waRdK6uvx2|uYw)aSyb#aR&H8<-`*E#u
z?!oQ!yVkE;SM!3h+bxe3br~M-0JgoZnnQH<^TGCa)O8-YU6?Wk90oPTSp|j0Askvw
zA8}jtiMzmm5ET66$;;KicLoz}8*#ym!r?OW^ZP*^)eAWeuV=m|;&@I>Ohmphw{~WE
zxmLDaoU_AKhR)7TT;Ri?PG%-`fLDP3%=iKy77{7me7S-y88;%jF`PPxeNt^{DQtN~
zZ|-5Jt6JUW($th6(o!<fWp$g~XglUjU^uoiolH&KP{uGUSaAz~a}B&+e9lFA_@RDU
zwDj)s5n@h`5ZH|cb(;S2eD5!CZAn%OK(q%Rht1j(c6Pr`_?H!wLiGzkuygWOf!SD3
zPaSem4oRRc0Za%uBlv+bFhhcrY4BtZyo|NAOMdiqbT;(@w8KmOs+({(;&E)+q#iNB
zEvn0PN-1``4i*gvfLbY7pt*T?I&lo+J0t5N`8cBb79X*madXSn(_kY}fa+4i+wMvk
zf!1gCM{^h75+2pF@HF7%aDANLkPGqvTT?TW_v%wrjd5E2hKwaG+eK2Bl|_}Cx5|i6
zaC+hOvDgg>R7!VVo5?Avs;X+=^Qy^e8xvEX=T_;j$hWJ*b%euYBPO~Y_eY%o%sqIm
zP`I}DOF&ur6rP!QNRyinyfeN|a-pocIyI>*c-N>tasjFXBwH_d4<9enq^{UN7B2(O
zMh6XyaJ%(QJ*)XWk!gyqQlg?WfO<l~nI0^2RNki$604>#Z~ph_pK8A_(R>Dj+Ltoh
zEQ2MSQyuPpfy{pn;3xr<8swG9YBfKKeO=Zr{ViLtx867;**^5OTZwb%jv}-5m8P6g
zw=?diN0!rxaLozKGS1uXM>q`{eMz6o`C?5cfXxEy2o)^wVO7Nag6N)WD_8MgCOQy1
zO5e*HokX323mPgJt#Zw;J8Hr-82|J**fsq%;~EoabhDb5w<lkh`j}+J4wbGaD@P>q
z^v0DUf>@5g=XP<98eA2_tp^PzM%4~hN66f`zutw7k<s4LYMa=cPM}P_AUT}6xp(pX
z)~sDRuvLb9s}(Dr|LgzLFG&QVXjS<G#z;PVqUFEwf_LHO<$t;M>c8<z@AYx+i0*C9
z5{`9Wk@@xQ+A7%%(zeTgk>aO}-7DU!*!b9{nQDa8TspJygTv4zb@ua7Hn~D2mZA=~
z_p)l(A=h*-&BHt(Nbk(Zo5qxf?O{S)B9p~eoOo4gu)m|T?Qihc9WrpZO)dUI{zk^@
zp(-7UYbbrrPteYODpyT@G8w7LDpid7B?t1`YMnm)*&?e$2x<y~ZNMX!CaLP=H2w5|
z$|BURxGS+57YRcR$`$n7Sox%mnEMco%<=;(h0;3uCt!Wxr4)>B3>q(Wb9cXg|Gq}z
zg^1nds1{%`naBK^49}%S(-~a#mB%^G#ymnt1?OqJ@2~|5Ei#S~!T_C;C6p3r4`Pm_
z6#V$O0nC{!==#|?;t$1XfPpAR>#A_(YbY!Ktbq{&CM68?^6~NU0P!PcH}GQ3_=JYi
z(70G4O7U|G6r*$`u5^HDLtoZl=W9jX%FH}90;U`GSFVdVA{^UoN^Y%V0B>2YLyw+2
za+ds^P!j0Vra;>;Uv%R`%#PP0$L7tC!ord&7qPnzII#C$bpHMf7OK!G$^3$Z&W0}O
z>F%4DGgRf`3P{flmN??JVZB*Wl4Prc(6Ymj0w8i%r6db!X22OJxJ`w0>f$Sq+be}3
zkwkC53a$(PSy#{rDAv<%_5Ylj!Z42|+|#=5G_}w=`&$K&K%nTwj|>jEt6(HnGWbOH
z3Z+`twn7ls2b%t*lM;bR!`u4Ecu6vuxd%f;`UYddeK6G5FkEP>Or|ZTSA8x7AlcZI
zI1(#+a@3KWwx(23lBSA{iA&QGjtO>k^S8!A_jZMzhNCv$sEXqm8RTsI+2GU3G@gKM
zeb8-$JNE_RzD9LPtPME({#x!&Y?*$Z7xNvOH9=txDTozKT?s7vBG~!*iLSK6e{U>G
zTKNfej{1cQv5QH^QoX(i=?Iv;iQ+A=Mzqo0yLX+SyGKttIzgwq%@w@~XxsWO!P5h%
z2{88p0B>y1HKQzN1_~|?tWN=1W#{+TR%RO$nMuh~*{O4S1DK5+F7B8#o0DWj%s<0-
zjbuEVj`AHmC>Oc_SBvt9_iV%+j@rL9OFVt0D~DTU`=`LBnkB|&q43Thicb(YpT380
z8w*RU{#<{!XHrk_Oo^{vRz!i>qr~XNVm2#Ckj~P*0KLe1-0RMrCd{6ebK)t2TJAA&
zyHKI4_1jSz$RcRc?Ch172n(8miabUrIhDs4AbUb<Rz#=0k4gYBZsAT6@Tdt~xXrAK
zd*&wpT>6CCk@=nM^7Y+zx)V<8Rs6T~4a8|Y3*8=8S)VNKkizBgsn13D84p)*-sPLc
zDZws|hE8HCH1Di4p2D^k)lr>{IVE?-eNxVhjA;s43p+86tZP3pl;mimn10MpC^^fE
zzs)v~#dmak(t66VMmtTBJEB>B+C@-hWL?*vmU>w+6~VI>J8}*P_%Dfjt{BoVwMGHw
zLNoVPTKKYVu8iRx-MQ~VQqgZYT_kQFcsSe<czGp5&iZ}Uwp#_$xWDEbGr7*@eD$Hw
zEQ78~vX+dUOTEd}>Yk`F!lkW78?z0GbClB)zAR)yRWBN|r1t$8b5H1&)kgukPWBwh
zb4J2nhZ_P-AMUg0<QmftwMa=Q$k7)*RInY-q)pJHxSAX|u*%tk0_-UWH4EeW1?_!y
zI3H$mE_@C%+K2(A+ExV%na;)4WF9%{DGU{Ea#M`H8TU~q-)#oQ$5T`|xL_ib(EsdZ
z)reLdNtVMH_@;zjc?P4-F*)@mT~^C|J<r9N{*Ee^S(udE2VeQOQfZ|K8F|0(AOa4?
z68tdC9ffjKRbyM<b{UB5(S5qxoqT0D&fWVCO?w#jM*-}w%cl%x$k8K<`BIfeDU>7y
zZV&|k=oG6AHrfcPP86#LAPxXSnj`hWu9FKx3CUVNAM7eJ4&yVB-3-3{JDKd35XNT*
z&N~nmx1CZt%<0c1^iNyp$}d17iP;F(S&u3!KVdCU!$*cv3Fi|dz9|s}d3Sg%@}N2t
zE5RS_u!bK@*Y)+@Di-CP!c{E5d$&{p)WNv`;2h4gF-(c&guuYA&p92l&$ybg$&t!L
zw{1Lon8(O#H6fwV=2$|dz?F=)7<xFv?2@{-#wfsv#tRj8HQGoFg1d|b&AJ~~Ne2)!
zoER}5f!K{<_Aa6Nu=RHC3BKP4>)tpydmJ1bpo`^zY6ecLVlRW(*36G?qZv&CQpm>y
z{f2l2LDkGXd{4u}rL8(8XpWR)h-Cgr)HrM8vI8=AZAtukeT^I}Rs~;3yvxa66gCyy
zY!VQa;TG|l&GDh4Lo)$38L~Z$M_5=RbOB9VRcUFBjR!Dh1msjoD56P;ZiZ$}_Zg>R
zSfUV_p2A<YMtWgTQBa|g&l9bR=@PVXZ+2~G1>OAY8SRer{AEmR1_Fr*$Kjrf&JeTG
zo%wO?+BINZih)PILq3p*F|DvbLVHvYU*PJd_qly{WZ%N)-M#@v-U~nONav1bwgD%#
zk~x0fUFUKqv~^I3Y(it8mdAP&07+;|OvO8fb(`5_?^%wWe(l|Ayd#-Te~<9$wzr+M
z#`qt>>CO!Kds(xb&Ga3!oLw)l<*aLAckP+9BF97C<#nsuqAGG6Z<mM*IjCfw=n+a@
zc=5yHyta0NM$z!5u5($ZdW5XB^KuS$guU-*PZ1U;HIuJ>pF+6ElG5A?^G`PP@3Um|
z{!!&C@9|o$dRA})fm!~y_y6~o{_m6c|K*xkDygbE4B*<iXAp{KaHXn0CMVTf&ZXb_
zrdA(quJ};S+S(d{<vE>dOgIL{F1fq8)vrO9m@Xp`_EB|r(}#-s99_nof`S76wm;T4
zvgbJ5mZT*$6_+??c;XMN*R;@0ez|Dba9yE&0XJfsXk|wiV@_vKD&4lkIjzd3rlxoo
z=G*4$hsM1ri>`nFu<H{^Zf2WuB!9NiJw(`|Gw|!+xx5^GjSu*Z_O=YJX;f2VV{7mJ
z%J9WsoH4z%y@x7eAG{1|<Gjdk)F)sckNCB3xIM;DjiZR<Z<D$0<)siTGz#UT2JUg_
zm-i`#&F77~Cu2fF;OINM#`@tH9^mR+(il#S<_xj-HWgC_VrE?B(3+6><sdo$1`zKm
z?iVc&h|JR-_1AtTKHep&^it$i0Gh<<4;*ZG+EXgzk4k|egiVZ-0Tn3m(Q`}B*7%Y>
z5a^&$X1{Xq;e!W*2MNgnvWSe>2JDByB=*mL=wzFd_ye5LxE8EJYe32+^yF&gPo8mi
z&%;mkMx77OElSVr&!EL4Jp+l)P*)Fn$8nC9H0zE443dMlnA9^5SKLb%)NG&{Kvcx1
z5k)pod+%Aa4G+D&Yn{7#e5u|_{f<RRi%D4|<{wpg69TUV*ZBH&ls%hRf_4{T-SC0w
zMi_1>)swKido7LuZ?atcaxfX(r1EkNh}p1R5X6(IrF$j(^`wyzF+W3<p8p{eT6Y*=
z1+YVvl(y=wlNH+iA{oxl?2oykoY=Q-Ut@iJ06w?7PKEZU8;~eaqL4Y)y@*DyQaMs5
ztM}Pqtng8g7D`5O`=M<d9Agtb2JDJNS#+h0iCwck*^UQQ_I<jWd#Q@gfY$7ga5~TI
z!-Y9u02-bP?Ko$jsv3Z@Cf<>5D=v4q-DAG`?Ok>9wllIVLr<$Vo+peTp1xX(*M`4}
zQ0Ip&%uQ*isbK=SS#DJGs0o$uYG0EQ6VLS&1EU|l8*_GQ+C^g|+vy1Dt<V6m_aEB6
zM-DJd>pa>(Rm+-}C&{dlbQ67<HSHli+unMeLpN3lCC&w!<(VU@F+!{J9mjQxl46PQ
z+cJncEtJe+kNR+E+@%d{XohoWms;j72Q>(jhV4yau3}=VkG<G8&Dy?(dW2~{270$<
zGb9K?$^4;oC1RmvXXWJT>gpQ08a~_KYRY){?sB!4ZAiR`prD$CE}A3gH4-K*-Uevo
z9V`cWHf$ZUL2Ijwu^}Gq7qK7~!{<gSWsW<K)mL!eYdt^W^@XX}(l#%+d8w_GQf|k#
z-@2~5DBfksO4^an%HlpH`C(h`fqBQU)$JCYg*=AYbOYmD!DpGth7GX|VGy<G{6nGl
zp`P&SrgQZDCoC`K9W*$}x?_h9>WZcm{gNjv$8AkRSO6s8pZ*9afIzNblNc&)ocLk#
zUitZ+rh?}cDW4R6Ic~6dk;b&Z{$_2zNLzsR?y5h>SW-jhe0I^2&NE9(7f>VALX^<x
zU%5i)PXNWxD*+k@3}uuQ94cMTmtJ2a5t58`00ilIVG=LqBNL3p%&egjz9eMHG_XkI
zf4Kh<gguHNB~7K^E<4^diLm(msHhVboxi5gi(#+@8y96;w2%Eup=6=zmnS!ju9VZ$
z@JvQJzK!n0nm_*>_&fRecsbRsucfW;*j2HQ!#j-51Zx;+1gzJ&BVN}9S(e(|b1Z|@
zO?G1K2Xr$gAzh=n7-gQ~?{~DN#AJ!(#8o789ujSgdyaWTs<c*m@7Azp`QWCMBpgub
z&NN3ko}q27(5q~+i+3za5V8uB7%iW)Tdzq=YF2Ap{W^B?(BSyXlm|ZcZqGJWRE4tC
zX7r$+=fQyl#%e&XHE=WnYo9D_qTj!mVcIYR9VpRJHB?9}2Iy68Puh7P=$%!U)U%z4
z8UaOOYfdv~-L=0Q2m%hR4bW?Vxt}Xl^r(fOg3aSuxehna#r%2L18#O=63gflIi7dj
zH#XFFOXgSH*9!-og>(!-9bo9+38;d+95#>J)e;XJ!tS@a0af`#FWnA-n;gg4_^%U)
z&(n3AI2l@lP)&OP1NNh>Y9%Y#uKo$V6$$u(BO@NlmY)FcMBxkYl}@`qM4`?7EIWMo
z!keQDdDy+AgtiaSIAx6kl$99@7cwgvX~_pbirFj@!$7gO*rMyaP3N!QhaEG;u7*)V
z2M0DiIqWF3gbmZ2VNQB5LbTEopk%cL&UA}`aoiX~eV{(bbV2*;u*w<Hrl5~!^Uyh-
z67%ZSA<fiYKq+-66McRV*S=oXp2N|*+Ti<$O?g17aCQuqL8^^;tRu~a@=+3(iCJUf
zy003g)gz$y1(U_m4OEJc*AEu<+&Q;?l7uY*;eePH!L8E>XZi+DGSXRW4PALcdF|*T
z?)MSxvCKYs_!9DcVuT7UdH!ZPtULdH6+O;AUOqmhwROOIaOb(qi)cRM*s)_C;0MXk
zZ~;<&6@>Uet5S(4+nQ2uiv8=AGRVV(4#Up7Cg51)U%#&=9-hXNX`38znBKj2Zw5;S
zM{g8BC1xLNFzhrE^5EID-2!u?3g*8bo`b%@T~8+1s^(=8fq#}3x|Y;5Pfe31YG_Vq
z&neY$*4^+x6u3@xI5u>F1{1?P9z=OITl;LlTyw}(wXO1Ku){!JJS2i|KVDK)6lf5b
z_UMlC1F?dG4m8KSyv5mJGIt#8xb_p4TG27!H;Bpcw{v5|Jg_QUp*Y7|tGgQd8Y&P1
z@fFO*ak>}4l!wNFl?v@C!fpp@J%_Y#;sys9OIk{#{=}x`?!|i;$ICzdY5OyLkj7F!
z&Z*(1swW1qA5}epqVRyEmUh%T{iz4Na|!8$kXse%%rS}uR%0)NdB(tbN%{q@xw^p1
z*U1awd;&HkAr~teFC%b}Lvd{#0wtD4jG!X-^u#A2lo%be;3I28SFzBO#ehUeYv_Sk
zrB1Y`*~XL8D{sCt_5czjaN$d3C8`;}FG%f`2c-#I?8v={e{}PZ2ZVdw1;fq1q(+_I
zaH=TG-ybl`BAg@<AD;M7#Tp0oT6@MfKmDiBSgu!6T^4}G$x)<&G=-+o+%KT%Pbe4`
zSwcF*-hKPT_$5MHb7$vze5I3`?L*MiXRq-_YZ!C=B~Ct#ndo54*`mW9e3#y@Ag4ZA
zV2w6b|If}4z(jl;^R{hZFJK#!x5!UTt=0T!3xWvw+jH=jxDzLkLcv(}@FF_H)*td>
zl=?xnin+%?CqN>qHm)AUhUml-liMl-Y!8t)uvJb5o+ekt{7$+p7SrC>zjCk*tT6o~
z62VtAEM?KG()03C2QZ;5uK9fyx*A*8cl8AFvh^37%WIQK$!W{&)KVLlZ_N$7vg-DT
zC3W9&KiFK+`R3LQHHz@qc(nN{hMWW1_JU>tCe-KF;awf0?dP)Yp#FW+zoV%)TVXYS
z$JX^r<?PL8{zp)7atr>q;Pe0P9}LojClUq;FmV7o!$2P-+@sNGmB*PtPM6^toW_HO
z<D#-&C1xQ`9(yuKUR1?~BNp{(VxsEk)9l#um=LeFdo4ae_sY{7Bb)`^KK1wCiGz+H
zdms^WohA@W14=FCMkliQ`H|Q8q+S+Pv%^P3F~Ly>DXF_y=?%zNaduY#0f+7%U{GZ}
z)z@T&7yqDY0Aohv3D>G^y=@kw<$U33nVFf;)nU*bb`G=-o!zOZsc}rlJqGd^GOcfx
z<l>!a9S;aQ-Nxu3c{J5K@X59VMmABEupg=i@Jz*W)<xQTaVgl$bMo>)Cz98@<UsX=
z!hVVD<r7ANRnPqWi7B_p11b;5Iv8TsDR4vV=4uX3uvHb38h)BY<O;YL8rBdZ&3E?D
z6J~sLEk`J8cDnz1+**pT7G6-bj0e@DUcG8)Y!urNYKGzj7`<+)!9A%?KtD;v5&&@A
zKR56|-4!h9nrSExc{(azFyWP^CFdo9LFK?LQ)?FU4Stly;tYR<7*RsH9A$toWh1_)
zz*Z2QSzZ+&94eq<LKg>#hhxV=#Fo@fkQLA@6P-VpP~u(THoD>)c?lx37ZfGf05mn@
zB)iK+>|6Z^fea@M956HUg2(|(#_meg&Qhqrw_g?W^veNmZk-gpqK~&XG;k4$!^!cT
zc~?F~8>#s<c*S_wgSKbYUeLdTX--hTuD&5k?Nkd7_|JW&^odt%w2dl~mHkf3$%)$y
zJQDi(uw1V-aUdDApNKa3GS~V*wN<=`j_!k?4^<qhf2@a52;GQ-!XplFB1l>ykARuc
z-ae!B?+^{g8zK8{CvS1Zsq5l03#tai#T)!7jO_LF^t7@<1lD1rcUHAX9>&Xp#Od+l
zh=q4pDnR=2L^Q-3OTPCC+dqf!B(N<qo#7{ys(9r3l`;NScvbL|GwROy{Y6KI_6QEE
zx^}F((KCJqEf^^xy2SKMD_N=-H3Q=%*iI1F1Oqs#1PI{jyP@hxIsi#ZkSkV?-@dul
zIWN^`%Rwhep<-pird|1YOzK?_XOYnb+5aiEIL`m$=g->rYBy(4t8GNsEh2^95~>sV
zad2_OxqYG&CLzzj8tblgH8pAMZo{_0{6?^G;=`ULjN7)A<4gp6H~x;Bk`1xVFYS%p
zFlb|51a{gI&gT4aO!?Ka_yQhX^ILAskMGoL=VoOy0`X+BW@9;bI$2td0fT4azHlCw
z#v}yrb&y2hf{tBBhsk=->zVRGEQB?TlAxLcI(6GdiBt8J&{9B&039p@QqDCenc-+q
zGabt6a0u3I_>6V=dUN@a__t6h1n1<1&<djRqE<BQUgPNp&eqrpX+_%Xr*gD*9u0X-
z_UlnwB2s(t*c!J@623d00-=O)N_BQ#G|@s`4|=Dk#8=~3&pg&Unl?;86iqAW!Crv)
zI^phbZ5Y1zwn(pu$`QZl4Db8*(Q`Q=uh8Ob+ZI1Jo980ZSbNaC@F3X^JhKysyH3xg
z1ys5Ff2e%9eSpVS@nMknALFp!k`X%yct^dFkk|yGr~@fVV0eB^O~EEr0e{d%(X4m7
zuw%gfkifpKxy~tAod_Yu&OV9`Srf&QX&csW4)nnd^#}=5Gn;M3hEr7wYUoJ!ett$l
zK|P8Sjr9^pHnbU||AN{d0wlZ4<=&{`dg11v>uZu&zdH=opV99Dp1MzSmrR)*Muc*4
zosHC^vneYp^Ud@7CeDTQCJ;dX2yvy{rojs{#(jG&U3BUXC`@3BfRV7No$IAMGQi1^
zdof443VD?OqPo9_{t%K0aY;#vO8EkJ<<_nfbeEu^LDP%BPRVruWiK#~R<PN3C$(SP
zpELzMmcEm?y4BM8ahBi-8)sT845ZPq3dBOC0iOdjJ$(r`DkU^pKbMr8I;0~Q>r%g#
zX*5KC{6XE5p?&+x8R{x)cxpR^a<b5yLA1bG5KfMRZnnoP*bX!rrq|9Dv&jm4X>e-h
zj{Yz@<FLCti)qUio9kuP{vZzn3#;SS#C9}8hlREDR`}J8GaEzi%$*Ha=NnoTe5X5B
zYgkcii@JtJ7L-0X7;Z<8{u*vlWV7jWCqpwKiP_H1{(6+y&I}AN`ZhEnFJet%)pp1f
za;1H+4{zPMGc0o!Yp=pYg7wTWBvO~i@t-xM*SB4^Qi7~k<4sU>Ox8CvK)*fQ(AFl7
zko&*?ejhl&ZZ!6b55B32(LEsTV}c5>zd>XA0&ihTKfnkrKW1W8Wr?5o^}%IojOblR
zHoM(+38yzwF{X{0--3w+4Z-XfFmdQu1rfAz8gB$PkEK-iq?I05H}t>~4eYK!V}fo>
zmX`LH`DCEE!<GnSZv$?Qq1pVuRka%+!Q0DPj+qtEZW2%fUW7e+oX+XR-lIxe*aSiU
z2x(c{r&lq=Z?LeipeVIU8RfyU#U)Z`GbYRQyPT_<fIlOsEgI-xx;oAZ=lnZnlyjOn
z-`U2a#5qRMYB|D5cVP~C%@g9HLPCv!q%>Go{Zx8EGK4z?+M7f&Afp%4IdQNcTv9wu
z(#NRZ3x6kw@&yW1xT;bOZ9$Oq4(n9)tLsk}&%Y3YgedaHB2t}CdU!0(<hmk}6%BmF
z&4#?ZJcOvG`<ExGKmnG(;};mH34DQ4pP+F#je-317tW7aK5j=4E2)PsTi~uhg8=z-
zIvH&&?l?O=4HMlf+%WJ+V9D7(FLrFtn$CPG{<z+HtKw^L4}2FZ<6(|FbV!h)O55}Y
zQQe*eE6cuZTW`4tBd)6<LCB+q_5p7I+0&?C-M4%}Q+M&*;y<q619JnZY`~0+gR@2~
zHZkJE%Yu6dFC4q&v*srC^?&`v>+A=4BQOxF@`EO4;0Up5qHhbYObe;HfpZQlRDgI7
zo=&+UO_Zt-<Zv41JKX$bU%sTfkaw41HubvT3DJD4;KXfebb<gNa1O(-^X!?Lu5QwG
z%X8<-aX8zR?)AsnQKR`+CYB?;^@0=yCpv6M!kvHCi||FMRkkHRiHpOTE6LA~{!^I`
z=LQB|3~IOYJ$?K*1!k1h+S=OWXQI3qU1_wOmLzZx%Aei%e1A~NEjF=sna*R5P7>z%
z;8w=zSjD|YoM_xk8@Qm8!6lNKdKIV^K*-A69^R@w%3pIU)(_rf$6O}>41MofvFBhN
zMPi@5VL0pqzp!?UZ}xp?E15gwNxq|qJGPyyadQ{$TXa@L@eM@<%B>m^%};&L4r+jo
zv_nyapU^-0*G{7#j6X)r2*p6d8dEc~EF6B23qlYE%{!D~m=_Ffb9_8kUPV<EJi(uF
znhR16x;Q(BhIhp(|Bc>O;}b5tgt)kS4<D*s!^aWul@;6DmqKF5Th|d6a&^R~tmb7N
zC}dADo5*gQn8L7GpiBVk??HyGT=ZN(aRHkhD+fo?#1ei3ro_SdGsaC<Ha$K4YotZx
z;T~RI_%S1*q6|>8Ay}XVS1?wr4~Jw>SXe&3BYsrkg%mwp^w{D_NlBBFla1bx0`<2|
z#p9dQ$CHW97HvXQISY46K4p^`XfqrX^$z8_m`~_vNS@yN?PQ7E^!kNGAHaM0IL>kb
zbJ#!I-dvXP@W|(9n*_|g9U2m}qN<h<Ma0MBKS;`?6p~FznGE121npoatQ34G>kTfX
z2dp=hPNEArg;NgxBKz+5E8UL^(r|C$&Jl*(H_*KnQ`GtS`GLtQpFiI{KAy}|hjN3;
zt4lso7_@<vTj>Juh6Ec?b-^hExTEaz=jsG}oO}1~ZRfr89y}&ecDJ&yT+q^j0x=W-
zsMjtoR6u5dSOgDuh!Wc;_Uhk%|1BXgpPQ{e0PW}oChpUUicS6W8#c%}+`~Y0tSD$T
zseke?#AQZSek))0dGO!F&nIeB;~(ahiPb9t3Lkw(S*NU1o)$|K@;cbSky%)2Bz4qq
zFHTQqXEaDSNulc$I~Z;@D}hA<CEo%dYMfpG7Rlv!0gA+#QDqH4&tMjYw&701(#FA~
zp8Na$5aEZ5ClNbwibfOsju(i002Qwc6qWeneDJlRO&|k{i35XE0g+j18gXt&Y}m`m
zdB@8O)vwT75cfsJ#bNZ08{-BMf`Tf>94*B9U06vt*HAE;HN-zlD?EVapbM}aoJY<M
z_8=C(-h?=lXK!5$sjud%V^(O*4!F9yhFd9aDSr1I)<zBv4zT5{tnq!9_d!Gspi59d
zpdN0x+qdCb?+X!T6YQz4ugCeeEFY$&pxi@f%p<EQx+8d#`Y74Gl^$o}ti>n!wTb*N
zqm{Uf)FAmnk7HN}^W@gen=eJL@@kd!dl1oD4ofNW3;<I`Mn>Xjue2zJ!q)&_0!ArV
zr?6wqfiFS+NI*ids#W+>(#WtxUFh!a4o(L-n(ruN7rt*f2K^qi>rjKA-fhsoF!Aj9
zb9ld*nVExwkD*!>tQSs`xaWVLT5PZX^xjmPNp4*66}jH;-`Pd1{|2m#UK6JTZVDU2
zkli>(NWK7GFIF@y6L%~j8Q^s~apIO{cN;V_zB5YvXU?4?0a5&9MXjjhC1Ob6WGFRS
z(PI{uv*tB5G?-Wqmzzal4l}p`QXI#|@^-OcYBln<3i#)8&P{NcI*#-WUmXj5F&Lyw
zW;$-?AHMKVcyExNZUwizuu3nR@b{J5x}hRy$gaPHg+dM#4Av|cXU0XLj+O}l*Elkf
zzTVt?fqH+guUNRDXd<A&_mrd_T<jpR0A{wD1C30-^854-xlClKaJ|9p1tIhdptq`U
zX;0LDxY;Tt{1FTxuk*W`2gM+GGO`Pow^RA(adc1Q+o1#1-3u%Y<FK-`Tif?Pg*@!Q
z*gF)DCaIq7SkwY?b6>dQ)b`-9LQ`B;CYRh=k8Y*B9Xr7^%dE>ozw;}%@zsNMgYCP%
ztE2l^lZI!H$`s!pM=`D+bfD#d?u`(dz;1XIYWDa@kOi3A=Ce~;3e(4+yQVw(>w3ZS
zq0{b#EnoQR6-dU|n#fk{tZ{@s+S#S^(=Wdk3G!Nibg<5vHizJYUY>`u0otxbXdp<c
z5ujhxS_`nmF(1-OZ=>Cp(>fv`kdEt&T<-&|ErpIcK;K>xcms_hE&eCgEbiglygb2H
zJl{DmPVKhB7OhXAkxraZgUBx^L$7H4D9@q9(O7HJhMW-Bw9Rm3=DzSkGZmRi*s;d`
zI73d(?!f~+c~Kb}q?Uv=O>`=z8`pQ0tG&ZRh5i+Lrd1jk19qfV3cjzl%4cB6N<B)s
zaPes+!g~chhB4eGn!_RI>(`eUd^>T){j+A8p}WIz)A^ylyle1W@cyv%<6p;RpxXdA
z-!D+`Y`JQPA>wR}^XDHGk75r++AN~F0K#IPZ<B^wn~}8F5WhYAf$9*QATlkwklk=n
zR@SAQ!4`xc4t7L<{^Ek|8zqr9j^OuIRf_r^@_cFO4;+*bx0TkXf#fbTby%!ji9V9d
z6_!mOE{_%{Dz81#S1L|twBQqgpofN3Q-=zFyuJ$nDAv5Fid;ccSF<vV+rHn;s6v1L
zg|yz*!+{y;HWnvr8SQ^dYq14fEDM}s7ZTSWNsgaDJBnvIunJ)fx`*cf+;$q*McT7}
zOfPDo@gGpgf(*;Tw$mKTB5l?+zrw%%j5&DZNGd)VDI?wp;h!%j8Dw;%#h7qiryA>F
z(GjcSht<ru3qNSK>?Y<W6pvULE`m76fYitGzCx=}soHb|WsG>|R0OuCKmwK%F0irh
zv_|t&=?A7R)*Qj&Zs3rbo5?^M045Fz>rP+``|RNzg$N4U6D1kkdL*vpt#yQ9DQ;dU
z>_Y{8mDJTUQR5@r%M*q^Bx?i+nmx}XwM=fV#HgAe$7m^9Asm?@RJ(gp*Crj_+;7b^
zJu5HPx97yEQ)bRa2QOaP8fO?hBsFxx;5OM0Ay+mYx6Vf8hKhn8VSYfpyFd>hOn?<m
zGqgK!Lo}d<!E&HS1VMQKAE{$7w&*DaY&aL3U}9q<ZqWnp%?e5pImK&QAKN2&Ow(04
zjpXMZ>PxhCBRz3?IBvvB553c#HQ@RSwzyy2xpSu#b49JTk=K1gQ8SKD?bjl2WSRu9
zy}&cc28xnthXC7zZmr238`iB;(kJN^sGfL4O~9t)p_e8G{nu{KW^c^iWqON1WB_ZO
zuvY%NA`M|AXPUrM8tS8IX;cI}JV|&rtkN-2QIMUR7v9~1QygdgB|tYQpP4Z@41I;O
z%*ER~ooW>x?XL-|;U1MWs<C=0Kd2~<-HFrS{P)i8s|)@~W`%*hSN~DpVP~Qy%l+nk
zkVKq-n96vLn51(7ykCRNl4=S!@Vq^GQ1--$5KcN-S7P%+|2B-Ga7raYt^RPxYd19n
z;_2zVd_D*;2lq|Y84I!?-|XnwEWl5tr9kG1sw5pIBbjfoxq>HUXcxLM{v1|++)qJ?
zCBj3veMtIjA78!1nq`aV5s0;@T!c0TC(i2I`XsI0`Tbm3@{`*k|9bt+GbCm=P7GXW
zfkmng(d4JS*M!aW{kvXV`M|DlMdINyF*)e&y-AkH`<}=D@U(BX-P=WeWyK1)|GmHT
zacSbJO{bHXV-%N@Yg@w>)}~aol!MLtXqMX3(Jz`izG@$z2x>0sYYsglWb>~qZik}b
zB*(gL`IfEV15{G4-LTl|+LIL~|H1n}TYI1Uh`Q3}u^*vl8m-q_I^5uI*z{1}ai8WV
z_WySQN;+Otjt*Y6I)wt3_B<+di0L{ZzsC6E2B-;_X2O?dz@#Gi!&b`f4*wTmB*~zw
zz9F3=9ah$7%!hReChMDQGeM;u1ON-Hm1w77vW^dx22X~6Q7;1uWlwa*xA)Hv;+hK)
zQL=(>(hgb06xUHm5^>QPZl`Ag{YS_#FlT`F2b)uRNQ@UkB~zoK3ZZ>b9mGX%m5u%V
zw~&wnZa|<hraw456R9-Xq5b;<z%gzb$Gw9K=KN(~!mXS_=`*-|7m0~t)XFpACuT2=
z;rjuqY_Sf}$V>3p>C}B4>QGK`adCK5!LSkU7G28l$9*tvL%uwX@kp=rLw%^Anr#rx
zBH;Z4`Uf+%P{@L^-*po9i)bjlHnD4IX!K8%h}n7&&l%y%7@?p!PU+paQz{pc6Tg|H
z*kEZ4XoBfUdDQ@5I}ood3=BZH2f4q#+vaL&8t-F8W@!{3249xpRpm`t=;&$71z)iQ
zHt&3}#tiYa0dGaAkD3tz_-LslUQcA~gQ+;hoJG_qD+~Us8s$8U0wh^3EzXOMql+Bm
zcDxPKyu!j+uz}!<_p>{;M?^k=#CY&lL=#D9!sBU6(ZBPBOUJI}B&%e0pX(7imTi6U
zY6%=3)0Zid387$3JsYpw+LV~>V8`@R2fWNhw}~RK>oU&-&t>-onepWPQfAvKlWnX%
zg5<!|HQuNR$X)XJGU`r38f*=dW8S>pHogp21K`6@%QpZ90&9jg72!nF!xxw0k9`EF
zZyz$=k&`ufk8VLyNNBPMLkkdcmGl!~9CjTr8#%G9kppZc77g9HCwjiB`Yy1)zc9;d
z;I7f9zgxPxmXIPdG&0nOlf;|2{n89x#IiKt<;~`F5@9UCf7f^m8C<Ur9lO4kqxw~-
zk1JaGn$@G%R<1IC8%_7uU+0CFuqe|ofr`>iL-V^JdE`i~*PqvC=MY;)Dl#aT2ScRL
zW8%dt8aZdItr{C&e?A!tQLF@F2_lLGd;2WjU2d`THLoYeY2w;H*W-`lHKAfSyE4$d
z_4LM;%1{<%YW74io4t?);P(>8*Vvm#tXP1KzrIKX*E&fQLV&)j*cXvBN&hn&2_H!m
zvRF1>s-%~4z37D6B_lTMyA6J0mJIpHb{RvvzcAH>kb$U!Tx@H+AuY+idSpqyVNgYq
z62pKe?oH94Cu<w&J+sRsC(^`PdC#i`H#J|v4kHl{!A;+P7C;z{gIo)2w#a4N4anY)
zTC<LI&#(w-*5tD;Cjv-b!0H@!QTh(p8m-{v`dFpOJzf|#5r?B6gzeQCFr~OZ{ON8Q
z&}~B{*3g0pHpt?L?U~p2m5jdr65MuZmwjU048`j3yWS@lOOk|+%yc8i&YUwF7rr0%
z3>34+7J=p|9DXRhtgk`p7P=ktkXmS_=-p;Lir9#*#mOv$%ix>grX^wPMBHFIOCTlS
z=R@39XY@|Tq(S^32majtm^fKP`Q!f@>Oo^LG!8ycy+k8V8l*dGjYygz+r3?Ff(jc4
zB}f_rS_o&iCSm|As;g6!e$9Uth=g5DVzULYUPRzs$%78SJ<T=DMO4=0ZLGZcu|3_y
z4~l0O<b*6>A=y&I+Wc6w5Fj`1F(v*?P@?gSY77G#PteH}40T!yXKLUYxuJ1lb3x*g
zIm`Z_!fIw7v_siC9!Mx8Lak3t2jQ?#Xnt!GIh(U)9SZ(@tQ$e|H}F6(GSZ;IAe9Ff
zJqvF)q=m$10mYdgiwpGeXy+0ZlZFF{^Z}*H8_4ZuW}rYxNb|&B?oCl5=M#oj_^~LD
zASNWS(+9(kEr{20eS43-@X|bSdq^$K+h!~QSEE!TET+X;-fXK3S)4c{?5;Pxl4GV#
zA+|$qY{wZnIqkRBU!iRTZw|!`W_me<ekX32a(@LQmFROd*0L&g$6N{6hf)+Sc<!DL
z=k!iDk=Chh`lQh$ROy6SkoOb!BG$OR?-TyM=%QKoN=+0pU{ka1>wx?kOnc^#&#o49
zcwbmWn;lB3v0e|`mQ=%qbg7hGrthN?^JbD9`b*uvjEtbdJ+SCnIx@&y@v<3{zu4)X
zm$S>jE#(XS-@mYS&>ZmVpq3RpF^>ztVvOY~k?Q=-$jqD!yA@H=VT%olBuAw3L`zEX
zMJXVNDe^-tSrr6*sV(h@7xyBeeC0ucW$k=X8;l{lo8dy%RJ2%5v79%hWQK@<Aok$!
zTzfrWF{!zsi>4k~h;8!$f06?;bP$eup=2H%Y&*Cd;s{9Uc^5<+SGjI8S1H|Kl;syB
z|MjnrPYSDnpyIvGVerO4NYd_k%qqBY=3f`;bM1X#)sO#@{UVh2@(t6jC(tHl&CcO1
zz19D#B6$LHZJ_PPg+if}^(b-z876uXA`KZCF}IJwDw^Vyp1DWI?6Z&W7m;8=)dF}y
zNmHXL`xc0-t3-Ahz*SDB&_FN)*7Q8Obu#`5nk+UBsY8H~uqSfx$J82c_w<(fAs+fH
z`;x_5*W)RqG$8+JX_>Ufn>-7^M#eHnRGEF&t3;j<MfMDUVEDyI4vAd;+31y@kh?=t
zU9(=k)I*YpSS3<j+8(hyLD@+zg+*MDv8g;eh#`Vp??0;O{a9v6-Yj4OB;5^&B!9T+
z<0RD1$OdEB^XHRfrVp+RvBm>KqyPXB;C21wP#%JmQi5~zk}=+x<eK7Trtaa3vTc`~
zYNui|4ZRgcwL_^U(T!f79<db(!T9W+;rvEEtVgl?>$}iEn7<XT?dl@H1VSN8Ni?o)
zw$BgK`R8u-s&-<oIJN~tl!z{c9QVi}vN&`6e1-OcJ95*8rqMT$W8%}Nm>P3vuBZtH
z*={3<1~2J48ew*qOwC1rt}`GtxG$DRGehK)`Sp+E*N4@Nw(u34%>+}hWw&he4+<A`
z=Skb9a@<lV@FsC78oy=Px>fHJyG*uvfT(RB0*9lsvJG-^Y$xZ8iDfwRl{s<Q*33`$
z_?o>j@OU<|JmX7)@~XHS<q2$BbpAMb&F+ezpNA8+>B5f<54;h5gt68$L*v;u>Xj5q
zX7K9ev%Xpz;g1so;TQPvQWPA>T)e#{&g^xV3vwNYZ`nLo3x-OCAg=7p2+lU3hqGkM
z;@jdzi<2xktA76ci&dfT4q{VaAwuL3vA*4_@KOAQRYfqfD3oN~hp!l~cBhbe0Nv6E
zJj1HO#PTMAX-3DJzzq~=(-I5_nSrr8uWV-pn{*-<E^Yk~*3s3_O+zf&BAEyZ2{jkF
zDGR<o*B+Ts1ITVl`9ykF)`AD@;*(t!vk3-EdG0HC?F1%hG__+f7pe?z*sor=7@epA
z`PtPHvrUP5`-0wu$zP6l4!&VbA8UT*rtl%1)fxj!SE3KP$-QmMCGK#oqZ#I=U2kGK
z<)g-$<vp2=GGkOe%j;=;7+F~r&D#-5F^5vMB-7dP!_5P_g07AuTmko@yIaoHL%kXu
z&~vSX-}UIO;2*T1@;5hgCgn#At?u%-MIJckI1(K!&d>eglKf3($B1_#bK4%RVeWq@
zZ+<`9CRe>^v1@YSN^UfF-)lP7wPt!*ADR|Rn#)t~Fl4%4zt8aQN{Tq2=V0@J$v0dM
z8sCL2sFiGrO(M<3S2hIxu+X;{8GApvu1lxsp18w?z~*4~|0PY;@UjtixxKr@41*+<
zw&=OXYx%$5FyOvs{J!ILT#{Yq@~^B2e#Da6!N|awsG0Z0c^UCsVSXG!ZShR2!%)uu
zm){kdoP5|fd>LhWudv6<ynl35{vV%+_+yq-3J3;YUtj9-Z&=ZMtMJh%8EO4%sG;n?
z{=L%EALt<{?ad|h+KLrIyZ8)pz$yYS@26Y-l{f4DmpsSiPxC*~A=iVvoUIFA?0uTA
z_510(546p1=ld0NSakgNW3cvuA@G0f2mZI)`}!=!jVR0Ig9J*4<;Zm(x;^H&ndq>q
zvx!-2G=ERjtLSL4;T-eM+?K%KAN(4_?Bu-&D63K3iCQgoExDqILJaCiuBa%aU5#3m
z!Anz1=^4;Zid!kP!uuNXL=H4Av7Y0f_v=C%HA+2j!iewnSIN^h!ac1pC<jfd-C0fx
z7%~(}_hJzJf!{x@`<B8%J^|zEzhiole#aVPcQvTjt`{OuhqIjMP;(|EPcd*RfLXZx
z&njHOX{U8B0${Ef{`RxODE<U12j7O)TATvQ<9L<_b&<o_-;aHIU(7QWP;103Ni7Bp
z-f+O(552kAt7NgsxhtG+fC0ds0)=tRZ!7*atE*b~c9}e3G5xuJfI&p}kAdcK|Inj7
zF&E|h!~=f+rPhDM1mph?i11S!-eFY=>#dZyc$>5Bajirfz1UK}H~+kSJ^Z#IP!1|r
zo$>hYdwYinmo)XRl##zGCLgxLP6B|E?O7fO3$Fh2X+_rIPk3X<#FIwRz&n2mI=`<b
z+2K!hf+R!-oB+BGJk^<wa9REo*Ho@%<AeURNcB52ETF(4xj5YeVz83UAExQD1EJMu
zfX1Kx=kIRXcrRj~ubbu1qXWq_Q~_eI@CHGi(PqEhKOB@rY!jiiHUgU0cE&F&16GKr
zRXoDCjHIEM5ud1w43-ec2G8R%iq_QGj4YM|?5F%zPe;ree*OL}cf#)9p1&+d{vChj
zA7pLHIMBwFpL0o1IGLlW&`gh++8Ahby*NeO&-~ko#VaF1s_s3k!akvT^a*-a%5xXn
zSR~YXE~&lY{IPG_w5RVMLMA#LnYX({tmX6^@5J2@ci=DL7;6ruP&ax9%^SP>l^hqY
z>20a)b2X4ZB96=1=4?rg!Ag(Vd`*F69xV8Vk;;R8%8qZwZW!_J%F*{n#8Mt?o<Zv}
zZSoS#)uu~|Ep;WsK0Yl@xzAtqNAx6}(G$UT8c*e(4FR!iO*yXKCHxcF8}!sh;@wqv
zS%uf&5)@p`keoA~19ZSKVC;t8()jiFtVta|x_*p4=%9>O?lBV>>%srN9nNcU7A%WK
zBi5dLQM&)(aLO?v>g~xDB?;TT9^U7B_L7-i!i#aK44!X_<5E$}O_3b_5Mhy%Xv!cX
zu7IN+G@vC~3}~-20PF*Pt~95|bV}k|TKr1y`MI(ZmU)e~xf)*&)!%ssok>gK1S=u-
z;xpZttrY`&7;()GC|jX+T5k*Ln*3z!W_VTmA>uWFEXj06?6cSg=cM0R2c5u}xlm|!
zIrTgwHO!{8G5&;@+EUc7Xc1AhxIlaYZpj0dB83265aNXZdeD~~D5uw{?*ltX<_d#r
zZES1|dzau%y*29!$pZ+PhAw+q3?r>ZT^YH7QGRM#=rAZ(%n>aIX`T2J62s-8wH2=O
zffT^=ss;3tzp6>e6dVkPRg$QEA^ah>=t=<D4Gs<tjR2H;>0|Fb3$Wq-y?ZrqOU>oz
zA)!{87<F7pjxR>Sf(}&G|1sTc@3UdkrhL@OolZS;>|HpvqRm=K)t+Pmom_o|;B%d2
zgEDA30$m`+3aSGHIlNjV<USh1bGwE~t3f6@|8D3uUfVP%R)YRPn``(6%(KbzXU{^A
z;&A9&sU0PTx1o!fM<;fo4A^)WYGSZu;%SQ7)IDDHY+ztRg?TueM-V8}esOOwP`ov-
zqUX`Y0_*7FztV!YKQXrIti1dvMu1TJ64*Y(UFGz$+i&vq<*}zF7lnsgmHM9mB|qR6
zssYJMN4(lWw$xR9PC=u3JgkJ?u1xUrHp}N!8HtC@Tkqi``<l%xEX~j>Kz0c~MS=A;
z`yWVuVwX^Be0QQpmU6Ut^V|KCuu(%#nPE$tLgPR9vF6EQ60dzCLx%Ii?RG=;9B(3E
z+>dYj<rrE+P_;)IWmD7l4P}~qP|ku<Bq@+ODG3#AkG7})XJmB3rBDf9mE&OT$r5L_
z*__tQ>~~^0n;cE&O-F&nsmVcGFHi?$%J~lyr1(G;qBagAj@|Y&&m|8^lZo`eg%~rf
zB1;)hjbII7MMcHK+}x@==@Fq5oV8~zxfz+kP>0%EL^>qx&P}q|mc!px7w3)Cf?y5N
z#*-OVr5O)D)*sWgd$d#B!JN9!YccqP36s1>x(5U&h+0#o+CR6h`P?2@Q~g3MB#sBo
zxsBnD9%_}eBhytr${$?{Abb3*{`k06?5)V&xy|C{GQnA!Lp!u!e5&bseKI&p9;}?N
zucEQ>Km*WA5Qs*nyLJSPen`L%$v^YFWYlaYufZPZ_4oQ07w9w=0<sL<Dy>TIraiQz
zP%2fpsja&2&<Ud~riG5<zZ}hK`Ydew@`tO<aav!T6YH#t#H$^8szc9m_3TAciSJGY
zmIybmpH@0CfByG$wD(zc5>+fmSfwRSLk$aBK1BGUX>K{<%ZPLBOEKsvAX+`SGuf-7
zN^d4X{@2l~zB}YeaTSX<l#JfqMBgyIE%C-7F0Lb0JAh|nBi-}y$^0r_>NOi3u=a6K
z|41`6_Ze)F4LL!1t<J!IK;qT2m`{h_{D{mVXm3<RF-kI25)q(JJTv!CLNSJwCAfk%
z1uYqzIC5cGFR_YL@Dh<3Zvvo??vxYXLLLxew-y~qN{MrxX*S(gBp1e41TQ7szIAKh
zPb0-(jRh`iL07>Q8Iu6vT7UGOPy(hYR+%uwnDbJ7L|xLhP^T#_F)cXB@Q`!g-GLqc
zP|Mnev|f9u?%9;E7nuW+P=()dVJzqW^N_Q3lpeB2)jeUb(`EmP71JEr5~fh0y;h9U
z7Mr-C74VsBSa>WxW?4mrny}TR(MG|3M&+JxHb4Dvj@K&oSev23Nk*##XP7Sdt<Ilp
zstA&ZZ1s}0mVL({!+H>qktql`v3Qqx+l~f*;`hNR9B(#w+69sj&7b!VWxG@l!*You
z!Rbf$v1i0K1w5tY$NfWM7oYq4j|2IKlcMp;34(fJ4m@O1vEPSXK5Blp9enx@@?cvH
zLn2H-pa6gZc4-TdTc*|`&>?|g9Nc<#VFA<O5u^HIZ$Y)Hl2S_j$rufa$l{PjLG77F
zuQkc~p_|O$MA3jPh-jVxB|s=MAMoKsOhPZ{iD8#B-@#2nMvFm;PB?#6$6HqsTmcFC
zIJQHGG1a~>Z5cW<iApypeFA**pu<UbpyzRW1FqkK6$oz2wPJ7rLAn%MEJyZtH$coG
zjee4|aLnI9ET1+|BU6%HSa^cXBe1NAW|jv2wc(KpvlITvG!XVA{!lL=f|RE~5Q+Q}
z)5;K0v6$h%l50ZrG+bdFGdAt~jV}YS^<m*Vo^jFa1N~sE@4<3ddagi=va5eI`N?+q
zvF}jpe*u><kZYqvZTQgo6i`cZ@Ag_*zcwGA1*eCe4U1;{r$qL`VCl1u7>4XmTZ9Bt
zFNwWqhr?DZe(2jEK(Gb8k+JeO@5x9NxS#Og6ux6zhR|3hhZV+s5b6MhsNDoXis*oj
zz*>Yrn~NY3xJZ81DR_#f@~0%(FIh~-=v}(hja-*_TO&jlfg8u*XdB#6T1U>~!g2wj
zN;JxVH4%$v(p?Wgk)q}_f2p+n2o)5-K+v&OYckx}`?0HEy6c?@Ch&YDL-rTwtv$Q1
zuLZw(#jvHDOu8ptJYp?I?5e;eYeT1O=;#1QDBZ~c!o}V%s8|2_Lty`4eX{)vV9wu(
zu?vs_p&SCQ+yt6Gj#?zk#|mEKd#y`IH?<HcfgLC|cxe*jazHmg#l2=D3ojJq(6Gqq
zAq=+(f5)qoH(pm+ZKN?zSgb6#_bqW>r;L#R8xsZiTmQL-(|2u;2YCbJB^$z|uzQ8)
z(<JpzgPlidEAW>M&baw&5j_iA)%}dt1n$&usEbRQSmkBcZF^S4Ld*w&*KOAQcO&Y&
zMD2$3K6<H~*7t6b6gVQSWwlOl9CiQ(;&WG1OKz5rz@Vt>{#r8Ehr11D$**>bQHf(J
zY1g@6jS-jO@;BFDCJJ`JwZhNKP@z*5{itJVZD2E)M%I1rs>b7O_-oe0yU-jRgPXKf
zGOypT53g=mk(iyi1x9$tMux`wtc_OL|Jb)cqGeVOOH~F7jhFv0j`o(%Yh%g@-ZZ{%
z(y%FHxr-{6)&k^GW#ma4ta(^q?2voH15zxsOnw)I&3;B2g3wb~N2+>mLq(y@N2#Wj
zg^vVgYG#X_Ll9Jm9;)ZNT~ND2eQ#3*YnQDZEP7NK+V5VZON*b=D@ej3+lIpk$eThb
zO)~ZO@BW3^EzFFJqE<Qum&c##R0aJ<mtkKKLV6;r`5!Ov6R?`aUiC;{`fPl)?eWa$
zp3=%n%iIr;&4};){UbuM4HY(?@hf~Z$7VosOAdU#=Xu~osl}-=D?jjC726(QJO8_V
zQfZpU%{4U_VD%`pca_%z5L_|6-}2>R(ZvDVef#eYF{_sRK1E+$NGNm_f3B3VB$b@X
z)xBQj$-#p8m=gK#HblN6oJDMMu*Sv0Ev*V@YH00*;7k(o65A98!*>7vh;EU6iuj0D
ze&}R{@>^n{6HyqP4&p}aFi8{^xB8DhsLxt<tBiaY#{%dp(Y^lrx&-I6z^Y>(XHko3
zdyh=*j=lXKKib`B4_|%nso{#O(g$Ry8E|KGdGe{!4~0L{H~fZGLh|{auskWg7g4OR
zXc*35;Q1dvs?ISQKZ=9D*Wm~~%Ml;{g|Bypes_jJMS*8GvX37-&PlztD=WET<;1^V
zXT`U3d%fV&k3JXpEqA7t_#d8-KfEB-3M(EN`SuT<vO?h#{*F?dZ_U-!)&p`}q~fm3
z_47mUR0isR4s9n4C;u%Wgd$hch?mcx(6iLpa|nOCg6)Ri&rPIpyW&3%x$b$W3`7(g
z>gy5g^)x5;MONi<F64?JAU7fKn$giNDz^j<z1yY_QwO3@Atr((k)Ia)c1jsV62#vq
zEuo*z0}+d50b*kq0#8WnuvxU;Ykr-7;oA|wPZJPf6Z37mClwrbK+RI$@LSe&ui?!~
z_55G2vzAd5PG4v}iR2uy4&0bo0knWPT3$2-evR1n;)Xjche#f!q3{hom&>{Y=b|}A
zvOph0s2Fk#eZ&=;Q9`2h;TpreX7&x^$_k)z1j=cYVJp8g2a%z|!ouLbQ5{?{D$YVM
zLv-UyI#ZQ?BZU*;XTz<b%0;Ie3Z)2qVn33~0LTlV!NfTS06MIeQ{yuv#R0I15SES0
z159WAiu4R%%fBb4Kr~JsZ{-Sz*?Lf&q6^H0nhElf*B1+<Bqcj~7zj-#g-bkI?#h+#
zrBUnB{h=mJfozg!?kJ<L9z59iI*hhAk5~_IzogUm!>FfO8DvCUfm&Lv5E#m54`F!_
z_W#SvpP($Cqg+67N5U&^`&lF73+6UsN}3>!Ss$S!d5CGcC1zMdrMy~yAng@(gjs7^
zJhz~rJ*YcxjoVN<B{-z-1g{WvH>ANQ8CePxna41YlQ}K%E@^^!@wos?78pmp@f^Zx
zD+yk5&F>Vn%Ia6HyeiIm5*8LVs*K4~9-Zs11`SazuEac?3TT9(*OZnP5ow0CsckOG
zMH910K!C%+5p~G82-_HL2RkgAWqSkI6oe)yX=}T}sS3>vo}4HY>Y6j$UrI|`kW7GV
zRCP$Kk!lZHN?b1XHy-Pt+V@vHs7hNA5$tdyt#v|8RTboc+(A<n!y;f*R?TmY@eRG+
z7i7>fW4%fVW9K06rp0X=#3|Phpw@%bM##G3kHD7Zep>CN)*OoGrq|j?h;_J8m3W)c
z|9QO->>L+VR2bOU*mmyhg2TMQ9@}Iwr1j>cmqUiuQ?0vc`^ZZd*ol{Z6B=WZ469@Z
z=Qe^_lFQEQJDV>9Z9B%tr>3O|<~H$qAoCRfP#te)NlA(3w>`#L({poc*RF+n7gk6U
z3<`j(AqVz<*lCHs>|Bt538-bLnKrIpUu&2LpNB@4dCRv%w@knt1LHhM$U^lKuhL+M
zsjdhGmr4sh9vc_eg17Zg(fQ5JOY1XM6NpSIo*G<~7@T2jwuQ$q4QlDuK$1#pHfZ9h
zI4Xeu9^^OfAHI3u2fAQ%f*{@yxe^E3CO#Cm{_SKjh<9t(Hgbr3Flv<2$+jB=ua71=
zT@N>#EM$75oWa--e~LrPYG$2kJh6p!8Qzex0dyc9zhL|SOz1T_3wsIHgn$qaH}@}~
zSf6ulJ%E~+h}i&u1;P>n`VRV6JV8alrB@3Kfc&8ILs908p+lf&;D~U?$XZNIL==vW
zjt-nMB<lsBmRT9F3iv`0j{pSS$hl-lF~P8cpE%}1Lqa4V(gSZsTyaR!XAv^L0Dh_b
z34j)S(+()^ArJ_>nh3<OGFVtqt`Va0)vKYolS}F9B~yY-Irlp(>^k(upmggYH_L)s
zv6R<}TbY;|F(S!5m&`#VB{>cYLd56%!3_Yh*!|3jW2)d<%;?(zuec;sCGLeGuAY}X
zWOK{YN;@zQMEq1kKkR88u@p}9Vq6JH;J^K#W}xulJiu=>u`*+{4StfgTr?Q(gP1Pb
zxIG69DV;msfk3+jB+L6;3|wNPqh&8+m?-K1Yzb(?gWDhS&-Eg(95af{fcxN}#>w8G
z04b5Z)d{v=R4T^XjDxv``VRQZFO9Qj&!T!%<t+<gpS7JOQ(Z6v>l-BA*y)%l0E(><
z3ydTok9T<z*&b9RM_LcHvH>QptgLiUU*wY4*o`oMIFr?=)!A60b<x`{!GsJI8^llo
zpilD<bq<886KjNML4Up@{(~x8Jfnk0i`XD|Lu@o8oI7?TYM4NYi3JAS5+D<_=vai?
zUc{GbF3Gj>2U&XPD=@x(ulAZN)>|zt-Yjp(DsDSGj5#>WAptR6M*s?Y@nEt~uaRVE
zqe3iNh=J3Ic$N&7Njm0XU=YP$)q^?9bXT|I$b=pSKMapQ^27XrSLV>ZgA3k{)Z|?0
zO$)D4-S{~X0}>aPSlK%v_s>L#iF<4BUa-SFE(yNdpr6lQi^oq?We|T3$ixq2%&)UF
z6YJK~Q`%6|N#y@$ZWt#Cu|UCp&s2J!d?uhK+-`yPRZ_QK_(sL56?tpnmeRO==MEAN
z6lt-oO<e1jn)_v;SC6|1^Yj7b(Y>Rxs|U*GxNtiAp^tr*5sH_V7P6L{(cKd;S<jgK
z33Em*+{R{aafFFOOA3i`5VhydtIAtYF_Jxi-RcqwoLm=PS$xl`LKbo~g^JZoB8{cu
zSDK7x7AzE40p@kl5BUd&Pn<Xb;WfVc*(=C`hoC8WK`3yhMet;l`<1Ymo^s<8A2P8o
zaZb1T2;m{xCWWO%Hp2;k$-U*3(knA&fHto2$0yYvK3&In64gY@)5&Xriy7rNL(-!r
zubH;roZCX)mF*3PAp&JTLLw@O^@1x9EIHCsfNKeCbueuET3!U#Qv$nL=J@F7=<u*v
zbhs7JDO5VYMDuhUh3@fxI$4L@7A$7y-LbAAqRz<WA7=sij{{Xen91ZBMETUEr0tGB
z2h6l@^v!zC*xGxa%sD>y0g>*e?Y$q<qr$_xCdLje3zDtw-~;&;k3x|SfDR%&<EEqz
z_;FgZtda+fc$BVkD8Dh{=|sgb+J-3VrwF#dSho(*yHxL)Tb053#+LX8x8|45&Q9n@
z|Jt}wAkF7WSl(;iSC9(BvlD2OA0HRT=eTZg)xjivtG{ZW61%{abgXyWXD~$uYL+N}
z2IAVP4>d)f`0_x6>IZn!EyfbLIJ;2QGcht^2+1!ve89Cl@UGH%Stx{q5I`L*NgHt(
z$IBfP%M+<*@i^haUOyX)Yf%2Dlqo%qxV~NDv-7BnOI!_njqMM0f7#%SDhc~Atg7M+
z38mlfM!jA!ULj7+hb}c3S@w`&H)Et|gPD+3ryJ&Rr<Jg(Xkf~zv585XP#X??2G5(z
z8vp#&h&AG1O&ACK3~FI{C>V4FA_orKOU@HOWKaA?W<QI2Fxx$RNE16e&cX$gD-VxQ
z>EkzV-audjNwU^`CSKpNnm?el;G9+n0sICKj;tMZiEsuP6r<pQgj0t7vfzi?v!^g{
zYVYdcfB-<BYe%;qg65OV=7aQ}2+rU?$vH_&V9AKXa~*F<E9s(bxI#uFH6?}q=kZ#-
zQQ(Fo0<%yyKxh483kez!y!+kkaD`>?ebA#0PB_q@!Gq~A9Jg^VCW{yu!TRLt?2K)T
zk#IuqUY{v5wnRP<Q?+)NtaSNOM!U)G*Do36XXdemGqAGZfjzkgr@j0WJuipPt9kmq
zp4Gz81f)%$B&97eCyq4RpsoYjgRvC|0>BhXQ`ElkHnvO4R#Ji8c(Q9?LO{ia=~Psh
zE9&FwpeHPtWRA8LL&cSjp96Fk+Z76Bcs%fQM5vYgIMNVm%R5B_PFY-B95iSdbY<+m
zQcD@l?4taUQ}XazJ+J5LlZvFOpm;+9JN6RZ6P8dtGdxr#9+^uQw1~%#C^3&fnn+v_
z6VM=nBhdOCO#oA$Iu7@zPX$bBqi`fA)P@R@X6VHXnPh<Ql+L#{`Y^e`*owavNkT+*
z>g8w{DQe6K@zErh0n{Ww{qb&wYG0K(Ps>YYtn_=&wSPa%`Upp_KK0PY$H7n-R#USh
zr+z+k+&J?#pzwSTW7R?QD?_V?HsDgnb_0Sl)>W{S(zV;{+}Hg)jOoesW~wnR4Gtvr
zTfbxzRp8b8_eYhF<Fl=(+<{{55WWl^kR~Q;$bQ6K0ZTX;dcjX$fyfji+-K+mxDi^l
zX_I9`d;@Bo9~mvrZDH6mgZ-dystFsv!p|;$^7-~d)gpX$-^9HNk^bae8AUC}no*U<
z_TwrkEZpxPdhGwO_a;z1@9n?0y-nK?Ziz&OZ7ysfB@{AKNt2>bXp&HgLiR?ss0`cC
ztWar`N^_Yrm7$5E5YdbVn$PRg-uF5G^F05xo@cFd)_I<@*16Zc*1c|ftKaYY{S4Rj
zzTU%nb{?{VRstBP67_so_<%6Wsconf!xIXf3vGMv#zqFRNI9+w9{Xo@hSK_`*Nyvo
z?EF<$^bmZ-Fsf(;Y8%p+W~B9+5oSPryFh)*_c3N)+z|mXN`%*EbY_5H8*`ARH^wM_
zT95u#L=SWpx|ie_ED39CPsepSrRxrBmh~GIdm`T|^?j2NjtQdLh}AkE$0G?FVTt+e
z&0IYh{un{nB0SZ`#)f))DvW8Q;PJL42gq|_EGr0mR2EkLFRnN}&CYIT^oT(RS<)MC
zi09oU>tpJ&zKYpBPYr9{j;Ltzq)7sfK7O1iA9mc;%$F!z=rYmC#HYGuas08sUf8E?
z-Mm>Bb3KiBYtdyuW(1gvZ4?@5+6sOh#iM*(+od|UFrjM=%i#_{Qwr9JTrA-2aow8r
zffHv&nm*bPeyc&!*y#Rdsi)zuS8HfwF|VNw2$^?r*Xq^Ja6T3}mXiCPN8h-i-%`Ps
zu9!nv0YbwGV6eJyf{{G>S-M{=R?nL_mGdu9r0BI6t#MhHQt+W?=W<W_qBq@luzQ}O
zMM3!eD2h;H?0zfEaOvAc!3ojZ$mCM<lP9Yrc4pNB1^Rzdo9@u><A)C-hk!-E=H}3Y
ziMn$6a*`KfXSD1yRjptxa9nc9G-z}3q1~u`(yrp3q1x!~DKXt}^c1`FH`_%75@k;O
zCo-!;hm$!Iq7^`jq-4j~faX8K^jcORZy6{l>9enhbUmgjD{>H~Mihu3GNhbBGFokA
zK3cq_PF1~;5YGhXU7R;%iVd%(C0z)fA-D23<5GJx%JjG1XB})E5&kaj)gYN1e?wjr
zwIXg03@B*R=CA<k>dYUo(d)J8k0U%~WMr(;r5)aTRv@#gt+gGfF5!M4uxiiij77nX
z!JL!6Ip$P|pFpE&t<2WU#%jW??e0@I{mDEOHjY(O*ehOGz}xm{h7NohT==w$P;Tm#
z;7Io6*cl7);diV+(ivy5xrl~>u#JS->6FupmoD}BntJ~Q-X=!rk;m`9*wC`s^l>%#
zHrzDiD6~-uN^j}FCUHJ`?N^;m?*T85P>r>usD-Uswk#1hZmJO?C*FPhhz>6J*(#6H
z50dK5k`vnfqGOkg+{4%vjyE<dbzi?CotDKBOPm$%)rNB(wS|tV{;9gBj_L>pg}TKv
zh^L$BSS*&yd^?2dIpmVfWG~bGn!FFX9dqAvB!25IX9{rpsfOvyIjh))-FtOT$kV2#
z;UDcRI3h$hoM5|w!-b_wCMcN|Bk;Uvf1lT6#zJf6D_!M5bD)NOr1Rp`_kTNB`VOz2
z+4+anyp6bI8CNfd2v|IX_e>ezEN`S8KBq4G6jeXc@z7wrOOWIc|DJmp6_S*+^ykSt
z_qpZnKkxf<)BXKdPQFQ+))pyQHBmhEAA`kHr|sAcqph@8yq&_KA~fCDU9ohnBC+7K
zTok!8`qd!#m7-=uq|D;iPa3f{2bmaDKE&yd@I}EG=TiTxp2-wAe5gE2_IHCe+oE#v
z&V{sjltR=n4O40KYSurDp$o68tJ5&W^<kO3f6?8Os@05qIdB5JyvmW$ofAnsY=bkY
zXCD?76>YvdXfd?|H{3Cu12vmZ-Yy8Zlp#L7g$WJTti%lY%eQtABHQbFml5+7-0I3M
zBxGLNe;tJx$j{}FkV+dGPe#W~+kgqI2P?Z^62V>Lg1wTH-fR^W6^!3T#?vw3;BmL8
zD22+H&0ILcN}8H%!k!*`LDitjF7M0y%i`XdR{`dKcyDKJ4jMt$J>jlZ<Ohu$DH4*z
z$<;b0rfb)(%#q`JE()B~DCu~VQktYK#~+17e`9xIryeW|QOKCHH}IR%0pn!|Q0I{h
z#!BS?WU~N5i9mYVKI<KApNo1~{A4a^zSzblQniBN0h<%?Al`_gPb1ZUxv}}NGZ+2H
z;TTA5i0`}vEbF^%Fa6BCLe9#sIeX{!Z6?wCH3y0s417@J4IxCKRKP!?rM{dBW^J0v
zO5fowE*<)jMw50Zo<J4L5R#W|rKLiyn_4nCKRJDACRCC~EUNxn{*A@xFUrP9q9727
z0lf*@&&vxb7ARYZxVm3QuSqy`da!j=Z+7dm)g^|pr}&PHAg9m}L`slrwFQaz$mD(Y
z!^PB%45YAe4GF%HzMI$sy*G0!l%*JRpa^?aR2I1G`i|3F3=D|&%z)NHM<<qZoz_Qr
zhRj34f8wpr@7Cmg5xb1mu&wmToD?plhUHJPG!O{li3nRe?5g-$&0ni1blGwm2h3E*
zj=c=C-^loPYwO47e=CWz)Isn)qh%$fP1t%xY1+3d97-Hq3WzPdI+=6AVkUc_-Qz={
zZ&!UAB=aJgn*tNoPB|jLC}C!Lmt~&T3P7tOuO^Aj!1&T3f7@l|AANj`bvrXZw@=Av
zJS^e^xs5shef^@#Ci${jXnsIV_OM@^of*C|mcol?wWQYk(bh+i-zZ&erf9S$>2B_h
zrG3N|#D?RF?Y)7eF;iQirYJ$HWzl1*Mk}d;uut=`e^NbNu`K4e>gmQiI7aG*G@qPs
z4d_)&G1l$We!xQ%&QYLKyWet;3l;E^p#9`+9H`bhvdw?imJ#YvYBEEIdJ#&0^5olX
zopiFl0qB~!fA~K69+qzBeR=N8Z~bAuGBxSfPjyytw1zw5DGR#EQIP{VxY$f~16e_F
zt*?@f1;cqkjytkAH@G(qzQ1Z`NLK0V+xEkm^^-}z0EWWD+C<89HbxR7OSd$r);vaB
z(wo?MN=cy?-NRQS*XYiY5_re;Ei27G#%gMZH^}XfqLu*R#bYPFXQTh&@mJ^DjGZ-0
zwD7drO73HEL!*8#G(b?|i!TM74pn$s^d6SUg`R^oX-G9S%YIT9r;ImDQ(p-VWSJbH
z$p@LCJC!k-Gh^-_za~?N366f6%oyXTJG5_kRTwR~(-NJv9sPg<s9;UJrt4sll+IM~
zVe1MfyQ_{0-<9$bLwA@Ot@Yk~q;LFD^0&h`{b+8sddSz{;)~kBrdWxggy@-xepK3Y
z`!MT$PPpHg=CSn0W+rW#9x@q0cC(%@qlOZY9#)Q46D)qJ9@$+eu}+=Rrf&0BAr%oq
z^W~R$yJ)$exQVYK8qs&#p4}AwYy!n3&>3jDJ-+lqZ4~kz)v0M2qNt^CZjJXmX34|e
zwd;E9>xa+tsb2GV#<6vhWt`_|to&e=vL%9mQ;d`SyG?mTMqs4#wuR5gUc|lSAM;Ki
z?09n=EFQ1teZ-l?Hv>>{O-4`g^_%87VeZ_0Q0E1s3JvUzw&gjujTYP7dG*L(l8M7n
zOi>p-UXLb<H98W{09*v>otQ0~lurjFp+Y~95~3{b;+smpDjbd##tn$MWs2ZtFF3TR
z)~>$w?F_<)C$wJ1jkqPrKP>0)?o+XMuM%4)j5Fu7<UDTBF-5hEWru~^<BMl5eH0O9
zp3U)&ZkDxRXH#d-HeA_n==9B4b@CYs!ar9tH|g0|`r_8Q_&L?vpl8@p@QJKp;QeY{
z(WBkFH+$XeB{aRa3)(@cF21_b+b~+r+D+deb9TZ|1@R92-R}-Kc!umgZsrRoPwoiw
zI)zG?PwG-FtG=B|2M-p0=>tZ~b9wcTaiYZ_Rz$AqCw!3CWgX%YRd&9hp8d4<k2l@L
z&&)dVKawRRe!~A!7e(<4|M`t`;a8m3`D2T-`mHrB*M=M4T&SBoE+X=?S=WSr!i#?D
zva!#7G4ZkhY--oS3Jg4|cf7x*g4~*Wm2NE^=;M7RWp8_W<)p@x6tjfO_wOCHe6Ofm
zTT||zwaBJ0De$`G7xG88_Md2yQ>M|9FnWiQqxq0nC1M=1yIKESpm{AM>-fT1(YRU8
znsYaH(yH!7Kh~PBtEy?=UYHu}WAHS1V*~jojGMy^Zyxem_9iC$;v{{`HMRPduS@)v
z`)9wYnsVaJ>L263%((S9ZQavA!CBCJc;(?bU+w>%FbExu!1fq={r^T7WWX;3jM-UP
zHb7NqWf~BPTuV)TjleWDt;46!0jA36(ys4s*?m@o1R*pCO-y{LSaJq$Ah{>(HK9bK
zY9%o1kKWvvI*-*Z^?X(L`}y-26Fg(2Bm|kCBZJbR!I2?yu{5K_?a`r0jiMEbOen?+
z#K0v3<Je61VFpG<6+|;x)%CU`Rld`aaUU@`Xl?SrXcT|cy~}l3GO3aC1T8%d<#$vr
z!Abe7Tmr1Fkr0@L^{mh^kV_N#2-RyMQVwCn$ozjs!671lLk|e5f)EOFv#DgO3Bk+z
zSI<ho#_{S2%ND-q@XA8bs~!<va2;r~!iyp3ayXm$<u~kRsDMPW2=F&odamm3Jlh>R
zu4P-}Fzn%B3&NdLmpzBO*W!+1B*q}gP54qK{aYw0WW4+&Y91k;a%-atMEc9bvcN$T
ztD#mRkNVt;s@(UKRGEXpIbI&NR(0OH5b28<1mFf}@~p>urZwzzf1OuyezIYZhZ?m%
z6^n|hYVm*2Os*+-v1fVL37)k^wDw#t`zo%6K+J$K;~?A!`Go`)`5+xx_vth@PiSjE
zN2@uVKx5z2^esQo#b7^4t=$g8M@ZgRuU`G;e239@T@_EOC)WVTgrv}^h&IZ7;BQEJ
zc}NFNZZqw`FIEVMK&u+Q3t!|v`b@=>R8TUl>STuPdw2TODQd&7$V}qNkd`Pe?YYt|
z?QfTuidvbm!136|*+TWpwMQ&V#m+Un7pPw^|I1obq<hh}qPv1Efn}LNn{mMm;k@tQ
zo3Qz$FOEXl?bzZ^+P%2#nR<WAix%pL=4Pp6aQwI6iknx&_prWrLC9-NCqhWeY(yZs
zJ~Kh6*8b3sDcYeCJ}de^Nk%F<Icjwk!vVv8tM&^1)sDC-J^R~;k`k$lCU8zmoNMP{
zil2#H6h&-a`n+R-Ooi<^n9<A-@bZ7jMRJ&Bta~-<)qGNs-kR#=y3X0H&Fs8f_pxhA
zaip7Zv|E90^07Bn60rw+&M~Rl8kMPY*{$GBiN@P=xhXTRI-2`;-{xT~lNn|FZdHRl
z9OkO`{uYO@%C)UNX6#)rvWem&PHI${E@zBjVC?e+3;gk`b{3@Q*%VudP^2Naup5`o
zaZUf8RtxX{Dg%XCNE3KSf+x<d0LV%bAw<dL<DF}yn-M=T_@b}ceiohJN9JY(|0P0m
zmR&AYMr|q14z3T~YLSoTKoywxZC<;_Xv`2P$ZsK>57|ZMgH~}5qQ=iZY*AaewXy4)
zA)zqy%q<bV&{(P&?#euQ+gHKN)#D5FU9u)crVjW2lq56ejLX_YND!pk3RL1kzkM#c
zoR2+7QnF5%A1CWkoqmDxpuF{ov}ecZM2l?~o5e1txVkC`PiCI;&hhe*J~HjAsDiu}
zWonR{{2=CC__!cxhXV#xDjAj4FJsK|%IHQe-JGYo+piQV<4pVJ&zC&0sb=7lrBw2o
z#(8Cp^co!(>Hxxpqk24}U=nIQl^nxwde?cFxW;{gV2{8b@9=uO%guO-Yw8Y^x+~4}
z)izWwAQ_RN_8b2>uDK-`g<SQB4(H+TzcI8{`d5X`a~w@4jvf0!2>5tN-WM)d+?nBu
zEZtA|a%Xjtx;x6XT*6APN_1U(M*79AdhxN69l{@lH8b>IJ7ywbQCoYs0rWbfo)uhf
z=wcGm(6TO`vt?I&B2aDXD*w5LAHimPCSM~dija^mGhkXnRKqVgETaSQVvgcri46g?
ze>w5jqh!PyH(r3FT=;7tKlE3){L>u~EG#(NJb0}G-_8hEIZ5^{q;1|@u6qA@m&MZG
zQ()|9%(|J?caVnZvh$~K_YM?EM$zfbVW<!5zhjIE>%yT?XeEC8O-s9S(MU;2Gd^g8
z36-^wfi{MPM<sKvl9#bfIn&ZN!tV9c1C6nafQ>WLQ1-pHdpb|Z65)@{3OIA7PCRpP
zzT}&v9>37M_Gzd(y+sSgK#=Ihi4eMuEZYNS{|G{Jc91{!$^?s6S~Aj^F8{;K_K5zM
zZ(~<-rDAtZ_$OCtyRnM(%ePPJEFdQ8U1J^5W}wlFc6d_-4G<w}E1v{g^#vcf5-lHW
z4tAdF-X9a!=+bg<3d-E5@K1DEmKQ%`{|`5FsM2=d-r~+E^_UX{a~>h6^jPNZbK%Kh
zdSL%w1EsWO>$mNBoBZ!Qsae8N`|m(0>f~)4XliO3z6y~ucr-m+?&8=UZs*3j&YZjF
z{jmu(865}CGJ|Nrjo!5N$JedrB+wlGBq5z!lHyPq{QDV?#_YaY=V8%jv;RG<<048^
zr&eRM<+s;g#Ac9S79R0?P+=?A6=_th^&x74X~UMl<g&0sNV0#Jn-iar+{F2>jM|WG
z1ANH&I+uFXHD!!c3#dK?#5cfetBH<qVt8mSdM*hQ6zcyUGNkhFMMhQRbpfxceWGg9
z@m+88&C}XJ?>utDLf!9wE!+`%!sibg>YyVo+o~EZ_W5mIS0w`7HoKcqhBazDsCoIO
z<<>xr<`n!v!qS)f*rv+QEsBZpxjyc-ROBDymd;i>Qq`}7fB(Ks@o6W=qvcWdMKY<0
zX12Tk7SO$&Q~N|h=BGX64tAD||D!3K{E+`?iJt#2e%9tWjDr5*-%VCW<VQ6q%)*Ct
zewmGuhy{h8JxIfURPh0^oh6a_KMMB1J28=)ZQJ?x4r<`eu$?8v^yEMODEWyKcl<3^
zx;Y)WAm~WtUw{9FE&K(Ke;S1R|1`(+|Mp37O#Peq*kvs$*J>dh#{~B2e^eGK74I?Q
zYVuX;{3SQXi{GiEbLY4GPWs)(3IBV(v;WDtuRNRol`HN)`}9X?ure}SD3t4pb8udi
z+bo6Yn%*qQDS>;WP=e`{f*QW}Fpj3F*VjvXuh@O$$N;VdK*j0-o*~nu68mir&ZyKo
z8<mi~&2wwm+FRbUqPZBVuR5lMMQNmkXN3=4J1}M9=DZXWq64mvgG%)JlVef#PL&%X
zF@UhD+!U#lN#Q@O)vFCUsj-0ImAsF}OMmWf-ml!fCB-=?Q|CgM#rK`XSX}v**!)s*
z_w)9;;EbXHiHTOqx^G_JEv`xhJ@S2@R2QPw_Ha_t%)Q5FgyDORQxps&@2M9>k3pX-
zQn)dFBd{emo&nc!uD?K-44}CL7FOd)t%tJ>?akJGf}0Q41GP@8Q**^U4<DGQCjV7O
zpM$>PhZ0(hi!1e&<I{QHsTYh3v_MX?7y7T1-S>}9ORpwBvS{4-^`H^I$aXwEs&msT
z`1x%ZI_6I<Xp3-Ckto}5*sO@ZgR*kVFr4N(B786vDbJTLUqt+ez<d5quIjAC8Q}3<
z*08fF+U$J+55t3<_xTtc6k#qz8wvt>0#hu5^*isu|BfH|<Y#iL)@|6(@pqofMM|~I
zrV{c(I@>Bm707wo<{g~;gHnPHP>=vhD{gJ<v<x!7Ke17e&uwWUZbLIc08pA?uB;{E
zT<Tgd<k0df&26U~vunsRV6u~g<-@G#oM!m8VtTB25S|KU(syBhQP`PZ>VNLs4b%ss
zv>y_qa$6XpxxG2P{+jDHl}t<JOCr4V#8BMP&4*PO?_Ym@2Y)%EAj0s{t*ZY{h9yi+
z5N=pm$xJ6~XGQ5|V}seT^Zvq%R$o7#t9(#;4|hN~8^|sauYR(-{cM2tJM5vZ3b1SR
zVd}DbQF8eouU8lkS!MMp*>&1pM<J;?LIN|6)|zLf9GGBZQmT97U67%fE0e>pS3d0{
z!0%;cZBR44ttez}1(=%b_QK)vl0Jo9J7nbySCg>T)&~BgatTDTlGLK;augI$14BYW
zM#2pH$jk&hEIgyg&O_%44iBM3f|NwAQ_4#j*Jey=Rn#3nYF^MsgJ?QsA3Qc34ipr@
z9*N&8ar*DXDrRE{q-Ov6>%vTxd)vuD($QMEl5>4^*I$ILsz5587}-TJ2D-YRlc$au
zqwc<b=?|bm`Q4ti!r?~<Ff1pF=gjbjVLh=qIvHi&`Vt4Au#$Y>Yrjkp2Z#K6rIm@p
zGW4{E-JN=OyXSp#71M;?ZN?UL`hi(}Y>G$R-98{?9y}x58M7CeKKQin!R^ULaStXX
z2?r+4Ugjon0-@iMXJ3)}w<7h^Q04}>!(vp45d)o=DuisWorQaT%-lGs=v$@xzy5<f
z>*fgG(rr2h29B<#pTalauyZ;4q^Jl6_pc!9bAKmOE^yE`mOJGa<BouU4ROaMN;DK<
zPD`cleYu;=^>HPSrH&9H9pz*Y%beR5xOC&Ckrs8^RF3?GS?QH4S0h66US-t{*>>?I
zW2U?+2RS_#PYj5w&g~mwJQ~^>HC0y2j~|evG^dc__Qf?Uky5M8_-l{u-OG8kwhtXH
zR~Xr-LPP!tA0sq$V*K8f6~==S3sYq>jGQ4CZQHXeDAXq0M_vf^?nUJn->_j9ZV)~S
zQa+U`XW<q&D26-XmFhp$Z2I)+_8vOJrnMQ17`Lq1B0RKH{G|SG@l$@2aYNLe&iFA?
zM>1_1M79<0G4CV7o=?L=%rF%n@lVQXZmMn~7ADl5RbMl<T<rRppxSSANnsnxC+{NM
zuEeP_lHmz}*p}0yMkZbOGypS;O3;{ze<$-LtLk5XGu=cQ_bGpW%>OdQc>xZpjqFEg
zg<f<&tm#FbbO%0bK?&65>A3XSt33Z&QkuDP{O<TVv<4eW$2EKpXsa@3`^@UU;rliq
zqdL3uv=Z)v{TVJXyS;kLxwYYpX~EeXcqw@$wCaq&qf7U3vdw(sI(z|4F>#z#E<THJ
zM%V%x<JvW=^;_`$#bG4^TL7IYxV9j(NrVe6or^?~TWraa`!s8f!q^FzsDnb55piW|
z?N{OvqyBZBfSrOObiDT8K0IWkq4$rrw0CbO&OX4iuCgW2BkdRX`1)?U^V?V4uzW;p
zAsDt^*UzXq3-`e?l*o7x{1R624-nW?R5#G%In3yC+}@yJl}Y_sw@xt2Ra?KPYb0SX
zOy}{97JN^ut<~}7#3eOCD9do|e)Q?UCeATXAYp8VO27{Zz%g{f#E&D{sudAF%;Esj
zlR@7c=H~sL=X!iXTDll1aG}8@*CX@fA;ajmUlpf@)q}bLaJRi5lJV@7?vMerd4IXC
zVz};PKDz&vy3p)#7+XF|(h*K}mlu3PcWX`9HfHhGJATj^K~=E0_=B#$a{6tNj++{F
zmQ<H4s<={G3+g?fD(2<a-mMMk5&hF0#EAzGJy-PJ1$UJAz2VBMTkg8vT}@*vj_r;z
zr3`JuuCBrh1x#+%@K1WRT#)@q%O%I@jGtd*<xuzGjP}eP&Yns<f}e3|H`z*iU&76-
z1c7LEy|{yXgvzxtmmU-3sg=H3MP!|wep}Wm>~nq)!)-7u@pI7eILSdN!c;|=pSgSv
zJZf*1)7^wQ1u5&LpFdmB_PWiZw5IQOL00XsPq4E)2=0cx^YY{`gB5N4N=5TOBrf6g
zu9ZwQBpRZSItkq1sn-m_7!2?jkJ>C-9uc)?56$ekp22;BMFJOHrp)*@(v{Nj{_-6<
zcn{=h#bw3UHXVAzgi(gn0k4{`Bn;30YOdDe)#D+jdx73xQ~m8vI&>ye+4t7o#Dqhb
zXEhXTu+=hMHe^8Zo)=P^DV&Karn7{2f!cAU&ALqjo~13X02ko+E+Yexo6?!DCf15x
z=16R_JnCfRtONG6jxszO9{60S)H>R}cj6{4UypA%F;cDgN&Ky@yaXO+Xoe%vayUTc
zJr^OMyX@@pUSX{E)z^2p>?a4yA;X4M61yi{XN}v8KMMa+mLqi#4e9~hGgRxI%uq>p
zA2H9UTCj&_y&h*iP+hqFKz9Spgf$9yI|Ed(#zVJC%<s_jfwo=^e9gjZ0gKX$!B))a
z!>Oel2ZkcElA{SKa*6-lXFw)%(WuQhCH?+g&JVTZ^^HH|w<<YaRykNG8UI|_#Is|t
zo>_-Y$%aVBqT5Q{F?P-?o%G~>!SZv9s`C?zF_i>LyXrX1s$^01KOt0S+H3xr{5EPo
z($%j~U$$wOCfvv(#ma5r?xWF8j=_b2%Y7V!oo3<<u)^Ths+gm58n+^l_`7rY|0sU=
z-~?-uSVhOC+~YsBV0n82y+EjA)8Gx8c0{lHu2-_%TKSUhnC;n@Z6CjKJ3gb6V=nx%
zZw>{oi$QTgJqtSMTcNB5$&H-~=gS|hjJO~`XEiu!7&QwHBGgy`4c|$^HTqOQKy>qI
zPy;S-G&e!Prz?XN3IUOncs$u-1$9y8E=;b;`0cWzV>Lw%RYNjtN35pJCH=3!_&}{f
zS<JQa@aa<~|BhRS2Q+S?T!YLb2r?UQ{TvzE7RykOIj*G+>qUPrwJsmUhhvAiA~SkF
z#ixFJ3NXBKNye;t0s7H$Ecy>K)z;yId}Fel?~|xGK9CD?bCFkYFb-5S^MYScv68(K
zo}5$3f!XlRPb&S`&tPJ2-K6Am9Yq(=G*!+*r&*E(_gr(wU@<N`IO8CDegQNA;vgW_
z&74cJ)pKH+vQ{^Bi+e%|1GCLfW6uDI2F|@}4ENNh%DfD~k_|e5K%;MLdj;D`u%o7Y
zC@Uj|l^g;lxC9?C*I`Quf)axmXhkpiZnKw%Q_yqh%SX{z;0V1536@CuY8rP|QRG&^
z_<=)FQX{Wjm^kY?&Mx!^IjKEE_LkqFa8nP^I3;o!9-bcOW-w<#!#FvM<na}H4womU
zf4vjl1L9qj$EA4P204o{L4Sm;by-+suoxcl?9L#s`F3Lz4wt<vEtQm(maY;*_z@#U
z5Pn)9`3qtdqwMCAEfP^nfA%u(LJ|u_YXp%{GiK<d+<yA>DgBCJ&0*#xy^Y~r#C3&4
z5_IVj>3x*{g)}ZApV#8~LdmRIuuf4`rxIhu{C%+)XW9!UM4#==eIe4#gRDPZ&LmAR
zZXiGjb55ov2vc70x^>b%E_E?wA@EPu!B2#Wy8HNy(z&aVe)SLjf;%?S5_svp!Bs(p
z+V>cFZ8bOl%_wf!$`OPsbSwEqe$u2@v=0pMnVCdQi{H)-?&J<Npi+yRJZHSXAgAQs
z&bAV(`B?-+?AZ(qaT&bFY<R+i{xUNsemu-9`||VX*fK}%<5y6T;J_$?U2~tfJo;-A
zul#Cw_?(A-o%C5gML75~T1kX3DduYH@d_1#G(N(34R3oABAI3@GA?>Cy>J%{>-I;C
zjI|W&c6s+3sT!eXHC>f*qAXbYOmE#h`EDA|Gv$B#tpu$VPsIDo88iL4%VBU*d4Fqc
zRLx6s9DKoZbJ+6HEW!N{jD=MoZS0i-HZ{2yGdfd276hn4_2YYHwrF}ao=zGKOur&U
zVd~WFcs>IEzNwxX=IAi8p`T4iP|$nsdY(spZmqGPa408;=V5uX>eHtJ^hf-+A8xic
zcU~|YaYkB>BxN|lY+;f7f`2xApfjz_Yt7&h7YY&bLx%adC5v2InjhQ*s()4R5_A9@
z(nEOhFgyzLAiBYxGM}w*`Pq}wI93nU-gM^L*yyf_7Eg{KQ3a^SJkn8+8~czbbR{GN
za+#`<Qh{NUG+U0TNSXea>UniP##U=}-!r1jb&xKCBB(n^Q%#S|rD)JwiWzjp;<JL0
z2d9wd6G!WqHa~FE7w+Vd&aqlHHq{hmbV~;G=F8$2L|%X|ck<-3{Kdm`dk!TY<k9$E
ziBQIv^jrI6cS^=CdYvS0_r-%(tdw7W6}mR2VmmXrI)_0d)Q%DB1=R%HaZ_k7CvZ90
zsEW%*pru>v-Q{Fm!9E>{aET{EqET8}MzAd>1f1J+o=xFHIU<F~AM<^&VfKF5X3f47
ztQyOg!$$Z_Yfsj40Z}DvrLp72!SY%rsc6u$AYirgRytqGlI%yB6H(@Hya?eP;Uyf2
z=n7%G85kJ2*!=k9Te0jE<b_2Fawd9lR<N;`<>)n7J>}o5D9OlZJS21QoWTzc#o3LT
z0YDze&b%TZllxbpHlOverXOsnic$O5BVI%Fw+>Aad_xYm!D1U7EJLG{6+vYSmr335
zQ(AZ0x2ZdZmO)!M2{EZ#j~@PO9^Id7v@ANirBq~6oj6fXP}}{FlS`(K<>(MKZgk>%
zH-KvLeD@DDzkj~|EA+e^h9#uX?Wfee4UAMe&ozk&CG!K$&E*;zd8T6Nb=|ty{8-&`
zX4?=fp=@xnep;pCs+#m_Mn!kIPi1AWrBv$H>uxC<QlmIeS$S<sEbldQ<zY)5q1g&8
z7K$i>qyAgW(_4Fpef2G;mwe+LfGd!g_txt{A^B8Zi{Kj^qVZU}_JY@e-4L=IIFjKS
z)i|&72w_Da5_xtsR}S<jv!yACW|33Tp<@lC5Z;q>*zEY&vX_%z#>B1SDqpzTP#X<z
z=%Xi-)tyWE@ZRIX1k2TLV=U~*LU&e|9J1L#g9m$;i^u$I{j$D4g*=7<SyHmWY)=~0
zz_7QDFVvRo4tw;d-NpI4?1sf>J6u}N7dtOJ*ln4`?_GK=|0VEy@WkG`3vMKz(=&Ke
zTM<<mRrDIQK#J+o#jCX!XopRFG3S>xT>}rFEOu^7`<{Klc5rv?g<t&(>O5PN9k<r(
zP_xVSn*Hg{>*e=2JtLj3Ltchxs8zRNw~obxZ@=*wnrDv~b)|GQ9el*mQu+&F4bS`!
z0x8p!p))O3)1$vvk@NZ%Yv=2`QA0z6WALmr2O6<ZF$Tlci6f+gwwHET1;_A#grM+P
z7z0l{nt6y8qV3k46}}h7w}!ko3FLRNNhujP5s0cp`-N@>NB)tO2FuLPdCad{@Jwm0
z{?vz%W9hLU1@iVF&TS(NJ|yJRRpo;rN3AkQO>HjsZT=%Vx>kGtf<VQPhxTg+Md+yx
z2IYMFcB7QNG~yVo4xKCFi7P8n?Pz%Svd#}Pj48X10#C7@caN2X$Df-P(xx5ZY*TNf
zr+3!Ns|in;NRu=Y19Qm^Z_X;*IbyfnR-}9!UxwAUxH_9H^ZH+}IoxchG;n_t+M&Gj
zXGcr)>7(<bG1=Dgte%B^>qD3DeUrmXfeobUCn@%*er43DPL71;VsysG$7g&LoXI`7
zo(jt&fnYLVy#P%PMn?v94c~NH<h-3+C-mw8FkQI<g@v@x&k$!396TP2YND5!oo*y=
zC9V8b2=wdF&<AooRn~3^DR}uZ5jgDL_HnM9I2+q8M|m}vsYk{SoCkQ&=w`M$;KkCo
zm`6N<=0D?yi-%*>{n+R@@9~*hp)+@8J${TL_!)OwgB)!=_CMkhgO!JTIfY8pY@VC+
z6jE>29<AZV;Q~c8kb9f8-oP*l6999&uyOM8D{baaxs{iv`0KCldyc$RIy0i^2x)}t
zfOcNan>UX#!%0^I*2v+bN3B-^+c<P{kaWJMkeHODSTZDd{HC^LokUC{g4*KxSqD|Z
zD78dox?}CywU^b2+}nCv|Aqw|cvhPcH!|p)qFw&ds{W-dYcq2wa8xdHLlFkWszZJy
z3dFCiw>FIS`xoUJ0#^r3O^@^panItOWAdqrwg(B-dVadGvFv~WV)V>+9?`IGoI}rs
zK6w%64D|Jpp_7&~@{{VQhCz9Wc^OrU#glvH#5L<cVu3~b$YH}o%G}+%ci}!X)Rt_B
z24L}^-h?C5yZ5(-hP-`iXS@>v>yq?0&9RlrgHgoGKH+9Y7#hyS!E4X`>B*x<%^<$!
zS>Ex))?gmuoD;hQT?Fq#Sd0mapJO*~-ej?`XI_Q-v1s$4sZsswY}im+Qv>6C9%SWO
z)pdpU?u{d-g&)t+>hA82&|&4d$;-903>-tP1JP6TB!JeOs}}NRe$REq^EyWioon>>
z@!^!ENdm5*&W7R9f9Ukf5G=u`sb~S5lt1~}MWudw1Y>F9tXcY!TQ#<`F&Mf(99gWY
zDyt{EMD`}s13%}QBvDO>&`7RwfLH^A0`4QOD!Jc&tBpwh3SV5PtthVfgfQf+dbw^s
zqT7d4-8juDzBljBs)C~(dP|A3kLUUG1zey)8G0%A*|Uo)TA4iy69&Oj-jKe2&U4}Q
z1G_xxh@4Wv^$Nev$=JdC#iqYR&X3*T=;+8NsPrF|<vcHAOWR^OH1Zl}k4g+fwRh!6
zgGWZHkj#+n<2>YtYF5wH_ItqkAYS+AH~e$io(JE>D*$hEb?xC?Im3nrM;GvbrYI_^
zU!Oje<riyhqj#I|iMcw8;0-jSR+CS`JxI%AXq~Y#uYfg$9+eVm>Hej9hO1YThW5LF
zyWumVX>!ur3-F<Gp~8^cw^>(5=giTgM|)+8)V`bL7)68}8-E98@Mp-pun>b2z57$u
zb11zE-)Rb_3qQZQwzl@;M?E7Wr`F6IUrod$ui-bcEh%dn8i;rFI(c$qo1eoceM7?}
zeldbYO78GeOBXFdnZqok?Z?pJHdk#>eRDYHP7>0}L-|aL*tS*(hKW|Ifysdje8alA
z4MSwtR?iqU>aBC_!cKu^fGdGH;nWC($ym9C?=mzT>N&Kz7neQFz}$KBP_#PqB}<@6
z%6u8*-31G7QS^EdIF!Kpgxml^!Dot}wZk;*4=#rN_&2g-^8+@ngt?@tse0<fh2zIp
zZrfG`c%){PJ5e@@){HMFIK-?Mxsc#skD)WlShKnPBC8#I^%}}rk9CePLwZ8<)#tZh
zmyq98XXaH^=L0<&>fTrX@X^or8^f8PA5^_cC`>qj5!7&PQ2dDs3hJHY^@Y4sUiI4R
zo0rqBKH@I#D*O7)o9Zc=2jwV`J<!6B1fXLbI+FHEV(~{`yKD@}E6FCGMJbofq~`qd
z?GAhL_DA#=k7|B6nXWmHR`fDlZ*1J8{Y2~HA$@|KeEV8u5AgdJ()G2;_Lh`7v@GBR
zSj{6QS(O;R`0G@|>zi3!w3J~Ud~?yl(rl{9$#2${FzVm`y8qZK24^{6<JVgsAD+9D
z+BEWL=Pf*69wKedqvrB6XCI*5D{VX)aI?9)Fcax_iTlXY^Xbs#eeod?ym|OloX=~L
z*r)I?*z$5O*C}5O4i0|(`ZcAiZDHIb)Us$Pz*afvIN)?%6^EXM+O~Dema9=h>WnJ0
zK2y|_H_O3dCakR6e7vpw<;<kK$qD!tuGq}cg^<iJ{Nh6wiueBQ6Ib~l&RLYXy1SOv
zQ>1`wQ|C99h&0cFeh>%+nU1Rg!4Z^1!lOx9DqN>LDZUQMI+i8-fbLX&DK0LiK9iv;
zM<x|+J{zHoI4}_q>{0$a5{J)g1)cI9dE`B3Xo(?28m(DlnxS@s8W|;WYwJGFW6mc?
zQB)7kev&(PUMt!6sXB)G`y(Wj+*>gvBku^B7Q&DX8>093=+Wc;-MgQc6;^7VN8pF)
zjSIvmx+0D;MrRN<$_t_c(mm6T)RA{qi+YJu%{tF=*RF5uBE3En*4$HDp{{-hzD*iE
z7>0qw<^oY9SQlh-@|bj9fsrDH>fF|AFs1z&3_#|Ivb00SoECHh0TG8gW$HviHi!}P
z{;ZPKRcDZKUII{xeYXf_mx#^3$6rSDv$w14PnCzJoc-%BDkvK$JVGS`sKQ$3*p3|b
zCmn!p{sI$*av18J1>-e~(#wxdIB;9tMstaYNii1`<2)TY_xT(nvvEW)NptcG%2-uW
z(d&G`Dn;szY<d)g4HLgmDcfbwHs>e>46$x_O>D<4$_EEu*x7n5l*2TQb2oNI(p@EX
zaY8r<H7Rzq0u)7SE3Z*{^S-M}GCHU)ge3&ZkHN_HYOtO_re*Kw*uQ^&ElthF@81&~
zzs?Bx!Y4Dkva&vGqwotcHm)u!3pQ+Hdq}0|8(KSDoLQZq_6pd`7`q&}<@VC?X%=eD
ze>S}87_NV`zTUptFr}K=E~{qIqPyj*{6d>&&EeDz9f6XN*A`_E|GS$Ry*x5$l~Wn>
z&F6Wh&i++Ov!iWwX3zk-PV>A7289jxSVp^RUSD<HKRirFcB=J+DQMEb)<Q$r8CG4<
z!(BVK4@#=lgkehCbBlQ5)J)?b@*o2%>pP0g(nTFz?!y;V#ya{`urFS$!D@SoQ9Wk+
z_*hO5LL3s-Quo%?H^x3y<%Y5DydsuT134)xXVsdbM;ufIx<4qTx6>O)q<i-!g@;?4
znU#__&n(2wx{2G7CFqP)yyeW4J<iTO*;3uQeICQ&63DlzB4;TK-(@{@woI7>>BP>C
zDI4w-BPso{oUiI1Fqo>*O}8O58qM96&)h~A3q|B8H{0&vK1TOIxH;i-yHxGpA5Qs|
zn7DS%6C&8js>{lX9}%!wHko2*N`YFKfpypFyX_w=4XBYxH7m9K*pgeQ7f4B5%oI9&
zaC_R;*`Ylgo>isAUEF$Y*T)rlHQak5$`iQ)So(^#Ett6&MQzLrp`qlqqCW|8$!(Vw
z&oNF84Y46`7>s(>TmHO3-nWty6D<mT{rrSoWL6V*QT+NoihdsM?y_RG5~waa(!q#*
z%hzk@SCZwrFPa%R)h<vH52<`vg^rVytXB9%o46vXFHRvy2@z~s^ACduR<?xBl6s5w
z2Bd7;mb)H;BL`j@Gh*51+K=lv#4&ksVyq;JeSz~(>_01xxO>Jsiyj{g^(#WcH0BzG
zZ!unJD(?HZ{PKWBF<4C)HWaOYUUEe*zp%E)RF%_4>(;MNrFi6)oD|22MeAW>8(IB2
zsg6MsK?A|p8-#U37YhfpbJrsR23huy2lK#W&Jj)#7$1tT{rmQT_}#v92WyJy8*d(j
z9Y9Ez9GL_w?3CR>g9Pd&WE*-@THmj0bUq3}eE03cy;Oc~oUo2jHT5jK#B2RZ|C*$e
zjiW4zB1GJ3uNEw|#XZO<D&9z%JnALa7xFCWU-C-ircA-)Qf}@~`CX5Rmzid1W75ZI
z9b;g0g>7Kkbj2^_zkSnHJ>=LII0$t{6#wNj*EUW$>-n^BmGRBum3=B?d6&FVuHyVN
zA-eiAo`vLk>OO~*r)#jwdswCT-oAcFU^XWuCjI~dynlcEgbA2;{01`%5DnjzuClr(
zS)bNtXZ=a$bho1R%dy}W0??(aHSyFc!fTa9|Db(yAC_*Rh(5F*OZjJ?7;)&;6P1Jc
z>M0ISsy+Rd=r5K(Oz_Ouo>Csor%P5=FNo>ct=qou);)XlAbNUfQRtDiy80LL+avwf
z^=SwjCyE-iy@klVaAdvL9Ny|->$ET~Cg?LZ)oJGkGtIYO+aqBbX58Vi6N~AB+xrgX
z+Z@aR$~JNjZu73>h!D-wjCC6J!ig{`YW#igE;t<cpR&LI6wR0cRRZVwC0PndN!(AO
z=crRy96EGJWcR_R_3to)m%3LZ8+=M}bX&Y=(FqyF3K~eCnU<&18ooa_f-$)sFsn+-
ze>XK!m<J^*wU?n|SHFv9ZxjY0J3J8hMG&!p_b7SbzD%AnMPsD4+I6MQ+E3>M$`?ry
z*Gh{C64+*D;k>`X*+tEw`dM+!QHz!B(}##x6gL&_*nw{61MaqeQFuAbuS-iOrR<<S
zsFV2TU2d-an;+PvOJAz?|Be2r1A)Z7yu8202X6G~Q?|&)a%i+RA!}uOBAsjxSpRV@
z<~VhhLpNU^so?kVrbEs~>S@-7zKmRvFjyt6Y?+T4|EsT}Cja4F%(^Y=Gc%_yxmOd~
z+F@O1^<_%`BX)D-8q2Pa_LeVndvnsxPbzrf_I@Qs+dax|>OEU0J3ullJ*jxz{q4Vm
zyZM;eI!pza+5PoNQ&CC#*7L(XoQ~@taHt77KD8OP5TK83>eu@uf?Q>F0Kqm|P54+{
zJ&$Tds1Ih(o{a_xL(5tcbQ-y&Vgu*+u2J#%+_2>+1x|P?lk*eO3b)Ix*Uz0hmk}qc
zCagm6X1S<^M*=*7_*Moc&SNHAS@|afwd5w;mg|K)k7LDMC0%Bpnc1aycS-Dz+JxCB
zegtJ7KVHocxnqeW_kbK#<z=t5Nso)GpK=sn8aaIY@03O1x8}4ZWxsiYe~1MW6K0x@
z^uCnFy33X?f3Bbqn8lV*g;kEKCg2h5g?8A;muA`CR@7{WYHmY&Gi`sfeS@RlCk#a2
z&~|(8aL>6}2Jr{4kKm~`V$dw6XtZO`*WXSmN>!Ya+h80M?qmIs{F2=y$VpId2L|3M
zFG@B2&hbl<N3f<}SX~i4sbXT@&}isj#kcobZoCxSezR-;C%9Khj3VoeJB`w3Mqq|~
zBga|>i~yKtzQMaNXJ{AsV=wbY_@-oqXUN~=yJwDYuDWvG<i%+YUct|PvDc(P*?QOn
z5x-`e_|6rcfaQ)kD1$@%ox+%?HCCKiV*0>7>)2>0Iw0@ggug@Ft@0H8`SWiID?P*`
zxKS-#x)j`_K_$}S+eW(7<c**8x^6L^gX}f%8@W8f;zx4)L+@!8r&D369wiotFGXS2
zsRSAQ{Ft8EQs*(B*xHxE|Ge)ZH(~5pi@plmUn~1{Jat`p^J;L@3*=8=^C$i-QZd7q
zcYI&(yiRT$Q$;E|W?z`rWDTEra7Xj1PzrkL(Fl{YW?~2O$Bssl*Yzq@CCL1mkbeF9
zyTDCjs=YHUul@&dIQlM1o33AWGH4TTm_Ltcc3!pWM2{?$Qm<zvv^=C}i%Do2CBMj)
zV#ZAut*NFx=w4`Lil%*XdSx|oi11^k;N3EZax$a#UXQ9}rIhg59J28t=|Bz?GQ+=@
znNfTb4J*+vLc(m-MbPfyi~~MFTB4MH5nn}J%1kR~nn{7Z-#eE&pAv#k`4o%K$Kr>(
zIA`ctIN8$~e2kdqWU<0J(!sQ%)T+3mmL76-=14`WT&%83VEa2aEFYt=Il1ia$>2=k
z*>?Asq@vA^W}PquP74oE@+t1Y66X!-rQ@_8uYK>H?4ji?UsIg6?xV2w&FP^&P`$Su
zQ%3Iz7WEN1pZPM8$AUB?Gy|ls*GL;B+h1+SxQeq|MY-UvH<cXz>9E7mxA-Tn)z!V+
zegK9DzF7pmzc8sz%`H<LnSb*ug(VZJ7dx8B{`GWon+|QiJ)PlS!*@o=8mAStb8l*A
z-Yu6@XWkh0>W}-!Mc2)w=Zfp=p;qHu1wW{JpTVIS)^qDvcNHhh7rGRToekN_Z-3bn
zFHT6eX548BHj8OL^rra1a?5R(+N13Jh{zMIJ7P%2OP;fj1&U=SG-}zlD8zZFS4@=x
zGo1JA3H8Z<O94THR6|HT&CVbpqmNO9^qay6o6VaXT-moHd_&u#(7Pw2c6w)rM*LKb
z*$Ntg?V6^`+V<0uRQ#YQ63IKXshgu!Eyud9DwwWtx$-k<>XiI`?SEC^19$7peUIdz
zIGduz>yM}ERE=N1Nb%qRz3)O-j?3UUnZ?WnaPwO?Oj$vL&_YV=0KhKrIt}TX)H+QG
zKe*h-z^e#9jtDqs;S_N^bm|0^4xecUzce-;pw8uaTzYuAxkY5e;xTGBP+d$j$2Q@*
zBQxD9=p~|C$pa>v#<^0IU2Zqg(aE7CVjau{P&j#4q%E>?Ba5mKZ{S=y9e7Q0du+l$
zBGtqUwavKHt5ZEw>h)!$n)k#q<R`J#L7^|D8eowO7(RU4?M2U5^qsU@ey9o{M|_jm
zdCy)gzH@=~fm%ULzeNj?$3cDbxvVm)3Soyt6R3ET8KzJ0Njz9w$GT!iA>iu%YOSja
z>Ujx5>`^w>)qb`QYNOy8a@O+&mXVh}`q=0rS7Tl?P|W-4umz%!oPe9p9Sf9?N;G|O
zdAXIz_}0Hx#op!Yi@11ke$HjsW6k31yZQX^tux1uKjs{}*ykZIXWR!8_=e8ivxC7y
z{O^)E4|9_by+yzD;L)QsbA(&A;+{2+9czY7)Gc))=vI)d7?WPP?)tc*oEt&^kYn?#
z-`s@3^a1!aAhWq8I5F#M4C~u8$?LXnrAVXJ_!sw>rN&u_B(r59!a738w~~Vzs*Aou
zOFri5sYLjljEstyocixw@-Z$hj@PmeNw`Ws&5{zm4DT_>baX_#UUN!zo%giLxwa3q
z9t!!suQM3YApTJ1!&<d*b~O;Cd`)#-3XW+OI8G6&mBM`}J%8pyMt@OM6JcYj*7=j;
zJE)Q+EF>i*SyNZDu;xo|{q`6$gMu!<O`Tdp)S<#Bk3jqqr>;-@!Xc2SXl(w2X8G00
zMb|?2R?38wpLhgr(9Zdy*TVa0hxHU?l4c|;=s!?|e->|pQz#>&gOr7ElHmf6{?tD}
z|C$JC6R8o}e<kPGy0jFbJ-l=H_e)cyo%ZK#0*8_lIn9*)<H?;nW4V0!Ls~SEaWxWo
zG>tpSjhn#=0|Eki;SAN>e4zDfCU>5G5~c>g3=OmptE6WhM@*MNTrq%<0KmuH4?U`7
zeeMT5K-|ayin2%}=8wdN?aZkN3j>e+p+>X^(3Hyf@nc<u9mLRYLTh<eaZ@4+JE5JF
ztnrSikxoXBMu)X&-aaSzE!-75++j4(ww_dJL6~*P&MzqcgaVY-!^eUuU`wINsjP<i
z9W*Q8+_|mGOqbocK&4cUuV#J|0;ElX?nfuFDp5Y)=|{bg<+!xBBJMwYxSK;OK&fPn
z2aVZl#sC;Um=MisoTC_)#Eq}9=SLj(1F;$+LsGkmm6Qbc689g8<-dgO4bQM{4!%__
z$kMF65vuO`Inx#FIiWjvS9HF|dlfu~ve4l%r$*$DxVxuuKMhLkWxl4e>=ZVKR;RIL
zU2^vPZySWet-9%N^71*0zDA|gycj#1B?4kvVE-Iv!INJwwROa$I4t7bH^OsQO87}7
z_BylKc+N=Ysu&S>Hs%59T!~+~!Ax%(@6tE5;OUBjk$Q=)QPC-XXfdY`4k-eOYLEKY
z2Q2tR>JayU%xMv%vxjs?sq2rxMe`Qzgg{ufzO)9tD^YCnz-ynHV47V7v~;~2HQHUJ
z1*Th|onLkxPwYm!oLA1#=$DAg2BkO{L~K1K^HxH7+Wak&rUmfri<?1qKex^jr<IF)
z<*FY~HPPTW*l7$?Bb%Ogz$X;3m1V7Z*MX1IL_{h9w~A+-acY0Eyf0pQ@H+2U)yauM
zi1p_HU9eZL1@a2^^yX97UL&8~7Hc=H_=*kVTAo&Soj;@U=Sv2k@`qo&m+X1p=;Ldn
z`_>9_ySrOUP0q5Ft@QJiiXKzb@ob>{zBKQfJNveWM^#JpxMua*^tb7*a)lnRFTaco
z^+b2tVfj5f+btn!l>V!j7Y`>rDJx7+_CEA4JzIWK#Gc5Tk=O04`{l^}`N+dt=}76c
z)(QK<H~yx0NGj1QX5H_{Eq_10aJ$DFxwvy3GSh$FI(>9f@tVhbG>)f@J5y;Kk>KRu
zq@TJpreNsJelKsCY#uo0o2{AcRAmME;&bVaqkW%hOS}zD$d24{ZOY>w*KaGi%ckyq
zr?k{&Syk31mG|xaD<dtd-mZg|-`Qz(QU7;{^|b#QeD#0+=>I$%(c*XM^1sEJxZSZ6
zh{(<^wnTXj`wMp{@5indL!)OaPVIeTOIl^5_PddJWszSbo?p)zHq6=1N9kxx%(~G^
znZ?)Jd@j!39pm9TdQg?NP5Q^c9otLX-^dLMN(zd6=^o@{+polA^NDjdCR?1Z4)vCQ
z6L<5<>_+`hFLHA?4|(dFK`!*}hwnlYl&=7S5EvQ6?RS?{X!yFR^d#_pVY^l5X+Fxy
zL80VDrDT9nHPbAzc~fvL&MLn&*iWOrSzv+O?to8g_F`tpTyVzd-TnJ}a=-~Tx=Z^f
z7XUY+kiWy0p9KgrB?IW6Qo4L#&=*GZA~mj3*u&927NT2DjEVWWEwP)g6$5dtxnJ*+
z5qk3cdGhS*Xi?W=#sI0Y(dyHc6~9fHvOi}uDx$e_Tj3T1E5>TJG!D*wOviog+73Ey
zl{9!w1aABwuA+v?hQ~4Qw6s$*t~=QSK8@V_;gra^lfx>wnQQ6-&{D5Yd-I$ba1f1p
zl)@hVPQ}~~D9@nY-UCv4%!2F$BgYvR1^cL+z3p757ASwVYGl7DTWsb71=a7fV31RQ
zr(icB+#hZ$W+$f$^^s5tZ(_tC^P#WI%usq58gKq{)knYx7vPTe*i%ss?%G>IBJ%3h
zn1mfB6}5r}(4?VmXq<z;w@BNaH+k}^wl{}&`gwmB86mTxztICa=II$w>lK_#I^q2t
zYInwtcMEB)@$yk?`f!E;>@|acnFG~>tu^}!+lx^Q%6E45Y#qL{?d&x{5P=tyfpZ-+
zpMSVTYc=!W0ExlEQNs_P`G-OnG3g9fuEcPuGAd#Ug0I+a!!3FP;~uRB>7RLvZWlig
z{!rGZ_fas0y{7V~XLJ!!Hyv}@4lj@}iOHbOA#*f+Yd@&L;{OQtDjrz2?^0(j*S}yV
z3n_6pDfgI8K&wH2H>d5Ub_{qcJkUle=4VnG>h~!^#;dBDJoZb^!XWAgOZ6)g^>ANI
z*zZXh2#~OT{i~<jasVM3T8LuV4+p=ZR^_SMw+CZXO8t<H>9`xKsL$L)QKE0ogdiCm
zl;^z03*#S-Uo}X|j4IvrI-y|U4_{D1`7?c9Xg);Zt)c_WwsYCGOb>Go&Qef#epmro
zPl$IjYd=mnYJU-$?%&g*>}fLa#>67xHkSGo-cd7JMN%xTQ+|K?rev%$H&U#HRBNen
z=^G%Ez@urorN0G?^iC4%U~P=4Ahx7a+fEH1-A|=JxlQ_Z^V2I3<^5JEp6hKlZF85=
zG^M>Wl9P=-QunyHxJXVPlYDL>EQ}Qret7^<xRHgt`)hPZimAI#fBf^W2jxGQG-}jM
zqmT8v4M+M}b*ZSO5zww0U+);6#p4Zq9G+E~3UP9&WcHWAdOMjIH>bQu8=SYi7`m5?
zj><fDS*9v>c6NICFBNdEoi^>+$yw1A`fsfolhecFL24>bm@gxBsdp;Pkn9F+`Q7o|
zoa1$3vmI2PTdogDu&TDIt7vfbt+e0&lx96qGxL^8L3tiOWP6mIF;gFzgV|rK>XKi0
zA#F>8=uxWTZZjx)iK0x=#NE#Eu{w46$22*|BrFd7@rQ1UYrW(1B+V?7H~Xl5AZvMh
zOR6_IOREo&vda!!I(m1D#EAty2_+W}XK$a}oYK}~T9*Rl97gXr?N!9*Nvdz1=Q&{h
zj5A9$@Ak`iRwl8?TxoEd?6jWzOTNiP@8P+1-X78w5sBT82b}g>kVWTXXJ`HCEzH!n
zRa(9~9Ubu{)r6PwgBdOxjQz8#IrQGWulwA`^aD?p`;MP7Hg3hQIwqe_Oiq@2!ePh(
zsBd6^)XN^1eBQ_5fJ@=UQcxS)nMKv>Yh!*pi@N?~$2RRM&KagK`YxWwj`ix_U+Hp&
z{1dSRYI4g+&vN=+6M4>dVVeAIYX7+<FJD5Z4y{WyN_XgI@04%19G<dn{!o)4%65gR
zCVY~Rt<mjK`G^Xm3za^|po_kA(;-=>%BmV3(wgW31%-DqA#(av08Wun+pX%t9BCxe
zk$bKzRXGbJ55kbOH~4~gGjd0iZ+Tq+Wb;b$$|R1Zg@p-H47i)s2bDY4+b+GV&db)+
z+xPj|X!lCp{DU_b$cOD$zdtK0#`<>l3|MvcE8+*Ld;jLgxRta{*o&8P)C!FETjHR}
z`N-JiMX$w6HzJtIzjMLQXGwo2kt76CVeTG)MCCcLBl62XFx7v}fF`}Y**Y)9)l+8n
z8&qZ(Y&?5%>u}R)5DaFwq6-Pbz*Gr4WEd=;TWxPU=*GDGcz2Y!FBt{LPMk;umyu}F
zNym{!dFpP?gM8h0zxN#RZ0OU&J)&O%DhXyimz(8{h*!4(kzX^Qbez#HX9$o%SV#v7
z86oquztw#Rl*5;YGjcBh_N61jg0!UVQm|K;=H&3xGM-(Y9k}&aMU}vZIBo=!8x$z2
zMbpKfBkTUe-69N2b>9z81ZLHiz`v4<CEf}sQKCAxoq-M>s{9;<$ijX2PNHdw-Tp>J
z@gNAZa9rv4%P-Gz?{k|>Y7{ULASBoIbJ0=bm9fHLuViz|=Uu_pzJ;leWS-${B=R}O
z=cY98K{`qPb3FRlcDbQO8|+LUaQoB6W?-<PXmhP#w&D>X%0l<BDCD&8krE<dI))42
zJHT!!ploMx2@1756#u##LaJsIaA}UUCK5vxt!1WdJeYR7i?E3S9@3L0%~3<?jXh_y
zcokz|F@F-FPw^1CmUhhqM%l(ocU?6|Q7w0@A>r~Ez|Q<rM0+oh(p1~Q1f7YjubPW6
zLNQ|cdMs#sUyk+hu5nF})s2SOpT$gS2Ou>!z$2qAe~4Bp#8DvUigte<I~HT0JSWRt
z1ZRO2DJv;CLSqux)w67<bTgIskmnut8#Dph^2$<p;1PP`6H!^sG{|kT;SRIvfKAFa
zLCSDtd(@s!PrP(sSDrpS9sM+5zvO9CxBXNyB2CkEruQR|(Jd7}k{=B_EgcpbN~(8H
zdoLZs*rdwnjC7EM@vWbZHYeUr1wwGJoFjE?w7<gPj!QF+_v$#lT|48trl0rN3p?a2
zmw%n5<-ST<WoFKiMR&T(?@p83ExDwBmiM8&E=D%<m);o=_L<~ljsU%w%E+|rSLJ_2
zZHz<>-;i&z$+fI5wJ^0X<DB%aZi9B!`DGA<_iBL5lbIVzvWDjU8J6C(K7@Z!&S(Cu
zS)L#9#B-M^T2_}fumWXqyWOwT4yydnZhK?0sY~~wef|lBscE;b8tQG!gP_p6Z04Th
z$w^Yq;bRp3QTR{%x4VMtfAw?t|H~gKAAwi`=!Y;RooiQ&YH`NI#JI8``ssrQ7TdPP
zDeYQAnPrIRMi5D`@0Yt}H9?5VZ*24O2=p+gB1rq$TrjG(Z?B<a2Uhfn#-ar@$>~j!
zU5Ly+F3hy&y%12Xogp)t6Cquy#cT!*wyLp)y@?x^OOKH_+LvYYx5L~<QxFRGw(
zF4jQy6r*-EcUNOnTGq&px$^UG6DKM+Z5$>e!%l$y5Z*NrW+l8KX1Fgavk#LPpx2p>
zgUkGHHyCc-3pY3mmE?kt&pJK5Ew;_-kQ5#Mgx(QhjD7u^!n1`>0Xt#*)Z4!D@wc>k
z8TP8G3Ua+8>(?;;qKtN(zWdtcPZh26LvMw@vOdIZCAqwkB#_E!%vBwzdYTh=n`#@j
z6zr0HLO`ywwYVWIZ1`S}W<Jl;-HqM~5cVD7uArtmSci&rARPsLAv{lKgU{GBL9=i9
zFT(wH)Wjucwc3OGS2O%^p+bj41O0+s@@&&K3kwQWljiA=#l#!o3BmrrZYT}xvqdDl
zz$=D|sOQh;1j|Y1B<F*c7F^Gln`)C}de03Nm;g}(@{2Ms!dN7(S}o+bgIkjDe%>&d
z6X|!Lzkt5z?AJ?+!UYYM0k)MG%in<CNhz<PG8tS)f3?c$%#K1{Irng($-KqJOHSdN
zxz;(SQXslLWq-;`DfX9mCnmu=R)_+GufQc9Y+1*fjU1V4QBhf2Tf(2fEnLL%IDD8Q
z!0O$@kd@gBdy|=K&O^n*J-5F2&6_tSJ9m-Qc%7oXGJ6cn;wdpET58=Bu?OP&?xTJc
zAt_IuOoq=B9bGU)GSbGv0y8y28cU$g2&Yg`NQ<PlcePZH_jo{<tG6O++zhwv*4mbT
zMdn2@^>nN*ykfi`<#FNLRUdDAmme1_3~p}yt~Y-E{^iRr_FwAj<2();C92#;nquFL
zo4&fgO8~s4Cs?cn8h-DF5dm)o$%yLAnYt-?QE?qCAdq{(wQv3uq4hUc4c4B%4&e!K
z2+qnIFehbXh8%7D`0@T&rGnShTu?AuqO$73w09_%xED^A-E7P}&<+)7rbCCg?VotX
z?)my&L{khJWFb=`SMI}%qWTLXES1#4!0^hUHL+B{fUmt*A8~bcJ$dpZFGbK89AshP
zNlAUIsWIV-=yA=Zqn(uk!)vXfXYGrfI`)NUdoyUpFqOxj6NS?Vtgz=yEo?3smycZY
zLtIvn<s$q0FQA5lV`){?><V>wb)CMmD)iyp2YMHjcbdY&!{X@nb0tdI!s}a(2gRzj
zmJIr<c_kEWt6A7c&z`-P5dl*!VT+V}Z1)As37F5c4WGShGg35_evK2vv%1)Tq9+_O
zhiAhbg-#aV#H=rh%SS+whuOuH8ea$%=uMOzQ{a=@2j5-&H(-t5-*tKp2y$f}`n|Ac
z6yaN(A>omcf)<9PA;&8{XGP#%C#NM#mNcU6;Phh;qqMB<m~xij7Tp%ODb3j;GVLcs
zk_mhPnPJ1yNQ;Uw`cw6av1Na&5%~w|^;-(mF5AR~v%Zk8wX9u!F6RyuZF*1}Wrm+6
ztMM6#M-Ij!$$kDgFZ_IZYUoGEN0u$T7Z~XWY900G$pu0Avkd4xjR;t0oz%jl<mH6b
z)@zXsISL|n$_oXeA<q})#jM#T4wWxwPDwAUgwgmCXql5FO|}Oo+pZ4}=r>=5cld;d
zS9&!o<X(Nte5kT=7%!2$5k`AnsmLrI_9T5PmV=&8%vp&ZM9d5M{rOKLvPU^Oen%R{
zpNkwDa0Kr3a>(sm+-9bx5SxNOisi{VgUT4$;uGOxTGhWpN%jh?H%4cIC5z!;K?o(<
z(8>WrhMf2IcB1w}5;bYJO@xahbOOOkH-Gxe5lL$8E?8KG*h&j>i^YPT<_ue);j;X~
zBH$Mb%J!RtxKwm%^77#rrSuG>R#w@rGN`e_Hl9Xc_Ut4^gmAl5E?|Mz{AXIH9K(o|
zy|_O(Y`6>7W(2^{m&J@$FwfJ{D7~jnpZ?9DAMUkxAZ+b{xrew&4Y5_-UgzT@ql1ID
z@)5<w_wXT)NP~6EBD3G7wKZVEQ(h~}7TOf<X=2!U{=m||y>}yeJfrGHb+vZwk2fFw
z>^off3%m?0iJOc29=}30!!dn*`WTf#R%VTEGZ0XaAK(x9y|KlN6QyszevKF(|H%K>
zHG_RC-=XK5pSfs(Whr8S;g!FHzM!{={KlSpy6uN}`Mv}H`F=t?eEvM+Q^qM^FGgxt
z6b?J&EJaRf!pqSk3Wt)=w)v`B%Zr}0JNi-U4N=mKVKY6A{gmklEguyd-oR0r2MSNY
z_wBbB$&*7juEod+r$#PLdGYSW^PI-UpxQ5AzaAqNB>V;{0qvEs2EL=M-evYm^|}#b
zT2Row{a#){f%(?0MllvP%<egV<0~dMCpz5JyEfwf=4kPeJBdIOR!Y8w)JGm+VPPR`
zJC-k_6=%Ow_VXhy-_$w>Cz!iQ5PO}R?jztEI~K1N>!zU{vR=a{9LqVKo^-bASz|-L
z{BHp_`F<-#l!sRQ;`<?Ho<zL_bXStU>ir_u9j%foSu?2OHz+U!1M%%fd#L4^N4NCb
zKbI|;vZmw3_J&E$oh3(H55XtonB;c5KE9eG4~|U!H#AJigX?bu2EMBb$V+ew7#^&O
zf`pI{A))0TR&0cVw$3G>^3!5P=C@{N-^fOM)4F(0huowwrSJDxoHD7FG9R};50VS)
zW2uOc6|iV#I~?Yom;DuzYu>l7wcYDbSM}|yyCA0WBu0yCA9o&hdV(p+JwK6T?!cHB
z1)~0(#;(}CyOA4{AyE3uO%y^bPJt7CSGDeug{eGT(m47F_AQ}4P&K$pUsWE^*L}|M
zOca=v6a@K_H0!dv<riRHL!0Bo^Z(dC>cw{vsyvtkWjax=P5g}@`J@$wXXusUEPc^P
ze|6&vGq|F$H=f_h4Sc4pI5wp>@A7RuEcY`QGg*#vg^mX0Qfwf{n)O-k2t|_EG(4v5
zoV0K$_^6~FHc|0hx5^8H*jO2BaTR?a-$Lae=6kH*kyveS-u%Jvz@aDKt+=!C&QWgu
z1|<-4t4t@??EY(V9zimF#A-D!iVf!m<VA>fEZ!!5Z+t696Rp?SQKLqU8@Gif<ef)G
z_Ey`rNYL6PnbAMzZL!}MaU}CSn(tJN{rl&sjT7a_vt+?2v<zl*7v|=EsHySCX$W->
zcQHbUJ5FwH<8Q)pL}CQKAgIc)bAh(%(fi(U?>~i+Q^iHlAy~^1+~Bb3VPj<Ot$*@L
zgc*gE$Yg3ggrl$S(f0lEfoD|16gZc~GaVo+8#%@-T6qqF!R?$JICO^(*WHhE5f6g7
zJevCB?(S{dCFD+0KZZxdS14vaZ8I!d`|(_WSg{B77YN$@486*!J>Z6OL^2(Qu5Q&2
z+oA+U{m@$Bs}Xv5m4ni#23n5|D<{G9UT^<%FJ4e;iHI0&?RVAHZ_w-FK<Rw%sRnE-
zzyq)w$}E7B+#YPwDhIVCh&lNBB-s#Z5s|W$TXx@#dE2kv|N1Ndxl*Ol>E_c`@2r~g
zFC9Uo9+73VW_{M<b>sJYT=_T)mgs~!=}z~%A5a684YSVZX*dFtV0MoAdJsK#1%##%
znD}ymWz(#0P!{k&^YT-{Ind!jMxzz|X8HDeThNcsz-pjrN1Xfp+qdfm9T7+}Nh(#~
z5es1f%O2rlxZcZfmlK>U<5r#%xqp!>k6z)B6$;Il;ZOSkLAk|n$Fa$|)oW^M*d6dq
zyg6g(c7=?%ws>$z#f^dLM$jFdS|?~7k9R+=UT5C9FXKBI+^h1M_Z}Y~1>TF2-GXWZ
ze1ZcwIBW1(I&o&cqE7!qHOR69mipe8CkG7~!sPKQl^^FUM<<+@%tx1JPWYF7=+hg6
zj)iI>L{!@Lay6vc4I4(1`gQ+H&h>@FU|vc?IF&TV|4v())=t$@){@>9vZ>W5uaK<I
z-23eVWKFrv`(5@o3EdewhR~{zF?Z?$N<7NrAAU_}jrf>pYIEtowD;ywJ?H=5zgetP
zj3tuNm?310txzHRUTIe;yEZCXsN~Jq#!|KkZBmxBOC?IOXQV`{P?AbJQnX*UXXZ1X
z>-t{j{Jz)u{mymH_j}Io^VjFo2fdc(>#^P!<EIODj6c@de`@w3XDDgCW-{pI9h<pF
z4OWh_@+03j&_FZYY~ugo6*4UnHWguEoGYhKPD=&-eYfME9C9%0V?vghnfYP-2*`Y_
zCi(y~Y-?(y!lI*vWi=S-0ZTyQQ$?a@i{I#n{{05`vJ}w&DRu@oI1PLzhOxpS$>el@
zUGIu2SfO|!TqjWUaupcf?!66uiN;|wMbbfy;WV>4Qo*a)I=@fhH|M2&B{N)p-YP3z
z#H}L$O2r2-rhj&J_NU!C52V?lzyVQ8AdC}Ga<`nQxMq@iIV{YEiiPP#E5-7_)+uBC
z(S9I>#$ULK9qS4ba{P1prYB!KjhW$cp<Kx;DrERffT=m9u(`{dOBBz%%FMisSL?h}
z0Rc5{-T;phln>&hdxHsb3rk{<Y#EC@a*-w*7K)UsS92}e0`4tyd{(|ZPRlXDrna*Q
z%rxx`I9DnwDnfsU;&spTha-3SR`GFFw!QOmU2Bn2R^J~L5@|m9qUoZhR%yhIpEM~p
zEbP(Z_^&o-wg*n8`Ly*f3;PT)353S-m4&ZXQ<`(A+j>fZEjCAPox0`iAC2cOqHp&{
zpsvv+6Zh_h;cg4g>`uP(;fIN^w8J-!*ca#1(CBXMSC(|pX=%jGPM_dNwCJ@@?k^cP
zAvE)2?!J;t1Cx5Q@Q5RS7*0Ont;E>&AXGgsFQek+ak*?97XSRN%f9{lr`Q+yTTN|a
zbiniw6vxW9v;)S*n67%tP6+1H15DI7a3nyqEp!raKpv*28;1Aj*>f;r6R5F1nIQ89
z9ytD#kM!D%3=HHOPLqblbuF#@GNhI0Tkyc*g9k&GNX^#h<ci$|H6Id$cG*tF&a3@u
zRHteJeXad=`70~74%;6j2F{Ks-SBKPZUGAyFJ`(nvtTpe&hgWx-N3U;@dG?J?0P|l
zMwV*UeDh@F6F1pRjvGv5(gjKxGJmx0i4gq*&E4dU`8fafjXz46LTaGCYHn(JZq^z>
zlR7!XzWqc?Yh85+RKA9hkDW59nf&Z~G+S`pVzO;DlES0XHg^jb+{H>p;PzGSd;amq
zvRRXg891C98sB10fs!jdz*jc#wwZZGKXoe>d9(;bm1@To<P(@iMh9<aWyNwb8QU&&
z_|o&h=@TJtFUcneJm3x;>4t9y9D4=EhDX}Enh>uE<=hXPwqqRE;^MxY_8&r9C9tmE
zX~3~dXWtFDue<BgGed8#kIuc|@uL>`L+VS=lxZxftPES*GAaE}@u5w%Jw_!0zg3v`
zscueBPp6HIPJYvZZ9LnM<(i%pggtunxO}o?ZrqIzZ@(n?_}j2@q{lLY<mTdX75F-w
ze8_YB@lXBr)Oaj{okXa}9uLbd=Omq9UW!EG-tYv@;4IuT8fK0{l<wRWwO+y@Cb!Rc
z!y|kPaaR@=E!jUWNpBb`&r4s)i4%M4fVjG6twtwYtD>`+2GqSs7&mEBmc?fU6tX;X
zA%&<+o(yY8P4Iw==MD$}q-_y-C24p3BQ-jHxDduX*0EGsI|0LDSDRU-vrYD>++8GP
zNcUz22J2pRQ^j$y=8?Lar8hBAkO83$cGurh*;RPOP^Ju^Poaii5bqejpCyyCe8cag
zA0nMX)suRYK7;Z$1Y6K{ZTNQu9QhOL4!#UtwWz~fT}eAyIy%wqb(-FW)Zu%%sGM%T
zvM>%Pa&pv^5`ABoNi>$?VAo(u(la);EbTg=jww|{>G8loiT{f^8C!B|#xg3?pRW7>
z<xJ9<Seya@*PJ}&{O+q1hN|9NQs^cuM)9vSPO4<0@!V&D{tKgOzR6`@#LfKrYn<J7
z+eND3iAKv9=9q?e`;l0RSw;5lI7+-1Qz^u&roQ`y%nUyu-dM6^!8YD>fw#BiVNcJT
zsA^|%&NCOonU+Ct0XAVYzmt^98E4~ddVNbN6D77|s^!tp*;yjAN?-^3n%XMK%gW|c
z%tGL5-?MUPz+ROLqF`jmcp;C&RH6FIFXygY(W`HI@L;||cLizN>sOo5FQ-_k(P`hN
z<(0B{L-Ls&y($He7N@#O1LqJq9X=rtYdM=M^m)oOix%=J2hd~`gCCS)A{2)~?;DO&
zHf;Fz#}llK7mSeC8RDTcFBxJG9Y}hh=E}Xmy<i~<ourSjkT818iT|BZnBnTxL98?p
zIb6K>(dWW}<+Zg@B^S5Fn<@B<yGDx#N$w=Q!_E7dRt4`~>-@7qCG`nQi2AH0;vq#M
z>ub78sSy-2ksd)(Go%U%8E4EqQ7#k%z=*ps0SeLbLzuH)x;y2ys+nNtFeS;FHs5$s
zlR|G^L!1SV06wd^e9GyxuP#dQE9$o^_|z2++48%ue4Gwoqv_^kb+G3YmIeoChQik8
zH1PcixRj2UEj%l*hHMNrW=Mw~4G7rOwqtP%TWSWdrfk>`R4<nPt2x{yB+!e#EA6kp
zo+h*bAQd1hfN5fZV^c0>h)ma*zsCDq{eVYi&Dr1EnmTfkO5z}na*6M+U|6&4)mw0x
zXBg9ADX$7tf9%s?&rEApQ>?do373#tf-V?2Co7LbAk14pFZ$kQ2?!t(gu6f&7^*bn
z?0LSprvNFWw%3Hk`h<j7{yC?`9x1`CuzQr0=0_{PSfY?7W)dO2JHBt;xN&1dW2mI+
zaO<oDXf||h(7T1h5T6nscoIeZ^i<&(Q`Pin><N>CBUYLPex_*$>TIasoBvEcm9;QF
z_p7~j_wL>Ea&yC`6J{_UHt`hOTl;thN-I2O`Gx)hZ&e{AASp31Oyls7DcX^<yU$Y0
zi=uYgj?Z6m*a}nAu!ZsAkmf@R868#YbP|QDAgdac6c<0`QBuf!(;LjAAV;#w*>DxG
z00h$_7!WFk+6x!<kd}_uEE(|acN9tTm)?D{(fx8Tj;WoS;d6`1{EJMMa#w!t=t+4V
z5nz=-rnY>mlbv+^I>^js4V92-D|8O0Ni=m#Bkvb@TZrk^u7RdzLyL4<)HYG=pb2sG
z`0?Py1_4SVMj$9VM>Tja{Z*DNi3pSpO-e^rb9bp_^Uzt(SDdkL=guz9(yIM*Q!)$j
z9z<1V;NZc}(SR8nQ=o%RWX8gwKk`a<_9PT|TTgsRJqN;}12sd132W|A2}8@D407{8
z|B<}ytGtGcttGn|8C<L-3glLOu=dN(&j$$5azay&hzIr{E|BSZK)d1_7+`Q4t6DyD
zl?`}2=hffCgU3v=CtNM$+-%g6y%)t;1vciUUNCotk(G07o_hMHBbBGkt_zcqCpLxO
zb(4ZpvIzXMt*NQ6Z!-XL;cWDW_WPUTMOz-)c(ISo6AE?4fckypCa$BHDlPE78j~QB
z&dyxC(?S+w?jh_Q7=-z3r^%IktP62C>EP@v-MjZtH~>)g#(zk?hQtE7OP+GkKXbFA
zV-=MzV`Ryls83xp_Gy|8WEWi~HVah))sjtV<l-U%A;F_J!BCUWl|$GdH)v4moW1<w
zF8<vpAi}JostRV;zxw%0lirBLq$Ky&ZOz%b(lfQ*jI4W9cz^JERr@L3Jw}8(OsrX<
z80WI4#`8DP>WXgtzy1bF++~+8|Ji2jR)^!}%`r>LCaAgG9jw<7_x_}l%Hz<jhuR7O
zXzk3J6qcTKdu*9}_q(<)^WUcoxu(1S&7a+ttm*MZLZ){4YnoE3-PEwcrTem5KJQ!P
zx8M4(O}&#tmaIjI%9joD2Xo(SnJoY4{|WHbniIVvhv6BUCHMFfA3uEXA<7Ay7nuU%
zZ^5%dH*x{=_T&QB>xu0n2Z8t+mjY&p<%E$diyR0WD#KhD)sR!LH7|s)gcb`uQwz|n
zS5!lPbF9iQOx8rr3{cmyQsM)6o(-s)sdr47JlS-})G<UNbOi(?8$1BQF8boXcI;rz
zikvPK`f)Txl$l~9#47mF!-qZk^ywgYBMX%CI$+0u3+)yL2A{;X9*tD>6d_hMvK278
z!U-XQ@k=?WzllFC^d&oSU#z>0i>4G$tAm2=SOD*-g_gZju5uHL2x6DgJ^E>9=19&i
z<^=)>&*pyz5;kn_LC)8Sg=w3)z0gP{2Vj7@%SK9DF)3;@CBhUcHt<2`JLy(+iB-Sd
zxA+Qo$}Y>v?qFFCJx#cfGM%ri>*W3%>U;ktI$I4NSZ`VAs|6Hyd_0xH2vp5Ol2Ch!
zp-i^wR~U?t*u2!pTu|O`>ZFDb?19sBh2P=r8Ym%wZk3_TW%9#y<PHqWQXRREu9vAq
z7$#=t*_mk<#Y3otGu7}!(mn}A5q0(EeL(0D3UNLeW2`Z5%!KnllnZ5T;qnB2di<R|
zi>@dg?B$s5s|pr+6|yoHQ`K{@7^}Qz11Tdl)w1}`Ubg!u9x*V&sYi`&z7r=e0jGRX
zCs4R|v`5XVM?*kMRt3<}sZ+v?2L#)*!xN}|!IwYnGF!S3NPDyB0J4iz7YT;k%rJZq
z)s?gZrMwy82_iClDMMHMi9|iYcxCD7Uri1KG3D5n;jdO%$BgsIwEDvt^+21Lo^T{D
z#R~nCgXZO~>9VSeCJ&o%UN)ylCJFYAw*S-*?E679PKGjM`;u3$vG##fKoL?RDrZ%P
zV<3X#@OzGt2j~EsF7z#5NmZ9OWPmYT5(CzMd*gFULB^oY$#~EAu|Mh~zxiqD(!8m-
z0I8l$CRQ4@2&~1m4PTXbv5E20r1*~SAV(DZ^MX{S-+X&~iHO(-PGoHzE0IV*ds+O7
zbN7p@HG;~Ash+PxU$8S_wIX#tk6p07Dr#{0P(a;2s*4KatWRVFF>CW3S_B?YtYZ%3
zKzWjzipCo<kJZ?qoGVnW#BN4PamI>rN&jv?9z<}fFl%lMg!i^KUcaom)1{sVR%soV
zDf_m2x-8QamDP51NIiX)-M26@x(ZldP^!dKN%-KwF*B`wxvB8rZ!80U*-$0Xht=cc
zjl|q($WTbRZ>9>y%IQgKTb(2i@Jf5sfi*11)LWn#p#R>E;&ae};EWD1FnRg&^FBA#
zm&5q4chj)RzJvfQmCTEy_l_ncBxKYG?%V@48mF9{MlpVH=a}SWi!u@ecGaDXHo{V9
zD{O4mf+QT!LLwGQo1GLNCr_JB;b3L^SIbI1W#14MK$D}dbc<s-Cul)E8=`Fe?`%iK
zm+4`2)1jzpq7FN>6UoizKO7#`su-Z<q&s2HzP`E7^`k2{H0n+2<he$zy8qTKLD}5k
zs@J}rrVs3Ll7<bqW|5MRqLHhSa<aiL-ZkXNtFV<#h56D?C%T;b_EcH^Jp1&X9h#9v
z>FK>*zIC&&tt(shFg?a>!Cf#GIq@<#bIR@?eJ`^i%`M@S+^wg#I>2^inqFHAO%ftX
zQ<FJFe26HuTpG+2kWdS_KL?si1A}aV0Hy2mb4<+ymZS-fpD|uoD==Qf4bMkJJdP>!
zsn{Mio`H1-9xL*UV3d@~#F0?b9Ko!<ovjwg6&G(IuTP*ote|03E(z%{@r?34=mD7m
zMv5J6baPVgJBTcH@{Y1A+F)F<m1e=SgQA{VYt_R^`yv9p1lf_^h+;(j$>++PCI3Qd
z3UVl9-mqy<_*b^R83gfCaDdR$Uc<C3SLd&xz)G304cU^K$y7G`Inv={1F8nZ%k9+F
z9HC#G`(&i>i~A-rs!qwt#k_=S0y~>_2vj=dV!&<gUK7s|QGFY-uCk1`XbyZsZsv*=
z{>?X|oRp^7&X0lPvkGNOA)X+>QG{#5nDFUSw@MQ9h9&wZ6DMF=*v@q4cBsSd`Uf5l
zO~FT1PhsUb6VIwIqX(O6rQOSf{B}0&0F*_|?NX?gKCA#8%nX4;lV!i7-cR7731i-}
zZg-1;`xv>RtdIyw?9ZvW8j}K+%9NqiT9;He!(0o9NmyUOHtN|Y@M<@&$}&E4pTdjh
z&szmgwSG1n4%@*tVFtykrM=84>cDLW5QMAJ@Hx}v`vlT;T<qpWitY2m5AHC-R1Jw^
z2FNWqRp=QeC@rKSyoQ+&+1P36(uLnApcEP!a^}i>eHPl+-~p@HO<o;*3BX!AhJ8=>
zFrU&XZ(_qyaoF<ClM58npk{<nmEdibtIq??Y|li<@2D)|&HC`aGTdG#?u#er>r>G=
z?{aL;clONc(vDe}2SGo(UFfKzvJ5cv&S|4f7Fum^W-YEc1a;d+6W|K0EZy~s6BBs+
z(Nvr(4a~Eg_ZgQMR|B7QQgeq%N;l?A2+estnO&a$ex2}?aVA&p<>kTujUmWO^$DCG
zZmlh4?G_PJvMJ%!MeE(k8KEBF`+7~*&`2W93F=kE{*Q8RM0UAF|Ldtt6|X*aY`SUf
zC#PXgeLhV|Y0_dr4*c5!8Q597yHyOgjdpR7Q}a~RwCE~5Sdf>=-`RU+#ad-X>?#5C
z#;^sopcZ`PD$X0*JXkqG|FoQ%^_|P4@IU_e1E#Ym&pX*hL2u&Q-@K(Q5Sn>f1Du!o
z&lnu`DCg5_c&aIYR2p2su8NY3Q@tuu^>!VF4v#-Hg)IjJGBZne_r0-M!%YI(Vp4~)
z1I%)@n3Dw7%sn8MeetsD$~xth1O<W0=M2R^`d*Yo)I1^eFZf71pZ^-zV6R$*ry~$)
zn1h@JY8v?E3)fh&Gv-6sCMdh!NrX#LjtoBD<0L&b)WuA<i>JHA5m(G%90@L@YmT9@
z7#{34^TdP6bi#yB63uztoRlXNUo~6ecz*sop&rn)!?keft|_U+L+fI*y=D24#{J{u
zNBZ=Szpy^}#i7HiH~1w4+u7B3V$l{fY)x9Xv#bFBgM?`VGHNd6dv2;XN**$A*c4Q<
z6HfUSUz%(`&e<k?^<?A3Ub+1oRZ<Hp|AFQn{FlXO(Eq(3Ic#9Z=puxzi`Y%=TXRMf
z@>BPtWtjB+>(u`a=r?h}|9S86|NklR1Xlf5fh_+0I<{Eb*jzbenL+C{CF!k0wwb>k
zQ|&?KPET1m_xtfj2jQ+kd`4}(Q9Xo0G_bAGI7Kj{0d=(FH?We>(AeucLFFM{K8Cnq
zNG@_jnpmK92aUT)5<sIx2tXp|HJ!L<v3e&gW*ayv%1m0{u|gNKFydXOU;<FC1{@ni
zJBB=51+!M6`A@w-7ndI%aBBbl1*{j+dIMKsbj%D@6j=Z8an7Dy1;)Fwj_sdFK=4b2
zck$Zb4fghL4@V5GK`!$|tHRcoK_6)z>iHcO3vR^}_K=|dZ{g8kD3HAHK=VTNM-mnZ
zfZM2uk$eck$v&W*&gX4am2I@6i%nCfg8*G+8Bm@I<b#QfJcvAi&KK%m(14J9Zvrdw
zLrLSl`Kwm4cfce|ZT6H*Jz1MEW|KbP0W453iE)a&Xxj`Aq@B9yopK%B@tteh<%yEk
z5=Cl-@Vp|2yV6WlCaqf$GJf3kx5w!avf*T6ttXhoU@xk3Mta^mS^+;n4z`Qh7M5E4
zDs9b8naix<N(mW{4O;4+G$XomEc<ICz4x1&ITUaT=otLYy;V&X<AHkbFG@JzcNMdP
ztKNan4glj$*$Y593UH%MQ^s`NI4h|bK;hCq85m{5z^X!4Iio{K>ZbuM!cP)B9gEI}
zt>(*AccRFBg(ffFb?<fDqnJcn2Ln<%`<EW$Y=)}UWBpH|>Nc)}*DqQ(GqWLs28Gmb
zXX<#;FSCrk0EK%E$Fil~s?%YEsHz&K-Zrher!x9k({@CYg<^!np00&bC3F&tn0N#z
zt{e}ltY-R*?TUW3$XKgZo$c9w9y%8-VjSKcl^_Oy2>P(8Tzc)=p?wo5;Myolop)5R
z)j|bBIL!7(M!UYU3=sWOminq*qT~`MW=z1ajwZH30Ff$@)fAkY8yg&1g;Psp-=HdS
znh$YA$Pg7UjZ4T?pU|**ZxiVKO)sw<V`L5RePKvH>7P`5nT)HfmI|_6gxkCJMfHSz
zkfghFRFvXJH6B0S&o-0Y!G%eOhV34?H`H|tdmUe<A<P2kXXSP$7lbm#vwA5EXs>iT
zMp@8hb>tSegUNJQn=IO1-M#w@tx}9%R+;L&0r9S$Baxa5`DGP{_Mo|bR}T0Kl&+kP
z8%q+7muTxan=>L@w(RT`E;*{&rXEhRL4{4dk;K@~IN9&Vq=Ku7*T2oH(2jusa&?ng
z{P%MTZZs!7m>lNjol}rg<otbvp|*~p|A`al-Wx8<mc#Z2vdu-&h!=ax?Q~1*q;Fik
zdX-u4+9CHbyp8c(lVGf&VVDrLS(L$zVG|;UmAmSm4%@2gZvGN18?uOzp=uM>rF^wn
zvK-7ti)ul?(>UYbIYjo+(HChcgJSNg#JPU=^ttCe$&?@4UM-Jv&0^Q<ADoYBL51mz
zwWIFb-m_APSuTRv!m+B@-PLuTx{B|I$9+*y1~B$r2n0k_O`HzK7-7w5Vq|m@P7K@?
z7hHlCFtwP2^XPc08b<VnM%nBXfzjkDhlJ$E#>VDUqos(%%DLd+-*@lUdRHem<x={f
zsh84|l9E_!r~4Nbk7?}uB68x<(`MMoYFv8o0@EiWrlWfIi2W`gm<g3?ZedRGt|Iub
znArHx@l*CywiYtmXk_7Wz@yV$GX8wJS-CoN7r=UketCT_8>vk<FM;rgP(r2pPe0B4
z&NSeIly$vLC1{V_N#9fE@(!mIgTH6Vp&FIO>iCA-Q((1){+0(r6P<(g{ft@etuVKU
zw|}Ury*lif%uVgh)7JKgj6k=(%sE{(Zw22Fi&KZ@l%k+rAAy+E(@pD|hr?hORUm{j
z+y3nnPkDduiqmW%91egoVbj2#fT4QlTe-aMv5L{M(|oF5vI5(kQ06C?%zz*Va>Ax5
z@mBs2wQ=SX4f8N|+ly!0U&>2;RTj|^Dr(pqeOppe&rAfSrmgSfODSTG29f92F=JvO
zECOcfRgauQ02>j=LV#@yAYVLPSWuCwQ&|U$foPR1?1knHfgX}kFIsw3kWy@oge<P$
zzb$hm`_NQm!T+~^xbjVwT8*I3(buBMP{dqOIK7rPef+q^{RhYxrKn%4(MbyHxN`M?
za_6ADKNsbBgw)j?)Xm!(P$cqTRn6PKP6#~!q4YOlsz-I=gNo*;dcS=x>UCo4a`lBB
zVkw8MbINkkMQovn5B)|c-VSmzuUPtJ%$|cBBo9_fkXf%pRlsg6WO4#FKdkXJ1CU4C
z5!xodP6AP>--Knjpmi|xX&o`cb2S87A+`fvcW(V4L9#LVO0p5D6>PdVRMCz$NFMEq
zI>-2ig{@FPvA<qA(0%VWLZpTzirvd=x}_*pl9C_(t8-yS`S{_(KMoyoM=MQ;{cd`!
z_?r*(7?S6?*+9Qwfl7qOa;yF9H4Ardkd_xxFXYOG&s6sg3|w;+V;$_|W{z5#K5!kI
z5Z|AX6PT&Lo~{#&x2O(CF6@T)^;QV0-%f+UW)SRYP6H{?1)9yJX~?7~?4jStGhP2}
z*LH3w3@%y+O&<8h7i0W|n+g4I`@Q};fF~-ZiJ337q2=|XLP8wzp3^sOIyfdOb1!Kg
zx(;1)jZl10lVB{tk@}28gUaieJT(&0KY|It!NKRx59ecSlUgJtggR+vNVw=Fv@kjv
z%u4Okf!AgC=*^~|UoE&!7MNdfd`SZXF22ces5KbAZ`*?(+mERG4g0Q#wO96~OJm2D
zs4BZGFzhf+KGcx=efn+FUACWA$w;lf|68N`cPhp)3fD_Ia->5)mo2P$sL)`yuzF2u
zYh>MT6ZY%IXef826l_oXmsG*T^0`~H7g<D<!ri_ZKlgE{hnlj>ob3tE6MpVD=ZmIR
z@5UjPdGevUx@L$n7*u<OwMV-Rs*3FCyF32dgxZ*`Zt1H{W5h)id73Zr9i*P{fAlN!
zChCoGY4IFvYEcp~V$JNDDXH5Gs`pu$)QM$mXHeexf3ZX27yPIHyu)JZL*^gIK7*xw
zacGB7Qr@&_Q^S!U$%UAhr|r`^FH;lbuYUw54qghXTXQsz&(O25u&cX&9k_#l#Ph-_
zP_O}+ar>p#`t_xZig4Zu*4Z@U8<zd~<UnL>1?A>Y){+i8Y%r8#khwX3er~ifJI;b|
z$#9QlG0T&#Y_VZFWvLujqVI?5y5{yT4%oO6|Je5qF}%kvAF(7yLLwi_rd9UMYe(gy
zMhm>tS-R$J^<f2Z%O`{$FNJJ8{*r3F6+2{^HV9vt<U!?n3}D!^Gt8`dXmv*N`+*>u
zZb%64^aIbF7BwMLQ9iJc`invIk!_A3v{>X*+JVz*;UnS`iF>-5d<2rbSIX6^joniW
z>!ac}&ziMMZcdsxTKemmj3RjlI{|RGB`#D&Mly+jElSf)g@5zp^n{YXH`0{38n22W
zs4u%<`<=ob#g+hPmAHE1$YUn&@Z9vW8wKRG%Tx?`i`OBfJOJiIdAY5&`_FOf87zVZ
zm~r7rf&1p)*zmwjyiAcp!U9X3{ONnEwI27H4N4BEr4K#<hKhkRri}04oCxwa^&wK7
z&w%emo5Zrc781k6-+dPGK5ag0FR{d!{KLRs1&L5>%~=f-Sf3SmM=Xz-9bUMjr3O#(
zh!xjAhP>LHl?X^mSbKRWdc=SuMLm4^XB88fAZ5r_qsES9%~;3dh61y8Q~f!c1w(`=
z8Y35*X*|(Jz0TY77Pki;rEB-@`vXq1MnJ3?S#_--)%0Aag2J>XKHmyEfTb3(&8%a_
zEx-Jl*gSgNxUG(kExIPdo;C*Gg<~KLM_g7=r6TK{`=K?a<B<+dOZd<Xts1$JI-fLY
z?Nc4Qd<o#CWVl*9XZewzPl5YpG|83Q8WY};tgl_X{;8=#4mk$(Xw+l}2fvrOax?6v
z87wp3&BA2h)4O9ZS^(WZAxJ0yVy0)CBMX*7P!>VXR+Xe0>*@*(Z*sb6%5;NsSB%Ad
z-U>x;edHKGIBd;nNoW8hm3;<-6LWHkb6#+m!BwwDiyawMZ2V)EugV2#S&$z}ORd**
zoTyiAuI{O{4?jXyL)zu5AOH228nQebJKzXh7E9q=RO(TYMQ0el07&ZsW0IB@9vr-e
z{J{YfFC%8l9ER0jaW|jdzyIU#VfOyE^--S+I1KC&f$_i$;nS+xYSX;6rcdCoFgeOd
zs2vsIm9NbrO`V^<{Nnth)ABgaU?V3n0>qEHt+*pMKmU>;vrZ^`sEoC6dopV&2-|yx
zRLF_D&)D&Jy2BMD<y8j{by&myJ*ZzlJvcxDLG0%4Zl=*>GG^>pbHF;>2;eE~S3^c8
zCndG~wY1vL*H_^7+4#GzDEJ8iHZ5R#zIBi!BQ<q_Hyz`GoHABTLLftk6_T~CRbNRX
z15eA@LPYx1X1-#Dc&exrM`(CB{TUa|U9x_I7vjlLCf5SN*st72amF+>Yl%6DpKa)l
zd8k)3x9@`*RXL{O(CA9k8mfBSqehx4=;5lW4X~r$@e;-If8a~5f(d-X^K($x!)|Y9
z{x1}I87&S3A`c@=)$fG0ns^fL*G~BEwlxfrt6*?UHBTU7p+jr|6==&wGN!lD?`JtX
zl*-g<nw3oxi=2-uYR((5k#{K2%gAp`704p>0??4A7mf<>Z@+#SnjPB}q;sy!hCYLR
zK*Hpy2VFQj<7yVT4?$-c&;T1oU;EgP;AB|%qS_@Kg8<r>66^T(EZ-k{3@*7`o%Xk6
zxtf;86E?D{8&NdhyVAm9M?}akqd{sMhvt=>i-xeKqNA6hu|Si28BD0n3b}gKg?pfW
zM(Gv2G3$-o@Z{R^rMic=$l^q3vEZ=mQ-B%>Gnf0lO}ciC$2em6aE|GynK>o8PjvN6
zexMT&($9AhKRLe`4YH_9mo6t*%~~)T9#c}U9zDJknqN;!vh{8R_Hi+R&`N-%zO+<c
zf3faI<{1M9oFBJgT=R@xb636q99tAyc-!Jb5rU%GUFmwyO+J^$3xsU6^jKwyrSeSi
zD!K^)`}0vzb_~e5b|^%E<Jg;l({4-*q_l}<2k26ny(n5BxkstsTN2`5I3|wIzr=F>
zaGFKGiXLcAg2_L5>eP!drkULeUi7Jb)O_9N&~BG)-Rfl3H#eUN9#>slyg8yv{9>*3
zq%F}%k6(2Qgbl8Upwc7FJgYs$)w~{n`C8WbxHu=q10*j%Q@(9By{k)0*GD`4=9`nJ
zv18u)lqts<@>A;>+Bsc*q`9m21{5T{EuYSyH8r@L7vL=?FNw3zdWB8OufP6^h5^qY
zBJLPH>d*bct7~g_oLnHf!&`p=DzC`Q&xeqj#Auwf4n=^woj-T(`=hVc#vK2N<Dk5}
zT1HcmY@Gfi_k#n!ZWd38&dT>F?#di{K=H|MBF;Z5xV(A}sLPv|O}7!B@IFee-M?I>
z%`w7G+?VFc$B#FwgM8%3N9GPwS5HK$>*c`B@|+d*HGCz_w`O$}D}Pv#n8G!~s(St+
z;67h0q)5Xw-ZTmf0?&I;(HdMeFh$f?bki!J5|L?PyA1Y7=4{fch&?dNHQ}%TQieI2
zZ!>yronpeV-%!2uCP48Hw*r`vl8PI8Z*BA~2^)HwjT@b?iU6cn9~s{pV7{ra31K*f
zDTqF*WG3#mAYHW>3qch979ekLpsDR9&o_^HkGz7%cv@WzjTTsG0%?&=UBD?4vGzqm
z-SbAvYVLxHCAM%@L+~TL9KwSOScUty-8NoLRu#|3--87BCqTMs2&NKEAJMgfc-|1!
zn(VY31mtvio$?Pzrf(XCIn@#dK)}cVlux5xC+36qycKBDe4L>kMThdJU;-O5<M~xy
z;nXiUq0se+Tf#t(;TiZ(51?VNFjf6fcvuk4A#2RF>>ghugn+0;zR>0wei6+A%Jj~a
zD&!Ev8T>a{|0*uElTT5K>cSR&TosxKY-+>R?Z4)(y$-qqEkP!R<GG0{dmk8qQ%8>u
zCF}6=3LY;G$NtEz^pQ8vPRkb_b2#2S-?WSj7w31-WQo$%&Z&kJhdw^nIRfN)v(O7*
z=g49!9By|7muM|`I;VBAjnxm{6iA#qdEv>O%H;m{d3*z4?@Xlx+Ry@T2F?+E8mDc#
zPx+4;2?TozT*$ftjZFhhXvO)RGYDKwAZx$MI&_ngMLeYZ%^N-Vi6Gp#gehn4DYn`;
z6Bft@Tx%3_xg8xBumrX6Skdb|vl+qPj#%0f3QRjZT))L6Wk(y^L+<@j**bf-T+nkh
zuaZ6sIpJ9x&l)uMY!(y?%7nnBfo&Mzl{~uh2#6YJ0FS&Gd?^JSvyry8HXf+t<D5UV
zUYC~UK%b%V#Z-lN`))ZYyy6-<`vh-6m<P$mjnpA?Di(l#e!Z(10CKRap9ESHA}Lmd
zcTA;u(Xw6C2k+8egiHQNNDu<<GSn>JWns;7;snfzr|=EPJrt_cg-X+>CnqKr6gF4?
zNGClmw9dcs?C-O^yu5yc*-VNjPdlkNEw7FgknPvibHJw|;TP19EtB4aF1*U#8OQej
zSTdDlO~7M*`MR>w6q2HWfz!#i3Y=n2(G?&rAVeW*lC{oEcXz3HHm@kF@Xda5?t}aH
zh0_l!b>S5|Z;-hP`ovs4MJaF7s+`$Keu8~qa>H|KoH2YEMVC?NBU~TGMvqrYSpa8r
zz_qXqROE!M#$55B9U4hj`Xk1Tv*+eHgbeJd{py~_jx-4}!hQhTBMs0^O8W&}ZngWX
z!NJiVu&-ba83T5hqy;Ii+1Wd}c_a!m_E{Ixp-STt@CK8d;^G(rDVdK{P!$+EMSTqI
zj&n_c>cojxIF2Y!1HudY#a%QgUHnB&Z}4>cHcmxue+S_IJpR>VQx|P<c5e9mneun*
z+r5Ibo>6^w>!+@;Cxy2TO-?f55H#al*5+x8G{=}8vl%IF0PH5p0*uJ;#b9>+<m0`g
z_<JcqI`mu#Pu%rK5ovbD4kQTn!>{aH`?l!~oC+e*?dC(KR?Z^>C2E8DbckS>Hq5cJ
zi@Ldp@g}j6jVz1&>ap6sjNzzMU21uc6mF7t)jCq6w};=Z(lA#0${>8bQ5=GM^cb{f
zvur08QGjSw*T_t@hJ=&*BsJo06<=6wtzEQ+XM~^kWacK!w_z!I?B{Hc#JCVGZ0C;m
z{*Bcv8&;8w+c&zmfBM|~Byz>rE5>8f#FKL{;tl4C3Y$}p;*M5DWQxg9IXRo?yNl?4
zV%vw_-~;l))hi$SnTj7C2Wm>FwxI_gz>g4+EN5fU4C8n1s*@*A?l8(&+{dIe)~B~u
z!~RO@%xMY{rJcX!D!;|Z2$nqKccx_2_1I_d?Fknb1+Pe0l3)E%c1WbCLvmNnw70Ut
z1jm*XM;n%0t3vwn<zaHF4W5!psVZQR)e!-b6AeW#H)xQC-EHfSv^xzA@y7lZ&3Qu<
z`aD+eOBcc(0>QbQ1;5Kzcbe)toD>&xQLUA}fB`*BIm!m0AXx{G_%)eawtE|6w=w3?
znn?BDRXQzVgU**r&=Yi^50L~>#xl_gz>oRpFb04eT~SuH!G5zT>Jj89doW`}2z~P^
zjZaVl34P=rwGS(gs;ceS#}kPBJ^5Y!r)a!WRu<c?jlaMaebSb!qc>}qAF`baFW`>}
zVef(~ad8GkS$vF$y?yU^4j5HUk$gZyrv;?;Xr-Yz<<-E{9ZEe&W*R?!Je2^SY>1lU
z=4QO#{@f8xmCqL*96b96)w}jvTGg76YfCmAVwLl`-MNVeN>Zi$TlL}1eKAl-uwTi5
zf5rucgN+U-9Efffw@Ps(*C|i<zI9j|bkuU0Ct<H5g_GP+U!OHd2pTv?AN_rL@6_HK
z-OQNan}^23ZlIi2jNiq;LstODmLC{4PflK55MCx7m(}Z9Lp%XPdC=TBXxznIb}r%L
z#)av7%N&yHK#e(WSHs?%u2AKUc)xl2Av@$(^>3T6d3QVuD@$msEHK^Fn!G@4sk>-n
z-5jTszJChx%dSaEF~0pE8t0GkH^uvyN!@4oVlxE9N*F8%#<YRKTS!|6+GwGLD!g=D
zqmSj8CU$(Zkeeh|x+<t(FO&?=9xEGdKQZ!Upx4a)sZB@(0sv+3oB{0sZfCrYiyt$d
z<HxtCD_UexW1q!Y#Q)40JGdrzhS4<Ab}#rCcH>PxyxyGQ)e34Z7izF2YDAe25nu=K
zfUu(Se(x>pVCbd7ugpeKy)H9ocl&i7(H3Wz94pxHpav3BnHhvQz&RU7niiA^mPMu$
z7a0bs&!BZ_K2Cy$*$<Y&Gx<;lwnxkq`_`;Jv|BxcIAEA^&>+>w{R^2eep&crjdxa7
zL2awW)3X|ZkcW**PM%Z~S<CkW81wlW`Bna=u>ZcYcr3>H7NRF;Ew_>%tyr;fobyIN
zZy%GhS}+iL_;8`UeI5B`)4AzzV0mhIOW||RSjFUr2K&AH_a7NNNr}F0`QZKf_Y&Rb
zt<)*H{iqEU4o6O$7(91RZ4eKGS#hy#pT?W=Q_|kOwhD6j$o|pPOpIsOZ)&Xw2?Xir
z2#kq}OvdX)G<+i{eGE~oCGAqW@umqoLoGg~i|rsI7_9K_BpzB^WE8(aA()#-asCSR
zZ|dSg>mgN*;S4Dlv}_T)>)gn!)X2Nxm#AAJ<4xCZI(qC_(DWCIo#1fcbP+k<v49Z>
zRXn*AB{gdKGsiSEv{QEO+{t^VsH(_0&VQlDKYH|Ro}k}`uJxn7+Fn;=l{H%-4s?xB
z##IzNfZkX@&ZWRN5?UfkN*DR1Ak%X_)Ki;wJqyix_a*3r#Sr<FUFxvA2=}oB$xW#j
zq=lh~uI|&;C8JcO$f5}IgYhK#P@LGtA{SzZ+HvykULwh$sgav_{rc$T3hH|mWo4~u
zia!B#Gm^Qq!BDGt2Cc7P#`jUoc=&LcQ?FU2q+{YQQ8(vorS8fvQ~TsUd%8^Wbb-@4
z`K>Fwjn&UQzVOSrffpoEuGi;vzp;M9SEolI)F-FqgoJ^rqBdw%Te5A9OvY~jT5(fT
z`~1>zWb0Ab02eP@@TfZm{e%iF?T@~{2%am+iA0J5F>htc(_y1WFH)4p_P0HVCyBpN
zzM@7lB4-G#eW$<<j1+;VZ9(f%4w*vm$s-qCHgE1pi+Y0qms0>JsOHg=C($5?sTk1(
z9P%zOGbGMO&ijsWb-{!7R-e};C0RHk8om)yT;rNQHm?!m^B1$xu=-iAt3W#yJxA%U
z{r%^deilG@lT9-<`@%wC>6%<{h_xzvbc^_oNgoHj6JJWFF{vuq4zlgov5~}d-|>MN
zsYU)Kq@vuw;hKF}zNTtUBqh>0lbaaAf8~CD!Q78^1!p9a`k;SD+R8}nl}n2x1Xv)$
z8TpEHUW6Nx2UUvRtSj}PRvwpBeT7Yg9l{g^XK63+OJm+>Q*<-AK#%q;UaT^(Ydml#
zZ`Rcr?i-jjR4fUz5VM*g@=-S#twddWgDksV(<!ve*aI<_2>EWk<aK`Bn7z~RJ2;^E
zc3SsM5f9c%I&GLb^)=+QT3+3BZkCifZMfbl+i2;f^<sJVtTr>tySh0EILD%89baps
zwz=RYTWW&M*tNzceNi6h*1fx+%p#+~?Ep8^NL>vOfV`YH+k<@cKEg)3d16>!=olVN
zd^Th{UT1Q*u3bmZA8Wi~q+VLExphl_r#DHReE9zCTW=i@1sfiQjES2j#3i%#-+Wx7
zz>@Y8K7}Z}6YLSZ5oP6=oHv`xYLBXK?&bNXIG#HLNB`GV<r0VJ|06D`RTHK_(z<;o
zKll!GU!s(kwA{X-@>9gNBWt23?N*3gt!q~OFvT<Z`s;fU+sv8^_d3j2pt|#1p?bo}
z+gE=b@~~Ht%7X`m^4EqHPuXAbM~h}e!o`@~_UKu?UrCsY=+w}@;Cdh{_RS{vRwlXO
zP^L_7n|57NZ<gvd((-;4e<$u<ua(i-Pd0aHKZgo$-r%!p4il6etOqA0KkQ<Zz2JV7
z@z~8sU8i@AdF17-t-X43-p%_@<quzS8?!uo)qUHpcHRMIj;D=g8MtKM7%jiQShLt~
z;I-wu%wqfo?nuk8nfJhIaFU_b*xw>=rUt&Ym$dkqZ<$&-Ry&k^1SY2MPUy^lmzGj-
z(JzXu42|F`cSG+o`MFUnVNaZ(#d8G2_iA&h0-Z6MxuuoOfh*pNF{Xe&Jijup^!}ki
z;2&9Vyc7_Vq$DV<+d-U)H6+>>LVH0dT=0q8NO1@o=VzpWZy^Q!2UUDi3v>U|jDafM
z5NM!v<U4&fVgo8jU$uHmi;HzlP1Rw@2?<O3x9o0fItd#$3v-It;S0dFW@~XDie2(V
zbB(>k&)+}dD>~=~2;_R!h^<H+8o45)gD!j3-a!_ZN><@hBDjA=Li39$9ACfs6Cqys
zzp3V*2n>wABs_Fr_L_eVxS0}ONEt7a6jkTu&YJX6ddP(f2<_APKWz}jO?IYsc>+EC
zD*#piY1vuCvECNw6J{8%nRMiIVJw<m<a{Cgt5h$;CK58#kambIXKkC|N;v?^9pi%d
zVyB@&C+ZwqkoAZ<F;k1rJrH^%+|~9@RE1x+1iE6OQ%fyl^|!l+zw9&TQWW=n(3_$y
z>f{7;9MNq50s$gtu26gE)jBBU%if;5H;kF^N%-x7d}XApXJVNn&`skP<=)bD+|3l0
zzf(ek$_q&ZD@|7u+20ly@#JImgtFY>CMEN{u`O3676J~Cr5LToQm2*f?0kDv&$}cH
zt%cu%ni%u=dT%mj@7}#}A5d0aEXW#btgS2P(_w2ItbCCWoly@*qSM}hK|ItKEzd!Q
zxu3qk6H*im&yG_^mLCY>G<~ED1wriEE?jh63p=?b^d)i`)^-v3&S#8E`t<BM0c^6Y
z>S5h#-!YYf=#gE9DC2-@S*f)`@vY=sXcjaAryWa3yVFcgtm}jZF|H6}CPpMVUHDVt
z?Mxaz%YmUNs34*1$N@e#-!l<FoJ<m+R`U!Pqu`x|)5OgU(EuvO2NmX|sycRHag+$R
zK-!MYPFQ2~m;mSi$7Cm(1OLX_<_Av&LT~t9Y^W}*0+be_cD$R;!OueT84?G)7mXdK
zDuXL?=WeE`HT{SPv30?!I~^BI4+Jsx(WEYro4)m3W-%*-?76zXDEIF-$HKxwtONks
z8|0QclI+MDTMzpLNV){smQ(UhVH$_oX2WM_I;$TZ9fnkKB;Gn+?9mWLU>qry-q|Rb
zvA_2nxv?N_QCl+hr-D86#I|77!Zo9Y4_`-x3{C0yBi~WlJ`>kdEGe~)O9ZHnz=5C+
zwGUNL5cXE)meYi<(pUeLC%&pnV#ZW<AG+<<QGsgLt7f!xqYx;Y-X<~R0*e21d>Jp2
zQ+6b$9ceL@vkavYgeQ@!YJ*VBVF&o#4eC*wUZEhh4g|5?6&B5R`)FpXdXOmzPyuT&
zC^?_@9ML|N09}*s3fOPC0Mn_kj9xQhpUO!yL@l~CQbOz?G%<Ji8&zkjv`^%Cpxw+u
zd>m3Usilcq64<p@ZS!gc76ZeI$Jf_df!^>P&T695hG;cYsZRfo&^th|O9V1-(H0sy
zL35Cn$FKw#*SqEzaP)g45;)S}Te34vI!QByg@tl6t=@Nj9XqnLrbsK!z~m@X>>yjJ
zV<RGd)#@u$TLX%<zSNxemVNecQJeWM4_QPA#)Gdi=y{By!0UtEj9j$E#-<WZwECKR
zJsfLg-GFco`gQr)_Cg3Oe9z0Uv8k11uc&K@pZdiOX$MVD?5E}p=m=<^W<O#dh7+e=
zG9UU4*dd&pO9I&vwo-a+J7H3oN~otWaIsz*o-e&fD)fKyASz5w^4hHnhXk4f)A47j
z=I4Cr=APo!<O}xeAO9g#mIZt+Cxc!h{B{k14E)^J<4CVMw*MTFR0zTOz%fHQB==#?
zn$Hpla<M@6bwYS-Oe3@F5KSMO%!oXJ=KwMDB4+LWN9r*QklD*;lWj~63=3GKY6OV{
zroDg#shWRkXmGA|y)xg^E$5aX5GB0aa!7E>$TmaqnvuJarE^^7W>kQH^Ke+0JyCtv
zT`TFWHDu|vCEDLD*sErlAuoLfZ>V|x>ds*oAKARumPF}G#*H2=^dvcS5q;M!UVJd4
zp8xd><>TJBnUMfOYyg&T?8?c=?Pz{C_4Km3up*cV2Iu4&wo0EOW-SUR2S&zs%J}4I
zei^H7gKAX8znXUWj#B^ZYBAFF{-xE2*BDFkj*D)avQtDw0u3+aORA=gRY)WIJc+aw
z4V(0$ePN-3@5FERmYYcm?hIGOwF~dxB-sKX&<dPkp7)6lp}lNMO3&WCjock-C);~k
zJFB^udK+h#8H&Lrg2CcFeJ@i+ZWCHa(st~^KA=DJQGa5mLr%l{3f``+d0ItB;4BYo
zVgT5&Q~b23t#&J5v83OIYisVj+;7e}jg4r5mWr0~Xvd=5zv8Z4+Xg~4%nqgs(&n=q
z;T40y$|{-}RCTFLs<JH6r82Uc*WV6#H?l_Vo4dPAkTnxs{#SFn!>(UGne}FG!QRW}
zJ34j2Q!y}z13V!(hRE3vp)0>IIwyC;HPK)4;Io@6-l1Elx_TK<Ik^x)Qz`Bv$y~?x
z1eH&|xv|C;mE`aI#FF#LNxf?NM-H<MJ--O-F#Md2tN(3*m$@e}UD<_hk=1?^pWL&i
zO~A|q`J%hD+`2oCpHwdE>PwL61y>r<jpaLR#W4XrG1n36%r^9z@t;xg_M7JVab-ud
zasQz+Hm$#jE(#7b6ROIeK}L-9?g3Bb(*NRkC%op~3u4qij$KY^V-w!#6&##$J|G>b
zf;nCN@GZ7J-tCy+PNJ4fUG|9j;j%Es!8lfR)vYeJ*R!%(m-U~QeoSRi?bCCqENCz7
zIyc{-(Z(_Xjd_-i;b-Lp$5GWOcjN8rBc*~T?1>6EGVSBTf3sCmI$BcHD|{SI`4_kV
z(dImSp!{R7JMQP7Xa92GH}k}Iadn?gjF3LV2PIP{FtuKqtY(DrDu>b3?vBD7noG)$
zYpSBI=zkv~;qvgM?}2IWpgOCpqsIeAp8LGeqPY4aWToe-E1zvNDR-5wQCV~~Pb~@Y
z9|7EJGcOgjCni6OwY1`md|pE;5|7qt#}N4C!nX-GyRCm=BLLC^t!YWqKg5;nBG1KA
z$<%f_(;NPbssQl!A*H=x+<m**KQE7_xRpyY(L8mtc;ApH=2VOy=F|?*KW%L8oI|nJ
z*4nBPCQvA5@Kyr5dvzJ8CF8&2WPXIJ#X5uRlP5pO$t3;0$ty4Hb6J8CMYomPMul(6
zH|!1F7MVY9y{&haZPc5xTk+>zgB)$WvJaX^?Dg`_(D^Vq!8QCg)|YYBb@T5RUP(7=
zOBNO!nCFaLWB=P%7Y=E)Jd@SRZ_D0Cf(v_o+wk(q<*E0sn@ku=1rnib=aroE|IWYW
z)|1l>36H;NRT;kTYcusP@6q>@z@@A^)unaYfBb*``x=#Y-r;{+o7Mk=t9MT9KS$DX
zvaNl8zFFY=#;<R5>Z}me3E2}<9DlxkMlosn*B@%jf0g;e+a}v*sgy#8(oc4Mzna}l
zy^xWw^Vg1FKhFL7M<cN=5X-YJU1TezM(*=+R{ZgE_pd+jw+Ydh@F{EJjJF5A{#jFn
z|LLFAk@EO#_fu`3zyDe3jG1fRrIvX-?BDs9y%?R{|LvPEA0R}Ezx>)VA~f_b@q>(|
zYu??n|Mrc`u+D#Ur~V#||8O`tf|kEdaQZo=Z^_nmUw?B*@2&sXEi6^q=Ovl*W5N%A
zU!~s5|4rY)QdPA5*##L6Yu+tS8T8LTbCQ`qKfbp1s{!xp2qV-hPnr6qg{G+moUKb%
z`$J=&w%@-y=bj)w@LCn!G2X&Vc?+oF?BM&s8E0@>3TaN*HX?Sv4I{5Ju4O(f!$WT{
ziG&hhd%fq$Urn}9|555rnK7dsko7_Wnz8IEW~pp~^;eV91p6QAVQ9TXxX0$22#t?z
z+X&3RU}`fLoI`U`uM<jIVUdyX^p?HYO}u5&y8~Veh<306v23r92dRjYJQ&v&;=2Y-
z@Y9--o4#(0m6;;8qYS`4{1!4=7`$S>GWs!052HLM?<atOMKetgkwA=v<X=zJ4Q^*D
z`UI;>f!iWXv;AY}-z;(iU^%*O(;M4j1mq&4i~7^hl<>2CUlEYASh8`uJ6c{8&A>}W
zz0MPIaE(M%&?`!ug7x)<gCTP{*a{5)gWHE93bnABM$}Ch2Y7taHP50a+ajZ~+mU5x
zZB<gkm@o!-BK3+u{)hrE4F|t5I4(9=07k&98IU(}WMU|(kRlVk*>c8&;R`P8de|#K
z8^>7YzN7Uou7IvdAu+?*=V9y~JOJ^ii?|-Vp*I)`QOX$_n_uWFgeoe256Tk_J7piO
zLC7Q6O_fNbVeKFfZ=SC9j$oWXWIh8pm0DI>34NM#C++Xd)y>+C*y2kDC(4W&-5F#E
zzVh%1Z)<AWptw@by30+yYG2e2dVB~gr};8M6JV3YYF6XMmcp(RZ5@z{vFatEw>3Q0
zEd1NY#;DEQIF7B4O_ad*m1-B2&C@@JR&NP|eItgcHNeYc>6Yi8$Tc0w4&h>R&deqR
zGz{sNEe5#-e4y&6fuW-$MaNuO4Y<p=`k<+&CTORMkq3iiaWSawWn!;t@@yKe$hw}l
zE7s<zYUh0>S4N9!zbO*MUb#$cP6aFX=H<)pDThpNZomGODxD<!YkKr%QTo-t22H#p
zSnA}Zv^ygRNkN2B=HyMjolX*PmSPa&`di(=H)SI@^%Ku&#?WuJwb7O`>4^T#sP+~^
z_^wgUfA1!J&^W|+Lh(`?gn^39Vt)aw6|i3Ffca{h#V=RX(OCJ;%de6;8?;+h&mh~#
zGU24g^oFg5iN48lJ1buaIl>|NMb7fsMOstuni<^3rNm8!BDk(hnAjY8bkKCr)N=(l
zzBTqsXih47to|)#edA@WIY;S}ugBiT<sl*;Zv<V>f*ZPR=7YBGjo#u|trX|lHEM~U
z+zsu9gT`&<c~i%#40n;XlDT##&nyQC5B}|#jC$p%4`PRw`Ipa=F}JX&#g~|E$kKpE
zi>02|b;hY%CJz|Cqh^?wmw>m7<^2x%tB=1wCi69XTK$!i(=gzbg3HyHdhH4JfB&5>
z4hMZcMtlu(UF1>yTQ%z38QrY|*6g>os_zyYJLFKi-A~O)F;?{#)tn_upZ_s3p=7GB
z;tYiEo>Gm|@9o*QkC*czJODHGJeCNM{@9xjmX$q?V#}X@uABa{@VZHP=BC~Z#gr+Q
z?lS<o(tdQmBj2InX_U~IHvoy0MzfH8Kl6;7kCB?0WiJPm0jy?bwANeL2%RZpZ4l6*
zb?y66jX*){#9(3is8Lo757?GY2}*~+GkR%w3PBlPn-vfifalS2twa|EU>B&7l~>js
zh_V9UW^GNKXlggx?=vQ+u^T)yoRt}Z1OaO3w4)l6w7emSh{tDbWM~)~FZc>!TdVqf
zo;sxgY1EHEFWy0!L5gyuw!hUwMQgpo>UpDG!qcmy0;$)>1bjPX7^(mQ4v9)&r@RIn
z98H8ku}wizXx==O*T?XnLi+FE2rKEFiJ-zSS8w>t7C62M>85wSQIn~9msR!YtM1`9
z$nXQ}YF0@Rs6~igad2Jsg(Vq3Iokw0!BpuJ1dFOiSn4QZO9pcxypkdl{f@dl5^o{=
p#eYH+|H-NUjjRcub+kx26yslJIvB3@=|p8Mnx{QCYWAw%{|7bOad`j$

literal 0
HcmV?d00001

diff --git a/media/images/cutlass-warp-thread-tile-structure.png b/media/images/cutlass-warp-thread-tile-structure.png
new file mode 100644
index 0000000000000000000000000000000000000000..cecbbfd44a06b44acd78d9926e69fa4c510fdbad
GIT binary patch
literal 179689
zcmeFZXH=Bg)-{T4n?+kO5fqi65*5iRm`IW&6i7A{N)$wLwhf2`2_ga_D!E8X&ZU9~
z2qIvKfaIX$oYOZS)HA*_-e32Qaqq8}arz+LSoPH2Yp*reoO5l@^GY)G>zUTm(b3V%
z$(~iEqg%&CN4F|>?O*seuBlq)__pGvs?2G+<WDR;_~GwsrxZ`o(Y=1SVgAx8{JhRm
zR_i7m-98cGpA|<hL^#sXEk(<nJ*951-`}*xdK+zNY9xA!uVCg3Wxw88inSl7o|Iqn
zmK8xU?t2v-gEsBoyZiJyzt2uTUqt(#-h0Qo#>u&GsVVGun3?Rqe}8MrH@K$!X|UjC
z?9ihH@>Rhl;<<i($sQ=S`15DFlezm`SN`Xx8u}6D|NP*0{eH`TesH%wGr#&jKSeRO
z<GFu-?QQypy5i3dbUpW`>HqVCtjPa^x7vGVcxoyuD~o!gqa<2Bm`^|7erD9r!EI_#
z@7lE=?(Xi{*`l=FzhAp`0&nUr=H=-*GBrhYU6{?a>67+lsmEWel3dEiOH_u541LeJ
z86n}~I^E`Rd(Gy1ckaaf`3UZH#K*bHEiC-?)2Hh{KfieYV0*2RU`PO4*9pgQOIuqF
zVgr}IQatd17QN=ChTP^yK9DHtGY9D@nko9RO5u2?`H%cm79o=_y|e_2mck^*@shLB
z($7vfP1Y()Rt6q;$SI|lXX`Tl)8AxuJ{y1DN-jHTV)yCj+{>`=?wUK8m~wCaP};6v
z@SwjwZRa7?DD4cBB<+mZp4bR8Gc$G87Wclolq{p_)AXXRD?*MY*lF)RW@~L_rCRB3
z_oKTqO#U$s<I$@X**7{mhp+}LEG+83*XW`+_OCVQgzNltoq-#zDQ86TW2lg6)w2`I
z&yL4Ch9*Bd?y&z#+`XtEZp~!JiC&kPuHZBGHqNwpuu4DNvoMg=V%t*_trRXUxiB86
z;BT@n|Crm-f*l_23s*vQx(Thky!;&P_s+-M#wzL8C+TG6+75*NLpA*LR7^8jcNKkS
zRfMEPbH2l9r+))JVV}6tOT&+kAF@g+O*QrnG-M>0&?qLmn0&lTb{aU}=>PV*v{aUM
zSHsBYC-GPY)W!Dq8%TfWA8X9ANYPArrfn(|YCF)NrK6J|zPyffZ>$jsZ@AMkGm}-L
zA3Rtq7`k8Tfp!14k*OB9h@;m&_1okBo(dY*#HmEC-o)}PK{KVqhj}N@h4Vt6)$;8}
z)-iCNm6D3rj}0_%osptHN$evQNX5qUy>a~JH^(xreDGD4m^qu2!K64hIneUC>&5Rk
zW|l$>rI>y2-Oa`NnWB}}jd19|*U->V!iUDj#@gE2qN0wnzyo}Id|4JP&m>$NyUK$|
zY4(Vhwe<9)0;SE#$;mA)Q{laN(rT&XGFpOWg7};JTYev>H^+%jmf-2_J>T(AQeEOX
zjY3KglsH!T@uMkLH0S0I4c?3gJNXyKd(>!Bj-oEJ){U9wq!yvj9lY94MQ@y@t&sNq
za~ivE5gX)l`*zWATM<d(`9!5iOI)sCw#(e)fe7aSv71+E7a|X7r^iJ`MpBeE=h+UJ
ze13il4_2FEKxG!W9``>VOzcMcoy818v76oVGe06odQ9Ky>n8>pMG%sdg2`^b9;b=M
zuSq(6U*aQYldHX%gvy(n^=SngR8&+hUApx4?b}<oZt<sgDxN=oURGB2?AfzsW{JIg
zCrV#MWeKcxb90lFq`JG)G5T%nsyxx6R3a%Ts2(GG?_j5o_epE(bc&L{_mhepP2bi#
zuoaw3Vcfs4Zu92gvbrIv^P|%=soVgu2(mU=qPVy?t~VXe=hj=7lA@vO)9uAyh^0!W
z{7!ocYmoEuaWKBBQ`F_URx&AOn9!om(xTrMI8Ei+4JETuNlDs5?CfVru^#ly!p_J7
zlp&_d&64xOKdaeDQ?~Elzn__&{`T!#KZ10kmv-~Vr|=_JO8BYs0#1|tt2XRNL>L!)
zGAJo2r7+dxE0~$}XPDMSWl<Mr`w*m(R-L60Zi^0O0UVDXKi;!v4<*u?gW+d)_ay$~
z(&F4u$A^ckN3VM4YhhDxz}~%kr!K?4W!pBgp<%}5_YV%K#gu+qA0mb~55613cj<-q
zw_7XM?BLTqc=O8m&*~aCM!yQ5B9F~ZPEHBFHF7vv6Mc1>_(<jrf+6b!5_@W6EgI5$
z+KN1|F_cKbZ#g#){3!z!bjyn)7s%P;aSf+6Ej3lu#@G@c5(~!p-B|!fyTEbcfw#9h
zZHbn4t?Fx{RxJ)15))3p7|v1dqL+YS`Ii&}gL28b+H~Vu#HRPIBkw+aQmXUF&d&Z(
z6|pp2v^m0gR4(mmWmK53d4q0_m6T=z!?tbKy<g(B(yk(=vJj><KI55cu}V0O6C)$l
zHVj*~+*p{MxVvHJ<WP%&_%vRGTO;v8vTjZQhx`uw(Wv_6P{Gu*{6i=tNMuV>)Fo^r
zNt{{Ibw1?iHEWmY&APg}S3f;H6sZ@l8m$_Au59o6?Of`wF1|$ud2~?arSr@vE0R94
zX8|^1>_^qd>@x2FUuHq0!&fVwc<tn;6z=j18Edql3K`d&6~F%N)g_doO)R3%6C6j{
z-)EXPA{lC9r9+AYr0}4RZ<RAMt_Vr?-F@tOQ!c6Q##VvNGQKQYS=aS?6s~$*H@jQG
z(nAX3B9Tv~q^tIfO-|}(n2<a+?MA)fOVjJVd3veK=lXT$@oE_ZmkC;Pfm7|1IX<1t
zeuT8_lg(iw7LyYbG*VOcjVtZNo<7VX$>(334lwrb;`S=k$-0j0CEsRsQtRg8;+#cK
zPU32TqhnnkV{s;=uf{uTk)?tt>|_P<bFAHYm*08admRw~|6-#GUFIm3Crzh^+dh5z
zL=mUA9cm8e)e%P4h`;c<eR81DU}-c(=HVX2Cx=f>2v+ufO)|Z5C9?1K;OS)K+XQhR
zPSdZ6_$)OvM<*wXrd%6TT^}YPE`vhn!S6XF8EupW8yg#%P0!E})w1o~L&-%^ByPOZ
zgB`pLiCSsKwJ~C1Vm-5g(gK$eCcQP$@;O#r>Qw#x2sMPXMfJ<Oi|@VYnFM8Jzice4
z=&6qM=v9x5*Ud>CJSVeZ!v?KE0iRhf0Z)YxfwKPaV|K|E|LC<8Bk8)K^2I2I?LbYi
z31$hg!6AFRoo)aA(-{i4{rvvX%9}-o#ZJ&7g9A@}p^*AMu)5`=%q2Ul5B~1MBBt8?
z%p|_LB2=hvX6#35F`l|USud~sy;s76&QhM5N)MzlT3#^<z${`VKG~oeM?~G=R~ezZ
za+)Y3Z{EH=we;5FGS<R)b5;Mq0I}`bCKLVjwI4qGn6MC@{#hM4((xhTS&UY=xXpM+
z7P5kf=~o4sF+*tJ0p)YFu8+a7$`SeqH`1lOIC<-)vc^Y8nSf`w4K3D1(Z0RDV#pVL
z<DR{}J&$hoE32+@%0hzam$>S;x7Uz{HtOctCfN-&Q`CH7&INI)#V8OtGb)JdoTC4J
zDPfCd7A7X99Xo8X|0#vDTz8B4JR34h4RWmy`8@oWh}5j>;eskY6Q#P9!Tb?CkyzyT
zm-b>-oj)71hH!w@^gRr3^%^`9zWzNMKLSZi&F<8SNhFsABxocB%siis`+-skD09B4
zVE-R@x$6M_WWNfLo1l}GJUd|Ebhj2sF{xLTVfXG6S4zB3-(4SH!c-X>;hKBp!zR*#
zqpqHw+rosV-sk;p4A-w8N<~y1P<}S=*;N^qb@A=LyxQs64r4LNn{%fJ#;PPWD+NOV
z5{K&3egIt6gm5{o>$&uf!@aq=xue8KUe?t5Oz@?iLFWso&P0M>Zc^N`VcS7JHknO&
z!RuUSx^{|)i0HMbwhj$RBD~py{mWX(WCSdQ+3)&=+!Y*QYw>}<y?b|hqWTSze&K8{
zH!WUTE!VmStJk+i1?es5VXA_cQCTT_4&V7NaVlq4@7s`z9iYg{bLy5*a1v_HFP0l!
zt9qtKd(SLvcHv#qDYbw8`RA4Mj8%vUP2t$(nwyMmK#e$1ZG9=!L8OI9X&)~2xV=R+
ztbU0_C}WvfS(*#yK0P^dg*>jl(kJFp(Y@K){VsmS{+ptz1QHCb0`wA7_hM%*?MjqD
z&BEF93p)F?44Js6rJfXXx;u8f-tYQ}C8Ey%cidj=t_VToX|}mbk5$XC?v`}br9~eU
z5U?tLbO>ut;uQ+T!kIUu%aN#=0PzS_C1CQ&{(79iuT<9O-kq&)Z)5e@*dki9T3o|W
zh><T&96xUDa@f0Nw6hF3Kb-xAO6q8LWdbX80eN2aCHK;Jt+I>{6YAgk5EX<iG6!BW
zBr>uCxc}kqW0}bQC?)LcN=Car9$<^<Yy9~4nl;#G8Oe3EGyQ2*<eJ2!B-Rs-ojpB=
z)a;fP7b0aIenQItJWrgCUcP4T_ZA^2T~Ebsz7rzXr(Fx4ISLeuM8kUAe)!F;l?Yp=
z!x!CM-%-@m=ZcR_oRTkz!n2}GED<N?#eC4Jx_pN*_I0|xEMl1!Ey*R_9H-BmnHp$}
z4Qmq@2mlJakZT=ZaZPLFW&8W$;?f%bw}2k!maYa|ZhLoEHG0-)uiSi$B*Ptr&_pW%
zkF4uWj>wr!d3GP?HtiNCSB8>oUIg*#WWK)gfvGuO=-|Ph@9u8E0rC_3j1PnKn6R2j
zG5TCk;oM*zdqT1=kD*p$?exHJ+|w+ue6$c9U#a;$c|(Qr**z~`JbCg271<!){stZa
zul<E88jo6q?q~C+O&Z~a!i*ZSviGyHrcnJ*$)nsNOVJ_hKH;c-k0WE&+1dH8zy5j|
z8EHf8od6OcI-xrodVp}Mu@pcmX3hEa@7}eS`m?Rs#Nsyv#PIC!rGLj2>sZ~~mN?`e
zd!v~F&JY$B23i6ZQr)#@&ofJpGmMWnitz9#l<Vp0F3yitJ(QT071<V!IF6n_TL8et
zQMPKscCK{5A*ZRqnVFfgSL)bQW@cvYm7^0AHaBnP+4Oylk_#MP`AqXc%ht|{kTe6T
z>zd7b9{D3l1~}}YaE#S9H7#_O1p?!#hcm^g$Jba;7i`gjhBOLjr0NnITK(9@7`0$_
zCV6_~1M7(sCunOqJ~TAU7HyVP*E1DdwSL<!QOj2BkYVCRejx?{QBBP{e>R!k6hDC_
zwI`e9+Oz&9b{$;@s*WMWQ2XD1{~eDt9BM9@bx1p?7URt$N~^U`b&m>4^s8~M3>BK4
zs(NJMGk&(*#x!vs<Kx~9ziP%s1+;d1lin2-_0bYy16CxV^V@{n(2#DdHm>mO_zVgZ
z(Um?wbsHH6fvQbPyr5F&f<Q#OC4`O;C`#(=*|^1+EWm`X$T}ittI-*m)+NX11|Riq
z*}9EScN*D5ALtITucxPX=JaXn9ACaMq=%5(x6hEtQOS~{CC$x?C?5dwxdG~O%H+cB
zhg8qfE6>Sh0<guKti%rDNRYx!(9B&2Bq}T{q<96Vy?XVT>hd$8#G*dc5NWd>XB2A?
z=Eunt;6KxPd$W3&Jz(=A(&f5jJ%JDEcB`LBx-Ft1rL5LQ?F*<+rqE~S<Pb>1hEnkT
ze5j=J^m!8XDNm|J;f%CUZGhBsR-Ima3N8{w@cMUAdHIibzR~=~&9Qel531(rs)bs8
zgH3s8ty9ElM&i~#{obYjJ{QtnXq0N$!3?~8yRR%rE`?%0(!O%_Mp^k?lj2{K_2#hi
z38zd1vCCBJo&btd4!I)>iISG2V~3n)H~3wpselo2z0mH(|K+?8Q%Kc@oqXyxtI@WS
z5;S;e@so@;Mfd3COP5q_=ch*iJSdM-c2T=Z{UcEg4p~REB7@7RrX%-wvr0<bHRWJP
z)GwG_m})__VhX82+aOP4^y6CCum+Idt-FGe6dX!jT0FLI*ABg0Ylr&K5O&uD)#!4Z
zIMqT<<qwsWif-4vP&S*Ys+390zyTl7^1T$NDSbl4CH>!Y!CuAFr%&4se%DGR%LQ$m
zKTwm8vxR={byn8q<&M>&XBRcYtbP<=gyJPqR#ZeFO_R8W4ew)=!YREQ@x=Nzu@moi
z8tiJW88+nM<wft9s9kt@9zmEvG`P9j5O@k<!iqw*v)y49`nKj;Tfct&3QV9`nO?Pa
zxz!E7wS`SOZcs23ux}AHhq9l3&vE<1&eN8(3t?jg{g>|GC;`JeIyl7Vei<KZ(h;g<
z60?d54-cmtJ^6>I8YBK>+}_uB40)RX3glMFvPXy1P_b@yma4=kgy5)0Su%d^lTDfC
zMY2LVP^Vd3K!*fOKy%NSvY$u$Mbf*BTqGbxIhKUvgr3>Ha@riNIE7CLE2C1G?l}Il
zZD0VH#2Pq-fXP=I*sTz16u#F$-5KVM8aA=j>DQaY2aZJfITV`J3;b@i6Wj1B>?2{`
z4?R3QDDste)-jAXx=uCO2{ceX5uMlaSH(*FDazBs;{zBH|D)HG^bY%>NIuxkZHxX0
zweQ5%J{-}h!KOyES6H!o^vtek5oSiaYBOpy6ED2RS&CX%VQd_%Kca*F$d^?znNllf
zZ=dbu^$}H=PdD2VjUsp@{N=02`+=N_0rk<V6NN4pucdLmMu~6*A4OsFiLvgfLCk5|
z7!QAK&jQ_{hD{v($luh|MACZz?g?)l6KXtU4{G2nDfk<@e;n`l+}fDSpn>q$*lLrR
zOa&2LjDkjf6j>g*d0~LK^bZy_H$1m;sLKxouH`o<OzhqGhf-YTKu(4pcN~ucqC`Ee
zS+$Z#vm)2OBX$X5N$3bOa~P;1lo|~a<)@;c7G9$+pk<{cY8}Pf=XQ&ui@UM@;lylJ
z%@NmQR-N}Liz&#RAU3dDlah<m9l(!Ff=1`TjUBV;{eo=DsTleN`4F_&c5V$G9IF67
zD?ne$PS48lV_66$3fsWI5#<Ppq~4m=r1uu7pGilPK7}94%g&C=-IkM+<FosihEVP5
z0tQZn^ERG}PeoOhuE*gFE+AdnaO+c0H97iv0WQ?9B<(rj7^i<=Qe2Z-W>x3*NDq}B
zd-D8$tb#7k_C6;Dl*#nWObr|3fA;KI1V`Y8BZ5S#R`3~3m(JO<cX|(o?~<FJ9Pg<G
z+CqPri08!7Q_i+L?4!SfN;HOmN5p=jtpziMmm>BPiG>^4of0kVdJ_z&&7slp@nvQw
zZCgiH3UyKYv45}9+;ArPTGx^HI|pi|rR601w(b_UK3|~JZ_}QIrBaVqmCE>HgueIO
zpJSLNgFnS@SiAND)wQ7f?{py3;m$G!QutMzH&7#my>~TGWe}KKnVA!EWj7BUclEk|
z-_qLp>2U`uY`Ho$AP^)I55fi|5l@J&Le|Q-^<#V1zBBiJ%A7(m%K*at^(o97GkXlG
zf+wdd>+0-qKqy)dMs(0jk@rvrYtHn2O(LZ*IE7Cu7K+ZAvi&(@0)GJv$%Y38)`He~
zF0dj=+J^~{EUs5@Y-&o`Dvt{0ZE>Q`pt`!6;x#^ey(8<@t5>K1nn>tf<bz21hUJfD
zenviI5;ptx;*1A&^h=VCCe65j$91kZA!R&;D-0io$)Y!I3@eRf*C(T4vEQ}U;6l$!
zR0T?%XMxguCgPS!$RzIZAJ)8d7g6VJ(BGo@^(p^bFcgtT&nUpo$EQT1KEOwfFEk>>
zoxg<bzsf+pd+**J)Uw-~CC(RoR!h+@P>Gc01^a>8ih5Ll0)#gnYRbC?KE1zx9z-C{
zP=ZnhVgihg{L<=Y-8-oOPtiwQ<*hgj(Vc5&n$_bpXe`OyUQN%b^fb;feAk~f8$P%E
za3C-aX{AOH4~MP=kg=co-hxOHF4dItFWw<dRdBlIS#_Pm(%V$pJS_hReg;eyC?Y%1
zy&jucXQ!vxkF`Wu0w3hw6X*A8nMJ#|^d=3bwz{lLjuw4OOm6|;je+L>6*SsIEH1j_
z+9l7RAR5w_dI|&E9}PpFpev%Tqj%%_=Q9Y*xAAJRi)ZFJ6~RkI&b|cylYulh?=g2F
zrd98~#p~Cvy>{@b`ecj(w08v?phMTT8L@it;ssDV$`KYu&f)F9t4K0Tm7ian!P3R{
z*1UPzp2c3}8kiv{AfQT%=Kj;Gwgw?-o#X<fi&2h9{%b`NXdXvLM@p|Issnn}jkKLf
zvlD#=IaVCP!WuUIdzwk}w#eELFXBrGTw`TpL!uoz=QJ;TqrG@5$GJG)^xN6?BQGiP
zD{nq%DV*sJLs?2dRcvvc8^F#{`1A@ArjsBrXlQ6qHvOs=hj$}*{2m;$8)TOY0^c3i
zt6vRP0t-%=eMti?@%i(4Qn(V{`|71j)yR;)YSB+36X}`M?4c$BYY=#Lx3Qo=G*J<4
zj4vvUggx5Hudj<bhGIL1{_OXABXmK3tJ(Z|Z}*<P&@|Lpj@!RNykZB8z^4h`>{cL6
zJ$TG-pr3A}LSq{!U<9WoLkf1qGi2iTAe|(XFezedkXT}RRRbrd2c}0lX1&g!be#qd
z3%oMU8gjK}q!BSQ5tszD7<-sEr2}bqX?{!@Bp@l4$tTeVp``KOPr{?0pN+CXJP9(v
z7;<GouI3Fid+fo58AjEBE({d$h5UqRbHqP*H&q{@(5sc9(I@D^Xex|;&klZXftpbJ
zu(%ivpJ4^b#sr(Hk)nTsR#V&|qN79b+X;i|1bM{5l1Qno((!7UL?Mn-VWY*{_OOUr
zp8PL`MD>Vm|AnB{M$tzq&%LXyy@|35<w?z@+6c|kaTKdpuMX3sW*sy~8gc9>8c7r;
zQ&!U~(>gv<FcT{)>q3QGK94H{GPNn-i@F_?A{2$4yxQy?DHMbKTwLY#^)tZ+u7^mJ
zM<&MYBVh{F_qVXA+i8Oo1FaiNag_p8U$J6E@0rUMysl~K>1Oq*(F93`O~*(1Z!E~M
zWy=<@N9T>*zXF*YKXHO&!&F>S0v5{}jRyEk4OE;j@wI6GNisdXI8S+YL)W1im?Tzj
z<JTu>J<4Dgc@c`(U}IK_l-CYQw8r|8MzGW4YuK^vNSisWtrvU3dJpO=D0uUnm6Vk1
zc@D%$NE_zq3gWH|08lh)TdYxCa(HCq70~{@`-M`!8!n29ik9kTpbAEN7Gz8hfNO(#
zLwu65VEz`snEw*N_Hu|=G=EW!I@_>v*OskYQ=#x6)Vj-q<TL8fB76aoRF~-)zz0CT
z(btrhWs*pHeMLr7Q<Jo?b<?IzXFN9X>gA@JF!0}<u54*>BR<%%Bm@?^Z`%@YMtqKH
z<yN%4=H}+Xe0mKyWq++&PyX~&OX&W!-jT4_*dJ&;)nm0$xQrUo;}f$eUSCREHIj9;
z(C`B@74~bnU_YF|cAzsR#cG2dy=iBsN&9`SJc)Dl$PApZWO;e`u_>@x&=|Xix8j|}
z@DDHr6v-1HrLl>cap(8RO==W6&n(PMdEC24xfGRUx1D;|!=oxxNM7h`d4!}JC>0(a
z9;7ODnUVbbe9#HwkeKk7366|%>)Ez;kxN&u)KW;?pt(d|5~UZ_fDlQrHE2%|k;y<<
z_?bs1(=0&B?>Q9L)K}`t^t;^VIU(IXIm~U1u3rUt2fr6C=_Ua>)h75!LPA2~9YRp7
zxCH`IE&;q%LH~<;`0xxHcJQ1JH$ekQZhdnLNnVvUGCw~Lu<F`XzI}r6cY5O_(p!Kh
z!-2;<TB=ej8m5!*`ap353tN#0Q4!5Seo4#^pIInAeE<gvbWlsa!%eiSOmCQnliNiI
zjq%Q@KGh>3oycRGnT7koI_aP#M_EE=a1{7&#md#P4%IKEY<4rB6LSS~9C#x^FE6uK
z-25E27wt3>iGhpoLPE=(iU&|uKF-E46?3b+JPTSH;lOru9?I}{3P)ebzpFOjoYsJs
z#V+?&Edft5q8xdVy3=~K6Tr@=ZX-xUEjOe`z7GDeYs0N?6~lzFUWF#Vwd!3A1WywW
z1|F&BDp<fSx|CCnsxMC8#X)3|aK13H;N##i5*8d>hp-4Z-o<wc#qMTzMZCn%GDre|
zR^w-w{7=twMpEYTuub^X2O6u`iQPdn4D|;YPG@P~O<=2IfZ54e_q-)tYbzi8{AtAa
zdNn;$zL_4cYE<b`db88eiK1hcy}Qb27K4L>kX0)l^M;u`m$@nhDS7;ZTW6_1<@Y`<
zGZd}S|K7fh<)XOuxY^*4eR|BR0}A57wnH`OR6q^MZYHI)M1dDYO4aizHZ8UQ&U2<s
zD^AbO5;0jY)vV?sr-H2p`PT?ii{XG0V)1N{2|720i6c^gH3NWQDA6~&$~kW8I6je+
zzgn1&Pn1{T#ux$ykmZ=ILawAuuR1UR?XX}dVjT3Nb{+Q_xpomPMx4R;Uez=N5X7GN
z$4rVi8H+meoNE4~G>dgg&yLr>II||Clbn_i?C-##NInR1%Bj8`5F~vuJzsS`({;gd
z;jkzkxzyXFIX@?H7p3x}3&?HCZx_Tbs>T7*S}?X4^=LMFi5A4ChxGmxE0XUxVRG@}
zMIy0HFlQn>%7eHQ{6Fj41(~$&Yj1D={{1@;VN|GbM-j46e6Qvf7M6T)!kZ<gPfq;g
z04+@{<;pdirsw8x*3p4zl8n$SUzp&NI&$O)Qa!+<|IBx!B!V;Bp#?I(8C?io)ETM=
zXoETQj)sq{$CdyGQ6|n8eKr!e?KdK{o1lI1z0C!A$g2K_v<sbc(4u1b&^y1-HW37r
z6mfRfN_BQ|IRIc7YD{!IpngG|ps*p4qAw`jwsbsSJ?NlHdqPTK1DY*JnKpGbj7&!^
z-&stbN9Tyngk%#BWi!e39`Dh4036C72U+m=@#Ey@ch_%Mt<*oAtMbQ-v8<GodHMR<
zT3hQPzu~n0h^oXHLtJHor9=V%jOs;Y*}UiY@c6j1>D#bRc+R>MgB0cg^tJ;nR7u`T
za*+KlUTh`M27p@FQ#62VKA!&jSXm=bdlu00BM)MStluea8SAc`d%K1;-MrBjHE+j`
z9RhA(NTQq=XTfM8-|j04KjD-)Pt!|$EG^(+C;=vF7$~JC;v=>j$q(x_IXS7CycAV{
z7z1k{FCy>~QCoA4#%K=`9JP?lMSetf#Rg3-<0_#k$eHOz{<hMe{IzoNs}PS!!7tHo
zfGp*#c;GPBU6vcwTeDYG^g>K&O^p>`Gu$oLk*@$^Y_h^ZUt2=Yq=3MDb*Tt_+bjgk
zp!eoiuCVpx@Ho;W#IRo%vMn#Ya~5@5bUuIH5BmxnJzggrvV?O@;gf<r<8i#-tx2pT
z&?%le@JI@J3Gf2qc7y1}jY3Xpl~YWArQ|nH2;4i0V8zPh7ZgOqhNPqnfgeVTP2z9%
z2c%(S5K^j&_;^qXMvL5SXsi&ePL7VfOdxOw8Zvk3?CeEz^8%nj7<fKKNG?HvxBztz
zdxS<gh<(eWoZU=Jp@)t9C*6Mpfke)MZp7tW+uSa2cSV_VU{0*GY@V}WGbQ&+sfpjK
z(NgPGfB#+DPqI1mz{iJv)26Qm>z4+eMW-G_g$76P8YD47-w9<FC88eY8RXVYtP*Bd
zu8e^J7W56M*uTL4uQNZHoup^7IMxuy7U+g5v|)o67OMOS8iBf+n$h{0F<V<(0r^@9
zrr%4^cow~G=}DyNqyUj5<kkejAx3;HyRO{5-&Ix)Km#O|g-NTW8&xCqQGWYa{`^Ke
z$`Lov#`+e)P#k9zYyCeE@}xLn)_U@+wY3$@CCHB%h)Bi`k1w1(Ta4UKz(u?(y72j|
z50u{m?#cD&(&%D7pc(%7m=_TOI|jT-3+YHa_&6X=M8(A&?d@d;uw#G%I2#DXOd!sl
z7zj6Lzg6+9Y~~<Kk{#Fl`Yd!kgeU5vBj|qAt>gefA5LT$6i!I4AF!Cv)N?>E;6W--
zfNG-TpjH#Iwz}O23Mhz7w>7I*Q=0!g;q3CK+JoaqoGGHh8K=C&{-Uk-xqtus!f)%E
zyEWmrIea2Fflw9__h$$uz;lC+st9rR@b{DLEg;-83d)w2!w^e>9`#}r7`G=zAA}$Z
zlf?|Sj9)Kz+duz2pZ(*AvmltZH{&ph9Cup;A=?4Qavl%)!JDxb<Ootd+(fUTWuY*e
zqqG8IfFv3R9j)}_@Flo5&;fxZ&>Z;vd0KszKhJF(-TKBxs0<5V;?>Y4zfMmlGB*GT
zgagvf-w!;j@rUXn{>A@$_uTK7qx=8FsOP@1ysoaUzP^4Hox4a8jV1&zH}I>~Iw=kL
zdhZoaFE4OL`mk_-8AjK5d>elAVyWN0Q9JBEB&CPGz8c5&EkC8-5q#v*3zsinhJvIH
zsR^ahq8SYq#GNlnYnOkAyb(B0;PKC&KS9&OPouNIL#ZbJMYmTkez&&<YB{oGitXv;
z-`#r!@YwJ5Ss59-o*EADxJ*8rz&}Woyz1aa)Hpi~&`BcdmfV&S&O>??h)L1S8C{xd
zSps8WxY|p4Q6ujB3vl?U-U=>OcNC-$s})zOw?QmMf0Szd#pGIhXC8kGlY?56?3SY!
zYCE~rUSEDc)$F9~B76$nHGwzyTur~dY6C3)?~kx!VLAzCp*BVls>iF;RPn2+O7La@
z=MhcZ%qWM~&MNJ+t8a5{HlSu+%uN9b1>J9j9{@#E8H_{81*z%jy5Iy+OALkJbJN()
zDXVcb<T2nqK8F?99RXgL0W@v!uX(lhBR+KybT6f-{00(@)>NUsuVtE7yGOe=pbJXH
zp#qKy9S`Ls&lBb%WT0|^fQ(Pu>e6dtmBAV10#E0DY$dV=zDnKk2Qts>hz{uFq{Kw^
zyPi(-(`7!)n*9S+tJbt^*x<Blt5wT3gBLG0cN&^HbvGC2oI3T^q(R|3fH73uFKZZf
zGBY~?HVqG3PSh7WI5^-`v{2o?){dFjXX^!IRIBTcy4c;!n{Iu({o1vi=mCYyIR}AC
zKy8y)6#~=J#zb12!2n*>o6ocx(kJ~oX9BB%iy6IK=QY4l0RY{(dpBM@a61dj{P2sW
zX!+Rir%DTRDGSu4TzpG2F4SFIsH1)TI@^%pwP#P&m(Gw>Kx(AXW1^yW&?M~-+zz$y
zpMNaTQCV16kjUkoUPJx;R%6{sYc?nTdpl)mZs^Kw;$a`2IKdB`^7ZRvGvJINLu}0F
zM`GgQP|9dgBA+rdGXZSbe-To9i}n+d`NVX7vi0rKdkbIR*vpsq%+IA1QI{G*x<Bgc
zXIbdffBT2ZxcjD0%V0~E>&UzA7PsB>U!~O?#2oFPQg8m)I1;8pBout@y$zzv?=^mX
z%4@pPehZbc58rqF_6z#G#UDy9+;8!olbXMpkM9%s?)_&Yi5(^L6kC)m>~}q?kMFbi
zF8!NnBwG^4ZAZIEhbvx{zg^^t3%;}crnUq`iKX5!5_W@%SKT=h_PP+?xBMmo8Cgb{
z-M!HnXB*&E@jw@d@ArQh58XHVPSc+(IX!>%J6^Q|50pr}I#DL^b#gVh;k{S(xgH(F
ztB&A-zT*24EZYBm-2dI({|)B<pU&=k=Z-87xV9YTr{}3l60=hV*UbN#a#ML6UqDXZ
zZDyY2+2ZXtQ(~cU>sB4IXxT+`!Jy#Uv}-$&E1ia#SMu}o3psG&pcAK-?uj^&E#w2H
zE8o4_51>E`Nd)KY<n-a@k3@5`Nhe4BwHxvx3s&=$aR_jZ%u+?$KJ88b-UOi)&skO6
zl<!bmR#vuARe#H_UG{D7R)O}MsDD(pv*rE!iLXhGQ-fMFa|S{a2`y&kRruvOAVAb#
zFE1}O2IEu$t^KJre>W941^-S%-Y`O+EP2UF1;iW#m4DSTB@+e7&JM27#RQc|@eEV9
zZ0jDf%!dx}+*4zD6sMV4eK~uJ>FPNB#YIh&QoODdKmW~A`(m_*cpviWLn&)FZ7Kvq
z9}y8TYgYd9<;y*iu4bmDP7{>7X=yaCopk|;4>(5xhEly}iaca2S|rlU8+~EYaf3Vy
zPDld}{4_iq(3<a~ERX~+%@8eN=byZ~gUG8=lCDH62`m6p{s~yLUdQyTNgARqxmG+m
zf@b7X$Wa;aBNB7{fvyXMOcMD^pI@|a<gea5*qCB4G*mcuuK8y$bDQZK_d;}uX!{@W
z><keXiszKgvc9*GQ2?5{*2$Q>&~;7!`tf@y_zrSMavxC<SR74aJaV}cD+TM%QOk=F
zmx=<CJz_=!j<5>;Y+PKJ19Pt-Y>J*bsImcUS0dG&>_|vKVfWEWP4?9(f0gdgbr#S#
zU1D2&e@m(nnXzZRO$KKtoGJYP8epE_Z-@e0-d`X2KXF|Dw<CD5UpNl<iXZ%w6K67v
z7~q=uL2eJmHe(rsv6l<QQMYTfN2Rwjax<P`bPHiQdO`3sXDrBBf>@7G3`sPGr}rQf
zs#&vCGA)2(|3|6EzP{Qs3W45kkj)HVcJ}c@QP6}qAr!AY`WmEM?!XzSkz|G!T;4%E
zOd))=3tvk&@?Us$5f5u4-<eh=(Fh8(VcjwiarcI^{$$D4-Mbf>>{_}2Ri_dT0??|X
z-2!0xZ#4KAE^$y-&;~{D`DTtja~}Ef!yZVLrWfZA?h9}(zNUD+QT%4Qiu+~^<PCcb
z+-A6SR+5;MO$^ig<oXPCl<Gyd@m%mzyt6Ol3h;;B&6{ffg{v)rs|lV7Y9EARp2~|m
z`1R3uoSw;p@qm<W-2*8T4O%^Dqu&hn=jW#&b!*sY*Nk8xqR;0(5}|B!*CP6Fs6q`{
z7O?2fpc7vNUqg6<ZRCT?=in)Do*T%*qhriP8Q~dV#(KwWf7CF7;gNp){$hv=<KyG%
zd92Gx!S51*`R^kiz#s<7XhC3C2zmE}7B^gL)sZq#;Y_|~k3g(|IdC_ml-~Jyvh)e`
zV`$i1X2<=t<>loU8vd>cp;FxfBvu}F9j%<0oV2yFO3lcyv9^9Rlt=lze&a@G^lxDQ
zQ?FI&1Lx!O6VNW#{`&Rn0A=%?fy&@!c5dDJ@?1yR)l;FR8k&pcuhfl8_SWtJwX<_)
z?Bt2%r`=nGj)HEUdFRe4JRMfKCD#T|DjQU?Ve{rC*rGsTs{Yav<5cMw?<FM-fGQC&
zZy0ZVyOI?3p}DybYs=(wm0&~<z6Q#K({LOfX@7rz%C83JO(Fr?RFUJBr*n`4prt|E
zR*80m!5^y)2bJxyW5-B;@4a&0*EcgGV*rpC^j7z$@Pu;=%o5J_&<?;hkIm2AERuf<
zrq$(_`|jmS^)1Vv!rhb5MWgnEk*lg2!a^eD*dkn_N1`zGl#E^!Plzl+5q!Ni>B*B_
z6O8VR{wb3<onT4Oi>a$z#$yBxoWUL&%3t0^)kCiamKY7jO&gn_0Z%TU15JH#Rm*Qi
z7vqjp>z4~qy^FVq^#hu6ut@r7ywE~bJ{407;>>hgS_DuB-@qii=HhBH!@ib5GPO0e
z=^L65IHJMg#XQ&=I3Nv13vq_g6x*UawR`vO!7x5IGZX)RztOPv<ttYf78cCS%-}H!
zbm3FS{0O>FhzdgBryNqwtsrl_apMMJ-+p#H9%E%(=gcq#02_n_EYDzOFy}%t&WDac
zzgs*VEEjcQQpd<Bj_cQW*5T^_#O~IC{Tckt&CTfiX-0yGLlr4cViBMqA}70!wBP0W
z%kL8Gpch*TU2vfN&F{7;az<0|6sap_2J?mpg~d1@OuDIQA5>dHo@i@pqX_QFO8k3y
z*@o65+qcp`@bVfP86k)${15)Cc<k_TdrRyvhT3}C+uv1n(T#(VGzJqvMDpAam7YH$
zsPZEmeu7Mj5a)5GNb!5z+?LRMiyk`$E;!ZUSEFP>4E41R$W8tjf(Of3Fchr#afi|3
zS1ZA|pfji1kGvaxah^`VH!kkrgwjKd2;o%;%jQcdFLK0YI|MO*;q+zLUpBK!czb%P
zM2}$cqq9=Y<tEGZeudf+F=#Z*_r9b=TU(oOXkuYWQl7lJ*~1W)mMxo5FQ)s%+`V}q
zQ&v}xKzoHTTS52*%%-oUBg??$!dpx7e+J$}OG~RP^L<m(iF*6Z%dg)`C0d|-dF&|W
zhTtlckdVN^f)Zsa7z&XYPLZ17_1n=q9yoBo&dzRv@#Ja-e8C`->LmY6^u|jteyEm@
zeZ0A9Zo->|Sks`W8-oucj7iZW)-Fo-yRz*#mfubG7!ZuR3QP<wuuQvR=nYa}Q3Mqn
z(xD7QFtOoa>=7!wSVB--2(lyfUX9SI^dWa(%q``@>vzMFbg(TJf>H)`N-)Ya?+D9Z
zD*aF5VD8Ghe}64zoXE8q(9s@oYx04*fLl^1f8yz*<1Vvb;C%=k>kxHk$20)u)efWh
zgPJO}l@2O_(AtcqII`LZh7(M;aFCezam?%Lrcf3^cTa(jieCOKblOCV$3UDt@OrkG
zi$hJnH}e$MFFfbmL|+!h5BK!{-5T_r>gI+C7L-k9IKc`E3b=fBGBI&AMu1=k?KMV-
z<?711x=*dyvJWrQSMD2$F7M(y03T4l$UuRLb%f&&AOk@PkU*%9s&ulqkzDHYr;Ql(
znSXS3WuO@O5c6(wP}WG44^>qb$l3(A?6!D(9n11lGb&1ZxAgb-W0vL>BrBroV~w#}
z@b=fiUxUHG>(gIc=-hj9L92tZ1=XI5`c`C6g>wz=q!D5R2%i)13<v#nlIf0zM@xZ|
zW+v~u;RextcL6Etj07=bN|JKK!-Hb7Lyki@TAK4Mzkl}+y%GzHnIp&b_4QF1uq%Yj
z1lkF7F`?OlH*x`n1LbK9dJFG|d8+8#)pSn^-@JK)P{UCLhCKwIM^FiPF$l(K(vikU
zJRn)s<DY>N@3}ooN9Re{zGKe#9uBM=+P!->_(g4$Er=O$`%lyi!$l6LT7>0?3Zx#t
zrzht(0juzt`C$toH)CKfDM^{5yS4Rsu08knrY6Fq5v#OY@c}Wo22#4B2`tP9ALc2T
zRyXfDOlSr{y*a<;nr`4gKYzZL^f#R`Mi$+$2QY>;)Yr%FKY`N)nlkt{aJ5r2)y*KN
zB(UQLVs5a7YTz3Zal$F)+%N3YW1lvnqo7a$iy%}b7rpFg3y8OrNRcY+DuM~5ky??f
zCra{UPpwSGistyz(o!tZUS0>{Y(7reu}WZV{i#ydUQpd-5+TMASyJsv9~}y8d)RS$
z@&+6TP|ohv(N>%+C;yOu$qH5rNHc<a_nt&CUbhaaq7twgRI{wBl}sdxjPS7<9~Smq
z%^JT5)?K$nn5me~b4J|21zO#uGwV3nA204$1f>GT3H9eER|vHd?0HPHF=nbXDU8EP
z3z!T+p-92DLm}XXi5MnDbPJ?4dl!l^?PnBU<@ndil|(E;jeNvKD*yOV9_xyY$Aj1n
zG)y2O$#Zmc{A|n-pFe*NUhu$><7b#C$a89lRHTr&8he<J;4L5|h;Og<i6|{|>u*F0
z-cIu#KR%C{2p}x=YK_Z~(J&XS8D1y{?fIP5j2_mMaQwl?gse9TCJNxI0h<H;8Uj)l
z#zJTt?PD<tx3ACSDzC%Qi*MWs&(E6Hr27vZSlze*m{|cR(N(}jO9Om^qYOjMa+92L
zd?(wiNOUP|oSY>HUf9}^OOR?Qg3rwS;TFK8DWA+*h-Hynie{*HI6gw(#ec;?RtJ5F
z1t`ki?>S>jU3z6Rr~pGP)TJ1==i^gT2HBP`n4&b$mt~pNLnnHfdw&XJy=&I2LAIV?
zw2vh!zlK&4x)n5$hlNokvFPfkKZx*+cGn;hp0NJ;86m<d;k;|d4n$vThLns<3yP%&
ztLyY+qs7u}ANm5BOj*d?FgPr^uUHvSkd}-=1)#Ssi_|5ZU)fN<CG0^9P$)og;>(o-
zC-z{P=RCBq39ZO@SP?TaCc=DM5MW;loa}^TmkqB_Y1M7qx9C6s)i%wTof=Y}U%e{~
zZP7<f8&nb`rt?ycNPDp2YeJRBA)1|?rPSD`&UJX+pj%8s^;cF_mXVPuGVM4kD_ctV
zb3SZ_EU78wxm(ooB242@VXSRzg!1hM!z3h@17R<lz1m3F-Mdo2G}dLe;^33O_T&G9
z4ykeKmC3NWq(eX!S?K6MR+m_uzS8uM6w(khq4-`pHtG4*PjZp4cEY=gqJpX+m|t&Y
zY55BFi?A>qS=qH>Ebi9ZVqGYNb>v#b6UZAoNTJ_g4e$C%j6K4TO+Zz_XXtFro<rT=
zx@F6$ZNEa)ZA`j73&cGBX5ZzN;h>9m!|;Wwy>6s&X>p2*<Vx*nVSyr~g~QeK&wD^<
z3=gR9zE})CLk$&x82y8NNL);ev3Y&~MLabUqUA6I=z;!z^+R+~#9%1qz{RZW>u<Nf
zp8F6k9T=#Qoa%>-bTjpkA$indDxm+~2EaPBytVe*E!bUkAS6GnN%(#;at3okXumKH
zCgZ)!{~s#EsD8xC;ru4W*-(__>z3k}aZ}muegm~wK@XYK*}Nb>e`5;I7RU`a{Lh^8
zU?{sj{Y}Mq6rvEK03!z+jVyHf9(j3rK0btG8c_KI^#DSiO8rSfH@-I#2I<qlZ9xc!
z4tSpNt5wFYf+pU>N_B8_6oz32$FJc_>rw@x^u5<kq*{#Z$lfO=ooaE4tsk}oJRMs?
zzRrEyQ~D(C!BXdh+xfNY*E^1OdIFju(_S|Qu~CP~3n*MbLl_s{Klc68r$G=QJK-CK
zM;kHt^yyQiDAGiNYzK;;2YkujF%LjAy6^)SJI{_AGwmFKqPz!<#6W`(V<SFtLqkLP
z`p8~=9d-3b_>2`MdP|1mWOh`h+Ah{y`fI*aDz(Ca@hcwN@PYvEX!Lm-{@^G{7(3NW
zlfD91kXF&9wRU%BqW2`!H*IaE=Fm~Z14dJfXcQVuP~^tAa|Z1bQ;Ku~kJLq&tj4op
zI072~xFV{}jgClW7$LQ?tbzTi{zAO!39CeI9pN6iT-NW)a^1z#H8A9?U$6c8vedhU
zJ!#~!QLGeZ?d5|aB3j^2+S)EsjkgiGF@Y#AB@_}k+mKAzr{1u@nu}@}&E*L+ff?Wn
zOG|EOnNa)>bmeM?++lx9LKLK=qyz>ATH68-pl$ouf-QkM`g2KX-vYpA^+YdTj7Yy2
zR4M_}fwVM~4jyF`f+2DcF+h`%p8n`rc3z$b1c}KMK0(1RZ{M~7YvGWyV5<S!YT-)7
zboeNQ;PAtj-l27@dMd^i$aeFPsOU6Q9)Vlfq#W={6(QROS8>T}#Hbw0N=8R37XxR6
zuIBdb+fiW{;Cn}vRt^=6hoKF1qz?nH3Xux^$diUQ^82TDhIl}YfI1llG=~0)7(Qfd
zgicZRug<HBw;oAia6!^wW*<GqCJfU7b|r|3a9Yh0Uf?4!ByRCN`$noL;Z#rK_K7D0
z@_Ik4;BIpMXErAkp)g+F(BO!kO5g{itUkgpG0<QGGC{zG@JV>6?eVKn?UC+|O3XzL
z)-+8btfGb?loy;a^3wqe3me>T)GQ6?Oy0iNs9*o3RQTNF6TD}zPbL?Qt<kdneCgud
zV_Yj`4Q83+$PYK-E)TX3W~d5`63*Eyr3ek|OtMy549mZ{xw(}6C#=3tqo&l`GByYO
zD*ZPDK8=8<A%Mxk9r+fNuR_dVGzm$g14EPah02wTK8@dL|NB0o)r3NaJr84(@da9;
z+%hiv05Yaa&<{gv@Y)i-etooE=;0;j`i~w8Zb0R??)y4`kj<q4--hgf8x({C!9HTe
zfK+gqf)Q2+h*1oEJp{VGTyGyAJrpQ}fExM)RPQ){*=izZ!uXAP-cRMQL_Wak5q)>H
zhKrydc8)MHp-iCSroOWJ@hPeAf;I=c$vs4fDll}@_dsGG9hQK9a87sbv;#cA$QcIU
z6&mNrm|?Jh#aNC{D6szEQQhtr6)d#y6<YrSRAhrqb9=%pkd5i2(h4wa_j~oM$ai5f
z%-|UWMB7#)vm4zB9QLx@A?r?e-{Ubj^zgxh01BZPJ_yF>w_XIjT++sacLm{!e~sP(
z2R+#EQIurr*4}$@%;^&GK@QmfWwf1iF&MnOh9uypR|V#hPiHmwtW2>~7eX<$YjFW$
z5+bdqv$)GrmYthRFgG{^_hf{uEJf`Gb;U&eZ|`VwYvpJ|X2HVXP=8!;Gj$z{=J;|>
zs5s+TVqwK40VICMU9nlvqFHyzDgx=O*I)tmt{lMnxZLrZ*j$*|U@MTK=QMYP0~s!O
zniqzm0Ko7MNpC(wCYORV4~KIeeho&)Pk_J3?}q1WYB^Y8F`NUtqZf=%n|q{s^KR7P
zs~;aHVHpM15>vo#HKh#=xXk4faHib86*c~w)*~H5FkaX)2RNj5pTHFmq+i^553^<g
z@?6<2UnU_6m?D9;S$W}g@s7B!0QO_dd>_?oA)mw(gP8^aAf~FXD&Pb@(FwA#rsHUc
zkB=fK2tb#;3(A*@t;v6rYZ@}mO{b@$*}(%)=LV0_6ihK=rpjk351I<@_6YVtA@;Fe
z@CI)6G%nyyXxp+jBaHBjG=LDqF#3~1aFb|EnpW+<7wqZe;DE`23x#v32gEH~-MJL|
z6?Jtt(TS(}1Vnx(7o`!^dH?SCp#JC?Tv}lz`Up+1*nNTgiR<d>>bTG&)n!@Wdy^h@
zZ9WsY7<TrbqjV|-jy8u>Y_xrSeF=*%jY$zkC0ujUDX2q=4FpX2lB}mge<o~!-61d$
zwr>f?aoLH}%yEQ)f@UlTi*FbBd$?3M6`q{O8V2i?bKaiDd<C{FwolI5dK|zgs#jkH
zge68$xN2YaktmRdYjC7l#H`|wj(JDI2){F~EI?mH%u53NksgJD>L}Nxr>D;V&jtbv
zhlnJ_RQlHmo8CuEL0@pOM+)qBWqfQQ3B;We^Q4H0(nM1L)bgXpF{3N518Qv%KC!r$
zf}ol^k<l0C=hc-ba3c!FFlB9G577P|af9OkjRvvSd9Xd#vlAnm;NQyh7rNWp_JzGg
z-bKx%?5DHm2EhVeq^-BNx4-{s|EWcgCB#Jc8WrG9k$n44@8283tO{1)nTW-+MadEl
zufEP@7*xX3)SiU}M=Dj0UeVB(fJv61&S$q^>_Qi<T)Gtl85l+`w067h6CSRItO7$2
zniBH`(es4i;i?tFA=7^3@`C(GfbPOqEDZ3B4UFnUKO)6n4a@*nJiK|cKv)<78v_6>
z-?a(zc}V@E(xK^iaqvty@S5Qz#L&yT?N|6wtDImJuacNk$neyRlJ&<^p__*)u>xVr
zEI=+L$|8C@a7Ci~+-j<9^m}?mdTx))OzFphs1&Gz&6v1U0g1s4vuNw=TojCG$Ogpa
zCr0c!?E|R47O<XwDR=gRVpEXYW=KY>a)nZNuB5n_m<`+Uc#-6i8d`RttU(kx8L2uE
z2_6ZWn3$d+S_$@BhB#HQQzSTE!{jw5w*&sGd=OW(glX)u5rl`lsWiRxNvZC+wSO^m
z-&SY^5F#m002h{B#uXjU5;xXd)B7MU;1sQC;-Z*{QQK5$lmq#RRqi=~=6WYjzJUZo
zwqvsZCkTX#IO`MMotmQ-?HH8<j0S2ucWG_|UDP>WTO@sU5Ar%Y(>f%_3@lN3x4bVb
za^~PHK^x&N7vt-fE{)(`3M5W^xvQMZnkLN0aM{xqnh&7%T$)y%vU<jI?aR7-Y8dK6
z#=bgT+h&S!=o7z8iZG7jzO0>1uLwJT8jP%B#>%JHcbOS1wUIGjxwJ6kHhTyXf)=@x
z8+i+fgfM^uNWi8FhfKgHq$cBQ*KqJ)-dC`IBL=?fBJ8~n<|MJZuo-59c7i<y@Sl8t
zv>QY}GGEY^Ma+Gc2lJ<}?v^V8RPCLe6sXAuk27n>QxU`+>|KK)EX$vt_aQ@v6oCT3
zJPxS09Lu(U75ZUm3>7pcDj)4+Ul0bW1$0A>;ze+$$q?aZ!J=ZqrVC{m_+XF7^{0cA
z0Tea!553_U7#1{)LGN)1cT?en6c7MwO$c#sLr;BL?Bd3qHQZVUP0aM)y?y%vt^c~}
z@QO0@^8}4u@?lu>YRJCSXXBWYaw`bpM4ET0=Y6=*LL%fj5G-(s|AaYCB#tLWmGdh+
zAc~ZK-*foln>DP?e(dLU;pkj+(Xs)HMHtZ0z?4$Bxo`KX%Xh!3*pX4l$$9%5gqC;O
zYxdp_<jpaAU^qlT1hR$VA*To;kg<cQWgNFw4hu&+7Bm3I;`W1yvI7wa;+mqOGeIT9
z9UO(u4#<3+*|NT=;ETj2Z9&tsHCr!DNi63EebQ{P1=vAY@;ukCPw)KxZTRmwRBd#M
z%Gpcg#rYX**}(%flv(;|*xRg&Y8WM5^C_~50n@yvt`4NtBgiG77~uCCzkMr}TZEH{
z;Lace8)IGfK?l}TM&>%87@Cen*~S-l?sT^f2u0eP^wk@8J?{-*OS4AOq^Kp~=w%q!
zcH=l>9(?WEwVzMyl6>oSzXgWoQG6<5?C{>h!O#9V%Ogq|dqR9tnXvXB8yd82Oo*0w
zU0qd=H?xQmjpGCC#&~qRC=ML%pE%z2!Q;-IJEht$+?p<dN-z-CC@ZlLP$nM->T||v
z3SNjyN3@}*jQcfDzFnGh;2H*L@DlLjGBrP6N2kxZfB(Dsda?Ss@8w@r?Tn`(O$7{`
z6b=I&1z+{|Z}e}D?F-vmf4@va*2VY7;NT)Ijv#IoICXn9F^#4EkmU|;dawh>hT@A(
zUrw?<dzmX~_8s?ZDO{LrL_5}N^;b2*l-$8;V9<gqqrgR+tkVKp7~RHPU{iq}gV+NE
zaa)LUYJg7*B-3$R3^(}gbx~y{FFQLseA43L;u`Xf%-gqf5c4{tDid8TZs>}mJ_>G9
zmmNdsoS|1v09SyTOKEt6v<zw`N}ML~CJ~lK#J1AMs`Wsel#s8O#~-}`D?Kso+;(W=
zbreBxMe641*p&TalOP8GP7jf<K!;`$w~jN31mVG7#9gwL1($v-Iaq-gB_`=Blt~L#
z0G-I{_f297Qo7+bjq2TsaeVSU3}p7;NG&cd9^x?!kwjlmr_2DY=gH`MXMq+>$Pk0}
zR@|C&vLXH60ZpQS-2|S?{DJcZu9hrA43>e{T|gIRF}`$#u9Z}FBOGlp3K1LgK`{S7
zmcGTE_M|B{*D?tP%}rYTutSfuONpr~&9tN~9|L=r6lQ9f@i5X6UdlyJb}!muViu8H
zWsIVG1dIt`?W;3{+zWDlu(y{&X>muB+IKJdC`fqlVaz2K$bhq$2qhR7w}<5-ZJ@_z
zJsU7cj7GhT>~?x$Y6?VYX0K8L+5u2>s<e1GK-Do+c*r%7qYy2!dW8G|a_2;Zd@xWa
zae-2vEiZ4K6$bFMg=$UeQ@cJU_l}K?)f#*ipnx7fH@BG^<l(vOgKE||arNIn9d>2L
zKA>H7ZJiZBaGSv$U=rhFg@{Y(4G3g+?Ssz_nigfHd);1UhWg;LLeBbyl>T^~3=@vL
zQ4lyVzd^t}yvfS?fJgiO^48`YRVx5p;9g<l8Zt^D0y&+yX$hyJ>-h+B1^&e)$>l(v
zuF@BAg&FV$+B$~8CW!ILp#0~+ef1VY4nVyQ7%qK{HmP)-<@#XTg2M3!Ey()(1sE&F
zn0-J}k~x;;i+e`Z@i|c42ye*NkODPn;liJQ)}ko#w~=5dkF`^_QOhdiu3UEnGlSWj
zpW2=nuZnVEC$3U)dw&7y7dr8n-mRGPC*$c!c1)GTWrE8$Bdo@x_%!Z&+4?N^z{-H=
zi@PX{B^GGlV=3}Jfq`n61yMhm1QZdM+X;o*e#1sPzEh`8VWtqr<Wc_-de;1H3=CH=
z4Ut!y%0fph)?cZ&0?uTBL(tLE;>f!-IyDvCVIr2uBx?D*tthsO<t;q<$VXP0`#sDl
z+m?&-Qg23k7KmW<c<gs}yabJhEbOLLynV}-eLsq@wrYB&{6WYB&nT`dYq(wKptQr<
z`Lef08G}m|MWE^3+}vPG1d(W9U?4U&^zC&d(<|G@&_N{Xr_F((X6wpm@oERU<`_9g
z#7A_H<{+cjSkdaRgqYqxpvUcxM(9z*)mZ%9D>%8DycrDHAd@hrkLfv(xk<UTM$o#Z
zG#yn#;kiVe$GLxLx`<nS(B;++Uk$*-Ob9bRxTa0Ke>5=$KvU)JI<RFc*6jdf6!`Y}
z!=3{lG7S<MHo!<AY9SgLj=80OQo9~iT4+yhq8pZGy#5yPfjUwRvp*U-2o9+(kUL+o
zSd)@<9e}|=JdP{+cCqZ<Juol;j^;PT$3LY#(g?<%n27OOa~7j4fRWL?0TB9b;%`9*
zL_!Bms!Fps>G<9PV!2~<LVN(nj{$)-FVmq<g+G0Y7_*0<3Hmh!+W;hhks_8Om(Sv4
zjR!`dCcu0vjwK}~$JvrFV)d<|fwFw(LnVaZ!_Nge2L}nB1nUW^fVgjj7TpcH9~anp
zn#33UGmL=?RU6Oc5g@iC)Opz#-ul|I!N|144JN5qD=DUY2|sb9=rx1tJX=sMiE&t(
zswvS4@M-LZ^eBChojr=MkK=Zf#>@enI+F46`WWzs`Z-qbadY0JH3CcF7K;%Ec8K9~
zwDYfCzlJW`dA}MxD6)No%Va%<14zb~YkbURtv@_o&V2Jz)4YcdTViLpSU#HoZ&Ru~
z*R5R}hl?{!o@W57iA=GDtGu^>Ujoe-mZca6Qy)DVB7};ZC<WgGkl?MqRv}{s6D{A5
zDlEf0!wdWGPAg9F=dN>IoVliTkitjbtTf-<(}UqeU91#X3|ty^4l4y*1_yx}ZiNEU
zw?~IdQG!?B5<(M6ra_(y8hQ>&Gr>K{uI%}Nw{-&6Jlu%h_Za4gi)f=Z?IQl{e7JDP
zdi_zqX?pi981S&Mvy-$RZUs#P)sk2$GeU3!5KVn3KQr=}?xI=eMV(J-ow_Bc=%uZ4
zRjDq4D@SoxP}z$)5OdJYjrl&z0I_AhdUalE`NVn;P(N5e;0a#zSwVOaOlVxB;Qb4I
zA$OjZ&%%q4JAQTJh>pGeG_FlV=KYQa6LsyQoYOm!hA}Z$hk{gl*mVOvz2Yd(Ysf6|
zx#<qamg!;WG}cLHQComPacKzKN^=ain#_z&S7J5<H~F2%<TZ94Ga%NOyfM5Ud$*zu
z<6h4%yuQ3nP4nehPs}lhHFXg8pCC74+7Wiyiw|(%$X?{^RbJlSx|wELDC3YC3$1%p
zp^9kZy3~&n)%EpS+gG@c963Jh>*G^k)AyLgYzfi{0apZ{SubHFFmngyqsuVM0nRwL
z>ERc#vDdVHBbL+s)mBN+EcfEw3jBXU*+B-m4a<oE-`>4%T3V?1gzLmSrcn?BUBn%8
z?SG7f4W2E4HZU9bG!d^%_za$CKuA#U`Pd<%^*1qByxX`ybsIYZg;U-cATd{?JqROt
zk>pPakNF?M-Di%TFJAoIW=I7Dx~GrWbD(dyuh;?^1{a?~OL)RqA5-?}^rR!gBd{p~
zdNtZi6fGRVT&Tt=xkZ1u+wpO6_2LAff$+brL)xai=?gA1LY2@#3n8YV9_@(%dW}s@
z#2tWW;>#z`2bCP<S^mUNa+kJJq0sVNc=a5b2p8k$00t$o1l`BPWDAc$VLl2wHcAb5
z$U%}ObkYg&f`X!H#ZNDhdx?2{f^#S|BDg?Us1Ots&<+qGE&$mhbGhIW4e*oboC(v^
zadN32`YTGZ!5%7BCk`1I2?)!akehxaY+A7-3D5_3b`YZtXmB8MQ7e8doqVi`RvfpL
zJQ~!b68`T}vez}ZcR-HdsKKwH8^k#|J#s~ieRz2I@b|tI?$rT`k6A`wRMh=+57g32
zI8AUD3rls`A$Rb=ZCjp)g@v(v*3YxWHM88jYrZWfj*cmVb`h8*(U_eNUY}nGroy1W
zk@V~H4uI>&3I9^nEMSbwC|*FWBN%c(O{_FMLkfB#H(13m7}+6$n<v;ubeJp_L*AIR
zXQ5dWA?T5)YGhEE7(>tj0uf6q84Hk9t~X{@T9RP<a9`pP7M{d8L$)C9?nK9dw3h0_
zOBCqDz^3En$)7DP*3xmdA*B#P8Sn@$Z&dex2B%%A*lDzVU9akgwLYcx1a{QG<5Dl2
z%DC*lQ5z{=K9LY+L6N0gzE!6|b#*Z{HKk3BPhwP9%)B|(P#!0h<dj4ZM2r~-`7gLf
z8WZiDP7xs}*pt;xag86_MU<7R*hL}~CQltZbU18!08$L7c}<*Tq|6x@#>n627ZY&(
z9XX8;3EqBp>V{2_bbw1QTzJCu;6Ppuw5IZXx6DS+ibtMf2pmXjOR1r|xRu;@KxPQA
zyZ7d0?7RQ%PJ~oHQH}kSl~_9ur-GHTO1H4@lV8qSHypdB2VnF<sMSdQmBO~K^pIxq
zcl0#sEwzn#4_W{ho^{sSv%<Roe}ukmc~TX|7{V+HRVwxOP|L*TF)5fNUV|`vOp#|!
z^K2n2fLBZqui13^Y6eAKa|nnNSKhUy(C97-lSO_E3=~`{T3s((*iV%MPe6>K0#r*n
zjNbXdzT)r!(2Q6j99=5hWE-nAU{<hMG7+|HJqa8G=LfFdMh!y#AylkoTikGRf%bg&
z&!3{Wc}Q>1UW7RbpT##N4zUkrgH-U@2n<>#ZX^+MC$=aHare{X(Wonq817>-_HHRA
zWGESJjJdch&SPSAB|Zf>QG>A~_QvCzIz$-xsIhd1EmC8h;ND6|=tB!aQn?HQIB?(+
zdTdOrsQd4!Ka0l0-qDdsB8P#_J7n>OD+FXq=v<)TKswo?hjn#zr3mWdswh-h$?4YH
z&~s{V(N<8eKifP?_o~&aV@CcDUuPbdbH4un+t|jS#x5n1%9f=lNy->Yku6b{Y%L-p
zv`EX$*tbd>D$F26mO`l1$kL7yl1jRhl2R$H`aR!e&i9=2{XM?tpYwQ}Gt+(FpU?Y!
zU9anPy{^|ax%D@BkG4>E7n5il#O*Gg!l)LRhUoB%cb-3<X<IY8yo<)%5W~owyz_)F
zhTzQ?ULvaUk1pDN(a^Q2mI4z;5QH6K9^N#t6NWGQ0o<34+z|Lq%&cIkvAU@il;Lo7
zutd(>%<L5}WW<syqjaM!zwU>pCB<1pSnj`cX~R;-d6HElhA1mz-9!mfQdVYHH>eY8
z7uc{wG89i;TDRQ4^jU87!t_Fh0&j2YFOFE=i6!vZG;4872^(*)flh8q!Kq=CP0uI>
zv$}?(2#)>J<ZlcI(0<Lo`TS^oZA43vwqI?Xak8kk0QcQjL|PvP+=HJk1T0k@7>7JC
z(%`or!gLRZlKk!8{r0=PrhDcoth=tp)mBw4+%EB6Fnz|10T%UtR`Wk4zldO>D#B@Y
zZMH*1QlF&qdF|r2b?n#?)tE8!isb$z#nDU6%sw1Z0~^^okLcZ_M<urc&h^S+F<IjI
zr3M=c2Er)N9CMR`_-hY|IE!*e3PZ=zgD)ThElRHJxBbcqBX?X1SW4GsNA{E5dk8)+
z;c2oo9@c$=H(j~2a(C(6k7A+|TjaO#?Xu>ioGpw3=YJS;m8;r>O=Z~V<`^8qK;%3d
ztnilnDLN99B%Z%PTP5GSNbd)5sP)D+S*D2DPvI~3Bt-Y|nepw8`M!E(rnAR`Fu{y?
z#Nz;Z1_D?L@(E$Q>DgjRIA$yTw<*aR_UqTLjS6($XnQ!HOuh(Gw@=4)(D-%eA!;B<
zFWp<`hPxOt^CjC`{W{1ors_8-+G!u1E?u}4zLQjPAz=6;dnU&nPF}v7*?=8ihJ)HX
zSy?X{+7s+v&7Y8|Q6jL)Mj;*54QJq5*qmTT#8HLS?9j0z@|ZkpX6VB_^r&e+5p}MV
zN+g}g{tjF*aEWSTSrly~F?ILr{+{$%13$%#I2>rHmeR*Tl9~i#I1lhHP3)oLgto#m
z1^Wp@o!8I|F$JF{NxjWpClB{mI1xG^{d#3<Aa}Dpkl)nY9E~3zGP)H#m55rd)$ff>
zn@i!818{528nf~CcB*F6z$;uYRkaKJ$pyH*KpBbrpA{RNT1+K?AYLj=2h>dt<?jlf
zCFE4w!=5D?&`lbxe5$PEdaynnVbM~<{W}3_@AT^jnk99{kOyaAyuwUAb=(Yz?p-tD
zlYR$m<!RJA!3uJ{DSF4-)oB$9C+noYmT(N(A3uy~kGEM^Py;P3;i$n$fQcDAcyQSG
zJV1`6$6a7&_J;m1e(=m5`(|mfxtQjD4N8Ij6BD!<&Kw;4Gk@X8(}`Z?d{5QQcjJ4W
zEZ`~A{ZgxTGEr%vS3c;FG<If?oirt|f=SD(TPs2#uRnfES$H0#1ROGHI}x-gU&fh@
z1$jaDq8ORw7|PIgQhgZCs-y*~qBE}_%+_)D?PaZ_@*-~bpTjs_5Io!P(g6o28tjgZ
zZKkY)zaGEt>1ncNSb0y)nz}S%J<Y3z$RVUL+7<!zZ;Og3fB(Fzsbq>PB%Blf`g6VQ
z^ZGV}3i3BLIdbZoZ39ahuu+8OT69y<+=CKs+O%m|HWJTv2rotB^4Y=j=g$}1`U=Dp
z&;4+CnTl28Rpi~}O1LxKx?!6Q<mqBK@r}R9(ACag8U+*z7fzcBLxE)G2-{SVQhp+9
zQ9uG*!i{>ND)TYvcI%V~cN(Xk7ixFzyqA(n_3Qw8R^^2I2(OyC(WG}V#c@~h0GMd3
zdcVERohwGTZ$*l}8aF3l^n#upX^Wei+qpl?)O8-xT#7|zjAms+R+#_L>6wN)?!7cF
ziwRU=6!TQn%2cqk22o@E<uT!8;@NXk)*au`q$+KS<CGePGA{lX`x$g-Nd-5h{P^+x
z&L8Arc~(MpfH}*;?&D9;zmBV}6L^fgY7(+ODWfbuE^gE&Ta`jp<uUfu=rr44nw)sH
zSv@7651_A{59HCg?~~9eL0KVNC-2Ty8%{$+A$7!}a}w`%i8G!&d{{(Mb+}N1$)QnU
z$IhKovW>-E=3tk(4Und$VCV{`kkL!W(X>@`>OJmk&o~A>MUPSci8B!kIC|pI&mXO5
z6J2O=j-(ryis?w!xl81U{k+HCBNolN`7#;aiPQ@7@+I5m)OIcv@CFbk8a2#WV-R!U
zRBTDyyb12Uk?#l+6wZ&srmhhhz@9Tp5`X0O{_6Hr<BvLZ#*X^>rmoIXvfzsf;acQf
zhz716h2s}=My~X;aD^!`3;T&Cs&eREts`~D!BgBO!Tp78`1IEDm*fEToYPa=o9`5=
z;W0jQ77@9u4ll*!8e<mc>9`DXWFs{FR|FMgWw6G9)SAu+RoSp}?Fqwje<)l{*7-en
zOaJ#a3q`)xIWLMPUX1BQ#`jm{wk&6Od~mkM%C{b^-T}w1FM1aRRa3e$bn)%Y1!SWc
zcqNp!lyb2728;EwW@sQk6}NQYBYRAopkYuh$CXZB!&!U!#I+}_{t8@tH(==05WELJ
zl3xd+l%U2Goz^sqa=MSFf+abxUw=d0h`Ds9upNO4zWWGs2`QKBxMW9T6~w)d_!Xa*
zSRC*ZV~lReS3)-nN9d5p_J9MyLOKq$YDTPWbN?NvNA_s5*IJ3e>m=)ywdeQ9d+6#$
zLt`geOmp-D{J|AQMn>B0@>0+l5<MBAshk134~YLlbky?AEqCCQqm(62LuMaQ)LYu8
z#K&0ZClTW3kSUV_7W<3-zUQ4;!`-)T*<$GMn;5C#B!z{oOn|>>{8DmeN0@)@toQzN
zLMEAZH<&%QDWiYfM$92-P=y_zkqK0zk8|<vc;C!tAUD#@)EbrPKpPm%6f!wJ(V?d*
zV`v*u;?L4?&lJj7)I%p=HYl+m8HYa5B2gsq1^^axbzcH<bW*bPUOi&>$;;p7lHIm7
z8@`}I1*)E#l$AGT(cGh%{o}BUS~MXOJH{Yr#yLKzE?INV_>{c9w)&5-*<$zrp2J-9
zTrWLd=nop;ekU1yV>AknYWei7OuXeL6!gTs%nbW8T!``1WJ+Otkz9Xy`9|b)#1Ub%
zd(&mVXwqr;nrgDhr>d%I5{e#xj@6)z{jU+WIr8D;SHkT*kCuBR*nnJZ$+5jdmrbt!
zP+W{$^RA#0vNseWh?J&Im$523o%>nA<OD@l9R-;~-}mp|w<&$&x1H@B$DcD!-zQE7
z>{TGdE>DY^%w+r3nO~P*LPu(NN*DpPn$Bfp5&F4Xr{#@+y(kQQ9@TB6GzSG`8oSae
zL`P{~cdhcqzC(xnwp^fj`X%|Z!zCaS!%f$4k%UhZUakDSA;xIg7=BYv@OQDGbxcO*
zn@>0#mv3mpZx9xR%quXal+UaCURKkxt^tud(3EPPDdaN-hxaZ<A89(>0W|WB6*mFH
zO=dh={OArpihhPsin0R4pde}l8Ja+V630S$#-aIeowhzYW4iB7J%CJ=_&+=A+>EcI
z4xpm~5E;L>6oKJeN;k~4E{*Cq*q+&=(HnMuF@Nt!3zRcT?jLZxC9Gd30E!2jh<Ip*
zUp0(0v`LZJxEMH1ID4ay#v3GIp(=6PoSaVKhdpQa<-Hk`5rJvE9zsOQ=vCiyKVAum
zQKl0lk{Cn7+C)-j#F@a24q}3B<wc_!8eVVc;yDWP+V)LQd(ZlDZzP0}?)}G}CVB!G
z0+lW3jm#Y{ofXaT0ea@$bBji5)j0#G2elb-+_aVYS~X|kfqc@05UnrS0MdbUCjcA|
zbJe521a_SFp&oK;D?>Uj<IbP^le9hS$@Xd4*Vpca(I4PZzXK&XzedcTb+>wr+lHlh
z&s(={U55ID7dC=+4;O4jsR?h6mq{QjAbs$~>C;+l7h=S65`kq0d=d)E$}X2?h(`aS
zs!+FImy@J<h17HEqeg98tJ1ZcW13_!$Qr}>Dss4n?72T*#d*YCUP3WQg{D!wy}Q+7
zGjsDhNW=&OchuU0E7$X*#LxzpH+d-?Z963V=pcB|E-=F|RhK%AQOk6o2e4~`QQ}$R
z$F<1F%$4#88$xRHS6dlS2+Bhl!!w`-i$qm)1MmiTpxJiDPw*m(<+FxM-m3r9y}N(&
z>p@HJdYm!*Mdp;{`7w<lyovKg`HLk=(|mkK(J)QW{2TR{j?qg!9alb)km=?11a`H^
zQYa0>5+yBP1Q2;U&}g`DMg6f$moAJ=WF44O{##DV;ou*Wh6h}Unxt`AdyAu=<uKcM
zb<&-{rR5VckK}!v6MdsQECY2goDP&e`9*q_nitT3JjK!=Ojo_c%=+el&Fd~a53M{9
zyQGT4Pb>@jZ0!0mg(f~tkwi0<%UynXG~#f|>`A_rOVWOsc1}%WJC9dm{_*OtB9D+h
zcgHbp5?Eh>td2IQ+3dW;rohN%xQ?L*-&$EN{nGF7ms<ZvYDuq;)z&Lnj%XWH!%fiY
z#wiqVXr1I-%stL7-%+D_Z;HfoQPTS*j;0Yy`s~r|n7xC=G=@=^1Rcgnjc$+ZAv-2g
zuCw=QmFRYU_aPUqWTLn_!XVmBZubVr6V4Rm%Xy<-0*Y;t9;-JFo+H>igD{Tusz=hH
zj*v`u2X&avK|r-Q#uQO=#<b<jg<S<Fy%9|d-hvkv>d`M1wly3QPT%{FA1^WT@LG3X
z;+|(YIl8PO>Qi$4=FNd9S7`ZB11&Q3dnJT}=&7g=6COK?+!epfpebPLMv$QJWGx7q
zkqO_&SdrLW<?YS{2koa5W&SU)yGLE)H?Wd=y_<*9kwb@&gS*i?2IOSAchr|ycHqKu
zG6l^Iyk{~GEaM-(0n=oQp-#SzI$y;+C&<o9Go@&YI52q~-f8>7hkmT67-Qpa8*}{6
zZT2=cFC%T{Z7dJPe*18aMLWsofF#8`P!j|)RI7`o@8Go*gKYT}672aRIpAD~x3@Q<
zD?xi;=fcnxJ>f*d`8;QgE=LZ$l;O;a2OA(TB9PD<Z|iwkbgT?Y>e{Uv!iQ(13tXM;
zoJ)`G3f2=m>D*t77Mb*m*-s-!#OCe1puEx9x@wK{#^RO*;`7t1p-K^ct336qpM-%`
z_y)3uR3Z6uTz@ct$aJ7xv5-PAF|BR3){kV24mF1j>Dq`DKKzpeyR=jKE1l%~GHf8L
zK6B<{9_m$oG;$^3P~@Y$SIfx+_UgX5ibV40J^!+BW&!FT{Zo#1H62hvrG$<EW5};!
zBLLGqAiP=avoE}U^-5sIv16Zp9;8HlWda#bS_F+`eSTMn-HRw2nI*``(8$(Z)(U2n
z+%;VYwt_bZRw#|QK{g<Rw_I8lRZgoV4~5f_rKBW|%of_|+hmVD`wE{UrgGeQNN0$^
z1yboYVlSwn|CAH6ezH;<9bH8#;fpNwf5a5LuWA?B;KII{5^tr|zI74uvr%;mAtOH*
zV9y&_bgq&~A)=i*7GY%4q{U19OS^RM&KRxqk-xYqxN=xmF(1Q86%5IW-~gfRM8hd2
z^juy|lt@%(%1Cf(V$)Ee*pS4*gAB8@l%j7UPu+kN{Pv`i#KI6`DuRue1QAoJTUDTc
zNeyBmnIFlk4qF7(;RF`Y$1t1`2{0lyCxsY-xIlVxS)iJ(8D%XL{?9xr&Y@V=2iy)D
z!|ghY8!6-W?*L{v4vmeOs61@gI)Z3K<`e&sF99HoTCp_H7E_p1j{-^j$ja(!{BypE
ziA1h`f^PeR5Y;oC-V3V1^sL&@p$`~*U=dG4LSMmlja~b|UUgo2K95(Jfm5BG-O+tH
zM+Hu8^6LA$i27RwvGy_56loWs^B_~fIPdVa!xrknX@V+Wv5P4paFax`ur|W?;=X<R
zDD_3zf_flAbnJF)%D<<6lPul{KO=mhT89}Tr||;l47P9I9zqiK4b{P5HCMg^a=$!a
zk?;ao_f)A~7pGwGJzP1!Y6JgcRb}P=0|yr3Mdg{jpXG@B;K;~m&|hF+AW?E}I|Nwa
z_<Dh>g!!GgUFxi-8#XL4D=UlcSV6ns2A=up#wUqHB;Y9bo6sY=frL7wfzk)Yt+0IT
z)CczO5y||Lo=tTw^?SlR0&HZ}lJw@Y4?dSM=XgvnVfJ|Gx&i<xHyWSNGHMx^dy#sH
z9^{$2z=4vwC*7jr32cHWB7|+qi;=?xoC1FTGJXzZZ!J9~{!e2LH@^pr%TES=c5AuW
zdZF69aT3i4rgR$sfrz~CT2>tH+q?H7Za*2Om4o|H^7(bo42DV)$+o$!ZlWF3U37?5
zSq}8MU>ft2<Hvtt&VzG_0MyIh-+zR0>dTkf6DPhJ`$~|8p95Nbb}ZK!j!xf4&(YEG
z8}sDj2c&rqp0>z#4Xu_KiY;gxNLAAwlD9XLW|-cJhun@hOcGvru9CrbF)RY-1@q`Z
z%br|6KCp@wF%2MtJ|amu&un%4_}o&WxZJXByBkC{jsVQ89S5m^sW4BH&s)l@?Iep^
zE8rCL;8Q?P7#?5*I2}?wEiIghYbLv~T_9S+>@k2;BmR1PP^;~Z=dYZsg!}iwyFCUB
z2s`kFi}#W*cIMgm_0NZK5<c6kQByk)E60GqzCkYSlm;d}GS^DsC4H@}4G6!%ISN{i
z+MN?8FcZuVzr^kef;3YCAoU+2ZpJ?OkA0_BFAIyQj0kc#h*>dW(8%u<3^Tb}6ULM}
zR;_WfGWE;B!-s3oCNiQb;AL_8KsuL`E|^{ai^)j@YX~GqWFf?egs&nwp<LN)rO9V}
zKGF8fk{K*J8ml!I(bSAH&vt(PyR%r3btoT`I>r{o7EzQF?s*+OwI6J5kJVEnQ9x_`
z^L4xvqAGz1W(MZrIYk7lgPfLZ*REhzP{fz&YLixEY{78atm#ZaFe8HGh`_Z;K8i$=
z8|TqNO}FRkU+pAs!x`e{oedQ7Jg`l|pv|0&$^20A5VY{2Xp<k}mvK0y6%|*f4Anv_
z&a=>3_w+4g-JWIk6wo9fPQDmgVM36JTLjgXmX;Bw{8ocbyuq{gpFP_`6hxktf<FV{
zC}O}kIlWw8XTtFLM~V{9sL=q58MEEyiaxjsc@Rl5|FAL#({{3ZR7X!IL<F1olHhv2
zz<x%e`Fn6&SR!u#0w--Mpj5++*w8j5K+G@w{J`E|gmkhd^uT~jAEdM7sj%yvCGm-T
z0c-F+$nqZY%mUfl{93=)<NyZ$hY-4m6?riiE?ig@ZaKynZDJL&67>BMxDO_Hs&nON
zhbF?EP}yhi5ZCN?p7BFuf!nVy#yNMJ{h^gy(&ya3RhArEq9M7<H+J&<jEo2x{1oT)
zVkgytHH6!fCr_5Pm%QCb(2M5$&^i_UM--IuweY4((|-k=ohS?Wi~;00-~%ls_Q|R2
z|JtolXw{Fkd#A0`N3{G$XZCc^$fjx*BQ090cPnivVNr@~FBF^lCe%J<bak{%BMt!f
zev~*nF=F5_ZFb&;znqD!Av_O4F+WF)2Ejh4l)PsT1KOxy#C!ZMk?+L3_Ubo;StSpv
zQd0Ay!g9$m6{`Mh4Ww;fF~cx&oc0x(CdI{w<7t(!>D6z{mGO<vmU7ULAhrUYu~y=>
zun7(}#>g<($7jJ&O*8H#;l1QhB=za*Ei;E8hZz7v1V~*fFIjcja-=#OF49tUTH!xk
zGQGrhG{xNXaxTM_Wl>kcG<RrJ8J`$`9OW8Xir4Dx3}y_Gk0+pDou8GPy8_f35mEa3
z=0_V8Cd9GE#zry(2Ne(qD^(TPIfYOYzX&bW#iw5R!c5)h@Eoo`GSU6{3paCUvCc_M
zP2%9FN<6O{Z66t)li8&vdt2h!q;=F#A?Js*OY|g$QXDvZe4(Cj-u(bSoYGqh(u8R7
zwWh}OTqU=fkxLqF?ABe7&^lH>cCL6F`|?v00EUQqF9zvTERQ4`-*aoc^;)N$L8s~n
z`Ojb}b*NvW7MEm?*AZXM5PHk~hRuJAN3BuqfOn@)pC*vwA38Ls)zYz|L#4d;Pw%v=
zm5QrL+ZkztBnEr@4J#V%IQ_*<r)V(IRg-uw2J3(<>7mmk?ruM(o(p`+z2PFn5Hx}_
zD}d1_3>@gj<LBVIF+1!q_pBJB_H;VTnFlVr%<373tmZ0A3jd;Q`^e9*pckD~=V}jT
zhyYRh4mkNaJMLOacVAwsp>y-5SL8yh0JR54tY%GS=%{|?lK}GJYm$K{%lSvWZdxvt
zo(UUktnrPGug|Cu(Y^0;T*G`w#B%AuGgHnFD%r}w>NZzl#Z8i7*IoT_i;;IO+X8q6
zow4cmUz}jdjwSp+g8`T_b66e8T(lrs%`Xo3>)o40z$0?CUSwn}1V#S%<130Xx>7ub
zm5%jdwUBrDzI;#4!|}arx=H<usxo-5&z;jZ3FCZQ#_GQkn)(^PA?%4=H5fs;DEo$n
zW_CzQTxMn_=0Z7UD<R=XH&){|jy2b)qW)fX$Kl*%+p0%r&rfITRf#a22@f6>2tK{E
z&{xG*>EMie6HB*F@;Nt3_X}giqiF=vi9fEhH8fSbc{*|xYx4y11F-V}KUOVz&8+=L
z8iG3sm=9q6rA&>aqU2WJ*qCyCF&vjw`_^_+STPgUchB1s7{&vAfF!ufcI!rl=qe-g
zK2Lz>Su?+%!f8kAKGCd1Qshhl?t2H7(>0cq44U&oIh<Pa6#ID>m+%!*W}4dk9(<E|
zZ3K(QNs)=JrmKGkQ=u-&;_wnS1Xteo@Xm0{l(m0ZO05o98Z#?qW?<lHIPai$WgK!Z
zVz;I4&vJ6M8NR(}1orPgET@=T^Jx9W17DQfeAB)WHmsgpiFW?QbY0S88n2636UiMB
zBs!y@M`h05Idszb-1Va;6K5FQo4Ed~SdVS*X=iUG+aG1|GFy6$ptrl~!ra)D2KfYG
z-YmN2X*b~(T1`_d<iFn&Z-l3~io;=3L#(*Dd``fj82%xatB8~dlC3b_;b7VHkQ8H8
zk~pH7G|4aCh7G4!z(;h_P!~4D>CY2)IlH*f)fL-S?@gg1J8HXNrMhnsEBiK_U^W`-
z;t?8FAYv3xVkg<<zpEYQ%tcW#>IBc^;*%2k07J%(o$ofw4&sQ=<LkeZ8i-JZ;OPbf
zLa$+kQNlDCeH|^xDPZ_b-BT^Czx}vfJkcl?xS|ubVEPV%))#c?iM1|dN>R9oa)*6W
zx!efp=D9M8trA7=PXG4ukyYp*hX#0;Hw^tWVM%B*)&Y!yQmxQe^!pn2e0)-bw;_tx
zz}>qa0%?eNe~p;qy=mzKq&v(mvyFuLpRm$7hvz)xMR8j5=t$Hz2tcc$UV6zY!t&G6
z2^;xoSmMqJVI-Lvgb8ZeJd1piev*-)nL|<e?c$WU=@GZC!l{$QsveC^ya91RZ(wIv
zmIPmjmW=P%5V-R4(whe`^T@k{&q40=B*Vn1>AVRxN+}0zNbvl`C864B=93ZRZGZQm
z3*gMj_NGgdwrDbD;91rhB3I>A2Juk9=RyoxVS3RvWBOtuLcloz=&JYSbHvv&#iCfb
zj4)F4ajjxy(5N0OnnI(y{CSZI;5EO18UJ<Se?Ad4C{D#SPQ#68My?j+IFRMzhYuHw
z3Q+?jtIoc=W%FhTu?6RZ$H}Tx%a_ADYeiTE{Gpwz7hJ>LCD%q#9ttfauZf`>+UW>&
zsAW?s^N6&q#nx$Dh0p$8mp1v>mZtZmr44k4Xh<<J^a4xEbss{f4_)3YcyRF=2+}^v
z?yg;>2d|-%6Npa7;lbvcJ`;@A)6|>5*@g|huuvU|&)5}Atx!#ZZ2}_qlTa>ZI5Seu
zn-@z-?DD{e=Ztz)w|daY{`lkAKjeP}{<Q9pxd=%hYdt8A+foj8sIu@sp}NA-${k5v
zsrEbVGni@KIHcuHt&bHtT#=vKm4b5)5&fuXuNHO9K#NA97}oYJY$LJ*b1#+s(5*U>
z;*)5eh0_!;Oz`&S_Ok<J2$&8(if%vtIIG4;IC>vr-+)pdio3sK3ZwWr5DPE}C-58P
zS$ue>Eh{VgKi^^YamKDmpQ5CNQdV`*zzkG!>=L7d@$m-PEy;I|6>KfsrC{xcd4bk9
zkdevs{Yif&3WXl4JE{2Z>+qSHT)DP);MC;EdFG+v*~3c_pP7oMeSi$6qp$)?RR_eC
zxc}x~kwT#*{KYRWUiwZu+l#iA(XxccGFU(FUhUp@z<|57fEZo1dv$GU9~CX;ooMEa
z$DfPywP(r8`i6$&yaGa*!|PurLIAFE_@1LWYaYqRY=wfs-pXn_+IBok{|xH;cb5I5
z{hWs5>zV?7zwy96;ujj3X7`py45QMEUyk)GdY>@a{j^2zkiEhAe$!Sa)O{jkidujv
zAW~wR;S>r9-g(KLhHm_B<$wKdw<bp}6((nGA2<%(?8uR<7Fr7va6@BNQ(uq+cLyM5
z_=&;AR$}8eQ@Vf^NZ~8)63Nyz_V#h~vVr2sGx9cf6_QNqb*?xDSS5P`XEKkzg02?4
z8m+lK&qQv{)A|0c2P;3YcR-10J$YN^kZnui^xPW!>e4RYG#lQnf86ffyM@a=E?9(B
z|L&*ZVyi6=1)Mu)byUz=bC%LBpezbbQ)$fa6X8^c;tS26Jv~zAnjnRZ!uq9l6#sT>
z9n8m$9q>I&{^9aiXer2MugDg2wBJ7Su`0M9nSaRZ`&HAlzWB)gZt)|Xi4!T35t^>_
zFU6%&EGIoD=z`k~-6a|_*=l#Aqf@p7DqQKmsRafgmmz{|T?`|Z-d%KVhjfnE4S=vF
zyue4^wHJUZ3aheKz?C?$GRSb=kwY<f+gAFBd*^_4?I`sp?wK}qz8CDe5xOj}8YuA}
zk<m*|ZusL79J?vZ!wNsKj*?@#I)Th|EJx1NWLzu3-=arEeiDSDLJFF8hly&Pf8pZ$
zpIMyH%Kp8rfk9}!+;W56eTU<At9aM8$K9ZLJ>%r$xl_}d0)B<-A*&I}QCPBP_Oww=
z;-uwgW^^yvN=1fzz12ME8h$Q1i{_)tl`{Z!(laHMXT#81dO1pmUEtS>Q5?QzLF`D1
zJ|qZ5>n4vK>#c_#E#Bkb&m7>HZbI9c!z4owSA?wN1CE1smEizWEi~O{`(IAruN|G@
zC8w#{>bm2r+`(KA<)|1GVO|(6G*LqBjgy;H>SyP!T6_mZYBHIe{NBA{MF~v-5FCP@
zEWv}yE6;v%F6zyLp74Af|NR(L<O@Fnw2D{@@BQ~2Xw+oAi2to`WzHpGlLiIxN%#$+
z@1%E(`^%rqhl>41kd?d>%We@~&@-lkdit)7fp-!c939Tu9DA|?xrd_}Nl>_zP}{Vk
zarNkv6!3%t)mE%;Aj+23=<89F!-?c$5Aao()Vke}_9KqG>WoD~dJV}wH>hu45mq1#
zSi)Tf!wn+9J_4BxZ>}hMRj2$7qAzZt%riSuc{JB8F}q0MZ$@53{uy^?#NlEVopYgR
z{<0&ombchi)$RZ1kdOhAm`RcAlY8Sw-q5cEf_?cJOCThu_kfFBuL9AQC^Qti)L`h|
zgc{2q|HL2hE}(i@4iiZ(bJ(`pxnhmZkrPwg?v_0_3K#`nBa*kwK;e-Ic_i8qL%0-&
z@bquJ6k{7vFbjY6d2Qi<htR7s=-Ci=*C5N?=4>o38^m$D!@Q_z7?i0L)`3zup!wj4
z9~f+2bn3(V!a}aeNz$V+FP(7(|5D}vf;U|aEK8qWJB8@u@KZIRkr{HKSX<@zPw>S9
z+fthQ=8a`Z%J(0>k01sB<jJ>PkXkJq<}6UGFknNC9eML6wcxg!j1-Jqd9R6@5+*L=
z@O(Tc>%Qhg_JMTiCyxa|Ky|>jO5-Ci<cFa)i`{WE*oT}fOg$Lr4;m49kXlUjpHggW
zMV+xzjc^hBejGUiY=bduvbJkGi_28^{@g?Ojz07~3WX=^+o&;Mt|CVm&$-nJ01Fo(
zSqj!9M+=$^25&@$a^n&3eBzWXa3+|=lpPgLowk{(#Cn|$t>PI~EY;dxLt(3sC*ljO
zPC6~K|LbLFD)P;%ti(V$ME6m*8(yO>V-_Hq31TR0M22r^Y>GtkUR^^Y<FkkEuDG}s
ztQYbKXh>%J=k3%`Qd&g~ER1Afu&6c8!MUcZj2gv@u@Svk5i898Ig9Y%Q)lD>i0Tq4
z<>W{kYpw5A2F)c_MMXJLi8LsT89h23TR(P7`0wA5{o7u<F4%_*mfxyrrrAzXqB3dH
zQkg?SX<AZ3P4eMg6jw$#W$|%<@v`{@t(pW`{X>d+uSF>dx7%Ok-+%~lR2+hTzY24v
z<3&eNA(XcO-9SCLxsLZ>Y<!kh*TKZ){Z5`0&vjQoVLP2w!u7HiFg$$zY0t8SD;?KL
z0ZB%K@R)mUBWmzn|2+1Jx->M=6z>o0XH3^t|D|6X5A0A|G6dL}SUP_k8^T;r;?Ou0
z0(2?DW_jH>`cSMVDGN^`x%Gw}dTh^;q#ap8f4ePY)9OmhJ5O?glLd)+d;eTAk9fhI
zkvMDqa{*}CDJfU1xwj<lPIUC8NhZoBQ=6=%960kC`|^+W>DhCLZa#ONxi{_X;&`a)
zaPAoh!+&l6^0{3kv$|&gi8Q?vTG&pV_UzpYGvi>f6FkNEh=Jp6f+p+I7%#lbq>sbC
z(dQQo-3;Uu^CJuS9K}>!ci(eddOI+H^i5tX=o8-b{OZUajAE6Pz-hD>T^c{(6lJx?
zkDY#tS0$J(F*@4)6Td?)drRVPyUv|spl#&JTFcu=Y*O;hb1EZTH4f!Vhkd24!4kv!
z%u0d!1aaF+40Mi+Yxo2#;fezBL{20L3%J!I&PoAzY712i%Tm<1?%0i7*i|HA#Ftyw
zuhR)Pp+kB0x3Y;0ls(`3fSEEr?J$uC%eVgJZfF>?!9(JE)bA?@_b-Z}bL$sN?wN(R
z{l8EyIGdlz;o7&$h9L^MK5fZ(3tMVZ!bUEeRiiV`yt5FBZJks5Hsc)p_oW?pTo@Qg
z`X#lKSnMb0lPoB%e9Ow$qM@a<7=t|(MR_;-O~dy-K<6#Q1`v{IZ%=oHl(PMv_}VXt
zJKjOgrC;R1{P#~z@#uH81{e8l?88#8Hcn*hd{X=DztA!RWD8)>1yjvtjhAb!tR^f@
zdGtt?YlR!+&Uy!!3oCp2hq`!R65bunn6Y&jn-I4LyfyV7blsd~4=~G*b=3y%JT*S}
z^r8Kmof+TX@du7h^4CQ&_V`A1KXs2XEf+{Z+&j{L+%JxOTR&HM@4~@L_hbi6WEhL|
zPgTmoqs`fR*zr&_rIH7T%0+L@`#e<kZZA=4|Ig7PeGW}bjNV-HZ!qgn-KXs_Wsj5L
zTg32<gH-vkb%ZuvoS3HaESZT7CVU@z?4%%B)eZ4X(NHnf&%zztE6cp-8IEaeK&RvE
z>`b@bA$^K{-ejGzY>kx)9>%i6Kb80l=UVwC|CL3(`&RYATjT?`6QykTQ)z2$Y{;Lt
ziKMk`U%Is_?2F26g?19}(KKxsWjQ5s8QaG5E-lpKL60=M_7?5$W~e-o!v>5QI`r3C
z^N6n1H8sYyuXX>uo{03yCqIIv7ICR~xow$rTG+zwsg|-DYaZ<57wp7#FrtSDP<QNn
zsrv;*@=<Uq^pHlY(p_f0Km94rsMHk*C25JQ;X!M?38WV!=;Y@Y7C4NstXrj1V$qN^
zVJjsZiyYbxcbWYZk+S~%vlBl0R@6|=TdC7Szfe%qnKQLeCFK{HZqn#8Ml~PY-;Hlt
zEza2B&RP7{Wf&K%zN^X$sTTZ4xuMLhbF=x$aQi=5Rj78pzKa-g48Yj>fxp#>_ncyW
z&is)*)`6kAIvSLcGmg}y9qSPn>n2jxiXT}!bm-9dInOM+YO$Q%yf0n&829G8BeHt2
zeuJUi>~+<RsuH?Rwyv1^u3NV*qNQMP@itgg@4`>;B=YaKl3vkO@hs-^UjVN2Mk{}B
zQEDfNpY;!d`~PID89WIwCKq=H?h%!PE6Z6I>QRvkeJSxeJUrZV!DRQR9V9Vmum_X3
z$&6LCwOTuCgBEpXluBl()N^un`z|^%WiXK7D|o=O2gsAr81A*!uh5+0K3B)qLw3@d
z)P$LE)_r%wt9V?Kn@L%2^pdD+LWq6fOX7$f$U^Hg80u8TRL*mWe`%Z(3@b#_HVQpT
zBJV=8)~@6>V&C16mwY1HQHs5hBQFv1btX-6*r-j54R_yG>cybRx~HXd1vl+~ax}kq
zDQJ~W!&s)vg!9+m{v)yqKYS35%Vb<wpovIX$hMy!ogI)))<|Bxk$wwq@|x75#F6x!
z!jzPU3|lBRtYkRf^)RHt;+t@dMyh~s|DyfAe}Pn1Y;P~^&6R6|Y@L*C)~@wMqHFHQ
zxPftPzf^w1@W3%^!{P#dka$~I#wkCJqHd-4$ArIh@^y6d5!IL!pC~9dtX<w&M!}43
zG2$*U+sUNnUuUMYmw4V_FswCc?aQC@`=OYF$MMi9DdDWQl?w8Qg6;A!vv@@WgLx7Y
z#uo=oSicC`qiE!CT`RtLd=Tmw`Ch%0J+f@{(2xjwHZ8kjqVb!d{8;$xajw2%*631S
zWyOo2OAeHG+)S54V577D_1sfOyNiyZb8S!$3Oio=SO>6QM6rM26-$rZF&-`MNK!1P
zivG@?AS0bszKbJ{ew^YUN6YXN{@%5fl|Gt&ma=YGH=tou**g+`EE2x>TqV5_ARtY%
z49Z%aSt8>pb^j-Iwjl->p`DhrJ`O3cJw@4FbM2n`<LrxPt_^kM9ef@<*&#Pz45Pmc
z+JaH5kw}SR60w23PeJ-@8Kt7PmQZY*wApood^%8CILz?nmBSPz$s-$V2-S67hW-X@
zC`hxX|HSpSr~e<-^PxKRGhJk5<LJ5AX?6F=_jCK3+-^1D0$ar(5=fr8vzO^ito-`b
zt5sqyi7|<o-2hJsA3F(61LJpmRVMzROlT1J$L4^=kPXn?bC^5WL$D~=o6EKT&tw1n
z)O}}(c=~Jk=SltU*frsv<5-cW$6rMyNHli1A&M7)V}6o&KHG<(b;Uc}MA2g1rC$X_
za?~vti&JhP6#B_=YxiJ+S<n*tLD5{T+a&<r_J6WB<bk)36SsWIzeTyhQ-O7MTP+)v
zXDaa=0k@0P>Ax~n!m`s+`Um0x&KSjUqILqz3Hz*H!;E?{=^d`{gB$KAAdHNy&?1Ow
zkZEM(<ScXa6QyCK!T*XfQj(`>$i;tA7r1cS_NFJpD@T^dkx|KBW`ccs%JmO0iCAHr
zrsFjB2hp!vS{ixs*s)_YbLrr$M{5r-<zLIXvZ9gBqtN59NuIZ*;;?z0nT*8K5KH`j
zzj5^z&4icl*G*$o{kKW1<aJC+PEMvxNM~f<zKJXf1`XvS7#5<!j0aNB`LXRK@e>p8
z8Ky5p7`jc2==i-NtD^}Q_F0J~dse5aK8_MX7c_NT`tD;CM4S2ls6%En?b+6&Z(m2I
zON0#X;zBDvv(2a)GcUVKX{&m5mn2T4c+){fK>G=6M)|y*3v1m3t)YB@60f1I4nJO`
zYYr!=$JNn^X-@2hne(9k$ZFBYY{f|X|HK&Y%g~(Y96>4ylbz=uX~1)*zI+j);1|M~
z{L)_!&dLs9Q#)2@@gI`*uNKf~{(8`>2qEK7qVq(_L;d#Ro|`MIsz7Z!9h?;g4ooYT
zm3*H2e`c~hUwYE#k&}}n%MKhEe&C(qeuZuVkH5H%L&k-S2Lvy*Wex}?uRzcrI{;C`
zgrLqgx~GRH+}0`w5)<J9+*V?q(XAq96bv2*W<2(!I=afgVYTk|pNG8Qz3-!$p)j(%
z3OUVp+A$r;<v>gkV-bOgxL~^`-|eel8288w91%U#{r3*^)Nv3bS*1b0qsvNC%)%6U
z>XCawLk?kq%Qccg`Zt(A-9q<T5O<5RpyB_FZ3)W)%4GLBT&4h-Y2IGMGKl5`F<(?p
zDcNRyt`^Le#GkT1Cb_4*e7OX(gjrs}OBY{USVV#8mm5rcKOfBR=6u14PN#Yuark`n
z7ORNZjuNHA|M}@_94m9+TM4Z{w{jru^LF9mL7VZbAT^D+GyHUIyi%~eMtr0d6OH+#
z>P$x)hu`h+=YsfBb4?v{-u7;zR!aIaVH5ob3EqwC*PrP*n99r-vEZtZJc#x$#8VfI
zs?iib|Nf+p?GnXigE=jG@>N317ujb=)w?ArNaF3@FkQy62g*d<x^;wAiRUU66co-b
zc05A&*QoZbaqa$ROP5cOp)&iglf1Uck+vUGxZkOKezemsT2)M#1VQxL_37?0!*9h_
z5Pr~v4Yx?3ZB&ita9?E`>WeXBu2NekxaA{eW0GcYXZ!q})rW(F8Av1I(e&W?R4`(J
z)K8?Ce=%BZn2c>hqKRN?v;N;w)*psHcI)OB9;>iuXyceBCh`1kYSX1hE2ecQ|Cedg
ztO7rkm#4?Iw3nprDU(CkHA3yY=-<!VQ(aZnK;pG5Hp3bLGz_Ez(ZW!f1JF<%Wb6N6
zu;-s1&;JjfdG<IOE?9Bo1-5I~_Tn}f74q+KDqR+i43W!==_>g)$n|TxC8qWIn<pDb
z+GTI{3s}l{P)hB|Z=*6VuY9d>bCmj4`>hrJuIKLboId|eujT@S9)0?a9HTM)=MI*S
zKDYQ+$G1HCJjvkX*7D-!9Z)_`?krEgQ>~z%*LBq-nLmyz{ED4GlUU0MTgfrHV*M#`
z%MNZ#MND=25T^}j_=-M{#e;jwlzX3Tz(1q@XzDc4z&)~4RnYLn<eWtN2A^=HINKvl
zp_*0lmj~<V#oqQRKDuOMcD-M;*!$^w^yqWDlaL+ci<E<_d<JdkLPWQ+woYDfQbDfI
zl+)fXb#-Q4B}K<fWDn}{wAV=}<<QWQ6r~1J2x4ikeU{AobFM@(=iq;Qblqpe=ETL`
z`QvB0XUf%g4~PO=WAj%=(G=+Fx_*7wi8SSTkpRdBY#K?aCeECQ7rr4O>YY7BPY~A}
zI;1CVD!ayviT!f4Ob+9r2k`u9@9`k_`QtGS4uIx_j*_uzRq}5o^=ShV?L(DD+AGJE
z%)Iq`Q>ac=P<o>MwV3D67iFJ68hGdI*|Ya6>>)K*@|n`~7D7#*`aw<YB-c(}zI<6K
zwbXertZMCXlZ6ZKHJ0mUPxo7U>HcHoh}rt+IWdp?;=jbgoRa4R?EcU7-8XwSS$CIe
zn|S+2nSV)8OR~Q^IL?*_U^a(=T!<AhX99PoqN*BZuFILLrz?)%^i%@S#Qm2qkJ34S
zvEUhu{R(7{&zU!`g{f)Fxa;&ecULc)JNJmf5m8oHm?3=l)4H8x>5#Z~GT!-@e`~V-
zDWXa%uQ_y3_D@wo?-T7ODaZYtq@tpdbR-$*h9k~T`ZLd+J&VL>s^Wl%Q>xM9*T0xM
zW5x{j;o!*b*()(M)vwSGS0s4)Dpty`*P6F@@e61fA)P?;L3X&5?SVweTVYoNEXVPz
z-jdU!yz?cU6YXCZxNCMacag6*){p2T)lT!t-!{X&efl(uj}SEGu{&y(Sh!4gOnrVi
z1XP(VpMPs((1ep$+DUE?+pV9aGjikxygaVP)-EN&?vWjI#kwV&_w1!tYX+pz)X;eD
z7jomq4PMjp=g;rk$F!IDjrxxlTbQ6$qr7aYd!|CYv5i#wZ4=M8=;Oy|*sdWhlhPsF
zi+(dfa|Jr>UEe#<cXkK`SeLWs&cS(?<;9{4G&9cDLDt4F+{mjZpXhxJKG6_GU`U5H
zXC#Nb)qA33n5k4dzFk$&gx=})Ab-Euj5kyM+SR+lxsqU$<>Y8tHTnL5e(n}McEgI`
zAc;&po|)%|52xRnW&K>E*MVde`8Cog8p=20cS-kn%YT7MrFOefSsqna=X^8OPCCP<
zMmT!a8!wY;hxp`sR;O^HQ&TwxV<P@C4xaeTxlCcwwpqs6J|S07oTp@EnOYnh^|`~3
zlK76GsH6R+xU@4p|B3$V4uTm_R1sd6pF%o#vpJ!=Xn8QKSrGMDMNKV5rFZ=;9ZCE{
zae`hIN6|(JGjI0JPrsVj#9kwtFN#}+EZH{rku+%ydu|`}EnGBC8hC&&T6jtCxKHkz
zUGF%;s+_MSuFx*Xc&NFKM@L7O4eK}MkNt_aFu09^)k>L>^mYAjU6MYjd>o_w5i3Tl
zi(5E{7dpQ8^Yx`T-zbfODoGk>s&`|~Y{jz(wZSL0wzlh&Qz2ILVKzVm7c;GE5$q%y
zYXT6rzitvMf5~ozSu?%!J-Y^mgy5bMLw{ZLNiKz*xEV>Ms&>-(9aCFkMk}T&EPHv3
zij3rKu!g24^#Ceqv=LWAzilK5Yv(x^wwIl(RGc*8%i{vec{NmUVjDqGjrQ>2hG~8O
zSh7qqQJ)j%=>~3JtQ+;mx}g&$OwiL4%@WSk_!quSi_Ly(s%7x;%F>%7Mvbx~4s&gM
zugW`Y9QEMXn;W*iTOvG3y7t5O*i?$%;>H}U`lZKGUHeS0_1wLaW%7<|Rr9%gEJvQg
ziVzS&MRu%Bar%n)1EU>XTq|Dd5h_5Ui8GQyFCHGRcIUdZlb9qyDSg=YQA|nViHe-4
zc_+Ie!5t%eO7PpxuJ05xkEZ!Nt^mdtrK>tcPwOl@aN^r2eXpITw5t-Ae@hJ1R@PtL
ztx>M9XL?#i&X|O9jb@oL?ME%ATHYjWt!~lxZT#cm^3c=@-D^*r;wmgwp3-x*;{3hB
zw8G*~oF|y>jiuXpGsL>EuuysA7^gdkF2qjvxdWcB*?M$IG0ukBaS{%4Pj*L_x|ZK5
zzWect7|b*@ToCEP-Yx)TIlKb#q@M+q)z+i!Kf%V*1G<^mZ>G+#VGz${H(3oQBt8VB
zg$s|CT~A55vi!%Z;gYu^*v3zZOG<x??=RAHt*wu~$n7{(k{OytJ%YBNJSWPl$x*Rm
z)iQ)YDCn@HU65VU`^@aWT}Hn!TO^fB4>ztnpqs#J?A)#Y)5s-HM(0kd`H+?N;EauS
zc8BbrvlX(3-E?{H=dm{F7L&r32wfjB>&f^$E&9VzudqiKlSchDtq<Ax86Jl8EMG+o
zoAfolB>Rl3)18X#6<N_XSMy?}8@x_NxaC^SaQnn-y{Z`7_~qze8!c<;WR2m4Z|2pM
z3_mEnwDYR<j+E3p&(7OlozlD`C9#<~fR}fY-qhb~ZVZ-p=(IMJ{W9O)e8@kaZ|~M9
z`yr<#ib~{Cl6$f0lkUe`Hm=gIe|>)C)swN&U&}IMx4xX4>$+{w_;uIbWLjoEpK&5!
zOJ+A_w?njaT+RwT5Yb?)g<FUE?!)NaOsz85kbf^W&DzAok=9YpWpmB!_I|~WC;}z~
zsi_5u6tQ)4-D_c6N!2wO5G@8^=gwUm=|c8@198n*dNX%hz3KIcg(fE0=^(y6*tBYn
zWV4nCoQ+MjAQh6|%PM1?jfr7Y9{0HT@ZRi+-*f$>H0u6O(kL$ZPI>_mGwY&~;4V|G
zBZXc1{auWMT-?6*WPZ03Pq!yNDE~vvQ8U*&OL6R#t&j8an_u1gga(`5kV;VKt;}G{
zX72ai?((Xg$D;9dSbMRfwekkVK7EP`3M#QuNl7@5vVbNoz3bac?S6@<igr5Xda8(|
z7hPNW>W)q0$!6VVt;@x4pSgL+=S9BsOwVm-%80dpyvfa@B(EZHQ?q-C=IxJ9uQywM
zQG8`?efO)rc6NBnlNF8IKj_`gjDM!L_t3}coWydy&W?Ub<#Ek#*2X`{?Y!;7xX;D;
zGqw-Zy8h&8msnSsCKadmZ!Ep04!kQ{_SDJw{NIJH-I`-x+Ml`mrT>@6)Zm~&UrfCI
z{^Z)d+2!r+O$lmW2aLZL6kImtLi3%ge|VHmxxK<`u>Lo#TbbU5xqFREbha7E$|;A|
ztZz&S%x`(M<J|*8!GHvs$lLx>HP+`UjFm&?oMU7EJ~mD@ZMLE=l0t@>u2hyPC)&sN
ziRA8fR&+K{bRu|-Y?`-=N|E}OPG{3I#&^n!q|(GomP?l|Em+Jxjw~uTM3};~Y5IF@
zouNLtxd^;jycRZGvU$z-_sxX3`?GhKqFOSmy!v$Rx3SLk+X+vNLFGAT;_5GYpzN{I
zLr!dcS*<?&+K`r7u@z`sb!4{PUYUU>w6^cKnm=hw{)DWG=cNf<KFWkxY`D8+=$7W+
zUYVxEp0D|k<5GKB-|~#;;><Xa$(Vf63pq5e&?AVo2dicM(CcXD6v8kKJQtTbScM|e
zZNOgBP}`*BlvXS6PTdAvTa{L!`%8f0l-O^p-rP;7EWW2W`DU#_*#J5B^DpX>UcQ>p
zx$uSJft700?v1lfS5F?;5;x2}Jb015zqZW7t9m<^Dtdh^Q#(AkIIw=J^4HEqK8-Ca
z3tuGeEN^e_KGuH9-1kKvOaG{h*cLu&f?~;U7lT5h4}ExcKE*G|1kro&i4!OM{m<RX
z++|rr02QVTls{p^eSLLvum-KT`*Czzf*U!*A_j?(JC0a_&;Qoa2u}#v7mdFjJ0WHx
z1D`;T=s=*i_uEgO^jLw2ilO(n$jephb*)qTXBWmYA5RnKs`V$vpOR(8M6$&hDuk?2
z60?47Q52h&YYzkS$G3#~F8OSppBNcEEycaV(2!4B&WoXU*{C90mE!{RAv;GT*l5O~
zq~HKOIW{FS-@Ck}vGMA@NZr4llpmS&apT>=mj=2!Hr{$0*U+tOO0gGCRRa;7E#e#w
zz9S7H!f(uupuO9`uY5El)2BPIhsp~hyJ51Ypc(qrw<x4dzqRh~-*?A#{}8vP_;R66
zi|%&Eilj)_xhHc&8nfIJQ#ak&`d)TzXuQ<r(f-IhwV#ZWy_4QdFW!@T_JmH$HIKK!
zQ=&coKC$1;{UbY|o`XBPDm+M@8qE?jL_p7NtAjMGej@hus`7Id4Fr>;Y617>c||ln
z$Kc&%k#O5(=x)81SFrx*(VJj7tA-p42nYpoZ{BhI_;E5=)lbXnZkk$bMlRp*VwruC
zqCIk5pa&^UNGOFJg_F~mrt^i;A2KsDv-Wqb3!Wo+I;ib&$9}%wRsCMmd*8kTwHnU3
zc083^y0Ug{{{G0g+90vGo#8d0*qKD9xDfa}XB)4|9;>Z~jvO>#zz$|SOERs$41BXO
zvZcxU^2XIRQF~9;XypE=ADtU;XM5(edbdv78rRkaGn2BLj_#-NgYVcLa`bO0kD?|A
zW?GJv{vEL?can>Y-`;u5z+$!id|Jv4G@yM)nLTZZa^Ga3`Gbk}^x)hDZ)I!)dTe!k
z660U!T2rC5J^2O%>C(5#&!w~S@RO&TReGZy3ET0ePV0sd@$u9`*&y&|LCfMHPo@J$
zS{QjEJ2>KW)OtwOIxANlEiEY#9P@(*zfRaNQ|7S!-4fMom6J$)3zP$4$Y2<SQFFRu
z>GR?IOV$(<3QBS2?dy$OK=}bwLiz5oxlvEL&B^IK*FCdSefRi2t6Bz?QY#$tI&c%s
zJX!ez@rfa&t=NF9e{rN~7Tjd8`h*Fl#-y_9NeFQm>8le?r2r@3KZTLJeav9pRH49U
zT<1g@6=%q?W5f3T<zTs@E@Z3Z^#7ET4YE~1w?+l$H+=aRyQVnx^p`ZLwi~t32PF;*
zqn4PftbchWm$RI8IRwA3xaxG>h}lBO5Q=g@S?A94{T{l`pHKVbGo~fSNR@T<gU64>
z3Ln|YpW|_Lh(Y1OFW;g3Pk9&GLb09_R=*J$OKd~!@{;Dq`Etvs;+5jsJ)O$T*usSi
z`Gqk*^!=7&Pt^d9W{EA0zjwet?z!Z4H$EPLDczADWo5@Sy&LIEF!9SR;nRedBGn)x
z%`CxUHO;%i!ZV?g)0chzsqQj8yz_5Z6*av$U!0ul(bOzkZ>%iUmNd}u$q_<|mG0Rj
zVBtJyu6yy~MKO&<69~l-`c+Y;8jL&OI(zv&N;r5PL@zFwsUQ?x6zL+Jn3$6zWV{gf
zA>(b2Qq~7nR8$Q5`RAWmRzrBSZg<-6zrII7(~C%_ucof=6;i$ojVpoJF!0FE&SuV?
zA4i3AKIZfVbKR;^+sRV=o&E|flS-v5VM|gmduu2!@f@kDscCZL@^mWS6Un|OPnH)I
z)qsayvN6IjF6;8ZdUKZroACDncoglMmiGG3q;|uo=v!+)@BA-=q}m(JC&qyjH{N{m
zX07?Mq}G=(HX5=(Y<jGHwU*5Uk!8PA-&ZY<MQVnE%*EBU-?z=`63OQ4(udj%0vu6B
zT78EFI$QvY%>uT&7K#xLmLhWUe0{fqHCd2Cg~~&_U@p0B_g~*YH!eI!d(2SRpf}Aw
zy&0UQ!BOC_%pIntHuGefrOgbB<}AMuet7XoV&>0COZxu&^J!j1e38$~m4D7{T1MvN
z9hK8%5cKbGT|`qHh?s&s@+Wsz8A7*l{sIsGi@EvsM^mVJS1dsE?q1H<Kh+f4r%GOu
zl9+sM?kmGtvxH+$Q5VWB_hC(e1=5+6pPJAk-0?o<6;#^~j|MK$>C{a|1|LyV6Guy1
z(N;TGfBmr{=jS|8li_p@!A-ktv0q{RPm<A+e^DvTohgU|QtcfMvH&Y?!`HbVWmEM}
zR_pstS#QbvnCaerz5x|CG)2*{wMYopC(qrnV+W0BrZ~zWmh6ae>-$P1ekX#16%cb{
zF-nk{BjcWBr)WMR`U|Mxc2U4GdOo3$XbVIGP)sDFlX;it-Z@_9zfNCPlNLnZ=oKEh
zZ=;mHjB2|Hb4ODSGBI_x@QCh|<}W4;4hr0?HnVozi>oWgxb}<abwS(%TL&knz?VhB
z$re_hZ@OsFa~R*2`1Z1*^`fi0EbTRq)4O`8s%qc*Th5Zc|2y^-j~=M4xO|wCepS$v
zM0-i_^2Lh-0s~(%4amZVfMdrlSXU=z0Ejry#l$!Nei{=t@Kw|_H6s%}8j+X<s_N;j
zkU7i%w3)Q{7sT^*u-xMvYYy)05^$!3qD>gU5jJ+`E2?SkR%>V0{y*PE-*o#p$8T2E
zKGPlYA=S8l62{`P?>x8FB{dRH<I3-TRCJO0pcx<_kSl?n)EG_E6eSXsVNpIIXXfVk
zoJpZthv0!C%AS6*fSei7{x`fh`_%t{fdH$CLQb3ro7?`{&;R0j+M;eqzI&d7^y=qG
z-L~i#?;@4D*GZ9SV=&W`MbP5s^Cg6HN<@ARw5-TGMkdzQ*6g{aYay;!LlnKj{2d>|
zy{0s*qpUm;QTYCSEooejfrY9Di?@d>razi2QT^q=Gf&Q#kV(#pD-_5>UFy3_6pW0G
zjlr#niSy4_TiV!+VQV<-Q<YujpVK-|XtYP{#oZ1Z*k?PQO@68_+ow24_XP#zFwt=^
z)s`KR<Bs$et8VYRjV66EO+wOM5ov8)Fz;Na(>nk4%Y*aXztx=I*zTb6lk&E>CkY&-
zre?!K<obMqKIhMpaM0|-A(X%zDvn#T>qJC?2ZNVylYQ5I!csX5Q%u6-uqKZU9P}3q
zS5ml%RSfJsg+WbE=Z4Z)?=B-VclK<PNXd<<|M>{~tCu|<)Y9+9(9*KeZ3l4vj;5xj
zyq(p?E~CXdqUX=!RE7>sRGiJg9Vhbya<y}hzO~%zU2n6J#?2c(5&de-hiB6)&Scr0
zgkNP9l8gD6@`)=(Yr?B2E1ya1+Ijx#M0?NnQtb^&aV7eR_OBy0yMKIIIrC~<;QRMc
zzdOx}>{b=@jnn^S@YT0GMq75pF^Zk_Jg%lBvzS7&0{=0(s^ZhFW*+fEd@l@{=`F$f
zax>AQSVR{Mn`Uv3hj)o<f4vDM4;NdZS1(fE@~Qt7Z70MfWj4+mcrX9k*Nk2^v0dND
z8;@^`xKC$7qH?NGRfFE4D)H5!9iOCW3KQ^COZ!va=RXW7=IRd@?DUz*g#+z&>#Huc
zcnWTOO)F3E!Db6QUYW}1ZHldVf&TuA+4WzHvuTSOL6fLS{C@b~$G|S%@$tBq>#Bn0
z@(AWHmdb%)kE2Hsi+OwoEhu6rg&BAx5_(EXN@TmVA0(a{Lppmp*ttS@35ly*hScC&
zXwask3Eo4hm*K-e=0`NAymysMzT)HjeH}-)`_D`NBF%oQN8QD=bZ@I?HctI+YoA!x
z7JOF?A@S0mq#3f{e2XyNm~b+gF|Mw~+Acp3m*^M|X>nzp$nE<PG$oY8ATo{IE;2HU
zBOP&*Tcr@zL{+|9wz{a}3io7IbKtB4<+{Fa{6oM^8@t^Gf9}_RY8(_-EwkNAC;EJR
z?6Y6VNf2|Al>Qh}VtOIQ>mNOSd}+8YL4_q4ZvZ7o!$y7H(Lv(*u=lqo;~ajh&zL<X
z*D+^fRaJ<e-&yNwM%lk|MY*(q_B*YO1z(~V7AAag&`T&w-T&8<@NjQgyP+y*6Hoti
zcw3KzzF?pF_gXHcR~DRkl%}0OdF`WaIzcoABzKSYW3BxcMw&_G_fP4f`)qjFZ)M`(
zRC=0G!k9LQ*sM8m;%zty`eTgDFOHOa``@YemcDzGuANT3@kp@O*o%xzv7hkspL-RL
z+T8i_WgCBH;zV%}*gB54i%CJtN*cM_XygpJS^|l>0!vI*I{+_&gUd=wcRU{G^c;MQ
zmC^dzd|nu$|Fvt@)Gb;+QT>0NxO*-8o#Jfw66sa@^zEza+7<RkH0ujItbE-n1idd~
zCYrd7eb(RV-=xf>h}B$+Bj9mDE@-l=M~tPBQ8M$GBIW{*wla<Z;#|7)wU`P9eR+ZR
zjhmMh#3^?*ljV8GAFBU!+~%au1nqARV?GBx4(atB{8w78NouO46wntBL3!`rc2vTU
zeeQ36>#RCA7`wAe)*^d?y_cM9K><{>+koRQSwZV+&+gr{Ig=9-aQ&E-_Im%3BUg|O
zD6|u{+Ura6g|^J&+fE?Dke1L<t6DLi@B1h~lpqlRWYh0;m^7HUBcRa8;;34w_9sAp
z{845Z*f2)*1ZtgMcV>8z%4JjmRYU8AKtYbS2hi}wjq&xQGl}G|m5t5JUw>_)+-Ih#
z0maSpvN$oXXwe{yQIHPz{^l_m6dh5mB$c1gv9+lr9tVGH+t#holoCa*E*DLfy?a9h
z5`_rO9{x*2LnQ}5ZDb^;>0r}l8J9IX1uQeHVyHAAWY~nDneK~g^_c$e*}uQp#9YMd
z-Q`ZL7(V9BL$^dJvxmdSG~35i&Y+Aq5urSDH{WIp#3{@}o#mKgtvtb@`f%U@;#WHs
zQ{yh&MDcJzeaj}Pb}LAuYXMgC;Kgj7b+XAS{|Pe0BWsSfb`ohL&I{5ChX<y=@&>U3
z=xgsO*Deyt_}=~d-^R#P{PKE_4U8UbEj+AEB!u!d-<|(Wv0pz{6juS;Fo^6?e42jc
zTTi*_9N&3UhCjYg^^>%uM2-!=w}yHtoF>Un%2_>vv$9$mMNvjWW1AxX1%`XuR3<xz
zIq1*&e<jU*jzWkd?96v5gAGZ0jYsBlGJvJm>{_$uC}+k-QjkDRms8vLoH>8Lu@iND
zGh0CfV1~f&<I;OnbO%5U!S8{NpSUsNJJFC0e=%jrZy9KGRA+`qtPl*`*)Z#H`mC)L
z-2M9S6^&YXtEJkp934qV>Jr>!Z(-BR4fSuHMmcbDiPe&p@Tk1k0vU61t@&Ghd-hy2
zbo>OX$0;e7XqP&@*)o%&NrT?l<q%L-6ndQdySfY?K74($jD5)CKGR6r*9_c8Dygcz
z2bLa<jAhi1{=?$P#dKX;tGVnZt%@g(1Iev}<Jw8muYUFzz5Lp$srAc|(h!-Y4;NT`
z#XQ5r#H7AhOClMig!KXkb^xU{UBRv%<GE1QpzNZzA8+MsVzSUA(h*A)h%E)?o?LsB
z$)8>%p!4Oxd}&sZeoMVqu$XSf#C+lZd<nqx*C%&AO}de1?4H>TK(%>+^rqMZj!1zd
zf#homU!~?cr_O6~RiY@#OlOGeoSB@|oG>XucK+?y{dIM9{QtQK<%HRiPlbCBmI_F9
zn1H{|ocfR_62IQ!{nS(i#Y{}vQi4DkZ1PjnwD8?6k2$cdq=J8S&XbLfd)4&~+mIb!
z<Y!fNb#<CtBSwq>FsHpHsQOlRV-SA!j2U~%=Ju;!SqPUP$8!Jz&}thtcI>spxMr<Y
z@shRqt9UdH))Rt?p_NIv6d@te(XKmp#+>Ll8sxY+en)+p(%#VN_kK7R8v2cF%^ZG2
zw%zn^{d)QiX~R56!>?JoH&!oq-@wD^&cm4>VQCYJB$7@NIWn4C8r^|gBL=IBZqK{7
zgk?qXcZuYURM|L;3|ZNL`vq;V{Tr^_vBt!VYMd?#9PZ}LpW$RkzTUyXm#u$WBigu^
zPvjpErXFyn`t?#@#Mw9E^$Xtv@W11)#>(Os(FsZRJH&Z0TJGq0t1PHbeUdMifH9?O
zll47NCGXZhuFnVsVm#nj6<}^!+uLgSaP@wLt0oTVSR;L*?h8UCS0=fTJsEEb)+)Q8
z=Z?lQ*R>yH&GO4li;Rp8_~&JL&KC90=CG!KlPB*18=+_xj23;E^)GsUkA9br=l|tU
zoik=*qG+|ZlUx~^9r%rmQgOTR2wQq+^IpuJjIj~Q^A;X6RNlzqMXgWjsIPBxbF=ow
z*V~w_x!+RHu-a+xH(g8dOGt-cX$CL4^io9thWPK&MUTkOr@l?)^2WEbas5gO{rka#
zvk^S-%(MJd{vii+VEkX}riQfD$Zw63ladULjs5>P4GOs5qM+Jn&kMXd|Ic3-JfImE
zMq%i=J?WbPLUo87ACH@AlP2wew$i5-;VELg^W09c-Urb$GedJ_nrRXWxyQp~i@lTD
zsTqg|bgN1As@OuMg9wi&$I0*|dJeBzyG*DozOy&Av*p_`i^PqvgFWaX$KM)iKgsv+
zPszx0+Q>i+!J?FA3+k)qkVe<8q^72Fy)Y(Yz_zcu{c^H6?la|xOma3w3x{&DIC^XH
z#7UX~FdYoKEKR$ASD^Rwfc&yPbrq)wk*tTg8dGHivrkj^s<kmPjMi}Yx_+Z}y|E@4
z!*dGJ49&jPm|2d-U0c3B;A80zt#JKxbKd022Yl%B%L8>zCbt-*+_w)WkM>n|m7%?Z
z^$E+l-JP9p!y=%WEsVd$6h7$_?zYShrw3cI2+FZh<&h&-k8XW)>GmBFCfAhbE*sr)
zCA!>U>sFIURSLS+$CTStTkJJ3sVyp|4jDXnHKyhB^lF3<7_Hb<Yf<KL7@iPKVfr}y
zf?Jq)nDg@<h1no%gh)(`FkT5Q!_FH<BZ6}a?7-yj6v~$9zSP57LF(Aj96B}UeQ;};
z6SWh4rNhRUFB!90XZE9j#{YaFm1V25nrcBm0`GX514f1p9m+ljA@|(fauBAYftdt+
zYDUcahGb!JWQ%HX54fDt@sLeFR903-v_C!f)&70^)*<@G$d)A|@(8j782I&wim;ry
zx>6sZAH^z7y?MlR4xo(H@2$j7irU`5s-f<xfs_3&Wlz>Hk)Ar3+2MP@w5raD(a&jl
z9ncgi4+f9_Rr)hq=?hx&Mt7bme3ya2Ax?QZU@HDJ4=+g9=}OG+mokO+qIcfLv1iYp
zZ>+0BoMA(&obO3wTC?V_vITD(Qq&P$i1={gCQuxrxG(ZC1YQ@0`%P#?rk{R*sk+Q-
z<{q&}V2dd9vO0bLUc0Mv=EdF09tbhqm6*Az`=h<{ga<dDvRhwwD4dL=%*q`l=SX5L
z1kTpCH!fR`(Z5;z$Ix(i(|hORxT@N7ZivY*uB-r1CLWo|;s!913#b`tWM<ko`HBP4
zRc&vtD=h`pwH<|O7zd;Ym%4w)h|p!VA+O72R`OkFHb~xfi-?HejEkC&s+$?k#cAJi
z5cu|kZ^FhTMBfTGyXA5b)j#*>K~wvPfJE*d%dD;6Gs(lznyOPOwk@A%76v|yDhZDv
z9^J#(_OdE%BCBWv2eUesWr`Knj64V-#bWvI@C@GOPK7%GeK$CMb0;WMWN$)I#Wokb
zviPf<B<6^kL3NYe8pgNG=p>P(D~}xcQ7BcIfi2TX949`UAhGm_q43+KsJS2Am%IYQ
zLjgEA-CwEg4c)i0v}C#5xWR*`hTKxV+74(Uj+eQfo9}lDRU>Zt#kl4f?wK+?8Oh+8
z^MI2PF`Hv(YVFo{H{$M0|Ml0QDk^=xMZRGosbiu{0!tIrqx;glRj)c_gAq!L=rCfb
zF0OZslMj47-y|U5(UHf~$plo6qYq5(*ss2uJ84afEyAxbOuNuzN#B1Z{blEGxhC45
z5Qzi(cMS@vvCf}Y=_r|+w7kIi(#6e%jy0S9{?^|GUfwI+tV@#keCq6krn*8eGDRFD
zBadu_^Gji9&TuSENWZ|qe!7bNj<jB(=$&GOrEK|?<vQk1A{w-3em@(R-bcAqf3wR!
z-V{2J>mwNgL#LuLz4mYEDkJ0O95$eg88eb+akWfBz~T0hCmjwc={od%#SDi;<-+Gp
zf2`(O(XExo8=K*>f@%hvVk#fWJJ{u5w<Cy-4G<k~o;>lAy)w%4`?qm;Aa>dARowA`
zZbNIS`5#Y1D>@-J$$qJL9-9Y4gFc5O!X5&lPoHm2qn9js3B(d({SnGWXnrL!NO^W~
zcJ}NECC?7m<&tg4IGeQAOOGdc?Y@n7dl#K5H&`KIM<=j`V3UT#t++?g%=zZou0+;8
z-M!9I1fCZAzdHE*>v)7r>;dlS#p&?uI`pwQDZKPS9O}0wXu4PkTX9(H@)K!%h!Gv_
zF(@5xxBNiK>s>+C<nZ%05Yo&mkUiB+R#x2gB2QXtcc;@Kp;gyZhp@j_&z`}hpSHBJ
zJ<Duo&z(DkfJm@7sJm@c53bE#pL{Lzk#R{&s)9})YI^afX1%d4aab}sAHMPbadzba
zHKuL9VK5`Z%%G%{N`(|kB~r!~QOQ!;(WX>~lQ!kV*j2QrMcLZ4jnZ<Yjy31BS=t;e
z2c3#mPFl`%)c3o~tgn~P+dtp;&dk}K=YH<{x_;MhX`Y^hp*g$`j}HfyJ$#r1#F*qw
z1JpSqkm|xs5>;NZ<N#bW7Zwfd2G&j*p|lHdyJNn5>t1V_hYJA0A9iAU5GFt`#4ugT
z|G_BgmwtnFJzip<!K*0{p0d?|h|}#i&cw3a#S+LfDe&B?dt~`MgmVCuzR(L^LQ;~#
z2pwy>D`nMWsuaN27}uLAXe;pD0(97@n3eTVUpP5Ap=gnKB1)G<j3`A@LK!Sl&e{)k
znR$66s_88_OynP7iyNu10Kw%w%>|54T72UI*p-nQGWY5qcS()$L6hP-ffqwV_bC*X
zi;;!<o2P5fp606My)EF_J~TWVH&eqE$$zh9hQ~tZc6%)!OB+Zn4}h--Kk}vR$*TZ;
zO{@>)NN9@=b(8=;1C@3m(ug5ENvu;HeUSCcvHjxE1Fk~{tTpB#O>SUV8IzZP_P;_6
zI2@Tj-AD6pHzDUOhgOGObZ=&%e5NTN0%hK#Jna7u@84%?WIZfEb@71CZ59`*SRFSP
z9&x}50v&!9GDv>=&|oGv>LuCjk$qyvkim0V-U7f1Z`%*zFiF~A_#f=Cz~KwYL-4N5
zve6kqLdmY3p-ne21^O0VU~+Pn71rYvKGx4v+VcK9PDCi@1~6rzi_R#WQbAB8l?8q%
z)*;FpZ)uWgh&BPs)CzYUSIT;F4p&hq_N11P*6**c0Egg%h`F&h)4+c0<B)gfZnqtq
z6{Y3Y5&*F_1|aaL1a>vAbz3PlQW88_^svYo=7UEIh_++lnj-MGBUJ^6aKlf~rU|@)
z8PE!0hu?VNH(3W|m(k~dje=?jMGPBfIPOJhPfB#5*T*x&xPsE!NOo;<wjNfA3=4yJ
zWX|A`<HH9mfc4;uSEbGrvbajfAuv<~F4(4-fTD$q`jU11nv_tsCai+7qkuKEfRmh}
zg;RqV5d*Ge47?KN--ORrlo7r@Tuuw2edfL20`e(j9d*v?ISV2!UV!q1ElJ*5*ka(w
z*a@(P26e(;u$nH1Lk;|9#no9oRfwo&Ulw=G--XG~gTmGPRUa#Jmhp}yj1TNf?fpJ7
zc!tO(x49)?*xicz&Sb}q9pH$&Rv=GOvzIqsNVEgnOaqJ+4;swV#5svQuaH15>^CAp
zi86-5eO1oNnx-hI@HsD^V~wG~ZuS{eov{(*P-m?|Cfl{3lYHg<_L_!6{e9dwub_s6
zNv{nU&IjkubNqO%VZZtYW|QdVp*KlML~l6Sk0$h(n}4j<UoXJey6-6gj6tA8FSoAn
z);G7u74$vd3(iwQ+*ZByWCRf`ODXI%?p-eQ;;sc24-UMdcPZfsM@FxU8|nm<-zwU(
z^ACg7MZ!?{t@eKvD)9xuoEu~_S?PxZ3nm#ab84;j-nzLx%?k$W)p3XVhD5Er@c9#B
zy{i0P9zSX2`;G;0<R!)oC9@Wybge|>c=Z;><EV5^E3cRDBCVXx=kXU7y?^Sq@YdT?
zJ<dZ6-46&^)yw#{=~_@Gl@sK1YOAF<{@v}KN3}>sSypRl!t%QLBd_WuVngEe^-f6~
zCduvSd$uvg3MuaZF$^=SWc-_%BZzEbI%vTF-PQNjl!0mcGQLx8^kGB)tTl?x3#GN<
zEFfn;jaKj`u>^Z*@vq}97^l6?b~ZIkn&s-cB67hSkT@w<bf>_fJ%1A4z9j63$~^yx
zvFwAZbDvb_)Jplim(p-O<vhp?RyhH>{fo8!zvmZ-YGtcVqOVFcm^IsERoC|YT|<l9
zT7*O+8!PrXFr~V>3L}&|wVk%57IfWgz>li6^t3$Pnuj0{c6r9OH^Z`09butKdyiVI
zHL<q*MSpo9xvgF9#cD6Ofw{i?RK@Ko8K>P)qh^XMEyRYB><}6<Itp|o4*SHN&zS;d
zH5~6R+4~#W(qMJVN~g3`5Dy(b-^G9U*PsrUmkyrO1|}TbI?2?<yr!m{&UdMha+@-1
znFL~Vz&qk5qBXm|i3U@sTnpOr#gxYQSp|OGQypIkL_Cxk{4#UROK8t*NaxWzjY+A#
z)}Uoy=E-7h1pn5ruVbcy<lf3k6X%9yHW2Ax2GtF|$Ky*!Ba~w1hGr!{j#APz?yS@3
z@8_IEx0UHP%t5C2B8Q6ep$g4suV*~gys#^+_w9MDJ&%Rx3S?ITa?QEreQ--iL1n#I
zfV6l4b$Ez_wdmUPW>wfaT4+-Z=5=#*7;ts&irzba8#t(dQQcdN=sY!zh65iOJZlfa
zS1P_lj#KYxT_{dTTQGVfyM#3A_cdJbtU<!i5$8c{Zv6XG4Yl4sKAP8fu*bdD)UQW)
z5?$T4-luy7RmzLUa;rUIq2S(DZ<%nWUOcw*dGZ`jp+SbVIr7qZ;+yS(noa!vdpx+q
zikY{bLVt1f>KrxmfHC}ZjMqSsf*aK&4aV!&uLXi!+564+O}n3E``A=;Ee31x?6QK=
z(w3*oH5jaQ$cju3TyhC012jUY2LeF|hxmf33eJ_Dl4=Z^64POV<{)l`_x257Q+U-K
z+!JN|{`70_o?!vqT%5D#+|_KF!lSOmO+gb3p0bbjm>9mUX0$^oHg?PypuyE5(Z+y<
z|HXU~+PN6S*y?K<=Oi1j8*S*)$;qU?y1q>AK|`h6O-q{i>$cy0oZ6_S+g_K6NU+(G
zP`5@c+O;EIdp_gCyN9o*Dp*ieH{DTPerHGF?gv)^z`c)bm(gG##YsteS5#=d7_Yc3
zEp2*HQIpic*JoM)QMz_jw{MMcF}A3;M)Zy6^ZjjAV`5w?&P=z#^s=GQXNnk#**LYm
zdv-jF&q}@>m9DXSx5%1x6+Q1`mpJbj&afmIJlS9zPnDmfMYT2d72F-;kShq<E358-
z^io-__U!&|>FV6}EIXTDe;wL)V)^Q!Q-PK<#Q3c>>8mjtbJeo^4tFmCMAHcCLxXQ>
z8AA)-rWxYyG}-B#m5+s*G|{ak4=@eJKbXXzthKkZ1AK(m<=h9`BZ3;7R6zDYpBHzR
zzFUT~6VKvux8ky*4?cl$Dm&W*MwOxgak)Fg-W0z-ekG|wO4I)NN_G&+&{9NetR10l
zJ8~;DQ5+Mt%sjV{hfEkPYG97@`pUVIdr3GLv#d!@l2@gkp5DYslLSrY*bEOBo#sbI
zJ&}fdH@0o)S#Q@+1>{}Z4%~(tA$%*q&u0dX5(%4!<R5+utj2h&d}MI&V$kPN&5CDg
zqn{W0?eJZ`OI0#u>Qu`B&zno%?Ff(UD6%VM@amo>Fp{q3w|bny^=#Y`9^QQ2vs((w
zV_R7LVq?)|*{T6Dyt+4)rLj#FK|00`_R5@se!bSb<z4w}<HEACjAK_6@H^N)7-*^6
z+oc1yu7E!_9`(64_fJWeM(CF)y%HC`zz(r#cydKpL4PJYlXDn{_YYz!UKO$XPoFM@
zFZ{OGu@#HdGfY+WyT(!tgZ8d2a;;NWR4Tvc*fps*D9}=T+LBK2IhMpJ6Uy?&K7J<{
zb|0>q_LwxfE*pB3zSYvh(CS8Z*+YqQ_sSWazSwXv5G`f%>i95gGKgN{2pp$)>TAS*
zboRt_L;!VHS5cvwDtm^;K#qx02ZM)7`o<*GSMF`^Q%!YStqTrx)@NFCP<@oHg9EIE
z%Oyv|^pJ|4+K({U)6psl-nW=nQpm*rts|n;orB?82`V_kLn`7mtR>YNd_3A~3io=d
zPB9&(eHffPW1tR4=rGun&|>BUx6GLmg$)Coc@NO~oJzQ$Og#Z99##>Ly?W7r2pt|5
z#5p6z)!@Z^n9X3#jS(1MDOOs2lIGn~wk0kMSFi4-dvTET*k&=7*A}x|UcLu^rz&`F
zDJiqK?l)YIiFoK!2-WN>B;0x2pB)ZuG0WNgU=4i=bHy(iKkyNGdt<=MM8S8<GOvBF
zFxc4j@d4@RsaxKCtMc0R_CZOn_YK3o?}i>)7xq7iw9_7{>?qKU_kD+H)DA!|y=`qS
z*<6ixC{;}$W9@5$p-OOQs4B)OW4dYZTy2KWiF|9ct$o%I_P1FGh{mN(G`IjVVb#3E
zSy{Z@w#w|e*_<T+cqA~g#kXxv3|`K~_Ej}zDm<tTqNWU(^4JILS5U@K>z29YMQEZN
z({~NV)CfDKS)2^`spr_)_A#Die47fK_|0+h*3GW+=<X|HxkK_A#B#mLF%;TFV|)q3
z*Y3RaJGKI$+hdrN2a|Z>{Bl|l2W+Aek01_{(sxuK4_3>bVr}BKRgTtR*F8}y8h^U}
zE$qXTB0hqF8W1T12S+=wm-V3yxC)Su5P8s3f+_9C7$mvOJ93=1gBq}2S@YnMd8T}9
z@p!z&C~GIeg+{on%!|PU3&pOoDoj(XT?bC;m^?zcX7iL#NZ@w6u8G1Rj^OZP^12vR
zi)Wo1huVNgmg_uKFk8Cw_cy_M#f?g>3UkC5p+w&%f$>4UE@XI&66wc;gFdY0nHwDy
ztfOUvwkF2S%bNAaQo?9G`uZaZN{g^45Jq5<Rbn!W8GXNX=z1(<<N&`acNp?w)`Q`P
z;|;ww=}t8Xz6>URwTU&<MFtspHZ7tvXU@+n3g&PZJ+seF8P_tWy&L0D5R_Y6MI|LO
z?91oD>O|cE;3Ir_FmWYBVBxZLxia$d_So)G{{5=ui(!O(|FWhd_ExC0c|rR<Jq_2d
z-@MfxzF?|w`h#K`DkwEOGf*gaa~46f4Gj>yzIWeps{;Hjv_puWe*PCATWqw0lX&Lr
z$$#BZp>l|ua5|-!et_iqZN>6xslYjmW-u33i}*-T=<KN@Egb~a5G;YwTx#_kJtH?&
zj1`UTzr_DO+IfsjWjHaO=EsyGolgPnaNY*E*=*;kbvZw;qajdX4UApQ?A5cTgDnpP
zM3rYgN~;afjqnDD1p`NB=wUTp9Z>aRSg1pW(xfAC{y8wb1rZ#?32Y+2VbbS*!+9Bo
zot<4U)LAQOp@*`-5+Ml_M5_F>ERKWbE<hlE@=js}WnEU56%7_V+3cP=q?@yd4)9F?
z+59DW=8OO9N|0ulu0A3##^Z_+-4MMsE;Omuh8|G1^S5Ri?aH!C8m3qaaRDyal2)Kk
zSUb`uaPxML=LZVxF&_f`&<=bouEyXmv`}C?OIFjePmJMrLL12k&V+Kv`P-kbEanP>
zFZenT<MR=X;&W)vgf8lQ`HS^I8w&M*)xbu_yL%>`KtchAo)DYGT>ii;0ibB>><^yM
zY4W~+(m;fquKL%PQLOuGX^3AGBMLqy1q?t7`1gYHdfj53O%Mf*Bz&d@DwcO^VJ|^p
z9kRjvQh%}I+8O|K3O43Iy$wP9M4wMM+@D!(5My3iNgD(*3566ig)AF7Pkc27Zs!-<
zV2_Yn?t-pgO+GN;gg|xgs+yBu{q8SU@nYTuqMAcI9|s8C0ys<iJ+)e&aks~Al`*IZ
zU-@mx``tMYbc0N0q5kQtYsI4rKWK-|TkZ6W!@vFwFY{u`?G+cz3t&MLQUs<uL9p<M
z+h)CGXDl*>hVpAylJFzSgX?T(5@!4Av;y~Gymw0!0G$%<xFP2^!P9Z?S<gf;!NHis
zoWOG+g(}+rwUZm?{<ZKmR$|(;H(wx-cUXS#{T|@Kad<Oyh>edP87loYHKG*TSY?7?
z&6%(N;k=%hAUC+EA%n^htQ2%&7(y)wU$Gtv4L?6Wwe7!iBSXG=wT7*ysZQg|s!W|W
z?LA0N9#HTqvpo_Tg%lW(U;P~~ZR;^#zn+PbrWML+Fb$jT+O1Pkw9AsmlPy+9U=f)S
zy|U0@5K8|0(RczXXSws7iID5SkO3VJnNEQ5hOlWXuI^SOo?8rc&tIt=^uK(=7)-z-
zVs?Tfgrg3wl!X#!uZ{D@Ne6Pl0?x4$CuXY3tul`L`nSH(6Z0F}8HW>&nQ>!c$|ijK
zZ5qz8nq8Q-0wIv=6+dn<4NrP;?sr(EX!8DF8`Qn&xKfBi3RifC5M`!v3)G~G5QzA5
znqC&~>o2R_`H}G5&br#mYlZoRgtLjQP9p7^U8Mg1@}np9;BoBf@3)2<52`Dqb(sv@
zQ)spY^%x}uuybV(JFeh=`ku!GXV9VYowC_PhXp|FO?S7>!dgTxa0mU(q%;ASf917Y
z&2G_H9n4S!aE_)BoR9U`i@DXAZ+)673@bL#DnqX;VR)=CLVFStdVNk{TsE5#%;^A+
zV?00IdBR@@(qVMzH5XUY6rm!7zac$8f5zY`z^=mIeV3oy8?5^E=f>+O&M|=pNTg`l
zhQV3H_yu0LTZMT{F*r*L``X%Ro9cc2S9GII#m?5t<2`5i`5h^fS3utmg>xb7(`9P6
z%7byClDifV<{Db12$_|E&Gc7GFq;wH`PT*b;qfH+9o#6VoInSQsr}u~PT+#@%AvhH
zE=ueROkdvB)cYS+(Jws$<Ey|8*>au0nV}bHW)lCLth-L8lBV8Yy`zs;ZOH@48<!GA
zP!R|$Fk9|CGhNZEKj!p|uiJ&}%P3j9F@~p>0x~`XEFIS}$9g+od(on|Q1;?U&)Nec
ze~g)+(fRuKUR9%nnF1`)7A(LzN?}{5WaGYIb^s^z-Oqm8MRurMXEDCM)YokqM>q7;
zd1J`w?d1g+YIT+-@tj9<3Nu?kmy5pchJ#~;Z)iJ}a4=A0^dhern<q3teSH0*#k_O-
zpH2&KmuI|L_m}^LkWjny7s{j^3mM;=_CWD<^X5&=&D?PnH%2U&_qHpqK2Wu?hV>jA
z?Z3N-2;DyTr6a?*oC2RbUOC3u4Gj&QJ?7Yiu%4h|Ed5D#9kLsmT@$`n-)j666NYon
z<M{e+BTfkL|G;zn*%KX9si|2!+-++6Li5}OI*jATj!9rJioO~`sQkgM0>b=JO?<Y=
zbi==lDulo|{d`4t=Pn<~LsgF+q5Q4`vkF>^ZWPHFT$Nu~uCZW2+HL!p4qFv&Nbj{n
zx&1enk^je4Ub>wY>K#*_i|HY-Y&d7`#ur8DP|WXvyB>0nmwL9VJ@+*gGj+o}z*Z5{
z>i=&^e>A&UWA#2|cbRjs(r|Lab_JdesM0~uc?&O@-7eq0npPS3RhN0+U4cAj20!UG
zaf?MTKoLev)z`KUBG?%%;}t^@6;d#Z|7Ak*jZoUjFYM7TV!LUIP_Ny`2B0l?yP7Vk
zjT)TPcL8P*Nog5V`GxA3Fn-lfAIn#Yk99z=5AK}+4#$d~6h0d}4w)hS8mk~9bNRLa
zb>s7|UT3ozY}7ov=o8~jMLIbQPG#lRKA4thTMQT?qR&){l(%1Zm&Wot$6Q#te>Ze6
z#0Cf0v?ffo=+>63{@bj7JN5iOo-uBo@Gc9)jyDACb;NtZa*La{(dO$qBv2=?NJ9Oc
z@YuuRDbJZ5;?pY_9ycCQ?wKTjIn(Ld8di4*DZRgLQz7rX{|NSIOMoM=#5s~z#FD`@
z3UFv?=@vxZoVIqS9{C^ccjx72&bfC*<rJW2Ee1CP;{?O=i!Lo0S`aIk$gk#VH2lqU
zNNDGZFLbZtd3DX9!ieV0>3C8y9p>M?fSlk)m|`cl#<=l+ST>g0G3D|FOiW2!aBP6K
zhI=E+FjFd(V=T+lU{}5Icd!`4*Vp))gU**XrXvCmJ~ssQ0x=aqa0wX8CH=X6k-4{T
z-^R*k`r@fdNIxM6vylJ#w>Fjuuoj&@eY&Ki)eBK<r-V$00VZ#eX@N&NgTd&0#Tl;<
zIZtQp*KQ)HS#mM*fJTit{b8)vj-gRzCgsSv#9KeY#^~!G_VgRbcbP1%o(7u_OuP|B
z)(6~?6s1|h^8dDe`hRT7K^#34&4Ac4(P$&2m%COGv5qu-uC15X0IFu3w%k~!+#mTr
zk%I5*w$RxO%Wts1XQ`lQ!C^Sgn0RG?N(j^~VnP*8M&bK(Ulqr%K1hN%8I$;(xw{+d
zYk*miv2=qc2UVpEBg+4)_ITW$={AQT$E;2^lBKs0aq1wO-^1r#z4Je;`*0;3Zm5@V
zz5^$n1LcJQnz;)1Yg%9bNSd=laxfDK6ICSwOFLa-b7L9=(YT8L%bF=;JFA<nFg15y
zX3|yd=Zs?v69b>Nlq7DiwLF3V!GrpnN80~q=haxz4E7wr(mvud(#eY-7C@7;Blm$e
zBWkZdkL46foU#6&Rs6(OnBJYkENAACIeFhig{1jn_6K88$OplOh3QmzjwaoNK}fj7
zMiEClng*p%@WaE+b=BuXWNa{V+}!>Sdzm`o1J4P7C>^s!_%EJ1b4EoZ>a6oAxFgi0
z*Wo#=h5-PkS<TYmO~K<cIkBvaNx{hhHi=Wo4T2?qvD4Z-n?XuqJk78TxkTr_esa~e
z`O4+X+!{{=x!*kC2#{1v<Kajz23a#x(rw2MlIqE=fjKZH&=KXq>C2&xjD2VkBfnQX
zWG{w&P)}qj0X*DRTDH!0n)h#M){G%Yr{G(Fyi2rP<ZE;9$V`a>6A$dUlzFNMbB6HC
z0tXBD>Cr0b;HQX+MuMi5QrV(`p#(}cv5(U*A@<rijOl9s6)4=w)%b<BoB<RQM>3er
z<-k)5;h>yN$ft1B#%_pz7}8yxmcn!@t;i$F^VnF>yD&!r?;g*OoGOkD2%hpFzg7oz
zX&6}x_Uv_ZYt}VVPa_-~r1VHN6X7yeZLKG`oR}amw0z;f3;wXOYH_;#x={gX{4)1z
z^=w3KH(xc|X#gdP`~Ll6upZW$&RlJe5hQWgDxuWn>bpkc^ONU=_Vo0KFWPzdgD^~z
zgm!-OxwFnDp0n<(#5~nY^t<n8pIkwfhd=0VuQ%gi2<*ibGREM^m5nhXZe~4|9>WH=
z$Dur0&eMQh3~olU>C})P76(Y_SgAYUNCOl^&B9y;|0d0<kYr;u7l(-Tj<qNGR~UD|
zo#hEq&8qS$a8VFS491v?_kb_Nx>RwNh|(f5KxfU`l)DGxI&f3NL!FLj5}F{M1IZ<O
z9%BH@<=#Cm9O$hY5*`_8Np}S6*1qirmV)6JjOM&wUpg6JA_WBc%R>Pydj~r^#0k~{
zM=x@Eg+>|e1Dy9OhMg68=DRTeguyW=Z%Vaw<9q5bYe4`77NeHS^BbrIQcP82qKO5Y
zx&!7I7>E49L{)8*@PPmHE4V$ho+#CqZ6^`za7ifXU!}B2df~!_^rK=^F2m_a0I2;r
z_)Ny|>3a9}ZIEs`hF<7~^571Zb32xsyCZ+!ON<M-DJvy^YH5)0UQlY{U9}0LOgtKp
z4m(=GqJ(O@72zf$Mls;Tg8=p4yQDt83-X3krlwDAN~eJNaci(sFmbr^k6nf$v!wCK
zo^@F~s#K6Ur=j5xl=vW>CN{>twaAhNs|n+ii~Gm2)&anFK~Y$2otv$&aV!;&!zO*l
z)is@7%2#BFS6p%NH9LD*jWcNi+#9QdZ{)lO-XrSVbz1LZ6(#Q%GyDdXG&N22qu8J`
zAOj4Ekg$TglDJ7xP0bxZ9F$@vN#z7X6?9?%`rz*a(0`*Hn_e<LL|h5&=x{boz=&w5
zuZ|Be&f53g15jt6W<1**GD|HqBplJacq9<ci?J;cL8fRtjM%7d3mk)2BKp%$!9If$
z$YTToKL0mIssX!^gao0pL6sJw%CtSw6DDmMitfRbMa*j&Z}H(=Lx_-3Y^E^;q_9!y
zIxcDzbkY!2_gNUrNtz|f^($k<>-_@Y0U6eTZwG!b<R;C{EA^w`))7*_1Y@`D_@S5)
zcs964j`%QPW;gqDUHPCuecy|fYN_DTN?@`*J&FU?n0H3!c`e5A6DNM>^D)<O#x<nQ
zaPBK#%!|RW>K5<#$&;;*M4u^Zn!~s@HMJf3J6VlA=mrrxTCK7Im<XIcxOYP0IWW|o
z`SZ`0@%8Ok0uQV*;0e0=Q8fT*$QiKb?B_bUiHt%0)leRA^Lk_%QNO0$N>3ITpN~~S
z=ZPbVXd5wZgCLP}^4PItJ8$k&?!;iXYn3JuUx(<8dQH|HM{A2L8T=e*o)K=KT$cfw
z{ua7D@)ss9ygBCUW>p_uQI+Kxr*WI<<0szg)mK(PHatK`9IR$Iz7W_R&M^Dm-d2S%
zeM81cOc(pxs@u;l?@Gq4hvN~j*NnGnU)`E*`o*}>con~sa3;YzRI9b9y!gve!Z9KJ
z@{P>7UpKBA^$yJqVN$5l!1AdV4s<sjf|?NXWo6$SX0Hh1JQ<h6G8X@@Z@WrakEVrk
zBtwe6NiAlh0n%pDcU-?)UQRX=bb{N3^}_zS1^}}l=(S~klUY)N(sCaUn=T!X<()f*
zAL%F#_cNkA_%1;)byv&E!U@SNU8Cm0ih`EgM|Av#4|xqS4j|#8rD`7C#(C}m`_d_N
z^_olzP4Blaj?jBMHRv0?4pyw+VA>_&c|rh!+4Dz~SNEoba!N4#|7-A1rW>OkuHl<$
z%cszbxp%F-o5SG`Itc9pj>1U6mYg*1ztBX`il9(%eEVXdtnBb6L(k=I_NOb)R&A>d
zRTxG;&U<`mY@k5hmU$a0O3|r3kqhSUvu_XNaudG)UKx9+ln!lu7vn&`)S?%Vcjyj%
z=)d*;Ks$wY>H0R;117ca_}#S7g8R{Gp)xWeiHXWe_;F{$rqxy^i4J%B$x3=%jCglI
zI%6AcP_HZ0Af98q{1B~YHlz6m`UC$`ih;XJT1AN&8O^Tx(*#&glX0P-@Z2nOti?c$
z#<~5+Fi#{7qxMy=LS!SO%yCJg{~QP5=k3i%*__!pE3@eNi_SbLzn=1ku^vziAB9e#
zFNUJs$<8(hZP$*e0Va7lsC2R;>^rD=B@eZyD-;d9(!m+sQJV?rPT|4+F7~B+{ej{P
zNTJV7TMCj<tu^IwqJC-IiUN3Ln`Z>#Z1f#;>6xPKWtEXUruD{KulDqZ9IvM94srDE
z-`lGzkLRoK(M@M=*<#_wIg$VT^uy?|u;#kl4~h(W{-%M}_~|1o#HCr;CX!3vf(m-?
zVE@ptKxC@T0rsyB9w%PDT+Gt`2W2ff7W|=;3M`sGE+&(*(o}}{PL)ryZFWf*?$Y2Z
zQ3K(3MaS8INB9RMi4yQ1l`}+o%B>|!{t4T%_CLgui5Xtl&|G4<{nFj)T8pjMx5y<)
z;{U$9**+gW1nHifLndH*9QWN?cu*}WZ0)!T=j#2XN*cA-wpTv$rH|>#zf#;=YvK`C
zo+p)6y*;&&22Q%T$#DyXJPvJdb4l&8mpMk)cOR$nmISwghm0h{$b;(hq^b2z@tkYh
z3+N7y3|(?f_wV;Nh>PvM0jk_D>zVc7TfnXoOeSe`ono5QXLpY`-Mu$F^6`Z~P0gOI
zLXC^8y}|L5TD%XGRRIdRit~$~bB535FU694DQ$8pwf$T0h_*{}+pld8{q<<;(t8)A
z{g}n;)(z3!+kZpBDsCtW)>)Vw2JS(ekv;2ozCPDuaozAxzYZp%^rx5@MNOGJ+3L5Q
zN0O2pu))e%$NvjO*Bs9$gBH#QFtQEemgx;PP(TxY6Xnn~*jJZVG(1$O?$YS~>YYK1
zdbeM{WhKZtzk|46KFd1Ksn<J3otneE3{o4{tGl3E8|A^m9`)fE3d7~e&EAs++5B<E
z%hS!&9u=s@7N}r6QmO6|+x~n{U0*{@I>)i5<3Wt;HRq3<s6TCv>!!0Pck|oG5kd3W
zy!kN%vt)As^1yO}t}w+;^k2hhh2<x+40q6Z!^4%+g)A;Ul=SI<{Jf2Q_1L!)CV=v^
zREKe=vA34v1)WS|{Kg{shrVl0N8FM(UwR5cYX*9rL;Ve?LkpL8r=^H2O)z(*_s02D
zG>CDZ2W7&&Hrwn)7>^TX4(9qOH}#_*b6t1|Wo?Ke$$<o!QDbP{CG>`%s5r6L{%fGb
zQa;&1Lv?*|_k%OFRz98XLi@fUQ8{Q|P$fS^LFW+qv&_SEl)Z9{Z}PvbwQvhWCyI48
zN@M@?4kz+4ErC2&Hfsz~Lc-i37Y0~}Z^>Eki0)H1&Vu!i`@3@@8qBP2X`ii?-@F*Z
zlteGz0~rRiFjYP4S*OpOf#LoHxVy<E!>AI7)2BXA-*`4!Y)O4_b?3M5--jt0*XSyh
zTF#s{4N9I%7+#cYSE{`gYpSGp{~r{AO>^K`G+9XbHbD2Er%uhz%Brf=JzY{(rnT?I
zZ9KI;XgX3GT!r>sMbr<mibGT&m%U*{OxThUh1(yl;)<05dn5{<4hRT9MjNGSn=<_%
zq{Bd-ak!Dzy8GGnE4Rfu{xMrehT3k}K$QN{4*Q4k;PTH{y6?rQpJYKa3c=tG)o`5N
zN0R#=2azMn;Hgjrf{g@=70a$w#ONKJ*rV(d|G1=(9g!OH@2=p5J#~;@!f?MF06RSO
z9I+s74VK^fIN$!nD*}6B(yUNj!3Pic7g!t<t*b|dD_PHhwS4LG@ajbwZxOQ4<YV&`
zN=DH6i90A5pIFP<bLY;TGw0X{1qjX+<ikf;cpuGvNZr^1WxS&4i-QqSAo`&32B4RM
zm=)AvA*%3m_ya(}3qkz)o8h{~TAJblu+1coQZ-WXy72kii6e-J2s&7hZ&?9il-UqG
zjCi9%%!iwB>`#*+^0^!Ey(iWqy8%una44LoxUf!!*JBQe&&ri6p&0x9o1UP*JoCvL
z2pOCjQCIxos=q0Qvj+bm#5hPeh6$}(Wt}EO-o)nzpdlE8aC!%|)+%b7&d#5+?*3_&
zPTuPF_oE`Bj}LE56v!mK8m{AP%n4%>{vvoeg#Dh_{)w_C%f03I<@^2)7JuSBSUu+2
zqp$biI>DQ{z8^XcQ>gfoljph@X)WV?=?$j$kW~yzcomo|5!W)*g@7ce8&i7N!5cIg
z%PvhdRs6$m{!`bq{0!d(orVGx_;K<B53Uw8D8$%8>kKYWb((?g53E1uS@;2mr~cE>
zzP%+6Uscm|V0?%-zBUfaeps3j00wYzaCac&KF>dU72S!s(N(iP3OZSA2I^f=RD16Q
zp_~k%j|>8G)j$IM+wv>t^J40qs6Cj+I>41a+Sv<Ji6i2RN5;UHCs8c^KHS2~|Fw$9
z%Mn->+Jg;y8SIz1I7AH$O0M_-YD1LX!c@j2g}=<|@p>Vl*nj2*Xxf4B<6Q^lU|HOX
zLCA2hwVg-UiN!^;edAaQ<^D)*7<ui#Rv?q&!5tqS@ABmG@p{L-Fu*w2>qIxm5a=)X
z!e{Oud3J2EH6S(33x+u2YECy$pkwBbnVCRD^IUyb+krP<cmSA`<H!ZF867?YN}0^>
zw>}{}aUzC}kAZAA-wfd-*l&!sQ2A@Ji(j#C)rc7Ck5gnFO%c}`Gxy7H9~zVhK*%P}
z26zX29UzBcPtzBE{>KD!ly_k8L2&zbRxtiYO2z?f$O#7mS%2kDj9fj1HPEAuSc{I7
zco?0D{PYtbv;YJ<+`wUo8A{mRw6LM?V*ieyf9fk2?8MFpJccKs2F5Cs_~XZqf6n=x
z7*P8GZw;|lg6l-&n!gX=@it4P|8bbeGAw_CM2OytkpOq^%NT8V$peN1HQEAD5a1GI
zeJS&cq`&y{t%5ZmO}tO+w0p`m05$c%)n)Q`-vxyml`4k_W`E)Ge~;mp)f0F~(ep}G
z?*Wnu++g$OLCEJfKPE-a0e~5vvaZUcM_`!Q>BF~z-pW+7@G4rQ3D3|!hWVemeu~mr
zV^+n90X4OYUD86hb0o13Dn;Lc-=gQoed+QmYGzHQMnY1y?1FAf;jLT5z&9!Gpc7nA
z0Au6UIGGy#eSnOw@bA5bXFe}<y72ekN5S7H`;oTdxpDl1C?W2iuK4n&AIfsYMhPgQ
z5({SuIPfqWHZ{yio0}E(N8m{PuA_EBLc{MjtodadKK)bo{wK&K0XWnZ`s8W3!;+JF
zE`*Qe&}6y)^ZUFwzw^wZE=}qWrH9t(H;3?1LICk5ZtNc*{X{@GsB_I2w|ordARqp(
z(*~Srl`bOyo53eH;Ml|j19qV+X_ZnVi5lbu|JtM!7~x8$o%kRG8djy7_hXlW5@9cD
zhBEN2A(Vw5TFS`?$B$%T@&*7W|MskbnT)cD4X!ml%=Sa`Ro~`@&z%IknDMqb&3kw5
zytv;pB$Urj2N52^DB_uGl5Q3buSm(A@_#U-@M-@n4e}sZ-kHXDSLkcQ&4UQ>`l{m-
zdEecHf|8_F!r1vsFP1eAhJkWwX3<TU`=Q;XU^gec`>|!HAx3C|<R|{C@EVz8f)ol!
z|HhuhP%hx$O4f};j$SMjv9N4&H-olrgj9?d6RF34q^b1r(?K`F`fa;p2Zw-G%of1r
zYRt0pkA6DiBij|P1;qb{K`rUDM#gl<N2WV5_3dzXt{__gv2}om80H${Bp0N5`sZK&
z;P|aUC0SV;0I|ex3cUa<Yg6pqG436qq2XiyyvS=?@?e)|L*Hh*NZOPS;u&-WGe$Tw
zRWUa2uL%U$RxgR1532tWKPBs9P2|t+F+XtN#yx?&;Tovu@se2N2L(Gkp7@C`HflZ2
z=a*LjH3Q)twqyYU`)oEuBFjWMJYJ0RHW-&-I)eYCvQl-~vSlhNTa*@oiQ@em)K+(x
z6iAsPeJ&i_V;O*iAk4>MG!5KXZMz4zCCDcls%zMfM60NRi-1K*B5q2LM5`#tGKkdV
zf;t0ULd3BPf1`m0gh$TrLY~XB`g$8z{474d6Uq~(nj5xmc;sNxLxbnFtaVgmy+qdc
zI7sTV>^9=(Myn;^Qeo-F4^tQytl{l}Mjp<84McN`v(qWJgWIaH7X><#Lg2U+sq-qc
z8Vdl$jC}aWiLvsfAR<9*1o9>*Fq1;OI3Nmu*<oT!v^_P;9f$Y~O)3}5r8+E%l}l!S
zF#2n|;m9hN?$1Cej<6Ar;s7zHnq#(#Efp7tV+3%m(tE7{Xd{=$XlV@Xzr%f~u<86}
z@HF`Eu$Sr;nFyDhN;~Hq>HGi$C~_tv#twsufK(H!OOP>W`SdwwQ_j}QK%-&H{L%e6
z7ZJrA^jEM2UfTblRf3T7@mE2-D0aqkV0?n;md?obi;}kb`09XB2$2TCE;cJzl;ikW
z1T-EUJQ+s=%t*x-C8TY3@rc#5TZl_=W|lNg>)?}dYz^IfI$g|YP0`}qimOmZECB--
z@qWyEtyj)zN8|rPvt+rj7$$G<q9AtFcrP%;V0s!X=Dof|3CB%FqF!jd1ewVty@%@)
z^9*YPnZxK2FPbN*5z3a=?8`TFeGm7RNUgB}i2KlwiiLQ^vwH~ir<tQ;Mf|?Qs-*vd
z$N*qC+0HY6Fpa{g7{Za5AH>1bD;LcSYz}tzAhPut5e%KZx$otwnDRvX@;BWU!c-Os
zd4ZCq?iJXyD0?tUo1uV#*RuVu?&BiBS@$RJ0r<tZLS=$^R6zbto&;zbayoEYbc4U=
z>(_g7W=Af-<Ra$=>?NCqrzVd}SZBO4PA5=TA0q(g3wTUmI0V}i3AmMLIboKZd3*W}
zJ=^l*^%J;>!3r)-S2z2YzrpIkx?S=#2O4s6<3@kjvsMixE+IZ3(C|>zv9zD1wBKxo
zG!hpUvfP&bqx&i`nM)rXAz>7;u6lFnCgwnr2m435yX_UEf|M6%X0_me$1{V=(ubx!
zMjm-#N~+>?Bd#mq3SfselGKLNTu}PfDd|7|EG5Ok4THJH1B~kQf%+yV!~L>kEI90{
z2nvFm8!^%O@ki1*V~zyBhPZEWtRx!5a4;R{8TJdn9U;Hq#UxVdAMc4d0Vf_NrPX9M
zgP1=;#S@{}zrrMO#A3g#wH1V?EV$51=+NprVr;V6wyU+YwBVQaBP31O#;z;vhM)-!
zP}+YJ|L}I2;wcthcx(2Qc(l8qz$c$HhMDvF^H81PQ03nB>1{*xYl?jec6m?=3Ov;8
z?1@z=76R&}VJNI1a>9cZ9Ap2dw>}>hRV9bsX%h3zKkva`kzXTcj2?VA5Wz{6B4cF?
zt>9)+?L1F*l*mtB_0j(2k3MyTw>h_3Api8~Q|^XMT`Y|3o#q?DAOxaQ3yawOSy#0!
zf<MY>@bce;{#B-e<9Hcl`ob|sFv|1Bcn2_|hnrhys!_QWs2KmHv4`+SihV{giZc-v
z@$VpLHTT0NW*;hCr@pNJS}DMl0(o&^F0{R<F2O-1(cdJO#)tidlec6MgXGm+@Wtz>
z;U#VtqRZVi{U*SQaYQEc-+tGmo;p4pj4{!sVS}WeM6TWDY|+D?f7Plw0by{?2Ud}3
zbqKE`Iy)!`$i@H9Dj%0`)g$6*r#yuVAGJ<YX>rJsjV@gDg>v9|(I7Gm+`)2IwJ%$W
zH16n|Uwlc6MleveprFlMY!=JhouG5&<uh3<qpjXwxPS*LC=X5t23}a<<AD)3Dy5eQ
z2C(lz761`|k-vY|bfb6b{9*=64_j<cG{yx0FNrC&Gh(Pu;gP*rPyh-Hv6=YHs}U@g
zVVa!?q>EteAlM@&pt1SYt5vj0LT4a<e-<92QyNrvvgW&r1red4vX26hT!SBce7G;h
zxe8kt305IV6L$6=xx{$=e{`H+8y|;%Cm(S`J*Z`UfUw|dAz3xuUf+KtBXQ(&|D)Rm
z|M@p7TByTe@U4DP*L59<9^7m8g-`0`)uE}fbHk+}>4$fv^c|Od@g<~I(sGj5k3K+R
zG3-dl$mw(E3^!~Db}&&(z;Z*X;mDW#kERmK?e0Oo5=L-cj=bC0k~VMk0HD<9-8zfj
z$z7a~_#Oo#q8LYB{qL5TJbXLU7|=i8+DG#TBwL*t>FkJS7C>!vTH}93(?%Zli5puq
zFb0RT65h?Y7chqNLPH9n><4W9*GvmXqXNkX|EnVz<!Bp(bM8ZIfrbv`7ZORiEe^$V
zSXh|M@NNq+_<Rs)BmVxQmm_rHSS7}Vld)jvx?#i){0D|-PPrI$13?^Ff1mtBZk{hX
zxxL^y!rO)LkS|`Gt!7^Hg`deYFM{R#aI4O6%H~UVF_>+3GRn5YC4gBi`F{Tf3O^F(
zo56dsf>SBz1c1XJ^sRC>{YdWqZ$FAjIf2=KujOLyO%&##SOD0swNz8tPe<c4M?URS
z_YlNe!k&RVpc>O+@B~JjG5;U0T4P{f07`oE{G0rinC8hHZ_}xAr@r*dEH6T|3k>!L
zNv)-e7aQqYLOFVYs3-CFsfTYIzw<8HtSwD04CG;H-~d&ZmruOUnepYHWetyM*pl_Z
zofmc}i(!^i9`WPnABSJTo5hMEygB+9n5jHLETfwFsxRH;x@Op{M4^_1UllBy=QMus
zfV=R>kNQ*xh9AXaO?BV2DWHBacP}BNm17MfhFQV7`i(!D)z3Y1prDdXVh~Ra909Pp
ztXHl2V{PoT!Wf4jso?tppGCDhXE`;id)AB@UI^)RpPUrdOL3}MRdr(emI1#l%jgKs
zg!mjoARljUWG_7cX??O|GZ)i|%BN4OqJ$LwOqm#k!N@aDJ|CJ@*PCw=Cr+Pl@mzN+
z+{Q+poJEl^v)0T99F+(91z{l!4-Eoidyg0iU$EWKYrN-R$Om^IF&&x!B`b<t1ziyY
z(6lLBSc$uZ|1G*;$0FotAOiy9dQUj>i7cJOij0lDh5Zl|Ffs8Rhn)vNxB|7KXxF{*
z>{NKw0l-?Xr?*9?V+nWZa}LLkXssP8I;vA^VJY4NV7L%64>CkUr@KG_g%u&v!}3Z~
z4|>_HI^&m0{bw2TtHAg<A#5UnLkqUIJX>YMH%@)O{;^9e@`nQ|nsp><0S&F8iDoQC
za9&W;70|R`d8f%5yliVik{^xh;zxXt&z#xfU%qhZ(g7GGY^!To4^}BbQo+qeS>D@Y
ztZ*_GDLlXeyzxad=q)qd*G{_vmtr_?7o)}{8IWK-qK;J_w{PZuHudB9={I1l$ZXP>
zJ^RJe$<Idw-Y9L)Kfo9g%eevGc)d7y=b2>0K0l(^2&KMKYZ_wYflJMKs2`CjjKUut
zqnpL!b=9rU>LL%bI%<<Ef@z7(QeDfb`VHK&%OK?eyfqfxWeEdGf(OH7QE~gV14nAN
z9G^Hnqp<HeE;I$;7)+(weice0u6}=_sLiL2k19aS+0ig!2JlKwV6eJGz1JIlT=Oga
zsE3L1=oQ7}54ous2chak_j?i?;j(D8jeSPYV$Ut`Km$O6WhnG!5%)w3^n8&vZtkWv
zYDf@5RNd`oTq@$kP(Q(;VFhab3#_uIm6fo`a&o?yY?9eX7RA~OP#U;?<B1-ZxI^Q8
zFg`1+UtE>2qY5h+ju0N0sHD17G_+y5kcUQ`tY)08Z`#`C_XnXYFTK(NCwe1?61gd<
zgt6z{DEl4v&tRsJ+})3abvqct5QK($SfN&c3l8e3E=_gB-tlmYt?o^{Igpf-*YA0B
z=F}3^8>%WdclQ-kE)!ic&odi?Pj0>sNV-6Lo$GQtv6S};PWjp(MtV9@1E7L0EslWq
z5e&C|xWT%_^;IEtTZ#&{B28zbR@H1EFM_=O?VzWEp+KDwbVUgzTee%P0jwpkgkcbg
z>)Q^Ee}-{-^nUwyxG|+K-BOCiQUUzqbIp;KDiLSR$`iMDaG=!Zzk@e|aZGewjLu+3
zHd<om##@@0uuXmy@I#~<q83WSi6I4qzpTX_uq>b7%7FhQLYICP7vF0!`vqLM{x(<{
ztq6GLrolEd=tCsAPIHeVPzktco4ut_XZ$hPTj_vy1O`YqL2e2x%)$Oa!zhN>lKcBB
zoctNo!@bXbyCh)3qQoXJ&+o!RY(W6YluV33KE^pv2Nf>S)KPiG;uP!-krJxcdZMB*
zF~TIut@}HZ>U48YRKZTa7y)%ah^Jyx*{hVKI5RrcE~SOU(XPO`-(T<c2*8DxTsOta
z%8EMeN^Z}!)GjOzxHteEN`3GE#u(OE-NdFILq6}G7S{DRGohtFd~%b?<zAm%JB)|4
z`pqghx58z71VmeDjxjVeA?YZ1ucsn$J^>tAT{s0j5MAl<07yeEc7zdc&C=k#8zyg%
zgeiZM*-fN6aUTQt5JO7x`PeiIIuEN_$zgM=dNz&(Z5~s$*uJQ@#vI?xNcfD*1mZ5P
zqJ3m5+2Rnnxv*MLgL9)jqriYxdldW{yDbsU2F}hMShTjzHfXY%Ydk$YP5c*@5zF<G
z_wU}#>tckC`74d+@8?8`F^)Eg<Z0e%GADhhmG7ZGMENx06oI4h{hZ~`2q|&c#vb?p
z^lSrbb2Ng(!>6MzM3ltxPNxzoqF@_9_Cfc=%-M!(3H;c>-kvl8AfBkWm8;d>!jGYT
zmsW9T1LE}1w5H}KADu}bYS!f@ZqnB;6uei%VFHAwwQ*L4Q(bPl#IBTa55NZ~dqg22
z;dyzUxU)p%?-kRsddi9ec9`*{5_dU)&H;soYP_I%Jmz~XICOHq*&?Iy<4%<09|OPs
z#8aV0G^8%TRA{1RP58Y_I5ftC#vYtxW{+|oKh#2uy7?_u9C#DIcswNm%`ht?(a+rA
zqi1n`w+`>RC3p%;lOA-wrDfQeKL9qeV(R`Br@L)in8X+@EIII3S`e&I4+s*QaEjf7
zQ>Rb!@su_Th>0jh;3CQvUQv{lVM?<w6ucg_8~Vmp#!AhISXBoD8f_2>D0+iqrF(kn
z$YBf$vy)RBtQXqg%j&!nXAxjNRM2T6WAlan%P;huJ0XfVZY$;0^8l_xC5;&wTrW1m
zLrlVl*isf7JXd|Bm5oz5XOahuGqA0>SZoBj9ymtYVq_Hl4yVHzJuqYo1xaMFpCfnf
z&aQeozdP$1xD;?Ygh5Qzt5vp7phgEvd{68!&d)}yM?0FxDGB}%2tUQ+&WsZlNgnrL
zDTwH3-vd=^lZ|YM@B1$)bcivvv|!@jvM#;|NmD@7JW%!IOuBu1)GYL48hRFE<40+Z
zA)YZzfu_oD8bGIw2nsolD3ijL7YL0)k{O2qUl12TulA>8ka68cH|NE~kPm#&Um+`y
z>*X=!!WxqvqwTI6@Ugj!=aoO<D2_(zjNN7a08(dw%%`nQ!|0Pgt_%Fm^D1^{fU-I3
zs(XM$o!8(Iv%kV2&bxTm{DL2Wx{btgjA^zq0$xOz<m1+E(9;XaQQN%(rz;Hxc3_I8
z+9k9=0fK!Sp7-zSx5xU(5wucCXdj^L|J+n#T2ND&a5=Ql)^EKfSVy8xFOwK)=u8ev
ztZ6k#K*8!xQvU8t4~veT`Qwkjq2#EJ)IED~)=+rX#%$Oe0YMY5eF|>y))!`YF5&~$
zt~#3zl&tF4jp4De^?>)lt77MuK|ujSEfMVqQ`|``Rp;1N@{5t(XSUB9G0X%DEwRHX
zg&>@D;E+aaV9#A`udMk(50%)aO%m$PJFvHN%TR9!uv+`N8unVOPq`UFrUf_P_}QBA
z$^v%jH_IONeH#n+-+hPwBx8=W`LOwjJ$H_<sfD?DXa=!Y=wP!a+KT2$PR2eX&th0E
zy!Q}$p8O#@H3N&^9E58#k8!M*0<1Yo{>u~CYU-&eT!&10OSDzt!4zR7BYdm*Xma-}
z5lgAbld6BUK;5k_@;&<qLtrQ$w)#9GPr<gjmtO`N4Ia}NSeF|4yTMxE5WK01#g0i#
z2(Mavq5g*e8Bnq4*dJh-6i<--puIS=AdEowI|Jer6z-saEpBqz1@pnZq_s*mwOli=
zAcU`<`+PuDNcyBIb@LSwq5K)2d_;)}?z~tIe2)W$ry_wmGy1hW$`K)<i#IyKHA2%>
z++~V|M5Z+&7N*o2y|_y=Qujwa&vi*vzQKiI%zK=6A;OWVuTj{{6Vx_v_w+}YyDm1q
z=r=qBVAknQGu}miD5h?{aoRK7!^e*|+ZZ960N<5(jM}`xV0l69rR%SGWXPzdYz#EC
ziKPFbj+1;u*vP2QE&_~16{1$*h8hl1OlfuXnt^v{UYlZ`y2<s_fl$TcNdAtnE^OVV
zSlEj{y|B-eQShh%3L?aNbR-jf=O&Co9dik_WG@^Yulo?e6$lq*O8Hp`ApsKi0h=ZR
zhX%#^M5NV0NA${Vt2Pp^Jspg|V7|`UegLfsL?{F;Rw|VZ#aK)=qnHr?Z`V~Rn;IBY
zK#kE=H0atCg5qKYfL@y?_{s<|myAk7laI#|QC8A6Ln<ta7G@22IvfSX!rR~|gRzB?
z>m9+e9nWF<?|1J94Q6J9PxtYvqSAT4V#>8deJdaw)|lb%gu=f6RI!jqm+6U-2G2%b
ze%*xu4SHlr=sL&YOqTx$?6%So{$-m{>I61qqwBhnrhRP%@<}|HcCC-wc_<t8&pxj@
z9&rrjsK<pxXHt5u;oIWdMM2jU!QSugehBL_F!eeDb?^jl5mq*b_bnK}q#0?tOT2n;
z*Jgo`h8wDGk1$9Usl2PiE4WmE;9QmFkkW8PPgEvEyh-v(KX|v*X8NJ|VA%qGw&M&D
zgKjL$K(*lZB=Ea2#cIn^-i|Ohi3C(mQp#r}+VRxj#IE<!HN#wyJ7Y5#$9_cpCBd|=
zh<6HIJ%pZihWK2dU2{^CBEI?OqhNJb3}GK5+Pp3;e)>}CB6(dV5RLlZb{&m=inKzU
z#tG@zrJY(kuB9&X?2?!^?W)M^NQtr9@9s~99Y9cfD<VijKlI3~j+AIqcdBCM&jiV4
zN0zP#zHC;j^R#?C<HSRsDv;qYSvWFSM{<{0Z(vqbAn0We0Pp6z;08S>`vLyy>dgD<
zen6R+bsc4@71Tc%Oh7~R7JFgK@OG^y=ws3Tx$lphGjCoBRwq&apy7PG-e~5MJ^M<P
z@@6o$8S^e7%1bP#>}(lXqh$8gd`oOUCP<LNtE=nh-@JKkoRIR*f8P=#3w{5Pn-@G2
zL?G&G$_;SPEnOd@Y`kW=Vq{{u8K`mB@*Fph>g}kG%{P2_qOv#WN-YGkGcTp0e8;cZ
zDm;<+G80O%MIa6X%UtIuv(2kO{Ng=cJw<FJ5Jf!x*gR`6(BLb1sbbsDa26%5q$7ze
z!)QoCOErcr$4FQ;hjQkk4TGaOVodECXjp9Z+n1B;O%fpXJ4UvkL&7Mh88G02NaKtd
z#oa2&DXVOQElki^W4Fn?`5I;ZFgBWqcm7=M7cXC4!d|%k(|e(43<oVN(beoD3mVt#
zWOVh%6@b*9LV(C4i@;Xb?5t;%imGCY;cg2^&W5ZH_&_TLlgbzE?FEHF#OInu$o)>S
zJz!B^P<1$a^VH8F;o&)ut?5d7-yfKM8JCKTq*iZpKl`(c=V^sFue$@&f!-n0lM!?)
z52dQ$Q6n+n2WE3c#Nua7l@EA?5Cp6w>b`d|PMk2QXRhdFk%xgX0a(6uM5u%fA=$sk
z3uYbE?|J^*TGm2n1umEgy^#3_ACMjRhkpls<G|YunoD)a)1q4Hb}G6=)}K3|I)8rK
zs<WCKM^F8P`ReMqsE|f}yZol}J8xCLDG4p~<X2;TABlX(;V|+U{l3?^J01<`TcTy4
z5tZT+N1l;1S$Bm0icLE;yTvNBZHt}(mCD1jo<#d41Hsg`;jcN;q4%UTJ4n;ApO5xA
zUSf;`LJA%{0M+Yv{N?~jdD`!96mnjKFr}ZN=SkWWC8O)nBplrCfqsv=-qm-e12U2^
zqn1{6x_$wW4=bwmQM{j~k$2-QZ@%C6-6)Z3JEw^JErFAC9CjLTyc#u^P?iR`D=~mz
z-O`t_T0g@Dyt*TtSgQ-IObNLXBj|TN4Gt#hr0h(LVe^JA5}WaGX|p4|8__6KAGeA_
zLksSTiKUvTBX~miq3f|nb!h6K4sR3XI<d17B!-gR!j2)MQgabNlxzF>Xrgc3?*EDS
zAcV)qb5N}5=3K18kQTYQu0b3?t7FyNts(^{m{9z+FlLcDYorMivY7Mftv;lj0>f<-
zk+)i+_hKWpekC=#X>`t!FkeZjeCVD62uTtMHjS_}r6yMw`grC@Mv}~BBhiCm+(mup
z-xevqMIDggMM&E_W38FLjAT*Tg&zazM<(|*Ym{$c_4akEE<g19jb)W~{(*s=wVCnn
zbZZH|ho)nl(mpOqBbd-cUDw0vgtallY_k&x_JcS_t!NEsCl)-^cgmf{^&7ali-h!k
za~Kfj-*KO}FrOQ}IeO|0)}=HFKUm<=0p<}bDcgi3ppbnTEWVLt39FBLfc~zHGl`H;
z2Q7I+`ordV!Fg6W6wVOYPd36jyFFUnW&R+S^udBxa8-qyYA0H(C3l~p-|g(~&QxyC
znx#XtIIC-`&kZ3y-}ER+uNOyfgG*U}y4|}QEiZIuK^sTZnV9ROTkrs?;G|ifb2}Kd
zce7t#i|jcq6;Ky&A1$s6<YVlIqvC-;8z6nNRLBD6pf7~rsl=ot&i>0tfR4LHl_su3
z%^h`l3zd}g%dO^ptUN)k!0%>1gC}lF3}DWSA{LW0?{C!C->#s1S|R`kv<sBK_ms~$
zpOtXGCR{iN!z$ci(B&rtwsRYOx*_2(0jS>*t01xv@va!PkVh<-gCK>D=H>+DcRXkg
z!IY>UxVZKS+Gd!FmdEQ1Bh6FAK43~)K6i@A4H)?Cz&0n_v0{|_XDnQ?G2=P_UvWj*
zBH${R>nEebIMbYmcyg4e&z~)Mhob+Wk58(ds4TpWX6n}8mivfuUCI}Tgp@MpkOX>3
z$u9T<wzRaodIe9+LvFSTkC>D!BkH0nn2YaUEwS7K*?`3BGx+F9pjb2fH|e@g8x+)_
zmPQpx6rglZ)(RkYmXl|Knj*$8=Wwj8CRc4s*<fgBePhoPh<lrVi6*(>8_xz4<54oj
zM=3Tk+%hx0dEgDmd8vJmGH$kEn+hE(mD4eXsr(M@BSI$LK|!6GvJuH%vZ8iZ(@GCS
z4Z9ee9RSw0u_@gi$D0oTo9Z#T;8NoVvb$o*(m*to(;Yh;>~R>=4~dsHl9@oRoi+|?
ztkiW!LOBB@O$^ZwJmFa6gI*uHjQvW~>qfz-SfYGj9=$Q6>|N>fQVQwDi)&6}L{_>X
z=fz#zriE6wywLlK_A<x72WN!#GJdi|vb~yYfjoqgiYg2^ueKB)cT2c`H6UDP-wPtp
zgeu-v<4IMFEL=U8XJr}j3cWRSYb;zR^X<_BgLV*MX}Fc*ueAf&(wyIRt@a)`fB<!S
z?k>4UTJmy=QX(Supl)evH&)fj*nYsAF3^*~dg8Oe<*dZRYuz2p<5D0T9GM`QkNOy%
zx)P$ICRw#{f~T00HZ@R+H`p}Z;{G1B#1W+iwo^rvL7wEY4Y9YI076Jbla?iWO+<7d
zD(A`XMHX6-OkZ^2UF>XKrA66jn#r17=QEWAa3kuWN<|m>yU)^0Rhu4VuK+fM+4W{&
z<$Hh|No=r<9SQ2g_9Q44fyE&#IA{3ZM-~afG<Pnzxdd@pK+BCpJ*&54Y*=WvSxfU+
zJx(li8+!!n;aIATw0R_2<>W81WC?PS@=O0E&}ACp#!9ew0-DNuf@CiOeU@6fZztr>
z)E}$x;;i5AojHsgmBVAfvziHI8=QAG_00h}#ZAZT(ft6!rSJRtpi8=gwihlUw(FEs
zrA-mfL0~pkSDJG)7&KW!Syy1>y$Dh1TRF-y%a)l*s*u^h$wwf{14Kb1a0Ytkj?yQ=
zT7{(-^j)vO+?Vi)-WpCm2IYGp<n3?Y?xSC?`ZWZ(Q7ourfVnkgE`Q%vy^&_Z8d^qQ
zLT9k_RndBAdcV5=J-IDjR<4B0G~*-L=;Bz-+bKAh-ld$r3|0~R^EHvmYG5=P0^0QI
zm4&6H&cKVK*bhlzk27~7Ts}n|?9p71sxspwS*wfF%=Uf5^=d=;qr!`^IJx@7BqL$v
z(-zg#H9=C(2$F>>Z+Uh_^(zZBT*M(GK=nH|TYYF_b3*WybD)6E5Z#VD0TVZU`Rp^&
z{YP-_V6Ul7H?JM|iLSuRD1wq?zhgqDUW*1@8VpK1=fsz&2w{eO^quaDfQM^~>W96(
zx)vjubgA#aKFy?evQ%47>FwgbEyDhL_z(@*49CitijOzAFiV(2@wd*;f=tolK)^?X
zf<ru(!bgRAec~#Q$(vkYPB+#qrBdF(+21*AnTr|qu?kLUMBPuCxn%w1RaI%4fnutO
z=n>X6`89`|a0k{%F3ob6m(w^|e}|j6xXY0W_Mn2PAN?Hb$mRWpTeA~ZD>Jb2@wt1R
z-$;=doL(f(Y#@*i;fPa|UF^6?+{B;SZm?L}t1!I;l3F!t;VmRID;7`$76lYtzg`a|
zha%cBKIy?58c46DNu7hv3Z60$9OHBV-Zh8_FM>6rmM`3rphu<g?|`m`sOf9|s_B?W
zp>mmF@+&4LQUOzz(^pcbvy8&`t64!uE;^JFz81;Rd^pesoQovTFs5O?$R*2JV2Gv`
zk1B6?fd#r<@>u6|ydsQ;krJW}hwdP@I`AGA=q}j}2$yOh`_PoSy7c<Fv}d5c9)zd*
z_LMDh!}sRLqr3w?sp)IDV*?$y#kb?fBRpHn&jxOlPW0U7^_w&HX<jB#KQN5|y=;oa
zQdB~Entk4YO0X@s()j@rirf;T$Z<;*NAGZGWFtbMa6>w4PoyEwhSAX_q3xRwSzYnL
z5Y9wJQ0JC7W`Q3L#${&<2~Pro#JqDGEPvaFMvw<N`vV*};e6IP%r{fyd??ty4mVI#
zcH_tdZ7<FVrusI%14AgB=)Qbv6x+oNq*EfT0P{x6iK~tz79-)Z4X*wmeu3Nvdy&;~
z--5?-MI>x8{U*0sx2y5EU!=u#oNas@mBei2p-rU6gOVvFs)r@IO8OHDl}v5}zMn8@
z#?Ij}qp0bc(PWlR9R&-7E%yKz^+mQMr=l0|1gSHra}R(Ik?O_`;p2In+5N3b4p4G3
z8!BFhwwr>%sMDR}r~Umy$EKnsof-KUrl2`5ULj`jAnp)Ow1WLcC`!Y|PR!}xV5@?J
z-zip~Bo>GkJm+(t<>HDJH*bT43cwvzu0FIK6$XZvuE5x?nPk%HT=JSH=-h)<5Mhv&
zzO?n|nowaahW|o6!%4G<%v-Y)<dG0GS)GBNUNA*|IvJo@tmR!qHkAfABo}~UZS2wk
zW_-*dkiXcR1o%-M!0_7g*UiNUG_33yb@*_oZ#CSqxfpkO^^Y)DNrYdvePGAj((MjT
zSxMq>%H=YDV%H+-IJ9s(qJTE7H@0HtB7sv%+job0IZj25lM)rk0jmeiS6cc`Rb5DM
z@XO|AIbAg*WMEzgdL0rnY9P1*V{`sPGm{q=n<tXKQX&PK3@erm<1Uw$1#k-LMB~ZA
z3;APraHH4{9yFH--tZJ{K)mA*>#Q5;oZn09y5K1+=(xo0{%v{^YWXQE-fzZ$0-R6f
zlRs0#l9V6Z;Qsa+SI#5`2NWjkjA#8luwuVSr>Dd-+O7d0kX7jJzF`@LAu=HC`uz`Q
z6*pI9S`Q2S)^(xc#zgTZ260FyEB$7@y?vsY?;W_8Wh%cKvn_4MI~<0-m_CAny2SBm
z`0#5ZdJ|SfCMsK^OtJu3I1Hj|U0S!>qZK9zdebpXHmuRlh{w<qlwUpC=CeOmCkR!X
z8Ld2Se5j-RiXkX%951G0B8GvnTHagw7OXwy$SOf9)&QT+8tOvv5umiCbkp4ag>q|Q
zn#xR<U0z9I^Mp68cRhsxBc8mEF(p}+B&QuF7$v1fY)lyt`!f!;2x@c?p+Q(TqmE^*
zE{4(L%=k46C#d6vz5V@<N=mkDwfiNb8g+8xzI#8Qq6j_epym?{KC!If7~p&#O)>h0
z6QT*b=VA;B+#hBvdVz^aIvfW(=nc4tS*uARK&c7e${t5pKlUwfHmQL5ptxy!SoWy0
zG8-BQA{fKC=RIb5vsN73rj)-EBp^KY7@Iu<(RpEH4;DVieio~a3}Uk)`m9I-+Ta-}
z1PE`qapTs~Gcp^I&oR5*myFkOovCTd>`KD?52;>GOOhZF>RZ(rOG$Q`EFESi36NU$
zcd#qV%hS_J+HvkSo3%9-4&s7j+Ok9T`e5Ws*iV?ND(4yC8AR=41ctSD0C<BRaJ$ox
z23@}oS%^HWjQNV*Z5+RhDf>WOyZy~pZXWXDMhV{^ElxnX_FfR#(Ha$&<_lXBbflwp
z^;E&Yeo(Pt;rGL0p82R-eR1xo|8y^59+lH!AmB+2Q{5FeHYv);+<ovMVbYXXy$E=M
z?BQb&ZiKsaw#1{m5hBjz^g4JZCz~!8rAio#G}}=@7q)Bmnd0;h5L2~1>49(zLdfn0
zZ-a(nb)%O<_z>dl2=8U;)aF!QKSzp1X+?#)@|vqxuUb5xK()2Coe?>kd+NoQOc%|h
z-=pgF^PlxbZVz8QqqpZlkpBw5?+(ldbEKG~eSYcwSHuoyvC6Ky#{fjYk8Ylpmc@nd
z4`amsSCh6-7ZH7<W`9W=XrcEkHJ!EH+rlIgMXaW3ZVO$$1tHAKEYa7Y8!b8W#3mqF
zR(B$Adr@Rm)`y_ePu&~~)0bEbMZeBgs);~rX6@3vScZe#xYFyAwK|(W-NkF_<F>G7
zrNG!=nE%KRWOxZglG_WDh%xf_DPah_6;#*KU|8jiiBGd~6(R_{4=1xhLK=C=zf_4I
zhvzXZn}Ruj<({H2_35HJpb^K#amoz>M)8qqwrKg^uLk8$A36A0A(=zgaO>KkH&jzw
zL2w^Ji@xxhY_5h;y)`$Y_4=@&RR_h>Ta?AOyxxIGRy77TFQcUDf68e8`lex=GY4?$
z5-NRRDylx}6>Q_7qa?7yDgS`C{<LI`TESqYza>Wuz(oR+qKM~;9i9@8WK{emev+xQ
z#G!A5%ZwQqV7T$#lA#JW#_%CtX#&>x;LyH=md{WlVJEGLQIhWn?;4RGpw}RKn9%!O
z)l@~6ewM)JSn-@+UR&Ew>a;hBF$6KjW|d+J<BiW=nzRcXE}O*jp`=0`)yWM;je^J#
z@)JMFWyE61_Mjn|rV5P~S8j*8DxtZxuqrById8DNBi})DOt|HJ=vp8><4+ViF7{{&
zB2pQ<rDn$?KYr%Sw(f39nvl>mg#`;bN(6%>gZ$6QTI4;iKVW3?DGX?C*}iNagH4;N
zR38x5o`@Ux5`as3A^gA(?EL1%E&PL~=4Olr)8c;7)8De?DIAxG+5wwHZ^1VgXW%T1
zOiF~vsdv&Ar%z9IVl^4SbO;WF-xZv6maueFr{aR&-i=+9oM%n$=@LTI4CCZVu%F=E
z1x%Lg5cE`f!cQQp6m;g+c{z>QC(S+m3PBS{4KXp4L9PPH0sIHkeKy0fBC4kj0{Z}k
zK2$cy8og$E0VjNHyq0_E)U_C^$DO<Yvnm32VM=@|FmQYAwD<c^3ZP6#F;NrBUxYG%
zq_-cGoHq{qExbt);JT{ru|m4w=PzR?7=7-eV{Qr1ZLIT%ZZ=9x<XK$TQQ1!eTGSdG
z7B*+$I&v71vn@_ONH-%C=V(dXE;F;}n?)DD(R{TB!SOePk?A){V(I3|ci@XK5AOKL
zbt3#!eEwl!Sf+^g&iTwW7URB4C>qSe(T%TN61qXGXfd*BUufCtcA<%$i<#%avn!=>
zX~PPCazFIT*et0Xvl-iqhMqfl)_eH$nqP3)mb%}(yr4VTyt`{zf1@0dowrjmJvJWc
zS^6-)xx%b^Z*97r#dNjqYtpp=n?#ny^y*g6%xkpFOSG8c-d$MGx5AUPL7`BRnt4XA
zcBnmY4>ppyoq|3v_L^HYymu82ooIJW_1M^z{$g8`i1(_D?SqrO7nN8Vbp_#kZHet)
zEtb_;+!Nv(o|HId;|2TrEgvebc~%#x_Fu~%%vk1GvLWfvnW7x0@b(NwjaS5?AkN_|
z-TznuFt56bc`<e)t-fbAyhRJDAKlc{;fenrdv6}q<dy%Af4ZnsH^$bbia-?w6#*3$
zk*$skRkk7`MK%{?hbV}MKxnn@LS&aURRok(Wr+wRqE!g1h=LFxC<zF%86YGikl*XU
zc4oevj!WkEXV2-G(=*j1&wcKF-+SM$?Z-i4K<hK+OROb25b6;m_bheiUyxra@840P
z;GgT>(xu@f>p>nX>Q%QNAMj3BAdmA!GuioFf~~Jjs;0%4Zr{eT-$RxRYIbIwp)w--
zxv|R+O?H~kAoIu6?JI0wHV;33A**FIFui(p(~;34k7!A&xx`Z>vDw)qG!C&w2#rsJ
zy=cgA2Hl0dtNz-(ZmYnxHG!_9JNkYu@O_xgI^u5jO2=e%Q<=GW>0Dk>g!Z1iUO{r@
z><tv}iyb`PQ+{Xm#q^gVd%Ejjy3VrrH_y^MI%^n$am7ZL)rm`|qmgCtU*{(=E~r7w
zO?R4Ihz_cso>`71V1#>qm)Hx@1YasNRyj3jUD&7kvbs+@aZo>X!4;?CPpjR%taQ^Y
zDS8Cs3J2NzDR&JLTCCdKt5@Bx@w6`p9DnuZfoP~t`_SY6qZxZsmbgbSKXu9x|BX3r
ze=nvg-0@;B@JqH{;F;jB7e?HD_(k@V`TLxT7uWQ;4>iWkS+V<j)2}Rb7#5j_-5M5o
zgeYZF4&635C}@<MVwx%O?waklir@Fl_vO&)IGL59*4OSe#_uajBE8;cS@7lPh$Pc#
zq}4O7^RyPX-7M=&LXbMOVDEmm-q`3!zkXor=lz%F%tAKehB%Gsen$jbR3*0z4BM^l
zL!nwO{~yg>EuM8K4lnc2=tB1k7rcrQSN?fyej6wV{Nv5gTo=%*FLyk+f6bw7sqB=E
z?925&k1J1S2OfJ6Y;jR#3p^{#H!#MY4p#h{L&n!`cy?B&P-8=tch_D0<0C!Vd++@S
z23_CA{KXwTiJv-opSU&nYoo2(QMCmc`yAM<W0Pmd=QexW?d8plS$V|7jgo*^$Inwe
z5_G(6`t5LG?$Qk4d~e;czOzuiI{11{p-Ey(onVkwzMkQuzz^Kpo$@NDa9T!Up23h+
zf6^Cm9qMuGod@pe6(bdGwdd<A2fZ$o+2-EU%G9gYUFRo+_fktgjXim&yVmJcr%q~-
z{L%OguW^DcZ=9w)@|q=~jWep^^=p;gBXe}sE*^f_(>JzSC8&Ei^3BS9*!B)m{)4Zv
z5Ew0P5F3G5>1dWuOO7oMhxEnQ{fbHS0%H9wyTndw-qU+wy>8U;)7g!2xlgpKyB_rk
zd_-Xq)?Jo|MgOX-zk~N-9NJI5pbxr7MzneG%^cQe;hKdRG0)PS`U=^TXFQ*kE5^7@
zs_vMs__8O&f;I1=y#C^m7Sd-eni9XYhr^BLZa`%UiEduXYaOd6JwLmsq${!dm~Q;=
z)Ed=8lI5>`89uU2^^(fd-zod=+LqYjx6E^lnq|%{aV`>hTwp&L$YD*3ubO{aXEa~V
zu0GY$-tT;0V=+zCQQ%dx@{qjK*P%|nJsb1)?}l8{u~HN`a#*H-Ix)!_yNi`~5A<n%
zi=(OAHxur7Z;wfSHzyoT3O~oyLqWsQ2sk{ase(`(B||0Iri0d`H7WZ|i~32;(PaNK
z@h$Q_0qy-cg_~>0tbO--pSdltJPQwQ7?vUTYWy3<jZNeVSq^Q@LJm#5iL5bMs2YTQ
z&N!6)8!77Fd~$71z}2Qb(Z4UW@Cb+<1cK(i94~MK1zHW(%+Kmal}Ivrh0oYskMe)a
z(GE!%8%-UbVDVqXmmp6J)~S9c#k)_R6h|Qf>JhxgWO%Z_EdQt9(}W6n!o#0t*w)=W
z3Vwbo?oWWpi$pWNwOTY0*R}i-TZ)gnbouhKhRa}dBGB5zBqUaK60x0bnus|w|AsOD
z?N4&O#O5IsWcrkeQTXj^zQsBC|9J%y_9aU_!H)7ebbD{f38-@kU9kUloEfW6PQ+WK
zz;y8KP(CFb)p*wPXHJavZ{PD{%0JDa{&|iKW$&<o5|7h5PF(E=R|sc(+x0&@ao8L=
zxfa~*aG_)jJu%!aDQ!)-*I-dERFIs!ck^V=)blG(E?cFz;lYpJtT?;u!Z$NNox5e$
zY^$kLldZ$nZyzZ>!glW3Ru`z=G7^~TZ%A@+s|zGGU0b9nu@~ud#yl|gzp&q*TvI@;
zc`fQ*tK9G=G0xvKjBZ>=qUw&;OlHh7i*2I~v}vlJU{|(jY6_}mlBZ2(Y~3KJnnBh$
z$!>1bT%24&dh<8(;NpV8F9gQ+UULWHcx|*GKagap;D!aH+$05^!ynu6m3XeaxMS-;
z+<bAzWJY5Nsickew<(N*5|ZOUoUC};wY36O`4W=d5?{Sf7+r?dpOVex#YfkySiW2f
z=tyAuAaf}V4!B??<&#opkQJ}4Eg`+YpZ}Z@Q$q3_h?5h~old@Ri1;kW$;8KQ*>RHn
zau&YQtMjXYI67x#n<lq}lzJQO0RoHwOWYf@m2l=Y-Q!~Ef8dJn)GAx_U!f)?UeJK-
ztU#tzLuMXh6U(Ws1|9{i9vqFdV*}fr@o~vtkf+IDd<9k0$=)Z~J#DnT1J*xJjJ*c&
z8WeXf5YMIH6@_V2e`F6Wb^3&{T!yS2xioycFxMLA$@}g~e#sR%Dq_kb3`&HOKvhRj
zb)ijj;&11iWS=M@&6-Jk^u!wu{?28<TIU42=)1mvPsw%B@sq?UIs#);<Jh%GzVIgx
z#<Af<%M`mW6mQ$&a)N#TB)jNuzs&`0f$G=dxi2Or%EXU78!?&jP!Zq8sa9^&3}jl}
zBbA?IM?@GYK~=CsJser}E<nlflnJY(`dQnNj)%i78I%qJzZ)4bO&K6^{m^$mGN`tA
zu~Z*wF=gh$=djZYO!|~D_HrHr+`affg;@s!2CR<_#LfF{!a7c2OghP4ypWj96EjdY
z^hq1-*yjwt&}QN1;uLkQX#!)vfw;6VgB;SXHX5SB3A29QITk(c>>3P}6mP+MxmXDx
zJ(Es3yGBpiPdHk;b)H4$o@f8thX9(cu&Ac1?*d0}-@YsH^guk7qO`w>j~q|axb;<Z
z_3OF0M+lDFf^}d>JqF6%W45^bM`>1+W>xY4>i|V}{lW6tBKj{lFd?DS=4j(Vwzxwx
zZoP*q<x8{4pEFKPVffAZtz;Y>u*N*RKT%I6%G9joGsqVV@Y0zHruRsrVL3mtBc?E1
z`YsGuLs$rMJ)NJItqU3|ZjUz&&Mo^)ss*ujWUBy~=10&H1s_QP)_|+2;k<LL;~{5X
z&XJ~UrWB~(Cv}C(q!<04LGXg53NOKPZc5rR`+{`i80bd^H~LJ`Xf<+5K&CKOyU1TQ
z>!Eb3%iBJY4FnjZG)ra>Kf$;41?kF?^Hx%=tq!^l1B}JJxUd6HkQhi#Zn>r}-5kWP
zGUD0j5?hVpE@018y+8n~b12FhW+{`Tn<VxRNu@@5FJTscmm6iBc)a@toa9+aTR5iD
zJ*>$J1~V@iGL?BYhf09IG{AVrKjN%dstuy9c{`T|8vyj8Pz=_otCL{Dh_@<~YM)Li
z2rnmv1w7^oSI&zeCfnvs$;rvUG{a55Vmj<>UCa0~G)=n6m*7q|tiy!C4gHOHu%@DY
z{>f-nvy~^M*?HE^Tg1o&GD;9GB~J)^6gVFq+GVOVdu*M}&tfI&Y(g3VrnQZ{so&mS
zv&BzlOSfYGCd|yp=)r}Wcj95|*{74GnsaLZARAJPa_x`3I0ZE(Y~%{BUHesj=~Z*t
z5BX8a1J-CR!3FUyw57s6vpt<2UY(i{nJSFoqKb4eOM3k9=#hE_z%gV9>%zmEkT}ao
z_2!%#?n*t)hU?-T5HGPIH;o9R0>0-|Q|4=Q08@#KHU;pE%)DO13KpkvX-zI})1~dH
zC(!O|fT9D~7K;|x2X|Djb#8DH4rEC<HUuwuu+d=WeG+Dnyi<WbrahQfKk4q+lB)A|
zk#h`f1jZAGy+5hks+A-^KR^C;dK+y>u0NGse=ITJTmfKFF!cCZdlrXYQsf89JDPNY
z;?@J&TYQALmHwcH^I#DJ%wWW_>otL<p!LcH#2a~d>VWYc=qD@!xeIA%1Z&og6t2wx
zBnKVA{9LsaD{l7><UrzrMUF8$g5?BuS2K>mfoIMz6WDN7BXlIWE(c`%?BEcCO9BLy
zd)_`FP8_cqve_PxjDR+NQC_!+cxj0NVW)^Q_Pb8s7UC`%)EYHUm-s5h7)3=zq3|2N
zpb>i<-VhRj2k$4Tj_!|<b#p`3jF%c-4o+M-Ix~9A^ff5nxSm5EpuPXsvtP$oL-X|-
zqFVfs`5KO82IcezG|m=+(+22~;QQL?5srFL41y}4)5-!#do6|mNIjS}o&bHo`^v=_
zz%dEF|2ZgBV0#1nOIWq<MBo`Jw)7op&iFf_U%eT#S>o3V>S&ON#a>ShT%sE!ycY20
z(sxTZOTVGc=)LkiZ_*<$h&Yy_^|KP<-&;6N2|-D9WIFJ0^s~E~f{@@i1tU<#Ziosq
z+i2%;4*1GcXEo%OTNc*}oo(rdIv#cCbJz55wCf`69oOI0bGhHgpwi#g>nNrv+!Jeo
z396G~S%S-2a$2F2XDrBdeYV4-l$aeh8;|x}j*eE24nbps8ON8Cug`HZ75<}2{CQ0c
znXlnTXBrq(SJ!ba0+UoU%|UlL->tz!ZzErhtdv?;<mc^|k_VR=bkq6Qsm#)U=q=`5
zxdEHoeua7FF!o_1Hv~q%4+Hq2Lj!TUcJC$<;?F-)vhQ7qcstMnA<{!>MbS$5`9sD9
zw;iT~7ygn8F+)PX!&e`KJI{c1>`p;1=nN3%9ox6>MbGy{rine5<?mv0iqlq<RF!>6
z%Q@)#SA(iQ-29fTJE~z@>Wm4bU|DuAEq6!&*1eJ5P=}@80^A1h^F0ZMG`nI`cDP12
zITuSnMBeBn;eNIU;tZ_yILmabf<Wkth^$!j?>XGTXomP8l#KYhEw4Phsv;Uvid+ee
zmO?D{a+a^45!61=rCJcc0op(o@>=PcdHn;c3I=iR3X?I$|5nCz++l#mo(_N$h)RO6
zNAbo>TKiIkQ@$W5gc+*&fhxoODjp?6dC_~%1^dY9fSDIIW@Z4xKmeAi)oo69dN1w9
zfc3+jf=uvn@X}iHJ>mk!qMv}>OrXPz-Ie3}x^LZ<yf~28<$P++nkkwJ=@^{L_Q{!7
z@bfGS1`Q}4gvb#$c&zdbd++_9uy~=?D0Og6!JwBNzDZ$?!`b+V_z(<Gj7+e2Tb3+v
ziKZMU3PWK*L8n(}%$kGcM0A5X6%bJQ874iq$k-$e6_{tFjbsj8jyJUQgrpw-xre0(
z3h7FPSO79C+E_MLUtf@dqF)IKEGaRIJ${tAG@3}do;FV{*Wlc%CGS1|{<Dheb+E~X
z)>F~-r7=K;dIfP+gS;{Qd+!*<(v^qB^>X^c$-~F2>a};vhEPA#A54#b`10We;wpt4
z`Km<8-zl}_Cr*4Se6<ogIZg&xIZB<26%72EE(hJ;p|=*)#GCzts={B&#uV1MK9wO4
zeC8+Ibz|q&#OM5Et_SavFsIm}L)fnm$OxMu$idSR8f2jLtj(?YK@zg?F}$&=>AgX)
zGZa43r0>%ceP=ho!q8)1x*Qov_;a4m4!xZu`CC@t$+L8ux2G_s@9KfL|8}+BbD7N>
z9PBkaNSMM7SdY>-FocoKLb$jQ1W%C1ajS?VoetDb*s^$$@_qr4kAeqttlsJh5jDVn
zO}rSFIwg@FJ1pnYyb7?xK4;vRK}gxeQFK5rE3IxjpiV;?cKgiPSJWBOokPR|4*)~@
z;ukWYhwKrqdf1kIb?N!_@15~~cGLHM(@vAuJsyuI_EO`8o-bu2em8rcbSKuAr6jMw
zY9>?It{_>~FvWk_vKXT#_N>}@)1-UON<q~pEGS$;&Us*Oji}jyU_R(H`G21!C*`sK
zji`$@1h)7Xh<E6{=-mjq|Bu;m?=7r<((}@+Iyjr53XL7af6;YCu$Y8D<w44qwQr<5
zsz#fM^GR$yKPv(dC-zCs-F^SVr?~_PIamrfNausUd|tx0c5&%Kh2_*m;pW~(tNHjI
zQ=Lu98|zrk{pTpp=$s0#CNHj@b<k0|snVtyZPQA)xzw3x8|zK0SXwK;v>eT@k8eI|
zR+W&l2(%APKFDA5iiXagKi^|^wGzEcDIO9H9>Q(~2Pr6Jl^M%bRB{YXu8?0;{{HRv
zPiIL9$^Iq=tX%mu4oGw6&Mlv}p1;hjS-MFwg%Man*g5$HctV*9Q<c)T7^5NdrKD)f
zt;L6ha@r^Q*6rS4CxV3d5HCT><_n(ln!}pq4FnBj2w8%;xljM657QAIcf`??A6%me
z?i6wON-es5dyW6uWpkx!1jn9a(*t<TAhf1J7(7|H<6_X<ko|K%<ev1$E_I5QptnMq
zIvXZ5bnj}dPDsR-sj1}~oZCN3>W?FO-Dnr0zZtwxYbU+qmchxeO?;2V+0u2G@NR`+
zOb0WwT9}{6$Zd3xIfZk7oJ|BgDO}h}ycN>z6$3107F4p}fNsIfk%)DB<J5i@Ei!4k
zYBR~&jm)jv<)0g>7aswSd*YZIsx0l>H8~2E(fA9QAOYG2U~ne{eG*b6-Nv&}e01s>
z$(nee5U{U^j)=JDbxq3Mb-+5;BFjby3IuYT9-tzByJ07q<{uA@VA83kanh4O8;-3R
zuhAJanr<gIyF%KEX|~i}E)&6hh}>fgR%@qQq&rf+TrTZ!&Go=>?y@E+F(Af)Jrfe(
ze25-!R%)c3yZSdN%Wz7L!<quL7jUEEzp6bz)PiNTfI6fr>M1!m%tMMSz6&=Lg3?3&
z$sp$MQoaadC!9jix+R3?g!lz(41K=eyA&&Utn_D8G*1Nm+&T@{xN@g}ojSMJ2DYxd
zwC|II!UBzknT@;kl(~*EH><cB25`2@<<25k)YQo8+!Cc-{laS%*YQnjN)jV$dE)aF
zbMFdLaJQ0PT)YeAq}4uQWhOUA!C%RX?C&>x<*=9O&OW;$T5>==ulPWrj5A4)=~L<$
z9>rH*N!^!tHAX|r-f!60cJ<>oaW=7Q28WlKp3|bveElRn?*+|7w>7Ttu%Mo2wOq5}
zXXfTxds#Od()3ALUn&WLmyP}zy3x_5nGhKn$vkxz1YUyrWtgkGAPr5Y@sL*zZ+lo~
zQyGC=6?;Enc1@PHPH($hl7_3{(U6$J!^bE;^}5NA<+KzPHQySXw!2S(>Xq}H#0;se
zI7;c&PjPE^9L~w{;_<vi)BANqb^9<7QEytq5)8-*w0&DD@{Mo1I#g^n%ifeQ>6D^I
z@8MO}cik$_7q=?}cK?(!-n-I2c>`B`^r1!c?o3g6{EW>}{qv)}MqU<k{U6B-%~I_$
zIS(&eXcTUZd!(2$5<xjzw9DLcem~Q2r(Ix@<8aiJO=`94(wvyd+d~|h+P|^Rcj~!w
zDv;&l5gH!&GrQ@ii{8G&46eV%YoC4j?jv_@xQ#M)CWjU5xZI|B_0^w&kJxhpjOe$C
zuuc#Zxn8)dxl_LU{UX2P1q~~&vyrW@<?hvg!pwG!YoLKomu_yIe{XDuLnq`V+M4RL
ziZdRgl&)B>9HSo?lvYwhvS0D2kC&G#x1%G!?|DYUrI3mFlBlCFb(_53j<xPK{bkg{
zolncN!$)2Wn8ffmTxMFyd|lVuNnr<#PwH$`dAPijmQE-84R0jz7c^aAzp6ZL!IvE)
z*KCrDEpGTuejvVQ&x{2Pz0cc==?cX`oaM3G!v`bJT=mZ0?PVKgc;x7A6VRd73=MA>
z9UBqlx;!cR$tK#hA+6<()mYXf5ANRbsx|v~pT82Bb?S?`R^E}T07TYK`4eamXAt3Y
z^a}`IYfuJ8G#SDw5Yusb3;%6xE*BqV9-ODouP^}p+cNHKSyWtf^hld}pQJl^-rGmX
zwhy$ZDq4}}O?f<RR_HGD3Fc<Tiut~b)s|m;CEhkW@K3Kj1924QR+0XAyFRCVxR5<&
zk{FKqvi)tfx;mR&ICT4hLSWAeanZ&`E3KIIgPTqGro*lc)y%9&ualKlg2U*4D298T
zG-?cGu&VTCh84veKUsOXXs#>wDS4oC#NMm%A%DlLNsNPB3ufr;HGQXC#zQs@E{TxD
zg@+eJD-9-*lnT}+7ioGQ<t&{~-r>;Wlpd>9wP*c!@8E!J=<WZq{1jAHtXKfSOu)$%
zjHb<7l$GD^<mm2P&9)PyO9C^DOQWjxtSir5=h1l6?&QY4nzgd)GTB8w-5zTkW-NGC
zRZ+2yvSsYF4>xps!KTwjCOQn0*3i@~nN0-+1;*@($E8>NUO!T8S}SaPFj6sGVz=Bx
zixJq{t>V_fXc;P=?B#@tQ`vCWEPU>a?)sYOc}Y57aldH1xxM%)%b{|?`WvJyLta{h
zp?SH#hEs6tvutxs`z*sSamwMG$}#t6S6Kcv#e&>-uNpBCdI-s4F6rkLDk`!N5~9KA
z+w**%%&f7Tw+DoX`y|Oxz7<0>XkNE_x|~L~siOy(I!oiY&#U@1+7*ygO;XgR*f*;W
zJI=p(YuePib8|D<*F8;+hUm;p@XwQ9pP9PQsKBa6^SB*#R-OMkm)dU=ztn2X>wa3H
zpq1`BS#RcT)Tl@5-6I$5TY~!hI-gIh8x_V;tKqxZGSt?<=KEMTA=b}*%Q$_R+UvtH
z5OZWTNsrwQ83@l_YhL-4QZ~JHv-UxSu}-ZVS4ZEz#uXa&l=iuEhsLfOUdRvj4jJF&
zaAAG$XfWA6QJE;g!Pbv`1sD6&Eygq7JwE$)uZfA6)($JSQ5d37z!R5WI_iWzaJJo1
zu0m_snDeIEA=8i_c0Ka25MKP%j9hr1Y_C{CYTEHavn#K=rdM5Z%v^Z!;vQ@#d1sV|
zMX$ydJi84Gg9Iv7TV?eT17Unb+(Ysyu10=D%>u0)-@2$7cmybdXT&@Y94;ZYsHiuI
zIx~5%m6wJ$9r3iwIldcZVQiaEL!>b?x3t9FTUhDA^#-%@Cyi>I2X;!BM7HE-OZ)5n
z{fyrnD^OnUtKQ1mqv!vSepq*MeoaM9x|L!fv2{hyyhJ(cciyqOGTEiOd=u}RvZZ&A
zKa1V0<P)ukVpf(PRTG;-{vo<GlY5s~>?XR_RU*-V2RFyuGwO?Q%hLP35A4$46uoBz
z>mjs*#LJH`@4=-2jo=)EbK{MIF4}<7U>!+sS15aYXWo-6-l^9Wsg6(AN0?gs><uU>
zt6rC;@Pbw(ZthB-LQ<o~pe{dWSER~N>vOhWP!vZ+Q#GB%pbmzFpIokaK@w)pU0!?l
zfJOyr#%pZnm(Ni)3!esa>!wvW>G6+n#QfAbqEh$ro0i-Z-h6D6<G%!HKOkjpT$^z7
z4*L<$WnyPeC-I(qV)Y4Q#sao+V$5<H^JkA0R6XzBOVzs8^U1HDj}<pkXGV5zC+e<O
z{or~Tzq}^zjurb(u+LtV`7=O!Ci#LDZ)<cwM`ZRFX!h&DSkOP>6;<^VJF9T~w69wS
z?e)g%<~6hAj!&=1_32ri;hh~yDoPmZ?QeFK|N9p(wfjf}9bb458oWy?`yNg^8?YTM
z@+`>uhz!bBBc<?;4YhBk4zgTQ6Zi@JWKB(VhDq`1`Gt3fWi4*R`iSHt9$7J8!kGKx
zI5Bk##ZhLxt;K~fV&U1^0Q!In`CiJGa*S1s1iW&>l__DPFwgB-T4cDbin8)&mW8`b
zp1H1*yk<yBZ8Vk&jIBS8zC@hSlfq2PaXP;k@C%aLOoTQ#R?9IWsN@{+ZqeWF9o*~H
z<ke@9{!Ba`R6;ub8wuwFX;wt1V}7KKDwoxyl6B`Q?!;hS(G1Ro*iU7&K#j+fGw}56
zy=Yu5M{ud$vZDS3DEm{2!%T9;b&la}2rJalqC~$IH&MRx_iJJ@j$K+)w2HBveYbCP
z#X6q$(AVQ+>a7HSN_DP}@X(P4db^#(n$HLl6?S|Q+NSC8k#rdxD7~0@xc~ytbO9Br
z8>fL@v+^G7XFL_gcq)xI*|>3oV@a!-_ff~@j=lwj&XNlxj*ZW7p48uGoUn1Y64rLT
zxpfd`SrCV^osQA>N%qA<<!nZx_VL;)^Uv{?r)zkcH$>EkbH%3`Ty2k^8l!JJ!OorZ
zar`qJ0n2vT*ysRp!^NWy7zMnkD7ri5<DJ=hHChB6Q}lf*{;aM(!gNpQ;kcsP0i#Wd
z;-ig`mT^<INcVLXd-klLPJ<3-DYdO<QMo|cD`LbG0+LhF6m453Tw(`R27WnUlE%#u
zpGbR0e|2HWyky{OHW1KJ(6EE3x5rHSj?>WAuo~drPw%`uuL29NK4?LklKz)phc{KU
zx8ze{)DKyPn3m|lFdaa6va*T^jN30A(61#3rtbx!O~0z5q7u%2zIl^Za@f2(HvWc&
zhP{i<8%o<g9py3I#FmWFXTJ17Ibr;5=%M^0q;5b3(*wLFjdy4=me)|B#Oix~>w$do
z5AQ{b{!1xIQfI@`nb1)J069`}ViN!F50^^Wagq&WHtSEa+_lSr93HkXy5=%uROd_P
zeDj&KP0w1UiJnXAkvd~&*wbu2?^(qA?FjvDisWdju&TN3*nE2}$JZg$fQsWq^$Ls`
zrLI7LaE!2mqY1bi@I`_?ex*T=NXMwJC}3+Vu&_m&PnT_HPAQ{5c)+pYe73?g3_!Zk
z<yBX1-aG^$6+e)^RAIJXYzYaa0{5ZX?Z#P-gejIzUKYG9(Bow#{mvj_M&J4G*cCww
z{UdCt_duq!PTfC=04w>y-+12~*x;ep6xB{cUQ9vFi^@=LMKm<~hk$HhD~VR**MlID
z3U@$WZD=@e><A#VMGUx)1i{V;c7&^^==OrNVV+_{a6>uV@W{xe3JXL}c<cRKnHq%M
zjh8F`QVk&FUtmhb(@hOzb)LU)0cK(iIL?dmCD4C$!L@odC;)=s@w{I2P#`2F<bTLh
z82~)p^v`E~$3Ai&r>tlvO7}FfA*!hE*iaooeSlW+;x8ysEcT>Rl*)Lmx^cDdLSTdJ
z#y=bj`*6bGwjqM^%i4Z{>IO3KP@5we@HEkZ#0q9I_KE4dwU^@j65`DO%5!a?%~nr!
zq#VC2d|XM@XP`4nh$2UAu7N*=r|E}{VrVoazz0}u1O)xD)K7+QL7rdsdY9cgJe2)y
z2PP2XUTv`vodVwn2UJhIbz+-?>sq6)AWB&K0=+Hf86y6o!<b2D)xb^e31qL>C8|LN
zXww{x_7x25^GhyMjy*5&KLOGQq24)IGWMC*HP!bnCV<-@87$Pgo&mF4uvB160aMi9
z!R=nOtiN8pf6L;~S4VTR2!{s~G*9yxqAB5$w$<7%{CoRD!iAL7B~F%5Dqt&Vq!m}i
zC&hmUI3HW)LCW#Cctaehcsw558lJ#N)&FS?e0dhxUyosY+Yi1KJO>gN_OyBM4u>jV
z)~Q;6qgTF%weZz*UqMW~3CIVWn0f?d`IoUc2No&J5<V_dwqfh5rQlsivV+E8Q`YJV
zKzBekp&Y1HJ^XA}Sfmk@h{-`(9`9#^&F!Fpr-J4!l)8bKyx~4;eY$rEkHSDF59!E0
zL9{vI-M40wMO7rSMu1=d9GF;YkJhNU1Dy{yT*}w0uR;ci6!TCvD~X&haK`W;hp7dT
z#|I8=ggXjO&51VK;Jvw=)Z}~YIRrxpIu9f~AS*f>ov5nImR(-&5o_~>u5ng8L7lP;
z)~VAQeWmDEN3co`)Z*`Bf{gUDgAldKyHNt}O{K1a?s2H<GhqVYHI&mFTIsLr0n=%o
zaka5#i^FfD!3po81c}?T1Gp*>qaV^4CpQV+OIQS|4?0emVh6Q<XIOynHd?c~{(OMZ
zKU2wu=2%0p{U+8BhB`KhInOoGu}=&H3??#=f94$R-IHxvIs_MznP0E^)&$HLdEP4F
zw@beKLTHgC3lFVU5T_>C3va1Y*KDl8_kcSjz{iYh*Em1Ym<iG0-9*EbJT`UOGy;!c
zzi>joA5BD$C)b#S7gXIQGqcdQ)G5ph&`5w+sF3>D4EDkiP2uNHA%q5{x_)A5Y>Xs~
zu+Zs$ph<rd3=7Gg=7Ku;rN+!okk4nllRW<x;pdh)m4_AX+OubLHIUJ!|F>+8EXy2R
zUoZ&Da2RDA9;c)HUKRW5<AEDrQ<Rj~zzIl;V4sToHyR}VKqbe1w*-b=IxslTG{|{N
zXh?v<r}8a@gRtGnsU|2KiMBi=S)F48h)3;RM8!baVHN>0o^vv&wF^a+cg5v*CR{Tm
z6~cmqa*!W1ygQ5r=bQ*AaHdR_L)RxGqmsS}JtYEf2@N<mjlukHGL2J0Rdw|mc?)z3
zer7+x>6S6pOF9E~5(-eBf%fQEdUi^_fFy^JGbq1m@3(AvAUAFw+f+I9yRviB!T6}X
zx)mPAAb73vRy)l`L1dt&V^K7M>lc5j=m*T^Bn5HX6dn(5=H-yH_7G%0e+InPVfg@)
zD9n-q$oJQ})w_d_v|2z*;P<oD6=FfjYXnyXAJxG&hN|P5vT*bY?r4}uQKmaPf@-&>
zzMt$qCur1oA8hRAi=*`ZC^*0_8rsCUdl*Qm?cs-WVBCXo|3!C4s<ar6Y?l%Jcm}NW
zb(9ImhIMZB&y$Wo*&rS28d@F3<N(z;Eu+wyX{|{fQoS$j5&c>b0kW_I=^*eC-e77g
z2@vh?zjv5FPQ^o9FF6NL1N;f2B)5u;j0~7o;z_@h7K03>z(Hg*Re!7tTl+XjA%bK2
z@&=MHX&;w!;NioEyvUs>;@sh{PfokgA@wJ@@b)99@q*0~LJ%|?Ork98>`cpV_#UHQ
zN_)FmMn(*dfT+$F)alEp3j~dK)aOeHF$KT0#9pgbG;kjXb1Gr32+EK_7gajuGQ>M?
z4E4+<f>QnQ#u~Dc{jrG1$i}20)A#Ni|Lue?z%BDGFl+3KyTwi~uHlq%KtA<=bTsCf
z<RqhX&}tdu!`Y~ebkLC(_WdmNYw+Ho6b`;n5sp%v8-!0e06JN+wv?o%HqG+*^73+y
z;VhvNAEuOI%wuQD&L(N6UWALB&ap!<^Z<>IMmmGvdL{&(+m13)3Xaf0DZj@tG-uLh
z?XYXZHt&kc4T+9!#2aZx@T?Ka2u_7#eZCBTq%v?iI+~K^D@Z$)%a+(@m!}>R?&47;
zLMrx7nt{gqEBv3MHnO41kz)hPR#q)1=h_7J$hjPJ@L-X&)p%B5Xc+TaKsOcWwGFkR
zyu7D&y0nn>wxO-Cat%aqA+b#msUlFS@SUYp9nB;wjxPSqpgXFe3_jA|P*?Z<Z@*4W
ztq;6&!r>qOvi{37q^<0;0^eX0dy{p5cd7(eeGuQ5({7!SzWwm3f*`<X_uV0c%3Upm
zn&P?bA20UA4f-tI!OIHnC8d+**?g1z3+VcdNr$CV%%ErvEe%&c!W}e0DPCcjg;T^{
z|FvpTud4B-2<18m&rIyGIix92Y!-OJrT@rCUkm?|rPLp5;<|O~R^I$>c#HJnT@XvZ
zTT00hfb8(tfYZk@gKIXlUxZ$>3-(zwgE6T`@W@UUEZK_6(fhnh7|7{4H71Qq+gDQD
zc!L>T!kZ5l;Tya!(qFE-2?-6(&iomXQjgwZcQ8v(lcH5P=pb--`zfwc@3FJ@5wz>3
z2D*}ZG3xNdt>l^1ZNp`0*mls2BT}RifmiT$<QhauyJ0JyzlklHXi-=O^13SJcS_5A
z3tq-U?$VLUigsKUvAotnW&vXJ^Uc50U*6qD`wykDH?Zz%TnUB|5J9+|5zc!*XYY7#
zgX6z#57nIX6c|hbAbF|H7FJ(cw7I7iXoz%-tKjdPfP?T(nWKM$IO*l~#*Il=uw67i
zq91-Db?v-iO#eB`tr|!NSCjw!_aN!vn#eWGc=BYY|0|Bvi-UIykQ!QsDsaQ|CE^ym
z@9G|x`s_YSc-h91fUx|kh!7N>-(z{*FQi^&0Y-WhBqodz5QynZ<zf3DrQWZFEWi?Y
z2Z4$aHtxRtt*Q+9!D7kx()Q7>3f7@3*&iekp#ymzGz0GIL;ge3pR;G@aMnB{%$l|A
z50y-s&<RT#r9CTdS?z}Egx!Zo&XY%eCAx);NfLLdANGfQTo~a`S+=x-F4v8Y^>2*&
z-dw3)?V7Z!SFa*uVjPBeiD+vaK75OCSdfy*y=8u6(LExYAg6lcYbSkC<2+&d@)uHn
z*fV%(w30==kh85;QF(nqtflz26wDF!<}IjESZRMZIbioT4>w_k57oF&zXLpokO6Bl
zxi8-IOz#S6Gy(7Pd0GlpeJ#I}^fnfhg7m-v%V|FY{Jn<2^~oNc9UzV!Y^Zd3e7)~9
z@5X$=1W%#WO0WNxlf0mOzWuG}bISyoJBp(lqD-EL?#nKh<9hFw`<m_jz5fG}$HsMW
zw*%Vpd5yop{iEF_yl=iH%Wh0Ic%(OTaDB)z$%FN$*&9b(^L{zR3E>q?{5dQ2CM_Gf
z^SfzIvS!<S+U|W)paf?#5w@ocK@Edxv5`x<_VYylV%aJ7cyCXR-7)Ts7`M|D`{$ZD
z`Pcgma{PUJ#_e`j#VhKMMMbmvlSY(P<t`luUC)gDg~G_|`fS^i+kCuldvgxIdQw<b
z7E{dG+pXGOyfv^?wMSH&ArqJHemNmBJlr<jq*z?*EpljXKXl})xg&A84)@d(izM-b
z)%lj^&8tb4<lft^K6bKN>7Cao8m}$1-n5TDNF8>syJ6*Nm!&f&F4uYB#bXoRtk6{F
za@7NR1#4CNELUC4(fOO#x$3l-mSo@8Mga>$be4_|E7av3WGQJG3}qe#uV%`{*BcLS
zmqf%JysxCzr|-3!65T3(53%NKS)OCn0^yfO(DwwT^^$s9)vSq@BEbmbfDtC*Dh_wo
zr`x6<eU!O>xn^0s#Y*nv`L`o>w#I3tC&Wd^jnq-ul4liaw<jLXzHl@x*3ZJVvp&sM
zMRU0C;5}Dnc2*5TrG2g%*LHs1H-4TA{f;|uz!~$by~`xo3xeOxTRB^{lx-Ez>t<ir
zc48V#fN=-+)cSOyA6R=!m}#dgn&Q7D;tj}w9bB%i;DU&8+{Ho6A669et7nnZ6Wsde
z&N_J1fGo(i2xpJuia{I%{=-fL)QN3dvLGHw^r^RkUHDxa8g53M??CMwegdQT<9(MO
zF4bs=G_?&s9LL`-%oye}{PXIQF;U!>fHncvUKiIskW+ic+l||h5t`sqkrtW|Zd);a
z!w%g)E3I|usjW(zqY@I@$xTYi+6MA55wZ?toL?zouIHv0@dk&6jN!JLeg=lTH*)b*
zaz%N1n1#kL{os90hPPMG;P;7_4AhM0c!n?12pYV$UCnrTe^orz-wiHETzR)$9bauW
zOFF*0t|OQl`0j^9GY>}W=_ssyIi`5N!KT;adsG>2jP1pztNT_T+t%UX*#E-YZp@88
ztVw3+d;=m%=4`TdXLF9q*qep}9Yb<DT_-O#UE1CvqWCd<QXM-ezTV#6;Nt4LyHW@m
z)n=u@RY$x=LR#4A4ZoO}9L;PlYChUedo@xk`khC0QkncX$f#kP@oOiiP7dd3nz<&a
z?M~Kj<V|YR;5^gjpjKgLlgh&z5*nKzZ{Cd*1$V7+-{Dxi;*3d`*{U={5M)7c4Ns`M
z=|b=@PaE}-3GSvwbc$ynD^?Qvv(0sa%=#1Mq*3CRx|8!re7gsVpIW9L1-r|CX5S^3
z>}fey!u_W&WDh@VNL=?$_9TpI;IqC+R5(?96saAS*`XHM`|2hK$2E{5&bd9l^HAF&
zhwdvHsrqd31nrDgXQJO*V?iz~2&nEp`PCZdGfElD6Yn^bz5+$AJ|ocrur5ed+YLoQ
zvGHNYEAEi0u6*GpW4d6?4gc_t8F-_e+|FUyvGJ>!NhrOjH0#bNm1isTf8CO{xh~cq
zs3V2^;BE!~Vim||J>f66zt)T6y&}nP7|hV<jeHp~$l_Ysj(QgBtGBN9vUS0reU%(O
zZ+6J5J&(7k?XX&Ro9)JS7%I}EMi@mzyW;b8{kE5<lbY|-Cn&GMu2y3P49RxpH6#Cp
z4!nrVxA*TY?dxay+yKnfTbLK0@B01A941kgm(Daz%-i?aK26W*-9+leJAk~{BJ~oT
z$IQrZ^Yq=-q4pXcd0ws!<u~?Zb_9)$NG?y1KqBvxo}@oZWSP^QHw$wwHa+5XrOTMS
z(oQoBc8y{?2CO+|D9j*cnruZXm|?5;AFoMKm34epSq)D4+7~D1h#pmxL|8xa=WQs<
zPQRd(+x0ZVad_nelAEE@!KU`T{1IMPT!oV^f9Nx(c)!!dMqBQYqKmBiO;s*DD%ag!
z;Qz)BM8V|3(jy9w)ztN~;p1H|7iTQK!wA??X};FmQO(#qN~SFB@Xzct%S^3f_osL*
zsgs`qvie1<b63E&TraM_RqF3uFT=9Y(*W;%m7h-~d*jfv?spJfCx$2RwKY2pC=t>-
zdX0>$i(T_#*^+GSx3em(j1+WZkBg=7{xH{E!&SCCHFM)C`d)|51tq2oV|(3W;2;v!
zf80(lP>`Ewyk{Xn+$-ADuKxqwH=baBilgIKn4YVblTg_8vrQ|1Exi)Zjll))aoqsx
z{Mdo@2cM^Vfhf6D+aTyMn`fOq(^z?BAMIAao(YO`cU;ksMBwpQ;K{2rDlk@ZHx~}Y
zxScuD*I3T89vN{A+PLd2v6E?4!_whAbN%gc!Cj49VL@P`(Cu<x>$@ZYA!7qVfoK>Z
zI(moN?g2VG7Pv7k1c(#lPXtu_mO=2@t#N1ER;gf0g(MMB%!KWNtY+VT+Agefe*BH!
z3xpH1HtW%xYZn)kFa7chQGN|@q#x8iMc?5TNn{TO0<sYa;{}ifm)W2Ic51V4Sf`p~
zBABKpR;$r!{+&HqRu<{tM5euiuJ#+;^lTn<uCvMhP+6g2eHRHTR*9Nm4iFv;sIowk
z0Y4?6)wb|f{~)B@i2Ml6uE@#Bfv@&vt#zWAG8&z0a2`jN-wot^!C@dmvsa|E-J~QB
z(b|CFTLK2FcswCnGG;FvgH(K*UtGWj;%b&13)4^JK7d&PFtrBvW&&RprXgW91fpR;
zau);7kZ^=H0L~;26B#f**~i*vcyC$LKfKoOb}_j4?9qB!rIW%Ja2q>>E$l(C#7<SE
zzj$VG(~&OLU2kfo^(NMcs90!H@9SAmHL(@EgOdoT5q%0pgB=kBBa1<X{WGCYETB&4
z%X^U#0Omy-M8iS8xolB0FarV7$pc0T*^!h&ajX1rj{d@4WNu!n^FwA(v7VgPEMXp0
z>AYXVWrB6Mm9tDm1f()Zm55JFQ@a#hLx7<~n3A%-kVz>vwp&9aUF%eN77y3M=X?Yg
zY#QtusN+MaytD!YS@jhSRx6CXGO!DBULrhOcBTW-Lbpl&i2)l3WgCvnwG(LT;;BFn
zEd$458Ddph|MSQPPVNiV91MKq(S3TB#x(n^c<*7&EDf2npEF#h{dZ?DAo6(o%vpo;
z$~_*3Hiu&p_k)x1Pj3P+5?-+xLFk2XFKBex)MyWaqK6(70d(^{YQnukIoBX}_l4fB
ztaPhMCtL>e&lDNkEl*828e0^=xyVWKj*=8O#e#G4@`zgB2}d?xM=KOh@rFoDnqZuq
zy$@>$OZ8&jNOot4-4W+)R|CqsFS4FK<7()u2EEAJ6K%IovRmfe{8nJ;MD{#V$5Q1y
z?uKv@SHdxYK4}kOKaqNH!hRwyz-m2q#~2MKy4PCa<R@%9|K2<V!*&o*m^%5*1^8Z%
zp<VaZ-rx!0Tu-E_ZfAB)&?7DcEM@?^APXz(iAz-!B?7oOp&~<+$ladX6#&<Z`vd#I
z!5JJ)QcN9$dZ7<jrI;euaR5AYB-6osf)D(CY_x$v2U7>#BNsN+g_q{nl^o64><wmC
z<K{%=><Ig@ZcD<08%7F{Xv|hS#a1imNz*S1)pi~K$;GW)IkW7Jv7MD(VDBt)Vb2bc
zzDmTqDW3PmyJ?=bT03{`f}(Ge&|*7;QYZv3)u~1VRR@qU_)_8REHMc*8w8*LceBMS
z$3KOEqN7;;FrF#}GaILYCj1-dJpBNY3ChF~RLe^V2`!8u2?#gkHyVA9UAA#W=G`Hd
zhr#%wC_F|WJXi?7!2ZFT04`VB72UzkL3sZ4*P+fjfpUO40ImBGGMQfF3L-)=Ifa?-
zh(7`Fz4^{9U5+2GDb)LSGXdDtoqBJV0@GS74)EV)Puy7>7@m@_xdL1a#QZWv%0wxu
zk#MF}0Tag!xrwGrdiD4UWK;HqM>8=`!7juY5UF{LTW5-h<}i^PUlaiHjNK1EI8%-j
zgbdIn*Mgw}`C8-eb)1=ekKXHzp#>@F)zcf{@XtZ$T|ZgJmMG#2-`ng`7xW@r>m>V$
z<(pIj*(b3(gJ85xn86VJGFGA{b|84_Az%JJz6dYS_3<wysJ8p}>VP>_1SeoF*BlB^
zg3OfEs>Bw}nLWEK+yjO;pnp}xXr#iP1^MIp0fL*l91nP&M#~uEmG-d48{lG19t}Pl
zGVi^=a>5@{eiEZ=IvMv7aI1sQKKa1rm_Z3?;{=<|1&99+c8)X~h^uZRP;dfASZ4fz
zO_tf>6b*r~_dpzgxDU3y{Ohq`qxieq-d}I4;9vHoe@#M9oRWXD*8FR2{mUu$uafas
z$@p`}<G)JAUnS#D&9(n38Gn_Gze>hClq7F8_R^g)4hlSAT+R2OURcT~7WEYl#N|(C
zWd3mLD&c&@TaVkynh$c>fei$L=N%ve;0KP=kUjX;vF9nh*N?cxE?f2k5^r!>oQWtz
z0$0BMu+1qfYNeG|shn?FMJnVN1WntZI1|A?a0!GPFH}cV!X~hz%B{7ipvV<8lAc8*
zZFn8qe1dx-iOpx=dQEhmJ8~$W!}Nc{d)XF{lbEN5=%%R)R0DCjeSUy~j3z!Vk=8-E
zGg?6;C$9C%rhVWa0kDSiE7v$ET)i|Iq)w#H`IJX2=lT05$~)?T4W4nsGP@PLdQRLY
zqM7={g&$$1Xj1Kl+bY-#$ncF;jtiuofv=wnZuGdGzi!OwL@FkvRqlyDB@zsF<UhhT
zo1oX7+wzZ)=YvBz@Wm-VvrVnZ0Hk+&sxhz01-_m>4Yp1bx`_|F$%8k7-U1))RY45;
z*pUp<CaRgDff@`9LD#gj_h1;GVy}SXD(_$;eljOX_@Z{IPBxkha5;5p&G75DQ{ca9
ztz!@OK;Kc*3Z|DEo&lj7qVlhrI{_)yLG~dQi-8#o_qDLl;e$8~w&(Z$e*XYPSIKED
z+#*GKGU2IcqO@>a>aT6D%j)+HSGFrRug#t_)WxFPiZB}G$@fO4#ri!fJCgzeKmSta
zjD;Hph-A-dU;2TMc-$S4E8wXi$(IOPZGGAPBf9!UqA9h=2I`zL((F&L1Pczm_{WH^
zbqQ%sdKqaV09US1Av2YRe6Y=A!lMEDfpm-PQO{w<vkZ%8>}O>+_9Qm}1jtrORaC}@
zt9!@l;iY?h!mO!*zgV*P(ZZ2j{OD&l%sZ{wqftcx@_w99*aDAq)s@m~9&m0vOE!!~
z%cE$xK{MUS;)a#>@QqguX}kOj_YAudZmkeWG|XGO-EITsg&UeS@gZp2fYcD!nczzo
zwe-i<=zR(B^2K`z2&aU-O;D5!X8C)H#$~92-gE|;&I_+8p4Cepv*DIf1BW|U<03GA
z7wVIBf`ksSFULp>cqZMoE#wDf@{YG0?LQ*ddQEiQQQ@L{cMHeUSFZjJS+s)0urBaU
zt)>Rtu1`#?iHwN&6;_(oM0=3NHtE(hNlo#vrum3|VfEV`=NH=*=$7Vw=ePd&+JeDn
zuZzuuNZfK}??Y)}Iy_0dLYp&Z4xE^ygG8t&OWwOqu{PUkf`q9w+37L2Z0RcUt9?y#
zWwl7`wk}p;;EisEM8tS7;TQ~M<}UfwB0Y&UB+zm79yx<-xxAYd<yUV30<$sKX)O%&
zI`;DXX9u>a_3YFbY2o*7gj)9zo(QTcSfL(*10_!u`Ynj)0*HvticU;HTL!sUx7!0G
z?ylDMlMQTPUG5fr;l`ER##c2;?#rn42lv)>Ygshqc@UM3AUvHW%sj`@Ap1=gf($FR
z;F0F<ZTR;#VeX6hnWVtiofJKx<54$Z$Dxk9ye{gNA}F}eRfGo}(;Y$kH+I#&PsLFw
z#|BwQufqc;nA5tiJuB9XFpbPUBC*qZP{?eFGClK^<#2g<dK2CD4B=2+H&{S;Mmay;
z`_D&JvvCHABXR{qS~&*A9;mPiM<l;^J+thXGqcf5PaTh0do-%1fA!1aj3x^fo)VU&
zUyI`piUpa_yP%^ehYI?hBnZ62$BK;O#oI0%R!~U1yK$KH(44_cFE3S7BfogIP|*AH
z!$kHTnrpaiYPVpHZhhc-EBYKG;llQZ9F_Z9x~{#c@OR+SS#(`-O4czRt1u{WaHPb#
z!YNfpR<|jir`2*M@4DIRmZKi52Sk_bgF9Va3KP*Foo$+99}z4vBtw`Hq@X`G{%`%U
zQVy+UKvq1NA@_pz1)*srl3ZA`$kvk?B_s(=QJg=CtoQ^yLQoUN5Fs*!(S;VE{=Zs)
zW?RYrFuCxrn8%zq7?azD<S%;1<6r4Xcb{H&6nb<hZ|0<zPo-TP3;DL<?EK=`d>z7i
z%kQLez)dfS;688u9MAck%)w1$Tkk{r<4h!_B!JCPQ<MX8rZ>Wg!@Ar_pKmlI&hKt}
zuFB1s@YpH{=(ybikFA^H`nv~m&KZtY7;LdiTTZ(;!dbdJo4&ka%0{xR&YP1-4NLtN
zu6cdsQtGcgKAW{iTs;Jt=9G~R&#$8hguRNJ(?OCObsg@kvbc}kcPn`H#8ZaXoSNt%
zCY)psP5D<64~_>gP-&+`Qmt<J-*2ArK*M!#{Y)zT`1drrM-{afG>?$WwQjXhW(4?L
z#a?^0=4^FvY<*32d1&dC&R=GlTTYK4tVo3G%d;PFme*c2ZqJBq)N0i7dEF3GaP+%J
zx-$(l`}-B=ddd%%N%RItozH7LpDgd7snCzQJi8kdbJz9W3Bu||ZP`LC7Z(X=4B_(*
zfEm=0xnM@3;HQ8sJ3Z%0JaoKV7Hljiw29_?X`6FA-zK)hsjdCc(DK!;yZhHC#8nVT
zc@u1MM9$S`rmd#{d{uHUNeTTbdX89#y!d}ND;X~#Vq=cXB-bhYD|7}trE11N5qsD1
zmk$=%-sQW5Td6qL6<EFo(%k{V1mp_9i1Te@gC1wwc2}+0+cLE&-<fsCq(!_(E6>Z@
zJC5f1^oEm))@8y;tJ5yCd);+K(=V0-&Nl3?j}dMtv-0h47{5~5$7s7c_?9wYVb8dF
zeB3(0zqlcj1j<0+um=k`c5vLfOH*v@!gxQsKf7hsa4|r>+=|xs)JXpGf-Rj64Pl1i
zHZ*fm_$T41TUaC3Fyu0YBhvS4oo%vPM5+XDY|Z{j9{$taB_e(O1OLtu`12J8D~u-<
zjM1_rna=w1Y%9bxM_DLpD~rmgj<L6MymoqC($di1wJ(hA^vtLjhE9oJcF5c@<~f$n
zSmR)|&ii(btFB;Bq+Zaof5IP)Kb)S8Di;>%!#Nq|HL{<fs2}9_G=7QSKOA|<O!2F@
z-`F(F_Pt;43}ZVqR6ad(^*1U_pXLX>D1b;WOUc6TU@z#_SzrBYas;on(rO1dI@eDb
z`dL0&sR@r4_5Kq3X2~-{bugtsjdN_(F7PwxGb(SXIQy?Z{~NukDbG6BbCku_^?1i{
zr9jTxeb93JMQ}4^?!wEUC0&c0Ph+Z7I4ud`vE~fKwGt*-7u1jOG#Ne5GkpN&Yj~)#
z*10?`8~3rx^LEn=%-;7pq-rNvMQ%@X$z*bC=$XZ|qYspZ_vCwod7Yddqq8(byfoe*
z4MZ=IUE%b=g`885Q_L?=b-g5~?2GUHn^l%1^I+kl7=BvBphs=W;o`|YoQKOyf8FRa
z7@O;S$t$kX3hr5yq6L)kvS^!FkjEBbvgC{`sLxc7PEn+0bk|paos)DChFJwpuRA4W
z_Ilf|t(-taMyC*gPjy-X;~*j~s_VJ_*m{yAw0~WcvWBNhd1}yoQ-+H=R?CLLi~76C
z$Awv6fOt`Hy{ctZKvUW#EDOhHWrXJ2&aUrlm+m}I`ACA~Sj3>b(kSvyQX(w)K<d-F
z{vd+;8R6yjvbaDtL=2upN2aWTFkN!nySqMHqdmNYU?)|vHtgT@;<~~3$WKAqEb`HC
zlhq8{H+dCl^?^R+<>S-V2OEJt(keDqR8s9?zc?Ai+h3U$Q&(h>wCO9o%e2GCz@pTj
zpxVGitD~QqVWn%RW=zm2tdua56`lB=bp-`N>l4<#?)=)G)@f4-`@Qv&ensV#s)9Q9
zikS4Df!Cjho(O4Te;AwPr`UAAUZ0@!sD|X4JMt$}0$1(z>hRc6Q&MLSKGzHhImhqY
zw|q6F;@#~9pK%rDMb(sD_fVr2@CUAuli1m2s_8hGz_c-^VMdFYo+cM=VlmiEVQg0D
zQgPa9UC!X(;Ax|7Y(87Ges}@9!b)SVM!kGubBgz1?6Vv!&~D8%k&D;)fFv{gXLc0N
zidE66$FBs{=FJ@c7{akoXhE=Txa*d-)1qq#x=kynpelUI>(w^{?Z|dj3mQ>4<BHsW
z4A=rfmsiCdQ#Iq9)XW7-WKP&zO}ETk9-VS=f&z&>rWJfhMaic&nR^nB=f^T!wxkrR
zRpv+5Slv1B+-+T==D)ML{;)TjUuK)=j}5Ur3o|`i#PJymtk$I;?6~c=J9~F=M-baD
zy1;P<Zn^Ncv`^dJWI<oWHH>&}O7GnB|Bo@&gHTd$D#kycr)vr(?{xo|v!~hPx%(xT
zjpy^zns@0PU{=>E43V4!nHFbKKqY0p>ZBrmjX7bD)iEUkBcbISpy}tB(ya7V{*8dq
z%Dl}RN8AqzG7tP28K>r*Q>T&yVnLHCtvQTJrN;RW*`KK?<20x5P8W_z?$&*nJJcVh
z;}>K@Pzw~^=gjnn?JrFbZCalmM@_IOb_`ClirF~M+m2wni4?v68cOzuog@VYP7Ss}
z?S<<GL1kfI5k2NBOs~F2ID7F}jhaE7y9a;#4zKoo+KoR>81UBuy5=x~bVrgVZLMpF
zGPR5Gv$oJvG#kI~mZ$c+>D>Ed$aVS?$!XPCzZ1vN3C~B%G1PIhK^Y_K@X^R1C3jvq
zugi_XV|}PGQc4h!OsM&X)6~cQl=oggCOSxe80`;?-21~|eqa#Of6S>5^27bpGxU37
z(EczJKTPmqESU&i+=wH)%!h;Tf4#1^;f}HD;`Q*7NYBn^r`#va!Cl}_?@#aWrL&(1
zhY$~0$NrbA(>q>!)ikm;tUyRm{6K$E(QFDX3odSdb{>C62xJPCO_uCY^_QG@GGM(X
zCYMohQ;MH*flAgMY4&DF#`+7hH9#z~v5Eg~2~7EE$h1Lc^m$UuJn=_Q8$_cZIi`is
z=ECJ5Ry4muQ`kq?%WF0tdcYp%(?G^;l=hP~TaMI$&&MES?D%9FSTMRsz4sabacj?=
zLsxWT@%10OfQcEg@BYsRcq|;+2+MVt=b(cIw$MZQ87o$-h=t|`3L(yVNZxY|+Q0tz
zF%edio)BU*|7#HP?GhhogfCD+f~us17!N|FF4d<#{E_`+346fu#!hZpde(6sQyCr~
z9+b&T!<i5a!9+=6!=Z1<B+BUgkN?FF<JkPZ7Htqk(JGt{(}l}H>$qr7!6fOoI5YSW
zef*qLZ51ow=hf(m;C+$tvWDjI{N^HUZIOz-@Vr=}u-^T$Znx9NuZOw*h_nMCHFmwn
zXfG*96yuZ_v(7C_cY(vWYdQ1>cQmU=M<z2qdKZbQB*7!sh8`e9C)TMd77mJP{%c=B
z)dkLLAQWSSW|`Eg<G;)8<9~D%QyjIk97BMvEz;n4_P)%e(db~8%IlhhN)QM8(Mzv{
zRO$wn85(@W?IGHBumC*I{!%%diRLY$mmGi~ENJ_L{Kvz<2kgM@kw!}TC|j_(D)t{K
z&*nQn#&ibPkBsQk76fbo6UjG7nkLO>2W8#A{}17GW#0}oi{)1B{Si?)CMEX9Uwr)Q
z8er)+!2JidSu5=K;<dYj`^tA-HfUPv)ARhz(`D178B)oX7gR@hx7lw!whYG5kf>WZ
zB@FjV#{1El&oMB?G4W%|_hd%GMMT#&VLcHlS|sK45tfw;(lRpKLDU3eTx2<Bwnmy?
ztDFQ+e?$Z9dvJOf)>i;X_|Dgf2{CYg8hjit>j%+whqxy`e$x~5ax8Z3%0(wREbL3s
z(Z_HgnmqmMLoZIvvxBA>uBJ2thK*E1F^UkcRgRUH!LshuAFZXp6RW58dt|Hu&Vg<N
z1^D(E6Cj8mf80!^qtLjcm5kLYw|f7th@I)J{hqg#RfpKUCx+@wE7oS^sZvZ@O%DjP
zoqL|&BIvzbBUHtn+8UV2y+D47=uz#**F^+a)kAcPfYf1RYv?0r2WvLZU^8kZEH{<D
zJa_Zn$M0(kprb;)1{+rS%X3%`JxzHP@-y-v8PM)8GM5j=PS4sr5GV6z-QRZ{VP=rc
z?T9mnb`u!dPSx>#@G_`qAK<e{tfV=DUcxc+=?(K<kr?MHS#ipGfw2eLC<k}Fzs_hf
z5Kb;caxq@}DAL|#WY<^9XWk?6{tjHKf?gw;&fq@1v2owl8lQvVT*LD-4Csr7+`VXD
zQQ`D^L6zaL;C5bsNqJ5!)tI$gk0!bqweE%H!w+ty6V~04mUhrhFmOhZ8|$L^ma6xM
z3f#lMDp&IL_vpHI_%yr8=Z74}U|n6RhIl<$EO_~HKLOFG?r{+G5(wc?ooTNbiFMnr
zVoHntvGx}In$``@7i#p!^78_!r|?tRO}`=7K%R(SX7(YnV4@d~d}xd*2_xaLhn5*5
zsy;g@A-Y%O{H)}#%FK(yo?f)*zA<NkxO$yyaow%W2Ey*fx8T@X_vhc+C9W34Tm$ge
zdbm`M*F<!Rw~syQdYTKQw@>#jgHMZA${amp+sKJ<N>aDBTFbBFM3{`p?yexG0*r&I
z)kr8h7MOAU`gH`q5UZUe`nT5cJC3Tme_|&FC}+3#40A8QSX}+$v1yvoHG3?_dG@by
zm@{rKrJP|ufnJBkCi??%1Xp{_`UsuVy!3!G5>B{jM`tIz0`D)hYy~?SMsch=X6-91
z*jamCSM8b6n%Q#QwfD4qmYD^xJy(WB-k!)5<Jj`;F_g0m<{8JQ*UfN(=|ViG_z|$+
z8|JC-#qI;(7!h4VLh^c|uD?nAhFZX)pt-L?^rmA~T=8z9`no}O_3+SA?;~EF>0EK<
zo?u@%20npBB2aNw_>cyW;XL9T3oJVd_J#6F3V-v9Rkf$v=zZez>hUMIl(oOtMnd%z
zyRS&ps@*>(oR-}ozU4&^AT8{*%ZMK-WH<!%S1SY|89p9g`^=I>GJipYZbJ1?5578h
z<3lrnpJk(5*dD3f>J)$YktvxM4!6R`bj7Ct{wK@GH#35QMEN1e6?_aN9bzVY(w!?c
zOslfxPcyA8$#q}_93cNqXGfwLYy)d5D#BCkDe}4qF_nc^9kw>^f@SJdV3@hE#v+Ol
z)I@%+#gI7Tp|cXK3(2tU6Lxy^7dPC7j)-?Z)Nm8n>Al-Wp_1U#WyOc+uzMEihesC`
zZR@CvQKbIJaRni{_RV|mxFGybA&=HU$WhZ^Kawe%C8-bAv`O9P<pi^o6!z}4wf=l}
zfvPc3ykEaE9qMKI!j5V1#N3rXd_#GGqnX0-S62vR9q=cNDD(QYo5V?hh^<7RCLB3`
z#irY%ebuB-2rE!HAhK|#L&oWC=h~NBr_J-b`|!!thfr?8DsXJz#RKlsp6$n3l`$IF
zL|8;DX|PUEkC}`$J-`nJik##{>eNnZ5E+_-7ts`7Rhv79uqj|~xMUd|;0y{$7;o1Q
zaU_d&vm}Oe=Qj<jv#Bmm2p^QGk29<^METUJ1Z~T#y<kK{n||xH@xuVjedKWUdBh0<
zQ<CmVBove)O3mI0UN^HR>?V_ibv1xPnT5MEe%Qwz56A}ZBbz*&4t-Z-R8-UEse1~%
z4uVGlyF#dViZElKFUWu;Bq2tSQSf|z^98P12lylgv*K6z;e2R`Dwgg_bjQ&o=S+Yn
z0&nsE*aO#waWnJ>V%7&$vT1|R{nHm}W!!*M3bsmN6%wN>8DmiZ7W|<bQ#QK1mpwwn
zY9UH*wd8MwH*XG%zRr%82*87Jlj(AX%OTF6^2qlLWDQP65+<G>w3H@99piuw8OPW9
z<N(4Rf#dPJib5!X)QZR?<6oySN5}}!<vHL@Qb6B<G|r_yqY=E9U1RE>jTfM}DF1Gr
z_+gC|a5knIDupA*5-nQ{Sg(lw1Mi!D<fr2P$PjbY0n>X@$aHMEgl!mVcdEejUbL!p
zJy!4KH>@}0|EtZO&R~AEnT!zQxON&WSTn3?)fn*~cr0iYWkeG1D5yKm07UkF@5<?z
z#P~f{Q-`q~?~$+#4UnkYKX2T8g_AS@MOP~h>y3?#sREgy7n*q`r2mh-H;<<}@88E~
zrm3cBF|DSJN}+@)a>zENl7vA>L>r<wQOI`8j7mig5y@5*QK;-$PP?6COO~S?`<7!l
z4u|u--bXWc_x36N`8|G*$32hxpU-FR`*^=!@7L@3dOok~dR|W}4>~4e&)44d#dt;d
z)NvP3W(VyR?(Y2)Mw9Mnath|QLUtq_uwvte4ROPQ9OhrYh>@H^k=|eB^E2Me3A_pq
z3gp;a3{*`;ycue1U5)|KFdi~MQ<fyZERjQmylW($_$#l>viuejjLeqs^P>uGJo}o7
zLsIBIsO3IV4igv7iRtquo1LVcJ@X^PS@;_6D7BkuBWU-NT)+OIs!IOcuHNxJ-qTHP
zJ^lJ?QAep>SyqV{jg0!8N<<=Ilo+=UcUC_N+VQf8E4(j+^+YnYYsb>XU(?mIvxF?t
z#ZMbPU-!_6oNfQ|@?v7xKpUonPBJ4)J9|5n4uk0k=Z^ImM=_P|#is6V#8_B~DZ=s7
z^*$y`|Mg+;>K8?$zPL$eU`i3b_+DYyVn6tBeCTznf2kk(C|MX%w^p$2@^>?dd9D-B
z`LznaH{2kt8$PUR%?A9CU0QE?lMnLUeOXsrZ^@z2imEh{2eIGen~xZ?X)6<};*HQd
z`yBSJ4lvMFTx10oZe{{nEn%)r!uZvw1|SQQ?V!r(4_QlZ6VSR%9LReKk2_kGxonL0
z6&tS%XqZAr)~3cZX~n?`U7`olos;X1mdTrIX!(9<%nb?*9ASFcPX6r|ktw4%HO;e&
z@oc5JoS3HQy}`uD0@T=$nl+#0riR9W0Qk#TeZKaMFKWUt!Bez>lX~j?Gc0T2>B^ij
zHoC9-u8>`u&|ke$%6zYy+9ky}9C*M$==Vae*p7g&g8MI%Xz|7wkC2{1Mwd)>&mnYt
zr-6g?U~Ha=rDd$*vSi?6L|1G>c5P1lsww>m!f+YAgDMy1Jj9<M%y&<|eSqfiTuxaU
z=5k8I>>R}=^GdRUUsu^~Xe?&X&>_cj`>_0)qY<^YC2b&||0%!msi*6LjNf3MVPxbQ
z7im!^>CsoQs8xaGftZG;*ZezQXBn5)REa=Bbm<bKxR8_Rpd}HEYYLJ&U5@0dsWkFA
zWXagn$s)CeEAEPNPX^Zlt%~6oF@{6}-kUJ8%AeBD7HJOitHTYS>n-Ku`jUeHYrwg;
zUQ1{4d-r?V*y+Kpntq}mScs~yM(Y6~g_AyxJkHJ)W7pC5d2g8CV7&Z4Jtrm;nZys(
z^)S!F@xZJ?CQ!@hp!BUn$M|!}QdM&rbd<!1$%0^^ckS)184#s43pS_00V4k?;Shmg
zMhP2kynbBH?W={0(dLh~zGK<0BP~ors$$gd^m*RmMGp+_C^QH5EGr-54#(G=dpX7s
zx(bEBb%jO#LFb39pUqr4DqFN?&fNZ5cqA<jEagdgblF90qYF6)#+*JM_tqVu8GaC1
znS68tGPpVngrK9v9_c=i8st>!;E4V$G?m#>My#L4<gZ_v0$T@z=<$Kto6nfRP%w=#
zY~Suz66chYr{&rk<yhQ@g@aj^2-So0*pA!kKGOaA1>8A`e8xAiyj7#d+tW7KbCX@U
z$0vqOjk>T0*2yce%E?XqgZ_Vyn0oVOJc8Sv<~?ES!Or*9Tuli{v1yBDwiALXEY2%q
zG_3B1d#u8rbj@ANokdGg(mb8cKhRdzgv(~AEeJ>G-!^{aWzLXi0XK8#<BOg07c454
z^sd<C($v^9t=6nEFTc3BxUh7&BCYz-nBbkdjnia4G}Q}@Ug>_5?&Q&R{{WO~g7bQR
z=`Y`A_uv`4PUd^1@<n7HK2_*&CCRFVajZJ7`esSiv(@UGdu(MNQ5~-sr?R3vDfXu4
zV7#-~)J>?<QL36{`k0hta!q~6J2c1P*VcyKe6LNJ=9-16S3I@2jZFuId=z$y)yY=L
zL%Ah)PZi_4aO_U#mj<fq?oyhk8ouBt|By{}N(Lldw~miel57Q8hL0Wh5zZItEbnEs
ztX40wlG*2ioG@=B^koRaaJNo4kP`R7RAc>2qLmx@LrszeKddOCO#fqKLxNgaZ88|;
z*^|}!N3TT%<rEhK=GlDX!!h*gSlu-IhMb%nmD?*h-m1#=BLpk;${E>jW@{P557|Jf
z6MsNXlJoG*G(Ni6Ow0lMb~JI+z0ZS|-LD_E)t=eUJYinRDJ$(M$jf~{%2N7h${HV_
zNn|pwV*GS5Z#Y?)Q&n(v!>Pf8$~gyn)C%goSUn^8ECJVn90L;<LlbX%W@pw|i7A&=
zliTb}C}yr_jfA_7Jmhe;+FeR8iU~I+#%rEsY2~mAO}U&aBvTC93krI_oSZ$>=C7RD
znM+qEG%X1;9LGN@C$g*bK9^F}(y}l-nHCrrh#Dv*GFuJy{G4$X%^lv4r~-!s7tH%l
z7s7%|FT@hFjwmZErKiw2RYdv-M~Gb3*hdT|R;m^#&Pqt<6v%T&OJ)k3ZN!9}%#qIO
zw^2)LSmXUJ%z$*%%kCdN1mCKhNyeuq*QJ-4sA_I!viIc_IYeklWx3P(=*=%hCG%l7
zFytkX^%lQaqTIXP=_kg5F<2H*#yYvIJ3FHX$rfS#^}VhJgwU;yS#MObRjAxl_&wL`
z3G$|6l50f7hp)7K&l`{}KL}K(8+aTIMg^d7k{x?ZT%_-&r=JB33OhQOneJi&tNr&@
z?0kOhMB4b{v5&7?XLBzJ%s-DZr2*RUZhOYsWb6=A?nt#on0??_uh5#2@3PTLFto-F
zHjNiGF-(%$n5Ihyg9cc!8b}kKL66gyj$}J;W^<ThLog<JAldCMi~3I?cdhBkJl4yh
z=PEk}UUp!mkZEQ6gr39Xfq@eF-ca{(_7IJFv2DjekQ%7iQ~CY;mvDBS`IDy(2pd7k
zh`hn|ym+aWi|D>>+n%mOpFbi9#@7M-w#Il{bdF4vw|}Lps3Y_kX+aHf@)Wi9uDOsD
znKvwGK1~Xw?U&;+#c&W3J?M*M&`lu{;rfPh?&8Ha4lThJN?cAqlU-u6O;Z!*_`$BE
zfhfVTyz#UJ^Y3&6`%5&=U}987*G|Um>9qM_t9YWRcQ+7_;XZN}131t0HYheHMz4@Q
z{u^2lkVURDRpcF8%8XBWFOqz{A8BFkPhTptUzQtQajvr5BAT|7w%5p{aNORAZ@jNG
z;&Ef7dJ$p#^dp*1o?xISu=rJ``GwWpJ9gyWM+rfI9l(B2+wR%3r)x3eHsO#$Ut(*y
zCUT*$!K@5vH`FkTxsMXuojxuvoAoFC!+fB{U?=xRC>`wSM|jaus)d>9eGmy4<70*U
zo#8bIq^Q>MEC|rQL0u?GUIkm2^res~Eal$E-99ch*<&-8rq}kQvo7Duv3(WHWl>pA
zFc*<+5pwBb&LLyPi=vn;^l8VCsF<{QwlYrd)1dlp%nGEVXmwNdb*+>rW$S)a)@J`*
zRH96UQPaMMFx;?d$Z{I$TSNSV=|X?){QkRm+)9iZfr$&B((oZ<db;CQdn~!*W7x^z
zAV0=wHx~S(xQN@arVn^KK4i_%vTcj8w}K$HKPf25`(gLLH#Qy<el~!&kU#=}=mEV-
zApJf!QL7TCz`(?*xtGGq1g%gZpog34@AW}!wgQxd3+-^?{C&4DqUP+Ff#1UU^XF^7
zLf!pog9vQFS466Z(^Hjm@D>tDPMfOoRVra~zrQardhhyoG*f}ko*S?}_+5j0`rSmx
zx%Q_`MspxkWf}th*n9;Rq|rn83-jkYE&ltAI91>#9mTAXBQJj(bvTcyC*}BS1nA1h
z^CMs#RSySjO(-MKJA>Av)DNb{PM80xJ%u9Y>{WV*1}Wp5Uf;*MtRAK;E@zdT^!j8=
z-DIxr24cY?-M1270w~K6Ur{3|!h^1`L6LTz`@=4ZX`j|HM#{&!)1~>U>}t^WXx!;4
zyZ9#oJ`hj=Z@t$<{tUJDUrS>D43ksn0DT2qKRzYADlteK-B;N>nryGh=EYpK41a9e
zPfN{v-}x_BeYO`Q^U0WIKuo^9zUk-^3FG}3aYdcc4Kx`3M6}_TlISVYAzVPhlmDvS
zFHZa;Is;{g$Pc{1j;d~I6e(gd$nD#=aox(ni906Tc~AH>q8diCLw6Y>(f{!j?z3ns
zCE4yq;4}osKYC)X-y1g24ZL=3@scH);R<YjEhTo)@Bi2{|KUaa3&?L!E)l#Y-+`C3
z8+Pz?!BOO56#Mm%5SJo%Qjg$2O6G}IIP%kHpFY1OO&Sa^qdCYl&>|1PSdJjA2m04h
z&FQjeZvKR<?BM;g$O9(T3%}<L6OLNLNJ9WcYDwIciKeviP3|Msfa&ct_JbAYXGs5r
z%uIa2HJ7*j9Zp)b=QE7}<l%M=lr+r&B1Ui}(#NsckOpPK9x43nhf6p?HBpv-@3a4~
z5f-ne-GR~0Ai};<Yv^ghYzeM4wNbbBsH+nbYw5Bey8i1f5KZBv9?hNS<V%OI6|OR(
zpzzOU5HTGEBI=i}+O*OY=l+k4cqfqlhVV|udlV#fVhdy3)NQ#R{*KlYtG4L}iqO_=
zycAZUK$kK)O6QsYA|_@o<0g*4s3N(x;rQFPcQl;gh8u4VmZtTI{%vZ)d+W$KbN=Zk
zFoqbGNA16VJB=6wgRc<mae)q=VinCW>uet}!U?;t@LpwBb>iQiDihy+^DqB61)^H)
z?(0h_Aqq}RY$2fCBBjJbIlg^xc&OfF`rp+l?=1rU_-x<5q|#CEKSH_$V3ZE31|~|c
z0fl#Gs-QuMz`)QJ$(#EE-Sl7fEdTx{8z>y2SnN;CA(CHge=Oye-nk?&hXn3HSZQH;
zRM%>=zhQ)l6JU1evz@f5g`{Q@kA5vqLkd;`1#N*;|FhYWxJG>y<NnV-AIK4g_m7Vr
zOrY`bbXe75*-9gn>7YVkZj1~A@|LpzXop@Cs_#!eIJ|}Yr;DoKSB%HYXTY*kKheak
z2&WLVMz!(jVlJnY>rD&@-U`tujBPL+XW|X!|I;f3=aVhb8ycaoiXSfAm|#^8KEXwL
zpP^w5yqUZ%UuNhW;=^2-zwL3{?Aj%we}f0nVs5mJ&UM%3^@1Bm4-2i?s&98qHkN)z
zfA4r_mpf^GneA0|UEuK9R-uf~PHtmb0OEBPI3m0vC?7{uz0d+6?ZvQ(g42z+<8Y7v
z1tnM#W>IJhO;m5bH=TWrVN1-`a=nqt_mgEj@<!+=U=+uQRo{_&0t5&8Py@+2n!!)d
zdY5-cZTwz_G_W7W?CUt9lwjr9(GQ<(qo?HcV6lNi!Dq?>otg;AL&try9A9}aB^Cl=
zipm@}7ngyxa5wvel;jfPAaFO#j6rBZ#)Qv5Zn<$Hhn3wMJ67U#8}bHy0HlvQ6Osg_
z)<ia~HJw46ZJ4`#ASS{sW-!)9=vCi06f(7h3D_Xh)Qa1A>7vgyHZv28f!rwNpOQzX
zMVui%Jslll&>T|cvCCo!ZI}?IxNJ`XAMOq{VrbTA1PJ<1JHw|2+X!A%wl0=8e;g~t
z*T)<$%^JSFulW;`llSFx3>O&W98uo4V~0owa*JL%OfARs%@FlK0c?fecbEIR`DK?L
zkB@XBGd=N7nR~zJaJOJwaxxN0WuS{`u4NBg*>=F!T?Ls?iI|%avkeLbMq>UXb{Wrl
z>1Y**Jb=8FCd=+_uQqY9#uAH-*D3EL@^-wx{iyAlH6uszSuc&!Y*MQI{9oe~B6gTY
zz<8FIQ_mhK5KDaPm8UlQQ}}`FBjKtI8XU>{i%WDUz$!qr5W2lIw}kZcbR=1zZ3*n#
zQ_~6TmOR2T!!qL9H8Vc99LeF{;)0#8J{sYuql@tnJhpILi4k8~gf%uSwn(@_@g;!P
zF$2arpNb?xYq)69qR<MO+TbD-V@7B~+faq*Oia-rUW?9YAsHnfw`Gpc+&iF!wD~a-
zu9uY1%{eG8y9ZXehziMfCvzP~+J|oW(k<+IY<;^{Z#{r`gBIrFi9#Z`fCh7zK{QU9
z`zUFY9#oT|UTzs<F*KW*r~XEmdPy<BZ;Y<H=6Pb-Vq!8w_h;Gr%h4D*t}g*8iWnNj
zGwkl5Q5-3CWHTv4wkTY2R27nyE!D<C22wc7n}dz<bo}h3_?KS%xmO7Z-3dN+D7!t4
zSjk4o_RY#;1l!VeqCC2o7%S>xIqc5u6$9KcB!~9e@tv(<?uU2vM4m2DROYajf}*Ae
zNH)GFop%F+<qo^LuH5$H7Gt%B{KjV*rt_OuF)Ur4?rb%6W*g9k2F1)^B6!(LGUFp>
zc8LZ?uUnWr4KjA<yJm2Z!mu5Fx0pFPTXHKmugPC6snw;7ZD8ya?6k+2ol@9r?`KI>
zIScf7*D#e0b6qa3``XStwKk+DPViM+NrP735`Q^(Df_Ad>zP+6t?RNnT5d{JoVE*O
zNN2<x7uHZ3;ddY0-tQcMxw{5ZAK9z?V_xhu&2D6hNo)azw5x$=lPmNMb9@T+@fU+x
z<#0+AahWe?NrVg0A~H(GYeG8<Hb_VW_Nrr?V$;3EoOe8l>;%{A4gMCpO5CUFO)H}U
zL*X`RmEg$Ns)PfQRg_yPw_a`wG4HTu9o-yF->c$cf;p^$g~Swh=cX$pOkYRla$?jc
zDnG=IZbKUzGD6-AlfM&~kk=>Bk82KE%9qB+df?<88XAhY`Ig0o#1x|xh50nmi`u=K
z>`y&_Q3V*w$k02APm6w$AAKVt(D9#z{6HUURcft`)Pxt}UOcrRoqM?Qaj(0qOyARw
z%}djjnyM<Tr5Kr9r=W!ds|A<z;2?pJl*3Qbn-w=(H5m-7kfWXO^07A^D?CBYF=WTn
za%x7Ss{EDNzciaaqz^YM3MX__<~TNW80wk0cMl?$j<2d;HYcKd=e+2;%?<v!hwB~*
z2({YB>%}})SjV_^wzZz-mVDPJT5+EFLj8do$s^ANxgQdwN``4%?U(36RF}wXqmmW3
zxSCi@;CTKqb-ux2%X18jB=#g`k2q^m25mfy_U<q1&(oFmm!UY7UJ`S$7aR&#_~9D;
zJ}1b)#9zJq+_mh@-L}5@x{;;VW$Z(a(Z)xXGs7$?QTP9}wHAr*2_q1t7kb&F8kS>S
zh15@-AvwR$QjV8JLihGZbW3Rj4bhIh#vEP%xLB|7d^{PMtY2vPL1tL=4I4MEV7NnS
z*n><4Uj@btTaM-ZL=1d<UKB=l8YrbV-)5XCvUTr-&m|x$#8=FJc)gzR1SC93F*FdI
z{>*tRj#CBPlADVW*g{eIF(Zd76Db(8v3oRURYoyN4nhrriS6v0#*X#&c7-D0XCu+5
zjQNd8Bqmf4;Bhf!+Rm)4HZ8F_ahaOZk}!G41QeK1J{;{B-FXvr3iFu1MRczqzkk+!
zH0ukDFLXdu!;WxZQ3b90-+RBTEwD%|ec_gs&3XRt1a~w%!mZg`s%YAGwAlDHwCv!q
z(dW(g90E#9?{;sDpgnYb<vUB!%B&S{o`!*mvt`_p6J2cyq%gCP-zS1j)5~nhNa<fL
zeP7vXSHz%MInh_P`B1-1U}@LDw$68QPEHwYjS!N=#)xZv)aRUo&9jFBB`F^=BEp=a
zvu~@%T&E`tzq@0oVPa&eq&ET24FyOV8!6m5G(2jj4RiIxqiI!A)pPu*yNN%`><CG+
z*<ll}Ky+j_7u>OQ1f<Cf*q>##mr7aL{CFRXA^CoMCs`xoKxRi0Cc*f*13B(RA#(0G
z`U^R`7P%d!z&^tX2@r@cW&LstphWGNVp$Hphw#8?i=z50Cu#ch_R(;0fVfFS>WD(1
zmgY`_OxT60|J!e`qg45D>{ntFz}ujNa6mwzA+*c;?PL3UuD847&#Yw;SqD=V^P&m~
z9*f}eAPd~c`Mt17k_1OoSS%x{BeYyZCKnK-1!sWf52xX-=_1dEB>bwF1)=q*Ko)xz
zKL2pk5R;GyS8%d};<z~~1I2}PX|lVh(~JU(WC)5<Ez4hZ2GP__^u-S(rw_e5QOxtZ
zT>~rXdiHZu>CUZ`s>e(<vCXzgO5(j+&*ZOkRQz}?5fBN~1pmctxiSf{D=a8N-fgfE
z0}%kf&LY6}_vOwqmSw-(Gj}kdG~DbH+(?(#L=f0GuC944W(OKAt@KL^N(y4>4|;BV
zxD-4r8=zIcUn%>6Ys*nB<x{)P{M8qyg-*Dd0E|okr4iV*Vr(1Nfq4W8ROY8HFi-+K
zOX)!kldY@n?Mmgf#Qmp6uyxgUa47A&#v8h{JPZ2Q68|f?PNxvhtOMP0pJ<ELm$Wfq
z<j-S)sh0`e{r7}J!owpwvBprATOp8w2p?)M_jDia-j~{XcXthGdv`<jD5L>Hs9zgU
zKcoD^G!c4GkQQzOtq$cIZdQm5(#ot<GF{0fueGHltTxN(v{U7aMmhxm*{_`OZW4<|
z#mwI|n|XRW_%;PUCEI)qS;<-Qul_y#f6|pkyQHuO7qhK7!+nHl3>qR}v@&<;<`>|R
zFVK0anxW6k3&O|WLxki7s8YcxzXIc&p;Q63lF7;W<YkcdQHI@+c=P73;U{6%{16(N
zl2AD$bN<vas3>u-5S!ZdIC3)!n8)Deacx>ommSG(#em-V!8}@(`lZ$?WRDtJh;Bb`
zu?h(NlWifaOB9^9wWD@1-6}A#3$t*^<3c&#^AMNFITQ4u=y35I%4rXJS7X|tk4EP_
z=yji3)P!`1dDo33{Mmhwe**>(rb(D&z3r>TxPlG6SDT1l3}o+mPyzLh|ET&&=DC|E
z^Mv8#|J^=^tUEgC{A~W{kG05C;fOLmTO$1?vO)+ITFet5V#c`jjAlSoi^e^U@eqnN
z1-@Uu4i>mrAs<PyD7C3g?S`tp*!mf&6$n#XyVK|bC>x)BQdZ2@zA)i=y68)7gM^Fb
z?EVmT8vQn?gzAXP$|J&%LY8u3KS-4-BoXuB_i0SwQDM~}ja-$O$b7Xr%=O_3zVnz_
zs1B+Y8a8+pb>I414Kd+Q67{7nLIn`THOd79{Dm@#0Iw93q13?4K_c@f1abhRUH!OZ
zE*kiFnwr&LJQf}VMBG9+;f-tmr2?9V${EUyd~R9<ham!l>yfGoR{1SGEOZLLn=^-|
zcM?!7bn5BdskIFC!@%;9Qa?EK2Zyv|$&&E3T0FpTa$jt;ni+yQ#2feuH)ZTjuq0*>
z0c7UBR^j8-Qe#0A2;^kW!<iw;)--9nXdPU?nRI*Z7>nGHRU<H^-*VW%)=02~&oC&w
z3knMfD=BEyPX^6QMaBYIV4COn(<v;b<~mx2k0m+(7!$tVzAj9#6vq*AhT4>Q@crLj
zH(#}v4A*iTituCtl;QV8$pvS1g%-v28#cVd0RwIgB(D3`k38+yMNt)=&H-CciWf}e
zhsA&9EP2nHqRfjl7Xt_h&~P#Sa#;I&k|kjEqp!S!x7x?KjrJ3AT}RsJL4Exyuo_)c
z`q9`ABsGCI$P?d@lp-K3BM3OCiq{cZod_}tapVx7c8Ef3GDpAs71`1XvKK;X3!C}D
z>#Wl_wO&iaq3jDVZa|TSGA3X$2T9>W8WKk+kZl1a5egDiAj*!(AcgY%t-)OktyKD}
z%AXkf`c)yS|04YjtK(jx$=UbkiRXmVypbQBVdsqg1c)F;Q$;5Hm)ovS;>;g;PG;`$
zlY9^kCJw!PV9ubs^Z|T|Jw=fN08W@k`%KK@MT}U=fiGaqQ}WaQ>YBJwhLZ|51?g-_
zxS~<GIrEr00xOKb`Y?HbuFQGQhkLTUtQ36@z|<~I_F<zzWkDL8wuS~ei1nyYA`^H^
zbGDsjimJzDpx&=>|4jOk%{dcB-1`_L_M!Y)Rk6Ajzzu;)3d}u_b=DSN44W%t_gdl%
zYfqoTgKx$l@#;7|v5YswI)mZi=?fS0kTIdiPqTl&Y7=<SZ-c`#p|G2Yw#z&}A+hno
zQ&5B^3{N{9BRnA>T8SJ7PDx)C0hV%vtzptsP)1a_+V7$@!$u&ZS3pk~lRLCXiU%c5
zZUfB0ykH<=kI|Tfbi4~$0FMTZfm;NjZkpV~IXuIprV;SvN@$%y_J23;5Nd^kxIdAV
zrJk(O!T4Y5xEBvLn_sqxXFC6N5$Y+~lxW(#e;{SgxVt{cgXSB=+yo->156kV;x+0`
zb|-allN<#bwe_8rzuNZg(+i7SR2>f*yi6T>w8kMI#p{T{#=LinzhAI>)vu!8-ext(
zi)OQY_Vlhhw?W+3_a}c>_m)sOdZz!k+OtlV$g_H#B_x?8YmW&_`OisH%Oi`d5fKrQ
zmzO8IEQA6)d-#KwdVpvdngRv}&bSS%T}`X;=FC{Nks0F1AbI-IEAq(Z43Z+#=oBOE
z2Op04E{d)YE!dC#jk+J5^9QHpCuT?(>XI_}4x$G_2U8ExMbUEQ7-n}tQ!j{R-{9DK
z|Ncg|fpdQJle;L>ep<pVmS={j<dLlyBq?Ty09#y^Y4p7+MM{Vk>qjrjBmaIUk39Y>
z<@68iVogRGO;kk00_TPxt&yrXkg3a+DF9BDP4V535F%-5j}r0bm`gF2|NbD4+~7xF
zvHjCS4&;%a`q9_OGDDWKHLeg3KW*bqO8-pWpLbY8YrY5jKZW5&59Ti>$WCx2bVO}q
zu9EC+1>{a0ykg5Bh2T}s;eX@9d(~y^VsB2gDrL40X9<2856gRr<%iZYLzI1qKb*9X
zEpD0*f3*|UfSyWkY!M@Guf-LJWYZ}1WCjX_2h*{PQ+imqBYJy#4-5=Eu(yU=B~@`~
z|HC6MP22`6f!eo43Cv!y@i_b@>rUj6m#m?E`-2y!WhJ|KHG{N;w*XYmk`-+6KY5>T
z;<G-{VUXNc(d5o?%ti1Gupheb1ep+MI_gO`6tiv>N12TLzP>)Dt)JG+5#OXd@;8y+
zPwoT$Ky*<6Gy%jriqF<MHlB(D^CCBwj$Wf#vu0@;hc*e(zP-4BLF&yT&s+Uz7dSK0
z8uQ5WSMXMR7qL6O4O~NGPvgCiydV8OFx&gkFBEvTpsa!{v`jT@C$`tR$!!6{6KGZ-
zhDGn>KRAHIueUzaKyWT1^a%K5e}Dh-^77Mmb_3d8*atgiP3~04gveMQaCPNirlr*8
z%>%bqW!wh8WF4z>hfww6YVU|zGKDuknR>SGh*N;Si$()|4hhXZM6t{K!#^ep68UOX
z>eCBk>QsJK#(kWFdhh|;8hHy?v@x_-ZFTH%CH8@|sF>J^r+-ezzw!5ck(?~;CLKBX
zy+8_y<)j{YdD)j^o)aQ2By^OX1D(nC?Bi=iMBImJEMWL@07?=a9i4%)i`c=F-4iDr
z?sJAR(JR^q8g}t|9R?b`)igD$R23QhUUkmR#o>=4)YT@xNou;ZTGMd!fZBr+bVJ)1
z+P*7P6*0Mk3--1!<{1E}b`>@eIrsR|vxJBv70uhU?S6EexSgkXv5pr$X6(PrY2o7q
z*RCCuq?(8l@^%w5tOQE)ypobC&p$C}<s%5d#T)m3yyYoyRk<^2YQJonPtJXavXlM7
z0I?Emnk_Kuk-ND-q0kNW0D}wJ(zp4>%owC^wEvt`tOzM)uBY9Ji76Bb0vZDpPNJ6@
zT~tzn*)9Xnq=@o8fUxC_Dt9wtvgo!+MbBb$b^zT+a^1RSB&Pl$J8)Xio+IK`AtWNw
zs^x01f<5=wfK@anRpNq}2<qiRwCSo8FN6zRRlHa?_rW4|u^=y+)Li12CtYNuA?BO`
zHwimP!dwHC(||S=A_*<TJZi&m{-om?DP-qbnwhzI^zGYub5(lcoyhME4Grz)ngS9=
zLqQuZ#KE$KzfNJZZCt|^-=V4LGp_ptU#g=zQId3h&CbhUlZ*t%OjjpH`c5GfC9S5N
ze~Xdx*k@ws9|4Z~K>5bzb?eN~t$<#ry&4*op5IO7L>peGdxw5A_NS+UReo_h23kQ%
z@JMOVR9?KOg|nmzkPc&MdR?dl3UR0YmiDM`an=G<e@9i(9#pS7=>&olA{Rtw2(0e4
z#;a%AcM@t3H|a*)$LIs#5G_wGy^2nOJszIlO+JCBDazoO=N(j0I^WL!9j0;<YJVVl
z`B%D;p#)`8l~#*(Q6D8Q#h%?ix$Es@iw&hvOk6x34GTp63nOJmjCu6r9N)7}NJu68
zPz*wKOiZn56F%CrHIq9JQp(L~NOtBelin>+f&smdWU@LFX&nm{7`hG5`IL=QtST|1
z82d~Xv1$@IL`bn~Af2HC>6kpbA}}~OI4mq)>xZj_Z(&3{c&O(^lfYC~g2t(W1Ypcg
z00#_!0;Rv0L@@6ejfiDPtxylA9D4dEa-g>#vyrlWbJ*{zLa<YREhFE5(6Yw}bR#y0
zs?Um8Q-{z3GE%`el9?N&q@*@&vVC(~jXBdT&ycz5bggw-etnGdU`Kv_{>a@Vq%|_f
zU*7~iOBksL+SU9yeKx#cBv{MXXKwPzb)w}kx0JlSM2PAFHtNUG_pl&thXP-O+7HL-
zO3yWfWhNfi>C2B>5JLaZ)HJAFc+A4WAJLIa36ZspTv0kl_QU4IrY?gWTd?s!NfL?n
zpB{`beu4$7PNX9UHD8F=I^}O1SW!{&;>8Pe8s-Z!gzjja@~txjqvl>Ho|aeN3L^CY
zCSt89i;>&i03JvN<`AYfCo#(_P~J!BsfHbaK==m)tYzImnGi#^v`d6qgR1adGRi%{
z5z~(OwflClJy@HJO%5vEK!=OC&h3kJ`Y^-^Woh?;R716;p|0+4Fh_2^a-Mt*YFHe$
ztS_f(i-$7lb|=^LQh)q~k=FD>KDkt(zX+X_$fxwD-#-(W)sHODukZ~-4v3YA9aZgK
zNn3B?&mp}E#~K++J4%+6Ew75x1JY@YAzF|*HuKq)4Oq^5hn<fm-wN7-99Dyizp%yu
z$On~*x7lgI97aD#;vnM{k!fYzX<t~kR?rJL`4*eH{XJVSSIdzVDD1e@sWoV$;Tq~U
zAaZ<_?~VE?vA@sr)JgaQJEAat;9;)7a<I%OTn8<`W!{QFml3oO2xeL6ZqogDD`->`
zjA3EG`Y5H*ADGL(IsfI8*1)Msw>>KNNbc8g`~62iUjhR$#HK>h9@n77G%{Ju?ndG;
zhQbS)goaf&{hDxn2nq_Cg8v?S)Wmpn@!YxZ#~u}8@};P02fI-P-*kY^9XHrAK2y;3
z0k$@b)XQQr)Ov<HOoRl5u<tKjx@70>=hft)Dz#d0K07_{Wtk**8+^d4?ypbNVSBiK
zkP$q>_Nco`Ln*mn-JV5~CdNwhU%Y&ozqBHDdsz93O^L$>(y)@Zs*FP;lwO3}_w2d9
zZ=c8soM!By`19(h|CH`CThg$4n8wRl@zHA~(WHy6b~0WYbJ~IqIs`i_=aZe9$9mGR
ztI<@Q7e{T0NIJ7G?l<pmzR50D+p%q5`<qQiUnQe-#D=hwdaYW&HfZM=<gnPG_|M?e
zmxk%54sYMS9jBjP{J?GMW3}+2Iq-6ahTpT!t-+~vCA;muafVJr%gyG(Ag!>iDLA=y
zM?*m8X5GcHa@}}=PcZ!Yby2~fb?Sk6bG0HGmpMrXI#OVp&%EWQmEQ4`t);M|P{ng(
z*H)a5%1SThHiOl25)w8*mq(JnVb?Y%b%e^DMpF|F0(yVuPix7l0^cWOwA^?i5)p;i
zzUa#}2bO@uzWh`GVTtJVz^T>A8SPHr&NMpz<6>y^BDGFOxZbM4pMWk&o7R;+UuYNJ
z@)U5+5wqO<rdOan24_p4B}XAOuU<r0c$dKG0c{JgYA(nQ?2Z=Z<-PVaPCb@?6`!L}
z<qt}Y8Diy9NYpWyZlF*k#P!Wd2v$I7Eg#w@EH9slMPkOfTQ~Br2w#MAD8qI4UPb%%
zx34+wjx@tIehRDB_B<mEM3OVY?}#)D-U(S+5lTRAUQ5c`d>Y{gu??PtXh+AOfftt+
zx_zXof)&XatTJlu!5u+AS(mOYXdkG+f@Q()b#I4y>4|(9C-G_2)YQcE@5|aTE-EqZ
zBUBc6Mk5rDG;?lK+~a~=H!F7DPhvQjU@;**YKwA5K(v-XjrjGSM9z;;5|Ws;eLOe<
zs6eqfBhB9oy6O&pONf95R#OqLy}jqKLqpPPSI(Tmy|{}aZ@78$W{`o>fW=X;wW|o&
zeFO(e3_8s`)6OKW^eCF=<l!6{AzIj(!!(*TG=UxdyN!*Fot+;mEjtz3>xsg0lDI-h
zaUMD56@fNl2B&;a`q9QGe~kF5?%MSV(?_8jlh7K^c66FT?&ZyKD9973gF+aZZCzT|
zLlj{E1R5Y;MS2SaCP?Xq2rb_UhiGz;1p)e;e1MY#iXm<^4;RaTcFySBCz~c&+AU=l
z&j51O3EUTsI#SL9$K6C%t)(eqdIxaf@|bTg9+_lPxQmkXhpPlJUc_|~#AEmPrk`V^
z;kT2ZC>fFdM%(+#cgSam5AkJE5j4u&3;gLl7^#Z(%=Yp>A0;KZ&&?}>>-0Cn$o&Yg
z4v{!+iwQj<^O$;1(cJ@fJw;pE{b%~LA7R#Zr95|Jl+2YglHRz^afq7aOgiBtO{<&@
z1|W7}^P#+&$U{<9w>50)+qwO<kBefpofM1eZpfc-=`mi;tc_Dyn7Xqj+s>$`%giO0
zHK!%5YUR~v&gR`pYgSu$UC7TSzq8Y#gwzRbO`MsbR#g8BliP2U*xO1LND+6`#E&1g
zi{<bB*>F&vx%|-5&p<dFH&V!X0P)}BaO`tC@Edlpf_Iu#r4?+WEG;cZM87c=;$_Xd
zcT>dnKWNOY6yx5=JbrX&;O@KV&~`Chks)p$mo{qM(s6iwMv_X&lDV~4<xf|5n`jtG
z>(Iw!&KzMij|%5K^-W^CgfM6{4I`&Rk(eEfm-R{Q+-BWhMpn2nRwULuTXic<T=^FX
zIY<4x%+}s@ttA{Y)>{FOcQ<+|A<4&Xy6)Is(lVNVP^ZUDH*lUlJKp@tJLc;}=c_&T
z+AK(_p4VHU-kLT~(Ws>Umo@Kt_^t59Cz~?q-;DZxhQQ*;)@;Py0{9G}ZgtG`F*svD
zsp79Iw(ssQa71xi^n2n&qPcc0ZSjUPBQ6no2hf_QT|m`Nd0D%w)P$6kdo#6z?$FfK
z^s1<Pw6NzP@d?ChHkmiJNx*X5J9g!AQ^|zVk3NLV$78icKR0z;)}{X966+fk35ypl
zTv&Va@R-wb)m=@4t4No+qud*|Bs}wKE)_knLs=)3$#Ho4@=hFS_-xhVTgtuO2`<fA
z^0|9W<&uvk_BL-*v$<SsL=xB(-}<3Didb!b7y8|$*+;Ej7O0$w@3mqrE!(uUmulz#
zvpmhTR-*XmQ6FrUu&b{myCi24|NT+R-0QJoGbqD)W`m;8dH$X!^ch?T=sBt85+e=m
zIXNR8_XulYTrW3RGAL29ksu(g9ozhk=>)KVEg_%yBBM0tV-d?bgk;$u8dsI<6!l7N
z?!sjin8TCs=B}DYwD|T?JmtN}ZBZkAeYW<~40djRK7w@$z|vsrYOKjI;gp5!2zzX6
zYpZcJa=`icyEU6)&6;w<orklowsxpq)(xji<P1DJFqmUiXWVn`((2xDnh15f-OT$D
zziIV&+vx@@Klc39ENy4`lMQ#Zo4z0X>0pfJN~hzOt45Csu?O}gQaEK|kv0d}Do2tj
zsaI1v-!KOqO|+>Ceq_(RsPM0+A#69Lu&5{$v%if`u}>!OIiY?eAu&TU6ku4Uc9rV4
zvVggXa&I*|eqZ~7#o?3<2{zg9wj7PLNjY-ls7D`csjt6#c+2AAjp;eD+fDf%Zn9_G
zm?fu@d|!X>%F{b5;+MayRyldHdn;9`?^OPq*7k{a%ovD#*GI2N5bxC*sNdA=@U!dj
ztILl`D@*5_8B}}7j=T<NoumCIO4;FR$d2Oc2k0-QPc$$pt4;O)`<uusWn3fr9+;0=
zbayT!)&tt#_{@%=%ba(J6|KoCW{@lx`Q%o`gMG0hgA0xv?c7n@v0_Zlq=PO+y~?jr
z@{{6dMCUEd0h7fog6Y?Mb)zioeT1p$su5??ckJjliXSF3qL+rHz2ef;clC{Fw`8jq
z*e|fN8rYjK^R)lP7SFb~*S8ka$RqDU7^Ekg|0Sr(jCQicw`|c1Uu<k&sRso_J#mMW
z-2{M77z99RjcbAP`<^GOotU)?x6<M-znadh-OLPGxSd&>(HhqOOl+|{>tyX?U7daL
z8Zo!^SKe4BV|{bni6oI=)31M}*1<-=PKK_P;3*S!gQRA)X!w?wJ;V8U-Tn8h?vVVa
zzNbfA>=g6djZ(DY+y`3ypgibFAC}EHzoT~WW)*zV9S$B)8X9=c9KI>IeofzVkrP#;
z%+Yxo_}%%;9=3~JbK1%3<ZVZ`*QZC(TlXp7GD!-&WGBCmRMr;ke0+~p&2U@xrjIn$
zJQdwVCVZPS)be6tX3Xup_g&EI2bBIQ4F(bR58F*^dy_U8(rcjeUq0j5ASW8wxCmB?
z*60@=4hhvD(enY%!0WK*RQmCWGYXn;cjapp*3XJkGW-JtE<Gzg5L9b6eAT^vG_U<U
z?yuST<PS|9*H|qQ4WaTvajEMZU&X2T&+zUs?$3M&#qgCxe$t8J2i+N`w<AcXmxK*I
zFKW;*T3dyPWhzN|ds{$kNDCK|7~^CP9fAMeJWZ?mO|eyuDMzhxW%lmf?{anzUh<K6
zhLo;dt3v-C_V)9GDvxDfvb#B6dnmPy9*bw@7P>6pt((8mV+&*I({4t|{(I(o@69U~
z<|_Pkm8q0hn5kG*d;58|^~O~%lZnk-F-uNM8ZrKK6}7D{v$9NZn_-M*ZaBTPR(A6`
zM+agJjZRxg)+t3=U8$~&I=7uNZ4LEv>=+4#xri8TWg$S=o}5t|r$PdG1f_|?P}Sd(
z2GlT1pMB+pu=ovWa=C1*{h|a*uhhY1GWR$wE_Ql%J3;)!XR+h)^Q_kKfKYj<xYR9<
zRW}Cmr{$iBHB@O$tLePZTNJk3F7^2SJw0857K4^m%;OZGIh3~y0W8(KKzVs$;R5S|
z?fj3I6L<WGkZ#mRXJ6~$uxv%g9;s_<BIx>eG<;cW8TI|F)aDYy9I|Wa>aDbtp6k-h
zK~I@y7vtBjD@bdY_Ho(P!wdntwG4%_Ux?dY_R;Bxs;#ua5z2UrcJ1lbbD`qPgbiLs
zh6&xH014cv@)?&0+R{9UQ$hyl1osX02QNu*kB@<IyGifP*^d3Bk79+P01~cD_1pbV
zLg+{phv5ArebV>TK+v-g)1L%2yspF=BI(~CsK144w}+BcwJB%RS}l)zv}e>hKP+SG
zKqmcyYO5p7x_GpnJTtN{lP=R*<QwvW>&i0P6+mGb+4bDFc5r3Y7PO7_qy^N~IMGJM
z<u=epHG162hkMeZNS74oW2x)+;Qu4Bg+4ap?Ztonoa``q0AT6Xv6NHW1zZWCq0`K8
zh>$tMF5hx28#wyO$IA%iAbKq9qx6uOpA384tH(|US?c_iL?4m%$;fYEckh2wUQR#T
zbcJX_gF*6*O-C;%b*!dpA~>mQXcQL|yz%@dbir!+*bo>t0@~CJd)sCVS{vcimmd1-
zSF)_UFO%1jhUf=Y)S>IGEt<=m$lc7r=jUcEWGuBrMPH5fMe295>&9C%>Ep_@ow4bU
z?eobAtG<#9ByM-ZWBnn%k_+G#dI|+%SJz25QBf(WeprKv9eg|h??pvO{@oTmS^vJ6
z{NcSwxb?fkZG1`oo|*^w&yU(_?x}59DCnGg<kt4{m5agSF8Nw=0UUPmnsB<0ip?(w
z?f}5$0kBJ-ZrKac43tH+srxn6Cj6Vch(YadMAUXuGSSoG|5)or=6c7Dg5z~r#ToUx
zB(lePm@yFv-1tC_xi~ZAtB7V^j$0E-N5YN<2XVd(R285ABb1h{jTwhCPXuMe^5n^`
zXXj`C^_Tnq5V`tzWih#2e`nKoZ0j0p28sV`IesF;1VZoN3KW((ryDPtIq*gueK)tL
z&VVHg4OY1xUGcFMx2~2zF?qQPO?=}X8OQRnUJB^2Kfaa@BSKmaEWtY>0ofpbbphxN
zefB-7Gwey#ZS2>tUq52@jr$Y|Is#D7&#y@%(@~3F<uSX1yek>OGf>Q+2eBZq@Gdst
z;mH?e!I|vtVSEO3JR0BM{}3=3;I2J_(@#D7GUoBQAb~h4QnZ#dKm&kk9s)8Wk_TQu
zr$XRfxD;?xj`N_E+Yi6boD>VsD`{J*IW6l<J=>I>@^T*%inl!hzMk8r_FGHlvc(fa
zLszilV)w=Bpx?@jz=E{D5t#hq8J=k&0l)R>L(|v_xy@aC5#S&6_U<i$yW~I<Rk?-1
zXp8z)di5kZ4jju!8QS`#OP3xd2Lj#^*Nxtb&Jkd;zF;M&-<6%4bg?Ysg(7AnFd^5D
z*ch~l!Wbnci#`_U=l2k30Zc6*B1?o#Cug#(2?DYZ?fkm5O5(_3R_9?sEwnleRvMUQ
zqb&glRSTSJ3?{#{OA+KBO?yT;9pb7(bX1oBJ%>OZje_k_ztbiUX8^-eJ`7L@65O*u
z*g!m7L&Xaa${Z?9@a|aVzNq!@CBBSVey$!OB8xX?NF=ZLSEbn-O|oRs)Ji_&pXkJ}
zd_y>c`1&?_)G9<yPB_Hd@qozM8QTWIqHk^TmVyhzH6U)FlEr_eee-roA1Uk%(=ZV@
z3AU!6Yfs^5$a}m!*koZ=4-h!K{9)V&laWqMyu8C3GlWnLMQ~0KX4$Dio5|0JgPhir
zEg<`L@~{qmHSCC#MTskHGrbnAXJTK*#Kd$)3BcTOMC;cbU#6U}I{y$U5K)<trn|SN
z9(`6FZ|;D#&}GbCiyKZ{Tq7s>9!f~K4?G)hkZlZ@!a2<&>l-5XkD@AV5WG0rOH)Qg
zAUJ&u<YklM9(kw8kib}>;{MY$f1oc{&~vQ#l-=yQloJM4R#qU@mA+^2P2~fbUqi6V
zs0M~kK~ss7yR?~ug9EfZiw%tX+G8RF2nKLEa|%HjnTxKze&D!&F1nlqUAi{0e^LDS
zgm6%-RQ-c9S?vT*u(krkRv<dTV2&v#BQpdZa^$Y3YX-;@$&6gT?>|;g<?EBuR>0F7
zlmUpJ{L!fO*s0CxPa&MW55gPWeD{=o<QPsRLKTzn!H_le=FNm35xFkgB~7Wr@7gsO
z(F!|0$Ev&iAS*MKPu8+LHZ~Ub$`voK6JU(q3TnuKF9QL_9*%}+Q02+PDXjw?A{|W)
zje1;JgjS(+<Tw`ClQGL0nIq$t9U-w1J#}&_D<QrIIS!h~63(>0AvK&mYG?OIslyg<
z`Gef~DN{%!m_`A+H8jE?LW2r@t3%h%L#n!vQDFRFPDgzv3)K0*>K&x1EbR<Ge}5s<
zU2(NfuxSUi`Q$uaORm~FmHUKr5l!fX=e&Wj?M{59=i@)@$!P9<`%s1Ud)u#*R1WcW
z|0+gKaA@d8M?%4H%-p;qN`R@x2{f`{m%5J&nU=Myd<3FB`3QZ1el09)B|m?R4WXB*
zQ1uwT6+oGsFqD_C`_VsUqDFZQAktI7`7YFOD1XXT6&-r&<bYH=tqAnoXcbDH(prY5
z;|@ZHR6D-{BZ&i3q1C31#i4S#IUVJy@1cU7!doxoACj*{omfeY-e{cuk@vaN0YXeZ
zFu#{9C@C>XJ!uGe#gU^&Va<ZVA<v>{cz76_5<-88E>h`J&96E*D!VE7e!KPTlY9ds
z&I$R(m1TEK9WbH&Ih>!<9l8&I=f+mJeqGkAV38o_{sVL*G=P+|W5pUKwV;(^5ESRz
zheu!E+y-7z_Dq|v65|nC&V<*ki#JT#MeBM5OxWrB<Cu3%sc{3poZj`Qu);!c8|8V#
zY4l1k7>oy(4(7}d)xZBXrP@R+!e)DpyN~H2i?2ukocfJiU9*&|1VIoI1U4L<^7<6N
zrEOJjU}IyHpqCXOArej4wA1(`G-;GE=b<h+2s8<y;ldSX1}>ynltO@l-V$jTqy_{m
z$~ZnEJ=5&ivAsCp7`S{jvy_m9f|b4<9o<pBVr?%6fCmWvN}4+td}jVi)riJubS-NH
zZ@yz$9t}YU*tqgEX{S~axnZN=4cs4vUUninx%KN<VbB`E=1#|LXg-4!dIply_0W*P
z^#e0+?(jLSfJYaMGYPebk<gZs4PX9*1;9^ehPxW>K!fEAJ<D36g&SQyHF%{5zrQcJ
z>PUHUaXul>+q36tp{TpV$OloB&?lj8HWrPM^l>iroU>F1tAhVNn#}gEbgaOaY?jfF
z-n%qoQ~^_~Aop8=z8gZ$QQm<*?7AYxD;em=owV`VenP6maa+B5o6_OAE4S_wwD)~n
zou|4(Ng8SgW@MzMeSm8M8wFt&_n9W;xmpn732Tv4Km)-kG9E(24I_|LbpB&2>zI<B
zeT8%x3>t<&aG(~2N_#&>QE{plKn|j=sTs(<5n;U(Vy}}F|IT>wukIFT?9dvo#r*<1
zFlll_-3r?SIyzU4Lvc*z{`?D+M!qAzqGeG;Nht@W8_b#Zb=vSxA%g|iGdQ@;F#^QK
zfu7$`HB>>)V{-t24espVy0_Ru?E~T(p#C2qPT;Qud43lo`1)L(E%wDa!DSiQ?J7RY
zHy_Ibz@$!5$-#LoDJt5lr4^*yrXm2bivRKk<T?^mzJNLRz8s(+T7tLC237dsWXl}7
zvQh?3a9~<cCS9fb2u*NRu#JIiv_as(b3<lHp{hGl0n`xP=(^?@;zL0^P~Z+YsuqU=
zX1ZMs*+wfJ{alYTKIGM-q4EL_uCMZ4_13!tiGQ$#nB0(A3h$;z6MC?=@)ZLh!N)Nx
z1nRJW<sk~!<=xa5;s^byKCTyTpc`8u#-0@z-Lr)-*e}fjZ>*zwZfm8s9o>)b%ARWQ
zC^2uLj)3IH6haC}CYjI=G0zfl_CfnR45j*FAcSV;=C)~ab{`v`s>t|>+&O|8G|0p`
zmM30;$l=Gu8}^1P7)G?@K+rzWS&h%A4OPZmK_%BGzkiGMs+7#^B0k98y?6mWN&^~z
z?!lbGA!D@Sz9B~Wgh7f1P;C>&Q$W{oo5*Y=fXZlN%P9A3VJ@{s0)bAaYRSw*BttD+
zDshJQz|50*iUd11WC3V)Fc2IZhWgzU6uo1ElWIv5HCF}QA74^3|D{VC{g}x+#fq43
z0wL9#m<%#HoDnCMZaQ*~Qe%ragKx@3$vjvnA@4eT3T1?_W@wv-yTXA-$MVtHy1_95
zx?FQ0Sa=;q1|7CmkYB;1)-BHr6VMO`4xrZo2X|n#1uTSrQzBYo%kfT#Wl%h1jC2X*
zkuTmvx;Ped6G#H&Jo{{dfti$!p1mFx7Iy909n&ZIyS|)Ikb!O|hAUYGL%?wbXxHCD
zZC(vTdV6xHs|Ic@Ss)Qxi-MyN{b2ovk{H0$T3^nTGL}P9POp7EpCa6Ox()0HzzcUu
zZOFP%R`wtf5`3xlNiH=RT+ol+D8c6FLEn^7Ur;P7C8ay%-$_8I$j!|q2FW3`yzx{3
z*ii`_4e=;n#kcPCpmyjlQ%Npns5Ubgca@KsnZ+uf+yCIuQ{Wwhk&VdOwI}I02L)fw
znqcU^TIWqbv3cZ=_t1A3db&i;?w$?u0-kgw0Qo9)H@E?Sm(h%;lk1G(0p>!qr->-_
z8HZzVGapu7pZEME{<*e64=y3e1kJE$3eXpX!Q;Zz$iwbin~_=Jpg%(UthkJfj43yx
z_~4iC(a#%V2n-y*S7wQLpO`)L4*e^1#M+9AePBS8#0x}5pp?0D`}T0-ADyLBD$*}%
zVgYf{ch;u$5(4_w)PR5hWFW*@Kzyxxc+^vAnb}kdmF2!c3MSWJoz^oSiG?3J9tfa<
zIcSZFol--c+D}%OgvkT#``GKw&4h~DNqJ{<OpGLEuyj<!5-_r_;FRjWRgz8*_GoIF
z;GClV8(7Wfbddnt$r;T{*xo{>A3CCPz)MY{U+hy^@Vl}V977gw*ylT{4&WQ~9fBGA
z{sznt3qohp)P51L9PTt{ph-xIuLlN3Q)lGQ&sdm0Z5aDaS66pXd*+lDp^@<p7YBUB
z*0G|AQJ!c=8@cN-rSEjgE`QotjG$<47^pHL!-e+%`mgfyZJS$lu72?X`gfFy)X2E1
z6^ncETB0lCRxbg59QReYkY_NzH=AX0<j4nrBLmuEQ+w;Rc(5|}tru{g5^`5NQ%t_9
zBh-^q{lR_jU{?pki^wkEP`6!R@dPJ<<8<GYW}-BkxX+{JPbvQYu1iL)!HnI2egWEw
zfEzc6Pev34NE(q?B`7UJYv5#B?mk5r*+IsMqqj^yzQv=1Iuv2OKp{&^yBj%v?#n5|
zfB0fg1R%&l21mgcLdN)*AUJppXVAz(5F3#WL%3LK%knARG5gUjaTLG;^U}uNm=+`=
z=xyjo$n1%Oz1;fY?S5a*;Qm$I0SRP+Z|M(AxdbpDC^brn=2>k%C+}<h_*%Hq+Em=X
zojf~(=2T<9;9#V=MZGzrngV}96P!q$fpR{dUj#y}5vaOh!5dE<pFX9}c50`lrY2OE
z*aSMdx|m4_K}vFRG9<mG5UCJ&6T#q=(SD!Oij4aP2Evo?1lyVU$4r5rWl!ByT6X(Q
zJwh;m!ogegDTTyu+<j-hMbjN}4GPM1sBqt?dcfNlmDIj8$eyxjhn{}tHjq9Mcdn9X
zdSg9<6?GA5EhU%Z?l4MBf;O4Gek-x%#EN1J#(P<OQ2B^s4+nxhik;%g(l9A!%?NXG
zYD=2);0I5w_KdC8k5<f)i=l~BdvF{NzN&z@rjt`8d$@^Q9@*{uTWz4cg+&j?V#7`a
znx5h5vmZ+8oCw8Mnvi49<!K9@=UOH*jXHhQbc5ywQZGKfw5zm2rQG|PiUwu*raLh!
zE<qG1OuEDl*=65eexNx`GdsuBm-D=&E`yMZb?1epovpsBmE)qKxJQ&hTE+aV3HlS4
zF)i{B*GSxCWALOyhF|vf?f$=Ce!*2bj5m_`a-7BG982&xQC5&JO4MwMF8w$!B}aaQ
zoC%SdKV@0E#L+!@HLkR4GldhBq%GTS_h{T8UFJ#qDA4(N=}@3wYaL)Qh8}!)a&BF1
zt}8vqF#g6SJ3Z;+`?#(3M-5_jRu4ib*mygoT{nV~;p!*#W9Nj<EB)@i!E@9l*4)Dy
z&S&bys&8wA)13BIQ{tOCUsfh8E`MZQzUlO6f$EN)INqO-SWn&Fv}7PiY@0yjiK@Gb
zr}hTvc}Dg)`^IaAD44Z3&Z{?i^#b3n`*F(kRM$M{Qh3Tby-g>c`%-h7p@A&?R}Cau
zFn3J5M#lkvi~(<ODBmkM=qm*iUr8_(w7ry3It1BRtP&;G{h$rXuq$ts7(1X^{_ae7
zb+m4;e(?d}SFfsK#Xfv^cgCi{`cSPx>%bWPB|Um)i16UTj>=2%3;Fr0v-FyLvU7qw
zoJ!hzS7v8H`||p3PTkrauG#4&ZU=VK2Tz@`i_PRa$r_g8i_qnq9NTSM&|kYV$oRK=
z<E<-Q(z;}R?YYL(z8Gk~@^!RIY4388E#6-D#2nQ!wo&M}3>zJOw)a=Bk2`wRcoy@A
zmCJQSV)dHtW(&MKW7%+5ZJLwu)q9cJ{^wE;hBz+&$r<t)<Hd@e$u6B9dpfkYucm$L
zr}{6-81$R}G}q3~j<K)+nHxiw0d4<a*(&w{HyCuFk^HS9s}3XoRPBFRORKl#E>x=*
zDTUnCT0`1~VrP@4T}aOEKg<jnLr+1z&Py>Rqg%HAFPsOPqE6ZN*{aqW{py-M>^uv?
zz{~4i<Q5M8lqJk4?P%nNidZe-XK_iFqEsW9&UYhzlf1QUOf|waeMjtv5x)-st!ZA8
z*?0A`6PrhZ9EBkeVt+@H>wmpAEqB=YkIZBHGz9`H2UiV1W~M0+**V5l@#m~|RyL}n
za&xS8n$!NP)Dg|v$BrE%T26kuwH>*IzvP^XZDfkSf4KWYou(x#<p+LlNbPJCHO@5=
zT3~d>Y5YzBkU#C}S?uBi&^}hM*KJT3+gJZ~_yE1q=W(U?r7M^8xHs2ZRbP%>YIotT
zVWYv1?VYQIh4mAHeWi93TD`j4D=8PJS$}}Ovv=?(U9q7u5djIq5rv7*zAngQpZs{p
zyA;OQr5x&?3evH?1=m6jhi$cE%~4dT*lXk2;rx@T;0<Qz>OH~{;T4YG{>b*o`q}P+
zsA2K4ln~)9l)=HE|EB*!0~xbX!Mx~aCudWndO(fhJpPsmiQS^O#^0zsq1tLydH3MG
zmYITXN5-22p!)LV=yS48hr4GS$?b`!k?9-bs^V0V0<A-2tnRyq8q}vh#z{!+xxR=H
zXBjUh<iCmh?gMcb?}fZg-sYA1m&VUuc0@&%8n>KZu=>%#^0q921NOVE%46A0iv=W1
zKCBqqJ^znhO6CLeY)PZk6K@`?AS^TsS4V32&$!Z27^ZD=ad6>>5E=5K__XKdP~{0^
zlV;rTSCHP>J@~q7^u@Ug%-3fI{PnhbIIGb~K5y<tx+Q65AIR<#P<CDLV9w_~z7w_I
zH;dSp4=S~zCjT|Nt(c6DO2GgRG(ou!(04}a{IgyP;zDn!%UNT6h5e)};g8Oo+GpMI
zXmu0++_s8Lz3u~>RLRf#Y*mCELLNHr&#U3k%sgV^e|~d%_vkK-W$2}Qm78ndNjLA}
zQ0#sg2+e7zFjM8qQ{Mk>F1`@b!B?*;)Q<l~{&4k=G6%)G8b(UTUd0{OQZ&tZ8@zK+
z=;iuSGQWxO<6X~0nwAWO<!pZ3bFJK9-b%$Za&1X*bBQQvXU4W6?!zS49TghV&cZ>C
z?=Ih(mg{hh7b>g0+huMRmyI3`I7p~3=Y&;^jSgu{qXj;)DNNP4pw+&br-=3sd2xNZ
zTb%3o4d(zf-~7t>chY^vs{6j2A>`fp)pPz>wD<~Ire}Q;R5nZ0d=gZ)bR?@y+vS+R
zK4_gWH@Dg=B*lDq2=FPcEvWqdT~9f0FCl@3*zf!C%#qiOs+Im$(<#d=p1(L}zf_mF
zNuk1oe7{60F+g(Pe(qK++spm6Z2oJU)TcAW_<VvUq=Gtj7LxT+3Av39b{6;bq@wja
z&Hdd42$3QLhY@w_nj1*gY~OcVsN;eQ=z59k_%!Sa=S;LARD})-ZDrZ4qpA~rQE&T4
zokDgMbgyNcgsiY)wxjpm15Nh-MI+8@)g{i){)emvx3t3^=bn@vD(b(tA@b0s6zaJ7
z)eVBo=OQb8k!!^FjpWp=Gy0BOw^UJG=>}ccrT-t@5Q|Ql@9DV@!KBTSJn|s4R%RVL
z<gT}djyIHLttMTn3R7T<pSFUg688%i|2hGNbg#=eOFqd+QypDPxus+^ym9hi+nB9+
zp4?bY@GZ8r9rbROfKS8P7Mq{hG`97=<a)^p9lO?zb(<b_fZq9cDKgQpQy7BeAihy|
zvFY(Qj~(gS{m%13mY(lqJ?AW0Ia8Tk<b`vh&kKHs(eOY%gZ``4=pbuLW!96e<fItF
z@4-=|xUxc~L+tX*k+!qhk(Lkny;(yqrL)A5)>luSoz`DZ{@v|ABrQJ$l4zGQ1zb1B
z*1o7&ZWnVu&*xcj&GlOQ7m{i8eu#JnXq8v#_jgW0O~`XkfmAw-Pr<Lk`c0ii1|eu`
zu`cPBv8%Cm3{oCD!wl*EN{5-hlB=Ke!#P8YGEV9yo-7YP3R&K|NlMqgzWexJaK*1}
zTK?bv?7v%SOdz!XTgiVF?tFDe{QoxB|Nl1EUlhz=)&Og1dUt<24A&;K&Bh<h1cfpV
zOJfg^FyIIUA%1inyl?7Y2rK|t7y(@se%AO)$oL34sr%g)&`DrhfS7iIPI`1q4Z4;w
z+eA#=y{PaVhK6sWb>*PAH+85n>qw%0ZFlcPGryL;{u1bA5y0V#Dn;R(byA|ea|6{C
zCTn{HGsqw-TxV*V01`f;ag|f+PF7DnoCFl$xSb(8@;xcv%n&L9j~R0TX^Oi0@(<3M
z2Rv2)E~X;}&(IBIs<d^v%*od=a)eq5ei1#Gw_NuYcBvmm#H~RvfqU8mGR^Z(&^WT7
z1C_@H{NZG9ylgwIOE!ZLx_`WJB0>9~8rA<V=7mf-@%F*36*bErl+I&@ufWI?fR1n*
z$c8++a#Rh>F1SuO;SrAYV8BAAug%!oz(oQHgD}$Z*Wh!5jYA<z%8<3YHLyA;|D|8d
zQs!&h0f!c*csx2-;L&)^*>^qET*&X?fOt#mv@Tww*<6@JOgiaMDY1f0Hr|R6D9l<`
zO}5;ww1#;r7AzJ%I<qDQmdo(s_2)5UU(-$waRPYl%~DeEUsSAI1{Gnbvimq57K5qH
zDXEJg{6+NuHV!nKpu*Wxwoex1jtw_aLCAIDKNxbw@bD@JI0!=&@1;^Ln1Ej88M+1R
zFQ^ijE*kX2Fw4qRR}$qJ%(%yz1i8MMr398t$^c<Oh!sfj`TinMh-llKgms49SfH?=
z7p&UW3JVwHn!$!jlm6zM>(y(jzXQGM3|g6nQXkLf={mXv-U44X2MQq3pkUqY1G&|S
zv@MJ<h{8>+tTxcc99&TofZ`69w!FF`C}to54Raj)-{8l$VAEsl2%#S(95#Zyq~QGl
zER7(S?Q92T&AVE-hS9U0x||T<L$v{afYXG>MsbMagvUmqB#qEDJ2<35lz`y^wUD9X
zp+!i99U8F@nPr6U1m2f2&Ta)9y46kH-_b-VC12=QNQ4Gg=f-ON3YFCP$$Utj$|M-g
z5J>6z{)ue{2t3$b>xk)I1lx=Q1GX8=XB9{&*g+Dm4@dn$`<D<ihOE=-g&iZn^e{RX
z#^@f!)8O<Gli94S;wD5h;P#Epv|$$k43U_H28w;Ku!lI(?4dK;DAR6!85l+&>!`dJ
zLp^W-9$r3!_2h93H(@HdjbN+;PG&kpcIe=D2Q@Nc7DRX!!;k~=fq|#W0>tbp)G*gF
zOG$LsB-^H4ZWV^iIx^nK?kMps@Qm#KRuKq$_CI_!^A-!{Kg?U0X%hxv4;mmdps}tb
zggsyNn3o6<2hES}0~OSS`{9IychaVb|NEZ>|ErJW|CZ!`OY&v6(f{p||Lv0h?UE_j
z^#1SQ{O{oW@8JA@c5oQQWW5tvIm)aUm<dE#<!2;S-PRJ2jrPhX!{&wVCr<)G{Qzy_
z$|W83_nXT&`jWnM{b<bzH2vx{?m>T<4Eq@1!kwFAcEQSlXx1O9%aCED=~*shD9&<X
zak8y5l7hNd(xtA`4><0=!7Mz)zIZOQnB|{&yKXdEoW)4XSB&f*7bRWFSpNUmd(W^a
z(`;)PwbfQsx<y3{prRlm(4sU!f(bDJN)XA~s3-^}Iaiqzl0-yeDIih6L=I&p35X;W
zq*RJ5AVsXApuTmZJ?ES^oH_IU`hE;oU(TpVJ<lC>SbOiacDnU`GHuVcWL7cNY`uG<
zf*xzVAOreOtdG{AFXRkbx&Fb!{STD%=M)|afyl!&(=9m-O<GH7k&BEPZ*KHG*7b5i
za|VXqH5}Sf?oQI?wDFJWF>h?P260Xs#^-fAihP(JDvP~zttbY=E}V>})l-?{i{jXg
z5l>1<rNq8ch3l`a$Ivf29Y4^>p4M{1+2&$__k<-#hpgNJdp0DcaeA|N@15artMSNZ
z$tCJP-faEyc(xg;WtVloiT!8h9NLK4Wii?IQ;UC=MD`XQUP=b<FaK}jZT~>Y2tN+E
zgQHXA<v%JM=U!WRAX8N4@;-Bg2hQ|^nRd&^vp*4$!;rix%gt(J$HG%D4=?$6_dv*u
z4I3V!%KmBQljsKz80aN1+jQ#djVZgCQec}{iYo5it%aqULf0$1kGxK~`?z5at&4Nn
zFUG|12R+W0SNH5z`zRc7WSFGJbz7=94?S=k7(-IMt@rwdOzX(Zean;+P!S?T7LmEO
z9iJU7TK5E9?f^kcp3n&i?QNC9b5Zm8F0F3rdScyV@ngKmq9(Y;tI~Ai`X5hv$=~dK
zVp)6We^XBUNuP;j2wm^nT(gkA2ZdXyb#-Y54a!`0HAVJ{E_csw+8Lp16EZFe_^#!a
zjIT;}Xo}NQTOTO&qpG`C4pm*A(%GffH+@%34cx|+T>RT7_uam0u5=WMu~FV@wMqS(
zKxL_Xs`jjlDBFwuAIf>pXO~jk)xPi0A1NKkV(D5f_m8AUHTu@F&HB7<^Nur4bJCup
zYO-{+y&&mhHLaqKA0a)JpCyu3K1OL;X>;Yq#c`$Hjz|lRY?cGam-rVoHfb>x54Yv+
zby8ofZ8cA2y9><0e`RF;8%9RDd|52@{gW5ptDW8F(2JyJD;;mHbn{J6J2cU`?c(fI
z8A6`{D5Q%=sB#`TobsvYv(;|2t-HT`sq<iQgmk9etJ?d&d&R5`=Z0?U^15>MYN(wg
zYt8|M+|PV|Rg-I1eVH?gyy&jLcWSUbE)1CUj8bgtX8SThpR)O8{@o(c*YzrdA4lzg
z!qAJe3v+e1>H5c%4*j+?RXl<vlo>lD*>B-*suQV14du;vf9d~ps)6TVG|ke3Q}?p1
zr_oLHeTo5Nt$BX>`6X*yJ^DkHW{XJ2rVFzpGXcnj+lZtN4m(RE4vKxZZtwWmQR%zW
z<-~{d<aMVV9bNMW?bT11H@tnU^=w8!=ew-E0~an0feZp{kC|P!YrPN6R9WowC!ONb
zKA~Br6KfqOIX7V9+`adzLtVuq%Rg-BO27P+r7tAb&~x>g5Z$-Z<Yy0noC-gmOCJ`i
zroO%1k!M^M%CtK%cAP0ywop##)lPq5)nT5c16@0;{SCFbBhFYWu{q7q4LvK3dDf4U
z3N_t&8uCsK>}2N{X6t?eNmKqXW#j2nhL#KC^5-nB;Y0^o8U0@vXb8D~YXt=z0^TE^
z+?V{hPnkPDbwhQI>cdRyzy3<`*<Z&im!9ki(DBh9@PE>D4=f}*>fBhBpGF&>JZs6T
zzkeVfdZVPdh`Gs@();{JbJ4f5XiYauCMv;pXc+)o3hRkww?abMKbU!xj_Obvb3Jih
z%BPuu;wjSE=3Brcu!h<67FaopXc#2(Ixp%r2ni>uF`{V)N-0YWO~MpmYo||gL@DLg
zU6vdYtJf&9M16mQz3Lhrs||)4tGZwh4TN+a*Uy>ksbQpA?iGu0Lp#a}*oEgTacp2*
zkxs62-$B1@|A4HqiywQNrfc?awiccEzp+OBTq5)i`;PTw11CD9WV(EuKG<FBn^9J*
zRYIvpbx|YT(v#AAqat@>tgV@o4QVWT+EJ;<*c`$9+Wo4+bfeGT?xn4gd*pauf-I_s
zqh9?lB!><;9*%{jjO2%H-0m<xZL?(EY~H5IOIK&vZA{qFG8D8~LdCs4t4XD*K)-1J
zk@0S|SIJcr=AWa7Tc7nyA8^aqR~lXDQk5fizA>3cS{Pto_f$rUlC}ln@RsUtzRkR(
z(<PVvCTL*C3lx<rOf+M$0P7g8-#Ft1IufmJ^Cx>8x-K?q8>aQ={kOI9KB_l#SV5mU
zs>xWP5pgivA^P_F_amhgxqpSK<Y$rD?X{?lA$8n;C%P+an+lHnrN2P#;cmYi?o~>G
z#l2m>|3B0)QELTl{O7BQbjrH~J$|*Hci`=%7nlBVe7B$O3$cvve|>p=vCj2hr8glI
z)9f~-{){pDt}cyZ&+3~*?cy8-4V=7r57@Uhmq%0cCbCUoLH^~EE7(xLNfMH$6OsR)
z%dUkzy=<1!Snz)@Ke7@u$b@XX!WV3w-wmkba6%spTqtR%aO~W<6BQ0<hXctTT4_^y
z{(2b&Bhbu8$NV(9?xS-ZydP!$J(%a=29;wbE9mA;Akypp!QBkWt)H`h81^ard-m^t
z1QGsZYX(7IK;I$exTIdEMOb(^2dd4Ozq1274d_#=wLjeq4qho@gTWvS%5X4!<9pf>
z2qzOlU+Cf~6K81=q`6W7-LDX$)#}x-qH^w)sbS2obTdZZxcINs-yZc6%rua)h_(%;
zr-){t-Y;MocH!QV?Bijy2T&{kTQlDh$1dTwp~jZU{{r3ct)QS4+V9rKP23wILpJ}Z
zph4#KiUU4jW{}t53dkEX0TfIbe|&OMf>y8nDZZJOyMo<+Lr@Xr9n7aWITBJ*z}@a$
zwYw+o1m>N@cd{LGp??Xk)^~g5OQ*G9tH8<}@yC(pz-Lk25U~X~oz8rRK_M{LkC5U4
z#-j#1s&zHzm2B3utzFA`yXoY+9pX-;1sl@wuAf{RlB+b%@n&rK=kpDu24MfuFrY-r
z)%!kX&M=IJ0Y=L_7imt9GCU!8gT_FG4mOwA-DiA`M%QCoxKn_YuUWmi<XEsEW=+GJ
z@>nM?nXhV~97kn_3(Bclp||J=Cv_SSfv4*^?+2PsbcmJE0vn7%Ri!PckATTzFsp03
zgorj^Z6X+-daws0oBIDs#i=^>6`4W&<8bhDqU8Xj9P_9c`wzF0-9A}y3P-C(XAb5o
zOYGUG!1UIoHefWCRpqpU-iD$Y`hRB#i8X=G040~>Ha6YD%i`tsf+GQU24XENAzj)D
zoITov&%g^QsHL|Ie$sB{_%Bt$3H`wg?uG-#`U+Ko&C=4HI32t9?sXpDdKfh$_OEXV
z0sP~dFs<M~UDT4&bH2_V`k)Oyd33h^vySt!u@_RUyYCnUEK|7=9Q;g(u2xjQ(E-IV
z4f5Lm!PDM^BHPS4iyz?1{ypfsR_Ra9c`*9YA&&K<96*?|JO_@W9DsojjMFZIw8q5v
z*wD%_*+UOjNK5bTRV0@u=rKxFs{;joj+EiP|6`==e^@Y^th3N@L0fO^l{?TU#gUb#
zwG&lu)Vtg<%1UZ1%T=GC7+X|Ifvgo<n~I|9)l$l2PjmE|s__|f7OznHlg7&aS*bA3
zeK(Vk2-ewf(lF!pKjw-5QA26Nn@cd3(-}yiTFb`<J6j&}vYcA?V5#PbYc%03Ulo?(
zeijczM=X@%p<SC4s9GMzu}3IGjML>PR|wpKl=sB{(?r|9Dw*_i1m@rW>_1eb{=Fnn
z2m7zWTK`^>e=o^DmtXt$Df#y)`S&RSh5f(1>A$_{e<M@*Z#(&KJNa)r`TtuxIjX@J
z>iy&mqA8L)iYml|c@QwyTlxGqdK@Cmf@B{JZ=e_MN#tcwm>PsArLDs5<CA1fwiyz6
zAYo87^!Xofb^V~I@vYSWc2V$OF&+#fLk>z_MTJu=PK$yDJ6cLX@Ump%@qK&tT*GfL
z2~XFg6;YoZ1A~sdRgn*#OnCl$kfg)~s&)fh12z=0)QogJvL2!5&=sx4R`j<qdw?GG
zG-S}J&wMe9Ui9^v%wVE8^34_he8?O144_<402?+vj+X>#6N91YS0YyT|JJ~IHdFjt
zQ|<s#VVWZo`ET)c(HgXB0u0MA&vn93JolHGvVugS5$GBIlMw+K)(Xy+l4B+y&iSDS
z)hfh}MWZH|lSI)g3h2%kOvDXI2Z$gp*#}T7^^SqCp}RIYr0IQIWpqA}2;Xy&nA+C#
z8U6n9<&NBj^(K#YhzXP4(EL(}!?Av!gdBG0YTl7%R|m_B$>nvd8t)_mJ>UWVXN+nX
zN<tY2U|#vamQ>O^3rHSMw$`#BXOc^(bRjAk_%n4rZ-5Bemiug#D+witRdV^)$iPZ)
zL%F_MXxt$Z<qE+t4B^U^gKwqhyq^TmB_kMoNc&lFEs@^-KIW{i9U{x5#BUN(#=#oB
z209f0@VS3Z?obDPN#DRZn<BqvsiNOmZ*$M4Au6F<;}&WMsd+O1_SFr=Eg1Zr^Oi1l
z2U2@^>(TLCE@vRVgp(m87m&BUs6ZKDZ0)Q5nqz=WtlrW+rp9=-g@d20Q%_eQcJV)-
zs^^aMW%LF2=CsFn4|)gQ!E*5j==@sa-vk7HXJb|$j6ixcr>Vca`p3+;uVs65RFmtN
zQ`n9gs%p?!O;(d9>Js-&;tqmIrMu40?2-K`uU<9=wK&7=6E1&@gkANUvBsB~<5qDS
zBe2?4U13q1wdY-ms$qt7Z=H})y6R?OMhZi2X}5R!Fa7q$;y3$-^B>PP(S=&&yeIsN
z1-0cE7N;GPZ^zq$-~Xp}z-6Z}hq8zd?nfao_|?wWIN!c~k#l{(o{DjkPdnmly6&Ew
zcr9*Mr^co2svXU`rMBr_+r<1FOvR=Ib$<zq7Dfd)k!{vMwZAp4dcZ-74CgI>W09xo
z`%c7_`Lq620Bi}v053!=J&u6AZLdkjj;r&to4xG7?KOnef~KD)Hjevjp}?76IcRfr
z2dlBB%0G09N+X$N#yQ!a?s)B1x7BL!s^8PKsAhC*^a6M8(kqwdMz~$KZ<eWo;!lNl
zz3n^6^dl`7X3WygxcoZp>y5nEL@Gz?nXQy-;K|x2)bkfEVWj-j&7j&sH$zLIOw+-X
zPmlDz$-0jZxKs%p)`Y%7)K?oLk7V<>0A|_W`U-aSYa}0f7Bq>rCcIDDJucbPwWFoy
zL3?#-?8z}zZSgQxL=tnqSOhv8JO;fw7B{X<j>%iML@`w)lb&We9B|cc$di-UXYivO
zSb!#L!iNcpu=Imz9~0fiKoujyhwj-JMjOb2py3<UJrL92=w=i`7n{Wp5QtJ>C%5A}
z#|-q;6^}gsWjuV=7MCAPMI}(u+|D*bk)=|#9WwB8i;QI44p!^m+pA$d@uf<W&kNDh
z;B>SE@~NMgvlptUlcId=t7}cJBNmjxp?c6O4OeT6g8+8C-D<xn&QwMF=G6BlHguCN
zo_<CF`&!d#4RCBtYM#u0Rdpq+`^%|Zu|Zw=L4J=8%bjY5LpNChdax__`Psm|E<M*{
zFUseQJ_jk<HnF7EghR>iWRyY+AHEN_@zC6adB_6xT9+68d?=yD2~`sSb6lv&YVb|m
zNHJ7Is5T2^oqCw*oT|tC;Np8QI+zoGd@MaTZ&&qm9I+eGo(HR+YfbR;owPuOG<bej
z5vI?tECP8C(SC$9nW2Dyt}N%<V`v@{i5-<$TWbFol@^Q^CK-YJ2~3!wYY%)aIJ52I
zM7z~sY?-Ld0(_ctozcpM-6irx{$kSw7pS#IIkUWe11Cg-_V2%mi_@7<CxD1+1aDCV
z;XlAYi2;OjHbXckc$L=Rtm;I3u+y3nqXVEB1CM%FT(!1_dNc$T&T1#jw~2PWHPWd6
z%$+giX(=e8LS_kUSq(a>&Z?aPK~juQ18-~WxfK(h4b{Ibyf}8u-GMQyyDz8jVa@p|
z=TZ7c)xa06`du%6Iq=6W#<H}*%%?-2?+UHF13FU<ciMZUQ}6dD>#t#(1r_~1+joU&
zr`_4^XWPZMK}OCeR(uD0E@!R)zRnn|Tg|ZWC=C@-V>gvkX#KoyzW?(=-f&o;+W5!m
zA{LepKA-HGy^`_aKBh`w*wVSXrabLag`F=B6weUf$}UDJ%WI_9x8B62lQCa_T7`!F
zKMy|@7+-ON0@F>tqV&PAIZ>=RahE<mb0ULPqpMj62F;7HhDUM-oB0xB*JRR9e0a2m
zQ=yBleIk^J0*KiZfq-r(LwL1@8b?5pC4<S81c?Bm4NIW<c#_^yDS9nUU0~S@LHUBW
zAX)ZodMmVwbBQ;DeCAW>IuxGz+!-rhf+o3|h<-+1#J{f<2MkY276@TVX;VO`<O3ml
zEd&%^Z<Q4xRgIAfM#qSN06XZi<U<r?#*>1p{_!3tmgTktY<98RCe~o-oo22DQYtQY
zDn8GAJ9QfQ+|M@&s}2H|`)0yy4|b^(%-FG_>e=|K)ARmbb9)#-=m3Jud2F$m)5T48
z^@Q1tYfFAm(~ciMXvI_%As)d3pl+C9nz?5}FjoxzogNdDp0NVo_Y{Q3_@5tNpW|`#
z|Nf1D)X&YG`~&5aKcAlb?&<EIk2(2Qx=SGa`S;i9cPNqk{dFef=Q2+ILDZ)I_m4UN
zd39}mCvADR@{b?>T^s0tz!n#f%@D@DZoD1}iXdXev`W?O4cqCH+b1BvBhuhccYinA
zl66_*iyo1RqpaB?K5nqB`DU!%`7zePY#bIs%!z6qg3m4n2$so+n1;48LNw5sm0uH)
zw~XC!6>MzndEM!DO*s!WCJ()Uz-T!Z<xI$7JOD<FmMJ+jT{wffr<_IJCeVM=dD=K5
zM_ykSZC1+k=>G~rq>d2&6_jQwqBk2ipYt+^(+;#O^6`WMw}xo%W>9;AX7cOTudq=@
z`EK?@OiZs~@@p?$A_~(x3!%}vWj`W6(3hp^O`Z|~feFZy3w+K1r&A}QMNK}ZYU=da
z3+4oA8s0zT2$C@FGTKWp(z${?%ZphHAqFLn?}vTa;?<y#>Q2wE97}*c%VRPTq|lU&
zK`l@@E|596&-Z34BNmT=Xu7ujSE-dNzubRZsc*B$$=fe5up#m18KI#GK;XME=z<8Z
z?!;JMgQCP|ED?z(HHyXiOC$n2lzw-q))GO%k-YjkqZAKD>2AzGb=CZK0OeL1sPZWJ
zJz3tpx$T7S1gt^il0pSoPvZzk>U?qX!Tlbq`E&}{>Z?KjI;ise?=!l>iW~u{tp^Vt
zytgORrQ+AMAVx!VdZ<)NQcB7OMPo1m#ZiUDNR?5eW>$G+<veLmWE<m%>4!?MB%u^|
zOU}ZSc6ch0;R1JMM~L2Shyl!jQsR$O7OaI^6txV8ONb*GkGtA~qEw9({mk|2*Rj!r
zjh{QDE`~<~sV$*RdORV<@itB~HNtq`IClyOVj&SZr1IMV=xP{h{$;4r^Q0!_U>aA7
zZ3b@ara#{VMjNIWCO`7wIQa&g{`-!V7?V?5T8+ZyQiq(aGyTsX1>nP`a9P5qiTLDD
zH>nWfvq7UdENzeg^^)$#6ES!!$aLM3HrUCaZt?N)fj!cgxylyjQ^dk0c;e}TwWqP-
zG^{FZ6$1wm#1fYIh_j(N>iKNC$W5$<gC>#v>}M|cVPymazz{k^Kv@OS2>l2?JMa8{
zx<*H7=-USay3bThSq?oHl=sNL;s~V&u<okK$n2#LjgSdKKl!3xIsKQQWK=CB@lN+3
zb+4Wt9qts1PwM%|F@~5J+9$O0bctnun-KOweC}x{jJ0(~Qi`g#N_@u8=XIrK43<hA
z#>qcIW5*+37{y<DvPypUt!F+)MH0%tZ+U;bL4s1YncPHQg;hOATZsk<nHW`d>9|A0
zI{O(1Zu~Io0%v?CcXktD72PUv2VAQV$JOk&djBUz1>s~<8pyaKw$EwErWMTFyY=)M
zY{u1LCi?56p+-XnA<5<V@n&Pr|8?Vb4-f@%%$4Sy{KcF|hPr)wD<$3l!kW#lT`nI_
zCWagPwD>DQ%3|M8Y|iI%g6Mj1UbR7f<3?wQ#U`+>B9M6X^5v<<EFJo^;4I`01sr=+
zcDXDcP;5;e%`HW%V5)T^5DpvPKXgFJ|IA*w+@no7j(FetcI7ObX2UeoI#%{fF^@aY
zoyGX10co5GhOo<EACr&%1n$BB(t3e8Ih!cQOI})zFmM=DTLqROddp%sIdq)}fixQD
z4W<jkwcZWs7VLV^4ohQX6%(zI5fKqFF;pJi{={9Jyz#M-a;+f0$K+f!W|v<C>#@l2
zONM&?YRtuf@wM#)wY;qCM&v#7@UHq*#u@vw!*Od${WVuL{PE+ut-3;v+DW)ieTW2p
z+B9_!MqXjo(K^xPysQx-!@Ugt1a>*a*rzR=^okhZ<|D_`Tdo4V+agX|BtE&@SUC%6
zdLbws6B@4~LoOdn(9`(SvxTUq;4QXodk)9SgPsH-zzfuz@PNiJO9<SpZ3tfB25KOV
zLCCyumKh(#S7zK}TiTxCeSrpeaiAxAol~XtIB3qbnj^RsHryw71_uW*Mhf|-5!@zk
z+^s$c3t`!}q<?`4Exq{3Eu~2M4=E`rENo#aY0~)qTyW^JR1i~R^z(VpTQ5^_+7Z1{
zKG(%lKB7R!b75|6+q#8}vAZf)IXcbvaM5#7Jtt}%O}om%<Y^5S?w?@E_0)$9@%H!#
zMI`HZ-Y(}KM}x4~!!B09d+dZBeB{n87<5ITlM9M%-vH||kgyeKvBpQ3Rh5;!Z|}Y!
z(%S(Gr1j$gEZ~OKWSl+)M>y8VoH$+-oDTLO^c7;ZG)03$v;UNriJ3*1>E3BVYNr7w
zV6wN4trP=egn(9)gtitp{8m7q;;SdR%;0t`5s$Nn#i0X&OjOP+YaipTa8O7HiKa10
zT+Vdbz9n4Y7&=Ury;}f4BtbVC8s_6j@4k>n#*Vf|;q2DH@J=9?$1v_ry8L0>5@OrE
z><AZNt9}VGt!!p(GRzoJP3z5R2>{pkBWMuV(0#MaZ{fn0haw5LDSMU6y0Mp~Z=8Bi
zr!v`c4ZY+TnyJc(F{v{$PIfoakn5Tje{;Qwe!5Za?XE|xHO8h;^%#s4RE6KfbFuWx
zyURRTk4k7#`)&t?hbLG4Ub(xJ0^@$&&(Hh&vze{S^E+bwSTiIjk55#`It|UvjcNTT
zXOvP4xo=7FJ5Xt-;Dj+6r~mMwpCM2JLqCXUk$kF+Kiv1C^&S8@qDq7oo+9&|(N8lx
z_wL#ibe_B&HYFi&(c1lR8CdVs0r6t=LA-IVp5>W_gRs1N=3zMq!NOc>U@Hc5`B$KB
z@eR|z4rsO^31Q^sbQncUCNq5oD!4<_G&rmf;0dW4$#uX)Y>H`S*Lfig53B|n$am1C
zlOVE$`O*V62hnSDUr$gO>a4BL%lgTwME4fN`jX7UxlgP^giLUY5T@K~K28lPFFIZk
zfe}*+ekiRhzpp5jY5o>XE3I7lgZFQ1Xk)5%S^$4Qm;V<PwAk4`3$WW4$#5~_D$}6A
zqu;x)FdNj^iQi_PBC)K1zzRS&2(+XD;xYLX+1X3cA$S_=$Yoi-$Ns^mr&-<Iau%QD
zO(tg5)YUB}?g!4ezDz~Gu<Riy4So6JBiyDbxS#fcV(I}yJ^LZ>UDrPLSgvUFE2fwu
zF1RfNpR|(^T%0;raT@C!(QnWNuIB)Afm|d(@7MN})O6eG*o$6vWiSPWY5nH}<@PgI
zj(}u+5ftOa)i+>tcK|&-fqY+UT7>y9q~e<0nZ8{4F#`k`660;>h-w1n-3O{Pt>_Ym
zp-k>c+jp<Q3J2)VQ$a!_q_xe86Bxwkz=;GmyFb<Jhhh9KO~SmRAAwFGz^RZwWq_9-
zAmZ507dC<*2!T<Tv&dSKsts5;KqWxV^huHiRs<bq%lPi05Fh73hN`}O-e?13A`=(G
zdYqcsS(Dg3Fda*YOnVg)$%6ns_ugE4Kw*nqaDm702OGNMYf-L`n3EbLSlnq(4!`FO
z6O8iE!)@tj;d1wjt7a)2D|-TS&B#3y#FOm%j+JslB+wmpUKb2Do>f(Fak=JQ?Rs6p
z6Ajq95qSIvx`pTb(qmST5Z^AOzM8g|sE&*upv5`DGnQ^ukzVgQ0f=D-BlnI$6jNVc
zpM<DEjb{odBwd>>Vt%@GO<0K{twOQEoER4y&kT63WzM_nF7KXbChQ5ll3dvz2j^+v
zkAovCYmX*H5(Mp;SB6JN>PF%%m?SqCv2Lv0cgX9(+3ku3d3hY(szZ480uRJTi{#9c
zbZ6VWxxE2n+coX;JkSI<bn**CtKo+%efnPos<BHT^K~;Q2wQ&{{$-@2Iu4;U2GU8~
z663=zeZVwwYqZZE?-ioViDa_o`{HN7!rkQ@b1m-A=jfF9t<-+0Inf`8JhcmQQMi<P
z>x|QVVCkb_1i706H&!aQAiCG1^3LqY{f02a6P?T%xor_R{bgeYB?I|P)^cKIT=8$n
zuzvE9QW@lVR%8*wnIN2Gr3iAihOuLqE;Tyr0I>2)uUXTIbL{jdhvMYKhKyl~aRwDp
zN!Q~UrB>*QY$skfTkyvLWRjp;_YoTOg8GUO;^%|xHCAt)l%(YArF2jbB<ht^ELZm$
zgjdPXTf6@b^aa4?@GkLU4O-kNyv?vi6Jtz%SIzTq@DfDzAe5!yoPYvygF{meVlQ;@
zX{=du3{l0{NS~gLjyl3z;N4X04!8wK9#tKyg~-&tSzL4UrLf*I{?gCS+p_0R;a<E0
z9$-!A4H0araSAACzgmM1aD>4hCz2_jcx|pP<|@^unYr^u`<?D00$nX0ff&X9!y_%Z
z&u_vvk`ezAr5CVw@sKPc!rJo6p2(V4(T3omh%BLTes*}NHUkt5POasebGsHFynpB}
zbx&f0bU6|0WSbH;d}_1+=L(uRj{<UaGAJEW0-c8kS_wh@o`G<rB%@!(AmO?>pX>AU
zPA?~SdNo2KeNF4P#IEAaGxRFASMuTLIv&p`dx`BCI(b%nWCY!%oi(!;kOYS?oSytr
zn{Hu7SNwcwsl)fz1qB48f^!0df_vZblD7IYq%T^&e%<!h8{82I3QKvq+$rjSDgu)j
zkFQtXzkd%-f_+iSj=fE}n$zDzDp8;)PJ{^Tj+4ql#q?z|3^bxzI2rLkih<KsZBrqk
zqGFOB1#R1PEZG7CFl^)Qjje$&kmL?<`viHs*Vq8_bR%E(!&28I{({rC>`0$|AmA9s
zR#-5$J=IbAgeKQSk_K<Y+=FYk27>6Il8?A=E&Lq^$*OFLzo0hq%NfnHBo5>dm@sJ7
zyC)|Nd`-oG8~J{{DmBQ#wS;Nf{;>)zq3L>pm`G8nZ+M0Pm0XD-&Qx5XWMbJu^in|j
zewlY8*AGPsBFW|P{f>sVSaB&CmdGFL&4=VuH(ViP3Jx)zZ}5<(?xKchhOIN|g2U`(
zGH4{`sd)%hGcd<n!9&4c?zy?Py2#htH-PsL91VR+(lJzSCmmNDX)7|6Z?&v!xKkRZ
zH4NScau7y?`Qp;n$mdt;aDj?O|8eA;hA3Y2j08)RuI3E3jC#ligN1)1q(guuE$6r2
zd3pf(LQr6a&&`WIFM&No-MA5}HxP$D*i$%K;7M^hQl}LIaPlhe#ndy_lQ*+SOx>#q
zH#=|RFFr6XC}cHA@iVZ?O<vt;T%WUfNFpSCO}8MhLl}{)C%6Bzzfv>0QSWK=&~yMG
z<KgPs1xGvL0(E)bA19K4|8+7X?*O(Sp_?N$(fB<t;oJv!M<q1W`W9)f!ibryDc+fm
z1UFHG^9$H2)v%%5q4OGm^@J&VY3Iy1_K4I-BWi981X`O&?)@WyzOCxo<stv5V4Bm5
z`bjuJc?0|Yy0O~X9EK)YJrH%22sbx6<o6J!ir&2LW*UDS3C889xf*|f*M~9QLt!6S
zL@0mB<je54WWC2RO)ennt$FwE-LzV905~d9uwckmIAHT#3(actqntj3&Y4F`=X)A(
zmkCU)AQzAoBDEU!ry+XfXRHBi&3(kVr3NB>RV$bMad^wF&7wg13P+k#$(o@mH#p(4
zCj%FbM`|+df+xV6qaiEK;|)|1?~<&5h;tahr&APt?czTfrN#rKojv0`zsdLsh*|J$
zeAJ^L5*e$fu>puqkd!}H=NCip9RVjoe)oAl6}X7iUw_4F*qu=mG6AYAKJEd9n^$8N
zF<;^Fe=gS)b^#3d8qR``kB;pv5mF9Eq=IaK)y=7y$`XR3Wwf4L!Kt8q%%=2>Zy}->
z#hhG?ER;tA)n@hJ9*&$LLqFd>42<dx09-U8(9<iw)V;ENJXKNwWJ5-4i0||{fR<&B
zX~kM(Pe4ouPx8C5=bNT<0ueHW2#m(c4rER238x&H^qf^2HXNW2GXQXS0nzCim|poI
z-<{%Xsu5)K7f!dVVNwvcn<ZFNEatth=y07>`|p1;3i%Ub5GQG9A8kR;I^6qr%n|Ub
ze<+{;j{<~r8qRa5qk20%N@!Ub1qPM)jv<q2tgJM>F$vbCe(VdrZ3U%WnGr5T?8p^l
zWK6_fBz3?+U&~jYo(@3)T!;>a#^K5+m1ZkFIV6)*cBFi!ed9se^=auv+%D8Ux@*|Q
z4;{2<U+XhZeNgb6LBu`Erx7M31O+~@JY3dk)^0m<^CrYcY4WGfPDR`sq2a6g9}5Qc
z7bNhV@*k$+COG>>6r*a}D($a&-sgxraoc9uy7WaLGhf2)(FR|5j7G)wBC)xg(h#I{
zwMah)OKJ6pBeLN{5!55juR`XF)E*@+GNS;Wg2^t#^$J6p7q3DfTMcPsG3Qy}k%30s
zu6*AyH{SqFIdH{hB=S#CH#@O*mGnIfDR<@3i$_INZZgrQeHt+WTug)mD&d1CX+ceg
z2hC<B0Zk_|^e2fars|P&=VaJ~7uRqW=Tai-(*^7@8SWDS&n3I41NQ*^bOt&;g?|}H
zq|b@TA(I_Q=h^X@$e!8Eo&HM*p%V9rCYjd(q0$p-!+BOhs@^;sf+Ez8LfxXeeI8F{
zCPrC#3y}qFDMH*-T%p9g&p0aRfuh8AYV@Jw$J?OOm|no%<9g|FrD`{Dm8LBFNR1EH
zKqb1=%HZj5-MZE0>m^||&jD8vOU7L`1#v>!vf6g#BgBwqxVP?oQyr&00z-?W0`=x3
zRLWpg#*r$PS@~iI%B)sfd4|bZeDvvt{_?&)fDD=u%pw3|EY?x1Wp6x7=>QOkamlII
z7RhqSX{%wM-Oka8vGU~iX>#6XgL%v0UgX3b0%#PQGD6QFR`3_swB##Jt|j4DhwHe@
zh|w@I%{rCL=L)dR2CwX*cEkA3RchLgrALSthosmB)ndpIB;jBqs~~oz+g<$*0(6J~
z<!Pt@C_DX*;GUdSeR?d9&u3?%Zr|;z>-72Q6wcQnl9Jf0HF<OtVFJb+GW3RT|7joL
zbI(q-hA}aeft&)YO%yJxsR@A1lxZ`txI3e_c4FcCX%8Q)>@)K6;^MT5$eF*#K}1>s
z$TPF~iQ6icph50+OuT`&+=EfFh^SM->?z-5;?~Ic7M+2~W0Ty#vXHAp+kfiReKpwz
z%9_v3-hIpeJav1*jw}N&1`$dO#Cf>gody?qi!xW;U?L2Vqy<mN2rdYMh(OU;x<*gn
zA*6tCG>ObTTaX%*P@YN?)QjbZ$N_pm2DH*e-vep9IIMMZ`)YQk1?=9N>_rv;njvd9
zCo%w_E*B9~G+c966#LZ)fEtqqx3WSVSv(S`LeT_NYXB71O7X=!DXl7Xq)JEdfrc=)
zNVvGP=hvu8ibbAFE@|qRycj><b{lnlqIn}b{@!=`Uk*>p$eIRONswIrvofyL=ke+V
zi96wBhpfc6Q2oSyFQt6ScjuF=onJO}Iw|ixVEDGU!^CzVoDZbROkpQri4}dFlvzrj
z<H2+)z}^c%q@l1=Q}9}Vr2`A9c4s+!>Kc#9qD>6Yp$Ex*!iUMqLe`4h<WTfu6u{Zj
zlSVc-lDU>59}a;pH!fIb*n!2j$T}5{Lo*apvXledhvka!_^*Lsy{PPWD$z`&>tx`l
zGkgAbg4N?p%Yef5?)J%jV3xYUSe4hM^CijVF>GLd*lV7s)u{cBjW~reh)-sp@9Wi7
zpHZ?v=`O8m&>P-HoLz8(w@4l92mHRLKCO{pZJtkwTLfBEE^9?!h60vyC-E&j1+T#q
z1Kyu*B06K5UBVR5;d3TG!76KCBMh9WI5a8u>7C~xYlWC*f?j2Xj;?MIFr2}YXS0V1
zuz@I^?lT9=g4vh?z$-(kt&V`Qn}Ba1VH<;D;s7+YN{rL3eEPL8)dV7C0!AWdv2uL1
zu+1z2Pl~{T0pZRevspoV)AY(`rn9oK!0;D#2%RXtH8fRGmWmM!#31t*vehFc8>1n^
zuv~2e`x`ELC@JEN&?0Uoiec+Rl<rlzOfArK(+Xn7Uao<WSdbVWUt)3C^(j7=B{~A|
zd#LnF5c5n(0K(i7dCZ&<b(2A3`za8iZbbpBuI2_F33=p;!RvrU)a2wU$GV%gK~AFx
zse9L(ufW8i5_n#9cg%Smy2kkRjg@Z`7p^@G??e(PAnaXpiWQt#B?xl$7y*|H=uQQA
z&W8^lqTV}B&VlqTpJ#d2#q&Ie?^&t5Jr2Zdp78W&tOR$6h%DpGueB;Fzzxs2!2}#T
zpIvL}Z~-^B9bH5gUm$B7tj&^8^kg3$S0aaB`2*5)Qosq~Ws%I9P2YyouiKtYBKas6
zV%@19Ag!=%+qsDp+0U_la!XWQlDO%a$di5hUx~C`eJh*YqyQYV#m7jh%7$g)@6(@H
zNy7)CZ;XW_>2$-#|9yd{GleQ+k@rL`Q5AOq8Ma}%xd~(2ew>-ITe6MF6l#V8tg$12
zAtE)Ae_VwsiRk#jsR+|gA`JO8l3AZ_k&5CHCz=T*ig6r`j)CdO;3bIWmlOd|AH2s7
zkO1m3D;rKti_S~LM$Y8;^Jeh0Cf}sAtZa$8*Awz4KzdV+QtOF>H}rg`54GBm05Pl%
z0Nds5qUEr6NJst9r;;*2cda*JC)Dcc9s;5Ws=(Iq>YIp()ax^XH_o3wpA49d&z{0I
zYD17$gui(6=8dptFDsE(kA#CFB#h>ScZsdjjM<S*^8x?GR*9TOu8$N)k3I*F{q!%E
z67i$#rQby+{lf_?1F({_6VKDOoP|x$7=CZvW&CIyLO(!eV+cBg^fuL4<rZorBb_zH
zzii~J`+ij_X8*I}NHPe%>Zxl4Q;hDKy_Ff3{fE{ayq{D_DS!tdBVST<0nOHI08EIy
z_5%|V(&X)@-x7jKAdb1|=nJV=q(`7i<U6jQLCpEi8a$-Hq4noDvYR)1Pw+T6ifLAi
z2}CS1RqjO-Tsw|4pg9l++W00s4cRd+75NQ0*w>d=0qKV&>LQtPUga4<q&E?zjo`J@
zpE4#K%7xuLx2fYGdY;FX)!Dc2x?oV^adtaq5>X2`&>a`no3D4l`~r5U{PAJVos!FK
zK;JR|V&mEY9`77yY-?TeR=nkmK?sv|&U+xT>916*u3ou~l=@_e4EF0(T}o&Z8wK<U
z$T622Enm7c^5)G=NJD(MpQj!q2^c%r=iv}+=mN-k(0Uf_TF%zWimC<n;hVJOEPPou
z!lf>w0Ij0WA@Y^!j0vxyb<lRbsYH?ymEA=#1Jv$DbhixwKe0J}JjM9U-eyCfGEh;w
zYqjz-I(K?L<!5UYU+p)bhPZEMTqXWiKjs=t_SR<JFai=dUQ@cybKR}f5UFsk&lD%K
zaZ)s!4CU6lts98cP*HM6s)Q=i7!nXVl4OE0#+a4XJVD%FUbBcZ01Z1X8c{GNY7HqI
z#+Zaz0X)pws)*Lkm{HPKM7c}jPjEL0c^+J&H{T3QkVqOxha&t0(|5!I3NLWy!}-iu
zDZLDA5~;|;W+b9bf}Ey;7i^bKTo@Tp9U@fl0e)99aKe+{3Mz7sRg6c^f)c*~YY>HH
zFjs-CB8ew@GKgy`S;}kI<eLC=DxXF!3TFW5gj7{#Yb}tMPE;CCAeXss^7u{0HGWOM
zo`VoNEP|yNPQSCJIReTqovEd<$*GgYN#@-neMbapCM1>P+@24Q6LD_1*2{uulO;As
zM@K;09FnQNw+{5=>mBnfq5(fDaa1w#9o%k+!huGa(|D5Az!ycY!46cklOB^QHDR0V
zu1mb={D|F1tid!{@m9R__TJ_AQH6OcOCNVaVcf#2^BxVAm0lE3umb(qg5Xqc1~25-
z!zxHdSBRI2+-J|Z3y;pV%RU2af`T(0Gp!>G;gP(L_h83etM>OSyCPEd;JQv_iTe4>
z5@QRmbRf!I5$}9X#uy(wSPx-MN?xZVu_ki}uPS$$)N3X9A;pVoXK&gphaazzYCjJX
z1$q!%KeL#Gt`NQV(j^q9?i=ml-1}32+P)F@<xYk*wVRJ|?4d#Dbc5##pGV9`p`Ken
zD+KAg;N77gRvS5P;dI=yEZIus>6pY(DDAd7ftPaxuA&e~;kKCbf}Ruk1anr`(STFJ
zaYKOZ?U_+v+~8>LT%m}CxTuy-;2Ek+@tUe?R#|ZS#7aG;?hZ7#kljE{8&tY&Rq7&p
z_wJ2U_jW^0&F>GSbtrk6D>a?oj)T|i)h#>jv}K}|2+?|kG}7N9FQ!a8NDPaw(^DYp
z#Q*r3D$~>%r5guPHU)3(3Kq>>BLMbR<Ig_<6yz3jtdgd<Pg>7iG1E{zU?YsIvpO^#
zy{fjrkBJGE7g@W)YIk|qbFOPZH%cYSh#ZGfrx(49((v^vad!xnx3ZkD9H0HA#6Zw9
zV_VTT^yNixvkHXUBYBc~)~s_dm)~)r5sK_VJ`2BDptCpTb15?i>83Ax*5>IPd)z)J
zzjrosgKVzzM!kt~rzWmvp!nvB;FVkp@oQ_@`&8uQbYtjUO1|dgv?qF_Y{78e8nZk#
z1c9Ku-W<ATn<!qG#1t_9&ozv0+UT*La1j;O*^Em}Kuj9nr`b1R(YmJZD9Hm;$EDeh
zKB$!Nn`&OeLYB&IW!%+#KIXES&u#={&^nDZo<H%Mr&lA8SpwrJi7XHnj;s28KSBg_
zA$Hb0=lF4S9A+RgA4kM?54DUORL`LS>vC>n`cr6i32d2wgjfE^%rHNcjyiA=3vfgR
z%csxw0n+Qq*G_w2n(bguorq5Y=P&veNb4&({(wFo_-Lh9`Oaal`GhHOKm~9wY;DFE
zQe>lv5(=fDA6yhscbPk$_D!sR%h(m;W#Lr1hAS_q7U+c#qmVK6%P-OAc#`6+_!pgz
zXG8&6M^2@xN4%#%d2|HN4M{O5a=!rI7W6#mx{4qM07;hfIerjkD&1(OLc%XtoZT^>
zOSEcm*<o8`Een+U4760<0c^tS@J2JJ%W$<F0Rpg+!>NA7D{M|cx|SNPxi^Mawy_u~
zSf`TLR8}s@gMr0$7K-vzIAKiKw!f%V<8<Omue2-W#w-O_t#1VXa*4Kf`dOH&PNkWn
z)6pCe#6W*WHV~9IW1+pM1G^&%@C?~au$f$16}G96c@1GvE*~bdd4(~4E@4=97C*1{
z>^6uAkZs<vlG;*qMe|wT(~YRFI{{0H^h0resfttl$m|7dEl$wN?SrM97QoN!K|Q|j
zS@}#-(r)1|=01Rf5eClx)@JSvsfA7z{7~_LhX__+Lpw#tI<n3aKU#|WTsoGvm%XDU
ztI@%`<L>2&@je<8SR`CfjTA3~R9w+{&P@|H+w~)&yWI2co}U^+quy*-wceePiHtgC
zNB73*qyXY1iu%}lln8+8l-IlmHaU06rnMV3^aFyy`sb)d=9W11x1K8IO#f{aG>B7s
z!9@VwoaZFVN0LAts8HgQ2f%WX?Mr|1Kvr8Lg1y?Suep%hGZBN*=w+Uo*!GxTHG#vU
zjrAZT)(GUdCv=@Ug2M)LXMYWqKwdcoZi9=X?TQm+g@n^-=u-TC&S*-=b9jQAKEDto
zk~%eo6b9H$S$I%SO-pt_A%JEy>cM;h0Dewx(xuheEcnW@nV-gFc%cL=SfaRxap0-Q
zB;+=NuJ%%4q46QZ&+S>|#sh7FdpKVGFRcT8f=R@hWW0c_nB=ntEuc2tVbe4{olu?P
zHWjb1+MI4#sLCpqEfb!>IcG#~L85XQin=%sAIuz2!N9ARZ(QX2aTZZ;R(tj<hmM}X
z`?<%;7Xi?QaGNKv5HF^4t|WiQz-C2wj0Ca<1j&vm4+exH&KEs?$mv7t)yryyYQaqR
zU$Nnz^<c4NDXyfr5p@^W1y(8~(Z6LX>#7-2B*cPlSbb7wTxYneGCVu_!mp(i0&?IT
zk)4{1I|VIc09a}rMd8b{7!eO(Y^N+zvKMX!YeI7>HqnA{d`q(aJ<?_nuzYhR8sK9Z
zFS&#vge-jp_^_|lB;Ho4?JI-SC5DGM&p$9|G*q)$QEXl}f}@*KJ2q_CfH)GZKuKyk
zmI!L`T&R%{)@?eKyL;jmPL@0J0en^=@}C0ntt+)zOKK=1IfxNGac(+|1<61F#wONQ
z&29~EK_dby!}8%@7n|0#RnavazrMs3T_Y)3gvW8}34fc!vZ4|*3E+ptE@R5kGDnzt
ztR=TnQ=xw5lw#gh08;9A2r1E9*6zE=2gQ=8kB@Eia>F|tW&yxqp-8!+xV398Criz9
zexYmkLCziY7b>&bq}&Nb^nfxyX{s{jE(A*4*=j5MoaeMWEEbDYaZb?ao;8Y+^q}1(
z@00=jpO{^$H{|!V_SIzw6Lm`arkn$4?_sH&_pxZk5k$@0jA0rym(znQ?hRYeDq8;K
z#pNNDfG<e90QzFxuTd-RkoF=%$-j@&26AoK1KpB7EfN*xL)hInK-d{?peB6FMscNH
z;Y;)|OH>8xe$PFtCKc?AmV`S{vqXaMpnyABwIO*{kdSVLJ42Mvfvahs`1qvrAyqS6
z?ePh84>2c(mHI+*Ku|_-8OB)ZZ{X^?0w+e$DE5Uxl(HQlrkAK2jYhZzOwZs@NJ7dA
zeRnaws1-ir^_^$4Hle^7tS#10jSJl)S)6gAY_z|nwQn693AN%(eEe!)E+Cn?>ApK=
zc3rxKH<((aMrl4}8?|%Slc;rK^EsS1Pjt)#3Fe?ih=T1_#<n1}FQMhi?!D%|Mb<$w
z+A-abD%i>}-J;Q|<Y_!apGvS*0;w<*PWy!hCTsKvsVZ{NKyeZk?Re_NGo&8_ZlVcJ
zP^0)E+<AAv=H9m%i&iMLpl!4xWXi~7_@NuKYqFT)m#hYWEft*vU5{hVAc<JsZKHi9
zCr8=0h$%s%T%EsWFm?I@;Dm_XZvYH?xk5rh0z%0}^<n%ndJVqby+g6078(NB=*F=H
zuO6&qTty^W2)qOKC^RvGt>K3Ruv}|D>)bL`mlFUGaDxRs^<F}vukpc=?VJcR#*mLh
z6_*_CAo1>%eV%~#%sK3NsWMg;{4QTh6!LMGhPr3Mhe{&r8mKkUi$=Q**YzBb+cK2K
z;Ewd0g@+t$pagkOm^~9g|DA#X)H|(+jC^4;KUbbXdnSfc@ms5|2^kW553oqS%7``+
z7Lk~cfZ)s|#<R0w4o~kM$!XP$fbL$hZq3FKA)WB->o^3>p0u%sheRiD!-ncH%^hWp
z!R;kdZ0kQlpPiq1+3+E<U3rT<LweL@HBJ4h+k@q_3u@klNY96?gh_<~K1_DCxo4?W
z*v*@(s~QGnejy6Xa0IITBU?4}5ni$T@|gvB?tQ)ELma1Wf*b=of16xNnFP$-&lKdT
zY1b!4pMfdx<Qq2t(cK>7#m{Y=b$BHyH5qzzr)3X{7<iV5gyH1z7{k44Yg1&#`8fxl
zP7gj)mNWJFiL1Z7ntm+S@oIIBWYR{{4M`gUT8i!*h;uwWtM{to3-whyi!Fo?XfJS|
zx#!i2TgvGxB(5xZv92UxU|gNiI5TDXsU@clM2&O{&CYEn@lAGWZ%bl+hONzoJ9k!$
z7c)9jEerD)42G>S+7*7wO*K$=F0D8QJOXL_YWF%Pk;RJ_=U^pq-YR3%#}L88My6l9
zsCD;4q{sHJN}R+uJIXY@y~%Kix3{-EhQk~l9gA+ru<GmXmeC4sst{58Ew>^xBCW)!
zdi7E1*tj?pEHZ|p%U{1vz_=VrH_R;iM(hU~3!mT*JO|o5y}ZgwmupfBy6CC3U$YbS
z=*>BfamY?m^yHE+9{qIm0;)D|&@sK|Exu4G+Phocs0_8{0u)(D9Z*hAPXEK6z2k~f
zlf99a$?vW*;|+toCz6uZN^Cq&iUGSrBvYKz5tb%b$bXL=O+)jKzWZv}2NrAbl{j{=
z(|zKqTd&?+r=a_=Swx0(H*}}BeEasTy*)82ycX+$d^XW7F8GEU=JjSQ;=x~tiHUKp
z9TOK9x7N53YJ-#{CGpaztaxrSu}0nZP3<K0V$8q$Kc0ch?u|Mq*QTtpQr9wG|9tAA
zEhal*y4TJn!-<T`<<<@ka&>;TN25@<4MdCE5X}-jvVcQUK8hXzj&pI*A2?zT*r+9&
zAk%n2BDo$orWImLAG*&C?#pM-wob$tKP*_;AE^<36tM)Wt**Mdy0monym$oWT*{L-
z653xnJ4Jv0{qAeog&U8*K@B7#Vym3VYZ8Tg-P<q85($6o(0_UE(gd%zb(y0&C7mJ9
z<KU}O8V8PU2~RYa)!(IrU;!JJo}TVB{=TuXeJto$3@YuZcS)jHF!i1=BR4-^B=tsF
zNy%b`qq~YSzK#qGc(YkoZ4cZ&*B@D{qoJYk<;xd^J9yFB+FCT-chFqpuls;a4Dt?j
z&y{hB>-lY4MECD;&8&!zFB%vbG0v~vwV?=g8<FK6rlt{wW%`1t^`=+q5_FbIcNhw`
z{KgOsU|x8m!{0-scdz*@rfKM(psTv>8CknE8i77q2=tsnQ~t5w`s;{F%BOv;H_D1X
ze8|n|dl0g@4_zK9D`S-0zP(??*kEO~Z{Hgf<OTiX=7e~U<LKZ)-_+G9_WjvE_d4_X
zYWHjyPT6|l(S55F6r9kRVmp85V&H*Y;i;Qil%nD3&{$rHt#+l(y0<@<EDpbXj}*20
z{X^@AMQ^oILNVglnktRLjoqlU0OzZcv?k(4lly_9t+`%9DH8@y@5O$D^M&mD$5T(x
zX3Uc5Kueod_2pZ-F>1-fchN-=aQ};6+xqfVMrJr3Ms_`m?@{G@-3up|185?WJoP$5
zGZqpYQ%e`y$JM>fh20$;w?{OWDxAeDp%Ajgeny$XS7c--e-#w$W-=JPmg@r1%@P)7
zJZttPpy^2~W2BUdU#;`raq1K@QtRlbsOxhcp0c-BS5pI2{~hJJ(NT|Fn$gltG;R%j
zPLo7eb6sn1Z@Q`7>p*b|YkQ(#s5~`f>UIY+beLe=M%FrDSFfFgg#`mOBk8BLSMJHI
zULB7!Mw*p{6?W~}Q73B*)C*;&L58#?I*uDp^CTBuoY<^xf9e!E3h!l!enA^yQBje&
z&-bmk4Q%yO1-sDy@AR;A&FW(*=5uU!V6_D@wsgLvAlySL%e>cQAbagbXlN!*F05SA
zM1<(Z<BO?Q$BRZQK7P#m+$ikt!W(r=7OmUTT1Mgk_-b1-$6YFa!pSRM+j(mhdYne@
zm1uV<CwB-73!_`aqpw+Av<omkGC03$*U+z8`0?`2J-aZ=_2kK>x&hC3_t5ae6;HYm
z+lRh=to{||oR<_#l%cXy!;ox!<@)XYhRj@LG;P!(Z7j%nLOin9kix`<3r{1jkIog?
zzXY4e`cu~-e!X+4y*d64El0sOZ^kbX?co8bGt16;^e6?9nZqWI)&kCxu5IeR+}f%t
zy)vQP(h!qUS!>JFYZxUJ=}noWJ$x7?8a4uMv~_7W^uv_F*M&YRe*S!0?*ic0!+<rH
zdKAYlSjk6ngVv1IFS-(B8T;rOg-81i)s~7dc7NGK<&9psas^#geGU!|j|9VS?`v*q
zG7s3M9dIDP5bagQT|1M-=4$TZ7<mIKL5M05dVPJ|KBI&%B{PoJ#43Y2^<)P`kSTiU
zwY7%QFJQprWnE{=ggwKS&Ml_sE9}mcwB92k+EiM45;bGn$m*{xEhxII6FIX$>XCt{
z_HjAqTb{FXPqA#8SC$mT`x{PJT3Vv@_KkP*maE<RWaqWKHnwELYy+K8-n=<=VoCC*
zxY$@jzvnDJW;3$Ca}>Qz?_i(fsRyQo%CvWNb@lbhE8g6<kGe$qM~AlUD#dHBU%Zf5
zzy3|hRD*--Wn^U3)yHA(XU&?00f#yB=D|CL-Sp6Zw0k$o%kNR`MijUA;33W6`HvRB
zvU(igAzV=zpLTOk4{4<x><IpNYSULGlRS}E6l8%&)ZfvfF4Pv_^n~bi&EF94B+$=q
zDHLa#srRnj670mm`ba(V$e$d8J-D|^7c6jD-+=TBZT!CQKJ$H)v@jg+;emLzxV6`O
zuKTy!*KeUo$aFzS(_r~rdQ(TauRXdg5VTsDSlih(qQi>d-)W3*+xARNp38PnZ?)v(
z80DS(mD371?h-vK`u6R$bqMUWU7T-O#lK$Lt2ESIj(z`K0pp>$7ek-#P7w@`q0^c8
z&@lwvm`uSkx^>r+zDi{Bjj-Kl24npeZ>w)zD5>vKno`!fvUpXu8ix2xz9VuaO^>K*
zi34R=AmC&hze~=8dW;R6*Qu-3>Bdm4g^>Qn#pxrgr+Tn)cI!3K^dP)^d0LjJPJ(Rr
zdV?DqbI_d!cT@i6SS2d-MZL)sv|5G5b<`wQfp-xRsFYEjd5=^4JHJ{ozO!~Z<v35$
z==#mq`ie<72utR)&y~E+1bQ|TJ6v7uh>i;6UzTXI<!!pLX%Wtn?E-(p8Y$hVKNP4T
z`f@8)90qj(dP0*>cUu-58X9_UxXtv_W^);&`XiS5;~{HttMvt8z$`Lr4w;#iTkiS(
z+Dc`M;)P42I#%G*yPp!Z-l7~Ppz-5JL`)+nB^ZWXadbJET5yGRz5CJ)kz_wVzXcy{
z^?t?!Yn+OQ`OJ^;QZh2BM^!Ei-ngdae`Bx1BP)eE4;U#!LqiV_j}s?4PU`I1wd>HK
z_edW5KIKd0@9%Lc?PdMu;@u$aH1E-`oaO^-XR;M)<Q6kLy}jGlM6ms8&msdx0(s^7
z^_!{&RAhd8yP`x2^}Z|KkS<j%*U4HxiY};QDGEIu9Vc?rl)gvDI$h^fZVP@D<8nYp
z@m=9Bq7O8}EzQlN-k7&7`~7!E^a`WeUUG4@wj*i^*nP>>s|#3i<Pt7uh!kb)KDi?F
zIM5P9noja73hJ{cw;RTt08C<tu!Z}oy`$q$+|Id**Ag(^f=odE$#AKexO4!r6@)l<
zu$=_qee&>O^8UN$x+t5b^_!t7icY87CMF|yM{keKog|;%zbZ}Zk1WW6dmQjBdke3N
zn8!l=b#Q7)b8~Z9*}6VgQ<TI}=<d|mHS?zHON^4<JaUoB?a8FwnH=)6%vbu8Dkvyu
zhtBS<4C&0#9+;yLDZPVnw<A(hyK!#>UsLj4q2{LwydS)hO-)U#9Z4E%{#rrBFdSiy
zuuXjU__5%xzj}~R=LoJkp4G+01?b0~-=ddnuk7pg(ojEa`s1_7uL1)5lklne=&tL&
z#*B@P-5DsBwsV7`Ne`~n0&ZtEMoOMOeF}thm!j;`cklG);my)vX%Ond_#z$|{Qez@
zvOO+%t4N)$H6A4(AV$MC&o<HV^y&A&5oU>TxA2aypymTPKvBBl%^O35kQ?Qj6%_P)
zX00v1f)0|kFUYR~0(bVmq)gY^xf2AEhW@d^iVq(=NaDUb8b!7M?I#ysQxL<uJ3AZX
zzgd%*fS~(bHlk$&)6v)~9Bz=idZJ7R=g`s70TDQhVc{i9Qn)8@IS`|U#U9G6QC3wI
zQ}g)a@za*o*LIM{3UR&V*~Q3Vjo>_-XxLV2Vrp8Zr*h1Pv$}cSe_5xsU$f7lLwJMF
z=xH1kAdL#6aDGRpvLC;6XfBWzwCs?mKUz)Z4u%tpajDzhgdaI_1hyI{4z0YRqM~5O
zgy(&<2W?a3W_5`ClQov$%<QwqGp9uF9DYROQ@<+Jyrw*=L|1g_*kEMABUYvxeh|dz
zUAGooAQxgzZOoZR#4(>yAiv^kwifRo>2t}>&R(KbgD4tFbZSM$>)RWw2e&UjVr@;t
z)sS|-e)UT9v5S;mjG?;XjIY^f+eBxAQcCpeXU~pc`;HBkOSN9}h1W_-N<wNB5gFNS
zdQ094r`NJF;p3bw+mR=15hd9IzAmn!$^iG=V5M4z_8gppq>2Q|^7-Q8eF(eU5^z<X
zqubIGW65<TzrHS}AekQ+8ZzqHggUzggX)Wj()P#`B~}duA*@m3wa(Dj6#O{!sAPa7
z*48vV%H{gCYx<E>PW*2Nq_i1LK}kESm6er8x!jbBgj>K1(R2i_nYq#b@@4JQrytlJ
zS=Q2$ec{3dn37btB`4J|Ob1_I_xuE98&C4m9MRaUg*7t%OhhA?COLKF$lVBA`E+EW
znWASd{jZCgbmoizwwy#p-Xn6G{_^z1ev;-@1iv4{kE4h0)%dM#EiFpYmvI7<Kb{2B
z0V%eFwuF4(E?!$}>%AYJ$BLjUQDQPPGi_6R`7DH&M}MoED$tLq<zq|8uP|BHM$`6h
z-MSS9#CC-aTG!FMo%Cm<p{;Ef78)^cUCbsFz1Q`IyuTjE+;QT>iK38Z{Ec>?SaQWq
zZ`uAvG!3-I8s*nwxX#L6Cc$_Kqf}JQYcOd-(F7yDo+lS{Z`L}SEjIa~?_pKy($W)v
zKBBAlO=ac5$jMq8ZDGIJ-RCb}z`-WYc!ydenedk1^Vo9do;_thI`q?r<AbfGd%bre
z7)VpKn^Q~yS+Ap$(>u*R#KGujPDRRq-A<l}KpKoOcRZy*=3aD(_||6q<#n$=(qr`d
zk#X*jk%9mH0UWs6;{uZx?j*K%wA^ZfZR4Mq*p5@wiO8rm>f>Z}gr9naIeX3Hp@9K|
zX(!Q`02>&eXDGX8wS+|6XA!l8gap#4kB03m+(e9-A(z7(;=yReOD);AZ{H@#I`%Qe
zHP^{$E>4dIvX9I^DlxkN?|@Jpx$eOC@B8y>UApUa$l@($lrrJ%(-@W8ESDo?Owqbp
zvKRcfSNZi%8_!Ojly3-r8WbBg0ere~?fK|)()KCPeDEbjp0MMfc$ECm3C<65pDBx8
ztt=K37iZunK7G1nDAD}nMfEXzVCMQSQWj}pv{Oh36uq90y6$gS#<&+B|I07G95OLU
zuKzf)Dlac@#`NjQ_%2;t4d=G&VPRo#649fw%E|;2v<+K=f2$(DX6=BLD^JqkV}a*m
zcy!ye;NF(vK>26JzSp9nmgW8d)4E{El6CDC;|qV-Uh=R41@>2%mMjEz&;Wdrm38n1
z2IYnWaR2<Tt-8!ZyCSTHIc_b;cQNBb>f#@7$)Lsgk3Sy37ue2>Kns`y2|heFm?U9_
z`{V~?#dRCQzKrU;eEs@kV`FN4F8VN0G&HJ<{ljU;qZ*)|nwkv!S+YYeGSYmf)@xBF
znS1@0l>l!)w#G;>uCQxVCq6NehSEZcYdWC2vWqvPqE6k3(=Zvv<QPKhpr9Z$4wjUD
z%5k)I)D)jp5dOoB{QW{ZjxQA!uDNfrQPEs(<3=LHio#{x?U~nr<IR`>!Bgc2__MaQ
zHWUOFE85=tcx$g4(5Rrk!>`cy=mC>bm-I(xXD3o(4%*+)u6dU>!}Z#ACdN^<uP;83
zW~x}XRbu0}Px)wCNi>R^iYx&W*GN1a?CmXZ*N{ZwOkvU=9Ul7mZ|YDj#PC4!qKok1
z>u$S-!W5C*4ZIF@E5pp`h+5~(o~_Wfl16IyrKHbTZgr=OO$C!lADv5?i4^(A7iB3t
z`_bo!UYuNAjU?I>l$6}v+=d4SqmUPnQDK}rsH*Jnzn^%&8QjDePu+;8M@eM2d-&D#
zxbW}~a1ON{RUvT%hD#3*0I&w%d@Sh9nKST9cy<mjO58(b<Q1?dz_&lfX$y&ngrN;O
zX<n5K!qT{q<VC#qQTOg0Lmq+s&jMwWimJ*j9Jg}S^%$?Le+*a+(zw&lD@DTs>^OY*
zFbbqYi7OkB^VuT-C45|0uKfC`MXHjn$-sO@_(mIS3c~pF(+5)UPZSgsSY9P#ay11f
zkvl#FT7b~lPelG!r$wQckz70uQEm{b<z)U$45O>JEGo6|sH_|1-j|}x*S(~8*!_l<
zn8`1XMj#UK6uGbqC_|=f9eN~u09_+E0j19Z7H|0L+|FU;!%xq^Am-=f+{QqqTkcVN
z&^ISvqBdhz4D*S?b-EOJ92W%pedv}YjfA8@9OY}GihF;bWqhLbkt4x<yIr+jQ&h3j
z=qf7eiqn?-{O#L%Dcyj3=tD%lKt<cbfbZ){L{t1u$5<eZ043VIzeNQU7W$IMzdi>c
z3aSbyrXwQNK~i_D6}DAc<Su|om#<2Ws1>4ZV6&=fibGY%N!sX_%T7C-R>H=VUmPS;
zbznC`%jn6sch2s!%q%}<Z9RZG#eBw>o-IF|H)>_}+j$4$5!}IZV`}al^6$A8`sgZ%
zP<D)6l6?lCr=mmCAw}7Fc6N3qr&SIOQT&7Z8-bPr{0NoT+IZ=kp~$8bn%y2*YI#Y?
zuk+?n4@4LRMdbsZMEIRFk&C|&M&u*7X#EKwj?c`qa^SmQBG*kzxqEgpfSKHur;Tk3
zUy-&);}<8<2|2><Z+v-G*zY<M-)+?G)CyO+Z$6`Q$IhL@s8C=sPB!Df*dGDwGk_1R
zzn`C<f7V56^JZ@xC_p#sM^7e-1RrS)^7ZjK>RA=NIdLLog923;sU5*yb8~aMOctm_
zq2i_+uAt?X2R8E|WB-s41KiS85)#%Q9vz!EZ=Nl4hEcM9Yi2P;726Lsi^owpKH_UO
zU2^#y@SH<Ug8#QoC~VA~ee>9l5E?Ji{3n7JH#fH~+K98(jvYxAYk-=3?d(i`{SF-)
zU9haLt}*4zbAtNf4&zo7dJZH2io`)OGc`@AH{CRZB5u<E*WUTZ#2kll9L*Z@b5=?6
zW6c#Z3d>kstjo2mBr+)>X=Sml@~d^H$gfMBOZnBR5zbP#EOdo6JNc?+OEJHPyNod{
zmg00?pZu7A{qO$0`|j?Z&*ynQ&-;1a@8^>;6B1A&86#SFH=p%Epqci7yiPP&ERhN;
za>gIhYO(iH59bazIn_H^W*^zh%QZDZ@&*!4FUgso`fAVPQUm-_+Pf3w>I%0<Mwmuf
zY#K85i=VWT5ii2qpr{q(tJUh{-N8{Cp~0DaLbJUe5<Xflt@f+Q+&%Prm&E=vw20^q
z>m@j4dNZjdw(YW>VW0X2s2OBYxNwkz1GD3oBF>n*XY{n?7noOH2e&{vQ0PFM^X(fv
zxL*1zFvBxJ4tNtya_&i(XWooZfcg`8D%66~0Qe;mq|ME=%eyDqdm6z%Z5uso2)C}2
z9R~*Ps;a8mJj(S0n}iC+Ma4S$%%=6`p|Ria2%0K$yu6etvvq76pn{{L;})u-cMGP{
zS~b+wWeVNGgG-x;&NNd{_K-qeGnt@YW)X_2k8>>hQ)>e;F=B6=xs(n7cNiqmg<^I@
zYFgTTdujUu8jkzqwlV+!X2h`HDOG%ykLW3}+Y*UIrdvhU=vtMPSeEzHpyWs&KAd=3
zJM8({kTKBp>JKMMWe9xn>ZZoV#UtL(IP?vPt?KOTMA%^Yu>4$BpKZspbFI3<!mYhs
zR(`qk<VhXtRXtBNf4sYUadEM=E&W|v68d6d^|1pAg~BQ35D7kwlGT2iRsI@{#+BqH
zuVR@}xj!aal^x>J+l%X%Z{K$I8=^0|B}!+4!cE}jhKNN}_bo9^%?wM4Pe@2eN}B2!
zollF?S*XdVwu<<I<L}MQHJi=!DK13px;p4*vWk4{Y75`IEHYAGQsh!uke41F9=<Yu
ziYNC2mzS42`IQ`5I6<!V&T99PBp}dUd3*tXK$M6)J)1t7@7fMdm&rQVsT^iqU%te#
zF7V=Rf=4m17z#!8sG*@jr_%+idn&{XG0>gpk8yW5zz72f?1w4^q;i9Tx6x?K@p!|J
z^musZB?Lz2ZI7%=V(Yi3vhJkpC;T(7yl)eBPhl@mU?B%BOD+oSFlh2E(K};b>>umo
zltF=G)oDuSl}JG+O$rQaK~BpNr2)jaD56vmZ|}uLt;kmj6Q3Vn+Ls_(BO9sLb^}xK
zTz%RMm!nh%Vic-YYfw`J1?$%qNl(RNR!3-1w(r58sI5Qx&2s&7rbDgT@W)GdQ$M-C
xht&VE0ZRlX`ThF;&@W5;H^jdh!ea0HXdk$Jz{#)UGPH8>bciA>sB+QToFB7rNB95$

literal 0
HcmV?d00001

diff --git a/media/images/gemm-hierarchy-with-epilogue.png b/media/images/gemm-hierarchy-with-epilogue.png
index dde58aa8e5a62fbb1c7acfb015f884f324607936..e68cc0c0de8f45704e1c4c761f3cf0f767a571a2 100644
GIT binary patch
delta 226124
zcmZsD2V9fa`v0p`xvdKAZ3U54uPAjOAObRDOO-}IRQARqB3p>eKwerav?^eO?4=^Z
z1i~I+Bv>oRjDR6*P(~n-1c*t10QsK;?CtON|9n1@^`3K{_c_n}KIb)oDjh!~U1seI
zANu8!ork{1exCC6m1Y&cQ;(nOKJB0W_DYX@iHpB?V71M#qZ1cXlwV}8_R6Vbz^CMU
z-W24C|N2_;kwfxkKfEU8Xn7F?iN0@MhG!G8S{;EYbk5R>5n+C<+Y7@nPS?^S6K@dM
z@@aF|sEFq|b{h>0eoFer3kHfx^;O;z1FJ0*G14vWO}G*}M=~?~F0b@6hC*KNf*@#^
zO2;Q!w^prl$f`OKr&gC=@pnMB6dP*dcp{O=X!LpetkFx)%|?+nHNM(l`$!6mnK+^7
z5<QBoPPEOH`+5&lR^3Eyn;%rdycweD4$cQ-9)1rlf*|SUkvBWU?_ek<oo6R3Yn!=5
z$<`DQ9`T^EV6scoleOui>SKsUiMFzKh*TH`7rU!%Tuq|?s*Lbp=~=XoBkY>oOH6h^
zR!rPx5EsX=^y=Ka$<1NZFb1@{Mg04zQ%Vx-D|l;%euf~YvAVW-X{pffxY`oe#Y=}b
zf5nF&(Zo>mqLQOxZRarAx{17I&K(Rve$pJuuX!~*N~KB3eFCmn`HbHgE_ijnc9J11
z_Wuf+_?(5u<V8ksGvq4i>SL~Mqvf3=b5t{Y;fGq?5z*>tGpknpr(F17LCv9>C12kf
z;{Hp#RBT?Ir05L<#d7Kx5-?R3$Ij3cj4*nrmV}URpqi>c0;X`SPY#u;GkAHin9=2{
z_!+p`URziZ8N{um?(66@!mZupwljVM8wj2K1$NwMVjw!x(4pL1Jh>=`)c*urA7c?{
z9X*My9>#_3d$<c4P#Uuyt-Wp$BrRIH?AU^WzUYnU{{1{?c8P(@f4rvKl8K!Q{`1&>
z#gwpy@u}8(s7R_sTv`JulB(~y6I^Xek;T*0lsbrYZJfTu(y`0YxBNYJKyiz#R~{)G
z>3ZQ4&zVp=VPw!uHkBHey%!7_=<LQ{a;f08_y{2fD2Dm2o1sWWNjVzSMt+|}Qx(e}
z^0P;oY)d6Zjq!pSW?iVRg|g$0<HrfE4N6a-f!<Kt#0*VN%F%oy<>E^Y^XI_S&9T~q
zO`QIl>yud~ayIJ4N)_PB7?ZVh#vru=pP7<w(6IK~Q3Sl1u%*y`=CYO!0uEPd2jpka
zN6<ax%Km(7ed$N<mB566?4xC^-HJEMB6}VTvY%rfuk}?+?P^ZpouH=TbUV`oNsKAR
zF=`x5|0{5D*|nyEH5}s_wWOmn+hrpt#Dpu|e@GV67*(SV<LtW94Cs#q%3ya-P$_of
zWj{NEG0iQvmmXDj^c#Evl`)--VNd2$5kr6$&oRZDGTfdJEtm<*4I4|0H_ht_pVcUC
zT3x-{bMtM^t2j&CCixHtf==*?7=J!7DSH=<tB;=j9FlL2!=Z5=IIxF?ehN^{Pm0u_
z`>o#85U_o|OQPwE>b+Zr)g2lYZIm4*PeRS@8<-@Ea5(pJQ&>7Nn<{OC#%bYni=)qg
zYu&RS;Ji*b2+Tve#G5vKhpI;XRI=n4OU$W`;VUBuDlW_x@Vb-{xBt~Y%6c_Sm&(`)
z**`DEyN*ALf>KcDxmh;?7k8C8D2`5{N9Z=>o+%-^Zvnq)!+pi*n#b;qDPasS;P*%G
z8g?Y-xjAOrG*#D!F@ZV(*Yl^cO|ACe4|JD~PG-@m(lNIt!rHiR&R*#3BlVL?9TDLn
zmPzk(Og2UY9he$@a@!5GF!<FR7#UL?>Kf9Et?rO~4R#r^hiZTe)Vs+nr#`28Ng_q2
z4BbL}18&3JNU_M(;5H1Huf+A?rKJ@=fzJ9}M2COfT{?zcR&t+@jN-Q5=Of0K<qvH1
z4z=!Zmk&4NQmG+br&z?>F8>zu*(RH5s9HY4`L~T_aZY)7lqL{NS&xfTwtcqksICW(
zNWE);aV3aNUWatQpqRPk5vprTPqLo3aob?F$T|T{V6KcvK+TaE%86|Kdi{{uuZwf(
z2;p!k=|it>j_bzi8(=*zc|(tQi_KYX8-1@N-0=}`(vKBMxK^pGUBIv^j=nM~v`KtU
zP|y*%;$~}A8#|js!l_(M!3Ty1Rn0f+Qz(sDFVIB!hB$@1dO%bzcD({`cybe2bRxK$
z7^-eb9er7B9!`CqN$dyi5s-X_$Ts?icTwd`;@mf~ZukDiR??S%%6>G6m1-`ia@ZVG
zaBF%V$$0Z^jK!QlMjARhAi&dg(38M`Nabx8!VvYHBW$}|!q`=prq5PIbN2rspZQ2C
z*EaeZoK76Iz!-;J=i;ddXTeRV`LpQB_sk%znVf;C$cY}Rw3=3JUYqs{qZ5g{!ASF^
z&LfGX4u)Wkmy&p=%tj2qqhS9Yk#mCl4%|bFUSlMu-WBHb^U1e~M)|bvF1PyfaWoU(
zz)2Xkiy|l*gnsZ>UmNQ-oX6W9f(Ln_!~V4&aBdrSpLi%p<%<;iZlQHxKxhO-S~ntS
zJrzf`Q&aenb?=o#jQ{&Q<&9aEQvh-L*C(jr8VO0M1%>zv4P&d_VM+$KQ>Z!!#Q4oK
zLzUD`KMse3#?=hv&hv%?m81J~qpfTx=rK;h>Rj&T99lA=3MZv-Rs%km*lHS3O>qi&
z`^O*OfibO(oNTs&wBilzE((RM6o0{>W`bU9M_Nuc-PmLcH{WQ+aKlC))FMjseU>(>
zeY18!_AZqe?|CgM8t;+m_d4twx*Z#D?6C1Ycg+SV@~Us2S@WNm_4A~@_yiiLk+NnN
zyWV;;<UqZH&y@7qvI&hlTMlqyhu-QnX|T)^tn<2cGa+!Z-sTwdx&Ez*bE%u92*xCB
zgm|1j+)W^}7+sDd90rKjP?=87)r}im#g5L#{IwxQAJqgWFLHyK&9dZ`SMZsG@fb|f
zvD+tLZ3F`0o>8rNFy7S&fe<o)2=A`0u2Q73uc@6pd9tdktSq0@k8|Z!q(-|2No%}n
z#id%OS_c9T$~c<2DU9IORLAdvihp)<G`yil9=Z~36GC|~Sc%8uqEFlxsmE|jUqNvb
zdejQM9YwFTzt6b>OjbVjHwo|~43&u;7qE@`1BtTrYaZ;`M_M^=e>YVOv!@S`g@HV`
zv#UMykPn}#A{J32VPUlBDHj{&FuWqr8;O|THyS)i&E^ewmwFL%9eAUC+}udFLIlfq
zs2s(=mP;S9Y{VyB(!=K^7|fMXf?ifDd(*x!<xV6iM-R{keo26pMKRZDNXx5nBbi#N
zGZ-ZUZ4Uh;A&Kz{2w-)Y(Cz(ED3p*??|tpsyK(7k&+7OKd3<Z3yP*=<YxX4G+fWH+
zc4r&FOU*w?xQW#53=k-8(~=s8Sbs-1-k7r_drtg-_i0T~OjSC2YXV`LDwXZ24Q8nX
zfrJewT*$i*l<pSoO@wXV$jC?sZjX$NOpSB-V6vSn@kD0K4tO{fM*|L454X1I6UO}&
zq)5%S!8Y7si_fBrt2#$mjC)5jS2u#W_o~I_m^oG@tKSs3E$_l&BQ;TE00Q2fzm?|L
z+vVBlQ?$r@;oOL{S2SG$LsoYYKF2W86vrgDP}v>QNnxQXJN6}Ig{s0;HNQav#W|cT
z`pD%`joS&-nlSd56JRkQs=qRayZNNDxTZs$9A$Vg-Z-S^ysZCo#IR?o3-94lxZ&8(
zxs_y0##$kUQAj8XP|)bWHLNdp@DnfOQJjO@jyN$mJYFq1y0NV6%@?K$OE31QH!kv?
zaEc2$PBkoWfZ)Tv_j^%Vjq`|;g8Y0E1A<+m9IL}x76z$ac!Pcr@5_$!bOhu4jCFZ3
zdTFyb7jIZnU%B>uQf@2oKFy)kRdw_+#>=GGFco-&k*zhu!gad|&N}rcTC3V2v~E9C
zo5*@KDIF(Ou`7x?GBS%W;>yu;G0QJ48Sew5h7t;mCqD%qwOVd8Lf{fTndIuoWm4(8
z6DkLraBCY3ritX>&K&CXJO1iNU5RW%&Vs4yijc%p&DFd8uxr67mscUBuyXGbf$Xyk
zqvhg`i$nFq8{@0lu0{p*o-GS(8@dhb+!P*<+5yee3mB?6Rcm&dra&3L2PZwv7iB^N
zq)<Cc=L+8DcCyB-VSGuoQ>@}u`B=wqhtIOTTU!kId8!v-^7Jc^U$o1nq`MRm91|})
zz3sBtG=K$xb-}Wyl!O7ZUpqAiX%F$^(6IlkLgpB=c5HRJL76~MI@OkP%al8JRQ+d9
zPfYRJ{q<VseH7zh$`@hT{70?(vOTQi<1d({5{g+$Uw>BiYBWS(F&a6kZPI%7SzJ~m
z@68v$&zDTM%LT%>lDbyu8HU2oAV0-iJZ1^g2{VhkT^fZ;a+Q|8SEa(wC*=;GQV10p
z-#~bdy<+)wW|PS$&wawY?CAS=OS<?VS~Z!!S5X48eSsDLpCM_N=)JrSVhq^V*r!{H
z98<FJfbs4=Ul_#wQsRavT<#yPMq9Qjz{_tmrMz3aT}({D^);y*)I``?)(+P3;N@DY
z+NRnBIu6@I&H4vz#>bv@2HFNu%<!q&#}@RAUx`HSr)HU1!6SuOUa7{b+5~!6e2b9&
zvq*x;I>MX}i%ZxEo%k@uIAYd+%6vO@-?5#9xt~CLa{Vn_Z+_^L@Y>=hda8$Mygd5^
z_7F|{RhV_DtKp5+7mOgPt{t7=`3>am!Ytj4T1uP#^nR^fb(A;7ff{CKXN|@?+5Y=;
zFs8q4msNj1xz5YZ(&t%~*RD`&Vg6`-qhyQ)tI4WA$8j@S<VPVLrN2~Q4;3X7C`yHZ
zK$vp_jJj8XR0^DClwV&`k5-e|0o_^YX8cC|LTly}Zj<^gf1DJX4z6{tHuP?r%*0WO
zQL#qxkxn7&`tV4}Ovkj5T~#T_#dbqdeQ|g+&PcLEt;tn9|G?*>dJRw+^%(Qxip&JY
zJL({nBv(m(bKOc9W=A1N75l?yAa_NVhVaf{)_Z2%+MClTQ`^$#grZX=#&u6`gDGyU
zB={{Wth_MRIF~SbjOn0ekTDOkX^?z$+9^NJiF`A(N-b*Ru*K`i$8Hw~I+c|;_{zo)
zA?#)c@h?zJJhPP5+IikWN5)V;AEbUR8!s6&99)VEaJj+CV!XQFY9!vSf!Ez7Gbs^*
z^~hZghv_yADaHP2Y%7YMuv1-uB}kB`-88h*_6fL_KfIo3I(Y@;{Ree(oPxZY!>h{D
z{Lcg!>MwAj*S@6XgpW4~QZQ0G+$#m{ZVn?TXYMSc{n~pmJLZMkstR{8^r*SEXdFfR
z*y5I`ptH^fIJcrx0le5)_2L|B7uTk|F7ork(4wvk&Qcwu)ZZulkz+*NuXV%Cj)@<$
zZn}}b0}KssW+~`5A4I=@RK3q?gtNw9=Q){nP>-rjnz_|`^X11s6j<S17uN$xth&hr
zmmba%JCYBhFEy?)@CgP>e}2i{SffX8(CvZ=IK)aISy*)U?$YdY%MFISGI}OGZiBxd
z=LOSrUHIvg?6O`%sO*I~nzjDh$4cYCM@_Q@$)vqeg?{Bho5^p#+`g&I!JiliHKocZ
zOYT!fu8rz5Ab^@YA?%>&lx^cuDT-H4GJ&n)$=taXCs?Z;A(lI!#pD8)M36-Dxl-c9
zu`G-DM6B3Q^EKeoe**g!*SlR1x;GhOmUvB6qmE8RCq*JJ2#Wbhp~%>Ew5hYx1fOUt
zz@4~}#kQeJ;>K|o@LvEcit&f9c?VHOsfDrs+6moycmj9#h;QF#l472BSEFXPbf;`*
zpyE~y4pdq#yCGab+k+K{&&7{fMO$)-A`HXNkY;B|2(@YO>NKv7yjop&P+cqRd+qUO
zX91QF!}KRa{(-HQo<?7Q+{43catYn~H^l`$@GE8SI`=7VEtC>ut$k2mT>1ci_U}o?
zODfu{)5TfQ!R7L3T}wL9Vt+Wv;<Hpxvh^@Fv}Q16^?8wQAua8BfaS8^vK<sFuQS!-
zz|Cm9l1w!;F46b?^=t9maUY#yJYzm%{X3S~?rzato&*1G)oos1T5+?`nMXY0;B#>~
zSD3DG&Y=ALAVDQk`Q2#-<RL5ICcM*$hjFdedE!*H`ND@^j``XZCyihZ!6lgI`kn)4
z#S1}D+;lB25Wm^|fGBH=aB9laM~lFp%rPOs)vhVO-Xoo;3M3GKcWsm+f+6-W-P}R2
zSYHT`7?z1ue}M~GJkj0@TW%DR?@^<Yi)QdN+gfS)ZS29_!YE{kXGS$mNgu9;!$A%?
z?3?k`Qq;x+B1bkbv4o`I!5gIJ*~;tz;@@FDyt3&rpR*HkulJ@MNpu5HkBB-hgE|gS
z^92A({YD)xWgR>Vt`~phxRwIY12g<x&zT&X(W_16Z4|2=Pzr~{@WLSoq6904v5)G7
z8@G>h{t}ER&dHY_cXJ!n|Ne6*<``ivNh(GT?g5T!i;C~uWk}p_4L(IkAOL7@;Gow|
zNQX>z2FY<DIihRHtt&11+mOfgPuE7?nF6NV_b=d-8m==vOg`BGfTO#NN$M`il5DNZ
zGNSonp3lUJ3P-?t4fizzX%Z*?py`OzgP^Y=<oDlNg8=%yHlfIM{JKY;rJ5Fhg0Y`^
zccbg*I@q6JPwsohxNTsjrXUb!hSwE=SrBw1(ytobHe{MK9CHYMvgRCu31OE7i6;he
z<SxSA@CLDHZS|F4+-`%Fabzb{^Rp991ThV|WH*Hi@5xnC@ZC;X!%j>$<T)^`K;Nr<
zs5gFT2NbJQV!xQhh~2hfjreUZ9ec|*r1L$KZ%ft&K!})P)TZSmN6Bzh%R&O9dFcEO
zsOI4+*oZH2l<u?*0)wqX>^`d__B6ilmVmPOKahqro_W9e8DLyBW8aD=DM**!HrL@^
za*^@nja%GY$!@X#5XGeRN`^Nz(Ut}*)F%YR^`chNKnYYvRI^rojwu~7@ZgQWuZAsc
z_$Rga&yJE!c#{?c3ovn=usgkiw<K~)WsP9PK7xmMx!vU-9fhA+n4PTk<dZw%??GVy
zmO~ZDBu+a!E7}>6*O=PfpNO!|n-xp%LD@{IiJW`C!MDkE>9`CAICV~@8j?u$A;4l`
zsH3i+9<RUlSbNK>Hpgn}iozkF8Z{8Uw&-O&G14Q%l*^N=R4>hOX4=nRhMH5#O4mAk
z*bj(SI0@=^+}}NC5(r~18y7-)d_DoLWne1QS_Bvkd=7+l!@kIvbe$O_(lS74A59MS
zefO3@!}q+|5-0?neTFC{J&C*((svr=Wm{T2=C-k*KLvCkF}FCu|LW)A^wTK1jjXLY
zzS{-(4uD0B=HU*f6i5FU19q0*s+wwuxf!x9S`$#p)osIb3=iVIq>d}<ixF4wi&hsU
zTyR7Z9);<SyTRt?qk+@zRIqb#h{sC<8wum`7`erU2Sw>#NdKeieEIhhAb-lusL)|X
zipomJeRK<(18<#rH;+=j&DFduN|;1syP!>N#ou=#)p=QOP~R`WC7Z1osuEDmeO((b
z+g4ltDXrSV`p0c-xYR{&G7FvY2=D;;T}aHVC;;(lps2v5Fw3SXuxV?9Pip_QC(m^4
zD8(3`*{{Xx0CzAzI(pYgSTFK+s7yb?hZ5?SqC&fDW8@0cZHC!umugG1w(C4g3$%8_
zZ8joz90Ip=V|n11FF;0O;CP>*koKy1Ini`6A+>)g7&5nLO#AjnY4uZc7!`~^7|US)
ziwVWXSL10qGEiB36bbp;#6}Q?JHdFT1{(!`SKUy5&9ev0WlNn*F(j4N2Z+J~|D|d{
zadtK9m}nKKAnl{oK*jLyS9BsI>JS$&VweW9Kf=a?iUuVJ0}`rSE2YNagf$}XU9g%<
zmB-a~rwKM0d+x`@tLy+V>c=_0YA#M{F90znFm-utsA5Sc$M3~VYy6u15k3|#3e@?L
z;6~%d&y0ar0=T@z0fMBa3)wJzWc7Znstrv|E6h6N8utZbW<St2D9zI{gn_NL6yYNi
zJ65i9%kC)U+Qj3QG`1Yo(e1=@dv0ic?hf?`^%ZsAtCK`%yI=v^ZqP)yga%bv``G)4
zTOpLwC`-aveYlWqEA$ir<k0Yd19b!jYwZ2vdJ0jIJHy}XnS)O-H*Qm0!q|<QHI|4v
zAGYNDuZKgG?U6aYga+1tQ$T|!rHf<ARBqxYxSY_lqlVN*um8F9U0#nWdxV>=9=$mB
zQm?g}nBD#vG;qq;A$s)N#6*IUYjkMZR@D4*3lICqHyp#g9T>9uzC7zNUiRczx2Qxv
z(2{?@^(0;Swy^X@CkE!GGwv~XFFOGw>F4HU;UIWhUs$IsBg1H{B+axCd)_q(OKQg|
z<_joem6ePvty6VNvw4ZGSAr-jggiQ()etKDv{e}%UrpS|kQe2A6bxhLux!hu5}NTP
zOu9YfT{s$jmOh}Vt4l!Gdw&HD>@9F9%}U<#-R|!Hm*JTB*(ruPu9U#*PHQTwuO7^t
zl7Nbn&G5=MuTF5@iF^>I5UKeNk54TT;nwc=^-%3Ysx+fl8=8c;>{|?@JmO0<KYQ}9
z)WTrI0=$V!Qo7yV)T$V^uzvBqLIb@%kGIe`{cB$0S<HBwv@tg)IScPYA$aiBPChV|
z)?a%ju$_#8%3ekP*goWe2cW%J-I`zgk3z`zXj8TDc^Q6w<SaMutBagX#?PYsO{2?8
zCefjLK9Jx~0EIT(d$d$icrNKX6JUP0R*;{35alP~?u4w0&=%2KK=$8lCn(#yR`&a-
z(Im6g*3uOewAvuvlwDOWCKc$D>-}055Co<1XLa;rzF8o{7%)_7npzsA%8D|zMabDE
z9^dn=uUV<Dc&7gB_waT~yEU`BRzqndCM1YUkgF6{=;P}f*Gi7cgPf|k5RK=HFrcSx
zA!g!&z}YA|h{cyd09RNRqBc6Q*=|Vt6!MD-v(vSfHn_>ul<)*P4!UF_H}f}&>GE^q
z7J$}}tPR~()*3E#6~&|zx7|Xna(`in;!6>!bjWRkb&w9sFt!>W`6sp-FV30|5H4=l
zyD$DqWVdH_S5&w%dZo)Qm68^1uJhYYC^pQAo4~jyhjJU6U7obKxKDc87q4qaw$CQM
z2jQ*xb0r(5J@B<KaJDB2&dVz+j9)}OK|oQ1-P@V}_T*6U9YKblEo>gL@L&*j-8dKG
z&#hyORmbm!%Kk&aD~*hQwW82&g{PlXg3CmWwixZD*<-%B4x;QY&dc%LL>``B8YYen
zG3uFrIX}_#AT4j!2ld7JgY^5dfq_VGX{bzZ#5vlprL&u{hZ@E0@tjezc5!oYjGo6m
zlK_6Tqw0Om37XL^sQF#G?Fc7LlqCSV_4#&HB>EsCw>dVr-HlW^l)7tH1Ty4p#!=9V
zA-dr%Jy)_F1$9sa=zr+Kr@Bwkf2IBgwsFL=?;g6qKL&8{g+)U^dgxYRUltH5wOuuA
zO$@o;iP(6r*|7)DCXfo(*uEM6g50@LbC}M?lE@!LO$2GX1{}>sc>6B!+cASF0e%Po
z?tCo?INr{K{my<=3K85PA}PupkVLpyhn>_4`!NLcm?D1x+&&4jrMNaC9B;5@8Jbk*
zko5<soU5aQ%QSN!Ha|1n8lhhZTNLW0UefUm_&g~`tF3sy*C$|hYvPZ8Gv9LXNw`!H
zKgJjg298lKYJIqC!||yR!#NBai+h+cqe(-u^Qdj~v+0f)!1%P0PunDA?-x6v35|Hc
zFiqV{6lVZUbo@giUp9m+*>{6pur!|F(g)m*2uy2b(HFkV_=-0|TlPGcSab<^0Tkt4
z?+&QBALSRa4%AxmH4IX`f77h#3LjR!pgLD;n2Xa>_lE8J_{e=(4W_AWx3%e+!Q#!!
zIRn=@f(|^wH}ufwAe1kipju@(f2l@qzzHua-n`1=l#83)nQey)i;sOK3F&0!)6^UA
zNqCC%R$uAdf8B{#{-Bnh1RJVrizo{>tX{icy>}N>mVn`4x{a<ag+5vPa2nNWGw$kg
zCAw-TYz0Jj_rA0K?L#5rLdO%7QCTV5&id<*`?}4zPOPczB!k58q)P9TmmJv5B7in3
zUmw$1Xs3=#aBNM4KlM{;wPxcIiZTA_#5g;3`$i#;QCiUX008)QwqYedUVxwj?Q>TB
zBLAA%RW+a5hv%1U8`E}nx4l^NOm)NB4A}Xv<wxc-ztSpO0=SHA2=XF2hRd0x3X5EO
zhh&|iLP8>3$3GiESdwy4ZvU<gS7^7>J+@Z@is@oi9rL9Tl0xIZfzRH4XfdHk)wKze
zQv4-7)JArn;?9B48C+l~$u~XS)Q;>pdU=D+aEV(j&&j0K?3`z30*n}f@Yjc8d9)Jr
zXHZOXdg#V>EqtK!<JpF7RwpzXPvsl&X<B$;`qN*!+`U{myY^0YGn!8aBJv_JT)3C<
zyH+<S7Q=AL>B}{vamiBdp6g^ufN#G4a3qmk6d?bfe*tL9*-h=FgHvQSa16i?2Q&_d
zGgI**I=_lQ>;)o`$cgJNAG(m&a~S+9NAp=5-6GH&;N!Xn<4+AWgt0$0@p7=p>zQ2#
z-_=r$z4q*Z_vD$KB0j^7uXl|{y_;0x*A0X2)DZ7M>*O9jYqSBL{aVy|$h}e>I8F*2
z2Xh#i&>bu$msYZRZhm-J!mG9onT*#>aQpBSNKRs42uMy&|IeeGVn!Wf=E<GK=BW8F
zL}6Z{k<aV_`9D52MN|b%;sVHm8JU)jkOzLSvMEa+cQ{Phg}N!h51}<VF`cqs@*n42
z@;P(RCZyF!H_ZLTc)I$qpoPyJ^d;R|>{ag!Pd$vM*h!ZdgC^^Fa7^J-YN@*J%Insw
zp}yRWM{<S3N(m#;)}}1Sb;lfXX#<N>z3%C@S{-F3DKjH^sY+9!+}9Evs%!<8ga!5U
zuILbW(7$%1XWlJr@Qo(WdbO;YsU__@&p<>@kEZUU9upyvVsrzt*ZrI3yWcqwe}STy
z*ox2-H7v@?79aQAtkO_Q%sngW2P!3ofzDQAW80p#+6PPFjSX$=^i9Sa2iv}I!_9et
zbi`{Dc#|1!=z2h-+wm;s%)#h!@I%6rJH-{*HhcE$5t0s4(nhUYCYO4^r-tDl-F$6S
zbHd;6Gx36Ia<#hk3r9^A^lm@c=Yhe%c9?Y&lUDcr>wl6X91638+818<PlRD+O5kXr
zDZJL8KNIf8v9W8MWEd~joWMtZAgYG-2;mS`^KUu{w9Vm;jB&(jKiji3{EDjKhqRx*
z^jAQ9_yZ<Y)p_;vok~lU#-14l0+6DcG3G-;_E0LiVaDLbdf@t>#pV9*OxTU}d~(Qg
zbySO<YS_~KC^dMHy}3Tk9M?TI7CCr=l=r1l<Oi@+Y$BPxHpZdn7BQ+SFEL=f@uq40
zchbX!#-Y_B-%|7R3isC|zO;Q`O#M_Z$T0}(?own4#;Q>m%y<G0&1yo?2`(K*YMR5F
z8+=w;?s%<-a6Q_9MWlD{XOpX8j4)y8k3VKf0+#VQr(_}V6DX4!673m8nKRiXj-T6+
zNo+duf5NY1-PV1nrJ(0f%^YpuCxV6(=~mm3)b#<dPs7uxZlpl4FZA=WE*}bjHHjNW
z^1!}wouigsse(RTay;%XE>KVth>i-GEDN%wfiakka6`<iBdN~I4I+yRgayO7p!c-6
zc{tH<x%2PMCwRdPbm;D@*Uvt^AJ<*6JE5fJEq%|x3Wh}!7MU8)EIje>JD@wha+k#2
z>8TDC*E<}k<50aVNRl*y=;#2RKE)7;OA3f9ZTL!R^n|6Qyy6YLE~BvVCQfCTYsh!h
z24j6C_E^ZD#q^^oAscjKbZ1xCSOvZRu93hLW|L90i`_O{;xJ-q;%-Y`k4+e}ekLVx
z1TD(cYdy}xN1=gdgc8!)<5o9PKQVBtyl4&;m9KxN80r}UOHK?m`W-5?aA*h^wK6=n
zN0K3bDr$*}LdEenbw{K6Sm?mWj-PP%bJy4Bm2P*!<(w0390H$2{}V4uFlPPvrDY?3
zo;*X$b!#Ky0va}@o$T!o7;zW&1Vk<5Q5re7D4bHkB+52p7o?M(Pt(j}yk+2aRERkl
z&f127z^53C9}Qh^zH7e6%dxjI2wga+zm3*_;^uszrNi*zD<d0&P<TNhQL3`et97J%
zY2;>rbG1hm%COdh9)84O=0XyuD}Kf{iqN)tVe$ehi9`5f6>^tP4^>1(ZaION9ir1D
zB67zc3`tXGNetY$khlEZwHS-{-A;kC1(fLE*#mL6+vP0(@A^PIp`yNNF`VE{)9fRJ
zi6`m*Km5O+omA@m-PGtNn4t>A|6SZ-5?>cna&zdycJQHUGWEAH7L9-XEi=sgb0i_V
zi@E6QCLRL*ly#jPeT{K;L5T1~n_J9BA|OZy{LuXMN9^z8rQ+A-L)oOMrG3<B5tL)U
ztB>HB;=0uoDc+O%;?td9naR_<&6M19e*iI%s!1?zxb8p46@!S)^?$drkF%C(GI2^Z
z*O^12{JZ#RK257o8Y|wF0bc5@T|2*0@-t7I4P@^R85N~^wmrS`>5?|B`?iv?fidwl
z2mH)|a*47gzfjsGhs@B?t&mtC{`GV4tEEF`O^*@Cmrj@bdMhb1`NYoo^rXUMW!W?S
z5&~awLe0nsHQGLkXCIb&O>*Z~uug$hs^OU1sD@ZNw@1a&5ecV$SP#?@|A%z4$W}%r
z^~5!z&owbdUFL5T1yV@5;5OvWX($oHY}Il59*Gb447B`1yv?zkebhv|(wnPYG3rIe
zR?&~)wKX|<)FR`1a5pjjo^!i-ZU<CA>d$bBboq<ZzeOG~KlY&GHk|3zY4j}8n){4V
zBv(0J`3K0Dp|a5jxVTeWQrZuSz)NyqF46ZTA|y+QK!+(Q(p|>y3yt!qShWtP#_Mp9
zjMt%G9zJ|{S55Piosa(gP5xIGZ_cURn!B4*^VK&@wa-uaTRJ&j^fr4!oW7dEGj(YH
z_jf!0{Pd@1$e4xQ6{?pS1DF5fG(5|Xd-Ui2!|`R$BB~l)>4v5hLrzcFnCnrDg4wvP
znCFjwnyWbX_U>OgS)@rzo^nFMDJp~39-(6@B1|TRcpZtI`GV%Nu^|t+7aWLit2~3W
z!jg7wnK|mO1A8AQ!_6rfw*;GDW#dszAxPKLPre7gXw()L2m7N$W@aA$J70TRr334C
z5*$nw{brhce+%y3p5idr>8x93JtAv%k9D{*Ejsw*UQ-n6W>r!rF6i9bQ=jYvijs!G
z`8$^a=a;6YV?(t4>(?_f|F?J&PaKnb#eZ^5&T7Q!_>n|^^y4OL{YDC#!SG?Qm_A6X
znt@WlFuKg&{XY@)yg+{@_|n_>p<xa8C*E(x$tt5w4Nk|CABBecXYmL6mnYs8U%3ds
zycVqlb^e>m@&$=<^NK?9v%=ZWHSVYxPBp$`HP8@mdwZ{*I=Qd&+{T840Gow=oqq(G
zaO@i?Xx%X5g6sd!E;Tl+hwCs_qgD!p;9z!MScnp<Ff5E6I23)$42>PBoomf5QB(W!
zIBRf(`-4R*>(21-8lN3l@AcB9=}U(b$WX<Req;ORkCX<-hQ_l;yW%P@5WfYL2g<Sf
zeNM8dY}M*BIxiXHaGmO1XoRxqIpi+0@*4CewGvVv?gk>AD|8H^q|_IlHNPX#cGruv
zUVe3T(HL$`V0O7AN~K_@1`C_QJxp7F-u!Kf_=HcEGJY#K*NQ!2CPgrsfB&iM*Z#yn
z*ed_Dz5e7csG97$8(pNAZgYKJ=4bXmotLSbhJ;X|*h^@5N^x?vwmkOs#)B778l`=A
zSeG!KJmvlca6ARg{VEcN3EN#r2Cn>nDoik>Q-8W@>hQ7Y^{025pW&xe=emSH^jh8i
z%Dvx7@BPxucUMI^_mj$S(n-YB&})IRXt9`M+s9%=AGRolIP*j$8b*>HP8q$r@RP&y
zM=9$b*xKu5v)^d!x~O+T%^@SF@jq=Zo=!rQL-)Q&)ZGvKr8~o~9ad+_MSy!!88@pa
z0VhBqsB#-d`#3dtox#qiw5l9C;$ZE;E5$Y*Z);KU)w1SEyzRx3EtXTBdNhC4a8_;A
z4~|^MJ-q`}+WKO<zo6;J0)OlNS$ree!2x*ow6U=(BL5dNSnT}2eh@0ki$HFwwS^^(
zxO(vF-c3H2Yp9}+s7R}>Vz9F2-(5%>+>Hw8`Qq`VbyvxP-h0PsqS~&qtKf@7`jNSB
zKw$$&Ll@Tm%XA8UIM(Lga|pT-bM-23+)VU4pcyPdg{;#(2*i1*g4{CFgG`V!&hY6R
zJG;JwQ(-H6Nu~9)@0)&c#7u@3sr;g<7HvmsB#}t5Pf-x6rG0x@i)uk;GLrXp3&+#Y
z-QHjE{%@@l!`P%OUg^kD8NXC<yzQ_@XEN6CFcO7D`xLL{sFZfTnaM9j2D>ZhxjQ;m
z-MqqIGsUbVKSecvZzOnd-}N@dlI3E1TgtuL{>t=Ffe6w|bEMuw+p4U3Z^Qejr2i%;
zTT4P|X?Qp;(QydtocZMETt{$<^Jv5k?46gbH!qnjKUa}YTIVjVHB+9<Pvo>H8-+TV
zR?{;&x{|$=!^T)Dt1moiLl=zdY8kGIg$hCKq~tvbv!gXIy3Zw(re37eH`Z%>tNV&q
z$dNXH*?0UQ5iNNT*Og6Vd@#!9=nHgNqi=hAdf^@fnHW8>h`A1R-U1Bc{QW=&EXk$;
zXuwuqvpMS@stYkZVC?-?y@o?=*~m!j-UQ8B{Wh)GMEH66Ols1ZBShmiw+C91osqSH
zji?u;Q8T@%)@TCCmHrcYJVcO+oyv9-<av!%dq!8o|GwKOJP&`^5Qc0zDb=qPjyv!g
z+|aZkAFWn3<IvWwKr$;6xjdszVn$^0{0NRRw^#89UWwVI=(&DN;o^AW=KE|Rab}6K
z!@XN{khXJICe9hZ78WRyam@3_|C6Z#3(rLyH1?UZ40ejuIWr2|d+=6~`q<mFG_)_)
z&Aj4B+i=o?ys1=L`N8(&U3o^dfy)7`wiGW_q?4H${U%D0bMO+QE#>eq-E-`w7AGTP
z20^kl^XMx=F-s&Y1tW^W(sy~|!U1f~W=?Sa>9k<t8Itl|s1jMdZyvub+!IHww-Bti
z@$f&Df=B@Td0z^4!zLqj-liF8wV7e9v5npjh?7ZCCr#vEyX8!wCtvUAYwwR9&Tz_f
zl0<OU5(A9uQJ%urboq{H)o$UYjq*t7WA-`f?(D-e>Ln^|oJ(if6Cr_uKk}$I9OW}5
zl@Y>`eC5$zSa(rNJyk`o!eg~Lm0gc3DI^y<hkz*j<MgksO~_Cgu|u%=8^`}-cq1|?
zOS^k;1F2+oI_+6x<?DwYNsTvG))@zVH?6QWDzz%Bvu9Dwj|7WcWf#<HSFS#4aQ%ox
zEorh{6E-Wc4LK=aRPBmJ%};!4mLNADour~yfU@b5gJv3km+ud3d$S=2fWV5tl{ENu
z_3yi4#nxk0@c(g1cchQZU0S}0<!R2yTrYYsv!JqP{-Lk_T9b<D5xx2rXRBC@u>k9b
z(-hoONu6nXn%e_6>a-PVeVC_S(K-e-FK7q9T<f|EYX7vz!)(+AnFHb!)jYlBsW^sg
z+pXy3oZ`t#r`6lOkUPF8*M&raJ%i1#mJc)ql5)q_h^lQ~s)r`cQ8qaz`Q8US2w79-
zusJI7zQqx)SekS$Iq(57S?)N05DQP8-po?@*k%`+1zVMrfxhJr$4vMoaX6bt|AI8E
z{4Z6^JZwF@XRkPT6+HOI4$S;4pLE7^R<I!1n&uSsdX;d{m!#MB8<Nm5@X9FAeA(dT
z{6-{pUtVW&l0x!zFKo27E4p6pz$Eb^7M_fyIQbU$rA@hG$5aHZX$CrN^RX0mHy9~Y
zHQ8lWtGaqUo(3`=sT37&r67NlC`vNiuYdclckc$=_*Y)`|Kkc)GWH>=wfSOCUR=I&
zu=0K^f>o>;=7-garL-QebI6!__YUSDESAZwY0*84>oY2}x8WOeQ||F}A#Jhzam&ab
zDw5dF4oUz^zjt2igYRO=1D6p_uZpa6DZgCBMZ5p*vA(epojRPy`9QaPa_#I%=&K(i
zl6{>R;Bdxc;|nrhrC=3)pDO>DJN}c$aJaWdC0Ciga0Mxo=n-Isb&B<BJ-+I2`*lRg
z>BnJ5BEH2+VzV?_Mo`#B|L`VhRbs8}fcKAq@pN+fGc}W4#zxvV3}O-e$5+6{j>{R7
zqaF~uRg_=9DV<M7Vyrz}R)|gO&t*g0mfy+-`gUW7?{)7ycPODKSae)R!^x%rrih#t
zptpDbv8`tfjh?&gPErw`je6UgJY{*>dJ%<+A8a+l`0QWL%9_%CNzcV;Hk?3)VPT8q
zoP)mI${41kZ?PV=zD2WA1&PM?A4DalYH(EsHCsl?kz<(G^NBVioCc(fibL+y{pz2u
z!f;o7NiuJyhO|qKdERtKjENdP*xyN%H@|J=9jB%AgB}DR4b{IQrs$)HV&<-)u+j-A
zUav|=(g#|auX%;8$+TueOPa4)uU=FqzI>)3sZkT@hD}kqlh>)3GzDKTnxJPQF^(Ri
z&#T~-109)K)^Js&VV*GU^!oaw&wkyeBW=f!q}1~J=$xdfRiw_*)x-y-4}V488r&nC
zRb@xNV+YPz(w?99(tE4TA01fhnMV*8&IOKR*^P7e*pE8$pB~<E*$tFRF~sk;;P1;H
z&yj60E&8j$DONW2SzTG|Nqcr022KG>QE|wc;vMuorL<Xh!b5fh$hPSvy;NiaZf%!|
zZ^Duq;Ri&XO1_G~=enWuC{n3d6J-;7FTu8ew|fo0wg2DdtOvOz_uNMhVH<tJo8+-0
z4jwKyiqz1x+9S)a{h4xWM&Ri;EC0MTANe5=r*=~}g%_*g|Coq)ia~B4;S+t>rW@qV
zgOso%#M@cE8~)h98w<TTQ*A%zsth`S!$?R_Gr4%MT;z^RFf4-2v1)mp)v81llj-lm
zjtpM*7|o^qq$2&mgY~P*i55+M_zTM;Z8MrP373{h?>J$e3-5Exw5(%q2V&vC_`@%=
zKC~%E%@mcE2-lDu1~L@kuw7%IX-@>?K2ZD(>sWG<fpT3$5b<_+?s&CVU>`w3emH4L
zHF2cA$lrCo`TJ$V8qQA%E|NMm{4l0({rqMo`e=nMc42nx4B}3*VbyADlTm)QxHNcD
z-fyH0Vl<V7N_i_%Es%fze{>7NDAA;ptE2SVen-k2i70AWXp%e5jHqfEne;r@C3jr@
zU{?>)*dS^%K?T-oSwL%96HspP#FsruQ}2R0n~d5dlZwrIbz4T-O}cfd_8fjv*6&ks
zat(F#Ib=@elU#u>cH#N{P#vNdJZz*$LxfMZdva3ussLMTzO7kN=cS?bf$}_uG#2|(
zjWx$+tMTo2x0}p=ICJJqis~cJ$Gujp(!Gx)cMCd<qMP=8>39<9dF!$DbL)#u5=Q&t
z8eC0aGO*?%*Ac6d*INZ-??3DZD)=rC8xOxURih`Ox_q%8R2?2pO&mbom(m+|@aVEr
z(bH;^J{=lFk;kqNE=HDG1oID6dhMh5BYRyYxk*oQ@%vu3+LLmpiuUgRkI`ih-V!#~
zaTh{Xb@l!`PLft+kfjw?nEu3#GOT5N`x8+aEKd#doW)$bAXlv7mAjthpZ{`U7#=M5
zKyy6!OdktuVeYLlUP8jIjW65!D)Hr42WeLwdWlmL4uytZ!{7H`#G(Vo-?%>Cn{r8i
z`9ZcS!J(49Xt&nz+l3u5=>ewLi&zu(!Ib@5z(<<L|Fp`1Qfs|R1=%j^QiV?2dlf{n
z=CI*<Ic)oavb=Zyj6!<3Zg(K%@~4-vQ7Uch1W|;>C;6Ez6AzZ=szf7|<c)oRKydFU
zaveC6?$+ZDj_Iml$*>z%`hmV)TK8V5T;-Vy8<0k8{74Z7eFz*vVR(Gq#sV=at2O@Q
z=}$yPmG<xdMNuF)X7Gk3*0)s;?HJ2*yIG=Hd#EiLDdV}&#gQJpUSliwMn0+0uq_1y
z9ux*EEmg|*LIx;$)TjZcYXSC7`G@7_d-rn|<UInW579kJhjR~Wr9FG3>iavcj+<g2
zGqN(8DWlx9_F94xy;&I=dWyB6Z0ZW7?YR(OEdmnYG-l2DZC3^T4Z_><0nN^|+;THt
z?9@0A98V>}H}*3Op;S|_5?j^a(^+z9dHo$Hk(w5*()RP-{X3e19uNzU=$$t4Jcno>
z@H~eMHpLdI>iMihowPv4-b1%6Qq`Ty8EoNlZucduI);uK4@Zu1a$UIeCs*Y<5mB>~
ztxBkcE2D+kOK+Q0vu=<4bg&dLX(Sk^j5J=q*P(M;Ss|*(nXvTbr_Fw6g7en=MVV4j
zE)#jlc&a?<@l!b%GS4BX2+wp6+8uF7X}uqCftEV8sbY58x=Je}7~8F~Pwx2PgB_Vk
zjs7c*ArDp$C#^3n&SUi2bbX35&&(7eFO_Q7c=q*2B<3o^f0U2rb@`8!l}}5sH#uIa
zZN6iRxCY^-6^t6bS!oxwn%N<xbatR@ZG}4Ol^Zsbli>gtKKGDO93)4A<E&i{%Rlru
zKt&A+Dr$!b{_3FOJf|4nIPQ?~<l@AOk14^g|A@LVKl&+x@bG@|ikTHQ@u<V2sRr#E
zveNKK?lZ3kM3C8rtgMq%5DFf=b`?|4uT3A=oc}O;IMcB{G(;OFy|XAqFa9iR9M;id
zs@vrh@&R{6%W%CpR`oMXN{M}_`vV%qtx0&ea6GzoZGT6CeSP3YiZaHtikQ2(LaG_Y
z+-m(pJKL8>;t&HH1izloHhoYX(BwZ<S@Mox!LL$YI99SU-RDLm&Kg2*slD6P?dWSk
zc7e*Cqy_lYHpCV85t{~j6yyCq!<Vpn_v-TxjHf8`nv40tp;(Fe{t^Lv-Yb3QzB_mB
zz-0lW^|bwp*RhJ}&w_L|GfG?<bdbw|LSCS<OZktlUi>_1UUNSG>RcBX)=)J2b&|Kc
zyF2o^b^D7ul872GnDmrmUZDjaPj0_AxZ*m`WRAj1uViHv#ktMQ(;OADZucPBd^umG
zM0-YGTIAw*$B?#O8ZI9DHeSXVWB!;{-k3^9E|)lwHmNk{HM2}y7jw9l{I2wr;Pr3*
z{+zY(=s~v7&ddxoy<Sac9`I$lfCiBnw)<7Khs=7^G{?<}3)``U!>FVwUmDDc)uK4}
z84oQKnATR+R8!<{`UcJi`UEH__>Q&(GdFZ=NF2PfbIR0!n?7@Yu3D-YH{1a#kOVf^
z>|9mSUY)<4n3;<n?ff4?QJBE??Nq!kRh(_hIapb%GWh7Kt*QfjcIYyVMVM)&q?S65
zX$_5dB>MTRwn|5@7pp|P%ybKDb%WO_Yz2QFle{Ep3D0iE>0dfK_lpae%hMgJe(dqB
z(EeLpM2)8__Bv+y=F5Va*!bwK!qUi#?AJsRX|s19ZM5+}$OOdFfRR@Yr^<2qJfv}@
z0~EY9zXQJg;HxD?Vcu8)13c3TD9!0_PPqBZ(mHsq^xj_oC>^|W*l37bk@fLR8o@<S
z^R&{u#<#SI7Xo(JMAkL@9Tg~sIoN7+5EgXY8hE<*x=*)VL}HAPu7V*N$*9uLBTqEo
z>5CUHEQ`SfTA~5t8!#&@_sVl?*Z!fQwSG>wL1};NL#_7ukohsUQ>p5W6F=|4<jtP6
za{m@PeroGrx`y`})=#c=1fQf5zgntt!c@L~Mb@n@Xmg#nIoc4at6cu0_xMeelTM&_
z#Cp`br`@^7sCsV`14#a>MhH^aV8yf<KUsb^ec#di(&#yO-crtgvw2fupDKd;r;(H8
zQ2$y#emscxH0ACcQ1VhR1>fI%OeTL=S*<A<9uBBurOcS*1_lHiJS%7{3^aRwX4z`T
z#4WXwV1MzWgm3Mt1=&7#w<^x0?Sn~w*M$&N8{Vy+i?t))_ALR~L>8(gr_`ChdLq<s
zv?q!&XE|ulztC8dvRT8c84D&Ft~~I{u2@JNyA>2+=wOWI+bvrn)|@jkGcH;h_*%@r
zrV9kSE28InKYaLbqX&C8UUAQ`aM)E**A4c{CzG%G`1u@Apv>=RJ}a{CnWz3X1e*qR
zagCa04PqO}rnczDucR@FxjEKx{g$E`HT$a|0T7eBOge%bJ>ftx2;+y}AaC3`K|o@q
zg{ugKaeXp-#3R8?n?Rc#dHcJ{vE+;1nd7!01s**=UqO(|uUwOck_bb)xm2ABPz_q(
z_V3?%(hMs2t8;Y&#$WyS_+IJDPRFL79)>hrn<V+3wEnpJ37WW>{?+rQ+uVWw`XRs}
z*>`)UZ5_S)H+WjZq$=#B8QQcuT5o$unuSc)d{I{8!Y>j=8yk|MGHNt_<S|JdX(uj7
ze-Ot|7`puTKG^nHjrhiuM|-3jrykv}(e-NcKkv2UG3!FWW%A)RG3LuCI)Mzt&X{~e
zeG8n4|3rN+|B}$Zs&}IYSL|5VIQtE>Sm$|IDewg7t(@ENS6&LAivD8jpw~0slOLb%
z_;|Yz^wm3BcfCp}0zCaLqj>$7(y<L@jkN1V7=G>e2A;jvq#Tv+d}_bqr!i{|`tO%s
z?_1ab-M}-Ewu;MJ6N3)Lv;R3QB$~YM_2w9>x5X$kGwF<M_O2MX-sgv2z4zk&1>r!%
z_;&XwEqMAL_yu(C3(_q?^6Fj7bz96vCHtiQXON0XW?$lntdEmOq@QV2)D>zWtwirZ
z5FzIMFBERgpU57r<o?8Z>S1mWHnw;x!wHT;J7fJu%LKo1vYmL-apOdC^O-&~Pxr;&
zI9y%-AAFrqKY16V*7Wn99#%mPIno7227dE-E|ytnbzztUg5z3a>VaJtsN(;|AuvZV
z6onthNzp)WZlw7OLT9=y5MB3nb=*tX3AJ4gqWo}Jw+yIa$psmi6f8i8^JCzXB3_#n
z-WiA<qJUyrv$5ALu%)tF?ojm2p~T|x-$^+o=UdZ4F~J>q=S|a6LIa0$M~8W`iXM*j
zbW{2J2^u9;H8uMc4~Z6097h+;9_YJ7<82Tp(PJId5l&v~y#x(4=HMW+>GrP?d%mjP
z0cqrk^7|RM!iR6vv3(vW?Yoas@B4#&l&IZSm{ffH;}anw_5i2ORmJV1R&29#d0u<9
z&#P@uQ?M=T=Bis7$oa*kAr;u=<1-BqguPD9=ms3h0ESoQq?OU{*H;Qley~EBz(Bf*
zikZ9{f)*nrcGvwGPwLYBJ(tczkD%sT_Syn0p*1J+d&e2={aH8H>NZq$!A&BA%W4f&
zb3?B8XcpX6%;et?c!=&2J>Oy-JKoWnU2oXMi9+ATE{xS9oOBj0VLROhG7i&D9y{Cf
zA!y=USP#&9_y6Gh&B-M!_}Ee8^Fynf*>)u-lcm@kK6`w;E`q(0jSS{k_H(;@{pHer
z$dRlyta6_pD`5&M^7(==^XvJCGWo`D96<dPhRE_`lHeDh+jUBN?<K=eq0WO;7JA!7
zShd>~h@BmBc}Yd~=xP*JeZRaIp8&E1n;j1KFDpckv;&3Q6DPyZ;;w&rnr!vt3U&mu
zVPg3e|D-|1VM^rSv0bVe#w@aj)mmJKad+KB-AVl)F)w~ANVIe%)z1D4iH#mbujeR+
zw(^xCpVoQJ9cNFQ7~P`JSVzY3JTYs#T0MKdV1hZ6Fj1U5(X@`n<Lq>kk%mq932=Mn
z_x4zx6;7za+?Udd3&%#?PAT6Q1`V$()wbP=A(omB$J=nPOxc#8%@u7qnNzT8k;qeN
zTkf_I3=a<jWVq6!Z>)e-kkgU?PHCJ-RcM0$<9h_@)YoJL1Y|apc(yFK4foRL3$@gC
z;PNMs!+7Uy*I*7G+sakWVfP+gr9Kry3nDdpm!=!&x+cZy_^GMkUczbr54YJ!D=VwD
zwKb6~L6AahvSP<>+mPas@vI}6_knYDQ6mKVx5)7KN*!%gj9}#SUX$T3+#DTiByoRA
zP;qE_Kh>nDxMxij>%}>Y&fqZ@{O#Y8rr?Ps)0}!Q5x=JM%=;&jU-aI~Z)F*5zSb5T
ztyh8`X4??daNyh=Aook#36|&spymgmV-fV}cbTQHU+T(cUypQXiVR^jut`rnM88(?
zo+jlcQSaO4=a=Wtek1H^8dmnH=Z$5`FcAafnNeSO+-(uwF_YjU-{)H*3C-LCrnpt^
z{ndP%iIr822*aix8FafPe)37YFvyc+F4@=X`=$`O-Fv>hu<|0-AVa-jtu*zB1Gjq*
zhD{14THjUy_2g8`hYcieKY+v^L)%l=pOD>Z{iX$%ngzq2*gZ*&r32q=Pb_-Th#nzt
zymKzcxR6kkeIkr)%1gIkJlnhhqX!xk6{>B`ziuC&{)^EYWTAO5j3udz?h-xW`;lV2
zCmFdI^}vlp{!Aii^U2dZ=-hIpd>{L`C=6*HmxGV9^|l-2?iW9H*3yDUk*5?l!_hCm
z;}BwU?{xwB-)a|P^JaqH=G4<Xb9sZ>z&7wiz3pw$f87H?7~|~2N+(1vEyHD%?fFkZ
z%Kx{8Zk2!a`7`T)ABZn%;dVoUbHM9~3HKgwln&6!>VuIq@IN|08ng$E!jBpC^I&nW
z9iU!8*4V3{<@a|wdomt5lUP^NAbO@`*FlGoK2a+YkbC!bhM?u7*Or;Iezq<1vyYEq
zi6=1s8O}4XlWLs!lfIw_bM+Fx0wJ+}&iv}ZApfZrF6cgvzJC8lg37-0ThAxW#D0YJ
zzpOB9b32-jSYPTu*6asIo&QT|59td0&N~z%*1BSsL$H&mq|7{TBhD3OGJfYHruQcE
z>$Y;R0{Hvw%%S-gzl+PPz0ptJH9W2Q`&p?LW>NS4i0&mXdKR@%R&f_3a&6XR;q%a3
zaf+sK?BKR!%?DJmQHR<RKzH`P)NH<d-!l4J*Uh)Gpi%tw;i#pA6T?Ej?&k9BPwf-G
z!P1-W)`Z`rnw>Y@>CO;^q-~MCb@+?1eHXy-^ZycRz>+pj<Kfje;yK3XRdTK&wbbUh
z^=bR(=5xLuq&|2CQZ{2*B-YHa=tEFJl8<~Zn;<&)`r|gB^;e7hoQ3RBc+PBj<7d==
zX9srs))*w58G)|oKiqe7rY+r?=qGX;Zrn1=t@Y>fW)xLfK7hAhdp!$<0YdxA<ex6`
z*z*Ci%sI8NlUd{AZ+i^~2Hu{z9B?vmz8ZQQ3)Z(At^>z2bhdro+wI<W+SulyHrOd?
zBzI~KS${uXTzGCX!mR|D!b~YVm)Q|mzd7R>D113iqI-K~)t3&9Txl&{aEO>%Cd9_J
zypUe!dX5{giIjzdlr=VSxv9_<!zt`uI5=W(>&1CWq+ju%#Hge^X=yr8F<XVXXNI38
zY^<!^SV#N^I$+}kCySrAB5ohbx@@=QCEOzo9zJ_CRi~o<!*cbHlfczoy?EOG_P=7}
z9$Wvn(+w3o53zG0Pf3sSR4HcIq)SHSzThzc72@0&8<SUEoqyWKVWzrT>ZI#X#I0Kz
z`JNrA3TZeR=zHR74mANB!<_&Rx`+?2fctiD-+};Q=9o>$OXkY}w)%f;y?0ns+4epj
zhf(I*7-tYr1av$Q5fKFG%`%FIDj*<I6{Ls|ArwP9C|8|91U;cwl_p*39UKHa(v&J)
zA<`k52qA>>+ez?#?)^T${m0DnU~;n0-fOS&u6M2dzs`qV{BYIM$$ZvCiLT93i_Gvq
zcenCow~4JX6?Xnvm-ZhxaNyXQ!<t5teV)>j&SV`V{d<k8yXx2rd-Hj%rR7vcgre{3
z9VtZ>R>wsaT5$E3*@BD!N&a!j_i;^;Y>hX*B8@{+_#qauaqDA&Vm5RoWW{&#(zc`N
z8&)1~_IB9#k1X6EwnWR!vl0wfncf`%z4E?E0W<LnS?{_=`)o%FU0f|CvCEAbI{qBe
zMp^;XZ^EW*{q#c?k^jFC&AU?)KbN=jk`C-STvlMKc*VmItzIv)VST(bDXA36+w#TO
zI9{|-T}Ey3InU&Qz=;~3K)2bbty^069ac)CzPm``1O8c|8fJ%{-H;oy;1<o=?cO|E
zjgsOOCow6&u{djsoceFoA>Ut+A!7)mCnGeAml_2ZF0=lb)V$TC;&ii)(jzmdY<hK}
zZt^uLWi6&dj5zeK=DDix`l*6Ag_8=Gf<DI_56Z1bce%n39dmZc@hbNEuIPl-J}<&u
zR66|7|Gabw4=%QG8#<@o=>d|W44AXH2zgWT_$Lb?L@r=G14=m}%V9ljF23IVRC(p<
ziUm8=c=1{LIgz!Lx)pgPgX@oZSbWhkw^tfvs45@3ZV$v64qJhyP;Haz6CpC1*WG+A
zb*IaxjR(lkY}rtsSL2Fn^n%t$-<gy;3eW7rcAit#VMC7r5t$9VhL%ZfT1VAQVQ6G#
zLUr;1K`-AP{2>J3{}&tf!Mze74H(fJTXhIV-ZfHPP88IX(88QF1IHirjRv&xFx1P-
zb6gF_|G6i!_MrVh+44u8=3_P=dO%aD=bmOnR?}je7<1uE3wms$>!A!{X?r}PGx+EF
zn;;7M7ACVGsRWsid?hr8n^DYL?kt2n680G`I|A3zQ)`WNP3ZsDSrQ%o`f=5|%BO8`
zWUyE1>spdDo7N;cLShu|-0k?a*;<+bnm)a()qeTPV}+mhr}~qHQrOH{j&TI<kfHb4
zmcr58#E(r7QioC&poqPoH`D)(CR*~&z+C}`DBn&bccSU!<O9hsLs`4Oha?c@KfWSq
z(;H>#oLSEDgurIYpw)MMHndMUGJ#(*nDjy3^O_sO4{GbCqP5*s9kIJx=L<CGUs#!n
zCvaieiD~w4O7__fnPfqe$vz)4fQyDO=0-}2TskuD7^8`Sopi;rvW|^7trkR7Yo^BS
z!~Ky5g2!xz`iUbhf;Z#dUV#heU-LYQ(n<dw+2b^)?6Wx2P#FQNM+hcpkl-u;>LbsO
z@JcS+!M;^Pz*yZ?neT!tLwBDDsnNt9pbdG=;59$}$}9KX`=Sz_z2yLZc<OAv=@D^P
zAXtS;fs$bN{q_^AeFHDA-MYOVZZvU}ESy)l!=P^Y`J(T-12di+J{t6`MW*sbaYc-k
zoL`n9YQ-GSF=H!V14~5&3kK?Kd$H`<FB%Wxzcp&?(-ZJLHY@pP^~obf7fUxpTHkFA
zF1)plbdGTH7k_v4Rz59A&&sPSA)Ou_yVr7F>d=9*=nT?Y)H^$u)0R$Dhg@Eq`c+Ec
z`*DVjHxt<{`>;j=BXHg^`^bWd71+oW@=1Pn;Aj_pIg%0z$>@4^U0o+iuwP5opn32A
zF#eiu>7pqR6JhNqZakq_>>D`dTilskY2iVkt-+ofHGId{zF9Mh1(SGj63#|ZuJUyN
z`~UQHPV`&(A?)rScX9P6ztW(M{plLAd*6K<xr>>-d(X<g1WJvC9^8X#lPQr+&&ljx
zu0N(AgR#)+!|&#u%zw}ZFkNy$4x5bnAN&W`YV-(RX}-OVhuaN2&!bBaOFM4xWI%W0
zVLo?fjfwJ9zVM~h0syn}m6nz+)vfl(48NS9j91M@?Z9PR0Ng#myZ}kcy*=A^3W`r>
zgHoK>ZSCzBD}Iq>>g@AFc7c^~e9}B>9tGT!dS&U&%sLV)mnp#vfp)=~(G*E|WxM_+
z?!=k8)rZHF4GEGDO2Ct5g^E%PX?CbE`MW`2@vEB2d8)>uR7&00o9N!?bxX0@&!HbC
zY!)lcZwB?u+Ptbr?gzXyQ>lfl(yQ!fSr(86&w96WeB;(Fn^yM5Dk6)GLL^hP?9c!4
zaTettQ-&Z{^uUV~tdh_6S3a(Oj4pMvEbA~tE!|g*n&mr?rsU`Hdq4kMJcngVTG92H
zr%n$Vc?sZV*hQK3<nzE4mY5*I?lP)B6Pti<?)c%5<EscKXIo*rYnq7^6mm*is>|Gh
zjMEd~bzjt0*HagG+fU;Wm^SxBklRqNzMC}q^|KhaVv@ZeAn@2pM^~@iSA4we({y}@
z>5eWyeRxUneTg(L@~1Ba%*I`S{@-BQQ8lF^tg5QE^03_`k{C|%>!@f>EGbgab(d1z
zf%AUGmL)jU-|hwyfGh|5m4m{&jLv+BPe9}+$2)-yVq)*!*JW+_y^Od#p0QlCJ$O26
zCNPDY_=r{A{@<0Gv3mNjW=tB8NjB3Wx)R!-Nm!jUZP8@Oq-d?Lr;OB1-4`ohIaXL@
ztNLO&$ki4pTY6zZuT&r0VlY5QhQ`}Ri>vLwt@_nW-2T4vd(;wR!Sx8=&XY1J$e#p|
zQI7RwZ&ot9Ukey7gt<<_t>xqTG+TH<`ahNX?0=OXxeHC=E2OX{BgZAELJgaS!}Cq@
z;cq1}Hl*$zTh>xMR53B*8e{c+tVAul?U5NWC2u-%dudiIu%W-Mx=zbFvv={H>vE@v
zd1(zB?N6daN`tmdPP1!tfFF8as^~Rklia!*7LN7_{D<lgx#@w+U$jIC5VH^3NPOd4
z_g`_C?4C)eKZ=qK#dOE6J%V!3>RX}m`q}0+$P%iJQa+AH^jDO*BKGVIdVH4IP*Enk
zC_dvs4TyeU{D^+P-ea@1abM}P2AygFK|W{~U<_DoHm+d*3ofIg35xoh8ejDw#q|O$
z7ZMY;&$GlU4g9-AoCKo}$<+$jsgh@tb<6*V^bPraF;DhEnzC3k`|_h1R?HC-nL4J4
z)A58lhflq}Ru#`c#;DbTv-p?hHD3&@{l@-@`hWl6Ld$m(@JwSg^W6WOoE{B4RsvU|
zi3&|a>ktx6DMJJ7X6*H|M|ElUAi}%%5oOt)6_L|sfYH$P_AT;gibeL~kVyCch&(pi
zb118WMCws2<Q%sh4*SPJc(~DDMVG~9R;)e|7<!DG8p1q3J-@m8ywPd?J*V$}y1VVe
z8>8R*9!fPSgz9$BKKgCwH{VBlK3D#ExBQL}e?jO@XS<J)=a!Q0+}Y<i8k3yQLYgJd
zbeW~x$f%n2GDkE!h{>wfi%BLj3SA9x`6hKSCtUr}!(=@}&)ekw2t2b6cHj3!@9=!?
z%KQ?<Yr5}eT+^#NJ3c5~$py~z^UE=5g!(|PZV5JGAF}@)pPrD;pp48Td2v_d7!M#{
zJkte12d_MKO`DITEJG$bj_wy|1CT$&G~OY%<&+w`j`8c`T1a@?&?ebKXfHX3%S5-o
zXpS<(`=zi!ss9dX>p#-(LK{~`wUjX`Z`>d{Ht_wM^J$ctS>6<6f!ap4t~=@ew&fIy
z^XOZyWTbVD!KtJIR_oHH|F7lihnh=di8Eo8p7Y;f(W!@C5b0VV3&w^T7YBF2O9$pJ
z?yXSg%hUZ<7%9k*{l~_q{-L5M{okpCxgkyZKzn<5_Bc*<h3)984}ll^&bq?QT+1Hi
z0(A9A3M+<R>}a(TY}?2I8-oAk@cEy6R2|x@Y+_jPl|03q)YMc0_)|fyYRiS3o*ULB
zSLPq=5IjC~#XI`RrJSBhvX_ii`7Mhci}S{LW-UhAB2kbEYp#e8tLE!oRl_G+keWI^
z3%;;=rswo|V_Vx%3e;asqPu}V<(eW%PXBIu0iHU)R1*ya1_tUzXs%3UvjHSreYmnX
zW{G~6h$BCb&3uxB9zZD(i~ZlGPQYeR|H-%GU<0i}H+qSddqe+;gsn@mx-#6T?bW4z
zV%vjHvm=b#<##5}{y*}tJ`@GpBvZ=ZUQ^)ovF&f{sT(B&1!`()F=k2j{M9np3^bap
z`u2!2c=K^rI6q7E?Jxc}w6&XA<m#fCgNL)sa=Zc81CExqT#8VeFE*)?_WDkR+b__n
zvO~gN27;$K%^(uImg=5X**!N3rlzJoYGL^7cDYWo+{;F~w1#X>z<r8G14epd)Yl)Z
z%u}EaJr8Tr;Trh3*lVl2?-XcM&(j$-7iXTv=6Eg97iXv%W7cK06D~V?^`=KO>t>Fv
zS^F@0Olp0<SQIJU>{tBaU!XqU$=>qATV(wt@Nt@-YJL2*gmIsqY}Vrz|C?(;oaYj=
zc`mvyuK7A(NSnFlm~EL)|CrGQP5^#*{6%Vb<q7PO>7<YgJF_UoT3K1pnt72rkY9fl
z$U!E)V(RVTh*eXt;hkFrtzIf(EOsBr;z4Tv20tV5)<6H6gh)>Zln=XtPuqgMjVT>u
z46sY`fH*D1Nt$FN22MSDP}(zgNze+p^?F@IM5O8fiSop4(ces|XohoUW$QD^tJa~N
z$(fO@YpPf?*(%ZD!&Gzjn>9H3$=Kw?4r804t|if)qLyBghP={}qduX>Vx`Kh(VE;*
zJ5gN$Pe@c0&!_{Z`~1WAWj+3>IGmc@C+7QBeyx@lrrdgKXZuipj{g<=Vgg@LGV|+P
z`Dg&W0aMbl^4^JSs;uo6y<B<Yy05Rf+tQGzAcgw$inItkVVcAvq!AccQVS(yx1UJv
zL0wFpICBR7(V0gbsQeGB+Vu->Jgyi-1D>CYJ8#l|rnH5eNOm}jQp=8g5b|zcoYb6I
zwG67FrXr4Qacg%{4KAB_i{d1pMh)2|?~G-}&k=eAv?^!!mM}}6jt8pb?~sN0X$}DT
z^bt37wtL>MfYnKmuA?F7&_%ZcqJKApE2|>aw9Y+hBcD4o{oaJ1vy6?SjAWk;v)6zn
z#4Rp*KUS2@t7X!a1FXS8Bl3;Riw`1XJ-AQ<>qMCtoFOr-TUZgK`>ZI)|1|1my3K_L
zsKWDThq*}FuDN*1M~IrGdO`T(bi9;%VzGJi9>ygRhs1=GYp;cajY>!jGr86kX){70
z@l~^$rrO*ku^VF!LLCN$$1ts!R_jRMVjef>9KLI18k;cY7rzxoYGWyu;zcq9__>GO
z2kV&m)wP@;TDi5~gq!&g&#80!_cAU&7HtY|=b!A|$eB4f-mQ%WRL=ZbU*7%V?JcuJ
zJjci%-t4&ed)pq^#(Z?c6BWD^drx~RL~QMn+3^}Rtqo?y^wiwV^&Q)cW@lTr@M<b#
z22nE)$A%+{FArhF?A<5AlO9uyBsc2S&JwLqL2;6Q&*_2sEwE;kLm-+d4mhz7bti1&
zpMR2pZO9ZF+Mkkk<YmP{Oj4X!m3f5cN{qufbl~FMh|@)=)f0*c+_Z4?+jxT{Pzs(`
z*-yfwRw)!-Q(hMy0&H|``5sUdMDw&Ga>&m@rXop6aVINsz{<@`y}!DRvv8+c0+q2l
zu)7Y^J8Z*fbfCW!64UV*9=HqiJPv2CojR6$en(G)mIxNVORCEEd*SmE;XW_7>EV+q
zaIc%yu<7hj>A2WY-9nF+m3--%1PMZa=~Y_%qSOQHiSl$`It3J5gg;8?Lwx3^zDam{
zh4*#r)8p6izfUz;wEUt`e^}wNM@LQGZcg&1Sc&WO>7CRv@H9h*(dx{xV{^g2HIp^W
zuUdf;MUxti4<cTT)mj$T_*!P@#i`!KoOuFa_bk;n%BAYCZ}t7dpV#@%8QZjcPDpTY
z1wLB84E8RvE<XWb&D)yGsi|OOvKLg5i=8mkGrDQ2+ZpA+I!N@-IMQg5M5#kpvna8q
zvE;G3&nu9xneg=?%M{8IWNr%NGFQ*jusZti=URS**H8LE^Mi~#(Xn!FW*K^}#Ri)W
zKyi`^yj$1f(b#oyqG0Bch3N}&(pbia2t~&{#E_N)@!~69je$Pv?@Qb~44s^4tel{V
z=5PVV&4F?c+S)83B>{>V{+dv`kS`h7fDt>^7)!ZUbvFhoYh4B<tV>8AX9>e~OT86=
zS>9H}<_V0ETkAoj+kTsr@HW`ri~OFtu)}CT{x={?FiJHO`B})kSE0P)UN_ij1XuqT
z7Z<Jn(<>nK%+G?wJoRsG&HOr98$(fo9W$%LoNl1H#>cjMXp`;Rvqtk<KBa5Gg#?tZ
zmq9fkd2}F|M-EjV#1eETmUIezQ3c7+ze*J_4*t%TBv~^(eUO-7OCl{E?KhNQ-bSyd
zisi^9!MpVf4<eWtInhRr)db~?`H^r!h6APLnFN2&xz7c)sj0-~ptaDwEmdXt%ccZW
zoiW`kovh&MNWDd~3c#L|e0$wf6bK{LZO!VeSk`@FE@a_LWw-*}81AJ0?J@6Cf)=tC
zE;>m`Tub}xc(wb$W$$3cv67!fv(8VRmA3?xZ?^q)_UBsY*uQ#BL5MCy?(Hsf?8U1D
z{MEc_fVP+%i@)gTQ@7Tm@5s<8)JBElTWb_CY;moIJf!e;C>OHL(V|wsK|Pdm&dFi_
zr=ce)O$xhzT68p#G6Ow;RC2Lb3nH(r>`l#4y0I12+vwdxf3sp}Pb#wTcSL;M{H~7W
z!7sC=H{B+UkK(qwSq|~cI}a4Q#Hshw+^(12>__t~%gjW0gf{jk@hPYhIHy8LfV#^5
zvG?wkXtf$vhUR92Tyee3tff2%HYCs8F)ZTyD5F<s8G26g-FF$Dqf*d-3N|~#(gn7Q
zo&*^hdIqA1Q*`S*nX+$jvPK<yCt>j;W(ofL^DDOUxP?YQ%xl=3AgZV9>9ND}k+&tf
zs*dHLbEt#Pn&!Yq6UIkm_O$<jm)UCc{A>_hrW$zgg&hXH&$a1uPFhtnLiPi`we+Nb
zNwv`|)orrto5<@GZu24pH}4PuO-hh%pm=eTeTfGSC;G&6-<5BlTp!%7?lOsFwHh!V
zC^|v?i4Hg3?Fd50LUw6L3N#!c{)tkT1~&q+IYhial2Q$gy3>YApxJnJCHA7QhpdmZ
zE|7Z#?5d>90`s))Z>9xO*au*WnCGw|JUKuWE6GECQFwA-d5Xteg!M*nsAe{|q9~`m
zbF@-gSS=>c@<UDFAaDWZYByH0={VVJN5yhOc53Rw|Gorx2aCEjL5Y4z>|H3RI=wU>
zztY=UA{lxcm^4>8|EnnAb`Lt_Z;Wlt(VYOhRbIPs3P^xv3<Z&f{m5RKN4~i@Frb25
zE$TUV!5Q7leE}ehwapO8I#ezhG4Sj^NMx^l<D%AeafRPOkhT5?CT6@IZ`BvC{Cmf!
zNcpE)^8>f%CPs4m+1^=_{~949@RJjs8s|`#E>=a?0v={|_|NrIF2y(w`2QRne2)L|
z!!aAcN+E&{Z3z;)P?$Xc(4p~n6Ng#>r#k6uEXyeLZc4wTOnaP>)<`1c8h?QPTJGtt
zebvQyIQcO}cX7>JiL_pXwgNFh`C?k<;~g9|#zRlaD074ryioApj(t!{Hg!WYM34bt
zE!tY`<(|mZ(6QtYWB!A~CT@v;JFWHZBKHz3dwNc|5GNC}<gLZFo!ZL|6;><$b7cST
z#5yY>7ibgNXF>VoEk<9NqZz*6>91yWJRl1XCbYIKl#S-@oO%ycWilUJ8I7l;t*j?6
z9(eQ}VmgOz<kQJkA1LLV_vZ*pueSur7<IxkZP3M#R%>e{H`>9^_4%V6^5|R=r4o%J
zh*yYX5vj$Qzon>e6d@i1*GDy+W0FaO8@I<uAz-GsR2MrBL)&dy)Sqy%NA?F!<QRQE
z#C~@D%m0uon?mGgEamH98U-SvR-+EcQU<@+C(xtLYJ<-!_juf(0;bi=*f{Z}QNu}s
zbOoSY)oIuXF<WHBl6>>V{|UzV&IB}|s1_ljbl$jGeb0-bt{$aj2m5Y+jp8pD)qvNZ
zJ1lgrY{ThU@d!S(O?h6;3n&+x39ujA-9%P_5zU0LhQyRCHp|4mYX$1t<+1eQP<s;D
z!6KCYVNsk&T$zvAy9!|=@RBb5k7Pk{rcdC;S4c3XH5mmC<tSby2lM!$H4ef)hMu<A
zc+B@ftz(>B&O4002m}#SGUXebj8X<}jDz3#Sif~jSlXC<kdT|Y-}-Z0))qGB7N*QK
z^<jb{uz-Y$EH(i-;VZJ<odSC-R98S~vx;(<<lm~<7V3Z8@Z0MrgYoQruFG)9SHmn>
zV5*G7cuEwA&q!A2z(HaaL^424;d}$yDRM4*E7&7UjG#|@1w|Nmw6!4Frzi3aX-~i-
zW6C53%0DDIxMJg4I$(da3<}G||HcJ>W2cBt*}HC1qlB(=&4rN64R~Fp@qs{rZl{GC
zKw*~U2TdYB=L-EZS9Sk(tF1UGFjVfTzs`iC#I*i5(OVX;4UHqWwCOzYec71|k#tb8
zUWRQHLTN?&yU^APuasK^btW=0lw(FeLWj8%#o<z2Ez#y~MoJV#Fr;-+oav?e+aoa<
zU0Nx`67N?Eu?-=@s9^C?{`pLQV{=D?xL1Mxwr>7C7C0eq_AK{XCOGs3*|O8}V4UBi
z-8GR@AW%8rBq;zIUE+d$e9s2DI-Ubnvp})xO43;?t-TWLeJ^mA^S_A>8%HuC_c8*G
zV9m1~HNGfoTih({84&v0bFH)^)E{W=(~3GB8VaBbm3)T<25_>CjuR)Rnr}$)N|1sA
zH{SCX911Jn%3JN+(88zeZs9v&ZR#z6JD<d^W(;oX-L?D!7#QOM1F|EDrru!ALJhrq
zS0|(v^Wq+&)d$%&?Vea~`jL4Tv#;`1L4!$J8=v%$Dm?Q>;6?~r%ln~ts6rAOjcILz
z3r$c{$?bRI_a68mpJCca6y@J5>-li>ZaH6Fw80WVU#ulYQP$vg-NJOX54PO*B+ZEn
z;%w*Xc*va%?l3TF>?O3v(jZpG@~?odaWU@;ptrv1Z|3t@@P$=P0xme7#fIjBSZvie
z4ey5K%CMnPh-ntM@e+!OY)y`QetD`85>!+<&VCXYr=(hS5s$WpFbEi7>qN>t?5<bn
zzfET0bH{uf5aQ$%5c1RjU6kYy0|{G3J~UdI7EJP5!(>+82G&><At2&pt%<}KYAm8u
zYO%*`Z=6=(8XwZv-*4m%;m$X=^7r*Ev5}*vn?<c$sQ{}gwWRBL16`XPL}=_2iA()7
z2P{?!dLZ_B{ba915d%07n6>`I#P>m4YdIxxta*lIs}H=rI*8<f?uEmhX+ywMK2xlG
zPLflu0-jNS_}fG1L0b9w=egyRiTvquQdjn5x2;;E9leYcGDS(eNXK8u`=R-$(lm%Y
zwWI{Zw>kSFkJghxpoP0Ablavo$>9dtw%38PTLYV{l%~+FaCj~iQODGB9s*Nx=_V0%
zy{}wl_ZJc9qFbTAC9!lTRs>gbT|8R@P55aiEvF_vL3R1m4L4LQx-~g*jOR~tpw!9Z
zKkU%_)f@4)UAH`d;i*B9xhIs7(-Vr_N}?4Yq*}0uqkP!w^z2@H^$NafgO*|2KI+{&
z)Q_+E`o`3Ba*N$R?EIu``T5CnML(K&olY|4`1!$=9pV*oSOl7Q$peJSPuHyCDDv?7
z3Alf3KOaQ8gf`=ueq{TRSc)$!pb(cZOsKQihrCZ9C&o_P`%}#D)rHo1N!o75D}ZjK
zqKYl(hyRN$C14bf5KOELzm`Z4Gx4NAwE6niPSI_?r$T3?Goo6DqA4=uxoC>kmB)Xd
z7@H9{?^t8*svDr!<+Jn+fhLH347?VCb&Cm5eEK1qH}!<YV%$k1!IdMBcH;x!uLs{)
zOg};;+5J+q;r~}NXe1zP!oO_Q=dkpek555rIWEb;J<!rtj`0!F%Az6%&$-Ol85k7$
zhMsd?&jRWf)<&iE<$f%3o4&y}o7K<y6ZyFWbx*<tTHeaKDJbNVV^w{K0H~(yqfr0-
z(iiy<oa`P2Rhb)J>l{t;vSIW1M;~D~?jQJI4cCG*HZA$iUp1k1?F1GvQzWd*7E6NJ
zHZMIiWVZRZ)B?#GK;btHXmgP=+r7?&^1;?Alo^SRAEcG}YkuhOWOXTw1lNKI6hREA
z0&1Mx@YmKDM&8gj(C_KxqT@`UKDOYTOOm%S@(3irS9#@fHiYF^tj@{IzUMTW1J3r*
zA~JBcozR;(Y?E1kxzy(uc@QAS1K;4GF<7q;4nDe}zdh~IpK$CWWM+KheJXlV8dCzt
z2c{*1_y<xshS8vcqj3rG4rP8#s*Wm~%IWD*OElmh*2;fQ{d%KDiYxqlsV8nMKEzdS
zSwT=2tyaRmzyc*l1ab8j+1{s+6*|n1eEklAYS>uNIwFAMu;G4h%7*F=jLj9zmWhDH
zH+c2*eInEXj1Xhcwu=&L2-B(|zLRlke_#bOtO7k+D%#ITyPP<g0o6HsT5-h<Clrdo
zyDu2=6OBR(W6zi3D~@5W_f_lN|LpIG7NP2@*euG9*`lHm=<Xh`ul9T&R}5v8J+S+2
zH4oL)60AFU>Xj8!Uk3_bVYfWLdBe-5duo*<%ytjBp7Yba?uK$%wHrz>+y8h0em6{`
zL?R-^b~N51nc^b3J!rvQuIglCorpO&DP8Q7@?M)fhd#eh3Y1F?JQC^PjSBW51mU=N
zO8v?>gYPqwvySKAoYSgQ8C0~j^$t5R*=)<CW*-jQR}!SvU$<tcOKkSm&DkN}^c`_)
zXEvqxY~2^)6JMj-vj>If6LZnj#FLR_$pf|<S_QsVWhZ@YsQ%2;d>b}4m#iP3xcRNE
zB~WHj-p!2REV}+LI6s%VftUbo4Wo6sg>vwy^S1a;?mC6UK;$&=?d^v836nKt8bOmx
z;YxXGZ*~!g9|kJRGgA*&u<IRtitoBF&h!k=DitKgLyTiJc}`6$(=`oPk>@Zv&Hk&Z
z%URoIYhCw+eeJJMhqVb)6M%%OM(3CNpJ#j*QD02yRzZe@aPQlDmC6YpH~2V8Xo?-5
zfRXp|C}>Nd4k*MNHksWYQ~I>#L+$HpzfR^G8oiar!$n(RAfdccW2E;ZaPp<m(N2ej
z*QWI&DHOVXcol;FjwW_GaB>Y#FXa_1z5M5=?Kb4sB)9$a%AGG$bH0SX3|~fS_J#GO
zpD1YgRISLDwW~nFX%u4M`<360_hsG|^D{utCLC~OzC<5G!yxQpL*_Z;0QpAOwQ;k1
z&)3wQ)}ORU7|v9?#KaZ(xN8opN-5<}SGzTixeS*2%zJf@uX|qa0ib}wBY|W>@u{`t
z?zkcEQRyO|?@oJ!mE04n5%-pNF0f|@PgzG|q5Hd+nhE9C<~#SzmgXk*mU+yksZr~$
z_udMRf?UgTW6frBypLHE4Lg?d^~pXIAu?WnNk$bMq|`GF=NlhzWM6F)$jhU30p}TD
zwlkG0iv0eWmycw9cu>4znMfJq7Yh)(`7DL<?2o5u2x;F%wAGL{0Z_36DHP)3cn#F}
zlVJ$S1yz6-E_n9+nk)vMVs|D^?z)a&nftrwN3+@Ca*j6#s}GU!h6V%zp~ndPySnmG
z43X&9z+S;YC*E4wqGjS1C?&M_&xFT5hO{_-YC58fDd{+l_Mm?jm)I})FVH6EeV3Pz
zk=!_A@96dQQGG!JR(*%Th&WcOtK~C^`1piBSvrS1e<k(aWP&wI*}c0IkC5KK(p6RU
zo$D*O{Hof&XUvU^Qr_dWHfk-39Cyz?7_qh#aGM_RVdawO6K<L`m*yd*M0;^8uq@Zi
z-5ucK+|K^<3t%A+yrdrDn?sb4b=mDPwSn(%72!@LY~uW3s+&H1WH?m9j?QqWh68~I
z*U?kvxNyPfjXeI`hmMQ6F0|!#c%r9lUYyuPzqoH9hP-+fo2x<(BvS4`RGB#cukm|w
zO4$a*?eoiq-7QHEgQC?0O_LmM_WM(7h_iWRW{610RaMHzz@kA>HFFVry=BZ?hMBS^
zxK@yPeI@rqNrumL_v*1^D_;;1V)kNn#N8^6b)mmM646>?=oZzK$-uN#bFo+pdWLzT
z^W5?$%i}Lp&j7M~<rfka&ru<tGo%*UQjS-s!L-=5i7#<70RfGFH-!^xJuLjn_9BE#
zrcKaWx4xm2oa5Dp;X;-sk@)dp%0-Xouf`V!W9Ht<RN>EA=%ELqUqAFmDZFa5pVj{W
z-3>0h`el|4rPjZcw%j<yDBPu+VF<D+q>c*z^5~y}&0LGWuF7t=0~SyxmHr2JIqU!8
zu5bN?k4l&lIT593BYT~I)(igd@)))e_%nS{T%{Ikb%Wb=jJ6d&cW~#RR^iMcNJjrj
z8PJ;mrHUInd$Rzh6`}p+nMVXF6|g9Mj)>xfu6FrV%DLjVZsl2Qjf+lJG06!(A)y!7
zyQamm9wx7nrZZE=pRMgH%Jg$v>8}m+XDdx)u#B-1n3W(`Gm9)$RpR}vS4hhY+Q|a_
z;qGa^wKc7ZmeGwh{ffHJ+Eak+?1iR>tQK056D?Duq~@O~C}u1Nemwkz>eTSp@))&N
zb)&eY*8lx+4SMOuw>NYF^CaHje`S97hyGu7q>Bc!??9j|Iq@PuFK;bE73!D)oSaBm
zg`}haedOZQ1>+pmpX-%BQCmK|l0HW=h${k^SPr>b`P`ijZ+%BK^d?-GfenRRKLsKl
z^`rDJkQyE&J7Z#6lO8*q)}RWTME;~8r-HdJhW#I&1eRS3ySi^xW8expenrsfpBV!h
z63S22NJ*i%iWe2=$SKB8fFP@{{@x_JV+gwut5Ek8@n4TZ`8cM@CzhN3y6+kYT;eia
zvX?36Hj#n$3`k3CY)*H!tZh9o$R9-v<?z7ycAV@cBt&h|ki_V-tOA+1K^bguag8C)
zhT~?*t@@t6_YpJC%>eBE+Z5ExOyq7i8Xyi<!$+6o5drR{v3o95{&ls9e-hju0SWIP
zQhK?}tuE(~F9AgMTkYd(uZM{_9H1S7OBG0~p)0+5+UQx6NX9XOT$Lhd*pngAZzZQx
zH5ybT_mshg>RL<yf|w0$AhEy<E8#2B9hRmSC#~ZhtjUvXGt~6==-PrWso_CgV)H_g
zZI4k?m}yJQmnE`6wklAoVS5d;RB>=9qi{nC%Q3008;qKu5_oXMRd*US9tmWE5}g;N
zY0FF_^E%eHWG&9>?R>~xz4K=X?280(r_{2=D-h4WiZ-fh6^ICm=ooz>dXxKkb%Wyf
zuBuC5Th87FU9VoeoO%e4n9H&5LlK6BxteTdW7yT2nwsgvp(tz^2)Uf2-pq`Ft*vbj
zAfN~TZC?f<WC!3->P`SgQVncY@&|vIlYC`npQwgwS>E7^Uzr&oi5vCEf0|uHqS8Px
zRi!xbtV00W%=7Nywz>>{7Mna45?N->sU#9&Ea-W5{_2zhoM_Zde<B(%KpP)?dne!<
z-$g*&$oA{rXbfZ#Pa8{~lu$W*uHwBV`Pi{I4OOfc(jA-R6e)psW=&o2B%#d^(*$@J
z0$`?litogzPm_dgSJDJE-zSmGP1$o(xb>O2i#xU6$<K`%JP)}Ncz?5QybZKCDTWfr
z2NEZCd|@ltut;&BpQ*h7_m)sO1WpN}6c_k4BrqqTbv}_|wCH9`?ib5E^2dq?Y985I
zql(c1lo5CmLz+%csFJ&9guyewIAwYRZii{%5DV&;#@3=F?rJ~vr*+rv8}2G=OO$)5
zv<1h3eNR=~nbcn2!f{l>j&QZxNn!xn+{YMArnK~cTUWrcMtj4xDsTEHGmb3B^*Xqd
z(3D;$s#M(U1-YEsx(w_D07Z~pi)(yQtr~|gZ^`X{8|WF;s>hC_da$P<dTvv%fk3RT
zS-f8!+bS+UdVw|wO^Ww-hhCI5*8H{_F|>>%Z`7v$h^4<g+K~y;Er$Kxx&-P%OfCH%
zy6ProI<@cX;))Jv)D~vV(-HAQD3Kph8Bekey?3JnW{wrG7h>MQAKiNv+*?$u(Dj6J
z9k{dZZgPWBX-WWKwFKcyH^HfAvSpQs@{mD2ahy1@IsFL1CW#UP3-HPHJ#k>H3^hq~
z>|#F({GzRsI5PqAh5E}J77Q162_4E&%$u*CzB8DCh{u_+VU(V*Ew+RgproVzqr%r!
z=TFSv*<bttJ3ft5fRp(JS9!qSc52(ADFEYhTXgdySAb46C<yp7B#J=105)6W1h!+A
zB?cB5_9O&u(BTnVITk>5B!E-i`k#O*Oj@arz<_DR5Q4mr-4PaAAhS~EpA<N6VffLl
zx4p}NHHeU&g5<Z}kzu%U+fZ3;=s^zZM^8;=FCiFix?DH)>@!ZS!_!4YMbc_C|5mND
zuMT4EF10TjdZC9Vkz1moR$JNd9(Dp`QpzDldUg4v3S4^;8Hs=_F3BORNPexND*`)A
zIZp-F00bu}+KfCNTWb)*S7eC){j^b_pwhL;RCm3Ye%y7^tpKDbes2%k#$X;3!__zJ
zQrC)4PCE?e-Q}FIQ^K1zHW{`_pqQ9)s7H3)t5^Rb+GZ2lZtBtg=HKCE-Ra<CuvTjE
z8tGVocV|-#0mg5%Rt`|ZcW8wmUZr?_$kxC}Z&Nix)C;r`NCRHFAb0sHNOx7|nLfke
zBw|6J$qt6t91-m#$$X{J%bOYYUECNc_M=Ta#UFNL7XtEec{ugTujH`i2g<B$h;AHk
zst{=%fIt?PLVD_uFOTJ}tj|a^2N<DceT<gve<#OMR#(1hCeu>Lpd(ls)MC7<w<%Ih
zsTHuO`KXpUc5W}YpfL7@<H>SDAO|9Fd(<A`xY-Iv_6#=~*So1id6u%L=Hw>wNn!v^
z5o9wOk4)=<(_TadD1nd9n$KC(O`NDE-d|Iz@8;P`kWe{@J%>7u#;HkQE#zF7#)KFO
zKhUq@PQa;u6{Hr)po6nc0&svLJJhcK*gLiQ0*~?hNd4lu>f!gnHdynqg9%D7=TfEb
zKL<__a$lL10a10ww;o>^WHUC2=+H2GZ+!I06(MMKMeW8STG0=iiGwt*EgF#V1FC-7
z`dV^3DO|_X4$TW`9e(UEYIg4@(TWB}&`Pw-`XXL{Fl1F#R8*8Yql^m+|IbdHpVV&4
z=LT9ra$sWY?7^yK563{+MFOwl<}XBZaTWK!ngje%>-)Ec@}Uw)L{f$sXPpu!+(+bm
z5GNa;4KZ0O>wwAm{GVg>vU4iF5hFDd3nkCg=nMJm6k5iIyL9$ii@FDfuzo<0O=ma?
zbG|?xw(U8@7Wk)#{%XKq#0{%aM{x^txxNHSF~G6=cFBP2iP(dZ3#Ax(x`n!8cO-1S
zzp-B!BsC@GljNNi0C#GA!N!|P(WTZp_BOSZXpFA3DjlJ2aW;G;kVq(&1(ex8dtZEf
znfV3q5P@AR<+k*DTB9Ka8ZM1QQfQ$?oa|}+pT(uvIKU^;_nvNg%7jbBEutn0IQj=X
zLP;7s0k5lKYVyl>7eJpOwZBn5q33l&tgogIsB55Py)E|2cSaqx+VdT6kPq!REXta2
zI<S$Flq6!R{gWL<VFfWvy*IrDCs7F2{?YbdIV<SH?ZFYe1g;6jsHmQf=M^-><k(#f
z#2_n>m_)(g<FMytZ0M?_z%xrSWl%CSi2WMi*v0pWtEAU%JcP84#hDK9MAQRapXfoS
z&H5&*)cDWrVX4~_LChI@alf=OyWPsC&-?dYj>w`}v%hT@z)e%UuXWdd_170+glrX=
z_M>#+l|48D-sB3<q9kQyy?<YIxsw6vYQnz?JoOy$X7z(uHzZ}UdW@Ugv&&_<pauBp
z3p5IwQV~%<jVRj}bRB0coUZ!bI=J5adxxbJo0AiHp6wH5h?S|Tl3m>`PRfX=EzS1j
z*>;t9jw3Z1uxEpa`P@nGf#P{U4WNc5I28<)d!46JN`}oxtDR@r(XW)!$Y58W`E0ox
zmg1+hB%M-tmUnvSwIHCDho5h}|EN8c{c^bfEbG!8XjGrZ$`0ZDdFL%-)S5ih&xt1#
zKt>2v&!}y?>Dg+CN0>PPOe5XIhPnW^6nHIJMl`mS0Y)oa1rFDx(IF|`IE!ciW($a0
zbUp_FQ&|4_9qme2VuP%5yn(Q)WyqKCMs&qFJcuySIv+SYE42P<MXVrIzC=W0B+aWk
z-f&C(zkwiL<k}0_YuwXNT-IX*2&C-u7p9-N%VXhpxHj>5y^}Wvf@j;b%OCSCUbiQ%
zxLNGEh^n7B=V54kEYjR($P_Nct7u?ak*yjEn9bSS?wq;WT?65_4A~1$0_r8I6)>v)
z1emLiVF+s=yF9Zu=793X`@L#chKjB=(iW-+es)*Txw^jBQci71e7{<vy0GX4zdrr^
zwgd$N{SKYa`UE>@-eo>=qNt#t_Z8LM(57Z|mH9|#D=zr6t5;C>lsbnUVYk_GMQGF~
zXLQ8Yh4aVY4@FtE!+j153sCd!Z?R&AM#)84*idm0>w5ZWvN8V-Zz!&l5=+qaJcC|A
zk;Yx38##~+!86Qb@~qg(`>rz3Sw-^8!(HLJDQk01cx(Up61)VnD!V8wt*>r<(O-QU
zHjGbHT-BJJY=ITcMXo_f0W^$As9ReqgH$SKjvb!9F5}-{?W8`wPi143z9Eg3X4Avc
z7}b*+ylu%E{$<6Jj4PJXN7(3yEE1Zp*9rJev&EAgp&&1N^Lz*^vJQ|vty1Z!=O+QQ
z0frjan$#~ZhC;T6o-U~1rV6)HXD<FaX^=-Cl5>H}VL+P)`g`>icEYKT(1-6&eLc<#
zdZ7GDe<b`+K-%vX<8RXmp<R<nzBXv})0qQ@-M)<>jTY6nJv#3rqAZeW&zAE8gdlnX
z#B5pVRg9LgUH`-waLoa%$NY+kcwXPZZ~l1})9j0l>i>M@kLtr_e6-~O2#*J?+??{Z
zZw(8qY9G4Jl3xm#xvy_o7FA>ZulnU)=hw_#(x54^Y^j2()(?PVvqjuEVxo<f;rmqp
zZes&D2s*!W)KhVRslMoFBt?I54Uexlf(5~#(2#FiYmgk^qgSE<T3Fha2pK)v=c^7P
zWPxLszs5^jmgcH4hKPgiuV0r{f04$^Tq&Na>a+2mmo|0U2lI;F{xr^~LV4Vm<TsNg
zmZRG8%Pi<3wX%+2E=5}-!nM|y`9^P#KdQ3=eP)Y(d*$)PBf@_uHH9@aSvwmh-@d%O
zvN&6IDai@a*kE=bBY^$7q(N_$ue0!uHhL+IO=j<APyFJuKy+0bZ7{BO`q~4a>QZQr
zZ2kd_4U2>nwT-{_4#)Wd&Lu$OG<a%9;>Q9Nf&LfmoKmg3^JAmA;933hC0$w*6vM8z
zx8;VoxTo_P$FW23MCOsTkD70XCLrx@2E+C1a>|S)nyW{f0_%}YaQiY$4Pv|o+(1T(
z|3XDd79jlkx4GI7J6&yA17ci?X3>gF;IyvH+|<<V#VjN<dBDBSY3-qZElRnwy(p}F
zJVI+d2{44~!c}Kpbb-xBYuDxpT6qNpRBJ-OxNzNVK>f_mQ|-90@>W|@uB51lNQ-ky
z?sp$`h2`Wq{!Q@TZZOJ&dP!J3rj3a{JrglQ>YiwB8+2-OFY@8oXW&0>u~oVfDT;sq
zd+_nKz<c3Aj9uyxoaD#Ht6VRssXz^#i*hjOIn6!<xPkiO$c^en1z6K)R7<0=!&$gO
z9@AeOtcq99Y&7G1#4aEq641^f++a|DlMHFyu=wNC9)Ic{YW3Q%b~VYA&^u=f>~@gP
zFd-vlHK#z`4^*#FZ4f`|-bpVXpOYKsaA8VayaDr9e!~T8nd=sw;FFo%tfve6A+ibF
z+iGJ^^%mH~f6;Z%S8aOgGdh`Ns{L^faA2!JIf+WO!$NNmi!OiL!;paD!}Lyar?)fy
z3FQs616@6cW$HL?)QbO&1eX?HooxyiccoGdI<48ENL&4wXo}#^Ko<~2ZF=SNvJbMq
ze2T@LhpZ2{_Wh41wt1jzqh7h^Nt&7WFTo!5qcOPgx83`Qv=_|_0JuNx?Hv)<QNIL{
z&V}Ah+Cg5;cJT2-Rp2F8&sI8_od)h0KKytO$N#_yr6}S_+NiepG{{f#$?gvL=4(61
z;5Fa4y)o=KKeQIow=vksX74=PS^be+?0Cwar-R(odai{%vHE2$v)=CJ$^&R4{@ORn
zIrw;iA_w=D70_FVM=@)Y>~N!!aFE-!h<2DgC{G5ZQ?**sfT6JinQaDnpEPKYH_kGi
z(ib5s#eOF4eGo7+c+5jGe=!+YC0?P-=sa7+#nQdLtu|HH=k2I_f2w!pBoa40>R=--
zxxnsbrE23(Phd~IO{Wh6txyxAL0Z%as<`&Jq6dy<Ya1K=aAv{b=-nLqhZE{hMb+i8
zyTB4NJpox8t(JyucX)2Wy{~0IWoKJGJuQok27obua!{1uSJQVPyf~8z5~bY!BK6L!
z1V|f-dqVj)TJeQ66;jH&{uPuGgLbCraCF$8r#N4?JEJU**}(2>-d}w0n=J_LX&WaQ
z6@O<E=IPjUBe*zM@T=KzZjKQrl+n(=RSoblrQ%q#P=R5gG^U1r2O0Rl(5-a$JZcPc
z{ICwk{NePxN+2h35+RhK>|;<^-O0AZRarc>W+3hQeiJ~m>*msFUKk)wp^Zm5I(ML_
z3gl5K{*s}jZA8~KA2+tkqV{%Z3@X_F%8N7k`ae&oU`DVH=q!s?6o5vdkU7A1PQ}@;
zkG<8WkCs#CLDpfoo1HvAfIDwvz8<i~2|hLn&$#p4x|HA>2Vy`hQGKxS4EY@A!Sl}6
zp<BN$xymt0R!VPlbBzG*_Yd~~=@TFkViH-q<b1VTe%o^LRoD0aKzc^UV0RKpDyRLY
z`WMc{AFIi~GWe0%8d<DkhP4q*5od>FU<m1hP(lkU(VyUF172XHPM1lB`iqh&_59SU
zI0&@XDmEYWew%DKtVr}@B%3--Q=`B5`bbxQ>8ub|WVCO*H=<URuvzFFR?S(Zuj($I
zfwOtsmT&JJ`5E;aPSo~>@#^ge@lM@g3sl;Yw(!y5fRo3WTNe)IN~ZsM@RY@%@%9>N
zY3n1!H8<}~2u$rVI+A`7-0g6uv-9G>w#xTkJX_LFVVy6x6`now8-C=s0@~4*0R=|H
zKDEN!#=`UK4$}<(WNMuJXrc;T=M@FJJy8u_<<?A~N)%tv`UT(vXX(maMx6g(zhQ8e
zhb77o6ya!6T<oG|LfT<$lB{lZOTaF^Vma)gs*LJ*;?nwo%SK+&&uYsS7n)q_Xw4wH
ztesJ*D|wcme+l&6xWPsj>i-s=CUsU{vY~T4(pY{FuhnOH1%VDQB6rW6G?PgXkiJs$
zthV<1#b++cNc!#rQ{`!@tG2L>rGtRomCLqX!7k4eDdyyp5b5QoO$3fTN1Xg{U=PnH
z<<Vh3|Jh+R>Xnjmk~>|uPm6ksU9P6UK6HtjG^YAU_A%EhNj@|l4Ry#I{pFsp9?HYJ
z+sf$HZiAYYOWTk3;z<FoErOBhbf;BG`GJi8ZM)R!v$3*<Xw90G1x*xw*%7@PNd6~&
zwi|M5j9p^Lo=$9WCHqVABfjWr(1$~@0^5wGsaJdVUFb~FA@SAk*+{0ypL-B{Z5DKV
z+FV%n*VrT0=f`B(o;0pLGR_2?6+5$XMXZc`><CcOveKY0Oav5ojyLWP(9!sC)Z{6#
zoN&(X8gv_qGlxOF9m(%MeL}zna%v0Ta3KsFr}gxwOH5At4udE6!Qt<Wq~x)wiy`;G
z#e-mEgy8WcV+5^$H8q>6??Z-J;eGnvfMCNNPk%k^b`n{R%mjA;Yi!c!HXB+856tMK
zmroYKBL~to*q@dajx=U|n!GIRWJRXzg_j&b*IE{Nh+X&)er4+>9P{aWA?V3<XVUg-
zZpZ_Fe+Ih?mgEVf^E~~q+Xdu`R1aQhl-bymPOjc~)_!)^pqk<_1C+4wNoq}BpU5jg
zb{b!5%kx(qNZ{MOFjd1`S|>m9?k)}CJAORIq;mFiZKWG8m7o!)Fwxy1X{gAHYyFAq
z4+Kkcb^OyMcLPrwG<ma2he`Gc%nj~E#F>|lULQ$SF{ag|`OS%3AF&24SUlI5<knxf
z3sLVfWihFl$7*h0d!q5k!p{lx6^Z=~uu$+Jn2MB)@?}*lG?9mwPf?xreqn;$aA!3<
zdSYT7d!zDk#C()^>t(U?`txL>nf0w(a<1YSk3Q%F&&#VTC0L+R><G9-N%*4kf!1th
zsL*Dq=Z}sMvHNuZ7y&A`zn1_c$3&9C4*MR-6)0ha5HW|?Ofv^}Qs~_2aOQ3U_+;WW
zSAl~0fX*3waluV%#|B%RLAr&}kjZhptGUhX7ngiJ8KYevM?Q9bKjn)i)~v1~XY=x;
z$wwDRUZ9mxct!(JKtX2SrfTM&vt&?Qe<j|1R`kHJnD)y7K9d8cvl2C;IN77%K!d?O
zVqo(<WOO^@DMg#*f)crhFbh~Q{KVux5Rh0x$5f*ROhd@WF3{#ZL>cQd92o{*KS@i7
z*_c5llx)`Nyey(!;0KHQD?=i-u}F{Lh_3<q(ATDBdZn_`_`?(2i#+fWfUI=*f43A=
z^gf~Vkq_v3>Y{m#O`Io7d^!t{n29Lir-iSNgq&@1iYS^8mJsGzIWX;5?;l5x^Abp8
zmK3K6T)oRg>CBfQsN<L%XX9^mZ|H&ERn!AcBef7QySc)?)gQvTK=(4*`W5zl+U#NH
zS2>YGt(#iaDxcfhu}(KnvH+#Xj(gcFgx{pD$zGq}7h!++(@A<Cd_3PKsE(`EWV_mQ
z3z6g40;JXy%Mi}0c4rJjVnX&KN@S}TaCFYvw+idgYW^j@*`nZ6arfY;bzi@K`Lona
z;#1H<z4a)2Jq$MKh5wP7SWk5HD7R^2>raLkJPo~9En!W$rXgMv$%TE?h8QJN4x+`L
z6cYRgTV*JF{8(8NbB@&xc6m`d#r^<JHbg@PG(;Oh9r}gnis{B_NziPQ1-*}a5?|p^
z_?hz=_J0hv{QthS-To|H+6qK~K?3D0caMU*-l3Pa`v^c4SHlp}EV^p!9dH_5GMW(4
zp*@4t$N|K}<`L3AlADqO+Ege3Eis(QhAF47rcHtZYW5EX$8!r;zs4%znHRiQM<9X>
zw}VEaJGkzoh<sDeb3}+Ps@ECgKtv}zdRLPM*cUf(zT4H((reql_#IJ*(NKQh7eKJK
z&YDujb&q^~G~o|g|AEd?pH9A4_(z2+?5Fg(DiH8XC75l{Lo}dja}!01A#f_eOR!t4
zpYS~kPKOiTMXyusUG;`R`pe8ZpA(z!Vdv=Lazpf{+l_g**3Pq_wV|EP&QZiUD6MU3
z3+}~c5w6~5GnR;H9a=V^7ZnR~Vb=^}R}`Oa{FdGbscFag9>JuHnHR@H#&ZELjhb%!
z$wbtCr2gOBd%D2k;`eKi4{9eoSpGpCxIP|X`+caPO+TIZuwAY@DPm-BS;jZe1v#y4
zNWCt``dh0a^?!}{h0d6?t8f3G_gC%(R|Ihu(B#urSkqRdP8~zS<O&ksxjNF(n<7qa
z!r7dE2cJn)Y`69_=<C-t6P@a~GxEG>r}t?7u3ahX3tGo@3+L>$zTtiOk)#Jd6<;@s
zH-2X~kx@{2$lF=~4{wu~!G<D@bqZhjMNC9?T@n#9uv}k{T^vbpa*)+hm^0c>Zq@qR
zOH9vFRMT&s$0BxN_47-W2gd!E{Q;Nu%hwO2FEiD~OX-OZI->_8;@130R_`nx8}D{J
z$OCWdisb2u^6T{Rl2%SSvH&i8jg8I!Vc*!zE5NBP1)1$Uc-upeoUM<PN-zANj<ct;
zeshc-g+ZAxaC#2dkK8{rz5^VCedJx6#}n7p6C<`dP*^~y{*w4bI!~Ig`Xq&VM3pb|
zS?RHNiNy}GdHeKqbzI=WBVUf`NlHsP1)*EB5Pr%@35&$E6X^kxeH3y-@5&8SOgDS0
zx<-Sj>oWfNd1SIL+yT^N*(E=D=dUYKa2z4;lw6o@Uxf&<@An_RUXaLgmdh=7I@l*p
znm93eKZr089)3T1>wJ#Ql4%FX8bfZR#S^pDN`|^B9lD;fu&?*R>&WbJV{faJv(qr5
zJ<y5VwLKK3&34`1c!|4+cv^EYzl*<f&RKB(H6s*6s8Ve7d3^H(|BG}L^@e@KnX5wd
zXoz&iyZX5*0`aBMuJqrBMhlG2vt<Mf<@urF&l7u7Di`G=ENktigU6ElvvLYD-L;#S
zGLjznC?N|f)tRqqh=lQx23GtM=t{rZn7O(-L61rHFV?evnpJnaE?Otgz#h#=jB^-0
zVS4<FQBy+{ed-sdNy-J64$6VLOg%{+`-!-}UPs<f%F6lh4o<goDsTF|ntJ!pc;n%r
z+Uaun5RyB}cfdDjnKAPg881yecS<CSf6eQFNFOq(MD$h^tueF|fJkoWns&s>oUZj!
zrZ|fpJ)RvGYt6P6daYk4b^llCv<iSMf){EGYQdR<moyJ@&iFak3)kuBE5)($<5(PA
z8xL+rSTLXsU)oM;8h8l`lQQuFT!0?P*vjn8Y?eRh!<R}d6ZzQted@LL<ouj-O4a1o
zkqqkxKJ9~}C3P;geXlE6l}l~2Qwz>BbMrUn_DzX+Z$#;u*;FIW9)>PYYZI?4JRDH}
zr=op-p0(CL73+K2lM*YhHfj)!Z5w*D{rL2y--V%1>gwqD^7Chprk^^zm#0m{C(s);
zJV11O>W6@~MA7*>r5E?jAGvNj<LRH@e)jj)ci$CPec6X0_|*@Gl3PP;SNai@P_z3P
z%%*ZOh{0pl@sv?CG3lMFS;{{9h5Mkn?QtQew%ME?YM?%>v!~Cb%w@ER#77<OuJ+zY
zZ5!lsPw{=qvK!Y%Y`#74<x66`BCI!7h*eKF#Pp4w804dBWXNXZ*IjD2Lo2W3YF@kA
z`Z+#Vy)#+v%g%1+`SB>%?;=@KBA>17AN7h(%U}OpdSRdSbonB<SuTRqW8V{7^bX!e
z2iJS3PXt&lTqryi5w%*3?~igY*KsMZAsDKt$>XcK;+LwgBX6!jp(g@TNo+lDzgY~S
z_b-mtufOSO4esFTGzZOHz;G;XLDgljN{FC)et7PhAxh64|F)f!uXBAz_^y&)Hr+*>
zY|_r1yQ3B7NVi9L=J}4@zTJ_*OklWKyeuO65?RldNb?UEC#hQ1$jIyD@Cu}XYHpq_
zg-oSW>oT7O88F{gMCD0Ux<<L$_SKH>u=g{5IR6Y7r0`qo{#lXT-!qKg7#nmZ9TvV6
zQz!!)8<?XDk;eJ${&QB>N4|+`5a}J$?YkP<eKMz^cW3-MJz5v<+%zzWK0tJrC3Y#j
z^Uc=Om&~m2b347Q>tb7tvNyt9_n_-C$<RY%16OqAQZ`w@jNqnoKR0UT3N|)#-Tvqo
z^<A(}_~Q(pMvb-U1JV8-?^0Wn%GVAjT9O@H(4z3F>&xRy`2K`6X_2f*)?B_Qpwk;#
zuCK;2-7F%R(=DbAwGua6mZ>K>D=ci|mCfzX@Pf0*fJt=IIGl@(No1--wH+@7t|Krl
zmqn11SYT@FU^J)$y$REXJw$!0L32*d2;N8eCe^#RM(eWa8u`#wl>=H;e=cxeODG}?
z-J)mDi>L|CsTRAgk2LsCGWd3P>w6`=rrAw@u1T2CaA#Jg3M&`fw6JIxOXfkE1sQV}
z(vN1~VcSa2tNDhVPbhXe(-%}kdhRBLNSb$;E5>R@rYX4{7I=B7_zRzF)S5E2^$x_F
z;V@siQ=-TCS=KFmO_l4e__~<NfTJNUup}MO%t#;0jbC;eYlMdhrWG13+mDMkM-3gz
zws=SL7#%ehm6D17>#%Jz^K3hkr+0rZ1Jw9B*`$<ur5i64<@go<e_VZcTvJ)Mb{q?@
zW8u!VpdvCe1`v><fYgBRI0&ICph(A|i-7bJ;Gm8=qZB=%S4E0+r9*(A3}B=Sh;)I_
zn*>Otf9oXp-h03Ohw>xj<Yb?{*IwmW&%<3-C6;<ySGf1%Qzzf9!<)yWeKj(|H4a=W
z7&L=`)1c+`wDto|V#)R-XQ^skjRH>?DD@mUJd~EUaFB?S`x5EGR*k(^D$fcT#ew3<
zhm7!b&J+Tb=m^m+7n!e|Y1CxN*iI&>+Qs~(cJQ`KIccpwhc#PH^&Cmm7Be|`+sWtx
zV$|iSviSG>fdp29*r3^FCzs0&!zcB9`7RAWx^7pTd!k@H`9;;u=S3N*q=i0JvwdU5
zOU2Sn^Ja1-MRr4d4=VSK7c<3UOG>?s7STk3MIM%U;c)V$dPM9icfDzET;jU1Sk=KF
zKSnwci?wMzqyA#FeR>~;4K)0ZrkYls+^|1oQ)IO-spliwGs{;<`qRB3D{2wV&Nx*s
zY8aN7V$3KY$gdLm6ZK9tjVumTDD0H^pr9|ErZ*tf@ik;3?9AvThvsYbM=tHaHD37c
z>S7Ty#NW|-r}Vp}m&-uJrVPIz$aa5q)Exm|WfVnMA+L`dbLTdYsPB~?duU+(vgfIF
zV~FMU90vVCa9uvcs$5!-=ySU~J^Vn`?s%r%^Sq93(yJ<G%jXNhyG8w;G)oz<F6#D!
z&(-fXUQFR3bZlN}s0%PL=I`G^>>G+h`Enku9h5zogj{Yo&h;qCq~L4g$Uaw{kC8jW
zq=mZOJ!VxM%Pls)@eEQy+@<C5N(1G3VfKWw)muhlXHFKS#i%09v8_UNqsZ^}F@2LB
z@_N^<`S$430?M97{)H3i@svkR@npKFeDRW<5n4`GSGexl@;fvPnlHaX&ZJA_H9rcC
z>5PPKjST~hz*E}!r&E<sH!pA<XrcJ96fv1K!np$>g|v11TEghb=3Y0a)pj&&Y<4pC
z158Bw_w1ks$BVMPcNbrhrq@?+CPMov)r^y0O1m$R5k3PIn4zm<OF}D^_*4T8uR4*r
z6$BxArRlwwO7|OlHj{^WU)ZRYW)<kJPtK|={uAZJ8n0dj=W#jD8_8J7l&ElVLZ5hT
z$A-Vi2fki>v^f9St3G+&h3e7<CRe<t(4`@HmaC+M$$c>Xj=VY;-QE2=37+oLaeKnz
zO(;H2<9`D<#z3X?jx*xO`naO07<EBn&iIXG?NEf6X!&(<xtG&30*(qTrarc;TG3DZ
z`g3odyKYu{=50QiPxxlIw_V-Dk35rk%Brb1j;>nM9Ld-`+i)?`=H~|TSxsR(NLaf?
zrs~ZUB>SB#8;I6}rn$@c8>LdI+1m2cdcH1(s=j}cic_T`eoaDViNzpEVD0W%A)uKr
z?{d6o#<o089SWz-N%%5RuEn&%Q5I?%ReW`jdSQ0|82v<QXrK3lPl}3&P}V2MgeAZG
zBTywnPj2~V{1TCVeDea^9Tnst&Ls6s<E#TwmR*W0I~yn2TOm#xG^lUUacelUcu>e!
z8lfG}sHl>Toc@p7ULDN3NA+8ApYQWxP0@0tuAF*BaT(uOlrRZ!sDI|pbC$4m1(oiQ
z-GA1_+|ORM;dnxpiQy>)$Dyg_q9<La6kI0d6UHUvSzmip9Vw4R#O}3Uk)Lm#!&At8
z-oLTFT|Amb`lsp{qVA?6GOFBwEZ*qWUEC$*#QV$W-<#$!Np#oF5g!t{a8%f#VOFgr
zKvHb7`G~NM=81fP`43fl#|YO>sL9EKW{%0h@t%rbFhe0kt{`-cO_`Eg(u+5wWDE_H
z{3m&n2qhjU^#kP~e`0~}R?QPKy{^}9>I84BV9~iP5cn>)oZk#s>_JH5%gabWOCJrC
zT;o`qmfe;gQtz%Yn*#3C=k#+jGx-o7pF2&kxTWQ$hj6hY$deqBp=e=fDlX$tW@?o|
zr^!1g(^T9J_T_yP+-0+b<?;PQ;;t>}DzGyE9iLxv&osPEFfTtbcUQ4E-61gysTZK-
z=5U3Eau@P9b5~Us0SkM>moHXppOigVp^YZ329~jtHqIjz7!CWFOcTql_||yjFDebB
z^|RbEa+2$Iz9}0yfNwNm^7DDmOf&3k|Jooa)+Ozd{D)Gtl(>w!-ce!}uRXqmdiy(E
zU;l0P)I`SGr!*6u{_;_ZCNeh=*z$3$SN1Hyg(knYIa!3Ta$YPp8<&=kG&_0gt}aA2
zn)v&u)#s++)exe}#!ULD(&Z-Et?4q&=E>Nloj9TS1bNBfmEsD!@Wm!#WU9EGt)v}Z
zUR2(%%<cVX{uCh;S~ad~i!YrEHKU4#=`tRK>vw;u6yqWTZbulQjZOJzPUXwr?~X6N
zt$VIk_H?Cso8lNDmlopC0L`42(E8MPM8m{clQCB~DyskVjo=<G)XoC<yL5{0JGBf{
zh9pp?8i<VGdW*80qEs6_iO4|jFH8ZGRoRlWMi_1_%Iu95mU$Zx3-AO9l~kbw#AvO|
zv1L*zLlv2tLf3n1$xT1t3OLap&Qjx>HI^a0qu`(pz8~AKOZ#UEG8PAgRv@8}_>3+?
z+(T|`n&8i;$kO<Qx}VagN0gXMPNpVE-@b;A^08|~AbV(Tbsi)YFb4XzX9UIYBf<1U
zm)qhB?+QQmRaj<5CW6vhJ`eygMnR><k+JS8R<_*0t#vK3{nG#+Us-1h<FC1uy0qle
zTAFL#-m69@{xE;yCKNQ}96&FAP@=RRV&m<ywTZ5ItGxDDtjc+^%C$EAsCja7K7&7y
zx-ZJ&&d;ok@x6q)^|}>8ma(B%wvo@+TX#qh-YA(_zt1B^eLaHwoh31OL#|}G6n*e;
zRo*6*aOcFWhM|+f)Z-0m?cw*0<Ui!}Lgg{yha>^AdV50g%t^1gnVVfEWTh8=O17{4
zx+4dan9H}dMmKCDUdph>XJax4^-mvR1sDFb@n&ocNmY~}rv5C9H6b@RG-wkCB8vSf
zwtF34rTSjA$e2UubG_~T7PnrxoKQ!1H$7QB+L&Ytf>>7W$fbbxi&ixio4Xfzv{x51
z4=ji5yr1gk;5>3K7APTu9a55Oo+TQxJwh!GFzJg&YdoDm43wt1Gd}kYV=qM?*C5X6
z=Kl=EjP=H2?y@Q1Vf_N>(=bR{5NIx4h~#PPz`;pYrQ_9P_ioMxV==(R+2sREQO*NC
z4d_<jH{J#p5<T<?Yi@Pu@g>5ey8ib*<1fs_D2lzjku4Tpg&tr2&Jyod@gKOCwwo}1
zR)I9=tJ%`ORXWOZ(q}kRlWCE^Ivm<5mQ^PakFyOcNfDyG7b|!2U3<FF*MZnw`(Tvd
z28uNBk3gquYTx*b!GOtyzEAj3tLE^0ug@_HkRUK5gmyl&&|-Mk<WtYn((t?=Bkv#b
zOR-8Yb!|~}|Jljc3Y9oW8GVc&)G*l;rCoDqNFcx8gOfB1S@I`x!g)ytPB`EGmS12c
zWa?WN*}tOtEW7>?Un+$6wGfFrQ6a_2=4kxXLO%a-&%f$d+wuIF*Dhi+6g?N2=RmB9
ze~5AR$04O_6W<yaqil69nPE}}J4pxaw&t4gM0ZF1$UJ8;kQ{h3y4f#mC_8NyFgGkM
zy`nz)llLI<k(6oi)LQfMpw_ogycux}5h(MosP$VbFJLB*3dPx6mLIb#OBHTtSt{`V
zCz7j2|5Wz6WS+7&@kHzt$RiLuW~M(3Bs_w?v7^$qwMP3e$%G{)>nPujFX0NU0e6}Y
z@H!j&HPpG}mb&-$H}KmJzOG28+P%{aY#4Q$oaUvL(bE&ZK2A_;CRjDKGc6F`x9<Gq
zce=|rqO$$oZKmh>e%LJF$(hWZHN-XEa+=i1f8!TCw_y~!8K2+=1f4n`jN<f|e6o3N
zB&YDjFR!yT(e;L>(-b}5!QT6w4fUbLCk_2CG}4Z+3{J7OQpLK2R#tv;t~^h3a%fo2
zXpt%Ni=P*TH0CxUToMteXgCS8E5`?ohAo1?RhWAZ0Dd^!(`+3#;DICi{~9rz(6;{j
zG9x+IypL?~!6z2&lWn%@wb_Tgt+}VjvA|_IK-jyOhtH;GVru67aP5-<m%#;+p_`x4
zR%54;`&=gW$dam<j%xKS{@toZukD?&XGU@E4o7-je9jQ_88fQB&AKWtzWm-^KUld{
zx5PRiNKD)u;jvwKyc-i?P-d02XfKIN5FsR%!l;hMu8u7WLh`YRSS34<%%#X0_suKw
zNH(%fp-`)YO9FBj1^#v2Puyy=*3a@Uu#h|YtA1SQ$rYnSi#y4aLscgHv=XWZf<Rh%
z>bi>NB_*GEFm$+hy}Y$_S<}sskU?WbDCS&foK=K_iA1*Arx(?1@sU-Qv=-;0EAsP2
zu?j^JIzvpA^z!griQ7Mxh<AK+(oRTT^w6NAL(S{y>4#<(R|$!}eFUHqsekPM@aWpQ
zq?3GfitC^CiVLhdnX#P7rU)cs9a+8ONeujD=Sp|sXuE^DNuX@6u8$L_W^QApB?Yh?
z5Du4qpO0uBO<yCH?`y`+hl>n=z-ESS5opC%#|YscZ1-{tb*nVTCgo^L!^@Tz6y_@y
z^X*3Zy9?e-;M*HMrfNbL@D<Ts#%J5=mPV+H{N1$<`Nvzsh$-`Na}s4Hf^wo@srk(q
zEKPlHos`n_jH)-t>~PVVxUuU{qEJq`_57$~(wlLbopQ#@s@z<ql@8o)lJ4Al^-<-m
z@KvR!os%s+`0*6IF?X+1qD*-q;^I@%OkU*tei;Boo^8miAFc2I7%8?gzwYiVHy8Qr
zLNdbNO(_uS8p{zL=dX+Id`dqs+2Gh7siLW`9PM4ZuMU>#?Udw8>>v}AZ8+H=9iGAM
zqRH8>vc$l%5$_UsLeI^={bj`Scx7q2Xhahy`2&pRP8h%Jmop`UWO@S;&Txx#k;A}m
zLVEk4WpHI^YZEEB>SEDTQMkBQv}@k4$4GZzIeRg&dvi%fm(Y4eR*lFlNr7mNSbRM!
zFHCNnRUop{D9Y{A=;!}VIxVQzCly)HPI%WHH8!OrmZ!tGAMWPzVddW_sXcPzbgrBB
z<~b){Z8Yh`_(CjsUB{2{uyFKcOq5FVe2SHx#SRc+xQvJ>+*aDg+8)Pppl}qJt=~XR
z9<!lYk~?M6_1+bT1Iv%URdAV|fV>2;M$U2IDILMXvCk#*o|E=D?5K)1ko|4Kd%4i{
zZy8UZPCT_fw}^~ymME_sm`z=st3Q%p^U9>8uXD+}WMleWb7EB*m9(6WROuTUo^Tx?
z8xkfh9rZO?SW+l8+->Y#=bD6(@4}p2w(nG~sD%G!ZoQa=_qW4pTylgB=VGDm#5R@j
zZ`{P<6oz@li~4taRX)wl$jzC$gOTz=d93X#jZKOL%1Zp!zf6>hk=mbb#Z;L-vtHP%
zG&PLxN)e^TI4;&3#Uo*KvD40hKnVgzMPKS9R_}$eomRNm_DOK10m$%2clN&w_`(aX
z1U-{UXY44vd)3)Ro8i*Az$FF3m)?55Dzy7V4PZ>!;=kp-j9nu7Xismi6fzm(kVt(#
zai;yUi>@wobvy~(Q9Ws;hCWQb1Y%1!k$;b@-}Mby4%m>FyaCXHQ#}Q~&D8#l)Y^>0
zV*Yl8zMh_`6_aYnNT@*56B5u8Mo<ikvL^_h!aHoA6)QcZ-yLbDsx-7Gc?uhbS!o7D
z2EYDjS)8^}TCn_5nK3oxI{I2k@naM}zKlRy)Lm*&&sQ4t|CzMN>(H=Ppo}CShGDCl
zmteDhhu&{*c2yIU?wfIY*IGSMylH~>9k$`WMt7w!{655FRHV7JoLTh3PpW@JKU~IH
zt@OvHVqt;YgSoQt#O(5KMn<GfRaLc^3(UEJXS2OX#>6pPys~mE{fX)$9PZ4!tumI%
zb^qD7yv>M7Te<zvwU&U9yUC03!Go)BwpQ-69mm<`c-wiS{lqHIJ|`z5v|htsTq9qZ
zs9CP|ZT~2kj+aJ8gj4!DqvY7r@|(p)MCBOL;wRI%VpB4bc;^RPkpBN?yi_Ttfe2hl
zp2o|`+kSaKOpHvCw?cR(A?wsbHc;+R!RYqae@D%Tr!rM9!q>q@P|R>|oQoN=OmS;;
z9Rotd=YlQJ(s$~Pqkoz@*TEYaXVN?d0-)0IOCurId!(37)B4RSsbYibW&;r{dL%i}
zAHWIQ!t~p+o<Wme2*lMV*bYN*cYZvpJ$h*wYM_f*MCir2gKj0XJqexHW<=n5p`<kK
z>JooL3-{P<u}M~?z*Jm?I&redW1{tid|tq;qs0X|Ik{468k!`mpqsP7kl13x?-MWm
z66Rb!nTCifXoi?QP1#I~b1pBR__;`0PVR=^z+z$)ex=b)c`>xe5$W<edNRXS`RiS7
zrA5y?Qh(;$++3KLQ9eBkD4aF({6|H{3kwVBQ(1YNm2j1e$_XVI=8Rieg;&}}wg7FY
z<`K!9fkqwX=qCcK;^l~J^w#Y_<)p@(?nKC8!9t$O*3DO@Js_S)munBRmE1}w_7|p6
z+9MUyzaa~NjnDM{(_Me#BpXH_y_<8|wBKbXMJ?0f$k5be1B8V1uDa+o%jNuEXvdFN
z((NvxJe?vx<J#-Wh~_su{xZ(Y%ggHp0l#Ml?8c6qu>EnSpCaq{DcgvAoH-~)8`jG(
zFcgon>*%^B5)m3Y-jal<qE+wSAssgY0yfIxWL<JKKN=Hk!<kGbXy+=4M%-&S{?b4s
z!Av}g$98PvAkoTdq$*j8vnr~kJ^fvEKayqBBxseLBj=K|E_vCQ?a5MA9yNtlZD{$^
zvlzK8p(8J$V^S4M*LG;wDPzu$`(nKue8)LuoYOUQ=)6$G0mQrt{h$KdtG%I%4BQtl
zlJ9GM3=>@W4UNQr8V@pbL8#u8Fo4p@9NfyQ5IC&mN06_TDiO${(e=uf8_J3FcH#xK
zp>x&Qz(=Yy4s1$12`}qn$sR}f{t$8c{CcQZG`Dp4L$Z6v#}L_pZzIIbjmM(7-`*q_
zbRai`Bao60S?0@`Q9|8jx8q}1uV9jg{}`<PBc!}gjscqoB^1=e`T^(b<mu^Ys5CC$
zQkDz}=jQ^nx0n&bMzyrGn`?``$OC28wJ?Nek{ChP&j@hPRTU;O?%`F`O@MNY;LwmJ
z?0Xg$bZDDYIQqZcQKauF{T}vBPy1a*r_l;nrQ|z-=$86<>cr27bH&3VWF$$QLdVZ2
z?7H)zi8$)ilWK4wR!m@}9S=lQWu-T;Pajc`qCt1oxw?2Mv|?>n*IKW^W)nTsb<9ce
z?K195p-0`6jr??c1W2hBDpm!!?BU`9GyJlAhVcY};|HV%Q)YY$31Q9ySGQG#&ir%8
zFmFC!y1;^3P(X3%o!pF7!PPsQ95S6RW!(auTW*1sqLUe2F~)!#{|z-v730^mQhw@f
z*COm=3TMRkg6co<z$X$kIp?uOS#3Ns`(pS#FL1>+I(q_~qu{E1*akwll4+i&nJ>->
zP9~>c5(l7|d|ZsEpcYed^9M(BsqQN{@BW2^nQlVBzWw5)DXAx+)egY9?rWaA`85s{
z3mw87tIqeEoetP@GVRecl`+)l;vf#+$$xz(lEhs#O;)YPW(gPcTegao*<h`mX(9ET
z=DZkm{Kz1(ANMR;QTGn@R7j7mtD*&I__ohu0xPpiV_hF3q3rpraP-O!kbmmNbl_n~
z3XJWiQ~@yuNCDvLzdggt^6>rfV_yt?QuWbuNq+5oVcMg8&HsMmB?MX{On9>C9Ut)2
z2zq74dcfCxobst{nIl>0Ttrv);02_vBBZlH4;=kI!iS0kVzXAhd_9$W=kqiLMeflf
z5)~B_$E^Hl4HgkLqRnTpCSGh*@1^+9w)ZNMxCw>Ho^2?kM~hfr@0LGe-cIQ1>U~Ww
z8&@G=B<`;=4oS@UB9Upb{6zV@gdTMv>zgPrf@e82D1MAY#1xSK!bxU*e_DSYu!4&R
zWfY&L%^wEHT98pjc#0{g-?Ue2t<`B+d<PSJ3jmaD4}cz&!mVqLxm&~ny=xVCzJSBn
zm@*CvmGbWWyLMM}{N1~oc-pnCVyQ)*yfbo53svh2-YMhNH>mfv>o{piNYah1d@~6X
z#Kr<Sm@T2uaK)l(Ys}X$U?`x09AC0HrQOxl8SyxD*TvcR8<6xfPZ(G?LNojduGpcK
zomRTb3`-!;ihJ1SHPaS3C;S0Of+7cgYL-dl^s83~bHHD(9@GV|3kqT1PJd_}B&|aS
zW9av-8v7CGUNca(RF3TZPr(u=^*Q$vh1c8D+0psd$!K@xu+$pprc`H3!cqx4!def!
zo+`nw%ODGtnyZD1bwPsO^n}~y`%-06J6h@6@GqNxLsq;?y~XUZ$nR{RQ1pLsiZs>$
zxgRGgkSlW8;F0RaMFs-IfBE7x=<PZGp(2F12kj6lvy7KP&i(k;_8j3}t&&YPZ}+D=
zZ#3F8@SNo<9pSU+G4?oxvwiUFLUdk5$wH5kYycnv?*r+PnugCqp0DBgvYy>>Hr;Wu
zY4ZlVxo~HmvVjed+TuKF!I4#bOID}~@F1$}Ys7q;cx7=dIHLfzsei0#7%y?sEvfA>
z$qzECv}U|_$l_-WHs%KY5~lFi1A~@<k{OZnret1npHJq_9k}>CoMQ{8&*7JpJPvD~
zM0D29&tPk;RXfmMLa&CkNuBr{IL>WTqt$z};lN|(AK;pj{cz2ylBb8$e-n04DJ{sD
z!_QaEe;KID9k_HLVj(xJ>TS(3`EU1E(-*A_=U+U`9jLoYSo7BLd%2Z6(EJe8Z9m>^
zCTNqGB})m7CsJ3*8*{koY$-ig-4S8PkHcsLtp)7nX{Cy^0@PoYScW|W1b6XGEE$gD
za(t4uTPHh1)K?$^sP0FXV^~diyUy(d5q61-Z4Y_sf(!R<1Ya?X>SNxIyB?__<h@n%
zh`Xh`z0Bq&+E+BhyP+MTy^~BUuwlIvTT@^)Piv4CS#x}HG=s42{xaX2dm2)?O7=%G
zJ)DgJ4~TShcCGn~<Km;AB}!?R|HZa37ddf=QOQwu+BjNIlx+G;<Cm5}p>F996*WY0
z?fh2?-e<c6R&JqOS*)Gdy<y{_eYT6bX8ZcxyKfmOKmLe|jy&<mEa^=x;r>qAlR&ym
zoTew-E`ij;OYuT%B#F5`45Xn1WJQ*A1zTjP%d@F*d-$Er$~_!dPZC#>XE6vM(~0lw
zfrF8nx&iC$-WH%f{eo;Z-s8Wymz^@LzPS8~-|ainZ9BvCMjE4r5aR#>(;9vF_59q>
zmTUDYSj<awyM*pOPMu&e*+@Xn^AG-#E)n25o+Tczl3RDSvH-Ac9erO}&dr}O48n<N
z?ei}0J^ybEdU>$}-z88cNwXo&iL(0!u2@l%=&~r_vB>AfoQ|EZ!uFA0{tM3BVE@{d
z4)Hd!jsi;R%ToIx_VwWTZ{y4_yI)5&Ge=mpbrks1JLTUV;CTePW9brg(OpT_uAY78
z!Bk`IMlbMjjz4`TU&Ez6QSn(I%?AuV8LX^S;rhe_VIJ=Vf5*9`e#YdeS!IAGmFZ})
zZj9l})NvinUk{9tekAU|-B~@pSwVC~IETvi%(blp3x&pLh^C7uyFK7(I2s>Azk+T6
z_)r%BH_o)rwS+<K(XFi(_49Id6;*hPm@AylZn$SlJuk1B+^xAt#c`n+3jiYC%60wB
zo;D%dZ;NR|Em_zk-~_XC*~mT+YIG+8?+tB$4T-Hj3wqSecoXvajGViyfkX=+9})Zt
zC|UX*)D~ecMC{%1Y04XwRF!GFO=grhsh4U&Da4S7C$ysw!5v2s_s8rO4lT!>Y@Aro
z@i`+R^k0?ZsZUd^!hOR8V+{H7c<q{G1tvA}bB^x#ZsaTlNtUdgIVHE(KV@QJ2Iz%h
z7H&88kc2pKIqr%(dk0%GjT3<&V$<9I6&8Hoa?(NF(L%wpfM8!;M28VN<zt2_UXCdd
zqNVE#e=WNiUmrN}r#@!nIO9&H%t6Y42}l(NwTE%+;`1@K^{SpJRHi`<LjcN9JWoQf
zeI?Z_Mid8bO_42r<yfw)D3bol*3z4GjRVl<@qJv$2Cj#I2T+igLpGMUDFauwWe_iK
zV@t36#f9F^4VBRPXli*B-X&*Nh|w|U;a5Uj$CM2!l_adTde;vSBO%G5bK&Rj*M(DL
zApT|-MjaO)J=7BSP$iH3EutkQq~V9^nT{lY$t$VQk_3;RVQ+!Mnzx+MeQ36(n?4HI
z3B`E&GVug@Ta)qkxlilkc$Pr-(-dXemotlg|0(z3s;}yrxjW3uNch(mH_vV6K){_m
zg1cgJfb&4Nr@TDN4{odaHmjYuS)~wo6U_@fpQi$u=q929z~HtF*y|X(^Ps&H%WnAq
z9&wYd?&wrrO#fLs0`1^d?6SZV;M!Zij%%|o3Zjx6yp5D$fQZW%=0hiVw{2Dl#%*5<
zAZ#lPzKcwshgu(M8lU3AXu~d#4Tv8fd$x4Tq*u*t0@AMGF(4Y5_bJm<>c-ubenM(Q
zUinhG*I}Tsi9PP%?mMr&8wz+eNwVF#Z1`2QG-v)Am;S^f33T8oF=300zA8!=l$WKw
za2-pCqIY*Lyu)){Mq*esKqLS`mv_BUJJ-waPu+5lZ`<w`7b@c(KOdkQ(=c>n`=!BH
z5`dRWlxXsK{_k|nEim8uzi~xuXg>V_G9dlYo!zMvv=@Uj!|G~@$8X7k?+%;+iy*3V
z9y2RiSA>ba!M$5jw2xEgkjORgvNV3tb-XMwCm&6(IrJTu4ksFpm*pH=GFn~t0C1gk
znuaPMiVNB?KBs3_Fxj3j|G;9*<)Cf0n-y?4nXV+dcIN^QIwQ^o%f`RbB=^NyyP!#Y
zc5{%y9vx|1dxGIveb5}T2Jn<_k4AN5C1JWbpmT8ZV_4OkyNe3w!{Zu%JnbZ|;=dCX
z$K?wZUtcRTJJ=qNpo0!uI5bFjp%$-8bR)I>8?F<*EUv*gopE@g0;E*WEGm$daum#E
zn_~@y%0y_gw>U<1Q-$PxO32&nbJ&(l0kCt$X}^1RU-MsTKm6<c&|PEhgQ>$H&+Akf
zre{K}^(!*&HO^AWF?K2v`E=c+_DPT5k({61M&73G`u)ES{rvRlf1&^7=8{h-psLtD
z^@wkD_OfFYNUixRpPH`+M0@4DuRz$$Sb<cMFO~B(1=WFIfAs(Wa_zI*eA|I(gCfXL
zI%<_Kybq7;;<z64KjW%>L<PFNqaho};3sa1(2@lg=ZJ3ZpqFKIp)oc}&?v#W=KUZ4
zV{@ugFeXsTr9CJ7oqPUFXMdQ&W1-`)oSqYA<A86p>nKK86C^zS4*IalglR4^F(v*b
zBS<ZAuBWErE?%faaGPBKd$X2C2-E*o;SR8l)Qqb`H(&noJNE0KpEx^ecHA5F7wjCI
z4%5xA!sNzq9#7?o<}tV4Hro)Zx~!e$X^nWzhenGZ@#zB4U8lY8KLnCEkBSYyvFo8m
zcRE57cJ4$Ju??&#({rP$ZO;<0E(mgt;foFIRB#Z}{Wf~vvED_KVYnM>pL!mkrJH|-
zR!Q`ly{RKlOLwd{b1?67cR<C6kzHd4=WY&^_h5I*9+rPLD>Ik)T9lbF(-bKe2k5M@
z&$!GBB~TwQ&diR93L>%{bqTUf#`BGJeUwMAOprFnmXi*;urP&B(p(NXlP*|xlN;da
z#`y(5hlSV8(dtd0Pj7oX|JmKHc~-@;`Q7Y3yOwDY2>kSadl@piCZtrmOE>}@&2mmK
z5eb=_F1bB$KEQpj9Hcx+O|$MK*(T(KKCP|1Nt7hZ%9$2+nwF5T@SW~^gMkIsKCui$
zB0k10d$&M}P&Dk;GsZ;Keq7qC%j4SH+o0|raxmOOYv3NTk{B^{;%9JlX%XoDBYZ#9
zb!(F26QLG39otAz39F!a6Pc!c<Q_kkknf$D1^d&1=GgLK?>|X_%IRPg3udTPvzf|M
zZ7h}S&9lY$kQipVna4GA@|fI2xqDvuE7MapBRg<p?U#fkh2m17RO|jrj<zAirFOl=
zPQa^I>?H(Lk&dL|`B-_mNI4U)+wtA9uZu`M&9`!~Z`8Y1()hmh$^~bWE~$+dZ8=xP
zJ<E_#9^B>JHedb!e}xe-^{I<?)5LtaPFeDLKCNOL@2l-Jz%Ow8b4`T>9-5FxiO#3S
z-njH;!O6Hi3j6B#;u^fOq2|yzO~Xx`47m_F|9Lp^1rR?UYA&Z5oa*m#`TV+S?JlK6
zR~N14N8DF?%G}3iCjBO#jduGvA-?ry8;i`OE*8B$-gE25Ck>S3Y@$-2cU*+8WTL}U
z^Qgpt!fM2(Q}$JyWv0D{_;&_g^3|$%EWsB1@+H|{oaoIqNN0YRr`6$0@GH|d$Hepc
zbG7rI(<;``3T4`0y74e(p*i;NBC2b#Hvgn~b7nrlueocWZRW&ToP7i=)v%1<J)n2z
zVBjO?^iH4sE%`XLJuPt{(3Yq1Ljs*$(Q7rX7x48!xdr84(ke7iieo*t0S^&v1>~h^
zv2XUU?Iw1C=v&vFE7H9ur%cATJdn;7yQ5gA)QhXGx-T)q^i4bDM{eE(C||$`j`q5P
zy~Q*TBL%;t*WY*?tN_g=39lw3|0@lViIJ6}{kzEZH&isXapQOBZZ0{v_&HAP6#F2=
zt^n!i8?at5|0h`M<>L1Cu8w90ia|8QMjyPZMjgg7`%6fkN8;#CMI)MIrP4>f4dnd-
zWh%64Nykl1$7J>maV|+#hu!svQhW>-wB0TA-CoefhuNKWPw^`Ts8E`5>0-X%V&uG6
z1)k<fiY}3-MPLOZMX~o>oGY>Czc31BTDB($Vu8VqS6^EbW3d;jqkT~5MaBu5>!N&E
zUL6;mY%3@)1Dt~@n)!vaJ~FDLOjEAO_Vq<ow2P|8nK#D{hMX0|-pd~P-IHpBviU{i
z>zgA1ikjY$4VdTCs(_iA%X!$EUle73{&%x_Xu1%hL`EW>=P=fl@%#{>Lh)_lk8TIm
z-LB1ks{}*0xQJh~{dPW4@fNmtIKz1OdD*@_+=-;t;<-i&6;91U1DNqWg3!-$k+e;1
zP{?WGiI&@k`b*HVLCB8IMf}7Qi-3#!+`U4s6YZ!4ap3&h+>6%*yJM^`qXISAD_h3@
zW8{K}ld3`$cRGi6t65Wxq_~9@8s_HueFh7s=PGUHm{l)o2EP8&)o%iBwQ*Wo9V6tz
zb8r!4Wki$;)7f((DVS)D9YKFXxoc2x<q9~GGiMOYue@mTEeG0`V`Au5+G7!D{1rv>
zcmfa00EL9@PGVqpGG^pBqcB70<m%_9Fv3!)%+BsYi#8)K*2^O*2@5<tRmi{5OD(?d
z9I1NZQCLRD5nE%&D#2WaH0QD3ewo8$pp^}hZ-J-@G+@B|OYYUuEqZFFNtU12VyxqN
z+X2(V#LME1%;S0+WtqR8{{GoGzL|#+DsiL+=n?F3`P66xQs9lVs^dGJk6?$@F~a{n
zy8f0qmI~)5PD*d1f8r}XiO5J3bdTzEW@(;Rp{)`cDKfMSG33McLWK2pc%jLJy78*T
z4A~UkXWPPS(6_UCmwn-Qdo^~V1A|X<+;$SgN>5w?yDN|A8nRLv8y~h?UI~a{LHoj0
zdu&$gW874n4i9(1n4O*&y<3GOj<GI(ANE|BRZRK{h0<9h<A2-UMK(iyVKek>MuYHB
zy+HRhd+-W^J}HWH4*JISZ?*L-=%Rg}tmkCOjT&wnl3`{3DMR0{3;zqU`*~h=O;lvG
zt*{Aks{i5~<e%h!q0RKnHlXnqw*in46uEK{x*MJ#<R#k{)zpStC6|Z?PuMoOn;hEa
zvcj(V+)29UMxZ5T_zKhEId1#)=Q!SN&SEH*`P3&?-N5|opl9C}@%2JR&*+ufV>wy<
zI+|`isKxBfflRy*5S>}8Y5w<r9H#2S9@X)?@9WATGju0KuVoiuIJ3n%?OW0}_d+_S
zHSt7(ET<NYtK(Ge3ZV)mByd~=^VTFsXQQlL(N5x=<N5ibjH9f+=&@Qt*C%I{r}P(s
ziz388<>B!E%*w?}cH)6<gHlIToGy8fiD7AB_#`WKN5E;MeWHT)-QH}=P4cmI*{>7=
zw{<jq6)$nzb}m17Mmw=9ZFQ}A995D`^Z3ujCI3DfU-^3em9N@u1;4k?DBw+1hqt~e
zwfjD4^ACWUhK<>j{G;bBtO84VVkAA4IDkpY;w%vjs0(yKhY%g~onWpKG9qWfZ@I?-
z@<MFkvM&6^4*~PMhNDp`)GWvp7dwut`(1e<hkU!|otl+p>Jfa-sAzZ-fE760Yt|Uv
z*Bng($ulhTb(--hJ%QAfM3{{a+1c%3itW@86Y;5yxcQBm7xyDx2zYOeIw4z70Ag=e
z>7GTJDopO__KAQy|Mx+k1}<-Zk<O4j1Q?gtDQ<=LJBXpg^P;p`?J+S823OIDK)1VV
zOEG?4H(!vpT%*LSdsYv|#y+HzmD@B$0`GUH!hmk>H>0+njOSLT^R|8mKd;-=1Ht0u
z6AIF_JhV}Z(Lx;1gVh<tEOvaYV&dgIt?}_1<T;Ep!Je_Lc3PV+nIMDhrJ!>Q?9CF~
z$Rf|EFNgf2`6Gtf@QBP4kQbvp#;Zxkl$`Ax)Qn7Dr4Xf%Uep?P_@9%rvrUFoj0o;|
z3Zx&;Drh2EPJ>mI>rhropEx#hi-rn>ZA}?cS4WcF3qMz->N%`N7@BuqMRH%fcoFYf
zcbtgkAsf?!Ab=EDe>-rgEiBNZ&6~Q`pKKMJm6({A4i)SNJW(2{$uA2VTU%RST)K40
zU2&EqM(fp8*;oRL2luX38j(@O47iPst6}+}RzYQ-TD2(u(X_mT*LRo|xlab}Y{n)p
z;#wC@%&tgF4haLlg#Js%%@apXvo}yM2a$a&Mv=VkI?EJdcLWGhp+Xc6yJAa=u?coA
z-MG))9z9O<0++lKv~czpiNh%%X|#X;e(T!DM`YuHo~VQ;0ZHu?iTF_XU>{FnzWaFd
z$4@yX`WXgk%S@&+IKK+Rthnw1yZOP+&Z6@~HJP;i2M+L=i9|%E)NGm(HGmuz53VQ0
zdUJiH_s8b;^FT49tMavaCwE_wV^`?r<|ctaZH-)ATeCZG;6M|w=(Nqkl!k2y=2bF#
z9*7#|_95dl1uf?1?3&|?&)A4WXtbP(&`^U<@$6vreEITar>Y%1>$=)^cquX{{WNo-
z9zrWgdx^Vntv|%AUC_0ljNUbhc=7fv$gxWbXk`p1>dBWagl6%CtF0`X6yJ`i3hb?P
zC)39i5hdhPW8%3Dzyg;mvW%!sPA(R{BaKMXz<|^kmBm%uuP7Vw;v=7Ey5R*@-rVt~
z6Qg=%r*mKI2-^E`!t}Z0|8@R?`=Z#=w1=Iypcq>8blimaY3Am@Cy4E0KndgKr}aNj
z{#4^H?K2_B1?<p0SPZiZ3`8y~ehMC!+Ou-Yr~c7Mb=yLY+r_&&qw*#|F!j-TbscY)
zzDnv!k+`<f>|IrmWgt?yQP{3SNtrmC<57FWFrFYSy~LHC6u3IblaN}gk#S_EYD^{%
zl1-kqbq*O+D&vEwA<Xs0C|tMgYMzsMz;b6;j)90ug1q}!d*V`xkdyQI<q@JeX~1`U
zSwJ52AA0ugmD^)z>Z<CUVK6mSJztb!><njs$HN%nrYy|?TF~k7g6@h_-dG~?7*~kG
zZIMHXfBeuil_+xsf-1)~?}L%$ANubTKeqQPwn|xzMdxNE4aiu%&gvt4?w7H8ZdaFm
zj)$cs>dk%7=2b^K!M$TTqC5@Ed(bmS#A9Gvf%q6FVf*#3fx@?AF0ffkr!*Gt#kZ6F
zUwVOD?E_M@Y&g9R_#Pt<EJho4L8YwPpe-9zlFTFNhcY6Ql~2=_M-u-vaoDcY*)a8h
z238E{QMW+LGOE%x-{Ap>*2von`=|Oa82^=X5p7zwmw@TC^z<p}n~qnx_PZ|JzA+fk
zHS6d{rcYeb^|PPrlehBI8Gcc;bJQ%3?CU<h%;!xXkqx!U!IzCbv{^F{xs+OS&}S)4
zKuvr=;nOlM=q5;rofwUQTLYgef}MJN<p&@?bln-{$E4_=^97_#;3O~4>o8(LX(p!2
z8W~{phhmO`gVh05HNTsgamG7v!9AT8en?tN{56l@!8`L}UG!*GuA_YSo4@Aw%w7cS
z(*7R`6L`{$2c-HgYlE^<0+2$L$<abxn|I?R1+xs5pMtdlOrS#6yjfffw~ho9OJ7gE
zZK5g<6nm=8RXTd!br6jD;5?}4h+NNUh|GzLYfLmQc3BIF6619`Q9+Rq1QMk#lb9N6
zx0+I6FN@)YNNlO4GTyTo8(F8`N9IWVs3qllyYKa6SG{5}YelvoPA2Qr83mYL>Glcl
zuOGG@rpKg*BzBq=_gt9moIO>#K<h%o(RD}6xiPZ;6~Qqlq_*75#i{H0;SDblKj2eP
z2@70uU5S!d*Da@1-sLw=X{&7xZWaKQ3y;4J=Ia787_d&>6I`?vlF#(=zlau*qFF%J
zrVAlJl-P&&9r>vfI6gZ6@cf}5;j|KOuV#fcUtjyq5Hf=}bAMc?VKH%Q`0PgavZ~q(
zs87q%=7lChhBYnc&t`=Tt(!wQRB?{>Z_LHfa+4s;_5nQmgiFA*2@<eAoWA97!KtUi
zn%Utxm61LstP6TW^zuBjDA_7z^1Vaar^XXW&S|=NN0llWC4;dCcrP4|x7Q;PQI>4k
z7P+WRFDiglUp7NgabC`Mn%t}FgZ!4b+L10u%-x!wUaad1$ouj;xjt!gGAWHh0dDjU
zc9mk&U3n66ZS*?~n$S3qj;W)49_`xltoSWqxu0-3%xo*2-Z$Tt)do7Lj;nm5ZdjXp
zp-$P`@d}}xI7{nok5!C=NkEeXR<zJA5JE;b{}{o&7DBd`hFJ6`<4Bc&V}Hpln@zf>
zL^I+)swid@7Ah$_Fd=<36@N+fQP7?bMCDlPR|X;hWweTqt*uvXEne4E&%YogEp4FT
zrskg))>&w<MO|RMPdV>oZ0KOy5?pd5;bnqTe}2ErvFg(4so2Pt00)Lj)Qi$bM?XhT
zIm*_o6yT9`A>iWK5<GsaUhATrufZ&HY^JPQK4bILyd8+{;Tdnj0<tImMgF+lWsx+U
z$BNfFodgs1IJ8wKRQuzh(X<C;Ll1e~Y7WRA=Cjhn5SfodC56Sz%B3}<#KjaYQ|=_}
zX^mti73taxWcw<DVgz<nwCaHeo`+?j5Ox|W<LbFzu}xe3SGP2_dowrB)40glXTjMd
zc`Y9qbeZ%sEb<}r3^4H$q6)wBlJrpu*}r7sXTC3Vd^`E`-!?OepF2C3?V$ajU|g)P
zWNE0SszCZ)o^a<LO84uz7Zr=~+(I<|qY0@yE5K<YI*TZ%bNQHN@*?Gf*F2sc{M!2@
zREhp4vN<)FsORz2i+N9|>X-ZX2V}W%hi2mOVMN9fo(re~>?K-smdESvs3-!GDgX+F
zj4t9F@3<)rM=X*Yslq=x%(pArEthy+am1p}eOxY&yY>BJ2*}C3qWo(Nk`7^pzA0Z&
z&MgYTqq7Oce-+sp@LE}S3fQO*_}V>B$$|WGq1HwnBjQZlF5Iz<w|kNt4T7;U3{LV7
zwo~~0mb(*<{{k?N;5f1ct%8Z0nbhVXp`@xVixS`dfEDH=^InFM$DeocJV*JGLn?o!
zwT#TaKB5CeaGT;LH*M$R6GttmV-;i`K2Jp5mf3hlLASSjKCy_KKd|imNxorEVy+e=
z;hww4Jv+S7sV#Anp)W=Sq@zk>uJwl#Ugkt-_zmJL?==xUPfw4a{xY;&SjtZJo=(#4
z*E4y?sK3(U>IpxAZW3^2&tKL1Q7brs2t0OS`jvsU6&rS_oq(@HMg5WJW8Ue0NZ{_*
zYW4hgW{R!2<@`4;UJyHrO^tbg2}{Ldqii?v;J5060g_4C%<AEwgIB3<{8OJ|aoaZN
zzST|q7AzRcOrPJ-HO_*`dGqzJdiwi%f_om-xhB(Q<msLu+O3`?2a_=Qq4&vFFqN%-
zCa98Pr*`(EUgX8hp9ZqFeHR8^1cfdZ;DK&UGe3h?u@gOcJ#Nt6>R&j)_r2yTy)hS@
z{Myb5hJ1Lw71{H-Hsk2Oe(*>(%Q%`+m5gN_xha0NVNA-<!1Td5Sv#Hi1|8q3u5jEj
zmu21t(s>>TI!;8KiWGv31orV)*+!vtGEHa&u|y#~7Kn}?Wpn0(r*hPo(72I`$y8rK
z5g;9R)!pTRhIQ24=`y8C(}Ylni9j5OfA9uwhPE@y5RmzBN&8DY{hJ&2mAyAsgw942
zTrgVEL(c=ZgRHKJzKp74SS|-=nP<-h5%=@<19*Ai&V5cuVgjAWLCs*X4ndxV;tTY}
z7Iqv9xqEX?CCf`ul*Vv{pz5>;QT&X;?{O>6s5Uzp1nHpRDcQ)p!%*&hPS_3>jh&6z
zbqUM(0|F~A@jQaQCa5E)(g(YH*QzQiE9iR-l{gx|d%_fnnsP+ifK$EAdcc)v{tPlQ
zf$`Q|r9wL={PQ$C^%LRCr5rE~rwce#{LQ|5+@W++)|+vs9gs7<I(c(rJH$3;$HUbI
zuYaWxGa`YL0~?Z_w>20sJ@#qwbPKY-Z0CWd2nQT##IEREJP%Nc^!VtZ({)nF;p)TZ
zqUlA%s^jy|9Bj|f9=IlAz<-?NagWY`KKn&q2#*{M{BFQP#eV(TutFHpoIx4CVfk5X
zkbtDu{niKp*!XXse13^g?6r0U<$bdM2ap^FMm<jRT8>voh3ZZ!X}Cbvxwo78f}Ny-
zZ4TaP63CdndC_xbmbuLZvYi`zeyBnT9tOau*xMht#V6lnIRB}y!$^XFL!nC(1!b1^
z(u4kxG#dvwb5vKb%yFGlK$Gl__xns#O!E0Wa%!fzA{EF`o~M5B<j0t`J}cf|p|07B
zz>hGH?eKnfj!bOU)+0hsMAG5!OYy=|7_ck=+cNdmd5{=w#P<sRdbssj;8orxC8^GP
zNh9R-wNfE=OcXsFYJO*FES+zGF2e<|A1^kG(|^`SKxdLlCl4olnmMA2RYO|mHbpz1
zAh%Z0lh@egLAaZqu2{UqN!w;4=qX}6@NxR_m<qRmQQ}lfs;z*E6!~o8)8Db1hD4NS
z7&4l<6}Zgfy!vh5U;#`hh4LkBABo#{-YU%E>ws$BD}#rRLw8=B?wDVZzJV2^nb(j_
z0}GBZeQn6uf^$eNq@^(XKFZF&!nIqw%@eG>W{dUi9DVM-VTB41b<{uJ7OI1f*K{*P
z)3q;(v+n_CIRjtMdt(Q#dVrIU!4-BCvXieD_xYDkaQ+CVwKocH6mD&ZQlP8Bql)WM
z*;aPX>`%n&A?{e{4LXIP%ZdE!8*j!3zoj1Hj+Rm}Oj=uBd)&P9Vtv-&jjF&ASb?!w
z63S<JV57m9IL1B)?77^@(CP-U4L0-#cy3vZNiHUa)2s1=nniRjOQm)1%s3yugfW{x
z7SW0ev{a%q@x1gLjs5pM?{n`~F^bK4k#v{tGHur%aED%iwb<Ii;bsz67t>e&U{7>V
zWilU@tfJlaL%jtdv-JLtm+bfBs`Hi)xNkuj;yM~Z^s84nD5<(3M@tg&-GrNX23Vv>
z!Ih1LgX}#6PU*G(818M{bgLfwTSOy`fwBOco{6GYe18Dd>W~hf=~>Vw79WY;{WDP~
zum7MxS#mYj#sj0;Wp2fQx}b!^HFfgv_vo`T?Z?Ot96W>|bZ1RtjERHnbOiQ>({E&e
z9??9J&I9{K9oo(T)uWGQJDs1uN)!j7)%!i`qa*y=S+}(K-14w#*+kfsWvjzAtBayN
zU5{>+n4tUd-8U%xXo>_a^yb`7xNOi>j@7YdmE(I+cof^)G`KYuza@9i*Ftl->79kT
zTdmKYAJPgp0TUNu+pNLp=(%x%lPASJ@N4@UX&KnewrW|o@x9aB(lDym=8CgVSPdD4
zTbNfj>|aW_w1;aCYgMI?ueVs&q;fKJgG^T|@wjH&7=12{nn${x6JKz%ebp$A%Wl4W
z{UH?f>04FW)E?xO9(ZA&x`0eOC*Y--9rNXCTGX8O!?b^>dvM33Y6%I`Vno~EA!NEF
z&9AZ#5m+Hd;<5E*sljGSs<tjk`@V!F4<1x!Bpc+7_6a>E1r09?8bw)C@rDPay#MXQ
z*$X4qm%El;#1IJg`(sLgECMp{Wpg9KS3BJrZwfhO?>{)Z+(r1-S~u4zdZ9@RJ<Tm2
zI1)b~ztf6_w3TEy+FSM(z6h|Jr!0O}O;?hOEJC4caeh9>;GssCF$8$3k4}|4b(Ec2
zXMDM0lkI@B{P0Qz$yA{x6C$LFL3A|6jFO;O=jp{-##71GCTK`euTw_kE<#~%y$LAR
z@VR96v##_nToP-<*5k!}?8EB0J<#>oAelUP_#KRD1J{dy5MI9yM2hjS>;MqnPK-<`
zH>yrN8As;<a!`gW^kQvtP!e@5CP~b+(LA4-d8gPmLTM=&AQQhqr~bjxmE>*{uQ`R$
z3LgKNG`BL0xY77!7B(GSZeJ>Dio?dHZ9SF`E;WC)vqO=S(k^YxGWYuHeFe$h+AWu)
zialBqijcv#`*=b`+UNZ2W(u(4ThripHJ_D{i{)CO2D7T`U%0ePY@5RJY|lQLD>L<5
z?Vd6GWNyet-RtJiLS_rL7{7nfGizAT0ldZ5s0s(l1uts70v||*h799HAH}RK;kyL8
zWxxj#&O_;;H^<^5QsU|1-^$qL#UtoJ0nbdVEUB4!_x1_>pDt$gZ&ouVlc+<Ei$D}L
zznh<u!S-9>nZNxFvJ{1RtBXJ}n(!k1f#a<Gka2-YVRPEi95P-)2Sk{8r|MSm(<l4~
zJb}9&>JK&S1$XhP7hXQY%U=g7ct-lB+nfE&KMe3fq-jThJYr=LZ*gq?BCh5JFyiQo
z@vmJa`!4f_vX3z>jX?{q?sfiwfTp2+V~q)m^}2zzk?b7a|2l(sSfx4{Qn%H?vogZu
zsfD^_kxqjCxM0jx??L6FHD*RYp9uxIj4B#OXI-l$a2MGp;N?YVWab~6kuzl-<L++;
zu~VPZ$oyk_6y1}kjM5J*{HhGUg(1zzG#E5cmZ0rqn;OSkR&qk2-fS#e(DhQcm23M{
zz(cG59}lexDNX;6h0n%T^fk24!sD+!fQj<Xti8C_=}giWTk4i2I{Z0Zm|to)VBVah
z&#NX~I#0D~;m1CcZA=bNfm*dOr<WQWvwxJ6tijI~DocS(G-;%feJa7<R^ttF*KUAs
zSUr%Tg6Q?t_#l4MlB^buqJPGReoY$anXR!(>Y2?vYTMI0oM?NY&_2P6yl#bZ>4{ky
zn<$z`SbNSE=c$Ha+o;uzZNafyfFYPClTr0-ng3CYw*krmX?1AVGN_a1slEeLaf2b2
z=H5{50^v|a;`LyYU!Uvq#nWB>IGt#VJVgEFX#J{OH}g&!@#03D?9ge)l0!C^K~;1z
zrn-JtTJ8~IB%9yUOMlD1xQn#|$J7aM)eSiJt5(Wv(L(hu<*`T*P%-`@<-UK~09E>o
z{!SYrCQ3ENFM}_bttGP+P&D%BNx*f`$4Q1$13WfP0eQs67*#=Z^Uu+!;ErN1;BX54
zSzf$$f@R47>gZN@=c}v3NbZS_q+5+d{%hiQE<CtdBaaV$+ykBE!FcbZe1HDrYlw2=
zg^xhkcRny?s%+)bp|3Z9+4&4@c(2ddpcG^4l~4FBQ>@nTD&v12=h+gM|I}ecB0cKp
zfWbchF(IQXiq6tUJH{F{&u1}<xKll;VJGG8$uByN{3GaIEC_veF2%n>=!2_PXWK8!
z3h<0$GOB(KbVW&zIawa?jGSCEd9UPZxLpJ8QfA#x#Nzbw<JGA(jR}b<NZ+9yv&rF8
zzAfiexf~8X5(E?}@`mVjIR3%d2jZrn1}W%o&)b-xDB0_i9i`^LE%`=+IKWp+xXA0b
z^saUzkMwRnZ!q7z3(~^iP+~i4&<BdfV^dEqA7)8LIAw*9Si_EfdSYK=+TWezg5}dq
zEH1PcgS+0Y@mBk+Xq*zBGs0MFu>m@%iRLkMLdH=`>D~@IXS51W0VlKiU;e+)c4Oja
zp9B~E$k3~61^(>{6Ji5Fie5N#CZ|TP-(S_Wg?{05=WmKZe_wF9cgl{s*Y9LdzjjB9
zTu`LK%F_|A1h@Bp^Zp0<!Z}viC;MW$+b_b;17_8c{LEU%=2tnr?e~i29N(TGF2~k@
z%Xw86)_wro-}C$ILcL{0d=e0SY^gIWF;3W^jEr#WSK!(^J*SIlz^son_t=k_5jW2O
zpvu<{bsFLO(Q=oUV3}LAysmDM|4bv^f_MJnMUujzuSC;K+1gP)tB(`CZwOI{|8#?D
z{qx;pGwpG1-G|DE=PBOIJPTak8!M7Xgl%Q2e*My9dwW0OH1WJ-Yf^%u_tAKJ#zaDA
zT(|~tJuaifX*zWO68B-g)9sXWyX*6fkaql$f=F;5JeUFvOOVZaG(TFm4poG=Z#9aY
znH@rsZbE$iAM3`IS4-vzmdIS-+F^jZK(R+c<+aTvmgQDYcbNP{X%1G`wV6tq!4OZc
zy{D4!xe}Lm2@b5?veH5Clh10oS<ZfI?RVzR;A^qZzn-P>AXMGW`F@KF4R~?9g`nPO
z<kUw_`Nne<3^d5yVKBL%h4bO`m)p@J4i}gcPe+ar#{_^qPWA{dmt`JAY)uAFNaDP<
zb5L)HroR9WQcFA!=_M6Ryt2YtQItyO0&59;!^v^VNteRpUQHY$zZ)N1d+$)KIj|ny
zIAGYVhW7b4Jzk$-+zOk1CUo*?d*J+^SZ2^-bxrhqt3^L$_JNE4A50TD3YO|a_$$Af
zmC=#F8y>+*YpS{}LK5F7*c_Iu-%$<pGg>CC{58V;eo}&2x&B%L`TAjLK6B1$<DIOs
z@S4~RwBgh5tSx7`&8m9ii3bUOfr%^m<R5jUea}*yR1<yIvmS@;D14?OH_7@`K~EWH
z9<XkARkiEx_jaKaj!TI9Zy`5{k=X&P$9drZjyS!e^#mjgK&%j=wB_1Ik4ct{&u|{Y
z+8WYJy2L=91Tb~;%T$dH4%UnV97xNlqc`GKOiLa^J*FieuSvdbe-(4cEdQI0dZ@lJ
z!yDI!?K1EMC=)tBx0**}<lr%y(9fbOxgojhW5^gUrB{W<(%(4Fs^TEWKEKSN6ni?&
z4$4(_bQ%tLkDVOdiwiDU6}+$oAQlJ@93Opnkb<il-t76-EvH=f)5~wMpz6_4HwSII
z1y(wk&!A<@#yVI^Gqo9c5DUcUe-H62tyfV1nUT>7YWF{^N@PC3t`AzjMoT{(j`oj@
zVB%?j7wGPcpf@joo-&L=3b!e9$m-N$TY9`_ov#D|YB3O1E$7v6AHh-&?i~<U;%P%-
zrqhOErdaGA{b$+{KKMVV*aH?;M<`UKTYhABVZbkED(?!iw6})1k#7&7YYhPnWldDc
z{oeT<h3_JW=46O=qYg;1_|bJG2$?<wyFe)y8}{lLQtsk(<!PD_*f(FFlW%$#emTC9
zSkYh{?qEFoW?tv~=VYuj8g!K7LEHP|X$^oFntlS#0Oumc)5ML9jkS(Y2{Gxt)dMC`
zQ%KSN8nc!=>L~RUUs4pkZ(;xTNhFhs9omHugj^aoym<OPaV{ey>qMUl0i>riZ;ed!
zhjMFvycSm?LyJ9XqaX-;nyV<Vkrm^qpJ%VXz`T^hoWlLfH&W34(ie5hcROLxDxd4i
zq6}`Vg4!qxDHu;eHlrTJn0#=l+I#9bpOSK?Y^k>@5pYh}s9lIv1aHB0b64SS2s&Ei
zdbK}53OyMEtFFqSza?SBu|$d-ug6Ovm9~y!PO_W6lhWtpdf4qaCa2HhrKc`CCj`F<
zT5uhUu^X@uiP+PkvbBCqI}K@4cXLGNg;q-NC0gooL7%=Q0mTo1@)<YB2Eyshcnesu
zSX~7h7wtr`2m8E6j{1YKlU?R+g_07V{*i}e2<x{b!#U=P3^6eF){7PZQ1vFi-w*FF
z#)J`YxR7x2dLWu7kio_kVV8=I4-}#e_uN2E!RfZv9Zl!0X_ObF(Td(Eaon1qy^MVQ
zMC$Bldd0-uxkeLXb{!mIWL~kIxEa22-HVhHxutfx2SHn+$LF()(8}9rHbXu!llL4v
zx#~HvhuUbKpnM6t83{hKnqDN@nV$%0S-1_$ibfqbRTN1eV%BZ}VlmRM*o}b?@^{Gi
z4qROtWb7>SS1&^n(9H&2wldZ1mW5XfTRAxf$;sQgZntN@%@UQ#Qx8qp@5JFKl-CzR
z)$@yK6-K}ab8AS|<_EVOAW24!kC|%8x9!pm*AI}|0QoE(2G2+$%n<nB_J30Y>lEjG
z7TX73S9NrHYhg%*8j4HwN_Ud!>n)}kWz2uAbIVh^>^A=&|BtQj0Bb6H;*FJcRoGn%
zs1$b%pwgvDcNbfzN>#cG(mR9>7t6{j2pW*y6agXh-a%9_(#3#ukrD_H1Pllv@a6{H
z|NFl8&i9E*ZtgwzlsPlMnfXmH`zV_{R5Sa)$tPdGz5h+G{n!nduSZbCu6f=|0g1)a
z)Qg-Iw}UC!pvTHe4)$|E`78m0IHiXA1fc~_(s(DKw(sJE9x{SmgM9gL|389z29#Tw
znd6UTTU?H8Rfasbw~a>QnVqIl`QB!zLAS~mpGup?h%iQ>B3fuW#Lbdjgw5+00-F1z
z3p_qBJ*wBdp9rb$NXJg|eY{SapBIhbZ#j1})#S+0ll%2{zhg2LnoA4_diQp#KY6N_
zg;?}XA-zHoa=S4a(mcq<PK_fo1e2@Bsuj+{LU2=?TYjOq$QaiYX)QQTuD#z|;;IRq
zw^d**5Zm$4((k)k+#o-1Nc3`1&fDXdG25GfFvx+A;Z-YhOs}OiPooGQV9C1j)oMpV
zy<6uSZ<CsD!Ig};rMlt~q^=N5Ck;8C+J%5hq1Bi8k!yNKZ@P7a&kbbe4tn+m;oRwM
zchYIol1+Lg<@V&jV!pwWLdwgH<PG(_fe%VxD_c!84Nwfv=p8jGyV*1}6SMr#`eB}X
z@AK0fJA-AU-bwBc#yQ}f0$j>F+BDsDviX&XM&GU>QR6#sG);FTkT7FEW`ip${o)2M
zXQ8td;Ec`^%%G2-CBcxtPnL8Kz?rZZHbTHNnfSQm@e{bo=W7{jlyDE0{cph~n_uT!
zzgf#9ygJ;PEc*fudn4kR*u>SlBemrw-(ybw8C5MpxW%Xg9cI$r?Sr=p$16o;k=AOP
zFEqKO$+?l0Fx?biR>bK;AvU!q@2*To@kbcfe|wu&7H<DoZE+)D=3Allw%}9G)1dC>
zvV{l1!9MMYR_+k5!7;JCK*dMnoS^WppCxfXQLoR<;1&qRsiNDz;e(_gU`zpmq&NRb
zV)+qM+_1uJUj%ZRrXg@+yx&c8=at0fbicWa1QRnWmdyrcjY-x^ihR)6YBDYP<@=MN
z{?=YA`?Q3#^RcAX>Ehis@V{{WmaloVmv$4=PwXaW@2>T#5zv3D-BXjyXyf*f!B~7a
znq;|6{7fcobg7$=sCUfeMIdbhE1O~T*~1PYBoOqP6pq7aYwTp{#JVjIIv&X#H|`6-
zV^Ml13y6b{^<6XoY3>z}J4u@Ss~Zy*;SkB4Jf5@9d~hip3$7^e*epEUl9LTPV+rWJ
zL?+kwq)M}^)8pqJ%Zrnhh{=YGZ!fVbY9N?|A_qI)xuW}D{P8;$c4qMxoxd{Gt47*?
zrSTLz5L$!JH115f*ZLe}8OskS;ULR8Pr$>P-xr5^Y5o5A>-!GCoI7T(7yeVjmo+G*
z05zO*j=t%gPZ@{84XT8Qa&b<$l}5!DLTAy)L~t_LRZl_^IvMbMXqO2*INk&(!n5O5
zs}h#P#O-cYIC$<B@00Om2s*3ujIG=onWKJ2YWOL7b?|+U_b;30{Fb^qu2<*gBlt>3
z4iHRTQ*2eeK5*=4L3IK1_-z*{x3GMDb7ObVFx4^pv2q;|%8~mHM#oU7Paql%4+zde
z0E3BuaB<8hv|`BEc+OtNEyQ~H?S<{X55^o1*|~7;=Vz$`zZ^Vm^xF7fhdq%=KK*xT
zu71B!X)dSF(-MP&Urs*LYuKTI5xerspQ*pm6xi+#Hq+YIH)1c0iIdDE8MCc*Bl*2c
z@s{-+<Hdb_ZQe_Y9a|ZNoele6aUn}8xMdA@0|Mgg#2wr?7(f2#gPN}lyTmdQIhzEf
zpONl<Rt|cDkDM)qxt3hBbSq-ny1fl7FzElD^9#S9b5M-!U;TGe;ai0e=}%m8!uX4q
z14Cs6`K$nl{&?1lw(F{$Q6Qc8UPJ)=(xR2)gj3xah-QL;XZYbM+?kuBjsFZB;(30d
zY`UZ)mq>KDn65)QK-qJId?uclSm2%OSPlBWl&i`9CbU+u{=HI^T}dw_ry3t9**
z5A3ZTCigx_+;uvpWn%ik+)U3-$w;fQriTNfCKUxHp0NT6@z1Mw)LU16y1h38nUn-R
ziHm~Q<dN6S<?8OX_MC4!oC8^)&y?cQvj6aVTHfNkSE8Il$g^Tc+GD&>OSwwGd`X?A
z(m=<^N@d=m9aH<#cXwO|^V7odXj>svE53!5Wp_^D32-jQUV<7|MsXd3AA<6kcE6%Y
zaH-c>fWK#SAR+OIm4Q9mSvHo<jIO_i%NhwXbEfG!(<d%aY|HFR<8`v4un-cdE~G~!
z@7=9ZAAU7UkAQ{HsS7W!ZoFj!HVYHat_!Q6M8<Y&Da@6^S4&UyAx&XN>gzW%WNYo*
zG6MlCHp)!~Hi-7q@|Pr)mV<H(h%25`y^f86`O>e{&DY+u0gD?FO2cjv`Y(JL;rn}b
z0cQZY7dRx;1Kn5W27F#_Gz*&-Y(Cz>ye^kMC7i%`IiDBn)qi2L$dVu^y4qk$iEc?+
zLB=tWXaaI@p(L{XWcv<Wopc31NfeiyJl-Wx8{`cl94!4inttf<#l@<W6x{CaN3dj@
zuSZUhj<6C-;3JE>e*XTO4&51=sv=b*UhgIr5r{#Xz$qJfMq3L#QLEQj>?PaNDHm+)
zGIX-O&cYv(TKZxu%#d^STv^Mh%tS(O&7^cXHp_r$T!Y!%@8a_+MP=fYcIDa!UG3V@
zLJEYUspIn02_x&1vX@kV^9q@JQ55A~xqb(Nu`UuqL)+hLz%V-#mf-1EckI~V5Zc~t
zg<KVl*?g{(<!Msb2kcw^Izs<GEsYjj?ffJYwFzjRy$TzLlPL?wwG~tE6`nDzTD~={
z>&I5L5?@>W-T~gtRxI9m+k>Sm1Z%TRS4a(HAFe+^x_M^+iFjY*ejG0F*&_N)nixXs
zI}))Yr?v`6f&ajB{P87G&7zVi?lv!o0aJ{(T3ugV$`_MYFBUN>d0}+=iF1mqi`k_>
z=e?YwgZ#MChxOLlnv2U2;>egAVGOS*Cyw*&PT6GcTH{;)#D*kTUH^5|=w{cm3xPO<
z<~){ftZHcHd$Up}>v?(kO4Et(vw!P%`NrG9h6E_0+s?fBPsvdB20o}gJ@}GQe{!pU
zhK5v14YifoUN<QeGF#D>c*{J+Z@Lz>+S8<s^y=hkAjA6;Ru7z`$XgdPv^5rcUgnCC
z^r3+0VlB4**rqMKwC5S*jZ(~t!<`?&1n|40o4$lsghA6SQf`nj+iNX~8JwKa+bur(
zh?Ab;4r5pQezDwCCY1pbU<JBT0Sx3um7@6kF7Ca-%Ow_jJ65oAey)rNtapZ2(AWxL
zU7Xb9h6AJETr<lw?et|8I|u#qT!>M*y|00AEriz^myGdxgoXnV5Td=v#3Iq-6xFaf
zwKJWI=P_@x1y<=W-{sgo1t?3%Zg)d~^<?<Ll?6r;oOek#E)q`Mlk-Z!y6_AdWEy<-
za6@go4+Jz^*ptPNjhVaYM>r6f_?>bb;(yoiD_SkBbKWBIO^5OLm4iInEIdGt7<*hJ
z?2SxJ7?;G+obV@u_c({F-;juGxyPlzPipGfs)d4?I{EPMlYDa&1IvZIH>EKXsi*+C
z?ae4^TykR;l0$HJjQL5WI8n7lvE2K6U;qTS20%GEZrlO4jHoZ#64ZadcVXqjS(5J+
z@E5xzF!E53)=L{IEJKtkN5dl4AIQ&CV;0xF(VA&eq>&OSR(!d}Uy^>AhTaLKEg5xc
zn~*07@7l1l=LPq#!OKh6rrUwK2(7brLRV-JI8C&9njE4cxuc(pv6NV@Z7~1vg*nSW
zg5bVk6%p2N;TM=DY8kd1C1_p)%})ax8uHEO6sZe}j1`s8QAH7BvFN)H$(h3_7UV0>
zk@etyg(e%pV1)bs%w^7o?Q@7?<Y_K030U9qlayR5{U(#X%sauMhATTZ0gNGzwtq)I
z{wPy=0ok}@Z)s0SI&`CCerN+rOh`=sX;K>#`RX1vhQk@6nLP-cSO}eW%VPRh@Q*n7
zqH+K74_If~vYRS_Bh#zl3m=Oxu9IDDLMLtJ=(ZQSrz>sufY)-S8`pk$?yvS-Ume1n
zr36=SvxfE}9qdaJnb#jPGs`Tx+K}8WA7xtCfKut1G;hC=)>D!X!ndEJ=nlTJ^0X#U
zBHTx`n<|f%Xq_U>;k>vfHjw1;*~vH4KS@Rcr$itSuZ?N8p7{;dCH^2IP=YiNpLnxE
zRPBt*L58WsJEnj<=dar}*wqP%k`<cj?p6d&emRK<vAwlE0jRGY>7=m^rjnR$RzNE{
zw4FDyalA+WZq3RPDRXlm*a-NRke^}%DoSy~az6EnuRkJMP$hMM!2L^T2fF>lUnU04
zjxa}5co{T)=5^mIUDst+#s-3v>8-@Nnz1#_Ko8N)rBE@km|WF;n3AO74~M&XAKDYd
zq$KttAN>6;n)es~LGsmX-5wU^p^dqgGG6p@E(vmGjqZ2sxwGOTEDAXgm^l^zg7yz>
zj(t(se6E`M(`x=0s(#sGAr0HXQ-k;mC$gN>uga|GMS14K9?USTB%0yaEoFbhWBsm{
zm)=E{m{l`^aYF1astDIBq|S!_dT-A0hFH6*U7y0SDZGOjujf%9DvZUc5q#e=0&9bX
zWQm0T9J=S)ny?)>cQwK>_*JKKHstL%y-XVcok<_JjB~$Ea44q#bsX)bZM@hf)xm##
zzHLOof^vPpWhv``$~Ux}*_7=A|5(THBgm^d8!3@pQZoH3lymlg1-MZu+OP{gLZSM)
zo|h;e!R?cWL9Ir=0CyC)r=)9~Xk`Fp__&|+@A+YOADnN(X70BftlvKz#81-94c*Zx
zvzs8yJ$P@i2fGvr+>`9NTgXmAHNG#mIIn7nQcVM?joiYb_l>uCd2*#%jx^D>Z#&*k
z*SPzJl&FTg;nFiqTI#o7f)^I6KD67d_kIY{28a7*_$s{Jx#m-xER+ii*`T6FYU)Kv
zWj{`Gh&Qr^a<LzN4ywE2dN|mtJ88V(B|}9k_X~>4py5AJM-^>GedWoB7ml50qRysi
zWp^&#%AT?o)^r5=Aax;4?l4B`)%}Dam6H&P2gs5jZWyW=vsC`h0C3pAZ9c6G$BkdY
z)o}~{#+r3NClUf9fwZO`Yc6tj@44z}?IIidz25uv`#t;!V>${Qlja0RTPG=2ComUt
zqZE;n&l`3VS4A^7r?L+z%`gn;0;Kns=2Ob*5bMorpL2{hzeLdkiGID#)NEnj@eMmm
z-(2kVk@Bi?(9w9W*LqS3mooO_6CH}=<Z-<xm;I&Mt5fOWM<#-L1uL`T{tUiaD6khZ
zHkyTFxBU_zSNg}>6OjQ@Bz{~wPYquA1lS+v5?BIR+)Y?>(fmJb+CtCy^4#ZEaG|;V
zTgZm3ES<QI>2EnlaJVNytH6c`_6d>LjN-Rk{;8Em$-SOm8<*1E-Mi-u=f(S(z4_+7
zwSN!okc=Gn_TKbsk2<B>q!;e7`D&%zq>wf`eXK<&bI`|F`z9is{{+jCUyWFwCcii3
z@G>-5QIg93BbDavomt0r(Krmq21{W=_6u`O1ldSQ@9Gpz%lT<%aIT+$eSNXZ+(=v&
zPV49(ujb<12jKGOKe9BR2%{Uu$CB$~Hfr{4{RXVmXLQViqhAQDPXA(AroNbfT|slu
zkR_wUJ*kmVguy7Q4s6WLnZ12;kByFW-Whwu3WJKLy{+XK`bIjSUGF_~k7_zmB>nF;
z`Pa{dXj$yo=5-QoCHh_3z~*R3%t~HRYT1%UvR7kZv31)lpL%l2{`J4xO_|=U@sc*}
z_jZNUTeLPmjvlEjB<f^EC%ZL_wk(ezF7?uBNcvK;e2?&fPTL1pcM}5Y`u<F9_rh&h
z9b|}Ty9Y%UW74|2mIN^ZVZ}gHFn$w7X$yXDa)}w&yfXmWZgRix=iV|FkBsJ-cdz2m
z_wW227nD5i@x$K1q+ZF_I3rEkz@g-#ATzQ|Khzl$$~h2;<qsc3gX$$nIfp6eA`Z?N
za9E}>^L_e54QlCeE;X3|H)Bqe7!r0|EF8IjquIJ2ej%%Zt~CgayC-0?Enam%1e5D-
zPSECu9JEM6VzSkO`0{`VsXB7~G)V-PJdzy@H<kh)BuML~W{Qr`yd0KPi4#2~!@gzz
zVlca|L&!=bP%pValxb>G?vc-9&FsTkn&6%Se-lVD%jS;2mv<CeKjzuAx5g;|4T{G~
zPDMR~>hBy|>a2<vn^3~=q;)-8B)e&E%PqHvVkGr_IN147BJE?Q3W+nGXD3&w+K?qI
zi?9&m$N*bce|JJJ<R1V%y6UXA1>t7yK0r(wKC*m^TzoESKt$_7SVtYmTkRmF2RqL*
zSZ3Xf%}n=7TrG!_v-6hnqw!T7FZbVr#gPzA5J4Cmrd~m>*HG*jV!S<ci56(PR_vaD
z8gZH4rV0}!p&K`wvHo=v1+t08qQ)TzSLzO_)6)w(lC`Ab|Bgx^2-~}}+geGz(c#2a
z=J&z=73x(oxcgIsPxUDhgRmY*NQ+EN9OuVbOLH-1UV<qfyoZ(4*zgT(o^8PK@FNZf
z<1|XnI<%4)J^l}Cq|Xghy1E{FcPz4ozx09$6k*MI@|1;t#`-uLEh3W6ra?>Wl9?-7
zf$hp6PEc10!vmCLk$;{l{fBso+I_X=+{|3^I4<que3&)cwx;Jn8+xa(yD(Tt(3GlR
zULaUTLcE@Oqy``NQpy{&4w?m)b+U)?rK2hq+V=G>?RMeQTpau34#u;BvTu0!7i8<h
z$oIW@3iEqx%$J_1dJS5)H{@&Aevr1nl<1^gm}nVG-flDl+Tf8<Wg$Xh?``2L^Q&ne
zDOFe%2d`f&G|&@k1QYucpeiHi!3_x+hj8s;XHaMHD;7Ujs+^aWyB=Zh1E{#gYUeKb
z*g<?ipCD4YSFZfIEY4h586$4gad~lYUtr)H2SOqN1be$yQPG=9))#`?yQeCg?FMzv
zIf!t*QHDc%VD@-t1FSAex2E>CFn#8F)>XMbFbC}}5XAO7!*@z<t(CdL-xq1mv9iGH
zN_zPp_?GIiE=;Oa4FgXp0(>}QP{mthYNxpS3|d2c<sR3{GoVCW?26tBEyT#{!yx2t
zyO4RrPU0PUNO#(&V=qOxrU2JM-)&(4qdQWLKG_N`+?Q~t3?6FP8)KzK7{<<@{9(mm
zB3owAFthyX>S}<FJ4rog7DGIO6)HdDY(R(`BWwwCTUpRz#UA?qY@0L;D$S@er$8lf
z_39@#cCDhBpH?94e!s}u?O~eV-`DexnaeQOCI1ppo4tvKL?$MUm*d)n|M%QWF5usY
ziyXfV`Du~a<cl+k+d6l;sDWZoy-xz6(Q(R;A-u>eVVt%lfl^i5l4XdC&v{l%>kI1<
zsM`p7%*D`m#-1@+?&k?k7b_xWmX3%uhq(rr6N-&~eSRlb-F^1tis@kM@e^O)VRb=H
zG27VBY@f%S@juAOwe@;*8%8Kmimkz_^GSdGEz>OKW}`AI=ywVcW~nvtV;%pgpAFB8
zPm%m1Yg9;KSV5<ov$wJ8gu%1yl`szofpL$k_;{&<G!W0d-<qFPOCIk}HS}h_3JYJC
zNfVS8DLw<_P&z7yB;WrXH4|yl_W;()?O($;tqE*shv|ZqIa9x+x$1Wz+b)jwKihFI
zCurjX*en=%oE)+~Z!Sl2&{fc0*o)hcB*lXZ1MIi3t>wg8jiABQ?!#V}ejVE(Q29HF
zKR05BcvfJbE5nOGH$GDCf`Zm=iY#=p;AU|~J9WT!QftO5u2L6)(VX&uDK6iAFv;rq
z8|0)-33itvgr`u#TvH^Cf8A;OU~N@5&HX%P3W^Z9EzI9SBf&Nxu}scKQ5EgTZ)^~M
zjJdZAQP^P@&V28Wt#$~%oW++7%?rD?#qMm^UZi3LIV5NkcP#nT7E265(0ymoGOV(x
z6pAd-h=)zrdh!*4kQZq)_3Xac&A}K?p&^~k9L!?1H%DJ%c%F4}e7(4L{x602xc=2W
zuSyk5$8L)ACO@(2`Kie~VVrvS=C-E1A7e&xRt*R+Ae5tHaTBMdmRs{1$i*8hy`}(v
z3FY%B#3`HpaKU1@9-0gIdJ)91t7-^@GrW-V`r@S@l?`u&>1^oNoKfS*@q6Lj7e6s@
z5U3F{>`GqLNT*I6T#Eb}X0Z;%M@vrb{h(ldcTA;^aPV9)tgVuv?VZ!2>hDvYwouiw
z+5*KcL!>NnxyVvI5*@LhSR+<O<HQ9i`5?Lk+IG}RMOy=6%Ty$p3#`r=G(|<4B#-k&
z&Pwuvu~TTs?~AwRY+7--IS39$;MBpD@r9V6--&D&%wKCg5V79scByVL(R<bemYl#p
zYyV8B|MNU}@)%A+4Izk?oc>9wz+$H*pT=UY!LDub&w@6j^zLuNc;2=r+`<OlDd*TP
z5wwCufCvCgY^<-ldN*{nWGe>SSoTr>GtOqHj!{;38IDC(D=DV%%gK|bvv`EqQt{FJ
ztA2zIb_v?u4{AZMN}ab1N%12hrp2DrIgXLax!e}o6q@ZE`B$J@1Ui5xPF<`#P72KZ
zc{?766asdR)jvY4bVG|UZC4?lF~xk_xlAIO8bra$sTil!YvC5Fu(D`onU{z*=-Zw5
zxJ$qi;p*4K1zq_O>xHo`<RJ{I_-qnk<$Zz_<Z122EA|u#C!98c<_3wHXbZcLPIJq8
zbg<K;nm<nA_JU0rjE=Zi=~x!>s_+zv)0lIYEdiE2bNy$GKxhgOjS!R~Ys5&V#z%~g
za+ep;3*jdHEHbZPD=)&S|J3B*+krx)1K<xH@5v3DQCp0HCpHX3I;Oy(n{9l=+mUby
zr~pZk&A+2Q05DbM>6;@i`%lWhyuGjfF0~4as5sp?{KC8Sr=}n!k}8ah6i8M(2Z}DH
z!Ky%t)QpPk*H{&eF@#U0@E`DtVg!`X)f7ykUBEd*!G`}dyx=_+kmz!c3kY+L5!U5N
zlE%qD1(UNxEXt&t1%O)N4X&qD@z<?h7(J<KekG!C>%Jp`eRDF!`TEbcjxV7L88=S_
zTW3S4dPhFSqUh-5#Ub<{dJYEYb(L?0{8@+eVIOy%^Je+8f0j}r*+kAJLmp5a@b&+7
z06N#Hk&Y!lQ-#A%M`w8nb|Ke&-Q6xJ(N=bk|HOQ&h44~wQXY;r_^!e!lKb)ayLDvr
zb^zKZfmC0Hvcszwb2_P7#!-04OmxN*Gj*I!ag5%J+t!BvD&8!jzSw54`<8q)R?aro
z62P$-k=E@}+RSy5v;^jhPiQ1mmk2=#B^R;Be%6GE7r(_)<^+oIxZ&vW0hIWo3^H}L
z8gNeN5iaQ>#)DQ46Te`>Qu5iIRdYYBt$#SII`9ZaE9k>#)^-bfpI7X~{n4o>&%s}k
z@)Q83PCXdD{ytl8HvT@#SW6YYy%!|w!rQ(e?a5v5j-S&dBj&v@fWayds0pcS@VwY5
zmMRoEl#ViSy=3v>q1`wKbuO$yDeJ<8tL0w)>m^6Sw-@XS3%l-=>k`(>wlv@VMjTs;
z&q$C0EwZmWlV;`_-6modWZ3cSjbVpb^;4w2K53ISfX2&rf7mn+s(f^C?75!S#(dsP
z`7tM@E~-A!kJq%^%8wviH(x%Wl_KM0A?(X*<hIg!saGTpF`K?V64;W|>mnNsp1VUc
z(OUTir_=qTg_Fr6rPg{gzWA6HRi2T!sl)q}u(<az<Dt1=jd4r1x^ZAvy@c*yH1$;w
z`xQhTW*-xLn>FHBPzozn%l#4#4lF<~Oe2NGfa(LCgEg%7yPl4OekIa~U?t+{YD`{3
zu~^KTvyL4$IetyaY)T(fo)m|+7gd@M`K!)PtE_(u$9XBt`Oa76Zcz{&(1iWmycuj>
z>U?3|R)r)zW4Q8lzvGk^p>&3Cj^_oGDRb*s({%7#+b!eiLY>dbF{^&&jhdQ)J7)Z|
zpV;>}nUJgf=00p7T{RaC4GpVf_U|j_nlQ%ETyFkiYf&-Z(UEQ-x~n8)E$ad*6rfq0
zXU$=fvooQVu%0?~9Q`FU@%vw~a#mk9Ca(7H5WhP3czo#<*9!Qp<SLS4$E&wck1Nm3
zhy90gjzzCq_rfG<A)|j@$`?XaY$U(#dAiBv2W~pK*bqJ`#Lg}%W#Scw*nHqryL2t2
z-7zDKWE^^0uRa-5%s}WRx8ASWF+IvsibucPp@{LcK-nQ4StY4juqfFFXF4Ys^N{x0
zRsWvSbTs|s5H4A^wa}*I3<x_}67MUnatTtONc(mvLuTu<A@whq)FdQIM<M^qAXaD#
zLX<+ap<pd9djbcl9+GfP0gEiZ0{WuDfw*ODcMZbR!-DaTt(;m8Y!m;DZU6AH;B`F<
zcDNuonz8IsU)<c+8!+*Rr#wy)xRHY0u4MU}oW|~wY97Uv@ibL9M4AkJ7QW*0QoK1S
z#tMg^E68w5`eSmJKBN3MU08Fi#X>B{K@?v|-9sH{gtaA4I!6E#;PPTN0J2-H!AkPc
zcnB^?=5>V&wo;j7j>@-Jcq76PBtTeA7&P(3g5m-JG+}OUw;aQBc}6QAk6tM$9zC2E
zP?UZuwGgqqCr9%T(cD(@7ihFWkmOX-?$738Bd|Jy^~M4XanL{fAoFauvxKgemo<ut
zM~#R5*9lAn>{U*zuhG5wR1VD87(};lNLc?#7y=W*it$~A4_-E`F9<*nAnsSEF8Yd-
z%8ht-Qa$;7hY|56)3|X%bW+Tj>u6SASVUT+Vl}Pu6wWMWeDcH30h8h0Ct+}{Sy5G<
zMYlev`HP~Np<Au<iZ($EEv07&GuZGp7Y({8#RXM8aht$~WR{&nlWf2owFZ&Z6a37y
z?eb#ljWDp>GY;F_@(U3}`kcAO+8yz~r1FCqMPCxaq)LYmy=(T<5&E*~M93GEvo-k*
zhF|JF%dXgZCg$8#n)YHiwwiyH*0Y-zSzmy-y4MRo?P@4UO6b4ss33T~{)wBmwmTk(
z<;|2qb%xeIoIEfm@7lU?Dc7&(0DC=(D@f@hrL2Ql+^a+V%*}r#5_E)Uw-(AQxGZTM
zzfiI<2Mm79N)scJ8`wW^yUWBOqwNWL_O)Tz!nFZQ3oc}3qLdVmK_My9hySE2#<EBP
zw;8Qm;n-J{bFJ`mF%$@KU#m#pZc)(#Qq~ftSrDl#-x9O(jaM1mWuu9`iEi^3T)y?_
zPZVjf1+(j9`8)1E*-w^u#kKSh%TX#1TPbmcVng@}|LpvY4mk*rgx4wGD=5bg)!PF^
zjFmU56UQfTK?z1(9oxnTurVy6Sb9r8`53_@9^itFJQig!Iw<E5A#kCc%t~UIs4ceq
z^$H_?lr!BcxfhO~(kE^}LMlgE$Lcn*w1;!ciOjpD+9PwHCPHWnQTxFIZlUv{N2#a%
zVzrTYn1oH4;x5JEuh>ibB&-7oVh>dhr%L~rQ@XPn=u!-Rxf7*wUMEaZYbzQ%61JTW
z@E42QR2G|1!^uDek_vwxKh7MD@nyB(!+z81=J9*QYQDT?<MsLU4GU!T9GDYcE#Qhe
zL0EtFX*n6o=W_F;EvJKl<J(udhMYW>jn@l3HD&U=f3_p!7}qYWtjOlgcf8{8t5?jZ
z>O12UA!;1+E*L+++dU*LfryID(Wnc_JYSnfS^_uBWQtc;7T?`;&^_|vAgA^A>(x|_
zq2Cf@)>i8)@kE(JJlkv~T~t1|dDqYV8)-<lnfUX9P2b=ySrhp&KGD^3CAQOK=6t|N
z+sNq{x;)17-!*gl_25h%JU{Sm`Whc8mM4id3$m|2W)e)mcoK?KL=@St2lu>4QCZct
z#GGs&0+1J?dxjIn#RwV>;(6#ynh}idPYyH-9S3#YRU=H22;1SJvpyj*GDpK*_5T_w
zaQ&|?m)F;R`S(QlH`*_%E1K?q0)`YIO)82G*^wF-J~+D(@w5821FfYhH41^ppm=u^
za@V78wf>ZR<6Y0qIS$IkK(6%1x6d{!3#WcM@Gd8=I5hkbw$FJo(d6qJhX>&jql&K0
zCpOH=ES}C!+>0J$zF29s&S;wzk>7q!*YW673-zHxwT>|tUvT@?5n&Ti?5?o3a|A?4
zey8Kh{kU)u`JJ6Q-<PcT2Cv#8?E~_2fEFZi+nIdoPO|DgI|;Im>o7~!d4Wl^{Cyc<
z5LY!qCjaWUPa>GPi4$mCdOpF?>B906T;8#m^KjL<X2#pb&5xUQDL(BrWA)$GOaWwQ
zc>Z1ZW6m+YYn8#Dh1D19z?rvtjX=lqjQ~ITNVD7l7}`fwEDOBgP_<xX{Z`f}df$PM
zQR9zMzR(Il;=<b7?hN!O%KqFRd)_a@Gu=cKmfK$+E9&M~Rx&l_3ZGA>Zq(h{_qDg@
zgpl`>_uVr^FPj}VlBbj2C+YMhOiGZ|N~eCp5!6Z{^urH^^Y^dF3Wrr{$BO$2<ZG>B
zsUZKzI~?KGhT0lqHvv15=kDiM4bjYQo-6SR+fEeQzsgSLC&p;y>#^+yrw+W{rh4Tb
zVNAnYumJ^{{^Y<|c&O`w;5<+876fo73#ZIE^A48Ffk(w&ptIk9kvJ}bQ%)Y|!L<YS
zi4HD`e*ytdB7mQ>G0%&hxK*cnEl_yIe*HN(BOw{+beMepf5(`5k*NIM6ECSvpLI0F
z9SrkZTjL~){pi$ZY2p_<l-=rQD?9R_`ob@D0c#Twg7LYWC)uei!N?;1{+O)c(36><
z0Dpqje5Jw!#1B_|I)9+qa1(!HjV<&Fvhh_j#Cln40C*xkU-S8#e&Nz(f?|=oo!Qbb
z1)}u-su&gYp6G9J7-`Wy>zdi>A2&bI958nx^nH0&PuiDE7e%RJ@A#{(&+d;#JJ4Fh
zM46@ptChg=j@yPaWdW_96Xs8&tQ?M-Og9bsa{!WcRgnIE-@kztofihm5rG2Oi!LlI
z#+HR+ivJ4uyIqG2iVFGTcuz@fnJh3$qB8uIzW+*Wij{_{Ao1hRu`NbCFiKU&q4LRY
zUjM&ogO%48tBJ+q-f#Yi|JQ5S*9O2|v>i}~Lk9F>@Zk{wwN$C!juA-qk6hR9`W+qr
zve$ot8_VL4DnXJ87IHl2pRp>Bqu;bmc86^qMVNhT<y**d`@(61d#<xmp|_P$`(1H?
zOT#XsR#8Oww9x-z3CcdTVku3Z&!V@2Gx!f6xp^~aU%K`c$ekLJA<kp+8FC@i%+&Ld
zHPL`LVP7hbKv0Co0|)|vI1{^covc9!eo#x-kzboii^QgEu2Zz*6})NLw@*mxXX(X9
zk6#ZxEOPXuyt*XB*#r{Mcq1`mU^!YVtTQt=H=j=QXkYEuH#Eh6XjcHS*sQ!<X!uZR
zVhX}~?hwgTt)yk7HX7R!EkdkYpAZw<D*te9Kz=lJ*9^zV(xW#!0=r#AWAGqKAK4F$
zLCy%A<A&dlWOya<KUn(W{p{a<V7wY<o~TX4LS)R!Rwz-GseLmh<$C}Pgd9d&S$18I
z&(b@siJMdG);@?NrN^nIs|eedw}@7+>)Ow^gkQ}yD9<$@3IdB&Bn*X>5>6-AU{hN2
zn$^?HOhL3@%F?7PuuUy%pFz|u(KzZOPt^FEdAtYLfMZCC$<#Uhr0moawOX=$X<A(`
z!Kyt`PW?eUMnjZnnBN}dWS!~#?!&V*4K5}#un(yyOv}hZUnQ$G@l5R*hj%%ewQ<E6
zsB%I+H#C;_J)iG$a=1JPD=3l+VZHOSR_!7glJpPrJNW+JKtcr^e{s(|qy`Qdnk=Zm
zKs;StqHOBJ3p>HQCa9&qCnm4dP?!Z%!fhq4qm4iwf!GY!_*Mfi2TAQn&E-vgF<;V4
zT=b!1nU#k{j6BT=D{Tp~^A2dlkx+ikBE0BCf0k}0uj}hyFXbF<R;f}T1>(Fm-pAB=
zdJ{6G7#!CsTt`FTK{dWhlWh*m4%!&W$S_Lp-q`UVI?;T>Wn+%$+gJx=J~tbEtol?T
za@>?hb{Bvv!5RKDk|UlJH@0?j*+4bB6x3xg$zM)430R8ozE=HoJ~e`SQ(Kl3Sg$is
zeM?-1?qIu&CS{*|KZ7Q#RIwDVq^ETv+@Q9T)o{uw<BQnMBrCP2cIf&?+fjcVLh?%n
z<?s=(&*7mxNS_U(wwJH8qu4+hUtXE;0Ia?dMOTmc%zQ<EN^$<`yWgLH&_0U+L%(s6
zzPAICaqut!7Vh9+q7cBrBpW%)ViZh0aMl)Fc46g!Z-Lg#e%alVpuQKy0ibmXWRul)
zuQ48k7hV_|s=aUt^y#Wo07W2XvE$U=o7%OCo`HuGZMIc>!gT>5DTBV`VTJZY=_RKQ
zd0#y0GWVhHZSiL1Tm+IkP)5^+@x`auZipgNB;Ci=Nqt){`uh)%_H(Ry1y}B_fPaBB
zjm!HHNp)`E+R_w382Qxm%+j$dkHM|uxf8+ImTBTdx&LmB!iGi;62`}Hb=_MoB#czY
zvw^&i)3XkB0EYi(PSqCx7zr9kM$iVzTqO{(gHTgQt4zkaXuGS~Q{17f{XJH~K#3gd
z9RDLnYq9Z}D(l_AKkZaDbV}F8(a<wYgi4FkK|FUty|6vFNi<@ooMi-}S86!!z(-X7
zjFZq(n;54i1l4$CNmVg>^Gv&IJ=;tN1W5RDvr4!A4|a3}IpIzrC|HXa7kf5Uy<fC5
z+$_sHgJKEk4z%Gi@KQThW)j!l-t)H(o0L|YaL4D!VJrw)=BgeVP%|1y%~j+F`u^gh
z0gee+04vw9^MLbUgD3zy-uqs~67A8sgp*II-*+qILaDO`KBzWk7+G_c<olmbMWAe>
zsyV54x1Mxg&;XB2SW&s4X?k+<FzrYnu4qWcL#91exprgT<-E0qsSN(+O8@Y5t)#3I
zqT&#;AN8qE&n5R5W<8g3X!1ICiRm}7c+C<ZI9>CAvl**E2x%aC8EB{N&=>&wI})J2
z_z`s3%85;<j=|z;l4qofU@%wi>VQkp_bR~<oArav1a?AtP||o5R+r!isMj=#M6F{v
z9;%9>F9qkn#pgJ^H%estqD@|H)9XiX%C@1_e=VL`3%>LF)k?k-IoBndOT;&e7`^y>
zV~H!t#chfE8T0fHPta~xdQmltg`U{kt;jL*hLL<`PZ%9#0?SHK0VpPzG%<>f=PJtg
zI*xs~K^ZN;8e&%`KYgoiI>iTFNA6wpJqzlWMJOcl3W4j)=oXqVaxguL@YnU=8z<!e
z55T0JDl_PZ>}A~Iec<@_b(`4&(K_3gla}so#3<6g9qK^d-v$s0)X@DOlxSe@1NH3b
zi3JCgXCs(2O~Yo6bL>)j7)7W#Lz*W5O=;N}O7v-q$kLrg;SrYfe}D#m?)km71D9Y6
zv6=uea<>cAJ1lv7ob`XlJ_@o-zCOc{i8>lMTZ$~cmsV)|81#wipO>=Ot$@gtcEwgI
z%+*hSt6b{g&?ByXePZL{_G?4A3L{Ei*FQr~%y_-qP8Ot#OPT~Yxc5Ye`XHb87)H<}
zw^`iIHorD}6nwX@dTnV|fyXehgL&#_#2}b01-PSkTlz(=<3SgI0vg%^eNtMhAiQKg
zp|jrU=*<t5F6M&1ssEXEm;+73$Qp5QxATgAcZA)kdZ$DlDj#y9OR#ZQ)<q3pQei}T
zEF(Ui%y;)@+_<YZ*ZCDXKHhwFsNA%;`-owZQgv7C0e1Q2$0|vTbv7aL#(TlTfp+sE
z%t{x<*>Oe&{VThPU&|rMx`ml}seoKr-VG{#Z?aG03uQ5kfH121q`{kPX*-!M1jQ35
zJ?wGP^8Th)96&4~g1*z=F6;pPM?jt>Ck!Bme{0;~=YiG?EGN6=Ab5-A(9&PgR;EIz
z^9Lk@mmuHbJOAO0+48}{fmTyl0n)5p@yhHpHSWEuD}L?saH|>FG``HP*~u%GZ2R^D
z?Fa|mdRa5w9zlQg(OVsHHpEYg)W!|<8pj(T!)^&Y8PZ3)jgt$l4yOEuIbaNO-t-?(
z6@l<}QVT?Va5JPuW}!GvIV9=g(l+Ne-}~GHrBXl{eai-0#or-;8iiR|ZR%XUHiVf$
z%+$s2wwe6!U=sVa>eVrajgdnmeD*0T9Z1J#){k7|;q){$Z#aNjI>JLORbF@&G5qa*
zz}Kdyk=r|e-%aH;-tjZW;@i=-BozFk8$cOjl;Cm{E2ge<bp7K5?w%s5#%qYO_d|zH
zNQgkJP>ljf0+)AsOTUK?&s~~U19y;Wq)C+3&F@EHywzC7!y$9UC8WjwP|}VjdvdnE
zF6byFwcy493+`;05g<1ZxMa(0MY%|Vn}xL&fm9R=rp2qs8X}q%(Quc=T*!4lQ&3I>
zCr5&er{4s{wgv$J8wl2s1)d*l@jWg^31n0#e*CP#`p~k>njC)$LHa|Ibv+SwOe}^P
z>Q6B8)lLKV!Z*u@JsnaJ+cEbRL$R0A4F)|d(NPTE^TNavzMYy2X@NG8gOB^SOQ@lu
zfz{$&Gzo0?xR(AwV`?sfbm+X59B<_X>NOfSMt-)V;p~DL+r{iIdf&stC@b_r)lo$>
zBbF;1QM2ELk_SYv{PbK|D}r)oNfAKIyme=cIBqTlvb;sk7iNI{SCY8|EHsOBmZs79
zv<j%QiJ{@!L}VV>4;y>_lsYG61a$<qf5l)F&C(iwRF&Q08oy}oM4<m~nZ&-PX}RkV
zka_ItJdnC{-t$sFBU}2<alWk$n`9pt6z?7$vB)dmdoJ78RAyow9_p0Y)wuZm6^^zg
z>~2zG;fkGCxeMSQ)LK!9FQ%P73+mKXd+4N=TS8HI#l=X$<>BC16EZsTb8uOqJaDuC
zsm8P4n~=IwICBDQ&yOr`gJ(Q_)y~huim)Rze7mM$+t752G*p-CM}yW`g)6N4OnZIT
zP02&kp7KJ!@4UUO@5IaFH-3F$`iq{-RSVbMTwOP~ZSGxlyK(WVC)YMZJu6JorCsMQ
z47whC&A;v9`LY7+-K5Khqi3;6!^Fu5<KK~|?$yqj4s!bCX8DxLj#@meynQK)mY1iy
zlDx#gTyk!Sbs7uLXT1(kdpUv?dyHqm_Exk@{;+{kUOeA__8F#Sf&TDk&Sc#reJ14w
zaQkVQ7}h$E%8;}Ty|a|B4Y^380z^E0nf{o1LbVwaj356L>x7K47DRMYZi*c38|*dd
zHa!L6ObEIFa>DwaqK<@_Ci>7<g~oEdm7}bZBCO7|cw5Vw{<60A`yEWd?@4AucB2a;
z99vqY#RG1xVy8iL84SL!7|U>LHpF0v)BeN=G0<Bvx~#NJSC7rYwNNUeOm5zd68ExN
z!{Yi?JcDXSR?&`C!qed;UYeLB=>%%i83(M*uQToFJBU16-hex3qL}M=Sy*2NEaYqI
z%?4sbE#gM1e0kN%qg$|JCRmwdgM;-3Bl@ONt}JUGeTYF*9#vbQRWY@y#IL0hvBXq#
zksto-+iw21b;cTvdWu}!%c42JH0<_rZ7p-#+X>H6AN!f3nFl!ebD}q|4lP*osnp2l
z`?-}`qJ&TlMJ%t&)+=BjbTgT3D^bvV^Y^_N=i10)hZwWD8$pe;cI0J!ZI(J*5XAFi
zfRO)dghorKmzo__ve&Yxx2X#bDEfZwR}jD$i=~eSOe?yBDjVwvfCpKauFg<9h#Y#9
z{fWDRA5tDrjfn$#^~yJv^~w6=lw2=BtYHlBRG4D)4(uJ#5(B6Rb(kokR%dJTd|s{A
zL&#G#$gD!HK3r_EihkNKxzI#SCog4(?EAq;feEIMxezn;IO4@u_LGquEhGAQjN^G(
zy<Xvk^&aXdS%Tayz2)XD*a$Pe7W8A@8(+D-`4{GWLWEpP<ka(LmslF7Hc~H;mrL)%
zW)%)WW2iqOia}ZNMA3Fq!jIt_eE<A{aL@}sef)KNKec(A#XCo$*)^s<eR5B6L{{<@
zp7Q>utZREdR(wwWF+Jf4O|0q3V3J$18B(Vgk5FQ%Hbf3tc|Mr=Yt7%^E{|&W&}<xG
zH2eTq5zNPH*2MX1KI@M!PAFkq9cJ@_()|9W8^e0*d@)GrCbyoZu$JdFb+%?l)}r(I
zzUa8#WkQ_>=4+})NNlAIy^Q*hoaGP&Hc-Wrnj7#}LQ4ue&yUv%-fx#zWk`>r_U|b!
zCi1ZbpYrmgx9vqDMy|JU#InSgMf$_7@zcHGrOq6xubI}mw8s9KW-9AgJKnE7ltG>2
z%b6R9IBFQ+`Ei5(IW(ert)J*^g8vlD1P;}qvWZzD^|OPRqHj=MT%5K^{amqOkZZ@|
zS<9JOgZw)?8b*(m2W7ypTi7D{OjY^;GLnykAC+ACK$ReeW*bV?4ITmb@n3XeVnw}k
zl_mdk@?$dI=TY$?5-Uh{x1ro#Ot*t}T2V!_UP^*E;}tnDyPh~4^#;;;Va?H91{)W3
ztJyycnglYH>Zcd`;!ZHu9r7yu1`fs0hK=x(ro67J?MVuN5Pw-m@{-uBSAv{3ae~Pe
zD|IX1GFoDa^Rv}ee92uNOG`sz;WnneYtxw{u2{y$GYSgkNXg(yOu_Xq1?NR&2}}X+
zVCRb{N=LS#!N?iw$=B2gvbSD@X|WZo<@36Xd!QdWp2;+*zaD6VH=s|0Sp41!aC13z
znetx9)NzcXEs$L9lqE@Kvq{S%iw}wD&Vwy+6J5@Jy|?1?2U0wnha`(HEl(R$%J~Kh
z=@m@<a-~sr|8SL!3b!|xLgp%XIQfb#XUGHI&MIyrS>=^uG?)$h=CZNnwzjs8#Db+V
zf5X2K=+#(wLNp$H?gfp?CQ2oUpEX^bJlE8^{w7`k)|r5OW4R;<dHiG-S(j*;9mDaz
zjo3CLLmtSk1u0-bb#m}@`d~s|A+P^dtU!z_{fV`L#9vnYGf|%73v6=_?FQW<(YdaT
z%QrJly2`wm<}v8}b%QFcdKaF<&MJ4R5rU|^7&fUTuHC=&!>flW@HI6F^u~9*ie;8j
zpOYW%XgD}vu2fJJNN?OzES6Vyt@f$B-xCj(C=$L2lWp7!ypjz~QnU)xe^y{-YRW99
z{z>*fcIewWh5G3cY}a7pMRYDSB5d?~rTwnL0^4f$5KsDDigwOMQM{dA#+T0^AR9`m
z0!GWCn)NcJPOtS9Q@2n7cBjF{oSs|TF=rKF0EGiMFgf1y`E`|kwsf%_Hqe)*FIx|A
z2>DOaV?w6w$X$CQRAeEYHe*<W-b5Y9UJ_^>&Xj-J_4y|@1369>{#zjT(0|UYB|a16
zQEU^Btgj0v=HpN7dX#;TmkAu2UQ^K7h8ukbOk4b5=b!K&iyd)UlOgP^Aqb<hk&CnI
z^EMnoLDDE+rBa9?dYkyh*`@4FL(|6|GU!#o<U*viEY~4<JI2D26&D4^>se5r5lq3x
zP?nzyU5MQB{T$RtiM!6CJ<q8%CC_9x8}^Dxcn?rrvJqpR;@y>SzVOz%B3JQ4!E)#z
z22V>n-&l3py0yGLoLH#Xg%-k^;vB?$HX~9b<yw+Bt2Q0$qigCNFY0Rj0_k@Vn0Ikz
zvJTUS{$P(sM1D|~pW_%Os@+2wyQo0RGT)?MF`vG`c01}Fz*=LjAIn%$E!NhBzJt7C
zsA6EMfL4^)YS$#oT|75hlc{YmD;8^kuAqQOX3ysaRa7}0zRkKVdkQSe;1gSf#0ch^
zTd^vtu(7wO$ey0Bw1y4&y%pRG%9hXdb1(J3UwI%qvIqMs=EKlo+K8@c_3K23a`dX;
zH>hCeW<^cmBQ8=5LB9}s{RS-S|5}cXp*}?`*4LT7O4ZKRHB|TolQ4Yem`Ko<R|h78
zkQZy`>F=mz-_?qbzp(CC>10`kp6N1?BIIM)5i;_yP0=!2;ykQ#<cn6e+0b}sIcxsW
zUMwVEcgpA0H<g4CH<=J^{rM#ErPzzRR7MQv(Bl$X!$q`E(Wkc$6`axOcNFNz=e?5D
zX^Su$J&q-%0oWq^st47!8U$pGnYwiRL(#WE9`v|B(Wo9)YiK%S%>0|4Lv6I5FL1+r
z5>hr9%B{-juYEnplRcovnRDSJdY#3UvBS|Lb(5zs7#XzKPlL5r2lYZ|nNrT01$~Ju
zX2{ly;td-AuynfyL_pS%+1NO?_ZZ^7^&I%=YU@FsA-WKQd>Uu#vo=iet@a_?gQ@?3
zpcmAL_4mRD;qCA-<gLu5efA&%z$t`^0MsD**vdQfZTl36E(4c*T4@IC->tH=!K1Zx
zen#|9R7=)|Wj!qzdFU8)p8_#YL^H#rav3*FYIf~`WTdr`DM5Zi+>(7<Js{PZMa}_j
zm<VfDiVY1oazzziFOBE~7WiE?bAeLE#w@HVhXc{!;r_u&39nh`ujg&%vpxxGYQrBY
z#>~IyKykly`UjJN9|D0nVcoOZTi?b|rT5!dYTB`+h~;7GhC?iz;WDhWy@IteJ?~@x
zyRD;p$_v^R<`ufa0qgR-Aa2aJ2b+dWJ^JmZcUZ4QL=nh_$Edb&#Xp-<pCe}&`8TdO
z+uKkqw=7>1LfSu8uvQWkkuUCg^I`sl7WaPvyBJ3=Lqn*i{p~l&V)80EA=||?6mSu=
zIUYrox$wcyV;MWhgTMTV!SvkXFyzQHyE4bK1lpM3u_p{gpZy@48}6|TI)h%_W3^WT
zjp&m98*_|+|22F*wVHTo-?3eQKR^pUg<k#Xt%x#gbH`nnf;jFMW(Gs`ek;FQx94nR
z`Qh=iM<-yE_iv4Ip81RR{Eg>+)BovF5D>R);6h|K$mjd<BHie<TZ14zyo;=wO)-=W
z^9?HVbEdz%cma&ghBikY1kI<@s0<{R>zVWZ7gT|9y|z*5=ZIIsum0v?oSmuflINBC
zrzoqh7@4{qWRtWvIxbS=H%hXzbwM+;v*VQuDb)@$w{|ef^yVPztH)`;I{L}Y%?%}E
zcJ7bmH#cw98hg#x1@+Ci%&8P0E$f4Wt;4ml+^fh&^a}sB25Z*)cd{GQ8!>(91LX4X
zxW22VWzkPz@t$A>eh{^P5bnY>D5^hM)>EqTQ^lLoTd87(z&6cl-4^EfuWic7{hyQj
zMDXow!vSlpzeab@){WlFjWOGdi_9Lzzg%CxI#AXjBG|znW9o;@>i3%0j>T8<FrXYO
zlcmBHi6QGU9&H`10oJ``NbTCX(xsvZkz(U$y7aaNf#Po!cALjxd-s%g7=S_yLIJ<t
zxV%bb5Q%K>Kt#{5s0FSiAIRpj|N89f%m1D17zfIT$RM9_pzYh^TOD>pP9|hj*w8GL
zXfL&^ZM~M?DsMg@=AE_gID{Yt)L(57${Rs$|G`@m<G#K1HH`7lNm2QY@ks6ArH?Lt
ztrS#Oa}e{j^ziVI<WL;j7Be!I=Uu;Xd1dMI#(L`nuw`iez2Mee_ooh=cgPZ%NR&0q
z&q+36rciTL;gktR=xVS^Fx-`F28h{EVZSkx3c~Gs3zq&`Lrux{H{{%ZjCJ<F0<>D#
zzNBkBs9SoorDrwngfOk|Of^2p%i62XzNNKiwNJ#D5)*mT%eth#FRt(AyhBNS+^V(p
zC5GuOV9Gs!ZuJVhvU#8(J&fuC2QIAtt?@eR&Z$4Z$*Yp<=PNCH4NW+NX7NgalIX#!
zA}P7_^{GeBZMOE-)>-A1K@W3T&qq&WBqfW}*Y10CD6Pb)+FZYpsc)RQFhBcigwJ_>
zWW5<#f2XUhgzqS@Gw5k;ZN*7SN~-wKDk;idQ^G=aK|vcb`u-~jEwHVUl3a~UDGJ$H
zTTkY!uCD54F8DijBrEl*(A*-9$v4?oSNV}|v<BMH6R9i2ay?!8JQu5b!NyLyX!Y2f
z<0ue!X_AAb`^?0l3jA637{kqU`7}S=51c6YW_(<n+{c4v=M_~{RC=eB$ad@fNPJ3)
zia2!5$$a3}KMXrYRo&mt&d%n#%k;L64p~V_kJM9)Dx;HfaVaSyy-|mfTRS@VawZe%
z>We2SluYWpeO$7xQo5fzo<b%3P_M-cYD1L`Q2X2mm2%L8SS}gi4nB?_22m_;gwN{}
z!-!7p%_(l7xj7evkuW(qS@-4bCFRBXeMvXdll*Cw9f?UvOmc|I`l!n>`4%;KbT*(<
zOJ6Q2e*Set#WVVlO!td(X*P;uM^sEql^qkG;8`Q=>`e3KU4470E(peYnrGgpxo>G{
zNgMU!ZnoTkEO;@FBpd!Dk9I^(EIuhI@bxRcjW2c#GopOnTE1$?H8$&PC-O@wAFCKB
z^uIxbGuH6`eIeGnp+9oMSE={OcI5j9tmg+`T$#Q1{cyxIq_Px>Bj^OdZ62^di4d<|
zsx(<ByPoST0%r``N|5>ebCsk0Pc6CMOEiyoO@RqAL%zAUJbm4OUO<h=rsVnkv32Ra
zXDnIG;spdagH>3LYyLHL2YC;<HrpecUcLSM@=a*0tF5kDeh?ZG?sj>=n_Cu~O~DVT
zUgUE9fy2C@Y@qQE;<f*u9*&vnGL7iZs7$%OEzuT?x1cO!mMneKy%!Fr%e(5QerBMH
z;C~z|7I+aeiy#Inmt=s_3SfLc6M8UU3Aa%3)9`>5Ar`VsfL@yKM=POX&YoEU0}o+a
zp5I&qaeXhm=xJLUPhxI3k33s}A1p44$L-mo){#Z-FrGU*K?|}-tE%%OH#!kga+R;u
z@`pxj4Tt0T(2=q0H5hnixs<L*-IdNtNx(TMuVIL%$p^A+4Ec_sAX&~YXt!K#8LT-?
zAQh5rLf8wDTSH}j?({TOwz%zrGV-_9{qM1#+2v*CyDF`4a&55SM=-&>*N3z+J>%?S
z*~H!LC0CuCzHW}MqF*vMu6=gZPO8PDnOaCjj>^A1cy>Z{p7}9ap+oWOm?~S}C)&`I
z&9{d%3B6yS!x{b4<PN=J^1S|tELz%)b^eCmMKxk$7i06lp^K=9x~87*=qc(!zLUKK
z+C#lw+y1CMFxBW~7@6Xvhlis#dQnxwb*7e~DK_8ey*{10Q4?65Z~l*z#{Fa2%^W;`
z?_i{mo3mB8phw@HQe&wxA@E|n=1LiB8TS74VQRgIM15{QQop-W=9z*XVyI*@bzJvT
zdA3USu$<?kQ(qbZtkFc@up=v+7!){l{Mcai(L-;Brdke6*5`Nq(K1g|E-``w5)&)W
zku}N5JF+I*g8BGJG+>3o_{zxVmT#(BqLl~K<PMZ+@DA?Gs|@Hh<V6-fJ1DGZQaEC*
z1Lb@yHV~nR5k{Fd{zI2&R!vu7Gq;N8-Ry9s$(@_loF*P`G)G#@7i-t`*?BAM0#jC)
zLxKZkLo4p&nEa|yp@{tTb^J!#U~3)IKO`JF5{d4K3VIWdBx?|ljp!>`c9o?OV+^!k
zB%22M<pKiQpyp<M8n79%Dsd#sOB%6vR1rtb7xw0!+=05qZ-j`tYIWr`+RZtafwpBf
zvI+iW=kGEFL}CY}!<9cEOI`+v78(tD7_@>o;l1ePB23EK47nSiIPG>EL)P1JX~=)K
zrUXx&N#Gyol@Bha4{iv@%nxKoF4|O@EQKm>e7?Jyl0(z4t@mrlMo`jgi=)gN^kslO
zjRjkIP3NxD&lhM7(!9!N)>_19p~Y+=;YH4~Ym3r6{<DRq2$LQea=o|iYreVjrrBm0
zXZ5!OhWmJKnD*o6l9l~)RfF9`nI+qE5)`N}=2S1epiZTEeeK&TP@7w{3O9jEZp}})
ziLOS$Pv;86Ie$Jqq0cQ*8dCYMtsG7v*5$@eM^paTj&WrbWO}t~K@X?iuuNt|Uv!XK
z_o2s^qKV`}EJZMZ%we!%;<LVkOxz6whYdIU`tq4x+JT={s}~<kh}9H14U`3qkzKCc
z(!=C<uw`$0#unQcW*XR(eci(t$iDONXQUqU>57-w!k`3M=`e4K><yKXt4W38EA0on
zKt5fG(HBb*_vpRI`F7(vn8=q56b|m2YnAMn-OE`=6f-&NNuW<a$X_5@69yGb&>9Sl
z1M1eG)aeHiMGn~SsK$J6sgL@YjO3abIGKN4UjQ{kP}XQ*p-5U20n@VuHCuw)sJ`SA
z*|Pfi$7BFu4w-RYIh!`JmTS1u6@e7-C}_)nX3kbEs|U{Y4yQK<Fd_}ac`&-4_>LyM
zKo;&++UVummP}0`FO=)vRbpb5W%V-kR)~3t;tUt!ywg`nYK49~3|qrjAA_`!6Dg*(
zsPF7pzbP{Buhz_4?lHwR)5zEy?Kbyar;oT(!sYuX-1JlGr>LTgulo8)p47r2x^gCa
zqAm06d}4=`tgJb?wtnHO7q^15QhD2SjbV+$)KB_z{eh+{n?2S0c`Qx8HC_PVe}1B{
zU16md1S^p`%%NP%qYx-&7&uLEsQxx)sE2PvoV>kO7{fuI&d)TL_6GQ(=Z-k3V%KDZ
z{A(|WazM|9eGYkR^ouiRYRbB#i$Vka)9_qD1#88np<uPPjJ*S4E<+R|`s?>{fM5?c
zrf7NBd92jU-;p03&zJigXtKJh?e(Q$<B-O#hA5w|8|_I$wl7;k3=BmiWCxHb=2^kb
z9pdf!54E(C$7eWcVz$#Mr)=~`bdwC3miW1%_b{skU4bQjhWN~j^@7_AZY2dZImt6c
zy}3ZbxGsH8mgM~cTjO)rj*ROnla%VL3QAN`68%v=k4&fh;{T!R&EuN7wy@z?Z?%>J
zZLOjr&|VR$fS@SI5U{mM5d~$QK~azyWD-I+SgTx%Km`SqNkok%kRbCsiiivm@qj=e
zDo8NQLlOuidDjV8`+o25+kep5oSd`wK6|g>S<hNKJ1ml`(uC*fFBO?q3_Mw@Y;PDU
znw5l&;l&$t5+dz`ZE;O_<-u;=Y&&rwL*_tO!2CicuhLC<z%<(ly)sok3_ovXy2l`z
z+H)-l&ig@$;!=lCV%lUoR@^F@^KO|fOUWWfRrD2%E?STc^Mv<LU80+N?}Ha!f%*N>
z?Z?I5Lx5rjWzcbeS`m4zoaT^<uZ=)Xb9yKWlF_^7>(~b9{agQ07#L-pKm`=(TzAZ$
z@2=L~!!Ug`lAKy;62fHr7yP|JmO*u@)b(O*kPCUu&Cbb{T`#@;Jkx;Lhpm3xn79&?
zgFj>DmGA%@rFkeWzR}sTx|lCuXS%s(+T-u@rR}^igi&mgAzf@!kX|m^#J-nCNE8Bq
zO)px)jza4<6gFFGt7^*Nx;*_k!p77}dV`>b{m0G`(??M?r^*?I)>#hLx>zSGy_NMv
z4EC4kt+*F%hL!AVuD7aK_^FTK>H@)JWT_@7cR$CFMHxP0E=xODj1%MhFtD%=$<v;^
z2v8-|lJRB@pxTz;qhCBwIl2fc$x0B)S!VMOoPa$V<2iE)+~(t#NtP^|T3dXeI4`_z
zB*d6=mF<SEPfqPOCq4!&XNULS644*$1t^}Zd|>yI&dnt&Iwh(!Vtm^$CTWRF+7i4T
zYZ=K@vH1i14^7N82^jO0EyVD$y6I3G^+z>16~S$DnrIM(XG5Z$2FLTDkAv8_ro0^*
z2tM;Z%*J0{91F`2&nOH?8@}%4kyCI*Zlimcb!GBx=)is#q8Ff;ntt4csttv;uOIzy
zQZ8mM7<+Zk=G#%8wTs_;<xZG7O#f5-r&4{5Xkyg%9K5%(Ay80PXG+oAsJhl}w%zy(
zHb^R1bupe|C^G-+J&%M&;0!RO#cq-7JtFE&=3%JQQpr)}903>L8dtAsvhITjAI^=P
zBk{CMm+C5h0!$6~`lmrW-cqU^Sumt9X^6a4d+tiK2vC4hk2WoAU7Pgpb?=|VmQS5I
z)i?MA+k&FvS0cE2bnI98?LT7hQBlY!^gRDql=#2UwU0@1&ObFIvun@}wie8TmTtIj
zRCp&Y)!b(P?#m7@s<&m}s*82~0T-1OjEDPklFyOg6(FwFz4n4b5cI2$i}JwiLMZF;
zJkG&2YBv-+bZ5VBH7pDY9RauWjyG+f#G6^%Pcc9~)XL9&z&ERU2ljY}5<iYQEl~$*
ze8Ze(AJE4gJ8H<G6P4~u3`b2HM?!DBoXZ{jy*Zvo|NANg;A2c5XvJ$=O+9k9z&}R#
zGwh9*0eO$!i5U;BId@tbz+i<)SV0b;9-*8Lz`P%44m>*l?g=`G#;vRSA;Lc-GQ>Kh
z^Uq$EH7|EC1vAQ`J%g9nUFc(U>XWDHx_f*p1VMkDmu318XM<Q-`-A>$!dLpeDdyb4
zyD;oHk4@C|J)4ov{uC?5+!b%bFvbA__25WdNRR*0Q&tDFHl1kYRLC;XV~vb>?5TM_
zy0(%<>y5&~AeHC*%7Mg{w8bVED|P8A;G1)X*)yn%I9QM@R%daeX%w4~uJ_nraB1}%
zbWS>mJAU+>giHUc2Y5a5TC_m@;D20^-4j&dxrVm*qY?*uhI_`doQZCnOY9SIE*If<
z(HvGH`zLgO;;qz{X+_NK`xJY_Y2^n>v?VzFFRC%k&^Dn$v{C)`ZF~W}7S5lHub6zb
zc$*xP$tg2QfcVJT)|NS{V9H?e9x+R21v_}OUY|SH+G~TRAO_XmV+_V}n_!ZAw{<Fz
zSLuQb6Cwt*RkbB>K3_nwd#4mwXF>r}42~)qErcq8Mj9DJ^(Zu&bJD(JST_TOQw<aT
z%5C`SQ$M|2BGViuPU4O~7(k8Dt*E+bD$$&?1D&#5Zv%iom@ZQm=q3~W+G<@=MK02)
z{u72i10r|*nVN>7-%k-ZoZmj`Xn^BSVt=bH@63%LSTT1JtPxv$4xi=a5aPO06myJj
zA{{h2&VIxeq907!+V|*vhwJj8@)y8YZ*LGRqQadc^0ork5NFOqwnXbOcut*t_^%;p
zSDJ$kuM-<9IK-Cq|MOVP%ZrX1jiHE~1YP2&15T?f%!*`5vbIs(8%Dpflwf6OC-?y2
zNmpHbZUr%<zcH22(J+LF5tX{5Gac+^K;8#6R`af-IX;Xp=7u)k1Ef!BC_d%cCNT0a
z`NP;PM&P4&1RPnx3alFxtmu#A51gKCyRt+$uz2QbQnKvV(T}-T*vlI<!yZXlFOemZ
zQ}v$kyVxZ1Qtt1V5=b73MQN5imy3}<H(S<P5WT6M*tEjbkpfv~v6G){`#M)(b@-pj
z?MM8;Co@7yX{K9OfK`{7@+(Wystl=f-XX>zo}53xhpv0gf5QHg{Y%^ng4Bm7)PgKy
zBkg?I5pIxsUD<}|A|P_oKjB;7oTdX;;`8w2Y(RXS@vsDE2(~vzeDKd$y9H&A0_HL%
zX`*Qtr;rALfT99p$<ckNn|J4SK0V3$N6>iQHk|AYnj|Z2Reb}HSz{EJT=~K_?7^zc
zUNkbNpxf{h&{_9wXo8r8;OeRO%ttoN5s>iU2=kDb9m|Z%sCQb`I#4`mH!(5Moz%-V
zA}3KuRteiy^AAd2NusTkFw3b-jU{aqjWZ2c8@*#@Jvsx@KPDwrFPlHeZl;iO#pq`;
z*A1$udf3?P*;`tz>viJ$l|_`Bhj%N9bNC<FB5Bw4oVSU)Fkf!QF+z=W3&wskw7{1{
z)E@)9%{4+S<?y#DHM9zHXY3usUty&qrLR1;ZPEl<gU7XUHPjBhhVI?S4ga+`<jAWv
z8gWwA3VB@hy+JJY?3HHLi8oAjOWNbi!sYYWguJte+mq?^f@hs#MSEoGv=Z<DeeS{g
zf7RN<RxX<p7r)+&DlCfd4H-xB-Za;<lh9a7b6)TvSS(^rS+2GM&6MWcJ^H07JOKBQ
z-igwz5DUT3pS>b0C!1<gr*R0x>WO8YU(j7FsskIwd6uGVe!UoVsr!xY6&yGbM6Uh>
zPS_d~p851Y5ywQ5o0?75Z-%vZyflk8S&5wQ*QD^Qc(t3B7SHE!-nh67grB>&2B)F6
z66JbUb{bQ3u-?c{sF}jZcyHWaQGWfeVuR!@+EvG8anH(w8|I9x)>F#aYd5;r)<%ps
zF#JbYfN9owT?`6I11iUzPb)O{{(xJFT=i-{n(#yMk756%8uXJFk9u!lFsjL6R_eJ?
z<(<XZCglO|gu`qzN=&ZnQJ9u8Sx|=*HIyVP_h&;<>c@vJWF^7ufATYZyyxe_`-D>!
zPMinXhc!}%wyA~kG~?nA^S+Udxs+~6y#H}YBzZ70mbn1SFm*VAVnSAjAWj6J+{$DU
zV#T6e*aI_M!yemKO?tBMM@^Hw6TUd&SB?rL9n1ySLVod;{`<_%n&QsIuSBVHiQ?&q
zjyvs=<2_Z%@aezL`wco+*>ohPTm1{%o9$6W5#AgEDz_OQX2~f4RHTq>lJbUrMVk;Q
zI_eF^!=Vt!4vzEFgA@)|B>nQ?^|oIYqPq^qxDLG03C67pntiz@`WGi{jPK^!xX8KE
zujrv&5x^NE)7AHuKBzbmvN)TwM&kk1dv?sWFmBJRUTt6PQ^sMkj5W)OMm4DX9xJ%2
zb$bBfNP(QUM`gMOl|O({1Fh~^eyQ$=yMnqiwpVB+Wur*ID;==Ijwh5_d02@^5${u3
z3RX@h1+E;Um^aN=z*`SP3D&!R#NlN7!A}T6m$Pa)=`!izS%o#>&kyA%M)3~N^aVQ&
zMGfl*x$^|hvUcSB)!W%?C0*fM@xt2W`AP-B2bDczBH@sTFovI64AK53V?*lrfM~u$
zC5wa1D~pyeXt|XVBPsVsePmUi^}xc8@I4ZWK1UrWS&xKgM}Mqybv7sRUj76k>v6DY
zj)cwBNvHCs3=k0HSc*d4U=bhetY6Li=kM?)l-h_E9AAmj!x`g}FyI@N7MwVV1kp~`
z{S{du+dNrQQRXr8E3mU7i<^)mF@$x-ASh2#A7xtNDG}$2gP_)xC1Oi7;v7afv6-Ta
zA$QZd&(Z*_09LVUWBKAQ@0WX}FTVZQJpN|!X8o(WuPf)AChgH=U!!8gkDIz-$ig$K
zwX@xCE0K~Fx};|?c|XZdGvL2(1Ja42^}@!NTdiB_+4r!;x_A_c{coEpgDx!_v&QL$
zNWxXqLJ7R@++;(CvJ)4$4T6to@kVzu${q*Pp8-3&q$Emz)BWh=<QsO5Nm~Zy)*RyS
z*;&^Ag%?z(G+oY?M>S;y&fsZ7%Re>lJU{dP$|%q(y<%gfWE8-l&DW_ai7*4FA<8Wi
zapxd^vzgYS$ij&wGTo9_)mzegWvTxh5g4B*e8+|XHncsp-fZcPMa0vv$gY<<wmW2q
z?8HG%g2EPYvQAx`fwjOrCuzFF;f$X*=dqU=XO_*fG2Di;7?s)V2eEK-UN(ak@v>op
zh+$H=vI7QA)uS3CLMs0vrxIO4Y&0=g5PE<5P2uQJlLWvX(<tV32jnDJF>N8J*x<MO
zZF#2?Im}W-;b)=sS0-e*SmcY}$bP3rlmjo(LY%qfJvqs%F;NfaBuL9$J}{f&zo3WN
z^0;r#J-nl!`=7CnN*TW-MrCKycD*~1e+*1eRLE;vk=S*YXGA-5Yt)ZljPl62@^Gr}
zRnrA4e+o5MNRDWPjRxVauRW|2oXgrVq8-+@48FfIk{}POq3+p}g^Qkn-+`r+)+z*U
zmma0ZnxqyH<;^KX8_6D4Df@R%hQCTB;>#jDIXRS@o51h%3*4wEz7G(3KOpR#r~@VJ
zM5-Y6%A%niX1C?lk|&)rEQ#kK>MyIdPvB3E5o^C_&%g_ucUPKevMU8>adm$*NwiOG
z`Tz8z%g~bfa#XiHP~J{34}onEJqi1FFMw^oag}%hb88}FCCcG**>Z?Un{Qr+SMa;$
z<v)poC4B|ozr&^4_gJq_xhM=p!_gX$>Re7OrS`FN*}hKbwpLM?CC_)>ey~!x%|Nxs
zeq|&S|CwLsFwY_xo22N&<yF8T8~5tD$J#>`E;S4#n7*M?$V+)X`{52>$Rw@oMF@K#
zIbhQGlZAc_<Made^K+ZfP7u4`z+MBR@(HSNJe3%n^F_s!Bg_oQpyx*R712v;(0&S%
zmzl40P5kueb}#z9gbbH&0PS)h=f#$&834~Dx<^Y_VWH|u0*mZnZKEE!{3O{R<)RVC
z18t#f`W6f#&l!NwG5ZhN_8M8T%fYtZLdxx<=L}7pwp@rT&a1e9`EO^IWc*?ZiaY<?
zr5x6^VI*djNhYba2`ob<j{OI$s5f^rs{=#_(4C(w+J}RaM-*1yipHd^=giCxINa+;
z>8vzz%Ki%H*$HjJB%l4BZE6xJ?6F2_ZSapz&49X0TRGJXIul(yQ;B9!kW3BUYj)VS
zO?&jS`Oh&km%sgyeD(B2)}Oup&Se=+f@v=>X>f1gAfJkR6-ZL-$(3nMc7y3CwJAK&
zd*-fYVTka^l%6N|D??Gm7_~o?GpRnF%YVb_(DP*NZQhR9nr60Ag>5r7Q^JOhwLKGk
zq4gevr3+JUtt-8FtgsIHfuK$qbw;T__l_@wVQ<IJLn$1sTY*jZR-v5~)b@vv<>)=%
zesZOaO>uCb89GFfu{JE7g|%XvfbC;(%Z=-?G^0iNH!uX7C#Ni(3Z62O+1}eWEdwJg
zd;HGyvJ54b+$y_Cxcx;AnVD;Fvbw0kbthJLAy+f&<Mf_<!85iUkb%NzUa;4ox!O<2
z7y2&!RN{Yri96Y=s~PlXR;52Z`Et;b2ZcMqtUNbX^Whd_yM9?1_bo%%TYh=TgE!e<
zIL;{@8IkJf08-kxVSZREa%0jzv~_&>LJ-K$fcaEki!jE2AYOCup|0Dz(2)i~HKp>v
z?kOEdLyPKCe%dXmuW)sIF||P43u1U{gWxfWnzRj&_^u)6KxN2cURKw~aEa21jU)0e
zM~CMLHnmk^&SrNx%aZOpU%}|HQjq<Wf1AH%0vu%{ixQk**)fAii*Ymv`je;!6{(v}
zr9`sXIh2ly{>!w3!i6CzRb_f6r4&kMMlCT~lryVXP^{^~;svf1=bE%rRgj-w)QEi8
z@>R;@svij_ZXI0{?OE#9R`OWa4~pzt>pkuaui{Zf^udf~yQrQJqz1`gPX_A_d{mXw
z+OS3I7w-Os_GqbZ<pLeo8EtP4{2};t`MsR$n%8x6e(reKcJAnK{2#hs|8e)nzyA8!
z@BW6<NhX`QYTuTq{{5iq<K+EP@=~+T-}etb?)qqN%6ZJ1n^`c3s^xP?rnQy3QH}{m
zhZ!b4!A;DZBX7*TQIk~8MtDH*vZ2-ufo6&qYY1#!ZCwTr+9!?6%Y_|Kow9qemTYFz
zoP0wfx;ONE18s^zeI##547gVAlvCbHP6>@<cEN8<wWQ_bm`Sg|&4Bjy>Gl5e!q*st
z6L4XR4MUUq)pxk)-jZ^DCYuEUwSFqhn$wILB9Ek~^;7F{bvN5i=!t&`f0T!30n2mI
zRy8V9aoDz5b(|t>1^CQWtGXz{r&0Nig58<PCn%BPpEp?ygfuYF-|a%($XV$cVb;Z-
zDApTj$~l3u?Fs#VgQYd|C7dM%k}op{RoPY(KjUJJ?5!xdBkv?YMs|y!$H&DnYwTCi
zNnPh4LS{zsb38NoPSPd)f_*X4;1+exd0L|Gl@k6MF+0Mfv7zk2UmwWSM|-H5g<oJj
z=<Xv>N=;K2QMLuD&f>^ox5CwB#Py$#Vq67N=Q>i|C8pm+bKbiG2grdOL_r*?J&;XE
zEpof(moIQ_`_-30nqV!}SKE?KadvUqcbZ!)8M|5NQ+#-hM&Y0%{(){GhTRsDjjUX3
z@Mk%0*bXh9Kn?RI9f-aM3<p+njq7wZ{c;uqWnZnuiQ(VMP$v!r?Xh%m0<y-3-OC2*
zxtUd8C%^&sh%R=4xVe@POZYV4ulj>6VZs^p3QBS*yO4GDiUcmeX7kZ8YWk__Z2s|(
z-anfG%&kUEtd+LG81KA!HT`9UjWsRx!b+_XS3$XNTd{?hl-Y8cL3~xVghgdbq-}t6
z#>jupYC<_G^Ka59J(fHtB)fSn&Q(qvp2d1`NK*TIK?15msfEx*75f=`2<?W*MV(It
zIU*uN#12zxGsupx<h<DslqmsbR<1GubB$jOi>4Oq*?+7O+~I$h#+R4)wp-wE>D$HD
zOjtE3!ZgH>V@5X2l~SMEJ7rZ()jf9`Nmz@k({(EZqfgw(Qr7C^OuOpHhVjYHz--+j
z%*+)eXM7WFSDOEn=1U&5hqxK<&*sIC@TSKoPAXU$n``f8a*oL||28V34t5S_wXP_F
z!lAdR-u){R@vdlZ&$9sx(L57F*0y9?4OB*0b4n34LB+ENjwb~#UO>%E*XlR=6RSPJ
zr3ZsvDXIu;V1!xMS`oAP&)BorRE+Cb6Ged?nJxph6-FU*-v^}~g*ORQWc@tdkYM46
z=PI<*{rb}09&GH_LH-mAFoI@u(!dE+<>;6Y&DtO7^nQSogP=>4lw3zJ3m$s<^{sRp
z(B_X-1@AU~jrcV%WU?Mz1W~ecq{PxC18H368cuyQXkDG7Tk(|9V?zM7(M-dzf#?TS
z4<n9qM3#vD2LQ^U)%9&H?X1EA6f@7@qz9E>AviO{`N+PUGe^sFb|eb@szf4$EMNL6
z8<xCOn*8e1^X;9P0gatDHri@?dC#w!`Batj2M;`lHNf|m%=%Hp**MZc>v)uDE_X+R
z@M0F*0>|eE*`#f?zc6JoEQt3ae&O6*B_xB}{BI#(f~Uh4n~ZNIvmiQFQ_asolxn%t
zuh}6e6|hx+$Nn|{ZMn5_dB&j$@p@zm*jo4a3m1M}lmCub5aGs|W*;_boA6p7eq1XV
zI~s*>a(<cUEo3Q^v$8_ttpfP28mY`e4|<rH-t*mW%mwc<@r3x}de4t-`(~X3*@8RX
z8zd+y%)Ni*3UVbALWkBIeow7%het+8_wvmhd5`K{1FSiTcmlWTe4m~5tL5e85%S>}
zDdGiS<w$gO6gHSrwCH_3_9%Q4BIA7VU6EUz>Y@y~cH8D<M|&roPhwzSoXX_Z(x1Qz
z58EUI{K_A3#=reyIW(2DvJx+Bry|1OBA82Oq6>$Ey0$Hc1Cmd&YVKA7HBb2k0un2&
zi#y4d*|vGXvE(UZ7fK+Pvv;7PQq1l9g$9$<;lEJLTJ{?Iv)32RYi;||3b;EW6ehva
z{o+18PeMY1Kw)Nv{%tkA{&M}>Ciu4vHXHV~w#dbCSB-_oSFT)9xE-2&Yd<i9&d(Fy
z_IcBYleaxG%l%*6u<r8*(oe0I#ui8Yi62!wPoI8w3HV;>wzjqlrEsf4E}mCOHd0kp
zU2Z74oLe+TtF2*6lQP!2KNns-hi6$LTAx<r?1Vy)ILdNS@0p`)nBkXTf2w>KVQ<O-
zj8p)@WY(TLOMJGWjbY{0UQmOlF|8qPsU^JlZpDOA?)yLcmD-}LLYx|vk9<*gt*ksE
zr15>GiE>+1zWpO-E4=@$puIzTs-_zf_N(qn-{l|P>QF;~F87fPIFD&*Fvb!OdgdZK
z&y2{n5Je!^`#mD#R8$)=`At;EIv4$LZef<-DqF&$t>8T@l(~ELuG73iZg}Ow``9o#
zogT)1OcH+lQpQok;+%<$Q*h@Fm{WY#>`hYJYnIROyyyDpt#bvCh_Kea;^4eI6nY5D
z{RJ><Xm6j&ZCM?E>{QZb^5w3t5Qv&z4YuMecSb~Vs?jhT-gW^W$sKeOwDcK)K-&2)
zwY;4)Mn;(VKfJ4eh?32KrJx;)^SD=6@>9@8hYDAKqN}c^d1UFl+w1ELD@V2YSI)H!
znsoBuVE#9=6zf%%V!%CaLV1bXifl$UGnEJI+s$@-1>VJAB?b0nUQIFoGP{HwMu{=q
z3xIiRe)vCv>Fq%v_tQETTd{Z>p1jRc`}oDSr2~=K9jxRGspvQ_Z%!h6nVkXIGtK}a
zd2{ABF1Gs(AQnr075v`@Lr$a<Y3oh(KnVB*GqrUyEfAvDonOS06TOodSh!fO=h$!X
z00h|B!26~9Yb^kpz?JIRR|gh_S~E`x(%2-*Ws5fOJU570nb<Gua(gZDq&_E1TYFGM
zl@$*oTtoWVN7uTp0~XULCaE*52HYALTy{Xn*%|e=c3-c#k-RXKxAxoiBdMX76Ej*<
z8ett`5_0~9-AZRFOI`-7rOSntl??512O@YyQxkrP1jQC`&-!huBa1*rZ}`VtbM0nW
z3q}GvCgtULrNN$bDmxuwlFQeO*1E2hwX9`M6X*ocn^3BXO++*Ggbm$Yp(UK649X2@
z4F8jyqGS@b2hph=6z5Y!*8^)|%+SI-k+3~uc2$`8I2<b>C4GFS7}wB9`p2!vzadCq
z|KT--@egWG4VdH0D|{d`LxZrHoQ3b`oulNTjg(s3VgTssj&jr4*{CKZh~n0@dRnjS
ztM`Z`OUD0qh<m<#|Hr3%%@wj1)&=-cMdzL2<<3AO&NWO0C6EVQ<eZ)NL;OcOWa(k=
zT-P@+C2jW!Hfcv$v}3Cj+2gJ6|8?6&f%q-LWr|`v0`A*J{-s!B;@i5mi%1AiXg8tl
zCT)0fgjvXa{yTP<jbUHG;?no7g2jnWGXIKLpSr&)Ms2Ljat*Xkb8DKh0}i33r#8uU
zs1ITmW_Ht;F|iWgif7I=6~o%aEp<FE=RgZs5+<CFkUmB+u%2)@3fdB0-**xyND`zC
zFbdVj!dvW}t0@3Dt<}2<?`yxY^sjtRo799*2hT9zZQY1B&nes;Wg^q}cJ!C{;!D!?
zv#Pk{F2mZXxqhCyW7vYPjVkNLRq6omnkF#V)+;QWB?{|qk+Pn<eKVq^rfRqW*H+Yy
zb{`QN2G9*eW#xoOtV_A+CS=je{5n<vgxEdH_ChWq&DyXWq&&2@e&H8F21l1`EZQIo
zF|NGxPF5&}9KAWjRgWMvTbk!ST&&<xm*i4q)8AAws}@JpNWP2X*<?b7VAJ{%e?4D2
zz>FM&T9XA1Qoe)X?5#1AL0kcnT>Vbu>0l6gJ}N3IfcueG#xd|<^4?z4f5v!-rB&n?
z1%9|1JC%d=0r#(&wbfCO&oh=k<tvu~X3F>u${58v<p$V6px>z!z+#ye)fXyG;i3;r
zPhS<ubHY%%m5r&k6nyXVRcx%AmUd*+$Lw9mS-VXV5}dn13N`*3VP~e0M#-M6*=*k|
zh>+gmMUATIg=Izs>x5GU<27na{<>8kbLA@i2yX@QHU2sYR>eX6n>^@r^=~GFI@WRx
zr=z5;e+0$p=2-r&Kw=?UFZ>uM+B3#=#3w_)VW0jz{w2?t=&jRtJ7<>2jj(hzhmj3A
zP@zdW)BRgqnFK4o5{sv<wC+I^Eu;*f4oYn`RX}F!W-Czr#Fo`UqM0>B8$NnPT`NC<
z(rpmiYDDtF8XRS)9#{v6v!HU92Q0+sxHFEOtz36;i1te#(0r%mb0Hgrd0^t(wsd1!
z+S%}$CkQ_t>(cBiOl{0-cES9Z94uJ)<DV65OXvxSG<&cAAYyoQxp1Sqf~6!`g>q$M
z!aA&*VFi|+W~lal)yc(0wh>s8KoWI5;Ar7wo}r~%t5Qj(Q3vhhoWv0`jaI4a<s~^4
zfq9o<t+@^TMR+z~gsf2>t*v=$BOfuiR$>3dmbO%drEHJP(7AR3Ne<g(@v)z~QaeIc
zpmz9|E%us6k@-F7AX|m(V57Yaw>_n6Ta-&hMBgtkY^%8hqvk7YbrNI)+a`wrebE<k
zM|~kL6JzpE*?z#HXd11cgtYwJkO-J3pXO9=IBWPzJbN!Ii}RF5m@RVCa5L?VAmbBk
zdX~?xQTEfYuVdS8QN!8#KO0=j&$7h^56!mLkK(K&c9m(~A75n>v{X+n911yW_Yvyn
z8rft~sCk(uiS8AFSih!|P;ZK|n0J&C2VlV20G|egCd%oYDPlLS<eIn-lu5FheUC#L
z+l@FCElb8)mC<W1OT%H-ysS_u_f`hOm06_OR_2ly71j6CTg9-`9Bs)gW<?^cRNgYp
zzTEuom8*2tspy85Gt_rIby-$S1F(HGI%F#ai!WWUknT!zZ&cS({jKa=1Hve^sXZk}
z%`5_h<jwTt0o}=5s`D8?LZb|ySkxkW8N};Y>#rPcr~QjkYjq!6b3r1Tk8#Oz<3-L+
z_8ATX;3BOhE941FBD_NaI61KL>Wn=YSLcSb9zr(G^Jkl6Ctc<MgA0fpu`hp>SyBDf
z=;+r5V3EW^EN~V7i|(CftqRJ<3xE38#FkrZ+q}jpQ)d5~fcJwg)!BW0ude8e^7*k>
z({4n1a2}%A`pbRdVI}<-xFtT=MnAVucmBj|I~rs(CQGTcYsUb~fW&P)sFN+*1u0Kw
zhyIdm-t;3FJP{g?D&D4zWeJ975&6*sXGede@z`$=o&5fjg23fJSvKWdV>7&%-v=d7
z2kqN!L>2rAcxv4@6$SjqL#az=o`6E{f(^k8aC>>V6{|3sTP<xZvtM;#dHiM}NP(#*
zIYYkaPO*x@jlKE5-t2apXs~$3o*_ECyk=tKto+b>L+9HV!{`&r4K8zXtwNr0jqP0x
z8zT6lJrDymsJ-rp^YQWbTEMeTp+>;UvT2-hYbLX-YOx>;E_%~!6?+lY0p!a;&ewK&
zEiSz(stg>W|FOGQgn~HVq3-O^WCH9yIDfLPU|^|+<;bfriJG{j%ooxl`+{o6HYy0(
zE?e*G3YXU5k(o<lqQ&(pi>dkMQHvxO{(>Pgal|Y$R0?Oi=bs6yJLpf1$~}FF4orj$
zbHTvq!dMP(O?2fL9^UI>&d@_P2#>G?_aDGFuHy&hR`@lvA&+a2;?th2q;1IyfY*=`
z5-<coV^FxaCsdq7$`Pj!db?|+rqznVdDWcXm`K;ii8+<qB(E;U?7n(0-H?83I%l1$
z5*AlpY0q>9<6g`6<`<FJFEE|!M>cpOo;8Ks%r4MwU>u5ybW0)oP>zz0@!xH?@^WiD
zgQJ{Q*arZ=3~8k+l<tM(wWC^-!t;)6{)^qYZo@w)1(>!Zh%Qu8w9Qfl?VXHDigGSQ
zG2OdJ6d8qP27X&IH*$uUJo`WP?~M%=i(+A!8%?({qt?(OhOotf-Oo$5^c^C0koEfa
zj`Wp%0cH}s!i}G|scpP0+2(q;x#?qh9bM6zKYL@W9VpV)Mk%+z)@7e8m1z}xfRMB`
zzMAh?nj(N-cg=CZVA8hH`zlu^MoNC7uI6x8{FBM;45X}{;o7&i`^t_OKhY_E=Z-lc
zq5LxVpZ#?I0pz}gDd)-Jz4G#MPar0CF_c8@@!Ji8$4yv93ESra%P;F8Y6_D#Evoe^
z*wenHA^|e~s8%#JI_=x6B#pgL4ZlXfoBpqD2E9rDmVSIC76u5}3m#DCrfzHS80;AG
zWt7S;0WpHqjraD<Y-&ZP2^OfbavSkn2%Sw_90a4dE0oDzBFTNx{X&l!aL!1I7!2Ld
z&=ztlNx(Md&l}aeBpJ?L@octD5wdTknCdlDTo~za>WV*!+UZSodLtha;kz({xz4er
zHY1|rvzcQ3K{TtZv*(qZkDlPBrx8pxGIZc`&tqdH6RcxM-@(JdEI#p%^A}wlP{z;c
zymOW}x^O#r&(X3lP96I%b{%j-!2-V6IEBy3(BQSP4YebmOxYYL9|bXMi+2I00I{hE
zlpVCXeb)(-L+|50uGsQdhhD(6K|}s!(zsSHN<+fH<&7hd8*3br%U_RHVqkXRNBU9k
z#5tqpezKX`-Y|F00{a#F>W3qs9w!@)py86O_b3tbISK;@rfSQov&w?Kvb)n7W28f}
zmKY>Re0T3Vg*^(lWy-dZbuT?4#yeIU6V0QWnF>gpilKP82S59|(VUU?6=8gmc=1|!
z9-1V(`De%4s`EG>SM^7O_7jgrQc?-#99GWURIczmmWo|>G-N#9f4r}lvR2!<>yj*K
zlLxV{W<VHU_*NmR=Wr!+?WE=eP>fqeb4=pLWj*A*@x;No*E=5~+VQ*^4tY=Y=nJy^
z^m77dc<SQt&5d~qwLBA<koo7+MmlDq8zM^KWVzdmYuyQmz)Td{_Z_(+YN}YUOcOmX
za?6#NsvIT{&W*h5nGH`UvoQ<5O8cN5fvQh^eE#m;1hWen{-dLUL`Ww~3j`j7o-_k<
z6nLcRHNr{-P2>X*kDCoIS_zgsNw6M<N^13Fc<BatKZ10A{T_L{y61C${w(QQ*ga&P
zHOsnGbuVv}O*_gmG#5O>;zL^1-bG3}A}N+ax`sCivk{cGeRDNd58FWX8D_8q=a_B$
z4|Dt8doPwP*w+laPe3jww8|~Or2!YpALz2A{4t_ZSz$)(;Gp&`P@1rE+WrX};?i@e
zTL6+`zFTetA$E%MgiYSq_8(lW3y})gTj$P^Nv8piPplk(1f2(}Mkh2Mg4^gSu#ZHF
z7KD(-0dVEYVX)Xo1XnnD0<HD3eH+vZsg4wFYX`E(LNLuX!rWKPvdPp36JR?H$`2NJ
zEZ3O@cT)+bdM_#h14L?&3lRHIY^4GGH{meP?Rb12R({qx^kXb_)jPEo6OXV*;at0k
z<cQw$Y9CHXnh?ka2TyaaNg^()qIc|3Y$u(nrc^wvpko`RPIY0PWH@k}WstjMIC{DZ
z=(~)CE8hK;VN*qJ;(O&6HObPm_F_{s*2S%fq_;IS#fZOY{VYCRM_)j(kpVPKxlL%#
zdBdJ%FRx(9*?oo+D`9WU{y2`lf1jC`6LS7*J8K5xVMLc697A+@W2DHzA78epNid8G
zMUSM&%lY8XjXn7=yx8Vp5XO%q_`eAqx-nt2d9a3e^Mk%MO7iEw)sc{xyL=^q5&7a)
z7DD$`p4}3Z25y)3dR$w6h8tC_2JjYWwwph#CV2i~Z7bxUy-BY<{!Fk?2pTIl)Y8VX
zbdQRhcs$r24R3B-dFWBjVzE@gwh`9YhJ>=|zIw*BYSCbtAESWBb_=qqRN#m7_%WZj
zfuEHo?Gkl<?wwgi6t~wyKB6HfGjia9JcV6hCjVw1Kx_-_B}4AjxsIh5$Xe)Q+BVhK
zWAfz;uoQDTRuCe1X#Tx_{Cpe(F99s=0h9nU+0R~2X#|E=J%*TmYU#f{^VP2{+`4Ph
zGrPk;ARl8|ROaz++V%9<NLRdd#uGt$qn??eVD!TK^b*ee4hQY5(D~PDBn3ogX`Zm%
zzQfJRcc5xwba}bq?Yystyz?~(3)Hk>1y)vHtFoA5AbwokKu{UKbwwOsOWre~QyO6l
z3E@Lxs{U$+lw$*B=?VRJp#a5>J{?f5?+;_&L~s0LUPap-c(nPU9P-6m#kW(fD90b-
zU@<^mao~*Q%t?^L^2GG_mAkn*Z7H1*E9&e(-jNlx5WNYqw^twL%Bdn2DfQxYJ8Tqe
z&rH5%r;$x4X6ot?9$9S~=Z3U0ndKPss+$C{+a)Yt9hwHx^?8zyGex<Bb^|nwP2@)I
zN$5aw`5esD{?u|aKM!h~&H01W1@R(&`{zGM5H7VwIspz=nhFrsY$#+}JJ}KM>xTY;
zMW|L<G^*)01e*Fa7{tE~eJzP#`J2#G#H3B}$GVmwGqNnu6kCD*SIp1xGU4c<($uK^
z;%~7(Z~eBF&McQnvO$^scV#8lk;R#X;!6T%%N|Cwf7<7RdZ)R&(E3h>Z|jCn69$}5
zwWVi{{pBOb%8c-i3{7T<fBY|f7~MPf4(bXGpiH39p5mkec$Kq4p%q_=3#d$McGMFC
ziMeL6Q?c<@>mRP_Zl`~AH_n|7H581zcaf~66*64*p5`vIbJ?%FrdC$Vs{diNM84t`
z5CdKyFyA*bWr#C_E0VJ5vt9Y7EZ&-Va)N5G|1`ImqVOo*ieytt_4_<6so~8)YmNs5
zQAdm*w!dGxmnO#Sz?$&<+#@Y&4%#GEuroUlHK)EH5!AmqhkAfjw=yvJ>&~p1bYuiQ
zEBXVM<P`ql79=wHg85TSq18n6eHY#PWTECf(-N|pp=pY(WbsE_^UxBdSzC3<4!pHm
zs2g#H6K@3?;!{(uOry}s8vFG~oBoqJeomc$^cL;F`6$N568ticiGyIS4?nM_w-+4^
z#LjJk)s)j2KL^eP^wWs4c<uq%9xDyvrSBz2W&BTq%X&&}&wg-Ou`hDV%02&i+pZ6n
zd29kXD^E(SF;U=+DL9BRfmQxTzC37;lK1kqhEWt<t%+|n-;S_(VEP^W=<~Qltzvc0
z+6JbP{*j5%w`Z?mB0#P~9clp4DG4@HG^q?%F}5b|nQg*m|3gT`0h@NSpCkf2Xw-OX
z+KWtIW%dXpx`7G#pMxK-t7syQju*iZ18L_Y{7(D<K1X|AbmH`0{n8)>2!DC}>Z|mi
z#R2w`4SuWm&e)&a3;<*=dl_jxjN!a5Mw8jfB)MV5;9UMSwo{kX7wI=4<fU2zg(0BX
zigOyUPoQfWWysoK(aR4^&;x<GiHvuV52NS8f58yLx`QNBJ@I8Y7k9^B=v%`A<x=Bq
z;x+@9m6hu4tStWS|C-w9omI6J`B2h88w>)YkW(QofXTyU2aN?s05T#x6f=!+(dt`E
z*9f+Xi?k58h8f;}BbFStfylq66qg)u_w-i!k&Pp!c{LHiQ6K;8ZMNa%?x9eft#zX}
zh0Zj|Fi926qM+O&$PzE4T!~e$S=i9kQSb_~WwF3cwv0>U%%G=-oiT)Er1RDla&`0~
z=11Q)NT}zsQ;@}!FvFQ^W>uaL(|O&{(69@xLZt5$)B9aDE}lm_bBq+i;28?3p_y19
z2w}44?UvH5h?r?Rd)ROuJef6hDTKDs1tA+<@v3okDcAd>qgZ!HFwHLFFr&VBwSU&I
zfcE~e15E-mpc$fgmHbO=+s1ZDDcHEtLt*2{n<pNU>n^+835`cJwtNHG=%Nl!maQaY
zYpZ95UPTM?^QWnv9=66XJQJ2Q;Z5Tp7Ncs~PjS=OqK`lp{bE<glWp<xc>V}nCJ95*
z<P}?U?ykp=-tqLnx#sp*GtH|nV8|4-g~UMFmkIrkgu|MT(xe#|Um$YAa-m;u*z|~6
zO#EO)IXn3>p;Wa^?zV$z`sEm|zfSOccY93y_BWApLRm9A(35hy5&a`D|Mm6#Twk5e
z=KlSu4z_+!#_`muVmgrhk7A0p3&@S&oj*}P2wn~_N#W|>jrcXhu5sVp-u_+%Tj12W
zA<gl(RW9jVoPJB$ym>RVzlOL}iv_7d-_~8KhA12TO^I(m^MoGczQZ+!5V5=1&YkF|
zXTmkXjgs2mkOfxik?$mGXOE~ybaE`>i|$EnKREq_9o}E+FS?Aag&1jtsPT7=G0YP0
z9x6dWH+VGJlVxYT#G4ZJ)+4UdA=s4<;Yv?BVQ{X*212M(p!*BK$hfp2$k0*{9x_2z
z7Vjii_gKQn2s^Qr8O+?MHd)SjTi@O@DSB#Wg^03iGYp|7!#RAyRAEn)Uvu1&e_v?p
za><UgJ+;2QOa4xkQ$rr@r5YEfl>Pgcd#e>{CVrE5L%`RipZHJoOepXL{IQr6G)=RA
z0-re9_Ar|S?+f42OD)0QUA~6uS!@1q2(^HW&m6Q9mWn49;){oXr-I-PZSl^7ue(f-
z5xC=6frXd3g5Et9qxTM9uD@%y6lCSn_w{I^$)56%Zeb)`Vh0gS<e<JcLd7;x33=^$
zDMm#7mojayvnKAv?$O=1<(m<Yi6E^4Pl$h&nJg(U^Ls37(P`0%sH%vMt5fpk%`@La
zhJHExq>kk${A6V!U3q<wGFPb02oUUw@dp&f%0*P>ztq-|K~f(JKj4ov>xDTLPhZQZ
z44tT$Ks;TRioBEOY^_QoCwVd>ESYr)BDQkmyPu?^rtfFfG9QTg#uT1lrs3sho3_TQ
z{J-1FXFrC-L!7*sj3qMU@nt|sEKwT82`4xWCnjFkk2;8N|4}@*vQNt-N1J^uF@*EF
z%0A?izQBr6tu~E8x)owSP^(*p*+C*rUC|610hYK{z5~~}U(yEg>DxQ`iYPz*26N$|
zbfC}zir+P`@fItE9P_`!l=i}fp~)C-9%Qv)*Nl8tYSA-PKU;=o%cNeqi!O4SdmAbi
zehBaUQQ5VhTUfyoDD0is66V>utN)=KxaiRz^c<_BijrsV10`w7n$|+cl1(5K@%n@t
zHKSN;(WMm1RO6Wo4J#(*xz8{Wu62%p#>hh4yyhvx6ZO}Q?C5BvDA;n&wxzc_l$3<G
zBHf<NaJOi(2QaO|%^}rUuo@i;cvbP({?R&!0D2#TpkQ}w6YnqqVrO58cfv}ZoVX{r
ze0^;jMBCmZJh;@*h4pGfq3FJ@xs$b1Wo|Hb0cEI!eW>wQw+AZ|tUP(Xn5H`<)zgt_
zz8Qx^bI!~NUdDY2k?DVa4f$GoD0`sJ&Y=EjZmm^9?qE;8`1ows>WZfN_n*iFi`UqO
zSbZx!ny#f&Vc#WjmrT!S2eaO1I(2>h1=ImuHKDqnGKyBshPvHbEhW07)&zWyO!Ic;
zW*kN<p<I)K*u=>1Tzs%me$E&*q{zRX9>Y|wtJ(z3K>zf}BI-c~2Nf%!1+C85Yv$;D
ztTq{-jPsjiwhn51a+v!+lW2g0wVf>QFhQl>!72q7l5-$Gu-obc=D7s$d}v7KDPMBO
z`Guerrb7+meH<7w;?<e{YMPlgbv{sB#ug}v{{(z7L_CsnX~hA_1_vZOfD?i~K-W`t
zv~Iv`h=6n{8~XM<!?YDf6eK=DM@ia@eBtyD1z-d8mwn#|=?d5&fPe7oXJM0GRg-r*
zoX+^O9C56^7%Y?~hf&3TNc4>z=$MgrVit{>=j<@yBnG#kA1}+|M(KVFK^73jaCZ!(
zpTIOcw3Rwy*e95$mNAPJYtxo92tiaE5gBMj_xftF<pK6@GwV9r1ImqPl1V4T@iE|Z
zRR*>lfRzBS4mZ^slHkNxRkH7Ah7g1^0LPOB_P^Agy}VR*6S@;E?1s!Gpm3p!k`gf#
z=TAG{Vjs24qerZv6`l>OkE?VMchR<_9imOE_BR+*6|&@7o%r&Bu!FV14dV%xS-FE2
zPRNSuLgrfXsF|k(Gk^AKlG8rD|8140+lmXt^eVo_q``TH;Cu0S3)(+Z332&;0OUVq
zGc6%$t+blYgnCvoE6Gf*T)9WiTTe~6oEb@H-(jnhA;}4%60jMIFASx6ryLtv^Aj>~
z(6-tQc7Li@*XVKqY^~foH0W1xdH`Hlca^6O6KCjWJ1bt;8Y+HUf+of>(qq0s`hgKF
zI~$s-)n_LHf|Ip0sIfpD)IH6WAsd0GpWq~pNY(ie{5i^Cs2FCfE}L8X{g53I;@42@
z-Buj9vSM(ppIlhDby;P+^^|PhgLG@WkJw;SwqeDM7@TZZ-=P3sYorbCvnN@X0%|zL
z{s_^hw3SzctGf`_|36?Ra)5PF|Ne`{MfQj%R^tS7JpS3G@GnGj%$4&uTaUto?L#A{
zXhXfDii#)jO>`2&`~lvI=>SaOiiid%l#2b@wxn88`+n_?l};}hj6SScc3$zMj`(Ck
zLjP)WeMr0@_L!scD?+Z7$5=C8=D%eXDEYs}BDg;K^eu8cn-numL~N4R1>W(u9Sq{i
zQ8S1#0G=26%@AKou8J(5uReQL(VVvpS3lq(WC}?r_c|B9L@PmC!yN<6`B&L`WI6Pm
zI0^#xu`@`h6YQ`PDnKZ{sa7Lh5x5&%Q5cuxXVw!gACZsD=2M1J`|-N+d4rWt8S#+Q
zXhI3IA*?uS2eCqB;oE~C!!3OOQr}fWf9xK()Z`}FS6TQ_w&K1muSrzFXng&K8qr`i
z!K@eQk0V(VxfLp5K1`&qAS#|Pq-K*<A}Wy;A>2uT5DIHHE`%xe&f;Y@zIQ}^)K=d0
z)6Rn%eEa+k+xk`GoNT{V`*7jdF5m2aU&1j7&&u@ViDW`H9`9Ij)6cV1HRaco&05)q
zHvam1P~eaM`PI*K{Eg{$hXOUblI<p%OU>7x?7Qy%Y@6rc){k>K9`S?Wvt2o~O|4OR
zt#eL$51!iNI}lF4W6C|2xHgGkbF=jW@``%Hmy$x;P4`WzzhnwWBAl^A6vTDM;bm+5
zYv!Y7pD8MsUNB8Od}3se@hrEGBbylMdI_*$98SPGU>x;h%R|f96*|>l`^|Zg#GiJJ
zbR8<-yd(6Si*LuTmzLkY%}~E$pK;05U_t1`$cq(82X`QDmDULg@=kUJ3vb?DPGD40
zld2QXj!!>-aje|DuNYan^YL8FI#xmR%eN;VbZy7wKhMp@yOV3p#3CkD``;bB@MBAl
zSAzSVjKJ#hrg8tBa139&acG+kreR*1b?+=!fivlads-}4Px{$s&s#=DvpF$eKi{Xm
zyQ}3^T2zFGr>h^$a9@GP;$TetH%cv=WDI%lLdLp7=gS%AVt^hn{yaHktcR8rIr4yx
zltE{Q-w~RVQ(ECLst!T+0L!0o(REUf7;HhZ!?}LvY3Xc>WQiRX4gb$T5H7ZJeUf9A
z*Cje4cVfg^Iou|(UQq!~!@VMoy3a>HfwLGcTu3~p=B{pb0ZFWuSSd<v`|9Yn+>G?I
zMx~eG2#3+(bz(dN*7TQ}C&i`!wl?8k0g7;HO62~QY^5MGv*IFUV?X~VES03H-7QDt
zNSGvxXgZ(hbV5kjg|sLq>ZcD2oK`9<t6IfL-FIPfU`sW51&daB__i8{kE|Ep8vFC}
z%Q#~#rSknPd1~&=L@!UecA}5{TP)^&$iHk~i%#*_%zvSK&|;l))_ydbjDTvfXAV?|
zwtj?9&|F(SYgz=SdhV7YuSdQ;*Yv{aiHM-sUX~J^r9J^i`RzlE55eVkPnIf$hro%~
zi?&#$dKh0*UgxFxu}aW{cWvYTB5d2VUA!9FBtF|VxV#gJIy+h(7>Aao65+>6I*Dg}
z#V_EHVcPG-`6Me(x~uPq3z8VA1P8aTU~sAiFnX*Cm+FDIN#vi~#$LK7mj2kYar4)l
zjBEZL?%o`f((N3j*YZv&NM>ia1)Mc+HxP(fj(2~jo6gQ*>&#zfrM%>*8Qj*ed<?|T
zU+AcibgKR*>`rx6TXyUIqaLAp<Q$y4mU*_Ui7}U0RTwI0H1>0TeiFOzkBDRBFKb$p
zmWitqAbdS~NUS%^SKrX+?tcw^&ReyG<J;y-uGUW+j=vI%bw0R$DJfF5r7%(d<ypU<
zTly3UmEU161Hp}|?2zp44ueAXhn}!w2@fp<LLc}7R?*&nuc@8vlqARG;Z4R$D`&_A
z`|WQbIkYWXCdMR1?rT|;$P`QRQDryd_}6(E=D$G(&=)9EbX{qe%nD{_yX{{a;D@0n
zifKuaWUM?gES#Py-IjpF6h$4&m0a?>rIv}~R0qA{|H0Q^_MPNK+F(ahL9ceYJsQP6
zd~POBm6Ou{KD)bxyLx74wTDe&mxun!i{$VO6Mn#Gbs*06ed<8I?X5&hFnV4ppI#2%
zfPME;PDJ8P2RUJ%5ACRAXJTQR<iuOX-Q9U8Q$eiz+9>~C2-uaXdo5NsMufSbeqJRp
zSLMH7;SR0Q+Hbpxma6`oQorGgACM;RU=6`zComjNUO&piuX^%d9<cnpZLu5Twk<u7
zsn%(YN!cWqqrA+L5iawn$j2l89Z&1me);gDoJ=NiYLD=eNupwpQ&7+#hcu;f@YK}8
z?X2bAZzQdd>$7p{i1)K+Jel-IVLsJ}QRjDXr3(QuaSm7<`zyY4;~vJvQ+uM0aoiU9
z-u@kx%t^P!N4FJPYlT7n?ZPL-FO}Jnvh?yFQye4h5{E}<gEx59EcLHVU+YPk8CYYL
zX-1#=K((7tJ#3t-^XarwYF9h}?9W}J0U|5;-j4a}okl`7p(jBfnf?7Ci6n8nOHaPa
z!=pxsrX?xHNXfkz9X(%vEu#5(Ba#6J2`PrpcNzr^Kfm$E##8>xQCn_YJT?vb7wH|5
zf^`b5aSOJ7KCNM;tPz^OY2tBHQ}?rH@4x*Gc8LD%JitU;cdZJR;0(+#tH=vxP4I?O
zTp~k|a{&Q&M^%IC8>R8~*eF(8a`fdPx2??D($OvWp}Ga(y&W3b2|I5eFSs}QWA*vw
zc)24+qsBu+Lt7OT)OC-V^_2&CbbiM-F6|2{nr~}po*j==)z;d(_r|qr*Y3H^OCVfK
z(_ph=vYKylcMSX2OT_nZP9^U{A3Z8W*SNfe;hJbZ5kYQo+||;#?(T)eV@bU^LAN#s
zJ=ogQKC;ra=%K<rEeeX|_?8gk^b*)xZD~ECHfb5TH6x9|iH2sgm2fgy^39mU$O;qx
zu_5Cq<(8{^s`1fqfC+YZ_uGS*Nt(QGMJyabdhpaTR$eVn&l?$kK{0T#+>+|=ve@Ho
zW;Q$DvX-D39Kh-@KV~xdR`5iylx(OKK7CVhk>Oz|xYb2JICrx1c67JjB9ErtZAgRT
zBp=>8d@}Wte$BTY?(a-@JlHyyH{vej!J!40HQn#rTG!sDJ8;%-By%Epom@sn`^?RC
zh+M`5$xw5*ac0)=2I%<LL4o2U#zC9B?g|<odsdq`-1sH%U~znxoe82EJ^L{d<b=J5
zQilUeb#fp>IZ@-bR}0rRWpFTFQD$fP?hwPFuk#O;D3<48M@a^3m-o!a%x2r&>?y)-
z<IqnsM^~PAq8*t-Zb;X#{S9X8?-kVj`t#0RQ%Ep@Ds0g--KBf{QoLe|15KDAIvM<}
zYm1&*OV$r^e>A942!pxTNrSFqH-`EOgSQhpc>M;Mco|BHQn>MDj`?=6xC2=Ejo|I|
zv35{}$!8tlV0K2a>opKlQC6n2-o^&se!x#ecqdjv7W7?T?agvH*EJI-;0U?H@RAQD
zY%|_>t2s*&i!+J)ebijfNbIJ%W`DCY+&_`INB1k$zmFw;gzJOvrVkU3#Eic5HKv-(
zw%xmYvdnqmi-k6YHh=4HE$-}f@Y}1c;YRJvysXJh_u8lZw_B5eg&J4i{;H+v90AF!
z->Q=)Kz{!4MmxZiv`8cV-27MQ$XHL%yl?5;m?w)Et}jC3JFM*6<OX=7sv2PqiIF9%
zhja!HxF{`>6w?wTDJ_gXMH>=7Bwbp0@s`+Fna`F+op(=pPUIO2%T|9-WNBIe%W<nW
z5$dRJ`+c&Ehdks22~>p(mjtaxr6+BZ6vOZVV=XGy)bUZ(Y`Go0bd89B9`@txCm)zq
ztcT6Iy(-4obrySUj`60dg4nL%^yzf1t<yUJ20eXvU`~8~5X@on&1^+~)7jq>CB6n|
zD6$qYnZ0)JaPay6wjjqiF~pu9(!b=_yC$MY@z}Nf>iIhA=;d`viTaE)lWmr<?o|JM
zr3Nj9=J@6DZcCE`?sKz>$|S!3HTNc2Gm}}j;xV(Gy?U*T0!13d2~lZ@JHd@KO`Nk(
z`-z`*Vx;5u*?WDQltf0)S?(rd)87krw1|B7mF{ZUR6JH|woj{-5s>Ke$O+Lzzc1`X
z95aVE7)vQH9!n|@c`U3wp13}7+<PCvo?IIyrQFLrEA^MT=`87S6mV~$<<I-j@OQ$!
z$S$SF68jz6YJP$<?@JXI?L9CGn8AFuq5}O1a(G&>+f#`5z<z<7Pj<2c`m?e5E-Q)1
z5%(W&<t%-3e~7lu(ktP@<2j_-ebQ#z@8_sXk`FCCLD!oc6%Z3vz1Mn4)VYTC@&~Z}
zwQmfE#Y(MdqcDGm!w)SJXOx0G9@rOX-W<NFxZeG?tZ9K7`s&_TQe;g_CXzb*LNV#F
ze1le+$Ifu)#7)Kqsly6sZ9+?O6Q1eygrzWS8%TFZ)ZgFAKpq=AJ5<&vwIJRFEW@4Q
zN69;XZy)4JBt}w01%~d9+69{EY$pAK?WL1Dko`OQueJ%>caxMBQ!J(Z7S59&94QR<
zB{$_0lB#lA7`GqSsPlIArk^cp8Nc>8*%F`3W{QmiT;2OHi^L@C5avoXcVq{g8wv+P
zFMh$os_;g130KXyI(@R}HnT=;^6||i6D{Yx`+DAI-nfBpEgh&PoJ({J?*5Q7)}5EZ
zR-`|jJnI$ts32;9--2EEs>Rv(LXWR>u3C!9gCK3ks;T8TS&t>V2;5yf=zfaBC#7GO
z-Ms_e3DaXYdM4Srq+1@z+ip5rqQwlY4016pC}{7M*=d*D{XoOzQM;<yoQvp&Vpgsb
zv-b@BhGJ#XxaZzdpJyC5HTM(+mZN#Qei~}L2Ug&drcB!Jv*U_9Qg|ReVdvt-34X6}
z4dZO6H<@WWCtWP?2ntE;xo@w;88Vh?-&gt*yejNGDfI)r$lMX*%)ieXk#`<1w6jSw
zAvYN(oxsE`EGO=`$sFw`#TK$6>orvy%;i&wBy>c0Ag?xAY&KyR9eHGUH!5VJlkJhc
z2FJI{Dfo3ovDEz`9`fIe&Jl)hv5`uSv2*uGCe1f!vQLqPQWZS+E>$R!6nl|ZXC}K9
z6{t=MKKryY*lR+S9}51+wq8Hb{@{O)?8;A?s|}am4R!L{7j`VMr-xd5YorP9Z+zhh
zxz^~;CSKM479+17IM$A*R7fxv6i4ny3$lBcy%I&Xm44hM&%@*^N0N%KGky0hU4C3+
zsBFKoiw@NuOdbByQX<@54mmzMt4RBu<Gs;a<{*Y)iCddh&RVwFiLorXb+}QFRh#Tr
zF_tqbz0p&Y=4seJ0t~AJ>k_5%+;+Un-|X50VDu7oTFeyfQiiFU3z6irKce@t-6u^h
z5ED^P=h-0r2fs{g{!T3`aKI;2qlMqcxu(XAM2;qAo!Ez-nH*R2r#aPXwM&Ex4PeF7
zlovadf<!x8vPcnc-km$a-ELZ}I{JGe^!Jhyp++Bbsq+SV&raU#bJS_c@N~8e`ITI&
z%_W7~Z4?h7w*PEmT7N3x*u;knPvPP+NqMmxGpzTv4933_zhAhlZU(_1Yt<v*EZxb_
z5&v%ub+PfLk@c)Uz2A;dG{n|o39Gp0&jlr#rx9v&(LXZWj~p`QXw+%<P)oIM%l<yw
zqNtJ-S=p2sV}bu_`ebbR(60aL+H1U?WRUl(Kiz6N+t$a?wjW=7Z`n$K4hGV@%+=N&
z^A&D9;jWD+>u95gH)i#mo$N_mHlN^MF_zCf=jWRk)<ZSS817Rd7$~<GKbBv&SgsUA
zN%Z->xXsJMUgRuZfUfW0Y`ZJQ-NkS+Kq8ak<dQjDas{gqy3#`2#kHT>!07f4c3JVY
zY2v}vjn{OIFh=@vZXr9w3)BA*-oE@mOZel>Pm6XR<~Lflx`!5}R%*7yB;^_x&@g+f
z+IU?TKP@AE^Ebu2CGVJgcZ#wvT^Zhf=s<3fr!TfR!ydxe{FN3zS~64G{~~0j4Hp)V
zWtsjTw!S)`$?ki6fQYDoihz;^f<cIMn<!ESokLVQ$EYzLcvV75K^g{viZWt!ha&JI
zF_9WM6xeXYs4<Db_u0_*^L~E6&-r7F=h>}uPu+9wy=Qq{tQ4<Ze(>k8VMplWm6Z>?
zCxx_^FKBaiUh=&P#0`q2+$y)sGpqi_`eA#6OSHPSU69^?a5<`v$lTls8SZGiM@wIK
z(Z97U{vjxOLPxv8=hZ*^1@ic5osV;#%rQZD<F#%)`?G%7HM}=QUW-}`r_&y$!3O(;
z3+4>U7vBmMf$juRv_<Dws@=2}0P-~rn)gU{#Jtnhz{_HO<4!y{e;iJg;STFjv&N;l
zXOv~y+a(DKXV!;?;iX==;$r^p^Ba1O)}t%0MNQ6Bi?=`1BUrzjDvB4>UH(f{Q6Ys!
zG>i-flb$Vz!K8J)9OK$W$=a9XJ4RDQP5KJSw^x|+%C$LjDVy|R0+6hiHlPF)CFX8a
zw+?~%{#u7Av+-N~plsfqMF`Z<!TU0DcZiIOVL{xSWK1Ju%p+^f%RRDM-LVlmV=$b)
zd27Ds%Yf)xQ5OF|(Ee;pm|8VF;F4M`+n#n`a>LOG<E<A*akR$7i{8A4)a1<dmjSx2
z@*L(E6i(nR#iHjoLE_E)yO=qfDwi^nJQZ0!3ntRL96uxtDyF!R`;x4wU6JuyLGv34
z+6}55mgoAj-xrJ8=qwM3A*@kT>4tdCOs7kgr~2{NHt*4XnVvdx?QOp1{Fa1(^-zzL
zIBIzc{MO$ij5hFlaDLkBCgNZbV4f78>8B5V<&^5!=<UWfLG3g1)cu?Nk6VLBCe-y!
z0j<4z1HT*tk&*S-!kn)SD{&P+`e4oKLr}x&M%lL7;seUprluxT_BDwY<SE?XRo-|O
zFcqE3XXf`)xFYAgzfT;PLK!x0W8NE{Pq?PNFx&|2c=wnQM!-S~UO@F0v`2Xt)4?eE
z20GK{B(m?n3}y55PjriR(QjHbUh;9neMFg;$*|_v1tN%Un&5>rM?!-rU#|I~UXn+<
zulV|i=%nl1dhswSwjy~f(doM$+Wo1jIX`G?HZR5GhR--G-9uOR##<UwRZ8pU2Z6yt
zlQ$sS6p8!m#WjOO1v85ia2hPqrqDFgobO3W)tu=9GV4yXqwlFlk-=j>DUaOD;%q>j
z_;Tu<7|3G}UE@BA$+})hxNYXU4Boe18ZdTFh+O=jpB?;kS^pwoF>c1*(=_q5uFhZp
zRrPvO-MCP>dXf<lOHAeh-kNIxj(Im0N<pz*d0#SS=T4jrs4hN=k~4~e>!(t%frOrp
zLEaR*la}y)BW=nGG4e|(ijtp`MCD7d3mG%_4qi9jr2X0+w(Ch=vj1D?2ElZnY>;c@
zlAUYTABV)(T%X(xSzp;k0%IvM2V!{b9VG>nw{$m;(5`iWQBqHw8gcDbxR9OlGn9_m
zM|Nqj#+0epm0u4~S{0)HW(+sjjuB$h!lE-;th&HQz2~9Z<BHRuIj=H85`e^l2p%1t
z{KyOAo5pR<WatqF-UKK)#MPbdibRaRoO=6V`vt>aw@A~9-*S#jIRL=sP9zv-;^*pK
z)4ic|2o6%rcqrO_PIiFKWRX@hS~nvXHuy>>X4f)&?u`Kzf@r(=$mj|dq=PU}l16}R
zCoZN8lIFa&M(V@7meD8L<M&2NjXr*B93;5A%7C>>wAaW<A5%en%bG4vN=S*cvja9^
z&G3TmQ;*IKm5xyB={zszsgsvkSu5Jk0^gZ;kFP73jeukw8~kkhdsE%lLMw*SlB7^o
z|MB2>?Fxj;h_!N=l>)FkZ1*MC9osI9q$3PKnJ_Mz1j^@%WZLC8>30DhGZ8oW$c@z6
z^=CkmMrD`jSCiY?`sY=yi-30Q`SGw7+edLcOAYB<==+k{D-Cm_?Bz-0Nf`pSOT@;L
zR&4#Z#$;`bKjXn8YF|0eRDbxm0T`5r*N$QNm@hZhD6~h$s~LMU0+pasgu6D*Qf;yt
z#2Zvbpu0HJR@KSm@D&E0-`@13pTY#aMUpq;Mh6IUJLvjA*yE$rCQrYBIBD?@qW*Sq
zv5G0Q4$xAnmTvFY1Enx%PyZAZ(YtgB6hG|=+MJ^Pa_!e#r>xQ*mPIS4!oDtUty8jD
zBu+_7sWhGXfo)&+eAL6l`_e?z-@fN0@5>!?(65xb`AKuf&TV_cBoc_}`8G3y0$nm`
zzM|D9`%jrbO!M7tT{8QVfNkb9m}RO+ujG9DM`kdBDN%O+K5b|sg^up8m4)jgQ#A(g
zince{J<JgA=w0f_N}!(cH|aSEIuNxr5=pkD;{5~0WquhK;w{ssT6tlbD7%)6Hh<5x
zfVMHP1*#mHc2H?c1Bi&P=r!T`WTlI!2$snkk5eL%H`r#lZ7%G_-RYQ8f7^2f3@^C+
z1WzCaOX0pk=X(lsL6YTECqB~*XhZtCj`>Y_y!D>)AZ{kye)|Pxy_kca3ls;({5v*Z
zw!9!ZElNJ8vJYu%6PF3xT8<Vq&<0JIC)&bJO96;`>fwH6Eu$sJ2V>z%zIt)QGCweM
zanWQDT%()HZJ+7~>~@@bt`H{fYmfhfBygUuse%sp!=Ulo^uzn{lk$1GM-L(t&@qBv
z?2<*5*=}u<-BkTG)>JpQWU1Rf-0N1i*Kr5HDE!dx{RzWM<A#mZOX=B9zOI0N<d|WK
z72PzMRY!MK$BM4&=C!Deq;~3wff<L5J|ymw2gkvpJ>EkY*$ZZiwaS>12A5|N{0XA&
zy5)ktSrZa%IdM}pqM#d+Vby`S3)Yac00YiV5Bg>_a(ieXfv(n>0F6s$EV6?IAX!Df
zLzSRin$2=K4hb6V;8LPifiRvjrKfEydd~O7ff>EG!yUI@pW_V+5p|A>;t|?odT6^Y
zUGs^ykNA3T_7g~?euR>6^Pe38%I!&Dr|9!W2L^dS&;6c<qr0b1L65S|7%QFm_FNV*
zO>#QP3h8qF*Mvj9QY#c0K2r(f-?q)C-yMa17_r!mD(%(}xh#!Kc@y_W&W^q-5@VWS
zMg<+)et($FK5Hi4mW7)?5c^&9G@KqE32w>T*04wX@gHl)7bkE7m)(c%f(OU0f*UL)
z>Uw8UgZNzpN+iGjm$UzOi=bLm8i}{OG`ap$dvDyU$Ozch?I-PU{I8^59atcZg_|u=
zT`dT&t?kuYS(L#qY%MdUjbalXuW@@Ah|McrJ{@aS>F-on++a_{)r%XQKZiU8>v$QG
zVdq<v)**cD$+ZN1802!M>bZ7O4LvFk!sWrF*UZd3?vfO?0coA(r=qdEFCMvlX&(~k
z7P-(>e9C?Yhbx(<lC2X&b2XRhmdeq_dhjFmF4&hJo9(8*MW7AT0@oagvG5X;xKY_U
zxK*{Kl&jKDZ8ntma0)kU$j$?L2SlIF*l~`53cB+j1kA&8@x?6Mjx&-J(2+oaZZ@1-
z_+S`Us$l7nC3mrMP{gdketq~mLM(o&JvZGKI#yFI#6z9)^YHcy{5A140zF`Wf)BH@
z(Y-eVoOlH@(0h}MTAhk0)gQqv1wk;^<<BoTdW$ejbj%6DucYt$n2#Rgy_Lf<i=CrK
ziJpPsk>AIazse`svN0d!5742%ongF%2RtdyU~n8bYi5l1w*xxX_BtDo{*->#gJg*0
zroa9ZW1^337rt6lD3~I=2Ekom68WVhl!2IkS@;S1yQXh%lJ4$jK6<+{N_@zq(ip&~
zLoPR>rNu@Q-_T<jAV3}eb54W)|1Nw*R1ByWY2t(-S$Opi3+okhk^(^|G3mu#=A**n
z_W=*uaqZCO;I<wNL|?n4#;u^CYPZ5G415dDs8iSmxy~rp)4OtDqMc)a6nTKbPrR=f
zl^h%IotfAutpNjGP+Pg0qTjsboxpf|e7v;$<8VAZ9L9L-=)FUa_&_kwBo9^)gR3Yl
zw!zGPdQ9&?&RtJz1znVakSNCpO$dOOoqnW5bAmSE%uNbaK0$OOa(4@ogcSqDf&tjm
z+G4Z2W<rY@94n&jRrLpJNlOQqc?772aV|v`Xw3-_3pR8t4E(`D>TfI<0>QK)?c1zV
zVC>ug9j{jG=4$bWW%cMBDRS9;7z`R4#c|vK_bDXbBoa0|_K~H*a0&>RG6trO&**W<
znW|ROBWVPaoXr$4l0ttCIS`LYIC>1M;Tx1L6uy%A$FOoWWCjjR?=VKe7r;nXDdXg=
z2?OW^0D{i=ou2q5R&K!IeNiOhOTxn}wYEV?@pB?0xtH3IF|K}dJxkWw_mnFJEvXkc
zI<Ij;W(+7)*_&}{hJQ%nx5tN3-Jg%IX<Bh}I$l4b${Wru96zSp;4!(Qk!zSbGAp9u
z=ixAmON@`3x{$`jC1Im5dUvdQ?aI9BKvc}URkgj-^ve$dH;uhPu5}sPoELv}|C}Da
z-nXSbc3e$4NqsNdUSiJGeUOd2G+O6?XfGXAAS5d62AS%eb>ejF)yR=QP|Mz4)9*5e
zH7>S+zO9~~Y3^7~<G87?%;ofq*?~g3Z%eW_&0t)i96sMJp5gr~C9N>v4L$VkJ@PWd
ztJ*SP!#`~;9X2oo%8H!f;gytJpHx=JM(5?Y(%FHEqc0c~#>lh$XVhSJl*R;B;4&9l
zdO=wd^d_-IM)Wq6qxIG9@h6YW3Zv4`O9}|0^yB2gM<tKp_ATno9VUA8XVwia(|xJ^
z;=(^47KxfER0Y;p=DjkOu#uJCWNJF%r4`4+5aeJ>!B;z%I#T}A<ezWeS7=w(-iq4u
z9R_;_)kq&<&;j`N&OQcec<N_E_Buy%)`3LM_FKWAUNboUnC}=K>S{+PiO$#+{`}v1
zdjIa*<Gy2q(D^Mo%Os2N(LD@}yUaDgU@pPc!U8&PNJ)T%+NAcrF?J~BVcjlsKp1o<
z6kwv<j)Xh&9R;JHS=Zi*3d{~HNbQpK<!nX|ga*g%gStr6nJy!~hKQdrGXe!rCZnBy
z#Nfyn9IK<Pz)P=%g-_v6eDSCjoq3L5c6av9qOsCt<5!R?q$#Y=7^tyIy0f2|=Xj;O
z%Gd2r^g+z%=KMfu{dv1PM*d2MTwVkvo;11<P>!4W$n3=^E}FE&4zl;GR(w=nft4ve
zrpwufZye2Z@@K>;E}#63g$D9~dSliLP{hDw)2G_u&Q$tvL73Q$e+t$YZ9_M?<I=6^
zbtqR|Y=@5h-aM7H%b)xKcwhc}^>PMp6MpP<#?$u=fDn9~(FWgYgBII}q6$O=lEo)~
zUhwy}(xY_F7racaE&XVo!?MT(3Ajr`>L|DS(s2ob$F2kw9IsSwZ(u0b%Z*i43+qp`
z#rFTrV4g*F#yp)0usPFi1<sTBIi44+kO{y1+g|!(!x_I>EZOlr!>({Co9-6X1TBG7
zQ3L&w@?<5wS8+YXR?Tmf2lmek;cK@R`#zV54k4h_MZ@U{sJJJm{(?=ApVNb(*KLUg
zu?u+lQP7EeNg3{8_SRA=T13!FgGk%ES0$PWLi>>|N&%LTwZF+nmLc<aX1GAv3^)Z~
zs_daBs;5<VDqhRACG8w!=DDoeUg}DXDMxTc6{f$RvxawA^}_PGRR}#ST&NdbZ@sD4
zdf$$*iI}Q_lH>N1T_eNK>B%1x<2wVfz-pKl+o(<Y)XEs=x7+?I{@Xm#c$MESaW3@$
zS7q(O;nh!J0|geU{n{vj3yKARM?gmnWp>a2%;iVaqz|aX*SXpdRQE|Xzpm9{@l{Jr
zmelo}K++HWQpjZy2g6aA{coAumok|o%RoGRdO$eA_=L=qfW5d71Wuq8(i3YKSNmHD
zU5ww=Alr+#;?&{JNp!lJQ0l`MjV3)T`7cZf&xqjPBZBV6@zCeYp_w~A{VvEynhZYr
zEe8Z>lWR4^YuZ5=dQsP^{Ey}|+Ch2`ev>l)YOEI9n9VR<Th0&lL0w_L`z@En;ML=R
zoXSi?PY8INy*{f4`9+bgltIX1V#pam+T^(C<gVFi4R;({an)Y?%?Vj3#z0PN-_>7^
zt|`wwV`hAr7ZUtf{}!Fj2&ev{R|ApT6$yfkqt?{G8*#Y|sS%;4eH-pfp~^6R@{GZh
zfDONpU*iWlyQJ2ZecWZHUpsSSzEuS#RufC)`f5kf7cU;}6Jq}6eD(N|VUD{`g7+C8
z3RM_jqA*=~ej+E^bT8|H$?#Jxq3@5fGWA}5^7P2<;D|k^ZoJs@6moKYe5zA~+~uL1
zUT-im{R&I;9~Y<QQx?jDHs?xx$7y>Dmsz0AFXB(Ka0^0V%DxdLh%PnIgj-rDzCOhE
zSeRi^Htjo-<jKm+E#e|2@<GbV(C3F5GZW<4<eM9sHipQ@!Xb<SN!(yy=4972iBuo?
zWx-rXAq+e)o9N{N@3`^E9($7E1r2^FO1DmhaDm&8da$*5h|bfXC^<6<w%jr(&8P@=
z1{8)zj}ul3&wSBO_Xnp?$AVOI{dbt_+Dm$8b)YLRK~o3!H?K|7+=uRrn<p4Wb8hV(
zYhwKK=L55DX^DJrH{~;ZqpSxM{wcczhVCF9Vq8MgbnDO9^mj^ThysR{sr0%wm0zoP
z-yQlf%eX5sxH|qfhRmH<wl=%z7;^XdapVy>mEJuNI{u*0{JbZ&T{afHHY80FuD;xz
za+AR&n1d1VSN3q9RLJErwy`wy`9jAaju=d0iu@w=UPG3SDG*xY=<S?@!obU^+OkX1
zOe#~aNkAY*)chE*P%FI<2&UahUwN5%fTq-pyGU|&$^E<o#6um5{xe9F_ZM@KTFgpn
z2Ex}mz@r~+vsGb1HpNwAP^N|B{w*Pcb9GLGG0&__8mFp@swV@6^M*@j!9>)m)^LhN
z;czu(mQ-E=TLJ=?7AdXF5P{AoiDy+|gx!Pb`N1Fx{{t4kzorfT)On@;K42)H#cb}h
z$ks28!3~^{suMA!xv^**wsg4Qf~&#&sFAAAz^AKLrS?cyBOwoHc~0Sw#eu>6Ms*18
zs=oE=%2oJ);15QXrUTtcJ-p0Eb-@AJAbsu*J;@W2jj}a>{}dIlG<}aQ;*X(-&3`!g
zvAf?yPYk@+rXLZy_U=U)F|}|ZE~0Wjq}1~c{9AU(N?s)4_bit%s7?+y+HJYI!jY%i
zh1uz-d3PUO)P=zoIJ|y_8bxVbBwvO=qxJJSE&hdScE-E`3YBjaKJOH!XkjXSee}5W
zmr>>B4zG85P}|V)5b$P7H9wGk+4nN0M<L2;<sXm#f6x^S_qQm&Gmk5p``+)~E%&^>
zzVwO8hni;H&9VK3KQ)I(G_k4&A*Q)u(i`h}q<rPiyM%M<2<W^?@@8c|^uWa}v!J_R
zq1a|f8@%)RhHUgyo`xmT?;R4HsE-9`RjKo;=nc}`wOt}f$@t&BKul(5`WoZqV=qI3
zU4I_d0e97EFiPO=FpwmO+e#chw)34%#JIx5ngze!&YazOVf~GaMlQolkRF}j8AISH
zHW%5OM&gp^5dc2Gl_5njum2|-%5TxKGmGx4JJ1Ej$d~3ktH>|gZoj2Re&~PE)^D^~
zG~W}L(tJ#(zmcwcg97e!aj=*E5)Jk>;ppiBkH?gj8;|h!g=9b$3ZDNi)_)G<sQm5>
zI^WQLcWU={nB0xX8;`<_H81Y|PNpB^JZme-&Xc<wZp08P0Cd)ma^z8L8rV#e&l2v;
zm+inm#2@lMJJ^QE<B~pKYXhHE{tTkRRou|m%y13c-}Z;{^0fb#NGjhN0%yU{ARQDo
zO^Ivxq_YSLh-LcrONeRC|E8aa0666@QZVgHP{~F)>09;nJrEc9n?|uVhCVkaCa`c&
zRu9Z;HZD%*_~N&FVl#XNF=m#_Z;OOwz&x<fBaF#a#+hqa)K_mT(7wdvq3+Pe)tH$f
z73sN#Vc-Pn!P^BN&{KZZlD??3S^X-?RCXKp1pR3iszf2WI|ksUrh%+pFf2a{5|1SD
z1qqNiZ}EP6kY0@5bJ-`mi&FYO|9}Nn(}<k6P--*e*?$^6*nQ>{1d8^10H4b)Q8W=j
zffI!p6EwF1#;-Jq`Hs=H>vK-BpSh^aM%XcexahJ;8Jz_egA9nTPB;h*tY$aJYhzc?
zgGLB@5l#q()iO6=;K;OeD*Qy##(ch}`TJ6W5SvBEAeg@@tXnlya>0I0sA+iqz0bmC
zC34tyS=iD_j(h?FeQSA$L9hSxl>Ws<uL!MSjT{Mj<eP`OSMMivm<f_LR*FuOK96vR
z69j<=Oalbge%HJhjlj0_YqpU!BXxA!Bsjs#mtiaaS8dQ)@V>_9Hy+u1a5J%zTX6tW
zyv-T+-^{zlo1mE=&^y=6G%%A+8eif3%avHs&$`0-fE&Cu_siUAj$RCGoT-Vo0z(GR
zj4UjZwrdGObZz{ft){yT-CxNA6Tfg%FQ{g3P)O`6`}RR_WkI#>dc!O4MCZX<t=Bt9
zHT~o>{#?4l@^pz1TwPNKCX2atN#%bG-s%9DJO|B}pxLnTeJBh(e11>UT0QXYkWqgx
zouFOBrH#?3@kJWAFE5x<tKf+Jxx)GXk2-kh*OO4aAgX4=y)h)}3W&f@G=7Cr%RtE`
z^vc2grlqir0cvTp%>1MRNH<M;%k0MK3wZg9@S7$?BSmw=?R8Qg>6&aTIF^G8_v@=`
zwzHQF<U}EL-h{(Uv+xemSAVvT6)Q_l*t#e2JuJK@DsspA$DM3@mJ&#fUD6T|=o9dS
zZ%G4X`1^CxQ{`4x@JD>d(aXKaS;FRlei5wfSqSu6fGa+r%R}$THrP0y5Qd%Rg|B1U
zdDO2*<Ub6-93FdDljp8Kyi!)JwTE7we|FKX9~G+i3xIbQg9kDO$%>ZJb02~NyNl_s
zd7El73^S~RltDET%rT1#oqfhl5ZYHMGr%0da<Q{L#-Ht9q=C@~Z@jQ0;jQOW^v*J#
zV;(o&AM?0AR%9rWZY#lHx2C<m56dqSlpY6x`!zsldT#Y~1~Hb~EhF`(DqNgTm+GH?
zz`sxn<$M(fUD~7m1li{d>kTTaf~gs*dt&-2HxEq|`W%&Rs2-?GL!cW`cXwqZy=MM@
ziz$ie5B=9#`vA?n4eU7z4M$qCBkkD3*IsQj=uj-|NFo+ia&H@K0cyUr68Xfy_b9El
zoo^&hJK@b&B&xXZVS0a>20YQEEq}J+r)h?nX}*VKy|APduo}^bf84;(=6KMC`vaz5
z&h%HtegH00YQQ#U9&H2x2E96?D-$wEKuQ~toRK52qk)^LGx<|s_b=|NPxrqN0M6>j
zB}#2>ADO8iN$m6OXKCxp&}acyB>x4;C;!t8@KTh(iVa-yMm$)Gz5j4WI;@CPbAJW_
zRKK}mulw5Ize<8WtINBlDC05oRc~wGSar?EqZ_03f5Ci=#Pwg3C()<d`ZATD?dsM4
z6i;UPcdK{xMebMT)a)GH2%LC|O*6!c6luu+yUZ@DCqMZwb%4Wkzb`E0Ja!lG0uPhV
zk%LJM7u0+QA`q=-WOf-EcWc}b>BmX4RteJ}*8fc3`s3lBzR>^7j?{P&efdw9g3JFs
z1IMQ0NTVd{(<B3w2jE*216Y2qrWSId8#G=waJ^s9e7D`nPGPw~8E|UbGoo6v@gsR7
z*Qinb<96#hjYMwiYXr1FZ2^Ld5nxpBG=9a!vuM=!Pg{_*<bP>U@C?1YiYHbm&kh|a
z);H*Mgh|LW19u27I$F@9{e(BKRIHB+xI-TQPjN;)O`~(^|9aFE>a&qtBh<gZzD5Z?
zJbmEw7x5t~eZ~i;;<*2xDaSDV+bW5I`M}qcH^#V0pb@^U^UB63L*a+aWZZoIz=8~X
zGL8={{a>OM!#<z--!0#`wv2KYx!Z`iN*k?L@rqc6foWm!#n;E`(X)n01*PN+$qcy}
zbNl>K<R2VBVg5msvC|}L>w51{P=<g$QJSE+kdaV5xvFeqIH=8p$j1+Hkpyi%-GNNN
zxKiXUHJ?;=y!F$UI?P)|_=k;p5>M%YXY4gsC<GabxRFWMS-SmFQORe-C3u(mBXm>y
za{ap+N_b7KiG7#U(Y2LCQu1NA<~<}dv>0<q8XW`H7}<~Sy2z^#o9W<ZAU&<e5vj)n
z$<ufD{(%}XQ7qJ`?AFj4yXlXB1BCFJCwbfgKP+NvjRr;TR#pbIsf>Ue8*HXhtKxTk
zjLRr9*;WE`mzG2lY3;*T)_7?ZUsT4A&B%09O*B=SO(Dqz%>o07!sb@vm@EB!ME;%u
zkL%#&<YC4pbE*wr38py+L-<4ZEj+Gl?gA{@VN>N@jWs+Ylu8^YtyBZ!d!ewZ8}Qh}
zaQBo)C+O&kqVV<C-|Pbu5X~R7GmB+GhZ)D_FPMxurL0JQ0CVg(H(P5F_2pF{xKE-B
zOv(AGhT>801<H%rR^VtYgBMjj5-hgaoGz=g=H)Qs5SKfO4#{Vc8KLdp*c3-ys^8dt
zTQbR0hed*F66#zHz;haNgjG8(L!Z>z!HI|AH@hz#YG}6-KxVEkn(h7ce5|l%2d^BE
z7=rmQ`o0HH6ruOBDb&}T@=1om<zhO45zaY6t;<m<vW1nuJrcFxMvFjbQLHHAq0w~%
zvlvoU==%9K`KS?*Vsay!i49pmpxw&c>JGT-31CLL18k~!wQ??bh%k~Ehd{8Al`*p7
zJ3n=}Q9L>HNghI>^K_k2GyeNaq+P?eL4mk*WS*@|pRyid1(f@|stvY<zwT)zH2c`i
zw-0#h=GY7tVJ{tmyjvK_BY)8UurU4&HrCMhqH115ptU%vI?C6BGC{fmCUkQZXf5Hb
zt=Z58C?TPqNsVX?jhtg`)vnEZALq)A=Gr)QkB*a?IVOP}!}^o$fnxK?B-?(PK&viz
zC|1q8_*tk-JeM&!Z@h|(holX$@V7=O#?hBzpz0aT4_HXvh(r^2$rkdMtQD>A1sgNl
z3;K-=HNSbp&b~wYjlSeyk6akT01f(}q%}Pqfe7}mxj$<V<#nU^F^|0N@}?79kMd0S
z4O>+Z{9g0t0fd6CN`pWA@BP9EZOZG=2vhLD09hyZ$j^xd$@-7q)Q~kN5v#X_1~KQT
zUQ({fx73_3&;asu|Iq9Vv7x}_3b`$n_8?4%;{cma{=}$(;f}(X2Y5IaApTPDy%geW
zZ+8QFDf3a1;wZJy*7Mik8jX4YIccqgsVfL@_4K1;%fyaYsQaG>EyaW5cue)sT~LI&
zAtMkz3NGViI20*^LqM^<exu<`_wgie`?o%^A5`r)=7o&LoEs;FIoQ<(etZj!#)6sb
z?$hw{6|&u9=uD8AhX7KN@z>UFk{d?^)P2l@qxKGXPmsTjYNmrJq{Kd=P2^tvL)}dS
z_g{r|xB|2YdfVbcW~`4bC9GfPW?B2{*qe=Khv6nhn)1!21G7z`T_=Gm+iT7JE`K#t
zs+58`8KnhKpyn)v-M)}^zvl3~<1f@f7v!MW+3|dhK8(!5J;3_gFL^1fiz%MDX@C+L
z-C(knM_ST(1>9`jIc;2`HTOPrcKd#w%?I#KQT=$mORz^diZhM(DLw3K@{)?~$HM$w
znrr%|1@DY`;g`ZmmHe$M)`s;Bwgo%+a}HHEcgjdXk~@mUXj{v<1rC8sE70dlspZfP
z=X5$YXnww@6Y%GlgrX_E(ZVbU80D*cnR0iuK<l)Ya(<1=C*;5)D$oh;)QoHQ@{zM7
zj=u@G)$BKQlRwC$$l>SGb<k)o@8<xC?o_N(vU7=$VDClX;j372##+KfLD3Os08>8D
zKg+*%2K83e(AWBVb&<2FW)opKG*MWwW*`SG4d`cO3Ml5EGjnnk0wpy^UH12m`LY-t
zfxTT=mt@`b7o>puLHc9?ZY-B>wfg`;K02rirQTL$nwciIy<&SN!dU@rht71w<=Y#?
z(=6-rHi)6^i`3++bMEOLb@58Au76d(A{JuC>I)=3Vnu}vX`A~eYdtcM$iQc`{6{bV
zO$os5x3h3q%?1}hVq}rj9m-BX3?ka!tw?00Dige7eSby%3O~)-|Fhtvd32@17&f)Y
zXve(1089W@sVIR$y~9RF5QFY7q?P;M%&{pI@089@LFlYBYM5eWNZYeA9cl~D564<`
zOUF2_BsjZpLvS_QH9dozA{O=|Z9uF8b&l5U|0Nt&=m3wn#5-a}BZgP-@hiYAK7^Go
z%k-8DySv|dC8r%L*o$XN@}H|mC&`PVthBc(1$w&SN&cfhx?J6Aitv=q*k7@sdQKIQ
zpb@v}M>=R%-I1)+(9o&?mLyzlrsip@WS#upFP`+%_iY;yOvxN523~r4QNToTjO^a4
z)=<_7t99wLGpRA#;{sQ7+uC$dr>2Sh<VxMK?+%C|i>!<`)O6ap*MV8u)ID_(M^H=_
zUGw}q${SVd&nh0EQ!2fRNM$m_qSdPGcCpw-FI^j7OS?3_D94pPcx!FrHMEWM7R+?s
z)2-JGsCl(%NX~@LxdZOE_RHsOUvrLH$!#lJe<xp|-0d}3J*kjn5m~E{ua26MpIX-o
zQacLem2xV{42xF^a>&E_*&Uas&J0ifC10_*EaTb$MV_Ru4?Fy>3v6oqt&9$LA4Xie
zV=uo!-FYKlv7R8~DkV3EthKIm!R^3~P+3GYL;N7nkrE6yfcwJfeCs);HbB4mb2(P=
zU^pHYWXq)6QjgX|gZbgA0`8PMe?khHj#ZvaX-5dSEo_<RDE8TwvG9v|V87X=c1G80
zt5mCawj#Gjqc*`_1ZykT)woiG`d83^3(oS_j+{gQ=uSy~*4x%M_U`1%FXrkV*Vnhx
z98t<Y(w_hpc-*8_UXE6uRga=LmwC4&KS4sTmnBa&&%|Uf&C6zTwDG&Va_+`UvCN~7
zUNz_89d7YbP8YZbeda(nzPBE}n8<Yj9!NojHfC7pzV8w+0!BUXL>zlLJ6)G!hOCNC
zMqriu&v84DCrG||nl1=(rRQd-s46y}GZk73w3(3eP*(HF(ArJaEZg|4Qgp2WW{gcP
zKjqOQA7d;Uyy{}jFV1c7qV@79d*!Y_cR;?YIO6S`8;<4Zz+^b7tKXBpLdA`9M+DFR
z{7Q=8I6yEcT2R7!fX)(ye!QHn%FcH&)hhwYZSuNbG#WQ@ku(vd=558=wsN3B4{dCB
zlM;2DQf`h-v9%Fba1o@hsVrLHpt#jAtuJhMJpwj+@rz?eAKCimNRDtV@B<ZV%onTV
zZuldUvT8-?4xLgL=&=*{k=Bn}DUT`GF8f|Sq(0dY>yF!+J<b99C^juFfQt7o&;K0H
zKaOZK_&{SbBD*E??P1uTn2a&>$?DF@)GaM%O>^4z(~(gLA4So@YTBz|yb;Zbk_VzI
z-uo7q-jFC;C~GkIVf+s5Uh}Lv2b*Ez=nDtuL;=ZNr=0RwLBPzxO$6cK=7ZUdc@pOe
zCo|+&ayYY#J(p8*{`zNsHfGG;+B}>08uyUobh{5VfDM=h4ov>3II`zz8hDQ&w)=e%
z*==(C1;U{@dco{h^>GTFvR4+vNzJZNh#T}pAN&gCCuo=!6^~`~(~{2OEi&ry*aQ7$
zr-yO%tqsnB-!f$fdKM%`KLl97r=m7g%TI>P*`?C<nrRx*bl|n;%6Hy}>P<n@i6E^2
z7?}yVvAXXoZUYh3bc%r}JdYP>jc`+M(Fn@kXg^occzCRGqm~qYd=<PlGC|MHCY}Y|
zSRkzMdd)Pg8Le2kJox<^m|{T{-J3_1%fB&R`l)TlkdklI%Gi(4w6>aloB|sRrO0E1
zsqaykPGvsumTmPnHJ;7pi9#FzB1PCly=r4Ubg5BV_re_rPKv(R4pvsJ3h-~<Q;g4m
zNkA^ZJ3>X3#k-Va-j3#Pbdk#Ya|wbSj~8<|(zbOs#Rj$XO-pkEe46*(>IHLuf4{##
zM;T#$F?92ire*zOx+ei*G3eMIuhlniZI|ZzA;vs=3&|m%JWmEXNo+|<)JEel<D{Yz
zaz;N(YhPx=mo;Oj*Bexl4tSM^5yxb1n4zM}t%2fipHKLLEVqdCFz3t<dK(Z>YJh_k
z5WBNt?Ty`wwr%$!i`Ug^H{SB3Q<p-qF}@0Q*hW*Uo<(I}LwIHAQ(G>FU!(lft^ET0
zgnd@kg!jAaABEhsf{Ao=-U|8vx=69}b?p@}Rc$iQ+DapTYonCuwWzc%Nr44bk%mrx
z6S*yYYn%F7TiRp`(oS%emm}?oddW2R1@(6u595y$!K>M7jr|r_`|*lfu7M4<Y6~wy
zpWXna-W~F<&_*8Ph2YTj4_uanx&xpRiAqYhumb8oD~BnH#(}xWBBDhEkXM?kIz~*6
z??#D6IwJbpIh<qP{UoO1hxsdFK#59rcpaeKtde*k@qJ^S?ZJikev8~g0uUD+a6NU<
z+7fv-zC1XZ{FJ1}5uaw_<WAWp+2qB_k6Kn&eSh51-*4Lw7Z4M~XW3qRqpA>KCkluW
zF(muc1;SP8n6Jx2yv<m}cQVWzHIDgCUv#;^RnaEKB83{4h+y<4xZvlimiR)o5qyQz
zi*|ug!<XL@meb{bj6OkcmTk1i`xeFs-=+4G>d`LluMFfq`{*~Ty^UQf(2iIGy#Q9t
zexTc6Q@VFM2ffqlP0$oF$^fj!ocFsLd<jEW%DLd+LCtmH{Ddo`n1DMJB!_lP;!4<N
zw*YkmLkk41E$4Z5JKUNp9o<~)>OTOQ9rlI>ZmW;I#SJxWXrG>+X1IcI!wu%N{)Wj+
z@XkmjdwX~zm~|I$->NB@l@opHzxc3u)WgRJ7@P4d=2w7ht^lEk!JXpkv_~B5W>PN4
zr~z7(#ZdT0TeKrpnZr)W-5TD9U&N8xl9cUVZ*+trD8wSn*d)L8=FQ42Kf&f-t)LId
z#!?+LHABn0CM}0CFGno|TA|jX7llh-W%P^4N6lMTKlfu&i1Rf8RKtQal|YBZbO{M*
zN79r9ofP2uJGeSPzgKS*7D)<whtn8ozRNM`lC!0C?STjc8VauP6!IbkG##CbS@LG(
zMKhH0Y*}8Yf_LG$)%?{)cEMHs(C5&WfGA|gqZQ>uhs+{m(I!Sk=!TNeZ67&N@_GzO
zl}Z67_=i)TVik33GRmo)S+U|KjYGrMISGCQ;MH)(8y0@IgE7OS&h>7i7iC01U+k;_
zfBkood7yo>R(g(Ft*tHL&DQ3g5$1|_vBt3$E$eK?VJ3s_rlP<KsgQ$O7i;x#lB>`f
zRIG5@Pl-#*Vydr~`$9K!bj%#8Dw5w|W6t77ezm+Y(Np4t1mD$nui_k*$=;p{eVUC1
zWJsGG_u8eq-En8<v`!D3&6iJr&Iz)^I>%eBA&U&-`ihM<<Hq&2tIaU=#*N8PrJa1+
zE!Zo2#f;DDimvO*rh{V28;u;3c!U5!QE+^5Y|WUX-GdVawKP$5X;`!9uRh(qjz!93
zn5h?SgoJicTak?oj+8!9k~r_Vv@xJdU_2~GgDO=7-Wbna(_i&IAfQ<*!rkGPT=^?|
z1sAQ#;WrN89z60;bVIjAq_~Nqz+K-f&G6|rmNFkJf}`i*{f&B<dV~pH_1*R$TG{~9
zxYF8(%sOfI=`2F*7#k!Ff2Ln25AU{K?l&kGwNjU3E7fx$ZzNiIr!Um=og)xc>T=Ye
zU_s{H_HwA_E5(A6F-3)_=DLQSl}cYj;43C(#~JO?80z^EZ$?PR8pb-^I#kBLV@x9>
z+l2Cn_NDcA7ffh#$s1I8OZ&n{YLlg4>ZnFz+Gseeq2T1<L7l;`8ckY@A4AEby4XgA
ze1?vxs05{@GrarNFaVgZdE-HuCZqy(K)wR8L&`b~&&)^Fw)%ik5<L<Rhk&jGJl`kh
z`CT7luEOqPy@T6rrw51do2_LumRXmypMH9v(XH)X);2f#W{FI>M&KJx9V@ksPfG|)
ztS_$_Jo-SXB0#G-RH38ABT~L>r&VSi>5);4{Q?u92{r&4@7&BY6@6VyA7Y06q%7?l
zMMQen-Uk&q;btE52O$%REfHIvUi|=b)@}q<FAWC7k9ylH7m0AURXvNujHM6GP`{ie
z92<11EAPR62VGruCKTl6uthsEdo#bZ5gYBe8N}%2pQV8wnKgR5-deV;N^F`>fCg+C
z*M8T4V32|Ddj<~yC0{Chz~FUuMtwg;OO1fNxr!V(zgf7EcGy)?&IMXwUMq0KPp~w!
zO^O)Gq5bA&OKs&+1hUnCD%t0zkcomQw@P(_q{?tV=G^#ue}O?O+eQ<`EsoJ3xWUqn
z>bs4<FChb~Ra~Oy-5=gm-1aY;b_aqA7A}d!6crVBoo*|u{yL0LazEZn;6rl{;1;&s
z@EEi2?}J>fvVqB((|c!}Ybv{x5<6Nydl8SfF$?rZ3+$+SjlL5|8;Vuf_Q!j<z0_;v
z7NCt*cwO2HMbubLYW7MOG{}WbhNAsACkX|Xh`A5eI1etr0=Iier<9;^4A5Fp1TIg6
z25|&dyJ0mr$2={m75}6mf1_KzHK1VDa7XD~?6XjRQ|G0d9c7!v0~PP!=O$Y_HOg8Q
zfB@YzwBD<-BOO-67@c&bFHHS6!8HU*zM}S3qfjrlQ9eqV#l?_MenWPSi+GH0c4b)%
zK+<i4{La(-wEC?MI}$LUvQV0yBhWfwEP%ag0gL{k1vAb8b_`N&Om+CnH3?TKbzp1*
zGLp*9-el~n*POk6KaW^6u_dwvfICQ%t&Au;OVo$oF6_BVuJ?Tt|CRO4t$1sr=O^@D
zJZ7OWXP>xn`SO+LhHuZ-i)O8!(hDFT`gZNstrWb7Ga<=V36TK=xusxd{TFgNHGIiP
zd$-36Lx}nEFBvi6x5RXqeWC15YLmh0#Z9x~I>~LhO=eBco2Zx*7TOCcpCTT`WLITP
zb;q1mIk_IzlyN31>GPwIBI+lCMcK)wkLQS|cHv&pV<`JuMTpcbkNSbS8`nX2BSBSl
zO?xxvd<K}CxNWk-Dz+CTdufpZ-^ceX;v2KeTp6NB_TkY)m+6&**yt7ZL_fJV39I-W
ziDAqq<ql?qt!C_Tc9bHEA5U_s-CSj`Uh%JRlS^w$${6{@Vpx}8lkoA)BtprV@1o&0
zwl@+p&q32of={Qf)rW+zMxFlMuT!VS+8_Y5n_umDr|ps^RDI$)G%zMeV^2lPbI3E7
z0}`+7q5^y*w)t1SPf07Nu;SSLdaDWh=G5a_mz%crH^rOw<zI|{Wp6WQe|VY&ikMTs
z^OVeD$Ltzu>wlU)%HJT&isC49Wy`nxl&pEG27*00@%%_@JfR%b>tpi>C_Qxe@XMmR
z--QqVlo}4cU;Oki>N`*8jq9S()=lM2nB-Y&$beg8g-dBL=p76eVc|Z1tn_#wrzO8b
z8ruOesc%<Jv$M}Ovc2O`v%Y5n{kV9SlbImtSNEj&hq{#>Yqyl2#9;=!%+qCy*&`fY
z?RI_r{_YdEFRBm#a~9+Gyg_SE!*<q6`dx7PTAouy%a2_2&2p8i;InaGXvrL`ye+(Q
zS3<*9dLkpPjYN6?HQJ(T-6J!#wOE##FiqZ?RPAz9efeNKR;Uny;ws}{_BreEyIHWM
zmjR0VO}YK@vbL@FNWq3JLWB<Rqfx7@K{I8s%)s`&ucq<A&FO0&o0!gRsvX%JdMdal
z@KuR{b}p;ZM@LP;UsX*@t;|VE^Qt^biQ)f%T%p25)MbkUykwg<+qhJ}R~;DGty9{P
z{J%CNJ`rz&xPSBT{OIXZV_nh@hKX#1{0HE)vu8X%Q@5lR%_EE`-TE2Wr8@xxLj5Ny
zp0~Lf+OycO4hJ!>N_phxFw>$xa+ynw7*32{w$PlIVQwQmL5gHsUa1OxvD<@Nr;}N?
zE)i0vF<F;(v6-#@l!u37Nc4tHGmDMLv>FjU@#OMIICJaXV-Z3>KHOAPcGY<$N6?iB
zwY8Jbf6W`jq$`DK1e`;N>1!Mz)%yhv__3)^BW>%Sw{#tySIc!pA8F-gR89Z*U_xf<
z-M_FRx20Y<zhAgW*d-S5+3x$Rt(MKN&k?VA!{$jaGJOpZqIz#teCQxsB72!SWYqjq
zGM}oe#jA^`fAAJA_bv@1t993hB@rAc3lL&^*d{Y(I{B!!ox{ZJWQcTLI{mku?>?!Y
z`ZiX_R3`}Q8a2|reqA(#r}%*s$|OWG#B<s}e8vvSHW79-?L_YJdM-<D2a994$}CSp
zQ;_i8?wqwqPd+AYX4kNLmWS)>i?ai*x**->9S-ge=cReTv17AkRF=JlasVIW*-vXR
zrdZYa(?`~N|Kj=Ur<2%XW->A6VBpw=*53Yox$_}MX@>KzxvmXIS_QaVp7V64+`YO}
ze(AtSBj-=;nyYud1#)^12R+Lil|ftV<Ku|jK%V=D%TKi<4@P+n53-n}Q*J-<@fsdy
z6PB>;ypU0mpp61V-7T^jdl%+cZh5YG4R=dAc2Y5QhwdisA)I%#Jbd_^78leL>I#KP
z5FWxmwck3EGL9p@k0H+z=63+cEE5i5!gT`|)U4f#HCIP&$-XY?dhIxc)fh5hySC|I
z1sz&bU<~l3mMr%#WL5!>Qel>-c}Nbks|gF4S1tzd=2B-TGTqfM0U3p#WH!ql9^Tia
z+O({XXnan%`;N)<Q1hY3jVSge2Z?a6$I*lYW1GiV;8e6MIiP>3;aKO~<$mc98QfKD
zl6-1XE+6k@WyQ6i<mdH#txO_^^zZdZ1jX+7yD}SJY}4sBf2&jc`IbFY^FqX$1ynOT
z(m@#Dvee(k`-U+;In|)SUUkAAe<K-Uxi9@#kHRq}K_yAzG4*}Yi8fqytgG$Hp>)c)
zm0%unCfF8-q#d1rO~^`k=3RGY;@v}Nd7fSYon^NRF~G3kD31?Sa9-MHQM4Y{x_-P8
z8upmLw)a6qp!kE89muadpZm_{rI_aSaVDT5NG`~u8w!<i>8hO!3KCpX#k?F~-;_mc
zPdcXiM;d-m#GExAMR;ruzOw^r@wuMcV$Z|Fz4@pt0(*zGMCa_zNQh;jiQzjVn)`9$
zKW1kiWY*`lsA(F?y>F(;V2jSU>ox0GC-x(nuAN!6;BsqTE6Q10{CMQqR(;LSTS9;%
zQw3L<-lzR@uWS!4UP=^wi;mfR>v<+xl1@KI-ilz3R)`NBsI}QS7-^P#ui3x9Hby=6
zb!W^hDh5daL?Uww6=9b)1+mv9tiMO5cAu^OIuyTzqgo(J?_E$2c~<;+8CC|kidF2a
zpIoaoyna2;_W<Tbmg}L!%UkQDclUuj;ikv>o8_j04|?31_SdX(mbo+4p|Uc+s;J|F
zhBWVY>wI%&s$egRW?eY%ITu#E*>e`n%=JpCBK($bKbI=kkw<%ZHII}WTvVSUZ<#-Z
zQ3Id0OpWdt)nD>|Nbqgl7POFcI!X(k50)%GR`7NoUv)|ZvSCBfLvgLX0Nx!7Ok=2@
z6LE-Bt3w`_7HuXxCA5geQuEE>-5E@Y*UrxqhsK+(hE$l%BY9nIKeZ%iydEuI^DlmY
zYA#lKf8#+Rz`bcU%DQ!+<vpD?!f)ACG5=!indRSP%6*{BzKr9E)cfhgn`luo-Wk#5
z%OsKb7~;dFak!R>Oxx(%kvRlhxLAA925WJNy(4Y5;I91hD>z}@qb*YrARD~cPXz~g
zG^sD=rNWSEC+i%u%l>==zbD7$2)_W_<4w)tQv#GbhwM2d96M@ogv}o~JuiE1%;oT;
zV!iR3A>tT;8Li@D->-`ZjlWL5JjhzywQ{&gWqxP=Cr+)Adql0sXt@^XFP@0(DsF23
zN=%3_U2NfQ>M~utAuIHbpUH&>)+N(~o;Em>poqcWJhHZb4K=2m?dk|sl$cOQH#Ehv
zxF+4ve1__7Ip21ZwLyqIU9aH@N);MeXjN|8@|L0g`9JOlZN(C??=1U8?3~pVnJXVe
zSU;Cz`<{Km29o)14seHV+L>?W{GAnIJQut)(6qPd{I46TjSy6819%m{&Q3}BgJ&&+
zZaesv;%wbWyN}W*?_*BHB^4t&h#_pnEd1qV5DZ&IOtCQDvUm2Pkl*1=VSJ3x#Cyug
ztj9f3&f^CzBDxS(b6I!(mYXn>2w5#?I^7qP0TvNc75v3p0caH~;Vs#YN1h=B9JU|_
z333}iPW{<T;1{<cQ6l`7t%5LrZg#@lmms7jXh6%~IU~Q%qGROX$fSAPV#qzr^<V=C
z)fT8tJ6UxPRJ$+7!h~ERN-ic!{D@B02xV*7hW@p5b8o{q*QTzpiNoU?b1O!#sNtCi
z$%CH<0H>?k_fFJ>iuP#iMSWVpXXjggw|vu(udBpK_W4o|05LP4)S<=j*hG-x=>*2*
zlIeESg%)%?8+*CTws?-p1mvV+KL|yf&W;kJnZ+rmSj|xnJlE5ZNiHJ$ON2BMm(JPX
zSNs~As-Ld5Ex-mp{}@nhyYRFD3ynCA{|x-#vEGYf+P*d)x#6vWDB1u0a}sy4`gEIP
zcd2-^oBpSzOYz0Dk6PdOA}xlQar+|q_SGwXT=UEPJfO03g_d#n$jer$ri)OWQ?Jv-
z$NZix8pc`v`>7IPJc<XaYu|XbJpd*Z_LaHsvrNv)q@-7<Vy?U1E1WJyl%CBwtM~yA
zsOpbAI1_W>)VB;*$f$q=Lcl_Y<fOC+gK~dr*HX2B;Bsk8oF11FEndH;q+TedWS<RV
z=HrvoPvK>bVOeV%5Q=wb(b$w^+k#lYe#tJX=BfMkF$c1x?P#%Q%3^54(ZQKe8H*%l
zK3nG|Mec1&<yWiE9vL@z^<Pi9zD)K9__+>A-KvtGK6*_s23(IuHyV%i$IZv87sG5!
zSnTg*7JKh1QlWQD#6wn>a}|9W{SCWiVz>fnk0o|)7Eo9#T7D!coC*>`sw8gO9rY0M
z34NWI$hy|DU}w^d9oke@psE(1YVwb~)RL09Xx(n=GA5xvh!b<Cz2@S@0|~8r=Em#A
z6Ppzu3N9LdX(&DRv_&Yi?s*F<C<4Iw7B_(k5bwrb;z}R=8Kugi8Xni*tB<cG%qTwO
znG^F(m314PWN|rs;?<o}T^NgIv)f`xH*h{N%2T?;HOPj%ihNL!#It(9K0l_doi(bI
z)q~6U#kpB3d_S*8i67Gnpq<UCilZ9FC^xcg?bpdGg?5&Yzb*+_;@TSY&}?T;;%|3-
zYU5tOw-TrFY|&Y%v={EII;eiLA#<LKg{D6}8yPgH1pB)-i$JrsY3PLm-i4}SL_uMW
zRfKb{^M=x7rR|l!=otK#tlzwoZ!%5mlk8TD;ZU>JnXo1Ldjiz9&3kjsYVF6#8+))e
zLch)=did&I7qMX~vSV{7O%+h$QPquuyT0bo=_}z{dY05X!!^gbC9HEyO_?ZIt0BCX
z^UcPax(h6dw$6EG1ogvJb@d{_eCf`<`9D~BCfq(1eUCWOh8#Gq=*|=yo8F+<Ipq6_
zg86I33~%C!tN9GP{&l1FOUVi2i@#_`SLQc<F>j95$o8<tPO43<)&uWMcnVlm_Yvz8
zQ<|s;1WOZx^nSs+^ZcX$PlA_us|GN=x;~h`!eMrJ<U;z7C?RTc1g(3Y(C4F|HM30l
z6vy*)+gf~G&F}t1wW=tXcPNCoBk>UiOm)(hpHA}G9`XU+KV+LY<RUcvz{P##uFKd%
zIiIs)?Zh{OvfY!l`k6-aLtI{juX{W1f2&GTvP(n;=Q_c@1F^A%9#R)nSN=}j^5@LO
zDr`+XwW2ls6!)GfJWEuzBU>)x=s1tVPCnJ_7`wk@SttK1;Zz|xdh9~uq#72X7S(c#
z&+(0{^(att%>XJe5t#o~w~uOf$p^dHAqcZ%*V&uui=8yydNXAv5!I4t^L+k-xRu4N
z<>dXN;XM9%_YPEq-s>BRXMIrERboG~uMRP;kf-<8Hq2hw#C~oCl8Y5(Z7wxETAL|C
zj>?!?I+1wm=5^5zkCuR<Ig8p4XN)7O5>UU0CBRFdM6;;q&dW8WB2}bYLU!g@M$quB
zN;g!Zug~J!J=n|<{~&>iBICX8SPADVxgx5_aTKiK?hg&(yY{!3%3kb;7Cq%}-@9?S
zuhc+`z&P{B_843nG)nsjPl<T>ohB!oa+VtPqfjhhyL9kI)!=dQSt6Ts(B_~ral}j-
zjDL<Mb^AGr*g%Pc-;TPqI~jda7A{e1g*sP`6X)+-alkt11KhH!Nl&Tk+as*8<p+%~
zHoVWgCQu<9$nPV4hK}V^_sWIX@kQR&b|O!C&ajV(aCOLpNoFW}OJROYKXzo<JC%Ix
zZ%dr|2rjvJQrN&2KbyCb=5sWzTZL?93M{>zFRqUDDpbEXDF_f&{q;U+X#BmzAFrlD
zob?~CUbxm^efhn_xbULs@-&SXG{_TpKiznvnu>Kq99NaNPbNURnK@7GM9=?aDidKB
zd>Zpa_K`p^>j6RS?Q0T9Oxo0Z@x&8!h~^6khtk{Phk)c+(TP<-yZrDow@1(36aj=b
znAli0%dtNdakiLC5-gTl+y2r~Lb!GI#G}<OC7;*lUIU#D_gwpRZ{A)M<((_>zdmxl
z$;b3$PFVnSXK(fvk4}Y!K~R{`-sl=>W!?kbnTfCQ(IIdaSN|X^XsL#WzjC#jlbsD0
zL`p;<w|As`CIaqlJ3jihKagwF1>8>8SzaIfHu%h?sNMrg`&C7)uD|$_XL>c`G^V_g
zZ~qKTd19D(gWar=wgj6)++C~r`-F@75_FkIiT^3j;UTUI71n(x(F=cDtOVtim`%xw
zBwln*V%{)6Qguj)6OlP?aXHg7^Z}Er<_RF{9ssReYr8)80`K26qP!_Nto(}&;Ip^I
z$2J<u3OSyD*&!@9UjngcwnZTc&;D}L>`+hTO*$)kznc_~8{HGhw$Jh7+FDI2>z3+w
zL9HWJZ@l&_J>v*db>$Kj)GRQTU?+>2UYaZqUf1E*i9@tFT0m+C)2w?e-vs3^l+_zl
zOi63|%S8Ee9%LZq`cI}g;F(aOjoMAkSv&3HfR^hdJPeB14tqfLMlqSr`6M2jwKbJk
z)i_#8ELP{e79^k8hY0M}_!w09h$gWC-K?#JaM>clq?6=~!`_By-X9%`pA1f0(Z5|&
z&xG?YK7CHCxV?2g7J*@YMCSXN8y+6mdvJo|(+xPGz(eZM%6>K^uqV*^2hRFs+M{qh
zV0Ql9j#fmhi#J-u)tSlum6DHP&k*Mm9YK@p*8`Cu_y;$dR?^S?bg`H?43(9LaP%!Z
zvB))H!Aczwv1l6=w&)PB^4JlI`TXE>r0$l=tJNFwwYArZONEj97b>|D#hth%B48=h
z!wjZ5Wv2IOnHL2J_6&%0v>fhF{Ja!WglAC$J;Qb8n9^bU`<+9f^2JK2Y{i01MPTRc
z&n7DRWv0{0pv2}-JLT|l09vgewZBX<cx)so#kYoUO?dyhZ1hX21>Nv`<7INFFxbra
z&ibK=|6}UA<Ei}L{~ag0$Q~Ibl1;K#$xMjCv5yhSPUgXVPO?`dWJXHLIL96b#}09l
z;@GoP#xc*a{qA~yKaa=n_|rM}{d&FbYd){%b=~4_Q?ox-Pu)w1cK)PkN257)w_I#W
zn-hxV!8p*cv>$Z8rRCauSVho*vMioqZR!0Pe~m(<ES4NN)2rWapn##VKs9|P-}?6E
zGdY+!B3|=U)kCq?Y+83uUemHO<gFk5{Ftw6riWrsMYzP`o+`~j4obLuZI#FEsQy~=
z?EJYB;*VxqM6Lf?J9qD?<?FVJzS;vN=Xyt)YdXN+waVs2pIS-#bfjPR_WSAQc_<G>
zcTnrho@$&uD={aZyOih`-nE<K3_0h%oKyF3V}VdOS=8pkmm-a>O~8&`^-DHQ(KKDX
znK@+9)wV3Yf^jyeEO{8j8gb491YFXFvho1D%WmojIa>K}9W5I8uq2T@B;h&TR{OdU
z&>iPj#ajGqLva)4dxZEOAB=1EuB@(p&e|V3!+7;!S?H$65!vb`7Jt?+?)R;T|NPyW
zC&QeaTNyT`9`%wTw-QuxA^+?1ZFqqmwV=1S?R+EIlL(Z?yE&1I4<Q->KU?AP%0d{3
zud+-JclCR{(N5XffP=C}_=x9nK#T%BKdoo_itALPAx}NW&kmqm&r&J#WnM^FDh98d
zt1)sSK}`Dn(IUm!3`_kNODLWBpI3XQ<o{bg0?SsHX|=OFigoi>Nqo|?7m?|KaH8_*
zd64BZv3FE{H7I4n$P>`0WWAm1Jl1<ZeljJoO0`xQ@wKvR>^@+qi36q+%#|_=RJR*c
zoC|1_!Zot|Tl313j}ek9$BI0L(PDxNRvf26eXX@Q)=uW#<xkjEfQ%nLU#^!(SNbL|
z2bAE;&2|>Mc>>fuENeht<ORE_gRhXq3*7H7J64yg<Vs!cH7=-M&h<&B%H5nmpNTS<
zK0jhv&c9p|44e}bG~aSEl`5UbrfqErV55G}1&=mfAuh^GxO?!=*q>hFKHSl`cdW7;
z)~+EJ>ZTYUiajS`iVIWqfJjxq*9-MB)RaCd9~*uC;=nSqeCWgZ1rYarC8wL3!s%Y&
zRPvvPIt>&GOZgg*6wcqVDa?xArgks?k*J9ss0Hl3GZZB1?=T-Y?FSAtk#iD%)JP0`
zAgJhkU!kRO%_ZV<H7X4Vy)?pYb*d^!^5?mTwl*aG`Sl@!9LDx0c=dpfdgUS)1<f#$
zv?Ar6onk(t)n4dggkO7X$ST8>iSkRQ6mMel=lw{pRWRY?GT@6gzeLKV$W6tZ+T+Xt
zoHE$=%nm;j7^!ZF3eS&~yk1PVu`0EYHf(R*CsFK4hL})Kj6xI!zPP;?JUmB0p+mo=
z{*v$CBwU)fZqadKudA&7z~SF6&0&1v)ONb4$X(1cv^l#NPa;*&)PQ0_AcxoGvWNI=
z;pAZf)v)lpan9-UF@$jV#9^rtZ~>aKHQ0eRvnfQt(JmC0=JKhDq;`6K_QrLB6@vx#
zm+R59X{*B%&9WOd<8-+;qGYliPYH{CB&E2M|9KKwuekaRx;UuwHm|cRoXz6838>H?
z{M$zAC^BTEidP^n8Qs&|KqRk4U_){_WPnwQa+`irCnjxz!=`hODFeVN_&jD7?ImQ9
zt}VPTK9Rh?LU)F(rRUP$9ZipE;N)-<!aLy-7F@+*1CCU&L&7#slddPXv+$)i>NT9H
zTgF(&IkS~B)#(Lm(}fpM9G%NkPd%s--=OUlX<qa6UL_BX3MXFz(<`IL6WQ(#@Q4zx
zus-MB-L@Nd5D%r90EyDEr6(h)iGKpxia*Qkf|!q&y#%%Eca~llPeaC^p_|_$-(s+=
zGs|@q6G(iP-Bq#DZZuXlp*Yw$SCf*4lTc7R_TtI%tVX-jxOaEF+4Qp(>6zPmN9>}@
ziOGN6f2=;UM(27!(b=BIo$mr{=T=hE){pL)M%Sb?o5VQ-XDPh9hN3yW<RoUCFf0cg
za@>0#M>HtKh3q(pv*T^(BBOsY_N&-SP;j^G<%W?ojIuLRJll{X2MY9ln7ks-$Ccz2
z_|71#K_f%W%dpJJm)RI<Ec(7u*YCV9B;xL;O`H|?A(6_KDNJ#GSHS7Q4`(DE19iWJ
ziLW;J01Q<`x6st%W^6)u6NGEieX^M}L%zT~+izxfzJgseOn<TQ!Ztwu=`XVJh4F+)
z^LeT=r{f^Oi45EaSBJc!w#C?!mP57-HQRqqCx4alDEcw<dk}<#W64T)_geM6!>(he
z06B@HLUg@i#K!XJa!0bKbHxkS!Ke%uR(=DJBf32bajCCY1G`4;u?sxzWiivu=Oo^1
zit1|4>6aWc!F;V+Cio1ezGW{ckD%p=sA9v0T0RcmI#!v>-P>BB6rA_GsxYCxEE{qq
z;T*mfBQ9n>F%d}%Gl5fXuvC+;9l(KR&aS5vh%PnYYF%`zLbvebU(k7$fe=o{0w@wQ
z?xV3y`gI!18R(2qsF9P>1~J_^Qdsbl2mc%kJcjZhZL3>2(Bs{i@U*G0+WZ?grovPI
zJy#aa^HT3^(lz0StHhUTLnvH`P{O58D{QNtcUTrNa<>bd5Bd2J{0xp%QHvUr_`y~6
zl$7c_b-E|Wa;oWjcY$7t5>DV-roJhugVg<^OZ5)qB&J&>Z001lkZ>?B)+LflWSFAx
zq*crGYX#+UP*rvM&LL%Fu0mz7Df7ZXN`k>Iy`u3&yR^_g?}vYFkYK=N1JfS{FwBM`
z=5TI?puXV*<9{a9I8=9rkxJ_G^?{yiTn$NkMe6s^3$68Vsy59B0I4xH9~Rd64wm~>
zVJ{?(!;9z!of}BpUiZCDs=mFTylVT^A2y#gOgMCwQ8+c95a`65=}Ma#C+zd$n+Ylh
z(*$etPg*z&oC)$r?#gKA5DjlmSoS}AB=~Zl&%#CFk><%&iMj{3J6bc&1Txlq7tDV^
z;ma9O@wKAInG7sAP;{bevxStCY|w}ycbv}ecic6QI*v4#JcF%9TBWDIa&sjK*+b02
ziOtv0sUr~)bk1P($aXslp<Uek3zB<lk9zx7yrGj-^jl2vQ$NK9XJih>XsZ`<Bbu=V
zbM9+7MoT(pPGHAM;3EfCbw83bML1+Q-wo5LW8!pS4JfEf(WE%kD0?PsGLC%wV&Z2l
zQwFkIe8Qi%4*lYLR2S!3$cyou<w9*G3I^zGj{-i^ui^sZ5sQ-YrbL^&>RdftC0_!S
zgIa<xH(yeVKy-~}29-tEOywX;7)I)(Z4iN~6w6LXC%VqD7e!hqbk8uQ2(PY`fUzE<
zT0z7k;H66BUxdp*{WMxQBB@#?<GETqqvzlFSYO>*v0eTR>Xfq5nNIuAxz8$ta#YAF
ztw#=BRQO=ZgoGPqjfgDQeCeg*xi(<fAO~$uY2Yv%x}ah^O#`DL2oQ371rsgivPl?C
zBlX2#0q5?h{9bzY#Ga=PDo?`?9CaEwdw@}`(O!Cq-s9Dj?syr^eE$dr$mvC^;rvQu
zDuH}_*;Cz(C-C_@&AQflUeb(%&@#5Ed4_P{^&U1lfUEqNWBkbD1?XG!2!}+DRf^dL
zW3O<`E$7+xQ3J);-yW)Eu?NH4KPSJx5)z+~V-UX*b|Dbwd7XnW8h_jjqgS=91Ly*M
zMU9x>eBetsu3&l<C#=(4mHk^EI$i*Z=^|P^1#mibb)~MzVVx{dV$mEvIU>xi8{K`%
z2xcW>HI7l<T8B?^;5vTIk01(+JLJ3l%87!u4I)o`mV`xGHGk~cl_&B&v%2V}$=BN9
z^t7k$)JLys){Fj+!~F)mqTe!Ez+X+iUM-}9nCV(z*EsXeY4c#4;v>sU$!eKqphK%q
zk8%%pVmDQnu#iOmO;8%R8IG7$S+}pxgH-^6eQ(Mpz`;Oi39-3*l;10{>UN}-@qW|X
z6Yr{4y=X}7+?~zYwZNv(l~xuS3P+3&EQoZPET|IreOMOJ4g04o8UUh-vaWJU!p)>u
zLE*B-%)H^;H3{!!S&6_a{S>RS-!H+OroV94pkSN%-#-=H1rrh1Z4x!sNinHMHPb$D
zK0i)&&2MF+Hn;h6hEPZWSQ+tQ#RN2YAoX6^-F^455t)Z{fUg+kkDyjCT(4XMWh4C9
z(6x0hF#fcrt`q`r!0*V?X?C)jw)ZilELm7oLut^Z8J6G@;_OXrOktnUxZXoLU5m>r
zC(zm0STNt5h3tW&<(%DaO3}O%`9*}z;n&7aDF!UrRHTE20wajOi(jz+D|nTDYQ_b?
zGzb;Zj%3y4E2}H8qD81ZZXxnRAopg-BUg%gC-PFz2C#c{md}DBuxp{hBJki*`}#SD
z?xEx#nDZQZsY|&%!Jg}vF<}w~PMa*p=-Q_`7})CoG*R#J(io6mSxMaKTG-Ia7v@E9
z{78~IJ*E%T@ZQGl9>SG17KiS=-Mw70CcITJ{;!Ja{>Ty@bFqk@$f-1>26Jlr0%JuB
zmFNJ$6WnfNiQ%LU?`*B(I>($hz{TnL)BucjjD4Heo}z|<XVUaWi1X(z1@Fw;!^B)d
zQLiCN!{IgozdM9Az9U;O6xhijfgKC;>}gfy<rp~)mf*IZ(0MjWYHfRbke}R!Td+ch
zd;1Za0jSN}EI@h{HxWW`tZz73QNFvQ2<-W5q66=VPlG5U*<U`_lBeW+#5p(We1EVU
zKgp8ZOdlA0?L*2g6yMmxO)h`77>%9ZX$hNCW>Ut-iJOhiui~~HuBa3S2)KP#m|Ldn
z{d@YU2mU-KZt9g^yobHxUK##sJqatLt+mX3z-56H>}v_Uf7ifFMETg*WPbv9$7-(_
z$H2ptD4eu;&_)Fl?DVjuRK2*gdt86^n6hm6ZGj2uBZ~M!;+1LoTT}w=EJL8$`Tzll
z;U}mVP2qR#Jj<m950>ITYlN|mohB<g=$WryIpWE`>YJ;BzWC+~tl;@^%lGekLrNE1
zSHXZWe>38z17%ys(~`6a7KQ^L9-+CG?l;3nGLh-ABxE0Ji5}!}sy6HdzQz~d)SuxQ
zI04^HH9o)B=Hm*d`jS0fN!NBFL{*Zo!|5jF*SDbcFC*jix4U4d#r_9zh14>b#_J`w
z>hpo@vw5ieQwsD%zk?C^0<0|@)mn20%W{crmai+NV~u&gJe^jJ0yN$%8SJ42`xZD<
zG_N?3LzW$>(%NE#U&GRUFHI-qo!H}*$V8QJi&{6$Pp@uW;GnUHrgH9?E-Uu)aFjY4
zv(|2(EVc;znJVA7&1+oX1vA|dvUWZw{js?8WR~TxCX^EXzjTdGedbKW?W5MiDwtVc
zL$%-tU{LQi`u$T@>j)SK;}?dqLdq^|A93SKUBr)?s4O1#<Q$%GA5cxcAWq>22nU_U
zgkwjJ9H%&?h1S_#x7D`Jr?7?R4Spxku$(0~lTar&lOf@89^-8F72Pf9(O3&C%74F6
zF6E;fDFivP9I5=X>FOpi#}IvdT4N!i5&aWT{Ch@&9#%)Qd=J=7CCse+#QmgvdyFm+
zm%}Y=FD)L~2OUg_>1dt?94Lz{PNngzCQj=fy=pH|!5_cR6@{MUTV=G|K^Nr}YWU!l
zXRk6SE!L(=h}zRgCqKDH+JDcHQhg81TT{hCFy%n^R`LB~TK4JKsz$lfij+7QFW@_&
zlyiwd7OXfG(s3-BTG<KF@6l-4TXS$*_4fdwUC*`M*NNd!-Y9??&e2DY)%zXA4kiE8
zWK>;D)pJ-F!~FdGg$RO_e%&I~TN+?J#kqjNS-D#4xHY-E>W3`vVg9q8hRbfJ|3xGQ
ztNI7>BzC%4&Nh>(-Lw!|px0rIJ2*Kr=j}PJ=kTfL0zEs^(Lbm+<J+Hnf69K!$2USO
zaY>Q?!?oOgW*eXyn9Oxm_eds<`ATo@TUPz_JAO5?EYE$&%Of`?;lXbgavC`C$?}_W
z|9N<t+>9etipbyletlAL@d%~jGoQ~P0Y9z>r`tZv#e=UlO#W^Ka7Q7U_|xMicBYk_
zXUlPK=??IrcOOX|A+ZYZv*U`}?P)RV{fd!#9_9^hdPhZyUN~9qgEdcsBl4~x?wWEh
z;jAH&nP-v6ec1B-clEi$89w9IGyTWtr}t)*c5NG$rH&da&6-PJ4v9}~3)a$U8zR0)
z8P4a=;1H<g&w}Fs{^$>GTTdBZTHm2Qse})?)}D2XPI`1rAUGK;zy5WOmAaBsa;4$x
z?k~oqZ-gyGtI;7Bp5D?*kw)d9i}ycn?jp)gU}^C`(9jAIsAbRRMUx?z+~nb>=67@D
zcAtf8WEbVp^5_Bdtvlt)KMCLK_Gm7;I_gAJ#f$S#M+3)G)IYf1P#LZ+^4+~R&yScb
zgB~$w{Yl(r+#jP>6@TN4Zv@qffVi~60~1&Ph!M}I;14idCvA-io_TJ&iN}$APO3;B
zj!PfR=ko>5JJh&Uo;_CJVP7|>WU8yU@Fz$jaPE3a_a>8U>zD=;sE?wvMSBG=-jHZ-
zk#m>b0Ipf_rmCA=y926Ynt6^#jJGy43!X%%L3tDSsJG}9W8V9kU@{W8gO1aB%BjGs
zzN0#g*ppbDvytQv8Rh$z^@Jr^H!OQelp-dMSB*Bw(v!%=$JpppQTtoVy&^Ej!aU42
zXI?_n+4fNu3mOvj5KdF|E2nrcE04$7eSr0@6pGzwD?-Da#q5a^Btb;^987eXS9Jx&
zF18gx?UN=Qec5}KEIt>T>%4PWLrN<O(LZ)I3So_&T`Y`f6GEhxGx|ePl%4Oq!|uv5
zyW5IQy_hy1YItKtGRH?Dux*l=uDLd549d>+%muHH&M!Bz_P@IJx<lQrWpSrE2ym3+
zV0P!9X^gd2Z_RW%F`y@Z?pQ!<33;qRjwD@k{fZBBz85mnlWP_#m4}27g5yKUzC8~+
z7c#5LD!X?NMZ3Edy1E;mEO)3Ys)V=Fd@k_mKb>tIQu11oW)%9TbSxr<^ZXnBF-I5M
z8w#=VK3lu6;-P-ADLH{Uiv?ge{L=X1Lyq2AriV}|JV6nL%4(1=N$3+OsTQ(061lD$
zBtA7lk6lUJ^n^G+`MDO8L_^J?_K(k`Khj8fdTZB&Rb%KOkef1HqoyB*$x@K;z2<Q<
z`*{%q`D~~3muqpWeaxym6jFZRsv|6{Y<WkBdTc>^B~*lzaRz#z_Ucsixd`N%#N7Mz
zaNYe(xt<)t;XB%yo4Hnm4s9O4n<^up`0svsnVDXabRadgC~Tb{FTCz)VLzX5tsYUZ
zCGR3S1<lyIvV-+-?y*hxZI_XzZJPnl3(gQ+xZKTmRY`dR8$@^7{FmYfy5^tXA4VZu
zDLJ1@V>%x1f$>L4nz~>3M29*n20x-xZi-}=*kpOYf%!>UH%y$)amX*kTXdilbz)U1
zHb)YV8QWRThJ+WSx-HmY=MqQGMj>WI#zV<;pY69>DH<5}6lErUH!u1z>@&9Mh&F*8
zVz9!@y9EWQz+i)-Z?&B61>ew~)<yakZPDf5*$UYYf$7oIyX72F2vX;XZqz{zWc5`Q
zUiWQ>`tQ8C9c8LLi=K#PYd+0O@XJE4!R5Pi%pC7HGLOY9$OrZ*MT{+E@}<1ET%rE$
z)ru8&FU_Pwa&r(O>Pg=>t@{lnur-#9mj7`HR=N_K9~mr;KBXrMk>8HsIk=bq+D1Td
zuyUB5oCswUu`$hJr0Gud3rcR)>)GK8Fu^kI+nZS0hwX9Vtf`W!ubhOWOB_CaP>|EW
zbGn==ue|Ikdu$A?8<N{JUSP@o=xegi^VSzn&ed=;v-KR%!YvQM+O9t21;rcGi9Ak*
zK#%^`KaIXA<W~m=iT;L<sN7Z+0C@1{ZL)8^YUI{JyLrR%3bqIYbrc^kr@k9r1rL`}
zxA+%+<ig?PpQL(+=!gr2zW8-xzzavbHY9i3cBWwM9%)QKmCXEyXb4XdyfR}Pg(xaF
z*vp;fBzQ=qWiq_`ME>~KipJ`vmqj5){qxBxff<@E7w2s+%p7Q0MF9w@*xzKqEn<#D
zw8PQ^j`5+<vmFkG4=*3??_GV9>(^v6&mRkzc;Ee^B)NyUz07v~AE=~%ubJ``8fKM(
zM-T4v3uE7b(w@7%Ge*6d2lOK)d5(Iy-Bf-j)JTk+VDA>NVxCp$*w8j4{9zz_q6*3!
zIecB>PqY+#d$NEV4HtDS$V!WE&t2SPyj15%LyG_U9yBi-vwD@^y&t{&H57%QKCfXb
z4>f#r;j#Bzh)FM4A*UxJ1?~{}p0DUBJ>R5V4*AQp1pOSAr_>j311tJ2Xv-yMF?wd-
zfB~G1cS5OsiLAPKQaXoGc+!)dNEQ7pCx#BcU%-8+2K;qeHkRUBvu4$t>!RD6Qh|4|
zXLUH&8#{jca0Gs-q&>#SFMz?ify2@#n;b8wMh{~%rx*8}=?CelYMO}Dx7=%EPdLE`
zJj9EGmEf<_AYW{xg(Qjn<Gs=~$8O9nU1+kMqzq&6o0h1m6h9J`3A}H%w36HCYVeFg
z1`voat5cX0i%+n;JD>05W%|a?<7N~hZJS=yEshGTeKDu57pBsary}#(K7FK#xH*e)
znYH2ny)(Hl%VYS=&ZV6neTHr^&o4+SSk0&4r1fd9Scfg{euqD4p+P-GIlK-si<e)i
zyf>f!tJjHr=q+eUcZ6(}u;=#NdqSdDfyKmKh3`GBar(#LS5{Bf5)n85Nh$uEv1ZU;
z%e|rkT5f<pG$(5rZ`oh=QF`iL55DkIhx$z0O9!_9B=vI?LZdxxltXl#c<jY};Q0*v
z@9Y@U)j*?1G7*obYF0)ypBy}bCQG}FR+svk)Oh5b^nXglq{`U?qcC}Jli)Ust2ovn
zZLtISL)*#pYRi|8{BJ&BTeqUn)cpMhW_ycyv>SgZ>|V5nN#KFUVvgI;7SE5w?|cm8
z&yfPNF9S~OLRRACP;cpZ^uU77lLu_&=b1}`T9C{*Z^Gd1mOn{+&uF;~NKjh4!7j?P
zuGABVG!2URt4F|vJppKC@v2-L6S5rDdHa{Di&Dlj#hTc!(czjyl5h!W{rT%<{hp~q
zk0%24hw;&SeJCR2B)6!|Ri5d@X)4CtNL!3dHIF>8=%8u*DQLU%ClUMN1L^|E0-eb6
z)tWnwHBR5*KA8UJigwoua35f)QG&KCBdviq7q#~R0rVALC6X0Z--9xTdP0Lb86;1i
z!VTa>XK^fzqd6c;R3a+>aG|m?Jo&h6^4gAM_eug^*QwO573@RjU3gH*v30zmf;<%>
zCHic~DC^ffgFA;17}{>wzH?MN!dz?ik}B8)VGUiAL$+WFUg@U`oM)uPvWuTs6l*%2
zt^;p8^}~rYAl`GGwUV$z+nRspaR_`ScE$e6VN=H^+?e8AjsZfE-u95aPU?C0I`iU_
zK-LUipGQ3>Z*3D)z3ySoeEE7DHdiBQJudM#8qx0eqpa)w6~1oth{N~Qh=#}yery{v
zj7N#7xnBBfJMQ_7$=OK(ohIbQM7wVp3~*QHhEC1bxW!o#C}6$rZJgaPhP#1hK>qMC
z=jp0B#~Aa;F_w$N=Zc`<e$5=`w~+b|arbemFRV${WI+&n*bH=bo~RC+Dbovoq>kbu
zs(Q`v=YYE@5XCJ$J;XwTJKSe^HBWUfTeH|e8TO$WiS<`mHyQ4EQ%mF)X-Wg+FM5Qd
zx3>Py%P~b^v_}=sWKWHh3Wm*o`4|4Po8P3RIT!o1mmd(Rc=>{dl<xylzbKB>>SLVU
zP7^k`EO1ILG-c24nzd|fXCzW3>kk(clesw@II9?j-HyH<q>coNZ0JIq!E4<ILnm#J
zIRGUH7+xhqe3|Fx_N{>fMvLc{mUf=@BA5*`II0x;#D6nVfK1>5$VoQ35^OlQU2hH(
z*yH>%`)VKsa|<3KN$bh_5b^P~Y*Q0cu<DmOK^dSU0y~#bD!Vq_H<v{!Vihn9S1#~H
zPiSb<s2#`t`t!Te?C9nfvCmzaHGyVbW7c#cL+Y8n9mapv4oD5%xF}PKJF$=bU0EiN
zPQVo1kWT;BW;u1h7O%MnjbJVwG~|-5yjyq)9f_ATMx;+~j9p2&Mdz{7rv~eI55PTU
z+AdGGmws490XXb0c_Ix`FOLK@+o`3fa}{_@<7*jz@-^GQPiJPqGiI&e840QqPqMWf
z4lCZQp_pX?YK(eMqS?I8l2m1Gi_cRcK|L`mqd{x8m_|FwQu9UAR3Kz}_uj-x$xI5s
zK8^s=dV9}5vAQ_8(RTY&Bz9_CE~W53wjOjxoI74^`bf^LdnuL^_0QocdzTOpc`?ot
znUcO`jQ7yNPp6Ta!aK8+ylf8->6Kca$!bEq0lJ#qGYX=PpRw5BD2cea7rE-g;Z64k
z6YNx?H<}(=jGzYcNTG>#EX?lL6Ck(pNXz2cdhA-uk?jldhcA`tEIqx?%3S)nU)fuu
z_&2Qq@%ghv^_q+kP+rs0GnHxt(7NWVrJop|;rBil<tiPE(^Z!4;)c!(VU*BKBPW1c
zymW=sYz^ytwK7nMJ>s$VEYRTmM^DgiX}S=s@THD&nB0YcE2}i|#Qd-*ooF?lgyKf1
zQph$PE41nuHK;*1`++iK@460<HW+1W<1>fLJ(f-^Naz$714+bYK_Jqo-P9aGC``)4
zES=bY#eG<ts|in>7UEnJD*?PT;CauEJtG~EOIq2BuRs5R4d<g!B!xNs_-50oDBr5C
zfvY0O!X#g<PaJ7p`D934(1cG9)6}Z*!qeQgG8Yarac86<)T?FR)i3)5_Hz5Go7vHP
z<p<m3<Gh3_d9-V0<r<{~x8IufQIys{L+^T>Rr9^m5K9l1T`3*dTDP)6*+IP)QEe};
zR|I9j*V1}EUw$G$^(A44=40D(O*p;niz?01A^03@6?d>nXe$hzFK5<>Vb7G#uK(G>
zGVDQb8rUQ4IV<6D-o}we;8q-kD+K~FW~p%5UEAZl6h|=ACY^lM*PAy$Co^$@L2a=n
z$XLQgcRt?)X-NrqbwW?uJ|6lf64@gfv-i53&1~$`GD|=q`gXym-08UA^<OFQD_4HI
z6NlE%tB#)+G5%~1_BrN{yPA>pw|VM^NopF8C$RoHrU#U&Dr@z3XUKL!F5d9!8<U2x
zo153JTd$_Y>c5FIJh6ZBwAwm!$lc@Zl-4d7z~4>70z*CUZpm8;#)^5_TSKAIL+{5J
ze3*hmBu<fF%*J1+HOiOvv(cT+M#<|9lIb?rHs2g`$#l*=x0zSZtzg4kqO%IdHdf24
zIDo0#Y@y+wmk|u9fw(EHi3IEuIp!L0wad^K@mcrj2Us+!&;3|B4rT>AHpuifPik{U
z6aa{-kMIu!+o|WbOG^WWk7?&^c`KdwsX#-{6P*da4H~T9kRvWbmMXptZ?BSD3@1IL
zfW4UPswOCdORo5rR^bibrxA4l6IX_L4UR23S?Zp#%+xtj$;aOza80QBKr1ADb1V2E
zB!-%D$|Jd-`#I3aT+%@Goeu`x!oztMz((*b+EWC6B^(}V5UyBVjS^ta<J~>P`DF2V
zMo`E|EHshbSI_j1pq)Ysqt;pXLcgw8P$j9@#tLtOY%FHx-`?1O@@p*fY~hs?-$QX<
zK=*<w6;3+juz2k{6I=HZz1tNkmZc)~u0=pb*wF!sGRh-;999P||B7TMP4feWo;xAn
zzBJ*NOIpfm6IW20=cTl(sW{X)dKoSv1Pnia|E16#Uq+^@F`*%y@&4ec`}I9mz33Vf
zW$4Y<DzsNY4a+;E6M4>u;xltE%<WL8xQto4YwBDu^ZPVL?YZBSa@<Vw+Q!|Uh_^ic
zbDZ{}*bi~~)0>P}B+r#0g?|D6q1AgV34ZySUuI%A>2F75C304N(R|>LvmhclHqKfa
zRZb@&BDx*az6kR)ONp%uJ+iwf`1N7yN=?g+wZ*mg9f?4G^&PV3t+_syp0&6FFhGnX
zt}=IY^VRn(O!v1cUVWPRNm|UJF+Z4?!jF@}QLzu|XcrH+Xn8pS`e|JQV_z@eVsKAU
zr1!Aby5Q^lUeNdPG^ckR<ET+}yR4-7@Kyw!_<5lpk1p|^l4MDUcM_nRO-NU&_~#+@
z?G+tYm<)Al!Wjl$hB_PqK9N6IfB#`vy>tINHn-~@3P``c{{7h)!zdLsl-2p**E!E0
zHK*qilwUluJp&vmf2pG-&7=&7^S)K|eLfNa*?pM<#&ALzf7$mf*$`~ze26-R@=~}y
zfP=yxz}W%`i)&}`()~rxm?Un7<g7VBPOtEG{i33HQimA{q>)h`EdKN5Hm+q)2NCgX
zI+x?E$b46Z&pmI7TQh^(M!9t+7z!qXcfau7ht6?^zyO+Z<1y+u>8*mnO@WWWSSECL
zKlJj%0aOnv;zW#chK3*UABN9-lIpNuejZzwhXgyW3I}72k9LKBwABCWCj2ukVr=ux
zZ8dbcTs%=MWR)DNadwh3i{=zzSDe4LI2cpTJrpG@|L2Id{9Zup?FHs4eiF~E{yQpP
zKfePUWBR`SId>LEKO3x>`TQJuw_Y;K?rZ~xMW?j2-Dox$HrMuyDYl#m#0~Vs=b?|_
zI$f^s3astM&odO$A1A(pBH)$gLdoQMgiG9F=wbZ-L=ss*JrV6pE*XH68|+$cpCHyu
zabT;JgTSw-@VayC=d!g($MX&HKxT>@N&Gt@&zJcgQuSkY?6<trIT5)j0j1We@&5v#
zwv^I3Uz2f#fQkO8?e`^1F~?baA7z*vQY^W?p0t@77^&10^GdI;_Jtca>svjlJyqsT
z2+2|{GCC{(W45#HLnTpD_TRO|u0h1pSmO&P8I($%`L!AC%wiY~@Bq7}{@&+9INYY+
z@U~^~rtzeVghjBfj=#Z*`W%3ZN0B;_45nY@nNx*M&hgr=7<?<Wq~%<<de<M9?rD0Y
z^k&(RcX9>64~NXX$<ip=QhB0pon^XZm9~NS1qi38_qf}<Uc&r)Oxjynbh%VVqF*9d
zs-4ZWmZ4Hq8qz?py+N?flY&kXs(<74$S4Es#a>q2cT7v}^Odj0w;wlh90ti;{}RD9
zPETIddScIyG{CWQAApHjsVMt8*ju<uS7()_2S~j4p)0$HSAqG?AhVVwqo<WBjl<Z-
zs>*mq>`AVOtFeByXYc~?;Y_#k@2D24RP&NfXsHtGAV3U@eOBM2kPZXZmGJE_qmnf`
zw#0EO+waQ~eO5W$G*1d{)XX~d*%hUU2~g+8QB_Fu51%OeTDi-89MYakAvgtEsv}u9
zSm$h$`G)?ci_E{1bydAu#By}}EP^H;HD0-<+0C);-pyE3kyNfJ88uBFjNwBX<b1xu
zM7%i22K3wIc)H@Dv;E_}6st&*8BPqg@S8X%!ujraLUp3D(j4R9Gl;mdVHW4CX`*yh
z(p!=rZgmtMrR%V5Ph+US9GWzO5gJW;K6T?!Wz>fKS6IIhOq1@AZwwRw8VGpsAGT#=
zUjAxXYeetm1wiq;i~&OO^a+!{LIu>%H_rlmhDxXn;8O&CiCv7UTjyIdG`G%ell6+B
z|AljE@$A^7$1=Xuq~`yg;L#FWQeZTOX1=9s80RLOtj=#p;M-LfcgDZbL{kT@J9B$#
zhR%~P3-RongQ_5kXziRjLE9}=YZ|d?1|q4z>a3d;U9h%x_O!+xLKUcd1PHP>z3@Fd
zolV&Pk;%aCFHquj&7$FAoDHg)u6Ow4!*TYjz7md)04h9S<HWn(>G1ujq~lc4lvaZ;
zehZh6`~KYsG*;PP25_#ZI!ANkVwZvLn#>UU<;E=1k4*;h4h}C|+@by*HtuedwcyVe
zpm5b0Oi#d%zWSc{1_My!?4tltzzu!#;T_iCQ!2rhHe!$3{Ky9(SlzuaE&_Ieo?Nz8
zGk7L{NJhGE-B3bv8G|B~Bj2LN?vW4;BY{-41HZvIFU{%=RZBu_u`E?^<*_WilECDz
zNhXlZe_qHXj<iA+4~TZ0aXk#~H=>>QT4L&?JZXWNi!X=(EM7~4q_^lI^}_fHFWe=Z
zuyEp<SHASk#++q;B`*U7e9KZMzBt#gIzfDj)iU@_cIQXjAa01+D-uKXA&(NT&be1q
z9AdtvHutcINoy74+4yh|EAV~%1+EE1WbC@9Z4|Q2bL%dn+=Y`{5=RsokSELS>%=;0
zh3+)kF#t+LoTz17)PJ;?K<ZT`sQefwsF2%naeKr<dDK0OQ$y`sc}SaXV_P#;p7;a3
zyQ;99{nF{cXGxwYk8GwrHO^rSW3u_kV&KHwfuQ$FZ_b3wyLkPd6_iHlp%167UIr}&
zw>fU_4aVh_X~AO5BIj7}#omTRr->Xu6s2E1PTBTl-Qfdh{K`G(z^|S?65x;q19<Q=
z$X<z7IyupLLkuaS4dWzG8>X2`yWI&OY5y@2pFguZf||`xJIOVkg#Qh*g%XsJ_i{-k
z?yJG*=N@R6Cxz9sBJ-RR1|D>9y^>>HiE$eiA7~2ejI%A>o<?_=t`E>XB$sb}!@(|`
zYowJQ)YQ$#S6wzaC5&tJULQ-$d3&~5fW9yxD6dX%i1;mmDzDBR7ExS<jS}wmI#+}6
zhh_=<VjpQs_hBya8Yk&V26vnOrz(Hiug@`ota%gM0!5LnP9u5sk|gY8@;T>iUIg_9
zOGd)Q_{@a2kwE5~dGl-$2iMDuw37@86GV4N1TAl7QQLR4dc{>QTvVwm2$PzL{1JX{
ztz9hk0?B|}L9Nh=&_f8E4J-|9PeTHJcs*=OF3^^#Y@jb;SO9Ia($9VSw64%PE|NX%
zv8St}0hg4ddzjC5m`(@H&3=yh5Dl)=*ZQfb;=zmF07Ue|?fUB_a<NiVP~U6A?4Lv+
zfP|Os_d_;@Uni#8HqsKx#_22QGd=$v$F%v^$g-r@RIpF(mFB}<pMqY)?dD)`#Oom0
z5z%i&#yO*p|KPbKZm!DXG-+uxQB-}l=diGLY}3|g?ZRmB_SOM0N%+gj=f)nJ?R=II
zKpn85YKZYoeOU==K>d9%WuTt1@3Dp9>?L=)M%ixNtOjpuR(43+yXdLapx=LsDoHcV
zGYYZQMH8Ofo%D>wyqsn#<IQP>HJbQ#N$z~YWrkOYeCV|GHL<xT9dXDA+NqnE)1F&D
zyXaq+;{L@;-#)s=TW*llqD`CCQ#1g=!L9e`loA>=4Mz^&?X0_ok;p>h<^}d*4(zj<
zmeOe=<=t!dnNuaKkqM}fJddIBhf?MUXz+O(=j1BRz+@knn~Ql#0s=WCUJ}(a1~Nr%
zq;T+smsPVvqaH-JJl^o&8Qg;UEvf)gNyE|u#5@u8V3WgF6>axATw@ixtN_4P9bbX;
ztTTbqA-ted8+9oue+AZHmTQcPrfjvUCwgh~1hO=L?sqy(^p@nOy3FTQe-!>9`_I*+
z>iWw1vJ8`ZCRxHAG+33YKN~3j6jYgYiK$BX)oP#=q+<(#Z!A{k8*1{2;&O0ygb3qw
zD6#<RaAj3mOz&X~0tHy6nHYhHUBolS_=MQ&&BM4+Sk-yFiCC5)n@@GPQ=hX*tb59&
zC)vBm?Q2%f8iOO9wU**(H8N7P@}WsD?;q2tpCMCNJx=-5E1RMb3pk;K`(JtU1&<WP
zYGOl~Wh!!ifBQ_td{{9pYGtZM7wP>cMpkmd#RW8mD))etD&DIwwmp%Jt7wK@s~Vak
zL1BA8*3$AIOz|LIX>5lgxztr<cCK7paVwjw)UVEKnehVyFS*NttVB-V9p*Qv%pXGs
zaNPy>pkfcnEsr}nd!n-8cylp@J}mrJN4IxRs`UQK*}3qNaLW!ljS*|wh6{TSZXO3%
zwqO?O1^}h8TodOWWdqEWd69aLc6u?NyIX2?l=(fQ?Ee(`kNJ4ttB>D25&Sun(r|Le
zF06*;321%pwdDVxTm#}`i@!s~<G0k8vn`Qr=5l%2dr2dslt*+4lY=YzaGH{EAr8Hq
zo^vok%<~9b9*+42ScItWAaM#5VvE$_en7N|(wav-UN~hRbpeAvE_`+ra&&fp^?Vh#
zFRMj*^;wWy1gHDKan&7co-fUl&aFdTH%YER8QY96i{YFuYEgHoDOSXyojgC7_AIOY
z4M0G|+KFYO7o3eSyux%!VK45bt065So8Fc&w=1BixZy0NVWP|_IuvC*X$u3A<Ai>m
zAw8MEo2Xp|f2uMfkz*z(Xcb1an$))6%pUPHx+*wlZALekdBGdk(%4;VQnZ=IHIyR!
z(yF8Jr`TLo+Oll%(#Zfz{cnNH>($M#;tCQUM(~hZF8+QidP9y~siZ9K+m}gPfM`YA
zx!}^`#{Zn}ZuW2fV8uCQU{19*U!QV@+!7yoBW+q6&IHf)AIyK2P@7(AHHN*gIotJ>
zkX@hYGVeJz`sm$dBi(;N&6zTESHlgP_pxh{RLQ3oWyBX&prGdnJFnSypCw4e%aBrU
zd9_V3!*i7io{$?ZUnS^df9M!>yQSFA89B=?lW{#p4r!7{LIE(;6xcIEx<VjkHY2+Y
ze>waEQH$gU^7X_60fYcrD`}ZU52R=D%isHlBUtmpq}&9cNO9CHrwY~RqeGqDRgF1F
zNz3I5Pgt@nW2fe#5`&WPt+o+VL6_|arxKH@O|Tf6<IBeZ`Epo$W**8ANk;FI=ed8T
zcLRXa#3{W*ZsBYrQVykvw7aIJS-KpnY1qcM!G;b+Emlw*Q3W#)m<;p5On0ystc6DI
z6<tdzsvJ>he7f1P&2;RXzcR@8;Z<ALDeu3fYj*`Po~USBx@E|xo>>^Z)j#C_yo5q#
zPnI(t`XNshIhIH2WFh%e%<mQ}g7ZH?d2!cQ_fUs0r}BU{pM`;HwHDqd^`YYNidT9@
zUYAV8X@v5`g*ECBE{;SVORT%kT;N;}%Q6c&ywcKd+q<hP;{k#bCh=vIvW#Bs{udY%
zRKz80{TdEMHF&FNnn{hWEN^Z?9BFbp&uHz4gOK0?`CgK#_TSitQVXD(_lgqb9(0^#
zz!)+EnW53>Nb5<4Xb^W!d!0Nah#WGO8)N=88TU@@q23+qZ{O^+Grl@~Q^oztx+0{v
z#iw~Bo4f!sdwREOi%}0krnqcaka|7Gb${}2__P1{j4ou>Xfs!kft(1*r?D{H%sph_
zA_pEl^C@vAivW}pfZ5I@RGjwc0zB?>wFf`g6x=8!JZb&ufPja;&00zB8MW2MjY=^>
zyaOwK$F$Td&=_|y@;vy?ddL^b+vlYF@5qaT2hq#J7xpe>q^l+1F|eqiO?v13(6SCL
zxY1lT_Js~8J{t0!L`vpVc1*y)hvN%b7B@6KoTFg;K-bXISxBPc-joK6`Nh4sS?5N2
z@uHbk#_ssaXD2=7&)74^X@UiH+HN5opqd?;&|ta^{rCvgW~v4b!sVY$50C}5nmCQI
zWGFS|HoP10=m+)cA=?4}V8ZdFa;(c?=0J@Df>x#>mhOtLgbXEYw9yr;ovnUe8Fv{N
z{=!KB=n>(wH@ic%wVNVmWY-+buO)1SEXTXvmua<pe{KEqNT%$XwO*<2*g|@qQJ2Q)
zXa|iv56D6UKSJfQxF5KAx{4Nt;HIhH4GZhF9<Sb9GVr$jAz5nTMaZAFLXmtR9uO1d
z@EQsl)ivOZ>x1k(F!JWR`?nU(Fv`Hb4nPRBhjR|XKDQ<(X{9?PR$ax|x;W~`?N@G~
z1o;fAo_#3Cea8jQ&7}QY@X9yAaiAW}cV-3p%-p@R5l|h%Y?#ke#n{ch9zqY8c5Qos
zRcCrP3LvG?m3qFr(shG!LmJ+kwX!ZUjiUHx8%qJd6?)>`=D`C|y2?pzB_Pv<Mz;;O
z?#17`?sH<eC121$G&fV<ASb^Ar*ovQaCAf=aHH6dQd9Q^<cSR@f8|Y7$Yy&zp(RD(
z^5H?@6O)<QH|||T(R5Lx$6??-`iL5jEE{ObeD7v=s57z2{ItV~;~t|({5T!lI*tlf
zSa4S>fgkq=r+|aNm;qziZK#NIlqo;eNnCjeHnF^1+v<$ruUa{@`%_u(E|#6RCxHyU
z{2Pl|D}hvj9q~s;bcQ#wTqOO@qc5S=N%njhA@BbARI@WacxN$-Pwy<!)<bgjwu;mR
z99NW0C`_E(c+z@wBwlVbDXAa?cRwK<hJ<V!e-~Xh>~LZRL}xeGQa(uP`xU&hMr&QV
zj1De8g%?=aQ_XY^?Had_TE##Z91kHjwSeSM0?v_Yuy&>;n%#bL=yMR8T_fG3bYqI|
z>Ms^T_MR+(KY3YrtBsS1%A$w<tgw90;pL>^^lIZ%YKyQ(Hp|&M82>+b_+iRvXS{22
zH_Mddv$e~BH>AwEgLg3u#oiT4n>Er{!IXhsqamzt#~n|GXa6FPoQJ!^)mOuI<z6k_
z`X8Bq<Gy90zP9$C&hsT+9D~&gOL=_;TjTQ5M54!3=-jg`5(Jz+H6DD*;f>P({`HZ^
z#u9@FJb|`l{lD2izs(Pky=|~n5*%U(yer8~U|V@ScOM*X!AQmUIKNG}u7vAH0_g;F
z|2%&|uvpkew%d=}uA2e1Q=S5`z-8XsJYU;$5O1jZgbm<?Ld6VUNB=nt%g=>yhf2z1
z5TO=)mR9uSmqVWf&j2efC70wgGNog^wBp@vvVO)_eZxY2r1X_sob=SlG$+vTFUkO4
zhTWbmkMuLYBlLy}gM8ZX`o$Q!qkQaz+NP0}Yc2j#jq97*+@9C+#L5Jl%+c(ins!(k
zG6}OQnks~Co0bNrFM!u6Ml@)4*ZM$+oN6cfbMK#xMI^F^_jyqJvTR0~#nfxM%BU7j
zb&*c_V?h%a{V2`vdKJKrqh4b|LvIRD7C3uckVA$b_mRqGJBPd$5(Yy3vV?30+l3Vi
z3HNC!0;;M6)0OfDqc!~kP5yBnZm>Fg)PMEefBlB}!3ch7irEj31i9Cq3UkHzGi}&-
zN<OeCm5VQ_7BNe~&Qh^r4nx5p#=^vvb5pcK561{r2!R8SGn`JcYW7v-{5bEm6a&IZ
zUoTFCz(1-68|Ei|c6M{dP-?!YGTJ}QLFQHR>G)9zspdeAsBK2tFwagP5z#Ht7R%Wj
z@IjKE1*@oZ>!!|}D#*ENP#@%nF_)LCgs(Apwz;U)X{w|@ISc_a;#_Q-&2E_YRY~Hi
z7P}k33Lc-|ve=cL8m2qSoP9lq%B8_+|HUZRh?HZHL!~jbXm(7cuyilvn}Xi0H0;$E
zNM)!O=uFFH32mq^`=#ngkf`2z)xKg%9HV{_45Fgn-pUsgtP@p^+elir1&jWXL6@yT
z6w3D0PqA<23h{Zmf2pDzW=tTo@^Al7FH0E~wn3QbFi@9PyA$g^)^n<;&Og$6iR0M^
zs<?GWjzF$0X|N<D(db`|;IhHZD1A9O^E>T7!Pa+<RoxjbIM6_DdmO<tt#IzRQwV6r
z-?&^kZ}0Q<W_Hhp)t%;1Y@3w#;G~Dojyy3rV7V1Va)eb?oWr;P3xa-6&V$jjwhA_$
zebGv(9qfOQIk^Q(jLF>i(5de^TT83xY=8|k^7S%-ca!w2<uH5cYjSG!R<&@Q6psGk
zUPIVdbc1&L*YLqJq>j-olKx(<J+5i(FV_x?EqIf#%fmDYnxF%2WtuWOdBQRRLh5=m
z#HXPe1HvHxr!S1clM!pa688<)PMEC{@|cc9?_tV%AU5#B7@fWIFoDU;$=9znAT!h?
zYJN!TitREx$#9_!oJB{ce7HFU$)!}gx4@M`aRG8FcziO2B=rjFn1BPoc(Q|f=E3@r
zX{$+Iofthi*g4oga&Na;$j>S1q5;-QGGsZ519<Pr@y~n;CK2y=I=lvx(-rz<7M7s8
zw;9SjX>9A8qb%w5#iSGc2453RxaM4LY@H6uixThQK?L1kapCU!-7}yi>Uvn>b#?y2
zpQ_*sZ)=U6xa!B(2U`@A5Hf|A=Q}{kqjWT75Hx{PE#i%LzDc6{SW%y1OSFL6H{gOH
zB{+vp{@E<+Y4M(x<L;k3C2KqXSM&lqBS%+Xw~lE?QzBH><Ury>TXAbV3E7taMq4S#
z@!AQGt0X=7`c`&5x%pu-C{!XZFuUvO=vjkH49?w%XmeRn_u!ef%zg2HCE0HYhphIN
zVBu{OS4~%Gq=GLdK>>d82K>;>$-iNOF6Oo9%^=FN?m{%edVTuTrjOI%+IQeL?#{<^
zv$N67Fi@v|j1Y5eKXX;t_9=4d<~6~zn+wlfkp_4E5L3P%-;pDYm;Cug_uY<23>k_X
z(r6)nSO@?3Mk(uPj4ON-?Vm`ZFYgyHzqO1DS9PFqRpd<ogbdP({}hj^HHB1CcJaXf
zs14l1)jhEs=HFP2Yr6L*s9g#Es);gH=;itqxOl(#6}hR;5OCzh?mL>;BFzV!&qI=7
zW6JSI#Q`DqXOhn-T#O%HdNn*Bd|oF&O02M8e~==Xf>f9<U#W_cL~cLg@`%XexSJ*v
zP>{sxl`_h%4V=rrT_bs?_ORTNnnS;)#3?d(_GPGajr}BZKnYb2<3&9&&cW<jol6F3
zLI$0)>e`IGg;P|vw$2h(TR#stD}#^jpW<sac1v4stV18olo#XM!s83KeSx&qj$TXV
zN=bvXXn6**zL~xxV~U_y(5Ptb>lWQ^=jGjkdcujeF>u)A)%8`<m4Zk)B*+rLdqZWj
z<3g-<w0JsKr>~tFURAC3wxsD<>2RE~GMV@GF;(}sTyPY}wTaMD_@Ho?>-zpNt5Vxf
z7<i0A-xnVU4tr;K=d*^;{O;uGg#s0#8G&zq`sWUCYi#|*u8>@c%KMawjY~df4F^M{
zhc+a1fot3ZXhWL*r(L?QD;Ir)e!6~;sw$o*&c@Yk;<f^)1P#)fv|dCZC@Q=+Tg46e
zgH+JczD9k=B#0(tM%%-nQ}+W_3%`~P1+lr>r>*jjcOkPvEOxW@BU%1P22{b=^?Yz?
z-&V{#_zfux$Jq5DM5CHr2=Nlj`=AT>{P)0xw-KB-f{1o$#i<Lrb6;5w5ihTPZdKoS
z5_im~=Z}<TAu`z*RE$>4QrfV(oqmwXQL<^g;>)t{HoHu|ipdNznp5rKnMK}b%&?r`
zb-U`13}ST~9e6B@=H9sVXE07Cl_1xm=?io_4_@M5KGAMBGx++c%DreUd7|k3Or$cf
zmUCZ;l=FCE8=RT0f7;^E*5ca)LLe{jfsrvRUgEN9_<DWt(VN{f?%yM`mTI1E+|3uU
z`xLPj-)piv+uwBOk@S~GYf(k<M@qwW3Vx%H(0;h~xXOLUUS@FLR1#B{4ICS_C(|d2
zvP5bLtrDhO@4yaHlIW6;Zn#iMIFLZ<aGzpxg3jtho~%*Mo&U-z<^eg?<Lwu_^=LCp
z65f~ABRXk_E7Lyol~}qTQ|&*YNIhevckvI8rbyZwd)Z$HqQ7r{zicGnC$kX0U-2eR
zs2N;tn(n)Axt}a*b%tBLSiPhvME;&UUSwkQqa=NR)6K8jX%BdLeJuaf0$BdvT9$dY
z2SYS(H|eV;VwH)@$h;7*BBBGO-jA^9pSTd57JK*G)Op9R9wIiQ?6E=yf9L_>)7SlP
zjxE_M9?j>+i1VC=z&YpG`jyN4<<We;T>A!|dQF3I3vWvCugaU^vpV-#WU8N?d_#C&
z`bnj6BOvbSIz_9N(EFLpQ6M4huV($ZGqXJ8ZNII*X4!z$kC;uezjC}kRW0(ULujsB
z8=-hA^&FHB2;9U;ij;z@d3yZ$;?Q#WEjCw^ypT0{;8I#yfxhy}-7yMPh`^<j3=1#8
z4Ra^{aKpK696ok?dW>R>)$Kf9khIQE>3OCM5(dpu(=J$KU3>|cFa0u~qi{N|d_f%X
z>S|h=!L<l?nSU!lor{%!(PnC|)j5uPiE~4m$Mx>J*-pMFPIVQAM`<6H2T++s9>$X2
zS!IJ%=BQE9LUH`H^&3H)SZ+^aW5l0h_=va2vAsv;U*iSZIOaLsIYbvv2W~g#<TNl+
z<7-IV$6P%a@cfB)>Y??o#c}PNLu6CuEA90-iI_q1>8#;WCx8E&u9@qg1!=(;(OfjJ
zgG1oIwGUqeP+j|!r@WT)#royApqT)Uc%@CL1KL$|<ix#}!%6qy(hF3*>`r^}EX4rD
ztU=iE6<ic<oo)8K+Qr&eE^Mg}H>LTKO{0{xi*giQff`l!Yc(FI!?>h5E8~m#4&E|r
z=fE^nuVtMwH~j^;^3Xvq7raQow&PRKWM;A!Y&U&};_SJ-hJKu78esO1wrcVkLO>Sg
z0CPI;d;T-!iQxO-Fp?{XCgo1I)&)_xVzh=#5DUii&vsnpEVB|cSaF{!<y+1bRu4)K
z*BXGR_1VKPt$1eRx+&HzsY`v?Qt6~tTPyC{@*6R-)n{rAnp|pLJ+`Tby@t4Pu*tNI
zX;>pNm?)p#JIU*T`=(uB!nRuNS;^8j8et$5ju6-|hL>`*MO^ch+F%egwUOo_47~X9
zwu$l*3G32*tp#4-&l;{3vGr1L@fdSD5e?{9krlooBFx@Vvc}G)ESuW-{Xf3m1FDH{
zTO3Y6KtXyJ5T%MVkzN8Sh$6jrL=X_^BE1Z#2vLfF0!ovjNGJj6J!$}v5)nd&ASi**
zrGyspAMkhYd+&aCeOXyqvsPwyKl|*x&z^H+j||dX8j{2e&x`#?mwd8$91MjeFb}-#
zquDO4g~)r{ezea%_;NhTUUn>yD$>kZB1P^cT<g=mx2&1WOM{79Y$vSQMi@sP-&AW=
zuOxe3z(9wYSI7HG&%OV|K%?ze4YRMnASsdE_nL|TFxL`+-hkq$r!-63nz^m&+mXPN
zjNwB*<IUDn{(GHL&Ij$RUe|#f%>}_B3bIynB97iud)wa~)r}HHA>ptt&FuYLy}ck!
zc6^GPtWWP<7bodIeOf=u<ZmL!88U7yjW*NQ!-GlhX~k}(Xg?*fdR4{2t_Ze!&iG6!
za0AP#V9<VVX_?il?nSQdNhf6Q{^hYW=+rf~^~JytD)IE9F$`mNhSsnAu5Um6A?vMn
zNA6|tjkFx!l|<EO`paV`%K9ob>c-8Yx(=;(<1k3;AxH<a+mpd8OZbNQ?cRI1SgQ?g
zrJ}&#d}OZCVF;g2%9%Sq&+0rYj41AP0Lsk#CC4Mc6nQ6pn=ej3z=cOs;)z>BLyY<y
zq>j=De7p(B`ni@zxcgLUOm@0Si={_ecx99U-0LjR$@Hc%20|9uXTt8!_kpb+#FUnK
zGRMr;u;p!~FQ4tE*`_<;VM8>D)UC$4T1RvX$vac{-qarNK;vigXpQ8&fL$$H#SYbx
z7I^Kug{jqsxly^I7P#{2c$_k_l=8Q#kv<qMp|5UBXbQLG;DiK5i8kEJ`_Rr>P7CM6
z^Q1kJfS=>aTQqE+`P4^^M;nc2#!h^sBQ6=LVV-_D0}lL)o!<0`q|2kLvx^T^*VRM4
z1eCEWT6W!(x=dj@4$vGxSUnX-Wv3~`r?V{E@Op`8f8E~VYOeWfO1pl5?-rUQ;;1R`
zdTd7PPwRr#W#oR`<Ex6Z`~6)HF_>NTZ%My@)9!g<^-06{D0a9qJOTdrmN+wVHzsa3
zxfqRcVo6r}!yvH!D`JQD707*K`!R8h;jf2MtcTo3v$nl~+ly`KOBApin6atI3;TLE
z#+i-CI*|vj26;qSsaC_<&F0vtqi=H6QdCN<smv_>5l353aNdt!<YeF6Eu!7)k$oL3
z(RQx2E|VpOFf24=?{K5^w*GnA5jCwIAC3MirRFx0{o6>|j?5ETgMg%_5cYO48IaZt
z$J`d7wV%=imO8Vt2k>%lNRw;9<Q+<xc+tL2q?TF|hv<;*dnQa%7usX{s-0+Zp~Ggs
z)_4F)7xcTS-Ca@>RXmkN_rUdu@{>z1@3rN(N0#@wYrObrTraw+yhZ&+IcNa!ysPi$
zhQbUi{G#&5BjvmA)N}7#0ky9sHQ^@C6@=Fs2R!pn`sNI(zmw5wow2|RnPr<s3&L}|
z4mw!eYFimR89cN5J0BvfrC$jZGjpsY3k3%m>~Ga*t=m*Zm&Bp@G<PAsY`^*cj3$f}
zzIlgbtW8e=g?L?nxhuvCjeTjMK#X`jvXe1(`XlF>?X>2@ZP})iJ7(JB<8aM8Ndeyh
zz}%Z+D!IRw)>y6NSz*?fNq3ZAAtNS&y*}k<Wytj-n=KTOI-gR0mwif|V&`te&uWR1
zbBYhid3j*aLVUNMy1UuvowX5}d{e#2MSDLsid^P6L4?qWj!FAe=IVAC?6ing_RkL~
z%-p{<l@-MAd#Qr0!f>Ybaa`^K{?;=<SFpSNt`CKM@(y2sYs615)(J?U*+cTn@qIlh
zmmY${Rh>z^erD}1IpFF*^id>qaY<mhg&W+R*iERfTskYQS*j>PX~{C!O?&*CR{zxa
zBHaxNC(_1zd~FQ4FC-2j&8zbx+?C~es9Ec4EojpzeVQLp`mA2$55Y_Lg;oH=?GhYw
zLFJ+05%k8sK$JFoTb4jusLjdRWe|IrBUr=tR+n?+i@a1MLt-&I`5f)%($xOLJJYH!
zZ8u#TSoY7XU9QC4d#JrXr`1>F9UwL8rmRgV3ZWU~Ogz$g@wH;Rlg`mZ<6h-=k6FAF
z2gc48^7xMt+dso5r)2~H#m#ZqF%4)q>kd+jzfJIg;ms5|fxD7tZ<-*jUM*d_KzWEv
zyz=yg&4>f{NZunEQ~no4P|Laz%&zis?!C&~pKp^sP-GG_aEu2PUn=`_swE-3xI1L?
z28AM$eT|mPfgV+Bnm>jDbvvr2gz?6)KDE`Z?|omr@l}1TzYrLO*EVY@>o@UaWZlDv
z(-ydTUGuE?b~$tCIrgQbJidjh!kfzZY{tE?H$$l^TR*aho-;2j9HNUbDG`oFEz3><
zemBybqp2289oxz=#}&_`tl`_UaMHn~P>m(D5omklW;mGOEwIgbcUPdoOuzCbm~$nF
zZp$*b0JK<6(5j2m<Dmuy)rQbRBU6chHxRWK_sA6MIfW8*l(`1gIQ_8pkK~MdJapmw
zTv%<uTAR5c-1}l4a<`W%=VrB!<)7egqZQ1i&GeMkei-~$X8^b5tkn^(gC2*c)Uxgw
z{x-RAKlM<&`?}<|Z1O`tTo9B0sryr8-D*IRj#sborY~VpSm#V27%dm4CqNBoI1DHJ
zS=aB>oN}X(Wm)bt>2unOlD{cBc|ccLna3VNx3Lcis~fR2_W4jx{^ZKqbqU$kuzG3w
z2}8%O_?l5Z>53zfVb901<T;)-%8hk7HZ_uuL+1Uj!#96)|0p&{(A%9VwTw^#DFnbN
zVa5$!>qlA+=%cE>ESmC$&bq4f3N`pD3I-~rQ|)tV$z~>)Qu|xDK`IAzq~V@&D0D3x
z_VXZi0Df)WI#E2Nxh#s0b-9R@rrgF)c;T@%zn}w;Il{j$?2Mn$;!4(jqUc=9yH6re
zH(_uO>O_PXM_ilqVZu>R2!6r*cR4g#=|-vx<+QkbJ4Nyb0iRw$P-~85DNfv_Jpmb+
z>tG^`v77NUOmm5QQXRleC1EuioFcUKh6sJ`T5Ye}SYIThb00GtUB<esLE}&?mZq}B
zoFv(OOG`cPV|ZB`Mxv;86jzMu(b{)F1uaPM|42izlbp@X<HN7z1Iu2hXTk|pihfeg
zyD58*!82tq;d5{%h751K;)Hr!=Gu;^6lxiAhu2Ep#4||=1W<=dB^TtGa|(@FK-DL-
zZ<pEBKT^NZD1MXEdQW{6H|!Cms+$B_7`1i%4HKjdn-Wd1M_)vMcUCS=Xc`0GUXFfz
zi+7c#P;sS*r4V2cMiLeb#mK1B=sSh8(YoUEsxB%O{JZ>T+Ni^8r@8#2`Gv=BK-(yX
zq(%VMDcXsFnHK*jf7WGP=<Ru>{164Gltg8lNH0|VR%09|TKjbyw8`x3U+He`vo4?|
zzyPQCeB$*u<&T(Z-&M5M_{z)79T&c71k3*8hrplnaWjK1d<ZLACCcY4LHFIKFAFG}
zeG`*Mr~E#j4>3q1nmF9~Q;EJ>Sc+fZ{Q(b{Q_S3qu9hK@%#(TD?l?KrXX|^qWSm$!
zrIzB4V~i$R@+Urh&Ht+!$hI;q9z&o4Q19jAg^!gDN>V$gSw6{!3C>wkd&U=5VGQ&|
zV3_d+AD65xu8_9#Na!3f|F|j#>$DTCRx`nw5YAU4x!UEq6iAUVMvB9dr%GwmeFZr+
z7GPZ7pN~q0Zx4o<gTpLGn$_RK`aJ~>A(kd`@bUt0&hL}?!Fom8!mY#BIr%OA>=47c
zHThi8Db=zG?Y4sG$*49Ks@5QHK(;(^GV7i#)6V@^lC&<{y+$Uhyf3X!|L9IfYwf3?
zi4VGIJE((UYtBx{Lj-%maUF!VO~77@$mUp?(lN$2qR}6Del3`X^zM(CW|pFK$@e~5
zt#I2{gSVv@C?iwAvH$(6xRiv>j|yin>T9_dk&kL`RVGfJ$TE*m(g8$M)aCpy@4~rk
z{n!@1T(e|;{%(1PZ{bO#IMj_|c5F$}MRwX|hBEkdm!a(zi{FcdysZ7!8|#Et4XU&H
z)zZ2`ZKW4aP2NJ!MU_OekMA@#e>S{LT`S2o5JeS*Wa1I}!%#>s8pOh5`bR>St#nVs
zA~fyDpc5npqMiL$b^%@){N-A3e`3~5-4!T<`?`ns&FYru8Gp^k2_h+x6AYfF*MP^_
zhP>~)KGJ9NUyD|{`B2fg;(EK+sfm-#!uVGIXb%LV=t7(S7(iY6<0n@^)N1OKS%8Qy
zkV!f`87$M^%Dm?B%^sM9?x^|(!y{^E#T*%bv=3-gw!O=G91WaN_7<@};VrkWqV_g_
zom248U{Z4z5d4?Hn5@<(Te<aKetPp#@-3@=_&TZ|{pN<aj<759;&W>T$k2uJ<?V2P
zVNRpSA6?B=qBkgfR(#`=L$|fCAt?u1f*R+xr4ta22UO995V8PStq`2RSN2gh++G9j
z>i8%jKu6z}dgomB?>O!ozq*vg@U64aaK89~Wry>B9^K{EU22~ycr3Gheoo4?At;f`
zm2G~X2UVCAHf6w;rp&X$RiS{?7ii|KIKQ5ylCAXRAvczDiTg!R?cAklN~%5kl$}xa
z)8Wmi;W}_je`|qC@3djohWu|?RW_VERLO<}Q$Q|t{CI4H_RgZM4<*Ezl^IleYd%W(
zo>{=W5Un1?pAg``m1Yh<Xv_}x=A&v(`f8i<t+=!r$JAauzOJ;;5^&_8#x{AJpuQhU
zvM(aatm3S)VA)pTJ!gWZ-)OV#xDS`X)t{e5@0uHwVjzp`OFT2*Zz0IaY=-v(uK)(P
z2rcG!zn{f2qMg>I_nrCXiMf)I%iQphXCnOesUvJJLMN)?5~!~?%NDJwJNcuF#C+Dn
zHD~1a32$ZI*Nt|{b5}ChrA95&p%ti=n1U}Akv|Pzqv~)UGju1d!>)N!6bo3dUvO0Y
zfy`Ea1|Hb0(T~f{rglh0CX={Yv4EqU<}PfsQhnkMu6Wp46sY>9khr<AlQDM<OukKG
z4bG7qkk3w>vhLGIugB1Ks9utBKxF8BGlr{U<}XcIBv5(lqGf#T4e{4Cs3o+7TIzvT
znMBW@9(7%Cf0hazn#vaXdU3b-Ps1OnI+Rq3Fb$~m3)`V%96KI7>um)nfJ?vr<x;1w
zf0wi5Ej7lzxtfi9>*0-R%eXL<DO`Pnmdd3;NOXt>PVaO*LZgVhfX+h-P%|jJEBB8c
zW@qG&!ooElJl-dHJind!CYE&bQ?P;{?QqdqqS-SI(Wj4nQVt`miUu2vn|RLB@TSkp
z*1VQ=p`S5wpYoV1dTALS2~g!<8F{{uP<dU4qzguCp|d(|z|zB{V+U^TMKPM|E>)tO
z<_@<~D0OTeV43B!t-zG9L|DAu^sT6g5`!yIm-CxWDaWu!vBF!Z9(M+t(%lZzGsvnl
z3Wxb$b?V*R&61%mAE!;+sLP5Jg{rd62gxnx!o)oIO2&Dw?E!vB3ulR9{L(7z_HMsc
zE+9UFXF;*TBWXYe-_a(@w6(({ZW;C|c7)v`+)in{&c1IUcUkh9&@S%j1LC73XsiC7
z&q2~HUc(f*kNQIUt6l6`Q?DD5ug2qmVXXtoVSiK*ysfLib}5KifZX09xe3T-|L&?+
z>nDoRZNDA^+OjXAQZGM!n3%6F(AKT!?vr?**~wc*y6%Vk!|j~=<gCN0@&!rsP+!g6
zPdhi(bMftSZLUzVrpHF>A~W*&F8-ly!?wf@*STl<b(cHJ&>p_g6wVUY4w^Bd`v)f3
zZt_Q-WGg4=1t|odPd$6))<s2K{$#=YxK~l>{(FajU_0Jy>ZS@3eT95I{6Y~<J^!X>
za)f0V1n|itM=v^4@qZa+jW}#|%+>vkwt3iBz`FdaX<0C5^=R1L+T{6&i_*{uH~QL?
zCcpxeK|N1{i#e}81n*fp8E?@3ph=u-o1>s%57#pX-z9xIQvc%FF4Z)ty6!~-#X>$k
zr6o|5c?#owCmtUs^ntE+l=u`K+f=N%IeHg-?HOH?${Imr=AjLg7$IZ)_s-UPpLbxq
zE@I3fm}8mFgnXVi<I`zt6Bop>)>a+()lF>r(sT~TUN-qmVoaDeCGfVTbC*k|-?Wfv
z)Ulg|s=#1jwdz%6x75VOg<elB4@LOLm@wc`Oc=<>pd7ecKm<LwiveWuht1_I%edVb
zEL~!iO!6lAb^M{N*o5qv;0vOCUFf`A3r1MHFzwab*#oOamdT%C&yz_ou5f#8wwbOl
zd&v=g@^z{i{!=kw-UT(vt1cOe_?A;L_!ijO)tR6UVzh_*>f0X@j>tzz#m_#&Jb+7^
zSu4|va0(fufd>XzK-WR<r?k?@(Gi@bG&o4OiiX-UpX#ONG~%y+BQZf)!73w~6*`g4
zA-w3yu_87n2pZ~bvPfhnyAF#Y^$7ir{3XEx09<cK5u)cmN>_DK<R+}^-R2iZ9z{63
zny)GcIiwMt;R=UQhbQiYj|1hEs1>wzNvV921=#3J)6)mvZ~&{J=DLtr*03JiUG>v;
z*TJ{Ohp*wPqWHh>jiwqJFD=1i!Vrpfw8SgT-XBv^8Cr8F6N^UdhAvF^qBr*6#UDye
z2)Y+m`X<@boIp<cJiNHJatKHhyb3isx0v_&#>Ilq=@7h%Kg0Cx0h(%NKpcF<{5C5*
z>#`_||Gj<IQ>Mi8EP0Xi^)H6}5A{x1xC>6@olgG@W76@fQYSOEo<08uSDHER0h>7(
zE|A<L@>blZ@nckKh^bU*Is4UpRS3R(N3vt>vM<9r3HBtIu~B2qeFo<40DaqBlKL4o
z8zrvQ#_098mjJkGHqNzp%86mm(J9-}-68C(r<{ypJ<l5Zw3Cf$w;LF;fQD}V(brH(
z0QCO?{C_OGHkCPcPVa88N<+Fi<HO{9-RLU8YHe%p{#nVZOLPr+G3xj>iHX!&KLfqT
z$OX1;XF(m4VR4&N#wmzx>gjgsj%CW$o4i~E4h(Ay@I*>TwF_sWbu|gY4Cd<+X?;F&
z74*hYvrLZbS(U5#HClyYu`KYtp_>y`r;VfVC!GGw3QPwI$jlEOhH(ffD0tt}qh7k<
zd2QYzh(*TXR$y{QOw>kHHe4q$koT%5;;U|AgR*h<j;fYZrw3fW5W|G5jDGUS8J@uI
z!Fp;5s9gm&C)Ly*W{!1Le_8J)u|AS`u2s|$Vn~T$iS10I8WPCq1Wj-^wB2s{3;O+2
zO`C%^=5b%tJ6U-=z0b8GlbE_RZ{KzJ*n1rg|FDkMepVA55Jew{w;A9OwxH_sbevc<
z))(+PlA_7};q{)>Y@JX8M;RyYpS}X49W?;D86AOs`ojJ33K%S$Zayo+`B6}Y_`SFR
z4K2_RTCwKcIknzE;+>J*r$k35ijk6Lx6t?vuQ=txce-(9=B9BCKL-3)#>>c|Ss7o#
zGcvkg8>l^%hwpyk+b09av6rrM&2FqbNmA~POA?H%G+B|UV0mUH3WJO5y@h9q1-{HF
zre$=8b5<H(^ikiqr6OLg7Mp>~x}x%_@0QjC&S@%(IEnUfo(}qc4Xrkj88>6OZ|w7@
zAkh9g+lyNy1_z2Ajp;J2J8lb#=vA<Muwu)-BUS0Qerv{uxTW<dffMfJLTMp%80d3i
z={q24>iYf2ZytX)c7-eF0KeeAh!UoKOw!L95AY0hA`LR66b+PzysQ+Rc5uoj3xWmA
z<)qbIv<i6{&0UxdE{i>9UQ}FUUaTBXj*xm!JItE&6NQF3!_gVJBIKp6wBSUG-}TQ%
zbT?YE_S4P}skdo050wi>@~d52vVS8pKlM8fN5#VumL4cDq$LdKn2dcx?`~<ri2#vl
zmCi?)_NF?$p1{;BLonZZPMGryiCB)_Usvm7T3ry<`2pA@e!Xq_)G|)1nJiV@_H$Z&
zCj9egAs%T#d00daeU{OkIfAQIlNsK5%F!AA>cZTn)&9@JSZNlw0tP9tV6X+%IMLes
zeK(aFXE`Vh{{^5Ie@!Un1bep@Oe;yV?&ctrOt&sF54)g-Bq!PglI!NaJU%RA%+UK4
zKoE+qJ`!B9jfT*J#AcWu#ub%-+C|-ti@2H^TkivNGQdAZ?J3Xp3IA!<>uHeQ+KOck
z5i|*L8WR3fr6;-#g-vM82?<E|+}D~)k$kXc>=(og?AuO_eQp7q<`4Lf)S|M+Gln#>
z`7NKYnU`oW@n#+%GwiEh?k64$+s&~rD5c-@4d$$DXv3=KoVWKZ;`3nU4}E@M_kR2K
za^$3jZTxb)7XNL@gE)MM>Lqc}AvZCLC-+WGr)9Nnlz)n`9cy{d8NXY};OzbTP3nLH
zKCcqE7@l*0Hy;=dr8+yjYtIDY>GD#4iWJ@>2#I;JM;Zo}G6szhAH!Rpt0^KbCvIZM
z|0gu;n<>PL%zVf<nvaIBdtVsA{}UJrsB80nl-#rSQIQcf*<7@hd<dhhFMjMd*5LZ9
zT6)~6M^m}#edmie07fjd{+)Na35JNkdR$(sW#At$g&%G_dxqb2$Y0$>j-oWR9=-RE
z)4U!;DP7awN%?TwhRc&~X3Z=)x0}rgmOqKy_jq1upE^G)c%6UkTr86ZQ?V8Q`>n^o
zmv+Uj$Yy_!#NU>1D+7==Ke#$Dey6!$AzXjWW#*E1KN1Jzf9X62);Ra#MM+aq=33@Q
zN@)Ca;-kiZorS+dv3xPTIM-@5I=GW#X#=4Jo~Ix&QJWw_;##!Y2sV9QS+2Lf)f0#u
zjEot#i4VG<%Y@HIBx<ZKb$#Yjd+Hr{a-p-uCZUoyHEuSDYX9I~KBg^zOS*8_(zfCK
z_o>L(T>wdZxyB__oN3nJb6v2TrJ5Y%uTbfxv>I`HD1cc6NENCny65ofB9d|p4CtOZ
zWohB@tkiZnT=-O~eZ6Jep=<0qMRR)SpV%JAw$%BlPuk2>@v6#rdGZ!pg(X1N#ZQbc
z98B8AJz6x602h5MMEk1lPFA_aCP5vU^C4ycD-x$pfR%_H88)%`@e)RmQ=V(s$fUt~
zZ@$@)FoWV#cJ2XSbO(>WDsDiQ@!MYVZMSmB?*0?`mKW<*I%zu&x3qHGq(|^3%1O>$
zk4S-psH}SG@?M^2hAD;L61-I)Is}#=h%H5tBHzu=b#VF*Wn5IHw4S<biKBEQK-`Y+
z&@;G}{G<V$;_2WQAKus$wq4&t{v@bP8_j%iNppes@{8Av67M?R$WQSz)-~~A&g??9
zqVH58)bz}J&vv!mXl`BgR(WxLf}YnPq)p@4x4pq3<1mM&w2`E1gH<|tjKPX)ciU$t
zuJ^E-{VsTzrYDM#n|8F3MwbCYc9fpi*aB89ZbKr+W?G!%u5I{;C=4%a3$cdTKfg_8
zs$gBS%an0#c-Phjr)mu}ej4<kD3|gEexgbxIk+4ve=5P#AKoTR*`D-_i&4VD=I=Vs
zk&j)@qzmU#s(h?Yu-ORCx|x5eX~yqRtCVPY=W+!<xZn}AN1Y7J*Ufu)8r$GjK`T^|
zeL5m*CxrZVVw$AY&##kWmK_#d2B#2hA?OK6f2U(lTt8hw_ghqMh0*|0EBZh&U`BY_
z12u*cmP{nwk9BsS;niM`Sh03x^}neKNqRX!G<whMHljXBZd=^+?43O#%0xO0exW(s
zlIM1nL<KY%NWCjL*1fzRAi(&5yH)$wT-mp7)PCF+AA69(+QUAWBBXAJ>A8?jLWOTq
zp#zcE*wIOMI_IggdwZo8bH;1-M41=!RZCj0iIn3I&X*HDX(}A$wp$+4;>yHQJ)z5X
zwY{xHOzp4L4b6yUrpbjbnJ|@g%&ZzN`*aoDE$deg0S-sH>29+oXc0S-1)GDT^*nu$
z(Wh8{ROwH7`2bp>?Cab++xM>JGru9lJ|y*GoC|mwQ3d;2673%UrB_OjhhbC^jJy?l
z=2Q_xL}xT5{1Glmp66D%`b^Y-G1{Z#;xH2xkaM8{XA8%#$_o=S-(}7<8=f%eYH*{>
z_k9VpTbx)AC96~@u9@{Z8@>y!)HssT(YNr^Uffo1#8*QjqgpX^<Bbw2=;8DGLr$X1
zi$7LHX_w4?OF6Y&V|UKd&w@3)d(?{MF`%lYJT%{^mo0WZa^|6B{&4iRv?3qavta+r
zeOhU{J!LQRx=`d~*4G;Yi{<B9Im-aHQukqHwB5)S`zCCfTHuh#l$4kKsFRTiQzjox
z2GilU#RtJiqrL;YbX@+j%kQOK@#IcIFhP=Hl;$8#soPHln=|lQKWjNmw1VX~r}{DR
zE@3$%NMC~(=Vsb)wjEb^L?0Eyx$UKw%Yg#Yi`?v+lOC>64NL=`CIC1g0QQy~)x9lA
zd^;y9E*d-LXH((cld^7J4!+Sv>Vvi#vMm>1giiaTBGJ%n!16npcjoa<qSl`}?>}DC
zO`x82J+B1YXGUOzBLjJ$z}vC*4QsSeZ>v`Oul#bsXU#7IuKf0M5=4i6cz@2Q?v0LG
zorNgkW_otGoC}9B;7KrYygsdo#vFUz!o~^19_jF`44w}^zMy1K_qCGe0w=EW*4LMy
zgS}~{D8iFNpW)T%mb5}L9p5v@Xw(*t<!iP$N%>03XjF-;sXoQzrK`_0RM7d2AoP$F
zI7pyy&KL9G(<9tU&G|B}EHv+Hg(8OoQZcNUnwMp89Kb_o0TxW*x^a)AL|Fhj#6#G6
zV+d?ZwEG_`5YiDGzm9&>S@$8bcUEQE8LWOac_4~d+=9Pd3?H~5R6i1RQ1khtouRy&
z;gr5lHq2PwTO?)btWJo|^QsA|@HC~ijp1jVpm$Agx%rDfSag}a@1;;NXAdM%xDOi+
zB+t0reb0=4Fhtd=7t(H`{irjl4(cQNM<9Se?Pxe{KWG{kF15xvBO`$&;{@T&1^{^A
zi~;2#|C+gg^(q3Tg7#mGIlpJ8CNm`~+)nT3?d+k_{rZ98dPdN@gDj)vU^b<bR*Xuo
zziyd5wTylaCw7Z7`(yAd4Q|I)4s5--_RAg?|A*K%agz;C0$Z!Dh1aS@jrf~u_f2%6
zEaMJ(T=0l_mn4y~ocuR4V2vao;kX+_J~(EFDL~QBah4V#u4kHV3)hO^7vU%vUV4jc
zKwq0*M`dTn4yE9rfC!7uS!&O*J3tTxAizN=xp2}fO)%O8o@<-d3q)^3wZtWeF9)C8
zIp<4J`90!X#l!tOhp`Lj#kuCg#a))YC&BvOP+t0Q2CENO_*3C00FA;r#b3=72a3Kd
z6{_o1xa<d!hmU(9<w6c^cw^Ehuw@Kn?N1LhQm038*{}!hNfUoDZ*?CYQneA+E1b=C
zEhO$jMg*@6f9=gr;Q7N4gY)W{!}b}!g$4Y2ucF9I@GE2Tu_JFc=%>4W2rR-<!R2_>
zIOWxDIK9-DQ7ozh?XjcF78XgLL4S~wAzkA97|T0zZgc^4BifKT_T+PdV9NeMG5O-g
zCF|FFaVPFj(hxo_X&<Of-3Uh(cA<>XxT++U_JE;_;7d1X0Jpdi<sU_(J8$|ggA?l(
z5?KF2j0>nr8W<hTf%*q8zv<NE+YVy(^PX+e`iv3S7jxb2{KGe+W;%IzRoTtZfFkmW
zPcF=O_dP2z!4&TQAQs|tv3PYHj-$ex;9i3st#MRh#%D$wHJ`E{d1i;ZvZ%Q9b2`}d
z@(?(AseIwwoWE%ospT3Qr82iw?uDsJ?qo$*{X_plcZK97e+pmjb?drskG_GY7Y)Zg
zu>GVCP}rsP2l{+cH|<+(t39E9<rjl>(m_Lu`t;dp6DLOUGCO(*VHvk-Jwz-s2h(hq
z+=7P83j(dO$yF|je=xOby5Vhxf)6V13iAQ#6jl-iWe5QcBJ1_q*3+I;OIOv36ohHp
z@vm<-yLwZ3pFfKef2DQtNU0Z{q-5OIIj8Bg5+ASgZ3b~B-}oi*O$?FhqELw^P&nbR
z7F2t|ufDFX;ZED1w8~Z%=nuTevHnUZ!PiBoJhd>t_JoCaWt%dpn>0Ll=y7?=`vox0
zZgsg}S$i5z+rdk@1QsyIxvg4akgs(lo;heq)M{8<wOh7&esigg&o9GO{zs+=|9OSj
z)1E!^cLl#FpuTZ?1yO=$wy);J3p1$x_M&ZJ53c`G*};_L6Ew3wMwr<hAk8v5sO1jb
zkqEJXFi=nF3eD@iX0W5lf@XDnr`reUDEEc-lrocZg&v$<_s2zt@MI6=x6pSbF{R$C
zW9~8)WnwiqA7u#Ej3IIQX)N>k+Axk>Dp*#Z*&mgxrMBq0mq}|kaTOPq+~PNHGUF4V
z$fYlo-S>cT4fDncEWemEC<smEx+#~GU%3ekHKguL7{52~n#x$CSXXYdFU9~WNv4PA
za||R6!=*y#jD<oX96x1&-1ksT-U??p<oS)EqX$=CxMzG#2qCnU3%?kquQ{pDuEg(y
zo84v^HsmgFQZSr*w$mK5Neq%&=jx-3)ZMoGwQ`sLLqqgW<9WBRnO(~?YZRMPV%S<%
zP<Cz!QCM}M-~6TJudoWLC>Q{5_?&&OEDrO~X@#KXG_|%sJ9EGDDS9=}3y#yY_P@jw
zJG&w})Al+eHKg!yWe`PL*S&pJzxhhN=imygFD^ii?7yI;*iv`13^}PQB;_$ojmCB7
zscEYzmQ<^+H{zaVU>vd!8kW-Iz7$ddO~`W$>bJm7j9?zaJ^$4|J3y-;Xjmpe<5X4`
z3%mq;^%E+apO2WTzwExCp*&}S&WXu8NF7NZFXxMPksb5Ss|u*O=y|0y#8bbNwOrf7
z<7}ObG<1d?<<H(;r<`nchw;yFZ4t#Vi_Yaf>YT3n)h%>ube<lyl#fPF;U_mk1%U|l
zz_roTDz4DJJWEVYDR5Pd|D&Cr8V#XBeSM7kTN}J)Gq6m%w1nZe@=UniD+|HCF7Qwd
zpj<OcRQI*^5|Vqz-j}^MmzY}E$V<bU+8=mk?dKWi{<R9B^|KE>W?(<H(KuY-gQ6ah
z?Nhg}3#GO-lW|~wV?a|1EO+CiOwkLsQ!}1lxtt>BsAhT+Re&nC%G?NjNB8_IgBKjB
z{mN(WIGqhNF@;+Ef=nB7duc!!N`epQ<5qVsqaL7llf=;6MPcx&a}n&FMlmsPJKb(3
zw`&|C4#?C!BxmK@cSmv4O67_5QO^s~P{tuH-5mCtc<uUZ!m}BPYrh&MlP>6GrWf2{
zNZy#c=;YIj1H_++W42K@;$W7=b`1k@5mz`Nz&Z6M1{c1MbX+j)$^$N>sH)HR=WOF&
z6gWnN`Xgz2m#oLQcRaMm^#pu6(0iZ3?tw_K)L58|-$L=g^`GiqmUf?G6Yy)-M7w@Q
z&{aNkg3dfX{DF?0GDg$<h;E-0>y1%ZqL;{#rkA({sDW>#AirWa<Zc@|hd321o#_#O
zvUPDCN{SR%aD3J7to@NH4#zCc${ObUI-M!#?aru>Q|i~Y;?=iD9Zg_q?#%Tb#nLOh
zX55<L+BxWE<>dDa6lJ&AWE|2$x}J(K$2?mVWZ?|hSNocecD9NQKJ6UWdkw=(1FX3I
z;yW+~S}dSLE96y^9$nWB+GJkB`5Ba{BL5r@O)0urGtNIl5eJ^n{IhVEzQ;w{u-TR4
z9E<bmgUKANgXOb{vAke${iQ<U&F|^IGwXehV`jPVhl_7IFMu=18PdAs5dW|^x}hK}
zE?@+~67$k!dZ~-hBcAbllr^A0<^Vq>3}g_S9H-TWZ%VKT>y%k>SzRdb5?LuT@u2QA
zKn{{|e(1=S=<th_VcQ}UhD`V+w?Y2*U^I)2{|qyEZE&I$oClQFX3sbuua~$hStniy
zt`;yJbUQCFJTE7}_*GMjdD#0SZL)5Nm=hAq=A<z|((0*tLs#ZzcXBDaf16r$8U;R`
zey54z?1lSP;>LGFKP>*Fo;6u*e6@uCB|_ivcO_EpM>BJV=C)mrMQ@Bqx(s;tIrHw%
zFoH;CGATTqfosz4-rxCCu&?+orhQ`2(Jr02nc}RV$#02?0&f{waFq!^TMRyY939Bb
zNYLpChDpsm{uej_a|{TMBUg04VT7i+q2c?nc2l&od|tp9Wtq8#?d}}|lrY%>0S0D)
z8+uyRqSbFeJ1P9TBBdNGXTY9_BiJq8ylZl!{xY5NoNtcVf|)VW5kK$+v0xHLQS@L?
zJA}%3L|Qgr``s1Fu+2;r5x8>U{xMZT^nsVaCuO7AGwJlfnnZ$^3gn1aUbP<;GSnlr
zWEBSR07&S>4**83M`&}P;GjrbY8!%1(JqaU+cpk3>OT(7|CLwhI5WIfgVGRem_8=r
z(%?(`=+^jS(FQf9F5z|AhheCh8nw&Em<y*WL>G25ypHj@#)C=w5njG?)FDhGbiu_7
zSN@U43ykoXH;s3xI1?CC#KeT9=haj2ou8aJ<ET1~)2I0xddWTVJh_y1kBmENJuc3)
zs=twLTuZ?#GFY7+B~76U#VGKC86_yHA2&Bb9KmL^4HUP02bhNpbB#ZQ{JpoZJV?1h
zuEME{q<-pvVh6hB)D;27p5Rlb(kQ2L?~%DL6}-1f@1LjSH7qBd7x3FN8m2lnmTy(!
z-_!kI6OMKSZx1L96h|c`NW0o2yx$;4-n#6|2L_F-m)=jU{UfKo^}85s4~2!d6xite
zM!t3dlAc#b!EF@q&JUHs?KQi28cgWT=V%?x2Cm*438^5T@x1DI-BEZt040FRM^T{e
zI*MFk4t{iDbHLKF;;#w7yd^4BM`Ie1C(a_l_Oq16=SPyNqu^2;6rZ9k9e&8fSI-+P
zRIq$TKshuG7L7mZR}s>om4y=#)~l9(DI1I*MJedhoYyg_`<U+AMsY?gv^_RTGm{~o
za`n6_^WJ-u6C7#(_Q3bAYX1Hf{`7b_08M9VrVu${CQ3&<x)P;)2BNQQq7bA3k-)&l
zvm-+mrYy{HN|$b;5Ie#BkJP#NP4o?*eHSa+TB0!`V;U#)B>bA2SiIV(JA}uIUU9`9
z1GxaEGB@~WH-*d1GwI6MXi`Zd<=$X_#b4Hse~bMKG8wKMW1%Wk0o!nnFVjn!DJ&_$
zM)LHZ^%UG<r|2MH2R5XeayIIElo(2G+Iafv^y{ZHM?K&F`u?~CuEQPO&ZXeKV_QHz
z^Gz0|aX<duX%EOM<u;`D1c&!ej~qxjMIW^kg{wJ7wvbNtE?0%Yz}3?a6ny;$t{(9(
zc;jiTW^^mM<~~@6%Z!`dd=zmuYkq@}nBQAV=NsZQVSyBlmWIq;d}f+bXkd2@4=jFb
zW+>kN3C0QkkTU7+IRL$RWSLx-2_Yp=4T^2B_^b%QQK>_DPwHJLz75{!GR`w1U9h~0
zlD;4R?`Al$^uMa-mXu$ZL?NTs**9AheCgM^4rM^#X4$<_nzCaZN1ZAEARBbiR^*F1
zwie;SoB%mr4lLU;cg49i-Dy_##N+mtf9@>2<N9x^6bU+=(9UY#+x*~xkQUQa(;<$h
z!9Gjg3dssr1O9?2erOUToju<2-yDG#f^q+lb{V_u{0ls1=)?|(FT<K=UrPxj7otud
zj{%ose9u%sjUmS~%fEyH>j5nY6b1JsLN)hVs@A^V^v&r`R4K<kn32h?MNCULcE<0g
z(HNXy@Tvp_LkN`ib?kLkx7bLpZ=<-N(kOBAppo3B8Nv~)=xhJ!FqdW<a(JRyb~Yyo
zA_`^X<kd_myr@s<4Q}G|FQI_>^07}kGMtOB*-MVI@wE%6NH*y)Sw|6HrnM{D`xGR<
z|4n6a?2*|WDNM|SkAt%H%{}skOL>Kr?;*K5)%+*pCEfpz#nNkn5yY|3Ma^OvDY{*%
z?V(x5e}c(06Pf+BycI58$HlXMiO-#@@@Po%2&;sv&Eoc>Fcy~__<e2iBZg@^Uj9o?
z;LSfS$^6Tq013e*5Zk-elP4!k`|F2A#uQ5K>4B@GmlLQIsD>ylPH@n;QecR;lPKz-
zvS*%2cRPWvXfMJupzkTAw{II#AmvzXoI5CZpdQStn<`h8|1KY1H8bU;;W#lzAq_Qz
zGD3qWOnIIe|BFg2>ND(L*E;DowG>PMqShyWIf*?njP4Q*m#o&fHhZEt=!XB?akSGO
zS4Q~@C)L3!ytT)(QBNo$${Cx53zkn!&&1bK!HF{b6oJqVeEh~mU$Hg+X@R%M<(sOC
zXTkRjSVuUlWbuc}TFmXIQ1ocx%qT~PHT_6LE6{y$@T9R2{yWDW-#1(oxan%-a#VXX
z5kdp;q2}=V>ETLQN8v^ZoXZh6AEC2SE?5q=k$%u1v_58?9NgO{M9ZizLd&ebB%yaS
z8=VKlcy9?gV;U{WWYU~j{jwY?FppUy941|Fy9w=$RXc{4g(^5taHBpv>r4}JzmWcd
z6ttd3J^SsC!05WS^`~GB-S{ArPwI@in;{EKL}}V^Xz<1LfRN!{GqSo{#a8rf$bd>*
zL(&Bce`Vj36<SWsK@XJ-REIlh0ZT{snUD?OL99#<SbG^-IhQ8EDcV6oW+CnQcNEr=
zwD>89UD(l5|Jdt~3Wdf6$iM912ia|P>ajF(aX(Qbh|_B2f$<uPv6I}z3l{~jOv_w)
za*`_d<!+reu%)Lz!<VY$;F@AJE;KS^mEiTv50U5e()G~~Es^y{$!WmJM;6US@>Z)8
zFIB&K1?_k4dNs*}wc>-6@j;RM`>?aJxpx9_xYd2qVfL4gZjnvlw;})YS)7{fI5?;!
z0GQxyM(}Eg@SPh&4cP{>?Y;0nt0gq0Z!xE^?O5ISm4i`VN~#dja<mQ;J~5<PGf_oa
zqrJc_AdzrKd`Vea8c|;AV98hg*&)ol&CcGq#qVe5#^#_lRQEQ*!IrNoE^Pbtg7z`y
z3Ys@W#RKU7P;q<}wdLip#p--t74h6vjr<{c42q?f&0&NraWj-m*~5aK!H8vtg<}pa
zz_W;;(9i&b05bPxxyt2=y&3{LR<H!wd#|s0*}kQ$e`=uCXR8T2aE6L<Qt2_bW+LM7
zZRp`e4Al{yr~sXGnRW_RK$j7rkW{>E&e!&=>EHutPKgI%r5f324C#C9_C3tM;L2NR
z3roGqRc@>*Leg|exo_@%u6c$meV8R+0SoK!kF4D@D_ARBbW`&vx{WyepmOik+%Zq6
zM$vkj|6mT1@s0*Obq!jw{x%Ha=oMxXV0ovCWLI%}tDGQ)-4@&2?<L?Q*K?XmRxRr+
z_brG%Y!9k(JP}jFGn!%EW#y&i9&D}t_X64ocM=?ObrQ?e$1dzF484<TIzeNxTI!(k
zh5Hy|#rgES?;vxo3)3Oe5XhzJ7pJzGN({|8EpNNC{rPAZ5WE#d_(dqj4xNfH@MOEN
zk@rf%Hrs|Ye%&s}V~Z2JixoYy+)~oQLp7LX1}oSr!XE05%<?3Bjtks+LV!D$w;}d+
zSoT&4;?J8`60mflcK$)2CcF!Vf3Hm1RTZn`g+^}u(dLX+pXIe|soRUW-zh+}dp3*c
zF1gY3Rx!1ok^_+FM#_aM5$iWzm{0uHrwlt7cG*7Qq=acSJW<E+&&#fEd=L)jgItp2
zlshE8@1Cn4R#KFU#Id?wTD7O#=(BUh$Wn(Us@^Vhu%2{dCNbKMgpEJR$+en0ROPds
zRKC*z!`hx<$Q;e4<cVm(@eU9(u5a#?MYl|~p(D}=I)Hv8iF~7=BLAIIbtvvht14o^
zvSR-RM?dgmSGxc+4_HT3H&*XG2p~xfhd-cFr8p8Ss<C>wne#uD3K^=Aq^wabA-CE*
zU+R$b&!UHv>f_3%>{{v?gOZ68-!BZV(_vMq%foE8P=v7V5sy{ElFj`^lzg2Tru@*A
zo8(h6HF_axzM7DL?eCtKWwZsQA2R)>4OC6YFiRNDs-<wxV5>2Dv9DC!&b|tL*j-bm
z(zfSV@HU5sx*Yb=cz&R@q~b4OOUCK_y%cP~L;RC5I!g~`$Ot8`t-bs#H?r(7yhC<d
zD@c)cDa7MT?(L@sceVzwbRC0=mKx@yI+x8z>#d#WJz|NQMY?nWv3#X`%0Ana<gkT!
zO6fQBh|{u@evsVwJ7#-{u$7QAN#t=R#G3hhaA<kN{k*cJKWt+htH=?8si8YEdjJC2
zVSW_$pR$UwZghTI3)B>kRo-fXpls@D_SU&EO7}WQL@i6RBJ<qbYe<|=xUV7hlq9U)
ztxfx?<m`kk4EZV+#2SnBKx`n0;ApJ&LQE+cwbkyuv)~x38dyXWnHion1wslc3an#(
zg*O|o0YiA#LH=X(3R%4y4*y9A#A>*l`@^y+U!~1+2xO_ltwdBl`+Lrr7({r;+sMzC
zLtEcAlCO}wu-Ciio49fjiDj({1&87RCR-n(_u3Gx8t<&f5tfST4<ED<(u?FgEQ2hN
zh@9l_XO9tOTy*>d`%jc8i3pEtB<7NjR1nlkL|dcBH<&cv2fmv4NNJuAlMbYn%b`;3
zj3rHOYR(N$A3g9co>KiCl3Ofw_Cv11?+{B1Q43&X2X*cktmEr{w5%Jje1(L@+MIwm
zz6uX~8~BwajL(=fc!flX?bTgs$Wiln8|YB*J<mN1cV$@y`?yGHQNtW`Xn#dhLHA$C
zEVWlK3Y$ZCK_L|?t%^oXhBfY|T5_;!va^T5r&@+GZ&+$57?B6Kdtr4zW6;~kKk;+N
zqXS}E`(H;#i=id?uHG`gC8OsKlnALXo-npop5@la@B;{h=&>|H6ruL|cIclg%QV<`
z&+YH?sYJf5Eoi)}?eFuU)r3#>edM*R9PVD~W5(a#^kw`X!KTC7DQEx>yd^nQ&r5d;
zLD(v(V}O)eTUr=q5m`z{5?BeD>E9PmQPy;WzRc4MwBT0rNx3hhmU8O#ct6=Jx?@;+
z{U(Rs|HA(t*bqnM@(-;br!|E0CDn8gROzIAyMu<ZQPaa`{@Yp_GDiCc@ou+ejA(hr
z{(`a6Owa2E-EPTG4aUK3<dnUa^*j4*B!m4sYY3`i<BQmqa`4ai4Xjx2s42|x?RGXd
z=5XlBaw}H-Xofrb=tWQeHK6}ZhJ15Tqx;*)2U|ntBeODCVeEkA9S%r^j8~>f?!Ms%
zoZ36(FoYn@{kp#3ZO{?v16Y!)+F$)<Q2ZDD-mkCRYdJOC+^AAA7DT-Pl!k_FjS@z<
zH)$XlwItC&#ZX^NBxOyWW43z++iAIl7RqC4h9Lh9R>+O5m{Y?Cx3(4t{ibh1Jhw!#
zfH}4V(ei$f6XG}|62sl6lI2>)6B^+SzAd7IBpH2RItEvveRAbLCx3`Vw>|cGiK>WQ
zkX^v_0Pn3rmmcNjQ0uMA81*9aeTf1_2uf`^!w5HzNf}o+8oxX{n)>-%U2m}ZG000)
zsjWX5k6h3H`CQV!jW8%XEd7bk^(=O%@I5pPFy7KADM9d?DawUf?O(+*W51L*BZ?Gg
z4_|M68G}Mxmt$E8;K}NeL*=S8_i4bWsBk#)N7&!#ycGIh+!}WKCn49I{BA6ac^Ket
z@ioZ&Z32OK^enRyVoSeqcno_{);xAq3o{|>tnwXGS3&KWL;O2#{ui~Vr<<(=Yb^bS
z!wHC0ZOdE>N+qcG$==VBkL_atTUVCBxa=&geq&K%WXHy_^rFO=CjRQ@-%vpQd%8PI
zI?Xss|4jH;;%t7uhE$yO$|h1QPAt>M@}8};d9L?K;#y9ts!`al({sxNW6By2#Pa{I
z5$3d7lEMRS1+<^WPgqC1-D@D^VclGn=pYKuB0wss*J`52)=O&Jzb&f*k8>;;2G5Rr
z=GG{(z1jTD-FF;vLH_U1{Y!2I$HDcjdcp!W*P>1@51)Wl#?qAtA~-Dpd#~JUK9G?M
zE8HLWYVX^6+NCoNCYIEe4+)6NJ%`0!<7X^AtMK@>D$M)scAKlx-^ni{9~9Yt>K}CP
zdFn<Ho^KB)u{MRFVFBA2V_w}$A>IK$Gsd#Jmz28_V_tJwgjtH38<r;`&sxLkRqiPg
zy^!9BR_ln`e##YTr24S$2pC9>>L*aF1>(PA?e0EqEL3sU^J*g~C#ctzQ3Wv$x-w5}
z)Fr5E0N!Uz$-COQsYT211hTww!1`&|zlxSU_x}wE)9`6ARU8xbzV8=?Vq~R>n`F)K
zzyQY@@@I`Yd0N)`kN``{D0-K9;%I?|*YkwMN7}g|weiJmr8TS*vYVs99G_sr7M5n6
z3B_%NqbG=23Px^CMSH*gjj|$S>aTbDw|#&Y5}&-V0odUZACYPr(AwWekHJCRbp%8N
ztY0CyA)GDU({-Mzr%wiH%WB9Og*goXUbPm|XFdS=HLNSAjv?utOFd7?rp<-_1}YvK
z@m^_hp3r5wROiqf_O>=8uhr%0M()teqoAkPaw3~m?x`#uz}zfVsR_WP-yz5kD~d+I
z>P!4z2OukS1nL$SJ|%jr6}w>iX5%Aa16yfIsLRQ+wO2LLsNCD)?wKqK)!l*<zFxP}
zVEa?upyF~ymlTJz<UBo?Yus}0R#js8l$;USAYkgHYw9``mnW+6!POe)o(9jvu!N0@
zj@70D<F`GJExwa0>Dxq_a%9t$XXB%DfSN~>oyty*Q;CFWm(B3@CpkomqVk99_E~lj
zchV0#CH}N7(gZdaj>)z21*!Ns&LtAw6LiG0{O)eOJLT`t&@;vV`l@02c^(QbV=L3`
z>ggOrn}<@xuOEc(!rKR31WIh}sTL|?{E~fy-!<GaHj}g5zWjzc|CIh}J2mli%=e`a
z4t0+vpEd)ZCwO?M4kS7$GY`gq$}zXsB&u{jDhk%rX-aCKVr3cr3D!3G%P4!*qR4`V
zep9(H)VN^SQ7jtvC`|k8?MeAOVjmM|#`{tqSE1Mqo)+ox&P_W{UyQEkQXrTJ=`%Ep
zmh8PIWMgGHWr$x1d#9>a5s^jx!%bYa2unFy5;q~taO>su?Fqhr{QM=+u->r08cHQn
z(F2b9`$<?I1>SEPC_<L@d69JUVRJ=^gPj+IWNg94LDj1ryMlACHFA6>Ww10Q<0VPv
zxuxZ0<>lTb3|?#x{XGN115BPX?!Nx@7;9VdrE{>(%*T`M<_4UgoAAibyKLKoEp+n<
z0UZM?QE!TC7*?Q7Y;?TSv9e^^QXCo(5Xrlh7c(_%9wappba!iwFpBjrDd3dZr^mKG
zuV*+`fU`m=9fHrf&&7YjBL#QwU}``GSE4R!q~ZU%DOcwE1~P5b|0^@)MxYrDvVzPb
zvYFei?0RaS)c4Yjydm6kh`qmm*>%Fs%eEt86`>$`r)_fg>lLzPd4=M!#b0vVXy#14
zL&>T!)LduDpLvJ8Q8J6b^!j#$uJ2>pN>{Rp0?y6v_71XK$;Mj<?Vm7RKVMxy0oQb<
zg;6yv`0tbq&U>kqlx#Od8tOvt1nj=tpPIUG@JkuHWxCRmlWm@DMw*Prdm`1%?5m!H
zt&|!RmuGcpr?&XtIn<XW0ESy{2%BkVnNA#2RC@kV>eUmhKva8uWoT%@x%5|K7A;Mo
zS_MpJ(pFLkmDt71$eX?T*l|RxC8jL00=?g6PbwfBh^^LG@fRl+ABKO6&@jz5BE^ak
z|N7{;EB`yZIz|HiR9Mx?(LPYFX}r%(^zmRj@VDFgLkJtN_0rtCvz0~wK4Fm-x#hLU
zx5EwC4Fru@n?pndRnw#itO%SZeA4{LiG&htP?|D147*VxYRO-|V(*%ZX!F`^%(9Az
zq>4Dk6D5Cl;J+kSkSO|JsQarjHC_py4Yt{A5ve>>RR^8{JsFGMAEe6EZ6Ydwy_G8%
zQc0Qf{U8O}bZbNzT|^K*hfwRX$@{Tb<?h=^(*mP6)(y9}stNFfsnl3G+L=+L%G<_<
z{;&tm1&%qo9DTpBe6kaZd30gfgBR}2uMsM=R~LvSizSO^sIJ*NM3gTahAQP7&kvgN
z#O(57=W#zL8$$2I8p_kY*&AciC+-+)lJ)Bg8a<v?9S;~sP1gUMm5+GT`!a=%;OraH
z&J!G#r*(<0an03^){d2@T^sGcFgQ;jY%8x&)yWJ|*wS!a;<udxPbdUG6|PI>E$>4;
zLGQc~J`DOcZoa5d)whimW5)L8pv9PYW#hqM0|L>l2&!?P(go9Nc99A<<%-4+#=)3A
ze~$o%fY5-!1B;_LA>*Fz)(~NWP)(@VEvE#nnN1RvGZRJld>9#wDaRuSrG%IF7qbG7
z42;W7Hz2TJ)p^3!-XhyN+srFx*5L@aM5!N*1*g1vvm3slMg^(TqH<p<^Js=U(6mMP
z@5SP}>)(eOZav55`HwRkp#Y-f7eN#vvBag&azr1(pt!dD@EiC5gp5feEOh|<vr~kR
zgdRfS{f+RUzqSn-F)~2(eMrn93V;*%`dOQn+R*SC_tui5$Nu?LoaHmKAN=t-EHKBm
zWCJl!QeYA02mTiYjy-&J{i=(deM`|^I|29}BJs~8SaG$vp+9%P;aG6Xs>2Bo$cQNn
z+1S)ru2QEW3D6uxry03l5P&J^T0pMy>OUbG>Lss{{m35>6|Cvd@RhCQmiQ473Lho0
zqms+}Tttg>b2kf7^GwSKkE1^v%f{;V$_VeU$^KJR0L0O-R`y6-1$+0l8VSk%6LgR$
z7^ZJ6ho1zV5Q|7eD)f5E9z7-)s<ky4p7ak^M|<TDjUQftasxZ#@a9F9H%Pa)SJbA)
z8q0~~MQZP>@Gj`!WnPnh37U)D_rCW~w||36EId>h^F1>dDrAAT<mE{uNq7NkckiC<
zrbhUiu--ax+3&51kcr%xD}Io6DDRbI9wi{0s7_oi3!Cz=4_n>e4Oc6t`C_xU*NTLd
zMwG2?wW#MRpFN6weH~Tm_fm&6()|Lqeh_r9GX8xGN4$E%f)G<f85-d?3Qp|^mQ4OX
zuD%2us`u@G5GqP#D{K2|N!iy_sAS8YETt?lhQ`<iha%r-XhrrY%ZxSqIuoG<lQd?m
zLlaZO7)xU?%>2*j`}@7``#+bfYdXub-1q1CJooaP^VmM*hmamF!^W!_A>jy9#66%O
z98{u`H+R~A9YC}LY`_)F5MCFTg3crCa}CTEI5ZaKn4Ou0^bTHupaz+`Eo;r172)`6
zTJ{RM6#~4wcODmZRQ01Q?M0%KWa720&^t4z#+$dhbX5`FMlG*TnxW6i3Z6^JRFQ$;
z>K4D0MP@HQCtv`yV#%DE#Z?HTF1EWqcqyloUPxmS@OEP85Q}FLU=iB8MvMAOy&KsQ
zRuz^#a(~GXEJE$ev_aAclMqfAz)+}gC-7Dr_(36>)$nNJV+<zE!3v%Hirl2ut@odx
z`|H0A!eyiD>;J4z>d9E(6ai;?&hbMKT*!RZU`Y1zBJD94eXHEI$PcMR7?i)vWX(3a
z+HRN>?5o#^;nm=!_qqxFl6rjHaU;4wZNcXG;eQ+CL747u@h-_cDVE)_z+)P{k@tiz
z8NK>lIkbG!1AWiY52k~`Zh~b5Cu3BgQ>z^*cHWx6_80}N%hw<=W%M)`GGf>Yj8#Ox
zX=1lr5P(!3F=(sRU^tHkpjC>a3nQ#+{l?#eMaRhhHYBiJ*inf^j>o)`{{u+#j8LBV
z)@UuD(Y|oj=n7buM-hmN0xu937EEc>`K<1qsgJxi#GH_GX>G0TRRr1!`nRk<CCsgw
z2|-BDat6982Hf1TZL)93Ym!$$03As2i|R!#j~S-_6~MIi>!v1VuT4wE+J<TMkAi7=
zIbMNak#8*s{|bOU$!n8dPfG?%Dd2w)v2kFtsqo+%1^e(3(_%)~vWI}<kcioq2Lcd(
zHSD)(*P@NvV5q<h-Hcz@3l4u71#(v=ScaCpG#HOlu%l;Ccq9VR>xe?L>UCHra@?}h
zb++?PferWsjsIVe@DBe9p2Q`qG5&>i|M3suJ*8qiOhM9<JTdk43#%PKsCq_>(Ys*-
z;vrsrIRpOX|LMPOeE}cD<4TI(QU-{EsMCHBp6qKu05tVx7KFJo*(jkdv)%=5UV-32
z>UOw0PAS|Jds(6Xcy$B4MCGo;5B-v1je$d(F$}NY4W^Xr-VCGlK!jHT<X06O(BBD(
zDcQJH-D-)90%wEk1?ObI{t-*TI<Z3Ye`p^{`FO0G8k$SncvS$_vL{QOPdI~I(sq-^
zBgD!J@^)io{U5wfHN9@C)NPKqgP5w>WLo9v37QzX=xUZ{e*&7QF@2^FU7oGJIf^SC
zx*Y%)0}mlK5bf<bKEF=8Pb=K_7z``fuis*lr_~1~QSj1g3>+g%RaXJYU}44d!R#1(
z?@UJ5X!c(qT${7qa77UJC08-zIx*-OFKsDsRK5)o3(Q-cp^X&n<P8G<Z7$5h&mEW%
zOZiQjuoia2x*7!0_Olxsn`$B~D1Z=0%f8++V=H(w#0llB$#DMDAFtL28`WcS_9Y8K
zPQMHX&jnvV+@$EwRG`01>w^)6YBfBl>40(-Uzm7qQne6I5PRobTI+_udvAjy!eg5Z
zn6HvS@uHkDc<OVM>`8YpV%qB6uB3{N4r}L)(3mpD1p+WL+<cBRe0hLZKjh0Rv!$G<
z)@n6aSTw>IF_6_I2uZI!0qSBVu}f!gh|owtiF<*l@GSHhudeWufrolKR-nr>kMl^l
zQlqCj9N*Ss0}|@j24U^5KAV<CY1a!a`@4UCcIMC&Wp+GrcXhosrt5ofGZ^auECq~L
z|0)onsFcSy-R+}*gQ2bjggsB8LCH)<Lh~^T0SGSQ>R5|+e=iCFcx%brbI;mTL*V`l
zbU6MXTmmFN3yQ+Txq={GysA<LeAUvPYNuMkfhK$UZC398fq>FMIXY79i59Y(0TZXw
z_P}O;ZJa2Z5ZG1?fs_&*e8Ik*8Xi$v7^QXjQoz!#xV!~BR_@y~mhIYla&sU|oI8U6
zpLMluEvy>+7?lW)v?8AF`#1e)r_c7N`*jroqw1?wkM8}IgMX?4fvh#H*H=1j;0uBr
zWT#W=08ihhsh#{wjux`sbIBEM`iQL%kFh!XF*t3PdBa~3e5QT&rTCKyFhy1%jyxWM
zA>WoV=M?%h?O9jjlrxzBDtmsE2QV+_DUdLE2p}!g{fIvp<NWP!duoazY!Q|PVRR!a
zSt|E$BT1r3Nx-CZQh=M&*cqNOAdtK|hyNoGUrNuY0J@%6tM>jI{o^xrR0l0fS?}KH
zhN>=kNX&27f%Im*<_LSlSWQq}OT9z$U);|G`XEy3=BUGdXrlU{Om-SbQXazp3lze2
z^vct&6a`*H#G}>l>-f=5P%mJ~9hPM|8lVWkBR%#4y4f+oBFpoHVu{<x_+J?vRR@D}
zh4Y_G#k)IanjFDL?0IKM8OwICyIGDowi`=eQ{H6Cz^lMAaI>Q~T)#Pa20I{v5HoKc
zK_G+1Jea_JR0=_X;Q*ysbdI|LbaO;TxKQ%vFvAMcAsU+jKnK4d8}_Y*9ubVoQHz?!
zoS}3$Psor$W?z>~=@LdnMo_h04;*AMWfO_ZZVZF^rl4W%+_Ww*z&_HUfog27mIXhA
zq6N)T1}o+D2+PvQ5XCkH$<I;-y7(YY@_@8Nj6g36+AEj@Ua!oiquoe@zQfgH(&_Hb
zt%yyE3xtfgjuq+p)ApOMSTmctM!TH}wa*KA`~umzh2>7N#29`%ev+$200(3$h+w<{
z=*onmlZ*RG1G3e3gN-3n5keh8OXsY!ZN^S-s(Rww9}|MDG*Fj`F&{>%{_Jd&5`y^K
zfV9CoWUELuRIFwC%_4BimAQ5vdH0Zm2!12iEs#=F!#-FKaO1zAnK&1cU>dY~Om&^5
zCp%NuSD{iIka1iZG%D`-GHJ9dFn8o#hyq8j=5iYdSBxw?I5%CBXP@D?06Y)@8d}Wv
zw9m8-9)_Ln^P~q}im(`}p=OvqP3ZJ8AX+}*^_Ju;mAO0$(DoBRLccS|a~dF|wK@B2
zlG6aQf`BXnE2%sZmA^K!EM*tkw*@R@?7I&q%#t#?Nax8L%>2lu*#iUV*sv%Bg*QzA
z4uzY90fr%$0*2vm#ARd>!R^MFZc!DFBC}z%LW3l@B2{bJNToF3)$vVR9d~7XY&?Id
zqO3d@oKJ9r!6rx|7JESO6G-7$F$bz<pE4d(p82<n-i>Wl4}F3R`Zrmua_7Gi_S2{+
zGyn}w=^B<-r=Pbz4<3OY8E9Yp|L$9WzeJ|HQu%`FK-Z82*I_Ia1O%=r%X-5Y(epuP
znN>nlCVas-I`D?UK-N%0;Z8`UxcrcI{ra~@@L9$*EgJ>@QjJc+xE!<KO{4Qe<;CFK
zq8RSR{LN!Ff8g=I;=VqMj&2@Or-Sp-o7T>|%13z&=>^T%)VGv$fjg+~grH5#4N}Gk
zjVPU7qMc%{dhay*YC*Udq_S1NGUBpJkuSbY@KYaDU4PWqu&$C1GOONg2MmLdUV7i9
zGv$oBRS&YSw^>6JC5LCS0wl}iVmF(psqe<iOC>Z#3>=L`tMEjJo4#kfS)EgvD}iBW
z)bfbk(iFjL4~dp~&eQzT*_1*9MYJ1n+_aO}7g(C@6N(^xKLB2Vcs!?<bMkb<f5@>%
zY+b(}FAZ{I4)VGinJlb1m_-h17uB+p)-314z5|->wJU)`hOCCtsT4of6UajVQJRN<
zn>>|xM3^~Ll(a?A_KTGJ+{o2yR!dvllpL=f$W=c_W_wpV1LdF8DQ^i=x=Xylvj)@K
zg9v)VD>u5Y!4>gkmY_30<lF4ZNc$XZ3d$M%8Brf<?`>!0F9C2s2%{C8qKbX{Ua7#c
z&Vq)g?u>vS1Ptf-mM&%f7+n+~e34lSGQ+Q(1IvhkPJN^?GDDR6cc6p}itLZ|EC+5D
z4LT5MV20v4S8xb}PP?rJF0}zC<k8xu(q5Ox(LAr{Mc0lEUZWwocn6<hxGl5GGzbNV
z%ldVI&o+f?(Hq-rp3H)#GhEvc0-5$6w?Hl{Jr0eS1_cLNxAJbTU)5(GsZ{h8TbA$4
zWX5h%AqXL}X0)`|-}=siIrW0x#;2S{!exRn++gz-550_czW8RDPK_KVc^zKgNVk{n
z4p+mB-(8>r_ilsKGSZT<9GMs4>}fdnt5J@(QlK)sx7ioJ1N3fu3EMUs#A|sB6za&#
zcL+6JM$?WsU*%DVziViTir<FTH*AgW+n^<|<sf(5<vnackd^J!u=Fn#5P*=9y+Afu
zGc|r!<k*d$i2-%gqm;Qk>kN=szh9;B@HFV<W`X=q@4h_!SE#d)|F3to<V)O9+8bIP
z&tU+MkeF}{dbndjLzg(_5S7=PYK^2qgER*`M!{yxD>{K6g8MM%<oazo$EB@)t(6w^
zZ*|_O7RZ2Npbuk-u}uFLA7D7)Fjyb6QTlcTngbTv(f|A{uW?S9&30+Ei?{xW*{POU
zmL$JAe1cbb<?|j;wEyksDmd+*(8T!SnW+1>ttygpXF%?+w3h?NKo?$_r8G<Z)6>oC
zm~7~6#Ldj+oL}z%+A5&{-7y_{oL3%r=;6z0@qa}-E81<(@L84po$HcqC$DZ}%De7C
zePuF`6Kb!DR&bFw#9rWoq+?K;^v0S9H|9SyO`hM48@$&|do~CJtd7$<2^5*mU|yY?
z9g_q>Xe0>SO{H#3NAL(~Gb5r$DyLB~*y6SdU9aIycS81F8tt7SQf*Bbo#s$<`!Cg}
zqk8ZD2e;y~GtHpz-!VbP`WLoKDWVXZ6yhqv#!s()w0b^c;H)B##Cp1(65`7MgZ?`N
z5ww|oLaz?!5%Ufl-(()3v`KU!4=L!-8kXrA)!~@Nw9)2euREd4v@&c%S2IT1KBa7D
zE-V-lbGhuTFa9kUN;I>pe{~RK4wqqhjQRDk#wjF5+A+mXVl$(Z{;~rja((1_zAU&Z
zU;xeTH9E6d<llcr`k@$a$0ED>Ty2rf{s&HwTw7aeC5a6s5uPBD9udkLi-aKQ<5w(@
z<uHlE$Oy#x#eJZSqmT@GRKMY03`A0Lb5?nh@`z3@9sf=n6nAxK&5N)@kR)#Yi`@TK
z=%F0q2n^8@{aTtMY?vh4{I+-e5dS0Q8a$-|n_A<6%tNp70^)Km@;_QLxyLJL`u9BT
zeyW=}=zxIE83Oz0%)i6_zs2L4X3O2izjbN^pvOta%Y$y!`emepa_MXPpT@s<4YFJ+
zukl$fbIvQQe>HP;<|9C}h?<MY|ALmbOF{3<RFeO1x&Qv~$Ia1H*`q&X80Btu26b!q
zOWOG${x`)+IaRs^x{bQQJiz#Sf|HDEYiYzS#Gg&)4}#WhiE#D&FW8Ru@WA$ej?7!3
z;6flE2$hM}(oFQra-wIP=GiQPKfi+=C#hw*@OtXfJ4xVz!9E`4@#gbWRV%Xprx*`r
zh$GfH${67QCWWgmi~m>pF7FQza!M}zpPRw|;FRRfApYlM{V7@g27ZN@joA#{|2d1(
zTzErM_@d9LCz!xL^Yc;&`xMTGS|Vo7jGQe@+9aO;b@z2Sbp-Do86dsr0%!vKd*FIT
zU$6bP7$qYJ$|BsB#<fd`JBV=Rf`wc{HscGrzU)VMf<x}BASsV^%V@^;0}g?nOp#Oi
zR5m89d_K!uwtLgq`A=!Q@nX4Y#q!R?WP?ey8XXjKl9ov8CCH-T-+F{SfaV6+5*u0N
zrU;w*Yghc|X@5nra!cpw1(v;PmTfBi=NB}?b$UU}K{ef0%7KbOcPlTgG-JrwR$zEy
z8FZxn^IYa+vdD;|y^+J1(+0xRW}R%2E>f3y0n-h(5Q{cEn*a{M|2Y6i^<oUI=8gjP
zI0|W)%dT4|(&c?es|os*Q&?}<Rj~OnpZ<DdyoW$tTsH`~iL_<f5{y6}ye^>tjdhyT
z2`x1|^M4D*4c1|rLP1M45>ZbB)4-Sx^oYhBYs3~bHiHos2n2JSM#ca@*|-s70xa1j
z_J6wHGfZ><+&4m)rGLFi@Uqg(CxR;2<4{M~D_be>#O6UF8WSAtjyby9W;@BZg4v%y
zPm3NGG|^GoA$K@#gI|xV<!I&9vBWK1Yu<OqxoiwfS&WoUYT(g^nwi=V+zWMJ({14u
z=AjT`Z`407%WtR)<(VWg8hXXLXx$p!(jW?5xsgvgBp(bsHh%DApvQH)l^~^KYA9rJ
zN^v<RV2ql(*&LqR@Q7fGVHD4ud9XpQTC0mMqYV%;(T)zP73CT4({X+CQv|W{$yN8E
zFssaa%H1abLQ2_!Mv?c}X~^uQe+^x*tkYIvm~rc<3(Uz!po0xga*RA$9PKqq=mV>G
zuB~z`<PkBlaLt<8Ml(WxK?C6Ww5Y&B-&p5{P{g-0DO}?MUunodlQ)xqg4e0~GIU0E
zo9lC@X&E$Hm(B>*9){smMd1Al_`%tv@_qptS<9*(t0LS)g|BwVnB4a()oCeQJBJ9T
zRF8F2WhF^B=e~PmxpJ=ZZexY545NDWaipPLD;E5j%gJixgW&w-?4m-M6qMharC=wf
zg~$lZL0WULZ#|s(NynQnBvlw(xzHMszYuC~WYA9nC!II{0v2R*Tr9nSfba|B^b_V%
zRU+zSSQTzI2Jf1J1lT-kAc-b8k{t}%g2d<h{USG@Xw@4eg(k9Rnj_V*!g+;yO!LK`
z>egc2JFmKpYM=OC!Ma8<&ZGc^O-n-ED+HRa>}Yqsl^s$B?m$%WCu+!?c6DyWM1&UT
z3|M5UPXi816Eqlce%+`vN2fr^b`_7xTr|pck?AyBW<I7-z4!T?w+d(h`1}RyOBDLG
zz4aP(15g!44NYI#m!E7XG&i+^2|izm`$8UmjphhqJfH%8B@D`}>Iz@8Aec$jb>8QI
z(>sFN<=tEX?ZJ@i-%@`%EasTn4g#faF0R0}v8HYNSO~7^_|&>DbKF89RN1n)%`={w
zHPn?s9LGeo3%Ox^tdJFHk%jo26mB2|zUBpp)uW3XLY=1I73FT49ZJH9swE1xQ5FRg
ztI`#4P(K+gkh~JQM!#WUrsqHz;tSAJdv`;`6H|fL&!y_5c{fz9QBPa|_(q2Dny!=_
z7}T$&o*&{8*JXf<FevU13P0g!kJTtr8u<j;6Dmt98iXb4i+I9nVye6PVh$~I`o+I-
zY_G{iR43aHag}m(mhB)0Q@ZAAet`5G?OvKwn_M--F|;;7O5&Tt2aRLw*=;ln@nmql
zc+S$GLp01L5D<sNL>c6*Ju>xtHPY+z7^&=U^xfwT+@av~I9WZhANqkV16McK34XvP
zi=MhO`iq!n`g(e*%PEO4M;$=@NP&T}kA#90{rPmQt;+~;iH#l@&SFeC1YTn1riQP#
z7}i%#d2vJoG{8U$#9H2c!>8a0y>uML__iV&b{8lJn-2#EiKAU^R)0D~iJso28<(Ip
zx6}$Ce#)>GN@$6u7sl!xrM1eBxHg8Xr6I5mM#MmKrq$V=ch}AASk4_wM*YX_+HCw*
zuUq_nPQaE^5TTf4SCDkxHr<q`_!qiH1r&5ljSjEK3pjnUL9Ko`W-sO^!5$NJZ>cl@
zf+n#>q~pu0RFtU<QuF3xVU5A-DpW>hT@YTtMTe3(;zY?|m)&~YJO9eG@02X{9;{5|
z?z-~$<sDIT4%z)QK-zGiq3!m@!0=e@nkwqySFzDIQ3~IE(h=t=tz})_PpUCSe(Fm@
zmyIg^MkE;aDcQOo_ayt==!m*Y0oG_0j?`)Wy-u0W(G?YLM(;^;P;j=?>}07Qy_h<z
zRJyj_hMB?!FtSu+%vWMlxjC-duIfBa0&VR6*6W-IVi~~-_9HCCS3=3vx2F?oh4^ta
zSxoPJRoQwo9NhK3%GTiZOJGhx$GNF&Dl3(%Yv9@B13HlJ1!SoqKz+?x_~YJjL+g!e
z1;<AsHYT@w-oVC2!BW#|BD-X@ZayYozxg=aUrQr{rC&xL!%aP*(FUW}$r>i4ec{1h
z6lb0r;{Bq%;)(uLx|$z%55Ip#vm-FPqNhh-PjsWn0TM@rJn8~$4c@k*0=${y(Iy4j
zYm`hnwLXcMJ|hcwr{AfKep`FT5P06TQKXTqN2nXWAB3&y3gTc9$<?pgYHRO|pXiN@
z9cn}}Gf~sjrD!h4gVMSZw?m=h3L+!`DzP{F+ljKQg-KaCiW+9GXX*$6^gqcdhcv^K
zT;5l^u!$39$1XQT88oa>x|qe`+!i;Rjq?S*U<kUD02H7x8Ovu$5p~Flr7$bkn^>4L
zH9EBE<(yzsaFdVHq^~m90ND}Tui0r;+r~<UAN{!Ya;7K350S=8Il%)ze&>ss8+59P
zs;4DkD3}rZ1TCq(3d7^F{f5_FZKH}KU<hX>j9@k``*%4x1Y%fGEo%~-<Ghh_m$e<h
z8#M&k(mcI4S5M~Al2He1jJ~F)rGE<|;58E8Z7^t!1S6}Ae^A<QZ06@DQ9n4|nu*2%
z^^D(Ij-hVdGnQp;RiB&-7X`lPFF&PKOiON=fP^%6g@3bh0OOFL>)kD55`>3lRksFw
zJ_phJ3dJZ^<n%`--WV%bdmm2+rfK=Kmjp$7MsCN7`RY*NhAjLd^N@Hl-p#7Q%{uB{
zyJ(Sxwq|9uT>nZW>#^xZ)(N?hFxbW;(<LSu-FH`lber7>_cUDlPO}A9Dw1JKGTZw`
zN@gN^xudiD^}f2w&ZJwFg;>0pR3Q9DvEDmsmdm<o+kh5CU0N<I%N!_Y-B?bgMG>0O
zr!ZEIihiYO?EAD|rmZ7~WKjW(nyLnf?6NY!QN4Vm_e(Vu%ve-ffacH=Yl`5BuJDaK
z?u6fA!A1fF0`r*|q9fOdKD23f9Ksv}r+IJ9jou@|j(8YUYh1s%DMS;DpOLx+&}OPj
zEB2_&p_o;G{g8%93t#_6tDy1-m9!dA65ZO=ViO$lmU$wjWX^Si{TR-h2ZifkcS~K;
z&2~@JYB#LS(O%F9sM=PotDtIhYt}gNbV*cg4_EVMPOX#GQydyr5#SybEM9$elGGJB
zb&b=|6lCcP*=gtQw&9GxmOPmCb}X>&sR!%;cY_j}+3hi?@M}yz!q`z6?gZ_%$cU=O
z_BL$kg7cg$yl=6W;HW_pygDf?+bQ#ETpk2B)k>Y?XiwJeC*k_;-D4u5maf^om6)LH
ziA))m&Bk5IQqh|J2oWkvbg(QLANQ$4dW{sF7<fe3ATBf|IIw)#H$v0vUDJS{d|)ze
zKjiX7V>^^k4<0IUki0!atDI|4Wg|Na*io;7iJq7;+7ntRx~Pm&3kKp-7);d6D@B(M
zKZaeDb3wq@4(Ymr!KZv4hob8uMzgw_teDww8PF0Zf$K=5)pd80bra~~gdxx{)9d?{
z-sT-IDvkFUrO!2A=ga`heZTXo;uL*W8AI^{CL<Dfe<(v0mVI>EJN%j-;J%)J`58Y%
zE{tRQB{yvY9ETGztW(Nd_NwsnBVd@pi|$qysXSHWt<Axg-CB3Sc=w(b@Ym|DTV(Xe
zA2si`WX3sg8j(M5|E^1ggVp_c{5v1anZ>yh;ONXud;|wT1$38Bk~o3!QLfmBQN5qd
zuNzXl)QwlmB)ifh*jEt|r?eV!hIgZKUojP^VtAv)LiVRrqb^nV9|)uB_L;h+x*LZM
z#q=)Mm_CmyA+sH-4g5{r1!4p``{~N)HpzM||8_OEmgFG!s%@0=Zm7(T--8*fbqg78
z?x5PT#0W4$43ETCC0C7;eMI%+xz(Q^vjcL$U`eID{9t-@>)YStX2;>2cMmDoOZxiC
z2*iq;Ky~1iQ{Is)Lfv6KC%e+`H5b#D!1ZlqT<zSm#^dyfodkD{4gBQYI$``TKhV5e
zMpzfTpS|993Wnyq>3@toEB|f9pNS#Z`}G7f07P;)Z96;ai!Q5qpe$JR>)Qbn&uvzI
zpgO#66l8p}s^#E6Yt^?M?Vedc%6<$7c~56*3uM|KL!Rdw87imgp%q~_YQ{CXtFU<y
zf7+MxX$&+NupV-1*jec&R?=2$6X$g@v5pTSoT%sE?l4x=<VU&H+b@zLe~k|M)qpH|
z1}&!Q&nQ!Ysi%xRZa>PK*kl)4z!z%99K*)z?YP{Y%~YRo#szRGD;e8I1WKDKBaoiT
zU2IvuMWb<_d-r@0cFazK0fz11ZX@6J^y{p4GseBRt<h%dqU%7H^EZ%}p%cs^2W<1@
zzf>7w!>kJz<kN-#;7rgz7BOnw+Gz8Ko7i=Icm`wTP!Cl<q>Wz72aWYsOhsw(ko7Id
z;EXxi(Vms5`|(VOmHJ$$otO_N{!h-esL8DE+u@<m9`9^5Y7oOdikj8EB_!1oU5&07
zn}{|9h0W?Wg;!pXSz1WY;&{o|zu!>J@K)YGP5EG24YazKM_0A7CId7Q?5xIdGr8Z=
z%^MN$AG2Fo=ssxA1}_KL{*$N~9lg`HM-}wi>uJlfquhfGFyu4KsF&H{>^M_Odxes@
zkO{T&>>Z6K;O)r{8`ey^PMV<RbSnx^%*7iM@alsH`o3j5?)7YZ48iRL{nehX%Y+Jh
zKrCDL5{0#%DP2dt8+?(IOSl8BIH{}6g*J5=kiR<}2lEr+^5Z_ZHD$t~>y7F3D*<Jk
z)~1FCKhLTK7fhyBgL_QbFO18`j{DyBune12!Z7&y%b-K$OgJht1@!9lR<AO<QA^}0
zeUF{aplV|Tz8oNM1L&QmMo!tz8-O#o<}DTRn4Q<vL<9{pXUfbgl%nq{W9liYy~j)=
zk*(NP85LAO8gbP+(9t2YLl6u}&RCGhUM{~Mviw}y-oGcRZx7^l7aqx|NN{j(>Y=DQ
zPgeoHEoAWZS(zR0Q^94#2MenM36GaWDl5Q62~HG0!|^bNL3Nesa-jy$#>q47_$R^9
zs<<s+lFN76MXaRHYN_V!>|Ke&>~WoxRa>}R3IXXrss5!eyHg*d8<tGr)BEBoi#Xoq
zFJBP__w4(FLLv7X)wM5)!Fo(U`{wdjqSkcKkc{Eb=iC9YfSxb-_V)z5V~T&4V=K~>
z;{Tyw*hv75RHwPL-UQ%3{E=d4x3S|b%~D#96=iM%$1g=+W|m00!LJsa_;W#)7}XXe
zPXS}H97{}e@Jl?nbn7m2aj0`u2`R(W=|i`@({1g?340jy1(cSx;`gKgp#{zhl4pCs
zr3jTr6xinq0$A1FV1T?b-gi_Wb0*!?HtU#`{OxVsc18{x0FeemyH~hr-P!Nqvepz2
zO%#;FXLwwN#5n6!1ywJE*49n$I5k9QIETpX5-gGF+{dZYh22E5jwTDAew&~!b*OAm
zOG8S~;<pU}KDd%0y%`A^8E~(=N6GQTjA%9gc=ko7xL^C1F~LB(4)kuXi`|vrTd@Pf
z51&ng2!Oea#iP1>R}>}Or(j}q41Gu@-q)yKJI4<LU{uiKLy<`>{`R5%5~v0j%EJ{s
zrFE_gxRB7jIz>au9SfbrIu9Q};b+8r)-A_cZT^H+L5Q^|GUgN}R72(o_K;Ch<?hgc
z78Y=s!kV*0VZH0i498Zoo0}r65Y7d^dJ}-7m$ySs8>!xfS|G=5H|{atb?JPMp!-Hn
zw-v7ux^#xc?5+HIv`(YQFwa~)81eXe*!hB8BSc3~ubrixHiT1XMg=EWAY5}~Or~=x
zb?JdJIm^qD`NA|dnf}X2b%|6Y)7z4|_&FXb#WAOV?~ob|_^1n2${RG-YS34G0A@>9
z<M@^MtTec}r`wu5xMIIqog=kQYR3vxuFkn<j|^un-yryW3%N|WPPa$-k%=1RR25Bk
zgC^ZJn-7syPq+_cEUwo-x0Q*XR?Qs<JEqm9<!`|9|6aCIpo0pf(%94LQk6@iZT(q{
zXuq)DW9YMJGL#Om$}2eGH(db#hK)ShWt7h6=CUBbzx<e1Vr6;PkKt5RpVE<LqTxuZ
ztl!r`B$*B_;wx^e4N_@*nbp)zsqo1vQg&3F`>sA$(gdSyP<Ng(2vSrmjxJbxKzraP
z#~AKv!e}{S$DF*^5d?7z<MMNGRpsE^O@eCKVj~QrKwO_rVX?sFuKg&yv+7lGR}XqX
zK<R4O!k!exZ^b(7j<Yh{kCMw9vdUxMg(2Dy(B{jePNHQ0wE58XV*;(2>GAY9nmd?3
z^}k@`5;c<59T`|qtOmhZE<7;}N;T^X>KW0J0t`X-jy&k(v{qCW6?6g@vMfocx2t${
z`oVM!1R{4y#TSrhcJ+Nv)0bt9mPhzgOgGGGmh&5P%iTtNuKb~*&O>b3Xw&yZ#$5?p
z=du~u-W={5U5rg!aQ_9F+}Ej#i?j~EE2~3oB~!3(VKeQTBK3ZynJabia(>E#^EsxI
z3BcWTB{1(?lPu>>q)L@)-;%6gw`nfJStXj-27EsXkd3h{X{)Q1zPfT7%sg||w~zIq
zbp~B!Om?Kc%c<yv%K8N+!z7++zggH=y-10oFRD|ri)^oRqBb;8g*JMiL7kYbUuaW$
zyG#YT-nJ1m2<Dyj@OXPG*C{xx-0iE6=9wh?3fE>Mn3-itd7caHc~IF3PIpl^UHskP
zkpMH!)V7dae$%~KHrF8KuDU#Fds}@_#iwiIqbohpz6CanYdP08Sf&fJ^q(PwP|$F8
z*G#-GP}!JsW8<?-4%duerIGpYyQAvu)mqc11g=}uf@l|?wzYhJLtD%6tzj+jMY{&#
z<POwBKTOa<G&jnJ67jh}mbeug{F43Z8@Sxr7o`&yPTJ|0QQ<QRoUIkRdV0EAc1Fj6
ztyj6*=;^Is+?w2=6S8u+&_GLT+5~9phj>=scvra*={df9OqR;$56yKWm6wgXxYm#<
z3F?DthD{NXenz=^<!jAd!x>u8<G-hM-mN7|<}9suwJ__Ima>j%a-xBV=l7syKsT6N
zrx|&VT5sH<G)<r~UreUb?#I(>x^&0A)iWM}yn7}2ZV$JtQ1efwZ0_#5_O+LAnVAHR
z3q{`v>gS=%DXwy3iKK<Cvt?(X6&deIMx+Me#ihn_HP~v;zQ>>$Ec_zZUrDq9AuuA0
z0enV3{&_|Vl|44A>Zf#3zXGs%Jnbnf=goyGYbDTUkPajUM?`ktrpwPwYhBuz_NJJ_
zLTceuWIsAP<sbfZ$<Fwq-Los#E;`-6c==#rx|H}YY2$OdcExta@$EVt`|SCaBgb{9
za$4_#qJhY{_2s!cg_ej=1gmFk$<WFmZp4-P{i;={BSD9{bS|n~2Y`}N=0ijLqRNj<
zn*YQC{!UdD(vtJFvKI+*-9d8QuR`}envOJ~K0PraYWD(Bbl+3fkJMP^!A++8q;6@)
z;umVeQy*UV6wPRUEoIed%7;C#Y}YdkKFRwVt~#^aJneXLp7Lp{k!CS2<w%TT-eHEF
z-znIi<$Z_ho@D?EFK|&VLcj$&)b2_7iS;EUWhEc^a8O}lL68mWq~RJbSs$5_85t>#
znUVf@bPFQnmeDPj&-c%tf_Ue>S+?UCh{-+J?)%ouyd$La<0{f-vTG#fm1*t{i5Bwn
zySt85o?70EmdICa?}+QR307XeQot?Pz6?{_`$&8Yy7Kfb(96%^FLi&%NTz6mfA$Lp
zeo)T1y<H0(i;sP7V_fNAsQmPGg~-UCe*f(Knvn`O6>TL<^~Ngu^G5l18x)`J!X8}z
zHR2^Ml~nSKy^S3a#t3pho9qY4bo?E5aQUEqp%{@W!xmn@tEqa9rfsS9?#zN8)AmVT
z)Jsv}WPzhKz(R>^ZYWqYViEp>dIc-saPm`%z0K=6Z&Af-KMhCkkkWUrjOf*<I;1{R
z-o8SDlw1BxsAUl7jiW`^X5r(F{EB9~liyZFX1T?tBvXP_24w=t%Mz8B<J;(>`ZDw0
z6{1njh!7bcAm7sP0o}8|wom?`|E%>_(|;_il?#6ZyQBX=pO<jizVB3Ty62u_?;LDG
z2y{mFVnj`EU9BSG<Z+3TtD0M;^xF2!7bT|qZt7L8Xi4XJ18b<+M^)WME0Zrpt(#~M
zU-s;col~0qjr;IfunBz2D@#-E+=^avi6QaX{GE0R+xKVCv9yViNF1Cmlguy($eMH!
z0Gyh(aQ}iuu4rc8maOx2s8KJZkf3u^qW>cV_}LmoGg>=fme~;==`+!8U{3+}b4w6m
z)xgs1eo+%i#@Vl@+YL6A7rb5eG|LNKRC`P$8CKel6=7*xMuEF|&n(C4W(jhhyzg%7
zjYs~iD@#8(F%VDR9SyuVA$58S9raeq@Art?Ib^$i)zLjils%Pft>2HNp(st48@#vK
z9nRlwOn-Fgi8p;Kwh7#3L3>ZxT}K~X6Xcc^4}N#{ySFz7_RI|lHAqQ1_US4}&y_rk
zRT`~U3wc_95PEda4;i-~d;iw^*-PT2kJJ)pNn%QpKl!HobwIihF_|;_U3qjM&FYZx
zFo`vP;=6kmRG{6k&!Z2aBZRb!bck;&`k_0VLRF(>4>Sj+P_zY}zQ^@`FgQitqFL5$
zajr3o>ob`K_BWaGq541&yM_T_+x;Ba?}4;iFMX+Mzm>KAZG~;MXT>8Z9LK?ajfQ?S
zlb(Cju?O52Npi9=L{jj?1;NFm{An_tfs+d0m|vAx@Ow?<OCn5AB9EKiyCRZ%qv4ny
zLWHI6yp6qY7~6UU(XM=;{K%|#^`+TM9?ybir|fmdZ$>^?VMObnE)`Og-eOt6j4YmO
zJ@7AHq6hbv*ZnZZ-P2gz`-T74SbeMr%MK;N0)iD)Mh}@nDg=`=w<zV1>aC%ZpQ2__
zXS=@Q{wm8Gcg_CWBZ}z7h!}SW+e_P9Gf;5*i{?fac4_`9ta;DM?$bsm&oqfw9;@`}
zi<a*WdN+T<PPBCU`w~?OL-{W<jGA9h^a<Ww?%*+62Qij@vaWG^CA?Ep9{9I?;{WW1
zgjF9NIklg!_g#{s%8ncNx0go>9vM#UeBT-}ty;pJ#7!Pyx(X}uMGGi7KW%-AGj63D
z6gx4_dAd&AQpYPl2S@FFN{nKf|Cd_^c3X98pFE*_IK6j8AyDb$VaLL3)%=<Df#QkQ
zO`fr=4>}lRLd-D*+H<VZW-Om@4+eF?@_*cV;P<EVa(AvZ-{;(2j)4){f%~pEzx#0e
zOZ!R7Rk4Ye;{YHdDZEuOZ&dzKM&YhI==(4GH}d4A^KK)-jvSLu5OBFD$I_g)nIKO!
ziT~U;;fagIod}bwq-a|zBzKIH(|1P7HM9l8KKM^mw9+5ofXld}l0yOa_#(P$#ODnl
z+I*7fst+_`<pltvr)w-9sw78veaEBAwYLrhm))>`wz2wEzfGPB5qWugBq(dnYg=&2
zKa+~ZhMnIRM}5Bp|0(63jo=KP*g5ltvaP1hKtVgLq4jm=*NAng;uSx6C95z48Ht&#
ziwoO5QgBtd=O{o#S%aTz=Nhj5P|C)>z`e}UCF~BlN4JvjX6)UY%F|9B_<4JFII%hw
z&yP=KSRN?M3nf?gb7<#o`r1)Ll@IT4RzIDg6BG>-faU4X4&jt>7YNO-;uJjO)xF&W
zP@%@t|Kzoy7AXoBDeKaEa?qIy9{YYWuHdfW+K+>)dHB>HKEml;N}r;SbECJ0rT1~6
zJ8mBp@ctGZZN%T1`k{}jEX3Eng~Ji~Jo4Q9laB}d57Kp8nFi{XC1+W5LirCeYEOf3
z!-KiKF7By(b$sIqbC*R5*!@Z#{PS{qjyCTYOIaKYg>_!T4Yt-f3QHNUw&&qlM}o;%
zk%reqAkEVAbfsqHzRz6OeXe>1NUotkR5D&5rJ(h5X8+mVAUW@xZjlK+%joD!n*BML
z{#)nw@k<ZH_(hC3K8?W}7tcQiRlD2m-19*PQT{feS=V=BN#bqfhmpaXjPqL}gAW&;
z^xNV>(x~{?X|j4vqq@;{w5!bC>m>8;pe!IfC8glpM)Rqf)jKT{shi+TJ_~#2^Fi&-
zR#xPem8drx5`Q4>=lRt<V_!XDE5`9Z6SEv;obyuJo>hLz5`8rm)kG4|PSG|lmk>4X
zJS%kp`Q84ksN`E+x!eIgX63GVvloHZk~0vk<>A@E4{Dp^ZQ5cyX*=5G>iKxUcSeHl
zdq!Yy!bNky3XxxJ+1L{QBNui){!|&_(UkRMgX@)LjN}FD*pyw^-z+lr2uQ43E9Lj7
z(S(*wW+KYKj|0Cu?+*5LT2ShId%RS2tU-xmP0?img8>*s#l*xIyp*M#YHYHmocva|
zKZi3KxBUiPV0|my+~K|51fV`44CNT|6OR599xy$*cNiZ(cj1SS%BZcp(VNylF&y!P
zRRa}{Lk_P)W%j792VAa`@BSUob^*!P)V40Na`@zv>&L`i-)im_Am?qszy4M!Hx5#v
z=6PqBERhVp1fRs^#CdM#K1kfJwYuZxWX@|J6!-Cua)e~jfd%6v_iI3|kCl7CmO;U2
z%TWZ4XM!YCL?Z_;oX?V?T9b#v6%=a3eup^-8Kz8M$56GoM<#Af5OMTv8z+-Atm!`t
z{&AuDp5g0t#^+_pd?|C<LfW+vJ$M1WZf~<u)^c^roLLnFFhiQ25ImQ4+Q@`$FH*D0
zzUfnO_dLIg-dDpxPe3TU^;n(g{JvoK;U}}Js2vlQ!7v%C@Pmd){O+fdS8XO>1^pYL
zfX4&T5O@CQ__hwmGg-tm6C2m5)_xhw+2J682FWoI?zvW0iZRZte~n^!sX<Akx_|g5
zEH)`7?Rf+-W9$jUUa#DQ7@*V<qtOqG+8qq@O*F7D{&7F00NiKfbdkcj;t<NnrS!_X
znjiX(7$m8)%y=-l+&=kh>Ug2WIl+vX34vcn4*ewG)nRk8`Wdb!a*DXfjCra9A^(9m
zJ~|Ft?J@&b-sXN#zYYH6erPim4{=Z$>Sk=2#U^e)?9BQR!dLK@P3$Y>PkxorOYz@7
zwYt<_2uxomb?ONTfOdvZ+kMT;IbVFL`ShIwOFdB>*eMd0qP?mUJI{beLUZ0uTE8PN
zWq_acT5CLf<z4U0%xB59|ENsPp(`5va)V&B6Qlk4<=m}U*SN7WBhHVy2ObPQrpZ`g
z>TbSQbG`ish<wj6O5#5?v;H{sY@~iOa1`s7$lglslrCnSHP9>~M-6?e?AIy|Lrmnv
zaYFCCPjRi<sJNzGxK&JCq1#fBjs5nETYP_mb!WF-dQCZb^epb$w(h^f)>czmoRw3J
zbloYVl+smc{SdBlSby--qo|&a@VKa~R9x5ZhbSTDqqVvF+pl%q$kZF0AOj%}t;B7r
zezhq*HYhYdHE$sJAlBR0C>cwj4s*SMSwHGVZMgSY{v&l2-$$g1qN?Hpyo_JeSMI4)
zzrr7i_B`FBrJT_A;O$4ZNL)#Bx_+L}$^6krN^#46gQcXo<95e=k9deSO<#yVl=b5e
z@K9Muw1RM``?uxJ4{cPk33V1IXcd;cWB!yKC_NbjOUyY16HX3)esA0_)nsWQBqTF_
z_QGoCjtSaD&M1`hd-=wk?Y0yKrnP(Qwj3*VPvnfT$+nRp{UTO_``$JS)%RN6LAsf&
z{OjW2j#AFLXXiZ3{$%xD6Z?p+9@wuG<|df?etDro5IVc-rf0%^&Bd<*z`A=JtXIl*
zf3xU${Fo4$Zy@b;@r2K>tbpTNvY*L6Vkg52&Jul7&M_>Vw|~|Biy;BAQ#t6^yGqIB
zU*5}*lIE#T-v$B-<HGAXH9EFhhjz!Gsk#?C=La807Y}~+r$l0UFCKiGbVTu$lW3VO
zITuGvUp~C&*>6SFv}b^TsA9m${t(H?SMw{;!;COLu_Gob2XM-KvQ(B{NY<pSKxe|s
z-i+g>VG(ggRnU|3XWwl@biOl<+i(ySOy1&#*D3VMjJr2=A%AGYS!mnEqK_A_vX2t&
zd-op>`{Q8>l+FAs^08{X%JEtW3cjc)a_DIV<`Gu`AW_$iF3Mp6OU{Am>D-4_ZY*-p
zl{e*Y#JhicX&!dlwsiCG_iJg3j9&0Fs>k}1Cekz31Lca4uLQH=q&{3%+aegJaP8T~
zZk)6Lz&%lZh0dccOYds_`BN_>6gr}C^|9Dz%D#7`PUf&g16^~uScUEPI1-&n#h?sD
z?LtgV!W7ZC!AT(43kMFeO}W14y+>lS_ukhiSvfs_%%kle&!U1YV}7x+Px3y^v_iM+
zv2fy-#Ex#?=BOms&v@^1gX#ruRVE88_lEWPOPuEHxk3t)l;rF~eJ~*&o;yo39W*&#
zTNPXP+`1~49aCg|lk%x}>$gjGPoR<>hwR=!-F`0l01WLypFs(U`g=RpZn*QgUC5sj
z$;Stt@DTrl9Ls2U^HBWBlRo=>QTUGN;(7S1Pg2R^x3<iS{UEXw&9IGr)}zCIJ(sUL
zy{RutjE0Zwa&!vTnb>nUOylf>e?3Y>rPMIHx<TT|5aJ*{?_z|vN6@wiEcWydQf|Hm
z`XnHjR@(jo_%X(5*|sj<dAQaSsV)|N2<!K9-o`GyS)OVSzW#SJyyoE=-;2^w37T)G
zA8x>B2U9cHqSdJ_>9P}KWow2zjK9>>ufJA0miwAn^`*bb;aDaAym8ILCf&6iO7Vk<
z3He)=>#g}#wfbe2T3hMZOJ6aTLIRnunTbHJ_3H_>8n>C8xWTJ)X7Lu~d<tb<7DYQm
zUhh4b)Euk$a@O2!{QOM!oijpZnZQ;j*)b~@x`hTMK~aDsI7%AvdNE5rcU$m}D0~0O
z&jelrF+Qrljf%Aw$+2l)LQdZ|F8;;n`lWz9bMj2};o*^e+pnHuvFam61bP~~js5}L
z^(=M#<%4?gmt|G0<EUTVJ~v4YAw{&4mQA{)_;;GLhn~<$T(07`%KH&#$z0#HVm`re
zH{)+PG4ynq{jmB8<UWYIQ*8;Z_2}4XE7g|_OE1pj!3uq;TN7W;)mj}D=r)rBgfie(
zC;E#x{+G1fyrt%wqq#7lVd8dz>kzQF%*OD>$L6`bgoaSciA(-7+4sgib^b1%pN314
zuA_8j<i7AN6=)Qe{HhKIb8Ln}>zQ`}F@cx%=}WIvQ!eJ26(GM~3{HuV>203l&#CCP
zcrJ+?dFO+zcqM%LX(LNa;nxOi)8=_sb-dE-Ll8G%IV9`ezMYZ6+e!+{`+-)$&)XXJ
z(w~R6%Y1rPTu0#Z;Z`1hfMl<2X)1?Ve)V=w-LmuQsP{jT)^tL_(|KB_<ZzCojvzh0
zwpjriH~r04gtP*w49~>&7A`HHH{~On+&WysFz>LYPZ)gl)-w#^I<HEstvgzLCH^zs
zX87>OrwjP6tNol=;#c^7!5QE+DZBOQ>FbiEg6sSw^&o7=SEiN}-HP+L55v|MiUQcy
zrK!YMxPUITg!~9T`zo14s~!FBTR_9KJLs<Gmf<&#ZSc(ri+1iyr}-@)>{Bb{snuBg
z<Y#2~iuxp;9=mn}K3u6d$(S8nyJ6m*wl#&}?Q?B4aw5It_&-?DWMC^PJ4Q1U>-+e%
zvG%KPyi(<gu5!+g%H2CS9QRmq<x@w7kK4*MT*@(#;k~lInq#*sX(!u?9oxl;O0MXw
zR+qaH7Fn?uP;`$?DX=!qZ!y%gKKR$iN~YYtb7wZRx8lWYhr({db?w)!_OA}v?Ye6l
zWBaL%sIlir7*-Cr>B+wxqV#$0c%_<GnXlAIrApbdB$MSkTetV=?~+uB*865!Eh(AQ
z_VE{YC2M1+X^^a%=gP5@{%3*PWCNUxPX*I-Tt1;6tL*)Ur6%!nq&`Zuox!NlRyEgC
zy4PZ%Y4&J1)g89HR(Gk3BP|de6MZ%n<^6QU%B}A4-UkRMFb!49H$zmNs^gA)pLW$O
zT`AArz6`wW=h_Ieg<Vfc%Z6mog%+c<6io#EJpCgzxYj%obqAfK6p<Jj&rhgM*Q%&|
zP=JqRnUT7ExA|uUkbIsP#_F6hYG1C3y;Xp@rQT$Eo)cNx+o-nm@xqlq29n^0ncRx6
z`|^owPXHKXRP^dios#DtJ-;sFh0zr0wPo$MxcS7PMOsqPpIEy7g!$AOIf(e~)ht`a
z9IP^}(FH#}`&yJ!cemPRZlL5B=LtH{SoBnWYh2QGGw>zBziSDsqs^~2i<hOSSjXbY
z`y+ehvtL*2_EBc@;&?_#c0&n^%>5@P!3;Raw`MtY=|_3BF2fI@rr1O!U#w#P#uTs2
z(<E0~bSM4RQ$?egdHF*L2l$dsA@NuNSBfJ<8bUtbSaxEZZu*+vx!z{B?TmPX0=?IM
zqfck6<cxN1!`=_pnGegcu>E{_mg56~O-by^3L`(OT9?M8`G!ov7pbP<P4r~sE1-s<
zBC>ltjqVcsYqzJU<FUox0Ueh0)O)!gu6kP=6b=_kMOY2*uYzd_&u-M=gRrN&P8(FY
zgP}G}hViX~gJ+{7EjTaZ?Y)a)w>ZuGJWDc+ZpcIZ8)MrY@%5~dm%^Wo#Hi}=ZRL02
z<6d3iJ0#%Rs`EBK+D1HS_kc>ThxueOY%BFyJu<ghu*}(^Hn(Z-bt_+@;j3!0+OOyq
z`90`Sp=~$HuB>e&+$_!^nc$LcvwLJOy<mI)8oxok-gEa?=#tps56|z2TJfj7CQU+5
zI4BW$7@3wV9ZucxLfWx2C*)X_^d$ag-yZ++tD}adiOVNHdtX6Gb^r+XTu-A5%dA!<
zy8NH$tY@`X{%93uo3E`@35aHD9jSBFa6hWw=5R|~dM{PZ?Q78~{;2vrPW!x92F|gO
zcPe+!+r@3z(e=Oez9jxrNxZ##VsTG5LYNN6)bDSri_Fn{{-ZHTZPxro8!T}-boK^Q
zf4#SI<YZldMB;%gHxGTlXqHIjKBgSY51T=2_s&!8BR4w1w*TI5d3261QZf6;@IadK
zEB295a4XWzcx029^xW?5z1?q>-VEN}I%)FYc|-~vj9KxztNRlADD#40{2mL;t>}sU
z6AMyp`p%V%D&@7=ksA%&K{QV{>A8Jk`Z6o*V2}7`QKG%?j{*G0WITC+#lM!FrJ=5I
z12tv0;ZKY5S-kb^eU%+{VYi3w*GZZ1C8U-mi3~eGtlZ^84iTsf;d8mr-?mJy67-b`
zE)T?yn__oN=)Cyg`eMrZX+zO4>67j4yN@)Zn9wAtKYAh}ukl|Nf1gPdo={17=Bwml
zvRqvM_?Ho2j+8oLvR+m{78h5LGcooapMB$JUp(?h$@zxvM5<5T!S^SgW$f%!DLxy&
z`0UExv48FKvxd0E=fjAvoehC0zl0`p-s1o;A@VdVb~1lfcJj-FCUs{AXABWhx^XK`
zJk6>EU)%W0ZZc=GxRQ(6&A9`$g6O49EJZvV144(h>JQ92CT{cn10}vjRGuUqu40sd
zUvvTkuRnI*sZ`(d=J+#zGP*VH;_c6ohFP8~9%J4@ug_<uJuUm%4%?G*NYdbVXx}3D
zU6WktBV$}_@g?uievwkc3HxmG8M1o~uRi+aDQUOske6aU?9{bgo_saJ%m~v=HTrJ!
z32OsjD?Ooey)bd~7#=cM>Y?9<^V&1%2i2uh<;N^b1H~@YC<V{%-nOBu;z2c;R#^nY
zzrO!S&ha%rynx}q7d~{*!&?(h)otWOMWa?#mf1h;(Bjd>+d-6MtBeX<Zx($tsWCEQ
z=NK5Yb<b_l)#}hpI5MXDF+BH8wdcUKAmGF@Ywhswq?4h#hpZ0_NLLzxFM5h^^LW{M
zbXSBTG_N*uZ|X&OA$E_{31~8XTVjQXYVrr{ElRWJ@Wyc~@WWxtoSuZ`?Vh(ns%t*|
zYSw=IqiT%@rL)%Cwp~&m`CS|CsAv!Ft81ylj(@Ew-@5enuxW$$mJm^Qw59;ba1vOd
zNzM7@u|{4T%mX(p4j9~@^<_<c75hMATen5+=M;HwaAMTaaX`LC5YQD1UoKUr?m0DD
zEx2Zh+3QGVzB_O!IK)e^?$|-T$#*N*?Ok871{c@TyGz>*M)>f@_L>8eITsH0=_q~r
z2Wslk?Un2FRF&5}&v$2n_~t4KJb+0{FLgLS*R`SO`i+JnHW>d^;}25~96kI^BsI#=
zgCRe?<?g0*!N;;c+mje4Dr{W&qk)GI_uF%MIB;`ooz(d-*Z&MJ9WhC*t@3cMN1Po;
zZa7WewmUu+5debpuZjOWp(!3Y_+jVm$XCIa-%&(eb^tZ*IiJU^B_ieDX~{~)^?bQw
z%C(RsAB6s3CX#~oWS<;`C-gIteu{tJrnZG1G)~43p4&Coh?~Eoxki86#4+`hK9eJ=
z^s<_(jA|>>6qM{5mvkakYHaD8o;|-t_PGlNu5-ZspB+qyVIR8=9e;g5GPhG@0(t#B
za&yE3+9g%bmSvB>LOg1cQ`!x}W^Dhcz{$^Yhf-Sr6V464l?8E1<V<t6g*TNbcbUXx
zfsXNw;QT<mS(S)Mp$~8vI@tqC+dOYZe>ya?w)Or+#OGV;*NLahD~s%r5|XRtpA6q9
zN0QKEm&38FmUe>&F$SMhKlX#$HD&IhaseTPj*|c;KVR>T8%5k^;h!^uMM+y(rOD-l
z7D1auL&ZAboX@^z&Dk1z_9{QnsA9EWs~f^;;JS{Wy7!SpyP_4tYc(04k0k}-KgTg1
z;h!AsySaB*73NLFY$S(H=BVG^J-3fvUqL%WDk8aXVlgHg`$un(7g_f`ldgU9AHa6z
zUggCb4Q9a)0>z3U@Sb5(+NnivWJk&;TrqA{?Y=X@9k^31dJ+PS+UZ{W<$cD=Vc+ek
zbx4*zYH?6I5!_2!Y&|wIpAjx%C}tAGO1%Vq8lpGFu%TOOm^|~&Yt2zMSJ>2ku=t^W
z#P1w`mM~amcLGd~?13w@ql$qsWQgA6puSV%In@JI@h7`iH1~{NHa@nMrEa}$eG-JE
zMyeAdT4$qi|5vI#v=5wkzU^-f#K-<jvB^xH{_3D|y%=S6`r+QmoQmD`ZO_s2-)Bbl
z;C4t3LpiBm{vniHs3{s!I0S`KohEZut)b<1RZlj+UBho-rAMta8s7uL`=WdD+A>}y
zpT&ROcKKNHfO6KB9+=#~x&O!1TSrCJz3;<xhjgb%2_jtr(jrJmNOww0Gr$1>X%InC
zI#d+tMmmQcQ0W*#7?goQVul#tJv^W9Z>@JN{(uDw&N}RU@B51T+H89nAei9cFDCvM
z*3%$;@#c+YG<9*$=G$nO>5%4IxexW!35yCJ#=LAP=HB($>U8h;R^r?|-RZ4B_8edp
zeY1>*WqZ=65TiMTY2Xz$l%hE6#5wPBE%6MLur!aLy!^~Luxc0tj5<m9G188B43ez*
zH4eXi$+`Bv2M#TZuGV*xd;HRx+6Ln^_0fxu>@kGx4n}EZX<v=JpYE?;GfoPg74B{+
z<Y#Hm%N<)O8p1Fv6Ctrw?1XV0$zn0U^_}ZpQZ=-9Cm@1yW%rtLIkgbKV3<{KDvH6L
zu(4H=!baV<boaLf00K9z?=1!u{YKy!Dv-Nn=#Q5YX^3aaF|NVO06dJzg8cfO075KN
z>qIi;mL=>e^{Mh>ttS%*ce^iPtipZ&+GvsgM~mnS97HzyaBZmlpg%Cjm7A2?&KW0d
z*6XF97Xic;%X~Dch4FIB?bpo&zshLf%Mmc(=#2nbfs@Jsj6?QJ!b+*f|7azRXqw?A
zjuk4!mi`6x^AuH1uTD7+3gTo0ig{^6rn{JX@p^iHGlh)y6VR(1OPYvCz54J-W7}cv
z%^PgR8{ZO*=n6T?y|hVBEP>7DUMOjj;HPD~Qx4%cKl8Qsm($Wy-r|)1ZTxYzfka8$
zWI%(Ky<Fc%eV5qmU%XhR%tANAm=n`TeH>Smx*SgzF)0TZ7s~8YTtqiVYmKn>_r%_v
z3oOwL9}kMGGS=~5MS8;$LlwTL?bGX&+x}}+Q|B)pn-Nz(e93KEPiCq3om<uJ2-mIH
z@s3La&36?PzO{9XQVOM!m)nOv{UDm7$zVXhlC6;Gl;FTB`@)?6w$XZ?=v0I6^AWU&
zRtdJ@_OKndG_`s(ol$17aG?XF^uaf89k#4iML*@yf{J8Ld(Xg$RihFcH~U*h5Ubii
zvG1`^BOmSdj`S_V>Auo{!OoaZi`cy<+1kioV|r^)cjX_+s$ae=C=>2gk|LQ;FOmSl
zix76VwR*x}qtS)=(zSGBnU>P;d}hnrG=f?lt|M1S7wqK=le{vHZdHH9cWG=5ax*Rw
zwC%R5-vsqTZS9%;WbQX>u*FXKI&0gztrgOGyEtf?RGt`{G)(^d-RZvC>@yN9qjh1D
z@cJs8Gj02AJO6$QhkCg8Ub5pKgPLKW`sQQ^l*lU$X}e|cQyyiDpULpruxDp@(~bLI
ze4e4t)ZHE{_ii5=`nz@Viv}qRN6c~P3tNJ#551@kk%gst36?#?WX|UDv^!_J_)JQd
zN-WxX_3ux{hXDzLQ=B6&8f&h9q+d=2N#1(Vuke-&w}=XRX`Y>se+Pb|6z2(?1&-Pd
z7rLi&NkSv>Pl^2~N82EUZATriN?IGA7+No;4<tpTYMxla5`z>3!jzAa;s|ThBba8m
zx?dx^A%>lEG{3EYQyfbJoiMl@87Ud`P{L38+=om3B%{34{L`mQxka;`C=SV?w=vyi
z`I{Bb*Q;M1a>|NK5Ag-2v2y})u21L#A|sQcaM+)NZ~E^yi$6DPSU?@We?>TAZp)rB
zBK^S4$TS)YiLSv5$ui(L_GqMe_O{}<oD$%?KWRrJhnr;R%!1hM`D&6EC`n7W5<zn+
z|2RMNZW;V?>03{b;Pkf&g6vC*BA=?^jQUgB^?xUnNbCIC<bAf^MZgpq0s0vwr{k(d
zWYff@9(@~qUdOzM?c!vxn+z|2X*}=H#v{+!LGZfc3jb2eLaYncVqAX*AWsX`G}{@4
z)-K#l;&$y=ykQzCdZxs7jitn=+``2eiG`Z1ZM7>N`U{bU+Pmw!E}N;Bl&U%<MQWtE
z+L)^V5liQAm4FOy;MU{UWM_VUXoouvO8qrXLKqAZ<Pl%oM_*#M7dt#BaOVSPQ|jWN
z5mvod9MBOMX&g|r>3JkVnLx{FC#iGtZOC8X?V1&}@b=Hi?Y2&6<lsS7@A8que~5q`
zn)Dw9AQBU9A;;H;cIIn*^OBsxN*3=(pnj&vfVmkEpy8T==Kw61GJ>)X<r-Dyi$iNS
zHMOpxh@Al6GFVPsR*P{hy>M%eK$`<864fbeRJ==}5~Upm@tsxrE!3Eh{Z=$B>Z0Y(
zmoE+$nwE<3HY4aZlj%dUNfobSHe+t7fwx-M+6+4o@-mc=GdwTNg_*36dZDJ&{J)hC
z$myGHYwMKHUTn>Roqz-rEhpypx%I{M{}0X^PJ}<C*rk&du>9t%(&ai2+%E;SmH;i4
z3?pFK=dKJdGURPv6XS)Go!GnAL1f#+_fif%rK0Km2?<1ICBdw&ZD{uwKd+1|vqq=L
zY=|)w^XsAKq9zNGwP`GXYA~WQc|0lZRrmuj&+~{+NjF`i-IcUvMpN)r#R65uMEmoF
z6e)PnY%uws7u`5A_mNNjgkTw+VJTj7^~iQg?RfQys}8oFvK|SR2ulC^XD{51oBWf8
z*2f_oNs*DC&I<xrLufcLpD)wxa{QEHwO_w?wI!li)xNMz3E&h5hWvtXf%6wF4&_S$
zZ3cH9bk(30qnHn#uATn*(&|hzNqr2cr)*Y*J)Ie3;(&h5;Brz~ssW$sMcrSdR5bO>
zcEKq{a|YKvcc%mrHbwfz%w&edJRo5J`Sd>PM5em37uPhbK#R-QkqHOo>bQ*-nA^5#
z5{Zeksf68j$%_M?$9^10ehcY@|BH>Oak?&av@}!w!y#lVd)G5B?XTJ=N0zm2hKv&5
zT@};~#>@|UyIEV5=LY_kPNe2(K$~Pt+WP$N^aPsdfb#f?V+o@?FV8Z8W*wXh<9Tv#
zsyl|O7&|OJ&avBsliVUtKjWABb!^!Su7AI)3GcEy8hC-BQawsxUjN9i%N;WhFUd_8
z-wb;bp{8{y-%}f4jK>yq_@8%XZP_y|KqYHBXUfvm9p#a~u8nWC{NUY_%-6{-s5@)S
ze7srlC0{-t($UE98&y_Mv(m^^27_HdWOf^>`=|sK5lIgZvcj{vT=EoL4a2O$O4`Jh
z=&t}v%2Sa8NTV3zPsCoB^017TCie1gaJC8yn`|fVA}m6n{#u2PnflQ!QD?;SjTZ#<
z&0Ng~E<s2)>k9vt%~+Z)U(<T(n-i680#?gq?R(#s!MVn&)y>o-PzdcJ{n<wSO!Zb+
zJmj4=VPFc88SEk1XBV4q<YhT~0Nu5k9q>_!fL*IC2LIl&q^#Lf&x$8Mrb>0L2}<>8
z_AN-|Qd;9P=4D9b(q6<_tg<<Do8H3MH?CnEd+R#W=v^B4HtxORZ=)k$^eG;UtEbDg
zn#M<}Vf!MHL5EI<43T4fb`&b<ApYd574swfm%=S@EPtIr1Fgvd65Gzct^bS+1YCc#
zZOUyqGH7~mXXeEWnfEybgLJ~z8=9evL;%Nt`;uKG`?W-tyxQ2k<^Q3W&1_8@5MR;d
z9AHm0(C;LXow4YE(cgv9mqfKzLsyk?zlau(1fRZ#ma@e|qTG+eoK%ax6&uGvWMm^k
z;~O<KFC-~QMdKrejkALR-7?sfXD&)qBJo}y2>XSMTcKof2AQq&8-D#)Z|^LH{0I3*
z`n7A}qINt*2X3+;Sy7r72f^_fLbo6{OfhWeZk7d@j+P2#<K&D-z77O9O7_dq1Y2l|
z{=x>dZ^Kkju;^nm72+*CEXOJJ!cok=YTdAAZ5+h4I0ASt67|XbYw~_-iFy7t0X@Rb
zSwu4)^2!nF+T!`sC<-3Xc|HDA<nw}SmRYNuS*u&vMj>Tg6&?5wg`y#hqiifYNd2hk
z!j@=+(e#gbN0!T_v@fks$sFS$L}ei<*=MinV1Ee>SKZ%rxs^V6?P*x@Il!>D{H~F*
z;jI61IvEhe;NW(McsHqq87$TGhBC0nN}_0ui+$!6JMMzgh?0Fbd1Q06N;|=M0forw
z20PQfj=I@8XDwj}Ok@pK@2>RO2F~T{pMK+h`Z<t1;$9psh5sLp<6Fk}lW*=uWFuou
zTecZCG&IsB&OKf$={H$1Yc5+p;%MTpa0QIkY>}|iR2hz$$;X<E>xCGcIRSQE@Dte6
zCmdD5-q#de%}(MQh3hUdO#3$#fZbmR9ndhW;3sPw@0am5VAcyLJ;@EDIKo%qz2~~l
znmqS;ERS4@rOKw}!}RL8`-Jk)kVf*H7V_@0B;6nnM=}B9)4B)E_IeF_c|C;yXk~M=
z+FXVtUQdW<w9dLb8V&>ZcC1vNQdvy-ZLiCi4gY}Kkc*_Y>#a|TelUhdjeO+ox2ky<
zmN-=dP-l|!w&bUF&eyvx?9c9M;TUMn=i;&JUAc`t@8O^cX6-=)Ebi#ezW-$iVH`Zc
zzLKx2c!o1q($v@`E?E@^c?bdEJZwL81Qut=?!vEDX}uNGe<tWZR`Ac)cTtr}YLR2<
ztd-xA;1XUAWcT>xdQl(bdqGJn87A$29cIp)cH;LV@h64q-(tmL&9+~f4LJnqH(JHa
z)WF3zcWa<}3f(a};?6tkgMaRRT%advzj@h6jV68a;;*CJQ;ln~KPW)=cJ%FNCCK&J
z(!izLR@n}#xuU9FnbDhL0mC2DAA9Q5r#iPnlf_u27nnuKkfhe{z8IvKMhEEBJXORK
zeY&5qpD=;5qwgqm%qEXRsOeII%HPsMYNV=%TbWjB>^?m1%2!213Z!pl8>Bv5=J*7e
zUZKF7)f}{Yrk<pFd%7Li(O8pi{CCWiJ*7~`DQhJ`VUDXL@J=gFqU`<VwN&HlYsT=9
zC`!^S<#?IZ0!NYLRg9S?yq9)IkvXk8i{;D1!JmRt$5h80fx;<xTn~GxzLk1<s0Lo@
z?RdjV2PPqg|0v3p=%yiCvWwVA`domcXv$Tv_|$Q2I<9%Nl-LG{-7SI79PTJs<8(F{
zJRG4mz%;kVT$jSFWW`l#Sswo|rzA8^Q^WjC>LGWx4#CL~XjbB?B|T84=W8U$MV&<M
zD-Gr&Y~49+1X9X04o#;U{B(}n?)Bs&R*!a$+NsmrTshMJ!)M0AO75tAdN0)v#INNd
z$<VUM0-^_*z_6L3zFWGV``u<u-jh0Z2W)2y`i+~*PJnHX@ZY(wsGkMHF+*@@Nyue=
zC^6wk)Lp;v=8rmEe_&qOf|BX`d2of5G3GU=m~Iu_?+91LA$)jw<n$PIiS$9p<Ny42
zAgUy1(`G-Sj!;?sBQoTavfxFHwbMb%@>vI#r~(nohrZEHsZMA-pCn`r*(<txoZ;e&
z#335g$p%*%19g&_k6<o>>t`oDb+@Nb_HOoE$N@~yw1RIkUeF%1T8H_W*P0GJAcb3H
zAeQbJX~vWHupd{Ddh?0`aqM>gz>~hkd-|cK$<<3o?tN{%#Ym5IryzRWf4CbPyeTgv
zY5|+yb;d?@iQPQC#cuBvi5%n(uhj*KBFT}Z1WG+HL+k#gX<H^Irfj!bKTY&s-tB@t
zcwn%I9hr<;U&<_}W!80ZpU@mWwM0lIlG~&<&?zuuHLW!wjk?s+2lj|7xnAVpZZgxW
z$^K&7B`a-qMf}cdsg&Tj7xCJqF#l)Ag@6-7_zH9990%vR_T3>I1f77E0%2>iJg++S
z^!axSmaPPDDleVoqkjLxL%i?XYRIJ3evUn(SE~u>>Zs+g7c*+&6Nn!yVJDO9lWH4E
z<jrRnQSNrALH0;4&5MYg_NjmYP*7vg#YIV{e~5=`=TC09_2>_YFO>w9)c?gb2ZFvu
z8Ca(-q70FS?lul$^@Cr7$@A=McvMmjyND$Er^4MCV@l_YrV+%MJ7EEoK@L*SmI$h7
z2IvDhlB@f@W7s544YLcT7Kck27QN~vEg=~eu)O%y@)}jogPLO4b<lB`Sn`WK8TBAH
z8UAXb-!Q}R%kKKNt813HS>`G?Ak?l<<7_m8S9OQf-Of!eVD{ZC4<LTyW`usov5?((
z4|$AnTy^#~5%{^mw`P6_qbWZrytbpi%@~eYVr5=}Sexn*O=@i-x$e^TuebyMD3Bcu
zneM(DWAaF;4^+#ks~%$f@Z8ox$uC3O7J{z?29$dU@0_kB0>yGk!T$iO-O|?4ZjIw0
zl07HEE2ahQh5Wd`n8vc0zqh3|p~?42=kX_eL#Ws>I($<>A*ztN<+Od8xh**it;yyN
zk;zZ~yS_MZ&7=LwvocKC`$ntR_C|>|LRVfYoP+6cq4+bbu=XgN<oIRUs%vx4igFx4
zfc>^5KV{$wws|gtDHYfxF3Gh(m0dRc)?2$Bqx`BAF%Tjd#tQur2jmsI)%=H!35uX*
zGmsRd=1zM7jOI#jU$}Ssg*)xr$CTo~Z2R=%#`?=C+o_M`gS8uRpUpCt)0%}%^#8qc
z&h~SXuTyX(>eYl5-O{&QF&a)d%rZZq#DCI(F!J1~7-hBr=)tA19>q`K5}{nV)@DIz
zMVj9|v7I#N+!*|_>A1#9|CPrVr7CRPE_3x>FmC0#8j>Q-lo?ZNfoD@!M<QT@)n4_c
zIsqT<;1j=ISp{DB6*=^ePRI?rCpU6{ctRh&Avf6pZJ5Wj#)JaQx}oFmLfxq!k6+$-
ze4ZR>tEUd2k`-y0*mIN5rnTTvU+$w$1pR`7iQpH_U){5|p7nH@<PcoYG_tH#4>FeR
zj5&TW@4wfxD##O|eSBG+T<|gfZBR7b^k=g|*tPN+#NBp@ROHpbU6e-e_qxsZX{$xu
zgYD24Fa7sVX`#l1H;@tDx1f6~N(Cqg^o-0SL;~Zk`#lvk%ueq10{6<D<rcA>%#r*S
zz%%11th30OOsf-%&M9Xw_j=p0J^lNC0`%^;6uThP+dwAb%rLO1gSTw&YtN?vhU_md
zr42Vw_|Dz>{H15x2tka(pD}GxJF#65NBVEmZ|+<#TgA5(L6mk@cz&yYd1U^f^7&~H
zH*mt&c7yi^Em$tvux~Y*l_{2)9cp6GYR`0>TR{4$x#5IrhQ7l}VNE@@4HGM>WnWYC
z%xJA=5kB1DGnJE)dX)j2Mue8ZBsN%{HV~kFzaT>zGUK|h5jx!}@Z=}>%2I}g-e%2G
z=lPEj<82kr&+1{jqdt(|>?utdzJx%!m9@t)U@{p6-XM_I^2N!lvU7dn?%|D78m!#!
zQtIHMnCgl4!@7-dfjQ6<hIr7Ytgmao8Q8BC`+U2uP9$RwMX|_)5FP#cYA;U`?KT+P
z6=P#q^SCnNJ@pL2QWp*FvR$<+y{yrkFG`!;IvkSjAZA!esXLm^m%*6@zyZDIsAB1f
zmFRf9;8%D{#cn2EB0o>@Ht|l?J{G`B9wa`fOm!Sm|97cLdtC*0ZFr(hxYtmfSxt?V
z{4sR5M}lzZ$8YxjN!`pVXYX#EHOTW^O%1g@2q?Tzl9#>Y5r?l&INK$##iLCfk7S=#
z%KF&Pzt?FFT@w-I_x;@t&|HoaMNw70M%}h2H0hYBmn0vY+2(PblqB3j{a#REjjL|S
zB8BG+Z5_k?_4)Q?>s4*2-VNKtK|4M2j(lV$$FkVEOpCic1QS4*$lPUJ(4S-WKdYLL
zC+DiZ$;kO-es+IOd~^$b<o@h-2k2ANgRQ4*%B?`D=3ys*Pq$k_qDA``i1$BGJ7#1s
zOKYPF7IeRTM?G^bZtE!g&Vn7MqDt)w#NlqW#Ch&y5B-lsi}I^5?^V-;Cd8~)L(JH;
zLQv|hgBR|r*ILfkVn3s(GUG)l6n#sSdOGBnN*J>?J8=Ew0plsf>v|SwH{N%ja?SZr
zk}b&g`fws}#pcd|3bk*di0o#PBN;TY+$2dFxoH?CJNmefCpp7i_4)Os{J85u`FMNs
z<)xj&G5lc=r!g(v(UHjDMn(N^yi203%1_0_gT>}D@Q>dWXf;1jx3B&a=@VBMXSbhk
z{c3+5baaDZzxrSK44sMZX7rPwBCSpy46!In0fzVdX=b5?sCP8l4Yz1LDHl4q-Qb?g
zmup9oU@X}G%mnCeS)}&z_jpZXFVW@+wOz^-zFM$EVM3i$*~Us*2VbXs{hguXF^GLc
z4?Pz#5OGKN(#Tjg=|(q^E&2@J;@f7dzhvJUD6<OtRP$2_W(=-uH%@N;FVZIjKs(zP
z%T_n_QC%(fxzD%|eopOFKiK`zB`GBQGd`EDTo<TVvATm0QMZyD(~&1lYFA{C)eR13
z3ksFlz^mTq{{<&M;=MG3jGIz)jDJ4>Ark)DG}%xPX#mp#SDeg>6COo!b4%vAw*|X_
zH0HQ#FY1RK#v&fl+-Lhf#RCAv2&yDGM2Zj*d#~S`bbn6P-NQlu{K?HH$cvc>a20bp
zk!G|N_`wYAx#;E0j~D!z7VzFS)bl>(?*4EHH+3y_^IOnVGo~N*CbP@ewst(zJC<iG
zA!eAzK8x#|mtphX@iLie=@5y>3oIv!82_=46RZu-AjgbP7^H0)0}P_q#yvxJ7aU7M
zeM%`MFA3{n(BgYdtIFE%)==+BF7{+NRdoDSS97K%Maao<wDH9l8&@8Z!dxaj)FW=4
zYR6^N?NK&nT1y#@^jRKVYiV$)8*W^j4Uo!AKHSiHqSiMv(HsnV42NiaqLRa8=YN9j
z$dZt5s~a<I*)j(MFbuihr{C~|e-9gJ)4%$O)Z5|#=YbRdzZidU)uW=ve?r;58?_?n
z%U~Y@qa4FQP#f{17I-{@&KuWm9bO}sKVO!ZvcsP^+1C6|=>xBMAvu<h4J3Wa2qnb2
z7dOe>bP^z(*$_g8jCJ4<u0)e#5`F0QV_Hudvy&QuC$H=guIz8>3_Llfaf0>NAi~w3
zJBu>zhv)?e7?%6N&gV6q_)CH|=p$nMlvVK=jwdfTwixz5B$Dy`ws^LjD>t1y@+j~&
zb!=Txg0T^mhOi7?)JS_x2B`F<I6+-x4I{!cORtoA9Neo0>x2Ap6`zQ#7tROE`pM8*
zE>La(FZW(Lno((oNq1}f%QF6>w_eCR{ZSaL^p|ft{C#}kH%+pvO4Vh^5Z__Sj8t75
z#Bu4HVBxlvU{Qd!$?q`gwTC9oTT;gqzFkmrP*HSHF<$+A8t$LfUmK8c_?xGiV;ZHt
z12O0|%*J1OEahy?%LX3D%>ygsoTXT$sfrN*6qC#RZ3{!H4X4YF@DXi(2CRo<7!e)0
z7JJ@>l;rs2RTaGpIinlwOH4oJqV)3u5l_u`BN*oSQ4cV<DcAEY&7Pl?Ia{HYmv(AY
zS?gByZ}U^Tp%y#7y_!Gmf*MXf<76CKg?Kf43U(Dal46{_vkdpDm%^7Wzsx@ezU2eo
zd|-kbe?M72`R6#{Nt3gAy2l<VmPpqA>b!t5A2(G{f<#JIJ{5hW_<sPL^wI)`CH6e3
zjvA%kU%-LD_TbsZ<fE2W-mjI+zKMwk#6Nq)Ci%lz>L4QSGV*b)4P%~ThFkkf8E}P+
z+au-QG<5|Tt}R3BoOGZ73!06-i2Q11=bAd33F^KF*XOlkx2p7mHGQNZ@TtGwT>GR!
zN%!2+N0voKz)*y0hobBntask`k`BG9>KGO_VW31!Ugi0;{5Km-)W`G$&X)u+YBC0o
zy}*?Y^?xCmFK6_sp4M97gD@z453b?}f14OEQ=fQwXZeWM&lebUiXbQ5|5!{H2VoUt
zxx;X8`DgA}>JfV44{RYuxyCm@pQBHy2&%tI($pfv|NAh7z$uYtUq1O%Gm(Ceyt7O6
zrOl3DP`mQAHp}nRWaxB@5}rtwpGaMwlDeVe^Gx_7_^isq0Qz&v_{lc0^;UJH=c#zg
zbFyzB(Erd89SLMu)r0!6lgPSw3s}f#6hDBxr%o7dM9~wZr&l|X`KOQK3_`CJX&FMA
z8LzCGc-4k?OV7+LiZCKlDnhL8th&@>AKx4P2<7Z&lw-9+bL;Yd^MjGak&ksGCckEK
z2nrN!YMAcsdAb5B-!Zpq;VmhRh)2(Mibvj)v|o~!0lqlaIiX&_!`%^{aKj#Rvfje3
zJuuSAh(Q;x+u*^gu05CI4$%}|kPb2Id!dJ8aUC396xEz8*EJj<L9OeMLd$7YX8;~o
z`U;M55KdLXpK5zDjX7s>!i7xX@TNjc-W|@exAXZG?#>jm?LW>lFY{fFC1W;@-Z6u9
zMZg4b{=5+NbP84fhhUxaTlCt{oh8(m_bV}SH>9s_nF`bXpL`iHQgA<<E`+<N7B$%4
zvClUu`OibKDaY7fyD47&BkZN9kpDX8bXuR1_}~S#VDEnLs|gQhyAbBsODn7~9^AN=
zcl~V6|D<j9-S;>M5k7`F*baYI#|vZL54hqd=_7c+cc%EIC)h}Qg)%8+4A%aP)0hIN
z!R`~Y;9K|P!%c11Id?6l9}Z$u7(3nT>6!&iV>brPl1V@neqYDp$bsnRhf-n#r;M;c
zkTxrNQj3{&<(bZ<7fBY4o_ZLcl47XQ>c&d@;hcMq5O1-LdA*eX$RUNP^N|8jm&Xqm
z_mYXua77*oXaT-YZLQZ6-YcR5t#yL)V_+o6NJJOx;#c>C!pPm_pZM50Im~Sqta$=D
zpxL75c}##!s{kcP?>-D$EeXhgtwHbi`Hx=^P6pk0vT*JVMirLl&IR&<Gk!N^+|R2B
zCNzS^f3>nHiIye1xI72Y1W_TZ;_}10v)eXjB9E+B&rh5)%Do2H2L_W+##8!6>xCb_
zP>rezUMn=(O0iD#QsL<L+Gf;mw6gV#d|U#o@g|bg(W?ZEqw^@HG-Woyaw+Mh;*Qg<
z;2X;qxC2exSHoql8)Q&_%faG$l-A{D{6M>!gB-7h70o3GOm)8{KYlQ{X{$Cc-ga$W
zdMQ!6eF$w-kp?Y9b!RW9wRddg-ybOSsnVdKH?<<g!4kT2@r0hqh~LcGp3~tC=sXZJ
z)*JZDk)ttx#o;mg<UGJWZm&bSTibDN@S1un=|P&b7gMLe5E({q=j0RFyMgo*y(aC|
zf$(=QXL|rTBM+`#o1uhSu2q=PD*0mp<F|gW`bXpZ+nN<IGM88J$ygL|1iSZdub;a|
zEmJ8LUa#Ho->Wv`4BdL?XJE6Z(lbS{IVQY(Buw@W%XVNzKkP@9JB4Mj(XRQ;{<EAm
zl^8Tp6!>L)BD%b_kj4K_ZDe}y9BZC;RKd8v@Buhg3#5BJJWV4w;w!X$RVAAGG8dzk
z<SHIRJ7K25!LbnssqhgiRg27+alZZ;uRI+>_jJi;X7wR%ik-Tu{{&(#*j;to1gTkl
zwP*W-Auj`@?KxZJ%QDP%#X$R2VAJH1#B{6rvd8I^cOGH-=Ep5Czq+CdEZz@>XgLGy
zK!1|URA>D-0`d*<$O!DEJaCK!1;Tg?VwP2Vdgps_OWtX}E+!@w9v8Hi)otf8mrf|M
zFi$*v@=;>x^bOQP2JED8qCD~g+*OOzMv`Qk<+}9O3%BZ0xXYh6#AH2c$yDa=b2V;t
zQ#Kjq_KgYqW}|x{KmWKB5ZetX(E2V7jNjr?jnAoQHM_U5QmQL7e0y1v`HnC>3&d`{
zkdse=O(6>JG1*r#&opnc0*m>Z6_s>btF^o$SY?YK;c}){@iRf*UhQnH6Wxz%r{e(c
zr!`AI!9rlg7AZ5e{5xgPTI{VpXjoFQhp>7$QaHBpuIb{3+6`TSfGl9Wa1!u1dgBM1
z)GC6D?gTK-N=N+3c3c7%1o%;mr#B1P>bwCm|F?bIy^6+eaW&66-GeQl(zLq62x3OL
zO$-5|WRJg6H+|?_t$f-GvP>$qK?b$v>vs((kv^rl%wVMpVj3CP#6pWH0k)7gUAtac
zxVcap)M${QK<%7Pceg!*nulRWtt#hw;j`%eFTs?}UPMj+G>c_kK6f_P5uY^Yle0(m
z#q))g*66eceM$|P_AoL+q@_8bPC2*ur(YCWn%Qd2Vw3abO{<ZPWKjHLoFZ+^y8oS}
z7eq1$TA=8Cda|IHRZ6)BSVZv8_u?lfo>J^Qi;21d-1B!qOP?U`as%yp$k#a|+-qjF
z`2Ir8y4k&(S!Dm7bPvzhO6lc!;8*`u*po8Lt#AgHGLrVN7fe+_S40l}Lq281?dIE3
zeJF{QNlab$k>aCgRs?IqBza;u{p9n*AoEVy>69U4uQ+hwAr`ghrE;%#KYV^JeAW?Y
zm1VxXl#buTRi4Zbb^gB&W9Ci6YEYC#UdV~@J3kmnb_>_vi#OnlyJf7)*XVYu?`FO|
zag&BZed8ey*XK9ET~B4+P5t};dMVa9^UmrvITrWM5~AqDialo?^Bvk%#n(CS5})nh
zMM511`3eilU|`Xxmy_uW&IF`WZ@s%^jBk?@HZM?$+B<6Zksz@euN)5G|Gd3ekZpHe
zrP3`Ek^5xv<k>gQ85dITn{uJ=klq^=eO(F`wNGTAuPI54SpoM>oe0wcM$p9m^w02>
z-JJ<n8}M7iMtG}}JDOD}-hongyt6y?<N}Stk3PJ8?FVDqaY2FpHH|vwS5Z0YxV!*w
zSMA@;j|(QCZ47PgmfsH1vePFyK0)<_nSwU2j4HXMhcVS~HDQFsd#*bP57-=>Xa{Lw
zPr*Yd{pDJS24;BM*N2{rXcbSi&;oZmGLNBS%FDMby0p^>2R>}O)IWvkRHmhBr4Skz
zI$n78s8}$s#2(0CZok&V!#UDMcPdzp=W;Gw`x;Y_ShXS^2iAy%+no4T5irg6beTmJ
zfst|Ze0>;iU34#qkG2(%7aDIh(G`v&{;;JLK}6eh#ix5cmgRm1_)7Q<L}r%GqOUKM
zkJD`fMZg-N<;dhATGsg}Oy{=K>jRI1Ig^GoF^^PJAQRjNqJ5~h25-7?h9u%*KdMY`
z<b$VlbLo4MXRB!4`jo3?N4>Zz!YMbmB;U{ORonJXb+K(v8)b!BxG#H61oCISu6dRe
z94WxRGCQbGlHpN~*`53DEB&SVHTD(~44e!S136f?;wjQTrJsgB+%00##E85MiWk*<
zp~OIhM{&>dl(Sk4?&vKMA5B>@OzK12OYynwt)4|qB12km=w9SuXvQ9J2ZXYOxOS}0
z@T`R&JFs}jVvG0lqkC*Cg3CurWiS~1u{`-0OV`I`tN%%cLZb<FaHp|*GA6SBD<5v!
zUPU!}UI9|VCS3I&q=`C4RJFPR%0_K7fmjm6YiyhH+{<4)%aU9N*$zj=12Px&tn15}
zAAaABx&;<R!iha%2G-to3$pe#+f_a^ctu0E@xVU{iaU1L#*=)(7rynUPH}sCWXDCC
zt!`waX>2w<w&jPM$bTwN^Fp>7#L=fUpYty(y=w!+ss*P2v-Ltxp{^FdS)83=iS(@Q
zSrS^*;n<^xH#1Vy{dlIB9k<j>B)-cRIx;3afasH6qG&8?XZo{A@~sq<!EUW3;UQ#M
z)K42)qLvDHmn9jt8fI6basnbWK~<|Xq~xfZcD<jw@8ZiWXZejZh)<i>RJguk5+{B4
z|K5g>SCQS_USQwj)kKH5+!EWRjN$nHLkAt?KV_qv2PUbgp=G_^{rK(MPbN>U`WS+!
z!#Ad_ZZhElc3-0>n5!kQt@+0gk|&jF{nXAoo>9o}vM!96y<I5jqes7P8jtOu;NB?2
z$nEU=hJw1S0{qWD?^rK5Iw0Ry83&+kTKuR5VbkY8s>;(CuCKL+kbA=OU}VL|KZrva
z#0rg^fU64OD8oL><JSGfyn#7B(U)%(gMHJLcR|P_)Q2X!v%vYv1|{QLxdl&);`-Df
zoy?yA@+rebW!|J1YYipGl{~g6hA<zD+Y{t`wa>_(pnP2Q@;e1``sFlPtuG=M^vC<z
zwXK1*1Jg&=Tk#Z;1{&nXOn3r#+PA2D>?jDcy>;8fF81E1M_kG~;AYK1mi8VkyV0#t
z*q4#8LGci!_8;h_!Y^A12xs82wnRq<BDD6WN@P<U88UY2m2r4>Lx{#d^VnMq7;mWm
zxQ=5zGa<X<d_^ANRA{ArT{m74@#?696D#m^`ieo=9y<ccJJDI0iO*)NQy6uwRd-P#
zj=m7QJGh0ZQ5kM!D22GU?#EIGPRC1yzcx@P?sz1^uofLJ*n7y!7fR=twd#ZtPj6sO
z?^5x6qr$;}uN?1%fhHK%{g!;qiuykE4^phLQA*y)$TjANWE156&2U^WK`avY2B6R`
z<9$<t_lKHSHMI&K8o?_1yz6~$jfnZkCN=K0$VfBD)b(!0!QVbSdXFlJs}GCk*;&AR
zBJ(c9TYf0bHexyzyE<sAG4jkb;8w2hJ5%>Ij<V@?G_i0qIobF%@#8|^o<sLoNyu(}
zY+M0)Ib-$h62o&F+zFR^<I|YTMgUIIop3z(_VCbu?P<mJlUTfR{$k3-`UQ?V?IuR^
z&eVZ0<_zVzqOzcu!saA$MK4~yqte2InKE_|--)wJ+XiaPyxNH;E~8TM?mRuZ+bF~F
z{T{Wdr>08-UGU3E7KYPxu$7?DV|~PYC3j3^OQc)eW~KPK1mR=q<%Lz+?gRqmy?CZO
zMu?8^vWy(}m1&^+aml||6K5@}H7<T0DWGnPG%Msk$M{wC*mzR^@c)kM2@iqTUkbDL
z>K`1y^Z)Bq3I^(FpbzZ6Go@!`KzY+is~}qr&-yO<>4wE@kF@!U>642tA1sDcrg%qh
zfw>ahppP=zpcD_jcPa~vstBbd82t!qf9W4<ggiVQ2zD!t{F^|FAwQr^7MK_J8;5+j
zjVvU*d$sc+^>WLFh}DTv%YmE`j)UdN(U#FJ+Z74)1t+yg1+y-qVNX|WAFqt>qP*<x
zUn!F_jEdcM`}drlt66vL{oYiF$#%#A6)m4!>|uaph=4UWf<GHbF=oV+M&tw!c5bVq
z_{1?y?@xbJpqp&}dZ%aQKn*Fr-_ie(!{e^fV&VJ;H(M-JEP1dq;YISd5Hd+4tfSzo
zgWblASf3YCdz;kNY8z@RJ@*xE?{`&)yyGfi-U{~b&@NL8K@psvO63MLZb*+7Y|5ug
z-e*q#TOAjgGI=Wt2+6<dh@0(J|Cg6isy6D&UoTHzg^3%^<2t84#!_AKV+gu5m89Q1
zZLl5?#}D)N0Fd*WHE(1vO(Qft0?~u`Q1<v$&7;}u<Sib0rU(dVw&WKvye6s@+e*W@
z3GPSr$^drw<|(aBzfJ3QSFvKNP0M=fN6-ETji6HiZ{rZ+_wC~-;tB^y<cM-d(uTd7
z^lecU#Sh)~<fUFj*2XbnLbYg3;(EUzfqwx~Ip!ZH;2|3F36ThCuFsJi|78DA_&179
zv6?8}(>nT6AI3PC-IP*p9V`E`cBQ9`1}Z}J!1U!_$P}VYZS8&V5%yMpZTtpcaONq|
zt<5V9ltgTL3%RAO>(@h{eqJ-9&$~6c#h&t<lxc-dKHE>UoOq`YQNBsRe1qotDw+Jp
zS3W_+ed`qtni4lBHS!|D?C8r&DSIGB4=r{y{n$(lk8|X`w;WjgIE6#A1QO4KrNkB4
zywBsA<7FH(MjXmVC_dhY2!*#rRXnuY3#9;_Bm(I+?jBqqNYcwyZDRxT5yAz-Hfv}i
zITDk{nl~H*pUg~<KGNeGppN!6jyMGStRY)9IlpsbcZp{+4Lhoh_gRk$(1?~tJ!=Yw
z3~`0g$$twTqtoIchA|i`4=(d%XW3+OOay*XYW(}?uI^p3`8Mj6&FjRMHfmUcOTZN_
zXkR1PQnFUpUFOL%V0e75mjB>Ip3@|s$g(8;oz_UPygVb3^fzs4`6E3f&H?NKDsv_F
z!?(stLk_sIQTotY2j6dR&ZZ*6#*+7BKE!PY_?|TDxIY0qv3HTw!u1k@>P1RD7CV>Q
zBiWNg<|L$xuimtbIY!kdp&!H&_yg6dsM;Ey%q0tV$zYn}u4V?>7W2EMuum~6xOrJx
zUY_*A1o;AC2MqKYN;I8EBGEF4cfI$%{OQQ!qAd)Gq)hU3{(ulo)Tmzc=PmeG-FnB5
z#eZ%>uW>R^RM_>BHz3ODw$Y1GN5T7%caN)AeG1_@Vx{tXVGGu<al$(ocoD!=4BMS+
zw38J|sWQU-G)9MRlMH`1l#JHX-t6X3D$jkXcvOZdlAa2p6+ZlxgDJt2<NEmBzF%`H
z=<F-4x1I(jM~o=lg8b6VS8$q|g6konZgO?b4SYJ{?^Z)CQ)hcY!)web<eHti>Tfj|
z&<b;cBddLx_({goS5bmQK(P*WIO=&dm(ojgCkp9}DV~2BM!L&t{bB#YMqa<%NePCo
z7)X)B$|7!lslI@?#K!w)k1>7zhcw1mu_nLI(k-oV*j;YlV&-WBqVxrN2GSIrH}_%<
z^#{kkB*xvQx_=cVwIvX7{Sw`$RLoxVFUfndbh&A6iIf~ep;-qwTf_%fmZlZ38#mq!
zR?U)d5-HN0o92meYQ}%}G13}h6!q#w8_}Uc;P{bOaaRK+bW*96Vk;qg5JLiuq9Q_T
z`Fpz@aMQB3wtT$0pbLK`JtbL*JngibvTY^ah=){OD9#T)<0#K!P9Q@M{NBfu6A%8Z
ziYHLbdys(+xJU-h9_XK;Dop)xN1xf$gF72%7WZmt8<j#k=_$0kiu#D?7JS#d!tNnt
zuhQq(#<O1e)4zlg>hHxkI4KlbLZ;0wAOLfMH8Apl5=C<lZA>>zBPi_fKK{gAYD)G7
zywUzP@$xkNK3dAyn8<4uPwb_`=(nn4nTn>PtRC^Z#lV9)Pu)Y@#@QG2GaU`D4%KkG
z)Z2or_)GJf%kZIIy7_(vJDk6M?=hEy9TgY}GE|%B^z@gc2h@#(sn}rfPvETLxy%s!
zT3`A^<x0)G)s505rGzbB$5#_IvPWQ6eEywHvsQyQBBPm=9}gTysW&_3UjGR@IRi>M
zUrUBx0F`-rsol^4+K(Ie77>|Ln(`lA5DDcQO^HsU;|Y+rwSESASZzS2pYd|cm`Uz#
zO{qe?6+!v}kz5;|UBz#`M*f-fc*6%KJIpCYg06Q5SOT>QByOG*_n20hK`DQ+>Fanq
zo_W!2?835X?R82TsJH#R-)!zoL996+@yZb(y<3!CJMEQIiZ?0592dtSlIMG?d}xJ~
zLS417<li`N^&_vuOA59YMr5~7mqutr3HKAj!$&(<D_&4vy`$K)+fQ3?{&`(JcBA`K
zli`}~uoes5V0;W{2nb7|?w;Fe@y#P)*UEKU^=CoK7=m4XBlSI4-%#geJaWZkY6y7R
zL*G9Xh>XXIP^d>)6>X6c?qTorX?;V>+Lyg-wh|{$%297F`jj8i<V4x-o26{A3dTM;
zS#0cQNq*5L`6M#*1{F5l@`UJ$f_)^v^osnp(VM2ssnO}4lX)1rOEeoNFCIqZrS}ll
z<;%_U`fXxf3za$>ot<j$n>we*P18VdrUL@@=zY^p$WnI!!ykBj=H*KI8|sE?2Cp;%
z8b`0jrSS<h>f9q}ls*avyu6FKg!`!1y+1&Je)!Oxh>h~Q-6`6zZ<Cy~-`Y37-BZi1
zi*;w0W|1lFD*47DYbf*X?eymc7hmB6WBaz$%M7)n?q|2X^th`9!xV=!=7HKp&o5uF
zQG#o3EXPQe*lkJ0VmwBRsArPA8F^G#x>Jep{i>d2SZ9@yV{g!a3g*gm?Fb3W-BC=g
zyP)t3t+^KWdP!jGrioTj?hWm+g>+Fsx;~T_toG$d*LBZzB$?M$(yaIU+__i->qj<h
z^drzb*x2xmnSB9muUHZZ$U5rHMn%LrqNXk0dz~7Yd|a^1k?VR07hs8mHnThmJhrBP
zR?9>7;9k}pUaV!K#>K4ii}I#RiFA;j?ye{E3sz`%1ZIUW@?*ap`Zh^O<)MBz!{hSj
zsTSY<WY4B0*@I;ZYyquvHCxp8@^09q*}`xEdK;yT+KivHz`Wc|nBmb26)ndL>~l59
zm=kIu@?&w@O6nEcmtqSJ5j8pOosYTLWCs8VJGms?6IDI6{Q5Z5!Ke@NA&ek+mi&0`
zp}&GleU(FZ3|Woa7G)XiXR?AVZw?Lm(&)!_dXpnZe*#gkt*+vv__<O`;-<|&`h3y9
zc<@Q?74-m|5Qg3A7FOlucMWjL)F^n#qV?bwCGd2}G(I$AUE6Da?=$FZU2_uR2+1ci
zPk*s-bl#k_(-p!P{;I}oWY{u*$-z!GZKr<}+9Bw---3@A{0(}&iqz3H=}71XILlq$
z*b$F1kUpnmc;k79Tb3c<!8KNEy4FEDFnD#<2h{p9NCdK%Usy0)C|k@ZhS&@YoJ4++
zK@GUoMvCORwW-IYagZ$v#wylc+A5ZG!daS=8E2Nqce;CfEFj5AboZWeH)L5bL68Y=
zk^O?m<$A+?*F@3OsB&X({huWEPkV}(gjAxK1B<94@8xKrkNnGuh$@tR|96-KA!C8d
z2%onZg~@hW^9IwiV}IbbTHPVrI{}#_0QJZpU$fctgF6P*DR0RG?Tnze+eQy=Yem#k
zyeeMgV8dA|V{h~=g)jO}VX^OQuM44*pS+6mOL^JtkL?;6U042#l*uir86*J&Bx6j&
zGi-9ub*@>7bVNQ9lg#S)<_hWn5ZSh{Bg+^4Hn)haD?-W%0Ht^7H=!$Fkm<iVm!W6i
zv~~gFEGl&xp*PBK`)^9q+}Y#Fs4AE!pO>`^xjoc{v8vN|Mi)Xpn5%emK0<5x(B$xb
z@Sm&V0+L2)mwgv18zyB9w8j*tYj~GXFQRVTh_2|gV3EXM<)UB!f$ohw=ad0`n%(5L
zUU)yY4&S#$;(T7fZ(nl0;s+RAXs+3Gt#{Ekrg`?>0YZC5paxotuLko8ztW4O()v1j
zb;mKv8#|IN>wTOL2}_;^@CnDtT|FA@Y3dbY90`}}$uP^TcF>*w=OxhmN8pq49)3NU
z<V~feiUfG_3i6l1WX>jRUMpl<gpX)SlsA`W=*=Ej)m9S7id@55EV%BFLyrNSlFW&c
zZZI`+=d4S}gRJAYnD2zC4l2dQfE7zN<(AdWqk0e>XIM>8t=b*09frAhoa&d+w6Oe;
ztx{-vnz-2UA&=G1*I%?~9FxCFb;FMYWr{55fK$?g@VL%@gvdZVkh-YE`Q4r<h9jY}
zev)&Ek1)Ff_JE2stufoN7KD)V2Ik=CC-|iL2p2t#>%B##ohyebB`KD;LeqElo_Y`t
zhL5AXChdd=8lWH8ZKs7JHs)GmK9>;7bvEZIt3~+Map*1Y0<V^oa<fa=eiQk}R{lOf
zYqhw5IqLbmm@fTIX291Qg^E@1eytZ(g?~htWvZXSctmKg2-j2G|AH@tbB%{Er&Nm}
z=R{=722Vg$Pe5xP^^q~xx5e>4z03m+YQrBH_gNf|=RE#j-sT^^u9(ZKr-SDj1vdlh
zS|GKK>`2Py<uwE95QwQlcbZov8q==}ph9+WWef={QB_8<26ZN)%aXITL0)QBjMN0!
z_wmU)E+szeh3`+!9}L=XNuEcr4mJj|s>igDUR;$WN7T(`sS*BD2W9Yb`or&#d5()k
zm2yzq92^x7D|o(YB+@$ul37=v0<9<XH&lyC94p_U2G|vno&KZp*R*vaD=R9R_l16a
z$xvI=`4ya;V%Slx)BAHfUmfI82}!#pCp0iAS0WGP;P;!~cYy|qmA~}+xQZ&lUU^4q
znl)EqKbmitCc4|4{*gA5rg1ku1BU%J#wFAQ-Gb#UMa)hBq4#m|3Ho(fi(t8o@eDHQ
zas?>3A)5|O`!)+zr3oXeE{EL$(4M524%^{fB+~ixC@UGu9J5-pboNifStXC)+`Sp!
zSYiLBe5C7)=kFozEEX|=W|HKCkd*u@R~NzHCwabzofdG~pfZ;bWoTQaKh<>+zQcj>
z0<&i6gClGU!Ms$5r(~GuPUsK%d%#uD+WX3*Hvd->L}$;VDb$+umrg8#x@M{IyQHQf
z<;jD<pX6xI{a)>D7v(uW*%0ia)WRi#40>Q@vrkm(l^&&N(Mr7LjP&;f<p$2<RH_r3
z8O!WVxl6%Z!*x0Q58^b?P@0!7PI=Lnf4E0=66I+jKlc-9kuqT{q)eCJfw(R>|2+qn
z99plO!K(SJ_@)X!XHHi}zc>ElbNIlnYJAetKc~Ocv(_A^CTl3VX}tN$H%L1|tn2}X
z#`)RpbQksm)$HM%WZBH`t%F4|LA)6geKo1w85*TpVdgmPg7c9B#1d}nnn=ERqep_@
zygrw@ooRhJ_4|;Y5}6^#2h>gMkudH0;<)iQ|B=(j(6*Z^lO$y-#l<m<iL@>xJ-|h#
z6<#8WG2hJhwR(|2l3XyvzGQs0Gw;u%o%P+G$AW(UH2AosBvr2|kMA|&vf3qbR)lp~
zJ)nx<^5#v|a1^)V5zo#j#=JB&>Rr&B3JJa+K1W%{o=X=O%1WsE5qPg%G{)}mIe0vQ
zOl8YO2q{nhD9~TvIO@zA7eZZpF<S2)3-g#T-3eJqKbbyZ??-raw_UNL^FNYxy%PQV
zg7cgML7D4&$Vz*=0nZ><Rma-&AKoJUD$a_E;~b}JncIxOu-yYMg+*o?!in|<`q(bQ
z6;G#^yT&BT>@hac5diD=kf^uV-KLOY#GfD<XrWdvB8-MpeGo0HxhqkESS|g+eah2l
zpx?6nT0KULKIl7T*%ZV)u|enPzrG?+Ij2}@ejXjU@sbbF2#-0rq7ZAlR;V44%JcFR
zJQ6mZzJOGysYZU_I>k8`#UifjLS`M_Fw9+Ck1KpnQA`2a+av3^dzE+|aT8?N^E~8!
zlxQDAARtGo@25lJoQcyb+A7v1H%8`pbg@}*wpXh+_jMoQd(ydrIC_9lt@!?Te0=Y&
zDWXH{Kx$Fa>+MmUX%rRoE7?^+z<+qbBOjM0a)^mDep5<I0DUI^8vDGvlK1c3>F>sj
zLwIv+kpLri!J4K4nxs)lW07~ezM*b9D&URafNo5)a$G?8*f23oB&)bLFyRhfl0IOQ
z>>6etUS>eE+urG4KHa7NM$j@RILg&(&Yepuw}WDr9hLGop+etu-vK|S?e<V8v0}?!
z!m0G=S59BNZ#Z*&`2nukuyC2tw8&c@Ao_XtUjbTYcya<$t2wK?WB|eV(@ja(YhdMb
z)+@SHbpIJzp-<x1WIR_2xw3pZoq?W@`t;}F^sM+A-gCX2pVmusSCbKh%h~?v`fD%B
zVD=_u=0S^R=T06Y4@e?%xv4y#xcHdZnFh&7FS1F8*5nv{k!fW-D#?{ep`nSS;+?c#
z^asG#lpn!NH(gG)J8SA_RMtrsDx=BmZm>LRU@4->O-QrIMYxx_UG-I(yaLgV`^QQ-
z>G&a9^*gn?|H_Hknn|Dh9TknBLU_%zGSvs)?3goBI|Olw(l3()7w4=wOABGv8C>Dr
z<yj@3nM-mL6>p<0h`H!w@8mZhligsBJ|O&0mfsUA5HXd<d8O_>ck{MymQbX*T6r+N
z)*3sd>+6nWR^1k1cO8c(X|S+4usJPHeYW7#i;vS$7f<E!38)saet3$ISKK^(*MNv+
zf%?i2XI^4tZ?SxcAF}u~<kmtG;YuK(Rwp<5zCEke@s*|dy>e}5X2o|(Y0Q(}_Q1Gi
zs<@)i<OggHO#o96hoyq!z9qRYqoQ`I%||&0yGB8-+-rbksC$OFolbP^ql{kra-s(<
zdRs>c+y5Sw&W?D&UVeVu-z9?yPF2-3R8db#)?CR-v6tNdCSlQ+Nq2{v-*Yl^iX&v?
z$KSpo%#6|9aSInu2&<Ob{u1<n3h>hR&-?X^?FdLsr8(Soc3Q2IDx~mB7Z1jSIJFJ+
z*NmXj!o-B^C$o_Tr-=5cQ!FM82Irzt=Q=K^lpazYLQqRP?r6-#i%@7H{M^&Kd7Ww>
zd|-j>t(6i%IiII49WfKL8z`gl#dm3pIc2k8L7qX!)pWVLC8+@vTJdZ^i9G+0Q^i1E
zz1Y-)O8BO)<Ya)&0DC7#2JbYc0|mK!ee0q7eoOoL)<o1$htn6ERup*ln4}Qap@I@*
z?(h5Z4((|S#x|jo57!ch<wjp%`8V9o<HfZ`@ivXLMDDt>!$CYFvw2#4(xe_eJ!Bom
z?u%!&b?c~-CV;^MCkn6~z`7_zStDRA>EgCZ{NJhu(DU89l(~#HksTVRh+*MJ4tp$|
z=7`V+=FPWzp)Hd|up4oOz5G#B{3Z5q?6YRhD_zoSY*{W7Xiiq^6W=zf4gW5#Eii~|
zaV`-H9v4@8DPBo0{>-+GY*%}H=Fxrt<2%`nuOZ$%(keq&KtXl>W`r2=HjC~e>W!(G
zV-lnO$cv#+p;_=^sag&;<|B8f@%_z=FFxNykZBx8l}V0u&t(*17TB2QEIpN^J=Yi<
zh>>uV9r(ch$I!`{^Pp1m^O6Uz4Mm_*_xH($-j_8H*$SWt9MAHxM;mI^G>M<GLT~pI
zr}-;PcWw~_@<aP_LJK%ErqBmt^!^cK*qDt%`NI3#8C9l51qVS`Py0g7%L|?WsO4oy
z#ikocCs*K`qUnvSp$9JV`<@4gi!5;;<hdy^?GRa7(<Ob;nP;)@F#Z2W(^W@B`9ED)
zI;6Wpq=f~9rMsjhBt*JfI+q2MT1pV<R7$!VL`r%^Lb^d(md^L#`#bOdoIMYpnz?uG
z+;MzaejzyQJm!(LTgP?oeUhsY`}|4jm?nF*&tw6qL9iZs_1k_?;e<4(6%y`A_WfYi
zWBU`WcLI3aMs&0;4XnlPuBPevf>iCIIQazocuN(l5pza0+A@7Os*rT*^UQEYe_F2f
zlXgwHqvFyF<#M{dG@3qw6;`V(%@wXM^qc>|n}5!s!ET+!-B*0EY0?RW2)Zw(aUP5=
z=IY<>!QL*t`brWP!chJqeY_M!-)aV7@Y)V~>X1X_S*R1@UM0peU}&9@dVP7AN?K{T
zXoODga$CF*2Id3z-%3pQ$f6<Xtwv^WMiAZ2dx~(AqV*LqXlEa5KM#poQ=b6WP)|$$
zf}JqGEeBRna<lPSds=_gSJHI*sn`ZvlOs_>bOX3mVx>U`^o<kTr2f2f9fCS!;I#&^
zu`G*{vf;3FdLfMYfhw5BA5j*GHxc`4hi;ZQTE!p^+`WvA=k`SIXO1s>G>7<f*y|)q
z#rR7a$dhQ3nKkSHN>xI(<Q&awP#ovqSc-Q}V3JGEFi1H@>#Sv5Es@nLVcO#WRL?Ga
zb*5Xog&pr7P!etif`#8JvtV_F%I5r=jgN!vCD@T0w2A(RG*CZ*2gRx-jKJK?Iq8&&
z0#jJvn(QuX4L~btDEnymg;KB!+3q4!tex~7BfU3By_tVJS2&(R;ZSDT=q68^BQ?G5
zkPL*Ii`RG=ZWXh~oc6C{mYqMGU(<F>2CLU_t?6{2=);AUcgAqEMzpt_=7+2ZrTMiN
zb6B7@?T5B*(5xIEY2u%CUGMk<>us?Wee-;p11DykW$l7tgWtk&w-N86)aW!I(buTY
z@RBxu4yZV@)pK4-uArP&nxgaNA01i&BWNgE-}Yk9!4;(E`$R|Yh^|d4$am`S11_>B
zR_LUmShoDvSs&D=Pb|q^;s?^CfhUgab~+y%;yok%Nbf4zFgB64Ad+2CsR=t*>(J~A
z&yjnjo2e3+{~8n=J@C1%pLBGgs>iA0zm~t4Zm*d(?L=qbG+$DR{_{}XtBwf(xvIsq
zsOi_0%0((|g~(d$4<Hd1#70MHC4bym2b2a?BAF#oWkI30R16%5O{lxjs@m~|Lc#sN
z`~inJxys;KIB4MSPa)#q&Jl-7Z7Cs@Jm#u5?*k{=uHV3<7H@v|rwR8}E9V_>uVg5A
z=)wM$W{aa9vpCGKRRpi<6+QPqVdFQ=>mb&Ro)2ATxu%DoZ)#yaS1w2xwWcnF-l5e~
zq=yx=Uh~9SzT0KrO6M&~t#br~dw%JT6~UmgO(W(ByFUswWPQ#NxzergU+X5#NbdWX
zdl!y-aTNPPz2dsis2D{%*M&0MCeG{#y$DRkvHS(m+#zK*5ctpjr#9<oPgNS-;?7a+
z`EEliAC?$4D=+$;HZpJ0V{~?)!C(Hg|K7L~hmj(XLA)Utw;kV(v>j(UG@0H|0x(06
z4ctmtap}5UPf$9&5ea&*JH=TX-dk1FV{dqsH{RdPqt_<<#dIcht8aScWkciX^C4<H
zhZ>&9cXr=~gi7AFQ7jt2D6M{Xy471*b*K=w-0@fPY~!YzWT)d~tYnAoKmUD)lnd7D
zi1W6r>-0(c2NqSb<f{eyrZrwcaMv&}>+Kte9c9lJz@`lB1$2YPXRpJZZXcq*2zJC-
z9NJ=Ov!i9u%VY})YOx%(+<@w6gI_KEP|DA(f#zv_I<jCMQ`+)spo%!5-))&5!Ekmt
zb?Dvy>5-M?z7Di`Ye3;D!?Qhw_R_+_bJB9rX^JN}0za``#Ec5=Y_<$~`X%$M56h?k
z5`s?==eg+ehD6GUk=lee_r|-$N$<cXj(8&>s-kbn4CGZg8k%83TXIKClb`*a>iJ^c
z&X&D1iy?lUn{EjY>{RL+Hjdub4*bX4i?U%!zvfsU`ugc>R47y~mbYOx3iuO-ryUMj
z7wua43OUC6@d~MRA!Zk>Z}4xp8WDgk`@ul4O2l0nzLk2MFv07Ce-F>{!%AIQbBo*J
zeFa96!@wLKM|3BA_HEdg^sBz1TomMHaA88HigoWiy92U*Nzyh;(VR74!Vgo>@|~as
z+9w{k{0E|KEa<hf@?F0q7Rgc&DEr5cUAmc{k<lf`$L%t?X2eoQJf3s5nW5uoxBL_L
zFRE$#a99^V#GpEo>uZHiV^(pSA9_yQv5)&+j!%fqpDT4mYJ&!yM8}@EQ(LU(lqR7X
zu^vJ1LUXBtTQwF=w&?Y48Co&55`-(XIL+^K)D>nnm!Z1t=CfDbRXFUG`&ym-l6!e}
zQADnqdq4m&^eV6$ybApk*IAcu*Yl!=bY!p3I5PxqmVa9`_Sx2zmGQ}gDKLyI&u-Cb
z!t=V(e!P}p^1#qXJ}@v7k#(0`ZU~mfcTQ&^8gL-BtR%(CJIeX5S{;wnnA0yAc6efW
zvVeqglpkR2+n@eadrFit<Ha^tSkZ^yy``ekY>$a5jxksDRYIxM#$2aIR9wxRmUtuD
z`$^T>i_WO_Zv#3ZVK)0H#!V7v2QAC*6)q1ka#%ZzZf}(WUm}mUwR2=R2&MJHS0Wr{
z>>ATNpKbcz3jwQAmb)HHd%&$T8aR8!p*0K@fPprXE8aW0yP@5`cXVBXXAOH~^!cT9
z1u~RvFVN0{rYMUnF<1C@7A>$=)+0OzfTmT-hTPZZ3Ze<D*xN$6>i=HED<0#|E&Eza
z1xhp=Ee^B(E18Fdmze%=f718+SS)_BwYPo#36})!fJ2s^(}_6gnCfk4kazNPcIO4?
zB;x_GUW?Qh(<*5-g;Uj*##4L?jZbX47_W%bNZ&FZMmjFNs>wr01#dtot!OVo0m)v$
zi{9bT%)u^(|Jk)VEE|o4=SaRfT5jS>%`xB2Vs`3OIwc(Lc@03PQ9LRXx=0}}`SAnI
zy%UhTU?ZY0<xK+Ia9B=drV$<iJ;5GUSqktO%?dQ$-!m0Fv=GFc<3-yodnaC|LAWV)
z7<&R{SB!5Fu`o;gj1Y@khiLS~1=1A@gK6I>wsN}02n)q*k^G9f>92($La-c2KyJ+K
zf9oOdID$lEdHj(~Boq}k)u3w20>hJTl8PABm%g=vB-97DtxAEwp<jZw3_RemJ>;l~
zM)U(PsY;XNy<gT`zvLb4{bdpORr(c2fmTwH2_x}yju;K?ou6g)FxFm|CvX!!MzjaT
zp2&t-luN5H!&mPpEOfS+OWfDO@IBSz@I!$~UzF;A$r>Nfrb`&O1+ir`U#+x?WO#TW
zT_M(sc#xUt8gO<lT7yz=Fqxs7ff7)iu&#NGCl(Y>s0B<7r6vYQ_y@y%6Y~xvakes^
zq(i4I(Yd&IJ`Tf3L(?7Wt3Kq=cERb~XnH<y<`pzaE5vV;{rK8l(@pncPDJiKe!|(W
zMqx3&fWn*XmOuNlep)MDF<M1Z*~gw&N@P|G$xRMgB7~N-7tT=F;kZ9CH%e-FBF$sm
z7tsLe^&qob^8sIHzCWCA(=GQHcQ>b8xd(0U{ESpd*~fxOEu&H}cl9z2XZ>ZaXZSDE
zqp+F~UtsNCP+Df2KrTJoXq#~*-=JvO)+Ph*iB4+A-_>)SfZdH}z~Xb_Mjd;G8Mh~;
z)AC9MZQDZ7w=a$V1#UuYicH_D0mEB>sC#0rr;z&xFQLbSrf_=6OY4LPXMrm1#e@`2
zGfSj@z&lZkbp~yQm$>UW71)$`W+_Y`xGXA==j?A{KW1=s@=-R-ga`?&Mw6>kMZpI|
z_O6c*-N_t$TZl?%r+Q5orYH4*8#&}61+L`pknaRVW<^^%D9)XwkBZreMU!q1;q8gr
z1hWroep~t>rEnD)`5S!BV-Iz_sC>AO`Z;rc2o2F5@QY9W_~1hy9J)F2_7Jms=nL_+
z5#^MHv)mQF##?12?uHZmVoU<`4?1n<E5Tp5SM)M*I3k7hGLhUX7LGGu?}7jv0CopN
z{d9qr)Hat-UiV69^-tq|n4PlkiUDqBrP4SiGxNBqL-2ZzLHoU-(~IO#N?r6{eV!3<
zfn}YILci_JvffF`4^;9lVzw&;1>e=GBy1(@NS?|*t74Z_UARCzu4L9699@bnYe0a=
z5Wc&ElS;qW!rAZ_cD7{HCz0lAc><zAK;P5jFGQWY$Cy9;g?81vmz!H~k(n6sX_8Je
zPij3!bEtS-Z}X@*Ih9J|wwC&$e)mceXDT|EY)4Rf2pol=JtW+>ITcObqR|o6oL}#k
zjMvSi%Fjc^80$iF=ry@l^oIvxvaUxHl}3OV<96yuri2dDLnG>h2~Hh~($3%|&{<1i
zy*z$y<8~^6KCnD6ymII}bqRJ}s><Yr4tUndUOpg}=B}S5sa&A?17a!D&{N0IR>V^$
z`~CU2j(`rwRq-IDn;L%$@jAosu``JS5b)P?K9Te#edM07R4R#blm@<f-x~fvPV(6Y
zu$7I|+;EoyrBnA)^o#VU+oM8#lPe!`LO-s#?ufmjs1*rU#&!#u7O>zHKOzx6O#ixa
zb%fUVm1;eDX*T^hV>owEIqg|5)yi_vB-J<eJD7fG8_U2vf%w%;)9hBgW=&AslCnIl
zO_$tqBqvV#WKQHq!3<Tb)rS5m)nrIW8=})7jOt|LeUy}-?#LNZ-<%E#SYs7lL?-&<
zbNt;I!W@XVU=dJ~1f087^{|h<P>~O`)B?c<-LuSNEVpe(GDnSAoBT6bv#P54&xhUt
zTl@<tRm~>Qk=eg<L!XkDTKv7{tlcG@BsGaDzg)CrE5!THCCa7A460b<Yo((*?tIBS
z3;}o-tveQ1d=<%bpgNSi>vg=YZGYj$*<Vnwu}<@U(nUIULd&JNZO+G#0mopyZvXg0
zB2{JOZo`e{n2f~TL}0>>G-X)VOKOM#*7!M*qe+l@_%zR1uSQrv%jza)0V6Bn9XYLq
zV@mjvAmN=_3fi*EsXO0L_z0d;M<MkZ2-qX4A1{i1EpwoM%6#skzl+%^C0A)zy=Mcx
zARUV1*%i|l(ie~1ZHc_2nOf!jweqG8CDVs~u|2%<C?WrL?_s6qn`TQIx&*@8Yx`^r
zk7v=FXZ~zl@#jOjJMn2wJ!rGE>u5{CT-kBv%RXT_>E&&yUuVEKcd$Et!^Po@f<IBi
ziJvP*4lfh*`GALUrj|~&b%}7T<M^iL%><>S)(0xB^RwMgN!>nC!-8XAwj(rOG+K;n
zuYpg$HrTW*@1IvRGul(H!sQxlN~`Y)^hKnq<|KIxj)O?53Clk3>2A~EdC|9d-Cdx6
zar)g+bjlG>Rk9mU@R)uG#fsp>E``GnVkbx!2q93Wb*fCX&znSQTs-UHRUZ|=)ZByx
zLq%AHtk=KWiUoNCQcd&k-BC81CEmYV|G>Ifv8pnOOs*_!+WynwzMdm+!p{${E_K$r
zkH%LSR`}Glu4xP;lS4j)vC%DMZ_w$KFU8v#J^Cf*Nya#7ao*4{W~@ULwfi=_22>T*
zKbAtJPq&7D&4Q-KzhI-2n+I$7B|93e6bY?vjHv-{4TVB9mLl7OZ{Eg~{>0h}%V51j
z2#u$l&(L?}L9+Gj7jrkD$b7kKGwne63(K|M!I+}(YRI+nhKZN01shne6x*4E#F)^9
zf$S>F5$9++(;20eJ;E>CE0#9Z{@)0PYBBUv@2ygy)4+F_6gSE@)CU*$_*|+3=vO~9
z)B%q&4R-gZBmt0cXUp8P2|^e2%D52@28AN_ndHV<5psjo37PtCX<;DFpL8Nzqgm{1
zsQ#)4%2<v!>?jlkbNVF$fjsZxk0B5#;O7Mz{8@fuidzy5@USMi9=Y+eOQ_mE=xEq^
zj#nn?i_EXEE6{;&V*i_+;1zGjWh_crIexIJsLje|lvG__LvuTI!qN+Q%!O17L$^~@
zVIjcI{@=wfZf%&KeXu!ejNqZF%N$yOW)SY8nPUxYK+(uG{U2JKir;I&D@WAZk8pA>
zfn7&uX}M<R4-~&0^Om`|g;xiPa6rsm4v3C^4omB(?bAUNCi4}B2DZk#+R9)`Jz$j+
zmdBq<S&7m}Dr*g~_537rAi8fvNSVPr#WmXmva0jWCiGyBYzsij!Kvz!49Irh8Hc}T
zxwa-p(5piT(M~9F_C*hm&<@Z-kI?KWg``!YJi=ve6gepS($!gSpd*_8m!bkcYC11!
z)DwE2w_@<MVw}36K7Sf0bzQF%=m@;4zk6e5N=E}#euGo61laqgYhR#oH`O_B`(edg
zA<=8dWVx4r^fOKVX#44wV0&0;wa4JOfc7Tx#Ava1fRlBxz)`Z#6*KSd)7JpH;Y3q+
ze@*LvTJY5o(stD$1&TD`cJt@2R*GxXf+1tDha7ONbX>GKF1FfWjqUG%C)<IqKaZ~6
z2ozkTbdAcnt4mkRuq8Vl&-|994QHrQ=_Zye`NIFdoWNO`g5MXnJV>b|=kH7W)U-fB
z__#cN{@h+*gF1NlrKD)@1*l7YYr<$Ja(5{e?R@_lY6dM73xlFIu?psv<)A$-V{*(u
zjfToSVTI22Xh|jO9+kdj7=od!i4Ww|$tA6(L60bAh>Ibxexse>FdnI*>qK>oEwJlh
z97`G{a#*_db`Yz3bd;a~%SKSjk=^nTD}+#OfW3RF`w%9T$)s^60<YoGm{+UuY^NLG
zq!KxV0zta>X(|OTeBPCZ0>S>tW881Wzo&>kmObVxHjfShRi%CR2i-PZ*qd4rMcRA8
zO-Q3IgQlWpZo}KMkf@PhpHhSrDx@W}nZ|;{2ca~iu$gGjtyhJ;zekZd-x~R~71}q}
z0I9G6%&-XDnJi=n@9akal~m92cg>X%%zmghU9n^fef0MS5G1TwV?e^FaL*47$LfuW
zQ?yn)CBhDSlRu^$%PFql6TWt&cAFuQby2dT)vZopaP*)DrX_o)nbsNpS7YF<H2VEq
zVF!(FOazaU;HysolC9S?Gp5J@<|^`<Em}@O$z?sKb1<riEAxU;@s#u36Mu974nhCY
zQh6Hny!S$B66Sa92nwsb0uo_o760j^lQo`|TbUdDZo&z{H-)EI=K|MR%I9H%kL0gp
z3vq>S78T;cckuVWUAnC};vG{893%brB8it;_M>e>H&goSg4Rocl<xTa+yXa}D29+V
z<fFr$xM%z@3CW-woOwEIFk%>3{~*82YLD^SQqX_A@<1uoQC@pwB0mDeA#LULG3uA#
zl6}=cP$LIV;kM7>XG0HmtEm4M6L1x18La0VgqFgkq(PmZJ#v=Pm<z@$$($DI#2d!D
zaJp?U#!U6gk$s#ZW@z(hb|`_#U01%0=3gt<IZ}{bLOyZOSG<_i2R5WRr$@@`>I$NI
zNX+X~Wq<y0fL(ktEqbs2k>eRDGCLz?m*%4W+V|AkoW8!R)fjbM>%D@4u&k)jHVdNg
z_l)I0>1Pj)ZLgvBN&m#^)eMdV@qUQ+OJS7rud}|XN)S|WzGjiJ-mb}teo>C9j<?9x
zz|hEd3H=_>EFTMqPsjJL`brP2bo{&8i6Kx-L)1^?a4W+y<1Ata$y9CG?;l_Vxo-P#
z9^s=@M6WNApqw{1JYhWS%uxkC3s6f+ak&#x;`ibzyAe?_J<81}M08#wL=(h`D)cKp
zRDypX+J-O&kN@NCv)qvUKG_$~I6)4iJoKNHpr=%|=A)E_ur~&lA)n7S+z&CGY5!b^
zuK2Bp&3P^sW;c^k=NavB6QW#@GiojxF8^EYmf{3?ywrjdq%Z&Y1>mmr9I2g~K)<|k
z0gi-xib{t)2;2AnK}0@pPYMRbK=5aTR9HO@4Ihxv)c~wgmC|YYryzKs0ou7Tv`@Ms
z2jxgb<_5QZc8V4aCSJnJ;!WNtZ_g!%A)EK5wnG=4M0KjuY?P<=c~A2|D|@?PcUFTR
zbHO9I)Zj<XTM{BNu^rgW{5yBWLX>n_!-*VQEM8Z_3bqV_%JxtO=0}{Sj3g+m`pU<4
zRJ@~)1#eK({i#y9F7&Mwh5doH#fv67jILBd&n4y@?kw~jX<=a>wO@gI>=S~Ej49^r
z1>fU*ARYhPE&E%uafuk`MOQp-AXK|>Sz*YEt2PypbJAv0Au_7y4G&Z*@Eu8n87Cd>
zO}A;VX6|z<p4PxePu7S58jG7bDc?YVxg7+Fu8#V1Z!LKE=fiPb9|Za<L;q2@Q!$`A
zsBP<8Xoe-w8bnLZVz(+;pCDnCH%_BB+-xT_=bI@#!CwFQfNU5$#o8ZuNl27%E9_*z
z{gR3qqSBGPK^>T`fIXuB3D0WBSmG++sR;b2rnn$Q#gmA0w;R;qq~Iq7<%Xh3Xi3^8
zf_T4*!E;u)>Ly80Z`NyxWRG}L*6Z>dk9eN)59p+3oaXyd5i^`_g;$~qHoYVuuc2|j
zr~FV}l612#dH&aE%UF#{SKzMi!pVE8X3m~1zx!?tcrB7_cMrPvX1&F@5n@;6=DC8U
zacovw-0zO^?dMh*gy}Xx459C+Vo5C0i7&~A1f@|f17(qb|7ucu+{wSno$Dhugy@}B
zPYZ_b30{iU>t{(#H%YUz8Qwv*WCFfk#<6^9&P%$4P!1*vAe2Wo)hL2rKQ$edb+i=1
z&A4+VLB4$*F)jBe+6e2x3@EMi3pdUc?%89?Cvj|aXk<v^W$#>*3YhPPpEw?Ak?7Er
zXVlkH=gLDH;sP^*?=-)IOWqzy#7t(TQ+9aX;z9^61^M&yT7ay9uDDEs1YyUJa&)fu
zy`~<`VClP;YC#&jq3d%1p{SPS`Ex6LS=p-(U9meN#1INd()BxoEJsfk_c%mxc_8!j
zi_$3#n{2=Tg`#0Am0YJOnOw%gv(Ls($2YW4&jp-zJ*Yh}&N+@27?|r~iR*5xbK041
zDA$|I9?cTc$%V&0aQobD3^GvLeFW1G1QLye<WR;}CcUKwmY(d!*qnHtBI2Q9rN+dD
zf|L+sP8%V~JYmuagD|EEq;=?`n#hirqK+ow;~&j3tC2s6S8uTS-T<S-bd>V8bCaQ=
zM=0|wsN>ov_Dkg$67f09l^PH?o!+!MqrQ880X}1UGYUg&YN63s^}wv98imMQHInz2
zy^oh82K?Pm;vEnB6V}k!(A;VJBdlAJ=qx$~7mqC`j)c&ExUj|~6(R}pRPY6zYQbQ_
zICdAQ@!F!%HUVN#(#@#wE_kI76WZ^Bt`^~p>1C$je@`)LZ*A_boi~oVb5)@8gV%}m
z!T3$y2oM*3j!AWcA~Y^#oEk+6!ghGZ$FezAT?%D#c|+F)M-ccq&zu+Po(sfOIKrH`
z`EelR<WI8PP8&K2<Fvo{Ep4mti#*+JVLP4yS-EHVtb+@KIRf0EVzNB((El!q{<_D0
z`@O!s>3WU_ac~CjM;icY7pknV%x)jVcDGS)QN08^k@(kfyL+LoS1S7j9~6MLoH5EJ
z_SkjC6pZ{@{-CC$wZZyeE}`-qV_%$@+{pyi<`|+Q2l$Dj&))Bv=*H??-jx|L3<y`4
zU^JIsYJaqlEH>JHvjpuOdA*5TXpNLq0FTqfoydjfW=5SCKSw#o42kcZk1>CqqUI$*
z(!R@M&oH3+-E&9u9I}FKJxE%&EGAus<S?n|!|CSrK9$aGHpVLsxW$1a`X&7vNLon-
zu79CKta^~VVZW6Av#so(0&^T0X}(=G@0E3=rek+VS##(uXQ1$0t?!k3lg(Jx<<?Vg
zs}!85FAR@Xg8?9vZcHO5S$Z-D(~rEM7GUSYGr05Qb(P<0!~#iw7p8Mc`5USmnyuaG
zkt(V6NE|u5$U&1*XtiYyL8sFWg7A(<Dh0y-sOK0WjsB&kr!8-aCt0~fR{RyL{I*<?
zWF=Pd<BY=&T5hnoKG}Wnx2F`(sjJd4KwQ%UV1||_F|WV0N1pYKZPF&OBtG*L2Et4_
z><AIKcxG;HXLTz`3m*oG2p*3`gwf+DDbK<qL`0aC1LX&*1J+~!#SJIT#59fclD!qq
zAo@kfR(YRc`Cc{q<V3=q)aTb!$^!f&+mM`2CUjVlIC(?+Sw^~h(#680x!KVx%Jzh(
zZzTBT%VbDA#g8#p<@SQL!v?+#f-jyr!_P2ZYCfJvId=EgGpHn^vqa=fe6b`eF+5}R
z=x^S~a6jm+NN`e3Zd_rplD23h8CKgIZU@m0^IOXIgw^<4vOU+L6dik~baT@km}DjT
z7Yf0U6rT>5UZ!{PInW2xALM<hFe7ZYG3b+9W*r_BZrX#=<jmS%>NPPeF<&V}=6D6O
zC8CL0-iA#J9HK(7$fYBu1I~-V>p5RTz2Q=wNssb?4O!n`NN7^DOO(+B%^uC{vjk=a
z7T|)A1mu=~j9R~oxR}Sx_m0~86|oLQZzdwI`Y?^MRp~jBCXr&enyus?bu2bgWDfx9
zs7a43enQ35KR6=)^IioAoPoqyt*FtG5KRSMOJvWm^McjpK@&@+@@Wg_I-Pj(+xiM(
zAIx~>hubAaj5(>i_P(pp{-G|K9~%-P#kcC9`z3FlD244Npw-8J=94QlbR=w=MJm^V
zXOox`MVztx&sDVkfIuZ?g?JOmv~RvMi?;Rwav|o9+jx)RoNdTcf;_#>C44EChj=~U
zugnK!U9`w8iN<xIaGgP~V~Q2bwce`6FG2m1P0Z^NUs<o?(e4eMA)2IDM9oyQe6`S_
zEDwNiNKW%@^NuAb0Q`qyJhVP7-_ck&T8q)I;jMJyd*b&med7YMMd`wf?QW}`MUmdt
zZil|ekNA5>WG2fQlm`I+hrc<{1Ttf?nori&TqEedCMzUu1eI~lQvKC=><^DG48F|_
z?T8C$Ly1J>Y<=^$bZ8lgAHjb1EDB@)x|Yjne8dT`K58%h0VQO)-jB>YujeL(CBu+T
z^|><saW>1sb9Qn^H>C|t+3!vmR<D-=oKoxfDI1qO#M92-hQITcGoHFZw0VrXMtHKB
z{Xk~W7Yj9eB&`3oC3{zxB|2fpL?RF*tg29vz{aI3yq;sru5N7su)2w>^1MZ|J=)7I
zD|KKvmegM{sMNvr_DD(f04F8;t1b^MBlNho(i7hWRW&$=F;ET2w@WjS>|#gVE^yN3
zrI5KOO?w|5qEar|`{&EN7Z4kR{qUOe_E2!_c~E%5alfT1Z9T(F%xzX;)N2-{YnCbo
zXUf)*5KJpvzz-Z2Z=AV4&>V<Ai)M+R?P@p^luUX7B`PLbk}I-po3>}fUQj)FQZujO
z<WABfhGnOuYGRY`ID_!u6~1_*bc2U6ViZfMBd2bUT#9LmX%DO9qs6)oB7~qHSp5D0
z6r~GGsCphD#L0@4Ii9r~|Ljg12g#F#wEkQVSH-oQh8+~3UB|`!)|Q{AVEnMzLyLL`
z-4zN14nf^)tA1<>k=kN2!lpdy31juR9Iz?iHF2`)vclOj^RWZAyoN#bxUcIFT@qHZ
zW&(cn%k~w+3|V#X&F}Zh#Lx8Xu}RWhM9$$m$y3dCpMgiU4+LOnY0-F5bn2AfYXWQV
z<oP57fajTI*rkCfm*nh)bGe@q5zrsID$QQgbX$hR5WGtd>xU|i&mIXca;tt?vu>rk
zgrqReb8Ssci|Pt{OsNXZ?1Q-v0thqFB__OYL1|A+XWFX%aVL%6bTfDVxLo=&DJB8O
zUuWpPk58!yX(62&zvC@9vgsD@`>-yQo($`#Zm@bQ_dy@{H;khEn@q3`aiN!H-)n@z
zwOFr(+MYe@Z!TUEizur@Yh>s>u>OXKPA|mwqQy5|+?SzY+Pbb|4(M!}#x9eaQqLE6
z0Pv*kQ4_^?s+FEfE9_quMx+&-ylNrWDV~MF<DVQx?*jgd3K3mE*=i)p%lZBd5EMq;
z3xm1z=F^6(-Hi$tW165N5snrzG`L_}t~>2cyC~(*Sj(_?#;IMPffJXGq}MQ~WM$HE
z6XM`h_RR0~lVbQl&CF_1_oTPAU%uhUq6V(G#}SEjT^`>#pmlx;rJoIuw#%nu8t`~2
z^LDK=ezL5c8o|D`nok@OL!n+vCr(LbqGOmjQA*lXv2n@eoB^F-u}yAS8m%i$%(E^m
zk~GV+Z0iDbDL+rjEYxVaLSP=Em=mOw)CpHVarX#EiuRqDt@ZY{QY&34$bP$}_x<%s
z2`CYCMjE||$d0Ht+b}diL88wo7xs|?^nXEmgz)=Hta$k?e!N1^uTL<^#J^+m)@lTY
zGBXWVb?Ecf{ZQg2)lAB7Am4o7bW?{A%V2JP-#WCCa6^xU2_$;`K#{J#XwvZun|K+M
zbcNV&ryZb*2fb(m!NbQ&eR-&;6PO@SV>YI#EX$^z5EP=foi?dE4=>LY+@<@^|BC0W
z%m+^}C~Xh4O)7kV_YcxIF>+|H@s&&BeRf?nbssba{Yj5!tfl{yJ)=zU_653m3W8n9
zni=n*cga(fYO@$%WC%rQ59CATb<x)zFF?F5_#Q3D<@9fY!lZE$)p`zRY_hK4Z+kb9
z^_+&#zBs8PR_4D-Mx2)M0u~2WQ^SNM*#nc&cp?#g%l1tt=2?#XxXqLh)LGngi4iPk
zXymT{y=oSbi`zadX56ZJtm$`8a(J8%_gnUnZ@p8FhkEXGoHb+Vvc22PTd=e2>oiB&
z`725Fpr{CKLgg@n@Fc@w1`hVWU9&gR9SGRFSc%tj4s1Cf&4e8h#!+b1Vca*E2waLZ
zsWf(St{wFaDdI@s&7=Nczg;=2c|#bgi1q8K<#cVu+53X@pZ1K(bFGO2)vpzDGX=(K
z)cVJZzr3tD-_Y6jjx7z<AnE;xJ8TVTm?v^y9c*jt%|V<#a%2o_ck6eLPe`qs*Ef1m
zk#vMeu3zF=%nbi$6e13WH)mC`a&-EXO!*5JXmPEFi^7cHQUKlig^9;>3rZz#keKwb
zf&J?9U`^Karc+8}%P+D4--&xeBY)D%UpsZSVUR3G^Ti*j&rI){ysNUXB|ftxlDI!V
z_qKgmF@KbIW5TPnI=36I%XRWj$T!Pi)8q7*-jdf^=%YwswW6VAe+kL-mdV3Yo!;@+
zo1;Bx=zjx9tH-gXO9~(Cy5peTl7kJGHf49>-kqb--2q9#!%yuO;?78}agLA3U<x0H
zDi*JV!FXOaZIPe+b->(=g+1YmpkQG|MN&5!E2FXA&yyiPqk-0{ScJW9?RNi$-r$HG
ztGQZz^IJlBZSegC61y7bi@*Uj`Yi<no3d&&^A8{wK^<|ehbBG6Ert^3pt;J<Oa?Sl
z`td)w(-Z;q5F3`S7H<%q7eAiQ*?$1La1<GkV|USa)QwT@)bSlFug&N|vDInq8D-zB
z0`36u>%WJyyJ6kw#KBN(fYvR7`M357ClH)cN8#Rgs=YX86Gz-#eOBs94t-#KXn2@H
z9C>Mvtv7N_A3dn;LZKfX!rWn_BxG%7SLEk8!y`L%3w7NPy5j6+bO^}~?T#mhJI1kP
zOz0yN1jc^$sI0iAP*SWFb1b(^MS+P8)3y#Q#v+y&<qbcKRP=+1gU6WXX$+Q>Ac}Qp
z$DYolm4=VvW|a1nNr{R<;Pu14ehdA`M8VGM=1o823%vvAC{A-U>zz8We_I>MARv(n
zBn0Zuohlna{`}}BOxqn~uzH9HDi&362tFMioKqrWEn3u$0`va07n7;sa;a~!f)3rZ
zq%(oJV+wRpQ(XpRHqLLfVMPQCu*DA|Op|_B{wLiTWdl;tL#+}q8!(ohd1A`Wj#5l?
zuXzuppK=wi7>^$8ZJchApu03_1(<RN4_Dc}1Lkvut?mkg@q6MSR6I#>o)nH$<A~k|
znJxLz@^IBr+*!-wT(l;eG%G3d1N>aA(f+~Er%F%T)q^l^u?&I6N09&mSB!Gs#L}en
zc(%(-N`pAdsTnOGwb@o9R*0s0vM}TAB?v`pt*nHdelaNSlt9w!xZLB3_U$}AGy1j?
zLr-eoMcMA{T1};jHu&RgvOd8-H6myhkmX6OdD5*5;28Wnop{wKW!3>>Af#76UZ5=v
zXZoMDU>v`&<LmzE6y3}j)$vKCn|gamvA&RMZ^FRz>A|y@Ro?m>x?imGIFit=;H9%=
zX+YHIl+X#BViX|J&Eii$xuFUcRwY)+G?%nCDoFAd>_EKTjFj863%~w2;fwAQzkkE^
zvbKee>h%Df=Gi5?F_q!>oeQets<j`bw0q*m&$u+*v#1IMyCT1C^7OF03r_6*w+fSr
zW%gYovinW_831Rv{rsZDhft3Cl{>+wL9}fI_4HibL4{E$CZXv`Y4<}IV_?i^lORwK
z?ua}x`CNB`l4@d~3AbBdT;mhfflxorZ?^^A#wW*AXm$gzW`(ON+=R8vAe<3ud$%cM
zAj`{U3Gjp+svf_$a<3mfP#lFaOEU{Sp5gS5brTui^velJECZiF57?%M{kw@HMh`^L
zL*B>Sze1XtbHoUydcx$fX(8qDa9siiiF!AFUIDG^7O-1-3*{xLyL^x6w(y*poB0SK
zjx=G_@9wm-ch6QODHEgCIygjyUPvn(JrNPMa2?<b6A3keRe*vqQD;!UCEZH~Q+N?J
zoc#UYWy<)j0iEra97fsGEyr;bjN)v5(|pX~Xcdhv7Z@$*60goL2M3Lf@hd}9mKoO^
ze#MCJq4H4M=c3MnI*zPusC)LFQEu`pbCV_uHsX5Rq-Zvz_gWW5>L#rYtacyH_MB&;
z2o@|f5miwi410}!l2i9F+Rq)1nW<@^o^Q5$W-W8^8M^j^Gb_#0R`eJ31&>qx>pQxp
zLyO=E!Jc5HE+2Cqk~*3Xl?Sx>!E;lrQf-0&#a2&ol<&*Bx9HuEUL(|_SmJ6OPjkS|
z2JdrtKAtD`dDOA~fjAll82D~{*O+YyMHU!mrCgbCQYFBJ<XS8_<Dvq81XTLJP$k=3
zO^K4)hJNJ5va?%zQZ+1d!O-(}l;8`hYme~ZAEHg3E<-<|KBT5Xu1#XT4sLnF*EGLj
zxXpqfD?jC?ptr_PyY5BPfqyD9wrXD%Ez`firnd=tk%W&Lj^fO^q?&g9WhlS9<neM3
ztE0v<6hczrHx2JvPAugMgN2T*V`Om6>GwUapp}C)n6wAkdJlI$9NZX~+B<6mjIGqu
zm;a_DW3d8-fPdRBrT1U7=<Vs+tn%~(SWo7)?n@WmedGlNi|f!gtwY!fwCd2@vpyo-
z6>|NnMN+dMJftwHx^#(}t#1RfMb5pq&y|(pUtmYi8hf$)$oUG3^_a}@VSf62PU8=H
z9JH;bQdO5dx~CKbeg-K$vPjj@28dm-L<~Na{5~o^e*KX$MD>ti<<E5wP;Ym@)nZ;9
zv4KUhNKaClVr9Dta=S~%WuC)jGdDyEd$;6a*@^rU@9g6&b}OxNDj%ApxbhsaEb&>(
zlo)%)=~ntBZMK=8O3@9I4h}Y|*O%2mqm!k<+b{PsEZ!O-8&0l*i5rcoZTcri1G?8>
z=l@D(AK535m<^`2oKNDRcsT4oX4X0?$Bl0>XTQPz(c198tZa+Bjy+kH=_9AWDpZi(
zqZjH`S4rH{IK3z<b0AcqS`AovRiBd#`sTOx53@h0$9|chjf$B&ftbA~0JQ;%5gKDo
zu!4Ikk|VO(9-kbx%xtkhq*ma)mEw;lo+pW=c02$01$4zm3o2Q%cW$Mre#ZEW=CrIl
zpI8!Uco-4eS3QLsSd(bQil=Q<mrs94&{|bR@1q6rt^PwsHT%ZhUhx0{C=R{yr$dgx
zri*z5!Y-Q(2Kl;fb9y&N2ffLek8DP6I1~npnZu$0@lQ*XlomOI;+`kt+;|NnW_l3E
zpSo@7slMs%@7Wu@Y2VuYc6hea#zpl~3+biw%0^Ttx77@fsOFU4vjQ!nxWImp-EaH0
z@c#4C?A=%2rXN`Aivdm|neu{VH6+#y5wQ2qoEE{C^)zPbZ>1_e^xvBpnU_7&C8;dE
zGu9&2HPel5APRNA-i_t028P^>%xaBJ@rkoy@~ErMB4d-?*p6jG?}Ioh&x04Z2?fSM
zIJZv>@n*^Vq}K##$!U@v(*eC$;%+wLyX%7MbR*ojqK2!_h)#*V?PsT`jo|Br$O>L<
zgHE^lE`|1*h_5qH2*FH^ciHGDAV+goiIK_rg~Tlb6V{l9L8b?m_?iwID*C&skDP7_
zj*wCjduNe|w|nRDx;WP_#8Cz~Mfp$|L3Px3KFU2WG=<C8a(?4<Osln#yQN1HA4PkU
zEYVOoo~EPh!zo)DSfR>%K@BAEw=#XdY<ju;vL#i?G|8b<;W2@77o{l|)$vhRWkH0o
zn>^;9WNrW_&Rw^TdX3mOG4joVH9$OE_unuE+;VN%?Q0gUp4}nDM=iaBwmerTR-^~@
z4xu}DgMYKBWLE|zjvDacF*}olZG+a91T~Ppcc6b5H#S1W2UhjaXqTY$k29I{GPG9F
zAo+lQK2WF5w6t$S1Km>*%UU9+Tk>ny%psQbW`ymuv}up4DKv;)|Lh-Abp*nfsa3i{
zHb~A#WB^5)shx2SH4AGbT0N+oWl4!TjAW0X7a0ESK~_!9-@Vf$ZTxWc;^k7DQTPsu
zfqZ|DG^oe{=uSD2H&;9Lm5N-8p-dfktL4-SO}heH51Ga~B%%89{>yH^#1MFfyP5t(
zW_dmr70St<`Ui$Kapk({1x&#7Cu^oNVX~4;N$YsxVObnE0b7zJw5lzMq)mD(p~UMN
zD51=N+Nkafuo@MwDk^#(u<>eKqLx^@UXqT9%>J^^mB}J9;C4r?PDI%891p;ehDT7+
zs-%#FONP@!0lU0$UsyUq%BT=u#v8ApIioo!!Dk!%wAvu{0QQ5lZ!INZKI!<YcZD%=
z^Y<N6E0S84R#)=T7^Rze>ozG-OVC`Q=-7@3p+K;B&2dzW4NJh7k?6#L*u{yZ=)Oc2
zyDs`GrsPm|?Ct9V6uR7JSwmpr3JfS;<PxJJg3u7tk4aHGJ{fx$pK{1W%w2ehHR~hG
zg$uy{Fj^Z+eoa5(H}|@J%*`zN(LNWnHxqH^+Z`KBQu)J<1(Dk3A<nXWEQXA2A9k+D
zU@4(36EqQho4wQ;zb(nlbqdGXzEpe)px<PCKh0_Yq8Jb^;G%Uy0W>vK&^sTct$KZt
zkN$+|{2$Qgbb&A!Hu7CgZ;>njou4jEWWr9cp8X&wQ(Rkf{YM1ya$EjlsEMTazXp1J
zrXm7@(;R=aV|r_u-QNQ)5f|8Pif4q}{2w%`&y3x;-S1h_iKm`@Xzq;v$D^AA+qvtV
z>BufS;rMl)#yw%@yCMW#=_5lG{krAT69C?0k!)uf{}dc|UIlBz&FX@C6=a-Ef`TdJ
zFCHZ0YQ_e+IRH-P2T)sNA9-rcQImjhd%c2Pwx?}E!9yJV2T+B78uTdPz>gvAQ2D-~
zbmO-YK3Ee%gxHob=F9Jowqki{U-D@qkY$tHklwX^Jd~oXO9e_4s~fV!nx$uB>Wj1{
z*#FYXwfw`f1(Q5tjBclnv4i$vU)@j83F5B1o(}*zp*RnFU0dR(&uA<~t<gnlSJKLQ
ziF;{%B@#x&E59!h`8*@7;|$>-@hrt%M<}V47}iZGBmq@6kXF8vRn+GaK8vU1R`ByC
zY|1C12jSk8GSI7$DJ#oL0Xt&h!@sfTeDT<)>9i(9<D(8hAkWeZLUo4Wp2#^hp$O(%
zBd1EWu-(uDeCyHe#X_xgU@J?%-H6C68LW9~MXn^IJK!HLEI&Scmg)Jy2=Zm|s3o>P
zy1+XPdVyEXL=t8a>s%zKZ;tKGC6Fsh-JBRS({8Km1eM9}NWX9xY2HReNeu{GxtWrU
zqp>rC$B57pXTK|{XoJV^O8P?OwL`|b=?1*BYERV6tvY$jUa);b8P99a8vZ#BcSRY(
zy2hy1)3o|;(9!yr6?JDoA_|-5UyJb1{QldX@Jr5i+YL7Dg?e1Xm&!4s*Q_I<(`IrK
zs(~BOVmg=t7w<hvd%8u=cl#&Ld&$Y{Y)xZT0Za{OlF$;bE{v$R{=^*5tt(RZyRzSF
z%r@J}KBFBHJNPN8^84A--}ZpA=EOrv{vy`cS@YkSO0Z5+P*fmpe17&Np8M0*!$=5b
zwAN-zWHLLN&S;AMHUwU+eQ0dYw~owOBP@VcAO63Xpsa7}@yy(ZS*d*Q!r8ul9yhHI
zs3{HJYwAT>ZIXUK52r7V>HXbA5u82NLpdvkt$B02XN$E0(VPdaD`D;KA1yh#`-*zZ
z+iJuTY&uNqCDCw-Gd*HEALwt8x<iCSeey+;4|NTPHSnELUlV-UdfBrFCC-~oP$yDb
z%8GVbn8Z53s?_p7bGGzPJ8m6ojb4jN-|kYxN(y}dO6PxQD6t9ukqr4uPw$BEJyv^x
zM{g015-;zqMd1W$LYYS?jKMF%@F%%sT%C&w)?PG{^oG}Xna^0q$+zh1Z)o>iv1XU#
z@TCIXr(1==BhlH@g;3IFl+C{1mMHGe1)MX}SU8I7-zd#C7o%;mM|wHbR+BZp9UZl&
zuU~9NzvQ(zXpY6H((Q`QIRex()YF(H>ktpiOhF6rSyACs)qbX)B5Z%F=o;gHsnmOR
zf!WQY+fw$0V!gT?|N0%wp37Hu>Yh+=-STjQmp%5{HtGqdub{QgA34^x%T6Q#P&XTU
z<}`700jZb4;1brbc?tl*WD%=q?%uz#E{BtvBhe8gy!~jAg*X3}-6wMb(nCWcndLIi
zY`&1*NB~;AlS!N`B1BdBR()y>AQ^ZKRFe8Ac52~XC;cR?ZfA0l$~Ap+P<6xRAjUki
zygStuY43jMe*$VF03lIaiWMBmsU*5+XM1KPj5t{uV)+qNu-h5orDM(#_ubG4Q2m@d
zJ+|K!v`v3Pot5<gPIrjOAa7~&8m$YfvG7bIFhGF)I=DS{`sy{abG;J+hU=cIu<aO?
z?BJZeqq;(0I4+|%+hs(*PJrrzsadryI6z{i2koFg#^s_jZjKi%vQ|26zu`NTTqG4a
z04m&sp^MR^zjAOcxsM^Olr~p6<zWic%Q8RLUFZJWdLZMXqMkJzfxXMDYp0~>Q`%W<
zc+0#W$a=l61BImjLB-j4-^?ycH@fxOUb279rv51F{Q(S+%DlGCD%7#uT70n%^nc;j
zOKJs1z1sRdN*o-|A%R;w0{^}=oWp6E6>Wbf)|*O}Yu3Qrh?vO67?{uu3Z1UwDUx&2
zOZ~1TXh;yPT}gttFjESI)>poL8k{KlHYyUvhZoO^5kfeu35QL>-z%>|9B`rqe38bh
zI*;d7v%wGJQdyxZpToDTd>_3WYOrl*IlbOBBg13#H<CB+lJi(S%rN68%2Tg)TZLsS
zSd-w$6yxS@#HF~$Rjt40i^h_@=X$z<hXyJ0)-?pxP=LLD$(UkChkR~X!ON?jL09Dx
zcRr&X?>E%~P@3wV=Wo9CdJ_kipZPsvUk5;hvjjb|m9O_*)I2ly_kboLq^K@6fKh%?
z^@nl`3g9AH#k!~NiHPmzyYqHez@%53os9RJFf?4cWe=3GAC)4eSP&^$o{kzyclYEi
zpU$7GC5^(p&wDrdr_`{@ejYlVejCWD_;g7(bre}WvN_&A+Co>HqUV9^^>`%+hs;c|
zdL#{(-}3!O1sdr<b!?-!*q<5}=q4z}*AekoAhzGEMJPNnf#z2AEAz-%bd!{}^mdFO
zi_>V;S&zAJySVeO)s*xnJpw5i5gjO#Tv@RlRA8H)sRvXwtm_0t&CN&lWXor5$#ah!
z=3sOF{rNp3P7ozdN%MD;^&rRk*I=0S7sO$|<kX7T3Uo^5W_~u)VYC1s-Za7LJyK>T
zWVs371#qu9RLMp+c?yFmo_0^uq9r!_M+xr64?cpCT2JYKnRpA{6e_c-#KVNBW#oQj
z3`edEixVZN4ONZF;ydRy0}2nOGX`BG?muazo<b9=ScGs7#A_Vd6<Q<TuF!IUq_Ge)
zH+u?|5ur=J+>cOT;kgEJGs!k>C+bY@_uB!}jfLX)ahiDwmdm?&OJr`$>y;X~syV7r
zV*H(+3LR_dbsvlDl15P_M4(yWF3DaAV&!}8P@js=5*wmZV`==<>lQHe%!*PElTrv2
zpj{Dl)eL-x<!(rS_gVR(fG{bv+k&ImLNfp=f=tIVq`br-;qfOlr6oMPhX3z!>0hyV
z_zy1^2Zb$S6=cOPEoJiDhvTBiJ1f*+?CJhuga{SnvW4o~T(f$PEGwQKC|tpfFm8F)
zGudI30%Hh{1ZK|yqHhIf;Yw+=+1m}(=#Z?R?O~>Tb<EZNVTM^JmYYod8R^SV`+CA>
zZKa?4w1BJ!AvyOm!73C%d}pBi0@cP+{B)nZt_npU^|p5hsT=d+(*phhWkhp+_m%Dm
zS!=@kSsFt=Ssr~GA)h6uZwHKGeYO1j(7JGb!wGxF@L-q6t;+J*uwR>AzfkId*%a`(
z<CdWrH;;{X;<ekK8WC^0e}!%g%%0`_(AG5mCV)-7X^6?1cQ!6<mvz)O+l8c(zhUts
zY#!JV<g51im%lNlP~S-Q<L7U;F@2%Q0^}*#+K8H^`mggbvZT?l?rWvoG|0E^gW0py
zNDC*I20=b6X-4%=K>ru;A*Dp?IvsIeeP>5$I3Db>dsrMbfH`7Ki%?1jtF50Bv)(q@
z-8iD-nPJS`4X1CbekCu@h`Pdmj^}Jt{hcLrcqt9Xj|O_qmz1|8DU_Lz%X;{VSFBJ}
zTXjekX@9HosjT;){~qccnfTEyjy2b8WmfiTU7>^7B<ldD<a5UrpaVWhJGO7XTL)v{
z*KT`6@3Fk0ExJFkAas24kw*+pTG5Cy+&<`Iy~dBF8+LHXk&mB|Ot2*n?*D}&;d=T<
zK#@t4tvW`xSk~5#v-;4Y3S{;b`wMzI&Vnsa9VhqlL6R0ed{PMo`aX(>yg-CXr^wOd
zpZnJJTA&b=TX9*Qim`d6n;_1x!F0kn9}$gGOj4cN5Z-&JO8bh6WBJikeJ|U!_`&x;
zpnGj~iFr2q(xAPfdusM5UpM2IPaVAl^Ob8jAjt-vFwD;+x!U(=D<a<U(j)-%?Hn8D
z4O0(#E_-9bSa<<Tn7CQwcsg+bA|aKaA%9L-=9#19hsO3$EWjthh=Xm|V**~ovjL1L
z^gKl8bfHwyF|Y4Y--PFUx{p5>HdBaBOehS4rFER}B@%g2{Hv8NM2;1pv3<WMP7l7N
z?7O9jxx&;d?<5w;b&R-Zl`>0!>0wn1%|Tm8Hs1$*z|E9a*hW&FwguBrZ{L$dpPoDM
zYYsTDX%^js%D<~bA<>^QT|XZhxW)}mkXD>I^o43`j;HS!zfhK9{tv^g3uQ;@fc@|X
zNZp>ld0Llu(Ku<}o)*M2r&|qq@8zw4WxlP^`CdK8Bq?8|<Y8s-z6<Mc%tBMmy6R7$
zJQyj$wbnx0&?UbP>k@{zw!Je@$gOjD+bPRv{^8lEsj#im)?z8ObN#@U$udfi!|4?{
zw6EevRs1=r+(N{(Ue>K2rQ}WTF{}0El5>&LOox+BunNz5^$~QKn4N0@J2-S5E(QEF
zxe!z^intHLcq3*&cDI`r=x;s^vici$KfCQ$cK5RQ#VlF6qs#KXjAJ!_bsA!u!Fkp8
zzpYbdV0Z1PLX!-CFsoTr5EL(ygpRZLQ6oKb74AW`4QU@BtjTG?5oNVhbF497TE<v-
ze67^Fk?kaSOH`4>Gl#+@&6MnO;Tx@3S&o?*0U^ykl9I;2JuxYyz;P79&exf=l!q>?
zqidEckUtkigf@5!GoDu}Wk`T{{^{5p>7xi9co4j;6-Z19Uts-eY6*p&2CC{;oKZ(R
zR?2yyyiUqpI)D$-{rctBib2h&7fr2mm#uFm0>564Tb37#W=<_??380Ie<A@?a}GX>
zY2wDCNhR#~;tthto-DjUnflxz6TC;ENmHrdq`*wUHm1&-${VW7dQGp~;51TqB2>2Q
z9Kn5@r7*zB`<TFbWI@AweR&8l44y+$4QxT@w)vZlX_V6vRy9u~hlY$x44HaOldPTq
zBc!8$h-s$RpdY-J{rM-J)G8!#jbWP7aD0c9)QQ`I+*Bhxra_kWmBIIU>U36sDCER)
zQ#g(GUvk5u=%x7BLNL!W7H!px=mfIO6PpNxD|w*U=IW~eN+|n1HaYPp^1VQe#-DYQ
zQie|coa3L;oI=FQCF3!k3tgAX9;t?=iXLE?u0I}7%{mAP&Pks;85d7QWP*0hgQRze
z>r1i3<JI!nn{q{@Q0qn4s};K3yoQsGXhAsVw`d1e_1K(m!k9iNJ_=p2M|r(d0r+l8
z%<K5v%s@{e^mq?$wej;?w`2E%K>Q?SaIx*PxPPD4_0m~G!?k4tDT-uo@}E2I|Cc+7
zyJLI2cMjIh?&gbq!ams8UALjT6QBby#7V>+h;o@MVx&#|+wWUUEAFShro1PDO-bX+
zHk9?L`mw4iZwk`i5F-YzMgNbjuMCT-i`u3`5Ew>EkQ_h}ML@blh8R-1LqeoWIu2kk
zBPHE~0*Z8()Sx2`BZ4#x4kg`P-}pSw`@P?f@5h|$nmYTOefGZhTI;^o+CllmEHWcF
zqxJLa%UOU$+~_r>{+EMAEpJ=xGOlMBUp?Guad5DLs0UFyk$RU(zh&a?Vu`)CDoOi&
zx}A(ONnkD0$DI(bj3UP!$%G+Ri86VK>KN%?&cvT?=@I}PVM|h^>1`2J_YPH;gt*+_
z*KH=H*+c{P;hVli%4thb->hJjLo9Uw8D(C9ts>yM5i#!4GXFwUj-FCF>9ilCN5?Y`
z=>KOe`byCs3*=!r@c~qIp-+tX-3ixYMdS92*N<9SNbQx_5Z;d;hag5_=CN(4HdH=(
zta+VWHq{Fcpj*zyPqU0~^kA#%s_V%=spDNNO(GgT_jo7qIeAy%748)Rnn%)xfQH2O
ziAL<<N@Z*os{_nNC?B);Jobwrd<ZN>Q8xAPWm!Zl_ZfSP_dEUalEFAP3#NRpzm+5<
zH@bcQGzq85cPH;N%t7rRnA{j9kl{-DCXgkLeAB8bCnu6+sxWV{M|?!A!E(|0ez~5T
z<*l=5S=~z$Bj^@E2|lS#A1gHjB&~6uW|OT?&mGSQB4Uy@NsW3XQ}L80KN?V_fnu9m
z4hD^(E+#@eZixcr;5uS(M6UAwRJ!Ch$>^D($-FwGCwV=gw~VLJ%Ul`JvD<iQ8pB@-
zOHv+6+01zHglkCiwaW11dEawunkFwsd>xVJSHzzs3*Lrco&&@I_W^Ig5>6W;Gdl0=
zV(;joSw#!)`r*@-$Q-uHzadbvXZVn524|dz7yscim_Ol+)hntBydAWOM-sCL49{sJ
zy!nq737{SVl2t&8O&S+geLZ@%`{f_=^0y0~2Co0PHy-I-0d9@Hr&+Ip53s7+AUuSW
zzt~@-2Uq&y?H`80?~Ko9J>FhfF`9_}0Ep;$Ui^irXCjp2DaXEJdzAxgg$w%0t^ooA
z_reF0jCCKcpDf&Um0{<lxDRXjK!1Ew&m$y!@E5uF%`Hr_2DP(f(CE2&4Y60YI8NvD
zkE_;a<p1dwK(oK6)|Tr2Jo-vHrWf-h=w2%ECZO^<wr26+5)Vp&`}E=_Oa6`T=g-|b
z1m-TTNw%US^+fM&`^+iZLmyZ!EL%MW;$=t6OWW5jP*YO<Nw3qYNI}c0WRwS$H1ru2
z$}v?bds-?W{{5p{FYak@q2vh=Ic<+xZd*40pp|5#R4C7}X)_%17elxD#`x3M!_I{w
zt^;e#qJCC=KNbifz4Hs0+b^~<=_c?=VGZdemGHKK5Y#WVY2O6udD-aJK?RP<vmQ|e
zZ_@oz);#dBWt>lH1ZHS2{rfYu@Mlk|eiMi^$<WPw8!g(asp0yN<nk`TbZGr~Z98R4
z3MWmW*a>A2|M-WAh!<6q^#ljTs1!<DufO#lvWs{5c5v0hob&0S*P=g(Q@sxjU#nW%
zwhJI`6wbr;d}b_Ht0$p}{^KuS_VMCp1acYq$QLxM61J&{+s_xQ?+VL}5v~?W#3Vd%
zgs%)q87OaZh2=WkuT|Zh`I=WW&}->)h3FjPy#HO?ayIRJV2JF+fZMNxob0`pfhB-_
z{TwU*-13e=LyCkbr_bJ6#Ou}Levcng<8UVfo>II_?)4}cen8-JM{`8qb*Rf}#vcw_
zle-fiat6y!8vJPsd+5m&#NNub;!NEw=_kq(jm#;NE#p!H9~tax8q!`2%^vEb=s_3p
zgjOX!aX}f3lI$BhmM<^kV$*%7l>tn_74K%oKIG<DWFvvO`3Iq5w`N9}qkR6CKep!h
z=A3NyRES<=XE#z?THBehXB<t#y+7YPxWW8(--ko7DI41*ZsVJY$w6l<m&Nz5H56X5
z6*LWHE`5J>U_z)upId@mwTO4_UHdKnf)-z?s^G6m5A8#}tqg5{{bUH10x&UTBI;JA
z6n7BJtn~LMiDU+=MVJxRum6TjJ6Sg_;6l<bvPE{8>$eBu!<E5kTr$VnY~}s$xpzn9
zyk+ZQR(O>b<C&7+n`;3_;-^h_UgC2JpfOLr^5f0g>!q>Vy3h3|ddM}h9gHC7Pk60F
zCdreGG*LaBcDKFqmv=k?eV*zS=vP6mdNmMSpRzP|MzO%0+;sFgKz=N#%*i{aweB00
zGbHyhE0_7g<8kB~9{S>jT~$8hVVQX%@g+^dcBGe?qv&B{#K@Apnm}P9-nC_iYzg`@
zr;2OmNv>q_Nl!!;aVVV#+O_i#mgp1O{J<?|e@?CzRUbAV`bq#S@cs^!b>8$#Hz%az
zl)0Mh;UwR{mSoWhzW}oR)l&M9)*~Wm1=p|Be;b~cjP<<k`SjLB138jB?1`r2Rj#3~
zYkWSgyG82eSzr|{{e<+Zkk`KnjUIp1*;Cn<OIqDJpoTU@F>xzpE9B=bnIM&1jB=Oh
z`g(6Oi9k)!p8z{tr8D~{`}jvw!RQP#DeRKP3%A;F>SNkNsqx#xA6!OVx<gv5bd&vT
zSs(%dmSgQqioo2%d<>PPs^GVXy%_n>Axuiz_=YZuP$gG;l}Xuqbsl6dz}#o{=Q5C>
z-sU+YqtfyM73!#aIb+4dH7Re43p6IXWKO@Bsp+=g4BVvjtGx+4#@RDYapwz{q}J-b
zc^_IL@uN;O+Vl_2pX_tu2R?^Cf*iQ)AKb`8PU_<oxKcyGJ8r1AS}}II`|hqzZWgZ&
zRsKocFB&-Mb`^OO@qA!KU{|z`R+v>JIe>kGc%esld~JtVSAOEA6lP{%=}+rm&?gqH
zHD;H7fM6ZrZ0%myhOaJykjSjY@1$k@wR}-s5wy1Bfb+!dMdF31T>MF$@GubM)9HhW
z0ZSD^;Nj_u_bx70V%E3*gmwpc1Yf6gXt+skxBN^e`Y^Ztj$|s{)W1@Oz^A$=e>->o
zS%2}?+?c3r{;L0v4^zEW#@{DdE7Ptdh8qQDamoAS;>v-V90V14K~;9)Gw<3~i&5Tx
zES-JrFB^%Ab!A9fvF)!O`bT}p%-OQpk}^U7JYd#nd6eRF%+3oNH|I4f|MzC``9FN7
zCeRyHvu`g-bNMfZuxHQacnk^ynS0MnNm?bYudm90i^VKx<>D_{FYX`mxK~_;y|@G(
z_PU^148li4kdL;amWdTq6_!>0uwic=3yaWy0UzJEps7a>sAqduGWE7be;^*emea@a
z!RO>jf!7xjGujPt3zkUlz%kWN4osXpza)mlfJNCz|HNG|ZdYpgu~-8>?r+=e>gH_k
z7kX#=npfa{j@rv6Q{V3nc5Gj+M!vBC%KxhB25@xy;dDOJDt6k{fz=Ft*>@jG9%^?s
z>e$22fX?yU4{0ZP%+LB2*wb4(sv3kl;{quLzgBggCw<oW(|Z~yt(ylVtUv7s96RO}
z(!I`~`Oy8&#fUWDCRTl#8|CB3d?f*zzsg!=;l3Yv;lt4M{<vD$KOt`j07RDD4IX+J
z+D&UOa9Z4m&SN_IaW3(U`O3&{-P)eH`S}|HYf#*kW&Xu2*CR*#Vj<wgdl>3+Le@Dm
zz%2T@V*tWK)(3Y~*B0xn(KOwi!>CZ3f|twoevik@k9`wFL3xnF;LarStfv6hPlv8+
zE0*~_j7}-xZ#BIV)#MVul<jS3`9lFZ&urmMh|O>6Dv6{I<LwRHNgYVBrP&XtCY=XM
zZJ#5AnI3emqqW~-UeZ8JKyT+W$-3GGnUA^!Bbd57(N}J^voFWAn7-ggmOc?9x-Fh<
zvi1*J{d48W+Zr%$AZBt-HZ<WkDmuZ(L8_CprlssoSZJUk#MK{AIJ8par~lr{K<P2S
z!rVa25cF!6*O}oKT5sVCS^(vsrdIT){pjxPAq9_)dE~xQdwhDkSO1Qpw%2tiH^O82
zhVh?c`bIVeYKMtj%dYf7E8-HPr@`y(9b{V3<?>eC=RU3(UgrSwy!qERrl!{zV6V%E
z0&ijRY)hrCU1t1Sf643ZdxgUqbC0h1&)W|wj!sN<ht`OF(Ler7l0Vmx^FzuE?Kv2I
zQVve6+A6K^4dv6Z4ck;9y*&GHkam3tyK8UY^FZ2m(5%aD;ckq>#ksY<>va`5e0ZOA
zm*v52@0N~NV~jwq-TDBoYkb*2_x1i=0z00iEvQRgR{}7Q{GMMaL8`-13@_JM&(B(P
zj`<ZDGr(3ikfcI=kl9`K#4a25JT{1Dx5PJ{Js8spUfdb!vsn+>)ZP!paPvuviP$5g
z3WWw9=tzuO6fWWAIG*<puo~8i%Vt)OONNP?-)BBqlm8Vua<}EYtJ|wWxrrmTT8f^v
zdg&x)eGLe!D_5N9`V%wn`1HB~`OQ5Uj@RCAc7s$b2`FbmbnV)dxVwrBMJ4DL8JC?h
z8%Pe>S4qA`-j5q*C4X|3ok=qN*z56O-FSH8+CrLrumbt7$*3ihd-KP4DpwzE^*XVy
zNj0t3O&e*g31u;vJ!GQ0Wa$(W!por4QPksg4EpRqZvL9Jl?zPHl+3chcC@a#RMcdw
zbJI>xB%<3T_7jI$RP+GriI(=BUriu7J8Svj7^gj(H(hVwIlfTkY#g5cA_<URzd35>
zoq6}JzV6vf?HRsy!Sd`gd?+sRbTFzxSI%+teC*E3OJ`qqh<j)e`#^=_IA$pab><s4
z#Yzke`SUILXNb{yXxW|Xh{WZ-##^ojvV0#720ElL3QY8jTN^TL&167`Q0^_tY_<7G
zCob)Ehqe|B%RdnXesPHVz2=xM@9UTS%{S-eC+8aVf0F;Q8#(idRbF~<MO3cZ<R70W
z78lfY$}w^HDwtlMDtR~HWe8HjQCaNW0C3Dw8oC77pHCc$bhazZ9}jf?+$fKH`dxT@
z8HV&VQhK88RMXxr7mpR+_7P+kc28(|*57Ix;bSh<;<)q>lh<8aG~2$cic<P>>dWIP
zVdmmoU?deSJe54{-k*{N3LffL4vG8exocj6&n5TD)_V|s%KmJN3u{{(R8;Jx1H>rm
z=?a-osr2W3-+!OcDMw|;L_Vv(oIXnSoZov~@a=b9FW2W`5}TCx;wIug^hb{~{J-i6
z%5WV`1$oUQ@k(oai2>z<ALHOB-X<WEPH9u1!ccsZ@R;gwi~j{%io88uv)P~dyrV%a
zVX)NXsB{P&ZM|<VVK*&s^T>p99|&|?k9y8O&;BFW=r%F|6@#$r{TegAym&x~`%5Y5
z7kFXRL3WOTOwN2tRe(4?$2{IR#w*I<t#lkiEVH!kV?7>&UwFPOSZ?v8JdFJ21ro;A
zjEAA&kYbx@;vm23+1xMjQBM@T@?Q|Fap|Y2B;IhjmHQ&LN$w;X)A<wN*tlLn>lzhS
zA;am_$&ldWE;tOj3{)88n!T|`|MJNt+S;j<Id4>$hWCxTQq`HWe)WT(c#b5lL!s`}
zvmdOXLslcc3ofbq>;lfS3s-gi*x%lU4&OSrZm2)z{Gdu_K=-6L{JjYQDV7ODC2*VZ
ziDDJk+dPvh?zge`--nYX0M3M@$_7E;clXu)-1@1+xwsGl$ojOg?ILT&kP~i83zwE-
zUmgr**Nq}4YWgN!<Y=onTc~9qlMlTx+uzZ0A6C$E#7G@MvZgyjxqiKm=jd@#s)csC
zi4fR~J&~|6-VMojf}$>4!+oco`#9Jz*;=jezDV_~QVXx$DX2gI<Z1Fa_MMGdrsJ?1
zmAs(vqMY#Oq0k@I)r+ucA4bn-DpI)=rJlF8J#0Z+`3u&X84c$N-Y@;{DV@q3+aWem
ze%t=c9hUJKJxGX=W(3*YX)W(T%Mp+-JO?~8v`bGWkcUg}WBDSB*`fU$>ak2&jr;|P
z&-U^4M6g^-@h?Px3NN-w1y7y0`pts9@H7v;E1yV(A*;$<VHC1p8A_c@e#cSkJtBCQ
zMaeND;S}-e?lJ)fBvOAtEJ9K{G=q6<%f7#L1_}mu138CuUgsXmN4138S>mVdI$0MS
z>Jt3;B&}EHxvB~~rCVJnm*-m<=;ye}W1G22wv8KF)1tr=M$i!(Il)@(5Vm8Kd+EbK
z&(M~gjH{AHLn&JBW#0hWY$4_DdY?1eLv~BfibXM8b2=#(5&Q-Jf_#+CrH~xkZ2d)z
zlRPn#&V4DC%6xPzEnL`^a~KWT%%GUYs+dcFeNIzXDq9!fRr!8M!fEJ94{R5*dGb)$
zTDW8#fc8^Py=+vypzz{&Ap$yEQrwMaa7fA3v-%0?X2KR^b$-<0oxu`kty;k9xv-%d
ziHlFUe>^W#{La;>?a#R>#_n2k;b#}N0d2#gMWO5Q+F@trAWZk}{#7Z>s<j@z16Wi^
z^f70l@}waMTTEaV2;++3l+iU!zz-Y;E1)DN=Z-vikVut6fqZ_J#&eCtf{z1}=$f6p
zBW2$dRRomwu3uxTFE4(>cq@6KAuGd0ahn19hL2hFN7FixmV15o7c^qbo=Lq9P)R;u
z2Orssdg(aw{h0Q0`fQ6s9*(3mlG{*aYPcS@(l-#RXye$sCB%QyhEx^NsP|&l%>cdN
zCE_hU`q!n&^A|F7NvnrM<)169c?MwUm!C`VDkpx%cuND@=A<5`_qFR(-=#G<8Nr_-
zjYAs-f(jP`Fj4TVSITaqISvnZdNme4{*RVm?n>qcRX6YA4uzM6x?JO>fERJF!J^zX
z3~|^a$fna#L&<7Lyvb*UY(N-_YI8%7+B!_c@7w$+Lo20!{8jaWeI$@Q;aD|s*No|y
z3&iHjk(t9RnS4);zv4vZfQ0K0X((c>kGddlo7|>3W{jUMx+wUm*G=ey!l?)?k=Z>m
z?f|{v=n*k*OC1uQZgtl)Mclcs|2;W9iRN&Mr3cx!;E(wIjmD!cz(B<jF;G-_;Xa}h
zW9>+~5qQVz`e_x^vh_g*EYYBxT#bA-*GN^Bevq4JWyvzx3gYCgknnDs13i9G5B03O
zhd{ksOKe-t)v{2)(ws-9gFSgbF%2*(IO^rqy$|Iu#2AObhgjksZKP!DD{&-mC+p>-
zb!#Dh#xwWpEd_?V00~_V*|cImaZ?P%gDJGfayyC~jxwBT==DR(VT)z`Bl;fV0+%nK
z*b4qr1-k5N%~15h_8y#6u!4_B%Z<`i9b%=$Ym}qXuhf`g^2A4~it}Ut2^qoIyHE?w
zSjsp9rg!qzvSzBP>Xo7s%Sm0=Mz0jBmrF(tEatel1JDux{C!LXe<Z&vEF>+dhelQ;
zm*SBZIq37EIxfVhv&uLTQe@uGRZfe6M7G!2IoNC&MW|f{(|TPOOG!7b7fe`xChMhD
zFaL{-Wzg<^0_yNu_3}I|^Gwi{Il?QJ6>(M_j6i?F(2vF41x=kkwo$T`<<+^+kcLw<
zj=gF@*c1c1)S&(g$=+5W?CTfROT!wj71V{`qX(w5IuHu&lP8@nX?lZ_6F)bf+pgc)
zvdDp<_{|;Ig~Nhw36F(2ueImn_ep}{(yIxDt;Tx1l%3YVYqf1q$my3v=J@t#=4Ip{
zu4w}d7w$YjY~i&kz6%;g?cv8-em5)6WNqEhX@GZ&|Cmuz{eizRUHefHddE-McHp}P
z;<7!7!a2FCW%R61&8i~gG~6Gw$9?Fs=g|f35X8=&9#P{mHwYQGX#42r1LxrvHlc4x
zf2@zN<>eYDU22tSk#t?%Pe}j6fetwNh8DlCYT@rr&=N_J*&=t6o163Ka560c?_IJT
z0*LG_>(><bFPw1F$I>`i@nbge%;QTwQ0^5Ox~6c%r%oWocBdvUAAVwiuV>iC+DMxY
zV;kc<%!s&nW@o#(D!xFK9z=T*htVq(CypbD<D}QSNRaHpT0fr2qFXzs<+OGsfX{F0
zs6RJf%y={{`p}K$*I;f+fz=_MFgw5nZ0Ctzx^oLhtv|wjITOIOt+?Z6H@$GP?l-)w
zB@k-e4f2)j37+!|3#`qzr!?n6q0?EiJqi*$ow9}WV=`&<K24ikgTfkSi1E%c#M-6A
z@T@3&qU=&E!D6H9dTmpI6q>DBU%mVYKVd8KoAGGMpVM-5fj$VR_!7s=dIHF8lpR@8
z9h;TNYQ_j#srEk&31^nbQ95ty0@=m6fVy%I5P@bwh35+<-<s0lj^1jx&_3{y5eJX0
zYqp{*)-#m{Ik8T@uHCltF&I{HvFeMV%k6Slpek+?0Fkdfv8BG$v!z*&rB)bip^5G~
zs^?FHjrq!(r>gn2^AEM}0q}7mV>+xyFNtmYL{8(fb`Cic$nJ&4+PMWRQTpHk$k^Qj
z*Yw+Lz|T?b0&P(_k8s%~jXmURKS8&I&vzq(4eB+_H{?z2vV5CfH%bJ*M@tJqHr>M1
ztLh2@HF-9D20!hYyw(Hxgg1a-a&79N^Ve79BtSl=VYDrcpTy4qxD*ezqNo+WOYlnI
zDu#Zq0|L95Fsm#}-JJ#U<nkga3nuK@lsc_9jPh;g*WJ3VEKL)_s|zT2`7}Fq_>q-D
zNj}5sOdm4augWyF+FU4^BA9=uyG^Cs8U>8wzUWixOjcbN{*!!kbTk&Z5qet}D9kl)
zIHsPM^0)A@?7IhGcDV08@M13kQ<?9s`(Synk*~GOv@{db#Xb*wlm6_e^m9sY(XSxx
zmPdKzMlNJ>FbVA@X=lpzN3bMY^%C{+jt3{>P{HJMjg8DQ|LT=R$LX4<)Cq>;WuH*i
zpV9(kJyUc%7cCtvLvv44L44@h3zH*xL{P>3pF7!lM{7kufwIP_QC{1GLGTQT@QPFk
zt?G@^t9|H&wU7zWJj%@{Wq;r#pYW>KI3#y}Yjf`HnWstKh5lXlc4rR$;Ipt<i!pDR
z^!>2JYsjp{EUDEis$V)Lcc!S+Jd6b%yZ|*oCTH`%*3;_LhI&UGxMzKCSjCP^LLW7i
z9$s0!zpMcRzK*1^9+SP$%7W5M9axKeiZcLCgv3I?aOJHm5EZt8k59N<MV8j&W=q7n
zOZ0H&n%N2;J!MEenI9xl%~b<ZmaXX*8RuR@4cf0|E$hdHvk<qJ9KcT=n)WC|e4nw{
zwxLx7F9+Nn$8-dF+=eBlirXRP7K$7>XY_h0Ai$N`PYlEAeZ%|Xvc**OLM0Z;fi4`W
zFI4h2CSG7oI(pGWBc)*&{!ScTDE8TI>-SY{;krf;$J8gBd<;=oaz2M|YK33rEg_AO
z6IXKI`n66d$DwmgTN(YqFVkKVnTK!oL+S<k9?#A2x^{(+9CXF2ySfw{U)zy;*s8F6
zrvg~@WcB9_WiPEh&)6kuDTq__(Qqz=4?#H#KOLoYEY?V!Asq)SZaI*7(WFRwaehB+
zKSQ{@)B#~Ctf7a~7YuOJ1P4JF#q^M3))j9Kn^*-ay<2N_fnRa58Tn~L;v~$H-(RDt
z_S=R=nbSbl?K+qOPcUny+BL2s87)5Rbs*LK&X&;AEUZ$nF#L^xC_KDhKU@`2@JM+z
zi}qZHa!NdT=GtLdocFB+>U`J0(W#J6k$%z4RI(~xup8yg8!B0Zv_H=;(;8mT@3~NW
zDw4a+z)J5ayfKMCB({}XS**R1^<rF%1-D2KjgBNv-m%r-M(8JO1#xYYc*O_tdjTyv
zWjTEUfn7NLwfU&K!{IK7S2+A8#9+IbcCOJ}?GG2i(@H*vriqa29&FoAyO!87-A$hI
zyViO*@iv8_C12ipvGFeWD;C2rt5EcLcr}iO=5P=?<@5RSWZx88JzTsF>yIcYzFMZU
zGb5JI4!C+v+Q4sk<v_aTG3nSd3$*2Dt(mz;CC+*vjh~(g@f^Ms02;ofm`A+)vmUsj
z;WJ|W(V#R%!f@QrnPyLzp|<JTi7h4Ly?BCVgCBVC&@^@9Fwku_WLEC?=$=IC-(1Uq
zz{I5BheF~=qBcb-s+Bi2Y}-b24GX~!M#~VvorM1Ulg!7O*5;LEbv+UvfGty;%6qs0
z4mknEy)>k%7qtQ7I{E9|s1S2(ImhmCr%X>|)mEYr%C9%HO@zI4#KA`kM;&Y%)X61x
z6yV2v=-AOGlxCXK!$<+}5kZTv?$x8Fa0()0G&@REYVu1uuA@QqF%H>*csO~-Q0Q6e
z!(D3M7O5!ja@gC+tbH$F>y9)n^ovg3rj_Qj&!fDyFq>u(Y5AD6ByDQRpY%ryEBXq;
zigkYu4ET-6w4L`ntdxU-kp*866j|V&$eKxoy1e=|yrEkw3#&SHy6@D(8h#;j+|2ZD
zmJfVXyHyXJp(?r`F)0LgJ0jk?`vef;-;6NXes>yD+~WQY0@DD}FiD|qJKvYS@WJpt
zo1W?+Cy^`zi%UhZAomi(rUmY>Eis+^=k+N+HN=!yvb)ywo;A1Uqams6Zy9Pq>?;*_
zotr;n6E4r?Gd|Bpu>dkj2}!lJtn^3J$B-)df)%Wh0^cUfkL!qFM%_*Bld6KGL_=Lh
zy0yh#dmM7mRR<smat^|>ms=>4C<s(9Ee$+OYFWmhc1cfL3#`<pMdxh3@ZT{I!c#OV
z%dld|ZDgb4XOZ~EhTO-cxyZ-;-|o}z2fUxADmBI(;$1rh@X-tWOU=29#P*iXaMy-G
zQ<h1y@tcbkWN@5gctcvPrP9h0T26<~rN7gtc0-jPn6y?a#jc76B0s#KuPI<HQ%18m
z2U%;Tto;eGW}!WA{SbyBvl@Qd9`%z75zL9ZnAX@k8+cSC?WHrZ2rUja5`g{u`8*KU
zbol*-4)>IM6YDX%u<FORd%^nnpW7OpBc0`k0m6#Um0Lw<xprRM20Kg&qeqs;AAV%i
z==KtDQ%AE1oHd_dxh6%tbcFdf?_k_f3{t0hwX*8yTeI~x0NzUsDdP6Rg!?}kX#5^x
z+n#Rl6sxL-LtckNLrtfKooEPPVyrVS$P3sHdFHa*E(eNHV{qyKM{x9=w^rdXyzXcP
z@@#Th?dkpY=vgcKed=x9pG>1A^t9l14dAT9O%<&8(Swf>Tfjy(J@kxqBl8i7b_kr}
zNt0-fg9=j9{zF?tz;T*4#50t9<B?|iibjj0peJ9|pNbsL2|EO4?gcl>GbNhwW3oQ{
zyLDho<ncw0q9F6?i+0PT0GlvM5XCVus`}RG$5RV}bH1)KKSFnIvhS01WWqxyn!wNK
zPfLkg*<T(?k_VIyv^QlsbBwE*1-0auRPNiY2L2IA_NR|V>Bn(z_T1PU*g?`7{n#|Y
zam}VcxraXvJT2G~lOVZ-PHT)gNZ`z_h}|w{4AH`zea^KCqsby~Owj)Kz9)f7j^rM<
zk*Hva4oez^UY0?#IfNi#W2-b+9iT=24RgDo=sR-M6ddMjy2*3JJfLO(8S=C4XivjW
zklYP$#aKcC9sps91tK}5uG)esTd7jMd*Mllu-1fKqS?pO&FzT+&!&@$(Ag>9Sl5-n
z<&gSd9@}z9!?P*&g4~H5E8QvO#TDbxnr{vfM-DBQ=3nlbqSU;oD{uV*D#~D{P!dPu
z{sZ$LHfJ>v{`&4jnXl2A&09~fC#QGjfbIsGN57hHj7Lf?J!}GK>nSADC^Wy^suF)F
z)+LNj-HbzLmw#a+ZFwD(nCzR+19!Ccmza)MMho-Dn;QB-qORy*!R4-v96u9NNsYMZ
z*Ij>}ZaJeGBM&aKC~k%VIvqg}7=1riqHg=kO}1|=%<VJpD1Ml|0mB1s*Ju=1=<Co4
zn+>`(a`*;QAB$Ac>`B^&6uI`%&D)q>!dj0`0~cB10U;h9#u*;ykHwdN+I)XTo5=Fj
zUeDRO>w_rx0o*P$Z<5oF`Cw(`(>yaLj>~Wvnw!?h-?D3Ag(da^hk`p6!Th!%=LFoF
zy~7N(V!4f%XMCXNm)}uL@Bmkyjq@-C(DK|Ol<j36#(;_NinDyCfw26Ji8aWWfR>n?
zNQkIS4efgm2jjlqbBb~zUF%&lvW;6LgeE3v-{V9cZ9zjMfIG8dMIy^!jF1HX(zB1Y
z#&z>F+$>Wi@CCq%qi~|Bb9Gt@ZE_R^Z+xyiKoIBg>ttuNJ>}4;y34qtAbU$Su>iU4
zgo|)1WFa|&XQ6UI5e8Ug&Dq&ZW@^)lgLZ!cKhi_8Hm&I&ST*Xz8$CATPW7!vkkxx@
zwsYnPKm24zM2St&Mesz`$ZxaQqBuQfn0QzFU5>;j0k+%22tougf|A|^OsGX3LvE$E
zE<sKwVZ1l>`Rb-kQ{>b^w0OfxknIjS3PE`#LoeZqw>UAONotS8@&|&V1b};uZXD_(
z*flUlLFw@D;4vqr;@vDQ(pt~_E*)XR)C?^LFJmz9c6@A%n2)B|-;^7M@q-d<=fewZ
z14V%fj?s>K*Yx~Zk+|S*O?QV5v+lZ{@gwTvg+9clz)1x**rF94v&~1<2v({639$WX
zHT$KnR|N>m%fY0KX#Z-11-E0X<rQEWX|3Jz_5Hl%Q4%FZ3i${~bzu2D_Kzm?$)WTI
zW1xPqx||IN__fJMTCaUO!FctnHrjye!YhEn*2yY7aw7-%`D%@HZEFO92)mxl8tyBw
z*{6*jN6l@uSdu5srYhIw-gquq0pWYHFcYtRuW05|NcQ?hUsB~KC-S6A<fzbi=S@^U
z+lC-fn|d8(GC%$Nhj<$2qo`XWdqh8{^c^Di%<0{>be~Q|@lVP(J({sYa55BO4h4Z;
zR)z6Q3h@NzJs#32DH+|XG^$bSsJ<Q`gu@~X3w7j$>0!*W)|==sPh__f@E`zzX-&Ra
zmM1T7o~8{!1iUe>bAX@JZ}iIv=4Vrt8h$%e>~D2jZDzaOKoCXm^J2{#mZzgbj|C)d
zs<th^WWBz3<e_suQ_pbN>VB4Z31rt7HR<$$J4`+;{V~s2l()S<OeM2^)Q9i1gnry#
zYj*YhU>&^fnGR(2ezOIX#JA{YIa;cwcjH*J(p~vNfosSwgEC&F_&VG-S$Wih@s19C
zgnIGh7(bZsVe#}E)gpJAVIxF+voK;d05{nf;~Tw^d<UJ~;<w!FPJ9l$RXa8{wq6Ez
z@#m5jQ&(`0f+f7DG3Jbfs)^cfClPpSw!J!1yf4*^+{}mwH{$EvkgOpy-8Parit#t`
z$O%(9J?DZcWl)5qH7Y#cWtPuXJ8ZSA%j!FQ!5E(xv#YuqxKwGbG}T~lszx#vs_@-z
zX<;XoEp)QsP1p<D8(x5Q=IYg2=BkbID4{l2t9;|CNHly#bb2pNJC+Zraqsg})^dEd
zo7~G*>7mV$Ym<VuH>%1v?qp7+eWJ%et<!7T&FOpcGLNro^3qS@5&Be6wLj(L_D=Sx
z_Z;DF7bHhL#_1|j?bV5NaqQ5K4I^&bJfvn!(sI+MpyYtVU;^Nmg+kiKBHAM9E&|eD
zw9y=YEIX@+R&xC*i93^u-M7d%fofv(;VvTxr4jyvL?-b3Qw471@I}<`E-NOwJ*!Pf
zVoPZ5@vRZD3gdx*JDwCfIXXO{A=Z!j0r@v-w#Hp1Yic#uR?Z2E3byfnm1J|G(42!r
zs=Lm#=*?rLJfQ4DuON5#P9Q1+o!8zM-X(+2Z?LILtS?ML%b9-svydEho4;|#e%JDy
zv92DK5I*`lfR@`ZCq4F$6W>cFO|J3$ihp0k<3)>pugo8<%K>53%hk&MHpqY2q#bvn
z{PLJqT#x=pHupR!p8ewqIZ0xWzJM2I&YL0Ohxfr-;I#U#r#|b&M5|5k8Dw<}AJQja
z;$K}SXa8`Fo`^++pZezRHH&#+oKfEpZP$~X(3i%~5)*`>k&7P~qx}*a9hG-uHTDUu
zA)Qd^D$=SSc{3M(Mrfwi82L7PJg)xQ$<c_YLkF|0fOLhCfMP`Oq`m__2-}{%YVj86
ztN?iE(+elRAk_p6&}wSa!-EG)bJafJoD>L5ZtX#J#l6cBi?M%Zoxrb7)X+k(k#4Q5
zV!!S*axj;YNjQT-#bR+XN*R5=Vf?FBi+ELgS~Q1ZG?*GhG8g#E19!Fa_~)Mem(csi
zLTbP$_U4iYrtdh*TwufZ;)^ieq=ErZqTFVm{i@+zI<NI<1g>i^A+ymDwTmX&^7$;z
zyt#<Vy0%|qd6&M!wpSisUE?5vSZi7z>5K6B%45*rL7SX`sz6+{l#>KBCunc}a1YE(
zkFWE7eX)t}NMa-2CCV99-?N_==+;h}8@X6%mg9$>q`yebb5z&Q9LVWY2>@}fC0TKX
z>3~LW^6fX*8m7>4CmD@}XBmyEdb${X`eVFb_ff4W!=%t~nHe7h%$XwQbyqcN%E7HY
zo*Kg2&|TqJIxm~i(jcWYPoq2!4E_AanboNR1#I5hyDz^!p(STrSEr1bKwjnYDkSIS
zKT}b@3~pVTbB~In<%V4lKropmq*GumpiP#eF`T(?^P%TvG$J^W-{sF1(OlsO5R(dl
zePh*vJRheR&uk={%1EE86Z0y2P+m2A5VshfM(1NZ`xyN$fPBZ)9d<BwVaTc_n}j7A
zPf(k#B;RgFXBW6@`-x`43!AU+!~nGTy)4Ag7w?5h>S|38=^VQNx2>Sx<C+;=Cesv2
zl}+lFBuVW}74(T|?&*?Bti3gNaLdBe^X!jEy@!n%1>24|zCB0~|Mtv7?zOe#Pcn&>
z@Bq*KU>uob1p}hvecmRSm5wIahKe%T7k1wIjSl+L9p*}j1pA^v<pM{dF(QS}Ra#Cr
zt87j+Z68%pRD4$f>LU<mKz{3MZA@Xdy?)nER&f0qp2%qnQjI%8hJ!nK4YyLtyk!$c
zmg3Qmk*t5tnQPg-vZufSfvkW({dP0W6x&Le%Cv$*Ap1^h=u63{{(jS=KSncWAX@Qa
zP2{)>l4zFJ0(xrY<G{Vs?-;%Xf<cyi$2S?FUy(<2lz?KdNLKn>m;o*{A2HXxMbZW%
zd2E$_oW%gABsrs-=hq?$(A$!XXv`g`xxIXVCPL~X!u2Km$Cm<ZIYOBdKL6^u*ZMoe
z_NlJG$&XF6)HY9TJ7*v%j&PqzEti<7ep2lgIE`$Xj*4;06zwUK5TlU@xf5R&j^Ul%
zE0LDw2LAE-uDg@d5YTWFfm;$xY}%#1Gxcck5;<5thSZ!$2rIPRi3fGmwP`}$jOUmH
zG=)(5Vl`#4@}$Qelm~TdSaeNUbw7kiV}RsYZErq$`YZ~LGSUjB^z_5YDU{^%kY+y$
z(n3EuTQ;+=5MpuaAl>3^1$6LVD5Wd*1HYt*0`3V**cfx)F)O6J#z-&*#z<TdoJX6q
zSiE7e2U4ljo%#Ee?K${4Za+DyL3x-v*vJo=!(V}vmkY0=j^)EN*nHL=vL0Vc2w!-K
z3PyOXYg3a*o%2>1m96gW9@uaBNEl9Es_hbN8_qqk9hhT9NIenaS>j_5&N?o?5AcNL
z8|z-3C+{I#iY(!Q;T|9Md|x&Y7lOtJb&`KJ|JLFU=Ga;~VAhY=qKo+EZ@(k8&P%$Q
zt(x6%snSo`{=tMPcV3tqwW<?dhiJkz(;YofCW^Snxm1};m91#8r*7DIUGh~rYb$vb
z`$^qHrtBqcob;iwB)@KA!53L51o$D9OmTTCK8GhFA{@*JEMU{v3uGfr(G)kg(}@S-
z;3-GpxjjB$d^|yk_KQn)$!tP5o+qJAP{dHZ5p%P}4{uJz5ERcc7BT2!yN1*2J0Z9G
zWWsd_Fb3Ehvzcq_v}~FXd2FnSXv5>44OuN&@Hy2^v!KZ6R2*xB8$t{Sjv|;!d9rLU
zCuz%;SF}t!<H{#&bYf}Sx-biUvR!RUF+g@7a+psA7jER<<fDHKq%xBS^Kbjv#6}*_
z98x6Eol4>w@4*tkbaCS>%50ZFdwiF}FH{Ap;opybw>|?27gofif6)`l`gQ6t6s#62
ztG_b4(9P2!0^QvdRQL!Wn~D<EZ7TzcWRE~eM2Eb5>!~L;d75K%gdZ@RjQ0DHf#^IG
z7!ls;+w>-&`yoAf)+U4<g0-~GSticqj%+k?Gb$;wCg3RkAm;?Dfn$G+!6|L6^qnLn
z=)g>2I`;3&l@t;l%w;7vsQDI1rM|!+Ptf+tu;M;u+usW%=D<~0stHL5tJh4Jgm9A=
zjc}kpk?@@tq_|5T9`5muXQ(%~Y5|b&2O}k!q{c&yd!4s*1n17Ag;{o`ZS}VF(PH)r
zJ2PckAv!|*e8;J+C>zKLev&PBXK!I6)1mT7CQu--WLin~k(oE>_$JzaN6&U=ISwVQ
zER*xQ5S@1l$o9Nx;4bIMCAox=NCmw!39qECyjDpF3Ybetr%>KFAxKCU(4k9m2&Zl6
zy@mEz72!sq?9Q=KhkbNM3aoTpO}F5owQ5ApVvc~Vf~mqzTP*xLFTfKSW})Us-yDnh
zexHL2*v-Iz$5h|$O~9Zwc`b1rUPQ3OWQ;wx%_G1lyr2jguJRWK5>*mO(KQo5{bj45
zFs+@BjU~=>*9_`e?|_&a&qoBZVdy#<H~E(WG`WyFsZz$xnm%yH>-->}TlHK>N;gGW
zRSQ;=>*;E)^Wmn@_n*lTQil!nJ*?#)PNa_bMRybH3M|G2TGxAxoW^FU6@XxQ5VI=)
zISDR#QKO6&o!5XnHs2*Qr|%l_Ma(Z}Lb*SAl^xMSzGrI3NNIB|_02$iBe=GR4@*C9
zw#ZxS%jkgjW(Qp_f-P~`^}@mx^MUB;A_v6$1vgIWN)soOp$&=sk|Q~&V5Q$)qe&h%
zA|OOk&mTGK{;1!@gw&+!U^dM5DhP-fZ*X_mv8XORp>~j|GBiLcqo@1V;9_7qcvB8O
z9Jx`4fEwNfcV#ocFG9$wRJ>?F3;uJN8%DO;21z{(<ojSB9U;!s3jtfJ`DbYPHu0U{
zTf;$D!)QM(F8WBz>lW9h4efHbKAy}w>qeV|lwSyXwYKwC-tk(;cUI1KV7XGBG56au
zIv?3BuEUR6MUDfT-%z?`B5x$?X_N6Cads1Z@KYTf=)3fO7gE)>FFt2xYgKHJ)`b2t
zXHB=fAwkzOKC5;<TU;AX@#)fs+tf^g?Ti;@c5}dSC;dCK?MzQSn)#p)ewND+b+NXb
zscI3A)t=_JnmXOe_HLdAssf?5zlPzC)E-2B+@mRVto}A2FCm$Cg8Pp%HCh5$c3K&P
zqrOL6Bk%n9Y`B#YehM#OGi5Kw!}_%L`Jf8_?3mNzL#qeT-{*b%z?AN(Au6f<7gKDE
z@%OH?1(z2#K{_v>^uHD8U0P;I*EL<SyHacEk7Mp##7TCJfHe03zUp}XnIKK(2TYP5
z4e_+!$z6D;v;OY)+%=xgad+Os{62*6Ng%_1L%iClpYV2%k%F~S>BV%qiA#=u&h9s8
zZpHIo{$jI^_;n3${(r;-BbuDQWyJ51e?;273oNp@fIj&;jEDl058vwW=O7>CI`y;r
z7P>N0gT@sDgi(OL+j~qH_meBf&k9XLHRy%JQcgAH3zh(mU-pmXQq$?YxPOJJG7)fm
zln@nh`Rl}ZD8!E+H8{Pe)i*h(vz}RdX8U!n2>t4dfE<iO?lScI#{L(8p31{IeFy3D
z-2H1FL{ak<TXuJ$Iup?rI%eJU6n=Id-7T>bz?ML9xB>9iVRLI{5>{_>fByQx?R)^r
zJ+b7jan970MM6LTVuV2z4X%9PXTK@YwhO`|E`$k<%hJ18i3*zaApt$pXQ1e8A+DTc
z*UGf|-YD`5AQbA|^cwAPcZ=xG!J8HI$+`%xF{9e2WFHhAv`L8M9CVn6zdm3Ecg#)g
z+@0%k11<;D{E0j%PLKx!5P2n7;>gsjs_Zv;uw-=OsK68>Y62Av-Z~ThMLL-L*9^zA
z;rv9dmRLN(i>H0>5r0!dJ$P65h?z9x!Tf;&{hrgWQqzL?d&OhKW!_=Kx9;?WmhJX&
zS+Qyyk-snqJcTdtG>FY4B+6;^o3=iOk4*zzC1S+KswMl8@^h(12|)v{bJIpF%CZ$<
zVj#%?4es&%W1@qjD#@w|Yq;I&2+@HrZVGBU{o7z?y4}^9cWH^Xu$15c`$@)Dq(FA`
zH#P^>Uvg_u?AEAxp*2WxCCcudJ1pl9Ph5lsJGn78{Y<GkgpS#SSUgS5{y`2iaR>mP
zmAaIrIIlJ2q#vY#ywA}r&0*Eb_AdlaiN#7D$!elg(k(sGqQsICuGZ~gH7qPs(<Q=%
z#oK~P*sBT^h@5q-<fbO~rtvdySFS1Aqk4GltMoJs(sIdH$(C>&B8Lm8p|85!$}q}M
zpH7=rF1;$AVpHk#pt99mSvO*-1Y~!bbevO$1hu6Va=s%zoH=he{ju|k+$Xd{9Q3=;
zw?}xP#rx-*U>|ZhJB4`vf$3B~ay~1Cm)%sHMN#REs>PkdsH1SZaJh)kBL4ARn|Qh;
z1`OH#!VL0<hLYFt)!H6{ENWdF2y@>zeOCmC<jF%o#{|NN0zuJmAp(FOM7vYG>oRA=
z{ktQGcQp8}aL2IyjaBh6!V1pF@i5T%7u?||FqOIv;r)-3*qYwG8=!|_LUU*Kj^8(+
z9Kt&%b4KR9heSWI9r(SVpow2lJ7`ozhvCore1r4WpPOdD2;mmmU(@alC(^<hdunfE
zowT2)@Xe@@ypzf~r56D#H8dN;0IiK830cCHH_S@YZI9&a;FJ?Lo80+2ZG|9!?I&T>
zvogIA(*Sn1UL_Pqxc@@H)*ZAh<KMBG%0qO+jg(D$dimm`A$|qr{WBts_F0VwMFiBy
zs`S6cQyh3)(4bvT`JC0lIF28qxnsXTFw4GId^cC7yLe*(=mo0X+@Z1uExp(S{W13o
z{%Dx4W0Q->T|tS2o}I$=>OlfzF+)8#$It!SM%wR~%t@)jPkx!+4kh~{Nj2)l!-6XK
zTHL%^9x1GuoA83=fVT+@6?W{Pij~n%GS$gJscJ2wcNvM|>)-x!DT&n^)GdNL>|^s9
ziOElSxPc!7Sa_7c1#jAGRC_oN9HN+icNTdBIo0o42sfrrVqE4uO)Rt^T~|EFo!Uf%
zg*^KaJjO)?)>*L$CQD;M(S{oqPgio`YdLF>L~PV<g+fL0C4|rY_dY;x;Uj~$icW(=
z^A;StXWQoS%&ogMSF2D;4urR_FTyV3%xC{D;L#LM@#He7SEHrzX`EkI^2q3uP4(J~
zrE61{u)K}=yRNL<m9wgdo_oqiu~N|OnOK2MQPc^dEu{R7eDb2Iy+@z#fUnk1iYgH=
zi<XzW<>bBh<H1M#4paO?o4@dMU4b$}-qqs$rZCC_e2`{{B$%CaKI%pX$KS5hqNB72
zs#mXqI!^m)!P^7_S8sYL)c2i!p1H6r2H<Y)SEA3f?>)`R-1n+(s9+-6W79l6vuKa>
zOCt``jQRHPV(RoM9`Y3N+E)K39#;P^*WI(>rXl#O!Y5ZUVz=`#S$59zy*}Os<BwxW
zm(*wBOcK8o@#?1HP!@drt(~9|(Rg&iT!}ZGU0-vpvXGaOt`o39Wpymy=^iEW>fj#z
zGwUEl0)-FG$A2jq$Xxxy2K@Ux|2h8rxuIiU(N)1Sn+JjMbY4Rp;tP@r!C%S5Cn(Sj
zTFm*)QO{|h%28;u27*-HNL^ZEqv9%|5`r^ApfEupV2c_@w7h2k-hLt3_wJ(Uo(vir
zLu92yV%vrcLA*tBM#8qV>LOr!=>#F^6mY4W7j!+%h_)@_Qe^(+V)vyc|BZE^_>zHY
z6kEI4Gu!s*C|6c*s#4?^|KiQTPv}cP)>CSmb0PxstYLP~pIdZQ9!17*;6}ZIDN_f)
zU^gNCr&IG_x3MOy2O--v3r)!H9v_<KXo{8wCMELel3tQ(g@#3!bqx?WBEuf&JbO4Q
z1LGNTL7cTUjj%3+HHvUZUQ0I^I^0Zp-aZCCdSp?^mh?RTxfHR9&yy^^&A@UP3IU~`
z{{kq5LLbfhr`6s&1GV=FoSsr(v;eph4!Jpo=U)kB2pSguC^0O;xO-OL+}b}Qm0FeX
z(g_?Tx(};0R|&j1-X3}Rty_Is^xCn|#FS5%U275q=Fq1;on(mjIza4%$d$^t2yfd(
z^E>}Ou<IT~!q}k3oe~eRF|mI?`rjkZv<g)4ODQ0BvgKClpLmUB3QwSY92rJ^EE5^`
zhR%I6gp=IAOBZo;iukVVgRqg-cUfE6UTRR6NGCfl#jh4crL?l~Ch2wDI~f>KB+(~2
zgj;51xSG{)Tp0K7uEjDyh`0q`Dxa@P@;8Q!yL-hFHP5?WC+HKNWac2aGgCS%a2IrT
z2ngD?UwW)vY^09~7#4lG{3JIe&{~?+@O#vV#g)2hONX2OS}b28Vt_La<hzo8F|V8P
zOnm%s+GvGLqOLc*F8m<eFv6=$BuY|SUNid}vZyJZcv4Q@zvQA@`@u0JK~OQV*W0ut
z<k~nm09*<F4%V!9x$k*xn|Q7*bBf)G5g^DVDJKn6&#vh6CQcBX`%1sYhImH6!Ic;i
zLL9*QE8b^T8A2_eqIT0FH5UX^2vf2kPkqX%IMx7PQ@c~45k7!`{;)3i0<9)qBE&n>
z#y~-E=gpK2kc}!%GK5)J#k8IZ?z17sFe3M}ltxxz2WhwZ2M&R)I`{2PlXT<&Unq{D
zlm}{mtv3iPCrIKOrg@bgsql|E_y5c=JqCFVbRzp87&Rewp#0CTi+J!5)-$MiUe+1J
z@8nd?Rw=s8GpAtBk@hzEHT38EiwH!WE6aM)pW$C(`%iWAXj#+7N2BqyoxOZcm`*4v
z5XFjE09uu#M0C4Aqz&``iEe(4lC`Nopn_{h!{ipEY(y=!Z`@3fYRMvHk8+m@x`@`O
zhdZAl+7;^d%ZkUk@Y5|<VyteOhVMeI!dl;21%z1A=1IJlb}*GWTkNA#4R)@dCzYDK
zg{Nbbns|o}*%|6X1M)VK{sQaMQzjss9DLEO&qxFiSy_7Ja<RKQ9xV2W?SBxAN^HI7
zFLHkH8sAxRXL_@Bfz6Bl$yqHX|8~_XI)z%{jjz|si+|t$@9|-E8BITLu;rx$UJOz2
zm3s8A)!^h*#k8FjGsZ+u$;@6{D3iE<RYvGa=?ajxkeE~$B2_P|vgGH4=fvl*C|~G<
zw<`|*;!l-rp9D(og-6}p{1${4auO}2O)rt5$iuIA+xmtOM+!t1N|4*f;GG!<)0FiE
z4N(O8W{w$g`n#Re7pvGb={lP2AR8B)L>>EsjCJf!Zrk>jmue_4<q}z4C!Hv9ngFJ4
zKVZ(+9uT6#_9-A1bR3CmL}#0?J-9P}Fo8-6l$m^OL}b(#(8^TrLBAvC5cp1w(Wp=u
z<%cSP+f6S)tFsyCfg|c|YdpSMqqkOrdbh4jY-Z5Go4oAKM!!!`)hrbXG_sbuQ!~5G
z?AKjsTgncw1BeSg2WdPYO3Vq)4HW~@jjzP;GL%9>QRh_+P#?I*X{<W{Qy8AVwh{+{
z6?e3uFwX8i?D*hO6#Am(-w`>I91Cx{^=*JKki*j~bmm`H=zkwT?G33L$3dNIRPgkA
z!!EOA0}x)4fdAUe%;I_r_xyn<;?YUs$UPMhrMVH_Q}2r>Pi5Ud6|@aM+%Z}yX?}V0
z=S}GQcfSw|8g>!*J@XDoJnw!_T>l)}M-RKnN8kQo5x!-wQqu2S?vjy8XhrR+whs^`
zyl|#Tn8w}be)=*Z=~r?DROv1lVXjhh>@W6`V!Q0)Z~!Aew?(X)x;Rqp;nBk#n?Uuo
zcJ^=5Km&)TUgug30<AX_gv0~tMv06U<^;tB&3pbYSQa^9$!XY^>M~GfsOi%$JpT)!
z|J<?Dohmj@jt5fna)rcOMIR;p?S@-H_kQHwu5iL5>)$S0lz2<=KG!!s*x(<~Hk=@l
zBy4=SAK+gIIM8^CRJv(R{WsSag&6~0{qCxZb1QfG_f-FTRB60WtN4Y*N1p$^hQ$~6
zCy3c3#Qy{L$z7G|EiWcQp?_K}qH!VeAZ@#rO?gfpka`F{kiCu{trt_*O+F09{%aN{
zdIzxr6Z014692#DLCYTF*!H2R9462={z-=OZ<7qcpzTz2a2($I{pYGu=H8>%0N%(W
zyl6dP&1;SpzjWB!+_JgHO^G3~3AAB*KyE_NPr^>dPPj>ay1G*R-|(rTeb(Yf<r!*u
zD*^cLzW=9JYYiqy$7OerJZpbZ65om*NHr-ZBjDzPw*PKB8T$#vUA^Ul9WmMZzke?9
z)*{*@`9!TRKm8wF^3MhSd)8P_fLCS|lZ4uhJ<$H=^E*)~5fk>b-XRU(|IRvs)bDQV
zYGq}fG1*G{&_Hza;c93WQFM3Q(OwQ7UW*LuvNps2HfQ)8uzB3M7K)<$4~Gl5M@eRL
z0x-hpZ((Uqn}}G2GUOtHMXk2T!_4%p|Gh%#YU*u*i3|khe+ER|@{~PxUjBONG`_j2
zW+F~@J>vj{3BuU3h+A2!+5h~@jhR*!b||;$g}>@FPzw<!t8c7J56$zCyAO*0Z(nq&
z@fXgNR?Vh8Z6V@fE#H>@Nf`ToW`7A9GN<xI3aoE_-%+2vrW|a7%*yOJ?qv>-UmoCs
z2E~#;_nfRO-$qNno(pz|>?<y5rrH#C6T3z5kg1<g+g~kjux#bI>4v+RWYqU&<y@8p
zC7~sg-g2KgQ?XaxV&AfT;3_QSNZ5hC&hIkbDjTMP%u^NscA205o#o+R9W#@A%`J#;
zmHC0Opmp)q0h>+2-{;&w7QFc|Mg8qdcC&n-ivzbYNlOIv|E^DL|Lh}t|3W7N5O})!
KxvX<aXaWGy=OYaO

delta 223789
zcmaHT2V9d^7x#nI(pH7`bs(~A1uP;0A|NBAEmay3aR6b1WyzMkd9bclmL|%IfQYOF
z2phr*E|4u~*h6Im0wgj*fRN<73DCFi`+nbde?LRU^W1yxx#ynqKmT(d<EF&oDPqN@
z9<b0aJFb3xL+%T?pZ2MJjr$?*O<Z1J=ta}zvmR*cL2EBcWv_X?th?e5=0*z#lq#*1
zu73BM=*7x!{$+0YuhNoRx8`QG{ikYp)n6iF`%;v&%Qjp>^<@*r#%qcg5mQ<WtTuKD
z=P|Y3a3e*=l!K*dQ^<rUIAuV#sNte5X{7{$`(MQ4(?_3uMSs-RUSHAj<!v8gk=<Pz
z2!e`jBTLpT0?)T0dEvifsTdX82wBL1X>*A)QJ;(>bmpHmZVgXd>ZesJ@H)pzo(6z>
zAp6;A8ZNOQvTl7CvV@`w=WiO@b*<dL+1o&Bu}fOIDYt`vRkhgE9Z~)p2!^2ca`O6J
zW6j{OmDmB+vvQH>N9;6O2Zg8^y1>nhsH-VnzrDd02G@Gbpi}h>H>xH4yWB5xxwmO+
z9@5`H$?j-o0s(CX>o~476If<drp-mZC&1+n;h{l+uP_x_qThW1^)EIV+rih1_u`4N
zhj;NuZj8*S7U7Q%+8tISt=f5%`-pavLdACxjedYCYlDxE(u*3dzBvpoXzZ)@Xc|(n
zsgp+YT)na&=<anBCXF^p@o;TVuMG+J3LHA=pKGR4nErlj^tw2>!y%PwY*`yJas`5h
zUYGyT=+<`xd<#L6@t<S_Z=i#nj(9QH%pTw1+B8>2Ff>Kh_hv%<Jq?BHBQz7&cH3bm
zgXijar2Xtga6==0Er}9C$RHM3yU;&Unh9ug6AQKl)cF0zI~v1`ceQC)oxro<oMDz%
zi0%Y8c!p)sNJhQh`J?JT9RSJ*@d)g~XuL-72XD+N_Mhgz;m^M~&ej@H)UxYHhApS}
zWLZ@KfA%%v<|_FI@L0U0s9LZW6Cc?61-QB(T?Or9p_k}?6-&*PMc0$oKMywTfJ8sm
z$21?O$^`I^w6)I{ahadmYY9qXx)R`);*_*2X{Ao{$`r0pDbU5sc}gwbRk}PVi1}85
zXtJsQ{^D(WfFSGl90CJ>!P;dio<>HKuhe@Zei16po-dHmcbxJvJ{PWUg9s@U76N@s
z_ExVGXg^`&{6(Ej>z{-*hTQ_f%uw;J<|;&Q3m1AjEjM*zW39ILd;XFXtJ$7*o;RMA
z-U0Oo<=FbzRF8hYIX+!!Q!n6}^-e;A4d*KJsYKZrnsbqv3v4V}dA<)%H1$bWV;!Zm
zP_X!fqQD<PhYl~pyqNv8pD7(}?P-=A-#}ZY7=I|$5o3xj9^H|wJNtw!o1(_{ps1LS
zmHxrsRgFynA0Jj2_3C~B70=t~z|Ql3Fh%*3fv(%nOX+~WL#^?V?5W@k|4x%w!>sO*
zY1M-IwYA&b*WRbUzH3szC4avJK}sv1X|FO3ia$o?)C5j{3rRK_;%o7acvm!8$5RTb
zydh2TjcLxOXxvS%bzI<gpI37gSg=){w3)2+_;IMQwZ5T6p$<+Uj*{DlJ86b^1Z9ST
z>(f63t}VWBmhvvCAhM{&JsMoPviOmfL%VgecOQ%26C|0=x8dG*oj}e6S)DIty;+~;
z%S4QYpn~^WW<H*m^`SOWL6~`&*6NP_f_U#m1l=Ex)>`9@o?_!+vq;kVQXuNfM)N?=
zK=>;5m-NZjZk3|WyivQ6df<{EDB9~&0^T~+^Vw3m^Hh*&lDTZb=tT}g!{kdysx|3A
z!ld4_8Uo6<D>I7DF+<v?4LOz7!=z7q2h?b#o2%p2GMFtq0YQ}+w`sPND%tXtY1%{D
z-_A#zKaJvaQB$I%4*bO|U4r69F}y3f1Cr9rMhuHn&3%kQ#fk$FMeF0Q+4i1mdt#%U
z=f|PqJ#~d)=K_t(V!}_@CH=}DENF33p$m1KRrf1pFW$#Sui-IJO#gII(S?Ewg><m+
zbF>WwqzZbN@4h6*c3$aSDGL7va;O~~>N~)CKe0XmvqatqT;g@&k8~l(0nw4r94uv<
zb~51G-max|)(a(-hE?TUGoM2`yP)g+c1b-lbeul{t_guWHDo<6pAWjsoW4;86(ekV
zo>f!d(;iSJUpDdWDVg?+c8~TQC0pGk!#wh7ja!_$5L9OCuj1le<eh&4r^b3oQNqLI
z0&aJ`o));Fcs*x7%cf@Zd!T<0tE*2o{gi{j6(D_Mm@ZK#a{AkX4D1D+g?a;52r~C<
zek;`fP_u0eH%_QBH<8i#s#uZJ_(=#7VLLGATzvG{kraQNX8>y)M3#niPi7^p)$EN3
zf20GWJ<kGG-_wlR;P!d%#U;`af<2M@anMj0GM^^JR5f=bhyQ||y#ah;Y5Q=zLf;p`
zg?fC$RDJy}Nw2{j7_^0$Y>~J3;`#_N)%^HZ;3uf~Dqn-3(Xn?Q`?(`mdnQ*N+UaUV
zO|D1r0*Ny#L*BLvq@cO}?%;-LcKCaV1l!wA@X(NQ)$n^l6esCUyzl9UD}3qFO*x@u
zZQ)VnEivQd%ba@mkKg(yDa$~fdu4g6&B0><?~Dz1r#V(gpT6!uy>@DlNe?Eo`!mZ5
zD%aN5&SrI|7p}PCGBU=lR8Y7!Rik0E)7E6BH6g6iKi$8*i#yjfin#vFEbv3)jczzZ
zPv4IaIf~CZaNs~{Mh0?fgb~F8d!FDH6&1w-otNxHy4Ei~BI?nYM40ndEt(nJ5nF|<
z&~abjQam2-ge+{!qTFWvDQtox&ht(1k5qHnJbhb^DYMB8#n<-xXQr$hM!hS7Fjy&S
z$|y>Q-wsMpI0Q)%lndXjL#j777yE<0_S(;4Gdyk!tof#yTjayeF;kq+*SY@TCvhGT
zNyDN?8jewiI*aP3T05+Umr@1#(ggZ4XWF*4*A=ecp_NgD@w0p{h-*wDZ%o3c4#h?J
zVvhwV!D>h((jm1%?NFSZIuglC&Gaw04HVWTmUdP7`0?ZA#l^+h4ZV1~mC~fhOTJ>N
zuaDxBOvTN7($v_g3OFt~KdhM_ZOoq&kIR%jww}+Eu^!QITxqA>b02Gc3YNaHa^bzA
z2g8=N4{S|VLqlb?t0^KoY)RFZKS>x$%moo2Gz;<Zg<sH7pKKAU%SVGIE;UQ{YOgSO
zIF9&*s8`z3kuO?U94XfDfQD?ii5YuEmK!BnH5Os3WeYp!>W2-^TGE{pBZC9yUG?9(
zC9JIn%?(HPQ%UPr7&FgAGP*A{rv>y=tLe0airGK2YIrRPr|0}Ve`$urq=9Qwo}W=4
z<+jrLaGv_RAb7s<hA>%ION&J{pjvqO`}^}6YOY?r`f*Gw&AB4(Y!=Im=b$G;_L)9T
zaMP24Uv{SH!fW83G1Y)X$|;~wJlBL`h+OY>Mb5jK)Vh86jo{uKFD)*6`uYc?xj5)W
z1N5Q};s^r<Z+3}Foxa}uHq`vx@bGXOehC;|rA^7eWRiV@5-wT@9zx^$PRO)r<JX_N
z2Q%LSN7-oZcZR8J{7r;D*okynsRC||<IcQSk?<u@ByO}^Tqn{&0CGmyxdn)AeDP)W
zmZs5JW;$K($UNT6oS16_D>8~qv|*=2jkCKfuns}uLZaA^AUUDk*tDRdaB1aVP=7%>
zv%u9BZL1X!PpJ%MjN*WZMR1dP`oeSm1~XEr570Xlr|<uKr?_W6a!5YOW-)ppL~rzu
zj52am>bh&xl<NsXk*sPPzIM6Ch?Q_QtIIZ^`;0YhX{9r`!N0D!`0aOwQVSoKx{$oy
z%%y@HqZ6cw7@+v7U%j3aEAWnYMIlf3glm4b5$+YiO>-#}Dq*NsXCG92Y(<kj#!B6g
zB!@3>3o;0L6*cwirr3;T;J+J#D$1*=bXpenZm=9YM;lR}qUUwmvQJz0CYT*XBeeqV
zD}N|>JuY@vv~;Ilkhk}8M*2n^H9ct2-~#OhRX?y9OI}#ey(3y7F%mT^jbQzyQW$oX
zdHcq=XAlu@XJ79>eb~BDJ=L>#{`D&*)<}ZR(p4&tOk~gGib*@Ev*U9c3WP-(a<H?+
z)D76KDf3=9-_TE&Cz$1$B@}q4s<GJ=ZHg>f#ctdNYFsB}uIJMhD77x_+-6!G?Z_HO
z7F=FQ9HHz5;JtVdDS(W%+3Tjv{+qq&R&n@+!+-I6gc371S2ntEZjC}99Kr3&jBraC
zxJ|pq{Ho&2NdE-64CdWY3g&)VVB7(dl|pAl!qqITJDnvnBVkMP_Vw&;TI)xQ=hszc
z8D5J&SeQ>8#gpH_ZIsXLM_5w6&Dthm?QgX;E4r_h2h1$eI)$D>*2B_Oqi;L<>@@;n
z4Z<1~T}7qAZtu4`k+HDC)*5&W7qu)Ap~l{Y+q5Lc>tVQ)HusvH@mP)hUSTpiNn?#P
z|Ke&c2*J^D)UPSu8TF1Lf4z?n3U&$XbdZJ14h0*t!^hsLK@R)t$V6p231+@g=<4E!
zY{>J+O+`Zetrv(gr6D|7G*ZLi0QkkC#I}|d(7td~OnUr2@BkVCz>_+J57=`o;J~X)
zS9KR2D)9F}6tlM?ZYNZbb&2^x!8xkzUbvlAeF5rf*McG!jNsrAN_$u#RuFy<Z;L1i
zv&QaOC#js3z80+FW>3}%*aul;vd}7)r9n}fazyX>%~y;s7-T)5L|}L>{*sj;eVU)o
z6!g=NBzUtP7>Y^5{EoA#3&T1-skMor6Y?7hb;6YmgrHe>n3?n1F|k=?)UJCm8{uj?
zW^HReU+8Ux`U!MlaTKI1*1S*YK$HhP>HGUHagu_P7G)q!63fIg+;5Gw2V4d9hit*X
z;z!D+T~>AcWCOIyTt~wA0fxPfBfRpQqD)EikoXEZ_$nA}k{6$>7W^}lC|bko)M)1i
z9Kz&ZMlxd;BfZnq=iJ`w;>Y{e#=SM{l^LXh$jE?cRp@%MzSW4?y!JJ(8Rj?q-W%^c
z*|xh2Zkrl_JbkLn#PT}}RyvY7*$TLIa#fg1po3Qy3}!k_1M@5s_i3gWCZ_0?hIs{A
z2Kq8T?$73%!OLJLEVWT=B~!?6?t)vF`#`tNQBjZ;m^(DATQDbX_I4JYHBN^Gv7%pf
zd$uWQmpC!BW_+zkrvR}5>+pmFRa{P7D=qoZtvD|fJx`N0CtpIql{KL$q%yp?icGM;
z4>}yttxdI_nqQjT?-cj=%Dh!+<<$lg#O$zP<jnQ4;Nj}C<0Skg|6NKWQ?TBl1b4kd
zl<I}ydq%=dS+`$%X8DeHU(H~YWz?*{3a5`&E&G23;YRMV2S25c;|)!d#P$jVb<o+$
zVLV~;E<Cq<@JeJR>c*C;8b1zR;#>~ATBda>;%DY7S`W?Ei)$<`6iqI<7#Xx+(P@C&
zw=%~^h3q@-_RL;dh0-1Xsv0AM*l&e;`}gJ)cqM;I*J@w{kLp_$X}U?+ueI)}9b4?J
zO25q9phga9G)o81-Ahk^yTZrd;7^axcD}=Z9Ze5mX(6dNay7=^jPo20=e!g@(3Eu)
zxu)2MT)&i{Ge>qE3z=d?%xYw?Uwp09Aq+{jms2}4?r&kwo0kO08ESN4HqhEAFY$(E
zS?+q*e&AaKuyJ+Wi=14r&J2Q`DW{Bfiyy9nmXR>Qk)VzzB&H16MzTN6pBCt)puz1m
z0w&QFA*i9ZeD;Aqf!8qlv!I_ubu9sR0sQ6pDm2oxK4jtIpkVuhZI#rlJla66@kk*#
z5{~rgi$bdRg(*h~x=AUa4$K92`@n(NrF#7OMdlFYn#K-b7{$u)ao|MC*4w`Y-HZBJ
zRunsVS$#arAFA<5kSG8F{AT`P-axQ!;C*FwnRr5$OFQQpa~Fk;XAl~Sn@D_bHAtJq
z+fwKfWhO=G7W4T{ZSB&RI<yo)ssdaMjvzyJnm@9Z{vC91RGQ*SP#3l0V|9K`?|IsP
ztM_PUDYLjcn;9k$?p5{rH6~ZWU)<c#oNCrb^i_Zy9EZl7urDTU%mHijA(jMiH9`Mk
zTEpTsAe!gz3HW%+(v>8GFNC1vPcMyRGOW^0{rW9`3eg7J%X5}#Y#jAHOJ11D|NbZN
z@3akE8nQuDz%gZ8Nt7<rF^hRVtJK)EY(N>Hu)30Us|K$i@@uZ9kdELD&9ekhwejro
zs-j0yA$BC{d$=enJM43@0J(wwMB9AOW0ssW34fKmsD?0f;FQ(f9gt={&$d1@%$m=>
zm=x$+k6f+~k@f?zp_tp5TDsC5Xd(oXal@Pf<Ju_jEd(8m-Lx!7^C=DwU+O>;3EtA0
zn^Y9km>RbDX&#MFP*$(<fI*H?S=Fbh_-SoQ!k>C#RK_~et!Yl3aF=+T@Bf99D;GFN
zdl5UK#(;N4Mlw}=%L481_!vhs14$v-enjm$|9a4(E0*U0d5~njtF0Z8Rg)iPgw4p^
z0Uf6bQ@YGxn@Fb=5`uywbeR!>s`i2#3evMB$Ly^~^nkvj6^m$Cv1kc+A=5z68~FL=
zZJI$$v)_q=_@eYHoL7fjfkwz=8$B0o0y(r}!M-CoGAi&%O~Lw$k07%G@of$-Q|~mt
zm%o;$Z{4P0DWM{TX&M&=@<r!wb1;pS%wpPK26s1y*){%cBm^CXP{00c3ibc0ae^?~
z@8p=(bzD7|N83+X<8&x&06xqwl=+D^X3j`fWBcG^2vr3FhQuW-pd!3wuo*iX{XLw&
z{!5^DAnWfn)x3?g&~qU@S%3YSjl9SiO_kpPRsMm)YaN$q8?a3yh44xx%DVD9EguhA
z&)W+^RE~~E>tIjZf)I2^v(Vym0j-9~-wYswiQ8J(JJ-(!wtt#up~(oqg9uu*@}#6#
z4Gho34oFjORK)CnJilK83(<_u$WUV=C}UoJX}+F<0NeXw92m>cK|pl=_U_(JKyf+N
z-xPFm{%<EynGIix%v<lKA;m!UC1?(WHCM_Nf-JGf)`k9%)<o;VyA~OofE@g-^YqO*
zQG6gd0LN5i<kPKO=zkeU-JLs%v%!ITuQSp#oaeE#={q2YP%vVyZL^@q-M>@c3M>}t
zPox)g5}FJ|Ha|lBe@qd?fQCrLIz?f2OkI!1Uqk(N4J9p2F(7Sb-=Ss4u#gucqxb<I
z@>EN(UR)idO@03da0|!B@w9l_^uKwWrs3^DD*2h*=E$>6G-ZkxMc1{xp>Dm#y_vt!
zDsM$n?9Ibn+Y!||7nMzA0S7rvs|WaRm-&&yz^^G(Wre-RRG91rRI9@sU|B}JGU{7i
z!fh*n!o>$J<VTeq+9NH<Ir;u0><UwvpNA%<gqt#30r}cR<ZF$+Iz#JM*m<K$MLqaJ
zU=*{IHW&B?sJgftQK$2J%V6%8Z-k)hJ`rIp<09tGVqi?r92B?WU%_p0G}4MQlDWBX
zz&74(#8%k{z;8LhMCWfI2kRO_jb~H4FJ+Qaz5WJ}&gP5)ZcA$xUtbok=Pj*kzSoBu
z&n~1Wdb}%g6)2^5q%#xjAkd2C=Y1BXmS_H64~N%w){&((#gj4NXDRl|o!mYeTo8H^
zkUSwC%sg5@jqW_PVoKFmgE<v#u8;jqusw&t+&iY#t_b)vNlN+bLv_4ZLGY$i&Hj5E
zCNB5VW++{||JK+3p}uFuRC{!lvU+e3w&PJlR@jEl1X!JnAv~w8j<ZVpM8nfcC8%M6
z%tth1<8QtKQ_{p5nppDV0_<t}uINgRZI@sk1+{5g5yHV}J%E}1w^u1HS}{#BrJ|EM
zlOul)3}u$M*HxAPN@ya+_}mwaIDY~gE#|g1`(Q7Agc7I}1Jb}^yiD1|0)nE!_bb)n
z`oN%L`JNXv)z{k=206fSv864NjrD4aLjqMc9$Wi~8LNOBB8R7t(kO7D{$)-Tf1Oo3
zcm<<2^^r}(V&?W%dY*D$gN4~=L`JTi4|MnwD3A5R%Q)Q;(ckmKFZ@BGf1VQ%r~LPu
ztvGvFeSDs3)_h`=7o!2-+Vvli;jjv|)3y%89G4VQ7Ji8!hSn-N40z$j<Kg%#AnOSe
zbp1S+AR@iI8tZNvclR%WoT^(H&vxe)CbC5*@FxmJPdl#cG1hcnFQbu*ypBWB`P@9z
zcU>GpZDI<$hBhC=;(0Uedo_V~EsjgO)B!77vfqFEvrEd*C78=a>dgCO*C)|y#yivc
zMi&Rz=y}d{Y2R0LVWk#-ibkJQ_&a5-d6F+TkCVk3tMrhk;%lZ7P0~->T|2eDJYTEN
zdL%X$d79d<U3JA$2-FyI2|ha03*8h0eAhN2{ADXw*pwUwoF~2Lge{=&otPW1he-T=
z`La4>A$fB6CY?u#9gr>1N86f@ge8-JQs-x56+JR6S^HQoUi^~g-_&Q1)Y7SAk=Leh
zK_j2nYJ<$v0@p+PWFwcmm5$LR#(bAIh7o86^5g0_Lz~rY4|C3Snlab9hC?P^gbZhy
zgu)x>3kc?WT`{VZ?$lHhQ$#6l2ZVcGKKn@h@+QpNef~cLhKj#S;}<j@x-()2mIydp
zJqqkgD^m4(rov8rS>S4?X~DRCdmD1X2Kdw=RGDmOY{_1($*tCEVm{e>f#h*2IE2yQ
zAMxr2LN@^(u@CIw$V9Mwo27NhnA6R4(o`No*GK2m^pW_n;6;uJiLd3svf2K~UAxA+
zIq~{4>6Fv5kf(13029+R%vP+quDa!Ewk)FYY=9YanU<#@Iiy1EOWn5-QLN(==Pv}E
zUm^i?>c5Wjz_q!w!wuyvv(J(5pS=Ye{R!>Cm0tZ?K4_rh+Hwoh8n*Gn#Z6soTbrj-
zaAyd+gwm%x%9}XkDg;^Ni=pl9)2wYzI<Cl~6Fe>tFFn)f1m4k8Cc$EHwUgE+*oI<7
zc}<k*Cl%R!8iKB7FTnq$+?0_k2x3ifSXb--Y?*e+)`}B^jmzZo`XdxJAlaq5Cu*{R
zHz`voO0PW4V#mk=75CR9dS8b_(`UbcG#hjYvv?8d@|8C?KxGHCjV<~|@BzFux>ORw
zW<e4fgD)d2!T7!c=O3Zy{WZBd`C$=(v#|qIH1gs+F-o8;=;fdpBA{h(zW|-=MnBuk
z_xc^S{o!`6#iH?f-h?TFk!!pDN!+hO(97Cv00;+SNks2}wHAf!J9iiNP%_YD8-)Ao
z8DPoZ>(vdGI2rTjUu<d9FtM;e`I<inXsh^bFSy;ig$V1^Kmj+I)-O@Ut6R^c(P(Ov
z5f8~dki(huD<fpG;%DuLN6}qYdR&J>eu(w>^c`490sIr~Du40Z&{Wojaahouy~cK8
z!T-oFHAM#ogfm}DsEeN%9evm%0{}vG$@;6<lr%~bevJl*@)2T9Wli;ZyZ{duB!ZkJ
zi3lnN(J$2ttEmt8Fafj=hqqV>{s(?*=p7?Qk=9kzr|jxZFJWkT8pfc!<VU`Ys1Car
z*mu&OYMN^bciBF+?fj0g7i96(Nr3A=KLi1sb0jrr<mCK1pU#6EM*iEAHh#I(1Z-Fw
zFa?qJ%(1>x-$9MEwbuINP($V|U>yFkg+XRMdEA+AfW1Ry$|L<zHn!S7i2{kY+-Cpv
z?fB0hf#0Ok*=8bma-KIp5wB>;G(7XGolx;FfR`qPz~$}3-IOB)5^Yt28gV@^yv-hz
zEd(8Nmnb8fwqajDFNoK<X1r<8s(GZX*u2?2*a?@r2p8~nI*xQUL5ZM*H{_=|(J<wd
z-IP~29<8Cc9?FPa+HemvVwNPT2m_ravOdcvAhmw|3dntm?qg4WtiOd`h=bZ&$>CP-
z(Z+LAuN}3)3hL+8gc-jBI6OlVpHZDumf&-_-`}JyNeEFMb{+diMy>fnkXclw170Ml
zz*ZaPYvoZjUT5}6vsmF2{`S>Rf-Z;BwxH|w02NG}vE~z<r!6kbyNkCJaAWpX9Lus@
zH$W_pu_vUzpGdu?J$8k27gRn=GfWEj#qR#|GMdiDmrg^)1IO#50C={E^aYhWe*4>0
zHcOpQZ@=|{1j}@5&f8B56Ev0HlYlJOSuYINX05&+x=kwsIVQTk7$glL6^zdS6E)`e
z0*cB*km<CZuZ_~)=6HYFTGuVHA<x}ngeD4t(uS9n&=f7+Gi(XUsH1@!$tEB@m#&D1
zW%u^$#pjP+k+$SCo%9#WPbY`)(kS-EDH3S3DY1ZV@j4bDhKKKR3KT&hM-%7Pr;=+X
zYq7PNwixBD(V{y%f|*{F;kQ3)R%>Z0x;TupOK7pQrvS#zQjZdNm+GHYs8oiW3v{y^
z`({|zK3Ijix4~`U^uyd!io1mY{Gx+O0h)*niu(~(4Y+Uo0n`c2tHh*lr39IY@0Q-t
zA2fv*Hy<l&Z$E;!Cl(R7{>=238x~!i9@aOQEH6HEiZ(mxWx)QoVz!du-7enK+bR+K
zy?$`?eouP%><oo>{?ZGVVs+x$jyt~LfetBE8FmO_80^L@29V8+SxZSU4jrPuJSS3o
zk~;>9Zsxv&nC2?8DgmnASyXr+u|T=L6Kn^-)oIyz3ebsQ2+3D~2ltx-oIZ(PM#$=(
z&IJGZ>%&=5thbitLm_(Ul5uCn=SFH-w*ZTt(|s*~4!#?5&nUZn8@}CrM%>nv;=}3n
zssEss5ZYcSY-r^b-ZZ|j7S5uNAOr4GPRS&g5C^M##&&@(!u$9I1W>s0ICTi&K!_|f
zvxPa#aq;@;GX~92WhIF=bXT;bMK4RIsK$5t@UYg{LVXu)+A-mfPSc(1FS^A%hpX|{
zjJlHB3x3i^hT!H0wehq!BZlY-UL#_}mu1d2r+yw`<Y5oRoi!T?>Wh=M_#8Y%SZSCP
zj^yH1r0bTA)JG@Z&|)aU1eNyW$V-8j1Ak%S+V<$rJ;+@ychz@mnyI{dBv_X6p!NVc
zk;<5f506lWDSc7OWAAU=Uc0f^Yq#Ot;JfsZW>YXE+(54$vIF3t&A5u$q-Aq5U^me3
zuG|x$5tPFqKAXGPgTnrYo4tv4RDre&B>xfri+_$io8_9&Jf0z=)9h|-VNpGH?UdEQ
zgl3b2I&JQf3C+5ofMGW}aeKnL36v>DCRpd;$jxdFkI50y`yd4Kg7jomb{}+AmO_GB
z87TL_eQ$p@ALzv228&}K=i2UlY<yvL8hje@Dgh;my(W4KHJR$rP}hv>V+#F9ycE!@
z8j?(IL#{o@bS(ZRiZ)hPaK!}vJont|LoiIAha-8-@JhJOREYhOSyKIMtNwC)8zJn~
zz|r96JUDQr@h{EzKF*L)>KJmZm*GqdxpY+Tb28AA6mszofLp3vds)^#1u{L)^n8GW
z?xfM(8&KU{rJa$BDV$FP*uA&E^7DgW`vH+L{WU9nP64*|^O=T3GL03r(6hq8?enRh
z+doG6T1+qO!>^Jrk0P&oF~Z;F;&qs@*f6-4<xRS<`f?@3#3mmE{piALrhFg((g_lg
zUN^gv=I?)(-4HzYIAg3Ti&j+YGe+|0^D{AOuY`Fcx>Hovd_NNIim#>DM80PG%x8>|
z9qWo!YpChEV!Q|?_7R~*mq25C>tX-Fi$4n%@E?w=@k?L$<85*7S*9d^=Ky=>WC2C1
z@M}g$HBe&<n#oS0gUvG*2`Wx?fneokFh(cV61%T09~HL?`PgFMYU!Nio=MXsFX_sn
zZIPajDS_Y~J6)Lsdtb1#IHO<(zSA9B>m&l}SpD$8P-ZRfpVcRL!k%B5Q>p&&$F94b
zrC-JuR=%h1>R*lesKv{>i&$*Wbo4x^Wyi~I7}s-FfeLCY<*Sz{`Nj<*eMNl!fk2(0
z{VDH(7W;0ZA$jOhQpB{0iL|tfc86{7C~0Y_%HH=EO1Qqh3}ZC#RRL8YF>qd7A8wDU
z8Y`zx-A1qtVcELKK0a2zZH)}%-EPY2-XA<yL(54R;ingBRgPz11*rd7QBk_z+i{}Z
z?6CTI0kPtsD_|Q18r^(pbU%a+-UEnq5cTd~$t|!gqbt(0ZVNM&spQpG66s|)Ptv>Y
zDr-cmZvH3AZF^Ro2R*nQE?H7)0Y@Fkj8{tHMSApCdrj)tI5Ky@-lm0w_a?1~0lghW
zthFx{!OKTv0@)wasrIa9*TPe~AkULVM8~rfMaq6*CxKtA)c(ib#Jvisd;8+X{&_@6
z4ygMJN;I32_TRgJE3Nz(6OIp>gZs5*q+NWw;z?=ar0(Hr_vUNV5bx&Bg>$9taSBwN
zWJlqu4R$H6DQ-%EYI}Q0s8RFeyv|hlmK6za1NKI94VtR`ut;%7?AgiNFCg5jc`f_C
zJ@%{1Z`DL+p64Qcrv>K}_!1QFPt$Rpr}4AoVpu1~w)uSR=%!!y|2tlTaQ|0ULikUH
zGJ)hwN2#995ko=UYjXybPu(O3?16%TgK93HJ-9jT#>4-xZO?!C>jr67y(C5ox(4?(
zYL*2YVfzNo^Qmd`=M(`0ArR_jvZN07s_@=JcLPAo=`&*qV$S~awTYHt^@2cCjJ=w_
z7aaTXwBdWk4uNNEu3q23fD}VlAk*wGNkRvA?2~LNCxpGlR1ofdwF4@?muT1ZSo1eQ
z5yxQ&`@DFsEI5dTC@0sW-wOx>i!(+<S2|i+YZGueg!8ZY7F+`~#7B6=1GWffFKq53
zrQJWgaO*<|hVnQk7)qik0ALe0$q`}5Qvq-_Ikq6B1+73aDRbwJeG-!I%J<9>?Z9~e
zh~P2E+#-J+Mij9n!h7NV<O`OIA#mV`KpWi}n|utoeb#%Md=vD>f9b!@y}*1Am_2cT
z+s45cfF!*ypFmD#yc3G<U?gtxYBHxbxl{*9oFxA!*FT$NXO$_^vi|9$masl?-G-S7
z({Qejm$(8v4plzNmh6Y!?(-$}nF-utGl8U=M_T^w$RU6HfRE2(HC8n3BV{iE6b+)r
zzTqR}#vpaPOtq6hV`j(ei$Xv1R|udKFE22eRo+1D()4M@y4?mtqA=0Za`clt98-3B
z*Y~$>-8%01*Z1E(dH9oJ_QhX}d~O)2ESG2h<mPkZx?A{Q&*gL0-*hM^m6ju0FDHKc
zufrF<k~7}nq;((R`zaDDJ}`KejC>|nbkOaVd`H$KQ-`V@HkFdlu(Wb=VccT9VcYOF
z<<Ch&JLUc9`g0tqNN(&LTq@U+bEs@dL2x*)UET<DDxunZmN5oF>aX9hQ?pU2nC1QV
z1r%#?)<5i8(Ah;})@QXuNle|f$Fqe-i<qwgc??C9oSh$e-~?={du$z1@u+2@lcSKO
zKoQz_oBu%aa^TykTh{jgMh7Fd-#gaFAEWF{1v}OK^=<x_(3P{BX109AYdj3>utv|4
z{ML%Uf6XaLdM>nMAG{IkF4@-w3S^fRLp_It=d*i0Mn<90=qtfKXd{g0z{2&R(VJev
zdt2UBz#bm_FPCmiloX1Un>ZE9&Co|iF6TchFY_3$YpzTb5p#{Zd`NV5335ox3$o7w
z0kMgiCx<w5H(J8;<M-4(!DIE@%*4b*zpHKzU(y(|{Yl?V3>%zKM){rp*%$gi?LM{m
zN0RE7K&+YE!6qh-mj3DbBW$>AJz?oOvc5JPen-D)J&2uXFh<fnz1&hR`gTnf8R`Vd
z4v+SdVfY<Fl1@u|V}&Z6{ZP5`{9N|(o0VQJea>6|u}142;GB}*;rFu&3P4htoI+RB
zf!co{T+p3QA>0!cDr+>nBL*e=Zm!i<z9CQ~csY-x+zYRKk9d9ckkoG{^p++Q9<|<O
zt?34N`q0AyiXX~#>CeBG)YUn#Y$DgSr=A!1IdfD*C-JzY-}QM*ag%Dutu2y`JND>#
zkHpc(W%I8zJXWN+=Q8vipIQRS8NWjHtzgUY2a8tpPv!wq{J+KrTV&rMk}s!7P9z36
zCe@vl3K9o>w{pmf=(sZg(*I|3=vB;>mqjU3#ihScu$4!me7J^~^ru-+*=Xx`30mS9
zz}dU+mK#WSTKm55>?lug_xWua`XA%BYlz9u7%kqGV<>8V(|#_yd_opmCx7#d;SI%$
zt(I;rJ<AjOQKAQ=MUpAzu_1N&d@pdt^$IuKx9bg<)8REcjMtgFp!?*)|K0|WYSO8r
z+6pMemZyix;71c?C`|=RTxO~4lSDXi!wXZjPg*#q|Fv6->pLuZzw{T$6;{}Q`07g1
zpNGL1*Csd}t-oA`8kbk%pYpwYyUV2DuV5-$FF#3l7%lps8gLUUhsv7w$eMKYXCtTz
zp{H9|*gA)QoqW-*nd~1E4+VZ=>8L(3Hzo1URVRCC!f_#bDk#J6K&avG%>0t=v`F>L
zIn<XiqC%>|4>6@YJ3d?hO*JV%eyzf{b2Qz_7sJt*iof93{<+)Kai!^F0$M(lciO)(
z*4+C?u@jc1)xGSma_UEFYo?e?rpCTB;be7l^Q~d=BVz^UOLIYKm%skeB-DShUf?@Z
z7JMhcYDI1>2xEqlk#H<}I3a;b#SUL_>|n`-I^WS$i8RItkG~Om*YosDOidqh@g)(A
zp+FmOwOM`|9_7a<ed-VSHvxyCN#WQ3-s8=O%YJAvncXDnlX3rR|BbI~5E1Wt5+??C
z@85WTjIOQGqK=i4(m(5Og)xyINS+|x?GuR-wFTr8ce-Rq2ao8p@h;M1S1$z}Z4r~H
zt#D*KuQy}SPEY=MWu?&O`mc;i&Jd11SQqtkMaoLz$_@W`9fA^yJNv-;fXuY++lyZG
zcGxVJG4r@@fb7f2NsLd7=dN|k3*TiO5q7vkFdx3+<roe{rxXkV3#iHEF90-k{2$m!
z@C|fPmW{R1>m1mFqMz@<I$e(?QBdh>5gSHv8sx{%6kC`m?(dJa9eQgc$J2I2O{ym~
zJR9^+Thb95W*5Oj<cD&MjX_z&Qjzj3;n9y19F_Gf29LNjw)mEU<aCyfaRzI9&2ie^
z3njYVQS896^B667!K-Vi+|{2_`lQXCQ{rRmM>DF5TEEMSS{7$)bZI2OqL4rT486mN
ze$z=S3OQVWPR{TAAK775&PMm=OGYqe=wx~3Ow*yVE|Z=I&uW{7t+5-wW0X<A(#B5v
zHO5jd79Br0Ping3=WkM}r;8f2veGfc%_jF<zid(|HK4DubQYJ=_x==bp~C7A?rfTe
zk95c&mA(q^k>zlk6PK4+50xH0f7q72z;S?*jqzR<_I%~SK)Y6InVaO!6Yu}oxsC0C
z6d;~IhK&Ihn+cAZq3kfvFcZd(?a~<&juL}EaTn#rBn?HA%`53cy~BgUI;$ytaKKV`
zniAVkf6U?p(wEC3u79W$jugRbPD`o5Zt|$~;1{7H#PA_;8MsjM-C)1o>gpQx1ZO(2
z;YLO%Nv`FAbel*+M4y=#f`gdE3q$Sul??Uh#-(KfhmiOG6?m=>H&Ni*NjF)vz&w|u
z;LhBU!cClcNk#WrEM;KI<w^1_hRrF$Im35}yy;Z9&4>FwrEN+@qM9j<j<<9NhwBD@
zDr64gtVK*L{Ms!TIJp+JG=h64q)Lq&E{-y~LkG1f7i{Fq<_&|QxZ|pVx?b|h|C>vS
z_z@M1F~pW9s8t;{a6aXF)Y9Uv&AV=fy!Nq{ZjGtblgmr+K$6pyxB;{r>6FO<PV7_#
zN<S^ro*18s5`tWa4<vhiPRQ|huViS3dTFDe_~y`h>cH0dj7|IJztS9hF`=mVHy3Yo
zUAu73kMeoV8WZt*>;Ur3#qKTyN?-SD3D;D@q7%vF<w5^RIT6gV+<=8+#}bUGi(1`?
zbZjqdzewszlw0n6eQUdr&a=nh+;8uMl7BuYQR9O!EqwYb*o^M}7>&DnGL{YkNUrMq
zKPICpKAika(O}FKdAe!%lR;-N#bT)gb>Y09ZPN*Qs3T@f!j930^*rcY^mrl<mea+~
z5f%pDbu=FAGQ&t|MT}ZGrZvflV3!pJkWIrSC_Al)s9<pC8dBnzMGd0ms7D<rumlv#
zp_cyi!11HxMUf-BzDaVK=8ZGAk(lHEMXHUZ&zIV~P<B|SOBmVr$+o99d|l&Uk|Xx9
zT7<s&^Nt=lF|iDu8-|Bynv1zZ)jCSbX__@TD&nEXBi~8bsWEjxLHoXwT~v^N-vhgh
zO#7QY&U2sAlN3lHA@vFJGx(Ad=TlauDxaH4D}}L-aq7>w3O)I@jbJl$nGfxmYNbz#
zA5Q!!m+&7l{%8De#8%3$ZJc&ZI9D1X<!_A{KB=c`-qQ8dpwr`#P`y&iE{xv&iCbz@
z>DURcm$Q+lTk0!bT-X~9B<zs$k~sExCSPqxZKK5edDjwVqx19Hq+@%a!rD)FqHKxh
z7qbq{zUZ2tG^x*HV{#ipto;**%>&>A&^NxnKJoyVDS7}u7`gS}&yy4Xqrk?GGpPBK
z$#QGWAF~pR<X}wZ9~n50c740WD})c!2|1#KKF>66z!p`5-SEJ$-dp%{KYJj7jpg@h
z#HYxk2C?P6$>DXk@{hK}t4+llFRmEa!3FTA^fBYo!!7G__67SNu6uZU7M5#OF_o{m
zspxzINx54-@))9lg2EI1N;Ijme6#)(t^L0N^Sl@i8*%+{S(1Wf`ZIEqjU%RB;#k6f
zMw5*-rt_ntU7W^P+C&^`9aAnRA>~X@mg5~U*ohp2&o90^G<zYN^Rn4u^l|3Xv`Gn0
z^TUr+Su~+~Mj3ShwOAi(JG}H*uFIrUtp#?9xc%$-Kice84UwUYT`+6}*IZE6Y0E4k
zF`9Z4?07BCB4O;r2&yqUBG=}`e(A5H*ZF0`cKOYOIr_!c>HohsE(~^*D+d^6^WB6d
zxkqYKsh9|bmQQk3eHQ);pPOwZYClX($T6h#;XwW#ICrP@Ho!O>$M%Y&it+>KBjX=w
z7Zx4jQV1ta1IkZUXuY-95Ul^M#fbzqKGtsdUE+l8%h{3p6P<@<Pa1d))E0hBH1zi9
zddmofrqbPENeX)CEeKSac`H0Le!qkO=$zj^ruVm;kSd$m7t)~Al09xS>w}F@cT8H5
zGdZv!*U||>)&-Cy(GU4ES}#gm^uah{JSCiq5H0c&$HZ%tTJ9X0<<^PHg*r(28_HR#
z#gm$MMIA$FCa47mU|8^;46>4=ILjtA^W?K|Y=noD#MCnr?gw?lNH0#GiPdOH2zRXE
zQ>5;_PGRV!%Nbvj{Kvy<jU6#<*)Q1}MTl@*kaT~4x*RfeqW6r~l9h-8hFX#)7BHt%
zTvAW=uzzRE8XH!BP=RqWWaX?$6ij4xAnEgp^PYlCA+7?Z=L<QU$P3CSd-ngft<Ou<
zL92O_ZK(M3r9ZY9Xt*#sF1mGPX-vte2)lP)9C&*z{=(wG$E9GoHJqBu7%tN<jqTnp
z9iJ{Imf%RAN9iX!Ib#~srp#sh8uFV`$r%%|a>(}n*9a36cyV|)XV@O=WKvjM)`A$K
z&s1}tOQKKU$WDj<0#P|9=D};k&6G^|0&|(EDdp{J0>eHe^2v)bR=K&EnI(Fe$AurI
z`@zmn^i=!p=`*ul$!~v09lI%<eJ=YlO?ukx^f2?#I(t70`ic1|-TllR!HQxpYy-}J
z`ybW)VOUQoeRpm6v4<V@8M5UMIg#dM>wq_ForgRcerQQSMcprn2_L;b(RHUU+zV6N
zoQ&`Y@ixNH4-qqVb8Ng0>NhQN<P4qjzMZ*os4O7~K*&|n=@$Fl85xheW5QE08(q6O
zVWa7pPmh3<Bz8EjLCJsx?^17dkk@8UP(78TUB)`&rH62`wLWMMj2`FKQe|+!@#&1;
z($j6@9<??kwqiQvMY?n*wTBc+%`wB_>^m#xoQnf`9=Oiw`F5m6-X-^p8K3$FY7fxG
zm|~>D`icvl2<l6XQv4M4KU=b5gI>gY*e@7UfjV$>?P}b>)W?L1Z=w=i^HiyCV(WdQ
z!tb1m#!MVRMFq!#0BxD(WR2;fgmC0Qmedb+YzoSJ58P>CF72mp-qO>mM<Q&nF%b^$
zTb>8FTwmQ#)uM?+YkN<eWe)8E!Th4EFe=Cu#3(&)rw8BjMQMBpNV$LOe^a`4&2Ws3
zZs)+eljXc$JmN@uP({Gz9DUN^X@#<i*67jXiAhwY69_y@z}<z^BaQrK50-fWr|Wr0
z-+k>TjEQqzvg_DEe<d+(+3*prRLXO?Y(2{u)7OPn!zCY@7^CH@(-cFQ5c*O^MVY@Z
z?8-a6xTDcV)h}z4JE&6La#cJ2+f@PVUBivFwZh8r^dsJv9&NE!H~s7%88^_Z^=!n<
z(K`@B70ZANn&yt64mjm~H67>Jj!<rSAaP81{Zi8j;d2;Wj2@!p(o3qN+qsjb!|Hd4
zQ6KNYW-u>_7Z8MrSkTR2H!Y>}=I}_dN39Orj|Q^Hm1M^Rn*MxjE*<gl*|_NY5RL?6
zpgEng^bu`SnaTd}!C=xaF5@@ICF_AC#YYJsrJp#SCVq?GCjf)zx4{2876ZO=SOh6t
zu5V|<v6fOjJ2*hSra_K%)Di=HfA>RdfP&kbixS-+7Jvv#Ep%*`O_@lzYtL#!HC%EW
zd8URm_6sX4QN~qvhHq@F?v0<9@$w$O6Q?X2!pcDEqU@ILphq~YjCI`5SzP_6wlSNa
z&yCOTP@0K!eRiEX>wUY9v2@w=8!jcroZ-`nF@*1R?)YgWP|i)l*DIW#h0;K}+u5_*
zY=_u^Emq0ke?l>|&v6zQp!nScD-bSDwLFy@D^#luSsmxfApkDNO%%SQvgFr39xOvE
zXde^S{=MMXQ$yK-_dOK^!onV(u#ubMb)QMrn))?vFnFj79hds?qll*7rO#!auS<m;
z>!P?cj;uC^uG>qr2zu2MIa{^ySt+Z7v)s(87+JZgd!T5>ri_)=6*)9wc$}v9dqLo=
z*SmDDJ;7czxf}-*x7R8e+}4gWRG}wDiCZb}{Mk{)DS69er{Ha(>sNsb+Oq%id;4ts
zJ5(N?%SMZ*IhL9odsK#%vZ(SN;VJ2~?YnkRN^0X~;B0Sw(ez>L+#9*LvV}g+`N0Yl
z24+{m?CE>^l|&Cnxt1y)dvwmn4%~L;j7Z9PVPRn--~~lx^j1s2&CLC2u9&n-`KIRW
zO)M)P9|ku@r2(#<KFBu|RdJ@=TD@;4*BPTC?^dYR7s~g0WhSUnotra<Jf>y!mlyV)
z;7uRxI*;)gS!5C$rh4oLO})Iw8aR94zyZSxo*uY99=$D!N4By`RiY9RKFt;$j6ssW
z9VXxeU8?K@RVjlvh$n~f#?o<e_O)Dpt;eBLaOz68ix#3LyP`01^e5|ZYxs))_y>#G
z3yB^KatSldp7Wtpu9@58MqKqI+2EVocBmrw8*}QZmsyeWHUoR_zZqD-!i0Ov>bsME
zK>1@{qgLK0*UPu$JS^2|dC`5RCMZ|~8PyOmxtQJ!PsxNkU1>u`O^>_Ew@8j|)aY{8
z$KfdIwK5-G95Q6xfQ5YT`vP@zZoROIyil}Lde?gMH#KV|%1aozC9I*OriPa1oQHlS
z<w}@gCtx~~ysPO``%!)ye>Ky!mmcR*j;ZX3{>#dI(yAhE4&*dg_cQfI*kSZ$!MqV3
ze)<p3obwkI$y-A^T^ld6oUEBGV*iqTd7v(6ez0nPnscdb_<RLX>Crjan$ItG5l`r}
zIaz_Fj=|~$15+Sh3P?nmpIe+oEe`fItjwo4OG@%@5Z@yz8udH4AVU${u+D!7GWJ~d
zVrg$Lcq|}z6b`M>y!H4}Z=p4d>qm<CxKrHbv*a1qlpVV;8$sOyKOK#Fm*muTdde<M
z&aEAmx6~ed`<lG^B5sLV#bS(B)UN%x--vw{H&hyG)HY7tB_7B<pWm4o6|m&h##mdZ
zZ%b6RuOSYrp7v2yjGQ;Jhg+{LiLA(8JH3{Fls*85^;Gs&*>U2_#4C<VZLF@rE9&yU
z2y-~u&0SSqBcnkt1FKHSu1EO$ziS+zA|kENWk1OH2D<Cv27oc2LVnVKA7Pj(o!U%8
zO*fr4-=eo$9?r;)(^HsKx1Me7(SaC$tiBR4S<_`-;y4>Wbp<woTSrS=s1+5<RTWjt
z#J0)ju6nZ%oyp60V%o-A76)p{7<j##+B5v#G;Gk)!wTf|V_Ns;t&?(cbG2d;k9*Ep
z^mE5nXw_@$x=I|*qsxw0UVaF%6N8$51{+*e+>78>I2idIUz)~eTSw^lA5;yNnKHkb
zz`^KlwX+&N&oKZMY__sD8*B5zU16i7+Gch3ysV9{F(zWQi}!K0cP)}C<G+FTtv^f6
ziI+p=o1PomsKl#F#~g@VUyF<T1`xji6wN$h<pVwqez`F3;wH{fo!s`Js@9J%t1cnY
zgXa{*!ILEmFbz?yQd_BS6A*hzqpDLyXN%|qEMq_$-iEN*)0U0?c<bMXV4@|S);n4b
z>f-0ygf``F^enw*XE-_Gd{k<BhJm~oZ~&rtPkhOYMAh8mXQ_r;f%TVv2G%YA7wtCj
zI@c!TgM6+{dA+ugw-R`eI#A2+=DIW>Aq6+vqQbDJWc{|NVAaXi|D}SXe+Ve=>{5#{
zcc#3UJYy&n-K;FR5Mup3D6!Cd*nc)3VZ;a|Rj_sJ-jewr{O^;m$U(jGp&ZL3r{d|u
zM<SSXpQ^~uG_o}XJ!2o)$KZTWn)J(`{tbHH)$?6~p|=BAU289sQri80cl=+6g!rQ+
zpIu=EC27(Jh95s8O&^Een;Bp_zY|n3{6PT)mf5NaK2#F_A5sIl_xbh^v0WwNQ`O>Z
zMx<-^CFrok;Nz%?hKoZ2l|}<_oQ6u}zXz>d`oH<{Cp99B;q*eW0C8!@LDJHlyYGfS
z4UJ=*X77xcJZ21+svzNwPR`Dp6uV=>H%%TB$!-Q#L#eyYtJjxTREkS~kLu~w8Dk7w
zwU(U^`!pQBMwVPnVU;2dVV#<D>P;R8dofnRr@m#c%q!{aP<`n+RHYv5z3ygy+`=3@
z75Cend*Npfk#6u!QKPiD_#vQ-m3MAdfTzA1OW}(Q!Fu$Eavqq7`su@h&){Wus1qlC
zndzyl(^S5MwU$xVc~M>-KE$0Htt3w$eAk0O4q61<a?7r$D4hNZ1qPw7jvAb4P7bQ6
zWOPZ7E!h=KrOP7B!6j~8o!*RWgLdmDd3&H}3BK*9CYjYTEDvlcecv&7OY6x8qO@8H
z0r}))_FPbj+Li`H8fUX2etem_Cv8?_rlh&)X-;kHI_LIHl-1pYK83Z}-^aJ_x-UoQ
z4aljer~m@LFo9S5_fngYUT0EMCBHeZ9y!-vt~I1ZM`4azz^7CQ@%A>?pU#Y@TWh%#
z1A;+&<^7SKlf?WFzrJgpN0RcvBr!MZN3_=pj>N>PDbMxSX${HpXE|!Em2+~#PM`jM
z(k-1jl!bL-^>PMEuLfhBxG#F8NG_=7f8`_yi_`$#AA<H?@^W1F3N%qeo!isGV$``i
z=Ldvjz+{-mZR!YTFwSFeaA}c`okv^auZw!slbJiMS>9e_Ny_!$sKyUUdj{%QH#z~F
zs9}F}@?ddxiMq!5<zK!22?aUy<^_#yB^b$<8&2-$YvDIc!cmfH3l$rY-~Z#bTEMx1
zvPA0ixcLETN2}A|VcY_knsI+E?VC8v#LBE}*wbp)fd|r|y=@m1Pj@f-@}zM+NShVk
zrk%~s-QO+kx^OBoVsWwljNxyXx!KWi)?Be}1MBVH*9aqYsERD@hOSm_k8Zij(mR#Y
zCt~8SsenE{kK<$`LATwDYf)WNpGKKt`=x~(F585>SQA065oF=0X$O-TuHTyKkSLV=
z7rw%eo)><v<ub}#Sw9R0wXd1*L#$IBK4IlYQHjAtgJYwknwg){rEx2ofm+N{LFFgr
zEJ+j7oV}JxsKHc_>t<iJ>WO-F<B^fMw0X=mlBqeMKTHPgCQ~<Er^C4|sDg1)Z6O|z
zhPVB#XmefYQcv)8d(pWOvw(+gS-IgRsi~<weSK)Km%wpS)q*(-&0@UcBzNlgfDPZd
zy8AxzPzR6CUsu(pzq!JCC|XwSYB;+x#RMB(u7$S$C}V!w;w|!l9!_@PUAd2|&&#JP
z@*)Yy#rFulxH?uo_BL?-?nLwBh@i0r!=eGLZYC5xSK#M$iT|)TX#V&9?eO`ZUCNg_
zbydX1BF@M(kf!C{wb3X9|FKBcerZ0xpHm^8w(+>YuKbvCobnmNH6Qv2_u{(>)@b=P
z-gB-7!;a17{voCsY&w)|=YfD!(WbQwc<Vskc12EAtL}75Ew=7>3-^yQ{*YU(vHbdr
z9*SjIKp-eeoqQptIousFK!NLzx8Q^AK8Ld&wPim&B6Lyqh*l26q?E|#$#-s@`FL+j
z+AL}{J`A_TC}C}qCn8^;-3kDL_!B)d&Yc&d-eb-#riFX|2#7a1WUU&9?li~*!R`Db
z1nSGPHe2Ut{uY$YamBE)%kncP1dsM^3wmA>&07u+orUYP;AOtG?SwEHBgs){ei*uU
zspVp5SLRkQzJf2A-i&{Z4`(m<&3tYi+O_@EDuks2{0GSS1w()E{Ia;T^I$(I(&$9(
zT<KFs!C0S{W~3G@_%5w)t`%09{U1dRTl`%~PX>8`e72uK>z)R)Dc?yygD*uyV&eHK
zfT6}N*NLWO5Syb(E)$%DZ8LooBPh8;=kH}<9)hy*_WbyN8?U;ZKMB987&!wDX#e>3
z&8PHEP@m*C|2v!aCl9ouKnmH68a3U1uuky1!@s0PNPZu79@Tg4S|fCYK7;uo(byH!
z^QXrVts+p8oIiU&JV?&%#~(K7b**i#Kl%P7ihHtU<70yTh0?;ezY4nBd}+L;N3C|1
ziJ<#Z8P_^7LxPm@I9`AiRQqD<c#5uhb<LX?OjUjxI4C$>!34X))4TSJ?a$sku(H{m
zs<&Za(HsAGq%O5Uzkd2hi2qRYlXZ?s1zV1PMKr2=OS29y^dC&@LIv&He)vbwfeXey
zg0^dMF}LCH%`+krA7g@T2DoJMLXx4F>6a!EpT+ukh9sL~I{$*MnE1kCQ1qtCo^<{#
znWySG!T$`fDG!wVGOC8#P-!1I<MWs`(8l9T<VO{r%f>uE=X}mSEBJ{@c=(D|04q?-
zWM-F;YMSZL{itC62Ht11iT?gwH+Qd5McHE*;*a^;RnYkMmy^8$0B2vs(%{}N)st1=
zbsEBcZCK;x_*$J8p-PK!+85o{ddBeK30+PwyE(ORw`nPCA8g=b;zM%$xWUayoO<4r
zlXJt*G1P{*6Vd?VH-Iw@;FLzn*361F4IUJ*#ZaTE6I?kHlOEg62miM4AC#8?I0a3Z
zV>D(H^^U2f63&+8t{_Zw$KOX%rs8#6oV!|&Bn4}nIwczQfvCbB4eg3_=?m$FyB;wR
z%tahB(53Ig=#5<`!g?JYJ7lKy`#;C2z_ZhGZuY8V>IOBfexAzvPN*?YhalL<?HXHP
z6t3CA<nM-V$Yskl%ZL7qA?}wHfm|M5#yo#&0JTHe|1N(+s>X%2v~_uSwGtU>hj|=8
z`^z?KKTEE~7@XmiEG$%hl;3)iSQzNA(9?PI=1oOq>xPL&(|S-0HLut+!{=oDJLsE7
zSb*NIob?qG%>TR(!`Sb44B)b^{0I1O=$RX>$n_o3BHAvN+DFaw=HxUzcUM;lY1uhs
zl-={;!v}|%qqB?|DUbTU9{wM;-aDX)?0XxJ>qp&Hk#%jT6n7m!R0Kh!6I~Z^r~(2~
zg96e7q!ZepuBeEh6M9v8N9i3bfT2p48k9h&i3R~feeWdr{e0i|_nUukv&qbzTh2Y_
zInR0S;<e>dsSH!suDvRJm3AAi8wIM7qVip4KjK=)U8e33w&NNwHy%vnpKH7cIO5pz
z1EzB2$%1U|0((wiACW;KcjaqLEvu_mK3(Ff$Qmu^c%Ikdz`Tb+tZ|92ErsIyr9Izg
zqA;O+hN|1=rlps#UbD`O&@diUg&R)NwFkChOpZVO1jz}1-2-!RQxf5-0jJ}CK8XGP
z8QCOF*&9w)FLYGVnHs;ff{q{`l)6y6FwmGLr&az^;rf|KwDbFk31WZdAwC(}q$GoH
z(%v}#^snY^Jm47yflXk&OrXQ?b`tM$<ma|~oKhFp&82lhQ-qufn?0xM9bW$B@1Ktb
zf1}8Vzmy+Q6-^<2e_1S6bEk3OkkZm!$u?Pw6~TP}{)Wt*t{aNnZ7Z|2zUxtAnliU2
zsZK|#aTzZ&Uov;qx_z@~71iiUI(FltnsI7!YI3Qp+TwxuZ2=XB4TmJ{GWkH++WBXe
zPG|_olvZi6xB94aoDO&)6Di0deMaV`1zG>x{ogL9xdd<go6oK8J4j(!-0o+lCpT7m
z63d-W-sk;<yz+h1CFW0Tf0NMA)#f`rVOOu{q_iY0;QLL)zH-n=wNWFoGXXNJ9j{3{
z)k`RJ+jvu>yRj-LaGl`BkDI<p4g6lY69Z$bOgFa+q#Hxo!F8eyFUX4jJbzz#`~R}_
z0Y}=d6r3k_LWn}c5Es0xd&Xbu32`nr+*)CN>ZnuI`h*348SPEIsj1JALuY0u@op1k
z^^N>8x4s4Ct-CE83@?lsl+JTn|KKS`h_GZOn)&uGyAZ>+LjVYA+Z$@_i#ThQ|5?rq
zMC3h+{;D<F<0f!>=+#V(GR%w@SO_<Yi4ne5urwLiIKdbwwjWs>DXF>3VBC%d)F<ZG
zw#rDWJL328bh~oTX3>WWiuayA?Mj#V9hdgp6xJ7DVw)ql#I1I2{3VS2E9%{OAyzo#
zDNM{6W#i(UdLQtWh$YKO`%xbNU;nU>l1`JwtBcSy-Cqa{`Pw&zw93bb`LmP<Rbq)V
z@*~VKgPKKj2e8Jcq+1gyO5#iwL+SgPa;bt#*IBiLr)`kAXfX=D`0*C=YvT~#@x0a_
zUlLRWWtWPcoDaubw57aw4WIK|VJLN$lz^0$SNpBEuNtn;|IlVQJURbesmlD@m$rm?
z%}Vp;e|l9>2X20woNFgj({q$88eeA{2=w~>Q*LrZz2?rqKZRg|Nivnd+ENdp3CdPa
z{@!AnsM)FK_UQ2J0<09q>!^4Jy!S(yXD{>bSIBOTxpHL%#~}j$i@p9@h{D2C>MmV8
zl9cw3fd}rtoA(TsFo+(q=`p>tTz@FHc3!x-FV1as@d?4dLod0tnu>O)`JvP%0YWho
zGrj`_EVb>x$X|W&;P6R?Y<I92oorrEW?`shOAWnUl{i8;a@*E!Mhkr~AGzqk&S}Jz
z^ltML)j%B9a$9#T9~3h=Z}i*evf^{CGx^uHtL++)^AWaC#Et%ToN=GO)*!2S!!^Kg
zRtom7#NN?B*}47mayYaRm-3PwI2OK7f(#&{AsV}9J`rPD;sTuI^8V*7!GGh#1C3FT
zuA}rtt%O4DO&@QSCx<U~BdtNlBN<xg3d8TtR4Ah&y?RmsCw}osmPsrN3lbk%FFk7H
zf)DNo^~-5@BZXOgC+6;EUJY3~s9vHIIAV~RbRSnIb6TCb0HvQh7|)IkZ)FnUkw_|^
zF87zTpIidiEQV@a&(?gy8Urr#5IglwJkl_ahh02SNwi3~AKx^T_Br_sKk?3`nX`?2
zes_v!$ap8g`xOWzH^%e*rvjyf1t_NZCOC0r!0!tldIb`fc^UfVWhY<*Py%0f?v6)b
zlX3vrpy}g^{fo(C;!hOTYqBu+q`~&a<|Z5lXiWl;?G@&0NDJ;n41NlAup2cI6bNld
zlM6|{@?_)2s5M`72MMqlJg1YN&M7(}j7$P+^?-0mQOS48@>ec{;PXpaebqPTv(1)*
zS{GWj<8(8OoVAL%W<a!j4;XR&ELXM{X})LE7uOwo2(Jr~v(YL+Rkn-6o`2xc8Hslx
znvfxhdf{n*K9@k(+lj`KB8R~WKYw({Wh_)Kfw(TYxIaGgSK-r!!y8RqgaUg+ixQGl
zh`V|SGpGsYjDQ%~*+exLpN>DHB-gD`$tQcxKJinyv@(F(H~$%mgk+BwZzyu{BvRCw
zwWL)e)OaUwwvnDyHPkw^DuaW<rnRjEa&Mf#w0btLI?Jd?>LJOZyYEXSJwCU2lH7#L
zl>n1(G%P*#KVnF$m}42MK_Jh2M7h2HV@H1n!7U*v&b6h>r%iDpC%)Ct#kj)|m$3_*
zOIpCy&>dTOx1;-Az4nk~xQ8I|6*Bp|_^#Qb>p!jru4`~bmBqgkkgiYE!>McOF;+H5
ztXuoj|M+Xb`L?uEWtKx=PGVWG(r&>H8NV@nzR_Yo!dm^dwDEmiS$frLSh{&!r>7i1
zpSz6BSTT`)#b)K2Mjo9BG=9(Zv~j*Cw7was#$;>cMSfAOC*cy&`~{J<dffX-+t#`;
zEY$f5aWIk#!yLE{=<xt*h^mWI$Hkvr1O7&RI|#|*$)@o65Q#!z@-VEa<>D6aq7jtu
z_pK>8Z+)P&4<bt$5Gtujhw_KD9UP1PPRwLB6cRQjkG8FkudN|da>aRKChsEYWd(B>
z+CL4Y-)4~>Dj72p58<ZslADV2Fy>nnzX#wyy!x4=e!0mKj=DR5`W`3O3bANV%?exj
zh|{`&$1=j?Jjg(>Jf&gQ2{H_)KG2P`)v2B?j#NOQMt-EFt=e?u=o18_)w|S-za%KK
zWk?ifb6p%R{)~R_iCJQMc0eM*6CL?HUr36JptgPa^1t3+yj4mlbGJaxkm9PzCDdAw
z^@+!RSgyQ7C`Xj6hML4tbK&h-T#6g@hv;P!y{BrKMUtAs2JLr>t7uJ23Er$$BvH<_
ze^qd6Y0X#@7swcyw_*P1*A%;@i#_y6_LGEie!lEWe|d5wsvyc)I-AYNpv%H}8lB<P
zoU;>)!mL85Hk`UuSHNCp%?uTTh`NFPReB&gRxbsWtWlRQJN`pSOsT};<1WlQ!q(qU
z+FRXcz;Og@%hPh~*o$-jx{dac_=m85AMF>U(z?QWrl05c->qE5gLWo8`t^_h96I+%
zC?uxL%;apIwn>tiQ`l%knSJoDeS&|y=X(FbOV9Gc)^};A3mCh1w}`LQe0LkhYwnFH
zS-vJYY?@xVJWoUt=DVk|7;)a2(fn<0@ypf0hJz&DXiIPOU2KcL0(nEjrTK*Q5nJmX
zr&3|rjHY8a@enSPM>QQcL4dKZz5?>wO5cpkgLiUf>}J2P|Ae;eL#y!0wyoW0IUXvP
zCu@<0dheMWcSwgCg`;&OT#-v?pHTmCa-`9--*5xZL5~DH{4UrpKB~mISzShyi97pN
zJohWmDlxJdJYwd&sTITiydmKb#OhmKe*^pDKMY0e?@J3+*@gPz>!lW((bXi&MZ7Wk
zD{df?eQV=b%UiYio5|T^Q2Nidf2-wPq$&wml&pou5gaxJQP?*(N;yv6H#4ZEI&mhC
z;&`QiX7e!X!#L5#G$=B)s_fz3#e%J7Mc<-?dHpPCi_v`^9v;{Db_8@_5{jdrdxiRw
zDSaGwGeCPY6TCiDoATr8=W2NQB!)GB=c^yvb?A(*0UD|oZ;{etS8T|~$LEKAWYuGM
z*(g_kCacE|Z&G&Wb8l8*aEeiGZ+wc+=eG}<v)Uw3yJDjdx#<ju+;5%e_im`%b#Trv
zfCz3tAb=kn%Gx7=E-x<&36m#UW1Wo4?%c?oRycn9GPtQ-DWe#gnn7lay}x&;7_b2(
zoX2|+cmz$6CdcisS9od?PJIR;Iqe}Tp>V-p<g|<Ywen<|&T47GVAj?BY3kEi8u8~H
zd^{(LdseREcB=w+ukIa}g1}}(_j5jcrRAwJnNY1pLEaY*8{$7Y***Tl{r%-d(+F?!
zs2{8^%+l|<c=^p?tmSGh8sOibbmisbMiQy<dOHro#YVZu0Rg1oc7FjfWSbs8;P5gT
z(Q>(rQuO#N|DDs#?ora+kd*!O<@uOSuD*}5ib~@;tfcK8@x0__eUK3<pdZh+;72Cm
z0#MqH?{*RvCf*8~X*!BbX}GX{ov=$47G~W-FOjNFlDSoH;Xk4O9PnoBWmGIkX&Jw|
zrMk4p(zBjo6jbIXFso0s$5h{FE)k*ljN3-Chy1sI4oO+^_bp4sgDd?wTxb}_r+*>H
z*+DK?(5~?XxMVYGkE=P>F!yd$6gM9X{TtJ2MQ}WaRruVypTdqga*bCiL1vNA-`D54
zp{>H#<FRcIm<NEgpsd1Aq~>D-eg+i46~iM-aWsYWVgL5^^fKDN`!s>A-P+S|*bsbs
z_3vE$%A(<#zB3h*N$FrZwW~)<jL%-;RxHXrm|g+O=N1{0lb^;v91p#nO({ewqV?F!
zlz=Tt@l=LR*rGzJCA|+;N}zs$o?OQ33j!i*@P52B;TiKwLdjA_f@w+HOmz8cX?ySN
zwoZz}DSC|Wq7<!FLqeLIss{|{H7TQiYjQ`9Zo_@rvbFu;t+XG8mvis22mZoQj;W~o
zM+#5Q)q7~(xQ0x`3TW1_K4)3r#CsP~7wbCpPE}S`+7;3k%Z?#CdhDjINaRoR)=f^$
zWG@KzUvm%nmJ^|#E%$RnzG@c<`J`VTa(6`a?zap_Q1^*8or`HYSYVn!jf0M&zO`15
z8!}w;@Jre>3Ukm;K+3*tmYdi8ZA{iYPW(?1gnsvRzGQu^u$QGbX~@+5SM#AGUP|53
zDZ=E6ot!AvVN-BpUuzz`E=4{?;tit)+Kqj^!t3$AgEbZ&8S?4d9%QlOxX0;%w=K|;
zKHp8=8CXJud@t*M(Ouhx*2KooGt)COu|8iN#Xuc|Dmn*8M6_sWN=U&31Z`a~-Wd-#
zI_T|ei7Q7x9VbhpzBSXw9L)QmMj@hB&&7c{%{~+7v6O1Lkh1jYV`D?B`*)4tg0otW
z>RZn>3F<ZSbPt&>W&X?@?rWzA5j{{Vc)i?`o&<bM7iW}ykec;&Xn$YV=_|~7h;lO8
zkEr&?)2&bF707KGgRnqqoa>Zyssyw4WM@WM<Gt_V9&TwerRxN+_|lb7YM0(aTtn(*
z<-o!(3cq27k>>`-tVP*`Twzu$uSb%qUc5c6@VCI~WO{+i)G!dNZP!q-ww@=5KQbZ^
z_Q-tAlwI(_^SyB^y2}M8=(<00p8XdJRb?SNMh?e}p;afygV}pJx9_>a%!Fo03Zi5{
zlr@pq=-j^zftfK-WMs=aq<pt^8>}f3J*cRB_+tfh3hfU3!*_Q~I5h}jT#@iFcq|~G
z2?L|B3%e6Q2A3gxhTN5-UTQ&qyc4^|XBk)dm-6#J>oTS%XIoOprl8}lsUQ#cNU|+G
z&WQdF-lOiK+mvsy8oJ!u2AHr{gJyaUrc?oA&Le;1z|uLR4FA=sE4{a`_g5!J9>^Uo
zOS4yFq><qQ$Fb==BU%aH##KY~sd2BT!_@FOVsi->sV|2hJ1fyBS{*CAw6NfQd#I|!
zUL{mIGugGuzs)@9>Hs3?o0vs8$=Jf5`37Xt9NgIy>lf9WEQNUz%NZ?1XCtVJ2dr=G
zsG3n^v_9OJl8jbloR#+tKCm>5&Q%XeST%L;Rlj_6Qq4uJ=g)@M<8Z~86z^|K=_gR8
z(H_bWWK04+nm??cw(34S<g`(N_LJd+IIy)@X&@oQn?X0TjnF)3a7Xl@q_RlcG_(;;
z)e>yXc^kKXgR4)tyl~*e*vK+eDqNn0%}XoP=SwlTed-VSkM^<(O6RzW-iO&1N>~{s
zyKmO>y_jo(U9Jb&?-x52T`2=dlPah!eEz9_(OG*xlprW8Lw<SysI&y;IUrAb<m5>d
z!a}p62dJR#YIsUw5RjE2sC+h%^4;B2W9q18f)Bm6)Ovhbud8=KWAOY`R_i-6WM;j%
zv~5l;cPvK!yjG3%!qeE;jUc>qrfcV`^;jNv!lTZF=U+1+HPp9s`dD3ALEam`GbwES
zj?0+-IJkt8#&q{1f0e!9!wCiIK9pIihH7C6`Ee@+U6KiUQ~Qy846m!^nuqCju{jv^
zBl*6nK|GtD_^it-|MqzsJYphIYJgUga$xO$igICn&MX4n>g$_!ATgni&BVU27JmtH
zBkA<fwd>&^!nZ-U!Rt}f?`XfYkl}&8=B;&zS7%ARqTe9Nf*V=j<BOMHoH59`K2q&o
zpYKhgmTTc1zvUQ8`aC4jzNj5+tt|9d$sx{9I4Di@Hx5b1SqPFVd};|ZGuiG6V~-yy
zyrQhKW<0;k2-9YTxuka`Pt;{?E!vwe`1OjEoIp%J6H8>_E)4#(!bN%0!2hU=DoU%7
zDpVqWzN9eWiJBzb?D$uraAhvvQKHfSRYZqATGESQ%{&Gpo|<=Y;+7!GXpPve!ORwF
zWS1Rc_vFc=Lm&v*&HOO|83@Zl<Qp0x?u=h2j$~J$agkrV^PlLL4HYH{KIU=P^6g%A
zaPn%PoFSB2*(36iI$N&V41VFaQRzz4Xr_`QoK6*5HAmbYt|*@7sr%74>6_6(+=o4+
z?v)n}+p7XRy27c$a80<SUOfQr{0%8FvchCdk)6IVes%sg&|#g^s@iGD;j4y!cC^7}
z1{4Ac_AUlQ^hSYcDYSG<gxWLkjB!~1JQ-ov++ufE-yNy}hU`Ac7a|{0yH)$l(g=NG
z{LDUQ5T(*!vvA8uNOyXvqamT9aow1EU@SmyINDRM#}LQk9^_-r%bHZd$5`W6`hi*L
zs+o^xP(d}jX3yDxZ(1A}?BgFClW8OD1IbF0bx8^$<fGZhQxI)D%4zx-w1Xi3ek?vA
zX~^26311|8oIC;P>Y9Be?H9N`3BTsK9DN*2Wy(53?bgOAavDSvWO<Nid4h(0)bgKz
zVZdv9!=TQDOn8qP(Yc-52+i;|g+nyKRwSl6p%hK+g7X}dGaggxR0PVVKMB{2(oGTT
z)_7C*i1l8F{!it%hlA*IgAt1gR!eJr2Jt%rw51B)_<?2zJl-Vi{`V!Cm*;B5$(pdf
ze%LnL3%kDV(pz~N+V3U7o<{25MH+fW9T9R}J0y19RH84OS`Snlzzmo#hn(Qf*c5r?
z$6CiLg^5;c2vJPcMTL}ujR1DleN_}9&*+4GTXjX7w?|`rFOs(*aw;?WN}dMu5WN13
z*+;GDeIM<$POsaxRQ;vSLVD>|>pJG04b32ub6fH9#CB*!bnR38Mt^_5wmXEotd+cN
z67%`@ZSq5Y`eh$AOAtY#E?O!Kh^u-%03G5nIM01!q8X<1z8wnH*}vMNNpx-tUj8-#
z8Fo>lxFfbWd>Bntgqi<Bge*pF1$jO(+|mqvLh>!MbnJs9XAT>r5Z|!LM%c@!pQ{vN
zUGv*mI$TvI44Ww}J2!;y(%rwr8<vEdO0XMKSC~Oc9ixi;2ea}*;8=N@di>O~I4%oI
zc#XFI|18-Hm8?ssv;hzgFuzw>3l^;$SqUs!SwJA}AF*`ws9n2db>X2<zhW!Cd$|`9
z?pa#Oq1gamMn!kkGd__T^xq{L@H$VDOhOR_dGZpPBVb9NUbZNPx{UWZm_$9dWI%o4
zExxD7qOd=2s$%#LDl2jAN!OVb`o+rcEraWg``VArf|l}VY<=RhEb)VQ2v_${$D}0T
z=}vC;WDHd1OnLzO@yBUXVptleuy8bqx-3*Eo%#dU$fq%}jJ&XLCnH0^sd`<r5h@}^
zmz5-Up+iwrL5&dBkLCH17)#y%P7HB$B#aunuog>-!+$VwLhtLCJSnW+R^D(wKgDZ}
z4l@r4x<>X&<IKMtDZ{NT?;i(%&%U1tuuVT)JfQ_<_U{*%SXIXi2TyFTFjDULs8EH=
znH~o<>%@iTiABeDIo0Nj3d4(<1%#MG-+*UQI<xXnxV+4AF$_4At4d@;jgbEVsNe!0
zbVZfFHifc&gFVWQe9!-xOO_^oheEZOVNjnw$Yt@o+kWN(#pby;SV*^wgWAnBW;_!)
zn-F6Desim@n!HjVPQDAD7nYSLYv^qUWBm4qpP&6i79^j3;;XIxkSj5WJ7lPrJ<d{s
zuEX%i0B9;W&jQL<2l3e$+6@+rAlVhoQFU=gcf?r!G|%R%UiN6HAki(z-b|lM!qX28
zO*!$kyh^I00eMP?jMexzw88iQU!z_W{tqsgog+G8ys6+)cVctD@X}Uewu>kgd6}YZ
zc4J_zCiW*J?Y6G}{T4;)y~X-T@{DfSmSJ59X-U{AXepq1r$3ss+eSaA>VEhlMAk)D
zU)5}6LDms12@#f;gX#@yu1ZKFQuXDl4MK;1nlK*IK~y2FW+Mlx<+02YBc~gqHmhES
zXsKYo7`f)~>XA4#wCaW4OB?(!sY1fFDR^#h#cnXW?U%X?td$=>4M3HPD*%hc)}Qzn
zPW&aF0D$Lv5MJ%|30WMjsPgEvvE(V#O>hc+ja*laru12toX5r;aVPa#kY*#2s?tHX
zUV@d(5PCIfNcw|`7CNRI_WRnO%0zY|1G{<anjRVn0qDY6(6v^}#W~0&T3!XOZ!9ZL
zo(B^q&5P^Cdr_HD<)dc)b<WKdl8mgZLY(+C)}nJIj&+;301~j5bKXM0w}~83X^5-i
zDe?bRl91`tY7$1>hV5yhtFO)|+iDfwOYC15q_47eST7GMk_~271k{0*?;|PvN!EbZ
zYb+f#(ReWQ+P`+^jQ#|W%oUciA>r;NPmKb%XXVBy?+E(O94!Z8Xt|i7qQD13a1FH~
zkRk`fxys{Zwy7w`<ILHuc+`Xh`=#q2Uf6;QuoKl{&ivV?<p0RER;@Go%O#1UsuQ=C
z1_{74YH7J#LCZBJ0JvN_z48#iewK?V`|JOX6fA#5cK$iKMmNlY?D=m&vW1rPFOZX#
ziv@xXOL_qq#<3ktV&*Ccd8YV)ErKec{!d9J!3A2ilPNP={v9gxnbw#!EaGG^%6z9Y
zBYlzdr^cmis{q3IQQ6iOl68EGxZJI@vYHY+h8%5Hx^iX(=+*1538*e<mOzOx01Fbw
zv(37%^wxS96{*|5O{w&JbTx1wV7i@zbUI~y8Z8%rmGmhac9^#(NPa@fx#IE<iROPZ
z=#Qj&5!Jic@M9PMV*(@#)l2<hRj)`(IT3Ey5p>mIf`R&$)NI5-wIb1a1Mf17tCnkE
z5PPl|zCLmGLZ$upr7E!W1K!rnC($8YgmgQPbJW(yw9Uz?fBK4xrQgOFJYr}H9JUuX
zV@W2G@B6o1imN<9eyAHZIYf}?s~xr0AX(63lb)sb|1G^knC0%b;Y3<}Ww}V*FL10v
zj=U7Zdx+CYoDH{b*J@1Q6R`8lhFgY0OM4_rU)Fs4um&kRBkfI4Xr9b2QMZX6eE(Xc
z^qR|hUg1QW($oXtyev6x+&-)#FW`-ooLJ0(O-Sz7=^T!q-|csX91i=3QB#62uFxE<
z2}*>Sp>Wf|KCffsWK=<k+!xC`-vHIB6=aZyX8l)MK?O-1_5C?9XxS@B`KF^5^4wFr
z3k7te4%oxVMSZiyFBbe`zj)uvmx`8GBm<xA%>Bqk@v^NtCQfH_EhkDKB-*kR+UU5a
z9=z8;tlXR4?)0N4VZ(jc$vX>Jf`88euVuyvkdw`CAISlGDY(qvtLJStdI8iVC|v`e
zUCS0zMu_cOFGa0Uz%F_K9*Ih-qg4nMa{GH_7`|zrg<NL_m(lV@Ar|bnu~kG>cZaJB
zTCIEf?|CiE{K}!XZPA~by^W(w(9#!fCkan0zp>{&mr$pkrF>Op7urvG>dy;MP1|cj
zT{d^IEdcnl+R5{5LlS`SVL|{{)bJ0c*#9wvuF9PIvrSV=d!(!1k{$~CUrQXmj!jGd
zLWvg^D6a|L!_c{X291lbbVaSxeYIcg)A7ABy$l&h6aBF_1((gCE>c_+)evq|WA>o^
ziGt<AWI++74T}8qlu*J(WQth*0#CaZ5m-s&LiWPBGAF-gz*h;@IC^AAI(Zxrr9gv9
zHXEiN9S@vsC6c8vwrAoR3W_g9u|R;_A_|*@f&K~-Dm2y!!{s_kNLTvHOFhNo7GBtb
zY8A?cD!K&XpTEdA;0R%&9(kx6s_c<G-^>OOz@7B^QR-F%zLj?3i^wTD%S7#u;{3M#
zeY_^5H~Hn)QED}OMynu0xg4B4$A%V1kHjC6lH(BeK5gO;HV@K;S+-~+(3ha<Vh$WG
zN?c!%HU7JGqG|1%jfAIr(6$G_dD91tqpZgWHTtTeG(qAE^3Yz`Uyp)VA*eujOO0^-
z7X`orP$rGBIRe05TvgX}xe$~T^+YGE{#=0~*$Up%HfklYn<7by3#WF#W|3GFmtO?!
z4SsQ7z^ASk@qY7I?fh-J=}>?FEXt2-czu|QKKKy}xh!;(=aVkew6Jc)$#0@bxp#a}
zcwr5xWqTx-!B%ZPn<+(HT?IYMgtXMOzq)#o`cp;L=gP9kLvie-qZDHqxnH>eSQ~~0
zGY!fnRh9V<e&~jF^a|7>zqWJsyuZ#YceM7Gu$Hqdf@SgRO^5;Cjh2js74rHVViY5v
zXKZ8|bvA9o-nC8oOzs)v15Z)ctZ7!rGbmcxy407J^0I27dwqF>SUpyeT0ZYhY3BC+
zvBXT8z88GsiIW-KCo|EuutH`2tJW14E5D6I2`^_Ybk!6MhnFu)e*BN8E*d|xvJ3e7
zTgTe`<r&p;-{jjVALEIo`hb_A-P2pI$j3*<iXsb>54dF;Ao+B&TH<&&RBk=xpeWg^
z#o*IS2%m{iCt#n#N0;U3MlP=HcS6FU8R`6(fxf=J*KYO0k`?KU(aepMw$BY994x7M
z<M(bIk-_@+0<sxqJ<tQ%1=LJfiNh}2chL#O?{QvaJe2YD3;H`j7LF0UB2kI>%U|Ey
zet%JunX<edA>_)P_silsl<4F#v_^`1Mhz2k#cqmAweu@}c;MjGuQ9vZ?7O1+tOEE<
zMLqv@f6r(&uR8OTXu6$NOuXXYB_+EeRE{S%0H|E4e&wSp$~!>4-uy89UuX&o!vKU%
zh^NMin9T^3p4>l2lbuIGP0kZ_Xd0C*amB9lQ@w`e&Kfj_QwOyMON#B&llhk-Pi2FY
zV1{kcSKs7q(~aqE)VvkP=;CDjlTT&NV^nuzeN8pghri5kBFtSkaH0SG0sF|d>!nuX
zMKw>2g@=h7qJ@F3IgnwcReg~WA=hFm#>czF(;=qlcw>};Z2^LGY^fVPa^T4MlS=I5
z`Twk}@I>HE15GFGzMj&TpXBTRhMy{>^iaM)hthwHu9)vygSZcD5o~P^KrQ`I>GY~H
z+7Bo(TYw=ba?tBYiyFX1TvX7?z^|)V|LtoE6VdIgbk{ApZDQaacGhBWf-72q=;Dp|
z_+*EGMK|_F8(x<r)8P;e=97yP%V?D-8HEgrga-aC@<H2Eyu{Yt0iz<Zk{1Cb<?<C$
zTqE&LweLzn>=%|*_#LQ7SKJxc;qSpb1238`zn0%9EOZSn68lBG^N6SdWp<#^Ik`lU
z)qFq1w6mk!qSn7YXnZ*Ppi?Xo20c__v6fn6q+GA#ztaZ_Y}EQn2CZ9TrJd%VYspX4
zeC9m`(<`m49t419auog@JPCx{u>e1AqIoTA{-Ji+_qqFlvD<J1o4CJu_oh#u;s#~v
zv8CRo>Df-LzIioLt|~!)CCG{d`3K(AAT@d-niBan4j}4Cc-VBOHjXNwdW#ZH9fi0d
zB0?Uz-xqwn7^8FB?0U%Oah-1Ry>O^JV;Zt(9`Rws8#`44h-7!ypN;g`;l)qo(>xY$
zwQ9V{8?&{Oh@xnh_0vqL;#00;2bQQ6Y6pd3{*@o`t{={>=*8L0{+OyI#LQLuAuvj-
zU9M}1k*@yok457Sip#~Gy(nPMi?;jV**4@iX;WvXbvKY(MjL0P#oB#8kDbyy=Mgvm
zw7Ih~*Gs;2iFwJfa$?=Y{WBko4lhN=zB60>H)!8eK2J)GrHX&QqDa$Cl=^D7*$@fB
ze|j!Fy4R3oc`-=&`XK<VB0B;d`j>Z9L^@oT@B?WUvQOLayW;)0BBSI7w1?U_;L_^@
zyT3`=zP#DNm*3XFHPO^C2%p6!{{{yFxSMf23NJ?frg6(r%|$;*;>7_$S2l{}(gJjN
zY=f$R*#xLn^L~MwJ{o8uu=;Y!uRkKWaNcbudydxq8r$0yZYVEuf+xeet>}A8w2^!8
z*&9to^o@STbON<q4bR8NJ=Y$k*kj+-zBo6S4UA@gO?4kbZ8&Vobfb{cqu4*w+5WCJ
zGM(r!ou-LQGB(Jj>+1}srZq17--s!iOgha+jU0}l4lSD)+H&W<K8w^d-tmhd_@kHK
zA3~OTSm~yV!}mR=qD$98g%e84rWJ7NGEWaCQ2x7-Bt)cRD+)KT$!HJE7AB9w9;!?#
zL=!eNwEYVg@V5$T)bl5<VGBYC32_i<a&3w;rNkJ<Q|m!Ik!LS4_}o$rmC~5tKfM*1
zhF_0rM~eyf%Yy7@Rh1?EUuf4fkrI`(KjS$W_Q<w2`7gk9`RzKqr+Jjo(Tno-Rmkkq
z_e2d+ycn!ih;S;}PY-?Fac&1rykh$q1qx6VIdBnp3okAws@YugWyd40-feogCNm`9
zBAdpfWDl^7_D7HNf-KhW)&!$khegKxAZgVHmBqYq`E>umoZXW!oIs!;e&iv4I4_@3
zD~927ghWe6v{JGNJ<je8T)^e^u$02--%}!}r$BEM7z5uOJFa10ecc0^befFQFSuj<
zA4hBM)<0zb;2o!?3JG}r^}+sK^aNuz@_r01$R&>%05D4q<&8<IvL=%Hi-D|<gcNxK
zE$?4jj0HLv7<gxr03byJK~^KS3(Jy41q-$E@r+JrCPo1d?k}#n3M&1Yk1DN>D|jTX
zWraxG$}y@rU7F~o({mPV^*LUuJzK8mR7E0d1lTP8%i3_>IRrV1doj#)nr>Sp18R2u
zDHg1653N`pmj1fRcA3ntZ+71w-pNIn&p4nhN)Epiw?<jWjb0(G>IVIim>t`qbe-9i
zGfF!P@8Nmt+Wz6v17(6bvj!l}5YZR4TEKib^W8IZa~d>io;n>#Fv85Sj)5o06K7$R
zbamcJK~^jTJWMl*rPmNcqaf?ROLK+T4#n!lNyAEq;oiQ=;_1^M0hO?Yke`pK!+a_}
z%k5WkY?Iy=ys7-YyZ-xrft0H1>0{uLb!DE`C@D~81vu5D+x8Nrr^%@zO2Gz5Nm&<g
zZtOvrkWZ?D$em$_mK3DPheetm0Q~0$dA0*C5i<M(53&X9Yd}Q>Z6+xQkrOdMxlHi!
z3$7|E+&=iDQ@Hx;U3yDp7Q1P8ceOiZaGIvXEk-|loihW)Pj5O06OW*D!TvbvC~}T)
z0*jN(Q%-}B+qV>8YUjznfn~B@NuIqgFl#()=}3b@vz$mVE$cGMdpkl&RY{g~An+8K
zw0klcKEFqzFFHk^!f72YOGnK`6ZM4pg~^UEJ^$QZg<pnA>5HwC2{jHAVRx&4!*LMQ
zCN2d$liQ1(|2O}KW8GdvkC7B=YBm-jLf#n+maco1qsD9n0k^dBoAx3h*Jjdck&+LA
zY@&i1F04rblq?5w%3vTFmh|7?JT>hrZa0IN<8OE)L5k4_J#EJ^Yv4v}if70P@R<|Q
zERZo5k`*JT>HmB0IrA|Mp&|_%^Q%jubDP1nn3IXj90BoZ$}{%%@vQwGe<-1E6GT;M
z56JH`z~tO!k9hf?`+p|o$CeeH)7N}7n+_ou>SQB4NXp@PJH!H0GXxUDyjgove;!l~
zmk9P7fpErOK3j<}kw`*#qo@T?`{`);Gs?vIX-Gi5!0TCg2vpfeJAa<&$mv$|Rk>4S
z3RHfaTqEd;WI5ISYFKRRK-1tJIxk8t!eEuGTf2XFUlIh7OGDmWn#$JpMD{O#!jP>w
zFf*lWQ~-QvF0+iT-hNc*l<m|N+oFg79}ge^(o)g!rnRQSmh{K4*>%dsbuxf_d}dY>
zwV3N@KY)28$xO)l{Lcu>{C0V{f29_hF37s{z|j1fuV2T;@XV}zyZ2kiLXQNG0m^#w
zRxBC*_mpO*)M(9u9w^iRC}4uX!Zpx?;Ic91%tVA|XDWazaJbyk*W|I%loLM=2W^8r
zH0PE1z`T!3+MSU@wFbB@Hrf+_9$zjt4z@9v`Cxh8A0j8A{pl$`qI(LiXKV&8fnyzT
zM3}<*{rwDqbs4f0!1F{)yn0L}^Ng73@t%hAPCg)I5q0O*xw3X^7MOqhj-#xO?+_ns
zcYsqGIPi>vOfIT32cX0(4i_nTg8Ne3ijJTCEeljD<@$>mRH)E(y0mqtzlWB~RX@at
z)DKR5Thm4jB3i0t$S)UY>n=ez|H57jI88(qbV+CmE>J<=>{J8!FNfTn-~f|1-_Mn4
zVdo8Cq!IkIx^p$F;b+R7!&a|*zt{;;)FdQ9WuX6c4l$?UaX74`^uFIfFgo(fR@ACj
zsQfSGKijtoy2it|dX@~NWhb7XRn;{F{VU(!L$toorEg&yaX>aqNYF6ii?to6N#gvi
z8qBig_0I@=CQE!5u(ndk05dRVV+Qta{^yQ!h9_VzXPYp;S@|dTTJU5l$Hvuts05Z`
zetx-E-5RWR5FrE9pm3)2D0=%;^q>ftzTjX-vhbHAZ-EaA67|VLXJNAhOAWMLxIF(S
z8ulXGAEiD;76xBdCGNo0eXzeaRQM8$y&Fm{(^M2;ew)o)up-AiM16A9WZs2hQQt}q
zjYfQbHC%J{eZRCIk#I!pP6s6rFgO9mPG=8|eM}2q7`1g_EkClQRkPqE8KiYls^tGb
z*H(KpwLiFCL(r|H+W>J3gjPyU?*ICMuV$&M)c0FH{<YWG#6Wy}JfB|U7IQajsMsSV
zC5N~3@MA|>b<a2r8>M7%N|lm<S7CK2s`4b+8Nexnq*;l7$2<fx1*fhM$?dbtEkk7q
z9NawMv;1Fx2)vXSNktAFxV0tlMtix>ce<2kJ{QQTd15&=siz0yuoI!b-kCW%#6d`L
zJZBGjW5Z{I#KX&3oRTPqFElVQY0KwNkt@*h5hy(s0NajU9h_l4W-Z9_MeTJ>)b^bF
zmL$yYN@<gvaBGc~b?pN|gXdC~4<bzPUII4XF>j95Yh81Z$bG@bu4vRZ`N7l{oKV5#
z`anfd&M7@bq8#{ZZq5*sWlDo04LB!T2_+S4@Dos~Xzs5P+gr5?M9Ep_ka$i5geq*|
z5SZBqk3_#Y<W_r%JOYRL*8RRVKJqYM&X<v%j!4@#bSKqr_|d|3mA)2|JYnW1Y5dra
zjoI1R3{awUJilYZ=ZL5}C^LJG_5HN~jw`h(%2AZhg8d^cb<i%9H}2+MHhvcHdUO`j
z(sY5*cd8S6)L#EO90O4_wZC&HGvXapXUHN8YXpdOgPhZe@O%9S*!r>H*hoU{e9P3Z
zZs;f4;aDu@{I}EQ4H0{1?!JsVZ}o5n+r*5;vdu%lqPu;N@@YyGH3|Az%Mi>5mH_ZT
z_@b#B-AnClqxFies7Y+nC@l;kh{{fEfzyNxqrX^Za{9(%Sc~L~D8eeJFo+&^c>PCn
z<K1DOc#nQh?txV6kwtuh*T@%)rStOKN#GNSua)(5M4PxaClRMUy(ZK;uEpeqA7y~l
z{84(@&GgK!GzS4d6)+f5@ELDNmGl<QpQ~A(P&R&uMZe|WMiOdjj2a!(*1IcTJF&v}
z<gU>6)X3lvap!X<&);_AXXi>@{p{9KZiwZGQVckSW#$1SbT)?CCd3XXM51F!)Uyi?
zx4;UQBNH%i%|dM=A%U6;oEFWeD7MRheZ~z?AWYCiVMEyuEd^MH<^&l%I1aW?Hz}h#
zH63rij~V4ApFqC$pN-E{^onbP<bC6o&rTZ?8o!42Y<Tg-XU<K26G~0)_1%dRDgqPn
zr$ypa`o5^n4FQZ&>`Axf93HtQUSW=djVxOY#LlaK)xY&<-RUvW?bI9uB!nJ|fO?*r
zFRKd1@>BtqH3hG~w4`Uki$~tNBAi*V@0~X6ADtpk2IeK(axo_Y0?H10-baS|^y?Li
zK@k<}Vcw^XF9`=uMR-#Dy0&(qmK)W3%w+9*TSh)p`@df3taNm77|9{Va>pT)L0HV}
zSjG&A_VX(a@$>XyPOnY0J6$^oipvSf^U0TK+E~MJ^8aA<cfis4QDVHdxULE?NN@!w
zXe`Xt2)TL+%X&O&T=fcK#%X9wq%91Jo#KiKOS+zMoE!##JY#ep+Krxe{Q83+NF<Uh
zg5?F4KR!&T0ZJ<xB81y_OqOS@@$ypx_W6ou$rQbKE2w&XA)hh^Yk7B4i#{_9@t}~g
z9GU+8_!O0-mEf~7S6VAb?$EP742${nH%};z9d7@?q9txP!6ka})=)J~ks)idINM*D
zs#x1MV0RJt@wfnOH=wMwyiQ10MD+iIyI>)CWGH=g8z6rki5HNP3uP~vPk(ZTt|8w5
zVtJ!#0Jh^;aNHOf$p?6ponLIMr779O6LrFpq@fxivX%aoN@RX6e*7`=(ZDFDq3cC9
z9rr7>awHmUWEfTRD0Q12jmP%MA+feE^-oCWSLZ*qXJ_pZ@ARLKr9fmtZ)wSEUlwym
zZJ(JjU_pAcO7$s}4TezcTU9~+32<M6hDo<o3%s8pjeSD0vOw?+Z?AX4e0I=%;>=*;
zYnra~?SYEi*=ki>L+RyRZB8~saJ<gz+zuAT&;^(Idk!m|Cs7WqQY5!wuuT#~(~DtS
zrx$*?cFZ4XkW&@|FH2U27uA^Du)nzZA_?%*0aJPf7UJ^qy@7IbA4g`Qip<~K>jTVA
ztKo85!l1{lJvHN^PO`*~BxOqV;()zVrd;zCxvzCw1&|MaKCGg5>uRlC2h7;(DyUY^
zl9pzysF&O7w?^bg!%?TzaUez;6aMJwsZgJxG5)n7n$nV~b)0iUV_!a@HWhGRr&#UC
z`aEF6mNKHP69E4kaBA;4z)A-0Sjz);&XK5ilsDpw;{E)H7XJdl#{tgcldSfE)ghKj
z&SYCvHkM$>m^%D*p?5!{a0~A1v&(%fE``m3-bAGv(v47Qq4IN}`hGQQfW2Ab92m~<
z9#{geJk_{(aRMZHlWJ-S_ZyLoYZMfyv#D@<`D**wp91IFS8~&5W-2#^T-(>w!Fvwa
zo6X0N%vJ{a)<@Z-&BPvLN{!%s1CU&^wZK_n9xIA7grWIxi2GWU)q6f<^&2Cn$8N*D
zTU#aG3=IDFIVWVr*3Zw6;XQVg@}nM5LERjBh?hH6l$g(vOt8n3+7;$oJXXxq&}fc-
zqkdZr<$abSNxlcdG28*~YwgMB@s1-(_8zgtuGszz9LU{2Dms$Bg8+LtaR1CHx9^os
zqeK99gVnr;lP?zcAAW9`55;EfVXuOZ+tX54X}S3@^YQZfl!*W3!4L7UBa%fK>7mMs
zmaxBr8yidkJTxMByd+QvWobA6u_g4APpB7dj-m9WHQT%J)&_?570&oeu2Bho;~j&`
z-b>3}KKU}~g@ws1v0u!qqLoJN`%rMsR=E-Sl;~ynv)c0KjHPf6ajg4Kf&W71X@ub7
z+H-b$@rsgGuH4&@AKD;2P!6b2g07{DgNcc6p7?l^6mD21al%iFkHL_zkl{1x4p>P~
zVr2<<*F~vZ#?l_A4Sf(#l#YcWcH0jw{ir$yY(eb&*MbCFy>0B@4shBL@Os8p<ly5~
zyPk`{)5{D&pyI4cxZthpHUHsJNo$KDsVI7EWLfOa%JymT-CiP0KBcpN7F5g|2o`pc
zTHpc#$s!?<isgmr{C9(~?grMgNR|w=%}&Bj0P_fN9(_`~GEjprTW(xooVTaZ1*+C5
z5&D45^PAOZ{dvq39XaZiaPHO_BS42kKr7e@Q;??U!UH1x{wKnKkwYwY#%>+(+T5it
zOr0L1;~t#ljwQPbAmbg;(Q#Dcg*971*)Y70ZxaQsb-&Vwp-!mQ|6g#*9`?J%LPfGH
z9HQo&yF>-MQk_ik?X`l;(%dqO#Q{<K9X|QL<1RnJ5{t;opQynRj(cU%)gyB7kveLz
zsd;k@2&PhtAV8NoPCjtIC0DaR0hpUbJC_!O@3kBDFkGEi?{jK2d=LUVairQU{4=Tp
zylnJr7ib1{9+J7u_5@*#T!03E>th55L<!b71j&k!5d>sT*?BD-?(!f7lKqPeMmVfR
zwEdDm(XiP4L!h>J7kXNwz!JiaEe6-Vx6$yTs*5Y=>fRzD;P^UV)Tp|TyA`yKcx`$S
zn>bgnsX#s_=U6B1o_6BXl$wh%d59oP^g|usk>@F%&&p>I-P2K?_I|Z30s`8c5`Ocf
zY(d#mWFOtC#@DXsc(@SQiH9}#z7}KM)xc>zE*X?AgT`ENm(xA1&qjwn=8eQt--BpL
zyG1g}c&5~z1U#0JixUThi9L_71HHi|6hwwYR10)bfv^@oDKY|;XCVh(;+lBp52-lD
zY&7^eQA&zu(y(m$7*3p7!KBULF(2P%GiN1k$9ep<u`(=}*d}r?hMhC8QJK*>9Z*Uj
zmFM@A>Ln+zHvwGKqciF**8vi-Dh@k5E0;Hl`1Qr(__TI<thC=q8okBX(ET6|xvZRA
zKY@|6&T;aM!1d?smPU*Rus=w`mqKEhAVLFIolV6_G7E6nB+_4D_!mgyYt(9J56wqG
zJJP(kw;lu1Tj|xyd6yP_r%R%{DwlHP)R5BCwT1SdMI+mWUzK~VKMe7v<YIw2n{~re
zaTlS%q#0wUZ5S+u3pfvat987OCqF+;FKX8+9~r&fk9szGe35yw@7|?fZfJ-+z-?(7
zh|rmIu$}t*<($>2bEOxY9{nxy02~3aD=Z?g^ZdsLXCjTyY*UR0lzPVZ2P*R|!Ykas
zus5$9Y5DZrN;E=>DXdmYnfGmvV@<R~8z4b~S`CskFgF8q8O@o#U*}a&Uq#pyee?G|
z_EJ)RI*3-)PO@pixVoIBeh{iFB~m{Fb&jr<dTWzzV#i@x(GsmLD5-GwLUpdEwAo5H
z9z>f9dhM)SE_ZjfE(aTJ&>XtbPMSz%#;`rqx)f{+M>JD`kYncL@B5Qpd-nq;W14GW
zA@$)-jdvpMqZb+ldp>WdG6((w4|}_uv{ilII8+;x@+bNJwx56;)^AZ$^lW}yBa7ZU
zXv`QP_GQ(#y2cVJ)`<_Xa<&|-@?~_B=7dYb&KEJyTG)NK6e9X-BNtB$nWMZicSeKm
zx!#%XN!PjhT8TUcbU4(-6vwopJI){A!yfVTGA~)_V{EJ#CRQv+Mv4+%xm^GYAsvG(
z0`^I7(thevdaxfweXAi+m!9l-QzZV(j>uiub^%?#*5rc=`LP56F}C;njT2MKLH*y)
zTeJVx6=Cl6e_PuUmju>M;oD-kCf@QQsJ#oYy&(=(&eSQn5Bq_y#+RwEWBI!KZtTZ*
zlKfAS8A6~Quj{`$A~<y}%&-Y>5-2%()#*)<n7qfGpmPWWtO4+pFm5CNX>f2LxWxGs
zWC1m=MT7b6?1U6VRCTX%%)(Al<XjJUY?E2<(iH&kI)!PRf$OIVcDKI4$$G^^4d%p&
zIqdrZ{V&3rcHkQaWX58k{3`|0K<RcUk(vN_Y;N5rkAZIh`;Wt=M@l`>=Tg|XXU(TD
zG+0>+G(prKKR+KMV0&q~%P3Q+oYf|lcP5^?#_i5;_i5zy4QJGMWd~u($u34-JX+ys
zsgvVySI3C&ojWRw*3zZK+d0W4e7<*_%i}stxtDqz<h_s?a?aUwe@$Y6EYAGkW-+Sz
zVQ|<y_WWW`S9BizzA57or2~p#)C$g!({)7V`CFf(48a}?#))~ls>{@~nf64>%h+$g
zrFp4cZpn5S??DfpwQcE?e*#>yuqeP%Ijr7hNPP3A6V|8l%6Pr{{QRMZv@j6lp?Maa
zlU~viYJ0O-vz&1MeyZ|3a%ds0aQfbT5)kC!w*l($GBVeV%Dq}&N@cfAD@038&rAd3
zRQF@k?qZS=;K_B}R|nW8H9cPnAUmpmwu3OxDU4VRM+in6$ID05sxlv3+v$7x6nhxJ
zFGlwp7kW9+Nc#AfepWLQN7sM3bFww)O9J8|YgoyAdnvVoRJoDRu-FihwxfbXogJqM
z*f}^vUvq9x#-xtU@g)>y5N($R^bYaIv>3sioo>cUqvqvq4POf7`|^yWr+{*hHV2R4
zEHN<nk9`c$UMNwN1L29^;DXy!3!H;x4+*iZyZicF7NZ0G%8gjdi>OoReA$u#dn$pp
zrah-rtr|$zeq$!$KP7IRdD14)4V3)fu4dPKtpO2z)%>(ZUtdpnP{@BSIDnS`YwyVB
zE{+W;xC5y8eGJtmP|Z<e^tLGH=y>rh0;<fC=`vZEa$=sJS3=1rPKqLq^k2okk6m>+
z|M${UH|40rX-byriGdW}t>+i9uLUH7;^I(YB28v~Q7~Fpv5n7S<Twl{h0f?w-(SbD
zuYjwoON!vPp-kI&V<qObm{>dA0!o#|voVt=vq^0W5RpvZ)c;A3uGMsLUSO_p%vwOS
zqZ#TBdkFWRZK$GL8F#N_2(jvT=0VD_0xTWgBNij(C`01}0PEOSdg{nJy`pX89T%Ts
z{8pg5Zmy5@$DK|3AzNq!e6j9*7-?0XBkE{=(Ccs1Cu<C$s4}0QoluHWb#C_(sHw_i
zBV6pe?#D#N>mGBQX`Fg=1!jpre&*5wM|v;d@GKDsrcooH=7y+Jk?_CfAVcZ4nA(IC
zS+XFBi?c(5AKcmb|9NZn{kyK1qJ4-kQ4J(icu#T$DNa8kMdwxFF*27$i*Y11GHYxX
zS`;e5xQcQM_D54=#}pRZ_Gz*m4(uLRtALeYC}F6jCiihgtiT%kxSOL>7|;kZV=7r=
zOF~2+j>5*M+q@H;5N~OL&NoCYnWHrj5=%N4S~$Vz7CM6c5?pa+W+m%QdFlD(vv2O!
zO!&-9t135cd9fJibdEx@eD&xUuvd5U_O@+Kc011b&2<()oXAPYFpN65Ifhd&1OYf>
z7)eb8LdC)5M|DK#vhuJ6I-)(X=6Ujg;#%<&@E&aYgOgNK)15cB*R^-Dh~Pg7v=4P}
z{<u7U+~G1e?!p5wzrkgWskMN=Ug`#@fna|^N;OBqLOk3EF!{s(P7o97mu;%L1Y}N{
z9v%_kwQdDTPO<P`5}7>n+l9i|krDWL+Q*{_-x^YO1Al|fB|xs7I*P0&(fA!5PsSU&
zMZBc@ejjN-%4gJe$$5K=t$fm2CG-8?oA?FLZCscB-}irw9W#VoaleRNVX~%w0J$cM
zFyi<%Gs)OU%NZH_k*n;L3BEB}<V;6hE85Hom=_Ra&-a7zRv9ZE4mLl&du})zqE-Sc
zkMZTnlM4G^h(75I)7dU5?bpMVIa445OGFXji8P?hquk?jE<G-7`p2CC=2BzM(ul(G
z`>f0xp`B5d>u}17`2h24hrPguw{A4<hpn<<O$`Ibr(ltXp>3xOXyFB7;|gIVL;fwZ
zlxAd1r|n*ti}=>VS0tj+cr)_4NhQhlZ>BJH-n#d0n>2FqZ5;bs*g6h7YDipn1Dkf5
ziAea<i7h;_lt}TyRZUPvY?xp<&NF|0_hEu~TTFY@?Gx<&0FFRj&FW}hgrDD-DDAY9
ztpjl^bk$d-gDAsQY=vk~qzK-(Z8bO2QB^~gMXYbA+QPE)q|;YYkENdlxX4qHakX-x
zMBb8K1Jdes9nsOL!;9D7;rB`{%h!59?}B``&j(){F_s{@vtli;IBR)M2ovA^+sh;3
zGd`q3x>2vVwfqcOGE`RjyHA&g+qt6CHiU(OeD4}*@^Rbd>`=szR!uZ&0%At@;ficm
z?zC%sV9_n}s%pt~My&5!-FZU+bBBe}PQf$JW;mX4Kn!OCZ8`V^UDZYj7#J-e##zAX
zA9j&))Cx|KX^l~(5P4tL*nu9_apJM?zNYgK%m1kaCyK$<+0xRur1O6u-MNXxA?7x<
z9s8GBG)?^!-R0#<q~{chDuKd>;?uc!pQB6sBYj0c%6?2tX`CjVSo?h_+3LtvjWu^x
z@ija5BcyZVEzn9xri)0Z1b<$fii(W9u!^dW5bcMemFi(0$@YJCr=6QsH+`zFd2*Zl
zJE??GzeBqZi}8P6)M$)9jI_9td`HXX-_;tZtRF4q6a8iSO6p|#*kqYfZFF|ww@JSN
za5@7BX7JwK)`aN-yl8)7DX&56`&leLG`|^$C;Z<=$GimSMWmC$uv&3S8gmQVR-G`q
zbTT$FxOi`)JKUzu>;XqAxO$?DG@TEKWN)CLDXgUUI%;#a;JOF~1g+uYI|Sk@=juw*
zRJfJooUBz=h7=zzou88{avfREThmyn*wZ%LSL|e_;;Eu*?PP7yeu0s(l5bML{IYiG
ziI3{mh4ItbhTRi;+uVC?=9c%iEri~oQ@goN(W6PrNAi?9eQfNsZ-oUTt84N2H&RD*
zM7ABt<guZ@n#m^leu<LY+GF8_mbh8jWVYL=h^**D4!XMY$C&G<m42?>iY<oVpGvHo
zwGD;!i%@Mm&^s^_NM$ed{eX?I5kZ~3W>&b|!s99p#BW{S$k>|^ewqOwv6WYYBvfdu
zoNx2-Vx&#vt_V1c_}^Kn+B&@BD4rRFukx9!3iX>8Yg-%D0DIHH(0+d}#@PpF-PclG
zwv)PhZZ7QIWwEEva{T#Xn27a@%k~2KCdrH|%8XxWN9>ChuOy1Z+BmmQsy61<+Qj*^
zWb<b?#OY~DM0pCaM$gg)0YA(NA?8ri6@gMjrH-o4g11jof3$3Wd~Xp=^!UN!+QFZX
zww?lJmxq&dz?rLZjPNbe3<}QessZ9J;1W+Zji3_YUO}R<#PqF0K4_c)U#P(cSG|+Q
zcW!4WU)UVjfGJD!JFkjvw7;9@w?WL`yz@EVN<pfen(xKOSH=!<7q{EvtI~-ZpV#L1
zEV{Mu`PWwHn6fU3`2p3E1=l8(w%psM9j4hPD;0};1fDLE(QWQwaN5(q^Axqzlr-t^
zzam^vI&c4riZDMIb*Vtz(!*TbM=WS3=R?G%qGJ(FPe&e)5_t__?Sq}95Q{u+OV^kJ
zgc{{~KRUKXyGD1xR#mpO$9|VYRG=NbKC^i#G?vhm2pNXC7?HZub>fR&dE4tsSms{q
zQ$1)Pc2rk{W_zW;_1|;Fr|45!v{yq<bos65@8<+Q55+)gq&W8>(RTu+c=8D3Fm)w$
z$l7zkM$5%#fJtj?acWL#(IVs>S(MU7)ZQWK*jCCj_%%tF<Gfwa_}R-Y9IQ-Swl(v%
z$7}asS+KRdnf{Rs(~nw>lz=)>knv-L%$JP~b25NH1NT@c;dLG(GI23xF(hHc6i8X`
zMBHa6aeiZgu?7x|Pvz!)FHPrxO_8rf?!0hBl4f>C>`>!o44-2-H}~-k*AcCnn~oe@
z;+3fZYMLkY&MLyoo#DG&{m>9-hpwth(^SU6Szh&W@0x-)-(N!2wntwFq$Y_X*Ry9E
ziPn1{S#d%8QY-Pyh@Bb_?3rW{V|i9}_qgt1bv4!KNXv^&?;67Ig-1*~TUH$lfBIGc
zIVvWbN4=%psuK~qvL3;_PVD%HmnGLG;NoZ{ky9qjx+*unT$Fk$+$GVpC)w}Af`f>a
zk7|EJ;O*whw6E=TExM|y*X%N4*66?BqF#CjnmV2208Qd!o1GX`fqBB~fFi}wsg&$8
zAelt}AGY2*uBp3kAIExI+FOzKRzXFiy$ztUWp7(67^VV>Y%Iuz2w@lk9IRDaW#|ce
zBLX5zwqd)VVak>jRKgx9VHrmFy-&bC-{*P#&L8p;&iu^xxZc;r0QHh14)nXo^mSF*
z0O+Kc8f7xRm~0;o8><n6nb)0dD+}fHnUZSFzi9Z_le>lonO-%7zRi50RS&m*AA9%a
zVs>+7!Fs%L5Mi>K>A{|76>8mlU1_N?9usU80R~TrUr*eaAm1|I?tDY3;Rh4a)0VOo
znH8C?A<S3Qe9gTRi1e(DN<~>fNA=s9=7iWK$@sb#tB(%}3afeDLR7{F=u3<~w*|k8
z56eCDi#_#vr6=6+whv7NvQ0jfoE)1To77!AnJaAdxjQDN+l!etd?Lxpwk9do(QsMC
zmKwN(>p@fJXdTR{l_-|W@l^hao+D2$^~OJzi)N*y-zEHlAitav(IXb96&(IIkA3+U
zFXCJ7K&&^onA((;({2dLH==(kbM@<Q{A`KgttxR_@eGm1IC5H`Dm_b1`3dW2&t05@
z*T1;-CrtQ*Gk@l$zF=lXA|GSqEd^zu4KHf$4$f?&pIi3Zy*u1l@@j{bZ%R5+$s0Hg
zHrITNdc|<fWctcIOQre2&b3L7u2s3;tc&JQzzgrs8}gQIDk>X833r^2+x<aA%a7dz
zBReI-UB<F&lhs)Fne(>w0r^Uc9lh-F_4BJo_QtH{dD#pHw|!Eyc`z<DUD)IBI&Ppd
zg;6JVGqvH^sfC>8PZ{U6$A&Z!kMSg&9jz!+yBY0H{-v|%K3VKnTXgZ6?s?T@lAo4u
zOI~@k8jYE4!di4eg-?w=iYk$(oxuC!NI1`&e&(O9E>8@{btUFcP28ZzxOb(-1St@V
z`^>)H%@g+}SZKO!BFi4whodS+e@Z!@<8gm&Zacn&$O=p1GaV<^@%tmsWNXs^zME-M
zEPutjeM`Ss9?V+Rp7jVv1jt^tk1T3x@F!!!R=jv^X_Yo_uOQftNX@!_t9kIpV0Vgj
z>5gysZ`#7`WbGuRv0Pms7+DW~088$Tj;vrS0Z;80HD$<+55G76G{9em$V?ue%t^Ew
zQMkz%8hGojZp^4%&RlzWhiFw5+h#XFEhTyP-QOdzztF>?qs-^!5gTV2i!RdmEBPuJ
z+agY!PvoBPMcxAPvRx4KO`Tqx&Om3Pqxte-cRC#>bJV{)YSr1|>te~>U>jQKsY3iZ
zszfsS*VIEjqkk<oM7do-hUC$?#^h7iJ)10Io5)qCn@$XsNG0bSWP2DFgJc0NF?UqT
z0&OKVKfSKpHT(-CQhhi$nvH6la;8*WETghCe2r7)>MSeXchZkhd#>@s<|S2&GTWIa
zeL}~excDLC^MpQMjz;U>72qVnUInRG_z@caX#nI4s<n|5HSt(DF0_B#56{U`3-L#-
zbm9Y4Xc_pn3uDWfMb_s3vtL&WZuB&#k|)Zm%#Hn%Z?Vn}2dgtvk^X6Y^@yY@`ziK4
z^htW{HG3d3J||(>HfcRv$$Dq8*F2!Wrh4TaNxywc1EEpx^+{U}UN&?6KIv`~2?+o%
zH<?j;pt6y-Sa$ftO8CY(lxT8l)gq;_DI`HW&UNscQ^rfHO&hq#+~bXdiBF`A@m5~i
zf%CUr@c{)FPFZz6lp>k07|JqpI#pg#L1<^dN2PC^?-VQ)TJelIs*?FcLXcM3Txt%r
za*d%s@_Ck;N!hqe_xt>JQtLV*Vw;3hruUlmy?>{W6V4VPF*^2;SDA@@boIi*tr_yT
zkyAbnxUYGezc!WT8>%48-&XgU)8a;EqWQo-J~G8NaX=|+>W8uR{qW7s($NvkXx*mN
zv~SwfLj|#{&2@*CK^4bp=?pBa-(}jL_ZUGsr?AV?8jc6s+wGrU>g>6}KUAb?xEQ1%
zjraG|yx|*^ws|Au@40-8rTuGOk->_U^r`?y`fpiZbs5MIg(eOGP5YTb*IMn8%jy;T
z*cS9rXVTM`w?1k&pO_<PuFnn?Z%w{%u#44}KQ}uvD96Et{zzZWT+Q18%bV(fuz$<k
z9Z)^0U-C)NZS}12aD~!v<z%nah>g$c3OR;8QhRNRq~F%RYFxNkMc_*g=zY~A9N<+&
z?u@K(q<?y?uI8^Os=B7XHs!3nT%S*<W!tse_!#v)5#doGF<WkZ-(E4MnUO>=Dwgz9
zmA?%$z=GD%9DPnY_A=8u2-KX4-F(s`y=T{K039mxB&n%<-cvOWwsk|il6j+*No?zp
zmhsZ-<ol;;k4&AvPnTnQ8+sX7L9wS0sv$kLVLISrg$86x*~R}BrYNWKP-DF~R>P-Q
z*n_+>?>Rek+0F=c*5EXG=1WOY0*jWac2~&sch*s_(>?)=jXHZD5ym2KD_&E%LdT9t
zYEEr55478mjVAC?Cg!n>5$O~U0iL)W?~ljymG}YZtk5p}Ik5fCVI3zcdL`TBIT2)5
zA)pY3D+CwS(MxCR;cyKe;BR+vb|Mo+6~^0<nxvnF=HExx9+$bs7tn`jTVo9MNP9%Y
zY=3&5J#IC~f!OhVR`mGz9@Da=BwVa0$qAJaXMem(nP_*X<=chWKPyfuUzwl$D?cPg
z*SB36LetkQ2kNT2+B?5nw2V^UwJ%`iM1@rK*hhk76?uI%cBpRsR%YU=r%ku^dpm7k
zBV)vP^Y3+=7aPCrrZTmSC*{VKkv679Pi3(~>nnNw6o?QuR$iYFsdi!C5jM6C#y7$y
z-54#Y(A|DYV(wPgMXUW27uc;=wGy(9wKQGw0=gUCoP(bw<9|t*FTFnToaoG7MNeRS
z+cPS6yQjH)X}qY=+2J%(IrmsTRh!UmwwZD?=Y{i=@X1I;<t>R}68<!>tKgwZ+0Mwy
zOOI7hIyR`NfAySH>w`5tKk<N(lzEQHx!|s|sHBT+cZEHNai5%UG;v*MI`QkHLgULa
zadj@8spg(f3C9jgM(Y!W1iKwIdF%~N91@OLs^$_a*#ErkxM$xU$1(A&415ZukuJau
zp|)Jq^FdH#50=evZiuV;5lk#Th@X-iqeyeWGkJHrCOC9KQ&hDQ|2M&zOWWaANJy*m
zU2L$5*;su&ay4Y|L_pq)fIfcnW7Db%^EwUc{Bv&o!~OK<L7d`@%-zP;el*U<MF9n=
zNmb{L{`EGiz<ExiRNaUA1LiixTWAj=7?9^>p&0V<U$W$CQBAy#SBGcw;JvVkEUjFV
zw&^ISu!nz6=R`=1X*p-J=*1t)#ZHM3v!cpgw}nA~pmN$fF9L*8>x5!9qwz|j{SV8J
zCA~W#JOgb-kKgUuEJO+NelG>Uk1GQ#JA8qj)qK(~N<jJR_GCgIwgN2v6pG)D@g?o&
zoTL%V8o^u~-Q$D>n?AhJ{E@b9(%=0dc_*54|7J?mBc-z{y{TgCi}~D~WW8@ikfHw3
zafO3G>i>S@^{{TEb4r~8@#r+Bb#UxGQDr?KKn$N?l~^3)=Z;AdNUbuBsFfDXX`&#K
zoles|9r<FNL!p~){)V$Uv*z?F05_#~Mus*vD%CsKms}<&rQI(n-z2BqEM;gBl9f7k
zqFm!$3d?@%9%-4X-}%nW4&)Qk9qi0k<~5>l@fB%u5^a`O;ddDobrqA}@ML%2n!io-
zdViy<(@H6X_%?ZP-j;KA{q7j3t0D(NSXR=p`gS9qTSc{(e>b1i@R>j2o>IQmv^Qn_
z-JRy%xjM(511s9Wt)?rfH7<q$o^@Z@UvbwDK*M_+e3|W?OB1tEM1R<`+6JPEnJ-Au
zgYFqgy!Wo#pbWda)+5nP>-6J!wp#wBV=q3HTr(<ok<EIsCF2Q6{`SZlGe|V#8mtP8
zg9~Uqqd|7Nc#LFrf-I*#+KfXN)K7h=!G|b;hZ=B*i}wq4^h5R0q*TU%oP*4;aq(xd
zg4dTmr93fd=!#<0dLJK@w!$v+?k%uM47OtGQ%iuuyi3R2Syw>DHYs>LVx$V~YF=|L
zXiFfPA3~tdJ};HosjG#IH%mADcAg08AHhR@%~?Ysug~GpXlI!wV#wOJd&Cp8IP;sz
zS#<<iJZnj$PWFMh<Vg@%SfI8Cdp!;y;ZZ>BKLRQw<;XLI%1|`xVZ^Fg5YT*2)ov%Z
zW*%rgb7FXN*^oNt9-TTS-)0*nVLRr`{sXDox}DhBr~Z)fS37Itw*!X!tHWy-YBw|2
zDY)h<6>AnpKfNR?gJ#2rsK8<EnvX1k$42h}By%dRd5vHjQ{pkJhn2n@w6=Y7Xe5Yi
zvTK*y$Kig^6FhyVC?mId#8Gw?XQ9qeQKwnNf40>Zx@%*nJiB&(dZA@>zCUIK(YV5p
zFMU68&$am_F8qWB{m(k(0y%;qp}=5ltLt8_K5OrhzuL2;QjN|Hu&Vk)Ub*k)F|hm6
zMcbTuD#EiDSg&v+Kx)2Cc8>xi*4%G{i7yX7!%R0*(!Z%f<9PROczAMg93>s3iR4&K
zA!b`jIC5S*-Zn<s=GhD0P|N<9My1^$PFP~3dYqr<;(@KvVsl^4(DlNhp190_2t_80
z%u3>a-)b5zhi|$Aqh>(I{k^Liu05h;8N2l`O=GP^yzsK0-xw|X>yz)vKDs)mSJ~O!
z6Swk=kX|uW@#r(DC5u;!+M)RH-jD-Q7UYaP{rFbX!QzUhwDx>Vxd#pOIEb&kE5b^@
z-~5Z7tVvZO7^-f`HssyK5iZ!-CYEnlB(PpqOW4YO&12*Y3+-ucP?|?<I~sJO^0V!B
z(!}W&6qY*V9GtJd5k}(Qf26Q^@~x&#j)xYEO*jk)1brZ&<<&)~n<=pT!zR9^b~zm~
z>LYulgE(#cTdS$zf$N>)naRdisUdw`ZGo%;=j7FvmFz;&^sT#<s(OK;{bM~xE)<sq
z1_i%StxLUp<gd!866wa6&&T8*eM%`xN}m6|tyaN&!j<HQiad!To3`<zLy6_HA|RW=
zigayuM>o1vkjTCyMnES;`H7TBYxRbAh`2Ci4YrQ^awZ+uMo(=+Z(CHhjpnIOjp&ex
zFBhqG<f&@(e^UH_1&AR8LVpr868>m|#Ujw>o`7v%`{_^HS;Dld62NH0kjNO)ddO%r
zwt-4)(}{r8E%nv9<$i*T4AK*zT`(zmZn$!+Agiuw&Q8#OWl3>!I9Gc)xw5kJkHwVg
zX*{o0qGcsN#Dt_WqvQn(=m@RpL4dYHt7(7@2~;;Vz1WqnvsKjUr=|h`_p%bkQEfyn
z6pKc$e&W*<F#25N@7(A;kpPQS38ngnb2B{yfDx|g8RgY&^hEj-?{2g&jorsRF#d2!
zP@F1e!)~=s)NcC}gd-gBUIgwPY^#tq#PYpxd<iSuFIS@3iIILfEi!q0ZubcGr?5QL
zX#O<5FdwozisVLU$AMaAEv0E4f84-C4;WRpE+*z;5r+EGcXWCRTfg04abpj1UN>GT
zkQ~_A-*4f&kH<(v9ff@aASd7KJvzbP;-1HxX}|RngBH9?X(e*z=4GUeGF?8ZXSC+#
zN{kt5uL%W6x&pBe2%-(uJiC6LnWO)$?1R#=TR8q>0h~>X6i%K#HSn0#bcy5d(O;J+
zg0Gb?vi!*0JW}G`SpTD1Wa9_g96kkkY^Q^cotoI)pEz>Cik`a6o~aJ(UKRO@$3Xml
zPxg}oD6U=q`ib}2Mn0}OBi~_Eppa-1i|#XRGZ<5hChNpkoB&L5jG59`hntzblET<0
zpYm<jTy^Yu+uk&=D05n^skA6yHNs<rqmP_#<oU3)(1Ej)R0I6x_nh{ct)frv{PY|2
z`@QG)76#4>@gGc{aNOvP+-wIp1COkGjd~Sj)`*oq>gC>yYFzn5yo4^}Eju+|IiJ*p
zQlr+U>4i9-)2ZFZXbTnjhAi4pV#WAC=~%+X;_qO+CRzTk??HG@4gjDdib2EE4{rx<
zWeixQxYi?87qTUyJ5!#p(m5UAbuz@!Sv}T8sT~*+MA{CH(1T`*+lSdQ6EXmV_~0uw
zzso+st(lIixDuI8zcDoAqa<#T{N&>k5khHaN)f>-)rWJ+ldUt&DySB(NLm_&r4-pg
zwR6Qlp`{FXnfOk-?I~tz?|NF~*@#?2lAR%I8h4Mf!3?wY4I-e0xc-NbQi>#xzWMd5
zi&2T-b;OVPu-WG)o@SoAx4)G%=We%N{1OgP{g@4d4wBnkEW(bRu)gtf58~TpsJuz+
zuyC9G4Y#a}4EuKVoafESgp)fLQ&yn_%vozOJ|NGgs=VaG1;xc%{6Qb$3(3PXSNsA3
z5DywEidg%mSO$(s*r{e`W{R5I1urw<CWdq8Cvu9MW1Gjy<ma5F@cTuyh8EG->L=U!
ziZFA8h3j5!I4>@;9lcsttRI?48)aT}MuMU9qzyV%-o}S0+-5UN$Mo^^<nkfaw~<iF
zc&X+@QsVT)1!x#xddFy)Ae*#*J18nYoP-;sNa_P&VVzRL5N~cQ<k$b26x9|&tDj!k
zwJT1k&5-r#@wsjjfL;!Rz+a??ihSWaSyOu^y~d)%sWqYH`IZ-g7l_r%tn{I3WYiXz
z<oNn(Ae;>ebm@>lRs(QGwhvd6h&E{Nv|L7MMFj}%ezeFrXx(-=(`0JahgvNw&kVS5
zR7hy`P%>sN!jY9T`hbk4RLce9=kt$8vK@~WOU#_PD#bcA0hQb0;N-0xbtZc^k-P_3
zJvf3MVs-rK!W!UHa-DxCp3p4hribDls^)n7&5AbTd=K82ZEXtU5Ptt5VMjDXfhLHS
zVmOVH2Em|iKQ_G(gG=3pt(^6QYPIGgTeq2;IU9-X#nZtJtOZ=EQL*a3BX>C^PiRc2
z_K8z#Cyy!iCOs*c{La+%^<BOS#K!yWA#;J`j2N%#g$5C07Sr6?`)%Z*<je-WoQ<l>
zw#(1VYcy!{zm9fy-{VRmW_5~dE&SOR3_$0NkPcP1DZu@D<mTp9eNt^FwH<<h^H<RO
z0^F)=tU=NrJs|6to?4<725#sNu<~%JdUN{Z(|UMR5Xb%r82~PCCf-WPkmj(9CrM>H
z0uC?|3ga$L5c|@@9VMuBECU8<{O^mD4PBIdo;Ur5A1N>IR)4M*?QF-7p{8C&rwLus
znZ+F*r)a5S{ZWkOw{NkQJlq$LZ^N^~<;KA@8y0^-hl~_KEFestF!(Kq?PO=lBUfaa
zEhh3L)f%1*FU*nU0e<4U?{LrcSi7XkN|O#bvFnW)b0puzh#l3Tvp=T12n=RgrEabz
zCl3b?8m;zi>{2lr{bnMtvBuoWk`i>1RycN{rmZ`H!VpBOPkXYj9$mautxh(23FH=G
z+p4GFHjiU`BL)FT_WDSVvyLnOAzk|C>=(}dxd6+I3vVLLGH;nI2il;1+c8-KI}tz?
znb|hG;5#AB&3EAHVgl{%S1)EFn2zo9Q&#pj`b|?UeE(&%8#vh)eU|TyfTAIuY`qvg
zHGgzU{)4Qh^;R^$bBI0>zG-Y!<nwya-!`d|Y6xIZ;W+r~=8>5-X|2)6o8cCL1dOts
z`ba5GWZm$azVXac6EbL$qUfIuN-{J;wsKueIix)!pGe*N_g}ksTD-n2sB+Hlmw~54
z0Hgv`8X|F2Dh#p@Z8&2YwSV1VyFf%k%lgLt`(^5&MFQe_|5C}kBF0AYp~7{HdE4$J
zH-9SIY?H|NGpE{Vvs`Z6GtV{#GxX;#jn5hQIH9eooZ!Peiaq_LlZ7`wj-3ahKYd%y
zGf69Noer!R06UD{kGZGP>HXx%^h5a%Vh%!hwB{avw`QsHOm!{&u4udFRzDd~ac2#a
zZ+f?{mmmr?><dk#xo#b`ANNu=Y*9NyEBd4I4fl>)JfRj}(%+&Uhq1u6L76Z<BpXAl
zwdiHy#vlTc^tBUJ#*_JlnBWz&Sry+a2B3#@oKQpDdMD7ovNpYYA!5!n?+f%zq7E8K
ziq$jr?OPJZ7pzqz$0Kz&&%bnySRIS3JE6(juy%-xWP{ambK}ig>|9{~n#B4V(LT7t
z;_e!2Q@OordN0!|g;AYsPN=LcC@}NI@wiRAxes}z>80^@)SxHvjv8e)|2X+sEHA}Z
zv|oWy?hsk-YkUbnLPbjvHwqS_vbhcAbc{RIkh4+>P7GyLZ23z1_XOx*`)#!0M2<N?
zMcM?UZx@S(Z2t*>#=Z0x9vFU+OSB@Ij@BoY2&VR9x++e0V5lI#*tJ@6I+%SEP1Sh0
ztmflEZA-}*?R>bX+pyf97&F^yrE_vGBx!1O0_V?|{P<t&E$V+qwzD*14%bm_<IZ@7
z-!^*0DJ51Mhync|Ucq>DY24G`%)=*Iv^}GF><5?5?lck4*`CxPmh+63-;A@gRjvJ0
zy)g50XYXUESds`UeHk=X6W%vYooZ%^9Wh`<s+zo#uMW+Qs>x}lOE%MCfzCdy0&FF>
zz97qXg7ioF#7VY(8&uqug*|55d|2|n23r&c+kE8$VBU`p*Tb$1btN+9@cv>{_oT)v
z+ekF*b9fHAe*Sv#Hoh!qB4H?w(O@e44bKOK?QM%EZkvBHl=e9vP{Ka$s39i82Jr`@
z6EL+O;|9<8d$-@kMP8BNHL^G4-VXaGbjl0vS##%!${{`c`paZPKXKA(Fz>38|MGFS
zr(pq#%Y4TRQVo*M+3+5%3glPxT~^vZ+h0fQ6xs|}_E*}se}Bw=-+9-8lDbT$WADkH
z)Y$+KcS?SApM2C9ib}Bfhke7&8q+Y0Pl;w!;hVNQ;eJmNLm$$*Y!5V-8zB0Wav4zG
zstQfj1Todzod6N{P46pJ%Q`(VoOJ%ZvXW6QGE`b@rbb;C(F(fRmeMA*m%=FE8<`}y
zc^r*1NRg@%@$B!T2H2VpB-SAT%zAuQV9R`4>t6Y*(wZ->KQGNDcKt@N$SA0#PY`!~
zcoVji<l1>YX!|+b;61IfY!dr#eUxQ9<G$IyNgOR&)}?V_ut)(JLv;YehdD*#YK;i@
z8u&-{7l+_;mI>qh`}W0%U%m(?c(=;zTA0-Q5#-nf+ocnQ{npRasq4)CF8cejb&1<}
zpSKjdT2LLyM9z?E+4%&SVTI2(W;!$VtL&Cq1U*v$0$5C#v3I@k+&XZ2G_`j9H@}(v
z$+K#G<BP^|+>q(l&vZ8*5_guyod8o<=8r%X;dP1&2$a3vu>P<Up-_Sf)Hv6;U_c>M
z@~_Y5>ni?10`l1ZOFMY#fx4aFRC9o$(^N8G+tSAG)&&q71OS83eU*Tc&J|!8dN_7`
zP}ziRF=&80cxinfyCSTNAoS?^Ca&($6H!`fm>l8t!v$;}by4^*hX(6^IAmY*jo8;#
zJOr3jc52G@oaAxahMmhMzy@q0TqmPM$6(T3Z)I@QleAtO0^mFj?m_No3@p_KFoFT1
zX8j<Pdq3=!HXAP=jF6e@wj1+vo2t)iF)#1=M=RpiY>crCb9&Bdt;}v6`P4TJ05jdM
z(){ldWJgRdK%G-p``;6W|EJ}~M}T1AG{HL1imMP7`Xq|cg1d*#ia5~8XdVzRH%QO3
zy-sg!Av)+wx$$LDcGK_MmEPF<P>M?&0yYCGh5#G90YJoy#PHYLW>Z1rUZ*PaA-3Dj
z-8H{$XkS)Ysy^!heno&=f9OQj2VMC71cq~Cd{ufNX<TKIbAo1^Y0^Y=G2x~!uxETw
zSe{~TZdzzBR@C|S4{|mKGNHHZdtHwD+i-z|M>y54pBJG94;t~?L{o0<ggs&@bdrl3
zYq`;`$D&}f?G8>jqlK(MtDe3&tm0mK3U7{jmVJXc-P}XIe|MFLOU?DsiYplY`UhGH
zcg4f{Oht94)e^P?nk9WK*j-t5qvy`Ur5D|aXcFa#B5ls0h3ta{m^IFzLx@~cwI-k#
z^=`HE0l4s-c+!7%o&#@bn(zI7nT|;tCWY)QlZxB5z)soAcrVCl&^B;&SGh`dao%2d
z9}>E5!ruD31LodPV$)W3<e0e|)Pa0CLVx9xnV*utcp;{;k@w4Ye>T}3fAV_USkus-
zH6A(={h%~${HqeUs($LRBG5MniP8vR@~i37W27VNBjbb%#ifBke#N_XY;HI)Ze@I5
zRRI?{z7L@*Y>+V09@t(;=@_EhDVqbZc?KKLQJ|gWPKmUOM2hu8M;jDLL}vj@@ex;O
z-1*Sa3N;QZ8rK%5%0LWb8UM9ze4pt*yB|+P;B<mMxsdcxz1+`#m5`q+aY&dqbinQK
z|6d1x=>eM_%yMw5N;P7w_AKnB1o=ggHX%^$YSby$mav6n2V!r^Jq+IOX>OaUy3t?R
z)*v~I=|{Ugi+U3Bp31=#<dW{*)h6s<tqiugXX2>Srlj2!${z3tS*se18($K1G!J9&
zUfWnm1)?A#5KM{Ow(;N@2E68Z<hBCUWxrJ!f~(CH-xwqvR%@HB%{l%S=KQJrpq@<a
zGJqcPbhlhcY$g*<V+lS^H7z6od&BxCJMEbzj$_Z@fY*fn8`e!{^EDM|RQ&#Md1f`P
zy&ytROjWk2T0{(Z2l(){>TL;HhyRhLk^k#~^v#g<Xu*xiv&eo01ccq6CLUkw9m2rP
zWB4}G7(}GkFx&eP&(m$_KH>9X)}s_FZf_g>!G(jyk;ZZCI?T3zgG)8`Aw0STuVMe2
z9=^$8h?9zsxe{441V$Ka4VLnO-t8}OA}RLU0V(Xfuiw82=&F|DRg(5VyiP0HR<147
zVA?YcLay!Nm{}yAg}nFMaYeR^89<?l%7KE)2;ij-;DTvC{9=>9=*5vK8?!1zkvv;z
z5ofv`4otsBibt{;cTU5zc<go7nwi!C^SPXr*pMZ^RPy=}Y+1N+*p<lsDD)2Me`Sk5
z-nqA2lr4sxE{iAL=VEyb{*(~|VZOl!SoL0gUce<(1fO|!0+V8m?~7-+_AFF_U8zR9
z46Iz+i|*fB{Z)%9)R|Wy8-?+PO8p-Hi8yBcv&w(Yp54#i9eCs9p~z=tZZpAA18Y*f
zxjh5DmYc3UZb<IsqVj>$w%xtCE_)sc@k@*T@LL?ut>1rt`1?aLWjJ|rQ||VYQAht0
z^{Uk5{)xqfo7&?g>dfGF36i67YBIZJox5^^WEc?icN5M6VAmnMEip^9UlEEm;0SF?
z7seD_)MB~S(hXLpXtl3fAY8t6fn|;tKosKxjL}3)Z>#uPZ?yu@BnasUU|GhULu?P$
z4;jkuJ`lUawqtPbE@{xP<#5h*1o%p+<&!_ae+(>O)JXsnYe+7wdaO!V#>l7d_&6U<
zm8#gWb1V2^Z{k)uVVc1=xr^tsA&?~tA%{+2jv`N39Cuu~XxC8~@;Mw^BnVyR%9W+v
zZo#vf%=Y?A>$7Tr0|xITW^tw^Ay!OP3X1XEEgxbF4EIPIo$HgY@M-xi!+-YJ;rEwd
z{#rikXkdjar9nlD@(y0wa=Q?vG}VD}%vwDJu|n%kbIYsd90Jkv_<6%(cYb0MUdu*(
zUT^VJiax~yUtFyeaD#ubx96XE%yYtbr6`+ubET-=dL)^o50w{Z^%V!MhS<L{1%lmd
zoqzUExoy*KZXy+}mZd4;IR#ub>e4^W#o5-+000DPXnbUVulJzIdq__d{EfBf#oJ|l
z*hlS&S0{RH?IH?z*{P6i&A~5>`_EBN$r0_3r^GJgL`mBD%?z2i`r6f9UyPYbT<=}R
z(T3f<QU|MCd*k#XdOdCXtEdDUV^=GL#BQ>hh`0_|f}x7qY?GX*-n=@pzbm3+M>2a5
zrMr3^G~E={2*o?oKrF=(O4~wL<l`8w_|xZkf&La>5asw3<igr)6BtW4O}uTNBYl&^
zFs#)tp7@l~-CLziyX_FEE3~lqWeW>EHD%+x!7dI+@}6J2<pF|tl2uioW6f8B7%W87
zexknqC!{Z#+;e`6byA3*C(h&O9J{;dt>!7wnd6r7?xk-v2g^MZdzGJ;spFMAYzIq%
z`&wQWz3DG@7;UM&l|S6&e}x#1eG<Lyy3XCZ#omLJDO3F6ULXwK>{rbr>jN|4=>HjD
z#(J0ut7c`4zRiJp1|-&STvMFp?zRZI$NJ;roBxHPWl3Y7McK&UL0i%7$psgrjVaB)
zx2|;<PS(t^HU9eSgiC2rP@}-=zRRe1>W$vbOx9#=$m_ey!~8=v!GWj-C$6inEm_^!
zxKBS)vc1=Ry;*&JI<;b}x>j6!Ja4_R_zF5i99)Y>qMI&Gy*Qs;U{!o`p|_)OiQo|a
z6_4rp4C1bx^)D`rHD&;BV1G<FnL)%?au=ktKQ`f&#HfJq=a&y4&G~zxdkn{iV;ReM
zj#kfq{;|7x(4e&e#Ljoc8DVx4YgZzi`s{a|%~gPrYH(cv6ksnP8LwWu9st@GI3`bW
z%@=zgAmDDrb7X0D0$9c`v{y}<mO%-Ur5!OGzl;vqsN2E>OucYMf|ic&4O9F9yB0g@
z%}RVmHEZ<EN7S~mb3?RBusW)5!@<+>gmtN&;AVF7{p7}WUi?kzZP+yH83>DlRg|F9
zPHk`pgOGKcsv7NkJO>t$c>Mln;RjIb4##<MD2Ar`#Wm73SpUG3VcUBN;|1euws$<5
z{AGSOY)5zuq!Yo|a`Z<F1-akwh&_lS<O<s*FkWi5Sfx0gq;2BAzH70F*jXO<XKw^M
z<`<Y<+Cyb;fgSgMFBk?|f`Y>EilI1KHmV`l^C~%3F}@<GVpJ4gF!;K<6%Qg$MYs{y
zpLQ}#Sc9b1Kugzle7ywK*jYMv?yYol%S9XBP{QD^vI~LeEOHXU?mYDe73FC;z+%s~
zKr;=;Q=%9P_?070t-yHY`V9D)p_5%4<^D0Z;+l-Kr)j~dTel<gCkHJmORS|aOQ;uH
zYh(klL7xnnTsU@C)wrub)Z~G#;;3odqK)LqkHg=tm^~z(g+z&4BhwHTx>WIg<=3$b
zLzjfG3%SR;|M0fj$lm;W=ytiEGkp{DeKMiN6=XjGlxu*pT^Euz#<fiA-vGXdj0bUy
z37qzY;##gicJk=koR}xlMxZTx9oD!rv^JbPDhc1U)%RtM!|YE3JsGu+cX9<}RQ|i(
znn1eHVc{RZY*^2-31CVQD^~f0SMG|}&eOrnes?BZDTYwG3wETsoJ$|mH5IYX43%5J
zoxtvs1Q0SM+C3C3OI@y+Iq-@g3RTW6I1%?Vg;9*(2NpifQeR}F5YIh+fz>Q<{a-u&
z7xa~(=Erx9ULmvTjrm9Z%G$i&R$L{L|9L8`?#17md(mToZ3m#R)Q5^id@Rpl4#gxa
zmu|ix+$BQx*X^nEYp@1wl`>?B6=;Ow?E|0P(XdKrAvvQH;{9>sZ#65#sXx+K14B-=
zMS@&>$M*9l?UnO3`iHD~=|S&8N}SpP=e?c1WPp8In9Dje`G1CD-b-$IW89-@rp`Ta
zwgC$CT~&GhRdy&F-^;v4&&L~iUizPLnDqyNzBZ>DJioSRY#~dgr$Nt&oz2ip{aQ=|
z*vf$L$Cv(v_MGCw&7Y>dK9<6e<Ko9o{`C<flI_ArxSt_7qja+o-^!bDirN&nAKN+o
zM2xlh%W+m6TNSr{hX|L8@&8(T#j%e~^Mj1QOVBOSkfs&<+yz&a(veF!oVKo6PGoNc
zf-=g*h;{LfSJ0Vzq?WN0|5L&RlZD0wY1hEc8s1jOeW1>^dtBP~E#9fm%Pxko@#`pd
z&lX-Z3bjspqD+=PZF8kcSkLF3tb58}g3FiJgrA-nU>NL%br0c5(}aH9vFpRO#fV*!
z190qo2$Zwla_#G|H>u*PS~QSZ@;pPZne(?qUsE>R_!qB;s>%T`nz|(l-Mw>UrR^S<
zJRJ1unmA#wC>PO(E!!nWhpe@1d=p&jmF~%EtgH<VSut$L!1Mip4C55-B4)0Io+8xY
zfNtH$$BsfOG%R~D(V!qRPc8RfhkT-9yg8n=_<c5a4dFiRs2XvBvYt}(*;S}gp5VIu
zD4}L<#Xvl?)R*<<$+m#wq%5}gg+5M>W4y#cn2jb&j76?H5?IwrJtF~Hv5Z@CJB9La
z_fWj!$Jsl<x~=NJc6IEH7`hDRRMzi0P|t(y7SL#cGS(T364-l$e&4kpvzbq<mf~c9
zn3-FZVA@%NRx3dPQ9H;(@h{FBlsRUbB@VU#Fyl|<K-g~%Op-@loJQ(4*ftPJF0oP9
z?Y#Z(x9rz~)e<%~V~-ueXdp2wC=BB!v<9kI7tsw3TK*m=yFUD=LThfQiZkmv;c@J*
ztWj*H5{7&(F-L-!BKw8&_DNCKWeDrcow=IPkzy?UGvp%Tb(ptziV1i6`EdLe63Z~n
z@e10c07DZN0e|<?{tG?^s0Ciy>kQ!%s{K@0hL-YxTrNsNP(^%!$as-*ga&vDXWjE^
z13a&cRFzL2ezy?f^S1qd#5<opJ7iNFGxWwG$N@KdmyQpKc634!BUTJHI7=&RZg2J%
z6RphA0yyKHNjRbugVB7+o`LByoAWK!oMC@*XN$dKZK|X0GXl=m1VeSCl>|xAT=7?M
zs*h>a*TF(A*60~AOkfYj;9w&a13&|zmK9wXbaNzlHQ2es!qRhnWo``1Izj82>&Hlv
zHq7hRdPD@1Gv2O9MeB7HR<oKS)(|2eAKzG*eA@*yXmiGHi@w2LRCij;hzwcEcu>1O
z%oGrIuwGtT(pY}ASEl-f+37>Vnb+^$y}Mud=+T5h*AaI-J!EYvd&Ck;ncBa~H&`xX
zI#4vUVQhygExeS_s$@tg2haU}r)0v<X6f!?-$5Yai0E@^&%X67fE(T+DMxJ<`<@==
zTJiR8w)c|1hT<8K?iJdnu!;d$b}OEh3A19u8C_M5uhQuGlyZ*J0;M1Piv>o2c7Eyy
zJ7XyAS9|*(B(CJW_y}x9wKbEH`B!qxvZSnE{2i679uQORHJqTAc_zQ2Vl~|)r~CW5
zk(Lxq@>T&-P!Nq*dnR|?#bt8RB&QT7yfUF@f|1GgmwOJ1E>5(MT)B}FGc_|qUc1G6
z{N{%On=1dM)m7#c`%ZcH$cVPPi;K%Ru<m%tMC*|^lu2`CebUxcA3)2c2Cv*#C61S#
zKV_O@7O0bBruM6g%hQb7zOQ+CMNVQ0ezMX6h**3)rWB<05Xh&t3@!kBt-$-C3ewtu
z6o1RJeSG@`fHwTpHN8WtQBAb)0PC7Gji$np;_J;zpoNi~h*KV6kFragR>GzLE8IIw
zZC~?rC$BdNIdhg)QslO3w4cw>sX6<i=dY^P0NayayG!rM*d}3bK0Y3UhdQ9CYV&`L
zKSnKgu}HhI4#`s3zDD$lo%k2aG2bo^C%&&_T#&MHvgfN*C&EU_k1$$&pF{JGOA$!T
zeO>873ATPcm&LD~j$Ut984V*+TKX&fW@5y;CP37sXQWCjIHxH9#Gz~;e><0*>^~ri
zoOgE3lqh)dX*NAQU0Y>yscQ=Yl~Pyq^6gg@3rVewlspL~BmK?IXmeYt8+4KkcH@XZ
z&&BE7!Vr&46ZTX~ynO1)6LC#fA|(eBr~`{_>V-12kN94r3-xj@KHZn7)Xy|A=M5<o
z?eTGki6q|w0?c?Lebyb^gaQ&jc&Uy8%Tc|GOZPR?_`eSxaJjOYcMEf>2J48=yD!fl
zH$YS7>9<mj$T#}hY%UcXxotBx|8l<I$Zkz}r*P^EXG<#i#>sP;Df96ewuRk_7!)ZC
z)<&@}20S;M8>+jM#ixYPjWt|0PY`4zr7(obMlS>Z;?V2rbeuBA59txtSY4?Ejhc1e
zDHBwdigBqI$__3cfpur~m$TU_x&BqBJ-L<l?{wCHA7NQ>8EV-nI0yQBELD>AR7a>e
zGAGRGjL<V&qwvD#@Jt=Q^CzBPd%ZSa<z?5Eh|?7b>^w)DXgktH{11P=@JZ$XlGKu@
zUdViLLZr@H(p{7$r7Ss^ZF1zauz!7qvXrXNLT?cyYWL-Kkh)H`gU0~JGwvik+XEoL
zSVjP4<0)oS&P|>;&l@Ti7=ZTS`ekU<Vv8|M|7x%kjD_4!s&(!)9qxt#m+k^i=em6G
zc-~`&jk{z5Rjd(_RC_*o*!OO1j~6dsn;gGOo2!=XVWoUja#K^MF>yd5^%n0RMwA9C
z&!UEPYabuqAz_D3i(uwJOVEu#NT%K~<oDt%FO=u2`!H>C0X;}H^IxZ1l(^ZHdkhab
zu5=d%4-%?9`dzv{3<t~6lJT|lremB|txxI0wXqe*I+?9~I$F0j7GxmLmU|>$vQMBn
zjNUb@)1nvEwAaNC=UFVD?SSPeEncVYwmB980fWhGNPfs23#;((7;=rXP(~5HHU^^N
zcA(ZlYlGsF=enuv*hL@qSZt>C@y)Kp+qXAKOBs>PbwMAI&fz(}jd%YIm-a`Te5LWM
zuE*zm9|mJgV$(Q5g?MFk+NHA5-DuwM>uNh7cLNuo&f}6!R*ckn-pL=fzC%)Z4CHER
zN{GGv?ak+My^^Age-+UPuuNIq5OkhuFOX6D_Z*W7dcb(XLA$TW&K92gCRV{6Vua)O
zV{`@fD0#|tLO}RhClFIujjYX#3Tkf}m$-IiiIrqWm>O#;8k3q#QCwf}TxIn_nc$%$
z7naKE5K%rju<XNBblqmJ$NT5$AAX?>fEZC7Z8J45Jf?ECO1tg)$fkF0tf#*5%~uCl
z-Pu}-c%MzgE>*d9o(up^4bGDBmcsDxFdjA6n(?%#3kiOS{3&*iVyvYKBxO1%BP-FX
zi8`@i{PIs8mojHz;y}dPLTy$7$EJ&UGFBfegZFFV)0)sc0>;KR4Iqz;DtDSa+>oR>
zqt#-dPrW24#2c!~&gQQZx6{~Kl(Lwqy)3aPUP$)lj7p5S(gJ;dr!MGZ7o8M6a#{`f
zm%>FORtN4JtVqp<<I%9SnIu*O{*0Ez!-8ajs(&H}=VfKCZH3qAibcD2RqDx;ovQOE
zkIi|^#LN}E<Y}-m?<)<O*Qabz_r29Dt#2^1t2)w_DypgpR6QJJTD^+XS8B}}ZWYST
z?R(nr%d0oFtzf@?6d640a9%eKi7Ke$tXU&96OKpO&|;T;fA{zCKvPaCOSSMR4?Ps}
zdXYYPn9>P|O>^Jh@vc*ynHH74t{rj%cV-kq%S*TNf=@3xwGMV9llZZ%BE}6Y@az9X
zp~CNf4+a!)JGErV!H<i}v3RXG$LnBgzAwow{2Zc>^i@53JJYdJE>5!O_;KKUB07}J
zs5;L(#Um~rpYp~?(qZ*YK|z5wR3{{95<b>u@*^wBncoK)<|w^yz3az6mOK%pg6BM+
zlobA8g9lg7wBskW`caeNcbf%|Z~KOh*!nVl6yI1h-&%=!e7m$nP-B7b$g!nb5>K4{
z1de2YpxNT8FFr_~C6oN0X)E7d?_Ze4G4&ylSZCxjqB8Ln&xL1qj;xBRKAHTXK8k3F
z_8-~$l%n293J%q|a!{BjZpfDXK6ZpSeNB9|J-#RSD&{;64vcket(G@W5N2ky=Wn-%
zjCewLIqmwia!lbb{WzZb3w%nStuuc8g`0m1{eIgjyqxI1Tj$#~FgdnW4#0j{GT-#u
zugzYn;Z(NH%r{qPFAc;@q@RE~vgecEdCu;^ha5-l<=@al;}-(@|1D3RSd!dYQ=CYy
zo_u=lOo_8j2Wg-;cr`Eh^WV+q$0xrl)c3iLG7lzY8~`#e)@Qhc7imuzF8LrAsh%}?
z%roDtbNy?c10F`tge*j28M%1>LqfbR=W^XM;!8}1Ww$_~M`Qj^&|UI2LXk++#QxV=
z16DK+Nt#}kADz>tXh_iXM>PxT-@H)oS(FIXRO5s?R0xynKhE$LyI#XuW^sD3a*I9P
zE_K1Do;PKgK8Q43@5|=#{bMbBOybTH%x~j5vOJ+N#7pupVocv2K!;MfBgQ5Cj;@B7
zuGV}!dDBnmij>ej1s;PdU0KG1fi2(a3JAm27TODfh5b2RziJNczb^iyQf{<-VgDZA
zB$y7T@pdTCSPDO6JRjK55jqDEYx+vl2+~&S+Vvnp&eiPe&5G^@X``~U-=!Ux(<}R7
z`4AR$y!pOIBBXSLZ`C&7eYGkv(9XYUu_o(Z^*3`zuF@$~SO@x^E<M-4A`<ZU2rg+_
zsFAWJjh9j_3a+?D#rtjkL7vig)7R!@L_y{HHoBpY285CSn+E)=Pn7Ofjjv_mwH|>}
zlr7F?e{T57-uU>{nqoligPku_Il00VS)$IgYhQagOS%os6UVc><782FCXANf{((K4
zhkRZgds4F34>Wv^t;-^C(C(0mV7?9w9|JVWZh!LEyX@OX+_ESew7|zi5(N;R<CpM0
zKf%;%37~kK#)3guILN%NC@2%l2G8wyi|>58w(}CB9w%ucqEuPhAZl&J&HTXyV((<o
zYB^di8dL;RX=1I)%<chQoE9Or7@^O)4*?n0D6XnO^T^o=^5tiVtm@*)A3Q%i#>wDE
z5ko8#1%WS>vC2qI!d@(Bs>eUmzU^YKV7mnv7QY?B8|jt3!Qg+;$~g|EXnVJg{1|R4
zfl-y?<x*g<`@N8MZurOQA82+x4HVQ`IVGJZ>yMYXLPJ*T%}4|Jb9m{nMQiTWw6xs$
zQJutgP`0?5(TTiX+i@amJ{jWS1cO7ElZqYhDP3risSuRS)PnCMJY7^acn=-A>iAvg
zeuzq2Z5Ow>lx2)d9sN9fAhpJOu#LmV4N}28CzP@^czDA3dURYX+IPYyJE6hk4`a|7
zBmy@-g2i84^dk-ZP9*uDTaqe!-%)K*#%G*v7JJ+(TU1qs#*YS_q1lXzaHE8wwDIoO
zMg#0OuaB?VgV`$uTq#nQ3)Zh<0U`R4maSo3)Bo4K=Wz*0HSqC5^`K;8<H<imF&zOC
z1{{zxUq&b-8%SyND}A3H8nN_Xz-2r>M_}VvDr2Nklj{@J9}HOfEkjv*?ho-oRr`5P
z376&R;y>dfm$Q*myW>6;-o)g%Lj70ma%|1IVi`}l(F^#(ceTAZ_9t0l8&+~8^Tyq@
z{xj($jb(;NBZ?C2_;|;K-+}NJj!FAM@`i-@=4x);jjl$!&neKL{lj~dZQhgrB8!kW
zep{6eJfC^S%=Z|NWp+q=_Dd`|U0S%dn7#HZtfuhrn(Zm*A7F@8AsC=C-1sZ@m$sE@
zT#0){G`v*uj0i;%@AEV2gs97<#5-D`Rj7vNS3cam3YZvS_*c(Blw<`HUxOnpGi#d$
z&GJLnHbMZLO}!UD0FSGJfb<Q4v_(yomQCj#ugD9<Zb_K$4W3Ef>c$6Vq~=zGO!Ce8
zBsO(zsBpv_@KS2Fn+>dGA#4O%Bf$&TsMth<souz?6*;ROm*_~`W+{Ss!K%F|B!4e{
z^$CtwjBWc&RGVk?W1Z>no0&-knFEQjj555mp^rYA?rqG?4!zUy=Ua-dm>bXvZf^6u
ze}E_M8(1vXw;)K(>`vA05!_C9%^sTj0FN|qLb@o`@(@|l6#&6_?h%qth+E(KFRcR2
zGw4+3c!!>vZp3pmXp8U?VK@=PVg(vAGT`L)$!R(NEZkp;LSneFta`_lDu7ix*5M|$
z%XZ*=onQS?=e`JnUU7cCBoE#vaL)fELOZl)eEVKJA;k9VweShxJ1nUE{4QlX<s4@q
z!Of*AEPzl)DljZ=UD+-&fr!eV`9P=0V&Upes_Z?B0?5vsl7u>XQb>_{K0l!%-QzMM
zTQ1u-mmTx%3AV0VfJxcfBPi0FYS&S#WmYweppHM#8V2TKaKU*0eMAxL?6B=sN35z(
zv>#O7w)2?K;lINmZv4Jw-SQbhfb%md(IEewZ00gR<~$XMSJ3R<hRz+}%*pNtMnNkp
z&cftzndaNX5L@Zk`w_d(&U6zb?dleSbStN`n8(hj$iC>?Lel5nmj@3_8wSj#;<PI>
zbI&+5gvo6N50|)&CGjQpwhw5iko(4zXAdumZLNB)^>EHb>$y%9*8=x8VNPgHtwf|p
zxyF}pMnROL2vX9g=BKO)_%jas?CKPIX2v)Yv{cYY!@kP&H||&#t5W<jf<wJ;oJCN<
z%s{CLEePEogtDbd+`1^$Esna^jmVt~hsEV9v-n$Qr;g0FRRfs>MBtnJM2!D@7UQsA
z-PPgx4VS{Y`Iq;U{0nW1T%FKkq`ww~CYIWc9M+GhHMBXmdoYV{PMtiG+$gO!_Od81
z8W%7Uf)HQ=2X?;#|4wZQdFPqYw)`QM_ugp-!`;BtwaGT!WFMN#Nh-obOJ@h>hU5xL
zstU!~$+$t(BX8JCzYI5-KCDGY9ZlzMn$FeUn~o51yC#i&qUE-1!FjSRDq&jl!_I8Z
zy1yF(5Lci<Ip8Vc0WS`qXk1V0S1XM7IHc}^4-ti0otlM6?gWwzp|6!HOCfI^5JFej
z{L8o40@S(gHN$CW6>Oy!6Z=k0)O>JIj&8<?9p4?b!J4BoX7_|}d9Z?=az<`IT0n!A
zI)#x&dQje;tX>YJ-8Jrk#}kS&$@6)e>-%kAxR}NJ_o+LiCPVHGaph?7&L3_L+&!3m
zxp=ikhe!5u56n{-pD9jdH}WqDo>r0-#|L=MD&O_<e^Q3%{J$Rxo-Q~Y3N&%bh6Oj_
z0DrXqc^C!RH31+#ZyCxKr$Xr**gys(X#0KgAU!&U%YM@?irpn`w`3AhW8YWZPb}wm
z?25b3V>!3N8)Lk+!DpA4>c}C<e131pHC&<3`2_$@l@<)|219J0rj)h2?%uwH;m3YT
zWiH7$k~fGr_g_@*6}Ra7uvoANwiwUhyW9bHzxV_VUp7iaA%U0h=@a%~SnGa_;U{jT
z;|q`rKrWFg&VF^1_p8GVz?hTb#(p1}(2_fHV;^>+y~!G<xOsf*?|JwAcCya%N!lSS
ziE?fb?|*ER+}an7etOB*&VgywqKD~Q(`s|(<JFXDVU_DEIl~pkbEEWuO?h;v<CS&(
z>3P!A^D{WwC45S$AhKBD*q*7C`d~8zdmJ~ka51hHSE$c=gd_YRxUfBl(jJ*-u4S=E
z_~YEA#@bZqwW@dZZR`@B(pS;Vg_fT&3(e_&EVQ?pJ1aaa@Z157GB}UVDcm5TRi;v3
z4;1<jCc34!*CKem6V}<$Z#5TJd^kx1Dvw_VZwZq**nPQ+N!mqiJgfWhIqVl;nBi8~
zICTnWMvFou`n`~|0G1NO4zYBf;YQ4KUNPEaLu#y{%jzB#x$;a@i(inv)axa3e7)Pt
zyiB%>F0iUll74>XSRzA&qVW)M+toENu<#6*>s}Eo6$p_OFuix8)Z81(lJfD(;dxss
zE!7!lwKz=>q?ewYX`}Mo1u8j?*S{7k0Z7GY!j0gIe;xYIuH@+tIOKrPf`WV$<28O>
zTJ0P1*k1!YhY9KwYrCrClky-+if{jymYA$x{)OV|Ndz(%&lA@sN@{BPd7cMMKOj#(
z`2N~|JqyEm#r~G7z)@u&))((^6>?@TV{m%=jaf<8#`BEJ-Z)=>#%AUUYg^BjoTg<7
zjA8xsUV`g99G2-qH%MqWo>Rt6H^N`uP1%+Ws>st00jA@x-tXH0|0dYeP>KWonTlV|
zimUwqX4Wxt--k+nC*hoN)RM^`!v3m4gMPs0U~b<+vsrtqNJ40%WgJ5nFJN5nunX7o
z-{uN2_5_w|IBWPn`#JP>u-t!rD=WHn(4{QP5Axcy-v+!hiqe#vZBdJ|!r+tn>%olr
z?_1*Sgv6ENOAtkxI~r7SC>?8T9ZY8vwD`sz<Jt|D_bfc144Hm0u_s*~m=1^fTt;*M
z-S*XU<%kQ#nmw&N(!x&jOSsL^ly6)FGtJt`5vSBHB&sL?$~3~TIOBt)g1He(`O?5{
zgFFWctP^#H^$s-}dgRbQFYB@9VSo)F?=l3X=aJz9A;@M-a@FyZT!Rv<yUm70-~=|e
zQ+WL1UXF*A=TMcPT^GgeR(q1bxJugjnHHns%=7M8tM4Rv8=B2o7rfga@9cp*p$kh*
zP}xz&lhL20MWieNBIx^c9-R++@zNI{ybYSaeTj~K2nq$-XJ{3Tnnz^&qaT+#6NF=?
z$Dtp^Dvsm`4D2!}B^_8&SvPz)$}{WrIHX}$X*ccOv5J|fb4Ek&zaU?Fxce%1YfsgV
z-izNg=dO!hma--4cn+rs<oVg{?Y;1<?^wu5+WpER82i}jB)pxcM@GjsfCvQ2N_e@P
zu?B{jxN~6IyX+PvT>6S<@^C<}jyzM3rHiQ}s#83Km=}3YJeQ|M1BNN^*_eZ~7<&Mg
zu7R%jcCxEe`)~yWOLRse=BNxSJ88AArDUB`=~2xoe?j1&rUcpi>O+L^plOc6j8w8(
zmT_vzJTiX-kKVe)nH{2*KtM~EnMZ$OruS*YpvKcGz%dO;n>-v(*VHTtgsJXe@_v&{
zx^d$NC}_gMSwS+&<B&$++kd6luOwUR)+6<)4-_S>)sDJg<}TvuU^c*A28)Sg_AM!)
zO5XLpwvd*e8a<^Ttt(}^<%kKOht?pbTR3kRv9b$vb0Lt+Ome)2?sjjyH}6lrFn3dj
zQf7JiwC^t{Q79-x|M;l|sygHwo83lJaBu7Wz>pLM+Z8)uvFSJwscr9(hv#qiF<`re
z3U(r;ItQE%@^w>`kYzbU?3X2`#xojl{NVv7?R`j_gLEYEysoenl&Xxr^jifYt?vYf
zm)OSw-~4pGG47z&7G2k9w=HWt+i|6~Neg9+yI)~A$C{I^BQ-vTCasXg4?<+{bLWWN
zqg$M5x~ELg=z)@vSN+^r-{c);ljzps>&Fg^ewn~PEz-*oh}@dI7`rFI>S}&A(yV(7
zIctO<Ma;2#!R*`SS%|rx$c$j^0=}PcjqnoUf`f&2(e5&pC-6R#9gB-CvB_pP9@8B9
zJtbHzqjr~l_oanzyu{a4jEjnERuFzjjF3=kp06bjW@;kdAJ_Tyiyh~x%!4v9Y{a*r
zy-!E3+Nz%dCoM-t%WP;jr7;E<06r|jAG>x8-Ljf3LC{vICZEs8wX{Lc#4UqfVAdQI
z60O@56eDVp;CSu<*EykVi$gX1I`W>uHCF%#aXtW}V>Ltx5KmOvUvJCy_VgW7Rvvjj
z%)!^DPPe~U?cttUf82ApEZ^OIt6?g$pq5oDKXKBS2eGg2Q7&TFas2~3bu($)9$A6a
zzJ~UO1-XdBZ~J`3RkM`*SMTCdg^B-#{<iOA;ZDHMj3NSxV7@@o7ax!31bBR@Xi^ko
zvsJ8?8O&54g~~9=#<Hw>Mps^`I6mdkbbA4m@kb!X;08dd9{i!09}!uMi_{v+lW!wW
z{RsA@z1~wqIOHkj5hZ7UU-<)mKjEWgo!duCxTGGZkUxoCTbc<YE8TzN77n?>t<r$s
z*)#bRsDw3s<nwD~C}BI)MX^R1@du*5O*;h8m;~^4sUC6Et%r;W@R*97f}q?C4ut3I
zIqs%m$%Hb{N3g!V9{poDf}i%+D#NDtu|bzxWN-lbQXn5ojh2RTEgGHC6L{O0X(wAd
z@Yk`M!2V)sJk4Z|WcvrXrsH{5=#^%L*ALGJ-aUtIoS*w#jhl#Y-tm~8p29rIG|UN6
ztNZFGa>T&L*web_17`}Psw_-|beaA^SJ8rj>U?}}>B%lR;M?qs1-7yZQTAJ}ihl>g
z!_t1(-sZxSvGSN&v*w+EMQEFMYt_i+d>^3hYf?40HWuqNT82zQ77hRAnftJiQ~R<;
zLa&MYzC0%*`i6Fae~T=NryW|ONEU`an4V93#P|zF-HPE%$ow(btwG^);QjFHJ6c>L
zInizOrGTauT>qSR`vvmJ+c6>dRam4vh*)q;aujZI*b{|rXFPRKD@u?ytxlAB{pVM^
zN*lItfY52d#q!IqX5j+F*m@`-oG876e^Il_!8%sBfqm$mo4TpgJ8I3_nd8bWn^l5q
z)jk#Ng^;5#+Z*haD?B1_-U-fpcZT~4E>DsetCS!qeCC&(zMiq9ju+@_U}3vkdjoFd
zuv42H-l!maY#Rv)X~)=P)`q8y_SkuTUuT5g$xVcVlRW5h1O|}`^3_1kjklU)pNr^3
zPs8gFbsB#|(l_wP3ns&VK;WOpKj0S>_G~~rgAE4%heNE;CMRYY!m=2?Y4o~3DuK=#
z_`qrxX?(_E=)m?_@9-WPAS0!O1?(t2%2*Ikf`a6Uj9NC;!Wn6Iwqp#TcxN)|;ND0u
zX2qK+4{^gHVA>4dDf9jXEi)W%)ni4O?Ugxw;Nf17FiT*xm?1HWRUwa)rW2<iqT`F!
z9bR?BUh1s=#<Dz})R>scxw{NA-r+t5DWV6zZfWN*e%q{I4k%6xB88kn_onOX-|hDO
zM*H0^o`x)Ny`dANYp)3LTRmj_4w`qWAr*t{*Lg%c)Nk~A3~7=DB<Jv>+bR+GE>mI|
zhG1b}PXvP@U{w~hfKi$3HL(ssajHLjd?|h9+Pt=CWVJ;|v&wdhS-Jqi%HBA@d<!|N
zbQycEX#V`E%Kwk8?+$A!+v1Hn$T%v@Toq6REJ0MNq97eFBN(bmla8W*ROwPr97Y|L
zGA7ciA~iJW9c&=dg-9<-XaRx(AwUScb%J`|_r16OaE5Tm*?X_OS6{#7)XP0_EXItT
zI2&ZM0=@u+*4(=ZDYT@1axKYx|AFJexQ)72cLeeA6*Jj>a@*L4cGX+Sr!UdwhUL<V
z2`^5cxtg`hP?NQ-QoYvFxA_zR-A^qqh**EP8bx^oNBI?c5cC~NHO8I{i?}*myU&4S
z(sZiQ?m5CXtM;=`i0V<R?C%+Q_?LcOv)<<kH!p18!lxmM0^dPmhM+A?DBaZ7`z9f0
zl%IY7`C5^owa{RRn$a)sIGYDulNbrCrBF1Z{KM2_=tPr6BX=&d{`tq_kNv%!hLxSi
z(khp<2qafQF)u_f=~UYDYC{q&jx~}Ns>Hp-ShR8<OrxR3vZ(BkaxLN6$MynoX=u}3
z<a)-@GotdCq3<C~(X-2mw=mkKB*#(z%0L$v0`ZFYHxu&fhSe0T&_#Dw!Zgv`m|sP!
zAm?5<N*m($ZnbPGVd^{iiB%^XYj85i-gpk{D#d>(dx|@n7qLRP(;{S9vWidqrv3k>
z%$MH6WX;V+9W1e4syYvJZ#Rv2MQIjUqg9Xn$T{urwy?wz(&O(eWtDr3bA<@Ed6i!q
zQVRBIi;;ERsIiM*ZDwbjI+@E|$}+gGnJ(r#u=-9zu-MB0d2B#nOqex<pWTVkJ}h7n
z@M}J291-lR98ZVYrTo4-ZnL9zv9%YA-%d2(f}$y{JSu2_TKfR|`lmq~aj4x_z)48_
z<ism9&G{kl(y*|4dXTr#9p-oh|3y)P>?lj1%pVEf+yJT1n!A;|zwx&r3{S?cNOh9|
z>B368+oryL!Z=&qq_gMHpTtbke7v}IMfLKuMSYCxD~t%*@c#y<4Ps9@k4G17!K8ee
zJh&78M9zylDJhcjqVJB{tOrA+{1o{=Nm|5#r!P(qp(QHTN7yQHv?*kc$5P${dIC5e
z#qU915g5S#GW=|yeH`Q}oyW=W#%{L`Fpr~r#oFCm{*ovu3_VM(5#~Z%QNs+zvAU;X
zQ0QZS3cA_nxLwWab_(yhn@KaFSM@b;A6vN$j0vzU?;G6*n&TfDNU&XJd$J@OIf_Sf
zdMkN#H(3#;UQ3TqUOeimf!yM5@1^0O2;1juj5Ne=&@e4|&mZh8S@ey4mr~sS#N6+W
zq6k3C=NshXH9;F#NRk&K1XSIF_y;82=xloE_Ru!83Jy1>6K8&kMO6YI!}LJQp8b5b
zw8J=>-sy8g&oI9&W?)OvoU_z7&4@)bRN*`W4+Z)%?RX-WvP*YdQc!E3b0CY<bkiRg
z(?9Ae?bY?$Q1h@YY3<`KDS7A)_ufTF2u)KJH0H03aFA=eXx`ap4__hml5N9lD=82I
zve8oA4YZ$#h@C|b_nLH}hQxn<{ao{l9QGg1E5CD`y_<|&>Nqm={Em^?Y@X2{B<Gxu
zpR$~*>vpCVKgVnQk-AmTdh4CLfBm{O;`XrIA&RoM&p4w&?7#!uQf#lC-4ZLPI<fm8
zGw@haORGyw+=Oop+kc4P?!s3ey@4yRBNP(WJRC<cd&fUvAG|R7Q0Vs0O91?zgHF*a
zai8kp1OWZ(o6alDbu%al+yO<h9xf7Kfx%83dc?iObo5nMtH#>!s|E`km*)HcR%7=N
zt>j)H+O7rD{)xR%&%`T)UYy`&O(A@I)T2>2N;^izxv%KCN0F)?;lxf}iGke7L*fNG
z>47d578cScBQ%foO?Xi=(`o+5pjWq&H0~C)E0fdQZz}cZhf?p^zK=UZ;{V0^etT?H
zHCs7E&#f_{h+Qf-m(WYHw<<jr9fReUbs6yf{QBP5^EYRDyRd@-%V(Q7c+I6)(n%}Y
z9jD}9eLSpOV?j{UuT%~4o*spHVN@q#N{1IBy?r8(($QuU1t`t-2+u~$Olnx4{nP2r
z)ZU==nl`T-K2^KpXYaJW2J_RV(>{!&u4gy4-0e1VX2hdXSnhP=UtJ#p#?zMkXZ0Sl
zi{e_?4*%rB86qVcTX;pGPVUkVn_2yOU(u~OSgz0sd5uCt68R~VZTmt>r0Fx$980O?
z6|WFPGnIfn5uqviTiCpY^4GiEl;@8nKA=iuym#NNJV;c_6KGtQwryT!v1F^KbRH|r
zPDf(N4)kmQi!kbti=BGOuqigJPFJh7-9z)w*>Ab}F-ke3%+B0XWF@Lg;;)VM-)+M6
z3Qj}q#j066TU_+j?_5%`UHOX@esB_L`)~q0j04<3KJSV;C03&Zh>C8FoHY4Tb6VBL
zQO@YUQ7VTdtn5*BgOuT%SK>Htz@Nf~%S_QLQ64^q6Lk8Bim$qVH_t<4C-I=doecq8
z>+#LDJ#Z$v`umwyaWc*a96DGf`VvtaDOWPZ^yWLBL;bs1rork>LT#=QNkvj#OFBX`
z)eaCb^dN`I4uI)B`khNHbmhjLR*j#{J0XlKHXZ!JvFv*14gdPu3CPkQrziSRcZVx=
z4-Z>ux?2#|#${{eR#8kWjfm8zO=Cg^CnKZ@=H{M}wm=6DV!W|LRQLftzN-NKdW`wl
z9VuTEfme<`Y5{bv0ix;oT{*>yjSse$J_D0H_zF|*j{WozlxeB@n^f4E%zZ58)=v7U
z&|cj=GZ<kBTu#-$!*l1Q_y>eD3#$*_KzZHQbpf0N|3J{w@rZ5khjp7cz>{Kgy3h{N
zN_a(=T|f%o$oK4MxFQ0P{?rQ-_9bWzSO>OgqAdx5V*6NUXn#ir5;LoO7v!lPW@WcO
zOW?Ac*UtJo5K1A%anN;Rh*87%jNOo0UYnC_-x%RkS?<R+J^Ho#<YOLjs+PMCKQefr
zV*Z0@Q-r2)b#=9@pxfI&NRL`Owc$bnN<^$KGj?|@V&aKefA4}D=Nj6$@Z>ytQLLY@
zPz>#8K1*k<<Zd)LkMCMr?b4b<&31vDj_31aH#Bc?s5uEE-+d}>5V=k$<#GuGWIJd$
zIw!m`xU2!Yl1w~7b4dK})Q?;O*oaB7CgQ<J3JvvGvB%y?4*2uhvi!Z6Jq^J)E*$`R
zZ@bUOWZ+74=2Kp6>OlB$G$_>`5ITMp>WVnb?$n4hb_Dk$*mCLO1%3cveSnh*(?Z3J
zd?acd;afL*qr=Z#6^2cP*QX%6w&%G3BihXK7kmRWmY)+@Da5J>U3W4j+>I1LwjMV+
z+nC2$`V7M5L*TV?zqnHxr8he2E`pT=2wRi8qzMO4HNRwHeWyoC<ct54^cXeno<+Vu
zmzu&3ui8s?662#ORX>(Dnpf##YU@(#*m0^PgH)Lg(e$`Vx7+=(ZwThmlmToK&fS%y
zwgu6?tw7;^9Ahr?w&w&+reqVvAET;qt0*IYg)$*0^zPZ2CQ*9P+V^ANHcs1ZQyYWR
zJuq+*m#gD`nSk8V(T3T|vwJh*m%cS)t+WcP2pUB5E8jVhbroGV;mJ^@^rNsX?a;lp
zz#kei%b`iCNTf)wLgV`Wil-B`Xp6N}0HICIL>F)UpV$tC>Wcns3mLlMs_ec5R6-uh
zS0DQaQ<T)8>65Di^&a}fgE6L0+LDg>Ql%_Y;wkyqK(-QF_bXfHuos$!?s;F=Z+*9Y
zKs*|i3YRNEoTnS&qSi-D5XH9*TDUM>XiAov!`2ir#J0ytRn~(^N-JeIt7As_*u_Q}
z0bT<TwFO71Wy*k$Ga*U#)XuKBn2x-6r6-CR$B|2#1%t;K7D+eM_7sM^Ey)z0SGmHk
zuP~SWYf9kUl8DJ5MeKqUvNigk47NPrwm(8h04T1;9XKRRYj*gJ_=;syCs4ipGMk4L
zh4T{v&J}OFzi}0f_2IoQos2qQ(fzAx!j;AgS|A)PlXTtH9eCYcT8IQEp~tT<ine})
zJP|N33l7&SD;0A*c5(4y8{B-ML$u6@{nedJTiuw;o_jI!;P*O~B2838o-%_@w<6?Z
zFHM|_Ucu;b#>N8HPF7M^BRU2!Cuqz>tdQ&V$R}mOjkzg3bB}RDpD1E)ye<=b;ipHJ
zX|f&V|NL$Z4b~{}ubfQ@M~PL(8z1@xm`uJK<%he2_hwg0Cs)T?dZOfnf#=fKnQ#By
zMpwuAWvCfZQMxfD2jSw7dIcy|t*@A4hwIlppsDIWBn5vp08MDe?-*aS*`RH#f9vs)
zoND_J43<*4(D2eirky2yOrYD98t1W+WEJ3B?j&#>lRUeaRua8rZ$J!q_Ru7Gs8f3N
zW8ywstK)SZ>l^X@TkBS_QM+B{wCCS;X$I)>RUtNR9jN|cuff)(*;9mL*OZ3!eK*1~
z1e@+sUO_}S;7!m*Sp7Di*+FW)5@Ax57i&Io+71i*$%BbaySy`QRK&9&<@9QKGlMYD
z_g3tZ>npw`fP|~C<=9fM-6@WNa)!kb8R4LAa70<NB^pNipg$JSa1qG5H24wF#W=_u
z^VKEj69z8b=D~aG>$qQc*eS^J{^w<$W`Q1|37Q$_@NPx9gKB5Mim_GyDB`+4v_+w<
zFDOngVfhu{gKbmQ&>whn!=o7{kaFup^2?4I70xSAk?=@g1%b$P-MEa*w_+|`fGgnr
z^W|~W{{w#jY((nROibSwY$4icIHOCqhpn9hcex{bOwO5ablv&u67<w{usDb>IrZ<2
z&m%HVOOM4QQL1s?_BYult!E&o$tA&yoS-u7g>r2ydgs~|cdC~Ux8NjPZGX?`jO&Z#
zN&z^L%2-|wK8|+}Fd<P$cdEDUXf5b7A4&;pKFyGFgpt=RpG2vFg=$du#u1hmu0;HY
zD90R?J=$oMX7qL89ys2L;%Hb-kQ{Cf_f$6Nmyp&qBDb@xGqXg?eeyU%NxDYXKIf>u
zLbu(SR(spulTRFId5KBhuRAcaejZZsD99341vd}PkN2V~KYo0A(`2Y+v|?2>=f}=H
zLG67Q$%8X-0BXY&UU2~V*{6dLl=RKY95X&9g1Qma=PR>8xS{5lvdOun98xLI_A&HC
z!`<ar8pb)3Cc~v!vbacPzl|a~OPbm6A3O5ugY@h<Gcr=?t#5p@@hC%&zX{TRS8K@C
zpbjj)r>5#hDV}!D7&Rxhbl@t~Uk<0Z4RPf7G#_U`V_w6SU0XvQorON-+<H3hs=*UY
znfuNQ#!yml5;%9-NX`OU?$h^_Es!4C+#+mzPi%sPq`0d&@Y*RWG={2$C>?4<a>Vt1
zX}8=?FqaN-16PM)qa{wc{UbY<1Wgsls7XuVO_Yov#<|q`J?Nm-2C*t=`=$j!2d=GT
zc6+30$DB@ck7o+i_>4dD;?@H%uiRLDzu!q4-yE#(ok5nger6=iFTb*&V(!`HeOtVu
zDi!ETQhnE-780|aZGT7XtzR8yD5PYbz}xP>dEpSoiClPvnGoo>(W<TE{&8f<p5U5p
z1X%x#(a6LvaC_F+jGa$K|B6C;3FJ|s#DP)t=h;TR2T;aB7{->%LJeAc_ZMwU0we^d
zVf~Mli<w!ycM0$MfEPUYz#M(P-BW`WI9acUB;HxAo|Z9~I~kR8epmb9V-{|DUWeqy
z^>iyr4Fm_*xmBvFeCXSX6OtB+_R!+aI@)eronLbr;q{<VYi&No%X!F%om=CuQ4T9w
zYYnxC&@5gI*~Vp6vJu40+0PP9V068-jlrwyhn)VGve3e{)vH8nUL>W*)t9gk7tg_$
zfP^KgY>~Pa9|1@Ol3L)VeX#pfP$ky&zyN5w^sd%DwI%mZV%iff3$~)`|C<Ynkg!Rj
zn@!bVCHMSp5}=nh8+;Vy8MDuq1_@Px|GZ33^Zv#R#n~30<3(3|X3(<GXAXJSX<0<g
zX$u%t0&g>h4|!HiI4JdqC86oAK`d0QUSXd#6P(N$xt;9?`&_ozM=%KiCn235iXs=W
zj~~1ob^(AoiZRXwH@{}Y0aHqrGoJyyUP@Ux%G9^*Fs@a{9rq&`k2(JSHN><jZG?bI
za1G8nwfrum;{Daz0m4(QD2qW<`4xg_I|T=>)q5*>*tQOoPm0A=+Pz~98V`HC$@b#U
z@;@=RWs)zHCn7J*|2O+;j+BA9=Cm|?ec1kY$}C(>`^=%b3`43QusCbQfmn)Ka6ge)
z1uf=r-U8Qaw-Lo0Z%V;?>e*%Ib<213QJh*LMdZ8h68L}exzc04b0Z~Z6`-cQc(l3J
z+3Pr-Yw<3&O>chW_tC@z$R-GSN?9^`fKJ%@i!W_RBln#9oLXm6L_cc9sZ>w*ok+J>
zlvFs@yCD9c`tyK$ul!q#K=Nf=xX@S6=N)@f2A<xyO!QDansOqt;!tBC9E1?la@xxy
ze<GOrejVIU6lIQhFo8mWl)%%ZS3OqTF7PUCYqnsjZvZ?waA|d%htJSqzcWuar)&a>
zy|mdo-Pd|Axc|~nG(|j9{7Zoc;bzV*R9C8d>(NQrh;y5skMoI^tM;LKEXg^kb@*Z?
z?H~C^@6yZ^H&?oXB!zw9Fm+{M^$xrXvOA;jtJE?2Lb~SR6PQE$FM<|4D@lMz`54YJ
z_QvW+^oAI_P1;d5?k!x!AKeA5%MxYpFzpFKy!(Giexqdfb?N@*@1md9cn|vOonyx4
z9V{4?@z@>|NKMV%vMo8{fcQx(LB?JLA_usFre7H*PbgJ9H}3ki3B6P97G5za493`8
z0g<(~z3$Ka!;KqUsN{w|_7~lQo;-uq@d>hhur1J|Hick*2`%_!5Bb+xXnuflrp5bm
z;cDFK^>1779e(PB3ERnOQA;A_De!f7Z$gB4E8F9OU_2Am8@#ke6StZ=zB;}HWj1}b
zoOidQrz^?D?>Fmg>V#hChd;I?Ulb(-+`5e_+`GF<@1YXYT|~J21mM1M{dB%z5=QNC
ztpeAZ6^L*Yg}U>sT+fT(pFk%&Cay;IZ5gky?|DLai6T283Dcf=KpZ*gy8F0%%f-i+
zw}X_vYa}Wx=l3^LOl!V{=f;-$w4n8_jDzf_t$Pj@!HoGTYp@=KMSvFhVa8#i%`KxK
z&kTXYehW_?yl#myR55g8P0AzO3JJ{zqyA*?i)tmR(cc=-SDl8xrv1u*6jqCtaAa$^
z$8CazMp@eg(aHWikG0c}_3kmzH~@>iV4i?pZtsma$_%zv$KCdS?^X0e103;K-o?em
zc!L}n(}^AUV{pMrkM-XC$1P899(pidobSW>lx}h$0f(g`lL(R7vbohz77N-sZdL6>
z&X^huJ+Jg693?nOzYa7{YP%z6`}Zi55Kn$|NWjU0V53n!_r-Sm{%6L=VopC|(OkX%
z{o{@vp%-}Qg~H&yFM`%7FXS-Cf^)mpch6|fZtyOhKy4URJGRQ-eh~SoeqxR#z)g#z
zuyD3mxm%((yjT+g1*vy?&(WT_N*s`V8_khvLHZ_wi~LR?f$6es6FDmDbsSCp(i5v_
zoa7AfA<0nSLkUlKQp}SmAB=vvyPYTG_L?kFu^lFyt<re&!UMj0q(@v*zjgBnBwNF6
zLQR%-+=rD>Wa9(QGOo|}k=4cdB;2RH01X87r#73%>HGP`%-%fIn02^5K&EjwPU2SJ
zK|F4DI=H`-m_7WVED-g0gpIPjlX&sCvtCBSt<pZGrA^HVtLSz%I2L78olTy^9u-%Y
zOA$UX@~wiXX!kcWzW31~RsF8EqyrI0x2lTBNrgT}xV0e@jDd*2iGMY^AC#YD;yHVi
z)J5r#(kDg$p@R-pe|fRSEx`=elc#^J!`==e7>mgH{^KSobdY(8kX|g$){4!R)>r0C
z*5Z7uiYGso28{t=uM_QgoJ3qukI07SMzC_wWRl^@PlvWo{vH~XENgm)x38nQt5uIL
z7a7YGkPQCz6<k;9QtN$K<I>|hrM!P`nm7NKQK(}Dj1Cme>x#oz1WaicyYwBOqkuY<
z!gS`ReuiM{?AJ~=77_yvHyT5hh-%Br;8N0a1JshoZ~x?CYV2oCR;zCMBsQD|&<JOA
zQZ9@kIa@BIM<>0o`(?CEv*6hUup3StJ-E>r`2rK08npgm7A};J31NMgg^{tQGtK`z
zWXeK^5&^SVNY6@EWA9kL7aa5HSIjtqCvP;HtH2A@rzdb|OUTmGY4MbK>_+sBq;J1+
zNIk4R*+|l_l&V2QM-yWxYY1SV7O>7yP|*_Ysq9O(OT0s|3sabnn5eRufFmb$qDxZD
z3Yt2d8NT@F@+#OihUb&-avbGjS`%E0PyX7z7dGpe<}OU~9s}Yo>=b`hp#4AJDn$SX
z08DI=Mxt3PT!-Wqwv(Wz;%*mD^*M<~{sQ`i)9^~v{=p<CC`mSU;B@t7ugYO^3dI_`
zi2>gKxQV<lnqNr5c{{Q#NqnRIRBWogE3(|`>}uhyfnsDv?}dD&Y}i0P+^G*7IGUs3
z?-|n4jh~P5ZQR4gnLg#P4_k$FMu41<w-AQPAVrbJmEP4gFHJ(XaQP`HEGuzDe8G2u
zm!Tw!gTQKc(VP!{u7=JFhU(+le<|y)m{#Jaf5p_wir^5!gDVQ*x3v5Sp5a<Y*w0vt
zo%9OVy7vM<-Y4ET@J9$VL4n=z%@oiR2-CsU^i&*ICBm_%P8egPOxCcFYcvx>0chI3
z4?Q18$|7>Yq5dAzz6tJyEhK86_>sba**jx~O9WJUY^lplb7Mk!2)uD9@dguw?v=q0
zWl&>F0HnY~MJ_Z3088k|+}H?mRPETob7NW903_J0ouE$Hs7ozP;{+WHe^0&zjMYpb
zX)Ew5sCI}1jxBO*<r;EegSq@r90H>lsVO=1{%LzlYP#DHYX7I<X=AoQ2Y|QHHpGE{
zDc!il-uXW<*}BeK3UlOS09!#)w;*@y;rCf&btwtD^zP8UarA`xif7XmRhykK1!-}u
zEoXobnLz-TKqRXY<^Z~zAR;Vx6lq+26)uj;$pFk4{B{60f$zDLJcUz^yTO1up!ra&
zEN|?u@H^X+!kGYSo4orep&%&=^-aZ}zQZiSYCYbywQkM=b%c5AxK9|>JI7J}!5WWq
z^HM-YVx+dT^fOHOYu2*#hKjG*Of9*aq;FH@%v7-}G{5+peJ+ynK+eU4;97F}*REdS
z#`A9uG7GV_PS<#nePO?HA8x@nn8i~PaLVxjI0?R@OZGr`{0=tsfK*J5)_e(eSQi{Y
zrBJEE-U6_DUIRc#Y~Pn-W}*+kUI_5I&F{d`J&|6**LNQ_Yd(bss+vHNd+MD~Jc`u0
z6nb0q$H{Sng9)Do+xMwey;9+Lqae&=<?8X+Z(dIKH$0X?jJ9uy&01$xpgXws>LXT&
zZBo_!$@X$Y&q(M15*PO-ULHD+zPD#VCkxYcH*mP{pWlKo^%`FPgiG>OB@ig3o0@Ms
zkFNakTZFmP@0Qe@sO-f6p6T*!zS56JyvA>-Z#Rp{nqBi5HiCrt*tGSH`KEg>_(W3O
z=Mf)^+Cls2hemm(<b}x!;ZEX>Z-KRg-m68ow%If;v_Gn}Q?77nT-0n^rJ2#Hf+}BD
z84<FtmU{XXUpX;Yc;j34dhXd2(>7A2xgd2JY5lX*dh#$1db(OU-Td8tB>GyI|DncG
zv;Du=XTjyI+%RK@!uGOv9M8tELf2=1&j$+;EKYD2-0%f$|02);APugR1Pyi3aDYd7
zGq^wN6Y7e^9IwCTuWUn>UQ(QVwVoYs;ThS&q7L!<>1}*&@IkZ-`fs)QcRPQFAhL)1
ztgz0xmgObtr@_SKn$%XLyIQOH5V9>c?B`T(zKMS1|H;*~vr{(znZG`wcaz??uNt*A
zr}(c9>*p90x{PKGksZ^Q!pF~6R8;g;J6V^#J3b6`7ox$c+uj5sK@!F8Cz6%A^u$r7
zz~+BP*%6dUPY>cu1cei=dSVYe?uAI>;b4Yj_(wtf!!KdjB%%5;2wXM2nth8Mc4m7$
z@JCqlL({f{`4rj8Rv_Z)PHuTW3slFxLl+hw`|p(yqJyy9TJnmPR?3=~P|zLUIW?c$
zDIG%k9MV+)DBMU`*1?HWEK>UJr=RqulL}e!yB`QCB2!l_MRByUsb^DQQF@M8K9Cqj
zpzJebJwjRb)A0*ay7N`n!jw`XfZ3JfmiX$+LUFAwZam55R6Cwo%fC1=voD_Z`QDp2
zW@5tjAf~akA<qJRV!%1j4)t_Tj}t}Eb)x(qe{D*u03p~Ab`_uN2*Em<CH{(ka?bv1
ziAv-1tsdxJ6b(S3Zh}&4&A8};nX;C66dNfdSaWdn%Hb2qa$I@^vr_c{TukM$yX&{}
zz8tLzt7QrYsNy^Kw@=^|0sNcrV=L~2aADtMHaLyWrC}Z}cz-)?J3$*)phhtMStx-y
z7Izn`qCH=DxIXY`BVa0J0e|Dm?Ig@3LIH$m>1kRWmLUQeG<G3s66pM(%!gdj@Cl$b
zc9-&v5yf@3gbGMEyCpf^`Ym}M@DV!HI3;@xDcn(zZnP39KiVjVTM`umy;>F7!xrJ5
z1=2)ti@(6yK|TQc8==!OTvqVWcAj422*mISabwHx{Bvq2VI~r6i2l;=I($*>>b)_x
z0OHd<^&uEnL#7_OlrGx1aQ_tT1Gd%yXtDwm07K3?01UiduQnard<9lE-DpJGrwaV<
zV3-G^ewt+B?iWUV9@l<adHDN&gn(1fYOlr=NT}{|0b<+PI`f@5A)+F3ip3lS>}gt`
zCUq&5Y~MTUpiZ#kvKau&z4+YDE(OI#?>BrtwxnQ;_+=F&D+%z3a@=N&ls^$o@3y%T
z1C$!ij}m~dBgr_nUGaU*m`6~c<b&-MZ}cgZ`MNwBj_43X!ZeO!?#~W%@!aT_Yh29<
z@%JN;P~iD_P@UoL+Lx9FT)OYtEU7q<3lncIqmG5-%&bkh{1R#rPN;?SJ~egY4k_h$
z!{>qAKWEGlo&TLGNb=dCB+9>7E1lE%_fA3Dq&CPtK-aw;fVN5r31x3hf<P376PNZs
z?#f3D#jTbuzPi~IdGp<)eMvgdKcurkd>`gbvG+gWLO^GQ#_I2E_K&c>iTvFYRpTN4
zl74SWb5BNj$zweK)f}_|X`PFN?XQn^#rkHD;VONuQc)qk$RnS}M`l0`0u<rlKS7_K
z6VTnA;@CUCGCYQr)SK_`dKARP7lnGYQ`mY-d+yM`l#i&pzz2mi-W;a4AcBUQ9hkU6
zu;Mwe9p6!Qym+BXLU*2&6Edwc--a6(i8;+xj@~~^!NiP6cHpWDr=*H!c)AmsgG~Hy
zG3}+dOdt8LYaw!lW1z{WiO605=hQSY;MTzcOwLcD`sjl)1$7YnGh1HrPica=Rf=7)
z-Mb85yT`z%1D%fgR6lP0M56?56_jH1eK3mJwX9Y@n%_Y_-xE>(TDPr1WF-jL7T-%V
z2t6KrLJ`_t%D}GN5mh^1dA0DmnqXo@#U$UJ)<>z11#Z>)7l}6psiC#CwQhlkU{E`A
z>=d~r@|M46Z-v43?Ea-_TJA$P-&;P$;f$GNm32$n0;3?Nr8de~!YuBCYHFF(p7(u*
z$Yf+sQ3ukt(UN0UoH_ZcYMd|g57!!|vqpSXmWn9%N%^L6iL%ch_ix;8teus+lu1J-
zm@ex^<=Nd^lGVC4u8eXj&Sr=L?q+NMhiEb`NKV;pBzz`{0>%^MfP8j)zqLr6wbqCn
z*rw`6(*+-|5N>`5i#)ku8tld<B%w?53^J^2i6*Jsx49l~0)~Q=JBbh<f8!>B|Nq)6
z2>rK~*0N^rX&iKW>+^uG!j-TSbs~{)k;RG!F)f}HTLxlq^|xs2T-N8oss1|}fQt~{
z)ViV5@yD?jOjqO_W7s9<l{ycrEfi|bFWI($6#N_8=q){gP@YR#>U)Oln7FGT_>ED(
zu`^IowunO0sJ4@lcD8i|<b&AjovKzwuIBv_eXo}>o?)xDpWP3iuy)!`STpN5Y`xRv
zqPr6`0f@}{eq_HfE<r~;qY)1WsNo*nnnc6K)t>?vU|l|&)fE+zo)`Vlm6nlUeS)HR
zV*{t_7JEt9APN?VxZx;T(00*%u#8=kC_kjZv)-_-$9(HCF0k>gd(IT19>?x&GJjBX
zjK8aud+kgJ3}Fc7H4w7%n9I-zN4YfyPTKu03-qesb9$5-S(`<p=mG4jPs4^|O#uI=
z0bFs`o-Tp|CFA9n+v~9(rBg-6+{@v(y{@MR*4C=rbO;yL;iNNm-$<@45i}_$Jx#QX
z+O2H6z|fw1N_+ZY=uCK~QPu^Giv)wL2<@0p=ypD<MGkEXtcl`ZNtqkVR64O@q)XVf
zX#8<l_FwD?pNP)Re#6_(AEs0y-2*%LVhs6>=wc?-o_?wFQYh~1v3sjlA9Sp@VAR0_
zbLJG69|jX=77Lscz=aeb4PIMkzWk~&=*rRf_+nIN|8orMii36&a~IupfBHV5fc-N#
zKS9%v$O-8eFMg~t#}|GH9I@a>CC+U0?5Uh7K(ve`%SE}3WO<?-{xYfbyJ_1RA44V?
z^9tNM<+t>Zd9y9hTU@^W@2_K>k{c`*Z|&??r^3N5=>2%Gww#)4&KT_{V*T3&Pqg_@
zy@I^&b2Y1ZJ3Cdb{ym@WDu1TXr!Q^f&pi#V_ehG%|Cc~{5}~ya%TR_S{XMUDtCWj&
zTOyWB%b?eH6>bhS1xTulI|`XRt<fnKyr&X4`YfipGXy$v?J70*unKaUnj>H<=PCnv
zs!U7AY<PwPj8Rk$Ye#ChO_m4;z&ow3bbe~xvkmize)Vpf9TECtBcg0qj1B6>#6PqT
z@6z-y!GTw3SZn^`vrUTy_#fW;<%z}?wU8Ag(_(F<6DuNY@`(!DMCO3TD5t;n>;b@(
z7Q(Paf^e;<MAx51fG>k0Y{7`W3Q`92Vvzq<U<I$P>;q80fjCOuBQE%TzA#rGu)94S
zO1SmIP~wU3rlMJ!=ulmFN{o+x@$^PGf^B*nifXAaw2wqoG^Bp7sNJ+%;Zy5BQLE_S
znP-|mk_q6eIqZ(f$?`O?X91DwazMEmHzJYK0o{pXNi0HBnpfO(k@`INj9Ia%xG{;m
z0yz<}`j7;YWkk{wjnEu}<Ojo(5g$7c4WR_=%G!hq@^PRX`mr6%%+yT%ScGjeEwb-W
zg+z?ZE15F@(J1Q@&<iL>pTg<%)zwwaiFl9J?%WD$R*LtK?*vnM>1BAe!^{bdbkiI`
z^Bf}|YSCOV)}+MAggz#T_<rvW(f4Twr}$N5Iq`v*;AC8oM|pPV79=^?U|KK=YDS<)
z`MXSpMdSZqD~#F(5kGvq)`U!hlMRqSR4cieOEh~$Vf%8|^FlO%hN=m682{tekJ_nM
zZfQD9!~{K`6l*a!$+~vA(!#rUEa{5Bm3N3kafNfSsZzPY$piz>$Yawuf<rN~ns@8<
zk)29PO1{ugC0@36r3DAN=!)3^f5@Y5%P=@8M=Kls)D|P1J~bBw08u*dwj3jp0KGaA
z>oMMJa>aAIwYy2RpI4fbv_iE$C<!-TPtMIX)rSh4)dBSckGnbkbSlC`-`1Jh5`UJh
zn{1~F`s~{*=R<fIo?X6pSTd$=nH>n-dozeojLZF*P^P^XK&Upf32l25QhFgt=FtXh
z1b0i4%0}L!){jm=*gnYdv7}c`D9t?pG^MnAJ9!18C<+VXE&aulVmd}2MlP&M`Zj8D
z=@w-7oNFnz?|9B6RJjgS`C5s}BU;iHzGD&SLc4Vn<mvdMVdt)s&#iY1;%Hh03sE(T
zsg*><)Lx|S^}U@c@S^dSI9XTALM#8R(J?m^Yb`+&CRwpgA`7loEqj)f@+Xh)sXy8z
z_@R1^T6O{jL^v~Omb8+l5Uy~0y<$pVlZi$wWF^aUCceZWRd0~K-GQ8elx3u%98j;%
zp!yd6Wu}!{VJ(y(s6K&;<9clOJ`@Iiau?nCGkjl;k>>mgHcDh=4y*qgl&o%!_8uZ(
zao3Pa>H9<M4~klq`{%0HGXfKf=QAr?27%x$tns^X{wjfEy$VTzEyi4#23Z#xkS$>7
z^G4=b-GLY9padZHyWo_gAixCKmKy*(0EG~B=gr_ARv8j^y#TSMN=PA^o1%UI7<ie>
zIYy`3p{_hcoJymK%WuV;>C^#N1T^F`=04@^P1pwkPV`CDPL}nzF@-fsD`{!SZ9F^1
z)&El?2|+{V4J50pH6*m=VwMCxKR`4+7R4<bqkLy$45zC-pZaPdYTuq6sFlIyWJju0
z8kNCa=C1R@7v5JNs}Xf$Wm_o}DLwWcocQ<oQH*M#v!?s!-)+*cCh?R=tdQP(!e#^s
zlkCeg=>1OD&T1h-1eyJ5PJtnjvxNho=;#Y52)C5)!G9^CUTt)&uRj5zol(pboD2%Y
z1kOCRqiF9nF9Pq6K10caPKC3&G4eK*&uyG8`?NhpXYhya#nU2?uv7EBFClE=b^Z+h
z0mF-r+^(DyF&<tVMG~}9J7#OWXJcupj<h}*Ty7=(LuhB3E@^|w|3o2b;FM!;Y^wC9
zh)BK4)l#Jh)R`b=;lU_@D79ykk_A~qW<c8JOy1>_Q6!s|Ef}IU>p-kctPnsvj-3EB
z{}}R!O+R+UngGrLD^TpeDaeA7CB_bHp;Q6>-}h(cKt$ruE$D=XS?_@?+gQpwT<iC4
z_3-dZdbbj7=4^6S<5E8@|Ju`PrKyvEi09olsYRGAi79leU!0;N$kEd_)PhXW%I+oI
zxrFjtOcMnsJ_xDfTp2|*n!>3j(k1=psNJGb4F|S?eYyJO&8Ze{3?3<gO8E;Y8d)n=
zpFafDmu_Obe3`{r-Cp!?ed^_O25`G0PYDoGd`zf1f-C+3B7wn()2FfN*cif%QKNbt
zJ>Y;7BEI$qe}E|LX?t;!mT5#}G44=5d^}!xOAxjGbM)sDVz7DxvyGy5EwOTG$i0=Q
z!P;E^!AE!J<DJKydXT*I+=FN;K(W4StVO1QR%KhS4}IN#w$wH|50JpLSZgRGiM9kc
zx}j~TpI1cW)}jjc1L5)`jk25#!)J9@(5avK@CH@C%od+utpLib>$d>-DfxKn)4d<I
z?ow;)MQ^UoOQiT?A{Nld^`O$U@v)f@TQS6Ym(0bBEY?yo8}ja~6L|)V&_ox9WSW~X
z1O_pE`X|Dz)KHuaZCxJ`Ibr1Z<ShuaN8o~@0H(A=AjuwXTV<x}PWUoDk|fqw!$IV1
zSJFAQBMIIrWs-2_4s`rXhq3~;{bSvvyiu6fYC2r{tZULHk422i?Y&jMv<*VQtfxss
zD@~c9_05B~Hgp==5=w)TO<U6Q6#XAR#?-KS)3amyq*MKRza;5aeg^i!AL{$AQ}>SN
zt37&Uex6A?zzAZ!p8tg3is7qK_Yj%x2h3w{3xY4?vaJ{pL}U>@Xl0WJ$^c~;t;0-n
z`v8+J+QO!~ZKWtcx~$1JZu_5E7cFI(K)DCu_W9f2FFzkZ)Me6YW?e|(awG5Qsf)_1
zy-D$f4Jp&cGUnl<J*)}IUf+5N{@k+J*o4+H>P&BFef;hAm*Hzu10eRVW-di3zns+a
zcb#er9K9woESr<=GxE_aH~L$s6_WnhvHIIr<2<vkZ}+IveIZi-_2ctZt9xu}J8~A0
zl>I0?>^5A9tCX!S_*fu?L#sg&LU&RfY&KE!`rQw}1JIbPWrWLb^Nm8VxCQMVP>f)w
zP0`>Fu!aJKm4A(g7MAR4$HE3}X%(k%wt8{Zc6!EbPwxklI(ZqkOIfs!MLG&Dg>SOe
z)zZA%?qtXox}G#-YM~$1n5}wLW=XqFwanBEeJq*}>z|Rz>4+Yh4-rmTeu|0i0X9De
zaSVtkIh^r9K{6C=^$CccF!*t5b>?Mp2Uy5PRJ}BCVX1HIXodRd4zz-r&AnlQs+@j-
zkY)x+g0kOjv-WS}G|#%e79p#Jjojt+OUx={-Jhox{m0c=ThG{sKCYj~qFu_PKjaNu
ztk<KY$Z{p@#dDpy#OOJ234?jlZI94UcArstq>)JgfJ?YkCWMb84H9~%DQ@VdxVyDO
z1|HwTTWGS-ATA8&ZunEb$H;3MLpbPQEaf>?bmyihYzI}%d1n1fjMWfn@}QIv$tWil
zRFvddvZUBB7;rDiTfuQt6sJCI_X))!K@@G>2*y~sBaI@2gNYOic3H$REE?OcyQruH
zh@&5Htx)lF&UaJSgez>aolteS(MmYx?AxAnsEwq&;<00!^?ZeANuRV=n4QXt@y|Ul
zb-!G)8X$Ik@IRmg;5b5#ML}u4dofZ^t*~+@i@zlD??jyeh_>q3bCeZ0k4=EnpAy!^
z^Uu#}CdhkrBq&O~jg~}nYGh4?I3X{h3tRXYRj*YwNKk!W|BxXsbtN>n&7}wfa}Mt&
zkD!2Xb+-+!h<=5q?y%cz)m^MsX?%qXGXEK-$KxC}pvc=9IsE7>*ni1N2}yuLlLu|l
zfOm0`BN$i{3(sBlFYg*G3_VxFIHz~Ko)6_g8wq?nuut%N*V#=#A*m~l#BAuX28%#P
z9oE~2KqLf+G$OqG9C(=`GeUW$_%AD)_jS@>dZF{FN5E4?d-?V&Ez?NBi3xbAy+SAt
zU>0pI!G7qB6b<+s%p~j!9s*OB=Dg7SV&hkG=!fXAchYxART|!3-?O3Zt^;z-q~pUS
zOi?Hq#c1il^6oyhq=Q=}m`4I}&}c()XLg%jXWUWZ!K<Eo?JFE;x>lfJZf}o7AmNkU
zxI(IlR?#{-mqpV}?=;zQ`1f7!1$S)U@i=4VujGP<TZ5(R{^1%uCmr%=r}U%eZ+<O%
zeq`IE;>klNzuZqbB(X#4NWnef!!v&t<lhjPTC_Zi4E(kuqTfrwqA9b2?x)liNXzl4
z^-9$9^6^TjV8jn|o^v;=cjEU6;9&FL+dWm+z=|E1>`~uY6yQ%Up}LXRk{@m^6@$4N
zmgj0v_BEcGO;zCrY(K9r6;!XCrMRGq3N898Y7hx!Aovr-dEo{^`{lP|vX62$IPsUF
zn^}6sh1KlV0FHLjt+YN93l;PLSl?{s5`ZtiDw{ipqz(U3lUmV@H~IOt8tKZZzuLRG
z_y2<5J+(;H-5I_S^!^b0*ZP#YXy;M(F^H@ekPTI+*^0TUGi(+Z@EKgF(OcQ-SsXK*
zY-Pa6RF?UfSBZ(72+!&_)+4R^zMjb>!8zVN{)PIK>Ys%SCrL3sQ1wVcS7(7Ez~D#w
zyyK6S-fWgZ53;FziJys=DV>vCPOg5i3r?9BS~-px8DB46&80rS%XW~Xf0%#T+YmW@
zZF~zkm2Ac%xUDWU*Tvwy$NGPyrO7_VdYOsUJkQYQFf#eUHYK5EczBH&a=`e`IodK{
za~7|KQ^RDL%b&@<<i{j|VAS~%x!G2k{a0|Z$Ct9zAKz7y*lB{fJ)JO+(PQUIXY8@n
zBbDU&9YG($)2IJG8?-y!P(|LBd6}$d$ZHU8)%hoU)gw06Qd|R4LKPud@&C*w!%Tm$
zGDa)|ljU6@U&~3+*kIUnFm08-qcATkH*4LgSdGnxvh{()sJ4FlPDw~_8nDo-qEUv!
zhJn=I+lEtDN$L|fhi~Ql7oKfm2gqc?WsM|r5{;E^{HRmKV6ue}GbJR|ul?_G*Nk-=
zua8+GTdj{)JgcyMI8kcEofnqros0XvEW3f%^FQdmPcTeW{TIwtao0?mMRjtY$3HP5
z#=J(7StWToP$p(Ahvrb%jepZ3n|rzG4*lQ@Baz3%uYXe`ld_t!I*nAgF#5J;^w$VA
zFH2T0I#8SbH?@qsS%sBfU%!tLvPqu<J_Bdi<T*Q=XK6H;e)&n;xdsCjv%s>BmD}(d
zd35a<nQ$LNJ;%i(8~vO=J*;*0r_BNzUXO;KIXSllZ)W2|=O^zW4aZ6`|56`QPRg}4
zk^`q4+&?&C=WOH9L-(fe`=Ps}JUF>V6){Ruc-yQ*Dm8S?*0o51yv4d4%5E@)dd$~7
z*%`9zgW+`1gIt}JZqTh8onXN_htY<<=dPA_)><8c>Nd;fM4dOcFX^{JGwR&>n2wM9
zN1xw)<|?jDBf{N5R2f6p4QuD&psunnDQ}kYc&!2k$laFJqgmS;W&lKWx<uU0%8=K}
z|8wJlM@w_SmsRJa>iJ;*up2^VcBOvM-iB+qj4q8<WvMYqRH3Y-jCFsnuIQL_qi_I1
ztA74%tQF?2%BG8Fxg$O1ncDXwjX|U$ybbddLdrMv6KXy{N`a;S0YHOETOIhjS16aJ
z&$6JWiJ=A0a9)s6p2(y=ujKJ@>h#=-PE=d#!QKfgj}~%&ZkZ?JQ<n7HJif_?HUJ*t
zyAwXMic*yf52l{{x3|@d>IPYhn)pCNi`7O_SYlk#oS={5^oLG86@+#FXm3MgZ|}-#
z%9#2Ve9QF#HzEVV&h(M{>Zyu|QFXy;<SA(pBgwp)6u+5RVUU%_V*6yBwqUG@a>c7H
zR0UFDmL9Oh?<>OVIM~sZ$S>76w^*w&%~Ot);Sw(^Wpu0%UCqgG^I(YD0697<xw--d
z*O3<rw8R*t0=;4RTGmKdPQz?o#q18B9*?ze4WXjS@=gu2Wy{e5W_d$39?XYK-Rc$r
zA4#BwLWw}BtBXs}_}>YogO&ebf=vTQwJ3XZ8wS5`=`-~iS(;>(<sxf4F8S#U`01oN
z{-{aV0h=fto||YYpkE!Zc@f$C-^sExbI52`0Jwm@t67R;%6L|7-gs2>ph-*ih2!Xy
z@jL3p#cFT1=tDh-_GnlfO3LY$0D2!agerR=VbnW?VVt-B2<UFNA-NDPq5Rr;`Z(2s
ztheiDJPqG6{e@ad@)xY1DK!+yaXE-d>sd#rcgeFPUft+GH~Ks3ZgK}{vqsGN1Q2_;
zVjRS<OqyE*+71s-r&6i4hTK_0{TX!=D#n}-&@{&Z0-F|oilmC%j>q%pWYHn@f+V7d
zT&G8owNp;t<3;&n8hLDIX{utHeCp+nwnW2CuK;q}ew4?ym}@Vl?(=@1fg7J8P*?4b
z&|AoABxFAu|NQ>u3(OTzH}>W@r>#c{gDX~kI2a>Ex6P6@8a7Ihy|$!G-Vw^9aW4Nu
zIr<#F<<@{>xY;LwEUv3RLn~|auf)`;-%ggdL+di@?i8wVqW7Pxsf4OQ8okd23?IY)
zUi+*HyZtrBI$I?p(U9dux7!8|@`@H?6)U9|t9g5DlZ;ul)JO4!Ku#cN7|W)_*<t~<
zp8tDG5bJlS`i!T~>5~0P07dv+4qC4^H=jgd&#h-?vn-93YAS*rmLvT}h(4>I8h!RX
z2gsMnd(6jK)7zWbOkO+BZD*6K8T+d{FN4TJ*)EK8PHYmhnAc?!oL1ga|K3uFevFPf
zQ$Kb3EP0wF0(8euF`iNzNXFXH{sD9?vJHQ&6wDGHdN#vf*fJf0!91`-2HZN!Mn%z&
z@o!4JP_9<@r$0$3qo#KCCAII`DEb?8)WwzurYzVk8Mq1pRXXQ_K><m;9Oz1aLv}9w
zo&CMHm(gQ+a1)RiL|mKz<Q8FWUtKT1?Avx0E+qSl;6-N_^~tx$MAD#EGm>yAq3GB{
zOfs$H_C_MLPk7wCk{tjRLmB(Xdvqr={LjeOf<bllu*CZJuR#A}tyGyM@AJCZgVbh>
zTuG?tyNl^r6dbVs7A%w~#ZV)QWEmTkT5M_+b@$OOs3Y&4`3q5zo*(0sIdmzosAC1`
zlzvkW#F}DvNxkoLg-$(YRfT4(u}27_*}<QlL5;mzh{=}=$nu-}JEq~x$>o(Ahi(v;
z=rb}~QDZ^F1^5=o5Nm1QAUdA<xB4`1Vn6h{hH36EVQX75<-OFTtUO20^Gk80wq0ma
z4-EAF%S854c}aGLyhi>Hz!z@y?K9Pde3MKQ9;aOzOslXKN98yM6MUdFe{Jb3RNv*F
zLbpYx(BDYXv}pDknUj>17gR1^Rv!beJGrUc$&{B<d3gk_dX|ZB<TeLhEskVq6=+6(
zv&VKrhd!5OV}vN|#TZCt)AW_Dy&fneEs(TG&`E{ObF43+ETDwV0*;}onC;SJJ+G>e
zesz(bzgON_9XO2o?5?%D=IG?kEKXw~{vTEFz@~02Xer9-v&`ug)T-i#+c1W+318Q2
zcxd675|(3ZxmcH9FOG<*xNL#&jtlBk$&aZn@U!>&d^m9<k{V2YJny#$7|cobX%Ac`
zQb*bk|5%FkqrsGlh1a99pr&GYR$v3OjEy<BZ%Y4c2{uX4l=J-FYLa~AYI(g7r@-K3
zKoP@;Vf6+idHyr@9VH{BsTKYI*Vhu6e|kNjKFAu5k*f5fk7DYK*J`QhS-iX0oj5U9
zz0k>ou~pPQ{pt)qYx=rcbG%`7rQfaMK<DdQfYYR+8i`SNOsGU!kcQWnx}Tc0bzx=2
z>M*$>Dmo^oHE+luaN6{5gnfoE)}5$6c$>l_BrA|He*f34n0&5)GQZpOzZ~YGK^s%)
z%@~+?<rocCf(+ZD%dbf6o4iNu%t~T2$<1w%>V1>tZ#ZnBbe-K~4L;P~zj-*n!7aBD
z1&&Bjr58}w$(7uvJZ$NDWD-KM={^p6kQ2N2m9-b^zg|If5wh0*^eBvWNvWTiSH2(X
z$4a6l{<jI=Br*iADAiV6YhEZMdyu$gPR_$&b+MfWEDwzJhgnih>gs&^`5$D%znO0%
z+mQ6LnxdlnuPEjCAs)q!yT7~a^1s2_4~R$lrDRIb%C9l#W_ETWZJ`?j7G~TBdrDIs
z7>U!RF8wlv*<wt_T(A2`U5z-CduFh}pFwZ3L>xEnvdqRO#%-5q)t}!pN~<JyU}X5w
z^*`{=UnNu9NW-}`Ud_#6)PiDEa`E4V`-)($25JIHH;478NmfxhwS&x`HJxQ=gp^Ys
zZvG;AJ2NZAb?I9d52M*7(?j{|c&A-he!MMXx2#k3;%ZyG0X=u;_(XVLNuZ0IuSEIG
zN1MEgb*eyj^K6gG!uoV6s=-ACu8fw(I0o5{OIMb#rpXg?as(vMDQ2)BI}fHB^R7XM
z$q9j={F=ZLKW+K|FojXxk~ZUED+{Gd;CH@S%GTiK<1eu;rSPV5bNv+Un5zmKE}z$X
zsA_84Vc%g`tM#6Fr{uvo?ZzF{ccHLQV`;_M-0R(C|J-F}uwnQ)rh=sM=blk6L`<Zu
za(!%2#OjPs$2XCrfceCRpiUd*T2xu{Z{&}I;XAUQyKGI+r<zIEs7T^vOxQ`t?!-9#
z=W%%4(ryUjShM2tEG??b{ch4J)C~hyfzu!kvW?M0GV)$2e|3QxMjoOXqrC0=$bL3q
zxM46@Sz(X-IH^vD9`i;g^?gaq5;rSpZ990)tu3-QXQ5EKaKX^b7Cv$5m9LE#E0j)Q
zwX`-%_*=n$n`NaH`sRL{f!28_@@8Gm!V0xA%gz9iMlH|p+x4U}qp#-c@-1=`sr=Q)
z?-Sr3lADNMSdNK7V$!)2Z1ySMwzaioluslwE1m^s7sbTHh?Di={b}WG2j!c7Q^@I)
z4@K<4@4P*lwK}S@K57g_=b8TZbqWjM&vavBVpd*xv?(!Os@a*~78VvtGy5ui<{Vp<
z7y~S|2@{;Ow6tAITU(NR=&+;z(oFffTe$x~`zfP-G8rLp+0Yb769%<b)v2*rNW<m?
z2OQ$EfQ?vlpj_(QY2=(Ie15f!P5&pARjZQZ{ba2xKTvPPI-8rDU!{FL@?~XZrCfb3
zQ+Krc)7skFU0BC0W*?W>fL?z$eV>Pi2Q#)H&owBh27a+kr?;E@U!<`S9;`{r{(2)Q
zXx;kk@FFYWtcr??A!6LL7*9O`Qd+?{YS(x58h>}zV(}&0RQle2;Hn!+W^3Q|JE-b_
zj=DwICc$r!RB^S5tG8ScX8-URSy{$C4dwYK8#gD#L}v#)+5*RCW@hq~*FGcMNPoMD
z(MOaVWiYD;DqsExUtWJ!n4KS^&T&9#bbs6OXX^a5(d=yY4#OI17v95n(b2u0yVIc1
znwXS?eC*H=Vp$2Ujc_8qlZv8K5T5nzfL9z9T>tt&ub*K`b|WJK@^9s(^qomuMjQYB
zNTftu%Im8B-vw<h1^%`6YBtu()+Oo2OZiWz-@7jRT{vPe+fhD0@}6A|2mBrt37B(5
zl}34)mX}%Ye(=g<mcOfg+wN{Ifzf}%<km~nG=PqI5@u!MW2IRS3=zaY$%njW^Ug}`
zWixAaILa{czp$x&N5n`dLpOtFn4q6Cysv$8Vm*78W(Uc|#^#EiA!>a!qh-&I0t+`N
zCDr8gm3-x6KZKw9|4fi?E|%Jz#cMd%))>Zq3c+M=QwUc{O=w6u?YRrqF|?b!kY#6>
z_fwRU9KUT{=x6h#Z|GwAK8<E^8c61Fu`LUukj-^R83<*pJ4_yeFRgnLlN6Vvk`LZw
zlv{f~-R<l`8*%cQX_v#3rQvKP?YR+kb3JmxdWH{+plT35nNBA0xDeNzz?~&-60qqq
zus&+KCfN3c1A3*FrN%gXyZ2XX!WQ6kBCy4}d5M>lDpz|@Cz<s<bXs_|es+h~9__Fk
zWd+ZFcF&Z+*%cCyf4}$K%Z?qCVQJ5QPvkFrXv*s)yqGNckxPL1mZk_6r}kYLykv3q
zc3P-|W6Fj|n-KifavybHsAh^uqJmL)&U$D2`LwzdLVj}%B?G?W&xGKK?LKqrDsNmp
z!=L>HYmg%A<^`q2<^<)f)|~Hz4`AHJq9h#f>tCf#%V?q;%GB>>ibo7d&>+FMI%74}
z!39ay22vkEpUaP#bt=kVtmOh#18+7r=<4UoTQjQXN}rhR4`iKuaZPjJl2Xv*@BBR*
z*~&(&SLlqm4I2z<6=7vxm#L@7vWER6hS7%e!xd-p`q}rze+)ibt)$ASamH+|HDq0;
zw>}HjzRPRGYvg(W7I;V3%bbo(t8w;@43RUA)6}gJr8WXXc}#+==+DT%frPB<^1XPr
z_UrPeT9fT{_dP#Xstl(OBV+BSJ|+0nj*U7GmfV~lId;2ctg>c)`7y6mf4QqXQg>#$
z>D9IcE8n%D(!i{gFmK#gXqeLY^0T7`UNfgemSrnPVntn6E!PQiV|nh#*E*ePX4TxB
za&O6OO%$mnfV|tvH(+ccZ^0EL`RuTQC!B_86fCnYN0t_is)==d%emD3k4pqBKok8h
zeTLfUC;%Q%qes&ETQEJ@f~G9pV$x+B=3Uf!xqS{=UoAy6L<KAkTFiI&NID|@E+r}%
z<5@fJbG^KaSXcxqBlkr=Ymr~B6q@f~I4)LhIFbrUwa!y2-Bx*t;EMBe*X^q<=Z~8k
zlD2;|^>vK82Yu4`%*nAOyYc|AJfEsGjm26me&ZEs-nikFM`e+>83}{YkLjG`CY6HQ
zb4dQ$(xgLMmdIaTU%X2zExI9}$0}awoaa--%ceUjZ>q;8e0Fs@FG;bvVks42xicB7
zrPV#}lFF`6{yP0J*O9T<>nN}_#A7ObpY`CtWesN``TrVf2o<NaSxQYgN3_^=N5LaI
z10=&e8q?8#-+1{4N)9%Mjb{6DVd^SMm(A(UWbIN#-ajz-IQBJe<s|tSa3lN+1Ept7
zQ$9D4y0g)g>Z>PEhTfAMlwUFNdQ>RG@+=B)$ko{tG+XLV-6PZ&VJwDxj&SZTq4Vbj
zz4`6MR_g?XORV%a@k*8Q#qx!zdOgEN0!{|Y9GC|M{tqX@GHEZrE?4bfu7puT?v?wb
z{R4awUy<#%@^?(7Oa-F4)RtwHsa(+a%-Y^A(bv|h?5joK=hx35q=2UUG0`qMC}V<A
z)Awb8Y<D0b-Q}|{+;`OdDHY#l6rR2ANH1_;KA#8&HAJbrqc1Ef=N6crS5d14<7CuE
z61-fU={J~v8921LPi4b?)+g8MitwN{;w;kR`|*!CyY6Bus$=bvgwl9_Qqf;i;L6@;
zpZt^cSfp7g#qUDO1<4IH`ZvQ?j=IJ2XY#2PR$gO&_abJ2t|>{E8*<!1H^Zbg6dqs+
zuFO#BAhLVfX@0}{@=Ik2Y7JL;hc>vA)<2BqZA2>gbahCClUCO*82j|5=Veh}Ao}66
zxePh4kw2#!d?y0Z%F9=>Xspom($OBb>2hb?iRv#FY8n|1-L&b7jnX0KNxtdVyb|E}
z50nh|8Y)k6rj3{zGJ?KN&Gt<Bms7Q(%=_O7)jrSK<5F2zIm}qvCSt0RTRq-{${jqe
zUR(<4I$Q$#hNj$GU-cj(d9tQapNm6tpIFTF^XI(z8ca^gu{Z;pCun>Oc#?^Q$snmB
z2xaU8@;(&{36+dMp{^YwNXs8{qaWIkf?&?2JnNH~w6~ABJZLlOJ1v!qDjXh`_o~k|
z$gK$B-Eti~-RH4ZwYQP;S{vGOq}4=f6;+7j7!|<<GYUm$Ddfs5g|n+lf8ck|EK0j{
zPWhC-0S<F7j+YVt4G&jiPq?5|%jzkWVV!qM=`%Cg4+3WM?|yp1T|HW8b%Itt(VOn|
zaW+igT*vB5W|S)*T#QNvZQgas)<uja_pPKR%9ZwJt}3HEIHiG6H7uYo<^9`imPA0C
zF#NR~vM!^r7FQml7qs{s6{2<62WW6>q#fnR+1wMx!&g}b^iFc*g|?(CtXp)E(BA?g
zO^G0|Kd~EwJN+NJzC9l5wEchDwmiFS*|uFOr*>1GN+?AL9k#3zmBSF@5Rr3^lhb^(
zHa#V5l=C6UX$B+XtTCjL946Tz43iv2;~2&;WB6U4p?bdG*Y|h-u`51@`@TQ-eI4G{
z`?_vNk@pa~)5{w0Hh;#@+2)YmXJZSD4J4Yi@G8b2L(Ghqx4S@oe&n>SCvn0i#P%=>
z;TKI%z54x697f8YGjT+L84`Qb;N5#DeZ{z-Wi*nTStc%XrT577_s0Zt3ms6k0zSyC
z6=gCI6+cG~0D0%)D?Rs!Q^1(S@}yN~{^9(}Kwez}2Ql9V-N6ZFcw(Bh@U6)A3eB4l
z0AABtSZ2y2Z8A*I&aSdcti&W31|cM#+)HMN#01Y&Qt<%(1a~I#_0ZB2KC}2O+RHwi
zR{sLqOgXpE%|uqv1)v>iP<t}K2-uF3cy@K_0pI(61H>lU8+O|A(+qpGpO|ZB(f4~$
zy&BFAM3JE5T9bt}8T>AQqPkAeSs8p1r<}ybc9PLOiX1VB5O)ADcl*&SO&b3N=Qe<C
z@DMffS)#g$97(6>IWvxP7Qh@ii!dvULCz$3;(~VGg)VvqlN@Nxt!CJF?g0N4GulJ5
zsGyZqU9FWyI{}1I^eod*OV6GJceFp@<<)`5xiX9_`?U1DG)pQ?Gi0OB8Vpiv*P|&i
zuGh&;W^dU-s}7tAMLl*vOH*$4$UB*6Nj=y<mY`Bi=`L+XJFvhp1{gENi_*Y8mmthK
zead(8$X)afwQSGAnsUB(CTl-B0vLEmP=lLRpa`^8gwOU;2D=8Ma+g-nnooFg;R5|K
z)+`<=aQ+RXk^zcEVnR)?9p~y2*(S?`6}M>1ILX?WN(R)atNgI$w()W-z%|CBri?w{
zL`TE-3g#|yh8TzyObz5^4$LsfhZYVuEL#W(+*}vO)nF0Epi<ku4D}?;yQ2>D_={Fg
zoVR<X>&0~B63&Y<u72o}<n((?A{bMT3RZeDO+x>Vb}fBu>if-QCcFZFvvNR1C~b|d
zGfffeYwuS*y0DFTae^`O?MMM50B}*(h!Z`CRIaFnMi)n0Iyhnw^b_}()q;(MHUP=K
znK6c1hpNVsHcN@A6jeQBZlTjEXuJ$3DD1W7F6>+8CMZv8I9fzhTT@2Q>P>dz$LHLu
zM`M&j9NFG;rlqc|!#(Wbq{<K7P5xu^Z^t&L(sX+y*uu57{U~Fy$m?ldpdL4gqtA%O
zrf)@&cg5qVJuSsBkVr#;MYVVt1_|^#9w2Xh?ih0V)Q0GSxk8UanCv$}qyY#fMC@+X
zDX((k)}Z?hW02W{O)oSoAb5WERE_QEXb|)fYu<4*HeGA^apF$Ji7vnT!h+7Rg%7Pn
zBV1s=zE)IUO+FM*v=USf6n6Q%I3QM7P3Te3!7nWhjgdG>+BV%9>gu{a$fsZQ<lbo`
zEpwtU$bO$DAaNx>uXuD4)m@{V@k9k|G<hiyjTRJ%XbEn=v#hAZWQlZiH1B>WB&Q(>
z6esn)mh;_lO5<G@WOCy|>VCx-JL9>^TO9olU8=3zO><nH<w%jlO*~x|pRI-a@^#})
z#PcSsafqtjTt3I1QL`F*!xY_!w6rBKPs~d7E!GA8BTT>E*gSSGWC_ln^!mpyzLjpG
zJ)7Tv3xxQHjJaVNejMR7N{$PfSFi&;?e|a8ZCY!HHM1Xamh9nSs3TS`h9g8*vxNMe
ztoG3wyGjd;?Ut=r-;pXXbGgXmvIrgBt?{f}6~urFudvS|B!ruEAF7{20?G^`>49k3
zO?-^}{ze}*q}S!vH@17n3k`{_xdg9gW3fcJJVK6Ug$VFB4@f5#ntxarXJ|04$Pm8M
zfCqp?cRb{AW5H`f8{liPUZ-vie7{+=Jw1MjNLh<PirRup`1PD^3|(vwac!8WDyBJN
z9hl(bgw-?Uk(F#Nd-!+V#w0lUFdD?|CtM{a=;S%&1H4*}7-@#6Zfaw0267D3@p=of
zNAYNy6eP=vUaP78|9P#*DEVF2N;t_$4@X2%hoU+_DYG<7t1jQJ3{qku`TRzXG8W>K
z?H}zRJkulllIbHMyKIaKGK|_CyqT^UAn)M-N{d>)(||;RT=|c%V$`?cpB^gw5j8$B
z@68fL2)y)-eJfBw(N9ac5Fg0>&c{iK$s#pMs-_?%%<~w7Qe_jiQ9|WOzoKp|4kYev
zM!K1<X|K~MkrI%$$tPr0Ek7GLsgcc3<yiWxvQCRMBDEAOQG@(#l&lC>hnE()DS592
zY`!YQ@AV3<I)8`0pNZJ^`~TaLbe4FQB#FAv*&WfQ3MS$%h)JK%zj>szi`0t1sqJVQ
zw(XUpmHZ{nB#HewbY=UmARtS89o|F*Xg>+9OigfxU@40Z{xSDVyOe4}y)5!TF~Ki_
zBqt_qa8I5yw=oVttfBd@khGF-K;v0g6UEOZXcSc0^?w49WrNrVFLM*F45KezXe}I;
zdQiHw@Y#6}FA5To5HM$Z4mkEy4D1CnuRWHiCEd@K&A09uJPfaY_gLh+r8S%BUQD$D
zMDw2_FLd%N9(d$hTT?Rwd4F}$@(MkC|CGW=-`35IBDd!2Jbljmj=?k2wbn+ih|tfX
z5;@X@g?4q7_wCAY#syb2H4K`q`}j7BJ8VX<z8sjJ-mY|k9zxV5>b$*&Q{X3Zo-j6;
zp?F*SNmR^@Hd=8*7^acd{{#y@_d};WH({Zlp>ej^J+GB$m>-o`MBhRz*cY=Y)Y%s)
z;$JOAZYKiBqkL4y^Vt$1Bk&wIWeCk2wf!#L#rM<L#hP+3*H8IzRs$ZO(5wFsy@o5p
zl0AKoUiaqaFkDIYo-cGZnWg7jTWNb_tpzw+L@BeSE?oBu<QAV+zJ~5@m5?Z;kWj!+
z=Ex~DFOfM_9PLO$;@VKl(fUY<>q|+T$Ssbv9KJY1yigR9*d1t=8R434JT9{uXQ(~X
zt?JklC5nkWQPi>4EP?_dwpGGlKh~+9Gz%)ZYPsMYT~Df@VTsRa-M3{UCe-<fD9EMq
za-&GUAsAcJaUy}Q;zai_nf2+3vrd^waB;L_VN_bPwxsD2HO*U0<q}i`LWaHMFhNxp
z4cM5~CzE<iBuzTMtk7NKvXt?W)qW^VY{MHs%yG8MtVR9O+4sW}rc_d(9k(g6a3k*Z
z%?&&SEOJTPVVx>W3sTo>&Q!H@&jZH6j-Rt%7^n*`9{w1w5XyD1%uJ`Z&mo=TMCFY#
zf7VHNUVT!X?(8dF<@D~z4}*_6JI}F}J!|_d7hi(?Q!9^H;Vy<i5T_krZk-F-1)9hM
zpEW8WbEY<(BifNKBxm=}jd1c9TZlFmL#VZo%pmV)?nZ=Ba|MyDdh-n_@hh;4+Yf^6
zxFFh)W6y3XM7WB&_A6<Y5H<s&V=9wjNn(*Eibg6kiSee<1!<<Zs^<iyr(FXA^-Ia{
zOk(n#AP?W3;}_u&5ou}7+Pw({hTAm19evrFu~sD^_SPoM51gtDQ~^n~l9ideHL8)e
zn<N`-2t-2nGu$C6Ah$7ej~_19rXk7Q_a1A3v9xPg_9C@NlN{*B?RtO~TrFxGOPgAZ
zAc?70CCuqSaUysc2*q$J<AA#0`X_X+1ed-zbt|@Y59pJ?rv;iMzAj@+!_nnj&YvK&
zbv2*sC|S*ZqLKP27uO(w7`y{VA(1q^yjZ|~`o39^!fiRZ{?7-q)#QMokID-Rk~&jm
zIV=*J)}N`~{DaI@3>++;DjdpT2}hJ|yeyV^a?32s$pAXJ+HS<4)?sof2XDQQpQF3L
zLXl-FYi+lYAAcAgV3cuQ$~F2}?66bqz9jses{jGf^)pBer~1|=7=uBU&vslz;4RMU
zUBe(DOmJ4htK4ix^!nPL0|PTVpL(j>O(YXNEh}U=4xTXJC}t|r)9U)7vWCJ+wDR2%
ze;(t7c7)_3fF()r(U_`#fSe5XKE-{^v0&^YrADObW`L^GBFYg9ZDto6NNambkljHj
zSg{BFA}!)SvFU``wMM#*4Xrsp#H}}bmpbX)Ni1{IA_{#d4F+4&&&*gxdH6StSPDye
zSf9KUQhk$eY*}+_U`(JpB^TaWbY_#8B)V9e)i3>Q=h#mmz)~H#vuJ}!PCN+SH;}Bl
zp1H?RBqxl>g{dk*m;8_}?-OfO7@H0)u%DNmzUkdyCWpH`@fh41F=8inx#TA_IZ*8e
z-ISM`)-}Qd2@EYX@-pvHw50Oypn9;DR=ySU*S`mYy}y(Z1Wp4_YGzTDbjxJ9jL%MX
zXJJFKtJp1NEuis~MuG9^=3=Q34IAc;=JoE*6y)vBnt|l-*1GMLBgXNwg~(#<n*-=O
zJZ7J8)TL7Y!uS2;V@WbH4I;*4b!q%IOu`9T(Y5N3%-AaNAp#>z!ejC*DtT)QK7Hhz
zx^;kuXEcyl1%0%n8|Y&II;l@PC8ul+utz8vjcJEUh2-;JqA^8(<27_7a^fO2lW)UV
z&flcuMk^vi<f~22Ox*M1=&?1Jgv+SLH}}EQc(_1FmIxl%ntzWLT+c#{d5rD9RT+zK
zel^GUQLiNr_C+cUziS)ZGUj1}yC7q3eQ4|5Wo0`qh=ds}sr`pSI^&e$ND#=o!o@PA
z;?Uz9ZH<pmkigkz?kLd?ZM9Pp%7>8I9k3eIqFywdjfnUWwujXmR+-pmK`qmCZ=10s
zr5DJWX_KlRU+|*Gz8o8^W1J<);j;2kzcV6v2XqT<xyo4OyuM3R*Jookip|T7sM+Qs
zH1*?g9&=8fZBBi6_1;IsSleMEg2w&~B4SD6%0~&ke;;4DT|&|NDxu+j^&@2|gCBmn
z(>ZG96(>hh)~4b)f$;c39n5|5%Bdu9Z>VKeE?<sOj-52W?BVKXmbpQ9SYd3Yj1l+X
zUt+cYRF!E~JfA5iK?({8^&;{z4iTQ?K6`K*JnW(jYG##ZX6JODw%wdvWe2LDP#-Qr
zG6{=%77$JYa>MH(Adxv?t0lDYUR;)>EaLl&U~Ss#c?C)j7HzIbSV5{FE+AtH7L73%
zzr_(LY<rYW&W*ALv1^cHWWpmy6)f348_SgX<xL2}hN%H7;+W3cx9gbVxqa3`SMFbj
z^;c!FS&&4?*y3dr-M;9KD{=qy2~_>lvbKd<_Wt0bSZzvGVE;gL>1^e5Eut>T(7GTL
zzJpPO%_@YBc|X;AUii$eH4WEtXs^J6^X%^dk~`x8>c0KlL%XJRA1R2GNYtrJHdN8Q
zzig)MZa0xbbjAL*0~W)2?$}KMIZtWZszs~9^;hO!U->HGUJYj=qH};)dwS?7%Y^#4
zjT_@h>+<QuN@DSsKFrX{_*9O5<Q>qK@4glJQRrmmN3segtb{XvRpyw{+H<e<f5$-d
zP#Ru4`xtlRW`mYOGhyc0_!#FF7Nw!ruAg#c{K60>Tm1!s3|f&iOvh7dlKX3kwW)~(
zGs=N1eTv@vLMIO2TSmeoc20~29ekg@R<y=&t@pH*Ki4UW7RZzIm#y&VEZd+nQ}Y55
zEAKX~)}{Fn3KJu0uJ<D~A(T!xt(cHz-^Yk1rYP_3z6pytx;I#Q9eo@<N%tPJUTPIF
zD<X&}YeOyKS3ZbdkEsnrN$a9!>;5!5FpwLxWq6|e8j{0_*)?2dV$+`cUJSG8O6Ol}
znmNt{*OxoRJ}+x3bmZRPWHHw5+YHc`ZR&!-E&L5+T-}TgY#?fo>6Vqf)9%7caPJX+
z5^}Pq98d2^Ox(H13<)ZePU+FLEQPAi`z?9<$%Di1>!=hl_8h%chN)YPXQf>s(+;cS
zulaj;csMTKpjt-xA{0wUc6{<$5TBV1Zpl>xfajS#Kfu_wp<ETLV_a_m&~lJ|upy}o
zR=)2s@L}Xu1pye6O_mZ9Mg@h|mnU?9U$T!RN9;qrtOP^4WrcgX3NQ4uLJq5%KP2)S
zi(0jF0zEQ2hiVG>?^f(iOz6g|;3sP(6|Wm%vpHiy+Jn=HJI8t|p(1ru)u1s}4(Hd=
zD~klb_|zbWx77%kv!eP<yyy0?4Rt;ZYCENW`nxF}NUui0BOg+Id}dU66$9#4exDsl
zPet|bF$UE#_GRZ7UceG5@79lO9iZZc$lS!y*6HfP8R4i2KBxVoq0`4A{o11MigPx5
ztoIEa`Om<?BOi`LWj@So{YB<V3S#%qwo_heSCmwL!~guxg&)6NcfsU$ubt=qm26d9
z<awj$$_>R-NV1`t_Ug9Ykbj|{YS`&bG}2CwZs2_qFvz-o{9e<%LK`A|p(f~RdHie&
zHq|zAHnrK5h7!EI*U3VTlb@(|3%Xot`O`1kk{oy=6(qX=`bF9EAxM>G*<CA4bJ@u)
zgb*9QQ{0D~u(QqM+gosE)RF-~8VIIq#Q`HD^J(|zL<<h1;K)2ZlT!!?U}$W8#fLPn
zQ~$xh{Vfchi7xPaHxg(RqHf{RaldOD3A(V19Xz^Mg)-*Iukl#r+@&fzjc2&7w?(#g
zHeAG}1K=~t$1I?S>9j4r`pGA{V8SxQ75F`9aS4@;MtQQv!oj~PDa3Omv^UU>Y>Vu<
zN??YArFB>N2plE_*1dFrb=#ER-Q{9_L|Z9ic7&sjT>$vR_Vt&|pOT_PB4h_%@*DWc
zN8EG%!~J%maEmN5vv1~48%&(qNByx449o2jFZY`&V*O6}d2v&IL3>ct(Pv5Zd)7=g
zOD7UE$gGt~m~ewh7*Kl*Aok*Ds)vYvmoF(s!eUt$Q!Rl{r%jp{2%Da6`Uzv39ng;g
zgwSf;sxtsH<a1(xPVH`9GUY@<WWEng1mt!PBN4@JQ%$vr{3_0`Bsl<5ZCl*QOU`~Q
zjw@;5Bap<<){*EX)e_zFHv}=zy}~RVCE66!Wb-*d*4T&b=LOht2TiYoecgf9Xjy5L
zaS8(|0QzbVm=Z)iY;yAAvj>7hidLA=YNS}@5`O3|FfW~mO}meFOkyVstcwq}p|5%#
z7q0vU7*Q|oulo6;ba(s0R1qoDaMQp<?8{!14E7|XB9H)d*;6{og@ra54SiPB?5fG{
zwV{in|3Ra(qUKU@Zv@G=wh%((f^Dj9CPywSgun&j*lx;bCke1L0D`__WD*+;6K1Ub
z4TIP2vIN)o@7>D?UEEAEe}&)<zpnIaE_HWJ`v&uV5arB;R*z~ke26|I<f72d?|Nc%
z0GZ>**wYjYFl@)RWYg8xp9ccb1#UBEXp190I%)$W1GRD|%Eu4~Omo%ET?BVyZU@B8
zsuhm58e!9k);8mp60gF&O=ah0a34D9`Ac|i)b3>~ketvGWW*Y*dTLN=n&GCL$V#;d
z0%!;cEfZ=6<OK9FC`1U~bskn4`jdk-LrZ3kz8H31mDrf~k7ryVMIds^a1Diz6mT{$
z)Xn0_Fc*&WCmcbv&)gyqq_m02z)(6A2wxJY$j*$s%o%kfRd7F`6=iR_TZx)-wohg3
z3&(9xf@aE?2hsY#B_4U{asTK~lZA2xeKu5wAt<7va?YoHrPr_k_1O<Lrk|hpfp^dU
z{=$c7gzP_1p2g=ZN~vL*d`>~;hYX`_*Kkcuw<XR*n;^ml6o(Eo?1{@c{DD0pXdLFX
zwIXsDrF-91FNBjGHva~O3E2oMC!LD8b3brq@B_kSEVtqT(CKS^-_5S{8WYNx=7&o~
z)l^kE->%eC3%)!6G6N|*4g+sTT<5=CAg8O~34W)!_c?F=>N1WKZGlICQZVK>@@qy?
zI9nJSh++jRgk*4=|62%HaRMMpcnxo5rkzt|0}NET!waRia?Hpi{{nzkF&)po&cCgr
zaQy1I;viq<1)MfwH@6uWaa+C*-8dP`kRsi}%3ZqbfvulBD|glWcb<SGx6y^3rmcHH
zxLD$o|7W{cSlwcpc2G@F_i?kjIF2}Ptjos%etv7K^6p}4u@gOQG$-}SuKkLNvk*Bf
zC3e!5xN;h!`IO-tY3EZL*N0Jv@nc;S_Nn&P;+SDJ8&Su~X!?%C0xicP!9VR6|4XF-
z9W@<9_!GH$>e+@InYE6Mv|QOYMeo^fIj=v9fjDO?FM7qsk83cc%4fnqlL@vW>4!us
zF>c@*HzyOOa+V_?lF94shv@+1gHK+j2H>OlMiGvOE~Nyd43DL~DXL``?;1AD>oW$h
zA#aI>x_v(c!Yp|c>L<0?SWAUw50VGYQ7P92SUTkOVRerW*2lKdY|PEySqkS$!t(#r
z-TK3NWovWuip%J1JbU)c9;V6&=3((w2_^qA5QC0qPOj~=4jT7?gVLHqjH62466^^G
zVaYVC?)?X6F$?_-8#aiiBqs;e!QC{Rxp_kAWF^Z~`?8%~zht(ILlzjzTvO!8xU|a2
zId#QRjT}DZ^NNh~TuyLBNA<Gjz;Jhk05+!i9(62vYrzb0l1wPl#J4fQovY+`9c~8u
z>3dP8KRN+OZ3z`$vOD1Sa!CcIn%x|UIJ#YD&rcY`=PeA9lmyQTBIjX@6I>!EfRqxk
z4c~uLlJMA0zuzFB$+B;{7rNZ3!_6}a>4ia-Xa~(TV?9GS#_9Y{^!qARjXV-Ee4M6y
z)aE}lQqqNE>LxY`m*ajZhjk(ei-DGol+t@%NZLFN0#cN*kv7*zx#InwiF+;K&InnJ
ztv^gG+|N0BC0oa7XO58;ra2+rRGBRM=Ix6NUaqVa)qdl_6}6x+QM)>R%i#2q^D-%?
z0UA_$Od_(QI|fLT1vS-G?2*o8d+r3ss6z(?(muNtwT!|^nD<9;SfL<1>tCG^QKE9P
zIi6+^=TRN)Wzh0v``)etD4Knkc~sE+U9|H|AjoD738IlfLVy`}F8s>hHl?d9#n3IK
zNOP&oifk^L*ZJ7tLfC#BEbys59BfNZZUIBiq}-HdsqK5G5<XCPOZz6#`_Vo$eB^MD
z$X1&&G~RZB@vzG7nSCF*e}kV+`Is+oi!4d;CT#3vii%(wP$WxIPWmfP|Iwx7ZhSjK
zVY<-u16X+1x;I1TG6gklpHeu+?LVxzP>LTTl3VD#{oQkWuE64-lwc{yB%A?xUD4YH
zugol^@S`{^6J4B4%4H=G=qraDqJ45~$>wM<CQx;)Ybj(g4l~x0dd$?fV^l|yIC>&U
zozIcoGF*neMcNsG*m-yuLvaSG<(kg759>;Hg1kM=qk=N9B%U;0%?o0d-VB$zK2cF$
zDuX|;0r0oB{Yn#Ex(`5vtMt`yhB859>aQH*jrM>tT*gt4_VEXcjh1yb$lsI=G09=0
zquVi3?;i4n;jExO(3=_zI(CvY$NVH&mR3e7$Qiea3`VVu>o#2GKthnepEdUmXDw;l
ziXg5yE2#FdpnpK6$5!N$)wS!kdttwTqDlPXR)j{5ApkH2q5K1WBqxs3$hZQT8KGU2
z^TIK&)-)UU0$FR}3*s)AVzpwniFiSpMXIGtvIl5gXz%`(@H|4heiGJ7xP+wiYP#kM
zS4(t(T5)G&hdetv3eh4ODS`?LG~q6BrludQDY`+;>rrn>OLv47Y`eR+y8DnOVtNJ*
zJixy%{g3BPq@$k^y-b8hpg);yB;Itsg>igIB8?KsxgOv@TmV#NCqo=dtLC@GwXotb
zqjb+`GlsGOs!kD=*usJuV&G+N<#!aGcGNcXd6@Ul75lCcKA{%o5BrslSXqUNrtaFa
zFV<wOgQrY^zJGL-CD91d$E>(dTv!KDECEw{+dQ{V&Cao~3giTrY@%$jnpjv=xB5^8
zYF&0<&o78ydL0wFO<lgRR!q&Ndh)d@X=y1;Ql_iSee}uD;KE=jHg#zsB%M`*^jFn;
zR$tbLKIA)IW0ax+9Jcvdh0z(Y!lT09W$jhUo$VI%!O(OsEK{lyC8WXbI`Bov+YVV>
z6y6G7rxU;b0RBvU<OQQVLMguyguICVk8g@4&75ZQQZH`;z`r@NW3eO*9mo1&q^(CQ
zJLdA?mQE_Zce0lG{&}BpxJBJl!@bE#+_ZOejC`ahq{q2w??h#Pl4aQ#%lqm~t1<nE
zZ#reNd~D;gQP1>~lfXv}qZrW|3V0fV8Zo261H)=)G1}0q$bITo!H66hM#TL0%)VZj
zx_WN<KQ5yqi#}T%<t%VExN2}w(5vt`Q}BV)I1kz*zrp0+xTU_x%cYSBg;m~FUhsF@
zljc^^l*;~@v*PD|Z6cbR=Zd8Yrb5Chw*)Oqc~mUj7k3v7wi3xtc_%%)DraUhn;H?H
zaVMU87t-E;&T0IeU(eb}-c(3aKt3_Gr|<{}WxH$XKC(s2H+Vrs-+=It8F;-h9#<>I
zY&0f{8EAd0>NGmIIj(;*Lmd9m94ZzW#lp&@IsTaNtI<{&T4mtWp)gD>?g*ZF>WejA
zG*?)dh8r*JJ7_ltq4NP^x!LkHKYP*Ai4QJ@XoC@U24W>dLJfeWLRTmfZ7w5TIB`KZ
z!(pA%0KWj^_Vd6U>oRpwh<2Z?Ai?$f8QUvBM=W%{WjkyT*el;O6Uo4%J^DM|5VXd_
z^hAGH5zp?uko>xUyQ>Qaf__5Sdl)<Q*y*V%f`=~WaTfbiu7kM*vN1O6Oc1dq18C56
ztnMYM14<Gl^(S#+IFPl1>oN`T<F;}}L=m%43x8XX`;16eU=G^KNMV_(6FT1?IljzY
zN1J{#BRl`lxxx13;yZEenUZABKCN+-AbQP8)D@BZujL=c3a|MQ>Rae>)5Z*1;hdSx
zh2E;FHq85ql#VIETShw?rp!-5j%q5IAQ~+@Ftx=`Nx)xhhul#T<Yl5%{)WA5xG2=3
z43v<URQp;;0nvJC1)6@}$c1Q)<$MJ~Z)}cC*fyWn9meAUPpgLYHXQLn!rHzuYj}2b
zO>Lm+oa~$B=PNn`JY_#i?rV{+d>wZ-evV18yYWnnxU=bu7$#P`if`rT4jH4W?I@=_
z|4)cBS!zE)c}JCQAjuWN?6(kva*<IvrgAH}CMu&Z-H+&c*arf3>}K^O<AbdEaihg<
z1sX!BS}yTXu^b*=FUU@{dnt6`&a`h@qfiO_9q0MQjt9Y1?!)eXUO)I||Dj-==x=^D
zl<?U|Tfdagp99+`)T{5^IQ`brPhVD-iWK3A-LKE~gMm*4!F`SU7yy#ma6Gxq%gK-X
zlTVLS&6~;0bA4N(o8~qWM5H{r<6=!|pj~|oC*GtJbwh0Z7I~bv9403lVjt%r3Q!K}
zHVh15_-cll18OO9<p&@e=d@bkyKBoyfWd_hsCK@7F!#^+sbhNBsROW0R?Zej*HLr0
zuH1^8+#a_xcm~&;`nKp_BhybGeiyohx5U|qFgoIt1{ZEIYz{H+4r-Cq3kb0OY$LTv
zfqwwE<O;gc73;-LyT*7HrfFRQHdKpCIQp4m|EXX*MfD^=%F|9MtlN=74Cwxju;Yw%
zEUV=)g?QdEWcEX#K+5d5pWyV*RhBf|7deC{8kw-o1aS#LzT6JPrH0?h@Fc@q9p5})
z7|Ap+B_oE)u<2<kP{U3tOxEf&*aWuYAw^XW?dsT0Igs;U9uh4h<4ICVL{${Vyy1U*
z+Wv}feurPGw^n*;Pe{e_wn{F4dW{l{4u1JYMNbxmAmLtobF-3z3_ysnjDMB8aAoit
zTl*m6`bmvwqE7L1CUrYOPRmT2%+C@D>ioairgU;^q6+UF=W6|*a^U_#>e~jQo=Lf(
zNGPl%JnWXjBZpx3LGJi?A5WWI)rp&SB_D0$A;axy0$lq1h?8tdOk!)$t4ge}&jy@p
zUGv6<zaC6C=?dRAEHAh!2Tqqj?FjGB8Wl|H03WXX#tp&1M3}hGnLOQKBS#g-FmaRH
z3iMm$WYkSTcvJ@+$}|Trvm@G`;kU(c=`6Qk<5{ire~O-qVUB2o1ed@>g?^fgt}L@h
z=}7sWsB$t_4XZ<#i$Z$!WPt*IDOt@k$)@qBY4UJf{C8&Uc|B!;h3Xhp5q$<-N)QqK
z<neg!Rd|-RDHhl>R({6Z+oD+$*m6@qy`jco4y5Uik|xd35M%A@3McNl%$d>EM1@)i
z;`c9BM1tL;R_w*o8~FammHIP=UttPc4INW$Qa6qYg#tXIhQV;PL&KQKIymb5k>QE9
zq7rt*B;~%IiQaaJj+S&(SlX@&t_k#pu(uStIM8O+Q?Zea`p3+!r~{oZf7u}tDk(pH
zSpl`)%=6UCC2`(o5bmqCg$7{!lyqMTDblRUM{V6(RaEl{We7=^b3QWIRn#$n4ieH}
zr^?eRyN}yakN8eq6`PYu^1tiHe!o<|ad>@u)DtCX4PQa@+i2ND9;-=4QISa?j4tg=
z^(IEQNVc@JoYOi1Gpn}X=|4D?VQ-_U8#tH{-6VrB7hD&v<)m<i+DvbGRtqPW?e&C0
zMDLcTmRbN9Jsr2aq*|l@*ERzK>96aKdqrafIKr$ZN0Syv|ErR1rfVXT?{8X;Qc@l1
zHBn^q!f;kHQAfjWVjn5UY_f^B8%9zlFk|VC|5#+!w-Ao()AAn4gzir~{Z!7<9tXB@
zj_&kL9pOD?1Fe@;vsm&|-|o#F4^;6JN&bHkTe}0Itp)qy(Z9_kMq9I-bT|VCqsT*_
z3YVTo*2GQN_I%7S(1Q7vCV%a?rIp+D63wHLJJ252x}mjaR$Bf|q@E!MmT0wJ1HHue
zz%wdI%nWNH7WZHiSilWZgvo`mzbc)~mMi-sLTJRsQ@U_JXMqSzfqmI48F`pEJEo7E
zq^AMo`hhL4CXFThZ(9+lXh?1vIAtolamHDqJwrFQkBVa1=MXjIQf!K@W}jII=nhp<
z12*1FT@fwbb4^l-*y?I7fn#LK2}cS8mS2nupJy3wDD9Kh3C<NT**Z9%mc#8)qLo#9
zy<xkK<j_A_R+djiqPcv2>8jPjucG08_r=%6<g0tiiiB|(ryeYff;46ka;%>}bZV{b
z+Mwgy4i~+{wCBuNqOM#j;>6VxrDCfQ?eW3(orO4=icd+Km`4hZjJD5>&*4+nEl*X;
zb_->%r8@)1*m@~_dEzXawXns=r6Dm#=>XO1DX#$Q_wf|gj2o)gM^Zo<cIKp970y#_
zs&X^+!gXH<@S_)PkW@dqjIm(}VR01Um$yfqXK;ha<7`Bzmn~zDyUyB$<)*2N)8gns
z&#8g0RfG2<Z6rc~k=`b8&*ikGoszyC+PwoNAtRHzJ=J})_lUqFWzTY1!h}6QJl0vN
zBXL+pTCgjn%Z0s_73^8(b)cSdB$n4kuOO3%?WwPl&d`izMlIJYuet&N6&5+HxqOeK
zj>d;5A90z78yE0Lmf!znq4feLU8T)d#fq5-JLrdrU|51_%Z?q&>G7Lwni^hoPLE3<
z(!o{}wGH2ZqH5aD(7<08@sv`>t!C$H@*ay;pCfu;<f{Ms-oft$U{ZojY{(rJL=&S;
z0mt8snHO?=0DFs8I)I<#=zM17fGFj1hEI8>A3)v4(asNo%ojW((KDMwrOZV?Cir<0
zmrU!wNpFfv=($9F(tS~w4uLIQ)O!^fHiMur-y_%2@`Ks~VuVK&|6ZT&3muVR0?&{9
zQJX^|GY$BQ?yN`Uc*9-bnDP(h8rt}-)+8x<^u?CMP$rBSO{ZP=M7x-G8*}TvqZql(
zUtSQ$>H*6-G!n`H9A<=w_KRa(j;`=y>rtLv@A7f+WPiv%7<j2{)ze1}0;CJ=cWBoB
zzUxbO(K#|tFXIgbIVvgXh@z3^5?|ye<|NjPWePU*QM<WLVuM*cmMsEM+cz?n!24Tm
zwnPa@o|{a;N#j?=ABNQ!$$blO3{lE^0V{B{t|h%o@QFe~l&WS&Y)AK4M(<akJL$|+
zwtF&z>dT~}-E@nm=BPP}>?cH>kajV;g?WOUV({RwapB@(kcZa2hJ>CHXS+%bjBWV1
zw2%8IAq0UyI23=eG%#DM^7!>_mtJ>pHfPT8z)5r{&8&J<<!ABna|gj#MJS%lrK&_a
z+3#<Limr{(_2)M`Hw_z(33+|K194QWTr#O!_=a5VFNl%>KdUQve)?pxIKr8w&~;|s
zY?0*-j>gTHn|6jw*Tw<HR)=LRKT%J?_hDs^+-rFEk8OrE@70jwn$T^2FINB}nBiYU
z8N#AYyhkQ1a?`9~CbjJ5SZ2EBGKH<gO(+}nb9*m;&|_dBwdD^lqYZv@A9+W7AHC4t
za7%21rFy!53Fq!OTe>fR|4}b~3%jHsN3N@Cp(HcMLqqtgD~C1k##@%;GCJ(8$7V~e
z&+*innL2Y+7Bh7Pt*^3A^i>he5xXyrDrO?Bo?#Ou630d*zRvVYMm-Srq(of()ear8
zxZ87`z+BG-#z<Q$s$Jz)w5!VJ)zM5mUaB(wBSv8jVpCWMQT`guLv|BAL>swOoAXpx
z5&eDjVWZEGib#>B{vonjc~vju|NHZkplT6&95(($n^z6L_9velGnNVNQb=Gx+vnMV
zvPV+opB7t1%qyM9eG^^fXixwqIdRnwho5cvOHSY{5kzDnV=BRS$(}(**DEwoD9~)V
z|23$J6ZKv%Ru-|sm&hHkxk9d&?CuJ=HNyjtu8i}Vvy<^;OLKf$$C_<O?n*e={KD6%
zG?Yay_L`^K;A);T^B8ibmPA$_;Tjic0-qbc9md|^ejXIp=2aPJmii@L6B^ranBn?m
zPxrx|&f63<>|tq$78PA-?>)NIhr3%3BWM^%2WD_Pep$3t|I3}nG^dGUS(nBOm;9fN
zMGzZICP}iW^84IEdwP!!cW*;ML)(x`!8X46nkuV`dhDyBRtfUR>pODktVU_z{K(>+
z?<j1nlWDwJ(8|hK6{5M_*!?D9TByqhrx?xGj70DZMX%Ynn$igWsD0^I!Vh=Bb29+b
zvlbrn%h#k<`T2dFmfB`5Gnrg}W`B392rl%LU`h5KMFlO~Z17c=7J11OD6MEyImG$n
z+cW_-I!}qDQw<i}=cXc<^J9NVQ_cS6+k~;#`^auRW$s|=6yidlUO^P5IqC)Plpq^2
zn4u*&fBkkxWLY-aHFjNe@XYw7Z3|mS`25RYIjy!MUA<NzFJ$`qGzxaqIw%KqAx+sb
zYixH~STTKOOo00aP4&MjM>PyguQ;;#fs^0?5<SV#&r2=J`(#!h2;rj?3D0A+>tU#W
z>f)6F{wew=+ZSLqez`_<h=yeu3*G!|QSC@B)G-mh6Z!wEN-UIn6*R>!yjuPzOU4uD
zTM28_u{5yrYW1DYmb$kcUfET(cY2PFe|cu}eWSau-6yXRx*(y+I^<~};y3aw<VCEu
z+Q5?QYx(V@N*BWS7NJ@}etso^rgLsu7u3<LHtq2p@Nla{r2oUSljt3xS7xG*t=@_;
zs2?TL)fA^HgKt;5GbRrQr!`HQv1pve&liAOrwCk06RqL{+WC^?f-)0bjqx1{8TJe#
zlgT9iAKyPd1mUeuA*+)8tDRuGz2-dCt|V@H!~=<H%G!cBrklwSm6|q8qmO>6;kO#`
zo<BJ7ePC-v#AvPWQ<oCpt!gz`&1i}S_dlmrv0uoz3FQlDi7EnJVg&Ilioe5p)8{Ay
zJj7BR-+?|D6Wmy_afEJ;#`{K_Dg?j2fXEMAbqD$HDJ}YI?Z&3-N=Yhs7cL`n=Bz@q
zPED1QpM@V6Qfl&xB9v?9br{0zRQoJ6B^<ZkD)`e2qXhrB2WkK-LJ&usI{yJSj#kr|
zOXlX+uO3b)rFXSu>WN8OU$--*EjH1f3T_((e>evLoJSH85{4G$=E(Io`5}D}6*@_Z
zlGWx{pzo+HnGr>O1ZFw(ZgxHgHDlxC_!)9Z{y$)9nD(a|pkfdpW#|YnH4e=6vs#^K
zp&b4}G^E(SV!QsAHno+I&Py{HFVxYoo9kkTn>1|q@VIsjHm)?y9%+cuc2(KB_!dHR
z;dQoeAfp^_sMX+-0GZjJN>uaXZr;3!Kc`iHX8RB8Z8VX0^|Eu>pe*-fTgX7{X#o&Q
zdb)oU<J#;<o4S!!y^A@-o+`<uL^17=<DCXtYcclJGJYJOjv}%=rZ)a=Pbh(TnyZk0
zyf^s$OJihWiq6G1)r0{w>O0%fVp=ZEtiED5@rvpFLHcM3(v*=|?xEv5SUa4|V_km@
zN|E!Xtw)Vcr;BguEAwo+t<#rX$9(1ue)rwaO6a?<N~rlydq%aMYfNwEz%9$F680J(
z(Kc<5Thr3lx>O7NIT=LDzuD@$=DIL3o6@49YrS*hJ<Fni)LOAkW2q2Pds*h*v*ghY
zdG2t{avQ|gT+2LJggG=a2f(P^`Ehb!{|1}+2g-qM5rygAkALxdUwb3kl-^SlB9JqH
zwV)Y1KV>g2r?XgwtM=~|yvaCOZlFa!(@jH`>6?)CVPy15^>c7#P~S{iIh7CLQc(11
zIGMst1_^=;sD9y!)dq_bnyMvJRUI2|wUjMLyXr+R5EJ*P@n2SGCGrL0aOTk-%QB_W
zfZ%lMoR5|V6KOBA94?pX@?CIm>O)4mL*#T_Yi`yB=?3%+(<g*e?h4ae5pZk+JbuI6
zE%#|I4M9~2w1j}K0`=Y1n(9ES*of;;4Fu6+8|C*sNy@+w)A;}7$QDGwQaKX@;XH3Q
z2yTva2Dfx7nkM*P?4~#w!P2<pI8OI(J0&Rti>IYKoy31@b}Zh?yRm>W$L^sx(P1)?
zXZ;oe9~^9?a#NWj*WPz*P^z%aUUHMf`L^AwvsKY`O{d&D*A9uWxNhD4PFgm<Abi<#
zdVq0ubxLYqs(GyCdr2|UeTSnN<wrjT>1ZTqJ>k*%!$*xYg6nPM3i$knkRB)hiK8JF
zbW(sotFLmDc++T%S?b#9ju;8Lb8wWD24dBa4~?dxOH;YNh}G@iARaIkrXXAtDhWHS
zm;WQO0}mCxy7qr<uS^tmhoJaTGc;?#nL*1{BK6tGSc{TNLO=4s2J+!fIIooVc(>!F
z`!QXQOjKPsSlvUu=!>s1GV~LnklzkWhB`nIjfLrL3(?r+pa(urZuA!Ox;-lR_U%z#
z@e?zl4Th+@j%nhh6U(6l(PW}GMDjtDM;=2nJL0AAx+R_{W&};u2xYpiw7Yn}`VVRP
z{;dARx5#%CdVV2Mi5{_DV@*$4IzxMM`9IDL6=y9CyVS-}cU+Ox&*5g4-d8YH&Lxxw
zo+EUKr0}&z9@~A!^F`KMO$v2neBq^}tZ4NpMtre^Fy?72k`5DM<kJu%ClRXqef+Jh
zg|$Ql`(d}f;?fpNq|8tYVksCCZIo6OOT?Q@rmsZ8LSsA5F-{zYa39Y2HIUh@6>H?W
zAx?&dXF<P;lH$;xV7x<>mHcXO7c#4b3!3qU2|@+NJx(#F`$`t-7n#eHn~H6h*uHOE
z)bS%;dZZA>HhhKu-2GzEzxk38leaulR>NV#|MeM4y)68WLrtCG?<mU!fezf7@Rg&o
zN8bfXf{(QWqyPJHlNKYB<vgfm#SCC%aFQ6CR*blxsx!1Cd1FatKLUqLRA>pnp54RQ
zpUnod#)p>@{Qngii-gjY?Z%~veWuhB{s?Mf+=^^fPMu0HA}(2QABNk|(Gj{jBi#P)
zROw_LWAH}Na#?6IycnVW$mZz<6j7#ByqXIC>>c-gWo%$D6NBfu?_BVH474g>nyCz$
z3s~rK5bh7Hb_znccU_GAPS>ZeL<y&cBs_noT^Fs+!TaIMeZhJWqLQ_M%>DIWpVelV
zB#v4idJW>G;B17E$Rwo#9dj8A!(-@!2Yf36hp!5|R@qPaPS8<ZYJWKQR?gq+Ft*(<
zA8b`xsZI<<d^Ud-HUP}JZ)^%0-rX!5;JnD3LC#ZsR-BHz(s|apmtq%#A$ZX3GARPG
z;nUuF>Ha(7U!R@~<nTiSkil>X)$pL$MMcBVpP(69r*9WwHw{Fd(g6^#Sl|%-!dOC=
zhZAt(bev3dp|(ic1#NdxEDWGKW~6-~x)Riglm;s)>`GO+BDb$}AOK>k*k*vKU-i3o
zyRyMVxlk!Dt#rM}I48Dxnjf*^a#nYILX6i7?RfscnqLtHP<mUun#XJE7qWm|{Fv{+
zP2=#lG^5z(`O=&!JohdqTA?}ZLhsYnZ`|>2Bk;zksAmLtBJcRXM7(HBaqeHafw05|
z@I(c(<!m$wZJe=O*k?kuT`A2(nLNh5<FfpdD%+&f1VJunUs>fn<Uf!C9#-l9@!*+~
z&ln%rN-yg;GO+m@Op;Ht<H37!Vgy5%i9>&(*Qh;3F1VAHyy|1*&`yO~c-1GkI-xnL
zq1^ub1D&fV2WfQ!h>YE9cwq>41iXlj?<lnM+K;Lp1&)cLPZ-CZAd)T^D#DMSm(61@
zsW$Yy5;Y>uzA$p1<_ebaneq;AtnCG(mUVUiPzlFw#a^q_^gP77;X>H9fOe>BHm(g)
z^V}gd4{JoWMl5?vRz49X&Xsw3c0es(4D;?^5|Ue6vFb)UMc|`~;Oj00O=uwo=?E+f
zVF%dQrqrhp)9YYFqMr*6CfGZk$L|AHFoUrLEsBcvr+D1G;#Z-}%F=nkJFd<h;+;YN
zg4uU@rUdyqv8v;-BJcQ97^C29vo<(Z;p=qc4+msg!?m^p0WX2IP!*hXTy$?#dvN`9
z8fEg@_*gZZlA7QbF&X9|;$gtGCq?CGMb}~S#U#}fC%X=!`6iMeM{@g0L0Q8@#J*KG
zVO>DRb2k}@A|9C9PgNOOo)>AZm*5rIZl6NlL>lX_L7(FGudn+N_;VW=HW1jEX!~@P
z+qY}j-$d68cZpivz2d9YHbPOd*8>THL{4L7SEt%yfM|rZC5nB2FO5AhR=8L9P{(gv
z5C4PVl#n-p^aj0N>hU;Q%As`PD(wYJ?QvWmrj%zTzeHHxJHJf9v-`bR+|*ju&c?V&
z>D|vYUVW6`_4r$bjB`Ev{~F?~DJlB-((6z6FP_QhaTm;nmf+Ijax5oK2xj|7E>>mr
z7E9k$+V6Ja#_qrV9=^8Y+Y?F({%#6U`@7;4Eu*s9mJT5H`9EYPJ~^Glx;xAbObeJz
z_SE5X++P$U9iKwTTT}iWUpDd7>6}*3uEraU)P1jqyq!B=l`)#I57_06?~hd<z}W5~
zQpH#8OvUYA?aX7!0me`PT|>PwW4%xO?tmaJKT=<(=oKmtLi=Wt<aPgcFy4!--f(Jr
zUO-LF-#>3~-qFRMqK+P<52uBRiEoOOlf@;<_uxG(w2tZ=?KMof_XJ035RWcYlnZv7
zs?(dmb+%gTAN0TOFk}#rUE;btceuT2)5cb(=#09IM1Qb>f1(ug6AI>ZzC*vHZQWNy
z4HMXSLmsgq>1?lb>);OWrqCV?*2$|YbRC#<fJ=`lTf`3*%CmPZ2;_}ltPo~jU2U1k
zywxGMcSqBo35kYjPd?`0<JJ%J_&aw7#Z88cyt0k43TX6^vo7~=w@h!s`Ojz9H$}Nw
zloN#fMknjJ#algH`}AdN@NNN>M~wqH0lG+u;Lk`Y@n$3^+QS9vkSYGkeZ9eTG8XMD
zMnY7MNc1C2Gv795)OgQSWo8|dBR_fOV8Y-|ee3dh6g>)6Qi&VfrEdsl!ZeQkqCa6&
zjDK=cv~)w<AGdZl>ihdbHP&M{3=1ir2_1*lit6~Uf*t1H>cs@BHtNMnyQuI=OwI(w
z49@KisyPTJ7FaR;HQ^NxE${B`V!Wrt#{~b@Sg+s5y7xQUv12qMeut1Bl>;Ypno$L-
zl>6F8+xDV2t+Zn|JPe8tG+xp7a6c%BgNN7Lb7=n!4X<OWkb2da6iceC@=97p(I7+X
z@1?=dk4wLY{sfI5{#DaHOmC5|r17sh_{BsJJCl=}b<`Ud^gWE=)V@6bZ_uaStUBCC
zLJzlYSS{_Z=+52r*oK9so4g=mna1SzD;Cr7e<Nt>(Mr4O@mu3II2gLPx^WEdKG=9q
z-gTueSYX%hdv9vDoC#V_Qe93ORE0CzSMWC5k9qhVROs46)<4zDdDv?rd0Dh${T-3)
z6Fv9MPXApCCt@s<n{j3#3*+*)q?&OlgLw2<c}`h7Wb9!urvm+BZ2p+$=@Y6~>gXQx
zL}#^829U7x`GGuL?)RHS-IREKzU@nYF>wiS#9E1b{kh?^_`y`hsGOnq%w;s3jger)
z!b-uV4a%)fz-)G)*jrR@@I_}J!spCf(L^iXUojufTP;^9&*M-35u+ucjQ0M`nn@!#
zhLwJ1`dC<HhP-R+*!b`NMo088=k7limaCJwe<IOvNI+TX-HT)Y)jR$_WckXYjr(E@
zBt(JCtE{UrM(T+RdGg{43l1?GBt-rjoY;BxWsG#5g;v&oc3?2;h}7k6=PoM!CYs1M
za$kc2n4brp$S21J6Gz}O%&~^2nvK_D;^j3=R?4zJtZtU?!cqKPHXp}ezAwobUMNJ5
z-hvilpF1M@;mdzQKE&$7SvC(Gg6b?p;}4yn>}&i;NfS-bxp5(V=gr5WtG_P0IO4^a
z#78GFv;RV@MJB!P%jG<sMJo{(|2(}gi47_ulu&%Iu{)`>Td)(oJ#^jS^S)o+D*BC%
zs_Dva9`0kv8qj`g{Hf}<KQWk}ZBM3tMzkKq7CrbGIsY_JtUbM3v|@Adtk3o7Oiq41
zeM9u*hcz~Ywq#21b&IwGRnL%se&ygve!R`>uz~c^^R`J7UTy0n*)ehzhxEOB5393r
z$Xv~zTl}Ka7aG%>-kcw5_%~~Iy4=w%7^%ArN1h7sKg;~8?=37v$_LkBpB9d6#q~dm
zga;^Kb>hghx#6dRah<s6B;k|AQQhT^F}WV>wMP?0pO_nbKJJQF(D#5MkpZlrrQ-L$
z_YO=A+Mm*cS@3T*W%_vLguyUTCk)yfQJFna|5yG~^-nL}V~^&E&aEMXWEx)h3fUR$
z5Exihd#HDyF35j))P|~|?>+J+<8D-xL`rVZ-J^@@dmfz8kI|D0IiwdQz30g0(z(c}
zE36T7bQ;2VW6hnOQ%|g-qlfrq!T2DLCH}B{<KUpf>C>mbHw2qW@$X7hrSosBh?R!}
z=t6troTcSSQ=m<MAR$ic#l-Hko)9~__$Ct_#cF#fE-fwBG`~bW)iAPM>?Kc9=Eg#R
zVxvRMFQ>#lp4Rdo`?ux^>~=Xh`uzNL=*ipGRIP}pH)k~&X_;A0n{?vX!}gUmw{PDz
zFfjO8CKEePfs_MlG|D#Ov|?g}MxmhaF(hYW<V0V*tFD0YQGRH>PniB0#%SJppDcMj
zsnFN@j@z4MQ<I$!Vw3!Ouda%kBRZooi*_+Ru~zBNovXp{`ZGXCU%b|~+4ffhg@p)t
z8rJv6hvcL82is)=E#dqqEqyiLk?}S1jRKLdYCxG0Z$vd2VXTM@50Y`pmzE~;g-@KU
zxC@V-)t(T%rs3eU)|_*)?~*gZwD55kIn`mjhPg@0rFVmM#xa9F>B3p8q3%HQ$x}|>
zBvlXT*3_6RKh-?kI4L3X=d&LMKixb+*?{NlX-V=_Qy0+G`SaUS4!7qXy6WHYalH?P
z=T>@XWMs@LD(4U~GUBEzOgs=fxS*eQ9y+cP|MQBY7<xi`e?yJOVmO?ctpfD5Hv-4$
z`N`_cN^5>vJz-9uzogN)4NhI=KXZr~jk)VLGCux?w^t15;*4q`Cc@!tOpoX|zlQ#M
znkdCPlyD)4r5fviN96`A)}>Dso-Rv0NObU&DI&NhF7aTU#K}GS0n3>^K3t<TuQP3S
z-}}nz_XTn%7jqtkVL~QL<dI9h|N5SiKOB&GFzr%Ui(Zr~{jJwn<r`1I^*Jk|b<*H2
zzmBtBJJ9FDXSv7=qZF#ECx%$Yxa-4do1KqP+H0VxMk9IG!m<0j5>A2s90C&-*K6*J
z2|ZP!-smLiG6v@&-)JI>sNF{uj?F)Pyt|JBqeRep?d5G};51Si&i6-ic~$*v@K4`_
zd&ls8k$H5kd{?DXqiV#a6a7{F8{Sh8721X42F@LBm5t2W{L0fon_9blh;__kQNIWb
z4tLF5-F8tUauNwx?=<8#yPR>~o>i-n`jR%6A-%8LBG-oAR^I!Xob!M;^l5QfLsPxo
zVPd34&*{cOPs||Y)Gg5v9}X<-ZPZohx<44T-p4i8D)n`z7o50`m4s+9=1rK6Nl4z)
zoXYau3$Y+j(e}nfqcKfh%CUg!=4Ir(qjI1RN$#NYDDwkibIMZM753+1nB3X|1+sZ%
zaRKEo|GP||XCrkuQcn2GIAkU*Sr$Aj`EBTRU{zHi>{Mg1rl4?kX=A9e7p7KG$|X&7
zR1o?mY<SF54LAl_NfC-JObM5?8x`(sYRkSYubcc@Tu`{@$cEWJ>*S%3aOW0hD_bAJ
zUa^e^@&Of%%*4E(TdY{N9w9MKS>E$q1$p;fnup*(H^U*;Pmy=j(~<@oh@I(Yit$mE
zSM(tRa>*=4N@{E&MPBmp#S^o-Qq8IN22U|Ym3LK=>&EuQr2Orm7qi@B>tP(TkJP#R
zw}V?$WxqVloVw(=cbB6N0;g|niIFy(ez4wW^x^`NC@(JG)oD9dVnUddHY}#qN&lRc
zGDyF;kRb9d9xl6)b+!kb*=tjNCZ;F3x#mFQG<tIHr68~lLuF?(<mKp3kdsqF$G7uA
zt)e*}QK~Nf{Z3GfL$=ADsl@af&C<P2JKT}Ow%PoD$9E$v*EvGgjpk-Nt?s^KlF^!D
ztX%4(=oCi~o>du~Cf+Yea9Rpycg&(S92dKeE2ZDDJMqlHKHG^glQaI|G0eXQYo&ea
z^~<s@Uh)lzp{u`}iH?EOmK^rpDry<B&`*nZI29wldm(2%MfbrOFM4^>*upIhGv-X3
zym-q21n&~lX+|dNPqSbW>H2ADXTH0bSuXrjKAmK}9Bt9b9W%&!%J$JP+hIbNqrWcu
z)d!)x&eLBy{2)w9C+UoHo0WC)nFC{e@{?Cp@Q!;Yn?m%}6t=mm1YO>{%QQM`8ZV-H
zV~S>b@54FW@w*m0V!K#>cwdO=iLrX}3Oz_UbfSc|YB&^yx*)^lP7y(luN$+Z$kK_P
zUi4S5(uR5_`ltu>m2?Dm+Wba43`=93F5?d#);UBW^zs|es#|Nk1>eNG(_K7&f4tKf
zwtIyGYn_yOE0;2hIp%66Z-M<{jr*Q#L6uAm-DK|z#TK^$L?=ljWzc<p&A1u6CdT1P
z1V#Bwv0}?vyPET<7HKbOOFQ*-ET}b<#<ZRK{t8{~4jx_kqYX*TO1iC;k7ELqNU>Jd
z)TPU@+BWwFyTBh9_>d-dcKQ>CONkAxtQ+evsd+LiM-tG7IPzruECWtMtaOsS$H~1}
zr_d8sZCsEdc0|n4UmK%L&Lj*M7iz|v+=<;S)hx1nFa=%lFKtf#5o4;~T43$zaZvC`
z-l(8eXqklUM_~X_yK_G1n2^KC?4qAoi<vDBymE6@znv1D;IgAK^F?J3G1~ET?9==g
z+BQ8On5FuyWNY2G4s(9`hWbcxRwJ`OU&o57^Ul^o^TFCNLxa(ECtEgEB^zzNkm;TA
z_~I)cJ8l)zcH+J~8DNZkkr6?CF@vv72yjBmM1XTlv<aDPFfF&yk@tAob>ZsXD<^#d
zPR1--Q9Wh_&L{WYJQd5h%W_u{gylWeRY+PnqTm?$NW$P>Cf^4nAu<Nj)AHm$hFrI}
zN&;nPwKZd@YdJ>eX3}NWV@9s5j_8EQr5xF~#aWo_tP3N_Aw@fu?XG+Z<NEtG?Ql+V
zbBIQxkv!^7?xrAV4m%z^$~Zl7);lDI;cPYSb2RICfyCzh>7dH}RT}vm?(K7PNN`|G
z`q_gFhlvz<PqH;lEpkJ^(ytGu)5r=7ZR>rO4>#I8_I}qtv~f<_FiUadj~L|4^o{jF
zHAfq>P3{!*b-}c7tTY-^ovlp#PVA+r&*gYohyssL{Kp|C*)k!>n>&>1ytuHKvuj}i
zwW|*__LaT;>|4|#pU}NNn;G~*JF+!JG<x$NMdLO9V_<*lc)rdhFTV&M<U+_HiiUn3
zj5PI3onhv04<CDPeV<I~?2&5TC=XWt1O1v_2YP*;^tab@8=0Se-Ym0!tBaq9>2}Ev
zKPUt^a`{r{=7PQU4rvS8D=OG|dH2_3X)fPhPeGDnQ{rD|+@`y#@Lcr?m4U)%^5XOZ
z<!X)9q|S6hZ}%|m^w`12CY!<*t->lz_0=9<bSzbEL6k)!D7v1O2B)ZvCN*noHBMs5
z<UhQ7RvaUAB%#}VP&TFF6)8?Wqgq+Crp?cb250NRa`y7@;kF^o_vDpbz37lx+QLj4
zTr~Oqa?*oeg%|c-QPoOn?oAx5*Y7|Da^d~KKKU@`r4~cI4dF=-*0<#RC)Z+I>lSqT
zd6;yUs5Op~I<?TTsmCt*f*3meLYsbWx{Jd#QdkHM>zaIgG2GW3U7QOyP44_1CBMLs
z7aLB{LVj&@jWu|DQHhaj_3@brK`0i(?6nnHdJp5z<&@He%g4Aw_Ibgr!Ac793+*N~
zr>C;yEqj1ZzS@4_5*#Ug$05!7tUmS8iPdoVqZP^lb^LtH{{5|l;un>!unFgKF3!Kb
z(<vW-i(#A__Go$HjbwsfO;CAIoalaTxa|M2_1y7L|NkE<l~4)U4WX=*J=-NBd#{wU
z_vRcGmHCOXx3b5{-YX>BQJu{t<8;PZ=i(f{*P+k%`};k9uRo0Uc)gyl*ZaAjuh;X*
zUsL1@%WWB3d3U73@J_k^fJfQz_vqyK>1jT<r08u>6hWirJ5x-3l`px@#&~QkgIDiT
z4S&~N`dQPr(@xQxs;kd=r6l9YfQ!5?R$g5?;wGx<Y7pJUi&wrT(K(jLtEXFne>g>*
zU!ly9vq=J{egOYXPX&c0D}nf2t?8(-f4G{BBh1Ha6ZZWElu4#5{g6v<+@B&PJ0j)M
zK8^;eNk4|wRCSG|mYZH(&k;t#K5SWA*+pwc2gx@&=cHmDy82!@EEzGDFx{JXhAb|q
zU(46EB`z|g9DOmbp6Au~YIwX=Y3S>af~W+(GE~75>2XX=+Lu!5Orm)FX#8{-dR~fe
z^Tvx|(MvwQ(W6?I4<~kq#ef<$TL9ldRQ~e&%-m95GnLihBYt27#<VAt(rm9*U3ibV
zP14-_GZzz`p*fJ|c{7&2#NIBBNnJ*;J4COdq7%oI8lT`=Q=||A*DLDoQkSnPQaC~z
z_l#`A`qUiJppH(hpWHrCVmvy)&0nZ=k%mU`*$FV~#}&f8VN+1n3<@tU)>bt0g(bqd
zz4Lsn&CSi#`_Hp<dATmwomT<wE-z-TC#QO*hf3`7znlx3PStMQL3{w|);S-#4(^ai
zIbq08eMgQQ@r1{9&(MY;5BPyQGeDmkO8E_#1m#b46gwSQ;Bc4Y6f3uR>V1r=WWuHz
zp})t(hJ2$g&B<kn(Y4S%`z<NjIQrpD)v~rrn3QRJba)j4+nMjDIP%of=t{6uZ{w*Y
zYn#V15saO3sTVS{+EsdIK^0t|-uWIvCEU!c!SroMyFydyv;;s37Z=owvSY4k6W@E{
zu5q#Q$LhIQ@f{eztCEK^R~xJNe4bMDu7EsW*!}1v_5~kPP<8nTM^Aa7_LXPjT{%?^
zD4a)5c|&KY4nO$$X-2Tj-pB9K9hw)n=~fjD{C<U067_3lrz-(t0L6)~!+9Ql4Bz>r
z9Xf{nB+})Sqsh6O!RuswmDIwEH^~hgpH4ve&-Ql@vLslF8GE30lxNnkDqqV|358j4
zMAih$x8sKHfx)_D@}C`?Wmh}_`i1N6tp16z00)&7ONaEo4vD@j&z#lkUS&<Q6t|o{
z&KB<l_7Wt3M4l8d9QKJ7A+8WRJt~Zpypox)7{V!-WMgF+=GK%jt-ku_Nvdxpua5!2
z*DYpvR|iG{UZw~>K&=Y>=8m3~7awiN%Z@H^K%#P9&(-6mTKL>pu|uS}6#ChL53bVI
z(e)Q8V)O0v$Gq)-_Bh8f`CiPnQA`3n%yr@1dyoUuzA1x^0t;w?rcx<SdAlx`4N#0_
z6_Z6W@?Rgz{e8p!uB<*x{Cf0sjPTMXRv1aP1W0iQkR4MDCqT^&UY<u3k=DZNl(#fo
zX#QI%f2~R~AxZ68>{AnVP?SX7rf(J3oiH3`3AZGHq|d#`3m?-Kh8Ibu6hvgNzVse7
zYLYk|l(@T5s{OT>DxJre<CV=GaF81Xo_8r0tQlBC?#rMsC}@3N`~IUFb{iE}*NSji
z3A9?5H*MMljgtM;0caDvdfFvkk_qG+(V~1lMprJ~R*oj&$&LXl@Q)}5F_!grn$a=9
zJZKAvDGVh}-qKHadbeJbwH2owI#(|`>UE3ok@$=h5?%O)ICD#%8%`8@$Gqaj2ob8h
zt?Zazwo|EnywZs5e;%@)ZwJ!BUxDKf2&#ASp=(#+p3CT?y>w?l$YQR^-9vjfxAwLY
zgYQ2ldOvz>;Mc+~$Rh4$1vWytcpFBG@+T;-X7lnmT_x!OHObX1x`3m{;o)jM?{{Uz
z#HWA=G^3%sGXG5X^D<Wa<K+<D&oXP>bF+;OI~c}*cv)XP2T^&g#LwDsJ(TkAg)X@;
zhSHbYRhcx9z9H6~nKak6!6rlZaCr8;`@}O`8H4o~yXf=I)KE8TdfblgI<VIuHyHC2
zaswQI2FSodiC&hbBz{F5K~a!6Fx8_Mb7>Hk-=M$;<2wmSw><FS_124a)rB(LRA*CO
zE!Ad7Qpl^V%<P&6Cc!0TNBe8UDH+`pYr#DxV`Ue*n&5gRn6zoBqy@?WwQ*Z~f7lzE
zsRZe(rcYxxhxFV7xmPLx$Oo-Y2gjw|biONAjg|^B7fA0hz`Y1kXhE#MyP5vU@*49R
z9EiBjfO;3n=?HJq%oATrX5F5X8pRxg1m61>I5}mRF27KQTk1n`)BMqJ|BGEQloGz?
z(XSHgCsMT;E^s?ss{(NXO9!M$%(Tp-2_SHK1}lI&E;hVLbp|u!Bp~}m-v0_^MGw9*
z1fpPlKc(V2#lNGUh%79tY?!(Xgw!J^9}-8CPe+VoIA(X;fnW4<0M^)fcEW5cB5tDT
zq#ww#0GHYq*f#_xlD<kwr5d@Ptes$u9@A)O6zu9Y^lyMxNE6@krYV1nhZ?=8=>lx<
z)0Ow9Gkhmfo}TNHGxQ$?*q>hzv#kS+vrCqIT}hgkJGlg;yI10sT}`6%fal_%-C#^C
z0Puk*j#ru%o^sltcA@|SUyl~nXr_nsX&o$3(bk=Qs&ie9fQCAww_$W{c-7T9WnJFO
zRd4C$)II{Ly`?2YPXn|fHbL2=2!U;%8s{T13u>!S;ERb(c8%^F{Rm{${ssY2R<3<Z
z0>ChLc2Bk(n3iV__Ey?K$V;uf{LEa`>9mC^AOE2a?5Je^yHkMjme1&XAtj_3d*xuE
zEDiwe!*A&F{GA--cOShcUxKn`V#OYd%|{mcD8@dmKM-QOYyz?|7Bo!k7&qyz2fc|v
zjWEy4Z$J&3QnJl~ZzXy;rj&+>b52CgHZ{!vTnudY^6gz4A)TY#4!nC^+nw@0oEz#F
ztpZh0Qs}x7?JDLHX=Zb^W{G3h*ViVs1aAJT`O~XTyxe7F$E}SDt+qD7?9r~Z<~F0j
zh;Y1tgl@oe>Aa+Ruhal>fwPYIAtB*iW6jK$W@KsIVDG<ytQ%2sm%DI@2X5jUo&Occ
z0!PvsXlUVcA{Dd)qAIH|d81hVc^2@sONK+_tYB~11?cY3(5FQr-t;|hj?&8ZN=1S0
zqY5UdJ?d>so8`>6HwEhQ{zx0v@QO0M=&|ed9ws%$A`a5Om1$GmM-rIUhAo}V9|PV>
zUJ94B8<pGN5H)ACZ~jo0VZX&ZK6D6PtK#6It|>Fr2>h8=R?%fr#@^}TSDOZT3>u-E
zBa?o7G1G-wNF{{h_()}_pQpUEth}PX^W0~hd481QVk^z!!h2r3S58Snz+lcvbszXV
zoa12crv#bPB82+k#sPtYCKT!uAhU1I9E`p9EAXx+3%+^lIt4;=7j#|I0aCe#$6Y-_
zeTIEWlX6#f?{11I)B)PLzYz$g64yex?=@@+T~ww7T@cl{aS+jA+_w$RgvQ)F#Kc+K
zJs@ib^`LAk{3TmA3#^;_VW6}XXzToO8HcIQaE(8c?`j0@{}*6ejjxG=*kmQ|^}lRA
z<^YDWidmn<7NC|lEGbK%s+jlp>w?v!jKNi_zSu&5^0Hk40g&bk(wD#ouNe7ti!w;y
z-Pj}4%p9a2+{Q}prq?N91EJ?-z=UC8-2+1C${rAB$8#n?7hZc{=6abOL=NTz_U_&r
zhuWo7l<lv<kGhgPuiZU1im*N)AIeDoHup4N+QGDON)RF}%hUx``8OIDCrSZjNelmT
z%a@j7C}xh35<!^u?|O(HtOxcjZ;ZsAoAu+bg+y!=uZ;1Xy~tZS{D7_$uPav$7NWVG
zf#@zs)n4<rqtt{4vu(_dqXHj=TMo@_4p)oTq>=$)t#3G9^+JPD-Gfe=_B!F7Q!}zn
z1q?8QLez9~_5N_SN%G%yPug4eJ4@>~QYzN==52wlOUv`Z?9V&*|DAV^u*aT~(@;D?
zR&5~d*%tfj&my<SbuxX4*NK!h2Ca`65*l~@J2jL14HE^EF|AbPBVX72$6cdWOJP>C
zHK<bhD20&;L1nARMF|Y~Ar0L>G!S2{MKUlk8JSOkU<6=iPJ5ppUi<w)G)!47xnh8+
zU4iCB7pvno1{?cu&5wK=#KIl8MqM?d{hzH(2F-MbjOLFHH^Mp-`%4=HiK<2N*F2`a
zgnDi~j4twPBENLCdidQ7Z{mW_l2Ql3@Rp#K;M|kcfu`DiN@WsV?ti`A2hm^(44}m^
z9HFL#`#C7P4i{n-G{98$Lfn;%J!RF<r|#~XpR-<ES6*#X4?rS4>;{3u3mf~pm)|LA
zq;_LEMoo6R=aHTQ#piXccJa#%z(f=lw;%Z-6-dc%HWxH(7B_peMtZ3s3RdU3WF+j2
zj(^#s=Dk{l`vB|#!FYuF2s{kULQIZ*suTU9{j<&Zhz>vZW%?ex2cx>$`&fDgb^fkI
zaLJ&ow&7Rm<V-;}<(jBjrK@c(jwz}furVPHV?`5@-gmk}W@YC{R5y5JE_Q|f%RJA|
zZqBIwXUM;Q$)<0dBWXsv9sdF{MIufj3;z1&1YYi85%UrOV39BF1i<*cI*Gsx8hjj6
z`kslcuVJaAtg@6M-&r~~_pt|b8@zXy1Kcer^SnvnH$vfb^T6$Z*_*n)`vGei9H0;i
zD+L|QseVj!E~s8J-A8iB0Vx$EPXpFMN1?F3Y|ZEh2|F*=edIZ(L4km~Z*eKlC%`IN
zf`a+hZ86b>`340IsJ(IK&hGWXKEAk=i2caRvDZsT7;aC50x*wf?GYPW9a^q$r<FqG
z*6IzUxRK}koF{T`1opmh9G5j*gEEWq98(wdhQGJ>CdmnIGZTNv{Q<#=B=kfRr}C;f
zg=j&G7N7`Gt~t*v<$JaRA{6F!gToeYwxs^Ce$VUxb~}aranxeG>{8A2DPne$P0dxe
zcSPZUj-}(80n6be7AOquyyVTHOx>JY<l!~_e?QT?0|rY>k+oC*O-Z4;Sp)VyR2|4G
zbC$g&U>z@+XxShzG=q@aJ;HHXiYExPU`o)HqmR5)Sf-1I_(K96wf!)fYO5&}HVYaj
zh4*rj9MnIRSW(VG^a+aO`RtfSzoB;ByYC;hH~NJoshH{F#0r(@cgMd_L!9MxFUeF{
zEg}zk>5<&m7VHgOq0u}E1pi0TWzqJ+d}=fwpSs%*I@_dH-16%riYUoTlnN<ta1SZS
zOSm~BQlx45iK3K?3w@T|IroWpc1IBKNJy5gw$C;eiQwThQN)vv92tqAf;9a4#ajVi
zfgM=skg`1%X*WktV5o*atVL8q&Ck`$$n7>}h@%`6Uog?W^5hxvy%p`hHo=h{^6FL2
zXjhp7F|xvsF}yfAez*Y_TbGSB;CJuIqUDx9Ka=onobgedCy&4RqW{KO0eWOP$jIpX
zS?fQTl(UCPaH$`1KX;;e)9~*9SbhE8wN~Q4Ik3q>3=dy02$<`)>sEF}XR|7n12rJe
zb9GGG?fVvOPF0~%Qvi7yJiF6I(F6RdVpV2VRey(u1y~b-<D5GluLw_8H~Hqs0-2)%
z`oPixMa>7of_-h<^*<+Cz?B0HkV_XI=+`a^xlvUBHYz-HJ&5u_tYTUaOgxZ24sPX7
zIaZ6`DBp+k)d=Z53G7zbrz&$v3cfJ2PH{+}MAbfJQe=y;_mk-Bwga|!C?w9}7&Qm`
znCY6oKo=wBmGr}LgMi-B_ULV&UohX(z^9YCDMBY*A_-UMuyg>f?Efcp)+2ps#|Pz3
z@<7r#e$=UN-aF7veq`*eD2LZr($o5V<SP;>@M#q8N<BcU9~9)(=#%@Z+^A8u@q@RU
zf_r^mjsf?)!RUd&4fOqg$BZ4dOD%b@I!)<G9C2AW&kF36qHI2ffQV}!m_J;lfd(%{
zQF?Az#-R-;9*OP!q?854Yr6$<<I3k=zT`c*ap`Re;?S3q=Q5a1p1pbKhsK%V4lb*+
zCxfMhWUpNnIj49iK;Yun>}%mlcRWLc(k(Eo!x|c~pCRX8^193BZBC7{B|RKB8a1)?
zQRIojU(9n`QozCrmWp<c4|vIdj~PgRdooV!2sIN&?@XIY`8bTSNwcGF{<H&63Z;4s
zc;eI<3X?fEWUQ!TQlGmx?E~20*{Rg9M#YjXEae~2^g~<YGMK5EG?KcR(X^};<E66p
z3<e;(fvdg8+Fb`M^86k<YJPBhpDj?{`M23C;tkdb#kk@%z=IJl{e=4~y?6IC0Q2I#
zvDt_GC+hBuc3r1vkmVmYRL%ec1vJSs!4&RxR+1+e1e_!6R|2|b(66uuc(#92Q!;I>
zKvcw53)o^qM?LlUMQlmV9=|z1?F}FP0q95nw>8hMr`|O)E0J~Nz6laDJ3sM=xa$x`
zG}?P^R_*V4+2kEw#!FE40AujemqsS!_O}B=x*x}!2bPVwn_<2)%7y~-GC6jH$A{Rn
zuN4a&thiq9Z%g#yu#qLXsB;hqiAy`BHg|Cit%N#HvCSdP`v31*sp;wB4S#rk$5qQb
z1vQUrjXb6^E6ZjN<}6b;%N3U~PR#_DkSp;0lL^l7n<d_k#jmCN$uBk9!IoN)f?i9b
zJ}c*SO8i?!qcEiiHwy)W;vt{mC2(WB!qQ@p8NR$eIOeEesbkVOpLx50tEBo@k)M~y
zLhX~HspQ=Xy5fonAqb)+x$(~EFlBn6A*lZku!fYY5PMUoNWZ5q;hO=i!GabKsg*Fe
zHO3`pi(Q)BEveq#zG$d7oH|ld;JHv399+A)N{G<$=v%VAZ&FjjQf$2I4M7AaSI*4`
z<C0~j_d3)cK>Ea39A<)>_bO_^o@tE!Mn|$)RoB;gN7IN1{b2Tc<<M}~&sG58);`g7
zW-+h!*Q!PR<ui*lp9E{2e`QfO+jAO^yJ?K_=daBI{|ad42LA{0y>aXvp`u$`zUW1$
z^zJ2-VVZn=k2A8!IwP1HGXry<xOoQTK2a-XF#6#+Aipoj3SaJ1z}2KtO}byZqy)a9
z!MeInwAtP$L*ep1Q7<3S1h11|7dfp+e`R&^Im$52A*FT`F)Ls?`f*iybm&N$5pGTL
zlB(9i{5aQ`Lcu7~eWK{+*T#Xy9mff<AvA^i)7*RmTE=Z(ze8O3|3Np)Q#2kY1XlX#
zcIsk##k(dH4PdU>ZqyKtmKF3OOGS#7i8x7MZ=Ql>ZWG`G#;hMc$*o`21jrDH!=S+K
zWQ4GS`<u#k693*~90%mhk%ZBtn^JlTm_*>BZ5}yNs&`*iZ@vOFk@sgVZo<m9I`29#
z<`&C<5t=34v^`LF9e94@Nc&Rcpd)5(4ptbf7q?DfAC>QEL89!61`7(cfu{SHBNbWX
z9bSd|?hR&@M~-MpIN(S+niLA-HMf(lt2Ngcjncl~184@JFqT`3&#V;H;Yq!{e>g=)
z<KV&S`mM0L4uiP?{(vh5E>7kYyZ|G9GK~LU4|18$d(WJ9h)M+GnAdqvpLT#N9uT!%
zx^r9~GxeE^D?zvzK(i)XO0R?<%>$lKJX$j=n+g=Az`vAMkiGvP_bTqL89tYrLfp-<
z8$5B=elrIQps>Gq4~cJ@XPSay9<p<Rm1g-n_dQmOPg6mRdNt5ltQ97@<Pr*j2YQe?
zngZtM6smkaU&N-+NQTih`ShP!1A7f(4nUGxeUIx!GxGF#Y7^pd!D~kkLF{GJa{+R0
zB;s24I~gT4bTjUJgYIs!tbyP|v;AVS7sb7Dk#EThK;~LuH*gaYD2(mH#j#chYd8I!
zjos|@<+y&p*l(^?fhzTWoPC~QI198L7E~S?y25S5RhPTii{{4yTB=O4(;iIlIyyAX
zp!9RsOZ-g6AwH<rP7z3#Gt!`)wMQLiRKKs)`o2vCg+mKAdKDQUh{MKZz9Xj>QAr*r
z&B>kvyT-Y0vnel%X5?65q?>C<M7x5^?vcXrNL%dAZk3vx>I6-}+AMH#>3(H6zXzDi
zdM!xJ$_M}>;f|r{W+{LzAafl7FMWX?cKbqI*jrX$q{{^>;&O{@W%0=Ip-7^@_pa`7
zC1-&cb|*l?MjB1VYh|5gZ9sK^g=(A@IwNd^$GE{}!zEC{*UaNv{cXhJSpL>_{cZbO
zN(K$`^AFm@7m~doL#-?uP9UF%iDAkoy9ppT|8I*=)YEQyoZ^3D^c31jFDl{wIZ(oT
zi(G74j(v0)l;!=tdNvO2QGiid;f^mC!~#EDU`=hguQ$PkIi{4B30_$o3?{`4pfMr;
zSeODS?0<-AGaCE=rM6dr1Z(zOeT6PT$^lcinZ?zHkcCcI+dupGzW`~rum6zo8Wl8J
zRUn7Deg=ZLJXU8R*4<7zjY@zDnD<T$0-+;0T3%&DQBXMgBKMXE{260?_=JQxE)o<9
z88_D;4HnR9^Q8G)0M+ZO?}KE>vSA}lLysZLzY_SV2j*wd60=;-9k6uhnKcH$)L3}z
z)&25e=+?}|Q8cPYlm&vgNq*v?tcUTcE|hhNtcmHTVP!Yh*>Te|^M_|_#rT9!gIt({
zo&;Ekpw=>D%*r8F&PQ`qTRVsUh~_!U58eSskKDU$oiJwQ*e<t6hxXo|UtUAc(1$H6
zL6Ly4Bj)eYlj!2~nyzAnD7Tprj>JM_QDidUyyk7Pl@{>H&pxyOIJT-A9MsM<Vu3PX
zQ~G}|)_i%v$o1^q6!c8l8|u9qyC`L}*1dJI7NOvJ5A~i;(q8PoE}dni<t!^D*%l<w
zVPP^t(UV*%GrRu^xR!6Swii_1>jDTu!B;x8QNNo$Y)ypkYaaGz28$Tdyk6fGDMo@{
zY_eIhPgHl;MolsQDkMXz2YSw4C$Xy^aIZSncb^jA5tn<(UvT}FTktGduZM1FeTcac
zfv7@c(zh|^^g10>iq~ro>4N@EGh+qY9=Ei|4c5Qj?DZj8iPct;!=DVR&)-V$c@>{w
zmhX5idzbk#&^`~EQE02e-@n10I+4O9sqEb!I1jBv(y8tqa!|HjH5?mcIlE&Ux^Y$R
zzSNEzqJOjS-#7ODKx6>+@}EoQw|z<1$bQ-4_?zg4S#d8ktYbYzrrl>xbNJ6=@#ldS
z_qPRp^#8au7Qgcyy!8fss#|_`2|cM5?^ly~6AFK1q4xK=gWt0^Cii?vd;glh^9ui6
zciW@ka!(EPaMZ9)ihOVlUXx2Edw1b-&$0jgYBQ(6e<lwJcb$!I<U(K8ieFP?3K;t^
zyK{@6t`*PpzutjE0%e9I{tIoILp*drF7m$DJKyu05`X&B>JSYlEukiqq{|ogUJbO_
zawN3M^pM`l^vI~26^rnEZ}QUJmv@;twtxOQ@WI1@!;gWg`nR2(X~ngn$M3JFNltDq
z8FSUNcBaC$xdsrA$9XxmQ^3btIMz!eNT{^!Jk%*yTWhYm8&iNu`{_SbpX)mnzq43*
zl9$p~vumT4g2Tl5${;_K+~3Y2SB?H#gP5w%>JRpFG~zN!k;<si)jDeJ<>7j}QMp<x
zE9{7{HdfV|JAI-FP6J|S|J4F(hGqWOT6pd)Vd^oY2k!Mo@TtX^WRjxgmSX>ODAWJ>
z;s~n$wf1g~9>3#v6qpjR>9}{7Mu@ujvn$Ci?Vh@JsQ5;g_OQQ${vChlrDyMd<^n2n
zm<&9w#|B*7BC1-a%IVz~>ECI@Jwh{z^m}P~^x~pDkPT%Y!;YBD6naGdOJw#UsQdu$
zJDBc#RupC1D+Dr%lE}}>&muap>S1Ke>#PI%A?9`()wJfHOm)Vs?qI&d^Syem(h07O
z#hU*3hzmxi^@<#4a&N%(T5jPD7E?4Rx<_RdR)@&ePkbISrF^3yTQ=YhMl0XViZz&~
zzCspsg3{$lv0%}i{fIUJyv2$T!e(W$_NP4rwXQkw!@2A-<OVt+LS)P>2^WIa8<gqH
zof5zoBDwp$oIPCOw;Ku7S{^B<V5EGnA~%09T>MA3g4>{@JA`&NtDp#6E!wDK9aBKz
zHdkeo#^&6TdGZ1rLkvK&o)mN`+5%+D{f4vKB>FUXN-fZG8Jd*UeyBxk&C1^{>RZBX
zp(p9_FTysQCYZ{+9<-6>{t0RSC1Rt`yR;3MbRhh4je*DDDVS5rvpt`4$5t5b!zq}0
zfvH@Z(0pl~?_&Z2WLJ0TmfvXwiIJcj1J|~ewZBs}vt&CnHa{J&ly$j-$qiPBFPUP8
z1%0NsVte^!WPC2oj-J)t2|8$(`_8{NgzgEWjr5SK1!0jqI^(7SC<0NziJ5ECh)RJ!
zJ2~{zQE%Mh4(4syiB@8bWmZ&-sa@<%{Zb>TElf%ll<noCnIjPa7=PPXpw`gixzKK%
z>zJI$Bd-W&b*ix@piU^AVQuqV>VR1_^v9SEkG=l7T?0dbW5095S7CPKC{O8b6F7_K
zpzpqv84_HiXa>vPT0Jy7!QiRQFAf*V_Z!9CLst-qCYrF17Cgj!B9m%c3woTr_@aFA
zB+UEiu4ltHFOJY;vQ}H~W4zt9CNp4Zl-7wG3pT#fSVW9h6QA12X7?)%;*sEdPC;c|
zEu0XDdxw*xZ-2(%ewXkO=Tso2<MgHBpKh7r48(XII;9|~a$WW!#zwyn4l+Iu(;sFK
zP15MlU?}FUhRapd>a>xbmO5$k3^g@;^hFg?J2J_!v((hVJy0R@FsJe+Sg8sJ(gmd0
zE|_%lowR>KZGSXJa+_4~)<09$Y2v)qG#~nV=X#o%g5^D6w*!o7;1I9<(mPpp;?q4^
z9i>s{@cE7c?}@kcSXa23ZFQ3xV7U4hgZ%=1YGL!D;jRX4hm9qS?R_*r<)D(9f4G0j
z(zCWqIP7{BgoNd@niV#_qbrD#GJZ{XL$kB{E033JtmY%DeqxTOl(BuIW|g)6J3kp#
zJ-mrlCc)r$Q$w6Cw%9V&ui_JjuhQTGYy5~t%EUL;V9||s91lF31BAoLOW$Ti_?CBs
z3XiJJdJTUhk47w!*d1SD2Az9I-!#;zi>(TljEoC>C*rY-1>8#S??50gqO>uEk?j3&
z!+F86vNDTPmF*%<`seI3e4&Ia6?rS;{*?DX{NoEH!o9RTh%}XTl0xPcEUbDw4%I%t
zB+xm7(nx79cyWNu9gJT7Zsl_^PhBrtfkS@&ZHf!G2n{$RQs?HAHu`fa!kJ#y1X{}u
z_`^2L*Dx+KvOnQ^(Y9~7s1Dq?!TWQ(DkdTy8aX#=M9yKeGAJ2GM`<ge5#B#-S#Dwm
z5s+U6`AzoTAOTAc5@s|k@sXo{h91sOV}#K;94Z9|3n>&{_fE-rTR}v<_ZA+K)PE^L
zQO&nAgmi|{{SM(nh$Xq33#*h{JF~Osf*u5=VnuDFCuEPQ7n)wp#6Lp6;1@@UFIr1G
zk_G9BTSe3O)HV(zbi88nEV&94$7uTgI6NRWvIyjd<SCdh{<(6W=yW(BwclA0RFMs1
zha;U7^L%$+V-;(C+u5%L)MQ9EYpOX(Zzw6FoV>YId^89zkD>J1plfjjX?E3Ko|lUI
zmt~qP+o0}FZJWIqyCKm-LpW0-6M%Otn_VH8_R$tGdeXZr|9uU>ysSo}%{Q^zAlGyd
zA+jPgUYYTe{II^bD+Tq$)6~oa?xwnXF`tg_DvF+C>9PTC0-T65=lD|=qU4xUVKV0Y
zZF>RNq^G29;`g=W_ifA7?LY6ZRt~1$=hBAR+<Mx##&TDhcyu+Zt;%F8CtH`Vb2xS+
zPvg;`yp2xNu=5Jx1G)F*n%WbNs-v@-sg12J#EMVUN-^%v1W~~r;zti8oDj^6EQ@U~
z8klbp?5XUVI}BU^@%2^WyX0Mhy%*2g$c}H%TEH^`=E~3~#r`?e*W1{5JBf(_cle-x
z&Xzr411FVF(s}i0Qv&9pn(C+S<2W#D60wt@U=>hmwN%s#-!)el&7CUg6k4nAz9;V_
z(<Ecn6IbG*3NfGG!bHF)y#9>Ib~bjuc0nop6jMLD65nlTk`WFhCFZQy#;vwnNI}9+
z-2kL}(Wo59@k@`swRQ9mOP{6sX%fDLw1Oj9@cC0yoQ*weETWEXQ{=T`?AGfN2_elg
z6VCBJ_|DwJnC!`yVls_&9b!?O*Jp3FVRT~LAKz{%fE!y)ymy3~Ip}|O#J&U`g{vdX
zkBImx8%K=sY=z0S*&0C;A?nIn4#^$2%G9YxG3(K@yK+#4(WnR?2Ug*=F^=M`I-Mx4
z>#5J7%~s3b?(K4uMmXJyI;vs)Obp&*8R!@emQRNGCMll$0P|a$Y0_4yQpGMkucFx8
zYSyk6cs!ZHdzrx(E2}cRQ9>IL40);OKg2%U%CLN_<d~BjPAtmMazGS3{SCWfD=>E5
zwvkoMyV!(&um<kelUy)foV%0zyMzF_>V%c3!KB2D1U$(v@wR01SnSss#STg@b$5hs
zE)ecg458SSKFJN2e~3jFFy(_G=}4P(;;xGwr&|qt?UIzC-mjKkj)C3e&nwOM)z2|P
z?2Q~34pn|?V-LNskQdP4t3@D$F#YmMG7}2Slg{(?Xlrj2%~f-%miCPH)FavoSgp2%
zypY??>Zik99l43tg34pTAwC+v7<WUD)o|=~1sjT@1;)4*;dIfAl0X%Pv$H(;lZA_P
zgHz7%+lxXYf7d;`eg1t#E$a0K4eNJ#zt5HoHZUx=dM;pbUIrL5d21OdyJ{<&M71Jh
zzUi<(YnANBN$6@L4w~ez@lJ!mPXFAJ8wqQIBAgm5*~#>EX{+(q&#TksvG&G~+2699
zNZ*PHnNsXjv)+s81xC!3<I2!$aQ0AS$>1CMPJ6sqP^n}A7y3I8naR>EE?#;~hOiH{
zy@xtY76#~vMLYLm1W&trw-Kk;k402*ablLaw;K5TxLu)yHF~9~QFUjK{}r_AuWa;K
z6{~0JZS3g??)%zK#g1b5bCAGRh2{;n2wW*Wt68eSxMQOWWMDBC4L6f8K1$L;w_Hyq
zvCy|e6}8BVJDXl8=bhdqjUuQ1eDqMiv&;6q_4(_`^V1>0SzrY70_pn6d$UnGC3dc1
zl<d*rtC7#Ph=rC58Yl&XGYX@Jjq)DLZB?32sKbrZxBE$E-j|$CLf2pmIE@<eC!uA~
z4mZrlt;cOL%W!4k5nX}`eMy%`Md9Zuc11t0gl~Ux^zcsAB4C>j7))?jN1<*q`THY&
z`Hi>e(E>Sj@3G#W>41B>aWr;*cb>;JJi?Ck<<WPx<F5vn8q|;^&I}|xoy=)>G)Vcr
zjx4400ztsW^L+bGVEu3>uutZ<$hgWiumkD@D3W`^9-5=a<0vpqgBV`OPc?w$`~FET
z(;lw_<uBX8F|f+OJ}Zw01i|Zx^RGs$X{Wh=IH&uu1UTGV1Kl>u%a?CG<(Sex1%~i|
zHEyi}GiyM43Av|q>tMN;34n#DsSKBO)Y$p=r<DzeEeVY^TAZrA2o=ZBupfti*>SJ1
zyys>*qojkk(Ld|R9`MN*`L4ri-Ww!aLT6~DVzcR+@Kz@Ad-}9_qNx#iFuMxbK8ZHd
zyRUAu9bpXx)n8FP=EWEDr7G8b8Y)0GidozU6K4z><RGFi+D@L*%a787>fvpx0|@oZ
zip2Pkw9QAl2>@iu9_HA!`Rj?;NP6O6v+r1iZ_l+TnWn9j5H}eq`|7x7_uCA!t8%%A
zoOcNH=q5Em0f;>-@QXvtkqmjJx+Vo%Z8A_Q{k$ZpGhH><WH+H1J~Up^_{Off8}bv|
zwsBjg(s#u#6>sSV7IKl+`VgB$M^J+Bs~ctM>P-qJtKmKBIwc8iK+QLw2UWzYPr>{K
zq-T$zHB`#sxwYOJqr+&p{;$&A;@W#2zpr2?3{qsXcYAaqt2F7*O+Wz=Dcq1uR#GUh
z4Y*wz`JUxS4XDNw(nOo{%!`02$Pp(!SJ3m>Ix*{Q3!JgS*W<%_vEjI;qMt5i)_=xV
zmO@bQ&BN$t^i9~v{G}g{uP*!u!5C$YA$(zN61Ol$Znl&q3XGWg!z@3$jl**+)r=aM
zl+@mA+x+K+?(%k$#MpJk-Zegst};V|{#3ZNfbDvAh@VoEDXeOe<ToA?+`_Fp-n7zL
z%s8rq94`<pk|F%8#(9uBjgimj592X9FnG}<d8Hxb*7f^R^-5~FKpTvWeoyj3n@Q}9
zO}|I)Ho@iUCdp;*cyd7+o>Ezt9`8Y?Y9wKT)Jb8hkU(YWnn`KGFhG;RL`;K(J(s%O
zI>|a?>qQ7jU&JUA?nH<pRaHGY&jGPl0ru$$)5oxSi~hqP)$ivJx~!5Wcqn$EKvA<H
zXUn*)<^385L#1)Qv&Pya`V>8@LE7W-;(oe|VluCE)a`4-=*I1KE8mj!JqkjI*mC)g
z7A?X6gdv=#u4oBxi`xRP5hSqach5c6C7I${8^VlEWDWEVNpo;D`TDQYSK35tg4Ezx
zhJ{$kM`LZ6^ZTiY)pmG@J>ITb?Ki&8S0j^VG1qb2xslipidlv4zQ#o*A_?mEb+D2`
z&6OIkPri1yGv1-ZjafC?JWdXlsFehiTl81XY_IHeMvyiU<Zb=iEBP)+TY-hLG3;_L
zNG@ktU{=J9nQLEGE8MXo^f2@9g(-&o6-S)MN0T^UQNwUC^z8zEiLqU2<i&g?8|jjY
z_X_F09oM2ZeF;Bs??Dc5Vb6)3#Ta^}7nU1Qn=kKSqP(;TO&rG?jT>=4UYMYFN0czq
zW=_)gcChrpA+c`Gx5eUV^`h(r9)7kSbQ1V1UTlq;=U@pYtsn0oweBp!bs2|uF&au!
zF&xOZ+mk@2rM7p)I|&3z+VLc{C9k<E6EeieyYdC+z}hw&lYPGnkGYlM__L)IN82>$
zv6}ZbQ$ku5A<ZX%qsboBhfyjI?c~umsmqxAtU*r~IF<pzSX0dMaA;dAbCr|86Dq{1
zlmX|U`AI?l?P0WF{-6%Vw9Q|RJ(Rd@?y(Ceui;JGq+^x|As6h*HiFoCR{r3;j7Cw`
zmr`Xvy72!_521OH#X>YJ;gB?b3bIpm5ON|+ojrt?Fo=^_0ciPpM2;P(de2EWl(^IA
z`{N3CQ(djDM@mS0mXqOl>0~^yRM30pJUXm^R4Bq{&n9a3iB(%Mee%zoCJXz9FdzK4
z;KdQ5#E#Xs1}5N4zxp+So^(_0-g?>qB6rX>e2erf?-y%YUZd`~`Df{Zan><lQJBz^
zEbK~40J|8$?Urw~E3vSf&O_N*Vn?+aYA3e=RN^VE3Q~@nc8KCDuIs-;)-WXYVy9}|
zHcVxw#F;jkr_XDE^709kaGQjmirVbhQH4qgfz7@2VekkNX{&=iY==DXIr`J^c=@E8
zG>$m&5mcKgF`TK!>Zsf3k1Z4EgR^5-e}n`t>KdH^1+HgO`sc{?72f_HF{fZ@PD3Th
z@4ES<SrDZS#apkAMS5uxmc__TCNR6_Yp^G(nEM5Gk-yFC&V!(96dZ{8erJ(qGOXg9
zg0Q={Th?-<Y7wevH}>P*_ByY0L~XV);!r(CI}f6W>0^abUzOV~L3ZKZV<zmO-<6=u
zmOOJdXp=af9v&&q`@6_19pgqR6>zz%Ny2Wx?I8BzrCqyq;%sOLY6M@tWrt^FN5cH`
zCmYsjE^-ssL*~hFUCnpL%*#mnZJ04t6clhcfOf#+LXt?n=!<#R0e2m6$EfYp_G7zk
ztJ9tetK~6p_Y<S&v5x_*J4~b4MQROgjTUb)XDt*0Dd94nTf;EMU5VUO6t`O7F~bh2
zcG|I%uP3eF^6NoHu<sfuxd-$QEI87KjTKIN4UfX}>(tM;0i{F}?t7Tcu`*<3*Q&>x
z#|XM%;NzQR*5=i@{%D@qyO=LH_zzZPKAA{o*}*M=p9l$d%$}^$OPI-DOwjsD19HWZ
zb*G2~zM46t>yEE#q*;Om!_eG+8w_)U%R9$<OAEI8$x}ts()|hpG8ny1csLC25!vfr
zU(l~q*4ZOEkWE~;2RAE8wk%fO?7i32h!&{^3Mmhd)4Jm4v|`u76hLFb+)y)*#Z#!w
zwNq|sWnXIwc5FZE)6usZ>DsB^ri!v0SRR`(ZpwJQo?B01HyeT`zlvb<`mxav^5j-d
z#iyi5kS^YF-Gk#*iSq<pkbQ!t%3xe&8y*RqLiS^v7+d{i#{!w!l@dQ;{APu$g=%Dl
z2-0&pUX0a{gk3GN?5Izdb%~hbo|B}fV~kA1wljhAwSm9=%(95TClsfI;=;RJU$H@f
z=PD#(SI%`TlOt&uC9&gy@ptUvn<|Y6aQH6ZOMlfy)M0yN1@45j@awu_)&{JGf=YEg
zM*W%UFa?{#YssHNT!6_?FI6ly-_{vkGvLRc1}vvwTu%q<7o#^Mi5;wuvYp^-x2)Kv
zD*W(#Pe8g`XU|%$MC9g-m}P1uvR=h!Cw|kkx<d^9v?reK(NbcY95@ZL{u20D5vP&|
z=P+Jy`A)cTA*wsESCOLKID0TUtYc;{?B9u7muF;ZYrW}xSVj_wx%T2%@h#GB^=7-_
zw_Ji4Yd*9`j1^*UCkLWD=3k5Lt8I1~(Pg^Je|E2qOGE5j{Ry)nhiyAHn-<2s;!SkW
zohx`%-&Zfs39obe;$Moqc7N>4s_~ZZL1~sK+??w7Q2~K-=>m5ze>;8S!?AB4?)vh-
z=Y3h8K-wv_N>vRh8~k0>i(iu`YJ5VC`(YB~t`ip;HVm}_X%K+~ewFyn`^}<({mpuT
ztSV=-62>1$m-ZZ+W_%vydc6Nw7lvl(ibXwd@$qdx9{a|-97i}~TtzPIH-as9>|?mE
zTQpbsKw{NvN_#gGkR$AHAzuRVLU5c+8_(j69BOWIQmqzHeaB)hm^1E|a()W&RFLVq
zycF`4{;&RjOy9*EEv!4PD-C7-d1HYjCfc$#OH~3Xa}6iUB7|9ZR$Mz2`KaY+c%%n~
z4lSgW!fiz4POEXt&<cLqcBh)Eho9iYmh&7sA!5#X>Tk0#E^2O-@II4pr;tnV#wYIO
zsAO0Q<F@2%V#y3=mMMK3k~gHDYT*sDO4pR)PyHMi#Mw3^0R9@Dx+?$Ek8SJyv|&)1
z%pw*tct(7HPCp~>pNn+t_wW4Md}HqiL8%?gjtmG{z<ZodH+V_L{2D-igbw|%sVlK9
zJ9+BV+rzoeQLop}F#qJ&Z#{|{(1{Ow{eT@7$PxHfY*2yGe#pgPcqB-P%8m+iL@}>5
zzSsPM^RsjZji0&CJB^O3XrGzUYhHNXse)q{O3;3HF-Y``{Dj!h&6i777F62@>mOk)
z;w%qezR}}h`86$cZ~fOFPf!Iu3!Kqhm*88*Gs>daSpN`r^jA_p3_w_pl|O3U_%+|#
z@Mmo#cY1}V{TCC%p$Q?M!X**ffeyG6FG14zVUGkY%hgEn#<Jwf@0VxEL%-R7*4!99
zX-=f>JpFflPvr%}f?|SD$8mU7xOvF;ooDGzH!aaIFG@2Xp2r-@W)>g7uMm$!@tU~g
z+%4UFB~Rlobr&Ap>)1SZV^pP?NXLzLHMdQ7;4<HQ-pTZDuWx7dT8{VMw`uuB4ii85
zM>l=($^vKf1I_M3I}ItzHI(5mCmbifexSbA7QfNHLc@IbPCk4QEHDR3OMkL-@M{{9
zdL%F`5FI#LAn%za%NWmOO=4*0rj|b6hvEGhO5Le!$Krf5-2vkKB*>D`*2thyeBSuR
zgZ&Tt;Z!+|QfQ5pj!>@Z-jxs5j23tA-mX;c9~=mR^I+wn^2?6t4ysg^G~w+GD?hT5
zQYt^eqYW!8#7-DlxE!xozP&x|XEP3wpD%Z!3Kwvew~?P`5(yz3XOYq>r%S0!d3aX+
zUnKgF*ugr6x!-(AjdXRJoPN(E_xr{fXT6pw@{kS3@r9Jkl8b>mYNX4}^=HV+lK15t
z__el)=0}{1zBgL7OugCr+~5cN^#hdi^+|FLIq>~)&iSL}Pd_)I+FeycKZwaM<F$g+
z3uGt@oS+`;cjrUSCeN~Fk3^WZB|xEL;T@qh-li?onmO;3Qqma%$Ad~V?4KuFtur{o
z(jCq?Ke#z1^b)3&Y5ZW3bxMRr@mM*Rip$+~hStzk4=Kh!cW+wmjSqhO_;#`RDIlY(
zxewj;KIhxiXR^!H-xc{Rl!W!q$1jZp!aL->?0;gu^O|u?l`H&{nP%(PW@A+NawVI3
z^hvN=;$;m(xk@<Kw<P!A^bebyljY>IO@RiwRi{PRSqLP}|14Wh-T7=-Sbk5Y?>#CG
z=|#Ay%ez8uDpR)+qH6zOquOXeGx_pXv^@)z=kfA}TPwk7vOc5|j`!l(0L*)W2u{R#
zgaV7(Cy~jgAEH&wgod55gC3;F-KNuhIU#EgGo>U^y$Bzt&>1ZQ_Bow4AHp4S5IQI#
zVOMeFkpAJOX3!024;pM~0+_Am4=2Ml`=lEJnW!BGshpU_BiBzf9K%v+DCz+gz>YJS
zKL$o^PHMJQBL!aR%~E}VI2U5k16N3cFd;HeIY=bx8Ilu}c5TFw_47Jd(i4HJh$)OB
z4W9*_LK@oIG*z+rxc*6NxH-#)X*_kkinQ|GvOml_*a~&Ta~V_D0o&TsaFuX(hK+`3
zYb9ESOSP|O^P17qyD%@ItGvH3IW(-;g}S3@kT~j``{ne98xJSHcMI2T4V#goDxo2}
zMxLi|63s^qfippGhhSt?^9##jvC=x36%Z9_v*ys`O7r<+F+q%_Ps#~aM=Kew9WpA}
z4DZ<Ft}=gR#X@_;@{NBE++q#R8n0ECCsE}2(_x#&p2m9nXL3gKr=dhIEP4CPf|vQl
zA|{5XJKH(mq}N#TvKyPP>AT=FxOOF3Nuy+jh&3sVI{-7Q)0{KQ#Ey~lX~K@pEgAgU
z-H4)Li2Or*gg{M{S*G$_VgHer8uQ%8j-4i@vT))E_mvEcuQNayI9J6h##n)AQFKz|
zkGCx5RX0Z63!By0_^3oJlr?MT>&+51zYXoNOpPNT8=_w{3_&79mBt4rNF?hu%#W>|
zMQ&Fw)eJ#*yb#_v-?FP~s1?<=U(AX{zr&;HQWO$GVGR{hf)(F51dFdyhnY~ziC$y#
zW+a(hxo}}q0ZvyRl#&+lNtqd|NiQes;4m~?lc^IpAH;KLq^f;qsW<F5^s>1^4*AOZ
za1nds1L>Oq#^(#=cV^0qOny~gxDY)CS&)D5&PRXy!I!T<2y-DWyvP_+z*~yRNYQvb
z_UBG$PbuYpVs|g%3CPX7u!dn7l69DK^5(e8?S1wS?FPJ}$O9RrQ%d|CIpmk=^s|<&
z86MbKdN!rAwjzpG*6WBqL*B-_HCz}>B;wmdKeYeeDUss!^E1U2aH=7?A@;BrhO)C;
zg9v>4cr!*Ld|!-+hu8)3oNg#~5m;st;=jpFdQy5BYzM5lG~e4g<R91k#O8<v@#lAh
zA4UqEi`nLRQA%BwrGM3_%U#H+xauBSAjBN1n<>BtxZQ^k?dtn?d^4**a7UDPP1qbl
zFtQ9)vrW=JK_pG>K1o`Hw}smOxP3F3fcPMsWS)fYwvg&FfjvKbtNx|Ks^W3^pz#}0
zq0f%-Z_Taq{idPG6nf*38bu|!^v6jZJG*HDADZ<kipCU$9X7L%I&2uCSfbkYTr?Hp
z*z#O7@$xyZ69}yy34W@QcS`TIcV3YdqY-hX#D$4d4uVvqx1!ZGO3RBkMwx%8XXMZ!
zzOHBlId#%t-{RA;OGBA<Ud)Bn@Ak<3qJGNeE8PKp{~MDu_C;7!vx9zS+y&t~)dKJ@
zInDPklQ_m!;>TA6u34wEBDfIO5i$stfPSQUP!6I5Bh0niWZ!^j{l($Ajd#`8$euy`
zjQb}+|74fSP{WK{^NS&>2tz~aAs(a7p?9c~-yVr{^?|Smd^3adkFArB%d9&j@R#D7
zW*d%qJ{EW?xqKq_#+KxQxmVHPF{4tr#Bfni1VSQo=Fhh5m#0EvgLFf_#Hr?(AJDf<
zpDTC&ZYCfI6b&U-<rKcKQ%LYycD_O=+ll*e(q7m}&OXZSa4YS@meW*<RAaBmi;f{b
z9|G=m&y&X!ap|jokiqBOCtE|ZK%L+_3kNKm);z6i>UeK>hoaeCpCtI7n!#3c`y#$~
zyoX!u9-LmJ`H2}K8@=-=kY>#jwL2ZzR`<dck4d{!>&&QcKc00dQkX)E-$EC^F9sE1
zN>ta`ULR-a4&Yh7|8+BYBtiPZ*F)dZE*Zpcwg)JE9GYgjZQzWu^x0O3iqdyRO{Gv{
zPhUG(hce*_Gs3f%oZN!TzPM!NPame|eaxHv4}XOy?mJ<j%kU+WnOfV%JDwaFRH}Gw
z@UhPBp5_f&4rREIqYbUOije8K^@&5HQ?S!U^V@<1uX_*f;82{uh)Q3VG3?<912oNV
zgDU%c?XpH%ZTw<ae?7$W8COFEHWC(o$1DB{6&R28)Qs-(R2x-*Uy3A&dGd$}WI80A
z?qojoc3P5liN3rcsOXYMmBa>{1xIVwy*fi`>FTK!K4-pIql{caqLTUiU5&`YBBIvG
z*MtuzQ*(yEkPkCiS=13%oW(0=myLeLX%ojZ=n#UEyTVM0Q0LAHBWg^`lgi>lB5ebK
zPAwBj8X+-_h#s6iyf{(dJIKhRK1C%IEAkaN1YOK@h=B3bXGUn~&UteNrjTkGq~o^2
zKkh49zr{JE)8?pUVWp&ACf7(8+n*SxmR0x<L-<b>{q1kDpRthmu$i5+v}3Oq#n9ib
zG@l=WEy(_n@#BAj4P0ssg*54{j<IwOlxM1T4D|kThetWA4)APQteDvNKOe6ncDVit
zQKd3fANFFoji_$>M-NebZcion{fpgxN*<>%8x&KQ?1HtR)%fK5^|v2}lN?eQJU)%|
z?1=EI4-=+-dD=GC=G0Hp5WVTZCaRTMjFESAmiR~wlLPfLxT)mcf%8u`XqJ{U4|?lx
ztb-1&VD*HGznl4L8m}SZ1#A~7hOG+Xu~hbm1ty=Iwyx+-=q~#bzrjz<i!~|B^F@Rw
zrka?G+w90i*YOaf2PzuxN2<8dRHpCTkN1T#_^|${$IKUa)GVFG*2cIZC;M+SnY<v9
zWTy0v^6&!1{?ywoFP0r>gYAU+IId@E8s6;Yd5GI3mDLOGf3&@^<9hOn<HO}`k02h4
zV_y7s*TrbhGL9u!MutI@S{P!Uni%DpzcFOsYg~3^rwJ;dZfa%dL4A?wT#C9McriCX
zb3!60sZ;_jw3d3rc)Xvnc@0_Nr#*F;`6tgyvo<DxYvI=&C#bpcaxlMFyJaJ11mV(Y
z1ei|Cz@^A`(Gi{4OQp|S@E_uxh@Ck@_<@EuBHo<X^EvpoYYq9<!b3Nu@fGD%_nD=w
zgvsxg=j}^YjRUYfGlk)>ouS`rL>Vl{HTF@#<lo_3MC-Ny=u3ttKps5U+%oSvehXd_
z<Ii0$vphD=gq-YcUTaGGS%Yz(g$H=Fu7q7ZB&YpJZrQ`0YsS^yX-&g^{3*4k0ACmO
z!wMU=H0L|CVq@Wzv|BDDELMDp85xg{6}Ku1Z{B53({HaS{M~cWZWSAxtSC4n`$Y4;
z9Qh@~IP=Uc=t6@Ew-H72TlGm^hSpq*;kmyu@N@8Wb)%?f$#(XdJbvXUoaLg)hf<`s
z%RECvkV#+|VtP`;EQ)PN0Uzbs<3caQW<8-0HHsjAyAaX(q`Tzv#`~CJVP2me>YZ?A
zpZshVd-{*LW&A3ijgy|CDo=S6>zRMWRGs-vi<B?!9>Pwlr70f|ftH@|R8m5-$#qTL
z6nY!^dfi^{^p3*HO?vG65IAwz`VrR0CwU=!Sj|1-pMR!O8h27%0{moP+2gNPke|#_
zTmqC&bSPE%dp}o1dZa47Uwu;FP`z;b+Qw$(cdR5>^ci_*eVEn;!9G3B^Q*Ep25p2K
zig4aAy2FdS{}LqW&}j3yRG}~lqFPD_22Tb76wG-LrGN3bFFjEfKIN}qnP$4Z0Rk3P
z1&aEOp{V4QZ;FcTih?<p$D+|AFWuyy`lz-JI5s3d%y{0H>XE#Y{cKM3%?dK!Ovt<N
zed+U+yD*+BL%z!fL$!7L+HJ++%|8J%ks^ciEuqmb0dCI5w?!g3YgzPHT+6f{RGGd1
zadaWo!L?_|1s(;rG@G}@N-YZUrg%&^=!Xx-$;~PvYc^hoyKOgq#}bZ_yrnwrR9EK`
zORzH7TB1H8@UcPt*x{J2I3oDEAG8gRvc65V7Ry<@By_HPLio@&wRH5hRHe$3ph$kI
zP77M-SIMJvEYhjluk^R5>OABX+Zdj0vwMp{o9@a*!2h%vLm^P?SxfO)0hex0m^(X!
zlZJCdEGNw(?DR8zw(8LBHSS=pp-qO^Gc|98Uo_<0zM^lD_s}Ez;wA6Xbe_YCnGVAC
zEBK8Q<jN;XG#UX>mqv^Dn?5tVxHle`9L~IvkdlEZ3VcNE;1ht_Q;*&`FfCl4kLQGi
zw<_+!@o%_zQ&QoE3G392&ta8jqO&84&7sY!Y#qO8k^`AlMJ_ye<{*@TbQu~MT|2y9
zbH({K75Sz8z{(%0jS2xjlcz^3Q@u}Y9_IvW{hBkB*+>-kkB<6uk<V_OZP^#7n2^PQ
z;^FlQYUj(&$2Sxkssa_KPIOX_MDoGYzuhozf=70WFZ_cEZsw3736E_4p=BK{E$PJP
zU+1zp7iR8f{3;qARlq#NtYYjzvn(u>s|&~}A1V@Xq00f`9rzE6y%Q)@_H**3+gTO&
zw_n9Rvr3MQ*!Z2B{9{9Cjb3(qaq0R5M8Ez+DQ`_&O64VlUqg*fV%U!;kCaNUFR|N~
zF2hAb#85#uDJ=f2Kv8qhkj3VV>v|bm?7J1x4@pz6vz1u5kf%D9?Pa?o^i3)EoAz5g
zs$zcJVAJvRAQh$~Iu`43ZU!d0WkISVK^QIkUWvXJ*Ufn!h|wGyj?oG<T2*`KTYq!N
z2b}ukEA7(diUL)gpW)B+<p4jxWDx;g1qsuHi|HGbLkeUTQSYTUPAu3}-%5wMKUchk
z3f?^Y=7TZpXwxezOXzs_nXiI<&zb2HbyoiX&D#wA6RUq}SswbZcI))AsJWcb8yod<
z-eo=Wtmh=I*F}~~Aw@Hf1gdw{IxWS1-Q^45icDdRnT~8n`mPIBV*>P3a~%+HUL+IU
zlG&bp`r+vJ()wWNy>j}`t}b^fE>VOlzGXwoHsi2d0gSsn*+HKtEX(I)_o=Imfr<)k
zrS&be*o7Qsx!aOQx^K#hL*czYHHAc7-hp){U0YKlwoKeU-}F&zH6V;am)heJF9pqG
znY9&9#7~8jx|7LXM-Id9DQxr(d*u*<s#0856$7FUKYaJBAR24da=Lo^{G`95>z0fH
zif-}O%R_F8MS)`VM9+y%{jbWBrAoR%wLQe!KeBp=-lrPFlmNa-RcMZ@{gF^IYV-NH
zqR?70Ip#R%h&LwbcdQT@)}^9Qv=wIf@c*Iez2m9;-}rHk%wvSCtTI9lLiXxilohG$
zO&K91^Wa8glMynGNF?)Ek#+1;ob1g(9OH28gJb+|eSY8X<MDm{?|6-CKCkC>-RA+_
z+e)YC)kgRuf;Z4#+w+X;93Oi2U1)3#8)w-@|Lj6bH0>3k=harT;Udn{7k)Cqg~B$1
zE~e!?=n}gH%0<3|W3e!5{aXj*>R`W|+W=;%GG9Ogm{H`-wR2(fFEd`?`oz<kH~vQ4
zGQPVNE4q$+pjA=ibbjsRDni)#H%qo;;~AoNEvN{<i@iFSaW=>O(c{49__)rr8vo}N
zU&ZO;SN1zM)PH=wTYv|=0$9&FZf!c_sE#y}?Y2?#p~xArG_wg!>lwXzFBrFXM9kjZ
zctMG=cPwp6lnar8W><h`5b)xgZ$;y~lzrn-y9h1Gv%FAMhXtW)PNb@@mRp|1C<q`G
z01ug4y&TnF9*lNK!WDx+dTMZ#bR<pM(+b+g&bUTRt;NxHs*|w*I~HtJp>(3Y^g+YB
zA;(GlQnO^x$eQQln6YaY@$d*iejfdb@YG*iI;Wv@z_TxA+{$4f*L)Yzw|aY&WAV$&
zv4eJ+1Kr+Rb2ZyXN(P%e^DY890X$fsh6y`<DjB<Q!2c=m{baTZwIGZ8>j#Uio6k$+
z(|P50>&5MJBb9<wGrU?X%VJNP()Q1?LIm%zBq6Zc?X8@uU*?+zw^U=(Sf-HQr5(sk
zlr*e+lul1n7Ecad9qU#zFn{ZB_3AznWKsNPO!`uHD-eIipL(a1Dp7usCmE>^;7bEJ
zfDW`*ccZ+9+Aqb^;bWw3%-D6l#}!Q`siH6BD+-!UC@bv!Aqda%UZNk1&SYlfx3Tm6
zxS)XTDYZTY>q>Oh>_mJ%k2}dPwp(-MW+A^yZV~?Q>+od%Kd$QIxfRN=pIt-MilpTc
zDqG{9#wAYzZ?;r^a?g}org{YS3XS`}sgd>Qp8GykYxOdXCe6H%>J%B+_<V-ghk9j}
z_T0@iCx3FC>cO*YJRwK5LVvucQLwd6sWDE5J!8#cN`=>Ppk*y?=Is&<h&C3Rm(?Od
zqBP%c+>v*FPF~VviuP$s-i*KL8Fw#)C{pwo7tI|6q$>cG@uzg!Jp9G(Hf`?^Lm^&L
z2XmD5tn#@#OjTiqmxD>5YhpiF$M1HaAVgPI&t9jB(x0#bR|2U%#iVRElVuUh*B@s>
zxH~2)Yr1<^m!5v~{dqQuI<va3p!D4OLOA$FD#eXxzsEr+vuvqtOANm_QKe0vtEyVp
zR67CYb{g<e3D3At6UaM$9j;Hb)*YK<L$mr_6EuFQXtuZSCuwHL$bNT^(yvdnnY4Z4
z8{=+#(H6rt6P8=4<T7_2$>Joc6zV1M^E4>ETc4`pzfcyW0uzzQKR7~dGT4|Tn1F=c
zq8H5+y4Z(T>rmaL%9x?q(-7^V+r82~6u?;!NoCS*(+Cw?sQ-t<{CiqK)aD(BLTOF1
z?ynd{dj4h{NG*IRI1@8mr@nNhx%(gFq%ziq8bZAl+zXO2VlOZ=>S7A9)~vh4>6{%d
zs3`1}=;7~*w$EYe5jInEP28$yI##7S<X43A?LW81SYOG-)s<*e&dEJzv$@O&II|Af
zPevL(XI(PqD?Cj}?#W%N5kp{(tis$Y+(q=7H-S41*uNU;0<97@lDC{`_zG*8Jjh0r
zC=D5m+WTz<k6<Ikkig$3cMY_}Vwd7g6}!9^EFfG@Y=C4d_rV;1cscfYBb}(WxAZ}a
zpUV91gD3qQ-2XC~B)-778DL$VBWCIC!}U~DtD5%rU40D>kRsD2m>@}YDD5NL<TPcw
z&H5|t&$kQ?lg-?Bk|x(ztNhd)fu0yy5W^iV%TK9`jvB7E3U?1^V`6W4`nlm5Qe}&+
z^t;<*uTbi72gl6L$Sm95A)n5h6m0V_44iy_L^$D+csB!$0?VOBH*iKIkt2oQXgX7I
z{S?S_i&5#FELVwqR>2xhaUAYJiEDn}(`)ir=cuV`D~0l5H!D|xLUt^9mAV3%TCbt6
zeN-_1=?^Qe(yNG`o1^%v19i$qGQ{s!PIK<=;b#CcLLnmO!uM!49FPXzZwOr@k`V2w
zb$`~7`p7$UCHIg5;}nOStT;wT@hylC`*S9vM|SdQ<91@O=!zniL%J<-BZ~q9TxeOd
zUzg0__?1RqPK!st<2X{(wjQwpiKz<MH-vdUsknmv5MSocaKo~_Ov1j+7EZeRSXrWg
zr9OM@24@MSBgvfa<WwmC7Fk1qqhiiqI3$-uLJE-h#CrgIgKNR4DrJ_BI*>AZbRyyt
zE#P(!5j~rY_q6J|Nh;*s3<kL@{5k#NSMFAulQ9%=al#n?vx<cnlQgpZNl$gZuiHpN
z*wc+234oA#5;XoPoR)=d{l}LE!SNf_t(H6Tkz{O1u(#JL@V1Wj$r&*@2ANSC@YkFE
zum~35N&?Zfm1>uutolQ0;_8u19qViT|4wr*Wm`V7=F?EPJjJHZgulgnD8agZ3%RJ!
zf!yz?jndbf<2_`qB;RuFK8gX$M4pa$kxxMpj)ij%Y4gmjtM!hJi*|o$R~bQilnH?z
zf=*P+U}@C^xiwZv#I%g7Y*m@?gbOtE`v8|f9HH;_uWqR;^*M+6D$>Y>mTz|Ct!j2>
z4N<cufgN=w*@NPT{?TcxD~?{6>bTv_*L(-f+6$&Qi@|D>`3&lDqP?)}d95Ok`H-@P
zT*;C$E-(QrR=RbnR$2S?-RF>;5IjkV;+R`Z4uibH(e3{k-mlB)CP@=tP7eX*%JH-h
z)I>AVaiu>-v3_a)p=J&nv>UTxW?})FxX#fR$$xLZY}-_DBuoFC<?v^D+)Ojs8_W!)
zF!K3cuj*`E6noy^+RQ|y=@B&q<3vC_T9{>%F$s~+BA>fOw+z3M-dRN}YO6)Q_|ij&
z^qWoA-$eUR+MHuM&H^R-2rHnjO>L!`!$|C~#AF~+S?`Ab0K&1dLqp$=bA#7APK}DF
zSQ;v*Kau?^Wpdg3R$54x=%g1-U1iG1=T5c_|M;UUY@WJ2$)^wryDY4z(wH0F36;F`
zHcSow3x#I3QsRKN_)+LcDU!m~XxIHpA#vTa6@5&BNa{26ax*IXCeWwx(-*oWHSnM4
zlpQ{@hv{H{2Gu%8s+=DD!qA%@?4dy=2b?kLoLqIhlJ-tHhTipGbfhvV&?dtia!#^{
zyp&Id{0kF>tf#=V78Ohe{zz>KnSZeU_|2XA)K~7RIdO++^LNK4|4UTz?pu0$0+}oY
zJsCY;Hq|FKkDwl4ocA-rvx%W{;V#-Xg64)zn?z2VDp_Uz^ry<&cYT$RU!HTs6eQp8
zL~QolW0bX)QH>-0Emq?9*2FUG?{4}*+RjmeQP(U{2b*oIKgMR>8n3NOmqxNyG?JzF
zf-||)2~8X);*D@5bE)EPr^tKujdtq=Sv`CE&r73@qd9=(shI`=(aE6%7UmXiB^y~%
zsOx&fsYPiNxA+u=QhjP+ltFDy97`6|xg+M_Bu{ZDiQ*Oewg$Y=2F?R?1UpPZ#>C<_
zo^U1RIsu+IcY^HSxkb?VCi$_H{(0z>`;xO%_@%EH$|&@VM_VD%GaO0?-;8hi+es+m
zYHgH30&i~V{KXXwalwM^9{1Qw`B>NM{C65lL(sg<O>qHvB{`%OIH6rkn%dzg7|aSV
zuyJcArdrZ<ZvJBEmG6<iha3<2lc_$CAkgB3euiPf>HdBaPEdYp59gliKDUBVTR?Gl
zw&6S*<Ag&6n8BjxIHK?Aa!)#KSB#8AbQd7v8Y*bIUt<TKD7l=gtkz#X&g0JXq_Y0#
z{IV*%O0lkD8s?~9AX~?;Iy*0oxe0rTm4x}+_<0S7U0XM?oB6|0(+1XOy?^9BGFC76
zu%B9cR`0d!X&u>AsN|+KI?{ZUuHq}HmAnmlivmeHrB*MME#Y10&)0I0ap>XoI$-v%
z0%tvSY>Kl(`Xbu{Qgat2W~Io>&v~}QS$obYaV|vYiT98<QlP7+;Df6i=R27DZ!wfJ
zszh?^v|$l|+dGOLw2!7mI_B6gc*+MS&v1;JzAFiBpgxAP9lG`GKd?WFxr-%F>=|9j
z)mAk9pX0mf53OhXML9L2i35VMVc|hJx~~IKyC#8;YArPa5t;rdw{exD99Twf-q0F~
z$E18-Ca1-$65e54S#1wm%`O9h3H{8Nz93jy;u1g1%8sPYsFIcyS|fR|?-YJ=j7DOP
z_1t0f5`Q_`k&XsuV;im3-Tggoy!B@`upY+&qSxH(Nh^W#4=Rkn#S<6$(D_jDt!?Xt
zF2Z6251{e;)M<ZfsPq*Uaal;T>iEMaU*>4)6pmd6xp^io>AYUqH*ag**0OWNy+w0=
zqMNF>l+<X2+Q;%pP#gzJ+N#MZ>?*2s1%97oFt6OQ+U?~aZtlfroE6#iZVig_?X9iA
z6NU&DC*-W?WPsZ%7Cxs!i%YdT3#ue@VY7>zSvao1q6Ty4(Wg<956fPEV-B7{k9t@+
z2PSU0$jfbI^JinH5gyaEl^rPtL9QT2V!yw>LWoQ5FQ7M9LXOydx0_wh_dKT`s(db(
z&um8U>MkWw)08j2aKyv8)mv)o{t-U0J}$p4?h=4~Hd~D^%?mJoB;<<LX6>gi?PSG{
zRo|CC$7IvDzH3?hK|O*w$BmtrfslmN;?6kf^$NV2!wQ>C^UKq~OBR$|8dcBk8yG>v
z`2!`!kLo4t&vVR>-kJ6Ib@OpE%gp`Wf!}I@%wy*~3f2#5Pu^^~_~oNK)4Idr?%D@w
z9uNQ{U%b+yYZ4NDeH`9RL;w^g>`;XEiwCe3(aqBu<8FUnMOYiVSEUT`^W!}tISw<(
z8LFB>aoyhq7Wp|t-*~S5JV=^BG-UL5u=e4;kchlx!JL9uv<@rVj(rh&4x6$5)`aQn
zqdB+nF<G5gH5-+!#k1%I1BK-a8p^6407vj%Zf30xz#L<x;sBeE75dS7Tz|r5lp<6=
z{na|WmHEsQYRNlPNo<0K;z_LA4*b)*HuLgbm-ggT7pDoYk4r}pr<Wb+Szz>~v^w2!
zjh6p^%4VkCHdQeCdO1m^VfU_HE=#F!08_Kwaq-gP@7LD<xDdrvJ=6e@)>!n@>%;1A
z!972^L-B3mW{HiK;9`HwZ^0Rasjt2LvEJ@vlS*u(-7-?^_b!%H?Yg<tA$R3n>Dg(9
zUw<UV5rJdDR_&v_2kn~-)#I!>os5KiRT=OZ(mI(UJL7ltF|h(_@Ig)`_$$)hQIA2K
zsa*1>ZEHf6VfHVEY{1_l9f|J9QRV$DIrcmXn6n7oI4`Od-<G_s_Dj;2(HRC}m6luo
zuu6jI?e&Rad9oZy(E_E#pr#@HQ32NrpmHK|6}HA6080X)N`J{ot%EN&6wzvV;YU6J
zog8v5$boM;s^5AQ=7jUAQ&=zyS5CS9?hU;Snk^o&2O6$a+*2>G@<*1n_UsfqB{JUp
z&iEYecs2vxxjd%EQ?{eBLc`)*E2dq&VQh7GorAcy@D0dBqH}UomCnU^KOo&J(MGcz
zAwJ10eu;yWq7<8b0F6&Kf8tqZg}qpI-rPkRxRmYn!_V=zgagj&N}BX9VxX$xSm}m}
zR3E^x*q?p+4<CsVKvK>Vla(N7j)#XWhuq0!=`d|S^m+)&t7#g>V)H1>^Ii+<kT3Z!
zx&@XutL5aPXG+%#=MsPLxC|@wzoA|}m#QmDcTjQ3OBnNz*gi6@TJ}7>KrlIoTs+ca
zFc+Q~e>EkR9Tx8dDcX$9I6^$gUb(P8jLwQ<m(T9xeDlzUvR0mXm4-PwWhaKxy-FA{
z<cNTO=S_{C+?%;+Ki9nV#!rce4tVt9Qm|bQ&8=u$){#x`Jp%dJP}!Ur%jN`G>&ioN
zd69dqmSrL5Ey0W?3Rw0jTk2bP?N0>lTfZp;8C6!yeEX4p$DhQ=<0oek0tyhO<JAbY
zAapb69|5=eC>!eJ%rN;}WO^vw<DHLEZwq#e9HG|luh$Ize3yTJ3UxP^o*#0v66JMK
zm<91yf0-Bah*fSc{j8>7>IG)Gzgi?$*tnPi0x72B1pBNb$?-@EJFS~WUCHeT>XYjZ
zJguJHFV<K1@tI-Yd<KB~b!3a{wk|ftwvibDOBwdQ*6nH}0|_igy*JDKUXv4BB9f_u
z2Eqgnw&}kVdn7iy%TkDwIw&kQX`R)!mH!l;_6i+xB!^2pvm{%8aDty9AW2GLX<g?Z
zN^I7Z*Fg>@?()=pU<;K&84ZE!Vc-CQOnPt1>1n-CbMW~0mtTOn-to{O<+Kj9&O@Ib
z<%<Ia{=xuy36uP^GhSAywt*EZKbOIlmSv0cr*F5F=sL~=2luycdr0}P{}7$#%5PWc
zGLvzb?$f^djTQXW53DD|d21WWxfk0%syF{(GfOVR?JDjzy<dkm9o=JF0aH@F-tDX1
zg?@CFyu5&2M8rXNzx8XeH7Qzi9TPSklOX!DiKH`=wyZxUDL-;UUip_gB@<4yQr_hc
zIh!c=nxd{MV8;zbjlTRK@-*FVVNa+Jno~e|D)g}53A6~OA*5Cq&=6{DT6^xD2H!v6
zGtaqClBi(+`(x9-BxA9}&FPfBh5if{*sN4>fcP}9xWQ;x$(Qx~xK{eWiyCqMefI?a
z{??q{&1vbm7Cp829i{u~1qgpE-;4c2?U*AWP%^-8*#FfUouoODbjTJNpZHXBHP1s|
z;zXuLwn`{@V@=*Mj)t{0^?8t3`COu~c-?jJ{?9^en@80{*r{=q$Bguz-No-(<=<Vn
zqbNW#8wSR>Xzo|9LG|)?v9fP7DJcJWbGn+n&S+sjNMvHsDXnAYso$w}4yfr6NlzEO
z^b|EcNAl7`eWy5tQGF5HR+@CTG<n>>$hRD1A><8|=O0U|VAbNydERj&H81wHvUvMT
zGai8!6J2sqhj+Et9%_Pt_5B4lrw@SM!QZGHvry4&$(!SZo3X#_kArd-=+A3NBBg-;
z@>nC_KBNvxr?q541vu%Sb2*Y$9kX&8Tl5Px_E2W$PV&{?5TBcN3x`_%H-~-ac_apQ
zU@%X|>Kz)w@Y;4sYQ=S(d7jEnxjgL5W$9(9aOhiqwI}=Frpe7wP!)+y0?_dx6x*zE
zh`kRItiY9N{E21Lxr1JJS*x`2W-#Nd=`($c+&T~RZQSl_1D7i{<T_32A2doELfrP?
zgk@vLm1?$mR2E++cgW$(?%+sU>bFfT=w9jVmk8f(=eO-D_;;?&#M{di{?@e9RLZov
z9><%3)7mW^?gla9)74CX(Td<Ow&$<4^d@wAA<lrbzkl4<!gj|PS)0kX*B<=M`v&rh
z#ysL4veh8(Y?+j@09S2L?4ch}q!849N%rTsyYKpf(52s*CilSI5AJRjwK94J30v9c
z#x43v1Wz2vOD{~?=QOY;ZFT-1F2Nb!;-L-kmnY$+#1lZ*6%^SkE{hqSW8%)!W{>6(
ze^tGXC$2A^TwF)Nk&M|qLIm~ghtZY7p(IKB6aEKtpifNrE~J_fSW%=Tp?dPf=1o|)
zDet+mc3MzF75bq?<oW53%xtg5j9^DHCF}=3Hl5D6&+RHpE~)J*)}F_%pX$fcK8Hm2
zo2bE@04~O2_Y0l43F^dPSL2A+Jc2Ge_$KNt2R1#Gt#QvU46C-Gtma~2&2*s><$7wl
zSLCh11oP_zl+Z*Ur!|mUBw=)j=EVP@J(ayXkEl>QH4L$K$aYMvZ&GXgjB~%{v&la^
z=ZFf>&~17{Lr^!*-BM`OM~;~YNU-SwNqCU!1+FAvQz*f8P1#-9Cr$0yt$7R1+2gyW
z5peN@Rf5zGcEFUi^@onqME@vlo3+lDcc+1Ysh<7vDrFuFovlK0AQOP~<n9QT?RLV2
zR%t$Iq&O!FG)+uI_8pBfSv>*8z2E1!goJV_SIQ=q;{0{@2c2U+F;S3$EHR9|4a;*K
zNP}z^9)seJ(jWbkK)$|Q+aTR76b`j}=A9^QHA%vRzifwyh!c)C1BLfIXz#^Fp%IHp
zg9rLrdt}M7t(Mz8aVlkeaYn<a`8-d^X%5z(@-M|@`e(}h{s@qC39j1}_is+`DyBKr
zQl)pty_fkfc(7ds@cLmLBK$YlaeD5G@+fP+iF76EUBDu@@R@nHDzLC;+BP~8b7K19
zpk3v;>TG+mXnNjCyULjSX{|lwY0Rz5=KS>WGVyyF2~D*VG-+4tqan+)Ge1$Ep0;|R
z&ki-xmc1>8o_z7pSA>$L<fsmDk?6JSEX$N*kf3l0;H26CAmw~`W0Doq5w$+q+fu%j
zg&H@|N^*a_oGHi%LD?PldW)iJudr2o1P%RU-u=bVFdBjYmgR9j6IA#D>ruJK&$8J-
zsRSe$iw6HU*ZXYFoM(M+YG0D{P_~N|N2>Gg7WmO_d|1!!!75(Vuaqy2#DNh}&DOKw
z|9iC>0&u-|8HGNcN38UK0htc}mCe<M^&WoYpfdZv<-*17Q;ft1F(*xedf_VT*{w??
zlp&x5*y7$3(z-tR)`FKl-FiE<+p3F>(NDC$PDa4%et~h82FvC)6H8r+iu1>)s0;`3
z>D}vTHFcVe@{5L*C(O<=pqNJHoXvh7mjR0N4tqU^%FThk)e=ay*^g4}lX--boc!tg
zBz}7x$EH%`i+_+7pVo7+X|iC(bh2!0&Sk%T;vqH+^uE=Xf`bPiAnV`qxrXK5J6xs>
zLago?&+j_+?_9;kjWC0Ijp3bp?|nAozaHa;iXo5Z2O*m8QZYtgF4Cxq0@!WTa1NiX
z_PglshQ|pKNy9fMD@oqe-GRFgQeMjr0m#nXFiWXHH@3wqrMKdlj_D_^>a=s3sTbQ=
zCqil1e?cG1LrbL03#{ec8jDsOp(lS)1e>;-Dl_?qv7UHC7rw{dxlHs4n;M7L#;7nq
z?o2883mK9Dd=|HzMBAxD0R}-ugTWq@J2WHxpXQjJQIy8Bm<qSENN#Yl-quS!hpdy$
zwX4RmIR~{<MyrwNiTgDHc3L+1wCzj{qgiV5Zl*LUgdS__tf-(0QI6xZg?&n&b|%=E
zy=}2xM`(rOhTJ2Is^Smh@Y@%)+IQW)c9RS}VH+_AH|uWf0E-t#f)bktMgOQW$Wsv!
z(dr7B9(OQqCfncmEW=KxA54TD&oW#Aqr@9l$X-cUhVCmF43u%KS^dB}0vQU-Wut{Q
zW~4kexLhr-#a7&p8ye{|8LTknAf~?(!`Ae*Gu_ca@0JhM>5e%3kFc3ARH<?w@8$k@
z17!&45!+MYTW4sLHY#GgIVdTC^ey@1+2FSDU|0AUeO-6V`_U9FRE{1z%`c)aG(P75
zZV*`ibdCr0Gqmm;liU1r;eLB-ZhF^3pSt?r-BFLp<pE_!X*E>h3=Docd4WXw#SGO2
z{A?Jm&X0{@UF9w+BM0U{hIByP2UJ`bKx|_6Yj>XGQ9HlSZ$@fP20fBVi~A-#v=w{e
zMj59)ked!)335GqT&_{Md(U8&EZDR?gMqo<v4-!M7DW5Nwg2l^m*0&6{|O?A5Cy_Z
zbwrKrwR|vQ%H0-jtKmnhCWPBGxt>>WjKPY1pyf)>SJT4V!&=0j@#dosKLh&@i#EhD
z0C^mEH;-9vPV@7r4BSQ8n%r&h4gEz$i5?p)H~H`FyK0bhP7X6Q`|+PZMS&8P{2yoF
z>S0iOOVt;f_b*Fqr7?Ka9Y^uGZu-!rT7gQPj~n}8-7A}_nD{$WPBz=&r+#g0)pnEc
z<UGj@4I$OE<5!IHHnne}=>fmv8v`Rl)_I3-K92l(3pj1WMFHy?@}8UI;mkh&_yWUk
zC_`7t4+w#}!1J<D%LEqkfR=)@=7rI@Pls>RFl_%#wuEo*(6C&Em}HWt@CzY%&nEwh
z2-~`;m|oFg-#2#cBc>N9$s39h$xgEm^2eHZNqD>`8T1Fnn8q`KpdUG?8Ifb1lK6#~
zrmiEYI)G`CVFfnnW&eJeKfZ`u{^lQ$Y0LSzMr$085^knqBLPJ*$xbCia4lYnDOPf&
z#vAjU(ko6aVMX9MSt#B26T;VUhG^yg4!qw!Ql>P4RDF6xIvr4#Fm!P9cy|A(yONs~
zMDw4=yYE5S1<bB1GYz$9huV8*Mt3peD0Rj1&RH+?lnXP=)P2HUFY{-VbG$HIa(8Ee
zrAi=P|J8vyVfC?_6>d-~d`zP{6Kb(hGiHxVj?z>y8FPj+5>F>-moaRZy#wW)wZ1TT
z@Jut}W8${n)YpPU-!fyX(r0BsA=b1uWJM3b_yVA{TKGeX3K+@Me2>#Rl-5^T>Rde!
z-O4l*^?7?OdTC3|_dIPOw&WLfL*sCF880l+`j%~~2>tG#=sm7DBUNU0GS69oFPtK|
zxMv==y()P+bzN_Y4E2OOk>J(7PSuQ5Ce!L-IaZ)M6u#(U_^fAcjfu)WO>9SZ&9eaS
zS;0!7(m%PIA;JCW)-ic?9zYX5HRDVqY19&*tks*cLv>RVC&*h#dOzRp`R{`_GGFBl
z*#-;7FQ(C8I?|)6vqV@ZB=4^L^=HstSu~NfQDNiTWpVo9A=)TsLYVF6?T3(Z+M4~P
z-7aSeJH!4@**e>itzVa3;P4iyKu+j><LMMg6lWaM>#!CE9~ZPV_uUTvV}YjMT6RMr
zQ+?5s&~dpxvMh)8T8jaZ)Uq(=-^zCh1|&gI)?O={qIy#gQ2Qdplr;{T>^Sb1YAi&K
zuWYkd=c`RTkMjLpW?e2f7hZnue$sx>S4Dwj_Sr(Ze+=UBxaRR>#6bXvcT#EZg5cZq
zTaqH_A)vqy&pyLA7d5-sO-RuY0;!s~oTe1F&Kn!mdJe6aYSu&aU+sx4?It&!fczFP
zQYbTYHL5keFx^qN-xh(i>~|5`?7L5KTpFgbd`-E2a=ppPjss3`kn`p?+mJ7O8mf|g
zU@n4R7iX%Xs<Z??ZfKN#^y9cH=A)%v!1G$oYt(Rn`qzsMg(9~NrXEWUHJ<&6OF>O5
zHFVwQs-v9v6Ni;)e-)>WbF28`!HaxRF@na_S3471Xn@1i#CJ#xW{hN^TC;uJ^(_4z
z?@l7~B_Fp~X4h5qPlTTHn3Z&T{;vYE^MwQ}zu^eHCgNE!si;~u(xKRlr!*y(RjcWi
z{+{~L`3*Z0Xlh=6%N;tP_L<fGNf17p_)?J~A<;WVja^_*Tw(+1gwE_%VIp8KTEKEB
zn<nu07s|XghhFTEb4qT3_r=dOy;6_Ps5`_26hHOxQSy*%&a&p(H~O?n!PKp~FqUCq
zDO<qaX}1Y7{RksJa|)He{ilv~>stoaoq^VKvZ7zA_y$Y5y01^$A|3z9E@DgxHJyC?
z(g904C!naXW`IJ6Br2T|J;0t3Z~UKe>QqPjuD!d^nIfdk;N~WIyrN}{;5I1UjEt+!
zP2OcvO!HTQDkf(NQCoMWtV2u%<B5t!z{h1MqnnG(di4I&Ti)8bL=qc^_7)1VDaDPk
zJowrDKMbO{M$WWxCp)*I4iX!kqUO@txU3LsW^wguGFD~Q9_TeVrOxk>mAbZ=QUbIF
zO-@hpvV1bGz`!4_{+#F1Uf3P)%a1@s57-pSzT-pdqxm`F71#(KM{Wd-3-U<^&Utt4
zbbGSh2*B43-Qys>Uo)X<-5OjR$&4E2#@h^Pqt*_oDgHfKKr*_L9ot2=5zk)n@o!|W
z-!=`|lY?5Z;4rTol_azA4<4_Qr2sbNgsvO4_iIKL@esx&Gjp2OAM^EK?}izIkLy!4
z4{HU%lzQ>yW{shy(Y0P;698q!uau$3m?aeE@(r^zWc49gmnMCB7N~x;V3`<Kqpb>M
zB?Yt=mRwc=6j%!iJ@{hs@%~6yP6|!$)yCA$({MGkTUsSUMbu!dN$52ZW9a<hH-^eN
z>F54E&gS3$ue5#VFb7N|^WFGi#%n>`=grVG{Q@uvkp>J#mX`z&<R`TSo)!E}R+ZGZ
zu4J$dJ+QVBDmqO}t<Du35GM=fbTYpR$M-C;Bn-024?4GI9RKVC<2WXri>@H6KC;>V
zt)^L%(09QFY8cYW8>}G>Vq5p$V%eT^v{R;iZ0b8uKy{ed*k6$#`B+kxU8fYv;e5j|
za+GAV3y_%HeTZAG5pJdystbJcii~~dCBl8NCMcZTPg6<*@KK`Gu`qi(5}HnfbC;^s
zqB%Bs-veheFIDEtcf01n=b?CDC9m+Or=oHW8;_I1dDF)_O+igqpjRgoR_?Ln8qC7~
zQ9ui3gH~!Zg1XCnXTP`CC-($rfoa4kk_@Pw9s91?tki8zYc9<dDk!sdOjY*8J4Snf
zu}b9N>b;-3ii5u$>?3;z*PyiR^n>uZ^ml#8{cqeE*0lAkqiqsqmZO=3XBf3`hA1}*
z3!b3|5+~tg0O{nQep$I|DEZ@vmIq#;r^vCJOg+RYmAX#P<{%C3OQ4x8Mi4{r6u@L%
z_olva_oinfJmQ2fxftTEenND(!;7nS`{MLRw+heDQ`Qjp4ryJSP{AZ_N8@2!dxOs#
zn>(%o2rJ-iQN@N?@&5wXQ)0*(>!!$5ou2szIM06Si3iE9JqzpeHopj4?sLxf!v#-t
zer_-HBc`!6v8kVph`G|08Igbn-(=0X2;Yu>B$L%Ix1yubV?0^#WhYJuj$-<0dp)J1
z8ydpQv?s}<CV3u=VsMVjXe!n-9}ad>X@JU$|Eas|ae4l)8%T$n=|D-=BGhvNK5Sv%
zyf0BmN)~&=>$qnTZ4VEUpn;J#@eV~A!>SEpBxJv{fQ-5`^PTaOY@kk1`+p=|b%8`#
z3>(TFvf+43?S|lMRgAWcUE8j9yJ$WUwxy-DsJc?KPdX~3>R@MCiqiiP?<^$PFdcHr
zMaxhFym5_yA6!?IU_iabWYPv*xRKP0R=?)s%Tuu5_SaamTa=C7Iog+A>-(626^osb
zuh0o(8LKJ<xQDC`9N=F((2CRuH7?@Sx5^)U?s_{I;!YX8w@AVAB{H1Np~@`YW3V$|
zPT6|S84fW-ZQLwh^Gf?$+P7dCpm%K&jr=Qap!L3$G#eVoXd<2;#OGn?EM0<dMhTAF
z`S_NhoDZoz%Dd?u|HX5A>a%%cs-UiWj(Sf5FB)!C$#=1Cu9C-5$aaqA8g*_GSv%-a
z1rHrkB7NUE+*m4qC|ivUiGOt<NyQ%BtTx)tq>qouwa7?t!Q<*%jJkrGW$?0?E~cK~
z1dm5%(`L%3n}<Z2_?G2nNe{~TF?lu}yVJ3+eVSKIq4UiJy{TE1!HNe;<?iZPpuYt`
zULcwu1<NPYJ+RqU%DRMD=U&r%!NvM*;8Zo>mQSnF2M@?RkbH{h6@5w*6Z^$CQppXC
z5z<XtmL>JOBI?Jv#E#*@`Th?<KkOB`x<P9%I^Wz$jp`9hP+`e<us2p3r;-?o3K(xl
ze2+X`G2piEVi6V3^gZ~iRnrad)iTCdeti^-dknt89UQj0^pY|kUwon5nc4Xp0a4*0
zO&+pB5-8;)L*Ze&$}fny!iI0r%DOBr`&sJykb9N8p&HKDgViLUcy}b*xdj6cYN71y
zrAai&ndZp{M=(^)Z@T2l=EP~*7oF-l0<wwF>&l!%Emwo*5k@B#cY&MJPq<wa-98Dc
zju{x|p%XkoS-x2N7y^nRI-z-jVw_9q32!Z%6q|f&Q*lGnNvkK}*uP2pFpzz`X@Q2|
zx>8e1s{cGA{TYFy?%e0q#~>ls+?RnrgIkwsEbnc+3IMO>*{IWhcs@So-<M`L{o=^P
z+hvdG$%DfMFHr-gEsMwZbaHGnzD=mUf5m*)kMoEh83N$%j5wXB=f^iqwD1|#2t6IB
zg#>cf=Z7Pk`*xQ^e0Kw{7m4*QH>98JtfqQ7`*{9W>KV~fpa8mZ2#$L|_KNw(Nztuo
zXo$W}rg5z$Rkr5qM<=AHGE@Sin-?->_TLdz46C_;cNV{#m3T5N7sf@E-0neF00Z3F
zOGg`XShR=AR?9NlmO89JR&~R#DZ1<lBC^bjmn=I0jAM8Ysf}pAu{O!zjYSB)>ED){
zZ`L6!J<Cn`3(xOc?OHMDWL!SZk!3risWTEx?i>s!T)COrm`*zX%uSIB1Wq2S<dUAZ
zZ+Zcr;;w_OF&3nY`l#gR_k$AVuC~^9lPPrPFb&P>Qmbe7(H}<mfM42-)|~ks>M@VV
zL!H}h+x^@Bpv5-LuX()0?PElbla0O&8%*ndbGGEj1aq-mb7gM2uvchqx^nOrcCzvB
zAjk+JA?_ri@*B^y31zhnsNBl&HeqX^)2<`tgw`8!HnHvUWY3#_9voS#)@?UhShynn
zj2v_Gr%1srVyKSsK%wzRhPi~qU9)N=-gJdnsk}u7lQje*i>tG*CS&AVpGc&=o^-H3
zO8U8@n0Dox@yD4gPSnDk+>Eo&fjUZVC9joV<i*|n@NegQ8kuw_nOmyo&cOJYPO6It
z0ijYr{tMvT35>Q!lUa2hWaaxcm?-)yT(!#c-+3;Z{Ht;rQO4*dh8hcb@_6qXeWmlq
zGKfXy3m@?Jyz{NXzJk5X&lNo+J(yX?*|e`fJgBxPF=sb_mnga4gDVF!wKXl=%odLZ
zM^rxjz1u7hz3*y@YrcFu3)I+av6sV~1KoE6Z_mHE_B?h<nKuS_^jD3%|1(FY*fkBq
z)wJc;7eo}2eu3|hqt}?^L5HV7ytZ2JS~vzqDRmN<m+r$tk^g*<zD&s|v+yHmW$KVs
zN&eJ3{GGNNs9w~|J9Bo0Prf|QmMvQv&ebvr8($A?Wugy;K$C$6dcQoH-L-!6u^97|
z{$J~@5@~mc_SmcLeQ*a|a0H$hhNoS_XxT;s{;~`V>p1-29Q>6b&1Ng{Wg>6G9Kgt|
zz=Xh<&@=JYBPlhK<|+W2pdtK?X2^`{idW~hAW;hUfG3<ay0o>VC8KR%39x4rtI5B$
zyuP!_XL;~_1S&{<ALGz|KiW-5Z-YE{Fj!3r7}4FPnML$yzW9b6U@!-$SPr&pAVhoQ
zL|!;`?d?nKn>C_V|Gj9_(VR-3JQXJa*|3bOHCI{H*mh)DjmP53`7FSyM4F$=ld2#e
zaMTAlBH)w}=5PL(fedZa+ms*IzC(ih?*NkbrV<Ubs9mCP!14DphpRErl7l2&*itQ(
zhr;}Bp{ZqDPAtQQCxS+qV%lh{euj=j9C8MkHrz1*^{3TA-mULxy`yB2o8r<k(+fO1
z|Lb6z?F?*UoU=s!N`B{V|HMf04*Nfsqsd>-CI4mxz9_*MWIaofZN6N<#UIr#H&G1W
z_`X*#_FFO<ldzv0mN*XSKcLyV>LCY07^fZ>N`blD*q@A(t5%q$zfV9qOfhfXH5!l;
zBS$*Up~Jdxq{p(%)HUUrYqT?-+ga1&RtJ|GaJ#+iKzwWxmiDI)P-4ZH84V!%6^1|6
z_wCmE>kGf&d$_=V(iy77T3n!Tk_Bwdefh(;_8gV^s_=<)Yx~#o2hqohHTD{b7x2G&
zK$U~GW~*@8>q4IA3Xdvjx8yJeHoR-qPGJAIcGJR*$L8*~T3NY1<<8`KU;AIH_Lv*L
z{40YONrlUo!%A%1^!OngULmKC26(h85M!0z?Eg}MCWyQe^C?H5@|G3w-(n*4gvc5m
zJEMEudS}cZrKCq}31<#0ti7_ufO$Z^KlWt5D`u)3XW_*d&w&-_%1p4v6qAd7Y4Y#g
z9jErAF*p8~GZ!0sy-*2-$V?%6>QKAm%^oVO8>C=faQw8wvEdFemyhq38pVruUVUh%
za&)ofDd&_l%><PWpqf6`j-or1tWf*)2R|XXp=3u4F8Pe}l{YHIK7=J%nQFjEcoLn@
z#gEP%@X<kO65pK|P&(r(cQr+g?l_~Fx+$jYC&>Ir<&zf<o@l5SNCvId&=vZ>DxmY3
z{Hbb8%1Xw#5LEv5kgq)kS)A}_UhpCxV`Pk$<E|I@GkO=;JMOR!HP*>WLjTgDU8)fD
zJMHPCJIRQR7Qym$H4Hm*hAw4j+Sy`Aica%8r7vjB(tTATf_%wcT$pPoeRDZm%(qiP
z5g^F6$6od&+w2o74^oUz@AUA5760Dpml=Z?zgJGQ6(m@v)jvG1FZiJHkTX~+zsq@=
z5LS?02$1x_Feg<v9^Z2(kt?h}^TBi_FaOU*j*RINP()HRq;WKWkJ`_g@Pg}7GOm!6
zNLHQWLVwMo^s{c?_vM)=HD*y;m)Tgwv24m|qnuUEl!5>5fF~psg-HtjVbxyQw+UTT
zqpEpuLbPd*P~z=8Sl_Mx<!nwWFX?z51cWYDc3LR?#g!znFzzanh(7(^=+!5HNhb%3
z*YjK${-U5;X<R!lf^p4s2gIe9HVsV2Y!?@p<kVM%9e_5rHZzzscY8&Dsup^jm??6B
zA|P<;frEJYEL#oBrm$Evi7}R|Xf`N!B?zhKNGi0n0@%8q!s)P?k=uk`;O-f%GLu)|
zeUul<I^<r6gt~?FWfRUrdf72TC@*R3vy3NZ5_WLy>+4BDt<L5cYm>VufnI!-BC{HO
z74O0Rxp&XG#9dw-@rcU<dUg~9=GqEP?J8xRZ10^x7H%DfA^RM$k=J<ZPnObC$1|q$
zpo=C%aLpYZu3w(X0nA6$nWD@YM3m6~As{GBkA*P(7oW{b-AWsCn&asC@UaxDb#}1O
zUvPcDeE*WV`U@O?DdwjyWJAoPD)xnO!@jKcFFiZ<F~H(Z>Da83+z);vnYL#a7+Y?l
zAR51t<t{fEEr72SE%xhxwbJ!t899_M_{&Em52@a-!|C@xC_hbRq<SN-AJh1)w%Rcg
z-ZaIm$s+}iYX@hEUOv5E|2CVn_9Ct064=XSR4tH}L)}E(^oIKeVt6}aeCb@jd(>q1
zrcF7f0_!AJbk<BW9XF%%V3pD}o_o2x(5&3Qr`a7om`Qkr(x(y<#lMDlFx;x!<It*h
zPHUav1HjBhpEFI^4SfYIQssdbfb|Y3iXglI(#2WQz!_&X&PKH(x<^_A?xIGQ4;_V_
zSwQAFK18&)j<t&8KxK>RcPNWlW_BLntT%+r#hYilP}tzhHbRGxZ|<A!g9TZ{-Kva#
zXJ8bulE(S(k)KiFa<-3{ktPx4+cYVF=`AB$rb<<hpxNGhP=s<b=Y2z?Zs)d)D?Y0Y
zqH22d$hwuJpX4kg$m&Qgc>6<nT37!)o(L8Z+7D2!iS5=toEGLW#=Kvq6_VE7vMl{%
zubHK8v-zu6pDQNgN|29XTgwCec_H6*I^4+i3YQmTi-VO?PJZ!F!>OnLJsb{%_mJH~
zLbRXQAFq=Ia>Od}JVBi#`>|!6^X9miRgNK<jiOc*am06{uTaLJ_MrwG2njyEzA|@R
zVm3HLBM^kt{0-S#`<!EycK1wm8%GVkeo7pYr86HZi|}>1{f~1NrD>KDQnF1jQk;q3
zupic*ZuSxLx-HNfU(zH9>=#2o%F)FA3950DsSY~lwmJT$@V~^?i@4^&MNJ%I)DFfT
zb)Bk*#wp+OHr&G5^0*s6(6DGmO}SQhf4q~FAY^)X#LDF3{8P+q^74Wk0tgd>jI_fg
zH)flzn|nA^!%1}zSF0quST>L3&hn$Mv0yz=CY$U;a5>W-2xn`}Y}-Z6AwPPdPf^TE
z`u`i$^Hunz<^01J-%NA&wsvMw<N~7ik41dkcjbM6UEbu1qt2kR<QH9YN|}a#<R6!t
zQ?qT7n(vnT%p)!YZhtOiw5jz$l??uDoam%fRl%!`{(GvD`S1jB_rst-4`@J=PBuUJ
zfW!xYhVrw>^zI!}`&qgsU3q^~Q4fx^xHY@dKl;LX8lsirl~51)v`+2c3#bn!wy6(7
zTW!}xBy3$o4bmulx<;Mr9^UHC4R!HCKh5kbLq(vz*_ThT>G1eL)BbE(3z+M0L0n03
zZ<~!DI3S8ILbRwWZBx4$5iC{3?+f5OY{@{=1wl8UpV?%Gz^2K=hO}#6Us%CK5A)-L
zChpg@4{A84g?I5K&wBh+>R4-_m#;^iv3B?4c@kO3zcU<4)Qw4TnD6FBl)V=Z-Dt(d
zY~%`f@@>5i-7Rx0ve&R0^(a^1F>h^QS1LJtf%)Eol11f>BaAF?>muVk4~;5FfCu&w
z*HStsAbVtK+6w(#uGTM2eqseZCAVZw>YF-{%|pZx<Tw`J%k6bFw7FG|)Tc987PiA1
z`G3d+UpFXV)Kk=wV`VfJ<R@3A<oquk3bCSREJf=c$X!*EXcjZtdji&aJBdm&db_1`
z{*JHSKD9l`(=(qAzz9hK8&;C{MG^?rTSB<q+J83`br>AY!W|uJsL)8`RqSXL_c%F-
zTf)6}I@K%5&XVpV+{5#;eJFnp7Ee{m<wUIc1ai2N-hu=JKECa?bQh!NtkADZ4n&(1
z&iO}!@APJ;n;)J8qzZ)E7PXkPM{I=lXlKL{yqj6&%flsOfy>%4gU&XF4g)3#l9tsP
zAZb~AkPrHuMXiAu^$@i_@<FdJTPJWHfoMVfZ}LIh0{v(yrEYPzx|A7MgN}kK`m=~m
z2Qc?C&!v8Dwx`dN;VfIaO;P4A0gAAh%k02gh%dz4cKr#TmLJe)-FfB%CZyodA0WoX
znsOEp@jF3w3Z<>>ksdL{cxO^({}-4yT&BdcTlwsnJK2!p8T?k7lk4-ZDRG~YY9U#^
z$|(9v&6K*Gqq57Sv5;6&=;sxJDa=1pGc~1BrnSCvtT`k|k;e<1Tv0H_TzPk92uWDF
zWkZg041RcJ=-&w*>o=(+Vvz--`>wn&piMIy9+GSCBC_$hUl`Gk&{Ww8X4CE1T)$|!
z=?Zy6gTwP-k|D$rU+K!QopT7QXSq4#ur;B_4+Efj#^-7@lqSanj#_@ojE^Z+a8~+T
z-`QDEac+Weh4gt>qhz#V?e8B+82Jg8SB~8MJ*V{J#nq)Q7$Tg7PVshIZ7e`)jrR+g
z(a~*>0eMg==p>UQFhWWyXlnJ`4}2*shR5BN>A&H(t?7xqS=d#>pr^pr+f7t0_DlXJ
zE1FX7q;d-t8)_8FPjgl;`76+WtW&s}{8!^c!iI{v0oNn9hwZ@>cd<nWlzMFk!C+GN
z>YPNkPgMr|ACp7Z^+EpeRBE=~VYin$3wE%#kx>j@tx|qopY_Z=#n%KZnr6x3_9JIS
z--IYtUJ?bTc-4LLc#MWJfWfxQ;`uHZ7|ubUgCk+;=syYEZ%-^gHirrNzVu17fsUJ#
zPv%~;+>!X_e4J@LBULFL&rx~=$ME6?>9Zra!w^s2a|i;v)bsl{xC@+Vd3$PH`r!Y0
zy3AU^KUMhqmMak$Y7#q>z1>0unc1R0y$JzL^57~<DLeYhr7=~L_Cp3+NuFjV3#GKc
z-umy~$q%I~-NRhqWS^9HoNH~jMH-*`y{raX#dyTte@bKv&56>#0#h;O^te`+_6=yq
z?vcu_`hoMOz@@q9^j9S@*yN<ak;&tVhs)8BmM%zo=kafat{uVB!A@NtYLCD&Ap^3-
zQ0`D-$UJqqb@5`-Nc=dqH{art?xphl`c@<hM!WRd!|B;X<5G!eJjoPUEEXs9jKTv_
zSK();W&gDDuPZM}(dWRIqO30RRV!N2QJRShv^k!BMK7v_=N{;p%cLhnKv;paFO#r;
z$%p#YxdzmK<EE*?YGn%+cNf4;+z+3wYt8exi~Z-X^8(KVIwlH|NC@^pjTjk@$<ONZ
zC+iDSFlzR1Zc{Y1-jqkX-0<^lS#6h`&RZ|5XR_edR|z(E9or)$=6Rdg=}*W^z=`;r
z-n)Tjx{a(4Rq=)=7$C33gz56CLb=ch;*hh8ji$sHtLWxv?8f>pEPniOHj{gpkom&{
z49T164r#Xd*Gj;2Xk9@&e2CovQ(-%r@1f6M;SX<(Wz|+l50D}=$ItQ-bFN6yh|Yex
zx1StN*nMndM+3@5u{A-csXVS-<w>X`lU3GhgcdiAGGOG9YuQZdN`CUSQ!*ewGE}m2
zjz8vi_kvFg!|#%9i+@*BpgfCspwe?QWP|if4Nl+|G&PiQJ^65lBKn@k53M_wdaqsk
zFYKDlUCB`PTQ+`uq~ux^jH$+_PveByNdzf-lQ{(VuU#Y4<Qk;a4bwV31;3$w``(<F
z`^<NO5#T+xYrZbtUaaV7>}}{fLJcqKuU4jaec;QoL5fCvQTiOr27{FTd3r6mz``pk
z>_+Ylrn~$3=AqnCe5&4x2+e2dlU_!kQ|$ZVu(8G4={TF1k~>U~>5}b%)A&7TLz?aD
z+dwgLGJDM*RWa+G_F5Z9r8<pjlv;yZbz1owKwe>(6KWCsVBHtr*8LZ#yU_<vT`%W)
zKL#q~Tov*+Ydng`ekA?WsMfPL&`cHp|H_vwsl!v)mxS#$yG~luu9(i4a`4x4A?UPP
zE!&TvJ2}46tGn*G&sLPDbFVdSZL@U3b&?Bg``T5KuRM<J_~aD)$>GI+@Quu#{&h8X
zByc*AeL!ax_1U~h)AhD;j^?l@$!aIG;sz5(xrHrlhxfKJertFwUR|<jkJNE_dfEQA
z^&{OJY3QNteRBzx(uT|RK~d*`oQGZq@?w84x}oa%Gq4$Dp&i-5NSOqRv&l!WGVMOB
ze7bbt-#&l24Wzoc5Vi@M)G7&+!8QZ8JF3}xuh{5gUh!QY>(Q!s)ATkYtGMw;^4r$)
z8<S}eqZc<XYb6h}D4Nz&@?AG(OgC2E)U~n3e2pP)kOk8>@zj?uv_z&f-9?vWLb)h$
zM)&5fHXMi8M;8F!WN$B9V3aY&bn!x3$pZV|hckPmP&*IFAGbF$y9J@nhI4-d&9vYv
zbAqpY2mCg6a>2_3uNcAIn``to=9q9AB3Jn)X&r@L{;}7#K2xq>tNOkMoMM_1M~frR
zo?DRj3TY+G`LfxxLpF+=Zay(*7y3oliD>#dnpH?*O<E^}NWYOo?Mi!+DnDgbBou;Y
zjy{tp_lIdc_ML(a_?X)p3<G#Ig^jFH`Ga+@$=zjIq9!0d@uk+|`>07(3fkulC6il;
zlrs9;#nnD83Y1$s2O^hu85ov0FrU?l0WyiXYibfgk_7}v*@T(!*IqP}+d89T8HM?!
zL(K(MHD@J0t>o_^5pV&K(hR4pQIjjXpIN7R7$a=glFeLm@4JQpI{vqcf_{y*uhu)G
z%%dJ6$ok3YudC!$i6eWxKEy0&iXkeXF!KR<LpV=HjuUS}M0TdfeLdn0)KnIgy5*v=
z`m13bO3T)3mc;=Dt7P=pC3M?olw6cRBe>(_`-Q{VKStv<2EK1Fft8&eITlT7w7{gS
zD~tyGUgzL$vLV1F<!-pv+;n~QuJML;pTC;=cTJ_ZCIx&^sHMMuK7NiQa%tKfigC3W
z$XpowaVu$Wve)P#`Ngr?pa123>i^~ZYX=MYOKD``b}s3xx<FLPLS?^NQ~@|kBDd40
zU@A;lHS-u@I?U3^)t_FhwwiIjFe}PGlwe?;|8Xj$0$`;6O8D$&AO#AD)<!RJcB0RP
zr}&fx3mF498*6p#^mMvfXf3=K<rRJK^33v@)(j4dnnV?aDow3mRWUX;UYO;Bj;oS|
zB)ohyn3GRoXN8bCekSC3S=d?3p;9G-=fQan>RaegRCTx<)A~C==%AT<7MOY;m9GMz
zR{*c#PQR3!(O1g_trD>{13fUzgU*I+-gm0GmPJLOXp)NS!Dsr0;{;}uL}+vLeqsgW
zyu1<s?LhU-%2)Y80zspVY<`jhv&HQyL&9}z*iH2*z1O~NS#3Ks>V>LGK9gkygip=I
z#dpBx5OBU!&vSU)<M`ux!5QH5Ms?61h+fZrV3P6rWfB~^2NsY$cpv%7$D1(!e6<2O
zKYhu^d+>;d@1RgC`8F<o<26b0FgYtEO}|EM^y#%X(}<xKk*=@5(~^!M!9qt}jGIEN
zOX<Iz=JItPaZ5#vAIc546{Li)M8zkX%98h!9gsNGaOk{{?iJ=6uzQkaWiFYn3B2CT
zjPntC_|``T=^1$1>6UQa%KAp)D&0`@+=J##i|o`CaN_}eV$aY*-n+J851HK3FVF3M
zA35!uU&;fGigKyuZw`mmIt6@0)V))0!TN`N{%jn(vUc|7qh8<1I~-dUJZ*g6s@@`4
z+I<>kV<OCP$iLTo`_6bvv)P#j3EZgEyH5lq!VNSsoQP}54rMv@50$h^b}SwWq-qAK
zef7!(v8P=WZ^);pFwQbR9{D$#Rs{6*NoxUBINeebYtPkNDg)S0g2d8E9d*8nIg&;a
zJn1Yw%y{eUNk}!w9q1hj7(iJeU}!lODkN4=H0^^RF*|*Qc_*bJl>@+|Psi#|q@8C8
z!-(9}Rn(;g!s5iR@wD!R#!ptGI#5?RHr)A?uKNjz=?Jv+zcP9fntE$1NXErFjL0%9
z@{OeNdCdmJ3D}q?u%D2^5#aVQWwWBb^#kgBz10ee)BlZpNmH8anX7<OQQuCJj`BZy
z+P>yvK@q6@X`@vTWW>n~IDUQf|MB%E@KAqW<M=S4$S%s7UDjmZi?JnSCu@XcPxj?a
zi^vwrz7)zb_I)>HP+2Br?8_izEJK<ZS^sbPe4gj~{GR9apO-S2_c`aD{hoX7y*5@B
z^zK)(p<ECGZ>S;au^r!#S^iDF^(-5WFimCcgK|{Kn<{4pPqVx+fGJ31iyXs<$V280
zDF@P{h`3L7=}Nilq;i1`%r19nN$jDWy2|f6VjSOQlT-<h_jMyL{jrWAjwbwA5q`;s
zPYdLqbYTpQ)Ow+S1pYkrl$s3Wd9jS1Pl#>I79tS;+;OZLx@`^#fK+-&RvH9x7l-pZ
zCK<_P-TG1R`OCZ?#OJ2p{Anz#CiWOmyj%=$6!R1+%@Np`j1ihm<(II(h9rU;V4!hy
zu1`l4B<NS*oq5BZwAHLTsM2uZ;W1R{QF|hvF2~(@PF>(dLJoMPlV(|q`G%c?aJ8w{
zz5(KyOuSOG<yq82rzq8B1~#3*f%|~ov3&Qu9(wz{ZM`eP7a9FoLeQ&DWy`{`aA{rE
zF*s%XYqoz3R^^fFJZH?{SF5-qB|2PJtE>*K#ZDw+WIn%F9sL$H#ySCZVu!lMuD2jG
zpYKmS1$HBpO-WuDSYH_)P1vRhFf8y4ZY3&=g=H_*2RaVzGdm8sKLTkQF==+a!n1un
zjpv-W0ORM*vBCRuwDPqL)r!k!zv1R2=qZ+IZce+X@!TMMkgtNj)xWItxvwo|Y{JKq
z7sQ7i?|9<Wb)B%XD=>32EYU7W=UxK^{n$+y@VI&c$@#W82KOV7E_S3+pab<o>xH0&
z2zG&Wue{%eM{@2RqA#Y|p4Q{M=nNosgYPIbaaTM{X}cZ2w=#U?5eoIkt}JQk8S9=X
zHu`972NC3G;K;b}=35yuG{VR+;-2DmUB-E3{eigYTgrkRN35?w2DJ8^sRjGlsdj~d
znRJg38-viMD*T*AKoln!j7<byg7*&^F6>7%2|Ro)9cGIL@Gshef`^lr_Nv~+&efU3
z7VI#(;o`kSj?jSF>J3c#1)>#F>~M@F(t>fHYHahE$RAte{(Y}17RJzE9lM~y+v9i-
zx0VZ20s5=fy0qxsEwkzK$1M2rh`<%thp+oF;qgfqe(r>PbDdq2ex82p#j4pJZBAiM
z&MY{(yv&f~i3y1b%1PmS7bY|uK)r3{!`Je3{i8}7W4^V3neuW_L5WkE9u;9HDTe^P
z#Q7}rmz_z~d#M$#7p;-&?5d&AwN!&d(G$6|s(PK7O&@MNSF^cgO1-$51>DcpU?Lex
zoh+7){$yeE$Uq&hK)*}5EoJr9a$#U}9>I)|y%avcM+pI4Fpp)kb_ym}VPi~|p{IY4
zr1COD;Q6I+#9dS1lWU;k6PvUGdk+boHXl?F5B=w0F(mqmX3FKT*E;tyCePQhY=vT=
z^+YKpuHAcDQ`WH>cWIl30l?M^GMhHssA!}NPb|vmo&g=54p-j3qK`ti)6R=iZFRQM
z;j{fL+<s_<VH|vBVrhQE>*tY%hTM;OoE}kdXVrg3e&vuoIV=DkPoRYyTXZ+?Gd|y}
zvoWsDkNae>+i|I8_~$b70`?Uc*HtmRu!XpAh9;$$-OPwiprBd0*5*1v;OjOLSMoiJ
zN;`$G)O~smIBfnN6@Psv<M<$NcHXjxBnfZ75}*jCf_%E~a%tO@3O%V8;*pm?az4Qy
zPCoCBc-G`vU!ldP+||(H!*_X9tt)xBQE1B-6FT^eS65}e<wy@5+J20cVN1=mc!wp`
zr^528b|(V$sG9Hrd#Yr<QjRHTm0o@Rr0Heq)<~TI#aA_m&?rV>&Yi>axncf3w=@sp
zgwEDQXzf!(aozSD&b}bB?v9{BMidTT+OVcm$Zthk-OFFPNDUt7_0>imq%)<6_1#16
zc(Pdym6caCH|u9~YE*Q_R_bwa;5NGt-7v48O)fw^z%I|c`=}tv#3$S$Mf&kQF-{%h
zD$6J9>O#<?S=eO_9Wjq8@^#bhj8chDQjq}D`btg?A&F((RsJV$8Dd#wnMkVU=2tGo
z=t)JQ-82E%Rt~uV+Pp^R)xJl0FHgI0W4sX|_~*Q*Zbw_0=9W%9*DXR+l0jDL{eC^*
z)pxf*QWJ)aV9mQDR@n?}<+THEgKDzM-YvH`osliMI{;<$G`xLqHB4eK7{yKFwsawA
zk9~rI96cotap9j#I>YQGz;pupbim(+C|m?5lLQDmfvF>QWIvA%Df3i}<XWS~?O!hG
zAs$lqfSKEu37O%vbZLVWKC~-v-Y2XeoOP=>+R^RX8O#xEpC#&@FuS)TMk<z|<W}(s
zlh5es1g=dK-uWrfFT|6MqQ3CE;Y~22FqW_(!s$&`c9>~LJ)L?VkV`&jz7i)bpLRkD
zKC3M%7Mx0nKdY79=&H@Jug=#kireo@$k4mJa@Yl%lE?5C#hoeM1SE97RXc%!pu^+5
z&$a4D3$k)__U20S(wH9DezIwurHX^+H(j}7Ee{VN9`CymTo^I3ec?5<3{h>Io#)cB
znL?8ill=PxUvVfW$k?;%!&=7`!mUB7BtgQ%M_0aqhZ**oPTLnBL?7sj_e0a6Y@=LY
z>;aj@vE2`w;sFjf^oPipG8uITpOu@KU4CNvXLp5^MPRatGyv|?PQvS~TAa!ZJ<{2e
z2@&7AB{kpv@iUD3x2U$6^6V&LD3*{K3$@U+G1zk$eI85H%FW8z$-BWm(kitQpv|~5
z`^_OW>O12G8|iZyCMx6{%W>~X;5-$Txr$y+;b-929gI754{34<kM|&Ng9VAh%nQd$
z<zM_W*tXYWTT#jj9)@WbVxHFPUm_Eo#ssDCQ3n>r9EMv}-ana_{ib{lo#LAW$ZmNG
zr3v8alf?SVV5)D+!s@zEqJoX%bFqkW*uEXYw?3WLO$77ps0J&nrOG|rD0j89z;{+X
z2k5sfEjYStr=j+_Wf12kKrz?|V^|j6u|Fl!Zj&~)QA~G*PMp`DJd88B@NJ17qbD57
z<?*(vfEoT4mAq;EO*1V5M%W3t;1jw;4<>Opm^YJ0;AxPdGXVoFwyA93E~QJm?gfVl
zh#MCYiB8|xh$iQZpQl*hf3uhZ4gmSW)o;THO_|@h*BHl>4kQxh&Zt^Ej1NW_GHw(`
znndDn66RiTM72@Q28jEZ7lbQd;yksb=iVcNFA&Cb{i0}-#TUqGjFxX=^c%EKS!=v=
zq^>C0Z-Ag>jdAjIOk4*jrvr=&JZa1H4{BA>T<iw?T#tneY|(FDEJXq)HA22^X%ylD
zDH`u`zFrr#;=D|Wxfd*lz97J*#}4}vk~_qoYw3E!Plro~?faZP$7f$=-sNZ36G-!C
zpAp$n6n<VrMob6(dEwpVK820vjPAnz*3f41@$#sezmf)v2A@)!mbb-twjF0i&s37x
zrTeuN$NC9c&Dxj&*AEGA@yNU@ezA3SR%v9Nrt?ABq$?KV`C66s5DETCT2j@S>+Jnd
z*Y5*&;C#BgJ^QiYjT*tM&8=X<srxO=o_~3?_7+9w*lp3=Evf>apfnUikJDs>#I}uV
zaL(wE8ARC#qiTP7`H#8#+qq%HCc+sOg|oGehnvX>Ofm!HowF{-i!r47D<mRK6Jxg{
zpws#H?bCw9o67EbM4CnB(}&{6O5Dz$=!5aD*eXw}AVkkxdXy8<#;~zMl2rfIUO4|6
zGI*zqa-;kfvdLfb5TBxoSpkioCZT=dBdD-SCmIna%R_0ip6%Dh7WsXRR&Z6Rh<1?O
zFaqG|<)PsXxBN-zSW|zY_@%+mCSf1eYMr>l_Z|iwDattyQuCSd%DyjGqjIJWU;aXe
z10>3??sIALb(M>pn<+ysM*@&V>t=hq`Qj?lsn_vt2zA6*3^hYA#kc6xsn~=o!M*fk
z@Wh^*s8g#;b{6otH{_{mIM5Pbara;tKrW}WMQTvauC&6Y;8)b-q{r{`toBtP8ZZ2o
z8&^Qy%@UpZcErsT^8^;iKxS<^YmUGpXh5e!)m(PulX4_ie3*{FdL~Lz?$WR7n-!A~
z8^&>lQ7a4^RnQ3ShP5gslH)U~W_R-|g4oAXA8pqUBXFh54sWy)*>qW=*z|#RTG|q~
z1OC`9lR%@xIh|9p1NCM^sZwy%sxF?J;Z_lYdA-vW3>z{_JGqFVE*9S-N&#`Vpd0&!
zY)SDeRb9O|JCRxi@xJdDpBzGf;e+E3V7zJq1c`*Qy9dvrlAy-|$I3-~x>?@T-+=Dp
zTVc_li|#4E&eY>Bs0|G8!18i%%hQ|p9gNu)AGMXj>|TmG#deH`HcIxYBBz~&i9^YV
zIR3pO=Bo-TvfliZ{W&CI7cG<01?lbR$1{TTb8qF`ZOz!DBAoxEWbG%k)yZ%uu6N)e
zNXjMVdtBf`lF!Sq=3@2i(*?7o95gwiDmKhGzeuVj_ry9%fiY$EoF!DPaPs1t85<Ec
z2ypq3<5vdre$MqD8lP*)lkJ;waTSG;M7m%-V};kR0~m~MwOvShIct4VQYzIHq^FA1
zu&ppP5_2?i^d;PL+?I5oj&dhA!W5gy3GRu8(ycTp)To~Gu&nit(GV#;S}|5Fogh&N
zC(>)aG8g3nRO#Y+x>l3?-^{g9%@Rjo9?q#rl^PzDIx3qJNUbN=X7j!Wa@8m-NSQVT
zbxLmMg}Z&dC}q9ASQc+dQTZ9criYXzm#5n`G&p`zrKuPH-L31*?qcZ6@iWHSwF^cF
zLeZR3_^bVnM+OC5Q&ZIK+;e>Ul3`U(e5sd`?)53w0E3+-xW0fR7c)=#Z&i!DiY!?m
zUnU=&UqyxZ^XYtgXwH);F?w}2Dt6nr=bkZ*-tXWC+1t!A%+37teF%TC4VJ@;)k4X?
z7dpv$cW*}Rdu21O+;jLY>o~>M%<CHeVXT?KDU7!m6^ux~LX4QCX)b@ZJ7?|~Z_pgG
z-sj`g12~D@Xr~#%EbSCnjY-v;$Ap5#P}LnuGUt}7f}_WDY{)NrMh3@Hu^RTy=h;1O
z+PZ=>N-kB1JN@$?<it>`5Bu+z@6w82LM_AQ_eK`;4E~HEeSAb$=br1|tYB+so%cl;
z#j2WQE0~N5(7aymaE-X(-}BQ#fbywI6XK$^IWW=%ju#6aqKit}*pxiA(N_J-`$~g7
z)P2`@>HB+S;)&0ZLE35SJ1=1Q{sJoC#y5vMJc&_juBL$ocbzdx$l1pqoZ34P;Ypuj
zcLcsvxr*N^&s0s7>P7hLefF&!SPi^ZZ4w)y{e5pDwQRJeb&$J=i<m{-3syDqjDcDd
zE&pD7?Y;bdNRq%FNAnPAnutR0<1_)n6_rNB#eEBqK=c*7)yT(S*7XXc-OL5y&A@OT
zqp;C6A6Z{!o0Ot5eV%<B>K$x0^L-WiP7KflJAjUT2j{3QnZsoJwmF{wU&E*)@1hRn
zOX+-jN3hSTCi_h$WI@KgFNchP5$zv=3TdOuCCq}$%sUT7Y&Any)@EOS2S#P;u6tD2
z^ryuGOjXJfvLmj&-X<Qiff@_pHJBW)<h4P5E-38n7aphSTkRAq!jioUNYp-iElNTr
z*xcmATjPS+CguW%a1J&ax=SvrybocoYJ|7c4d#IN2RUEdbyi+q{0Vf$)BgB9rOgy8
zR)>3Fh{-40<7!s5`6bDo_j4zSf8R!2aJ1HsbK^e$oF~_INIEDi)3>Rgjvz<iu}s{!
zJBd064YJkes>!N(jkbULAq$q@70CsQ2Mt1Lg#Tn<!7ZbtHNM;zcIptJZl2tJ&fmaW
zfhzOU;zJRa$a;ga#sSL~pSW=ETVXBPs<8ZA(P?OMkpImBoT{V7havv`V>5#}=$Jlo
z|Lp+ZmlWh0R(&B{()6HW{O$Gjx~SvAaqj%3NDVMM_}zw)VW%R-lOMs{lXmVp78K8@
zUs;TKY$W)bXmxMBjEblXbCoS<$bwCLRQUiF<N0*4(p1FrKsfaZ*aOOTTlCV9sbj?5
zij+kUb-qL3TH!GdcxV8W_6Jhonfz~)-(R~e7b1VDJ>28K3WK!(-P-&oAI5rM+<EOp
z^vA>Pe0!dw<lD_F%r6Fms}KhYIQ>`!oE#}mFv9iVY;)Eqjqo5j;UA93YM@qWIyuGY
zckVC&q2b|$_onHdFIHZ;+RKZ4`@VpJp29<)Pnyl<dN>Aq58PgD8>28kvgp+$WF=SU
zW2itOxW^H8n7+$lA)q^b(IF5Mh={v%XbnzH`P_D^eUd;C70nNQRMD{i$7u8~Y?AEi
z@Fad1>qe}^;+iU0sn&1gG<><UBV-ITyJ|QX7~~M?)&Na0XxNK!C%YfP7n{E@Z%%Yx
zpR0@FGC5fPEO;f5fc&U}XA^%GdU;mP>a#9|y&+WF#7o?rX^VUTe;B593<h~=c5s5M
zNxj~mrN5p8-pHh|L=2HITz{K&a}S62o;r6YrRb^Ye4c?VMLivm{88mel`a4?$i&h4
z-N*4Tyx-K|Q$G~&;q37{x<zX4%{}|}eELTfI$hto&STn6PCivZ&zC>lH5LxWG|2Ws
zSuG0_nkm@r9m)f$Ou<k!splAa|HDN)uyHkSP9rjqp$d<J#I57M|Jyqtm|_nR!aXSV
zLGd7##NzQnk`#yZfMc#hu-(x_sI;V9v(lCfhV(`5Qr%xBf=eEPVY0<IRUWQiqhh}m
zn0L8;tqA6knG0Vc-p3F~Yvwe5bPk3lrg0OV*;u?mkx5Vyi#$^pzhm45mVS-vq>SLd
zn5(}kYVBYRs)Q~QNbGrN&ilu?#;B{WB<KF{Rw#JW2du=7qj;G0Sfp9U(}WPdXR9B9
zM>5<NrFZ+%7Xu4-2a8;!Mv*HQ9e*u`Va$0XfBrt25<Oo|?xA&yd|lf^{ik^oqof@y
zAUQ)bsxHblRyWZ+EN$F0Ii1~)sz7m@HU^n!!T6jcpKsO)dXB7*flXwTmtnl4rVA%b
zd&yRV9mx7~eL>bKwvS-7pwPk;L>lx$URjpLGChdHTc7X8+J&7+T83;^nkzy1=-6&m
zZN_ZhN?w{SeLe<mgS$te9_Jh%yXZRd_Us|o?m8_rjIJgyxI>El9j3XA4SB$tF6f5V
zj`RmobG1SY9CRJM=1pL=3Gmq9*w9#NZYlB^Ai!#29~X_Z`80%_)@WO%&z3OG7EL3M
zFbMNjOU<Ba$(R2sS#j)Jt{$d6mzJS%r}Odni!7~y*LmQP4>S8!+A#_Pu}GVtTMLrq
z8UwVO)5mii52O^OR#cvk2R*t=(K~c4SswGqctLhC7OHB&fGezv>Ap+FsyE==`D9$^
zH6WKCtgvyxB2RC?+u(ApgR2?OCQcF<+BaC}kla$bZ{*0iiHB{&5AVzVF@jfKrqp>C
zK_LM>;22L9S{KcQ9USd@3~iW06M2sU><kVzI@2=1of$&rvJT4IP5b@`gTpaOGjg$i
z)4KY|IXZXF{4XstSme<TZ_pngtB<$+;h>Y5UCXjjPhMnbjQ`OS#-@okYMpJd{zula
zQaTcJ`y6R}qu#Q7qfSkN`!=^YD)~9PqhhDx`5Bxdq7Ui>t>+c)m@QH|N(|Eac{P#N
z5dJtXbbxiTeasC<+_$(VUTr)(sLl23Ocbp4ZX;kuPV1C;+_F1`oEreLqq6sogK4)j
zL$2+pSxCUvp`3<cE;IDwaR=&IhTo4Sf^}1v%=vzencfvnjv;nkz{{~u>*W~AKly!t
z&O*8tc|(&J{en~Xrp$SkS?z6o2GV034QQJ<H$}o?<=ODblzVq>b8RtV_Rr_4xovHH
z*`rR*2|CP~64Pv#oihg>=CH(s8T#jxhQ!9KIXYyMHgSRHng7AOIUdvgk!O`bV9?P!
z$qKM|MxK>V)*x%xn>pnvcG+qq?th_cntGY>Jy@;UXsCH7Mp+{Dp;vnA@mttzjA>p5
zbxh6|so3!AjQf2#x5_Chbbp9VTr1{!9Y|5r<=jWwbV#MKatyo#VUI+o-tSO%%N;xa
z?YZKMW`*J7w#oH<k=Ra__GJ=UdQHV49tQT=8y=>jlYOa0aU1oHwhMaRnfd*{kKpM2
z8QZIkCXC@>9lv?=a21I49LxLy8~Ot07;vw7`({3`fZ&(uK$p)MTwYSkJY&;21OeIv
z^gPv%u1dvlPw={5-`wwHz7jzka|=$pE(KKqDIZ7YPjkb;&g0adZ3FIw;&CsJ{%{Sq
zd_AG{y^{_w>Rv0qY85Mw6=Di;aBN?@NeH$qK$%R%H^tL3>Y9Iv7|Yfjh<()o40pE{
zMzT#_EPlP#lSA+&bK?BsMy(P(5@s;bEvDZV;{xQt3&xlnaI#$A7h{ihUc6ZObGHCT
zR;7S|!XCc|(>~2WQdHB|zQcN=-9-<*g)LKX*wT(F1?YWS^Q(<;hH!Qp0txNIvo++&
zFZ_9WXpg8_`ce*qR%F=wy%}rRO=?kv4B<zegF)KgkFqdS$h*_E#JSqRzRO^gS{Bs=
z_UdfQV#>gQ@%cYFcMm9TX`Z(<b~k1lyE@Cou*hLmixOc7kErkPv6jvH?d0J&xQHin
zvQ7B4mRVs3t`jyf#Rm%Y)2$R>6V-6*pB+7wqrC#ouJ(1fJgH$%j#+$_5*{Hmyz<(!
zmueM{<{6W|Gli?hGyr5tH&U=^d!oQzD^2ga&D6>C*L&7?2!41E%wU4@HC^K>;cSa{
zLu--D3v(43k_PV&cg{h@b>nwpQ^Ma9yt$@a+9A02nFrhwq~4{MXFq7slf_RdtTbTo
z@<uP|3&w-7jT=LA8`qhl%hwdT$SvdKQ7Qh}!m9b=227Dy<bG3<3+lnm6h1%~tK!YO
zzyIkEN4&dG>9lBgz5P{xH%w!WBy)Qn>5=A-?3VmdzkTMxs+5%}u|#Xa&85*ppU>m8
zhQI&xrG$&8@5rZ#O?bD_e2R6)OcrQtg9%#Oa4yaDlvboC!W{8AmxgbCAK81vqebEl
znWBH@MBtIF69-qvQez&pZUD?)7q_?y9z4iAV#akv!|S4w=<UVp;(29(@=?b*lgQlI
zo4w9rdUcu}?;-mP*^X=1l1nhkDTgnEfVqj)>(M@fTUW~V54le~+_%ROdSOIxd%#iL
zw*i4?s+e4alT4Byg{0x_blPFNYq`o&kx94P>6%`&P>#P6!p>H70%s2jFrIyM&z9$|
zdsI&4>Ie|Z9uon`I9X6@&&9gwk-51d2BPib`P}JM3xwQ5uR7-Bpvs?FPqi9@k#i|g
zd~D95;7JWuuoE9~`c;ul5k|Lbz!omuu)KXX8FtrTaPi=oC9bNQ$w5syv|#hM7|*cx
z1aX{!X%2T8&`q&(JNG5LGLI^ZVK=k^T-Yj-oq>92Fv+i)71IYt<yH8`3r5Kqg{y<N
zKVHNnz&76pDAR^9TGBRGW5y*K6qaQWZ(q%=<T=wwKCfroa_9-Cbtd<X-jF&xo-Hb7
z<up7YD`a8^Hov5Frx_)WX@D7|_`8WU;pSnSKLFvd)K7!f=`4{%2;&3xLY5p7<z&C?
zwa9F?7|oQTL@=K#vLi|xIXH@7Drx$Rk;yRn3@e#L$(KLtu&_)b$rR~|`LuVM0CQ#B
z9>-Qg&Q!S;-!=9z$GPt@3%Beqm+i}z-ZH)!Gd4bpL>i)x$UO|a!;-tsjWg^D<Gm19
zfCc`7$(=-m00MO%coKKY!7D4I){rqd<xS-~A_v<St7)&cL|ZPC_Cc+o$7OGiNxsKI
zuQ!c;B_c@RbE97at3uAmzZBX%^l{brjMirNQH&4rMlT5$U{Hk@h@n#3dmUv95p|Eg
z=MV!U86SG>+$r#R)nk5UJ3@^;hzi&W>UJ_L4y#f7H$)bF*o(mrhJP}=eY?R8*{W^C
zLYn_RuVMT%vh{apEUA)z%aie{+kF>Z>0AxH%HDe8qZy+%q5zOwQS8KXPziP9UJH5s
zSu>#E(fxLnaK?ve%SQ8XP=KM!>&B15RsVDblxFf{nF>WPyJ%|!qB|*Uw2@tE+ZXR#
z2?|r&p1eb`Yj3AYoAo70?)8IZH9()qvr5<%<qYG57sl4v>#ss1Zssh>XNI6w2e^m8
zW&+FCSSqel>T6Xr)-B}gdL`{hRnM?n-_75NX~>ciUiU*(!0bj%+<&%>4Uk8?_RHpy
zqmSX!&2^mT1av#F`G~$KnHW;W3enww$*LH>CrxJ4I2(*MY&fr#0isI1uFd}Sk2m!p
zioY`kcZ&~L6PTk&>~9$)N0L9aXc#9dFSrsFF@_^;L8{pqMHA^I88)Lbu;lbIni6Go
zkEi4LA(W*4a4V#{yI8@CN9fPmCN7LU?^Vg;DO9fm2R8gCv_JR~jy(9N9orJ6sDCCA
zGRpTtx@kdn0nx*8q1R8O8oI@wbtP|~shSGy`8e|i)6w{gkT@Fri(mvAc`%@exN<&U
zLn0jMKCh3w3m5J<6Gk<j5JWvTf7ihRV<M9v87F_W;lg%XWp-FpP{lhBje}Xs<|7~J
zTQ-0W`<Vlp?WQ*dV+^=#v-_%6r|SnNB(Y8m363gvY9G3Df*S<{MwRc_ny4hpcbk~a
zXRGpj=yCsSFH-)cVZ@K{Blq{{1S5J;i)VGiqD0)yH%%!LMZXd#4hMUEQna%AqsE}X
z+M~;0=Hn+ps?D(SpcD2->Y7xHp8~)Jv47X<c!l>vH)0lH9ow$6(Ml5}wMCP41*V#`
zJJ29kZF8*FrT)WzkI_dF++}x6VlSA2uOulqY;VltC_ueqTvV|#nx<QkZG792b0v@=
zDOj!ybq@XFdE}Ew>Zrw78$+|8bIp;T#u|hriDAsip;{*nVWiv*HjCCM1tO07@i5=n
zRN+mQg|;OUWFB1j;j#fqr`8YGN<|AziBO?of;^td{$yD${<H%mvJ{zKq7(~dOE<Q^
zoArMB79V#1a?QmK(B%#CGOH(%dwHwXs~eCU-Q-JAW*RRaJo2JAQWqT=GomXIwkPSO
zS8EcrhPXmQ>Desq0NaqQ2+T#txBJ%}{)~2qJ<CMyFRvf1Wm4`v4KnmP7Y5x`uD&0u
z`kwCGQG~j;_oqzC1BoqL2igVKE(-L)0Yzx?c+r8yLc?w12XJW#9NDh{vIva<xsJFD
z#tF`gW;f=D^gAxDjM;jVSDyZY7+u{La#Z!$PC2xp$hjUS2Y9z$?caedWIc)WW{kal
zM<#vz&5jtR<_pi7ib;$DZVLRT7eg)HJ)st<A4A*%t5|!iS1ERRCGAI%<nR{cjau-|
zNpOBcL!XA$<|F>mJ2qRoTPuvGKlhQGX2f|ScQ?5Gc~E816~tZSTpcZakN;@Jn>jFc
ztkp$HMI8gCUyDzj9!R=z+Gp6pb1tx2$@Q+IP6fLB>z7Ot#pF6JY+<_B7xoc#ZU2f3
zzV8=wLD}T{k*18RVJFo=#;j^+0d|mYmQ9dh<p&KnCDe4@d?E0Im2}{;VM@_^eZC>l
zs@uL@;Yh1-E(nX+bQ7QMmFJMSM~X3I)3<#Az$Di3avzk9zDG$`@K<knx5!HVGTmoY
zK?n=uod23=N!a<V{`f}gn}k1pn2+&|p*IPc4-JkRE^Mjt1b&MCf!e^61k&dNM>+#y
zkG_~LDD;QSzPNc|vviMrFc(I@Z5x{-)|Lu1E?rspa|GS~BPFuB<r>8=HHj7e<;P_N
z+*^YqM!{AR_Xko1x5M&uk)g{j7=eXt{R)2L6L}h6+KEw!>msq|d&n+|)&c_Qf?)>5
zSp|w#%XFcYL;M6=Puqf|^q2#h<NmMDBGGv$fk^`-PiIOIedP<Je~Rg-IU?%<L5?Np
z?QzyDpugIcRm)cGp*4j^6w1Ua0OaG(bV8a$s?DSJ2Y8q@QG(1<T$S9F=H+^PgsD9F
zTXh0g6@B+9Vh6dQY*LdGpQ^>G?`TcsBD$u2h6*{wb{mxTQPlXT)C|`2(j|G*E(D9U
z1|7kUcb~AJT)}Rqyw_1l5S#$RqxS=6DoG5;44i&GJM4)JX9&;v@X3%t0f^ph!66S4
z4AxSPC)w6-I5KQ7^8{nhI2M$NgX__iHOJRB3mc#YY@}?i^)q_P`7@4e4*2-SRRo#m
z?+%s;w&&tJN9KV~hGE}UMFU9!<(N)lXjy~g_8;Z`Redt`y|$qZBr#FA;s&AjscS6m
zPsPpfvEZjz+U<IG{)JHBGYu^HM?&N?zfGyQ464@5UCuCmG>VGal5Cf2!N(ZuPg%42
zLl&d#sJb{5KeZIzrSSYg*LMj@_UlaB6H&i+l#+tZyF$AJL&YD`*3ypH^lb_K-qBjX
zTfCk?NINEmZsi1~&cTWNN~^;cOf7zdRzHiBWAuC0cDp<Vb<1%Rz<M~&ZpE@LJm~2~
z;@)n=%xPHpT?NZgo4gBM$r-7^)d@9$+)A+@)M7P~%<ixU=|xT1YODa_8$aKpm`m{u
zp)pA3iV(4F;zJ=?#;QR@PgpyyiGR6nj0X_k4_>&sikREfi+z#=suJsL8qZ-zApgPi
zY3;tP<D8{9Q0U3vWA>z`{mHnA>Z`a?RfXkIWZtv4)B5ZEp6DS&b9`g=eQ(<enkxQL
z<wow&b7Mv0S$$#yhLJ&6wjSwkd*0wPA5T4K*jPoNVJY!ak%CfQO_Vj>4nii8dUt50
z+_olC$C6dKly=uYubx*~`3iS692KymwGzK<2h|^s0fKPnm%5O5Lg1r(qh`;4N&Bk4
zH*g0nxsi8NZA@?|_1(Z_!r1u(@#e=v`NY(sfPu?LLp08ewM6wYxda|n#&w;XC*d45
z_Hgu%hba2}9CAw1`cN(Flp?!&wuv1DS_VJL;56=`=y>jB*F65A^%9kS`u&M9k~Bd|
zSOTdXcq5emExzTuf`P(_EOy8Nf8oXo;;l^5@tp+)dlJiJ`D4ih`Nc=HzRX2c%NMcL
z7n9xH$QEvWazyU?KRm{>4=%5rINhRG&M`O_jbP4Q!zVRAtTG>YJ+&^a5*k{7<xL&N
z$fUQkQ~Sl{$XU>Zx*u7Y*aXj>WxuuFa&zemkb7ets>rg-xIN=9w3gb@`}^wBFQ;<#
zfY~=ILQT&-MXTKk4rLYVT-_`%wegKsu-SNUrJPsSct>=aSC<zhjBt<9KkC1x=C&-&
z<J$v;eH(72s;PJ4UWhyTg-o9{Lb7~|>X~uNrScqSvsAX{w0s;C-u~%;#{%{B&tp~*
zfS%2L%q4=mJUvF@Cy`#4Voj7&Dn$%-kZ75ZG0xV1@U$7)gA!oOh8^koQB<6|>ay=b
zj-7X%7v6lixS;gw-ZCoo5%%&|RwVat-vL8e=}aNhFp1>mlBty&X_q;>_mEB(H9VL@
zvgCLD1bK0oq^t(TYP(~#bf<`G*`)yNVF^VH)Nm#&!<*j0Y?(_vr~ly3=4W|YL9zP|
z;-UNtDs^;516~*$;ogEb(MS1*5XkL%&B#KAjlPA>ztf(r;R<)o!Wbm2JF&0n9$;e<
z>!%$^zgF$fPg(i}F_GGkVSlwB>|)h&3R;@w&p2*#z$lODh%)e(1_ELl0i1CxTY-5m
ztYXIln;sl@NvQMXvR!>L{)BjTi_TZTJcX~J_{B#R<JX<gFtNf769kGiUh`Dw^Y=6h
zFvCHP;m$^mxnAVS6hBA`V%+7dazDLmXRjH1z*>{Ps>-uGkxNzKnnTeJ>J}3QLGG0N
zZ@>eAq{p|DG77QQu^HV9DRFnCSTx49X0DI@c+U}kT6W=cD+;E*n!etWQK7_=l^)ej
z%E@gC);UYEJq!qI+inhzR@6^AL_zEJHQ);sUyi2f<xeMRBjw~lgEeR@b75rMrwEn2
z@zdf3_(824U&Q&^7021RmanJac#HO|nzd&ZsP1(!??=i#5|=(rBZ}x(tnZ<^Z;>*u
z+T2e!Y9eJzcR-My5jhl{E;P@9gpppfxSL-X$r}|6K37%hqx|<NyQZ^SXD0k4wf)7V
zPsva!y~Mm}B;qA#$L1Hg7Rejw87axXKlMcDODdjqotJWNebO8(iJgvMo%bH9XMnUf
z@PvjexyE!v=Ly<I(lbiY36h9_!!aZ9#2H!4`=hnH4xsfZR|{2p95<*|^H%#Ecdh(U
z@d<u6{FiO`MlcQ@Q7VIdy8li5)#7#X-_ACSN*B{xzi-^@vcooSlBRk6NIs>V4<9X;
znwK<D>Gu}Q4=)ueaYUXlh=cpd0mV2~Q0Mokzr7;~m-7wlXDDsvz&#Os{!~;%ol^`v
zU{{|Rf`9;&IKa6DIHGT7YbC2g3l5L7C}Ch@JviAoVF)|Faj^<**g0^5UG{g&Knh=i
zv^_-2xn2dDGwC1-!c3^iO*aB1Eii%?CrP8|wV1{^A*!Odps3UI<%C-fnwXAQf<38(
zEK^*1aw93*?Gbv$n0r4pY(oRCil5NmMiPE$40%#qX%zRN^I`XqGzxO%oTz$7R>czO
z9*HAugE(bTgLy4TYv~HRKEY<t!=Yj5nE=?FdD7~9GN?-itUJOE6Y-7Dvd)7ueE(;9
zQAW8m>fJ-YUeyO?@?I#MAzy)oBJHxOlL3hfNou5ath!pbKAFfVLq`^SNkd=Smh3;o
zBrksiJIvbB>03zI<h#)y5g&4C3aBL@0N4Y{wR>lwlLew}%6VcKrbD8b4@ZB6s5|3C
zQ|(#&<RxFJHK?N}6kQbTMmr*6Po8G{3?8Y>Q?0qs8EElOPtjjJ0vGSK0@JsfNIBCT
znn)?nWPyt~C#>hC0MjYM8lR-};dWAf($eA+a=6kRnn@|s3)@LW&N!Wj9AxH2F4J$1
z9EdOWmCs$w9}eL6@p$Gmc&mPf?BLpPgvK-9zXCr6&KEKse%-#;{{h8f*%y_2YMtSV
z7f%-H{_AU`WcXB=LT3d283L%$AXVuF?W7hYr+;D<F-BQ&TC!L|Ey*p}Gsp(W^UiRR
zZ<5(zO(Xvs(8+`h^!e%ZAQNQ$i)|w%FL}yAzO%-^v!x;lh2YKv@Vy}X$RwMl%%R93
zpSG}ml)@*o){WT9rEz>I70IT=@$_WeJldsxo6x;$l_qS7&Ubjy^z{hAh6Skb$&)%B
z<T;6<K(E-tL8v&Sv7B2Aw88-HjYHe=J;kEg=YOSoGBW?-zZ%La^DRb-Ql3tp=AwlW
z5K0nCDoAP%u`7Rb(!ON2B8G^#<avB1V&+7v|KUl?zhk&odb5f&f}*`Jx>FmPf2NU)
zK%Q5A_oUC|b)CXiO?>0KziVly4`Q#Kn&XLV_>1Tl(FpvANxf_JV5CUY>j#|R%G*EC
z!8g1k;|3I$PuZm42D?ZL?)qv%covgdKxx6#4ZcV5M=nL;BRBSsm7K#dw;Wh7@2-*j
zqi&~QN&`>iG~7mdNve&RVn_h&cjnx(!1N)`I2bH6QqhwI(?A1mPJ1a~tPh+1y54`#
zQ-bSOr|KhK6mZBs&NCb#vPFW~e0(@aF231CpolO87XZGbN15FD3FaqW0kl32-A=00
zTj}q+NQGnr)~VQE-9MJvGIG%Rd~|%1iK&_0@?i|220@PiCmj;H#&Ve?)6=V$|7)y8
zc2`?ZU8D$WBQvRiPQCqEcAY;3D$t{I2ZjaVfJ1|9-${A>-!Eg@6Wu@Ip-@pR4aw-x
z{Wi8BxvNbDH4#)c$-}bbL4fAszx{D150z4!8Z5u@rNT%Q|D+nlEqKrX7yl%oH0ZRO
z_g}~f4&dVBU%;ll28fVLo-B~`k*mvp5Z^C(PC@iWufG46hLcCM-u$CIz_;q(m9VL*
z2dsXaJ{()4+>^be*`#Bm(v9HiFxd4t2u|R)5#JD^n9QR!ZVWS~ho&dpS=T|#fs#+|
z-oNXL7kFGEGZB7=V@`;Xp{JvgPElhdYou^SRR2e$>)=XMUlc{;RMaZR3!{JOl|h^?
zK&PaeHIZHbzKkm^9;?yXSS~g*UIZ^bNA#Yw85fm>(^>KrZrsAGzUT|(t-hf(wSjbv
zGWR^Q{&JWg<OBZv5z&dDh?FDITZ-Rd@S!(CZiT(6TGE+nVyfoaa&b^{$jzBTk!|wi
zjjhG3ER>QimY-X%K^#wA^WFE40{g84g)B&kY4Yv3$ahhPQP4;^h#pfjiXG#EIgc?!
zy1%0dC4oEF+v**Jy|7FR!o>^D*44#))G&!rhow$Znfw#i8cE3k-idJ7WBl9y*QW3M
zbj8Ee($nHAN}ez}ahdFlgH}1OUVEH2GxDLiR#`is-5Py$R)TRcyy;&4bAi3~`!Q1z
zBw_SH%D!FgYg!I<Dcfl^^jq!@T5OU;`kn{kBs3&xy79zD**>?WJ)c!qvNS<EISJAF
zOWhtAT11E^GG*y8vN?aK1*e4|MgjbL7n{W^xdZ;y!RUs+&X5(9eCkbgz+%uzE%m<j
zyX6{wut|@oikSmDC5aPYtyK{NH9PaVTG@wZ>v*DV$Dx1i*U%zvlbrP){cUg$FoT8Z
z!sGZCS;o?zZ+$fu#L_*f`+4<-b{}8weP@}aGpUjS*!X8PS{kvj1GjE7zGLTQ&3t&{
zYYf%mV@dHh1)`)tt*i=g&??38jTpGuLd*&Env3Wt>(umD>Dp07fqhmviZchQ`S2rK
ze}wS9XQ_e5+1q<A_-Je=e7!{o<$1O;Ow)f$ICR70P~G1bU&hg8S0pHXMl}3wNU;CF
zHO{&@8#z)4_=;5dTF|vcaq{**UjRYbNsb&a$2Thsakj1Q-SEqyf_Qj5xA3mWlkCph
zw*c<Un0NR^hX;lj`<wfZu!oFoO<>i`CCWH0!<`NMTs-Hnc<NBp<PqAvOi=a=)K=#C
zC8xy7qw0Anxl=^dHy?-oC&rWak!~}7MFB((S9*Y8|J4TKfFkThLvm_R@*)i_+;l&8
z&^=P?p?C1n5BkrCiaYx?%&`t+J`0B*Td8;s`Q_aSujf`?eW8GwTwQ_7$#LF0cZ%TF
z4IkS77t_@WO|qR^wajvr6cE`oZ3`~1&U{{)l38Pw##T@A!wBHr-jgd_et!5v>|S(r
zcOk2~mu!kYTIo*2eN+RQA5CQa7)S%(G@fai$7lZFMpLjo&acc3n7G1j+EE&E#O`{E
z5MihLf1!TD(gA@W;@K77M)=`}u}<i8R&_f9eA9HML9r%8y}@5SA6R4~b)N0Wa)zhE
z=fLniW)7HjG$~fy#o2C5(cSh_$G^h5!j*2-^o_B7j0wQUV2$)_05|;GD|<MsUVr<h
z8M;o;#?KFwO+feB!yT{62~!RW6?n*9jW;Oc#EMzF!~O^R*N8d2HE2!r;mTLG|H+}$
zIp|s7=tDZ2S93?(PNmH3QfsnpqU~Ljo>s`wI#al+<Tuyk6^Y_tNr=OZA<xz0G}~rG
zN7_SYJzVHC`*Mf#z1dZf_25Yz)VrZ{IEzJ~jn;8@;ChFrI%>xpyaSoG)GO!eVj8v~
z;rZbD&<$#Ek5c;2(1B|q2fd%{a5)e2-BenE&sE3AZf8ZZdheo@1b)xh<+i?<nd^!_
zN*x-5Cz;~F`^jx@hu5?^rn{@wzThA^8G(bwr0X!%{~QbWQ)mv@I~@m?s6g{H?W~dw
zl0jq>z0IpCXYFQM2l{NR4)?KsXg00NP)GkJZ0&{h25*0t2EhME7MHmp{K$puunImq
zLU;YqO?(-4R^(^hS!-4T=YITNC)NtBZ$juS3$epjU@!2F<=S-=?+v{=w0K~RpN;kz
zrj<Q7FTV6C`fKswn1jSAUE_skH&1E(Pb%Nb1a$8NnjHsMFq1@5FLR^c`Q-uIzpxU^
z%1(xl{4^X;Yh`Q}<BJLCMR>k-L1#;d4PMRs>pmH}TN^u9717#ypR6O$-w!{EEssV$
zl5kU|b5+^3K-ci%k7vH9hX&x?sfnBWOZ?d9=2hi(tuHS1`&xI0?qs9K(*I=OHsw!=
zL2UddX}~`OzQ-3PPu_5EB!hS;Tf_GUf_p#sZFUK^HY>i{TR$IiXs1U(H02ok{XvC7
z`b>l9(kM2wLbcx2Le5kIK2$m@+ud2$SQ>)XIc!6tnp(f+<=PpkG=>Z?;8|p!atw;_
zt!Pkxu+Gmk`HOFS&BN~ZscZTd|6kHLSAHc=&Ww3bK_b!nkMKWT7$;3MO1`jYWBV%J
ztf0)a6GrUqbGsgQ_HPekxzQHOBS3>e38%F2aV~aWDyyL)#H}Gbc8>%tF>rsh(yQFg
zScU(s$|>xtCjXZ!3J08u0*+;-NFfgRPWu_@#XOeykwm*2UEsIMD!aPJdEcAgwgwML
znLiK}T6vD1a#hBep!>A2#REaJ{OD~oo3-NAv!@6wxj+2H^bbc*z9H&6uNj91HTZ)P
zhgd#WRWVk2^u<owG>NVBIM{#im5LmYl7Fc*_dA`Uv^(x%sY-q8%6ZqrChWo`0`wG4
z0C)5M^4l4sn!F7aXv4~3P6%Xe*qOIM$vpf0PrOvZoYbb_`=1TN%FV5PI)|ubY2rF|
zG<h%9FYB+l42-MB+5HE75XdS2#}^Oguw~e4eypGcmt~tj#G!lF$p3SW>w&}2VQIhi
z1M4y<d@XHaO_H~P%alblu$1~|GH=5MT5v_0_ywznmed<bg3rnpPn^O=oIm$}D8Iio
zz7rd)H<EACQQPV<C`%fdFrR`2jN<Gbo3%Yq58q+x;FL6OE8%|Q;_bh#v%!W&`{jiD
zf_is=WM4T|7KoJeAlKyop#S8D_1|4u53J#1<!By|9|QVQ>-fmzNiwONI>Ei|<Vn{R
z<^6@^$??AfM=0|ACrAI$Kg-yzvQ8OeAObHjdOy9at!iEr5-BM+P=exC8Zz!wE>s9D
zYfBvIRV^O+D5v!xu#%9y6Lw071Nj-^|Ds65*B#%Ry!ReEfPL#X>y(eRfbT3TQ$QSA
z8V5^IMvU08f%`*w*iXrmK!ac2VR!Q6d#t!$-roo|5Qzch`afR|?`ACz4|NW=uo~#p
z<*T74{>J`B_{nGp7bG&_2Mr@OG}H%0!rM^ekZYB}bY6P3<FERRlKdY^d2{A=$D@xj
zfu*XJhk#eZ+<BKxi^FW}4muS6eDIAR1QAky{B*Cq+ikS1W^AQZ0hRZAGU*xRUw^jt
z^#7nvX4a%5_@hiV+`dY@!p?5S_sga1vc<Av<3n5g9Gt>%0t#_3tP58U_wGuc_T+64
z^ULc%J>6?mKmmWX+r{A<%hCTFGWb*KK{2)uUVN*0lM{`zsH#*o%k5gsw=h*JsjS@m
zO1Hk_ggz|OwlFM7%;;MHML$l>i2WYT?IkUjI6{-Tv#wipSVW{b1#3z1e~1b0?+4%q
zuoCcmn_m3BMbexv1Tx;SCOATCn<_S1wWjre0u@XsI!c{YItAjuG2Z@@?EfV*l6t-s
zTU@4Q`<n-X$eI8{lZVe-=IyTUSspbJwyMTT9z%6~>Zx9(l^OqAXa2+g)jjmXSAnU3
z$e7P&BX-eUo)&V^!}d2R+cZ7_c&`{x!JHWt{8TwSw1|LE7??so(Rwgf>h=Gthjj#3
zkV9%EUKxuyRpwoGGw_gE_7w=Et!b`+Wt=L^xrmkUNoL9sPsrB*qy7V0_fFy@8<qav
z0%&pRFTavr0y3V9!0jtGjXKKrZZ(9HhaWfY<znfn=dV|lcFH{IgdjF&t{E$Z4K|L4
z+DaQMHBPpg$CZCmCbS0?1>E+ZQy7?D71VkFDD}0R@(po*qwasR(19cPVFQk#VQuVT
zGWIR{J^up{>aySmdTL$nxbo^1J_~c8esQ`2Oq}j@4-Vl>IMAE8Cl9+5`yx8$qwy?e
zEPO>2kkLsrnqF@t(WYOMV4PoWU|kS!9se7<-eB!I0%iumXNY0#+!r5~q6UuJ_ZAff
z!cFy#^Gf!{*<JoR7r%60@Z4+QsLNYCB+B++hCM`l?~ko{Zp-3&{X4}X#S(7QpL@}f
zk=dhRN)U&@%1fmj9WK`E9YYn3GGQ*0xh(Y&;MEiI#@X6Fs6coe+$p_8t?JJiV$L<=
zws(7<{tHcY@c)&(G<c%TsNbsFUw3aNY5U3vu~e(%Eam7rK~PzuDr*cp#J`l8bWW*x
zS*(O|TW-^Sko161H8_fG;l=N;(q8>LhEe(t>2EKPGHN4?#V?hr)V403cb#bq892Z1
z$>hyZ>N#sPcdhS_p-1osB`0n}Vku4DpyKhTOf(^Rk83DsHm<BKeq>H{G5D{n*w3Zb
zK$-N?etk{`bNo`NtewZ$I<$t%h&Qi7+uo+m;Vw3P`D$PnwgDZCPVR4x5dGoi=l@MK
ztu?pGY$b6d-&iG3t8UZwkf3vDjaHBX?<)B~anXbAOADI7KlF@h8axHpb2Yq4?#!3z
z@C%1rqr2|4YYO4dqzu?r|3sOscfR7)TK24>vATg`(f=9j?*Hon%Un+^dL>{L7`Vn2
z*z+kdzg%|Er!O~=E3>7ewKe3ouq(S&_}z~=ELGLS{gtnbCkTy4U#o~U7h~ZG6lpfM
zIb@wt6sCZkXZBZXAC$u!c876q*1RL6uR#R=2CLGx+A)pEtD(!<K#Q2yOl1TbWQ3Y&
zAW%1_D?V2puD}n?$L)P+Prw3fvw0V%ce3?q(0>B_ANp_U<ZHlJWZTKVpCO#xyrkUT
z>ZXp%<-UfhB-p#mLE)~l?GjC5!+tFvR8aZVQx$0UEcS<WhWH;?eYBy3(`GXI0;9{E
z>7jY|j%}hCI*wHx=-mS+D*>4*f!hB}F+@N8cK}bl4?Pc9jvcw<MG~I>0<8nijr{Qu
z8;X9d6cK(OkHCItIi7eB_MTg3*-*eH@D{!jyN9g;lj^w&@v2HVjr&=ako(}I;wd)r
z(#CEj)*qdlR^nZ1ho;l<v%^1&cF1uLT=zjH<|fY7xT1^GC5dg+AB<KuGisFf&AMzm
z>O;Ko?3)}NT^2LVi@w_CM0lRLN?|MUnoC#h-uSgjXzDPO<z8gR=zmE&#olYR!_{9L
zt}0`!7XGX)U-sJ$RAgOYIVL%H3a(*3ar~Nb54FfH)f3Srvp8`a@M5CNa;EX|r7_bf
z@HE^e)9m-)<#V%Y-;R6W>(r+@8h_%E)8EdJGOGFGlHgr=PRB&^KJ)y{#rT8;V%hQS
znbx10X<L)nI;yP0Wh_7Syvld^qE*}=F)f;ScmGw=KXLNhU%LSid`;%4O7Se;xiz+r
zhIw|jl8du!6PM8E&=xDoD~;G0bm04-fdsTJn%{5Yey!X_27u4mn=|exS8P~?K0c)>
z(jWG}XM_+)HM@nG;e)dettvdxV2UmG^y}3QLvvbqM8(AO5gXf%&Q^Q;m3S<LiRw`{
zS`9v{wAhihc8Hcl+YdD3iotNImgQ@Iiok*73^DaCl+mpp-yMB9Jr%BJv9;?-{XwnI
zT%ue&d*(stJGQbhb7FZ!%^u8uN;o9fR;8}h9j}KT167(9UTmReb~s4M+10W45MOa&
zsH;509G`(zL05>Zo8Y&j$Ch@nb?~2mSyRrN&D?Q<4OrKtDI?exG*)o0-!rUvr&z<C
zu~Z7?el~&5{x|R+u(s$X?U32GldZ6g-e{jpH_w^jz(6qUS>HfOW|wJbV=d&KejDhw
zEfX~FlW7-JGv_elu;lo<B^BW8Z>Dh-CCECPPX*^1^sNfr7+-rD{pPKb*>kz};<>8I
zlFl(YxwBx(lj*X*KOYnQwNz00=^yr)Eva^;blmuSA@vOt`^<UHCOHD`DVLetps(yH
zr`FMbImK63?d`w9;p(pO^AnL(-O8b3qN>$hBj{^d^woFntm>ha_87Y+$x%`xiqx+Z
zR2SoFod0psYrU%I{<7z07N%pO0UV&+U*gE<g2HJnrr>&Tsj}3viZ~le5SIhxzB$OK
zGoaF6;15lEQnthPF*G309qw0V0xx7~Vg)~gfLWJ~nYmgNn?9ESVS%3%BQQ~zb8T`x
zC$5KxR}7UHlr@Uq*9Jct`Oc$s$YYmtaTNOz`y2c8!44^r6qEv!s6(z&iDK8g?*9N@
zd*uYUTEja<IIw5i8(7w4hAO489uGJ{0hC*VD7+p9p(<CtVdJqy57s8D&VvtZ(Ked8
zHvT4FY%*stFSZag&1R_+0Dlj@5OzyXvGv&5IJ+}o@o2WAEZu^(N>(i3!rwoi{x4hb
z1iq6k-tM~6(x_Oh*q|6v!E%z!-9L*{fG>ro`v&71u?pzBK%6D>-^Uyzwz1J_#U1sE
zg^Hz<z*{yFNOf_D3pk<ez^-Fo9dKL+Kj+{}Qx(w^V($Oxao|5QXa_Bta@FZCAUjps
zjtpO0kNv)M0x+~r44tV@ROziiKSQsA7P>4mcfw_eWfh?+qA(=F|HlakU_5o>JZ>U5
z!Zf@(L=%r7+a!Y^@?2emP#ecI7;lTDa#=ACDey4|@86NwsXvK-BPm#AP-s@{LW7b~
z9y4DtEjHJ#n%_AAPcX19tGn|j@KU;kH$2alqp`Q`)Kb<^wq<c_ooWZ_8fSN7(VZuH
z;XwNc*x$;tMZH5`LhDk`$3h@imkIMKZF$FivmJd?c4K5mKrU4KHq!^H61N~-lDd%+
z>35m=V~-f51~bG>rBc76zm~#sgPFPx^sNjgdp=7R59fpLGSBgoW|m;66BrUauG49L
zpb8?nL30%dBjowPhB~Y8Gokq_JKMX;L(V`|gDMU;>t2Po&ByKUMA(~kbnYepfSe3-
z$JfKjeqq*~iL1&EZP_RPsP*f~2*H;nT%)YZb1{p!?rySlV@L5a_&bNLhu86wqg{zL
zZHiq+F*~~tR+MQ^xiv1GSR%d-AEQ;X?x-|^{Qk764uy;xANlp$7XydJ`1fFbysys)
zYL_)aYBF#qugBL3Pr!nOjWUi@*opb9(<WA`4u9KcGOS4KXZ<I~Mx;shFRR2YPGZZk
zKd>c#*iRIxI$!?H9<=+7(f`NQm%u~ywto+jqNorVOGPNzvhS79YRSHnvSiOP7#u1T
z4M|1zD9g-X?E8{JWf{`g8B9!#Wo%;`!+S=*-}5~G_k5;h&YW{^*Z11K_kHg3FZG_Q
z7$`|d!l6*)680?od+-tnB&}r}#Zg73eCAL9QX{mQMih)*fR%qLsi>Q);4v>j>ld(R
zo(3~Q#ghE$(ACVw4pZD5w7X_ze^{UkL+yfJW(LGH?HZA#RldJP68`}O=H9C7M0v@b
zH!R&#n_xW=3kwmX%5G-?Cs;su?lIyru17_HlimWE3}F<TbvSJaD96q5F<(wd7r6_G
z=w8sOu9~Z`M^2c~Oak!1EJq<Nd227s1{+*_$1F088?!?!DxD@G>3|yj(T5YWqG`4n
zqX=cX|L6kde0O~?cDklY6{T9M`fyf{PJeosg8|LZ{NSZxq#a)TOYo*mJYB&dDXqtG
zEP(a+_EZetofaYcg;d}xI5s~@Dt7-n3f^EpJkA<;dv?Ru1<gfSj)6B0@q#YY!_%EB
z*}UW-8pf|mZuzJFq3XhaFj1~y177Kn_Rbs>=YJ6~&vAUe>Re%HchEpt_$Dw+3P3Ps
z>vgI5KqBtUnvd4}xBn`FU`NwF%UJ>YkO<JH?2sIB@hXCJLxR!Zw++id4Ce<u46qpx
zr<V#IqSdETH!jAzqsoy<s9fh@I$&F>WXZD{@B|ccP>I!7P;-uHA3(Fy&qz;-0D!in
zjS!toC<*MQfK-iQjJ=!Upqq5Don?lhfP8f>1H|E`fj1rM8pXHSPlM%QLg?Km42Vn7
z)q+XIKfdFi?zh+}8m|hbT>!sE;8M##NetO$(1$#<(kV}Gf6%*rBqG|?pq1g9@Af+m
z=yffF%v;`ijx#)Coet&Kq?CP-^rx7vW?B;=nN|YH{FlLc9o+QHv%Z4pZ^@hdaCiv6
zV@HwBXQxB2sxSi=#&;)FF?SBRitI-znI+$W(lcAkH-5v$yzQyy1dFvlBu_-;i+&_Z
z3~><r31U$sjBG9h1TQ`5*!6K5Uz#VSliE*pfmYYDp<vs<FLmx!yUM^H+&kP+zf>Mb
z#8!}Q?v?dom979&rv?4LBO$E^&IT+hd{!w&PW-UQQbyG|NBc2AJS_P(Ak?&G<Sy>#
z6?$E1t<K{n!Pf(*g-^h55wxESII<ZwUG=3kP+M4s(Kx(9G^@VNw~r0XiE@vL^51@J
ze(B>wYLw@vdYB<HZ-N!cmj1Q@b_De~X;j>-x)uadE{g@#-wP?_YQUMrA+irm-r2qe
zmqZ0tNJLm~4a*STb&RenV{fGu6iu3HRdct8o|ZP`Y=1jUq+>|2*#I#2b~kvugG<t-
zUkJJQKoA7_`c!+})G$s3hoJY|VIU9G>grp3M2mcL7c-^XydYgRC#M721zVg&y;@_4
zaX|MqkQ|_cRXuHEegR36MA+n()75gmLw=EAT?rfy@Q{$5$-9Z5&v``PhHM+_`(ADW
z-8g2PWRmUy`tM^S4QU$}x5ru=;%W`eyMn_(`bIHeHB)EMl&H{Cx?5J~|HBoOTwEb|
zSzTe`1}r4^`Xb9KCJ?v~YA&dI7x(KN{NFl3<*QcB4bi3~s`M23(n%zYV3r5kt)W&G
z6c;e!L$5i4*;s)*JQ@RyQs^n}p)>O*ArX}$7s0^@ya7)=muWdJ;|byv-RtZIjs=R(
z9hPtIeRCfL^9Ffd^mE8+`A3L(;{%W?4Fo)bhG?e~o-Iu_ed4av+4j6|SOcz@zvpy^
zZ5vUg6U%j^AHWSz!@xsP8|-G5`<F5chuv7W&+qDUk>+;<4nQ!@90iM70mrC5bm8;Q
zA#e}+qszVUwi)UHpe>T~zeefy><RHuGUbu)ku*SQ8jfFbyGE}V?U@I{0}VQY(Fx}U
z!viw6{t6*3(41)IA|E@rORJdL0l@uN>GeY$Wlx2d{+<oSb^jxbpR*6aUU4X~x~JP_
z7>_G^D$8xWBt0=^0fovV<%SIyl|w=Ej=JE&%MuCfke0RLhv;#T{4cC?9`R9Z+%T`t
z+gHwk$!t=%=LELW+|=9c7hlF35S<Rtf6+;2c&ODyFH?&DipDJKp+VAgITDqB)MZ>B
znW;qYCFn1hSj;wx*fW*m!?rvq1M6HV&G$xpoUalD!O+tFp}en6Los}~Vha6?KEi4J
zi=?sk;F(i6yaBW)&)>;OlI|N*GSZN2d@8#6ra}c?@8r)yA{2T7x|Z;Rt19W0u&E)F
z&9JGUTGkeB$F%E=D^)5;%|G1NA@t9Ccd7T5yH=5DVhC3!jq1|beazmT`;6d6m!tgn
zn5C;#L2yTOPrh2WA%iJ}<A{$}61_dvpG^^!_5D!z`I2{v>36Pxtp;1uoKT(L2P_Ta
zc=C>d<mUq$L&&<4QiTd9$c954Bu0%I8@l@|Tu@>u_GXO$=`?tcgH{zP#4up#XXO0n
zd{ni<fTljGI8%N<u5$pECZl|BQigSnwwjAUb5wo+;^4VxPrDqjLDI*~A+1FbhaeF}
zq-P{I+&HoxoCGOOlLyYyiv|42x&lZSQxHWJF4DhP9!Va741EB#2>cN;;8f~{H89})
z99VyuIvqtn*M(2SS&!P>fu9`I?D0Ya>E`3=`>2Do?9LY>rdPBuOJokEm8!qWBrXNk
z3nt&)V3?<dD!EO!&DKL5P~ux}zzf|M=KEI(cT1R%PDlx)1gaB>rCY-m&A;{wg2uhR
z122Ba6>Q-#;72(iOK;X_=e_<+76XCn6wtC;Qt78agT`Xgq420~x3DghUZ&zlX)~Zd
z^D(LC9X)7+Lc4{quIbj{K7T80YS#g9_DTcN;3U|-dUy8!Wxp-rz+GTL%bcyz_D~Dd
zsQg;6*AWZeq&$r{cOe(00j(aCSEl%W<Q_3&Gm@FJ>RnWv0SY3b`_HTOU(L<J%-_Ho
z>m^WfU@u)v2lx97X)&*@O4P1MG4TKMp%1hsk?p|#tVqklZj>9=6sNK<j1Ho_AkuB|
zx`DC6!j?a!3LUoJw>11w#J$zHHicbqxD>zWA#>@@&mzeQIcO4Nz~506RvTguPJjQk
z5RP_(HF@k1jDWz1a`jI8b3#pJ8j?fl|Ck7f{lY7NG~d4awH!H@Psd=`KO#4C(xcRO
z=ec3;;FuTAn@POm2b+*m8LYTqX+yQRt*cd17tFr8AN8TzKH}aX6uPTT>{H}Z5gTuG
zS3#Y04|b)ncxL8lz<ET}%KMgl>bG`U!N|#ry=1orL^bhyyUL6k;$AfXj!aLLPjY*v
z1z5$<%|#QM4#m@$<&lJa@q}@P5$!=hU&Ry{gI(m|q7OsFn-L?L9VH36nUaN`XprgA
zzoY`5meE>u9a#l|u;6AAN;yIti4Qadv9YhA9vEA22A)$io-hEKKDs?KZQM8eP3_uH
zK!pfPlZgi72EM@vyoIfz<3&&|<5LI)3_<k8R37Q^`Y)dF?79c7LG;@H2v{|K4Egml
z@?y;g->}8CcB}7{{^)(z2{xig0M`k9j-NXf*CwFvDN^Y!MGr!5Pkkk67Xd|1_U=N`
z#qlM9;3JdZX-I^mqd5hLRt)!iR7A+dNq`g>D`*Zq%s7fP$K{E)d6atIfq{4`C6W;$
z;}@f}vXcjj(u6Y79x~=wu4xDs;c!c(BE-CZ_Jr-AYp>tUfG!UX9(vK>FYd!ejX9O}
zFB@~VpNJ&UTbTB_5g9j9bAQbMoc7iC@c2y+0RTviWZHW-ECQznZBvMM{}l~}FM+FG
zBYvK_r-#4cjQo@}A&^;@i97H>=`PsA0RnhaM3~wK)qJ;==Td*eMD>3{N>G5YfhN)h
z`yv4YRLige#PIdKX%d(V*(88B(l5yK7+LMp^+mXt#q?}n1{ffULk+3x^R_SNvupXm
z)OA&{Bu^s?X*X(-pynZ^M~~G!9?%<P3(n+&UF46a`*84ZxCNTXoHw@r+r>c*RGbx6
zciY@tOi_`%FBkOBhP3rDi^g&z8$yk)ATOlFOujQuV^ERxRfdfKpisgDPH$c+_ZTUM
zPn8;UhtQ#pQC)pF;^#~G4$^;<`>mo^*rJHZ4GDhrZQmB`3pHGr7Kb9BGFCbEbMB#o
zv$zUkE@GMwi)PR0Ok{v`4O~oJx3Osa5aJO~za;?Xa-8+n0au`Kui#(`71v)5><9Dc
z?u%*bHs%?o8FvNb=ndLGhV%nXN`AXbf3-8BCFuIbd=`zP<H;dl(bD$k%D3O(AlYVE
z2x#8;K)<{t@DkW9B{Q-I*PwE7;wm!)W9wnkpXm-|{-$3XpE`FO?3X3KT?T#|D+!ZU
z?<uqd={*o|1LR&(gQ8;A?;O%c94G1t5%zC3F^Y{R&D;>B<D@D^7{yV!rn}8!-eImL
z77G>z3Nzff59}{a0-0|X(?tdmIs35j4qS>pvs_g-p6&#i6u(-qzwTPq4Gkftlr>#h
zTkyUJgwOQ={W<Kpx?%v#)IO>P7VFW=0}l*hp&-04B#a`AoBFF*7^w}k6bY5or)An$
zrz-0%M8B-XgWfeL3Z@wA&Oi8-%m^9k8Te5_9MJ_Ic0%RO3S9#6{&NbqRkS$vXrnbu
z|F2wSpfP5|%JtBkIApS^0h%3rt<5~WIPjoGW&CeXUG^mlo!hSsQeKAIULCNrA^ae5
z<BU<-vrtt?%Lg;ij<u4`;ha#TcaDQ*BW+|H$!0ZNJ2QhrA@h~M4VuAnyS|^nsT4^i
z|E}B5ZHBgD_Vb|qIzcFcuRA7f;hy7cMdSCgvLRp|Inhgsb^jN!4?D(k4?<EV9)S+f
zlS@PmOlxy^86ZP^>?J+kc;ef7o~H1Bv~o+OLbdwM45zJ0BRb?>z!KM|e}MG2GVt$~
zhx5qYhBw@UH5DM)^ON-QFmR6<GIV<#gzdjQIVk`-=Wn(sw(SwW&Q27_%6fBsqqi+3
zUmNK+0+Z?sz**wX<4QT(=wbK&Io!)oA=*@_VvxV+0acuU6zG3?7=rmTKmH%l<Q)N%
z6UjeIq@DKKnZ+oeIV+U{2G$S<D^N7+m0Q<%Or=qo76R&){{N?F@C$~$9;rokk8`)N
zYRn0F7|>Dp801mD2wFAfhdc<l8qiC36qqOhJDMqFg!B&Q_!mHixHGs>zS?Ubw`iJg
z(xK10&p`ZBIEa7n@OWm6gYva0c%dhT#fyDyDxF$uK+HeZ&Ic7P!t-<OIq)LPF#laz
z0_hFNrG288-10~S_{Z|^7Xtc?v0_p+O3f_a)Ws|-3k)#-IUMAaF(Vp(BiVn?(f^fU
zV`0=6DF4LL$|%@UG@qjS-yb6+r>Q8a<T9nXuqVs-BAr<klJRpfslF(iDQ62NLI3AK
zxAzn>(XRm_f>nJ;|M@NDUA<XzO=JS>PQYqwmXc{!krYa*xCs-vilK!WQ#d4Q#;@Sa
zo%z{h!o>hr(&@Lp+LX@DvDpr!xwKyz8?@v9TSwFquD>6<(kqBqn8T1>t8`P|kzSD+
zacW4pA6+bf14_AWtI-~f<FRVmkLdr?7VD1BD9+@~?G98j_WawTUuj4otLZs&GwC$r
zi|DRua|8S7xn#3FPtErbh>!c<tb~3u=J;ZjOjG0bFe#c;!gpgCP;<1w;P_260^W`8
zJfOT$`SL#~2gNBP!BMDhIXy?r_r-du)O~FB7P?8u?4EruNt1)S(96B8`=3rgoTsu$
zf7l3PBqC}93^_fH!iw#hyF3@o!UEY#|I>E*f6_+dNs-`ugApzaS%P9OVh1PLhsf3S
z+xG&(0!%62NGqf)6aXMKW%ubIMW+2kcfW{~N<DKj669^|0zT6*`aeg@+lun-0np8;
zfm0Zt6(@bQj2pcj8yZzhwpR|SOJQgl@3)&w$94^n%^5})B`Q%NZUObCW5i$_(S?&8
zB6IG4YKalR0oY0x?G_?Ep#UW$>Fg3fY}{>V($G1hX+N%RWP^GA1T|_7Lk22kmczAR
z49+tzb&V1~Bj=DM7k7d`zrF(cHu`~)>M+%^3o{77o>Jc(M~X?m;0u-_nt7uq3~gnf
zs6;MIrJ;c4*ipcmps?_E_-XlBF*B|D?^GZ?6-;<Al5YDs6TPGsbq!>Q9z`03z0JRm
zrZg-AViuc#6ucYe6p%%F_I82|gitvyA9?F!yOt^0ep9XMy8s{a0m0#*o{5q=?|_o_
z)vc<~!tMK%Qj##ZR&NW(!pCd?F`LG;yJLlsPJAUA8%2wyU&4yLfCh8Bk)W)d4iJ%1
zh=WdG17xDq%sE`KE~COD{an<^b@aQiygKCa@cMN7$Oz9Y^a7@Ptg$4Vrh?YEQ_5ox
zczHFfht_RhgWCaUFc6oKRzm@{8uh-2piK5+!D^ZCdexGUJCuCH4o^g7ND$=%shhLA
zId{A5`RqXmpm^rL0$KOYLKR!KEpVU$O<`6Y=^VwoIU%6|pH=sLe#8O@y>AFcPJ?20
z+s{s8o{s$Eu6&Kv?tD7JJyyIzR(>Bk;bxRMR1K{Y$<r<V_D$U_3b=_z*P9U6fGv;K
z;S-D28exv=IXH5Ey%VJ+YPqIy7uahjh2gAEwp00-8I-=~kHX~MgL7Tj;g+p|X=B9W
zXVeuv#8vq@-y2Rv@J6p<&E};IX+^#qoAIFTEsKER*3Ijb<)bOy<=d4cF*9FkzPw$M
zWtulK(<qGGiie?Bc4MSpI6=v^am7VFo(=2iMqxqYiHt2H{6nsfw*qiLB4X#MnqrR=
z54N$`+hBD-Vq+VCILy`P1ze^4Zr>j1E83M?%t<gMTk?7rNfmevNAPZ}PwF<@+9KrH
z%4y_nXFl*+t!v+KFA_8i!>cYfyTY6_ibxV+l)4cYzB^c@ZI>ELT2R0s_r!V<LcwN$
z2<3Bsjqei=+NHRMrUPkE_hxd@gl&c`ZB_RG=%A`szJM-T3Ct67BYT(G2oDgm8qy`Z
z;oq|(Bp0IY4Au~Dc*YN!K^&4mO2PsaqoDX@p_3a&?xNc$C@Sgg=C&#B7LkihVzo#z
zLw=={v@y%|k6G+$je~xpq5^`PIM@4dPJB0zfPHl=RR}MBeY-)St9xLhkhBHb*gNIy
z2P{g3+_)Cgzu%1IYHpsfx7I9YpxYNHQ3{8>_(Ir48S98^w&GP-S5L<cEz$Bwolxb$
zPl(F$Hz8h>Q5=t=Of+u0P}gxDH>47GS+SN0nQtm)j#tT52{cWx;@$Jk?ImW(1F1NV
zYl%spt?PWT0*Vgt6xD{0&<&4kFJda|@ckdr6$P_zK>exbE72l*!_k1CA<Y6s4bObt
zu7L`mwr?y9g9{ksJI){;8yKL&%lm#U1|SBrZn?;dK}^Q;Lp;ET1K%TNAF&jz$QHZF
zyEN1o73|U2oCF7>0!{E`pgjOejmF>)!Rc<hwgoNIuzMMP#p`f|j}q3_tKCj~L{kah
zTa-wJuF^hsw=a!%?UB1~x}}g&d<Jw&43D?i8!1p|FR|yv+H7vTK~&<kJmr53H8S|A
zqZ8e0U&9nU37Iifp)bguVF-A<?I(Wdl*EGD3)-jl+VL&KM)tx_pqHqLld#?*x0)lH
z^>_QN#!%ZZMD!5Hcy`CwuyTTG-tveU!SCB2L;wv|-I!VOm&+iV8)T@y468BDJ@qF+
zY2|cyIk-L6rxp^wJuQy3z}e;L4Nie!&V*x1PnVUHo_h5~F_-N5hddgS&xQ!wtOh+x
zxzT<w1b_s<JcDFd<J?;kkCIPQzI^QDMI|E0g9}tgu6_>mxz@S2h_2ujNB`WY+*w^*
zPSUBaP4D}G&j<58kjC*iU(a{cU32jJ;45c^VmGeZptXYnqveCgKA(rmZ&-~r8GU_J
zDJ!I)gW(*u1Xrcy-l5ur!E!h8pXQX`j(2te%hb7`dBh{_TOFG$P?-+rpaqaGBaseE
zj^B1Ghu?KqTgROwfLrw1G-eyU2tX1^cMy*;25x&EBL`bN_$O-eRu)OK&Z~lfeiRta
zTfV2(ODorDxbk~VanYh?u7w!^ZN{@v;@Og3Z9S829FMml$Yxf556-M;4_5pkT?y2s
zU^7H-JH*v{!&8&7R0Z01Qni(BQrT#kO-6<_AG2=0|GmzR&6I$i<=5O@vYpG{zy;7*
z9T@|`7t=niTGKWrT|}Sz&w+MT%Q}2K_$1*KDH(d_2^b$%W?I<xRb+h{xFlH9PS9|B
z*Aa&26N1%Sdr9|3^+&a9s-r#vfHOHos^aMKYSBU^;l<&5v?_)6kXr%R!_&-=*~ykd
zCP<w@z<g_#J$|UhKZf*DcV+krf(=kmjIuEetE+3ME7-p7RQ_*3aeHA+ce#qF7+W=O
zHM`CtulP|jpxu}5A~C`I)-=bo{P(LFQ0R0PZYXzoh{Wj^4@}kK$R_rgs|}`FBd#J{
zo^TU_OZlnHk^~Fhy^qKHfg+HuJ3By-!X-$)NHCZ7me(J7sMVh|;FDEvg12pSeBw0h
zmD#r$)=d85JCDw6kdZ31yW5yo7v7oz8LEp%+gZ>?N%3--?s^nV)N&jGYfVPm+0#l$
zt8$ru{UXroYPBXLmfB3RMs^q|Yrz{ZZn1rmb=s72&K?dA0QRtfsFD9CbyLtN!-i%<
z8ECH?aYHbsd1!37qV+O<DmTN8!8M8H`9~fK43t#`-gWX!`8bYB><GO}DF4K@Xr3_=
zBoOM9`+O*vvyBnbGO%(B;rFdFvvXqXtM;aA0ANWNStLTKn~N3#0|hX+Yi{3yv#TP<
zJiZA9hB-SbJzL-(a2fS+zKxchFh6h&zZ#zq>tZQG!q#(LmdOn>?~)1Qg^7p`=Bnln
zbF59<g1vd8r{a6`5CiTO>WR5;7O|S5SOSt1Ivj2udH7@rJ{|LjEow4O7>q5WKsvAc
zJV?tqQ0r^AyGhf!rD-!O#+i3DFx$ja9rP@wWlbNwtCuS?@4S|+>l+)aw5U=BnuvCR
zRsYKrHor_ilrpBze}@@C?stB)LDIpk^0iroyN~z`K{kr*#>6K#p$HAmK$+sTe`i<+
z@9_0~A1e$Q;UmL=yL=n-of$|xDm;jE+3Pb6WiD?g1k`QExqW7EU{k>?4-=vg8+GT$
znnGGzH#6F)Lwk7fmGIScr>%GG!FZGICz(op4WUJ3^sY{>?ia4zJF$-#%l)qA-dNWC
zi5otohU}1h!3M4*-4&q(SCx$_6|1CMgkegX*6XVDjq?BklBHxSJi*nbbMtF^bh+oe
zYr1!HjnT7ExglJ^!fF>-M~Q;xsxHWlmM}pFW3wuwsk`KM&8BK|^22~REUcud&`9aG
zEE}Q6{TYLUhMk2*n7*GzK_yWg#QogbB<TSn{&RJgV`!;r<MuMiOHMUU$VN1pqsw)o
zXb}!rZ&TN&{#<nu+V#A(*VU6oSH>~3jqR0Px7M8tcs$9Thpa&-ET~yRo_|)$U<N#V
z^Bdun9|0|UIm`Q?e9#)%GbJB)rjHQ!5+qXg-f~4nHVX8uG|Ry<E~-|c$nIOjae`Q!
zm!C@R$7TcUJ1KdPh*-1h6^~X=2m`q1PT^~M2%+nI#74AHgJ<TztF%Vt_*6gis(%7$
zEDw+>zTfcRO-B{{T?dtBsyT6StoMiP?x%xY%e4<?Q$j+~Mu%L=seJ?CFO=?QtX72@
zQ?PgT_-(!g{dv*E0`bto_YU2Xp}+^x6a9fjz7ssfeiM};mpcKenxbWQC?K=3Fd#!V
zAt((7y&x7j7Auwb7E@F)b@!uW7d3h^&RT$!T}_{ew*;EGB+qT}Q9z)Vo4ixnkLQv?
zgpk4X%(BNSdHh841S_I!PiLnU)pz&%fn_gdSkZ3TpR5>(Qyf`+U<MOW<nEIDY5rl4
zgg1J(V0-;&{7g%`3y2D!*y6!$4jV$cnB-~=*_uG`f^{x1*ZI`-4#l`su3_f|`lG7O
zgf~?JW=(~a3MzJSczeC{YLkt0<8(+%x`1-PJ_FN~UphsSW!uY4Rx`sl%7FZnCzw%V
zQPNmhb_eR#Tha~0S$SilildMr`>~=@2I>`DBOi}DyEU*m5{W?EH61h^G|95$O*ZFI
zO6{1C=?J15O|Q;dNTHI&`mP1g7$Dy1(Ua#ElT33Oi4WW_nDU-PM(vHeRxN)dNwC>#
zRTv#w(L^W|P)#`s7cosfV#^f7)x?raLVCFesnK-2S+(4#D@0Pti|gE8KIsPusVg{0
z0T47z7@FNag}94TQetJFw=wATP}?X3Cn?hQ?&c2lIQ#!lU4+-`u42qR3@?s;%0>0_
zl^h3`IumFs8i<X~1k)_92Kxz<@uoVz+@L>9V4%d|y-)%U%Uy$l-HOV_=I+i0Xo1u=
z2O{sFed=n1mc4)sQN?m33F+-A&j+OBlfBWo5RVU^p;?|njXfP(9!^=mh<sU|9B6hV
zdtp<t>Z6Q=X4lNhh?E2Zvf6yFHpB?NKINszVy1<Or|$VsIuTb(k8rr67w|wv!s<6&
z#}yP5o5cimcZYePM<*VDw||`jIne5LHAFO8BEX6=rknX)cXZtKZa82^5kiTXYZ=i{
z>79&oe!+xQis!IpV>V?*xaf<<+jmZdybKYZU>2W(AfWc{YTP4T=4&PzSnxLY|9-Y(
zkBS5NnV}zcL;eW3;NbPwAkh@h?k4X*D<+jn+II!2RGaMCgk^_-k27x45J$l`6n6`w
z@{6X|^G%68V2T2O?0kOv+}_Q`52agRL{#;v#AL7Bcenm^OxKzH>5{zV3Q`-G(<CF6
z6l2x0hBHMqBmx|q8vi8X2+%EMn9YpS?U^l{dzwK!mcSPkIZQ|)c|+4y%?V)$nkrxx
zcJJuwL~V!(=s8Y#+DsV@Ebfp@Z-vq#*5%o)F9IVqDAk-q>P7@ff9{2&3qfJ36eR2<
z2DgHs3llh}x3%3kN!t&5;M|tw+S7J8{vjWBe9U!etpk_FhbQCe^qi!B_48rNDVp94
z4&GY5o1wXRZJzb+6fzPILQl^`OR;0iqLxQqlcT3!x+_={^fczV>}^U#Q%&TeT>u&4
z;>7Wbm|ROcgHw_pP!h7G#mVQ7-){Q3f+*k_9CV(F(3P9-FxUF&ifI~FFQpVQ;Y&*M
zR^t(eT{__wlv%UpD!>?ghDj3f_!p0fz1^&4j5&wLPj0vgWe@ELuF0vXG)87wPI;CT
zhc|?Lo^Rc{P!FZ3=%bp7R4e;{78VCdeeYkAnyy0jdxHq)w&X6E=p?9$ef5knLcN8E
z^$CYKa3=ja0G(UXHBJ{w0mEM929R9IM>Q9RmxqkLW?-=X0h4-h{)BR-(x-HAnL(fp
zC7lGfwq1>$nRm6x4lyJ=Ho+0WwG&{Ln(Q?h3NhY(t9$9kO^xD2E<paHm|1h#cWT20
zdLBHKy4x@V-QYJG|5zF>>#YWjvJo;H2ORmw#NXDI8y%SJ#LeIy;P48H#NsN4`G$E{
zetJTWqRO)_jN62j`l_3ogK1ONj*k;(+wP(lBIo#qo5!=}xz;`WUEBW6%&?}!P#Q;3
z5oCJzS4%sQ0>sFN=Pz217i;LKmU!*h*_wq_^hNAw2TQevjO8wm>>Wkm>+7rYgO(@=
ze64|*5K8JHSL4<ieF+n$xfVuAZBK1`6lmUz7hl3;uHwcKlr%Qvo|(W;SE=PEh_f{)
zw^$i(j)z}1w^h2%DN#}5xj3G6_$|tw0&8q>2NB?z1s`biLo`IYD6wYD+Yp_~6?v5G
z5(Wrgbw3ToD6lGP7FTln?5wx%BE;ke`W54Z9{wQ`;e5W*rbl)X5oeS48X|o?bvWE@
zZdv}J_IKlizy}j(1Xbd$N$#JaEQNtrP5Fua+g}4Tr6B4>mEa6vhwi6&z=Ai+&4#$!
z3bYP-<AboOWxhvOns9vxzr5Vh5F)m@*Y&<~$<7lOrKT7UO#_tR*w?9)7%?-BtbUu8
z-6<)=Y*|O~w5C1UZrI{;W6+ybTWcDvb@NHo9tcSqjzj5DOG*!id@QE;%LJm7XR!Yy
zxE+^@tNS>NS^zHkP2wA5Q%p*FyR{A2n}}7cZLQsK8#5;OwG1zO+p>9XVA_nU39lT9
z{$sARQaoWz^CHN7g_&VJY+|gCiQx3z*jqh?M+RooLdg8;ZEPQOCJYBt(sXH5zvCZ?
zt1k?>ksIFQse(xy+)R>7-RpfINUa`$84H2a;n}_%9_bzOCk~M{0!~X{%7KvYt;%`Z
z`CznFmCa*jkhz-9;Vtr*5#qsv|1l&_+f?ZZPS#x^%JJ;dI1pccXn9e-eS}yKSDWE+
z;@NWC%r8OEX4&+*@?vaSN$SvzvG*YlopN`bpm##d2-~D0#MKaBMErnErFTg<y6<#|
zLYq*Dr-#*UE~%ouRB{`5+wM{j7Ob6X_`^!0_@k0r1K`-zD!>=aX<+xvsj`hvb3lA&
z35FoH2ICO!&j@PNk;mLHt53A>4-^e@)0p^tO(MIy2LybU!yhG`vh-2ccSH*{F*F}*
zJYH_})4_gVrLi_ln1xuNdmP-}PAf}V(QZ&mUv45;we+L?ARhQJd*M;NAbvnRaOJgb
z=__0vW|_LKm85+T(lWo3Y*w}Y$SwE!0v>xh8j6%V*^X7zR8p_TaVL&l2h$v{dDOc;
zHq;)@Ra{+y!~M_LJWPH-a-Anep7q8AEULOW$7pH$sNAy|@X@U(U;o_m+Z<IC)|YaR
zR*F5)0=squ7htoX9lIK1J*+yJ!=lJ{O{0{e^l(^QtD$RfuK=_J^A<tr_7er!RoPS%
z0QWtMLkJz76Eb+@UTu?aH^Bf!E(rg)HCw}o3FGf4rLKoo8DaJe_y(okKBBZ{C9hSI
zV_;r3`Rea|7w${UZ#BaRBV-`!vkeR#9>Ttg9<&CaL}6p<WIA!wQloh}G=-&hzC~BH
zCJ~PLK^aKnL(GL2YLFM8j-~IY(x!NGT8yq8bJ{3{jX(nF+a2pLT8pkA0j31*!bZ3t
zwD%SCJj57cvBVFApKEUL%3ZsWuf99Q=e$<CbcHwPl54sHVfQJ6MGfF;7#ujIq)-e9
zcs@--`JHS(k5Hc=n&2^45;!0&>w(1fO3E8_eslHmsj1X=x)qmPOgP+rRiwWf8E7Hx
zI0ihV1W-4(6BHhq6{ma}+iNOiS*fz=x2O(XJTl7+ncTy`CZ=9-;r7DG&O?{2o=e?&
zEn<22@#BJmL*nA6eGi{FrzabEc$w`ia9ut-?(u<dIS0N?zj~d0?b}6_i<rm<gq_{Z
zv8{!fOSbu{*fID7u~2XLPqE)aF9Vo4PK8KVlVI12WI*sQm`+NWg#NPOatKmnz1_gS
zsdhnkRbOANarEY?j)tT@a@Z;A!kmZpCLI1jb1?nDy2y@FnqiiEln?JPS!m8|9+-<#
z30-&!aqsZu@9^E`5bjNvCaafyRb=CSFs@1*YCjdY_<gvUpggP+xkUC0^~~h{%<!Rk
zW85q*f7*$m`KqKz*9iSq@bk(-kZQYHz`7G8+L{n>Vads8QcV0?eL>}$8{=Vl=gTa(
zY{es~#az45Bcm-hx;S@hhm-+La_0L=mY~p{UF*_IOHh%5yTABG)vka21O34HST)~4
z>)xou`OpfBgUU?jDtTt`aRu4LUPhWn*>guVvtK*HEgZdM@2WnR)r~hMFKY!h`PO+=
zKVByio^~X{BzIJE_q6@iy=9MapK8W03ExS3!fH}tTSks2D1#sUJtrW*1k)8F)(9;c
zHTeb+xlFyx2K+d=JJ)?ha(jL_oY}^azx;u|(8XOYOqiArddi;Z@X$JUk7zi102|J}
zWR9^~bki^FdlNd~g+0%-ucq^{_2n@}kK30#Y)m2$$Alw=BL<IXg;YPko>J#EAUaRH
zI7`zPyc8c6yKbi>k;DLq>{VG;uD*O0^u~ihJ$({;o|`%iw$1+_lVK?(#bp%k3WU5r
zvGbcz@iKYaEVSj1isw<qZSN+bb7AWTM)uC9Y0GU7dT2?u#GE-Es4vl?pK<#%wNi%7
zqKZ*yuzSks$@*~(AO8F><>bxUh4Pkd?(HhckO9%Ha`)IKw5l3#bkbNyB{NX~6Sm{8
z54F}E688&(hnd8=IX@NB7?mgOQRRo9U`h;fH->Ey1U~UuRP&`{jmcl^m^KW%>rWQA
zZZSL^1W?c31^xxWNS54lcvfS={rAu7hK~ik3T`S+DHU>O_xJWPpo*GF^=eaUXGJhd
zQ_aI#B)=lySo~@ArhefBYVhHvqYQS3hIV{6d^=7xDYzzVO76pozr#)KU^Zk`9$MSI
zuI_VTiTj7x{Kcc8425j=af&hJo4qYjaAbQFT$O`o@rGBj>2G4$7v^121)jxyVCLIe
z#B6vgR$IeGiJR@GX!Sk`gr6~N8x>yA!71RP&ka@~xZ*$8cKDX{O0|LyC~X?$S+tz4
zP%^8qxP@ImF~V6KYnmwTcFHN3hx>CdPPsVgDg304&ROKKpP7#j1e+x+p^~EDv)VbP
zW@m8f3qXq)+ft=i8n2?{R3?^DiPJo&4(3i|{2(>PX^_#XG55X(T^8<Fo(LQ>$1yty
z>~}Q1snZ*S*S2SRi|)K)GPD4hke)V*^1&W#mwj;ZQ{}z#>U`kvMrh(@@a~ptQ7L<!
z;Z!s%Wb0R}#&CgkP5!q-lP+HlYb%W&_<p=W|H&JJjX}YV_AvuR<o9L8&lj%#C=aU^
z6}l32EBp&fmVne4T?HzDdqUHho+XS~1z+<WTkKrPrEjE74{hvx+6?VT*Zi`%X~Vw9
zSL0)F@vTn+xZ>V6GJ%I>9?!AUvD6m@=kNIQ&HP!`=mg`7;!hoC#C2E3Piofs7=(~c
zF1nTRFX{bg^J&x%Xq7zUB|7g?etrIs1JZZi)KqoCIW%UonHD534HTp@_fkDkHKzZO
zfZ3Vis%eRql+@4{55m_LNB>8<$3I6ZF?QTx)-=I*zaMGs4;fPH;nimPduzJpE!*de
z@%=o%8N=D;6Q|Q_TW~GX5o&dNYHV0o^_=0Oc0-f<{_YMg4v8;ls_}#mQxXLLuLbvG
zW4%eT<i1Jp*BpI6*|X)o{uzYMyN>Ee$qQArj2O>0#lIrr&lh-h91?^Q8SOmH(4CO{
z6G%E2(HUWEl(Uz9!gFEJGao(uVwHg<`6o;u^k5Cd0(}-P91&JO8WYJQQD%M4oiRBl
z*y|no87ntGTe?k|BoJ2_VSl&b<x9dBnPc2~8V7j|%QC!k=0c&9e@=L+{IyeIS&?6!
z^9w~BNSwRJ?sL*d#Y$@keYPI<{_2|>Iw!RHXv31{hBVWE4b6-7@(uQ#8}ihP7LF|B
zEgjd&;m^4=NV_WkvP22eECxj0$=67UouwwfZ=ORQCwe>s4t(nWRl)u3^nB|I&)Vi5
zaFucLJ$|@&t$7;XDOYj`)mD8z&oJD~nGw%ad~KuE^x;|?I5ckF2O06P%8NR$dG<UC
zC%On4BD<S#5tD6WE<M9@dod3oA`7ehabJX?=Z5!GG5)PC<-K+ud{c~KYCPFnV=<hX
zc!34Bx0Pl<nfem0g(#M@VbI~5&U;el?2PPK1j+ceG&bX!Gou&-aD~hS{W<x>SRFJ$
z$;+<e^13fw<gM^Shl)CJpMJE6w##-`Ru&fMo4QIa#<|*f|AH0eT0l3$f0ep0u-u)f
z4}1oT(C*zPlY8q^_N{(AL4Hdm(6g=9H4JtS*joHGZM(JzXGbQDnp-d~xS*pC+)sw+
zzNa1QRofGh*P{u=!h_HuN^I}hESS3AnO`B;Mg*TNAZODu^!k*^*Qjg({md7i@7S_i
z@LL?3vFS-@mtkJuzN1Y@dAzHi(7)SU)YK(EdHWS{<8$N_#;p7Y5TE;#tN62h#6TA=
zAXd_r$#(S?lkmIbW(~F=D9tX5K@hU|Uaoy0>0Bh1QHa@0w|Q>MaDMjwB(uovK%P3G
z2SwzG*ft}6-~RPhaeLl1TGQi2>IOq~0QHC0kppIWzR?od3WY}FN9E(c{Z<WT-IPWq
zX%#*)03kebOge%L`tn5o!|X~qZBH)&2c(=KN&(fmi4oYQf~6OrQxvqjnlxZ`<nooD
z^>5}s#~i|YYiokqLbn!d-H=Ii+nRH>&f+)MRqul%Hhi&<A0|T%64!tD^5^d@GjkOH
zK$K#FgWc)B(2XaoiJg3|oOc8?gAg9Q5$VTLlQJU5<k(YeefF3PF9R##%p0T0r(ziM
z=VFsC7(3)j1zw9Px_6*9*5TNNOxe_$tM)o_N4UwVhqC(BD45erF0XwIx!obvu+jOS
zUu6G!i2QKP_(suHbsrt(rY}pZ7!`~bj=P3>%5nLPw{e3H*3|*qLfq2}Yn2c1QO1~j
z@vUZn_X*;={aOIx%VRfz;}#^2F(!1v0Ho=d@6KY2LcydHE|i^H{QA8MKBftK;q2$u
zV-A#7>jlH)9>E7ycAf?^dtKd04bg#ztav+URA@GYbvMyNiiK}HrEGcFD~yWRw~O5@
z@8Z7r7GI^t;~Aq(?o<1`>TfVsqnNDUx6bSIGxKwA?f{J2W@p+0T||9u!ra?r<js$A
zCv<9yzoi|XylYbfszgwD#25I*#RE+*SU(JWb1E2GTyB9q<6I3K$x1U!?<|SPI2-RR
zSnu~vpZU;pmB$12f(y%do?|B$PrZl@%1Xpn#!t&nPt5FH4$INds1>l_ETXj8<o^|p
zKHde8tjP0PmY5uPWPAR#-h%c>=1in*uZ{c65n}V>0ZS~)qEv55nFTXWY9g^FAX7A{
zFP(DadtvEVY*b`GAK67xzQg`F4*&f-*Q6sCG*EJhBbFQD+nOG~u03n8xpR5)zJKG)
zgIoTM)%VP*GXlYl##sFAt&-Qa5JxBN{Jr@AgW$88aS*&r{FdcpxzX?4dLE2EYkdg>
zxCVS4yqi9lq+@71Gv3RmKR@EjloGKRm260+IYDCQMo-~B+Mk};^6MM<l@-AjY0gF|
zRv10QfE4l49rU{RIl{EhJIvAF+bve3F>d`!*40XWM>~xO!-aO(OBqKTIxgc@h+-Qs
zCPcUF`N!C=O6$pbUb@h0!vf7se(@5JcrXta%f(YylqX__qn9?!a5+ynv6)ZzoH@a`
z<rurLdXxPbX7UHDizCZj;tUG|wIug|$ei8I)T=Q6{aEO5Df5M1KD7i7u$B1tce-(y
zxLEcBZ*`;8<FBTPNPnmphGYWYR0e!?_h2*gc;EE-^vjzYDou*m*eS>l{A%g~mV3LF
zS4JbIq|^L2>aX$YhtZ>KIg{*<;%L|uNVObl)_FR9X>^!5A)l@26iy-2%oAM5SJ(S{
zZ!?_+2r!!sYzZJ_L)G&|o9&)cS+!b}3O3X<M04>P!(T9cfLuY)gULunnm6&Wkp1WN
z=9^O~>gxJI{MN+zy}!{jJ}D{^IJN%W1IsD(WsVMV@N;IpEu82<yiZiOP!Ve;`OY^Z
zoCYO^stHV0qL)f~$4jH_k2-jKYBKGPF}z!((34!3;Hg)|pnp3!p1X5>?yNx9*CVZ(
znbtrA;zl$gjun#_^{FK|+Piz5@q&e+0uOIE?R}eyEcR*1+l3(LvaHE`%eMYvo~mr5
zy#IRz4DCXd+7Zy&%1Xw3`5kROuMIdI+V1JdA&1`h!Lts=yTCGZo@lMs;H|i&yd-~t
z^=-_jA%ftur+nHSuito=>a@)ASBTX)d;xf4k8$#!a3oeR&j0*&pp`(CmtlN<P)tCM
z+4_hITU<_#$&J9Ywx5FX?Mv7bp?>`NtDA?A3XbE0Vm~r{S*#hn6N?33n!4mOgd#1J
zjLVs-63)nO@m9USls?dhTK>M;y7tz)`=s&d`XhphJF4ix<tIj;jNFeFYL#;P0)%?t
z8D~#%>XXD2r&Pv@f3=ceGY=aXEEE&XmI^$#6ZYZ!SXNX5Bag91&rgBt*WTYo+hoU_
z=&?SIvwHsA_E6=pE7`?=N|-a(2tEFpd6Ta{^UBpr58BVpdu}czobWXNbo^<@Al!b@
zgs^$`(cvp_=ncj2!MP#Aku1Iz-~{s)_dQcCJw>_JtRY1K<v9PVwx#G3j?LUpBDEuw
z<l+m5^KxvqUb+T)zr6-e()slspKz@W=?poc9wPs-c_84CD#qkn(_Z%yVd<IX$*X7W
zl}_xz=1=*-Z+uyHzb|ypdDm<6SHPY?{xx(?NjxF+Wx#U-b~yjJPd`8Iz*zvysig;N
zXO*i&wZLf7W)>or$bUrRkTTy;vk3Kbr1wEhEdle7`?*DaqvgR(;hSZ#Q)ecrE%trU
zH!k`aE;kS(twVOGR^nf`Bz{Tfkd)*5&4*8(OV>1uEPCRKjR5}1A<n1C4v||o68VGP
zMHw)eA2aXu61~~m2%M@pdN{RVcsyFT@2QSaU*?@epSG*VX^S!Klr;Zhu@zy5gxAC_
z9R@;4_EW^5(WeZf>o)$TBjvyCkE5SIedxsGnV-X`3T}gWR<_Ws05X2a<fRw0iDBsr
zMwN^fDOa+xZs@EnSM?*#Z99AIs2I`rWdGwPubsly;Nvf9K12hYFJJah&WB-JGh3vW
zTNCudj<9&04iDQqzm`^ixUH!1Q^SX-sQS^^-%1;nYez7=Og7O6N}ThT#`klZ4&TdB
zP|3`T<8kXmmxABgC-AzZS~@cP=L$r9S^wO7tD2$xT*BwkX)AMgz2e_q`gq5aR>^z_
zR&<O7YY|lFE=XN#@IDVSsLO6^rkyIPj2g&=>C7FYMUov$%6ks1=V*{SkD4fdyseuZ
zfHrtfdpFakfCqQy5hy~8$FL5KJsW6G_kVGX>Hy7cd^r=z(XV=N+qNQk<(LnLRZ?g+
ztC%qFlj1amUcTRV3mke3P3C7bCKm)3EJgH}PA>_Gkcfb?exPEU@@)E##%Dx3lZ)`u
z*!gk9^a+qPrSu8*AecurRF{Ui#iK($J@!;}%wu%PZuKtWjbyD83(I`-Bx37?Cj9t}
z78odhSrMMEGd)_-vwU-F@x!dN>%?T~v9OqfA>?<_2j(SvAZB`gV@Qi+pN1ZOO>uEe
zHtvKYI9tGy!{Tro8zrFb8RzRzp68y8=EZ97HqTvX*t*JGWp=f#BU#&BRNH80)qicg
zA^P5ntOL6`mCZ3t-&wn;J;}Ocd~UDCL)JPyjhJiq$=c+pg|B7fp69t>LtRWMj|YBE
zTwx4K@ZYQ6H=2Je4h+do*X%KgCeO#^!m5N$p8;?=?*86SA6=EwnJZtw=$7#!Ju8()
zw7NT67Mq%$70;=${w^1bW1w=4xjcJdxPbfIr%L<CJ+fGm&d7gxg%ZS@ddmRo=;SoX
zc{r<EXJa(*p2(6mSGC1jm>Vxrph0-stAl3@0ADfJw8zc%+dT+opQTs%;VQQG{dF#q
zwFp4Y`1n9_Qr|&|OTwHP#n8;GC|-ki{Jjm0xtD^?p^-Ebbb#jZZ|0qIw;j|7DNKfq
z5lD-}n=gECdmopl>sBFR$~Ebdt_GRmyKz`|tB*Xxe9>h6-S*wU);Akvn4?qVg~V+e
zzY{}AOL&i~Va437j!!#aCsR$Dc$J-1fxEGiPo6LZisg2Xllh!nv#%ZBSJ-sbn&=vp
zUtAT3Pf08#MVa<BEWL>k!v3m|mFk5takm8U=L_ne-l6i_r@6HGK&F-(okKO77=`q5
zroUK*d1T)^^w*fiC%v61#VaIS7>*GT4ppwb441fMP;mO^gih4V4{)s%aQW~=iSAI!
z3r5IlnFg!J3rqLZC#-B9F}5}?$5?yDSZct{rQ3&Gs~Yb0@$k`vvP$uh;_r5T=={5w
zz)RTq2%yI-6QjF6&WwJ%ZskpU;>+7O%A4Da%{`6JT+llnzL(t=>}FMP-CII4@<gR%
z^8{(#bLurM;b8b<AYAS(;`#L*F^RNmFFw^NmRIri<<@QTRqbUJb=Uh_EZhFq5p&d;
zNh!?Bk9yvxj)KAIB}D1*3%_UoamY8)<7mb2HfRmDD$kZ`032Z`vSp94qX&$Lzpu|7
zoshPJqh+HHwxQv;wqvcnCf$K|Y}wy_1w2}vb_2qSX}~|s)zf>*e4&`j&bSwhg6&PZ
zF1c4DOiSyhu$>|uSM1!<)t>C0No|r}Cu11WEs~!otlkjWl}FSBpv*i)N5qCx9}e6v
zxfXRNX{7!9wiW-3=kAdj)|!v?3Dyzrky`KForL@)XFjqmB<`GANP9r*fdbdn|BU`j
zGOj;6VjLp=W6%)J&s{yln9|%TtE_MDa9}-i{Z?hLxzv+VvUE4>LpOrpB{ftHZqq3=
zr|I?Snd}#?>(#vf>%RRreB(|tWPKor9v4%Db{=Xim5-q)uU~OGvUjmpy2DpBi9=ZS
z_*|xDljz>}RwPi~fB9-oKpE(_v-H)~;w6PWJl^%|3fA@Rs5rB45@N&Da7)DPr>lzc
zJ?_~lpLbh`&#0q<mSETAcxk&*r@c5nxTHOwSY^*|;Jey*3UMz3eD9jvy4uO{glb6D
z)zW~u_X;1*vL<cZ=S7MIp0N@#Sj|w1AR2k*8yI_s{sC_OhWRm_n7$zw?b6Hlhod)L
z$)MDRt^$9gEh;6Uu979q3#JP<H`QvZ52SS(cL_S(h6~KdaU<Tatr;db!A{etcB$)v
zAzD(ea5vYK@@NMaJh{G2M0W#R9wiUy<eJ$%&Ss?^74dunbCzwdbC^fzQwB^HXY&ni
zgdPb36kEfM7HneEBuY*=mV9d!m&!x?j%z>iqUe4Ze2e|zY<$OK4ct6{da|#$t;ZDG
zia$~xQ?2YGg4C0d>j(<zn4t|ShqJaVj#{NVZ?38~?b6xHisM>hiwrx*7S4_IC*29!
zyH&%sVG_r-;V&pPCLAvxFH!c=D(T8oo}>BzNwbGeB+)qqbM#ZBGyJ4Q?$zdKMrzK1
z;fW^oq;j$^or$IALZsYg@NKv(nTJ9(IW6+;3u*f;ofm(H3vsRi8NGcqNQw$Pwz%c@
zl*2Mf0xri}qt!Yg&~jJBQ}Qt*yQFpUY(=?9;PG$H^+zo<Vv0Vw+Ec9nk1MGM7bM2Y
z)B3!bf*8*E5+58{(s;E&=k3fcruLd+%^omxGWTsf*z!NO#pIK$`%V6BkvjZm+O@T;
zygS!!90%sS_Aa*?8LWPqbm3VnjBYwT=G5jV|8mIc_>DU(4m>}DlUH8d{7a644Byre
zxzfI*yZ+G);W4JbOTaEO^QQcvwu9$}H^WN^)H)yRU}=XEk43!{%dIa_@N4yK8xZu3
z^p?(3+}r+1Q=QU`L@$^0(aUpOVHvzr>#*z6@e_a0EMu{>@eiIH5PR|A4Y8v_P50Ba
zPP9=b5RyTC<qL26$)2TgD=u#Ry>K0F=CcD=;GD8>E6Wjo5n#HSTPFMQva)`D`Gs{d
zsb{1?B3Zsw<Frv#Zz=TT@6iVgYD#O$pp0UL&1zWIcKKD;e>2il<sFDeMdtg#7V>wL
zZl3Wa_nRKpGKpf_coxXB$dHmyqe50QG57I3wuGF*dL1SPI+kduYr{M8xZ7rifI%1W
zrh-THa{S!DrLe<P>T|d9M92X09JMiVsv|9tcJUzpksa<7k2Mu&TOj-QKh&6)o8}&&
zu-kCnnLp;0><S0Cw-C>V@AT)rZ*GhHm4JhR<D1@e^ZMnS;c&||7{#d42P<|cE+e_m
zIS1Bs_WAL}Q}Opak-UV9^BODiKPAWdFO#cvVk7DRA1sSy)Kb%)-~Bx(`lj;9T+{G*
z-*#TU*GW#55?1C#+kDNh?hV|%7X??m3iMxS$N4pS96OPLc;3-Dns=IEs%*2FwY|4q
zBl-~#CsO2tJ=qe+{NiJ^4|exBk>BF$GtX$JxOwhUZ!#UAQ5bdKn~%L2C4T;Lx|nO2
zW6lJCkm2K5{G)DDqjy9vGWkZwosU7E%4`|eC!FlE-?DA&<GR1tCV`f@a<ENWx8u^G
zO;IujYpAG87U59BASi%*&Fy+0Y;B8XyR6IG-*|_~t%!xJ+^c^E{67DqTE6KQ!9JH?
z2s}+daV3ku(;ZQf>z#3BO1uEGeaw6}^T2mU!p+>hJOtUuW13Pn<a=V_!kAw|AGz~B
z=g-5khZcM_$2!gILFH<k>a<xKl^|_HnRiApDn~8Uo%Ygr!>ku<C)Hn%mA!OyKNj1)
zb)jufHx8uar_Wp0xajyJVmx*@&dGDN4VK0|4h%`$4;;X(J47Go$aLX46FMCKfqU`P
zO$&LL;?_nSjD1b(9S7^RwScKi-YbhJ_tjz>aD4n9`*65wdfB3k3w3`zI8vpo>)IW}
z8+bR^UUC-yA<pNBQF(?TXqaV=C`YZt-P<`1*HDtM1mAd_lU{&s%PwQxxcJ0&Gw0bl
zFD67+NHUtq#W)jiFhH%#U-&tttbb|FY47c>RT^yOm03;43HhB{SHg>~ZQ2c&yMlIy
zOOJ0VQ}!uQtK{@lWWy0r8%R-gN(o&)ocB)qwjRqLm~nUx8lv9^rUVTcW_csWgfFZR
zZ$%6B_gY;!A^X@ez#e!|E^-0l8ODJx==_wrd8v)-q9=fx&E8neJe#2N%Dl$KbMl1A
zj{3q-*~w7B7t@RR&X`l9iw8AR`<gAP@>9=#E0561t+Cw?kiPg#Upuw(>wUllQ`QZ1
z%om%^aG{$aSp5@T-H$=nz&cW2^ymfo^rwuot}IiT2iv|}Q1G3~9I&|82zOp1ZbWL9
z7$_5!KLg1J+t@bdwbyx{y>n&voXLqA*<@@#COoz(IXwW2eMk+YR*CyqM+K%e&s=(R
zWA503Tb0=PswzLU5B8WznuK$sQXT~)n<8m;OES1$2g&Z6vT@rF%~bW9&y<krLH1Ao
z>NmqPe6G2)Z!6>9+U~EN*5paCD3{hLlflSd*a0f|F<jeelFvks$r*mi&o^3*1sJgd
zQ?6G+4<KOYL{2Io>$|V%+{@IC6WKek8zt(v(9-&wTz-*NoIiReQ;60$o9*t;XJrw}
zM9ULwn=lOc?!<S~_5Ts|*I`k8-}^XBcXtWWC`d?mhctqez|bKLQVuX6J(Pe7N{50<
zcQ*_@APPecC7^T;FvRchdVfF9b6xZA)H!>vz3y1|x$x@U>N9%#*B5tg2P=gnRDl)u
zb%X2)CYvVl%4p%nFUlp)ho5sg;=&<SaQ3M>@RWB!2GE?-m{Tuh(_zvnp^6^y4XrEk
zNv$ZHwhKUGrtoewr*3>iUdxlIA=jC=ZSI6t$WB>YHBB)klu##5lWP;guSq*%Dl-zc
z8P7qlz4I;Oih&KUFXj*dS7&LG)$Xl~n$s#-qoR>&anK6~cD2bsNZE=%p#P)tx>Jpg
zHjCyGHdMw%4UZCXwX6S+X4&gb4S`^OHqD7Ump-W_dCbSOMm|Q|DDc*T&-_-oUULa5
zxI$r@N^;{3O@E~-W>{Fgj0-wB22v^EIk7dase=8HG;Bg5%u;N$r;EfFz$5&2-VemO
zJ`n9sjbNj3^?wR^%;C#6JV3CCf6m#~Y)r>fd{J0uXgAB?%t`qP7CEYY{6o7ljtcYp
zn%I@gR4J&yT`s}wUHtPjG%<al3IRS|${evZb}rrY%72Aw{TGax5>{^3N}t<9Vls4G
z5)H@4g1rmVpHVk&N1OG-1JGEU3H<sY`g18#`Z!2U$lFzRyS&xy+ez8NcGo~GJRAiG
z385eF5$oexN=tquMgo&!+I-uDt*1u~s--?I!jx8k&`MeS0K4s>a)MAXOM}c`6_GaH
z!h-_sPPG;e4S5T~X5tDI$k?`PlwCRT1@W$EtkYEZ;vDTlK#o4gSFLfZFW@OgtCZtK
z#q`5VNTy-sW|Z_E%d=zjf_3*3X>`!BC}nfRM$pE<B<m8R^j>K029~}t(Kf)(-419V
z)E{jXA@E_}G6>5A6KI=4grP>Ct!owAnDRj}d85y)BGv*0n43y{zxQ1{4eV&2HOldU
z*fPw+7|e>2F}EdaX{(<cDkU`jtQL4Yb4B|d@+fP5gOiUJGM>Iy9{2BL*WhUOgwMo(
z-yIi~-CyAK5~Nyl+EqSOdEemFi!v7kwNSvP6b@{{(wyEIc9#vUyRaX{KnfNMW+R%6
z$_IPPyjFN4#^V?888NQOev4m%iMr})&4YAC#kj1bx%yg)C*=a=p~H-NeJ9<<+uo30
z9w)^ueXh2?G);B`UZ>6mua{0^7OMmQxO7WI!c&z)hTM*=6?L0G!VQd1U+~BlONWoK
z1X1~5`%sUxfYVT0A*9#}(e{oK>i$;@X{o+tHtus^4U5i`N71-dsz3`knx}b%lrLM}
z@u{s)^hla9hPHdN00(WeWEGZV5u|G`qwMzRwMl6hAy-P{qgD_s$v0%h^1Z*+izkb;
zhRf@%-1Aw`%CsmfSUL0`E7G!v4FjJcAEX{8&VSF`ZiSU==X_s2_~%!R7szpKy=a!k
z#)g-Ix6hj`v+eK7S^4<IUr!PUtH=b1P6{)@u!M0dn=j3KfCJw_7z=j^5=zaTw3tXI
zcwF|pGX+aIRg=2sF=G1AO+`KY{lGm^HBEI;R5Mo(qMGBa@3>Uyp70Q}b3e9rAR&dm
zaB5&kmgw?Ue^&2Sbuy=wjG`FPi?(2Rq7-B4dMwBGcrpP0SUNBiUQ}dV*sq*uR7NnH
z`^Xcnk*NCuA5>pNe8C0LejWbdboQA)I|OnZmg#oEw7SFXS-beq*69?5z<<Pa5Jk7&
zsE&K~CdCuuxe@tgHR#HYw%0Ni1T)mL&jtjCfp7%sMD`UBcn@}fKNA?FWIeG4Rxt~&
zEHA}vSW4A+oxN1V;l;$B!oKTza|wr5$Tk)$5#m}8<*Uiq2@wyz3q|}tF3H~Fo?6x`
zuwgn+t(GSxtf1*RAbr_{tx8<`J6njUv6PB!5}6^J9M1fn`60_Zo5wpv#F0wz-MZ*$
zOZL>(55(|-dbQLcZ!Nc^0Q4rPN}Fbzt}iu_&--A!HBL^a+0d0Lo8ji%OEhwNDlY`I
z>0W|{*nD@jz};e#yjqfR=+dhcy;2m@L^3mmb?Jn}=*AU3ync7np;No}zv^<T*O_p$
zd?y2aw&%{G7Q9%2lcibId{^S{{7#-nh9>)lwL%>`MSO6wpgEx9d%`DdgMK=$1C#QL
zoj?kbnzci?o`U%2|MAU6G`tR=x)+cQ-<UNJ6JJxGy=ZYN-T*YZi5cdQ+6C>E+w1n*
zws8+*Q*UZ|6dpEiX^eiJ>Y&Lv^@(G!)=XQGoc-mk)3O9M?aY(6FN`pMe1}bX+&yw-
z0r*D?N_3D|jl{u-lkhnL3>WIOW64K_y(Sbx>ip|Mh0ndEbl~HVu+xgporVxq8}m{V
zq*gV(+Z~C{pMn><3-DWSGk*MaH~eHGWRjsz(f<NCN4BWz^nJrTmp>%_k874V=qE!c
z490(sLp<#r{3z{7Gw`(kcQN9-qoPJ(R{lG3khUC{6~z?R9%GHsp3y>w_P#usZ~yU8
zJ*_(NEQ|&qb>|<d+YdlSI_7pRBD<SvAO<2&_GHgZH>$EfG>)qW6hiHv_4-HEE==L3
z+)KW`GM}=7bNqpYW&@DY9g8m`k}nOH=Ce?l&$@#q(Lo-_HirW?$pvQD<<FTMev!Ah
z*EoMPQ~un9*q;<Lf$<BNQbYniW$&SJle`<0?u3dLJ8q_~AsiY~--e4^+0Yy&(<07t
z@OOGcWs+d#z+0n;WEttVhZp+fIp8|qeX>VkgcVM){|MMzE~dKaBvYNRxk~Kkz_?OW
z2}31z!r#ALzm87+w(-NgUOSrfhkW$DX8!sO3R&oC(?;g=@Vi6itm(ly9#m(s6AgCV
zKOj>I`NCgp1%V|Rb-L;12f18wP$S-7pnos9DoRPDzOgW=ldJDqth0XJ9jx@$m0ebn
z!|r?0-3)Kzp_9|Di<Qy3{#piQr?+J-`90G_J#K*@uY7h|^>#Oa7*!q*6&&a+AFR*j
zQzYQ{;RF9!7U8wLa$%v>Q(x{Lz<yeLBeVwEKB<R6CQH7Jbz{=+hbVT5r3k&s5UY3f
zQ?7DYP;YjTUh!C?Q?Oq!p>ec|6&}^(*lp65co0u_eazF^9+jRxO>@MQ%+q4*H}6$2
z5dHf(LJ;T%e)J11!fbeXGb*-UGF6IPOFb=0rR-(}o@p%fHfM7ET2YgwOXHl~d9y0k
zfZV7HV*Y+z>bF1ZxxBj-u)1JUy$*q^tgvr@m4=ejh)U(BZ^ol=GCFOoPvdfhPX9lT
z#z>LiYMu~f=HYej+udZ5-Hy0(|B;Qzh#S0W>yg{?=wEpACwz4guDnF39M{tjuzvoJ
z0_$k7g5AX-)8iEry1sXl&xhhtUA7@X)Wz^+_s?v@qVZ(C_kh8;8Ac=}#NqoW`i0eX
zYx<t-{pDSk3QIhT2cr}V09eeG2s}`TJozL%Z7Sc;BQRYk%%XWK2;s1EsxrlXj}y{;
z;KztdHUG#j+NXB81n5zXQ&EiIp6#7SS6;gTx+3FYz$%s*d}w!`1wlnGdooeof<NuX
zFfL=w2>Qs?^vdVs*^F)b|M;lUyfs8}qnJvBWsP}FH^5*+x~MFLSM?%W`}QC-!7INu
z9As=LXq<Pj2mmeKvEKfhkAwF(z!AWk+7}(J5|`(XRMDGvf1(av3N9M6xW#}m1Vtz2
zIO7yw;#}!bodiIDi|wmoF2YD^lKNF>tyjJXFcx7{_MS_+<+k&cw~AL$@^bi<O&LU;
z`hL&t)mkHpn=x`PdPUb04&whYuGUZo<w*8{$3?y*X3+r<N|mwRgNl-mrrm9{#R=fp
z%>RfJVDt9>LBPkWW;d-nOxPD4{^W=+&}x;i6RScZ^C@|K{HZV3Icqnu^i%^J%=Fy6
zJ$C~RowHSL=i}u8QxirL22u@+UA;!E(N?$ak42R?@H>Y+ymHVOM_r$A31J_iqjOS4
zuU!q3eBgX5Ed(z!3z+gk7^apC#%_f8L!!Zz8b#c07mxq0n^`v86}F%zX&TK`!IdI6
zRge#URuv5TR^`9jy2BkIjpaCt)OMwqyXjLJ2IX=iVxAl$;C74(lubnCkC&5{mImzG
zrT{xpSnw|S6AkbDZz6u=Z4Z^FY|3<$`EOC!U${U7&k>!XrjUnz3khata(Xw^Fne#<
zd1()e%lY_C&y9;6yVy(=pGJ-|g{3Qk3i4!x)>;fKvhwaNnxuy6b1+--;8`Y-C(0~5
zg~$FG^JH9c*YGKego3_bwSjB8G5ty5TR%;s>o7MdAK_|$)ZOj3mD}lK>DQ#?HcFu4
zcND+q)4m`6>aK~J?D!LWEW{*kLH>kjm&D4#FrSVeqpL9Z!~CjinxD{X#p@?m74;D6
z#A4*oG9TY#Qu!?bmm<Bl6zHI)@8)C|Z+*uY>ygNQ-<;zF%J{a@*FrMcnBAYtE_Srb
z%DM?o1!Zu9u|4H(n7Qi=zQM*nl3;&Sh9_`OejU@=yi~+~veA{ioQqWIErAy$2l28c
z7N9z4r;xTrr;-c+OtIi|yOXAIeFGuCVy@>;#9%JAjia4vsK;mx=LrJbifWgb@6GqQ
zL~%RJcxdt15;j3FdRI{z!_Y^EYLSg2Ma0%o?uE$TKeuIa*gEPAG=|CH0ZnM5GyvyH
zWk(fu$MQXM;HJ?Pr&{_^iXl|!yA%cOrx~WO4O=Ph9@$<N&p|1o@|>3aAwpuQl^Nui
z%mwJ*PhC5F_*zXr!#n7wP$&u}_^u2~z&&wRYSKEnyz~h1_Gu~>FRf#cP~Wm!_cZRD
z_F85%v4&TQ+CK+r#6^4LdHPn#cAcW|{6)JpvUGv+hth`cwsn`lvZ`_|l9;7VdVmXg
z>MW@JUOHtW8!3}JYQ6$FiG=fF@n-J!1+Tzd<r`@8Roqt&KJ3Q*k5HVJY$o61=IH=Q
zNK-ar(smpi<fPcEY#CgHvaR6!{38=>U$=#EmswQRsggudO`IvS*Kb_L2jhu!XniN8
zWznl+>a~Qk@+m%ivk2#e6B{NFM<lUKxn&6xe&4J@5_WS75oH@$Wnd1u=GW5NIoMuW
z`(TqVl;mfn5Jki%#5T3{woJIMwM^J+jzq=X3s!_ce4qPtv2}y9l3J!@!dL0}ur;p>
zgC*WiLxn^W?C4&EW$5-7YeKcifR2;~c}D+U_L2a~xHsIpZE3+cAmgcf$G5v9<usi{
znFE*dauKV7{5=>`S}T7BR>Y2U7&0vgp&7x}FS5v*bYs)UX(SB|CppBg9f)J0zSxzc
zVFTJQ>d`esub=-m+W%!~ofI)*UdowR3?;DhVA%3yTUIkeL*gXbfzLG1?B~F@K%yN7
zdV^doB>mEZSfbBgEnvaa6+(*8e%0&{E8@blw6iJ5m8GuoY|pmLB1`j=81j%gri%w7
z4Hcg~BTs4^)|BDh=*jtcoci+%=b)Damt71aphcQL%CKJ%a>NzBOP?mr?%)_EInv2e
zyP|xcOF~<!`I84Jo7Zd_vlC2?LeBrOZa1IAIa5LkUJG6E{wS9DM8{hg@Vnf<pK)pH
z4j=NzC3^W%0(&rk&5U+B!hcc<H12bI!x#RCWVgMJvTS*Tl5tn;Q^K0&?c&m#gB!Y@
zld{3hxiWqG_@zi>=1LT&my)>FjNV149t~T7o*D?9VRdrcl@|7X{8?GJ0TrnU+qd|R
zj&I#5+j%rpe{P;qZMOoM(dPS_sQ8ypbHEVB@4l~@heev$c`y~#PWJ0Bi^+>w+93AC
z31P|C@bmQ=hYFrT%XN!ca-{}@gz}E!%;$fPx*OU-!7bWM+pU+zO>8rHTNpH%&2Lr^
zqDCZ^R8dp@YjNM?k{t+p(E|l8RsSJJ+&0@E|2p)pI8JjX^rO2n(Aw3~czQ)p$a7Va
z1~bES%_$EDL|6%|=4ByibM2s1ZuN*eovGjyGAod0Ao1s(8zRTBy5qZa5`ZLL`A&ok
zO5<;y{)I<&zDy7en>{Rzln5JLDR%X<_$?kTF<`yUmQX!Q!om>4Q{t5Djy3#jZs(!X
zY^?`eCDO#{B%t2hdLY10JTM&$p{o?xZPd=oA-}*pFk{ePc*7en@5rJU<2RV!|14I~
zyAXp0@TId+*BtnU9o-729A-T^niMqQ+aNFN*4jO>$9rS82yI@OEMkC4T%D`Mgm|k*
z{_r=xSgzC4%oc#)oOkOx3PRxp<A)_5>pwBti)lOFKCWi2esF~jWlE5Sa3w@KJCUxG
zx*GG3qV6aTImN0x@ijP)M!-hZUb|A8MX0TVqn?@^+Z@@>{v(qfOu$P~=W|{Zjf5jh
znj1Pvu>&`cZ@a%2Cy9u~^9vZ!oD_~Db*6&S&x6hcKj$ZLF5m?Ta1tQ<&e`QMS>v%p
zE0rSgYSzINp0`^edE^ic)bJ1E`8+bK6s(&0$QOpbX_{J)TwUdp@mxNX%-`WH0+5iq
z%l3(CH}919SCqdu?(*H@j>-WUJ6qt$iYjHf>qP_k8CT1Fk8}y(x0X;7<wgb4MOM42
z$a57lz9BDqDjD6{Ggj?jfoyIp1+n0}@ah4d-LtdDL@efL2(!fu=^MYosk<Y_D;Dol
z3k^BdDFD1NKSnQk;H-AtCDL>$BB7+f8x0LTEhR**a`e$-E#EiXOY&zwECr59(YdoB
ziCCJNC${e<lWxM1+o%F78<@i$DWr%4@O0cGhn&tHP(1i9KR%ruO@vR$dQgS6mFJv;
z&UoJm0V?Pnjnsj8Un<^F5%FHXkI8#Mu}VghCWr<8%*7~G__IF1C=`qH%i)tFqPYx%
zS)J-6yS<2OA<8iC#nAcfqpO#r+oP=pfsfhxSW(4*R`_6x3gvZ3^!W8Vo|$Umfi*cw
zw{>SI<<F3x)ebk|wT%qyac7gCn|{w)ce{u}QXmQ@E01|xHt88XcNwOFum?;A2pk*i
z8O2iKuy0UjYh5YEIFj~vrXUS0%diB%MdbBjBZO;}VTmz1F@T#A`YaqegKj6*NLnpr
z4E;O)jzG4Q*0xlihk_N9-duTxo>Pbt+QGld*7Ngd{V<J&lK?)!X-NbXT4DL`nIuHT
zJRp#%%-kV&H)7A>XC2?itR36Y90{nSFjY=<=!8suy*ZPtqE8gfjkWiwct+==lA|ZP
zU3RkNo|$^P^Yd0KkL#DI>u$yIq{zTa?Q=HV`nGfSoP84ud_l7A6M<y|<+7EkRujm!
z?r+`CAHljvTD>ad)9?-%8V$Xu;?y9gNTrY)7&iZxZ8T?hC*RkfOt2}&oB!!4{TQbc
ztZ$t4IrYV=g=+a%4>p%`Za|*ETLM@U9jgekscT}iRZE6(TQUBW(<;+LD{4GC)wlZX
zNP8-S<nZ^tZP<DD4J!JbgCsR6Sdo7RFBcfMVC9NroGd@=exFE992P<%{Sr>9CC)=p
zn$n*2_R7622-4a_;|lxJ1@v+???C^a*uaea0!#g}VSnBktokmcX{%lY@6S-2hpuMB
zGSr@rYM`cbv>gqDBvwy-x5g{~I3383$1c+JZjYXiw`zWbKP+P+B=6q9dJ~~j!-h~d
zsFscV9s{2F(*E$Q1R{ZrXj$>?CqR)Dx9jySd-5D!V!_Osd<?KXS?DjRc6#O69AEU#
zZuvV3^>%Qqs&$(Vfc{bKUq1c|{YUp(@JklQ762G_DDvyyms$^^6L-m#viC(W@j`$h
zmYYU_l+w@OH}G@e0T2pk{v~kp9@z?X#DLFJrM9xwNu=IFE`{p~qyNuL5Ftqd3b#oU
z0;oPVZ#!gF?5|DhkR(pIO|I3vp6-1<AK`<#b%md}k4v2_R@7F=Mj&RNlJk0;=n0<`
zDR~)RtXYZi#xpJ?NZ;(M;7S}MRnsqQ7Ln$r{yBZZpID5sl%;l=6-cf<$sA9NIu%6t
zwfaIrjnqf02oM+U|HGVOhpKDXdk*u=OJON|J;)l$^9%{rF5PhDWwR+!0n(FV4sxNb
z`X!}jtxgkes-aZP?7c9A1feI_7O6>X^~`k_^%U$O*Vu{d8V<7yyKga1;hO8XsivKb
zPV=S3m3MV1z-5#gfAoP1b7{25ABsXubOq1n?gR%Wkh5aD);0xC5=*hd$9NQk1$kU=
z`PF6el<qO4{i$^Jxq+@XAY}+KpBp@y3(sJWRxh_1ncU)uyk&B&oMi*ljo=Zg{TANI
zEdi*`yV`0ZOg6(bw*R3=eWWdTZ42X|NNs(!A=pv?z$71etV-5BA-0iPiYhg8{*mHX
zTjwuU^O9>|XG)&SFQNb`Q=fW2fif(lk!t}Ywmb3g=FJ~fjr@!uv#hTV=IGJh!9Ys#
zi@vRRFmH28=*~r7<Ozr8US^*@wN5kd*Ks8k6<$oFlC(~~Ca&ALMvaD|MvLT~D#}l%
z*+pS(&ClRVmQ}krr20hBrATT~?6uv2D%~gi`IxmpA=RB)`MrBl8xb1Uj9&gtlfgMB
z=t#Sdc@gQmEM$E36en0@67;hUey_>`?1D@3$^O=jbhC&R>$VWrCa`8x*13G;&coV+
zY=S`ms#Yr{L@8PMZmMe6dR8<jDz~~^duc#O>oun!v+=`ya}^Q?-`OQP51ze0`4AHm
z4>D^@I6WxssEG#uZ2VRhIBUJMXJ_Kk@M5A%ocF;qtB&`~!=UmI@ijk|uKdCSTms@j
ziOIZG#tme#HG>qzxV7b+?>(+%fu&96pN&E4B@X_T>aOMmRPSKiCi=ZnzL}|BPzpG!
zr4ogh1(WV618G^kV5;#(Fk$1UJ@)RAN7{5OF)ErdUS6|yrb$Ia#=s7y#o~hSeg_e}
zFe|>(8B#pZxA*TmHxU!k*8!xcaT-p7MMriIyKLudt)qs;TRTLKu0mvyXwoh7`?|&!
zhLO64!H>LfX+WV>bhFNA)v~u|ZG3{*ggoRTps5Xc-t*sp2e0S}CGW`LQ7cP%+GC(Z
z^e<yP{xLpis;U>oy?8<tDExA2&y%a!7-#R{;xxv@BUibVUipf9z%Dkiz*(%gg#*M$
zt>(x?g9Cf?%}E-9hIluQ7yi@J{P~U&Db(w|U!xm^0}G3b7AoetMjpZ-W^yTcz_?I4
zZVI<)vkQfG4*Z1q@7x=F*A%s`!bxdzTB&^sFhlrQ;pg6eKw01wvO})Z{TOdMX3z{C
z1HQUZ1zy3CA654VF!t}@qL~)FuuS>fbVG<XQj`XAD`M_UpQKV8e?|~`hRm~wDSrFT
zU`S6?l4bQXIIo{hiU|Tbf2hL)T$QKM#1A@>pzpTqoL)cSo<lUx9sxua2@cs{IC5gz
z<{`vxaXBfudZA7DN~Ze>Zt5OYeI82@F>VqqJ7T)7BMOW2yS>QD+FRIUT?aI;$tg{<
z*@f%y$r{$so2I<slWYx^{4MEEF#|P;pa;e^2Eew|zpuKGYx0Y>seKjjCj)lh!AZ1N
zS%=0^q_3&{$vN%<v0Vp$#e+HcoQ7h?u%dTDA$1J6)9G{$BRp;Tpw<m21|Y`sS^l|j
zgZ-zW7JN<+fL#X0kI?nET#I!Kt1deM(qX_LRD`ca%zx&5;7fDiwkEFy$E{X8PnTO1
zF4G||cDPajS(#k%^=%X94Z(o(-GEe66%oq3CZE*geWlPkK*>x;gYhto3D9!%1OBw*
z`6O*-PTQiJti~EsSu&T>=UJ)Wf%}mV#@n1_AI;Jlk-@p!p{J1caEN!&UlPiz{qoSU
zGu}Vk8Iec4oAI-9pcR4g*^w`k6v4GZL7sG@Op}yvCGvCcC$c2icyC#Q<%L^WC5d@c
zfx(5|29jlN>-}eZyjR@m>m*jqrBZ;79YJIeJ8|=zNYRud<ZcR}k?wa}IsxHZ@s~zL
zpZ9?39<NWcUo*2?H)iG#(q9b@9l6!8hXpKKM<Dk!bjglC1AUSLF-2w*B%J^6`lFY=
z6u!P|ZCmvjfCw$|J*rk{q>F5iKSc$%8HK0M9+EQC4_)^v5Jz(0)F}J*eI!7=blv|L
z>&+A<VW{sm6-xJK096lMsrzDE94fOjcZ~wL=KQBI;Bc2y`OIr+zh?p%?Oq57m*yQX
z0+_fRRwrP;xoDbW32Cz%|C6e#AWlTTUvn8drMYb*{q9gkMK`p^H}(eaG8#N1d=;K}
zj51;q4jtmqrQ%%l$NAHb3!<|_b3iR5|BfqAHrCBtvqoCe-yz@g9*a#>=c4i$_!mW6
z7BU~3leFQT04CD<ygzl3PQ;CW@7v^0mo(>nXxtI7vYQL!JJr4gQNmn*yO#LmS7dJ4
z&|O|P{iMc(OIz42>l=|ei9&FrMYjtPQ!4kOu^C!&fJ+>(Dug`1eRxaCeSH1B%{rRS
zd|x%Dtv2Z|KW-AfRWt9iX4vzna1wAvt7IbfG<I0H!fHFva5QpvQY<-g`MnmdHbpUj
zZ)fOKda598MH@X?N(s)R#VKUIz49-bG9yWcGl6EpGh>JO<{^8-o~b7lk@+<p5!79w
zt5J#gX{o)C-<cQrbE}$5hSj_;k+RRPTpN~q<qOo!cG~rbn1TrSDLSVmh*@BdKHk|Q
ze@OgawE(!hk7}rqr}+mJd7L5Nbec;e(;@pKS~f$^9|mDmvjzGnl{ryzZL7Q`s`EqW
zO|#;ej;**b(Q$=Se;bqN-0=OVXSvE6p~$es@@~2miFei6F>n+BxGIvZaazhG=%o_Y
zB!0p)5FSJ*66JxGI=ZZ;`Ef3I&&QqH_VR-Oynzb4*b9=!KS2Wxe(Y>C){ox`^g`sZ
zjfzzAYEU%$e^rX=3fFmyOWu92o<S^sx$Zr@uM#0Zl`#3u`ZZ^zx{E0g_R&_9(4ACP
zg8c@mp(siJFW_k|-(uaTDHrT<z0ObYv*-6^Ar8CI#ZWg%S-=cG)D448Zw|?$0TEoB
zR;W-UM0vQMUiRfEl-lX_W%5HF|2NMD994gr%@5iN&t;%b6oIkoCss8F7Q=uq?D1;Y
z_-r-mCmknCwr7Gn3TP45t6>4U|Nj;N^AEy&_5eoIC`|;;4MvmP2u97gsovNCKc;b=
zYPSpYS!Fjj_JzrpNI%M0I@da4Fk4Y1j@R)!Zv0JUNcu?$)Yfg6gUYEw+EP9E>pT6j
zZC(w?U2$j)EVZZzc3%~IONJrY(VO5GgCif5Spk2^vhDVwc~1^zcX4F63P<EUwG4DL
zov(7THH5b$Bg4zvHSei<UPAt_70OpqdHVM~0MJME|4M!JVdq0;sybpky^W!6xd!rF
zAGweqxEqkdxNTimb?mU)btz9{_7Z319YMAbd*t78pzrt;xoPC!k03kp-96jM(5Y^t
zJ8#HqWZ3uAfIyz~9$|oNZRBeIpH=DAu*HE4q-?zH>JiZBNR2FzpM_bl!Z_o<an~vj
zc2)qR3&&EdJ;GdMG{<%_1CR-`kwL0AGNLYbf{PBKG{3LN&g#N@TMCi=I@_Ncq$aAD
z9_IU`euxSUPU&>0Sqq*Ro^(m_F|c5vwv&Z3X%Ohde~YXf71(8+3i@>9j9oo2b}Z*&
z|Eh9H=kg5s#=moQ+6rn7Y4~S!)*z*Q&n5OrQ=u_$7l8Vd`8XO3iKPMwzkW*8%St_m
z(lW8VXc@W%m1d2%azuk!)p0eN)P-Kj)3ehlQxElN3FS<Ff9PbX(kq`aIl8>66>ncd
zbCaTs$zetTGCz9+oihnq&2#h;nb6A)4Nxhlg5Xa4cn-LFJO<|Q4tc1EUOsfXQ#FdL
zPN0<dnqF0HP1!3CF~BUvcv%Q`Jdu>7qUBm9c#=23MIez)+dk=WP!LhHWQc)`_gd(i
zM1noJSbVqx{oLx#XsCupV-bYK<L7K#7!=vIjZZDdJ~PhU<wF@L8hzja2*Pp;Oa7ji
z7u8iC5{a3DsCG0jIzxsP0N}a2_%<xRtaixeMH1(JNZSL*A2~_Oh9ctXnMZ&p4&GfK
z`GL-jcq5#qqj>9qj^%0|B|_bD)K$pX=I4+(SE%Kd_-~JO9VUktfW%>ud<gy{>L{er
z&b9jRuTY~@DIf~z4fFPXXt;?yE$XUZV77A)KV7m|%T}*9^{@6t^jN9aH}N$I&xD)s
z=FE89@hm}P>`4G%G=sA*WGm3M`@1Rt`O46m{ZbjRV{{WB)DPUSs!6h5c~Qfkt`?EW
zLiipA8qeBZ_=a|8;t`cMGQ8~|H;lFQ<(Dx67Tao3z5K$9?tdY8hEzcFGG-8*y4S@$
z?=^6M-6^Kk#aov!l~0V~YJ$&fTFU_M*wWO1<jZcHN|QQ}fS`*n?@=%Cx*``*->_de
zDeK-%owRZe`EGrez+UA;&KIcg3&uWpS;&EEQb!#8=#}ppV4a-+j#5&<)_VVW_PaYl
zvu{23?GWI&UH7{t<}f&h#@1oSQZqIBpvf5!*hZCB+<G1Ib*14SjJoS$_aKipsPT0H
zyA{^s?||hp>8!mCdc2&EXInM3pH|exoYXnOmp%_we$U^yAr(fb6U_D3CRFgyY4Z<Z
zAXNxZ(0N!m56P%zYA*Z=QlCY~OwT`S-tv6kW*Id4IVd0K!7u{Dd%jXC2q*(_lmFK!
z1d{^f!!vdB={2DK76DBa9qjxvnQAxB88OBbb;4bY#DmW5@e9PtFP8$|yHGj}|F@GD
z0NvFpBQFiFUg%z~B1!|gRYA)(kYL<6L#5<(GxT@{Rj$&PTC(lVcOI@oYk#b2r1vfC
zarK}3BX>`K>?(w=FuGI4qE}v|<!Q*)2puuz0h0odKU{Or8Ut1WdW@j!Pej*zMEqS_
zy*a>?zJbV%)d!zt`AGj1Xnk0YU7K<sfP$mfXO=lSdE8jb7i;iEPc2G);4_qsnU99g
zg?F>Y!bH!*Dy9yo-?K%%E?8BK+LfLMux89J&Y2s+zA8ER-f}tA+N{ag@6Cf!xNw;l
zK7^%o{4%&-r0L_Hn&PH;`U_pKpFEXW$Rl;6@nr9>5I)00+uokdVx#V>&G+cq{C?ey
zohm}&EMQ`2Ut<k;G?xnoTVk~@$sse1fH6+8m!hERzhv@)%pL(<H9`$~Z2kiKUS`HE
zfjBJCpiBK<M2?nJ_lfxmy#K~o0}IXE2>It6F2>4lzFXBT$R{QBMD!i>oXrSxT?jwr
z0ogT6Lhy_6ao4nZVB#SA(bAq9O$6Hi6f76#<0FYkP=ptjd_K}@FOxhdRQpPAXtZ<^
z(J)y8b}BwNYfBC5mYT3vI7QX*T#6bUo<AySQ&fnBa_2|>3a;2_e_-_X&2o%QB1DW(
zE5lG}$bH*e0tXkB`p;{WTJYU1A5}j>z-LUt)#&68P575pjP(;(L|3Ncf^W{m%A;M!
zEcq#orShL0ZftmkE=W7tc{yBK=5O|#Ekv!8ZHUosTyX@Feq3_&aeYod-)Uus??9k(
z<fSCWP9bWnh#_jZVw8+3Fg=8!1H#Ws`^p+`+-YKT62;Et9jzDvZEM5^VF;F9A;tK7
zUOk;Jc#^$mR6ANm<gpjO&$vE?x^l1AH^e2z>MG7D_;T~E+y6H%d<N4??WAj#zi}yM
zGn}_rDWT|+(=waPIul*oP*gj|B&)oYM0D+Qzq@%zxkw-aZ}5ep)Tb69PZAhujOBPf
zo+ZH@mUUpZ#0k!N65HgustGM^nk;SN)wGW(LNGs9=?RS2O{^A26KjrZHh`N=S1KFu
z|4QXXG#sG0ZTB9t^ynWRB6I$y8fC<E7_n?w;+~3sZ95aVmc+dv*QN`{Xs$xv!3Dc*
ztaAuLxeqVXy65;<Aq|qI9)TZroc0EvQ^MNKTj^6Wl6g5(hAnA02>CZxpK_Jt#Sljr
z;3=@Zg^runc-!EL#E7E*-E4_=*A9yC7KWx3eIf}>^idcfpy4$Q^yvSxoy(`wX~aaw
zE}(*9g?jVzYx)U7e-qsVHerOb&E?ZNT!uO-hI~psHh%!CfwZs;XvH0Oz7fUxW44=c
z%)hVc--bWAxUX10!M)2bm%5xB2&i2&RPi@yQ}C%s_=KAOmcDJ|zNutL^iAzk`ag-$
z{n}m0)<_PT(QsKRdOsG}v(ZolR-1P*;t9-6(ni@Gr|@E2-H`oH6H%=+!$qsF?#%Th
z^SepIZOIl<$f5kdZ)qlC4jd_ef9$-%0NcS>+4O2!s`SY4ItfDge8vjPw*6*4Kd+IC
z-P8@r^l*_k0SP2L(|X@pev}upwx6-7_5<SwC4FWWN8nQS-C*0tPmHdt|GN+W7%bZX
zE8<P+B>F*F>|O;o`jCzaMDRPQ{@TN(vWHG>jsnvB4GRQap<O@e6tG&-zh)ZePCs{V
zRFRI8-xAN~X-T<wSsy1gui;AiI6-Gh?z;z1k^IOPY6VbC$lL1NZfZ(cC_!)|&cZ?A
zf&Zs&5sPz$I6LA2knW}XQ+m#{&xV~xoA2ueeS|6;N=BWrpcVvw{8CgKqEGe{Sd^MS
zPIE$DPn=BqUXk3ld3N^cz57B-iMPWee0<Amy7j}EXX?H(^BAEN2{X|)IEslx&|CK6
z3V|`Do&etT3aQB@SNlM+`BP#MD$jn_Pd)k>7Fu@aey4sn9x0va!Bl$jkYsCDw;%vD
z>Q-t#tJvWR?WEH#xo`($s)DuJieMINh;e{F78Nz&5%mgsBfni=gJ?4|%}R;seNvmm
zZ}~)4b>d<X$n^3xAtA$}O5@wf45ReJZzV|cU<}&ee2mb3sX*CdVpJ%8LQ+gt(rtLt
zM)e6rE9{ODw=Mbt_i9{!#7;;ksBopmeX4=NUib~YIc>1`YL+M=uMY`cXJqa>$h#Qw
z!d@i%M2R;}t#nF8?n^^q$M`RkvKIy;L8YGNO>HlRDPDt?OYGb9z7}0BE-ZOIw#;Bo
zc<ZE?1SKZdnsT9k-2N0Z_^Xx+wm>|NXP0GKM;-}xt}Fb6Z|;QWlnjkW)sh<};Xto(
z;GSLd7UPHdX$y`I?ja$Ra)Bv<2!iQCxfeo;Yh<8&Aa_zc-ojl&{7QyxL#_9u(wp5k
zS?r`8_ubG7D#b7I%e0c1m0bI+pOR-jd1(xP77{&Z635~$P11<`n_U!iRuU3!(3!AV
zU%2s;BmT*;A&sIka`uv|D*OF_vlhX{cP#WGoxF~NI@r1B2$`H`tk;uUxDB~+p?#g3
zl)QUT+>JD>$@~76lwM=jsf@zX=4%0ZR1zCj9vl9n>BBaDEIG#A!@D;Lz|x*pyySed
z6<*>fI|CkYUCBxh(^4H%c=o*7-GFs;M~iLCq`r#{is||@X1VS2j^>>zdKneigg;~x
zTx(oY+4JXbJMzPNz3j}1$1Fs<J-!d(4;<0=Sc~p!QUBNup9{Gs7xdd=8LUfB)gLW8
z89wSsQ?~`84Ju|RG2jiowF9OF;ZxZi&-C{@$!{K9@pE#dgjBp1V&P>Lsaa7c+D}nN
zquD3mQ+N51ASywYX8thEW?1Xpm~xF&SlUt&y!2sVW^FUW1?DOwG+mz0pxK3K1mtlx
zCKzRHbd<uSU!0TEm3NK#r-tjMQ&JTzD&qUv)Xp+B`*qHFaU@RgZStDV^izg`;>y`|
z<YrN5eV)An`Ez}{f2|jar(?P!{89{3F&n*#%*Ey?Q{Cc4mkMKnt>U0eu2mSk5DAkf
z%umHSCq9L!1kOSL;I}34HrM#@IW6Ew*0AZ%a}ZPlfOs}`BA!Bi@{B;OFmW>uZGf&l
z<NG*&um<y9G&d7o82VOp;^NwO<VVFR*&E2U`bw75q|EU+_a%m<ne6*l{i`Y=g#|%p
zPj?!1m8Cu7@Kfe;q*n7L<;#X;MfCrRbunfrlyB#OI1NhdDK%q+8C|EJztOxaKe}u%
zF}_=8>g|>PQD8}u%cm=Y*}=<8Sgv#yAbD(?pk|KsNnb=)*_Q=raM4aon7{vP9hpLQ
z8l(}FA5a%_bjkf8n0=p9I`y^i2>TOR#df~sc&V>rq0O^|#3=Kf^a=#U%Tpm8>y`TU
zlz&5B5E`k?x^6iC;TP=*E|#5!ht<WtNdsED&8?!YsWMLY>jHb5J5=V46nDelQxIl(
zE&)Um^=B8zX1&9k7fX6V$Jp0NDUr_$5=Kc-N_^h)OON{Z^C<>*y}1N0W$EA&8Hp-p
zW8u*ld!?2~ygVs0^}QMtN6Ct`0MsDnEy$f{ZybBsyO8H>AGd!6k+Lyu+&!s?#R92F
zjAZc%;>fum#w|lHI5oQD7id<Lpdp(NvU|O-aev?8nU`ZM>;$0bYf-5=5_I^>;vQrD
zHbVw|!W&Iz)|;edojko7Kh7mr9Hc#)>?z&|#(5Z&<ODT1khC2bdi(_96mo~3_d}L=
zU5rvGv@HOk_N2%q8}AxdDmp~{hF+zJ>j!7yhrY;{HTiq;FP~Fp)Q8I3Iy`-I9)?dC
zDWJL79>6f4B}Ig*Gnn$NEV+@GR2HKAY(C_!v14H_?KYQw4!P9*u>{1AAfeq#r~z8I
z>{vmuEntji8Cy^VlcDh8Nu+C^Kg6A8=va-2nN$XJagNcuPE6Rh_$mk8@V=Af!S)V>
zi#}Ol<ghsM2_N(5vFr3)t>go#2ekIj`n1IE!1BF=j%(0#UJ;4j*x$=a>VHsbn2I_@
zE^u?P{5h(Gw_h)<$DwjwJcmIm1gDEHV*$&JglYnA6UE(Pn<xx5m;GW23E>;uKj~KH
zqQ}@7ztUO>(09CBCuSf=xWmot;gWUrAi(bUVz<kEMy=f3G~v*$Ej{eMi5hVUfkGMw
z>ixenu>3u@T`0T}w%45r4~+^vm~zW<zDP4GnX}B4QqV;5GKRq#Ewo;r&H@hyTo#s!
z1BnPQt(tx0Fsm^~5A8u_&UK|b^^$IF^yWaIRd)n3APt@4bS$;%3z*6r{!^7n!UoHK
z*X!)`s|o*y&ww;DhR6<9L(}YNdx}OL{as0Ne8$e}$F=$6$>Dh`Q4Tfsbq=U-d;4&h
z#`$mkYhtj~D1i9H&3%u$D&Y-x@OwddP09XVP=?$q%G4RC*RLYaJDm`3A~$-EYpmQ5
zt`u}H|8gyJ0#DsKYcYKs712bP+5wgS(g&>2lGL<U$0bt-WFai@?j=mn=JO@i>0C@j
zrf#CNo9JbCCKKNH4JrLM3Ng7ZnN1y-iv&4In=(44Pix7aO07854UDN)Fq{~!Zg$~J
zKoUbVt%U7K6qC1M_JAQc(9Oa>mY3mXaHG*2d~Sv_K{`-!C+kN-&UEhJ2YUef3oefj
zI}mu9S@<9!VFzvExtst*w~b}Hv^Yg4Kk=XEivm~Q*mNj?=@}c3>3%OxZg)lgdwq&)
zzZQ-Dch&tF;h<RU$fjYx_0h??4mkw)FL{1%ijivW)IYmz*S$RID?q>A2Dix7<_j_0
zh;7U69Nd?H=|{UMH=$l1Qf+7;@zo%;m;A+$Hl~~9>_T`9=k=0eahIEgd~c>ei{O30
zTgZddjW>O%3`fIH8KTcqXD~aX{U$pT!`*@Cr%T1Q8!)A8W^JS&^tifd3IbWS%nI<w
zSv|_lE2^4`zT>I;L=Ud!84eKrO2tdExFH1??QIiiZq7EyijnUyOsB5r5C8Z-Lcbi?
zt}=?Btze9|ZreQJp1;eslN~*|(JF?|z30~eCW=WxHlv8DvyPZ^*r;>(F2i(t1FGVU
zn|E<D_<j|+G1K*huYw`%|4*CxT>}E<RC8XvwzP+09%L5ZWsR>q>lT#u;HtrRp5M5e
z%HI=c5sC$t`&d*Cj5z|@6qGFP3h`^(0oC0Ccle=g2KXv*<?dpRse%=~5qa7Yk?+h`
z^JEhYViWAxccbf^!MIQS=n}YnL}NlBqsD+R#h2FN3i+r+Ovm1qF>KcT1W;kZw9E^2
z?ZfXD=sf%%9wynH)B~vpDbp?eG$F19m+;hW7RqsobuCo;_8hB94DQeNg>uqG+POQY
z77dA1fCCOH-a_Nia5Bu|dc<H!RfvqM<KCS-cT~>#)Xk|y@JD8a=k#UpTk_5-fK)Zl
z9w)7b^jP-Gz46{HViSE=ronpt)Z_FTou|`zIrbgMPLt%^O@`Z*J{aNz{@X*OX8Xfm
zhP^vNVBCoc?PeEYrVOVY{aX5B*QZRf-CrYdO6#6V6y24aW3)od-O2Uv3S3@LCTw_P
zDL%|K+|%fuPP?hfEkbhP72#Nq&akZ94RzW;+E@?GqjT{FxL)?h55gM7;2kAO&}<G5
zN7DI()z^LD7DdhXok_zlZh)VPjC7(lF00P91Q@`v(BMch&~q{w3qVg@2`s)V-|N`#
z?9vlCKz4k4*}PRsdA{&1W^<te(Z3A{rRmv#C{h#y#$&u`c<KK?brK+#AOwwgc}1P5
z`O-+$A-X7LRij>c+k?41#LmSMHcUakeMkcY(ESWxE2n*U1NQ%T9v7G0ou>GMuL);h
z>2Da!3ycy>{S`l&WU*^tml^=cqocb&yGeT?@^J&}$@s^>ik1XGJ9urQ8$Up><+N;5
zD8!3@?TP_P-i1*?$bw@!DWmqJ!anFlHdW{2syDhso)|6OmDS=S^nf3;!yMKgZ~p;Y
z$21IYVeB8k21Y&cUjh+=oRes~=WPCwsf|+J1g-k%6N$-v>FdhC<0KzqJX2FP`A-wF
zq~v7vb+?{)5q&QS(eAe}E*u!pIJ#r*E*9td&2RTYmR&-!{a%T_&>L&rW(24#K}~8_
zl)(2#+wQ;DKWEi|begxut!zqN-23uDCL1uH_XZy~V8ER;_aDQnHb_hP&z|i-CF;U2
z>RhZygaSg|4m22V^hRxWgR>4?wwnOkcll@B10$OXeM6fG%k2j!mKBY97sub?6F;q*
zA-uY2z!fKs6^luPle1(5Dg@=&)hRbJ^kJ6GxINE*vE`o2aQG#1f7GqaxEa5mj;_|)
z`FbLsWWi#lvV7~jxTPZn_I-2-<KxJrw=6L#;ykg!*E_4`K=3q)?9BSNC17vwh}UcM
z$+;au#5=STC`*S@qi^elK8Mnevm>%0f%uuWO~XI5nzyg1uEOyzEc$(Gln?g0adwA$
zU%im}nffUz*W+xj+r_#}*p~{3so0RQV7$;?IeFxY>7oDZybAx8`XW^7@9%gAX|fA0
zZH~v#rgyE)1E2_Tj#Rxqwq&^GL!)AWvDDnMGm6K~R$@ZfFa}tX+AzXN^nv^+L@^dh
zo;mDYeL#t(_wXm~9k^od{)D^mnx)h~!CHVVqJM~0wHN9{x9FjnhZm>{zXcVdegO8t
zp50kB7Bu&J-H(}{w6<3ly8ZZkj!LzZTmvz0Bq!S@Wn4qqTgx^ty^d%O9qJQ+P@@44
zXuqLC)H1QD8m<ey2Bhw0vds$;FXF0Cu_jG}W7IEqB{@dztZh$ln9CwT$6IMT;7GI4
zMt`V622L$Nk34scg1e2MZ3pG{&u_m;v7=9yoCS5~Wtj9dRVQlaCx*i;qBgVJBm0NS
zyECeaxGKK~6M7O=MeVcIxRd)&)%{BZT+YOzQ-j+?uFJV!8BP_aIwT-G&7B01*-=wL
zH1>F{L9BY`XY=66lhcp!4hF?pTOq7@YU+^^N;^*rx0X4|9$wt?HUFTUVeu0_Om5fb
z6{hNli;;@6U%sbpbI!M(*5flTgzH+p+ko@g*mg*sd{~4$Fn9Q@(<=V{cI5TxZQiNi
z$GAdQwmn`gmNU$H7X-wt64v>Y4EC4iT5{_i0|9|`nw1*9%Sh#cnIFy;?<a4>gvkbM
z>-l+^^4Uh^?%D_v-R?*#o}9T@(zfi6100x7jz@pLBu&FawctECxslq~j5wd^<9@+<
zRG3UGJ0<M&HyHkPa7#3D;ql?RG?y*CeFi{tX2U5bM%%wb9&1*29sJ=$hm2f=imXHr
zbpnYhc`uE0m*i>ZSrUoBAcFSTW9p{jMSCB0U&+UO`Tgnj6Kqn@4b+#DVK(wz6SzsQ
z^fPN$`2xwdf}IlD)Z&YWz_lpvFPDCAggxjBwSUzw!bx0vCf?ii>Dxwrv19~sk^`NR
zG&ENq(s>6lZ*b&!n08g$GJkR1hu9g;?WP;tqBmW`)m3fjc_t9$H!olV<nsu>Z~HH4
zL|<GtRmxfIug$5D=~D%7jJt|nN*Ze0-+I<9M4H;Y^K7izN8$|%(Z`pSN@q_FG|!aI
z)dScD*8*nISfvy|m=r03A)&azo`(wQivN*26q3(|XZ75!F4_ZX$^Qdd9uP7AyYWo7
z?B6Bsp>4lN?lp<dn#XR|PI-fuB)gSRn4rz{%>C)Ds*qao%Ei<6+zA-^TUyMlLE5?g
zWd0}n^`Sp&ipZ{{q0yj#hr=oJycqx6OGCS#@5rYU7INI_!*zn?T!65(=jS=^>h4;l
zAxYOrq#>6h-9ML(X#XanoD(K0m70r6yS7M)%R2jSIgLbKPd<AyDCA@m!c!T-B=~^7
zXq#ZcX(`S$wK}){(7DE64e3P3%MwrbNA;X-Wa>^_14&vRVccLlj~i>?Un6Po(<j&N
zU>*xd^PIjU>FtzkdNpn2hfwA-tf8iY^nXs`4A1e##HYx7=OscEtkAnDfs6Q_{>RAZ
z?PL}!fA>U8Y;wuDx2?{|LP;m0`VNmugYR<&0AkYQ8CE=s4>r9WDt7mI{odLIg%V2q
z*Z@F;?5q?7fBhPwb|H*$!;^6(H70e(*B6I(G(eQjkXX5T2U`w_d-nXr!JQ~1+m1eP
z_!GCz1S8j0ff{#|wkeIF+6KQe377KIcq(rEVJ#{{%wg#*5*_FNVyS~&!bwI?<(pc+
zdzqa9W|d#6WwNNeyubV3Wl%XN(h6UNfy7+h)LdDqAHyx0Oeg1ZgP59zW1=p)3iikA
zOwh|^OG5db=$TgDEv7!Bb%=&*a)Q_$$r7__8fD%Y_}Y3RKrq$3xM@9{>&oUdz#HQg
zl)U2R&1`eg+^BgF$zyYWV5|Rww<Bg-u|H>_nkY{Ki#B^S!0PHghK?*Rq{EqyK8M?l
zrPcOa_;Y@A@|*Df!%a3St;pAP?!Q9pP{EO67I8pFags#o{=p3+9HP;G^+G26{n1&4
z*I4F&V?!>22p!a+KUy?8SQib_v{5E<hx;ItPR4D=%o^6mld9nNwFY<z;1#)~zpO^}
zjL3L#gF22jb{)!tG-6w>u;Gj+0g7AEuj)XYFLU*EmpvV0FTeL@AgbIOKdNWO5=MjW
zK$i6LcP;{}43G+$cMRq7M~TGd#jb(9;dgXrDA{H6(xJh-x}*k~w6r(5f8)ZEb=a%t
zhy=N>TOFbwKzrviT+hR9-ilOlzkbfe%TQCEDg5zCviU8GG#s8B(wb_Vu%ikj)rp^~
zg5Mlap*{(&2NPZ}4lq7AceL%lstIG?VLWLcn%yCE0dn$gPSn=W|1{LvV-+<fXzdOA
zWnM^sruA)G$O;-C3i+y9bep{Sse9Ia6ivBrcV!nldsueFv_B%838*@KL<nTAWP?Df
zn7NE>ZuhGviTdU@Mi!Oo$p|j{WIex1BRol4n6-)LuLpxNTeS5PZwF;^yBlyTerpRX
z<;$VGUO>KLzl_@1R;w9v?w?Ay8m+5^ifrMBV8e%uBh5QYa+WJK%*CN1^3Vs};6b@u
zS4Bskn$`b$j_HVi>Z<Xe_szE<lsojkVm~r#i$xA@^v2xI6u<5#HzVS=CU`dM-$Wj7
zlR4X|a;E6pPQ9J6q;4i@>ntl@&zD|Dj%O)CG>~6M%)!^Z;v!qpgE?&Y6E_VBXJq0t
zJ2=j6_RHd&n-xE6AcM0_hW$BC_J14STXgxi)|?OPja|lyxad~BF(MJS|Et!JY*FLa
zXn~A!vK^4Z`}@l2&r^rx+6L4E7~#98l)F*^oL>+3Pkt6}gUeH)Xce)Of)6oWMfhJP
zAz)i(E)EOHK@145K)W~&BlXfpuA*ym!m6hOP!<t7ai<5=4E_`yi6wVW4@G%7j>=7c
zvT^${i!g~dyifj6@RD1ZM4igvxdip&SfS5bhRS~13e9r|q&npn;w%4nwo>dk{02y^
zdFhom)t#ic?yx`6CqJ^=rzkB@foZ(P07L8(OJKr^fyI_{s7ER5zY+<7S;0L=>R>i3
zk6!^1`w6U?$wH~GAEXxJ<+S<{ziJ0}6kICcrl_L6u$!vRmbV^qP?eI>k_tua=RSuf
zbV5n^1=Z}aoT_Q616Ho3e*L-$C3I&?l9;D^<r6MkjXjr-yV*mRmK!m~$~G+3lmW>f
zO^fIaC7q~(s)eb>2qM4u`tRVIs3JBgdewgg9eoJ#NNXqG)ekm41edYDdEMh4bRuxI
zt6(@8T3T?B$WG~?Sv(sUsO*l6x;6cQHz<&j7se~rGH4L#mLvk>%xEaOV4;nbC(>nR
zXd-XjFQqCE!M&+y8+ZwI#-ehT<$wq~2XfV#o`#Jr4_@jRM#bKD0Ag!~zfPIogkuvr
zT1TBf1U+IW<3Bil<O3qyk<b~tg-NYn+a50+oQd-kU5|ViqH&`iq4r`Xw8G6v%!?}T
za(YptU{)LfdyYeukR2}-!0SxDYBMsL?a1Bm@a_HQ1AzKANfX?di7g7@OoQ%oeux~I
zcV+Y91cFt^`qa4E1D$Qhs*K14O|oxz|7HK+OV7GG%?h)Hx#6mE4u(GOmcfqjOctT1
zsn&<Lgxe;~rM)4}&{gS>EIi13s*Cfzdu{OYeaj}y(7=|HP7N&VFdc17q{FzCuS*qE
zeH<^UHsO!`&tm8Qqv@)nqWq#Q-O@31mx3@L(jl$1w1UD6B_Q4PF$ze`5TfJ&f=Z_}
z2#mylNQg8dDIwh*@8kF0TkHFG*1BBoIrp5s_uWSvyBP^MpTukA!Lz%4(9TfObg^fM
zHDUkH7W*TRWzBqB5W!}y7kH+el8GQj*t4K>h^+^&W)5f1hbBH9l9?z!mDV(}s(8pT
z<FtGB=Wqpe#&eEOoHs>anDy_~Eo|$6`8G3Hi#Wu5FR5LxE*s|P{5z&3YLk^TAuyt`
zG?x7!^fB;*2wR$v{cU}kmG<NFq4-&4Z<ve6=iaiGm@NafCn7p|Q<F^+^oK6ec~46O
z7|h&U%r>sp^xv6p>unba&Jr_fN{vZtY5Z5Z=~sVchYFaMnLM{OTMVI*VzfM&ka6#N
zY7Yxb4fM4&$B8Ex>yb?`R*qM#RYRRsL`j2w*MDkLO}P)RoSw04J}`T~`?AIlFfm}~
zS(4iDK42jx!j7D>FfN$b>5oTq_XH^X@b7oUIAGHp`m#ZJ6^ZngCmP!sT@zv%L?4=P
zh}z#a3WNS7?&0ID`DYh%WS+iG!V20qsfQwiXP^VA{0)CYvLp>V9C;s%Z}X(CXP5s5
z?hISl92pnyeyHS`*97Shtkvo*yE6&L*ZZ@oRIa{_ce|oX3=CwkitwRruWU@3=J$H)
z*NJhy(K?2B6}opdZxLML!^b|N^Y@w`x=#(aZ1EN*7SJ?vB`tl;8E+wx4sHp5S+gXg
zKf5@q9dY@S&09C-KBf8U?zI57ajF|HkfYTcZzfG-iF^<lTwwHd=h70hO{$D9VziSX
zEW`Se<9_d=?}y+`daNQ{Gfei?-nJqYPskrdL?z-82bNncI&rQ)#ZG!_GIeK}ZdEZP
z7#o-cON-7pA0$DZO3fc<+3WvyrrVJX&%#^j#*;VB-swCnWd4u@={9`F`t@rBP-~zz
zp2L$fudEtaSBCUF{(zUrL~g~(cb7(DE1i}(QELA}8t0@6n*Y1A%xOkNuQPXhu4pL#
zu!_HQ7BpK4KBamm*5f6x!`dEsC)l{ub8u~ygC`<$_(t&0n6=8`b=O7~zM;FC?ZL2t
zw_j?}_|F{SOa83d6}F`uWpn{-fB6&0{AZmbc5Ap^B{;=Ww;n#pyt(;O*X77y57reT
zwv$DVkkRMlUJhPxT&@1U9zkYvKwewB?y0UHhsk!8(3Fc6TUx3|mR)sUd}qm+CeL@%
zg^)RMmN@TH95&TO#m-|y8zZNgXiOl{J_kWT@h4g)YpSI~RwyaZP#Nyq)QBGt=dph^
zhA}8I7*uyha=T7TLY7JdKa&cQvO94Kt2-}dQ{x-DDd(?zE*7yv8@w=dI;`k^=ANS&
z8o#cN%wiY?I7lzZNl`P1v&kpIKNn;M%tI*HC@(0P3$|jFW`(!Et>C*oh!RrH&6uUq
z!c8R_;EdSnj=~3;39;;!c7~*lkWG}VheENplgaZYx-;FDn9NhTcw;4Kpp<l{U$JhV
zq9Y9~^*3Gl!;m*H-{iYo;1a2smB$*DKUIWXi?BfjeBDGp6@AezR(S-2wx1{98xB6b
zy(~3gz%DyDIe}IDFb>fDx-CQ1kg;&iedFBGophAd1+cBo@P2+_BM<*a8m~{QaS_zN
z%4rrk$b-G-(j-T+)K2vQ-SnW~OyQQ*>z6)IS#uuVv1009wPifqn-#Yo*JNAY8Rv+)
z3>}YknW#bRr{MZpH{u@V53)n51%Ii;mYx63@~|HD7BT=aq&Sa7j_wz_eNk5FT>-4Q
zw@_bX-vIX(TB|GwN2DLO{=>!8Mo4Eds_MDB3q*f*+R|*#Ls6LFq&%e8p|Qv_eVwd6
zkJQwZZ+qd<iqC-WKD&4w8LMJYz@iEV6&_*_X(Iy?u~<;g`0a%5)_^(cm<RjL()F6d
zb}@SbFEYC{oR*Ed+#NPk`jzT}ij?y{jNQcP51@}$wHOH`sANCQ7${IDQZZxO91;2l
zilf=$vpM}lJqE%s7uMZlidWafn9v@+x$<%#VRAyZ3*Pgfl|qS-1ILUUd2061CH1>j
zp;1r~Ce841o6wBPt2%!^3l{;qtI24i9_?J+yDF&IVJVq5o+fuBLlflDggBv{)oFJR
zaEkVlVIpPk|220JRG2i6cs5WLHN(_0blErU9Ht#$FsI%tmamkw6M7o-4nA#M^TI&d
z9}Z3^jx8V5*q@Dt#tow<utX7r0V>DR_A&El)RjZ-`qABYF4OxgmH4y{I^UWx4466u
z)CHg1(8@N^e!z!nl<w0_6<_=vasW{HbJE_wRVCgu`#TYKJXIDoEf?#G{p%g|7<E}A
zx2Hr~FUyg}yqQ%x;wz%*d1&Io!#iY6mLbN!dD7^GzD>t_cgXei+yA{)7e}&Eo8p0k
z6Tmpn%D6sv5N3T{bJPHX#CIm8=0gyzd5}0S=3K=u9r!Ey1WID}^3DL-{ou5i8Z1#f
zozBOMlx+GW>6sy!Yt99NNLV_F6~TpqxC22Y>C(viPYd4dEmrIpr1sZZ>okt$iuF-?
zgwO7y&NR!S3eQ1mmT?6?x*)220iA(;aU0S0_HISy2<H#?SI@S^5L)5qMwhdfnCgJ*
zH;XlIV+s?_pZJtnkZuCM%LzpuW`L|{(zj`|PfSu@8t_KR?*5#+XfHH_bK4XX!QJpU
zZY$jrgjVo+FLK_OQHG38Kf^7Zwn6?Ep!Cq%TfU5`zEe4nc~Bo+RW?1<MPHKXLpmi-
zLK?WGea;FhvyTT|v8N9)lEQfZ79O@^70teyI)3sD<1V%b;#tn8Llk>ocO8w3Ar73b
zB95H4mrKx79i5>Z|3&GGKBqag_PpcQ2*RR-Y@5-lt<1;UR2G9-zFVv@Mc<t@nfzot
z7%DaClvz8RJ`wMQjVmjw4@z@i-Y$@0dw72_Tfewq(PU+?Avp!2cTvoIT(f>2OuI&>
zEGO>Z_6f+M{wS?LJ<$*GmMD|T^Fk{nupZ0k!(kDxh~76`jeVkVZ;V`n98+jv>9`-0
z63%c!9W2*gOiSXDI+k%lh95!KUnI%=(k+~{)qM9A0-c2FB>?`#-yRkk6(?yAA0yNf
zNp@7V8|tK6)lr{KKN#gYOSi;GrAFHONwOY3tN{RIY>aA`vb|Ek(^ud7A;%U`j>+1=
zx5$}~MKXor-&sY!WzH4&($ZsY)0zdncGR{4ryUhY%NZGu3)wkL7%e;*&L!B2vc6Wt
zW$3#6xUM}pH%+$1`*rt)6rcHfX;RkXKEu7UYofXjY>P276WJaEOM~yk;w6brn4U{x
z*S-TPHi2_vJ*Rb@cdxG4>txG}@BUHM%0+#7{&BG5Z$#gVL6t7%vQMu)$~{G1kafF@
z4^(7uMezj6!TJu~?O&eafiGf@?W@P%BnDCxuCC_&SMh^xyijomnh}y6C(`w6a;XKt
zq<xxOpZlVDTV=5BoS|~8bVB2yuUoGd8)%RHYybWZJKu=(2&DP`ZNodi<|dkE@2XZx
zNkQ{MstpG(*NS&3X&X<2#{nwB6t%(2A9;!&0=@d$Bt3YY<16UKymi@?&Et*ju^$%>
zHQSv(JYo4?mJT$XU@DCA-;<kR{^@;r+iBY~a3RB7(2--##H7uT|LWCIsTvBXXaQRp
zPdOfe0*CZ>^7<ud(y%^q+3_@%7|ffKX3tjUo0|ro7E)I2IhZ*yE9U+48CDT0TlS8J
z7P`<3C9*WNzu#MCbT`A$VCe5OAzEeMS5hsUp*h}7lUFTn>%3RqsbVl^aU`Z{RWd+p
z95~i$S&s8(kMm{sHoiEX27<H|97RWhjTi)QyKx+euopz5c=s2mA~pZkyoDRG2k_!I
z|4GF4<kiRYhp=}GM^PE&*sTU_1WFYY9}q9!!y*NN>p?GV8~IK`aMkE~#P6RiFL|35
zAHCRn%m)QhWgjK*D5lU1tQ6LZFpSM|AA~$6Uh}&Z$Doiyuz@%OmSB2S&FKZ}6S?bc
zf?U=gw?d{aF^ir54*nAf>@!r@j9-a7lnr_njH~=Zwp#!bNZ9$7ti*4ln$IXCvR3(-
z<M3-S9<1G{3TM=oy_)O}^~Z3n@bRX2^X98ljv(x5_{_GWe+MeKxTgiP8KGw%>_sQR
zRYvQ3g_M60Qv`&TPf3-g2W>Wib7f@a2X~%zG9SA>Xi$22&%-UmDSq)C;=g#rsv~zZ
zXJD2T%}#q&^az~6JlNn*fl*q_=!<q?wByY=k0YZJNT~@UuEcSUvih<<yP_6Z-7mu}
zKRTyq7rQ%5v;y`9JVR&Ce+H->yA}_v{(NA;b_poHOVo)p?KCV{{_s%SNwFr-a5=P?
z|7&LL1dfj$$*#n|x2!2ny9b5Z1zDXJttzwZ=fqeMR7UC5_+J*~`vW-!r$l&Q-<qjE
zXEP!bM0?t)R4tD4lAt`QPiRXsU(o#V%w^b}z-cgT@}IQnQtKpreTlADPulmA|EC+Q
z0s{t7tLpio!VQ_=)%{^*(qfTAr!UWyjzTbdIO(Sm@5i}qo{mJp;EOg51d0W@eIMUh
zDh}71a9~!O#XGkik?It}ZiT~)*G<1<f>`0f_Jw<SYDjV@x<pYlh;~%YtP+>HARCc;
z6`z^#x@iWeO0@#9ibZ<CD#tMiAJ%nv0YA;-cY(^h&AfC?nqO~OC3)Whqo-hdSKPU`
z8Bc!jig!+9E`hM@GQ%?r(u-<){xe88dh*WGX!qD*xzkg0MVu<G?rVyWRun;|8Bb=~
zH211f&|_|zFpczu;0o52mD`>#yZ@Dd7_vSJl75@||3b3}x{WLC!~UTK==L3&xi+&a
zF`gwl5nb9il=|T`N6$BajvRi`e`Ri3wa4)@8xPPAriM=^*Ka%Pv|oC`g}W72Z0Ce+
z<}qovik`Q&30C0WfxwqlU~e{6bzj0CEoP_HM!o0I2)tJu=)y#)j#oJ==G0mgKH5xa
z7`n!b@hwyyn0gIT90~$Jo@15ckdlkEac;(+uBNL-lH&Rw&TewDvqWLU7q?dwG`u-H
zAgHb;wU!Eh{Oh}NTm|+D_!szpN{+FHEaW79E3{xG5o<#cB#^@`?(oRxrT$RPf{bMv
zKEw_gm~tT?B+s&vlZ$Q|BnMluaF~2UM6EG(@_0q&zef~f)%rm1*C%~Jyh7$B#jXy{
zzBtU^AFG83?gW3?hUyRC9I&<WRl1B{v&QY6*MCr)IxpG|#@v8^k9WE1NWa%3+EOcz
zR{lz#mS;XZAy^D4oNc8jJzNVBld|tj6JcRs?`hzQdokFoZM^O`r(`#>Si_`6>ppF4
za_#kK2Dki$FEyZ8n6Yd0oM$;`ZoJYb1jh<*gBDWF{mTTHO#AVxMv>{{o}5It=c8{Z
z(B~Bj#VXp9FCIxTA|c7W4UP)VCnOAa@4gdCk*HMHAkKA2@h7+PCh+<`L-O*(z<h36
z-&clGHuQc_;S{Nq*alcs5X_~~E;vUeP2kl#ej@o4mk2oB8L5zUa?LDzY2ESIx(zn|
zB>G5V3s>gWL~141-)Hw6r>iCA2W<pByy*5pCR(}?H|E<lo=kLuUN?_r<9Yz|3I2}s
zf#TTRuMAKJf>H6<zE|%*Itk*B(5xy>MK?dJhq{q+MX2)xNkE!+E+4Hq3XPWgNDJO~
zR$qO?;vEd!f6S(`sJh}EeeQNUQxmKD#|q6ywu^&81)uTqW;D6Zv@t>R``Gq`z_P_y
z8oELo!TL{Sf!=-}_iVs@M4N)vvg8p*k&r&_00laSXoB%ihtv-h8)<kS^IvzFn=126
zz&tmk+lU4ZB<Qk>3ETXE43+YS|0c7z!yv|+4EjF~G!LAQ`Y!U?%>>`^5EAF5y|`o+
z2RaAEC`$3Ctvsw!5>+^06jjR_0#@;h^d0LFsNfWBhUot*IcsR1<Cy!iD{H~FmAT6;
zYoCt~ZajP9)9=X>d#7%BRcG#Guf2#LiU-7j0pY@IFp<_ob{UoO;NpbO$Rv&%z=UAa
zsJ=hvb&H9MUtGsK(|{eiQ>aI=`!aAOOb%L5jJ~ZU=cX%kd(3+5L(5o;jA<;Uc;Sn~
zFUc{%F^aSOI<&0k5%C(oHQ9+2=&?r-@MR9P%z2SLgi*BCl4f_>4q@Q4YfzdR?C%vz
zg7&t^!bRSCt_E&R2!z$etJ>)UX&;?jr|A~%P4|s^qG5rznrCgEO^r7=J}$u*iuPkP
zbXC{Qnq8C~hmg3!k&Ubt0xNPYyDVqTQG2bwd57cWS`)N#FXIij-~uM&Czfxcf7vVr
zfots~iPC=%dQDVxerfDY(u?AFyz})n0=$-IKWu*-POKX_C#<-6834#^wzo`#&amc_
zd`htS*KqG+cOtP%3*^?{V%q)Y3!aV;dHkp9@u9Rbcn#>*^y5{XX(YwZ(u-beOxq7C
zLCG=43n`lfutR?@sQIR^!uEx1WTmHp^1<n)sZHNPVR<f1`HOWKhFr49gLq?87{{7}
zsA6nu7g!D(eG>f{5Cv3vCNQ|a59EgRA?e}M)jXBbl?;b&&pZ|a7#gVgn}guu9=s@x
zPj|6?Bzj$F>?w1hnWWnvrRQbzfM^FOY7|f~ZqGmk$iZ~8Dr`}pgSd$_h<tE3TMRy#
zvz4WrjiR^)4<YQ7_Jn<hX^z-QEp(<6+J{n~_t*SB<97;h#6kZubI6wKf^<T;B_h2!
z-ZJq;|4un@q;U55%9gMlPgXdSTZ?%GzFm}pxj&_A`)a<^o2QZ!6<1dOK(${C*PDwD
zHIt_8tE*uqHBfNjYI&MJS(xBC=yZT&mN2}tANVJz?uA2g=wviBrOMK1T5F=g(Q?FR
zR$m~32@lZXeVwhjp{KN%-A_9E6v<m=S$l&|hOwa{<;_0-znDPX(+`UE<@)$z+=$nU
zV@CD7XBfoobX$<Ytt#hk-o)65qc2%r%#pDo2KYyW@tuqp;N}$QO0Ec2b&;E6Z<3cb
zhv3(7W(kG=dt}4by=-j*%mG$>Shn6~pXysvndycwE6YGmQtQimUKg^M-=8&%4PblB
z_9TL4F;x+S*H5fdl}MUbp!v|2KNh4<3!xPat7yy`Hm%68wc2z;I}{cCEEY2CHmeLJ
zIuO=i6@UT6*iI|csXw4`x%4zs1D*`KMZ+iGGhUiPJ%lpv(2ztBki^#g-9T_HGJxz*
z3*<{~H|IGvO(>31&f$y@Tk{X7IKXm)qQ3`HG_;~U(2QQn9(N|Uy4uvo!O3H2o<R2V
zNnhq)hisn&mK#5e4mv=Ol|y$=9X>}x4gOleLtWt|oPO+OHhi>^U#m6NS90k>uOleZ
z&T^ZkuK8kwZkd$>O0}K_eL=qWw_Y3``;$>>Tn0HBW-s@ldvuS+G4mKw6PJq7n;WMX
z6G{VL#z`UI5SC484X@=?G<_@7+WrgZfw>w>!D>Wd6c2Et@Y)g}(ljy@GGq`=*?MCj
z9`CLc_5!NGrDqc=Sle7wN@vh_hylYS5a%B_#0s(x@V*0Hyn8+S+hWmSZgL}6Hs1K2
z8>mG`#n9}&)EYWBgOSnzXujB!!!;2!+kP`zX@x}x2f(@C`yY@><d;_!ZTyjEUjH3Q
z5m|M;TsU&1Ot$bn=|JB2)|<{FwNGE8P~RBi%lD;3I)x*;N~1o&>OM;L$<p}^cRgfY
z_P){Iei!n&_P$qn-+9OCjmNIjP$`*0^w#WMod!3{&a~=7F~!)5G&=sNRGeisB0X=O
zVU7ZSk)e6PWOZ&O@qz9c<E}It1&C~Fa+DFq5@W!E=ES+6ouFgBxJT>Q`fiN`BE~Kw
z%|iOBpj~1)oBttw*DlSxqpHqV`Ryt044`pY)D{h}22{iZX3j$wFYc{2W$ax(z5kqR
zx8@QLo}zio)X(B($$FYP6qKxXQ=46F;P$CaL{Pn}ZXuIWUupE;QYUm@C&apvu_eJ#
zW;;T*xRX+eMy}SZR=*JsF`k7l=5*nuhk;H}5~yG$qHJPDFhNjygvH!UxBwP$7caCA
zrmvh{S%ClLo39`%kluojRO`tlmvQd-PVwfyYtjkwU@<Q|58c!Gk@z=8&kCN~^i6Bq
zKu2esoJDL0%vg^pP>^9JRPY!Q;_WgZRVR2cS%`P%!`CJ6GRjY+9I=pUwzaN*BC;ta
zog}#3A<J<voH`uGtgbi!P9QFwC-+LjjNLN&8Yd1n6GyoK9SZq*Ifjdg#Vk+weg<6!
zvL9lA=J?kLUIaT2;3sLa{rvsZb3;YUcMLak*s}K2%Cq)UIjyArh84E|?vaH+Hfu?>
znoQxB2C!^q#d<S6n3oH5VUpXg?{r^yA}NUFI2`%DbY|Ticp<jPvEHiWd$&F*%Ftl#
zLIid=AF7U)4ZfYxZ){B^@~W>2K)#e26EVi^#`~Qcv?#6f<iCAd>q*8mYmbX`QibQd
z=hXkbU+$@db<Ni<JuD3<(e2ybL-jP)b&ee{k4tSe^~h!&%|9}c9x2@3HJXd^nYU~I
zrCE|W6Au`3Jpa(LV2gkXSJ+-wp+0MVCi&Ebegx*opt<0K8Gl8#QO78m#_tUv-VgZ?
z@BhjOb?`fojTLtGbJc{bXbHwF+!4`wc4r0zqh>~2AN1hNam`7;yQ8~il3Ea6QWaM&
zu)<;@V#LrpWpy_$jpxnnq25<<dE*?hm!YY^lY8#>Y^&;CJSKdb#u}bVO3u86AX5;~
z7-+m>3olJI@{9$MOAa}sju8Lh3vC-~n?Sy+Dw3u90#vwnHDP?fUC%6f<cr<2j-;4r
zO>L10iDU297<)+7UE6OHJXK_=1+i$yhl>}#F;A1cW&g=A{*k}mG(JoC(r<HYE=157
z2r0vpq@F=@l3zfLM7R)1)J1Wbd%qr4#Y<#-W|SCs>L8~<%d7rXeA9j!--E?DjASY3
zC|`ClTLUqQg0?2z7_8Ah@E_X0PAt@mW;TrXwcm^J{-btt$E*qdJ?3mbf2n53v9Nb<
zUIzCnD#Kh&HhfZYfZ6yBEQWk}i34a4OhXweZ6v>4^gy?^E7HL0z+UzLBY|XwD2(7j
z61GunGT5*pHK%Ih2%r9JqN7rJJ0x~5f}9BJ^I^KX@gdKn!4>SOTy$LimRK<!s}{0R
zZiS^P@2Jc{Yoyvln&Ux~aPG|O^dwA`{hk#Q%=sy7eJ7U7q0DR?$X%X~i-sQKaHg_r
z^9bZVt8oc$3>W=5GZjleJACqT&ab8*y-B&p6TKWr_eXj<`pBp3a`b97d%g4RVsG!m
zo=+mnN~anJBC9om^*p?=5=PelB495%@R{|;4X!8J&5+}f)5&_~eD%RtZYA8SEI4Yu
zCoONym2g8%aTdU*;xhh2U4q{&7|jpj1H$&tZY=~|t)0xQVPh}-OgLvLL-5!r*-*~3
z^+aQNY+03`jSRk>X(#mlmn$|st#56(A%Ek_B(}b2eZrTL@}tiQuz|g@z-)<?R3G($
z6-!lTrkpD))WLnarl3NCW)p#)oV!Re8Mip{1vMf*tATA|V_4bQzoPAzEtbJ4`{Jy1
zGoH`IH(Tgmyp60WKF;%B%+4ZZg|=w>>UFaf49;T}<A>7*lUSDy5YX32iSvsOd7OdL
zyzU!pugQjo%IqUU1Spe+(vzya{Mk8(73Vnluzpgxo-_P0O1t0*n}*+Fb}<QyzcC03
z0w5}ARAXk<p?WO7d3KdefR1l{%>t!r((mFEAmXYzqAqyrHrxeTh;@`;o;On_2KFdm
z7BDdDZd&W>K?%l~&zv4?v_}nJKFB_OP(ns&_Fx=Y<}|zRdRvoarT!tU23r;2vM#0g
zPMW%a{+UL;gZvGG+K`TAg^eeV&G7*dha6}QhL@(1O`!?#F4eV;k^{=tHx(TbLubVO
z?XrONp8eHx`%6sPcCO~dvE)EYz2{Zf2*vyjkE^kxR4Gh*&Ekf<Wb`0xx{?Y`@MiaL
znhPPWRIYSP-mic4n-{zBiuKq8q0dLg1TtE87tv-dc=zfHaw1(w$#D#Tm@TMr#y2^A
z`F%NB_gkT<8z5)nj=9m;gCClwf%Ke%&E|@r>RyMDlXA1srlH_yNq;#l74`is+|l;>
z63;;)n=Q<#+4k=@8OhCo1qVXKUB9fgqM5#r&(={?dc@}#d_Tf)o0!{uq=APER#hlw
z4k>{M8j&FMRgMM?P;Hi_X9+_F=jVYWWzZg3@oObY>+Td>vo$$00taCmR9E7T0aE+M
zC3r#gU}GdxX5eqB>LEyIYGKusQIOz!Gb>|TY#LTsJzWjypxNLO_5N2m&Pt&j_3u?R
zuc&yjHFEWgAb3zqmAmDNDkJv9KMnGMjTPekAyP}N0pt<|qED|ZsYa!+f3?@bN5!%v
zDj2Ju32wfemb8B>^h<(B(f#Tc1mR<0_CU6lUr0a4%g;`~l5I0R^JdB>+MxmOcZ1`T
zPjGM5)A<^y3g(ppl@?TyE>WuZz|&nb<`Tw*z=bshA};tC_3_7Zi-K)0B@f8#2x}m2
zgGk^#VD~Ev)IoTUSyz6u!v$>ZN?jf$S<LPlZo62BJkMJntiXetspc%c0TCcd*OnaP
z#FX+y8HNu+p61}dqGvG>I`93T6v_`slNGv;_`A#)#{_)V+WmF@=22!YqoOD62ATrz
z6VkqO9jjTPn`>L;KB4O2_oA!$cVBu6!yZ8fEHM$9;om17aPv|uu)5Mhr&&nX8!H<9
zlmoC?H6}w11z=mj=xEEty~!Xuo{wQe>_4CT4l3AxiG$)wYf`rOKHFuj{^}o~dn79V
zII%*e0Y9`NQk}VYK<3x|#R{D1*lc^hPlu79gmt5gk_*3Tp&|F2bd@zz-*-u<eHIYT
zb-216!#MuWo3QtKB*ss2D}7Yv+KANUK8(#ze<HTN91TNr;$3hpqK$_qkfoW)5(EFa
zs4yDvb~KXGz{gco&AEqLsj2YXA#lIkCe@ObT@t_kb}XitA1h8!AsV|xxOl<!rKL>}
zCx;adQ)k@spgYR`aaE`UhBW|dz{)7&$#7}>|G?m3tp;wGu4ztij=%+lC;KUd!c^98
z9&D+B@AXw6vpqV;>L-_!w+1q>euL{a){O>U-rE>en`6bloIgDsklq<`?W%VEcX>7*
zlKj}lC!jN}{!v1n0xWFSOc5?GPBePRf$xe~i(6I?jc&tt0|;hZytZD3`;tWud7=+4
zvKrQRZrc<8;sfxotnit<(0;9~iWA};Bs8CH^cyHVdiU*VXN->9Ge0g-9sxmy{S8Zj
zVbIhrsZQ(@87OZkA85o<$^uIKzOl7}$MA7pg9rN=TBe;6lNq-k(m%Id+Ew~AvyeCD
zzleO8=futl@Z$dr4YwaUboHH6;S0(dhxjOMgvs7S|397Sc<W|d59+03%368op>YwC
z%7M^99IKGRllZpMCml{<`9SkgO4u+nc(rf-urQIY*|6)L!gMlX?RUv`ilF($=kN7{
zN?j&kpGu(B<?rbbg2n`oarL{eveT{B{a*Tnx&WOk4RuY6Cb4;J{p<zSfz*FO-dHd&
zqv-orCU``k-Xo+g`!8+Y3N4J6>^s;Z(`xuJlCq9?cN`(tG|m)F_zhG6@j=)6S?*r+
zl@5O=Zj-Y3!xbaKa4zm>a3y{6a`A6{sQaqidA#yAxL12h9;B7tHhr3fMaK;AyFb!T
z@PM;to_RO9g}g?1(i`qYX183;vBUn(YOtMTPJ8ZLgJ1&harzO(gZ}38A*EY;rndQJ
z#D;j1tSibO;W|uVfH$7EJuEU!I&B>yqc<F%Q*t}$mw5R`EwPRC%bNDI`}D@mWcGi;
zvn^N1kdt&$i`~m6{&-P@0||I{QRp9@VE^Iy#Y3`E%)_g5A}gE;F?+vCUr@qNnNQq7
z-1+2pc+iH9U*7t@7|K%%e>VSQ`WhVACiiJB@HfNy@wM>e_PjFpv`w}6(w2ExRLhEl
zVi48V6BsxIAXSD~2C~Wt@y7AsuHyp5ayPOc(BKIQ!!eynkfWU_{nmJU%mFZuSvOP?
zJh+e|+~MUrn{~6mQt}!p`MSQc2;v?2FpaYRJEM<O#~yGC<VEc`FypvpF0MTN7LNg*
zu&dKq-MW~DNQzDUh=!(>$Z_Uf)%<+cffobAO;ZN(2(a5wZ@e@N?fGg_QYXq#;m`g@
zz>yupqYZ(RkMOcRr3w-E09=M}<>Heg=!RC5Iz?7xbDdlKD{__UtnuLSAAOH^^yLI{
zS4P?hu~y^?Ndn+zoe7QODMPUrBq#Wz&H2kqiYEADG!V(>c@`|TOJg&iYeU70ELomz
z9Kh$!*j)MuOH&qCjH{I-xMFBXD`+{nKh8)YJ%e$~Q#kZkX6_9D1~Gj;BHw27Dud|P
z(dPI|@v43Ad7{a733s;3KW4u8dA!!EZQ#uRWi;LWb<lp!T_Mez*eH@*L=1<kp*$sh
zQB^@d&{%~yua(#M@Dzf(kErA9UGaCc{~5jOP_Z$B_gyA=i$b8wM?H<`qh$tH_V2||
z(tv1>Fu3H`t6_j9fo0`QZpeW*DXgm8b`Td%+i67jOyl%#BFCiP>ec3A`Sn#5bmdeL
z3#uV-r@=9F?bC1W|5bHO<4II{<(q6DqsiDm0v4aM^iL{o)gTyu+{YXx!Jn&W+-JgB
zlqj7aNys#W*}Q;H<6}gZ-Xt@xOYV^Ev=Dg8j0$2``+)z2tfH-y`8+O4FlmHUnNa;+
z2zXxf$*?=7+|$>&5ywi}C-?7D)$of;?|3oe*5QJ6)XCB#D>#Kj>;;b0<G}~(aYx2K
zIUyr!T#qmkgL<Zr&3oNRpem<miYNeys9sdD%Dr&>thMW_MCfn}?LK~dtZw2FXkyc+
z02JD;VWUswD*IntzmopXY=6m<thez={~693?)_}?42u<tIj;8QqjkJCO+BD!5{FbI
zJ89lgUkfjc8+Yh^qGv4s0n-n0yX*sF_@CR}f;*0LoTTIEKQh;k>AYKYPQn5v1(y4I
zzegNfsi?C0=Pmpk*@(zyE&oC!r>_?PFvn;C(&7#z9<r4@|8j;MRmKfVvIqVvZb6-|
zDpJV$y&h_tupB2PW8+#GZ#r2C{bX0kgQ+fUApt?>)Yke2bU(Zt3bQMT7#8sydN@&$
zn{~o_<UeFuXkK91)Fr28rDOFc#K={pfe3JU*R9WNOf!vA4|4?7Z#uyc;Mgbc;-nn`
z)!~aJbft;$oWRR6U9q>R!kjL>&{Jx2_Tf=`E%>uGjDs(&inR_g$bxa5SZD;tHzmkd
z-cmTn<uzmnMrFu06ON7)54nqRea?thc&i3vS<zIZH?E`f-$o~D!+DLw^n1_B=#g53
zc)3riAj1<9RbDQEUfO`~--&2wL2?C=V{p5JzA2pR7l~ZeDB>RYGpyozUdEE+qlEkr
z7{vyYR+Of2<z4_3ENbqE$%tmtosl$@t;^v3n+hR*QEwse0;I1(ch7Dxitc~QCUYtq
zLE)E4vP;*G5(*X5!<|c2rBv7XV(qOLFPJbL!g#`n(W+VCN4@5N)U?d(!^<3HbZftL
z#6If}T=GOLva9I6zZTLmb#L|#ex<ip(VnsCJbinRotn|}BT^>=|6$C8{z&(xjDBP#
z83}tqg|~ZWnymIyu9*P~0X(RKqz0@kwQC~Zx%1+#mezn2LCnMxAD)ivuJGy?ZOc*x
z{xC9y5&<V*8g-a;4=nW1a@6ow$!9DM%!H$$<gVkgCmh;Ih4_Zp52m^Mwi!P_;i(0f
zKSk$h_|T06yRX<ThmJq&>p2iysqN=0!hZ^!N)=X~;@HUBh>lPz5jPE@K?*W;LvEb%
z)(O<aawFgJjHY!32aE~1W3JtK3l3GyI@3IB0HudshzYFdT&9R?e^QY(JL_mmPGRYw
z@TZhigkDCOLn`xzh}BQu(3)=XBHod9{nj@VP_phQ8WyKs{}{@~Fm9bd=1{#O;apxh
z!O3uDIrxD)Uk&@P;zOIcHOTX|lbGYJz~b~6BS#f>ZRos}?9j8c&CJ|lRMd`)r{;jo
z;#>H??;@DURrhIaWRK@s?{*T7XS9Z4wygc1_A#eH+sp`;8!_9>DkeKe9-D<40C#L=
zzQ>C`WibkE;DhyP|5~Osrh)fVJN+}dhm{x$NN+gX^s}*E$nJs@Xsc~Fp#fZ}3_xt&
zvxsJxr2W>WsXdQ`eVql<=3za659YrTyXk%U!)^cSBStd=T8+y9Qc`5O&a@(|IYbHk
z&+ZC)61^NwVb@MpcpcFjyvX-!++VH?uCTL0wBjbH-}wV{8l&>(nGcJ5ZY(C5Y*9M>
zWQ^q-&%dpQ6uWk@D!1DmCI;Q%-`#ECOJn8BnSmD)32A3f?<^O4N&N!uk_{nRfhk1V
zpiA-e6JR6sb(4#`0u9t*>DR|XrW`zg*o^Q#-c0;S`r#u~&rM!f>k^tnM|)lxUH4IZ
z)&w1`VCd&$X$5~FXSkWH@GDfAsG(`AI~qs{fRpM}c(NVNj{Be8ABU{ShvyWKbQUQL
zethzsT6isTynRLus4uVG#EMRg*D4OJ1X8tMp4AW6?;XV(lM~g*;dB?t7~pT?Nir|`
zJ!qHGSJGr&5v6;TSH&?^24YOe0E5!x9fv}0(M|%J;0-Ku!DR!U;!gkU+{G})^k4h;
zPGan7I;a{OK|l*D6@9WE1>RbZwx}2wue8v|O`$^P;Kl$tmo2H@9f>-gB>n<^Yz1x#
zkyh)29WxsQ{6DfPB&ijLMbhRSm59m-ui|u<vQ-AP^tU@n@RY;DDop40qoMefnYsdu
z)N#glwP?jG3^lx`!my_XRVXpzJ&?g!?XbwhBtHB4=ZToWauX<~A}3eOaU<!A>^xMv
zn2-VZcK`=ho14Qm%tvRazu;zL3*WHu34M}&@@m74lCX~dE9Vq08n-W2H>6Zx#(^0@
zwtm!AE=#ftVEhpeunjFnS1Zzm0n!4*L%5~U$VdQ(;-y@#^A|eW<O@*`mL(}Mk;p6q
z7i`)ou3hh+XxpCf^B#fafp)P(L+io;SL!ohdJF&JbEky^QCQT>wwd0W#gX^t2=Yoo
zi81xa$xPn;CW%#*!EEBa_k~)c8bAJ1B!S0`yjl~vtN89{DWs;`eF+lw+F4IoSTWD1
zGkWkPrInc<SBto0<tylN5<S8se9|Z$Q>@s;aPmCfH(xVwgqmqNt<CZ-51Ny32`~U}
zll~vVA){%W3qtQYDuQ2j@;Ytj(|CiotXz!5Kb(~NSOqID3gLzvkFxJDOnsvG+kL$&
z!VN048}ez?Ot2AHjVN*Exfn#>W(5_OU&nu3D+~K_>Hm<WV^-6BCK%>N4!dFWp&T+y
zqg{~}jEA1}nb@A;!jxhfUIfrsMab~OMs$NCui!CQn>(oa<}or+JKh_LUK;ZDi}u$3
zedmz2mr8^QQY}(R?J2Nrx?n$d--aDNeT0FI%xW)-`do9;IvLncSK~+!liM-}m}ePb
zTrg+^l+}0;?L+3KE`>U#Enmzbx4!dSk2?7#lZ+tJlw^K-FDr)wwMn=|$*6S%FWySC
z#vzpmH0oB>;gbq6&r6AP#zTRq28oW46yZUegOELqC|UM`N7D&wj~&U8lY}xH0RkE-
z`kxySmCyQEw5clkj(f8~xT!FzN^B@5Xe@yWX-RE;?Ju>w*AmuU#C1a}*a~o~#V8^@
z<?)D(p1+wYwgF<a`yyKFAIGpgMFrT$Jo{whw|EgSm(|m#+E4dqL+6}fM8;EBo$wZ_
zGd(`9Nl*Qz!GG|5%g?#pCu2plUBh(j*e$8=m9>fa3fQry;sL69A*hMCnat01f?v}Q
zSv-9AK~iI}2I=W!?10NBzyf<{M<CtwH*Kx+K_{y}pb#0Mc(-eY+OL(z!T17aF8=MJ
z(A!<7kNhK;Nw>V7%^p2%71%?N8MM0tdDsP6yeNstj6%1*J_MEW=_TErR*w4IBKf~K
zH=nc7LnP(vdfxu8_PFQ-949IDH`1#fXE+zO|Gr0H<UX0A{1YrUJI1!~frtMWR)WYh
ze1JJ_Lmzr<Fqpg0lD2RiiMSK)kH|#4`MLd<{op)@MQUdtj-bnoKc~o$9fHgDrq3}R
z_e!%$wj$k#Qm96H|9(I7@iZrNS-kb^X=;}-W(ZS(@_d~*@hu2rAnd2?{9taSP|48)
zu`j1@ddgp^B>oZV7B~krN%h9<N*}tV3LL7m;V_Ci>EBchH^+1cSNB0J>tD6@r+-GQ
zNBTkaA79#uF??FLkYm(2`z5~`Vo(wZu#>V4fD&8bGm3(l<V#9F_JcNKf?u$F)dhh2
zfu`ZhDJ9wQDYDBlHLG{tD2E38C5T#!HS332Blm?v)8&VDJ+92{VsDOERe@VqWuG{E
z$Dhp7)w6;b8Wp}DOL80YYog_q|2sA{veH@U)eJwCNyJE6wc)LudkE;*GtfhPls`Z9
zaPikir);e%DJpQjfMcQbFL3#$=-54HGmaG}zQ42jim}HmEAol9LqnvnbaX!tcG@_I
zzRZ!!gVgU&zhmLmT`GA9u%fIATB2F0Pc#tIpMN8T31=i%f!YJ^Z$D}a%d_=Fj`1=H
z1}c(-;?sQhAbsYM*EBQA(-cf3RJ$U*j+_q2OgfMh0Jje9rpeuLw8(=k$Fm}L)vsfr
zA?6^;=9*@$B3_gK@v9r6L+ocTCNsA{JEji~kw7WQ8!0~*`3QiLA&pt6px;!2{#-@R
z*D{*d;loL`zdPw4$i81v07Vb%+U^3Mbduj_R2@2(KM4HUij~D|lelze>B$&ek~Ot~
z54~U(tRLbRJ7ZqzYt?3Yti7^-3yr80Rvof{m4Zr7Y|u+Fn)=ges%E3VG$sLy2i5~>
z<*mv4w>@kZEPyZ6`^@!9I{LHUg4#rqK%%d9E#y|*lFo+RW$(e2EG2)T3T1Z@k^s!S
zvCBGh(lm=_@XYfAeg_TJ7{*1!^W62_S<m6@QeBm{4(i<gv)jL7E|okMv)6`6*_ff_
z#mhA*GMays%=H69VnlabnE%nE_<d%#P?X2;xZ3Mzpwi=%0~3xpeS^4mK!TM-x98pt
zZ6%@jeb`0_M){|bC*y$nvJ|v5o?!1vv(>7{(1w+MJFds(llE|jT8~4Y1f7J8EC;jf
zG?4<%1-aCxYut&qN79@BzL%~Z?+Wzpiy2HfjpyM@%_$*gO1R^58x@8+Fs#_LZ-rIB
zBE>!sk5fmi-?t<AhGy2Jg?~rEnJq)PgC$u~v}v}5FjU{aOD`D2p5-xjJDGQNiP2OF
z(d8O}N`gOlp=+r|yA7E~H-#Da1wx|wBJ16Kxo|-aZa?SOM~^4pV>*{!hD9S?i#34*
zHm2d@d$RtJl{egop^*)G=<)z~d_{o{L}oYxFO~yeA=$fy9kovdN@*o^)lWC5@e$jC
z(Vr>eQEbP-Hc1lrFW%a&Hm@Ahz&Qz&#IdfK@;t0ADE)T{<?;r&Vi5R|ifllEKNe1I
zdA>d9xfW+XCzo-Sj(1Z!>fZ_AIC1Q3ND=~!OzU{>5)UV*O^+OBMDvRQ_?3k8$^;xb
z)H-*VBO>C>V<5p030e0PM4_2rCqw7x55|7}iM(=oLxau6b;Fm*U2B*b{_bBQmxftY
zhaq@=t<GV;Mgm@f94gId^mx`fYQJMBJ83xW2QRikxb9|aLb8&p8hw<l|6fZG{Jq(d
zsUf{}l*)|W5nx_<gWo3lV)JF<n00iCaQD4JS4P|;Ni2w4GQ$F;VMzPcj5nV_ich9(
z5eJR1u5Xa@PzS*gxU|hRV;MM|_1w_?Wi&hZ)M?1)L-xiMwn1dsb+fa(5KxY=zYE-U
z8(5Ng|0zCGFg`iscZ|2SB7~{2?*|<X{4q0UA4wkoLl${Ic*QSwsPb1~Ki46Sx`0lQ
zZ=psEjyN=GuV1O+t`qXV6UcDV386EtTs*kNAw3`#o8==!_QTMb)(<b=T83So85;O)
zv>wrgx7enxzXWc$?=sOswzs2@d?HH~ab07tlMTMz^gNM!|9-A#Ydj&}N7TOCv@z9P
zK@q@dNAAesNr_YU;Co}rWKbxl5j)sz!%TP>NpxzA+?T|8DkURL5|jBxM%Y{Z=BOp-
zTz_!fgqUeW?poe53sboOr~izopHlCL+@_sowt%E_>$V<o**utQ#>^MeT!+r_*!`6d
zhnGT;YU3C6I%)Eq)h5Bp70mf~M+94hz%w-grQh61Bym@mUzi6@6-%6$KJ1{vs|=?M
zTUw82oej(g7o*olS3+8~csrst9Q6AR+D>x<BbXikFQn>7ttbWPt?dtI>6br)SD^>;
z6GRp`%*1*F^q2)}7q&><S2G&H66<qPZu+x-HRmuCi>a#PdHzW%U5LVbTeBc(U_bqq
z1^x+?RwR%-RC;UnQ1a$)1V3Yfj-QgN%&U_XkNToSVJBpMp@qio&(v%48QE7`toUCK
z)2yCWOcI^0^I$JhHn3}f6ZFkW*QRTKe!!tj5;o6;VH<Is>G=_9bQYkv+-N{*kGi_f
zUctoFjleAqA`PP5W<}ZFfZLo~jR9>3-y93PFGvWmVpJQNF^axU3ggTd5%KIR3ZDfD
zVXTGk*k&EDETd7S(6UWv7FkqPQIxQF`SWI_bU(N|t)>07+7YIC$`Ye3IO)&q=Ji~Y
z7wrvinLi4P2(9oY4$^lwkK+2s_QQtY9bAEXC5YALdf@5%r@;XE@2`pi(iR#5cyBc0
z6{9wmt?VT!S_~5S2fp%Q`CcAd(M<M{m)av^VyY>v68><8an+5PJztjHIDcKd$$Ik=
zR=<Qf;q0YIONW~o5r<|JrM?0{2quV)m>OuD9py&r7yY@OSL1r$NaiGhw$1;2=ad*=
zh3{40>2i^yQ~@%69rLL1bPFff8(EiiJ?OcRX5cj%+;|@Tg06f$qN<$c(vZ_@C`d*5
z+x<tuB<W;FruzN6)z5$W>m{%i>@^f37AKHes-ldN_}AuMBAWx%+7w{mX&TZ)*A<=w
z(J%evB%O(f_MLeq1nb+p!KwR`dv=>vc71eszx*TM0PbNeZZ(6qk24N?Y~R3R8|#i|
zI7&J++Jpgw4BZhEl#rRlHoz6xMnWnMrm~TA{gHbw=Q9PLS7mvI(N>Dm>Ur$#HhG4X
z(?6i^YsLmj>lG2x8C8YxUPVOIltdpkvS?c6whc=M{E*3c+~7~($KA@{F7H8l<h}Yg
zzvhoC@X$iL^|#G`qRuDZ8atWZxyKRkREx7rkObUb925=L4H<ZF{&f4}3gY<Z{+|_$
zMa`fu11+Zo>fXY8v5yPaCd-kIJh-?z0i^?Z8r2{3W66JJw>yn|-7}bb>{H=GIQ2V(
zh(T2;nuQ2<)T@l!YM``RNB8r5AP=A6+Z8D(pmasmb-@#R%2{X`s%WP)O5yH%8NxW<
zPH6+Jx%Q$dCO;*Sy5ANzGYJ2=ePqNZaH3<UaPPx+8TNuKnW&9h799vwbJ$j!w)nD6
zjn)OD#O5Z!jEa<^;K%J^%UIIM|Ejuf&men$zA*HYLh(-ML>}%6Uv$R{MJ;N<FbP1)
z1AmD{r}K-P1ae?My@~Q^q8;B(HJgiFuJTTIv?tT!ZM0pqs9~7bzvwD>cv<sR`kPJC
z<5YdssJ60&u(?2Z-(FAW*Z7OKGF8)!L&t+YOHp)Pl-eG)RY+z3a?e&yj{swut}10e
zy^Tr!@|+CGpI2t!=(Jk8&R@~s;9`K}K-Qq&WAW?pI~o1$jn_v4sV{uFK$D2g=TQy(
z|4RxD3n*w?i3SlDYn=Nv&Z|pGt|<=k1~Bh8CFBR-PHIx{5A=L`ADI2clA3hgjTU;O
zW9MU+?rmWa^$WTzYyWE?e}d_QRdE-!$-2A&`1@+{wapokjzI<DX-6b58R>;;1LDh!
z1Hxj~3;yD}((O$mI(n%-*Xec+1Opj7|4F8cn8mnx-%bQYTPC*lKSwbCAS=f8-8^JQ
z1(mD%d~jUJJ8&z|2)-P9c3A7g*{ZJ_ceY)6)%5%OmForLuZI*>5Y!<<hON{b$DBU~
zgSX;~rhbFZsfCnh1Z1+kW;6FcTzx6{o>K4e%Y&wuCh~;Q)4{n4)Dtm5w>+lmvn8Xn
zjIJFdt)kBq*#EDQ@<c~<`ioHFq}-8B@pHgCa>!k(v!EZ7dk$j_GI?)`5Jo|7fIS`<
zlAm&2#uQ6i^PD41S%XV|DF&*n?RjgRs`LezQ)+>%N_6xaJbC}ibCJS-Qk@SQc|ix)
zA|f#@P-!~5P2Lyx65}shXNjikcEO(Vzg0I9`H0*n7l>&We&zko8hxTTqHbbZI>;~~
zFbGC*@6zXxiq4Rg<H+g7RLm?AdS^J8=7YWd`FQ#1P48Y{%7*Myhn*;oSY$*V8&+Qf
z?970hmt5lH5_00a)P7&6>FB9yWZ((TQm?<@fOvkfKz_eC#UJys1a-0c2W@e+M)S^$
z9hrkkJISWhE>N-)y#d+Szl1g#b1~@s1Ff8*e-GgyOW*~}Wuxqxs~4B+r0kP1P4nMl
z3NTfA_r>)&h;@~B2xW5eR<BYo0)<CPmBwt_y!%MVGR_v?fW>Eus65RJfZI4r0f~Rb
z0o|hhHL}h|DFQ?O`xM%F9V9_jtla$SB%|d|G+lm8WrXZCst<VjJ(32#c3b?6dbjr9
z51t2^lRwA>d-_&c!j$?)Q?6KJf+J3pmLT8zh}oQwr;vtE5w%ad?qEi-K-$&n{`<35
zS1yVEY68RNbkal2MUw0Jy}+uVuF~V`#RL0g+$~k2MAKhYt8b9gBBk2~|FvqZ1K%)?
zG>cImE<A3xq-nZRDnzYy?0G2FL2QTczHn1&N^x^5X*kSmY63O}b~x<6x4$s$s0{dO
zaqad}GtoItSuvX1xYz?P33ZdWQu5LxwzlEw4;)n+g>`hBbme|Z{(5aE-AVMDKKOR8
zWY;r-rH^U~k;v+)$Tak3SfOSEgDX)flPvgH`ZfBo6^J4&HbGGMH!J%WXBEH23jg;;
z_hAlkeBN}+-&~BJQ$odnFF08H_^%%7XnDN1acmj`glnKY0eJN9HqcssB=f}*CCrjY
z5x>+1$!bt{>|<~@0phJt8JfKBUri#R-$XZRFQflRiR()8i`dyTLz#aoMX#;mn>FY4
zG{H4;U4o++NWGG0lqX~Jhv~fc1`SCkXE}b$?*xFYzp5WS*a{4bO?Ljum@Zr2fQR^o
z-}ZcNz(e2$J)~uDOL<6K=X7n2VdC#LVw{y6XroYImK_Iq9a16gzcRi{PZmRnclK{|
z#w&pv3*n-4omDL2uc6D!1fC`_nN`v{N2)n1e@NtGuTx<eR^U-D#&pxbtvam_1YRl2
zW)q0Tccb?2<gWW=1$>v;#ws4#ihwNV(|<sq>!aFzb$2{Y7Py%{O|&t&$nK`bL-SHj
z?^|`{tefrsCh+=$^^RtBa7qZU1~~dZ=s+n3NGo9Y`0|-D{T1<le+~0eQtyiD9-1Or
z<q5=P=*)g-HS8&}XoQ&K>14f)SV;_8WIuS;Qu5(c|HBhJql(<%eu%9(*w4)m76L=p
zWoE<+|CL;eGK7^<v~tQ!7F@eiAWG3m>XsEX`}&ywN;L$3w@+xhIyi7X<aJmf^O>wk
z^D`6WIq1Y`i!h=jypillwX`2m7&~<9(bNx609nIyK|i_HcTHerh&lTKi!*&@f{_c1
ziLnh{GdCXVuZZ5Be?pOd`IiA;8fd4s6S-t-ijvj=-(A3UiPvV)Qr&XNlKg9jY|cn|
zTvA9q9r4GO9BN4($p-iLoRlA0lHVi>nWPN50tc3X5%+jz<6z`Yf6}?YMpg3l&<qwI
zvnLw=IrDWD;W!8O9D4(72;Qln7P~7?&)mIX^yD5Yow$KwDYaDT0)RZzl$DHw8;V(_
zhY<g+WHfP~(4P`x$3(5l?%%Vq_&b=Tiw=9&WhUfK%Y#j9(pAz_&En42+|HHrBKCm&
zotR9tIU@S3F`Ty4G<GF<6r4}9f(Oom41OFkV`n%%WyU!PC9L@EyoD*h-h2~*QVV^m
zA$iN=c2i1MhNl7k1;E%soC!raM@b>~b8<tf|0{l5ylJO&ezcEZ#FEOtA7ZGI5cVAT
zD&vQ0;ZKJyR|&Pv;f4c^Prs+G&P=XB*%0?U6V#4PEFsZBSDd(v@en|02ZojUB0(X8
z2a4F~FWEDpE0CD2hu2!uivNc0RS@o)yS|LPDy-j>umOrFyr~|vy)Hp$A@njxe|nNF
zC@idFQdE}}&2iU%h1{CgHhCSuIW>5xREJwK9ONc2px`cQ_pFU!a{Zr!mTZ4D>3S6&
zaygSlI`sV=BZEN3D^&RdkRGGI(MkqT5-P<&q&dBaO1&TFzPHG1Wq<cPy6UcY1r!@w
zT}+|10GM-^_lf72Vw7>xZg+&l8%uFu+?p<N|7Dn<o#EE3V;?S#V|`I<2`}G{yZPkV
z0nvnr!^+IUKkvSIqW#*PRf$eM90;u;YH6-yr%e1}=Rr9w5<>>ETZteq*kQC=Z%oCZ
z63MEV5d4%SNl$R+1Jq#{4C7kN)C9X~lLF8~i#?V8pQ64xE{bUVn-EYy>5z_<l5lCH
zM3-183F(rMZYhZY71$-E8w5c_TDnnJ5TvDBYLQxcfhFG2d++b%!(YQN=b1B4ou|H`
z*uQlV7GDNrUE(YF=gub?0SRiee;|kk2Qp4)u~bT|Z;qFQIKTAVjwFRoKrGHH9Oen*
zilvuZhxv-z2s~&`$%A<Et$V{m^YAdw&rby;57^Z<bI07Sr4sLmcnrWheLseM0IL?A
zDC!@?GM6t(j6Mkph#m+0vPWm%WTFT2C7!>a8O9C`2pP@%$7yp^B*v5FB#dJY?XS*~
zI}oK_O}+KqO(mH9#Jp!uddx;@@#shOqqoB+LLZ6i1c^Dn<*Mq4y-0XYkLOOER+CL8
zL2CLCZTtr>1V20cqAB|g47M>4v)<;*e0FP=@WxEH7njEaC7{}<O?mmF%Fed&R&!cY
zsCydwWBwrIF-|d_MUk-gQC@Tms@K}-@HB|+gz)=eggLp~vzQFlIp#j2&X;=cu)AJe
zjo7yyPAz-no(p^4@0ce0)uY~9PR#moCvp6w<V8JPpANiPrExj*vPe<Xi*!%m7z=i5
zTk{{DDzeHa)d5klLpATdd)oa+2f6lUpt7tfRItPhNtQ6_h>W-SC_S~0Rcg1sS1d5b
z<SrWu`)|8R;tPKnr@*~BhK{EbPtvVwxZ}|e?$#Jmxr^I@MF`ejCj1EK_j(KUlpgCS
zdDc(h9Ja>GjaI=>ls@K8N7GOAk0E&&$(ftbCp1t>xVlr$(ig49*D^QB-Xa;uxU1d!
zv(!h7<;I@k>ua7_&}vJn+c`PcH7v~>7TzgV#Y5K&T-v~%EYQ?#p0gbxw11p<6Y40O
zyQ|4v5{-)Z@@?Q7F&yO!A#;li9<IfkzGthm89unEQS-+7E_ztGTJ_3_e6&7~Zahm0
z=>$T4Q2v2gNic1a`MtA<2k`-2iworaqBpBBN71$%XMvWlk9#T~$on(Dw@?3b@+rdZ
zeyw5)Pc!=k!<qS3xa-ah(RevI)iM!k`zQFlr*dy{DF&~FL|LF;uFJRI-sQH1yb#;v
zJYx+ak-F>o>5E$@z}@YOx1fw!#SR6Y;uQj(&G&jEeJ7UU@YY}|!hu|m%Fu6pd#Wdo
z#I=r2puIk(eG!LMY)T7A&YC*@gsG#Zk6JD>h*Q}FV(-$ksM0R!7Z*KW;da;lnUL}&
z^g1!;T4U~7wr%uE%cQ69+{*0C?E{5m?j7EkCdG#o2X>w<)tCO6?rxK_>9T7)fHXzq
z?M-d2tf7>nm-oYzqi(cuDvFPHG_9Os24sNJsrcQ^nm*xAombB~DC`HJSMJ<vR}4pD
zFf%-yPfEs<paG*6jp21gW@o9pnGLU??z~Q!LecK|B-o)d!`1Yw`!+k4E9osRDtLKR
zaaWql=gi3><cnYwB{90H(o|gnfMN!^viZr~cy2?DRKOTqHZ;$!SN9q(BXmV5yJ4Op
zay46#OpF8n#}heTo|xk6l3kar+ld@;ij2_gB#sEtsjS^ioayGn=rz18Y?Phk9O7GS
z05ARl8qt;#gSu=>F(yB5tUeyUQxRNPeQd1RCle2~=k>)8rh0)V!t4o{O|Q(RF(0sH
z^X^g`=bdzD_Id9z{dxFT_Xu=?Q_d0!-dtwd8IKw{eV;-`wPw+|Y{tW$<sr@P4nm3P
z+TE0vzn&MQGo0KMaB4Uvy`ONh<<r^z=DULIllQ9Y##|WZyJ8~Mavp4=8T>fRg`B{l
z`v*?RRQz=;)qzx;%sjx)SMjBD@NJdrR0n$aqo;%X{`O#nTUpXr=O=S;6q<Y0|3;y8
z`*{sqY1>=|dk?r*^EoAw2CFjo$c4d#qv#`j|C-ot&*{99AHJAVNe|L#njUNGXHXJq
z=@ZdMf~K@pI|^M)_Ow+hQ!H;TT9~FjulGKqf(*P}1=?h9Ax9+ioW~GFPjb3V6QHxn
zHsvK%*yn-m<J<@uhH9hqN{t?yI8oSWdB@RrnYCO}BZA<(bAl5x>g&}`GY?f0BCH8@
zZVA@Tj}cX*rKN|om-S<w+C2J<4pDtSk7y!`%2)h!N1E;iG-YqfjHpGSiUz5+3VohI
z*2udr0nl=4;a*jDbrF>flj{{&e4oUQ7JZ!fcpXe-h{k%=RbTioIPD%Jy?t<?LOU@i
zL2Lf2d_k`i`;@h~H(PsoaKPx0CArz)i1#D!?3s(=<919^7?rcW`MK-0W9Jha{7v#G
zqi#{1())fiA;He|!nF=;cg~r1oXo-2YW-x#Dj@JKkD`Lg*GlD;Odfkr2<&ze!@z;r
z$pk23ElZPmOSzWB?-cSUn-do3Yu%)>U}a5kCFh$;GOsS4^e;~$>H=kjIkb$VBburX
zf+Fc_4J<x%4jjZ3Gt#UYKo##rxnLqEbQJA}>)I}!glr2ed082YcSKk@*S;vYsDECE
z0-A5fD2PEjezyAfmxAp;Z@n+&vY8O2XmA+R$W0Odi>bF&{_c6d+qluv1!;M#H(8Wr
zx^`8MK3fd`o$d6uO0i7+m?`xWi@M}#rl0s)TSrd-Z!!Bu_m8vYc32&I1D+vQ>@S>7
z9QUS~_Pf>~D%2rCk(|YcbX@;!9SU3EuEp!RhQq<^N>?eH%d3^_jxi%21)qCm(zLi>
zQT4FRSUfg_k=W|6M)~wZs)N*?=&otIaZI*DS+JMVW)NA1q}@eed!$pzCDO~VA>T|-
ztgSa7W{L+*Y*StkGx_tm<kAN9{jdo>VZ-gePHu`7<&@iV4BiKK<#*<zW8nPR5BUXU
zk>x^M;{!G?hrrh5(=d^kBg_x!;yV0kB#Y!vYtBU_8!$9^W4TLSvW6P_!1%=%UBMYn
z>`Ymsr}pxD<7Kudy7J=KYx@#!!>eL^_Af0q!HES<{&gXW`O8-$kz3MQvBpGqf_~Ee
z>5KO1KO>;?dTwWLGk>26YeWPbD!Xn)uB&&+TS<M2CH|nvqQ~~(dx)h4=*@z)DhhT?
zSV3l}U#@+=fhaYuuE|qdGFNJ?P2O<SQ_u!Agd|PO%&!2GM3bk<#m!yY&M|?4o?Cx|
zf}16;Jt@}b`3-7!*+!qt3bKOZpXD;|>bkrL3PmC62_jYzA{2zf!2GUBXX-k(Swi%_
zF>%IPm-UUUcFPB?{QK08o?M_##V5#z*BK*8A4&0+{}?%6mkH5`n^feq+<xSKs2Zq~
zrdMV>VycF6=Fa?SeB8CsmFYJ7>ja#$GYn2Fa(k}Y&ynh3kZMEV!TV_;Q)GDazjf`?
zNo8H~^6}a_{lL-}wMD^bwJ-Xeq<jlUil4J=&r3=SahkJ@#qDLJK`P#uIo_}ZLg)8b
zYx0XHxBOHgThF&Aj(u04JNT=QZD7}0;;{+F-Jfk~m~*Hn$s1!_p4Se(6=9#fuD-Y?
zVQWowA9R_dDc)U7GjOl<zYIcNLr2>#BYYb8{rlzmB7h6Fi}a=a$Z~7m&%yL9@$mIb
z>|HCnrJK9NT;D#+4~6v1XqL^zl%$Rg4hP2&#*sYly@%CbKcjP&d!b3QhgEqR8~A|7
z`aLshYzE4<&F%s}Zl9bAWqtc2r7kjIqOlmgC;I8VN!XfG1Ihc#FN}LLhI|e5{hk|I
zKfu5FYyy&2rcn~EIoa-1BF$1%+w5y#r}vWQGTYy*VsUT=>#E*o1=En2T)Ga;gNdK`
ze1<-ZQ{)=5J@&I=EdCPTOycv=<zbo?QjBw|#y(K_cvb%SY)Dt5y`_F7<Na}!=Ut}n
z+ehbg6t9f=(8u>rW2#!>fAJ59-&i`-)MYk^0HjG|=kw|W8ebX3t?i$=bL9^|SN^Wl
zv^l23ws{n@X+L&ulGQkfVl2EE?z0CR7ZZM*h&Wqc_LO|~9Hdp#kUz$pD(pJ%-+rbU
zRy!!n>7t+7-B^rcoT(eQzXDj~+-_qpTNt(>D*Fcm792Yjy4iDOmb~H5d|Mth-lqX*
z2`sY>UF_F&y|iQ1PIP6TEqL4|U&-}treHF3ZG&&0#h!bvY6$GS`YV6^(3tUHkt1JF
z@FaC_V?&+7Ozd2I^}{L&r@I?Tmb|!gKGyepW=AdWn1C=!o*(xXm8>=pd!^ijS+08o
zg@V~g$%2Pmt%2{CPE1M7{GKme10F}W>u7wrH%e<Oao0{LGYD$kM=|{9YhjFc<a(s!
zC7>;H(<ts&Qo|57vCi{?`4BJA`VSS-IMgP=Q=5utPz%aJl+7%?z%EfIL=j}M*xX{x
z`#SeQ*1g~qJqL@?07219P)Q=~v>;2>^a6}-cF(Nb1;bn|4n#(GF%E=M0BRSab0}0n
zY(SdL9swf`$>7PJ4MJop(BFtLW{~g(5+Gc~BKsV>#LsMI*xzkVkiogUKJ~?_sg+Tc
zzW;D+uO9P^VmXNS^n3A!3U9AvB+Q-uA@*J1ZSS%C^d4|&{?v&oO%6p3D#RB%H6!7A
ze))JuFJ4hdE9>e`nyNM6tBxQ2{ygrePmyU(Q4wq$z!0#hyh<v!m7~T6wTCtd>dZ=!
z8ZFzu>8DW?u!<GYY5(nXcxgf}ffFVaob*9mzaMg4E_UO=<?CxjCVNu>Y?DMM{8c6s
z)zmN7vf?VG8iNqWvX;u#iijl)eW(yP`bhfRWVG`$X%*L*nNSq)CP)a{LZQR@mF8pq
zTE|Duq8~2_Lj!LBA|^6ld{<SrHown+hq+Ln>z3N{Ju+7m*C$E~ry2YSk*X}W`oeN=
zq^ab!1n3CqtNGi`UO8jhm$&$S62)DOsBsqJjU-Uh7BMhKS&&)K>FDrVb8=lb5Hu`f
z_~KQ)IHq1nN)LMrSiBD9dYAm9=*AnZ>xBtyx{`rc{sZ%6O)X;H1GV0g9T@aMi1^l2
zK%R`O{Xm~A1}6t2h>AqOgaF?5!6<3$<3tENpiH?Bxg{^+#RH{35QJWNaeB73@Id3O
zSgMFl=`Zsh1=2Pew7Kyl@>wb!^o-Rz*1FRylW9|Zzh(h&BoYhX>C)_?>E5}vlrALp
zEPx*1q~<y2THc(%Zy#~+MtIJtB7@D<XctUgGkTlmO?JB?1IM2yB@S>!d5O5~W234Z
z-;e#_v~KH^Cvuk(;@l>Py6d3(rUaJ%yYL#?25H@oHl)^(33=3tMGu)#6)3^JBu+?O
zw$b`$pJ)IB5Cuhb<X#yRCF4Ng88lJdesbM9C<L24ag#goJS3N~r8R<aIph_i`VQAP
zo7-c#nE(b)@|Xd}ZrTE)kq3Sv3AD}jTMGS8mRfQ6OEO;{p&EbdFJ;R`8(BhMN#{!P
zCQ@OpyBNEyXSm)9dO!S}dT;(Q?NY`=77;S0O4d2R!Ib(SZ(bt?oV9(o^_5Y}vYa-5
zo)QYZvyJjumO%M*kF5ahqUruB0UUdB5}VlBL8SA|y7(i+W_WYk1Ly%4#L;I@5Nc^d
z4K>IbGqS!lm4?_1GetO`@uOzD84!UpN~pGN>4Ks4YfIB1yi2*#n-^9IYt%#<m3L+s
z7l7kVB2<V4@vK_k>dWjDtWaAl=dq`ub=)KlfjcW(lUg#JMqz00Y#P~Q&{KME4G8$R
zuxp>5+D2t`7$<upeFoqPO7;xe*&4LT&2QGmac<Xw8iqemAAI1U@n+29S$iVHp|HS>
zL>n?wq4RE_(y`8b?a~H71@C@Fkl3mZz#VFXtW)Nt`fmJzr!_>{Gv4?5uF~iJ!H`#n
zb(T49(7ljZSbgEfCS^cX99LJd8zfg|PBX^%$WG7NW%~#f5aRa<r(jArSqX0KawNc`
zK%#AXaxskZJW%>fhc;J=IjX2Q@V*0g8q>GF91Vlzeu>?<S*$$=+Z)qEIPU{?bt*}7
zx&@2<J+O+=PqUNjek$R?2CE87^ILxi8f1`-4KgV~&hVOa%~`bBgUu$=A~|}zKpJKF
zxWeW=VxQbVWUFEtp6Sz3dj_b;aWUP|1X7EueL1Q1TDGy0U?OD98d!SvU_2`HCsJgn
z@S(WfiB-g;ucPM-h|0TT9sm%KT#DJ@=1~3HzB0H!(1`Tbym9+^+qaHD5{b84hlmXV
zzq~dW7Z^PQK)%)gBFz<Fj=>9W{$DXc9qOIl_~1gG*D<yvdAs4Py)L@)Z7aY#!C>;-
zcz^*8rcM2CSAV?s6N;tb`eJG<$-@Kh+Z;nfg<Q}ng&1`p1DD{t<8O%!zS4fYU>wzW
zWY2e(Cg)DwPsfnoj=(%zFzE57cSrVxS;FUw%GKErIyW91Ruyxcb^le$=<qG8RhbpX
zrF?7ICd8rl0*byt9%|Rpuy#Z4eJ$>&wm`Y`OsV&HO>f7C233eIWQ^-?y71Pk2T|X)
zrJT8~6CVM(8tTaK`JAQVLJ*2s>(X1}@s)krEHI^@x_^1`xqV1f_SNAsL@2;55o14j
zDUq!BtjHlNq21CEnSanIQiKUs-@<kC2VZ^qzTGZt*J1~JkmR8@gB)F<S!Oyo>}KHb
z<xR<4wHGP0S2p~LdCE<BH{glHiMfU5Gc;rie!v|bXob2wa%*E(E3r~&phTqhYwR7;
zlP%KL6g95B`&^DQ#1Mvc2dQreROPmV++CXIhd~wfkhNbBI);SN%x9<|WV!Ka#!M>X
z>!bN6pfa>GjXt#3+8)&^m<;?S^5M|WBrG^()wHm~J!_2K{FH}sQ+7i^vZl6m)9mHB
zAHck&j*-mcYqUt6a;=KLsI%+bOZL7}NIkUQ?-0sgXjRZW!;NcwkJ$I8Nl0$oS-z)^
z3y8)wD(FytsA$aN&AmZu_xLe@*}gKodw@TJ&eos$T+uz#eA9Z{k={Rf<RW!k(Z;-!
z5SEzv2=V4S^M}I*-({aXd@Yh(=lq3IK49(is){@~rEQI)(z6irEuM7UK9>BVRvm|-
z$L?YHXEX)Wri6Fy1h8KkSUM!$?<BVUIX5CKRNm=H&tBBT0t>E_fjwO74t0d-ypx+T
zB|Q(s$Bn18d36~mXKB!W<1<M;lC<Q{UyzHSw&8U2lxo?jXLY5JdvwulIX?b)0I1}I
z{r>eF_cGncG=!^~ZQCC8awN+!q|bp3N>Y2>{qdi>?qL&LTN<>Uy$1~zw={UWVC*~t
zSjXi<xR5hjW$n@4Mcq{Ac4s*1;`j!trhkEEu#nApOHXV@PQa!w5mEwhhlwO@pS4FF
zLp;rmSG*^*3lC+QI@@331a<Dc2l}w3(f;ig`tx7rkKum;@pbs#^<Ch&p_WyGII06g
zZ`9R8YmHLXX_geY43^gwCk4vD+~w<)3)%d?%o%mK%(HF$oK2RhTPY)N<`NuUW{5m*
z>3``Hv7N>*H1Rm&z%New4-Q3rW|rmBbnT!X9qN}xsfao_D{SvD(FHo}7_Z4G?_Xv=
zHGPo?dAd?64pc*FPS~m}ke)Yrd33MBTqwGx>pTY4MtIAyt;OyGQxjdCbGOf4A{(iG
zaD$jRK?S>C?t{9cTF7%bsowo3a)qV*L?>cfgd0d4DGxnx2>BWX;=dR-^0vGdJ^b~{
zt>^@@G(#<A5=`e%4R~mK_X^Gu?&c<MV{1#1;qd`mWP$@j6GtoB?edhQ*hAsMVU0jn
z)-R7Y9D;M)g$vW26I*XVE?T9M#%U6?G^Tuc>387jg(Ek&3}A~F{x|=G<CB26$%0TH
z8XElr3+*~<IS-YjjsukutUd9nCTue7&{otwZPf3n;B1mGpsrKqwsF^FUu&_7KEz#Y
z1l#jfzCREY+@JiFq0{cVXFJ3Sxi+{Qvqlo@FOQ~idTTzfA#jtnpqv%wX!kLOOb8ql
zIwx;#M<GYAF;{%3Wvc`I&TU2&D&?Ggo;kr%5YX}^?Wv!1^UdSZEH$m^4W_iR>1vNb
z(naeiO&6f%(`zwQwLS8p!AUN-vS@uSb;M)@;akh*A#=o@1kW3Gr@6slQpb5ji^)*g
zLpsRjdr-i<emjl==P!O4hX)$qsXmV}G?`lk@uMwGVYIb@F-CVUq&->F>=ax~TJRao
zhuTdWc|m9vqej({jc4N3am72{0VY`w%jWKWeFlhIqTYcx&L>ZlaARq{!n0yIMm7d8
z&#w0Dw<A|x))xjXaCMexO=lVP>0uREZhmw8_gcw}@puqEInOyNP@yU?+7nwuLyCQ{
zf(v+c7N3=C0Kx<p%=}py^y7vn8ZarXgtg^vpldYnLmsZ!++D`CReY7F^mZ4{&&D3!
z0v3<%bmbZ}qA6hQbIU&rAAGKqWIZuL;>Kru!PN?`KzOM4B4pSVo8P%hTgq}t{J3+4
z*dMaz&Dnb<jm1|6D!+5t*gs@@Mi-$xp%th}65ZdqhLquFiO0obOn8Y9pJdGN^!ILS
zE}2FAl@7eyk7q$p&h)p6#XUwKS5p9;Y_`m;Mk*S|&XP^rR$L{AW#qvx2p9V6q&Ukx
zv@td-QmDY8$95|>5dx!*(Yh~9N|Q)9NjGeB9_-6zn$F%!_NN#qIzrZhO!)kF?%Fx$
zBTM=6Xg<j!dJ}dli#&g;OT)y$NctT|t*P)pyaD*1_r>yX@+b*s`Nh7NU_k)lwsOF9
z9Yo-McN+e@VU)V0P;0_6ze>4N<l|bty5%va>6ZpMtOAW*{Twnp@UsR)u?^8_2u=1!
zq^(*waM15e<+@-qrSxWB^#~qwvFQsr?_-G*TnRcwNTbEcITHmtlJhY&WIHWR^gBIk
z$>hOhc(;0{w8gq8yF(btV*wpkl`{q7#^M0Sg+Fts0x(s7w*GVe_F3?&@h*+P7cYP3
z=BNSjXU;#vgg#LigZo)kYfqT-Rzn5kdeFPD=i9}%&Uw@V5!{-)gh3DP;;et?hOL4c
ze-!9Dt}RB&5ZkCvFA#<@IL~%ueO#M#D*h@TjcocoliJ+<J0ck{`jCXl2+9!Vyl6YO
zb{(d3r}UuQetI3#uA=dcY`S|7_Au+yQU~E=?Yqgq&18^szL$@z4d@RG_b_7CY_qP6
z3{0=Hq(cqhtF$}(r56d-XhoBM?EV65nIyxi3G_xHsw0{Q{{-iBD`>1_^S=bpW3BEY
zl;QV!N8`eQz?V_v@%)}0k@#Y|ON|w%%Y(_-L+mbp)Ro4l9c6-g@%o$508<8!+q>>W
zTg#cY%pyXc<+WMVl{fwpa|%>^xLp32H6Sp1Ktnvxq?}mjTPw3mWPLF~5OpPN`LORd
zs7k$waC-J2pSDmo@zku?KXx*Qed%xG>p(m+0e<JsAMlNnw8Jk0o`{8F^mc;%EhA{U
zgK`6C)sbkJd+}9AY<S>)wTJdzJ#VflopI}i5|@3y8?E00$ZwaX8R3B(UBVOuI~quC
z^}vK5kJ<uypx-(LX1%F<a7zbI;Ui9~KUYj)<3zLCf>kH?s}wzdH{Y$Yd%yiy?!`<J
zkiL$4RKSRuL#-^xF~GJ#HJ2HPCr)_6uM;lgNU(fu34imorVDO5+4Xq}Xaznol%w%1
zxuPar`Z{ju#&8Kc_;C}fRJ?2Al4?i*zMv|zW{YK!%#mQ*4#_-eE0sU*uBSD}8g-@!
zY|OC6LtB&#D{ik@fKaXJ{w;3(b_eiSGFnIk%=wy#q3KP`yYQth9J_60s~adw`XHt}
z`R-tHh=Du<`{V3oTn(|#^$l995Skg`PfQmN_+|<BSbz1Q8$M#SM>dK&zRJtHQhCa^
z1}pE8^F;00Hr1!Av~%%+qO$;s&Nxq7;)Q5bj%}4}^#i$0?AQa)?C1cL{68-jlx3p-
z1O}2oC5LeC^JO9l?IL#(fv>n)!~Ct1j->CmybIX`+1h2CaP9fJJ&^}wRf~X0Jtp#4
zxWW;nGZ{oc<NE_wZbt6K6?9Sf-kIU5d*prm>ks&8NGI&%JFsrXNx5o?5GA=9wM?>V
zMn>bmwiXnhl3##}M&D_0_IR#0?bM|b<cVMs2$7bXk2;GiE<rb%<DZAC)kAAng2PW{
z3~~<L*`V?7KD}A<Vc0R&fShKj`5-kUxr2pg;dI|eqAuWorF*4N^L`n;Z@FYM-JIA=
z&1)o6E`l=eLX@UNm@q^oU{K<IiHCMP1*Nk|sa)zB72xcUrODBzkU(3Em8%h$wnWw$
zCVs|A??R4(EbUyQ!v^)v{W3wtQ{xdI9tbH9>7riX^kEn>dJLHtYF<Zu;u$hgh~k>I
zLpA4ru2cV=yV@xMvql$0k@E%s5$U%oIN}V*x#T?^i_MC~ZS)oeN4jA@-3}15@}>-}
zz-uG`O|qlg`X)r1)==D_B>;X=<NLJfaCxx8nTvgR?e_BA?Z)hv3WPPG7ouJK@Wd!6
zi$Ck`ZEK5>eiTbunGD>Xs>w7&6Vd}PudX>b_}L)PY#m(tcb+$W$W)Otz2aImQ)Jkd
zfLSbeB$e;}(nHCQE9iT(=h{N{uriT{1;DU6^7NHG)x<{|++^-3yq>G;TZk5I!X@uT
ze48-${tHENGx*BpJjLY4{f|$J3~7|7D<CsLHFmI_LYlC)k}H-4B*<9`ovKdJT8V|3
zTk!ffY1@<2Z61SGizCVHXHEwQNOu|`nvj7i#m3U%nQ1)UCVj19IqeSI2@KQ&a_Z2Y
zSgCjIL>!LcHK0e*2f81o%#FN{@{FfN3krhfw~ZQ$WuDURgfZ5pr;Hd{Zr`>J8ze&c
zP12#D6TLEu?$lTF#E*aHYW`3-bzrJye2|!#V$fLZ*AlL_zWX`RdMfFVNUUv!#QRtZ
zYKO})Y9v`aOLp}o983U~wj_bt)LrX$^gG53>6z4~+F6<`fU<A_%R@+DV@>>}3IA*j
z{Z!YTX2gorYtxuORqK4^n(pB#q2mc*kk+|px6l4KPS8+nN7q94?sZh|>4V~348FqK
zVCb0g3J|}bLVHhpb5m=dH~+7Z%WRt8nmhi;Z3Isot&Zb7on8WZ&mJcIbD>yWD644p
z%+6Il!Fk5PG+jqjdY*~OaM)8&x)zxp(#od8&P*b>rsq1PK4RKJ$P&&)U9}8yCF9c<
z%*R=pFZJ7q*KSw`k7AMb4L-CgSH2O_ewCaRWhzwN>eC9XpDOUwC8?#aH^w@(OI?u$
zr7n$+7G*pDAY=SzvoGn&EA#q3(U4&u1QiEgYYf{TI3Po;=;z_7pkw@Qa@`mWuvKRn
zb83lIgK?Eeyhb|bEIa|cE}zc$pk8)}8vV!Ms5}h%YjD2tp#0!>Wi0n=0ZN-3=G2bp
zEBkxZ1LdE%7AZhY=ODHrIC~(s8^}e`cV-7*)&(xpsb|zt5>H#sIR9YW=Y7<+on)7q
z`hq^m8W>UrR4AyQhR^sB^Q6^+XoDg;^A{S$bUS~b^e6aJ<6l=@)x%1WsNQm(fw?IE
zTVn5D`KRF*>t4v1Btnkd@9DgI=4@rS#N<M;7#j<?E6X1+-0%0W7XB)W_*#J@VCMnm
zf9CLCHFvnY4ojmsb(()HCo;$2FQr5IDJOc4oM-<}d#b<W0u6Qtb@5K-T3s_EVGKz<
zN0;@%!0=FK^)1i1+1KfQH6qY1oTPR8c-7fM=6fS+c3R)D#v6PANm+1GLn^5Z`ym-5
z<~hw%OZHOPx3qT=B&unYQk}--%H+hrssxe0?7f;$*A&jd2NUAf3%UFpap*8Yq%y3W
zhu-b`DR{OT6xh<s)D(Om$L?=9;2Iz#StWn1H7R{mu^qWE^9FRIbFKxog>I9J4^l4}
zvJdP||3V-I6ZJnxiBI#xbh3UT3L$>OXEF}zOL7hDyO}&881ls>dK}C800h{{OLS2?
zpKDhQitOue-2M{l%KlJp(g8~p@H7)HINqLm7}&oD`<+pVr^p$lCg@nbz>0h&&t5cH
z$a{divD01L>UJ-IC4ikvr#l5E`U>JqO>>=xdYSj>d{*f}w#w`vh+%i&YmGlR)rmyC
zDl&-SiW|N_!i==s{*W6|k^#{pQ53;%Pj1O2H^w=3Wugez-QQlaHnt9{PRn@ucyLx*
zRc9!ZQ&4|z1f}FN7~D1Kbq+CA=J;nn96SFI?>N@7Qw`!4;AP(?Q>+<&if~2UGJ7Ov
z8BqUj`}rQ<URk-Kp8=iPEea6FhZ3{5@gX`r@+E)uyVHd*d892sk%gZ1mGa!0)#_7h
zr}q~|OCB^=4_n{|CHfzC*x=8Y&ra?rcQ&C~Ge4O>ma7r|>SfJNPjk?<M!k6}*R{5o
zNwIV$69QB)jLhF?WS}~z99dItr#`Vi{jKi?t)|}<<oeSW$mA-u&#Ppn)pxfsTpD|x
zp?2T6s5>+sUzHHZBfj<S$cL^5DWTYLZHJGmk=8KjTq@l_iM)KB;Bv^J5<>cG8xHx?
z>n(qL&-145ZKxqw<NE9}uc(tKRx(lg63a90znZgo%14D^|G1W(K>V2wRk!7X5<?Rr
zz0U^p^<Z@(Qq<lxl_ezrJdrl{4(U2LE$JslGp4*;&jV2WiQsaYpbl_i<MYQEm*ItI
z&f07d2E{c_2<S?A4*D=v=MmcFeCM)uaV6F{S$71Ze(fryUfCTDo-om$5JP-#0YuT$
z4wCky{Y(nNykhw-(dZY79*iC!prgNtb-$U;@;7<<&-+cIcTjt#;VnqmG={Jp9>cIE
zK_;ES2ONvGgl^vy_YUJm+UMYCu<b2+X1DTBJ0VNb&6(#mb$X#9gjY(CXA2}JlvNf3
z+sDT&yRu7-0iQazA14-`8$7w1O$xKR0i}4xF`yg@q8{&jlkF$v%5$TV@hQ@htlaB(
zI*8T5Whvw6RoSjbP<?Mn%6=@@@^+L{gI<IV4Zy8+JHK=SI$N)iTyrXrHwy7fJo0I-
zHxkbGUT{5gf9l4~CVCU~<wGQrq(_f*c8#v{H;j7XbHDT9k@KP+-63ze6WiYHGhwJw
zpR>RbTG)E&>m3-;hQJFNBEt5CldH2UEiTX)>RNv;fIPLkzWYJtb)#iVQaYnT(eQIZ
zG62!j@*WA#cc#YXnG(+6&Co>KXZZ+0^9_P!^BRu>pZ0EoCuy5F9-c>9JUmAOkP6Ng
zWXD_=Y5^>kzP3=nz(@`OKxdC7ZSP2yI_U?RKnh<<YI+$(SooC8x?J^K$l_*eMx*bH
zxckrztvgYhw)~Q<WS*=tgpFZ*>HFkBHQqDED#-*|JKh4k^zbL6G1}BUq`p17)6Za{
zG1@f93^yJHOFzo**@nRmiZP8>0Ysj;IH@JZe!WnWBbgX!EuO+wH)m_l9v|437C3~V
zdM3hX%ZqO+sXHiVK+Vb^ya+b@{mNy@PYdNq08dQrCx(3ueRiWVLm5(+41oin9QST2
zTU&IUg0uLQ<ht|lTyC^xryCCcil823Q>BdFK~oPt_&_K^3CFSF@7&3CA5SUs(0%Xo
zS)EDqB1@SzN2Xy9Q-?&CR`P)Hgok~ax3&8ym>>0#ZSwDk=B0Rl`#?GPXvXLF`Fogd
zH-^$X&q8%;QxY@=q-A3c@<1~}M(-E0fKHn_ufGMk1oPnq<UX!lZoW-Tuc0}w-NBni
ziJ|Vd{9?YEPft0JmE;~!+@wV3NFbU%L?gV1SeDGh!ue7Uv<u$Nf8F@1eaHt@UCHXa
z1=C5LpvKh`-Ahe5c$-RvJ0PzX@uND(bSs{=C9y24s{AZRz%t|T4M12&fw8M!Kf`W@
z{YF8FJVWw+mC7sA0?m=>2S)YZVS5eHOjq-7q%G?2kp6Ln1(9Im0(JzTidtqO^C~!c
z!^Hb@FBa`%>+y9woV5%5HzyNux!Ps#6_ZY~)e{SktCLe~zCJ?u@XFh0%2Htg=Of(A
zmD3GR*DH?dILvVua3#zqxsob`Kj2uai7c4JaEzx&WcgVUd5Qoe)owP_M{_@CVK1Mp
zijx@yVCKcf74wdT9*io}uBwUFMLqEHe|wUBQ!BvSoJgwlUVMs;6E}iDs`Ac!8Y|NC
zZQ14mJ>{|vwq}3UoA(O1aC+K|EI_4EIkz5@9CIAI!@67nITc!kwsh%keQ3L{NDn&6
zSDyFK2rT*ATt;Bek5JG$)~WqLAAD`f?h#w-?KM}FpW1LUqQHHE(9!|bBwKy#&AfEm
zb=;>{51D>7J~>~GIyL)`ZSdKLTF>hOsh_>#@(OP~OAIJ6nnOX_y^)bLszYo&ewKK`
z5Nn{NWzERsh}we#id^hY&RVa@QX9RZ`y}FaNDXa*@ZZq2FvMps&L%SFrJ~`|DsJr<
z9_zGU?~CeVGD@ZCnGxZQyO<cK{AN=Ygs40|qOktDIE8xCEZWbJ$ky`Y{?tv>(n3Ft
zg*T^gd!l|N)wwfgo~S0l@t3GAcryZb?hN!u?)gJ>t{*?LBd%kT$yIal(x>SVOXaI?
znh>}O#`jc|%QT9SFGS#FRmJelie+qJ`$Y(kUByfI4iH2`z@0WeWA{q1g$#S<ZVvNo
zT1DC4-6Y`miC{otYO;(nP+UE1vE#~u8v)ryK?|DMSTF&x?>=P9(m@n5yn-PIUKCTo
zoj%KLW~sMEf(Npi;B5bhV1-@PC9o$@mVg1zw5WB5VKh%)@87201hWMYZR`XqV)WG%
zY@}~<<5r=q9ugJIfIT>n_$VTiU)!Ad7{?pwI!;<}y-)t)Jcw^Qudzl?h<p5<@5ud8
zd*<y=&4dY~m1yIpTV8y-fC?9McL4V4Qm7}FrBOuPDC3?#HB`}8CvID!luTN1Rbo50
z)1T@OZfF7PC6;QxUTi))v4pv}W~BHVP0`ReCvXvJ^ldng;S(urBy>WVme;6mXr8fP
zsQ*4n;^81ul`;x@8I8(3vv<70OtKB)6-zR~sxd+c33_Hq^xPK^|Fn?-d6B7UrmA^o
z|8ZZX<Vr~Y9n$17tu?WG$4yB)M?a6LchgihUCj$Z_nJ`w_AJ#O{1rSeGgO0k@+t*K
z*5t{9I))<%D>-(WBzXpk-y>x@qr;3*K`W|=Bg?0zot-BxO0-e!?}lH-aLi*pV<pp#
zY$o)~+KM}07#1Y}5yI9v2P+m=u6)(G0l`aR_Yx-~@1UAGiZzRaNx!K7+x4+O>imj|
z6nW*3S-Zc=>&nnmCw<boc1(EdL#FM|HhB^=m|R~|#!I%L<lp{_j~B0TH8~8k;VEcq
z^p<@~>6{34$IpW-z<xdL$8X2aR+2;A{fR-`s9>O`aEk`OiP8}I_fK#c<gK}C);J-n
zi9}o=RbxzgVF>qXNbb|@4A{sCVQ5~W8C?UNIgDVQn<<!o>UrVSO|6eylyE1)VoJge
z`fa$M{GR+}Y!puZb^0Q%Bnsy$rAm_|6VJVnzP7GX`irnr3HBQ;82&EGLl*k`jE3&0
zc;FuEWDdaiC`dhSo1Bx!)_L)a1WGT9+zQW#z?+dWu>eq*FYR(<W~4#V-<$`z=xfvx
z3kM`wCX0qcG-lD}zZ|6Aiu@V+fb!lLB>1Llfs=zWJp8v`@WeCgVK(^FDu;N8PsJ*#
z`3H00MFS_wq_Q6gnc5Ve{@69xC2rC1ws9UXgZ1SHviT>fiJGJRzL72-GT}tN>VBGv
z4BNFRY6A5?sfW^;I;2GZ0C8kUI29f1Yd9CCcE%uf+vxQE%c$&mOFxd%k~G9u=NxO9
zd*#Fb&T@&#E)-V9$rFuimKzV~cM^K*-l`$|=&K}l6&B}UU{H(*J4Q51cplCNxOkC4
z16(;?l26k36YlyfwylVGc;DUiE|}EF!OScm;02NRijXLU;8#IJ9%}^l1l@Qw-d$;9
z@-W?jL27upspfq1E4Aw{MLi@4vFQfrO`ZXE27*e?L=Oy6YwNphMP-fgw&e7;I|T1R
zWZMK<9LFMAXT3~A!&^10*`#-X_7scOe%lZ$3be*`PSiRY+g6KDCAvrQ{&d=hMsMCK
z{00u>BX0zVg8T6lG|dRv43&VKMcbuJv>;c$2d`|rk^Y%?ugJW&z^>im$3&cteJ0Vl
ztf#i8^u5M;kI}A6ExCK`jFTU~hG_GWmdnzQG$g@AW@`wfOI{g4;JUz3y<6=!<Yo~G
za&J3VGS+Ca!y{#Z`9=(h1^(9KzGwc-Q)tTIFn?m9ziEd5{OVFQBP5cw$5;{ny8>R<
zjjAj>KbKrQ79dD~IC2=#_>=A4S)724WTTN^DU7GNxc&?TbT%NlByH}_z2-|6Q^=1k
zxt9vmg*^)O4lV9EW*fk-fRJ8ke7raQ4AS8qOvk|lqYb=I-$-Nh@a$5P<PwkNdW?Xp
z`{&!5kgWDlHS!c%KZbkZh+wWM(o1sQQ+d`LvCG=+$`o&$53|z#<yi2!Z9+Z8a*4>^
zt}kj2AoUR2C9jIPR3toLt~?dfx$VQ1AYKlTKT-o0dc`G+FwgEB%L^1?1mbb5$ZH!D
zgk(RCS&y&psxRU#Wflm$hlebv=rgLb*&yG%f@Ahj(*;T5lx-P}7*p7BV7usy?xMey
z85}1IExIyQ-)Lx{<A=H=dE>qzoa;odw9xpQ*o}k6<O%jH@4Nxcsmo!R2FqGc7{D31
zs(*ERgW&R7P~p2^nKvh9sZ^WZFseUn-G!}}Td$5wg!8xqu0o709Wq#z&KBzWJj(z=
zwjY#_Zo3liDt3ZUFo8AXGa?5HnD*p$tWY(Ez4-8=l=^J;`ib-74&~Z#nCF40+1nAU
z-{Xx2^4FoN@cF#Ee}hF3x@{{H>Xv$whkdI4w~S_&BwtSdDZ&(`CDaoz0NeJ?Tny$T
zndk9i^f`rQ5#y|(wV5W@XD1!nZt_yIS7_3D7$>Q<PH5748^IvIGM*Y2UYJfhY+Ffs
zJb$l5tDAx6qDFh$DB6FJ0beYv8}U`r$4G^?(osc9XLot63ygPX(RBAn8_=H{KY+*t
zU-QooHH!X>C;fgnf*Qz510<#ymnL&nStjBoEf!+##2Tc2Zm?`fV=7OoJ5ZQi0IA@N
zyYPf5<$r-et7T9!1p?;cfP%otEECRR)M0yZUS+eIs_IVFt$Uw`=_%1YC1AvADT+<u
zgC8E=^)xt4N#AB`c<Z#uob{ns*q7U|>T7U;Ud>ov=_>YJi$zvoMdaR8nKC#~elV2x
z?oQx4W8$E&kG6ooUa)y`3&I*d2|SBD5GRpN=G)(sw{q`gM+d#(V+@ki5pU$Pr&d-B
z(KaKY&o6#3L4nv*<1g(XkfjWN*P$E`ZW}0wU%{<lm^Q3n6Z;rEO&Ki71(8EljKS<9
zX1ZH_^7z4ls1;*U@<g`L-(z-3dHI(P`s;3Eb)9Ik$+-V~ot!mAgxSbN#x1iaI$)8-
zU%?c*O)97CWw*pW3VyG#9uF&uMRcbkTtQ^j@h7rCDH7l2?vz-1I`yw|I#d<cod{Rb
zEoZVtLl`vA;7ZH9bG0)NvD6kUBW%aqy*3;F-y(%HSDVEam=dZ$LD9TZs8cG;(6EYv
z8v#7zukl8;;z{3_tj$x1gP&g1kS&xt1;?#i;Ov6)?R>BO0nj(-zKbIG#QkpRxHNqn
z9FLB5-BI;Y>VNK%n!lh!bTpQR(><GSK(zzeBiPEvTg(MkXHuc|x=TMsQV9(S+y!Kw
zBS>c8)j`Ft7^A#sdvN>rE-Wqonjr6cq~Fc6q-KOaOfG#-(`f*?)h8+qKU&Qq?WzqF
z%jB${=D%A~E_@3wByaa%6^0*SUwT6|@pABG=Rl`$XKAPqv+JYJ@pCWm2MH<guy{#f
zn@EBiPfem3^>+rTt(<zGE*bj=_F+Xt*i+I)aLzoUV|6ikLXl)vg_f@|@nq(XapcO9
zx;OGGQ@IHRV-B!;z)*5&<TUo7b0*9jIXIfyNelr}4Jf-;AHneBIwYnKb-A}^)Ih+C
zN1Zcjmn{#@&D}Vnz?m3*+Wy<qosDnu21%aV-mJYDi$AV;62QB)Aiac1Ub$UhWRwzt
z*Mjd38Ss>){O&cbaoYC1^L^**PF56pLn|sC?Dg7Do-meEk{cEL#?#4kLlM9?GSXex
z-fv<fZzY;++3S#{?AFX=0EY@~hAI;L>LvA{+e`{NA0S@Sr&VX;Ml98C-f3O)SbXF3
zH30&rlV+5zSyD*DQzf|4oK;j$)2Sz*2Wp#TNTu)pM*l=)*V~~@lJ%*<KqJU=Cg!uG
ztqQ-<Xd2}Hof30$F4Fokbx0aJ5jp1QAOMB8O%^-;)F*V~*UQdv82<a4$XC>4h>nRD
ziy`}TQ#uFZ98uyicN89dLw59Jt7I8kIv^wPP4O!sOYEAoIVKNi8~oq!O<FCf+Kv?!
z4-NSjc>J_72&q`3ywP6wlIeTz!#A7M$~`Jn;cN8N6shda=auNHaaMxtgx!Nv*s~Jf
zi(D|Y+h5x3F-X@bg?u>tk5^R7<01&P378?RYi5h@Q($0{7-W{w0x7~depf8WK7Uz<
zzeNc~a8VdIyX^c|Q>NINE{ZR5j&!$}x{`%j;#ZbB<oy%G$4>T<Z`%!khX4K_ymy@|
zkwki@LPY%EV>9>J5;2~Jc$J@o?!y!H!;iu!z@0@CUR|>&IDIHj7B+(@00Qxy4Vq~F
z5ob`>6bQFy01SikL3K3LO!yY0rZCYJzg2Nnf>)pFKNgqh#Hn}i3I@TXLEwZFWSvE^
z<1@saA39ZFR3Pxrbt^~}o)K{$(FcM-d~JO5u{VNgR1F05!n&#fQdN(7o#RSD$MNq=
z7s_dIG>PuHSn0bC|GSVp=i5n|i1A)9HGT1y9wy<N<N%k<#2~p9?7z1_?C!CpYwvS(
z$N#e-;6v83mG|X$XstY4hySj_BtCjtPiXKq8-wluZ_&;FYdZe!Y0CONs~2AfTS9*c
zL@EDg`Ee43#QjVfWaP!a)$Wx@;PAB}=dH}rbp@bz^7keaQF8yxm0lFXIDO8)EB&XO
zJ=jLFusyJ9E)BnhfP;1VE3cZC!|cu0x{Aerw>W*}vmyp>;+>$+NegQw;9z!QZb-@=
zItj6Q@_%n?4;RsD2?l8nYa!rduHTg$p<!Y-`EO#(PU^b<+m*oCP4Er=lE$27RZl>~
zQWyIZuH|sfRrUP;9)klPg9`&c|G$M;U4N%MVCcCK8(;qSgM-v$9x#9$kasO&lrH-(
z%P{kfmi%u==(en^+`t_P)BC?2@x`Cd+|Nux5Y+#7*#-i#TRyD|R74Iq=jc$M|4&Z?
z0qM;`0#|ZD&L)q+KmXkfZVJ#7`x2tzHJs~a75SH{ze_USpS>c0kaTfK*nCmI1ApMk
LTCj?TR<Hgaogl>r

diff --git a/media/images/gemm-structural-components.png b/media/images/gemm-structural-components.png
new file mode 100644
index 0000000000000000000000000000000000000000..3cfb3f1e4e61a1efc57e6282ee2eab5e90f21fa4
GIT binary patch
literal 245863
zcmdqJXH-*L`!5O>*r3Q(L<I#@dRKZ!1*I3INexPGq4#P56&0kH(4|Q4y+lCip@rU&
z8bT8iN+57%Z2Nup|BN&4hkHKUn=#y)Y)G=!n)7*n?OAWsRpltiX~~I*h$s}~Wgig{
zoe?G?I#vA_33x@H@>DhWi`e;*+&!X#?rSLU<dnr-mAgbl#i3^opPUBI$sFW$or#EU
z2oe4e&ocNX5fL3{D9GN`^e|eTBsIRMbvbA@f<FB3zy9{3IxqXs>gLyw)8~n;o}Ok;
zdw%^=-pCnpj$n%Or%s)^`ur0c8(Tf+BiX-CrL)|4i8<=2jzg%Ckv|a{ovfoYitx7J
zA6@P4>hAV)Zs8ri2|oP49_n3(YlZ*y3V5QP_m}X=f4#W**Gm}jzh3h=)r9!hOGFYU
zX3hWo8vQc|{(rv~dZ&u!U#|toU7tAnuh%{^{tYFZ)&G3Vod19M>oxKYKlP{l@eu*X
zA0i?cr~MA{UDn35`jN=Bho39=_V*P&K6r0BRp<Grz(Cad;_q+s8UOp6Bs}lxQubVk
z(lKp%>A2Oe)SP!di!y(&GwpuoLWEkTV!8DKGi&SUerro++gzwLlU9yq`06T`_W%tF
zr5hd<#W*|LxbvF-9G&6^$GJ>JxL>7G9ACy)RI{$As2`u}%H<NbH79mRLzzjaC$u0r
zJu_1YyW(oLIn!W1>KHC{mYp4S;mVckH*P%JSw?MdZ^s~Dm2I88aCT1ZybsPjlEX<S
zet+p1zu#9<^{%#dbRBLbcWY25xigp={+O|wUa!4_JQ9V>>R|Bq;Z>9Jd}V5$IjW%w
zdGH`)!v9#rb0vHBQRTX*Sh#TG4J#{l?as&&vraw9Ec(mRqj3Ki1NTX8KKm&PaH6zq
zxWw(l84vSXnRS9FuCl1WNEBY3i+SAhj6d{k5KO0Ff=MF_8b&F7&E&lZ15{Q1bxcu_
zI@!5%$gn!HEOuexJ41Q8EHOr2FI<mxIz*S2Oa2^#y1<`hD{|U%>1|eRhE?G7hY!ZN
zfl9Knu_oLS5(dwopJ0+SY_2_hyxvqXG2vp<fC>+rJ*>kXt<0^39IRQ3ii!@IT)df@
z+AX;_J3DrdNnAYZ^E65p*(%Gh`#h7n0_7aHEAi(uFG~Ji?euKC68Wi*Ev^o4iWMhZ
zTVmL*^ZfH;Gp6VN@2}YZTN}#by1&1qEtO?C5vhKPAOwAe{Nj~mj0wFZLIb|2NAY_J
z5wSM^*OrNkV=rvL<#Z+N2j)G#Jx%Ml)2ry_mg2M3&RXIyyX3S{pUA|?Iho{y<KuVE
zKRAjSocd7X+Eej>Z;M5QiJAF+KeCjWgQI^%6kD~|o+NoJ-x?yhFm9iv=;A{CYZWmu
zGU_DxY|&&Jh~6!z+q#Dqby#$4Z~q>FMIV<Wb;|Jh9Uct5E)A`uAAB3C_MxcAn2dtr
z&q~tH*JFu+Oets=7_cuTIEP3Q%J7fJf9~PDJT5AzA08XlUtxFEdqBZ&t4F%lY_=)m
z!i5W_C-PLcw$Bu;??zpqr#DB8kH(=_%k~e@KKLyXx(`W7JXeKmqrp0tcX0S1xpJ+(
z2Y%e}PzZY19Pgj<F|=B$MbKs_GMXEv;8qclx+)<mic44&Wc}LGqT4y+q+9P*p5R+S
zGW(~-29x|MqyZW!uO3xECpmZ<_R`WbGTtO3vmbpvx$NXO<+;?}OexLP*x0zk_WO7O
z4*qxR@6UGm{bT<>s`7Ayw|L2b3oJKo+@<$ky**mx_z_g>(T@#xkCQ%p_`7yV-=#D$
zEbK``llStrD;_)Cd6H7%Ix#WvKPT<SS(%Z4343<Ic7JQZ36&9}7)mdhelL(*iaJ_F
zRW*9F6dvt|_fooZCq;5)QlKa?HkJ+I^F0dGJJ$;rFPf@7%i7-Ejd4W}wJ#!IW`j9e
z7wG8h)c#z~AD?jTjRU{>b8h_#<*`b8UZohGsM2n+PI@fG_wV2PGn6d$QCar+Mn!`@
zPc$yGk&zwDCwT|8$uX#Gj&=+*SdW!iZSBp4!mtHTzXt!0?|!tSL&W?T6m)#zMq5``
zWJ1C<v`x_9c49O*bPikeH0efoVxpZt=|3v~{7dBg@1pk4%l}_#;p$9IPEOaXlCE=d
zzJ0)X{!evE`Lw^Fx4J<bd8;#;J7Q;Tyt66rOvc?8Bs-t%MI2@VTsEdu7P}Lf@7`@3
zdd+LQa)Oz~JozlGfM!bwUj63Ho2!l<FW5CQ+lrnvcX{a)KfO<A_$j8Z-@c8wArsWr
z^8PCGty{hH+}9-EJuEbmq>=P0i{#cHqUWX^9Ua{Q8?r68uz{o2ZS8`zw6u4yd*8uY
zLG#_N1CRBDN~fj67cX8cEW+%gS(APG>Hn+`2k9on9kK^iqvL-=cgzVL`i?@zE4pZ2
z2oLChaW3`MS(@2;DkY`lI=-VlYNp2xl3Un!R(uxS*Q_RM$|b)_^6~Q%mfa(`pD(*k
zK>|t|(<`$zq;Ic~p%}%)!O_7Tm5#^b5p#=}8&@eBIT8zngFLatL#-`V>wa7z^94(q
z)h1K^$N0)f4lP9?yD_FHPMwOZKg*)(@~nBvDaMIayT63J`3b8gCB47-94)k=U=quR
z&pq8gpSI1!k4W+eK5@d?43XpNWV6I+23mN?D;Pf?-+Z$FQP^0y4eW2bM~}iWC}gW<
zBD60p(A3PV9cJIaF7xVK)Eg>Ry$#VC*lkwSoa^4^6SBYl`q0)UFV~C|+ZY(oM5cZG
zNJnX&m6g?*D)TDcdN3!mqdejqy#!mR6z<bIT0zC8rl!@07Rz%Nu3oj_cxIFFl$A0H
zRrhUfPUX(yjmn5^?Kf}UEPA?#Sr#@fmX!&VzT-8l(X6l?y$SGGan_$6UKO*w0R4I7
zAz?Q7&W^6guCw{C4cg4{dEGMe%hpwa8Bwu<pYsG<YCN~iQPXfZ*)oS@s=7=U0wyf%
zyFi{56ciMHJ&!~?5h@07$=}=J<ncx$m+0xCi>MIKT0M334{`o?k*ZlJiAuY1?U^#9
z9j(N<vu6cDLpfirnj)7p80@o_^0$%uD<<oh?d<KL#Sq2OKNsUTQ0-^Izw_o}RG>vy
z?2X+?_hgh!##m{O)cDJ|a`J+=K@ZN5dx#l68@|8ss&+Ad+f~rrVb~|CTR&H~cFw(u
z-Z_g?w|2R15<l|iZTBwxss^8ztfCe#Lwp{#gfiIUXdgGMmUPZPBc;FPn?dc6tDSG%
zRPg7Qh=NIfb*dTX@Q8?o{iWm>>7%`7j9}M9juxlrM%}hD<YZSAhgQeNKdfT&>@O4=
zFx*#Eq6CE&ToZA)BZXULR8UhBHUZW7!lg^mkU-r79RtTe1CQCj%%2FI@VTG)_ZL=J
z1BevU%{rqM4tCZ+j}GilxqH%kK-jV<)q5Ap=f2KGMowPw;72LFefz+)Hzk$NZS~cK
z^XH$0HeXea<GT-fwfRtOFg54c$ADcWC8Y?^{%c8zy20;-6Z!_Jedf;%Xg6LSk)4c)
zXhFc_&5e%sB2S;1?-(1*&Cm%&&#zU=DNWY6X6TlhFS^@~SEv~IVzmfNAl-JfWJgUz
z39|j*JuP#n#MWzNn2<`1E81MmQQOuwPnWbKlHDX!M1~<NJ)KEGLE*MmZer%aX|L&A
zokD1+h}`s?E2{tgVpkj>2eUh$_%V*7_1=}EYLw@Oc0;@SJkh?x2dfxwk;L8E=2y&&
zj51(*tUX*>-X1MBk<+d7C<b5PevW4L(|@{<1Mh!Vnc25~d$Xi8VlJPmSK+xFEJPwV
zSXo<7VF9wBv+7TOBS~%#icrEi;oa);`U$5_L^yzY_HcZK<RG9v$Kp+hR-`A@KX_L}
zkkCTkIh0o3m{>*pCEPr0YGKhir~~2NUh0XNnYsRbd%H4==raoGP+CDR>D4yh9<lb&
zgHv*K#-*xyNyTmfaF!2BJk_#?__ynVuN}7Gj1xW*iNgPo$^Z?SDjK#%P=u~FA*S9r
z@cX<Ess(^hQMbhO4M3cv{huD1*a-03-y}*1N=P8GVSpB#r9XU0#^;AaW$j%2@nInj
z+j+YD8K7J5M5f)X+MhlTl}hS{{X<hfXWy7O8)^I!R!=c&ZvUW)reU$oVY@%WdA{k4
zph0w)@OdIt8CBI3A3XMQfAw}^f4PlLoRn{k<mo9zO7Xv;Qs6{{%2n-qh}r+sU_W1W
z#5;iHn{bK3YeCB{v(Hk%LQh+}0!!V%bnBM-;o;#b{Xg3(;mYrAB?Oqt7P=4~zf$tg
z|K5cB=ANyV_m2ttz`!5@wY0d{ktFHewfjGQaHh=4ft!;P_TXdRH7ilk>Ybs}Q`h<V
zH7e}JSwP>)OpcCbv9J3cWII(iiaB}WM7rI01p(OL{^OnO51j<xoJf)Fx3*pzuZ#&i
zb6N2P3B~HeX@{B5#HguySXZLB((~uf^Up&@22Lv~cS+F*Sblm(caSP8D?2i`NurUd
z9QLF+DDD@8nW-=1Sc=jyVpodh3cLT-TxqUF#q`)OzZVtbev*id$=~1KhGAU}HSV55
zpyQcp$xwi^dT%*<dDV<E49bwhgzQRo9+Ji_<@oGxEeg>(oI7_;s3&X69Dum~3PbTY
z+^B@rMBN+HOc*S&Bp|>*x7Mp1Q<t6J6)&ivR|&OKW2eR8gslhIJm<sYOaa2`&(|0B
z4laFaVxn@T4pa$1$}!dQii+Wpkr%Tyv%>+h_npEv=oA`F(mRGUw4(bn-gd?D%QZDO
zuMs*=2`E0L$pxMH5iV0+(^x5SJiY3YFX(0MZEYWxmo2>qL~%ZDt0NCD@fvaISJ;Me
zXyuG({5i)HZwUzTJak70EIpc8^SyY+X2hAx-O<t9`nn%!JgJCh1m@>Yb-bhD&-1Nr
zcnOpIplxxq)yZqNvpUM>_)V5Svr&<v%zCr0XJaqI08?~wb`flteGjl4v$k3O(N}!J
z;CSjEA3MWFyGSSHQw83#1yg=u`|D*07p3%J5sH)I1)xpkpN;=Ryh-5r-67;vRHBxW
z{f&fdM~rc_=7d%*U_H==0bOxWA5bC7|5!LP0>6GMQoXpinD0r`DJpAiS|c8<oXAro
zB=HSFFkbkfQ}uG%TV;knr-EqW{jdGVd<V3L!|fjF5*Jke;Ss2IX5YVk4Nppfw%n7E
zSx9|FACAMKVN(D6>P5jHAL#I!0l^sGKY3_OX>)o~C*DFJqw}5i3dQE@OIJQY9BTyX
z>im!WG!k_e=I7f$BQRYZDb6g^iboG*o8Z8f5;WO7OXx&k8|)^0?D3SBf1Ta7##1v<
z{bFjD5iX{(gwA=qUN$phTsdj~=hGqcG3WxdL?Vy6|Jj`gO|Hg$gT;BNJ3Qq&h30-!
zCXf2lr#tN_cV*00M<|(Z-fW_OB^=9V7JT-qP*<KiHK%r&9Pvg}R1~w0k!J>%Zi(zA
z?s)F^SA~l!>PgAgJ&2^G{ojO2vzfHKi!iL+iS=`o<i@GWY&#?31*6BIwHYJpq(?CA
zZ91t#*HO51%L?@pRTO7q<6V}CI)~Xu)!$pX`FwFM-n6O@^z`)nZV7>!kmT`=42Vs2
z5?gJI<~2|__Ev!S^HSC{xc$HP)gpDUlo>H`b%`6+8s({>A17#&Sq7aPOL`=L`F>T<
zI?_`@dVih@HIxrCH8ma4NK9><1L_(gFUG7R(oupduk$qz75Jw7{-GK!40o33E?;H^
zAlCWN5A9t?Xb{5?f4iwOqLRlHSB2!WA7v=-jh82VVuTM<ohm6UMeK^X&Cg|_VVz;p
zA1kF@mOqqP_T2+p$`psYX5;+r`|t`{ESa2|BlckFqOX+e==wx;Y4*+$Sh$J+kgR6^
zxoGS6|3_D`G?-lsJYxa-toq<V4p~!*#{$@RtD_L5N@)GUN-hk1ozxK0&#KWpl(p`y
zZ4m#jZ8=)o>E?*|A>Z~hfsM|l7Nl+I3K0wIwG1D`H|mBouW%RmvKpEn?U`h8J>G<o
zExV!m10A;6<pIGIU$2r`hadY@&xb2@)i5wH*wZUfv|qYh&+rRk+qL*ujeR>rk_#6a
zeTPj9mA?l?EO(>{K|s!-(npWSD(pD3v$J<JEta>jE4hX7)6Ps3%`2U@Zab*ckITgz
zkB{&R)k{ecpp<!IFsSXk(9muT&S&EIv5(Yk2Us*~1gl!~=B5LvQ7=d-E2gBoOX)4(
zheW0QpNr7;eT8y<{-&{eveTTC1uJhzPLiGz2<>TnL7KnocALOD4lX^tH%R+IDk`94
zij*P}jeq~{okT`5p0`GFXn$vAPzi7WMo_VD{!@j5&;B>5*c5CHf`O`N_WlU|^hU6n
zs_KWX*zbW8uEWNF)`x56q>m?jBfGdXf2vJ*nhTs%AH++T&2WLqdodm6i`~5r+kh=c
zW+i!PSJ)pb-@E6+@X=!@(Pbb1?d|B0-vs|l*zt>osN;hT_yQ^`Ia+wyM<XpQP5JNd
zV3|dUxvs=EWc428%r3eOLwK7ZS2+c3hCk$WHF2BJLZ|AzlO=ZUNbj%Y(tOpc){Q|F
z7}kzyBzz<uj)C~;PI+t#dag!!r$5cu3QvsUE|ofX_;jbGeUfrI9>P4*Gp*+2?4;)P
zUgfnkSI?xh-g>on%2|e^63LYW4910OEZ?ZUM)KRWe7}iQ8PYgm`y}5BLCzRI8?EIi
zo0yI@clYp_560-*2x@6GMBO2U#TTWuJb-P5N?Vn0{+7ZN`k+8v@w?Rle}tV3K)
zyw!OawKcl8VcMM_N{}<+u`Wl4`$KNKjN9~gQBDi-1veHVGSJbvPNmv&Zt)~pp!Yv;
z?lK0H`L{ewM06*t{oo=&eiyN$%}?`u&>5jKS?V#~r^R%prcj{Aa_HFEnORV)6LksF
ziBO5axTr?5y)ICCdzm--JmZ7d25qfD>n^X7r(oZ9#ga6EYrpcaagouA36pqxqg}jo
zxMOess@a5E))2<xL65<WIVoB~W%A_bey}c~V{o!)_I#?7>#HFrJcW*8t*TDjiymxP
z)>M^RfsK2d%X04n>qIR>Kb(1XHG+b!Fmi{k@WVN}@z{;R$_Cy~<<+U>r%s*LgEva<
zP9}ybJa`Zk2j?7FV@kA#LPInQwRB0O#xzLIRvWI<Il(6Q=e1G7DX%cKyDUgAEc&K9
z24y>zFDc%EsGK&|+tnXeh=GkM#?aekIPcnI$Smcin=Iw#FU@g?R<`S!`*H)yy>D2P
zWNn7+`zQx%=qE=5!dtyMSv!ou+9!xOrgbGrj$@ABcaOIRBU+u7>i$rF)tA5e9Q}jl
zeCfl@7um5ZX{qu$A9SrA130mMftJ=f)I*3OG$=A8oMr7mq4Zq6YQ5_!^JRl^jl&ns
zleB5ri#S$ub905vqwUT}e)LfI_Eo_TnhK>yX7Z+{RR%s<{OuLc*e8>V#!sJ1NNk$z
z&-LVobBZo534F;r?vlv!*QL>AF%6lsdaV-!WL)KKj~cxi?D4U++|<!XrdH)(Sf{PL
zyu9Ct?tMAA&X;6V>3(?Jj=YiOD3-rQ@^O*zGt9>HG$v{al5d`$YG2R&yRHWC0vt_v
za%<~^)7NoDYk9Tix1BM(F|n~%ki+V8fP>BVNFNLM0;p#NAjH{gBE6V;ZD@$8S*DV9
z(8U}x3%z5`)RKIE-682HbPT6fu1@&XS|di{p^{W$bNpD5f-l+Izl3iXN~1Fw8u$$x
zj&T-bVaD6een-sCcrhB<OG8+$joUc?zpF(~oj%=8=RR>mc*5ZY3XRV(tgXl%SWg=d
z25nM>paL{DdiHDp!N_cPeR9$J_c0I=@IQERZr@)dOnZWx_exw+k`;$oX4Yj$XImTJ
z?$_zMZMNlxeu<9@irU&CUs_sVm#8!()@B-CIPE!vyZZY;%*`_o@w?MQb4i!A2VJq)
zVMvS$OeoIJ*f`}Z4WBFygEGN=E_TZE*ApCJ=918aq9+wNbn=a#_tN%o)6v|>xT&}h
znCN_HinP~f7QG#%2tVD{-Y(c^j$g9E?DspAa<1l;ZEe3k&)8K3Rddnbn)2Rgw@CIi
z&qUj7gwTnbw!EX+r%w5^=IR0=Jjo73%tOGuQC?uJA8`HO0r|4vsQ+jB*rpL}O7&I;
zr&)VAbBSf2t<})#Jy937#-!kH^Gla)>yHpoF#C1x!JMc{Bhr)URXclv?_BpBN=}gk
zwIA-6raLWg0O{cJ{7Y7{4?t;+0^L%lsafU={0e973SUHY^b>B@qoLiK!c!g}m6N3=
zlU62OYQa^2O18|hSbn08+o<0)iW9Pnmz9%)jRTQ9jyz8<V=!iUI#(-uyu4O*MaYg(
zhcc1t#*NghI=ih>`snl*#U*?7#3jCy_o%+v5+t;8%jIp6UsRyWdH4qra2EK4YdXW*
z_KKmNmp{6JcQ9A0y>P@Q=Q+4igS!4k&4_LP$2@p@pL>Mf?YX}YV>aF3yR{Gl(L*06
zKFZN#Kgc3ii<uo6d7S;T!uy5}XDD5c<F^RW4NXYjt<}g<4UeSeOzygB_I@v}b<M?6
zeoVR(!t(z3k<pc{0#619K*mP_a6)T8eVR5}vFyeqDyn<p#0e$=fdS1lBf#?sKFe0O
z_{K<K`zy2gwy?$YH+sNu?3t5&;_ho8=C*3N_>np-_y4Q}*o06B3)^|60y}0*<6(k8
zN;-AKQg<S&_b$E26XWbp%Nx>53Ap|eGo^L}qC#%gijTk46uUAQ9vf?m4fck!s~;UY
zmrCF<oCGeM{Fkr=VE%c!rOKxV6(U&TZs!l=-B71Eb7|LW1^N=E_C8{E(c~+g2$POr
zoeU1!pcF*Oz%yQ97XdD@jFA_Lncc9aOqa)1w;r&9bfBQ@s3l6+pA)uuEzG<NoTX;A
zQff@JLn%o#*3&tW>AStaU-+GI`%b&cN%JHKzFG(3s|9c%6CQ`<uk35RC)2;s8N>P?
z$OG{D|CBQ~1?7TZmw6JnfjVFEfPb5%N#>L;LgPe)sP@OFrAyoI%ve}i)f<j*&Zvp%
znBgFp>(%UM4=LVG`R-1#1XKYUQ5x!Xw7)c7$sziea5AlX5R7v5eS}TV1~VRq5e5gF
zk)GZrLn+B5>AfRBY>|IdYmT7RP^kkaXD45^3)YMvlqJ(s*P_{-r*1WxL(U2_D5=%;
zy7F^zDbosCo8qSZkL!IfeRAe_r$E?cZapTzvOWMsbzGY4cd42&YH-ch2hT1tQV{n^
zWSKqYo|K6vnLbk!D$rw{RN7@3FaWb8+5{Xg5{Msh4J3DA!uHUn=Zc*CIt2#RvLvus
zLxFkRdhJHMacO@M8sJK{Gncq-`BEU)$1Bye^BzCJHORi0s3};1hu^$@{SH`YQSkhJ
zyJ7H_wiOm~{R=a_sWSW1J&EEv(L9FM|FFRIUygr(hQsE}-8j$@nOIq24J4;z?%h+q
zrH&fz<f&EGE3<rp3#cR~C+E}3d3BcNDUO!NsMamN4m+fuSqS|2h019^eu&_;)%?qU
zA>oK=IMaQ=Y<nQ4rs)H@Iz9C5R9CLV`eSJ*gwcFOK$}Glx7q<hv9(&-6W{PQ#2fvO
zgc6(#YM=lSbF|T=O5cMW;8fnT>P>kjxpEZ~{&lj}J)+v#LP1@<NbuVkSk0X`Z$?=`
zjf^Tbk&b-*`Y-QmQ^r8Q<Fg&PRXSDuoH#%jnUnL2p?&e9i~G5b%2zmv5|R=U?!?_T
z2`c9u)~Rt@<3MJqRc2kJ^zE#(=%F7iw}~O+w1L3=*Q=N2fff?Bwa__U`Q^>BNrlh8
zlhyFLSoV0?djm<Al9w-E>doy?sD>xQ<@*~S>mE)KjW$42eRf7I`fFTmysi6shv5%D
zK8X9gQD%iq*RO=`TwF3WH}5#ZTX&to57W@~7}ua#sC~aA&tFxfNLaN%5*~v=BOzex
zK|_;heWl9vJPA;3SKMv&L+yHv5<!jyF9fen)sMeSD<>}_F-uI__+I0Jy6L>w750NF
z&;ZKeH0e65V2nDuzlR>qmlGfNBK7pzxFN{0mb}0l(c;g}d)9Nfj#30D!K>Nby{*Ta
zv(4dQVK@5v`gT4!V?5VKia&B0)jb9+_-WF#iPdY*<{*kKq?&X)=%9$l%F6Euu)vlT
zJzSXVFD=NlhH)mnNNSjgmCYI%89Aha&3Jc2bEBi}IDhVgfQWxfgkZB1tv{NWHTQj+
zcMz`kz8V;NELFP*;psL&1)({Da|0+7#j5>zPp_)|$9nBLxv?=khGQ>nkN1}tXl_4!
z2~KE>gcR<Om4zi9j&@Ncad5BNAFCKvw2ZqJCx8}gFQW%SAM0f(&ugh9TDKvrM)Nbh
zLH+47z*tbA_u0Jb3>UnT)3^uBBUo@>KxOZOJE%-fNEP9Bu&q_9M&(d$*+6Xpl|1=y
zsX~938cR+heSBCd`sQSV-0%UPSw}4XZ`J;v4V+Ev-!kj9tI#3qOcV;RKOzyjXME0!
zT-6KFwZU8ydBjo_A1#qYiyCT@X3yinhOUY$7?<!x=M7pqu3(CRzPeS%J>kP-7*iIW
zP2&Ij#S4TE-W$|4!_fxcTF=!;sStK{c5_MbQR7_kW`q}{pn8XvjCX^Ts)5#uaMXd6
zpi*sQ<)&4VBnbWuH*P$!Kl6f8*+IQI6?bh}ET6i}6Mjl9bDY=Lf4bJ)-fE;MI>GS)
zwGB;AMb@SF1DgK1r}f5rxoqk?isdHdAcY!_PUNk52FN}z*F)R((V29%ZAPRs)zjXo
zco}pFF_-7RA$|O%EmOt2t6fa*&C&Go8(P4?s>y0EU!DxHZmVIVZr#wVnO48XU={fC
zWh@>JaL~{%r!AlsxZ{eqfN~t<P%6wgaTeliTIJc7Hrik1s9|%}wKs{JC~#@%vhi9o
zB0|cS<f1~AF6TR-t!b<`96(DAk(F)0t7R!lrIvHVVQw>nljn0|!l2&E)thN!KlJTe
zeqvyH<i=kg=!oJZSRukaPY7FT&BbtFruR)wN)7)+LS&?A6Cy0?gjrJzBQp{wS2bGg
z;C$CbbogM+i-(d<j44!dCzb#UR|az}GDEKlcWWNF<y+LOTHcDMQc+L9xEikvWcS1U
zrD-H_P}I0iOiyIpoBP+r$JMm+$GE5cYL&cp3wX<|t?v8m2KnVn>oy#$^XkH-j7ZMe
zvSlct-Nx~)qb|}<4t6}^Bs||5c-y%G@r`!qQ|-xazr~G2A-fO^dbgl%XUqm<H+IL6
zAz9;3^5-Y>bTx7lt?Zh`l)Sw94Ey96J~qE9HJfX3$=2p>)1!ah6)TQ9q`cM^2|wy6
zs~Bz^LaU{W`)4UxTZdphvh+Js;0eyEudy}8Y7V7z;^!V8m?tYPbsOd_IF?8f(sbbA
z4z9_+b@x(jD0K8uv)TRK8$3kQQ4v&Z5MMzV;H1oXROwD1S-VQ+cOBx;g-U_s)XI;c
zKu&UMp|Obln=T<MRD5<ZV##K9@ww%79Zpe*L*wbpLe`5Do=b^aUHm=rAlB6tTL6<I
zNt~pCswyi-<`!1#b!eT53YB7bvesw%H?*RPf8r40Vh9s;&dgr-MF<YZs&A`F<4vb@
zRAO&6PCSSS1I;7Ou3DR%G`J~jc5xW8!MQtu{7TC`=CJ+ktM~lD#&KAZBwC@~Yr#dp
zJ`H9$;=b5rSK>H#1HB>Hs<#x(GLhFfh=5Uoy>A<pTUfvnV~|$Jy-q2t&)dB9z17+5
zbHHs@YUotalNSaq51oNzcZtt)%X!GMkDIcFx7<SQ`8%3Yg|V`1mKa0rPFh#{Z^Ept
zJvi8|{=wbx`HJxspwfH2%e8#eqM%>}n88(`Q8`qjGM)3z?;cN082FEtq13EKx6Y#m
zvP+c{MEZV*#oRfouAKuH#X%9%Y)AY4fpey)>$w7wX#w>;g1*#X)S{Pr8{&`00<X@z
zML=Q{m@3Z^cg_dDd)GxN#A(PNc&mVwhK&NfqVN}kFD49i`Sj%avQSgc`bUq`K={2?
zO9G36=JrVL8lVPqV}Rn^515y}ko}Y`t_Cqoo<sYEBp@wwJf)7x?`=g!mW3W%eEihL
znfUdP=w0#BykT_LiLBb(j105b2*Z*RfqA1%yNSMjWTI&MuOMMo&`)mtnbq=>DG>jF
zQVt(s^dzn(7<{ZO6F#5<FT8>gUz9eK1G*DCP$h5U0|JPwh6@q}?58F$f^F$K*T!ny
z3*#0AD1?^u#wq=!b;?HLsJLdXQ6%Z)>uK=->DpTsIP8j2dow4qbqbSEHiO%0Qv0%C
z*NG#Chfh&RX_!&{Sl!@18=yB4{yh^_c5f1B&P*&UE#OlstdN<997zQ^T|jyh@+F$O
zd$J3N?|e~SQ6%~VLy$wNmZNrKq*w-EGbvG^bfS{aC1ydT4^JH4w-KhY+c|gl?%hYF
z=7>Y8#~3uQfjM`lybDpe;O#oVR#`PNIwlC^z_%G^^ekldq}KUO1_QEw<t{hnX)Ptf
zwHF5N=uMebZlACMyCWQn9)>k&ThR+xe!!rIdoaX%B$5wPp_4VhNeyGTM?pam1wKq4
zv<($$Nl8N^kJ;1vYn9W=$C@aga;NP+eL9b;zI45rF4cX(Gllg#@hHwjH?Tc_h`H0{
z6Ls6&;+chy9z8PcNs@H?<MCc3{iWcyJhK#_MZAfYYwo1A)Yj9*ZorSD8+;Eso}DD^
ziVeEj8p^;65)#>{lbeRX$J*C|X@S6l>E{4~fozWR;*<68sLICWxg2~4K4d%aYE+J=
zmwn3j_id{7kH@d?(dQrKcd9IOM5#cUyXnMSKI9hEbYNUX^#QX2xZ{?zd?E4j=`)ww
zfbXF4$DXK4hOCDrpCx8{2%H&~|8~Ptp2e(B*0uwwnTbuF)AQdNzsew=N9ex-CV)U+
zsrgR=J@Dzx>NJCe+UbC%K8LhqNI(}%SPh4vF>ZQG;0ZpPjif-C_uko<<^>SrHnr$1
z9j2%mV8;x@T68)TDddFhZ3nS6>-XcrA_{&(8c8m<v@gMh?^G1(vnBiP#Qjj|^#lwC
zn;1Oj&l9+_3wj8V^z9l2#)f&6QrZjBpeOVoM<@R#P+nNCja+6OP8im}VNtxzuP7_!
z5&<b^0cOr4LhJh?ilZ+CaVA0<h3e@MFU~+EQEbpw2MWi#m0p8R)#-xVofS?_3@lp%
zw^6f4yU#iJ-1<Aix!89in~)#M{G;K@xMd~Jqa*jOg8;B1dXiSo;$Z>~uzz6UJ}_rK
zk{v)tOTOBAE1k%n@Y$ScJX{dr;ZeoyZt(U<9poi=uUDIo;y}7aSsfS5S#YcJZu{(5
z1<<C{jQr~hC!EzT+h8!2G_0KB<2`z;yKTGE$BdHRLlIus4wU7TtZ?y>X`HAt%yz<~
z4d>kxMowL}RecazirPO76J`iklN#mFff%X)dwN)5_b9&xJG8wbb>vZS_R6gmO+Pr;
zaBEhr$hA#^s+IOOUVprEaj4{bq@bQl=ZkeEyJ^42Euqu4cA+_nFd@ObzB(%Y36Kg_
z8_E;C4)G~A^umZ}@KoJ__)i>&8$LBb&NovYf1nj?S{Twt>ocw&*H>2`0Uua@VXHIw
zgKDB!=a)BBYwSM@i-YjLoP8UNjIU0W=WNsHV)(SKt`z|o()fXpFjsZ8ZssF%?Pz%2
z{^IzfOyzXVTy0%3*BTi@B?FDoognV9r2Ms!{))~=bYeAUedQva4ixExcUSgv3_QN?
z14Z&_J<M?tuk584l&4n*aK#liM!67|!v>qcaUktwKl~WvIhB|WxB?(NggA91k0CC7
zaYKyk-m$7(&2-ve0_YpANHs-8K2{9_(3TfvgZG+?o&12QBh*et>u_YTWHefAR>);o
zGjK@H%HZsK_5u|ZVy<B0c7jirD-0GN&ygtZ9)17qrKnE;K4H>N=93q6Mh3OFhR|_7
zeE86*le;o@NppG$Rf6r{ES!fMS&2x9h{Q%X`T*CV2_e_N#zXk~*ZHFiDFEq|&&0Hk
z&ZhKPmib%V)#fxSzk@6(<zE1DPQ<kTv~kOe7bnwQ(Th%vr<e4RThGa9hr|z7OUZ-|
zt^gN~N|Q&Ezw`OQNi9~HlOeS8lYrWNR9VsmB9Le<R8k?hJvuhA{X#AO*RW`h>q@jq
zNOeG4Y?_)*<ByP5weB0yFJGPlkkOw!!B5N%RKvyF!_&pUDLi5CY&%|T^2!QVe`Js-
z<~rX<${=7OCY?W@cjGJk_(&h%MAj${&8Yj%I-NM`@vb>PW4Z7z_y~^g-u;N(tg)R9
z`ABuRyy)@aHexOfzCCi_A*RA$k#7!crj6)UgP8jis%W9w^fTn-9hB@g#-5;hvW%>z
z-Cc6-7G*ugDssl|F84LRq>m!G?wW|?=>2)lKof&MtOj9>PaqWr{vbXP@U+juqV|yG
zgDF{}TLLo~cW>nvEm`n<m-gPF>@P=CfT9e|F>b&Pkvd@qbz*0d<ueDL10g`&ylZb@
zECy|pQ>F?8KH68p$mVmIPTSbE^cGR>bS?NpP|Tj@P$ZF42(vN-M@(l*a@GnLh65xv
zz{nw7J69A;!YHVmeZ!O$<vVEob*zlM5V>o}iMRGZ(nY}pzvPDQ0=tJXEG#Sp0crlE
z=c)6el~#Sw*DarR8dxsd;sWydp~Ju)vpN2f-RHS{fGjF1iYO5AEpaiTjUQUeuH_JR
zUl~vUzP-UWPT^z@ioimndOcd;bVuu~p-ZUg=(q{Cxn}_okXZrwjsh{3FGuViCpm;Q
zs`uq<cr>cxI)1OV(7JHOA15*4lCO8%?j?TVVKu-qI6)Du^zvib3rk422|p|uz{Oib
zFJHXKMkyuoxLX>YIyekunZkmNS)0SWrTYE-CB^Lg(l7S-rEl=rQVnZAxIa&ZJD%;b
zkQl^ib!F=Q{pOE)YdSFtCY*0<rVSB>2Go{kaEVz+mj>LR;kGs~w-;^hR<bKQBb2OC
z4hga}$eB!GN=r*sV!aOczGoH+EY~^CJ)n9mMJ;#4!wRdVcOE`e7x6kF2V!8#MY>ky
z7Lx2~5V&7vVP{XK3Tz&z+`_(u@Sf+vTBS<w??6jHc*svAHdAIfqmi3qU9Rg3i_@81
zb@x2RhjzJ8v<-fGXef2K$^9mz!1#St&brly(MjsP8Fr_<h51aFcSq3^%61bOhO&4+
z$*7$aiSK(d{lyx>?QJd_gD3d-_>}J(WOP;rQ5*m%o#R7oQ~9Q0!IB6FYQB630dgX8
z_|6JI4p5GbOrQ?mHk2x>Db*GwQI&;|0y`oZ^4>6}n6sej9*c6UF;1}=<8>hr>L2On
zyNwVw>rYq6EG)BjP*m*G3j7@$PpSGbnGzsVR>ScA!S-aPJ;U*|nv#<6T`szw?wuI-
zDH>LjmSwZ}7hk8PbqZ<=-oLxLo9XL)d6>EDSUUMR?chCMjRGt$qhzz5n{3|KEC&Q`
zv~DK3wDUEIW;r`W(Gdoz)?aB4;m_<eDYqU}{;b~ohL%URJ#{dloV>7~qy4gxN2=~6
z5P1aN+SI}BhJDT^hoLzLJBE^{tnhttqiF3ny9cb6PoLNb62?G*;W)<ClTffSK=a5f
zEUYF744C!FaX&objJW+|ji9vcZvYlh_yZIMAk%c|DB{<q{pHVH19h=s<muB3d70C!
zu@xq*Qq}v5M_bt8Z6+zH``^BuYv-=Sd?+v!*GKN^b5GUyrd^YWecHflnZ#;cT>L#e
za(*hO?sFI+rwT;sOm>QE)&W?s;rKzQ(1#Ez+*J=pm89HoznuR?-0#o>2nDGqv{WB}
zmo_btL5Z$h?CkBBXAv2lW97p}oFJZ9jItToe}0DN11W>gEqKiyNQDxB-xjE$AXJhR
z1H!ZDp?rSd-{q=~`bVTHp(23DA4~_N^;t^wH#OY@p^Gk@)Z=^io}2X~)%U}X|5i|z
z;L1=8lpifQzqQ%Ct1#EHq+p!#*yJvNJJdj@*}A<=E|KZa$2}6yYOggb1vD@al?ZJE
zA#N3j%yS(>*C;E+W(2K~U2h8UpxgIkmwkecc8Zh~*5Eg|X;lfGREBUq>q(ZL9y6D+
z#dT17kf;ViLpd}*8LKup5c0dqNfM))9@={C`@pS^0bMSxfyW;d``S97bMFtLexi4Y
zMh5@GCn353*0x?uAtLgiuXmau#M?oeD3J@klzas=HL&GWfmW;D5lI%)CQti*(U-f+
z+HCC-%lY#efW2c0-hn>8-+WSP?p+Q+lagQPSV(t4soQYf(<`r$2SHmXR!O(=Or@Xd
z$-dOZ1EkgY^RpK&gzJP|5HX}(9Iv!b&Th)1R@DNr*6b2=PDAdX`c+}5Ev-Y1K!D!I
z2NZ<l6bijHn65wt5@8=uXufRHlY)oWsHjX@E;edh4B~+RF>rqt2WT0XFv^+-BuB_M
zgVhCiX^Y8u=NTAy@dvwLs7V;sps1#{BqRIdlB%aibLrkBL|>~<fbdGZBzYFfQLcVv
z_}kaF%(rj%(FY<y*O)JaAB6+ZI?fni-)qw8b)f^Ct+lW;koW-aa;{JP9N51hmn;P-
zL>ClQL)z**ofnppFF*FBkXul^bLRt@;=-bNoF7n_CtNh#$tWp>@pYNVJcjNK@lk-z
zIWoYZ5+<f#4MF>5W)>DOD-Mw6BVgYjWbovAdMD&-Fttj`)L@}ObqScF!kdrh2>6T@
zLZofP4@*%evy^0d3JSr|#aJYHwqT-?W*i9<2%4IaD4U}FQH$iLAD*(`Oa?;>h?pWU
zKQI17qwC>`^^De*EEO1wOwa_cKYl@M)Uc34&bi>t;bwCs0Rpu>KaJD9IwS6)pRZHI
z#Zw2S6^V!fdYtRA+aU02t6TiE`b&%T*IpvREDe|%>&R5m?{e`!zGgL67Iv0iLVhb)
zqUJ=aS3uCrZHXR`{bT{QLy`AQP;g?ja<xY#Z&SMnRsr)s)cX{h9&KJvM?clQEdclQ
z3aY-5YnbU+%`||7#-l7%I^-~U4Um(Peo#J25%!xm??LOa+Eg_<v~KHw|4(?#y$5Xs
z4Ok2!gTzoE;203e_?(^}*P3XP-s@)VrBaa2jZC;UY$2gX^lH(d^oU`Z7lpEtqa!78
z!2L`_2B`JPZXHjrpq@ppjUNkHEY;%d8}^^&=~uR|oK`e825`Ms4aj+_xyevygihEf
zR&plJfI7|s5zoB6h~PKzBB>5~AouPHa3X|z9jt&Wl>rPW@XZ{70idiwD`Z&wG*IGb
zZ!XiH$&fMtnc4}{E|H#l$FB^@b+9yB0x+N#qXkm#%76tWNTdk_6jJ*OZ2poYdNPSE
z4#W>^Xc2wU?sdwJb(b72{U}Q!veS70d47YAj_QUdBv>}|Ah0oX;zwbA_@K6DCyR$-
z;V*-NI`+QXcPzwImf-Z>>-wuwT3U(w`F-sZ*?AF>N@^<ja(BcewEgq5lVEW10OjNh
z9LY}LDp-ZiYmMh?<wj3Zy#aF!pmp5cS)a7wkUpu}?+auzjuFW)kWP#funHe2giO<)
zS5Q*oSFs}U2Zk;|0*v1<G$A7++h_fw8aQzLINKmrYI#FcbkN#LfHq%VKPNpsT^}*n
z6A1!++Bi%#<dFt{mq#FZ-`099BdD|e@kvkpSODkg@8?78w)T{Iz>IKGl9IevPA8nD
zaI?O0aZ^iAcQ?VgJM0L5FwXdtBjDPofV>!p4C+=pW%!=?tXp%fhNH)_{JT-TmjW;-
zRUoaPcW{7`t94{Ym<6buaC&PyQq+iXrI`evd3Ch3_1AtOBH9!F5pHqN6M%mJi8?Ye
zcBj2tK-Y3tQtOFMPZ!w6r^;mW`RwWQIn8^AM@O5yXC5Q2Y8WbG%1s8{hX$~v>ceDF
zACbZMXxl=NB#T`t`|{-?$aa=g-XaQk9?7YrN(j$ogMB_qiBwz!+4RziRK05HjW4CZ
zfb0a{MuowFl|o<`bmNzahO>)czQKmUtZE=zqZLCKlc?XFifE4j#u!hjxcj<5=khV{
z`(N59(H;69bVY<a{{CNNWMMg4ok~$03zh=$A615PJ9dVh9;M#10^)mdiT^P)7t;O?
z;=RV~G^mxI;j=IA40G<uX9a2c;{B;X4lNFE&FKjJufYo$E+}K~Gbh2hp(P*89P9)_
z-9v(xzuj7CKTYVLof|fLo*;(Ka+ab>-@&0M!F|e;5TnQ8{GN;yJ>hehxq}>5>;~I}
zzcZcl@5IPRCc>y1&F@L0NLz5y_qgy5Tx@J#aNRn3Mf(oD*i;74tn#Zs99gvxh4x9o
z*US4H-i^EUB#nuALF=0)?YWK!#-k%qU~O?)4dw(6_LRjR8SI>&_O?Jqun-XiUcPdL
zP0|bVp_RcO$aE6~Gi@Kpdn%ta&4A|x*56G>N5@RcstEedzbGleXz4A00gnKc<6-dG
ze1_u87b)n>f%{M0u*u(%c>3ip8h-P4s9X#Nb4b4Mv*HjDO@kg0pw>^>{PgKl)6JPw
z?W<4ANqtf#c`2p#(t#`1dc;Xg6tIh|H1)LabaKX<ZcNpen6_WYU9vdQprFtWvJiYA
z*<aprf{BeyJ?JbA6M!a3gYH^W1Gh?rK07ZT?EwtN2z0hIMXniQ0j@F7Aqm!~sFk+W
z9SkUcLg<|S-faM^O#!XVq`Vl&s5Zl+k@-$ye?H<-t(zTkn8@YrCGK>`xt7erSqqB!
zX~$MNfZB=jsXHPfBG%6TI+OrjfagB5qF$N2I>+3$KA8*VEgy75j&5MNIjrGKEYRoy
zO$uSqSM0N97eKU6-q!Zr;F%&EF&I1+^W3Nh5M3H>0C;`8&)%&5qvEG!g5Strn?HVk
zi(lexP@FJyf(=-L#d2FGENJ5gR*DKZ5{M+^s+|^0x8~cOfH4khD9D{_4UHKswSY;f
zPY6u-v@^%ZgL<n1fhb`PKt*cAX!-cmNqql8RpNW#1`Z4Zl0jSmoeTd4Z~^XHor7xE
zi6iCz=VVuJiaIh=#SF7-)Srzs1A|?fZ_k9=!ws2u>o)5_E`8Xbn|jLRk7cWs_qdP#
zbX|=0Y#mtZDuJU~xr<=P`?CH=+Nx8V_9Z3fl#GpEV-4BS-eDjds0+gR3$w41D_S1q
zWu`7%%RQ}|Z`#pL7P--IU?ApFW%$R~{TyK#I7|quqWUvb0#zs?d;!lbdHR){FcY$>
zzt9I}rub~e3lf#_wn+leDOo<`+M6u4>(_OL3XHfV?X5Y1h8sDQuRpF49Mo`RCAcC-
z?<orw01KEhDa{h$6cW+~5qsI(STTj<w?8LG!a$gH^kX-nX7AQ}VOMruJ7Xk`fP<+V
zFooK^hpQqOxT{&UIke*Um-2TFH=Jc<UrMf={V_R$cyp?+&+9@LN(l_!Yy&-4u*U+d
zHA2K1go7>-aO=JysAK#+w^_MAQ&kO}G;BR_@+5+fptBJ$3TAD5xXvga0-y3i#4-be
zanFjk5+`=cbwv|QMkQmt*TZYq`-h1qUvYv7Ilm#B73luXcw&F;?kGS7o^%M<GD}U5
znD>r0+VNcs(9C<h>^RKc*BmpRMrTLCkAh>sdukNaR|J(=Yc<ol?vnWtOe!&~H(JzB
z&B%LAu=<zswxG8Ail^oim{qZb;wLnI7$mqWzjQY)9fOBjV`Y7<^3zIHYN{d0dAiPb
z8up&nVwN2<4IG{|998YQ*L-QoY=6aYbVJbkWoLfnQ00S(V{d0?{K7D#5_DbZ8vs`e
z>D(b~s+o6WR4i?Y?o(DF#Ua3>yJi!#U6#_=7RH#ryHje4Sr*Pvpptx3w>(uFefG%~
zDl1|kBj!OHu(cTpF(%1#9@6-ULbYV6#Vfh=XE?11mTn%?OPJjI8kriG>H*sC?;W;5
z4mCOklB85MdgeSdsIZR`%Uiq3SE@{TrB}{+uwO~;psC`LLoxtz=<-8v5W6~IlbFp6
z0K}pq6$eL79`<<RP^mO#zS2ss(F>28UH~^A;3o}`IzDvvCJ&AXiYX^AC1Gm@9Fq7U
z#okaM1Ol{F`{^9x8VRcZ9Ae38M#yonP1J!zh0U~mK=z(NwUe1M!#O%J(<7-Y2Jz2i
z1rd%Ik&X{HWV#xnwY`TH9&<`1137ko`~ij3@$k-l2q^}SH+08Fk<u?SfgYV9%AUf8
z|1KANc;p>!;G{s4ttU8uyE<7rZ7KP(#2oR&Mm+9@-I%O`sc8TWC%N}ddS`#etBfbj
zw?vl`{<87^f<I`(RU(q=4IaGP>#$}to%#H1Cvpx|GDj}#zCO`3=I=X2tI`d7eClUi
zJ_YLgN9=@Vj1q6Y)%%*=c7S&)j~0Ewg&Cg*0&B;p1^RYDn(p=R2qb92LW+p^+5Y-k
z`cAjwjlo?O|HJQDWtO)ie~1_}z(BtL!om3=sHub&ai<uJJN=rA+!U-i<Jn5*9&3Dt
zsOp6_grL-$?QPEP{1qG?R0$+Zl?A1YyG3B+QI`;NB1~D)An#<5G-9f8!nk-aj5Gko
zhv;V)=TLQT#en)cVUVvUXybeKR%iG+)k-4*T~Nz&yyP-|XM`q+Lr_o)j2p9p&{8BJ
z<!-hUXOR@<w9wHGLO6(;j6&}kLrc)3kJ>F1)pq(gdVykEF+}W-#O&N>7buH-85pQv
zh<wG&kHqWr^ueXMxSH~iuP7P#Lhn8VKs&lWgAq}|!kzy~$^%P9@s*VHRoh6h3DBeM
z%UeO}rrxgzS!P8AQZw;j69w+~R)Lt9ni^%1k;T0{-ymfq=BPFz2n7s%W*(j|dj9=+
z!@`F2K;7P+*9)}^00svL<c$v5xMgB@$0H`>{aYJ+NzJ}}NzTJIaJK%~Wu)h!JhU%i
zZ^3Ov_ILpL2`0>A$yANPz;@srgZsk?V=FJGtGGlJZ&J{6NZv}f&lLjA2#()@k=?O`
z$eh<}SL0ptH)SI^R$&mQSV5V6PCR!q&A7l!yEzz#2l*+)!U25m+nLhoY@|yqq`_xj
z;~dw@AtA&C#@l|3pSeGL1q;o%(F$xH*mPlM?o`aMkvF1FND4cku_)vvjdeSAy?ILA
z03)bcNnG=8#i^k4M{)`Pjk`zGOfI$Asf)mPobVaJfm~+XN!*PaH_WSbYT#KaOQai_
z<J^+kIfD(yXxAqM)psvvUA)m9j3+1>`Fy`$s!S+04kWXSU{I}^?Qdw%1_;onjDRuW
zUo%2Po7}W|1a$04HJo<;%(g4&g9M+mZPI<(Zkl}a9PPJ$4j1?lF1PM`%T;q_HG|P=
z=d1+Zol%xeA2ApF=2wSpFprx7SlZ4-3#&Vin>B$-`g8C}RaFQ<H)}4L$_Q*q?pgEv
zw4A&8`4uZ6L?uB;7wJjYZ^0TE>^%l53ZYuY$oyGzLmupxlUY_(x|Cngw_i{Ng7fBI
z2(+8pM_^PMn4u3S-mG}vRNZ-2*-Lp;)>LXEo;SY0n&j~#Kk0l{CCeW$7W4Wc6C1W_
z7yZ0h4+`Prbtx)|2&q=ul3u)Ok_l0kV&x65@W^%Xgzko-q?cbU?hz3|WU8ty|Az9A
zzl6=!0%F2OI5&i)LWu6x!Gg*Nvj^Y?3<A&Ytl2C$`HBk~e<nK64sh>%5m#8Z6$}W6
z=wb=3=9-PecMv*a$=eV}gck<FUY(=k018WSnceu%%jty7!6<CAP5$A!0L68isE7F_
zXj9jRzDd~ceKRhjC1zmy(z0l?pmv?_?jgXN;O;J7(}GNS8^r=5Yx8qynEip?GHnmn
z@F{y=DXgG^^r0ip4}Az4wwci}=2TJy86ikB2h2@ECOT4yw|?N1SQ+`@3rZ<AfMT8#
z6ubuJ8AD9D3xMO9@o1pe+7C4ov>{4!X^_=&zH0c&Wt^ItdSUMkFq}V&FMAV9iduu<
zf8Z2DFXtkV5fy>ND&u_$K-)Y2r!)4J1OqS|gNCo>$spQO121f8w`#zRV%GGDr|wEC
z4+eL+PdL6B00iVz5y(W^l==wU40Sa`9V|Z~r4WVy^IUn~r9hyjDBINhBF{^jnPg6Q
zzAmRbhV7^Wk?gbeCVL`poRl@UZ)J}9@@0$XMXC(F!zqbD#fDL^L@B29?IH3`ATE^4
zC4AiY?uA)?5^b3Oe0AP;xb^<YDryc*2PG{_3SsN(<EUK+FL-%JO#xD`dbGV&HpVJ{
zBCm6gpu>q&-vY6Z<t<^th&(d$Jy{c4EIkGXC*(;J%M*#}!V3IBx?YfUzp#3dmOpcx
zdeYwqV6_DxPw=Dj3Y2JV#kRZn5q3Z>u}4O*xhCsLBiXs~Y5l)a>m&?G5D{(4g2F`D
zm>}8MkXzM^Al!oiJlKi_u4F#p%&_lrTc2RB_udtHB9`$)ShC6uK)`sZnQVj3jlJ)4
zDt`|PW*QJ1;El^b2>AX5TPa0wXP+!q#e1vtxp<ALOO<kbe0i>ejkg@1SYf&B^bB=h
zw5bXvCPSSKqWltV3&0%t-Ad8KOlsvxM|ioF$m1A8{0hd`U6MytI;LQ;pmp5UAIo$t
zYiXmVr{<lw@8?G{Q-(Dz?S-59@HsF~*F*UgU7^JJErecj3`1<6QdnGbw)QzfQ7zU3
zX!i?wrC>6QV#@~WDXAcXssW45KkjzcFqj6M5q0t3by@a%j>bz84mc9P7J?)dX{mRA
z1IU%a7Kt1bSp%OQ%1D7(CjuF!(V)GFG^U$Tz{qqHR6PDHL!iu=f@CI3Sz+0?K%={9
zU~VcCVteSs%v4qunXNu(J$Pm`N6|sP>S%UH`E9893rkh)=Tgz)8<pZq`JJWR)8z)@
zDobkx2OHh3UnhgVHQ0#gH+R3M73A|ZJQCb90E!fH_#lP2moT0KlB0+#GZZePL*$4W
z%50E&RFmfZ5s*MjeM*wA^uk&rb#Sx=I;0~tuDO!o?&9`SA>hIvBX<|Po+80pu!C`q
zeT8yhGb<<gA9;Ecaxp~ePCsu?rJiPaYdybmDx46%YzX>P_I%AGRMH%$$Qi1gtG!m1
zizZS<Iz$-t8}Ygpx_A;;Xcy^6#Tbiv48C@w!6v8BE4=P;bn>2VZd5WB-X!$R5Ue?>
zH#`9BRfFj3T3DT3A_>f}uoFb__{_VmfD!LksFPFoc5jz+)byLxgGs}!maF!U3+<2L
zHTOX8*n%{>R{MYddO0-5GznOxz^Xr$L`<~FR}irW1`we<S_Q0oiOOgYQZVrO{&mNI
za5yRRGZ9{de@LnDPKx^MZ64-$;GR5+U{O&{867NqT%1O5YBMQ4E>K|BCTn$ol&=DT
zhg`XR58O|~2B$||;=VD(vUiH8K^~HY2Bu_>#P&O~AdbmP)@I}2ehZ-fdrk82=vQ=s
z<wkw}{Egjde|UB9>;B<=x3#f$a8{tWf{1wB&YBI50}Ql-05JzZBNcMsN@VqO@;L}z
zAbdL!(Vxq0?_zzzE*P*2A@{Jvis!$~DqH!eU6;B-ArYqi#3c|r0EW{RKq$NiE>TZ%
z@F3(GyYQq-1d7wJ!mv}ADDo5`?8E9s(7P~#On~Q(9ol6;l?bW_;4mM-=~aYGgPA1`
zz}Xv6Xg^z^Glk^r<Q+5sLAgeEF)9cT2W$nHaLIpiA$8|}4s9DLH7fyyRCsX3AUr%=
zIkuVl@4;YqnV_>_KuL^~nz1s7i5hm83TIXV*wbE6>xveEDuaZ>Po4C7L=es(ri_&6
z^(YI#*qYGVH6i5i8VZcLnt@4<%tA0NVFt>&X2%O1Bt8I?yG|O5geRe|H9x60CX5Uh
zJ&{2UFZcsVW(%C+rCpu8$2SP~$UxODHw38yOW?;tP4<TZ9x&Ydw<QSKS`{3D1LOE8
z7b@hd1u!R#Ff>7vK$D3jBDA%Eo=mv_Lf!(t6kLLqy?5yS_MT{@>RNq$Kyk|o>qzvu
zz0b}9(8L9>4fuQ~AtT^k1t4Gm+t+dHRbK*$2<1SZ&oI=H3?P(Sh2K)1921`;kq3B3
z<$v+^)^Sno@4omTilQPaAQFlqNQ06BQYz9RDQzGjDV+ltC@9@6Ev+<2ib^9e!q7tw
zDWLRF_gT2V=bZ03_uk+A>o<RFU+#_DHEVs==kq-8dW>fM?&VXYhc7D3H*3KChWA$n
z{MS1F(%QJ3{7cf`jMcjT^Yn+7j*duYoTrdPTW%EI8a8%Ckm0QosYF6F0Z;X6DChl;
zb*qkBR!~?YS`$D;nDTxOA%&3`>ix2VX!f8Eb_0wHVF+Z;UIry}PrQB#l~shVD2UHE
z+}9Vbd)8^sxT%7ru>y+ig)`TCl9oVpg%~(y=l9m3!)xzh49_P&dWt?6IeeD@1G3j=
zVXBC`_@b}y$=hLKRZ2vwu-$?<E#a(1Wxn`Jeg>sWy#;TJ`oZf$AnJTC^}@I*_;N-8
zG}KD3MCveK8yj2cY^olzUuGx6YG$cPLmrJHj>@_QT%q8N9yQcGf^+;Md;fkkQuoF)
zrStDx2dd2eY=i>vAEYjaYOeD0Yj9Vus;PJB%vSyeAufc;?E={pXERiO53D2!JGS<A
zc7;{@d)tt1wI2<x=^Ku2-DpS;pcipyqUYNz$dGFO(wTF8=65k%%JuygX4KFU?0_M#
z5~IgS+-@Q6E@kq+3;m+h3ktX9O>nO^Xq2mh1np1fZE`uNK$VP$<v@jzL6mqW3I}Zm
zVp(4Zxml@bYHS?6B=Dwyfm;x227qS2$!xF{yX7rfu<mBFsLrBacaH+<tdM4dtHHac
z`>2rl&uG_0%@9sQpi=&&<kgqA$Rt!^`Ppg@RT|1Y0R(AFb7qz4E9~Y!hQ3Q<sjz4u
zF>l0P6hgLg;d-4Q`(16!<D+m6mwFK<XDvz$lZ^of!W)YXdmT~bcSu0^tExT1Jg@c8
zje~H%SAVG?$xof+j=lK?8~`R3&VIgi_t!uPpHW0kp%p^sFf3D6?m&^0l#!jBQxI`-
zx-I7M7YX^>n{Iv^hy++1RcBwZejAZ^5NH=6R-xkEMKO{6?lFWpf%dQerJ6qf=<L8E
zam}5L27@uLbj`#ye@a-He4Yu0Ia*x6GsYtP4{SezEOr&jsLlc;o<~OojF}@nw^mD@
z!TSwR*}9jNo2b}Bg2s%+5-361#d9wzU^v2%YBBM6-7uoo2aB*kBPokYA}5D-elZg2
z^ZwdjvV`?4fvENQkrR`dN$5hEKhN(#m>Ax>02G|zV850HoM@If@mAEmytai(rd$#i
zq}oHoVzU-?nNXo2XOVg`4Qh1P!Rt;#95>Wv*Qm;${`~Nepc`QUOM9!}i2R1Le!X&C
zl=-rbio7Mfu(R_uoxuAZ2o$#rApxxg_=*)363lKUl;};!UIFiZeDuZFwgys@#>`+7
z+0`6osD_uZE#f?il1uEeR*(&kQH{PyM||`4Z8#k;f6XP{dNV$Qa9PdZ)>Sf+2=6a8
zS4T%ny=aHBAQVXAP7gS{4A5)cdHJK&hK~$53d|&p%)MRVMMRt&n4_poaWea-E=3wy
zYFnOU0e?4;h|R0Y@dp`0v&77Pi$AnM(~pEl1icC8F)~C{p8!eND;i-#fM>dk-uW$q
z!R~UAi6eqANUiZM$k8dv5Wa4W#2Kz`+E~F3{%63VpkHDOx9aE!upYidOQjP-@eV~P
zCdO6@4=clsFjQgR-i!dBtn`1kKl<b-V;mg&q+G0d+$(^+wLtHxWW+Oz25D9k*pN&K
z-Yi|Gi!AzkmK=3@**PGAiubYZ!yTk9InXpl_znbC>5D>^RhK87*u7TGW}R)?1w>Xi
zJ3rqH>IiP|CWS-L5+6x8Q>C&7h+A)gH%9_?6iD8aQy=b^=1{C$FAGo9&v=*%WgI9;
zlg-4sfY`FhU^x`QrKcqVxjTqHkyK(&598VLmZzp~Z+1UJn+k#E+vhX(suCRzzjrCN
z?C*|0{25SD417b?8-LGpN`K!dfp?>YfaD``;H_-_Rbi)v`xPKVhqp~bcUYDq3jrHf
z*NA1v#?4-(fyRD1$Q;V?5@i%BaB69Z2i_jhY`Z+IUr&Kx*=xQA)k7qNc1;>JA7V9k
zNRlt`PIgGBSpISXusB0rV3@;U#kIYx4JRo<l&kikF>h;*c2RWcYeOnho!-pv*Wk|n
zJk2@$0}+@r^YW@8#Z%BB)>Cdbe}^h?U&rx)aRpARb|i5HiN8VW;CSBMYbJ0!cY~;F
zN7cty3hIf8ow--?IYs8*1OXwAcvii$6@C4&qS0+Zz>34gJqeRMKXe~1BfSR^9SU{)
zwviD;_b@`i0t;BZc5Yq)!IO<R<{|l^L!+Pg62ibJM>}Z7{iGmXeM*Z!inH^ikq9sj
zWzY0dnYpZ@iUtN@Ps8sJ2<1@WLWlZRxaL`xG<Cl^iZbe|Qf%}F+M+i%1T?;bsmS$H
z{k{Gjmfhe<KsG}T%2_QPOzTHzFH?b5$W;fuCm-1|6RnFY(kmfuEKh^GP!(Hd>6PWr
zer6W{wM{x=o*iQ5<ZO$l*D5kma%Zw>b9{ml^HJo{%ViluowiRg1}b$D6!>jRWk^%H
zIr?H};{sCL!fA%=c#1|Uw438^c_yJeMg$xl2H@Y`fu;o?{T=GWj!(i6f%vKM1n4C}
zF3t%QJj7%GPQvbDij+5_H+1`*zP>qAXg4K~!II0+3R!c4;a0#iJxT|A{mc7hezz={
zyq4T3PHjT+NC?%}5~Qn>h3aDg7!&{3TItnLyG&Ki=ks~y-N|8@0-1JfjX(H19!`Tw
z52)_`Rby`?J4!4B^fmTJX!71=I*4^EtT4bKy1I6!omn9=`sok1Lq6SuGj8}fV$^86
zn!5TFuvPpl?FK*!th0KLYt(qSs?*=u5QWw1{?i?LN>n`Zx_jt4m7*m>ti-=AuSae;
zPoBO+j4FTS`-K1W=<)WM`2b%l{RqR=94*<;2X(<RC4s0OarwfU+uDUfdnMTiU7qQn
zg9h+XsRZKdZpI|OOWoE(&H+zP0|m&lfn_)O`q~;(F<4PsK#Tc=fclfqI3Z$kj-H+q
z7`{y5XOgonAf--&5@&14X4SYHf`t$%Ic#)1c{^3kONOvt!aK4z4vM$-y+?>hDf+Cp
z>5Yvc`*uzDVz;7;wNU)jW&JK1S)Lrg5wkx0FIwr?R#8GI5KYm<H<FVXA)|2p!-j&Q
zV#v^ts=8GMK$z>SRrTR)>c#+HnpBGxR-X2c%2xnxq|m)a>2?+fwLiLhN3)yIzImqk
zC@?4}N`}Ex0|Cs`Lui&Y2<M!D8^&9}iLG>6nn!pK(S8GT`Ae@pY{tF>an}7`C>V=s
z-yi>?U`US3{EzsqNRoX1aH9-G8uza>1bs7EH6C2SWuDAgzyI&>F05qyKgmEc5Q&u9
z(dlaOM6LR;qk}^+5-lVS);m@tKLHS3S!m-H*jTMAPf4uzJ+_+&5Q=RLoG0x<L_j*{
zV!^kGJ6>1YwI+T00mw!&?%cf_Yc&E{zos?V4e82&o{uZgF063m5Tk6f9lW6YS^NXy
zytptc{+V)zSv46P9hd`Se=w|mO^mayY_8HiGD@?zv!X(C?SZ#zZH9IXW}^?aXY=JH
zDSk~M2;n%C<)gT*RD8l5j2?o5i`RXf6AVa7=G}LKE~HN?y}bQp5~IS>s=yNv4AsPU
z`XXWvD3mzT4mggOi#&fhj<%?Vb|`_$_DbjTF1&u2F&Dx^DY_1k#haTi{?s3xn1Z06
zD0u$;>Z4?k@|9@t*(s*30DWKQ?93B)KnJPKdvjyN)Le8)@9+eWEv4HKt*#l7pYsG~
zY=&D5x^6t%;d^?_z4+p}5jd8^7_R-Cas*GdTB)T@5f{dGmhZ>S$EO^g*8Oy(Gq857
zB~O$|VgR!(TqHu`Jym%YC~im)p*wqae3QsC!5M00^TlIA7OILbs^Hi8h$E|a@?2N&
zF{5Q+kjPeK8sw_zKsU)WENDKe*U-Lr?8*ESt2N@|)kAq0{+Z09<Bmx_wne5GM^I6W
z@XfCS0b?B*0IrN!ihhTEoMzU!I=>3TD{DD5dvkKcZnuhSOuNa4B1nGnho@XF0efxC
zbrfn(>E6q@wYB-Z?WHIPNo=twsJ@EGp2UtwKEvd+%=S#K?hb(Ye-bPng_$VT|AI?F
zpp^HciFxqfS7v=~OWM!tIq@kLarIAiCX4YtsJjg%+|fYo-RJI*I(4&hC7oe4DuA8G
zlYldNa7nq0zA=$*jA0aP;0qys6C;tU#r*E8F4|?kE>RmfL3rcE3uhgz0+by(q@`*x
zQ?(gc6N?44Ns5V^K075-<nv1NmK9K0|6+TU%CI;`<eF!F47K<^`5TxwV#z00Ur6LB
z_ovE`yN>!CRdke3k1!SRKA#;m>)i<I-<tE*y}O_3tjp^;Q<X7w+1&e!ebZR-UchpI
zyl&|tz9+)t>9N}2?tIwl@uNp+fIVa!j}hlqX6Wdatk7!dwF<@ry(KAfbe{^eiX@@o
z_s-lHZr;voO(H3RLd`@6tjjyU8yO%(D_(qmfWIlX^`+Jj8U*mhV6Veh2cm;ZK>CV^
zxP*0%)n#FFa0r0joukbo3}T<Q`79DmhlDu@f2;_|w{ZI+1zlNx<RO%NX$q_pIV-TB
zmt>vJsg*h5hFYeFwmK3rNabKDPJ!=~f7=iB2LS7T<2C{cUdKVn@J~8a9%1?)<FRQq
z(M9&hjcD2O{#L;KZ@O*i04%Ok=F_J0@$U20o5$kNJJBJDS7^+e&)&;ey{C72IBjQh
z_lKQA*?ihsdywqxpNKp9TTiy_Ta#GGqZWmnLhmgFhE84?p_`lhIq6V@p+0xUZ77nB
zMS*F{w(3sgTM_Hny@jzCN11OH#&0sHtEy(EGiAK-l6?Qt_sG7)jHS{t`RR(R+wNQD
zi$Z@urjWQk<xrwKhe$QKd*&V9;5BBKdL?5rJ<M`_@~d)=Q0{wnk@pLvX_k7Vy?lAY
z-E~(zA|Zi;hArmoxr<u4t#8G7+)y$N;<Vf=FUzE8X;;GK{VUrJAKvz>UAsYry^?AX
zC@%5r=qb61KU2ogT_WMS7g@xTZ#9I{?`$Yn*6d0Q?WFQoeE4ntDh`{gdqvEqva}Br
znCE}Wf1!O~rwhsg(*8LjPnI(6e5`U_lV0+zBaLORD!IDImmIyYv#yXg1?O9APG5QI
zp+etGf#p0F<r`bN`76EC>Mv{-kA*)yZCDmoX@qCO&Sxa*ryS)W6>?|rRO<N^W>GN+
z1~FkN$rmwTH7(V#c2ErBx>3D@Vt%zqJ@ZV{)2j<&6N*O6_mNT@Y9-G7ug~-J%H-j6
z68?lj$-hSy%<r(b+?7rGzgD28dW<`@d<_oe5=cHW=ms>${!n(J?eR<G|7RBH2k@R)
z;i8&0!oydG;TfT_T_ab2GGQ27HA|hk7f8>+l2~mZ@6N<3+5OnWr9Ju;8|toDzLg-J
zH#PT`J2)g27jfmS@SKPG*@?WZDOnfetyFwYVG%FWY^OLIomKlvv^k;Z_jS=UhyLud
zr(IUl`y6%EZoPvc1aet#3b!P3CLpLP&q7pZdBXYCDWUmO^PteZjI_>c84JusoRDnO
zfDgqI#;l%owS*CTe#6apD$dVstxNM6N{p+VT0^VCdKFLd^|8NsNdr!nMs|(6U${vb
z#d<;l$LYMmFdB&(ZSE!yF4i3b(ahssVlqZbmR;L<fF`cj%aT!3WiG^9Zb4XTcdmgF
z8-%6^Z_$;cP+i(9eB5|(7TqtIrIQ+&McH!Hu11Pn)U139s=KJ)VYS60?mwg2+P>ty
zAlgG0y0#j1Zv=AlTHv+6(OM@$rXxfT_9TwyLWBn>;GXSx*N9W=&T8vHX|w=*Pr1(R
zFFiThWk6N*@H)nA!Tuh5a5Qv<v94Z!<~C9pfSpz+?uUcHqFhJfy{$}%C0YHvkBgYe
zN03*1X*X1klCJ*a!~ME)DR;XYasT-!?q0eV#gdS}ZLxSi(K}QUdqpf+8fPC52(*b}
zj`>`(uv>~PyanwwFKdi2k`4gSwgF91(>e@Po!~a`ela=6ODwR;HCuQ(_ZBbA?rqQZ
z*!>j`dz}B<nyZG6Q<_)f$u?8qM_S-ig6Izf4(iTOqH{lv`ae_KiPNhM?ZfG~Z4RbN
zt?G#{?T;6&*|5cy`VftYW}`EhDF3@c(jEHQr7v3dUPFL|Hsu_Sp&ih&$B~=94I|-o
z816pqkf^%rH2&2OV%GJ_UVc-4wK&3K^hy8JWPX$u7p+2eTEDu#jEDYn&gfEU60-A_
zL6DZ9?@*28cD3)RJi`Pxz~1^K5;q>1kig8KL{Q~k)Y4|W@`YKnmfo}LcoSLhFR!Ig
zK{9J3)2ju##0%tyQe2{cg&I`2{#jj`dVV#4i7(ZbrE#W$a~^HLQf+Omy$}%xGFp>U
zRi9sg&i1liCh;DWb}sjFz+18=-|*25H+;srcf$n;ln`Nid^s~y?wHB23c2{Bq)t*1
zo9ZREqy#j1=1T9!m%jH(x~nm(2ZlAsHHfw?BJZA(DOep73ArUPLo0!<+8Q;Gu+^??
z$4p5^;l@u^p+*#6Ja&5?m~ToL$e;f?Xj5yIFPn0iIw7Co)Gh$8f9i<IUD_fHP^b=w
zVM4rLF^_Yy5fy)Bq52Zps^b(W;=_<cY06X==*xbw?OQ?p+np{$tyAI_Q8Hmle$IFC
zYT|bpTc2bfyM{HPrk`@^N}V*z0&ek>;8W#meBStu<_f~<K{Wn<*=5)lZTVzcpf9nd
zBx`B|z52_fpE{-q5Nfi<$52@5bpP$+#<lxy4EpWrE-jv2+aVF@XL{&AT}&R|otF9$
zk~vJRGVW&Sznk=0jN3M`*30{_?_s$Is%B%lwr@7i5Qw}n84sUSkH49J(NI?>x$<zF
zLgnT|0&O{xmed}t<?h^t3Q#7twOjQp)=F_Oppm?-M=rJ+JOp)aMu9^@cNnRDy-D8Q
z0-;lOR=luALc-4AFv{iV@Z!ASZdPU@?<+<~q->^OUt7Cv#IyQR0INx??5pLm2Pfgx
zKKgU#*r^Q$?&#_dtbXYI^T(unVf;key|?xtO;xserlUSTO{<XlwxfC5HOFhgYIS;b
zI<7=~zueVq|2ckIzI07wbA?BuwZlO4m;2GpbHmiRps;o2DFOM~0glM>Lgg^hlv3{2
zY2>Ia4wSS)3_+b#X4pfP{ZlCG<cFraoz(}@;>)ejSjBQ6+1oAe%-3}CcuOH32BRGx
zeV8&Zhqf}`0zt5##re4!;X8u(D7~h5$iAFp5ZAvObkT}XIWkN5pq)X4f}F4mIHy6Y
zgTNDxvDs!WW#2dq2J-~A3zI}>`if=t<7!S-7{1NcDq!TRNn$ekk;G}Vzq&7IG1AEE
z1j9fEqFE*f86<?C#+LR=D21q)1cpq@h+Q)Bl&D_~s&0SBaJ7kJ=_VsZt;>A5tH;WO
zhU<Rnncf<c4~Iz(<8cgi*qOZ%gpH_qTCP)22OZ!+9tSL;jF#703#tGLBY~4h)XFT<
zs<XNlXWLJF4`9A@scyBQq2URjhIqR<`38POMOwAJ_&I~Tj;1o-aiQ<J1UTi(K^WW$
zC5JUZch(i~o{a9w`NJ;&Y2O04z!)+P0dixdL6pE?!V)N;0f47iMkN97zq^`r!A+cZ
zC--=4#{R0rHc5upkX0`J(OO`l$u4H!JM=vm9ZbZA0S*58^=lsjh-~s403w&5Z;k-9
zS6_9N!c`<C+*<*h4hV<^4h<h4ACTB;%OQR!BbCT_NOr0i5<yLyMM&gj8v>7l!BU(;
z5P1++tD(&}L9&Bv%M^C%G&D3Y+C^gvPz@lEM%^873ORLinw!P!xfTp$-qT&SMT<Xv
zfpqV1JhF=H4iH;OL^59idE9@qf_Fs8?w3O5<v~IaZQ;)c0gwbn^<=GK8#YTL1eiLH
zGM#BA0Y!(CN*bi(0>HAFnqQZeY*wAnjT%CLcBDURQIhA7oUfb(prY!n^&o_jo76ZP
z=n#9G0t^*OdSj`-=rzJ&)Uh4-f>aOf0v-k_1d}@oeGnF}G1r@CQF9czHR|b7Ezo!>
z!2ScYB?=FUq!_O!(SS<O2-~IQ>Q{8H5|zt<j(ByZ>oyWjMaZA~QHh@OBV`vCH(ab*
zQ9kgGgBcr%$AxBh5IBNFB^Bj<fb;wF!MofK!w*y_si>GC9F<?YzYmHpBtF7>{}#e$
zy?@zB&Sx+_KHl~^k}$>$mxQ{Z#34L?bQ9^AkRakzM$q4Y6V|K-s|xXm_RzIT2za6v
zljl=?<A4HlTd8ITiLG$Iq>8*MJS50qV3;lla;tg({8q+~PsFI@o0SY}0Odqe=)yxu
zM8?fL?aei>!GYy7s|u)L@BM?!IJg#tTY!m`nPcuI!iDenD<Ri2YOPzZ16(zokf5ih
zm)%U~WguH^(MCDnm1Ft+$ajc@FkvV8`xZpDB(XmbeRFQAJXWUKfdJK1s8^u_1c4#x
zu<@L~#zi{d4bqK?i7|1{9m7Mr*q@5JsR>X_+w}EHuk>vV`0F-p4py=JvAm|Q%m;1?
z7ytL~FU@wPzCM6c1(;|kD6W9~N5C@zsA9w&UO_mC+UWMSN3u&cXlsxW1BmYkw%iLn
zt=SgA%IWFp%@E^r(8_p5Bqnwcj-#YOf=8SY0hl<FIv#XrSp!Tx_!dC|dKxq}2NNsy
zK$8P^=j?ch%*6xM>VbY>nN#<|I>fAn1B!WNpPf&)XA5kIk(-+?7_5H>0%<}Rb&R-o
z3Iz=f8~M#;N%SjKF{!caocvHkB(v(ct6yvuvO3qpQJZ29IAN|%k?-+WsL}T@1fw5b
z=ZZsj!QbER$CBBA`(bo^Cv$=Ywt!r7^u7}vwwOW@n{-6pAJNbKFa<-sjWQy+s`Hw-
z0Nax!Y4XtyeIg>%4gaKJ_}4ez)dU^5B=YnChd#T2gginh@7GlU$qEZBw@#UL!YnbX
zh}%0U6<M>P@=t)t9tWgch=p}?YpS{)IlTeh6yJaO64K^j-ba!#MAyTP1soi&-~4e;
z$GM-^jZSc|uqce5U6)rJzvw6I;UF4aZgh&dQC_j-Hz@a>`E4^@7f^mgzQnOS{g`51
z_PKz;wEfV{&<$A+wRdZ74{>Me8ew=t$KiN^K6;ph5CmJ+DDFV1z<OC<GYq~4;C8RT
zOTtl5#R#t0qFD=7JD6_u2k-?jSjowSAOZdw0*6%{_&fE1K-vjA6YlGB75F3Qjv?RT
zk_~LwCKog-6Ze2$N2n9Nc4-yk(HkTvO2x7$NCb)MUrc=Voo3x^Y|=kzbNi_51If;3
zTy;-b;_(HTL+z`mT1kw=qM+8wMp4Gm!{@FkdHLR=XBBRV;^Bcsa~5KNkCI<JfOMB_
z{xVg_Rag0Hy>&E*xXQ{Zi}<TtVVDb~HUuLZ1+v{Cq-(S<3&=msZ~Z{|N0KZ-EVq)T
zDb?Ati~u!;gRecNraSB$vZWdQ(zz`G^^Oc$+R30m;4s9AUd9~t4pmlJ?DpTRWN@e)
zGa)-K6Oqq)?_t+jDzpO!g%;pn{-Ga&Co&`Wj5uUnWOe4JIr?@V>)t88^D?poufA9A
z8h#>=HKcb(IOqtoG~n&&0AwLS)!E2Ewb9!D9L?jB2jvb$payN=O@K>5iNJQ2hQ|Cm
z|D*@tL@lub7K%nMLZRPynLtGTK6x58)HuhVRNlSUihYxiI1qxlxj8~2H6!v7LglH(
zuV0%$t_{KOs@>(vL*1U2u%&+-CMWT-KKr@9hbWXVUiq{8Ybz|#`55oeTPhv7a1XZ7
zfJQ7dz>SUnFQeR&lBF1`7m9L@TLR@U1@lb8L46*JhW837H%8p%xiH!ykq~0Efudv)
z(;0(R#6SNjr=X_~wnyMP=P=nFNRs?)4p2!nQ0*@KEqrk4ES^Xns)n@_qF^+G)(JZZ
zw!XM9E;!znm;UoHdqirz=uwc2f?{Y@K=m3(^=A8vGH2)0hil>Ftbme0$;h0!1V*m0
zXA@nNRMB`77#ImiV{DC<c-6Q+hcP&Iw^*)2iwEk5sL4rV3|66LUXIL-j+#swatQ~;
zP!PD`|I;?jFg*nhedIhr9Bh96{-Mz33A-%6KR8e*{s}LI8^n5@e<4@%6cVCHpbbaz
zB2Qir`ME04Sp~%&MBjg|FfKkJWeS!KH+nFtZ~Xak3#^-vIw$Cvknbabb<0o2rz=F^
zlYYL3|Iz#nA5+xGoedd8K>a+VGT`l-Hy<-m%MM8BxOT>ypdg`nfc;Q=puL1&kdLHa
zdW2C4;{rmCXn4U+n^73so&6D!lt7*I<)z;#`Wuof^-kGQN3ph+ii(OpD=Abqm`+uw
zOJHaL55H$#@cl{$^I1>^?^z-9U62<aY0ThdGtGXVuTyjvTnDDs1!Z!Iip5D*sO6LS
z6nx={Uz1tPi9keZ-AhsEATgz}Aqr1Rp0QTHMd@#TXxe`Z&#SWs9R-B#=s<3|Wx(c_
ze@{3Uro*-V$Mg+REHnSTDu|H31ffk~BBs4jIug0T?;i|nO?Gj_W@KKCIj56fNMBKw
z78jm`-jpJ&&T;RK7+vlvnUk{)6uZ78|A8037-^@}`kmKq^)pCqgfbjz*!+I??$|Ni
zEZn)bqS>!Q6Y5}A8y=AVY>0oie=|Bkt<sW;^w`NlnU$I1w3p{$$V{l(nI|h=T8+EJ
zcdX|Jl+W#KCU}4X4vDp!QsPX5J8qchHphm6BV5P5*d^^gd49eg0P5>+UTjjZD2D?a
z+pE7=d1H2Qw{WV}*rr#cVsrdz=+)Wv@bNPYahFbHScTLRFO|vozZU0)6uT&>YV@qj
z$4K0ZH)oDc^O<(=x7s{w?dS;o9rnHD+wh#c@ttzxw-%{d#fR*Ojknhg?0SUD<iLCI
z1kN!SKW44+N(i&|KhoIG*<mP82Xk0x7eposl|;Zul34aQX*LcH1!yvu|9u2Wq_6q&
zJWq=1uOGt>1|0AfBm>`2co6Jja>!8N>CcY<X$-c51ms@L{+>G<g!O}E#8cmCX~b$B
zv-Zq6v_p>}3}mj2xQ5v(0ow?OY61HHqfA2T57SKL1mmt0Y1ok>cUq#B$#l~-a7lCP
z6*tz?9b<Z|K49kKMQ2M_pz{nv5*&uS$j;T5%{XZ`TvfUG`_7(4m9?q!uYo7oL>A1W
zS7z5Y5a0~fE5>dAmnrSdIPuq@G=Y7!j4ylslXxS6_Se9<x#km<oJjtwRr(@!=F@9n
z$Kz&Esza-5rVwOchmhn3&cn=*lm96*{^syryU{hH{K`f4EWM?ZI^}o^i|zAfD!a7?
zpPifPH*c5^e5^3m*$*_X{v&tm(R0hq#|iuvKlPu#xW%*){bRh)zHkcbn3L{S6062l
zNw~Li?Bm|<C)c;d=KY$C^3qKyNz~0cjz0=B!3MU$arET*2P1DifsDh838{ucZkQBO
z=dSEo43$5_8{fIX1EKqfKCQ^~M`%|nE*z*?y;K<wZ?dB=n=_M?BclvyFT;I$Cmcw&
z3HzLuY?8QV+w_84RoaJt&$C-_JtjnbY79?tWk~<pm-ZuweEmy%jRIBzp*RvmG?9W^
z{Js;R(_d?e6y^<W?<jZZ-PQ&-#MR>LC@Dv`5n4(SkIj$$I7gAyOrkM>B8D{-9UDuf
zrVDy>1ePZOU%SjkW^7T{KkI67-{6I|?r!t!w7SIR43v{PUP3k_isk*UX9^1)=e3YT
zXC3jkx6RBxkiL9+sZnpHbOi~a+8FUtnM-i@eHq35q?+2nDM37B$Wj8c^CH(OXSb$^
zb<#wqRtQU|_L1Ipx98n$FId6Umc7~3@tRH?zTUgNc-R%}(TWk)o?MuT8w2~W%eIy3
z<6eW<bfOzVJCQ*W5PN1FR$zi=UZYLCoPH~a+_6I8nV1m4{TrcLdTZ!|zC}!DEk<R3
zgfXSjZGB;Yh0Tu!@6v*#n5qzYkEd@lfnz*sI?=tu1FstWxES0y<H?QgBxJNqh<=$=
zXk)IYHStim;(w=Fz?<;T2rn@}Yrk9`@_6(z?!?{l3K%8>6Jh$DX9-aZ)_XfL=G|3)
z!D_=RVxNul7RK;k`&1B}x3SaQv-kIvH-P%1L4*tBX@?61n&ypBI!UIU9>s)YOucz}
zPp)HJ76YpC@!)$RmAvp@4&^%2={`1OcD^rP0;|}yd)afSHJoi?^KpLite#D^rdEL=
z7kF4;R1-r=tG{>wb&1(!B|U@725uvdty%+5<&?u{yTF}_ht-O7e77#Tj1nPX#=qDS
zRbJe2OJY%uy_B?bLq1keRHfVA|ACRHp7HLVghJ0<B6D0>*5=lr&COv>tS*yQ`@X{2
zQ%ubQWkQ99eDTBI<7KTgn!XeWy-8ZTxa8k4EgxCJWhX>tD(9P2wL8G%x*ws^W}yT!
z`!@dF)Ax-;4Ybuev7NAUArn{AKpKBFnAc{HoY!;DEK9q#)EIx?%R6q?z6d{UWoK)X
z;%Xf~vPXR<N@N#v&hv9KJ#j^f-tFcNyM6mqUOv0YC>lB@-t6$=@<q#)y>G(~UYr~P
zGKQW{-zhR|<UtC63^YtnAY*Ghoh5fp?gs5KcO?D@(oELF!<>!FE1ZVs{%j37Ghe$=
z=N9tG=E2}+n;<57aVD}K!nmrX8=*CVOjlW2j0Ve^Dom4Dq<nhav#R8_fHHi7Nuo<v
z`_`hyR$1s8G<Np%D9_;D5ObNn#GNm<8%Tvx?{s=LLtI5Hg&1NqS57=E&--71SIwa@
zd}=`|$-&7#N<vHDqNoCi)xSd>W+an!$CGa~x5#3?`iWu3Q!n2q3!n3|P%cIK7xpSQ
zot@_yNy?bkocSGr_vuC_DwQ50P<7kQH73Pfu_MEH2l&oCiZ|}RFg~Irk&v;WEpfA}
zKpE$pkR+Z&yUA@vnB`9>^Zi*O>{(kf>#=rSg4Y{`ORg95lJLqxf7j{GcQ>slwRheq
z<95w6pBKc7yL=(_fAy&PFiawlRh4{yn1o6RgRNdzpeH@f?NTWko8y*>Ham0wj#ti}
zvK2wtZ*Sz%{&Sn@z>Hd~#HFQ)&?_o?U08SRk2*(=9#sG#L^_1a$qaLUJQhW|a$cua
zop{=fS3|1onG9d8_U%Q&&?c1!opbS}`A_Zby*LZ8J?Rp~`#}~Xy!Upt<59Mpp1VlP
z*RM6Zora;BVPMj1!G>l}SukMPBlE6KUCEK{`7n{GnP=;(5tz;Vq=7>&!mjs+-tJ=?
z^>0t77}*ulKhUb>4PD3Np<fkh`ZHf5qNE;<`nj<ruQCqLqYegAAx8eq^DD`yr20e4
zH!8-L7%mY>)oYz#(>PI#)@pD`tTSM!dpfFGVX>#IWdV|PiSXXz{cgCDmJrbyPv^#6
zAOt|g&fsj5AmpFK{hL5<s+*&EuXN#Y_8!z$qm$-Gra*~x<D9h?!EhM&<0)aS&!qb3
zM%44~21a?aGV4KBA_kckM9F{YO-Rb6viQz_dJdsma`N(phz3UW^k2aks_qy69qQBP
z+0*4;D`YM6zOqdJCUNb4*aug>gAkkdhr1{wfHdWT<-vPd4mBcOu$ZP@EiWs30P!p{
z{8Ny7Gp6)BTPbXQW!1ai9)GYTS<R8cRTo4Hq_T&WxoNGrA+dy12-0x}5ZH|M*ngC*
z$dBK=udE!nfU7m??(Rk)C~(o!0MTG`hKlORmv-p$_*vND$40;YX9s|y9|J7ms)HRP
z8jS{6Q&oe12uTa6!9s*mRS-<ASTz0K*m$5?`nSJL50dtgHU$)WW(3-+dNm#u$Y=sZ
z`+$l=P)buC@%;5H!9_hwjd_L28wvA>0t3Drbmd4u$p5%@J%IU;poi`vQx!<BXosl1
z5R3eZyAZ$Lb{~ckAqm!?{$)L$Phqj@m<7!qv=TN*@Zg~i7&VwdG@5;55%1=)CbqC|
zt{;r#RV)<*ecC$b{o+sWHRRqLe9j}X$*7as1SwmngP~2}9$!k@_~h>!51@<{z-sSV
z&B|S&R|C*$=D`$RU+#xu#42abEcUVPU9H%(>2o)g^h})Gd?xZUFel<=l>OHP+H1%q
zo0IGDpiXLTX$b`cvp-d`Ib;6z)9kg_u#n53wc<aj2dOE0k8`%q(9q0=#>JT^DP#!u
z+1aZz2@8Ki1I2A;(77U&>Z)hYg^@|3zgN7IYt-RNEJ<2o+0Sc^tEuMHFIT1IH+v97
z@I^f1|F^pTe?QsiUi|;Q_z!!5Q4dpm%c;Hfp@`El><@-qLN>|pU)+;ebNeTj0T!yD
ziqGl#n8Hu*=y&r=Fj4=1)c!N4N)Af@j)Hj2_*J`aU<9=Kq^;C7yq(?}*-{gan;P#`
zVp8h<#rExrxS-TI#X-gwM@MW97%Z^Y@*oP{A=?JBb+g|{5C@2_VyDW=AvLCXQ||H9
zxV0lQFQb0pw~~7tx-i8B)V<slbMb>|$_bT-l+FGl!-xu2qWYctpwlnoIn$N2XDe4j
zb()maB_;E74XSnBMt*96k%kS}<<d+_GO<qa|NU&UZ%vRW-FKy<bD9xCm8yIzC(eF%
z`>4O<4uJZvGt)EfH_5`=AyeqL)eCWMkR%9h&(_N<P>4t!*vE@7OJgwJj8spo{5%lx
zK_W6qKR|xg0<k+#@N;E6V)J;xEs7`$-|7~JuZy|0s;7=bg{QEJTU1Ms9%~ALZYx~I
zy)5cA1NuIqyL3;P#yF0{fXQG#29;nH>UWVR;u4Mcw+H$eYq>|b^}L2T43;cnHtrU%
z8vAkXJ}jaiNMgm}T$4*)&+I+6AVf`>`0s3fvl*uz<-s~xFvSp1<uOTnt;=CTGK#^@
zMzN1ZOr7R_HYd70BDiI5udLwrFBx%qXwP9qZ}aB5FF5tu7g>%Zoh{q`SiEGPyw*lJ
zY`=ne=h!R6h#mUbS4p?%Wv!v*R@xS~9v9BWa5bvb#!T!>FY%~JrJ`}>R8y-;4M&p4
zazOvS8O*p4qeA%yX}SKwWCp=}KrCJ?Yq5aZ*OwB{6V0P-;2iNYU(di~hyU)O7sPFX
zd$R89zaaVVw%tetb@WDqOt;n4SXx7&<6u(v^1@2Hd)8y4Fr=cGz>}#}sA*>DfBJK8
zrE{V}PiQGTu7HkdEP1SOW?I@#Yq)43%iG2srW_(up7@NCT=6vSl&r20X?6)PrXXRT
zVmSKoB~n2;b;9}n?QU%_Sg_f{m*$+7d|}bsY5Pk?>8&3VKc1y_?xfFz;Z6M8dfsK2
zCwf6%VD>5NyVddUspIaDM)C?~%fYry{m#}NMlv!4*%mEzuLapck8sd<988D2`*5ZZ
ze(dKNYp4BB0=uo?tOc}bopM9?9uVSfCrC+~3ueeRx{upq#N)1tIxSw)eEJ(KIpQ$*
zpweNEvBct@&ImO#6O$~IiN+;sHTTPuknk_Dsh{*T*7+9IXfDI;fWuTD6Mqd9-5wvG
zNb9d?&&yl-J%)doc35Y>QKaJIJ$uqqCxsUU*hGc&dh_+T1hRX=pHgKr2n3<#aTyY2
zO%Yro3U{)OeQ9UCH{vouwlXq~^rj(KWJJ)MhnCMF9#9BF>Z_`$uU@s+AY+@`V;oZ0
zC^{zC5H%xrHh*K%&7=7LxflD=4!OiDzu|_dOe>Ysyh?6`mQ5X+gWbm7RUYWs&K?sQ
zR3Dn|vt0oIi$^Jz|N3AaK!B~@M8vrp_xep3v~k#K$gRLng9Qt+3A`c@`mnV<b=hGb
zze_$6RZmVPI9Si9J5-fa)9ZV<2_&=JxQ-pI=k2CfmYI<w*9Q+JM)d9~5UJQiyQeVy
zgGYa*WbI<Hx9tiHM7k!f94mNJs$BTGl;F-M<yiA_;Sb)n_R6I@mDVL1SX=v5xV;jB
zHX(vspU+y~^;_wZVUPo-$wA)*X;p|^`4^jHb4ufxH9orGvfgESR9%q(L@Mv)&j1wt
zUozPLd(XO3Y`aqK$I!$)`~z^pvd;ha^(2Vc<#U%N92nXi{l)-xZ~Yg&HSJJosI?8f
zCojWhI?N9S`z13tn(1Y_eibZo>>|2i&nzvU-s^d)xhp-sH!IO(u4ZrE(Mc%hTVwC)
z7F$|dy*^RfzP7O<6fqahadTpB-agAy`~BU_d46pPAr|b8hl%o;TwJEql8wjC<(O;M
zp&G2(QoVUPEcc#}_HW06119!Y2zMEvaiQQ28BkXSCgi<~Cph#V{+lHg$;7I{L4kS0
zr^<QpUxfh(!4Zitg{2lPy65@j{0BwsNHkn5zg(=K)l-67e=i6{TR_`t1(}8Id?szz
zG!r9yT|ml@=F8x}{~1Kzh>L5ML#%!gn2PHx{1HsFtf!Vw1P2<3G{K?D!*dcO|ATKE
z62qoni(QEj)d(e<whX-x;3PNbo*()&A-jn{Lia>wBEe2`pJNYaQw%{InM!Cc_tXn^
za!HYP4}X~anf%yzV&_6)x1rk~SJ#=4qf9p$^$+b3|7qx7zK|bAM**1!5m<nN2Gmh5
zbYfdN8*KXX{O}cz|DCJ!_siZOBBOemj`2!;*xlLLxs#(Xi$$z*-bLNBv~POnM)NsD
zW`4oK<%}|LikY2X>Ix1s)ck@>+sTkGH}sP=m!3iLI3Pz!$;b<t1&@ZUcfTsgu#qsx
zixK#lz|8h)Gs<#zF!ZCe)AwCwY_HYjsD!Tj@<&WsX{J)9<|?_S3I~*!7+I(Hcllyv
zT~zaba_br9e<DQbVJ1TNLrn2ES^Q}HLZ9x6+U+H-^Kc3D+%#EMg0V4c>=F+jK3u0n
zjoejH?X)ebK~o?jac^Azrw&KHVBK~8;CLX{5E=p~#({U{j#Dr{wdKRTR7Im%E5tNH
zaZ`i#mLf>A5x`pF44EX7pP>eoDh3Neaz6r$wQE_`1OV^};8}mOf40-8^b9oh)|{;d
zisc}9%5P_`gEqW-yUMJK5zMbU2t~R5D@Dqz8YfQuM*R7A51|Dd(_3fmC_Or-kPfl|
zxxB)jsV~_9llT>pfnD0}+?FF-yRlEQn_u<NDv;;k*5cRI@)Vyyz4;^Vvg$j17Ty_c
ztRS(svz?}OucIzF75>{(^z}Uk1J2XE_V?_@UQrLEx?Z0A8?_$2ibNl<x3Y6_AtRD|
zc2LD6Z;;p^!~;r7nFC-xq{7%t!Oh|I)VA#sAgA6n0AZET#_d@wC|%^h&Z3CJ;f%N|
zXBZJ+{m)X^2p$-a2%x^BVT34Tu}3g;_Tow&H=aTOd4y_sXMT+U!`MTiq>ioW-ll~P
zVxuZ3Y0E3$c-mMY)>yW(2WD<T!1eB4ErGx{RzGGZm!NfahT%cGUv?9#c;y8s()e&-
zpX~BDGMb<d@+vlY6<^@fB;mLNO6Q-?k<PgmK#6O>G9yrn1F;_*!0w7h@QeYq)94VH
z=fq%xpTSy9H~o>AQP2|!vGSU+Yts?FeqJzuxxdsZ4x%hw5n~X<x5d<mz?k|W2y&7c
z28WYyA&k_3KVPV2-rLfioScl`U?sbQgCbH5Tw)mP#}z9WdUOaYZ<Fa`p0|z|pZPL~
zW}pN_Mgc2I0Q`&I+cHH$a@v>f(bl=agE0o%Tt>me*5S|2aqo*+x<4BfSt?bG#g~S1
zWEv(9{2*j~P<xU-?|Ol`NrFfJ6eYC*?!e>%8D>I83FAxCJV*90zY$icm%rBQbAZJF
zX~z7IL(KOeY~9@LY{+~X3)~v|AZMgk{`;vj?>yd;Z~F;t1db4jOIjlNyTHdyX+P*y
z4byU}fph^S3E=e*yBd<nFq;F=GSXv&bLsU$zSoC{M1zNqe(l2=`Lj6@6gOJbjVj!`
zNT$p|#%6K;pR8Kh64>z&eK_c7*d?lVKsFV<{ht5QFi6`V1NF`xF1_Bex_Zx3o_GKR
zF?^ai5gpS=)&j6-qWiqtgzYFUJtqy6?owIc=eQ9oGL|I0Pc@U2*>i<S3-Wzj<n3rR
zwIa1V!;uLT<xy=Quq3c@q{>Yl&7tQlgoA{urpwPo9dNa>2v>WGz7&1+SrEN)KoQz-
zyAgM_msUkKKww4K`eO5EW^p-=2K6%+n1gD7n^J*(3_|}b54hU<2YmhC+vfc!jc6PU
zz6v0v2R%h=FLdl;5=|edk^xl?Haer*@SWPgAp|kODykDoU@&opd~tW(Gq8hZEia@{
zC71ZGz@$n=&{H68Z15lstP0#g`1M%!b`SsxKBi6V4Yq^eGNo5f6AFAmCq8>sooE0g
z*79I-OJEpRhFmD386cEnYdTE9!^Z2f`~ag(+q5?srowdf?u$TIeIE;IvU5iPE>DXv
z+HbA&tZn6xsAVSVt^LyUY4NT};P#8YI<KxZUT*G=+>Oda;cvKs^}|PALKx%6!zA>B
z&%fd%K6?LtKzjV-Cp7n+L%Fl~?L%nsx~F?+!irR*5+5edT*KzBTpA4UX~$A{o?;OH
z=SEc_!>-_SLpp!XanaT?xIxaXc38m6S^O%2sHOwwNaLJ2TQ%&uKP+tH{HJ%D3?(U-
zLX~6?kr1&CW??mC<_@|R)CDrH{49QcxQt9dg(5koh9sqAU?o6k#Ec-{$gh#-BcFbG
zDoZ^xwzH`FLD4#rC`{4W?WstnU?EEYC5#YNqCis>B)>r<ZrlpTEsJ2?7cnCElrcOU
zyTY{tMe<6@Vkz%)k}L<;%c_18^tPz79S5LiVisl-mYB>ndcoA`v6Mpf!Ty8}jg}WX
zFTXx_*0B7c-4hZFb)<{Og|@ej$o9YabCya=D&<R%b;!dhCdT62JFn;^lx&OybE{q+
zk&)N9W4K>Fcz<H-@{=}?z&IJR;_y>JcJtdtb?UQj`T)ADh#jaefE@VyTH5-rzL;8A
zu%!57TWGE+MrLV-sgpg3lvr`VR+Us(jJRcKc~%LWoCw^S-{m$N^256+4n3=NOw^ri
z2Fdi!Dtg{dxei1(xQQjmAHF-Moqjn7N>K<;5`bVvI)DZab>$D5QO&~Uqk^OvV6ZK1
z;OK}rkg_=@Nlm-LZiG(?&e&$-(8>)4VJ}7zy9WuNh>tuJ@edB&C2ogZv>2J$f)}3=
zPZ}|49}pNf-L=l^v;0NYGN4)8QeXa}w~AO=h8$F1D&jlgoI1sdUtmOE420*RgMm1b
zVT9jJ311Preace&lGP8($Kt2Ocn|*~Y}o8DX{X$3mB+4#$_DRuX{P$5WLzEv=}D1t
zWp;%qGmDVSaYB?ufJNJW)2GzEeoT>lVG#Z9zJz;aN9KF4M;XM->JSaP<u>VuXjyIy
z)Ye)cIw%lqb<a*Ri7`FSVqmveUIE$_-`%fV3jDHqiHt;XZ|f^+hqy0-31uUu;2pyu
zzbQr7aP~()#suPQtVC=)+Z;z0qie;l9tnWZ53wZLnuEX?$dMtxm4Fs^9C1q$@Se<n
z+7I=`wi%VNcAri|3t&l2<aaoJ0YSl0OPj7`gC6%|nS^aq$aA>B>_3D&#kY#J9DAR3
z%Wsr8O5E8<-r30$LTPQA?pw$3{-&VW=|r(jF|gD0qQ~e8s+a?KEIGBys^!&~bb9yJ
z<2;tvZ}`0p2<!364Jn!LZHc$3i3(AvzO4Czqcu70u%GC877Oit_BcW7&<4NP%-7kv
zb~-3l!VE}1PbK%O$UlX+qlq*gN(QpM`MuhF8D%YN64jfl*+&VwvC+|H%99At3hmLs
z0qe~;%F?eh8=4r-G|NW%>Zy6NUual*R5JI7st<ZI?eaTVED8WyT(F@%4mrbWJ{aZ9
z+4N>uO=j61n#ch2LCR9|57N_FQjq|STVu9f`}!i%`xEi#N+q5t!_LiFLC?0eEs&<!
z`CwEs%~7&Z6bZGMADQrQw2XgxgY3<lLcb>gA^(Hk^f!LS$6B=Qz3WCfLQOL1drC-F
z*(tCh^eauo)7J9lC52hukVn<2!QLQSa8jVI_+%kN8Y<b`!_d|qA+MP-Ri)L#B<`6*
z-!j5I_4Mr!!Q<%G=tdCJ6;ZiDCg~Q<cflVEr9vZPE*(9!AW*x4o1F0rfcYASSq<G@
zQIYLJY3cC-YEA)Fn8j6s;HLCJf5Qb(tY?LV`$J<wxMN~oS?JK1hla&j{m64Mmlk%m
z!|n{b);f;R-hXzKtZ!~-n5Niq`tf4Giq>Mh5Zr9P8Syt-StT`mnF0ib_u)b8&Kf;4
z83D1f349&Fit|Y&GE7Re0+H^EOFX7ObGQR|%q|7cCUH^oiww?bQ|#BF*z~TdrL;)P
zm(WI}%lG&L#A{A^@>JnS>dy9_^6aRsxz0Qz=`uD)=cCQbahM$fgBNIhe}?f9xd>HP
z`UqAZI>^BFe*Q0ojPxb#=g%9`9V-3+UH|P%$p<silk89MM^KWVeq;7mleT)>+X=Pk
zRNNr$oDyb#S{NNG8fUbZ<IyGdePDGzv!3ufrLs1EKj(2~MM1@0<xT0eGQ7ZUZOe9E
zql&Z2i|OV_`t8p*X`gnK?p4fe(C)Rhw3KET$3#v=F-J78Hwmn93u5eZxfGT6BrGiK
z&$8G>oOl}=$6bE!`R)r>>gSI@Dfbk<gJmx)kEM)yJPgC5u<Tt!Dq;u?`@6sTztM_m
zZ#_*}s<SU-e+c#d{(YX?!u=JY5pi5P{leBZx)uCbf+ssi&gfuyCQzO%OOB!(W$$Mf
zpZ4RA;0O_+%+f38O{ZqCRXDx-($$J@c884PwhbwjK&%_{5uJ6eq9@p_zRX?)Q!Ahy
z)xfBK)h@R{zrIc=oQ&hjv}RuB(w&76^&-B9WjFb^<>cDsBlcha@<~Y_yh0}V^eu>8
zU~)YI#HZKeVWgpYg${D{fzzhdG~+WTRd0a@QE{NmhUWw|cQ_EAeW^7FDBoS}E))ZU
zHx3_}mAYuu_w$InVw*UmdVhF#VLREi;l$GQCoPmTf|k)bOYHCt2BmzMJ?c%M=eO)r
zg$V~&0L%#a5244EQ^za>a{sZZ2r{Hp%v_zyWIzXtS63?3ZfMIo<hkK*Yd7q9JZ>B2
znu?7KcrrQTJk^xrH;dR*+K<|eg-iv-7PNG<1gG8JPPcRjn8=v@@x5^&y!%OxtmK1W
zu~?Z*X6CQ55aS*0&l<O1B$BV)R`rid1u-tQfWan8=u<F~>4PMXE4srt#a~_H$wyZl
zhvxwHS}U7}&<-q&TA4zc4KNc7Uio(0c`1rpkA2$?9radED1=`Q208|9_8r!_X7%>u
zMVDGJwVSKYbZXJnh>YE?flR0`^&1Nes)1_W{2$xG#8vdAC<h4zuq`NY<&2*Wrn@v)
zwiKGvQK1CxGY-gU;6J)Gw(GEqP#DElSmg|~pbD*!4P(r!A^szWCtC)3a?+=jte!x%
zdocb{zN-mvesF9zUkSR&2-R&E@M!(&@l>DytPUa#{dd4uD_f)aqGO;|3uYUFl>dE%
zPh%O`zam3LFP!ako%eM1G@E6D&CnX=9S1{BG)#ymcsMQe-GgZuoQV1kMy>X#kN$G#
z2j(_F|7S{i@luywBJEmD8s#_B+1~9iZ*O`X!F?ImVrO^P&9T>0uc!?_vbc#Gupm_P
z)=X;9<X9t#LeHEgGap}T;+%MIgNc~LY-mWRdA0V*s3FFaz03^CVez^2ew+*@Tte&b
z2dCs8dBm=vdsXCRUY%=R>XFg#!gZ&&8h_6$YTs^yj&Vw9hx!2RmEhXEchSxG<DKxp
zkL!7FO^igCuPYVu+NCMJQtN%Jq0#!XgyC7!fL~E!Sd(4y)k%HIw!OC{iiZzxD!B9q
zr$A_fxBuGPnj}7L^xm^i|H62srLYA@8PKZVgXmbU;5?-l=RK2{<e!U`JfOX42-ZT`
z*&A6#`zPV8!j0?|uX!yDAALY6O-C{+RIz$0d4pSa>096%@B2ibkFj2=eNN?W^Csod
zZE4DS5<&kr@-lZ+(~irAjF6f$1-muZE=_WioDF};!M0={*t}r49yn+x$_I1)PEJIk
z{bz}Brrf5DMR}T*WgVFH##Fbpf#o$W7m0CRA^H*jGdOV{*B9tJ_fbI&7ez0f1K@X|
zuY`iyq2m0*`my^(c4R4xsr2^gX^(5y!LQR<?e2`JZAFjpg+xTWdiC~Pirx=vv(69P
zk-3D9r!NS?_`SzJY7E}I4U!%-xuD$V^=4b<ks70*rS5B|JdsOvIFY+a#a?|y3-^nx
znV)JDyqcr3i2r!fx+qT2=G(V~ZQVi3^Jtx&6SRV6GtnGsgilJq09{*2fC6#JwJJyf
z1lnm#s(6z#XU?$ko!_kYP6M$N9U8qQY9S5(?arMRTB98EuWuQL4P3-h0@|->$@3;z
zYJ9jD7)!?f{%(WWMifcc8%~Bp5?*xK?sEb<b23*rdC&Vup|ytX3-pT6M-IOxxpbqA
zL4eM6#xW0jy@1Z}=L!A7Tr0*l`@xqwLQ=<0mi7i5EhAl_c{P<whc-DP*2tBPc3rU{
z3pid_>gRt%qLD1!t@=-|;Ir{>Q)+*%wT0G4>PQFr|G0Z!@|sAGHF@0D9($rsyBgv5
ztstl*S3c+PJa2DnsjIm%_({l#ZvCS0CwhNeK=fD7zPMnok&8L>Zw7tJCyD#KjAd%J
zIJa}{m|P`JF)w^i+^kiJx9K5oTxzd)e<$svo#Em3x1A9cI>=pm&@#lS=F4VpFPGZZ
z&K$!l<Q`P<s=%>w;-ra5X&wl?AqAZX>Kt`E{+1dZuMWRHho7zwuMn1aV$EG$z7M|}
zW3{(Ow+zKIMCG-$t5FU)MKk9@8eMq`j%>zx<#bVvSiQ+gJ)Ug-8ookixo(#{yr~T)
zV{V-{;&G+Bpj)!qR#AH4ezm1&Y3@MK{N4EZ=ozAzx^CCFVB2e?QRFiZ5-wNP+5{-g
zEu4JNQD%{A^^IDLP<od{0wweqFPG%NP_;LAr)p&<^Hs;tO`9=##qBi%{(K|y*<Mkn
zGE0kLPNR=BGV52z{iQDC2~1Qt^4WaX4I?dUEV0T}`no&s%Zpiv=5r)tOuhYV>`A*_
z;qOYCGQTzrQ9~Cy`WhFTNVqFLt-L~dpBwQFgP&XmZO->jWl#)!&Wx)N7T&$#^p*bB
zcD8}?R@Jy<Oq_yH;tGgl8qbS3u#%8peD`~zQ4~+v-W(H0oxgc*j|gp&)NHX-GyF#3
zjda|(Um@lazc*XoPkv4H>nq<<DYoh#d8%;z^Pb;{2Y7smS3Yk{T#jZw`U`Jg(r5Dt
zEq%8|GI(T9x&f83#Tq!rJiEP!vGfAz=bI+K@PlV6UjoF&8ALprN<z`c3E@xh@isC!
zUb=Ukd{B#PS$4~P>ekoAy%Rn}K7r1vyifXzl)U3JVeGu}`(Uv_!%+|C2+Mg#nlz2h
zo6hIvrIjLkp5rTumT`I-i9=W08gl8r*HG`!J5$+MQFtgBvKqpVQBibykqo}1WVm-Z
z#7ryiUI@?OzOZs~^8IB>wcI5|64AFV#6d5rK8EOfp5ff;-x-^>pxSFww-l7<^Vl7I
zy|WVkLuh5?rwVtx(I_vyV@M(UjT`5|VS#_12(Fw)4S18!G%M7%!&gzu{{3`=uU+f!
zH&dfc-<EmbD$vmRyCpf1O`A-rJ(Aj$Q@!}joA77-b-u)U%Y+oaW$CU(!ne0vYJAo1
z+MH)hbWLoF3JMDJp2talU2&OaJx3x`1h?>wEc&?hIhaYP_5@;)q9H?lb~*hVm+mN{
z!L3DZGW<xO<>sY9EJK$7d#Xptz#>nN#g$4ovcoc(c2&f1l^c)pO(Js_;?ZBeJSv@D
z_C6i2p2=rfb23m%(B}6kQ@ja@kc_mnaE8CE9DZpjsIya*FA}jO{kQM<_1m{G0F~Ov
zkn4d@h<a<Gd+Ggvl6bILpLuqj1Wnl5zKq(#pBbHaEkc!(DigM1k55|l4ho9dvq`z#
zGVxu@^Ykd)`%aVJwCj#6OiXnqMaj^e1ZFX+g<dZghG3PQ{840!40+C0j%)_<{7wrn
zbC4R`Dj6d+p6<x#*5#EIKF5O#K>oot97ylipjS}yR<qXnYbbNh@A+|o&9&*0zS_$q
zrV%->qp$qF;lX-J=2YY3{hEfpY6}KlzCuOG)vV3?K?Z)?wi|7)LqcO7%`uJy3)$O4
z%lkO{O}H_AgB^(w3&<dnkfmzJcti+pwXEMc28JN;_&)-eF_4Y%mUw1}CuB(-eA1Y%
z#YA2>Z@e>DNL9Y%MSh7xv=vA|vM*EG2ENwQ2Cq!Wen_|8rM^GqL0@)cwB#GZ6?P`t
zsVnSP*sIPKVs=kE&zuL%_7kpOxRvXCANct=F!v~apR#@pf(uvyY)@|8zTK{3V(oNw
z8TsBJUaWubP%-q06A-0Z2lmCOXyj`De$t-@krxL0Ipb)9Hb&@!PS1x}iDhFy_@DS}
zVD>0Xhy2v3?_|6Aw-W|R?iI;9Y82>F^<-;FIiw%I5o=57?zANBV*6pO>JpH;Cw_^R
zy=phHuad1VANuHh+Tlb0sTy&5wcQO#vop?P!zU=to>jE9hsbo~);V;vwZm)xSwPng
zmS>X$<q+~-Fdr|{Kpr2&1Nmn0iCTf`cND;txqn?RqgvrL7mQy&htN(%{TYRLGNZoE
zY%7JF;#<CJ?;$BVc}W0Uho3(oF<-yXp4EGWS?q{S)s`SsYR^%JQ*>Q4^#^~m|IAj$
z5Ly)}KI)(EN}hUV5l460?1Y9{kxRg^wNOkPP4Ev%G`8ign+bb2uX=Fgvq!)H+;;O7
z;1S)gir>m=`j|Pr<4Lrl!@JPS3-h`3?w;E>tdCbKeddMl(~|cuk@$PlnHZ8R?;i7$
zjVXr26__+drx3|01#V?}b%oa;xS1HR*nYS;6r+`Ttu9uL_LL*~jh`^YSX}&iltHnn
zI#yfW7u@nEK@$A3e+f#=$!K<I0dUMgvM4bmZUsJ;AG7*<#@((am_EeE<Hi{39!sBM
zV7SD^+#mktk7n?OrQhrDBlh^wQX=f5W%t_DN5AeiIR#eV_mWw{b<qrqmVJ*d`#!e$
zJKp^3)I}BlvdE}coo{9+A{Ex#9GF<>Z)tps-NOI2nRx7U<z_a!C7OlA&fd`O(Md}|
zufwmUr}nu17isSu*3`GHje;nMAVrj3tRPAc0-=hESOCRBla2%x2u*qwL^_CtUMz^B
zC?%B8yAenL1t}5;O`>#+^!AOVzrDY+?>XPS&%M__e0(56GS^yjj`5DSyk7ejl)AQ9
z|6)bM5*nNzU<uMjJm>>)?sEW;rXVrHO4&XHm&u0j)nJ_XY>QYl$_#5z4-Qn3@S&8l
zy_hb|CQ4d7INdktqL<ixPAkPG*0WLMeB%r88!k&`OUNrU62YX&1~hf}^<S+*SF6Mn
z6uM2b>ZW`8rxtbmly0lGRg@e!Sbxfjpuy0RakI6=iV&;z!();3#xRfGAlE3~*Z!<{
zAASo&TuwhezvEHgx+84jc`GFPpm2&qi9@b=*`8AK9tNPIE4_5P_u><g*a&tx^I+y@
z1=^G!ki2daYcGU$ZDhrkt$H+=@&HIRu2KYyr`Q~@>`b{csM6kP8sk_AR#rnWcDlP#
za4)kJtc;1?J|{EWP8kjrt_-eZm<>D_EsPUZyTf=A0Gc036UwHUhUVT!!09s*1{R1I
zBNlz-i%UP4bL><0n1~+iVXuE|Lur_|iA|olS$xT%L_)$sNrat!A_j)@BcO)xBuZ@J
zFOk6#GU<0SVcGTbja!tGP`kF`>DrW6DsxLI3_nyV-SkekbIIMabyGMre0h(QK<}XP
z>AQgx{w>=+zS?!C?s~#_)WtQ~@XxDsWMWtxlqK^m1m2|)yX<st5O<=-Gx%#Rd8=zc
zh2n?1DcE-B8qd$zXBSHgyGg&iZ*Wx19`&Jg51ODdZYZ*3zsCj8ms|9F^AVV_P<)b%
zAykUnbMgrV(|i?CbvZL19qThvLiOX~8hA!)6saPhD0d<5GqjRH;W~bat^Gu7;SoLl
zcv=KCHv}tivpDtj=u?-Mveq5WlS!@8$3^S~lw34g&$ZWPPIkZ4e93rJM4wHZPkh;7
zgh#2OsZXh<v#dA0QXsJD{aJ#E<gS6i?<I4FM1$zG`EAvc8bVg|&xQM_k@XlgkEw4F
zEaj%r`9sdR#$}B9@hx*VOazsj>7ezOpFXpg2+^P<+1I!56iL$}jsYK!)9H*S=1A*H
zL)65Yz=fgb8|QS+o$Sn()bUl478N?Lo^ZdW)JYTfQF6$xN-@K3{OMC$LbjxUJ`h)~
zy*29Fep{tL!*eY`4gb7n=Y7V|k;JB&XI3E(V#^NNHUNzw2CU0QLB{(LXy?-l1)*P}
zH|CK}*k8WMO0_xFO9GQ=10G$Mp<^Xno3+#!fvX+{0^j|R^Cx@#%$Z285(cn93_}DN
z#|!k3<Dg+L+4Rd%eA(fv&a`AJ>NFHz0L3y9o}gY2jla+bs){&pvv*;ol7drdSDoE{
zHf>z0BZa;k8eiZ0rz{@Ai0{IxzzbA&C{{ozyCt_nF_UqJqRKcvE;!XJj-u9Rc`l<u
z#^oOBSu)Lw4asX8MXcedHbhJBtxs$7!}pnaQCRs0?EJBZ52x5ZRO@6*J;Z?;cV?X_
z8>LrW9}BtF^ESr)rXK2Eb>sBi!R{3=_dZ_YkFA31(&WVkN2`WmN#6Nst|Y}DVsO6p
zI8dsEkZkCUSV5bk7S)wDdY{L3W3iV0fs$q$YU>;8f^J&{c3V=79|<qaI@wkhMP@`I
znj?&AZVP=Yod}}Sz$j|CY~|ba7x)ZZ=z3$$a^hH*k`*5rv-PcTpP7o8jU&!#7dAoe
zCwvkDlIXCx0SR$Q6;C34q1k8s!zH3{fOjb);x*s`#%ZuaW#BRw3JAhi$6Yz&t)&hh
zZv1_(3Y?2$#WP+GVdCX<>PSaof>SRdi<b;3V%?@?Yr|n8DbZ3Np8fy14)y~_@qJZ$
z$$sOI0Xama+6fi<IYUXtRaEchnW2HYF$DPtoIE^X2+w7nM{H!XX=pr7eSK$MT;Pta
zNsVpi!$b2Hdhu3=G6Jpl4sQO?y%rvM_Cc{rw%{er%g&eYZ9LF$Ob#(js1BZG3b^B_
z7D@^55Swc7y;xKG<D$i>eC9!k47kO7=E;uW<oE;36!}`$z$=?mP;e^ghP)V)qO|cs
z`d3ED{lMUqYHT9BaKv5Rt|)fIx*^;B7GVgpwJkUmy5-TG*bnBifzGsS(hV0EYBh2J
z>_Hm}y~vy9kDCyPmry>xI&y!5pG#Dy7N$x+e^qBb3Ld=$Wshjc3F$|O7_y3=OkDai
z9?ku(gKe5c2T%*b?dL1gcrLh@z6IB+Y>IIvZn9vyq1_#-<ZQJD7Q<hI#iz2eT(F&j
z7F)2LlA1ngZ2W#~^MMLScor)>5$EAqcm&rkG%+C|!I$M=#xf3H*q~WQ(t>YXg%{Mp
z=a<=`NQDRLOVnCsa4L&-9ce`zkJga7QTL~*gco@2!g~DKaCc$VcXyZTJL7!e!JFeH
z5^09tz$+MSE+=3K-6~17gvm=vAIx`YX<OF8sUnpkT<R%7{SVlR+SXKFUZT8vZ==t>
z=RGYGh7X#rrGz*H_c~<D{z%rigz^7wH98!#955*#t>k$*{#yk>?n*xOoP>$t44s7q
zyHH5f$vV<29)@_n4nHK4$cB^foA;KpC=^~-RGo=)u_`k%{+z5>Y=6mno7iw)2Qr@1
zbHJUa#Gx-30+zf_;FJALD(PbDNP@mMpW*QA40{wEzugB%-_GqSQEM_*0<#xL#Px%(
z>R`NezaLvcYShdRZ0t0Bym}dG-^NhLT#G{XrtQfb42G=}PrLqI)HQ{onCa(7G|Y9{
zYb9O-#0COyR)iMp&ZveuP5ZfBfwoQ1oRw%vXV;<SdPQz=iX0-LebWET8KrXf>B!n=
zwdA1j;BBc9^O^fjzx@0h(|=W+N|Et;oSZtlGQ*j5Gdrm~{IyGsWvxb_oDD6RQ6cKw
zJm=oMHy0<NNpq8Z6<#r4asL&582t**)1xA-e3Nr&c*o7vv{&-O3Z$`PgIRz24RH^p
zWm(XwyWKd96xV<L%&RhL$_zy^q%=}MI&O?GnX+dlCn1%}#1hgtv-K)%nm|`$npNRA
zr-vnGwCMyx_c}-VrA4JFk9=mzC>o4f2oN;3LhXt_;=iz2?B%g}d=4k9Ro6ozUa5`o
zigVLAJTQDA>+bNtMZTfj|7d(FV;K$uUeSd35~io4;Sod`<|5tRUc0tvu@4feipOr1
zACIJ|sRWi6Dkc70|JgEPn%&t<YcEpTC*OX(DZSNmp)kGms(}*p3WcGRt+xFalwHTd
znN7_B%FLm)-SJ=jU3VnW)Ovyy`$7LDBW#7LSEVJYxt&h81!!77>;X(1sguxyVeVK5
zJ4<)b&Z9iZd2u98ZZod~^mVtcR)wyV{@Mul;$OOm!Da)}PP=;M0+XFHiXnC1pOXI(
zJTm}pWf_6jAp=B>2^K%98yBIgp{s4*YJ@=7RDr!$Oun=J@Zxd0bO+a`BhI$0o>r=}
zP?EM}9ip*bY3{HYFju@7F%pz{(WTd;xom@*r&_^ca{2n4@^7R0dDN_C3mxN;wDaPk
zUdN>}Dv&s+@1dn5>To6R(b}?rD#L?t0$VA-bHCS)eq888Q9pe6Fy6M$Z+4xyvIYc#
zUnGsk^-BUGB2EG2t5r0A;LuXdJJwN>K*~I2YHEu7oH^9E@A%Li7jzABWAuzpKT4KN
zp7KxuDwZJ`!YIp1^<yI=>%np;3gIg%_ZJYm$dGsj%b9V*59}Gn1tYvNKEv^x=H6|b
z-Ny0`^xK@=+zF|Yt2#Gt#NFZi+VOsPh4rzAj++1a+Jyt(U2d#x?)<&G=+426L`8h^
zT3GlK;mTX#^lbpNz_WElM&zAlRtf$bA7c6VPXi+EYIoD6>12?7-gFqK#p)><|GoK;
z5vsi6I_DAjUs?~7k|RfsB(n)P`3tjVV|zXbO?=g0K~dM)w&;Y9yUJ*qnOrCo=luR|
z|7_nLcJZij5+TN4O0&W3!x?9<E@s-#yd#}1t-6Y%-wT}TKF>Nhmk}P1yr<e7kUywQ
zq4c3T<I|jX>hH53PbJjE#P!9@y?L828?4OUc2O_-9%(#oC_iwJ{eSK?tQFG1`ezTA
zc8Wb<7nw<#5Ne~B#jqY@qkq@=`Vs-SNKqgT`rBt1<{8JF=1cwj+zpl0@5Xp|h0mqq
zA;Xh4Q92bp6beP66LnF~Bn-)pJUckq#`;2wlP5L&tHw-IEq#b94D^>bA-eVs<K<+&
z!F?fFcENRlG-|sx@IEUy&GF{d$?E$YeY*<Vq))}$3cakX!wBUsPALa%s)?KoS>2rv
ze!m0Q;wM9!OHkiE*UmFvc9^(y>vQ%Axi3*3szWE}13wr?-EjI53bgnkh-7gg&a(=m
zAdJjjt{GuU8l;Yzluk7eA5x(q4n800vo5(a5dmPXzP&b#j-5=<UB{05<{3Yx%6%|X
z==V~^1Z-_AVNO!MX10QBjDCT&7ApV81+qHt_V&?amBA$-s**faC>6&ONp5r>+QB7x
z7l<!TP@aQ_v^(+XquBlyAZvCMT($dM9l((xxF#Gc;zqnH_RilLXKS@mzvAU}*(q8O
zy$9f)N*l~P!5^UwH)LH>|CksxcxtUg@?m6J(8<!mYPlYXfqOMQf+s1%>2CZ!84sBy
zQgM9DVUL{qY8UfOw#V|#Gz1!#eDzD-BAG1r`nlY$G59pZG=x$2%UT<XF;xGE=g~m<
zE2(a7@Gz$A=9k||<8G@{y!dfA_pEz7w#udy_aCjuc8l^<w*fHFYFpj$Bf!jl($Op1
zKk+|$5uCc!B!e>w%eB}g5$)qASk1eohVT&Y{`}G;TRJu}pV=?j?&<ZRdGs4%G9Z-z
z#=eO}Kl8a_@GawVo{FsIE>Y~;lmteqv2eQ?GRVQr-UXKZeD3<P`mBhzhWhH<>1aMh
z{syMq+I#j0xv@~4e_1(1n}xC!r}FqX4VUDLV~z_a{Xcdk`mtqK9?fstKJ%`!Bgj#I
zCeJQ%`pLgW6aOlES@3UM+Bg3WCbETcU(QAlEdJEJz4=i079(}9Ii2&!rd4~14XOO;
z8~rNow}x+A>gDjH&0^c*<sRi9zhN5YT1PB8@-<Hr$Ro{tjQ!RA6&GXUwd&jn)xpr4
zCRdw@_x1MFxg@}xYZw8OfFkrG>ClL<pa5b|uA|Y8cNuj?D&lc3;kegvYKy#s0c(z`
z5ESJF#C##QMxowpWH87_`I`QCAdJ!}D6I};zm;6A3(D9|2uLL4TQxYtLZ{e7yasIV
zKPs@5g3}&|UHEIoy-<qK_Hd2NlSe&mW;4v@BrPq``;T%gMf<T$D|-YT`W#dDIw4^Q
z!^l(cGDg#Uus+s5Aj}<{?CjH<^;qdl@XiMi?IYt<rFSH0seXD50;3wWc+75L_q9HI
z4ZO=yV2CLQonf^eFZYGY5}p)xTD38y(i_*j`N>jqQ()PX`0W#&5}P0Q{X8mbiifqR
zn1TmBx<OXfXoYYAaZWcMFke<r4t+$A5mNE^J>mNth^>g>CT8us-FIEnOHd)4f>>Zq
z!962M6W*rUVY$=O8NM@Gp!|e_G16JU#@VgiJaPEtrPt5TkDl$8eR*r`8L5XUwG`Vh
zy|HFF9{tmNH#S4gHgZM%E|c&(-n-zT@iS?J-;_snQ^qLkFF4Ua$5-vis93?D=u0}$
zGX&1Gr(k$>ecd$4J%#%70~=O>5^Avagn%+E9mYGbZJ&Q}7<qLM6=HL9hQ_ai_s2p-
z3q9eC)99Q<_Rx5z<$D2W1r2XAV=*@#^AyjkHu4z}Efe7Sw-tRx2O`G9rZ1pgjID7M
z3ZNi?&8!nZ^9%#7?*p5*KsQ@w8u>j<X1qr>$$Rp!{iOImP2PL_TECc#XGa|Lt$9P}
zPvFjCz52UXaSg_!%Hw;5mICdZ-3Ay>%nyvjS+e9O+xVHUu}^88vfgGQ-}+O97`3MT
zrQoo`iZ7Rmg5wU2z(5>@iZtL4bSL$TFPylRb8X?iZT{BWEJ@{a-kQvP#;4Ik<8Wz)
zkO&h0FN5WW1f=<`TzAJR%6=NV=3jC}4spF6!kC|IuYC?^uJU*|J}fx3RceQ#FJpTF
zRL!rLOK&5HZx1xsS^Cf_!1AmoF+T_qo7tI*7Sh^{RVc(cOU!c|JbsO&_<`tSJ!Q2$
z^hpSN$V1w?B=u>+&^VHKz5ZL&<3ZrBX0fL1hPXAf1_hv66#%^i_&`mBN{;94onrlB
zt^E^xNOUZv3l636@Z=vrY%yt`tl@)rmqUm#15Hq&8X8Lv)Xru)yG;@-HgWnELT0qT
z(W=1k9MVbapz$YBocTj+5zSigFJ3{?_rk{sb?*l2mzstgF$Re1yv^Gs8Q+bf+npUX
zfq{g*v%@~$7hCu1I(goa#d$!uCUFtEo-ZM5nJ70J)q-?-GS=~-exs3$Myh-Cip>#h
z)rYVilwt)6-<Mog26qyzibvG>``v;VLdA)E8u2TEF+ge;whiv5S3IRcI}~{`f>SSH
zc`JmsZ2xy>^t5XTlfgAtZ<FCUXVk7B6L$j<prG5W`ezY-H039F<REv~;_-E8*_J2X
z<>}OHV|eRrrM$MgH|}y0O~Q~-ajVFd&D?l(SGCA;PVvItfVIAKyol45DxZx{WiZFq
ze)cIBq=Wks<*9MAgXi(yN}%BK%39wCIKd^*ol&vJ$%sW`{TF(jfySgbtCG(%&+KyR
zYo%^Aytl`Ky2_EHK&LbBFpjPtM{;d0nJ-GHbUT@b-MMc6?9O+tkW_z11&4tm215^_
z`yJ0ZtVPJg(MjM)$3pB&(i!$a-j_C%V{r>)(calLAXW^+n8pK6+;EB~u|*x?p1Fpa
zYY%XGUU7Eodo_e<A3`Stry{+`^z;yBHXF|c)w)~=eJB7xrOZDLVM-SaENRIjbet+E
zl-%-Tp;WO%R+Qznlzm}=A}X$Z2h2^??W=jJUylU!?+?kPu?fnZY~$<IAxhQjNiZsK
zF$v{WEt+&jj5VIj0YW<ECc^=bXPHn@-2!?=4p+#VrKvufMHcH00@xfBfHmJ$>Rq-h
zIj^P&`kRPpBJ<)wg=mD`Aw}n6Eu-KRn#!Xx(|*&R=e2()RO3vh+J4gOew7ikFY!~S
zM=+|Udkd7<PW<WqZ29{yP1)F}B=;ta45WBj$rfz1RotFCxQD9MJH=$_J9zyb$)T0T
zcD~Z`qxjLIpMEc)*LFf)j7zt%UD^7!!p^28eaRR6Qf~t@zNQ`hX7>2l{U;5M(^$=C
zk{$9F<%@h^EU4nTjQlwA%+>AQhD%E>1f^XVbiMK9;Qr$P>L@;wYRf8rhBeSiCz
zq)ha};|sUsPi;Fybk#FId(Be5KKPJZ98Z%FMXYB>&uN(G=ziJFr~(Nr%{I0`RT0fU
zd@Pb#uka$#PVDu^S?$5}$bN2ybYxgRcIMAWjx)|ulmRpHyL<W@Oz%Cyxw%!Sw3(O0
zQ}t7+>*vz~>vr%w1KnVDTiq9Mph>N}VrPIcpC`roGiu^O(&=%P1Ml5}p7vVxLt}vY
zao$fD#przb$?{-w@e)V|W!y*J-%Z{};-e!`=O(Cd%?Mo)hO4M^-}*R--)AT_l$(*B
zS6<irnE-}Ak#}GqeEc|Wez?^`8a3b#hjMmXMF5h4<%O8#rzh2wK~O-MqmSVyUn|8x
z3pgmj_sU^n3T3$;)xXvBYAeov-}U<A!|Ubg@z?JUVKDQ9>G|wS0ZTit$X(SjYwYYz
zY*Lq=u^Ap7259{0Q<7R%P}qrd&jYI88_-)do11%S=)A)tE>Gz{RvO*sdFb_aZo$jJ
zbFtw<Gr=*!|NB^_<#}XKw)y-|qwB)LRxYzs7Q{+j-fI`xuu3X-&Sd?zel5Xd8qOdC
z0cxiKG=aBWmVU3L%>gC&+ixsh+Zmi|l9jg>LD!_ncRnp?I->N)=*b)|rn^cHPx=Wl
z%F?*Mv<+d{isa^2;oz4~-}FldNQn<|pKTZO;HQ;jRPGjVQAVB31HZnmh}Pl4s68@L
zf6<C7M&Laa9u?)*Whq5QFg~|g=f<ee*)poIDTEwnw<$=YL_yin+cj`+nhK7{+z^ud
zAqUkz2ENzPfc7_aMZLSe);*N$E#2_o#SU*fTZW&;gH@gJPaLP-S&w68s5<)(HZiO*
zdxt4q;$GB$8(8?;s*q!3DHqpnf-H^e-{}%LSjf?a5PPD}NGr?X_=VRhOy~KwPd5hL
z#`u1?{5&`ZMVDfngGK1<R62HsHxTj}MW)U<L5YDzB)Hi&NwY73{3IIwEqS;ReX`Mp
zdmat#jAE(x;WkKGVfs+Ldgt+xsAW^O9|2$ol-)*!6dyhj2)@EH$ukLht&bL_D=DQb
zGKA68{@z{Z`kFj$T3a84Y&)Iw>1MDs9tIzhR!19yoGUw!U@b?Jk*13E^ycm4BPUMm
zL&`mn_35Th{{|_<b3_}W=irI5zk8c|4@Y?S*VKldu+wjMDRZ^kSUg3!;ZQrToVmbm
zcWS@rl=GrKf^wW=`!jG2Z_R)CwQr@KJ`UXBQ>NY>JeV;;<ke*r9-rn<=X-%ZN~HS%
zY_MeI0@`x3SmqfRKk1}1G{Vls1R^Wj3DdKHC(B^Tc(TN2zZghDdk(M8))TxBhpWv@
zEd)l%3H$sw;P9=exeKkdQO6`Q1lDy5?ou|O8^FV?!i_24n-w%}Gt4}pGD<#R1Qu(;
zrry4y{Ld{@n6FDvNk>Zu*mBH+qmb33?Hv74@cNH%_oeyjON4|2tba#Nq2i*CPx<YJ
zU-hQeDoD^)w*N&3Y4DU01p8CDg-84QeXd2liHw@awBNvZ{s946p6_$f4(sQzWI;dx
zg8KeN_W528e*TH1V+UV_qVOv)#u~3M{I5?GA6vZ=!?uXz!@n5$Bg4G}nBuosnBvg4
zCin94hJ%H<ilV^2ID0tjPfd2e*G+Gq?JYQjNS4Sp!VGUU)}~NJcfPiCp{qcN!3$Xl
zIc}Dbtv30^wBqGKZYk4nNLoE!S`7+$F1l$yiXhQibOJ^cNy@JS0pVDNnV?R35{U|R
zs2szX9_up<(@M@9WvETl^$(gBUl^&`0ALK!u}AhI4bb;FK;cuB`_n+d-vqq@+*ha)
zaRCK~TN4?s%X3y_-`T2O$aBp>h5rH#rWQCa=~QLC<=5Y5Hks+P?I}wu!DmXZH_Er#
zmp3O_JX>nywyKBB%Xfe{T@Z_XS&*5;!()5%rc!n!+)g{izae9K(`*Qfz=OV2=mcP5
zQ6ZnfJ+zGeb8b)0RWZfW@*$}(lZoa$baub0Dp|)y^aDa#0TZwj?rbKqYidpmQ>-Z%
zI)q&r3r2P+$}SIE(dXK}%Q5hxbX7u<`@{n%{!7E4%aU_f_k@`7@!}P~YDEmIjq@T*
zXNYb}{@?=A3!11LE>xH^$KZ;|-@C~5V9BdqEMk6}gWLEGwZsdMnTaaJ^Wu?ko|mvd
z*=>u${b3RrP|rnSAf7ELRkIw?JlFRDe>KVHcCF>u*R}4E<Q3@#o`Be#P@B^3+ZV<)
zc-W)7_@&M5Iu6Y~`LzEWr??s30@vPCmWMoI|C-BdebkWx==~%ZOyoe?DXXMOkqiv(
zKh=yrTMD!ycz`}f=tPp`&x=xJ+y4N!Y{9e_kHCB9YZu=eQ^2!zQWbV1`l(J{`3<mL
z8;v~vLB?JEH9UYnz7@Y)N$16bm)s(`&ZC=;bpx4=C{vD8!32H*v4iXMnhFGF>O9!-
zB`Ig(z+8!#B-;Qxb01`KGaJ7|hi_Vx8jY>Bq^jM3E11=ruQyy+SZGB>>t?TAOt@b7
zzUL+J@pxIqoV$0+L{8v4++5|OJV)(1nwj|&x@p}e>eJ)??JQ}N4`!=^R%VWwDjFNi
z_m*1~&?qTar}}mfJ+)mNxco?4^@}8E1$0iL=10CD#&bn=;f^JUL12_YdTF}djWC`X
zAGve!vyVNQN74hs9i<pi76B{Yvq|Ut@*M0FN=l3jN`&|pi3h2sY`b@APEJS;O*S0(
z`a(qPOk`vqg>UYY#BBLw!nvOfo95<~L*$-6g@lND-|J45LkC}df!2UD{W(#>_))4>
ze$kNRZwQ7Lfjqt2Cw4L9ioY7ZObts)3gML<(S+pf?GSK{&c1kluFo!WI6^E#X3Y%D
zPJn$-?LOI^Tw9uG?vvAK8-u{EU>6qVv(R2oMAtNE1Q8+yqZck-Jg;!%h2K7uWs;#s
zf>1=k8i(<74A$})*Sj>HJ>0u%YM*hjX{33oiVvEYbDui&f+pFMksLdA|8)3UBNRn-
z)6tKJy{~;elq4<2mCHpvBKENsL(_IPx;8^`EzjGHFLRQXNZDe*v}eS?jXzG5cmc9O
zwoB?OS>lLR%jT`8%+AMa-7sm3Y^v>tq)P-CcyZzBu~_lJI{H>PvHR{uW<YdtY|da^
z_D3K9$=Y{IAVL}B3rmFo8$NFOj7&~dlE4<&PVct1pui}OQt8oE9Js0cB|S;<er76d
zxsA@2@fhtCw|X3X3tXyKW!L56UXvGLE4$ULh<m7i<;os7q{4X2z34$Gbs}#8f=2hF
z(R`QG7M>VyLekoMw^a5yK){o8JCSXg@)T;s(_j!va>dus7HEt<G^b1Ij2Gt{-536a
z`>nt8zBTZCw_K!>fep^qW})RNexY1A3GMcP5a&jIfIxmFJ>plhlcxKHVg=FGv7<z~
z*$bvT<SqQAvO}o-aRPp`l|l7idp}NgzGg>It3*m<@?XM1f!M4|$3DD6wP&>*($i1D
z!J9(gQAyA?99|vUA&($@Jb571{3@#rpo<DfvQH88(m$`QYI?1bmYml!Cm)gttKUlc
z3g;$+L%qB#rT+us3-)XPdfCAT6gRQAMg)CoX!T4&GFI^(>E3|=QI?$7H;wXAZA;A+
zmm3w{RJ?j^Ytk>y!F#Pp;+<CAv!<u-wrYvDak?rraIbYGqE7^5{_+bLe&LOGYfRtC
z%&M92b#Uo^w7mU*5tTyUT|Pg?SD@Iv+afNn75^oOuDw#KpHJ05%A{y#&3YxP8?{Xf
z){3MWFe|L;)!`@o%P)p%P<dPrP+DgsFsR1n87h-XQa@SEUP8d9pV87v9^JPk#KJ96
z3+Td#m%)6~#^h%F(&$Tejm9M482EKKA3h)!R4KEJ&ebTQr#P-~FJ%M@L>7i+-^{WO
zG~JeB;J}dT1im2OatX0!DlVFdQJma@u_uoA>^~;gB5Qa-Zm}s1gv;Y?7DRm8)T~|0
z?_mj(aI9LzbG;D$Wz1m39812jO3WxT8-N$5M?P<t*QhumH@(vC`{>c*xur$PTiy5_
zpdQbZzG>T6;6h`Ztjytmd+n`jec9tY5>LP4Y+X#^KuE{4%j<>9Jn{}59kQj%!!GI6
zos}>7*YKdBwW(%O8o1i4O$bmNEQpyM25)>6Psh3DMIhtbfV=puzQQArgelYo9=@{L
zjSET&J_sE%Kv?)<8nb@oJ%5vb;dUs4p-QF8<PiV2f`>+p%+3pRN}u<NJpuORZuGgO
z1T8Jod;Rj#-NK-DhzJ=fXzWBLi4S0|`3DR!NC{3|0zctGJYIRO0lsG{4=w%)n3NK-
z9{{FgKn_lYOvY$n$&}v=l8_FVadC0Ml#xY^DR`Hc-nt&WxVE5E)thQdWSh2OL`6&!
zYS>6kf5-X)W5>ae14sRxgjTw3*sH9O*7+w&eK8NmgT5ec02vMU{4k>S;6-9AY!M}t
z-Ew!#dwpsj*;MH-^ss`CvsYaNcyU)qKU+wuiu=U<<7=j28HS4sMh|2#I|i!VxdsE=
zpD^#0il`%r1gdi8>3T8RrJGR>)k&!LsrTZhcg9YsMJDic&l@?rl`NF2C<@olk6n|W
zyw>laC~Q?l9KXKy-m!@(rvJKPpW8spv`;`AMQ24gvvN!Kc}OacM2cNW#M|q~_wg=&
zztd-|-dnuF@rdh7$5fh$!J!V+<b%}O?yqa4*_i$wnR~MtwM0^?;mm30TXg(IZ$=6n
zgY#5YHl*hV4Bh6T5FN*IL2gzp0`Ck7<D_wt^|L;VLglN1-*vLGvXW|5GHQG(wz7|!
za+4j@tm6pQ_Up<;xd8^xwVAz$1AB4%*oj{Bl!eUL{GiJ?;>bC`X1Hns`!btKq;c<2
zec{KyNvL|DLsA9g-$rR2&#sH(d6-t@4UmXHfs1xWwpN%Q#YNRXSS=+y=Ei2xcxmaN
zp=C8~hi`(=WOv@Fn2F-c#a9-%66!X|l7SmB7u(9(0BHu!0zcdm%81QQ+KsMvhV8jG
z7GomuQU48Lb7E4Y312{Jpx2?hNr0aW!MNeB4rlzx#8|B_r_+!J;=;q|o8}I!Vt${o
z9mm+qIQ2WqUA^bVPa1&~^K-GiAx)6Y!_2k$2&UsxM5_%4juw1ib9cxaKKYs4S<u1(
z&n}m5uNd0|1?oxBH)+czMAJn`o=8=er3<>pLTo&1%Es{9I87;r!Ejw1CTm|-Fs}|_
zdN6{0)5-Nc%G`k*0Rb7Us}pzB6-2tQSLh{8zG~vwiU-V7O5TOG6u%e}84DX1Ql+Ix
zkovn%t-KxH$-;h$wg_bUudmR7B{?y3zv{xn*)*d{gjbh-QF`7g96YwyF(|Pw#a^+b
zg!xjHg?;K#ixb<P57XZo{1CK)J!+~*dhgz_ut$F|Wb)%N-TtmKMrSx$40n~9mtya=
zyLcCrL}b6elj0c66FB!m;WZ-bWt~AB1>DVx>Y~!BgnEf3M8tnVAk0f&40qC%u290p
z`PW;2`?)Ui=ltilC~6+>ekP_QPrQln5?<SH#M?DB5ha@r#OLJ|lTZ!XUJDTchqN}r
zdD^nyrcmZ+F4Z^ox)Mc|I%aFcZh;x+5FhPrZ}v~63TBl5xQ0|^S(lv=u5y|J=K1hb
zW8x!N$PqnnhTq96$@J}df^Y1`<&m-QGpDle+>h15mP?U5q2|RYqF?L&w~$}T0f+GO
z92%PS)Ge^qgnpg_N-G`+4Ng_YokbmA13#r(6Rfw!cc>Fx{ilrDHrDv$N&U(w8|8U4
z$aLyJM|*Rk@w?1%he7&X>X+!h!0$Ix|Fko_-n)kqBIU2`m6hf;?c9ZRJ0BrZ)ZWta
zK*(75xSv{~T|Z0O?1x8=RZ{JSyHcoa)>TIfE9c7XT(RTLj=^zh?lz8G-r2q{l-jLW
z;M<RA<vZHl3=7P^Iz&}YUK~`J$)B#P#ZY&o4c0sSf_ys#9`8LNxqTS0Gcm=cdrr(P
z4!nwFz^YX4eE#Ot`nJ!NEq!yO&a?aG_X=;N)sdRSRVu^rv9$UfGgP2B0}mShocaSU
z#RoR^??I!wWH_Qr$u}=2Lr?7Tv2Ok0!-wSkw>N>oQNTCk*`2EB6bpUl=PvPM$993k
zws4C4Z5Zf>gR||Ltn1jhtH71GDiD%IgSehR>N<9;b`*F+B*#<fN%|@DoRtG2vinzo
z)uR}?tXNsK03e`SNL7;YYMjPq?dAr$bW;@b+=I~^`h_&{2QHX3BT8cYy`8b)u7MHJ
zh33ZvH#LXRPAAV~ZMPH%;<@1?(9hIX@#XTBE02ES`XNFt2dCyrBPqTFWpuU_y0`o7
z9`ha4?&+JSx>=+JK#n*RnC_(gO!Cv)eH#aN#=o%Epf9zB#{Y>PtHbz`($d1C0M0jX
zUxmN>%Ld=v7gC#+EDM!$3qRwzFsOm=pzjf(w*1iCdzLi_N(C9j2X=z>Z8fk-=K=mt
zR@MUN+^Ke?esfo+A~B>*5q;@ESauC5;G^3B`q2pBqKfWqTkub3Xk=kyxRsJu1@6~Z
zscv2Z6Du?-eCdZ3piux_<0@TN;1V_7OvsQxZ*g&oqj`;{bXo6^0j&Q}F;h;C5(55b
zINXnW5vrlPIB&n<*MskdA2ISAtbqMjy*C~IFH9{rrBE@-&SlF^!SISR?%dBYBAE#H
z(&isH3JoVN{30=>yFWM*q%CIN&;wmV6Z%JJU4is2!Fa0YjeY~`HI9%}h<SF}<x*P(
zyfxkvcdpI2Ek91~^;w#6oLEl<xZ_WM;6CEUyI%;L*e3*klc56@Z&Su;A<0!`$reiI
zTnR#+2*)?O?PSaj7VaTnwaB}}O7enx#c?hNUDLMVhA>Vr8JTFj?ah#lbS`HaPk3ci
z-T8V9iH?Kz^c1YmJa~MhI}g9Asi_%NTv4=NeBb0oBh)f#5T4W**fEGFw`4(mUs8&)
zSCOvfj{g$2;R_#GUF9#-lLpHJpV&1Rwz5>6_?90>k%w5Y*AjEf`XmGDq@qJ_N0+#&
zsvwBT6+0u^ZHImVilCDo*a;cvI_b*$AmJIqpV=_g-lo&p_<c@qx1OL<I@(PX-1BwQ
zsoRNXU<&MYl{z#5{Y3;MLyCJoJaOny!*&aqogvF<;21KBq`uCcMn2t{T_0K4pvKAc
z)#kPiLP;y%9YOm-U9z{sbUU%vp<QY<H2J{hy<7SV4$G^~=T4~Dy$BBjvLf5AU2+;)
zS$CTS$iz+LN^!2hWC<2*?Ebqt>9VmsT$N+2*^qG?|0s$=g>RS9e<aeu>~oTAiLvAU
ziEyjBB1-Xy2ZfG@(umwl)si{V_+;w=B-#KzS*{_+m4;eq%v8yWmB*gJP_e(rLE3rf
z=e;(Gr&w<ywhi+LuTgn+z25CNVo1>S>PPM+K6u_n$;#<E58d>y?RpoaqRe{gndIf?
zq!AZYJtgV8&Q9Z)MZUDR9H)2fN+F!uq3g*F6eC>t6Gv7o254>YEB=w9h>wCx=6$H{
ztf5BFZlm98egwH^Pq9WzSyZdOc=5t@5`cn}K!<h>Nk#7jzuI#}_C0M~-s+!UUlMsd
z-^W)pELBiYAS$o`KSU?pcn0ao3eT#@cJ4zBqeJo{_;R9t4L*tZ1B$ktxo}|@cmOf`
z0Zx$J=Jpfe(n9!(th<Yl$fUkxA%FP^Je{!?D|Ya4zR00KuU+EF;u!CP8Dq&q;|^J`
zM6~aGl+DV{H2NYJdq@qnFUPnUi0>=w6|BA~*QJ+djg>N6&y$pIXQa1Ya;apBFFfuv
zK3*9S{^vIMb4%Kqm$`n|Imv;ON3bOPE`~HUmwpFK0=DZ-JRj>pMwu-b{u%)ig7t?h
ziHCXVLlA;zzsk<GhN|2s-|}7#YQGO;*p~JE3fB|^8e%7NDZ{06=T2H%k1*4>2|9S#
zqK!4%#qS`0qaQyq)I?}piIeL;-?|nCXI$<2uYbczAN<fjYXR2|YuFE9MaG~(ehJ_{
z{IeC5&wvdim*cxr{O#w-!Lo4Pd*<M7P|p%Nw{CNVd+li_d9%6*i;)kYj&scutT{4o
zJ{{w_I5Mwv_*Ek{6&ty*e*ej#b9%+!nhCLcmzS6g&R>Wje14+Tctog8QRAmq<)~Ts
z6Ejt5XAIWh&t35;!Y}u1{8@=JEk_4MAx3)8sPHB;oI@i?Cdz{9e!M;A{p`@t74e6%
zx*pvfrmWG}C<qb8>?0xUqHk~&_pL;^F*k<;48ai!$j`&?r6#*_9;ccWNPNq;3Rzj|
zc^AlyX<HH6j14+!U3ujnHqy`-?$wlp${w4g1BItZetiPQ-zy*H-&)?mnC`qhTseAv
zzWY}p2R~=JQ`!Gf@DS<p|3>gIG97)2Sl{e#525O!L2douWqu!0TK0l>s*BD%8{<6U
zww8Um2-@)f8MdfDNdRPc1Omf7brys%Dd`}D=?kce>9dDs$)Ru=f^$JoA>6|`d$0rG
zY57|nba0lO1e0-_4^M8ImJ(l(Um8mLZGKfPn(1KVL(6^)#ry}xz}SYS3KG%+3D3q6
zXdt?CeFh^#gKV8(z&U_?z+Xma12IBMu6JX_4H>!=iYHQrtyCbR41hIG10a$SuzK5}
zudr!-=0bIKHD)eFBe_h>spPidka~OlMpS0VJ0%T6wno{PN$)6%JqJn;1(eD@8~D1M
z4753P=<$k{<uaM1jMnd-xZ@f;QmL7W6ln$_(=zpl{{8*Zs?-rr@R7VO<d&5+s(^#T
z<L*=!UsaySeKA6H*l0$0U*R_~g&W)n(rIyFObZHpTd-4m6Nn>mYrh}|KJ0v^U$it&
zRp_GQjs5$y)=wR0weK;<-DTP|ccb$U^K85Q!~2wIzC#=4u;7JyTZaBatqlJ5>xs5@
zbhH{{7LinGsp+0weCu@N=wu`RFaC2MkBiulqcW2{#;+TieNXbeqpA*=#b7;p8Plwk
z_Vta_m-n7vp;>OM?!;ofB&0Rl|LunTN4H5#U6FgY^vR`3lN(MA|7bN8Z6!gg=^QYN
z=@xVFr^Eh-7=i%hl+l~T6HekHaEPwbc@Ngpnm|k<2o5eNa3YxXN>~R?#Zp|Qh=~94
zfsfGwF~cDb4lzf>mW9$f6VP6^KaVd54888|zKWj?>)(vUt9jWsAFdpnbicpM<ZT&u
zoIiD;x4>RZ>W8areQ-ko<~#oxt#Puy_64butB4V4H2;Z~bwA*02)VVf_8(#4kvvnH
zG0;)Fx@l6r>buO-(e|w>kjHv7_L)B}7Kru2$GIMJ%~LJxKNskVE%$Hx<uBHUn>H$5
zWbew=7x*7|^~<*N(zkk_J-5NmH<a+Sb0RS|MUMU45KADdnUleK*0v&UBX=rs$k%JS
zxTmA&_EmzZc+R88k7cbJcXn#5Atq{$I*n#Z3N70?rWn2#i~)@7Oq^F;{HhKq(Oxj8
zn(w-LDY@FfMWp0*Zw;Y9+0#ts2%2hyPyqqCtyGsfHnNMHO^6eTvub#dth7`3qN*<J
z-?kutxX8alG4W=TBtH2b8YV)&?!5fk|KDH>gyVsaMOs&v0Us6o%3WC$3U^}ZXD4C%
z3mJPF&|zI#B}<cRm{g8vLpGiAfX4C=gFHAtZXd|-Q+Lh=LMv&%_|kbp#)dsL8t9X4
zZdVMM8eA_YW?CV+RRv8?my=Z?ZXPq&EhIGOaQauQ==$becSB=S(=_jP)$B4Ke>tPb
zNm*s(Z{O=CScyJAo`>Z_P%liU&O_(Ev()7;tHR9JL1O2BWmTk~cSgk(Kp6;S9Qj_H
z`sz-Y%iJZ#*E<_K<BF?3sNvZ<6$4|!qy#aJ#i1%Zqa}glJC%YuN|CsiH|l$OP7{U>
zUIv9oqyIe~?MfJYiY6s^THf7Ja`6}AKP-Qe2)WYkUo?NV?$1k&qj}6&y$g-N!Rh#L
zooV|r)A*WRp<Q1A=CAbP>+x}R>|l}iaj6-yVIAo;@(H*~56twlI$#1H2M;%<!$NzA
z<NHuvvA}~6*Tw7ls^I&2=C8uJdqLKG#eZ%{Q+v0lOtA!$0#e^lS8k$0ru7dCeha(b
zP!V};gnd@i$HX;0ID*fil}^_qO=WVbG4T6SL!I<{M`2Efsw1%)iF*95hUqAh+^$<?
z-4yu-$uY!&ms{E8NcwJ84;Nb(DICzOSH{zC4;Pk^!MKWBX-j8U;sA`~ukK0-6nzCJ
zS9o;v-Bv2emPQ-$8K2#u_WDg|>nL@4oy_8+r_Yi|TAGSoXts4z`-Sp!=ct4->301+
zb#ob4=*Lnh-We^lCU9{4QU7eD_KreV_}f_FnDT?~9^NCN{qj|;*v}HZIG|z?O}g6n
zxOZ`^DMz*BD98D%yWpD}rOGEE4afbJJ%0wnS**+BsZPYNc~h+W;=f#4E8iRX4%Hr+
zCebe@aPQu5c<$u^^2W2HM_N|<YlCFm(rg}NRVL{_4pqubKKBuj=U|<1hI-<jRhTfP
zC^N++{S4Q9-sm617nfw!o_r#$-AdF2^V{83sy&@x!f0M`=-HFm<W`SO0n?b-KC{;G
zwedAi!)KC-lWn%Njf#+pl6_*HSSq}|BU*zcd)nQTe#Uy9z8e`CDd+jydBpn;bOfaI
zlZ|Tz(`F&B$73Gs*193$F?sjs5!CDS12C-<v0KC-&7S#`?}%B}C+~tPxXj^Wf1reO
ze6{^K>Tub1nF1q*GjF6UJdU*bbMnU6BggbMnIsw#j_dh)Kc>VRg7|bqF|LetqK6NU
zG4?+Q4Ym3;)-2j8=`t67j|88!`fq)l7EOIx8Pw+ed`}<}?lo@E(CF3zK@3)Ko{xKq
z2NV`ge<B|H)@0e&eW+2IgY-`Rp6<rmkt3>%^UEW|DVVxm9Nf5(j1=={^s+LzIW@sV
zeYEsTh+#fX_Q!1d@jl~I7c`k=wxm)?*~foh+)usUlTm-;Ed>-h$fV1CQ18#o&J#XQ
z{G(XSBQTRVg4oSZ5F-_xhfe;6ji#%Q8vu|Ua0>q<M|-p8Vi++Qm;O}uX>5%9)YqnP
zNitT!Ik>o4m{l}_l2*qovgX+Eb!Y5!?59FuEq!$5p0jCgOxresb@OrIV)NTrFs`<~
z2CxmjN_5*Y_+vj2&$VI{bFjEktK|)_Q=WqrJ06m!^j}@rN9g)83=ja)Q!F^GWgbd;
zE-yIY7oU_Ao^!S4BTz!G9Siw#5l0E!8o0@`J{qTS`A^NZgmxX<slK)D#>y*02cIrB
z=Mj(7b;<`bm9Br)Zr<BElEaVuBVKj>)pzCZ+=)0nf2r*O=@>QizE*>D$G1xedrs)z
zYE{41V!P}^=wXf*$GVA%ae)FNIDujP>sB<Cd4=_~#57)pRFX)Ym3~=Z>(6S1q4Daf
z{9BvsNou|d5Pg!2!i6W%uLCVWK9o<cDx&n}I&iUcJhDbO-YDGua@Z7Tzvf$dwhz8E
zMe(GveU>sShw_Ull^<-uKSI);Gel-6!xt#6P(2m6QT0p#lY+{QOF$rs4~0nri7M~m
z7Kai@j6DrIip^W9i_mm$0RyBTo(*CALkhqD;DPe^h4UZXTNnDOwAue%x@if%E9fgM
z@cDj$>|@3bkxYvCp<ot4H`S1}*8ieT#niYkWwg$Fj8~o{J;h5UO{Y+vgI%GAj=K=!
z)?5_=0LV7EBc_4DJz(#kohTx(TsAjyGUIi{>Wec{sk7;`$$brG5v`d1#N>1^E&2~#
z>K$y2Me&{M1VQni_~~4e;$1>2?q_EwnTDGSW`~z$2|AwtQH^~B*1|kgxGEU#K(ZKs
zCF(k>V>W(eKO~Es`nToGot(QTWc2@~82i7-QkzvQH+cRGkN$59G2g?zU&^rDIydY#
zw%x7yP`sc(uE8Efkz&2Cb{~{e-cDV@V*KmTd`|`<`tPfqV0kGl5_XA_etU-POM`Nv
zJ7MMV-srWSjYG2pZIOU*+0nB$%g=_-oqAz|9d68S9GP8SxMluc^Z61tmL)aTp`ih#
zZM90WI3&Nn>(H91e((QbMszG=)&hi8%RpX~b^IoOcXn_<mP*XuavpvW`lA~sz;8sc
zxM<*SSFGtK#oA{7zx`(ZP3t}%@o!r9R;}M!m|AP>iAjSOXBSM~m=}CxZXHsnxJ@%K
zC70zDlO7EJTV~qC-fyO=jRzI<=Mu*oZt*Pr(;38~)<*3qyYEYTC=DRadH}<0<Ze{(
z`F%?jkRPw1drWhXaR&?uyfEP`45y_!+Z$|}_ZgZFCyjcq$NEkc5awW~97Xbm&mRL*
zm)9+_a<N~<<1^Og1fx7x&_M9+`8zE74aU>5;CI8tRQE4_cT_|~9mHeK1H3jmHdOf~
zDCEnO(NSHmPZ;e8nnF0pP%dU#AZC@1`U{m%LFK^C;lG8}1wkqlYnd=&qKz&AH<IPw
zW!Y-)v<E^9g<Mo=tdJ5%rp`*UZ5@f?uL%5d^bW->0FtN#+v9lSNP&L|TQj@Pxif6G
zA~T6xcMxnYwFr>co0ex~od#7Q8L>{*P_^!99m%b<jbPtu-t>D@WS>vP_mceiIfLls
zMP{PV??d%~#0h`AuL#lH#Xr~VC^PUDW|Q17dTdy8q;^)B@p;mdu~ESxAQI)Fdx?{r
zmKMH{+WlNDBz0rgPHbC=%>uCUn}^1Ct%RihqeKOIYG)QuR3{PW)iDMrCrJx$D`F!m
zfNwknV4xkG_ZNVS4Gd%#=Zp~4D_LO7D-HKZGVqg&^X9V<f(U;2fq-+LZ6Z3mr3NU<
zpO1nSJ)-Q5^Z!TmJE{yM)8@yI9$9Zo;w$=T3LyIO0R%{Kd(Anh=k}xH`5R-LsCs^O
z;O}OM#2t$5Y3RT11F`VyS1AA1Ig*|G;pY#F<5#lIz7_aO6@NB_AqXy^(fDMl$RO4t
z@x%vK?B?xO!OFtl`}{QKt^)aceG!MkvYT71a}G{yFrHdJty<W=FBEEVF-9b0iUl}G
z4eKj3Gmqz5gG1xxyYE<cw~I7L*J5Jly{Cbd3z_t{`YK~?vu94-`lbJe{hcwuze&IH
zc(*MKP&f13-<Z5oerxc-qh8MM{p@Ou;`AxX%xO-3SlG_z$l|7Z4%R`ItF8$DT6%A(
z^avX)OvPUE6d!0%zho<IS6ovLh&;#l9n`gqM(B>WFJ6pP*KZKN-Xp2TfBN)^PoB20
z&~%@ft4+xnG}vdxt|?g(V#^ROOJ$}b6hE4-+i(<@v_eF9xO0~!qm9zZh8tA5qdI?p
zqeh#;do9CHKbLuYmfrqmk3Qd0#+t_V)g3(Ed<V6fq9XdZslD5z_j@o&fzcmbU`?%G
zQ~S8no;!Qx<C0U1iIi2QvGsr}^EL(JxHQ$c_R^K{c5cZl+_IN5M*Vd53<)kFWfA8e
z<n)OV0{kOXaqZpNZjaMN5QHeSNg~5{ajJQ@>A2Rl)<o$)dS_K@8Px2yTGrCWlTb)j
z_n8*x3Ua(Rt0-x{ljhlR0>sU%UyvFsJlyLE`{hH0%07xSvAG9t3fOVarq5Tn^hC#>
zYgWQe9L#7eL5Bzp@R6q`ZBBdLLZ8{5sD0*B#1U1cT~?a$;XA|I6r~Ry{+43FR!48u
zJ=;yWv9R7Q9``WF8J89w^mu%SNubCcX6?j~bIBja=maUFO{|q~G?9gKJ-Y1z43zFq
zd@DYV@D#Omk(KY_O-g(8Xygq&7>js;YQv4;DLRuc0l`fs1eM+!yyuq!Y!#Jsf%VGx
z^lRv-ohJPBz&lePWEfX@kd@*T#~MuE2q93TgLiASa<taA77^vObsKTL22`_$yuW{Z
z7#a_hX;~f{X$-g*n0jdk$<Af9)cc^Vz~gOm*j6$XaickN_%E1yAsp<^E$i<yLx3Yd
z|FYkTZrcPPzXmwczaYmh-?3les@=y#c;M)Py>-G}EaQe!`*Ecp#0A@Gd2Tqnt@b<2
z?Vdv-m+0v~E<fSt&Ob>{51m5oe8KvQ<;=^--IlcL73WmrG-HWlEx^Y0fRaDL-)Sn<
zMk5`Ur-!_oKO=%G)*xoEhFUutg|tpBQW!IkKjyz=6jb%%fV0SOMxGHB2&!Ns@Y~CA
z<0yhRga=bH-E`0(&I1@l#h77aP_H32H>Lc~wLf<r03_tz&B62^+@VBsdVAln(VsfF
zBajkwP_lu`kH)t2OA<pLQ1Zg|ZNf+>kF=X=&^;2X-`@By&3xosA_C(d6oYLHS|Qn|
z>FJKxeVGXfZvCe*cLFBgm+rlL7+RVZ7mg4redEdRK(^WjB*~WdfiNlZ0v(NRx|h94
zhS>J)+mn=?Y@2JpgJNf}iw_S*LAFKMfp1-Z<_~9DwgLK!ddujeShlw>UnM(3eRE^x
z{)U(3;^;Y&j;#A7>yAQ{b00=++k5SYqny@i%a1!zg{X&3;h5^G{qF{N?-06s-!G%a
zFG=)OZP&oAaZ)xHB&*4DN33HB`v)>&n<qs_lQT2xMp=XjpU{U~me@UQdULIK<=r?Q
zY{>}9609FSNw~j7+7$Va=5s`9YsA%bamBXmRS&gFX1StHDZzy`>=FC(*+l=(z89QK
z)fVoUq89jnuN1O>*c$gCD{mO6ZqaCnT><rnu&Vs*0oC#$eO25tU-YW&-jD0bj85x|
zjDs7aX6r@MVl=1kzG<cY!U@yH4~m(3QUY5CU;4WI=skc`D@LobG*!k_JKGyuGgqQF
z7z9NuD=d(jpJ(ltQBtw-9~ArG*5A%b792h!fv+S~v$a`agCN>ZL|H8dadzyR5R*(^
z1!i8T02W_&(@qp~dn8=|@>eY<i1mKZT95o8$08kGa_UNF1j9k%DsrjeY9_oNtYB<!
z^X02PYO?kzBRzDi=%zMlfwywXNsSjTXsNbbA;OS=lXDqc<~;mLEcw}lZb7Q7`>3Ip
zeUp-E@iLk<RZURQ-}m^3l@aCNYg1>}E8Uob*MoyD`sXiARQ*sYJ7iMTzl$2^r|uK*
znae+Wscu?hAl5ys8$f=;#Hz^GhH5c929-gw?+8OAcc+o6g;}c+3$FP-i_8PElApKh
zwv$!4P@bg5+;p6bZ_gC@S3`z~jBl$0E_dwrO&yAy5M_2#xU=*Up=i2uZo0%t*1h$b
zU*UHyu4|6lnz%eiziXI(e4}x8_$MXf<I5WL$oQJ*MzyG!I<u&m`X5JLlI#k-daO<5
z7WUjt?%na8;uMoTtDyC=RN#5Dif+evh=Qn5N_GFbkW|uL`VT9=_<v`1Q?}b`6wEPm
z$!vW77MH&{=R>R9XkIHAAL4h2qhPlctOP{abI&}M{S-gCofT^!V3GA3su$v)1^+u9
zyrKiqa-$$SJ`I3}5c2qE9kxoaWfWJz$%tqK2ufGZ1v6WUwrzos21EcNN#&@9Ux=wb
zqf`Wg0F+*PkkA2`bAtP47$O7wy8(o!@uL`D_wyY!D9UX;5O7ba!qsNk#IfLoCC1in
zP7Wu@bm-G|c@#c@zGm(5;%Hb+V7<1z#z&lnM%;7CKt!uX6(djV?1LGR#roIw>e{@g
z=I2|Qe{41FCu>Y<Mw`g+i>xmms5V*K9q>(+sb<Ff0r)2mQ*9W&(AV76kU!c(H~qG_
zA+%Vk(RM+q;lx6oW)0)UWpt6;HphFQI#kNIwXoe>nR=u$pl;Huw7+6GpAfd3MHO4l
z?+JUe$6yC1J?HXNO1sQjN?(%ifGM%YYE$ET`O5NYc^>Du$b*Uaud-VSD@pyHQkbRm
zn7$2+jX|dI^5TTke3Pxk(9@Z`q(J+sH$Gk)FM4EG(>{BB=ydaXvBBl_hIAVL`l}j#
zbV|k95ob@bGdO_XCY9@Ppe@f|{o8e?u#cZ(^wlbrgExZXAH@g%mY5W|-M6P=M~&d-
zj?NOj2C-E2x_*1gM_P@B)3)qcQ!laXjT5^;USz(paJ?v_m*0_4s<p;E{n_P|_T7{Y
zW;Kn;h<>|)SX<x3<b^tko~w#FO~FDe`L0_RrgVC52e+bfrwM%@mgLRn(jba^rVFeL
z;=e>~1d`jmH5t}ekZtmx11mBfEdOi(7K!D*4BpP<AyMQ+tX3Mr-~D+d*Qj9RzA{dR
z=4st+8<2-One273Z);;V&<pX6O^4`mnB@5+(eFn7PsZ}~w*8WEYJ&53Rm0|fG*n_U
z%EN^F+5+>!MAq}(RF>#^E!S;T{wg2WqUpJ89ipCa3pm%@6x4NW_^FFtdhDmOdKI}c
zymKaiRLrQ%>Oo1Ax?1DHD96Q+^z+;W2?gO57E}qb-oB>l9;XI5Y%-gCU-qK8VqKdC
zHaW^(y^On|S}2x>S`*zI=oh(igU5Q~`R?$GG1`6?f*0CwpR3QRm<~?Ku};hL#(DVf
z%v%iL6It{Zv7pHBKw(!HtN521=cD&pS}D8@F#NjxkThS>cG_w?_y^hzr`p%lg&F#V
zW1gneQO4u?`^m9((th0R>1!M_Kku^7-122&EatzTdV?JOPQW52KS*YIWpz0C8_zSl
zkc=M&c>?9#KYdR9G<}IPHh3uc397cAefh7wH*I62P_1Pje!Am}HeZda<lgbRPVSrs
zvO-&k*ZMkPeoCu-<P}zWc;TW2L8WT2PH1{YCbKWpU8=DjKAz^*4kI~d=7fQ2)<D)3
z2K!l~sN&PzBh9o-`N_qP<BHas#WdNf*}FOuCzzew{aK{%degI)cypXiVbe@ZF>~#<
zx@9XL?GQd!>pY24jum27nOm!-%#VH$k#%3YHU$QqUD4N6*JwC=K-&U-xid<a?rxOl
zjc4=yF}jz3f3+}o49?;Ep=!IaSH~2^>9&~>;vUvxHT$_LytI2C&ZuI~Rt!M8&t9VN
z$y>sVjd{xXE%OqF!}PP)Lh))m@^PWNQf4Hsb=<Y%<Xq$|l))$eIlccXU9xzsxIY5z
z7kvjgLrlS$!4gqe@N<B#&4JSoERoE$Ho9>D%68OjET-n59+rXh1V|1~fK}e>2O9X7
zAV<yCOXJ?NXXFjk;pYkxcV`K=pZQgA?XZY@AUfem<nJdsTtiRNjON_PSC-3fd-S4k
z57SI*!A~-4Z*M2gvi;MkM`7wVn>XT&x6W2$^kq1@fiO;SdQgl7o;hhvY7RYfw0rU!
zsxbbxzg{zeC22O>RYH8XhcCC>7gYRMPS1A*t179j_gCsy=!#$58Tlou_7Kre%}^@1
z7Oj_wVGkd<kh^HsbZ$WlmM7i*7h`80PUYIa{SYccgpesD$!wX&6e$ssGG<<6W@Vm2
zGKC~lrizp@%PjK{7Ai8&VkI)PjG5l=t-YUTKhOJnf5+=M_CI?c+fnzr)^%Uk`906i
zdCTqO`k9}?0oeEJ6Y1qsvGV2C4P4)M#<t4W@l4AT3o6Ttzg9M#dzkr#cbRhJ7$bSb
z8>C#Nr~B5+CfXdLO?Skmg+A=x)|K^0)0s6>!pS&ey$oH~=@MN=UwaheY(3TkUpu*P
zS2<n7Cp#%Ob~xSX#AtH8De^pirDW`Oc>d9E6w4I%JIlVIw@bDL)Z*tf_cfJBF2B5Z
zg_s5$BD8k{U%d;yjZ*Bpo#x8*yKEu4N_r$%rQ4e}qbjn6DWN(bV&2G(@V!bJ>IBn6
zhq|mP@yTvef3um1I9<POmmQCv(TVrk&KT-$T-^M<IaNfG@IoU}{=0q^ufERRVAU6K
zkDn!luL;i=dUTuNw+kPcdsx(SGKgAH38cF4Ag_4!vAcn8Z0{S1*^KWSydJk9Ozl~?
zn^<_4<m6Ao2a&=|&Zp-t!~~`@j$ko|(5{x_gk|*r6nV63&-V~}D$ssqn7Ny;5}QN5
z5IOkpgG#Bsf(9Syv^&RHXSVeg$2JMaXr1*|2Nk<t1Pd}n6yC=+w|#~Er>}hRLr}GH
z&fEg#8Y8!uqsGnqUR}|{kvq&blm9_({5lTEjc=*j-{HV?1Uh5XHE)6+q&Ey_3YnD)
zu&HY1@98B<;oLWIZI9b@V&b3JsVZ%qm)x@Bk?DwP8t?^q9yRV|9*4i!@N$x#!GfeF
zRdUJWMs-Ow--F9aID<Sn6ieID5GtKQbdBfE@MhxZk?6O_l8vvEFmV4Hmhon!cIIA`
z@yJLS{mIUK0w~tL+?^(eL7)5#GII#vGQK=TlE=bdWun*=q7cd;Xp!enmRY8V-aR1z
z%^=Vu&@9|6!(dY3v0`?ZgyiM_b6$<u>=#BVXh3SOfb{V4rh<73dGW3nQ*pp@9>IUf
zo{fk1#H~NoSzMr`pm4>y3f7e3#q(wJFjS@xr35n~NteRDPqA@liWE({-*29pz2CNY
z3FwAN6t_PG?w2gG*gYZzV-nwu?_bH%{l$*w%Dh*+{LCE9K4>?n`@!WPe_V1M{Wm>h
zQ4j)h&6keLJwVL#yDbN1dXjujPEHnW!=QN%C=Bokxs_))DE!s+hPHO6H?C&dCgeEV
zWhfY52I0DLXP~YdDcM3BySet=JJ3oI{HX9(u|K~0>Dx%|McXK39uFFssNQ#Qo`(Z7
zLwXjjNA^}Q#r{5!jq);9IHFOz_D_1oWIu7l^78#O1}T>_2z>oueBFeMuOY%_)+Fct
z(j~5)wc{;ftyhc>VBgD1#qls^lRxkDG}2Jj=oD3-t2<qra?}B5PS|oQPd^}Oyi5Ei
z77!lo!b?g!tTRSsNZ$yiEEf#3CX+9>%I6pN+0O|z4b{rhkSEiO*ySdhXyh@mWxlpZ
z#0~+tPZm96M<ZWz;lgvPI|=rLti1I6h7XMW?x4FAsz+-CY&~kc5SrWP5H>Sx`DX@s
zYsn{%zb6_<VoJLjd9NAQ=Mcok+?6{P6p+bu+_5>-F}-d?QGtW+bgxC1<-^%;Sc`?w
z(Xg+ieP*2jV!9vv`Q2KUl(ruK+VouZv5OdwifA!5tJ$}?{8eex#Z^=0?a3c1{VGK9
zzt*(!eT?wZhO9)dw!D0n#WqbYl#Y6(Pzsp0=B1WD?`S?kM%nr-&X$UfaVC*BI4&tJ
ztf^NCE)SE|Lt3#b70NRw(W#G&<WDA>iL;AyorL?C6WlJEn4{}gu+wiCwP=|3%c#9i
zY&@UYjQ?0*d3u2LkxTsy70Zdpx28H;`G#`$a>l63-j@@v+sRO}$UHb!Pe=8Q&7!ZC
zCi>C>(;S531j;7}`E(2Fe2krkb$y*mj%HDol(w<whL~I#W`9HN{QIYnUkKk{1i_%o
zu7%dkqMM|;tpl;YGdC8;BL_A)t%qL{iTvbVQ~)0}M9V3X_m!&Rf98tY-S_PF90WdE
zl^-2K6Ss+bn_fV^j&m4Wl@OS7N&R2c-A9b5miNO_quPN%LFx+g0Or8{bEw`1)p-wP
z7Rwt~uU5l7AH5r1PV|4vy9+&Df62SaGEDN|NQ#o0qO|LAdi2QLbw{3hV?wGA22#!w
zbp-j*5#i;8Wp~$uD44{tO^VC9Q+E#>sw*#{=<Qi-0GJyF4s(P9SFOStgjO4{;zz4f
zz^oeBYFo}Mo*d;#`HesC*FR)FZQ%>K$}Cfa`t}m)TxU_9aOeO0MvD^=MsPU_O45Uy
zh!u-*E>TX3xL*tCb<BVGYdht3#1hxEoQ6%EP=ZAts>k`ucgI>EyHtmg&R+ag95p?E
zE4L2M84^DL6g+PACWF{CmDpk?xW-Q=&dWcF8~wmVLh9a}acSc+eBY?uOghp@on(dS
zas}Voj)ibrSn2;<8+X^U*E1GfGGual=R55nTZV62t$*5$Hu+MX50D<?L`A<vUZBgN
z=s(CU*AZn!HscjZP8dOe5?G{ZM;-1ISm%|fSKqh!`mU}E+T1M-=F!8ygRX>Y6!xjh
zE%ru9EjIfPwZwVn7~h}8^<Iu2MKJ}-_1JXq4+lRkI3(&|&}a^`3OOdW58K4(>#6T1
z(1K3D)X*@Porrs7zPwwf5l%Z&&F?^eCvBg##duA=VdoNc!l@9gh|A`CrOE@;wKQ{#
zQUQ@84(%aNFX7L33ccvw4y6=`p7HiW)#t=D^0M=tCRaQnY7`9m6Z!n)`C|_2vVIzw
zmamc?b*X4aPfZjC&2C_9(;|$*s+Jd~tP17)WY$?mLmu=VW>!}SCm$!@JpB8)k&?`g
z{H8nKP~nje@=L)#Ccna0S*|zCjLOHJ=1^ym`{<q3xj|BJRJMW<_M3-gBKFhL-ipAY
zk&~cLk*}uAd+~=QY!8R^$I<rQpQEf&huZ2p|BOZO#utkI?KAj8c>Kpm#NT0@+mBng
z+!H`IXUi+Rnon`_1r0A`{f!osN5%&q0FLC|BhfZ}Y@2(~iswIN-^&MDh@~bJL_3^D
zX^;S2k#=B#82-1vrw-=Ym+Cu-0srS`sFHWYVfOinAl?c=kqqj6U${>b3REv&jGg<K
z6z941Yv%0zB!--({^>f+D_263&gM0`zMGhB0JR*L-CfZg;E$svE@MHg@1h2!){BMD
z$xGAAHGF;#;s8jY6h`ilhM--&+J?V>ddqcVGT^zBOo7*+o1I<>TYscvzwl=wkpN?y
z{l%U7GlufdiHfctyX8Xq?kHKy)~={Mg<YSgVRTJy?%Qq0j?M|baiF`d19W~1dj{$D
z&T=v~-JXoqkgo@xPw4a0?;_Jl|7N}Zi$*U%ep8l?gi-L{G<rPolZqhBC^ogQ&*mPX
zT%NtTJ;z_T*OY8qDm`{u`gI%hhsXxv*C&bp14$p4{Gm>#zH>yOZ^1Z7P{JqRwLnGp
zkPTVwXqJ9t0;fuJhG|9C?7%&~X@<P51?ini3}e^Z-Xopo#gt#`v#4oeQa?(+Ii=O?
zGp==i&51+=KiRblzpoj%hSAI&ZHqpe1Eve=LlL2MM^^2>&=<okabk&tQ=W_Uu6&;-
z&@M^&`U?BHy+k7&!}%Q@6}QgLIOBOGGVTUvy`k6XwjetGp4jZuBgMoIm{KX@iC{$v
zPNpgUpL-$6$>VlKq3Pj&a5z)f?b3y<L+QT=V~V?EnvDMTses!0O5OR00~(J+iDl2o
z%d-O6Rc`P1yr8z#r#M2y7;v49=?l52^Iq4mco)Q9dZl)uva|&nzietSVL|O+18S!@
zG1E*1?b`g1yw=g?CV86zWQSvR@fW4G2)S=h9m<v|RjIKO=<n{9E4$~8vuePg(`2fo
zHwVHx+*^xM(<@{Io2GD60*i*Fw8z~Hj+{#Gp^23C%o1Jn;W^)H8?Y+cZ4vI4z~?Q#
z@bQ-}RHRF7Oy<s$JzL6a=%3lrQN)kvh~yH^yB0&tVKAzDFsyYMVb(=>Ye0io5;xRC
z2+cn%w1fN#OY;_^r&qGcq%GP2w@2KGxoygDzD${C>&Me~kv05zLbjy^4Am99&TNZ&
zi>8@_+MVyIYN@L4&Ea)LJt$9(tkcNP%N%ugFDIk#t2`veX`AA7J;g!5bHehJTN#P?
zwUw6B-+oYk{rpyy_g?-uOOQT=NI++AhUxJfrcz4Vhk5loOgQtMSJNv_RUyts8S|ei
zysT~>&vxi)+jzCu_+2OC^M31|q~kA7Yy2Iid;9NYD9^A6(WmP&NfwC|6-c?E7E}EN
z1@^v~`4lbE#9q}`3RhU~DG*{jA((?`^)bw+UQkg}ubf8PPV0Dq>D*ln{w?*?A*Znk
zg}x-y_`$;rO={q9ZUpC7XYQ#mMM|v5A4JM{Z@w`be6sS$+bYXBX(t)#_L8KX3+~rv
za99NrT}RlZMA^J#D7Jmb8lAm#rZ}Oz67hb`y0siVdX%`vPpjj_r4Xz)&QBj<4PtY!
zGS7ilSXQ^C%r7h~JOJ5=il6fkiZ-0EayuKGq~M7oV||xcQu};Ev$tWRi%hCqU~7<m
zH3h|EC{X;EE=0y6)Z3zw)UEcksC5tJn!c;E|6Thy@l>t67QJIjPs}1(tKnQAZ36)(
zVM))Kny(%<i`ULxv(pm7+nN2)!h8;%Bzm7eM49^5{o+lNr$<fDXZ`p1RMFNv!#h4Z
zn!=eJr*7Ll%5$wUb4spfa9ug4Hisg{<fR7@@RKBp-;%LS_FfCT{dqrU@4IFR5#cW3
ziu=O2uCH~8`Blnl0ZvXbTgv?Ux+RjSCmMqFtLi;5rtbTx#7ddpJt*7vRL7jJ|D{nc
zx6N7?kglxHKx1Ap<AakiJ@j;RmPHS~QM5~Hlb`ei2nhD4iYk+pliFRoL%+sntG#Zk
zQs$LG&Ugv{7{c=!)zPgr2<hR@Zm|%iYiYSVHoIHj=*nN2=U57!d^<{;ro~GZ!Ozg6
zv(0~bPlP_+J165jwvy>#>#27nGPJAA&>JoNgocv+ty!lJezR;vxQd!phfchfhUk~1
zAee8Z7q>Vi`Oa@RN{#lD{Np|*K0KLZ;zU^+t?O|Ir(Uhh<4F8*_z-=_^W>|sXOo5t
z|Gt17u7nF%Y`~Y{vixbOeXwwM{yYJ(6RsM1lD1!^U;esv3Dwy{@)HdS=QKg}G+D-f
zUAwlOQ=RTd=`E+EZXgV$iVs!*zrg-v=+89>K@7bxpNt&L+PXu}r+XiWr5?V<u|2J>
zyGT&kD!)U>b?D;zxle?Q%Ah2IiTG=KNqKg6GX#~-9+-%kyC=jY-4=9ZS3h0a1lLDr
zE|ZZjnLcZ)vCoQftdVSyA%jn@Am+BEXGf9Mr0$LLdmFW;402xYkDhenD%E13G62i`
zNW=-l;DBl*uhB|$+p1*Nd$BK<$!%#cxL{c`!FP;2>*_W2;;xmV&cb)V@SWAgotHhX
zuBs~1VUZrdyFFBH=P+D7PcC>4SOBQEw{m|Z@^Z11(fM_|{nIww%8VLqvq>MY)6=bS
zl4oV@W#UwcYQlFbEG6pgfCvA-$%Se{$-{afkz&`}CzixWKe>D0QXZypTM%~4+FfpV
zamG-*!1ww|1BvNcJ{h9Ke?tq;j%Qb`c>IiA43fCB#V~zm2m2nCU-{#F>xi~_@>3lC
zAJ{_ms9XO<Ewmgr*l+nyyNWDLQ__E93pX}4T#^f3qfL9Kr<cK{&}o0$)!U<cYR~n5
zyrBITz<JoOoZl{bIPx~V?|tWl+90ZZljsGEa{a_lmMXWYKmmGAK1pWVTX~8%EuMm-
zT*=P=da`)ui0=>Zl8KIMG}+HZlfOK4Xn*yplHyG#l^sfC7Nxd_Df;>e6-zcthNztl
z`t(zKT^q^R&o%NjSszNBK3}{yKS)85vy{*Et|q9~f6qBWZrhDrK>nnCvg^mPeW(2^
zYX9L99aivgu6yRntCiu!e=}cq`hlfW^5`F*X#an53PXN!<`JzMl>Fr)rthk%)R-7Q
zOiG&U*9Wp+(#A6IwO-uq$wDZKg`K;#`@6@%1S@fs2|@^q058;MK7bcul{aPM3mkh4
zqJYnTf~XoyGKjLh46F*7*-)7R^+v?iva+o-67;{ji94qOkjy+cS|tH2b{te~><3rz
zFkyFonLCBN6RMj)s6;HBfWmNB<7bh4Q**cHtf*}tmf2mEW^Y*BVdM>;NHas3)Y$nh
z#&SgB1nNLitS$-3O{ig3qhA8I#=lG)-KKEtC@4BPg6;N)kjEyBKwY9QVMV-PemVuE
z_u@ptJ7X!3)`vPDyTD{9ayBhBC%FI-0^L^8`R8Z3PW0CTBj$(SE;Y4L;m3gd5%L}1
z01bsxA&xbB?eFS4!St#;UL#d@!i_6!Df*PyvFR~?8a6eyU~uJgqB_JBWmU|koH1qF
z!uLM1cmSS(8MKi4FXR^i75vaVd|v3%3UCC&;A_i%y4y3EcUiLM)itY|`NotP<Gu{7
zJ=)Be@F*2N<0`?LwBMX#Uh6c)#|wOasE(9LQZ@Y)0gp2%GYlU+0km%3_5{+qP^9yU
z^k3jOo6Jgre_EWuD7<Y*H-g<Y|G8JPX){eL`}rrU?K}P*x8x@=4|ko9THh)Z^YN9t
zM=n4JR&RMbCNS$IltXFlfoHphiG(a)vVbtU%b%8PgHN>8qOs!c?5L7d_s}<cd2yOg
zh63fxzeVSQRJwc*i#6Dq)Hfhkg2UjikZ~rD*~KyM!$mA9YC1FpPKgJgKnS|Ode2h~
z-XUC<7^Ab&w^gv4c%G%&f(AGzH7N{uE+pug5G>>y?blJ}Hgk2Cm{8fH_j=T$cwUhe
zpQ2<Cs?&;{3QhXl*wDZ%mU#Wj*zB{vFdogx@ag|6Q@>;mcj=t>#1fd(R&aerJj`tk
zSW6M>3h=o@tX=@uo$eT@$gP%WviC6Pp6p2p>rbaQWMYTO=K07SK#vpad1W!Z*IL(g
z&D$`%GFPA}xUsbnmr2mwGdWGh94U1_x93jX_<Vd4p4X8?LL*6}*={_q#W$$lkLGMm
zND{C7h0b;zJOu~+*ZM@=d$ulQ4@cyC`N3bkGaXE}c*Ftx2137A=gg(M4SnrQCRT~*
zQ=%{D+Dv4$39>V`vcN(h+O0{d+4T4#;o;UaoW%mE_q-<G2qHyUlB#J!)jSQ7r-DY6
zH(>>k|Gfgp_D79$cM`yKB&s_Pm$pSPi7x?R662#PTgtT)mZif)dq7&9`zS6eilIf1
z?1)_?GIUQkejBcCbB(2w03x!fvDIzym85hO^k!Ph^Pz_;?n^^WsRx@Or#XZOXM#GC
zE4LU^@F)?X6ETW0N63z#@SCUs1qQ7Ett0P=&tov`kUJd-^X(&-G^%iUb@cRk%H94O
z(!fFZmq{ymiV93Hn{!$VN8qf|%IC(n*nTVFiOZ~Bb~qDy%&bp{)%qF}u2wx<kYtFQ
zMSAtY&uEqy7<X{dbt|Wi+wQbo_zGZ@re4O=CI0(<<cuPR5%YSF$Jh|W8WEC1uct~7
zuy@W#6eLL=>IDgMqz)|*5|DAjYs-QtK=B1ISs1nG-qL0(UB3Nr|0@0QIP|)j41?si
zw@)njyS0U#xu^v%@P5b0#6GbU^tHc%9DSbz)+g|8<h8_NRFW^WzcgXm)csvp^yP4j
z*@N9PUCzYoFE;g~$>t41*&KEVY(w&z!|Qp~^khwhvy3Dt*o?NQTkf$1wRU-vHx5xW
zMs_+jSyBi#5|;>Gh-l~61ZC|e#XB3q6pg2my{llxC^+Un%X4>*=Ss&FMVniDo?SRA
zi>y>lg^En8tdrH`RV6#*&E%m}vC0LK=7ey!f~n>0gV3ZZ3f;nj94fv+Vv=W(Ar#w%
z;YO=LzU=Dap;P|9Ub3K{xrIkW$gn?7($i1+kOg*b^r_-(JS98!F=CvDpDCy$b+fQo
zxj6LFXomhf{r$=r+s2mRj4+Qx6t7TF@|Lwh3IC~h$I!QvI_fQGh4G!icrxCeA%zo9
z%&Gi)&tK(^Z<;Q=a{cOsk<X1=v(4NrT}kQj_nW@yYAb9>K|1cbdfn$~XJWo-p(jzz
zRs4mqSFTP$VseU<%O9>6kpFy{2Y;n5fH;I4<ckd~X&mR4q70l5Le=Qq$&EO?gEaOq
z!j&?E5blv9M}+X6ReWRmv5H;bkAX-izl3HI{nGNqG_ddu^oFG_feTok{mMZ+5|X&X
zFM*8z)<%22?B%yRU6;Quw|nHw?;cqOe0cjfUs^2GTA7$U-<qTJtJ!;V(un>m**Tr|
zuNRv?{&+*JBe=iwYfZDn&|WD-NBQgbp)9{&n72A_B92Xd)s%XR-m}zQ3!izL?Em_T
zUhCei^?H}|+kaAje`=jv9u5@hg3Bsa4(wY^$&#nPG1E?Ipl_#1yV^Ls_R!Zqg%r-c
zx|Z-vx_J62@9i$b#72XkMPs1(`M?ex8WknpZHn^(wyah$TKzAt7B$aNhDV0AK1L&-
z-X34*%UFh>1l%%{*BHJm@Z3^oL^op~nSu|z=ic7lbur-hb%n38@+tWJ`6Ufuh2duc
z98zsux{09||HJpfUa0L1n*Knoe{D9jolQdGNUYuzR!CYy)FMcmfc_cm9o*Uluf!Ap
z{X|{EBO{vuLggaUEX5!WXJMKgHFCq6?=K^q0J1V8A41Tzh&=*UCgf-8DEZ|(74Bkb
zn{&zoIVxHM#YIk{Yv+oX=}$y>+yM65+-qldcy1oI$FQ9vOaB<n9|I5xa+UN0mV7HM
zESUalSFbAC*u33J9hbB1%c)0P{;4NuXjbZoj+?-90-R(XnLzm=h`l>Fe1LiA=0wnO
zDrh{&D$J;cy!Vl#M}=LdisGn|ZxZ~da-u^zKbj?%S?eVP?GS1TRtnhFD3e8<<T($`
zZ|h6n^I|w&F>TxFB~}Nz_anB#80G_gSBk=usCJ<KzykctHcuEj*J2u`+>esJPJx`v
zLm)*br8h05K){$5>gB~<r`)Mg?#tXOQ3Md%lR72gVE4li4VxL_NdDIcJOA?1OIWKI
zSgRI)t<~>4Rg+6hCSRX^(36b_i24S0Ot59nHTfB#9niJ;nA!sa-+|RJB_70PhT{r5
z;BSj1h)tz{N53DO`el1#Nd=$-*{JQ7spg249u0*gX<;%{t?ks*6x1gSUV2Eb2xBt!
z)PPSAfD|X_?s{(RcU-tmkI3-g<Ky7i5@x7y*pe=<nb9dQh;G2wFE;slEQh>)?4VI%
zqujB_cjG2fODXQ8;J&_c{-Am78(Vlg>`PJ<5ENj|1I#MoRs6<AeyeME&gc6lcBC-k
z%GImFu4q#~h;l6hr6*Y$(xOLUcm#||Kg5-zi7a}n5I4BHxy=9dN4X&hYpDd*QX=Y@
z_`DXa9iB~HE}XB`=&6!yv!_H`wPG~K4QVNqMC`#P`4><#hEPbzerI!~BH%7i)Gt7L
z0d@(7>TZRYEpTABLVzDL59_R^?Ts3<hpM`IGsppt!8VfRe8>inYu`b9$Sy8^7SM6P
zE#S7gjMVTUKh6~1r7UxLNqvsWcQIC+p9BxNX3W>k8oZydjzQH=pk3T&(Z+1Xw3`#F
z+MUyl&v1Ch?ycyp6mAZw-G+mOMBS#rPXddFkXgo!91wd-`ufih<JnVU$k8dAnZ4Ws
z#wU}6Lz8*5Ts+eoY}X9vV-(;IM!AxlH@^2-`8(W^vx_+qi?|2SpQsoalVoy%f_;RH
z4CN{<HT=gx3DIm_aZUCdLVX?kcx|3Dd&+B}=RID|Upc%<qU&nuc(Qxt<}BL#)>*R?
z>yw{8e~^6YVHTz?9lH6gQSu(&zHEGA#&*op6Slj%dxSVPKnpfa3!|k-V>ePH6+8u}
zqF9T@0@itBs*{pa>BSD5k_XS9+>Mr1(y7j3I1}DJNopxtT3T5GAhVn!TlSwO<}>zP
zqoZV%wf?aniJtfc=??W&nA>Q*xJZnbQzRfD*xa0sMmRRwI2=GE%-=hXkNstERLV?T
zCioHeE+W}rBWTo%Ha>c7Ag+LZ1M7A8?)pt_`jyN_kH~vAzCqt!P2Vq~ognIOR!D&*
z;ZESh5`Cg$B@aQL&;IEFyFGZNh^)n?(^%8_8$8#$?sVZw&DM@LJdw6J^S?4dJH7hw
zwkj0j!~u(O8E(%qQ0Q^xYKzG?0BI+Z-A-AP^IkXkl6kcvpj~zyzDrCH;Lqx!{06VJ
zXBQW4<{6X;AgltIC_lSP3%gO#-GfI2zhtG<W*nlmIAUaDv_M<33v*HHMb#Xp)^I^P
zxmr0DBkbN6!0tVfn*V@Uh5d{WVGO|*PMM_msY-#r<jadJ@Mkwy$Bkp8w&JNj&Zx|;
z_k=wKsx*{NQu8EU{sy}#AGy9atPCe;r;|qh;La^rF_7*sz4yz@C95F<7#bEP?CM5{
zFNYqtd)lvI@w`CLyv2#&f)#e2QWCWv>IL*AnBd;rcoqI9F$TY<4c%SJDTW&To%`4B
zS?0sCdA=&ggCWQ-H7R*_XNOsPl#^G6j99KH7rI^BP&1h!<~4F1Y3@H1j@!y7)Zh5T
zX|=`CpmeHhcf?aG2ze+6VZQbP1QG(^MW^2T!06)y^R*TYppQ6sdC8znupX*OT;@?|
zY#sCls-;R!#HOUABo79r)&oJ0{PzYFCo&%~6T*P;K+WjSMz5q=`~C4RYon5iH3O}p
zMs$Y0ho!9B=Uq6;>WNt<(si3XHXnPG2YbiNX!oD4-EVBjQ;ZRLcQN=Fyo%j=;T>)O
zkXI)FaN=cxp1LoNguw?q1)(tXDVcj<cnF6Ei6m(m?{0{ikHAzr>$+?j3WFKT=>V4I
z5t#k=y2R&V>HpfwELBE-xjGwlyfZ0d4aNnHhHbBWI<CR~HO=g6c>Jzj=DC!lWS-Nf
z>vq689G3JStudKc2+g$?S$3$kX#Dt`aR9BwSHX8Y8ee{m`Dqf^8N?mOfM1-mi?A}{
zEzKrGh@QaxKi!*G-rwIJ;gTSzPvD$p>zAC@e{XI2uc}F6y$_CJX=xItknI%=c!17I
zx}Z(1VP4C)U7zA>!EwV&Y6G*l;kn&|ys6uv+$$pVN>U+Q=&J!NBk8wOj_hCMCrE!o
zh0+tIa%fjysE27l<m&3ZR@w<*nL~9<%2p~Pk3-ECT6XJOY}R!;-djxwI`r{ls@A6|
zIN_k+&?|ao#aqu#li!x}$u-ZuD002CwY4N&g6;PryjQ4K1ial&ei0eu)&d*mp16On
zz-=<|@t4FZ5wvl5N(=bpc$iXlNy#1hh!2R{Qlbs;*k3)vm)iFN&=hHcf(;S_s&-7n
zm21~JC{(kcsDS1v_CDI|a#()N?_=6o;FAuIit0)T-h$S~i*UM7Per_-@Q)05vbcg|
zNE192Lq^kr6N8*3?@5xtYsL9$m=tZq0^bJ3W9Lt!Mw`3!Gx*o<q!Ln}J$V?klJ~nh
zcSd)9(fVSMCk5`O<)|V7ltHDvGNFk%(KKY#5%N?8->&X*KKQA<oXzE1&9U?fp@$5f
zXGeHE!T2<?{5(y~b0=k24blLAl9n#ks{mwC%>|&r6q0!a@TyuW0U5AfX5Ha%?Y?lq
z=)E;H$nUNfQyIZ){*GDq=<(y-EGDKCeaPIamDL;D%OfgE3ok{@iMY_G(%ISB@K#oY
z<HEI$Li1K^_a)M(=l<QKPIu=GKELZco$%D4ay;Z)ruh~1t74368h$@fJhB_J8h!%Y
z-5BM`W-;agTzBAX`qeNvAFfREB<}C#m%nL_B=&O)=9kO;lF@jfdbh#C0zFg+=1NQq
zm2osZX~hrBRFQ|(vp^(hEI!rs+zu{b4}U%fvB-R)E}$YwR5>%T*sbUH%=}b*X@9+g
z+%bf2s|I{qE4lFZSX$Wb&y)si`a&f($E)<>U1+sNzGM5E4+7vts!#rg3A&wO_ksr4
zDQO7I;LTe_^4};_Y~C$syz~ogwNW}1uRd7|Y3Yw^a2}Acky--;&QTy6i@Lf!-vjAt
z6E=PI)DH8~8R*2oQBIMPkeGe@81u%UEH9geC>2jx?j*JFn4hvdD!jw{#Z+l$sK*1>
zoq{cc@eE~w0NDb`le0#$HNqF-0$%0uk;mHrjL@NC>!jiM##uxEpPl73<LckN>bbrT
zevojeUOYKsqRy*YG533qLE7S+e%W37z&B)GyC|L=+08x1RU?>+@ED#|z}yxbt{8#z
z+R3tUafW`qbWg=}Bdufo!_NuIGW_=qG;4f3@mtFn1ZO_xHP278fZeE@+qr&jp*FJH
z>X1mnbd-I}($xTO4r2Vq#-&3$a<}aKYS8|x8%NJM)l`LdqCez)rCe6HTUiwmo$p#R
zF>Npb1=HZVx)6pRXe}iYTu(vzYBAE=i4X&IZ)j%oDTN`~yXLrJhn$T@{+G{j<r&NM
zZtT|-@uPY!clvL^|4--FRnv##;~H=O@NQ)wy1NlA7aoXH0{MaCUE=#onLxSDUh!D!
znwUk5YBEJ1>Rg2UB+O21m>OT)^YqRwQg9$Oi#=|#AH#xN$JPyI5QAFyc$`1u%CM89
zUpgRILh(CK#$|p;ATPnTNprDBvO}k=h!&vH<`RfRU<UtITY#T}Gw3DI4-bNyS!q(}
zQ<F927Hua)?=}n<#j#@VtbvwjhLoA%t3)SFHWAGv(2c7W39gu$nxfNru0!Y;CA-o@
zgRXsdGy948TaTWH6ilD~ne8PYh?0^uCirsWiF(*MV=iOzxZ_2I_B}S6B$vO*v^Z(v
zJ#LWy5VIlJ2TJh=1Fi(`|CuYhZ>#_BfG^%%t+U><EljvzaEF@tWZZUH%Azfi!{RVm
z#O(fksG`jPsJIj=;yaW;HNuQL>~)&gF?gZA2e$08s9R5#dh@J|9f(qr`#X5`<tGw_
z)3J(eJ8c-!sfxqVmw<760r05UYB&+ILN_e*^7@#hHQvoJhET9Tr;9(p2N0}r<3kFJ
z+DaO9-9yOc<@Ho)0Ms^;zeez+U?gMKt_~R{?dEqVpCmc_P3ojqBZ4z3kS+Gj*DY)?
zd~=42ExI3!t4v<23jzA-($7u%_m*eq(d>l^lbfGCG93&aslSUi{gI&U3_};mSuYYI
zcQ~{}gs^%YffR-ql7DJt?w=|=56)N#lsu7cy5}rovA<BzUebho`s2s<p--=sw%_!z
zy_y=iP4An@#3|_=wY>7FW7uQ~!3~TvokNC76tm)imCZ0h@3E&MRdnIb4zQPR??BiC
zA)I&mlp50u-g(p^P=)Q)pdXj0)hIWrH1`!T`F&t~d;K5Aw-AEl|2rlewfhff3w>Kf
zQF_PdU(L0fD=Ho<A4r|t@FZ98b<OcLx3(ASN-dgxYAD9yM=>eqL!;L!z4xTUdo#&J
zf6zwe#16e#oQnM!WdF`Q7ema}>qu|UA~DJ~P>&&JlM!<L!sjF7DRB0BinV~(Wb=DF
z&XvIKz@ge|Dho*QZ#s9`J=&XK?|o}P!PqA}I9l$o?jRpNeUwr1U9nYv=en44pW@*+
z<6{uI&S7dVvNCUdD|z_g<_ot77uMmkMPG`SSE|NM_OO<lAlrU^b&bB&aOLp-!ewE=
z&of|8Egu!hRWTLvtnV9O@o-+0^ck@tgt%jlQQajOBX(gA@Bhiq#zj4Rfw^%ym1mIh
z2Xt$icO{uCOf)Eyea^L#5VgKZA8|`9$oPII^E7^_%28tKgxTjTWp9fijS+v391CxY
z>39YB;M_gZk`f>x>^grt!>i=kn_CsXk9L@x#?995UEaXtm6Z+({evZIT9vZ<&Mvm>
zuX&2S_Vo?g^}()ZVq^gSK^@>^FTodw1@kKN;4IxOw~^?#3b9um_m^~K69eCk+(#{c
zdwTGh8Yh=6%RF!=@C7PMM029~-B$5V*d3kWBK%`>>auL>l*bAnS+G|8P<fops^C{G
zrC>@<5Y3gA1rdc4P*xcXoti}l>DPeZvN5lB=Bg`Dmpb+OO?_vzhu{2cXZg&~VyN7S
zdC3;Z^tu9^-KL&~*UsQ==Xv`wcCoL*9St+k0yT^1AOLAElzOpt(odlXpMjLg^NclP
zTj4b7(3$B{nHb|a)2{GozJ2k?G4yGjlkq!6hsA7rm0*sVYk!6t&qXAflFruM!|2gW
z>5222d5^Le5PELAoh1kP*bF_Zu?By#{SP}Ea1Kmashw97riu)@xp?F<FJInLq`$oq
z-i?Bqmcb&*e5_7!dSF2Ek?&pRQ{py|LA~){n<*&Sd%cppJJO3u%vPstJ>aFi)efut
ziRAk#i%gH^dR{~GrYF=;pT%Uz2z`nV%G|lb?)PvfZE`{|dRR8?mv`!T5Vq34vYfdz
zj)Ct6<lkCv_D?#;FO9O)cY>Q$oc_Vz)jQSYfl&HX^D(Gn)*I(NtDML^z0=uO!8QCF
zN-6~4lGEwdazXmeBfKL{YRABVXvYDgVp0leTtNpJa>$NkqXcSK++^|VlF`txQ)wc6
zdF)Gu5{PVan2E0idva-#_EVmAQ1LDmwXEB`hCAwGw4T3Q{!vj%V{%@4TO9#e_<21r
z_bpOy3RqKN^*m$syVfK*oZvc$K^5lVR+9Y`<MU8f$D%zNoj<=*GwGiEx?nsQ$G=lE
zz4f?Nvh=8*1is<sZ4$cngC;4q?ORjDuCdEEx>aJr8aA$FT4YX|T;%AAa<H_I9uW$M
z#^40`1!NLO59KOWi+c?<cDGH9H6cq3lSq_1yX0V+Zxt0iTSRH6^tUR>`@521|8SB)
zxZYQl+~H2K0~cby{6S}%Qb6udoGk9x+?=|79>xx!^563Yd!qBksQWb1pbAU#yHV5E
zzx_b};?_XmTxk!q7^F+fl2oR0a5EdOkg%d*5ge@Oy}q8={Z$&05g$6QQM~xe^Iw%p
zQR+|3ea!oqIGsGp@;rW~y64)9TAgyPc*Rw|1xYQ@RLZW?x{fBF761`tE`Xkp$|@87
zm<xKz+2y)q53la}FqSZ0XPw$>k1g?I(o?5fCxcX$TXTHN*Wv@9JZu)%u<N(6I6Ax2
znmjDf+}xZ*;DWxkzV2N(j9O_<NS~TYe#RloL95p%+|J}<+Sv8e`_l(c|K4}6v7N7u
zZYWqe;h)|m`&_C`X7R0J^R<wj-=OZ+_Nn=*+~l@Q-CI!Y)H2QE7}LFU5vS~HM<k5-
zRcj<#?+UT&oy`gl-tvmm<Yo+#PS20N1P6Js9tp|}|6xY1d*a?77pGo@3m5PuAH=hC
zHPT5?7Dcfwc3)7dzG69S%(U_|vrO&eH?54zQnR%FvR3Aro8Q`EBb2u<jby+zwftx4
zux75lSnE^m>5Ub*A1;G6lQts4uz9UKA7ijNzQ5-_G(J6b3KHp28exs=8BCuuT}Ce&
z$2RyycB+(4w+-f-{h&zayqT2T95f(cV$8W+3<ik@;`T$5vnf((NavRmn7tO)5s2dR
z9>5JID_#FVPv;Jdr2p(}%7rGIEe#kHLWOn$%g*&J&~iF2Jb6b%Z3w)h=I*4!5`u{+
z(lUzjlkPs{Byl$ViVn=r&3(K_e&QycT;~^_&2@eyUS1)2PgF8`t(wBgc^RrMCP5cm
z_d0tQH}OF3_aXf<yGJ)Or6km&foK$BUg)*XPJYU%3eGtNgT+9HT7b8Q?t5i`PpOlV
z2K84*)_2lyYt&Wjo;uCJN9*RnT|O9Z-x!tZ?c^Mbj1}9R_Mv_*`p$>tt=srdm6w<-
zGNsTbpLE7Ye&xMA)i>{DGK*!j6ffVhutWWlS%H!c3HxB}$x8Uk`|TKpYdfL#9}ZsF
zy2HTN`rNgYi=hsC->Mzb^8660Z<rD<1#l{ce9am?A{!VOh`nIrEJ=R?WQ|s!ERdD*
zHx10>Prgf*zhH`zC^j~4ocvce98BMIoQgfvE?y*r@qHBF3{9az!+Nx`1m2A>(gXg0
z-bmzpT!7O^%fLpapO!NzJai*)u#&@?x~t6$d)e)#bhr#j(Hq^1sR&F;y~2@(?!Kae
zCiz82BADPt9=a@^riS;W4cVBwX*fnUu7W;$>1J;CN3Z4mvGZ6vsM4axiEA^{zTUX#
zBbeo}t@TKrCg#Zl`g^|!vj9+B-&-N*{5UX(i2P&xli)A{k8M4xlbR$_s5gV2iuC<+
z(5;63X|u&_`8W<9gm#&O5e>rugO)&DgZ@q^GKiKOivj&-+hPFq*eoxPZ%9h}c_&**
z$JdAX(GPDn;|Kheq;d2-yD8hA&hrN+`<1i6=~2p5nzY|RdWd56A`^FW;I{i?<Uptw
ziNH00-uMP0{1EMa#Q5w0S(=7j=&H^wB>AYyns*6}j)EDBYjWp9GQn!9#*pI@L22X;
z;|N2edgXG@ofA?lBMu(iOlUi^Sqcq$w3$1}GEAn*$pl|UQbt~mfCr<$i8tBvjr?fi
zvHnB_vB(1e;2XJvfW7-Ux|p4m?TWv3==jI*_|IYWZ^1yw(gwMiP)iY0hOWdnL&*E(
z(FZfn2S9a(iXw^A;^MdHN#dOh{o~H-T!dbQ&gb0MEG*9aUjLcwJ*+?0z6-4ub+Eas
zBjQ$Ojtzqm8`03{p{liWd~EZDC<L43b0nJ)>3z9ceI*XJkH{gr1OAP>Mt@Izu7OW8
z{6mRtzZtR-x}$B-vuMiM1DeuD|LF+^K`I|`A86$nN}>2sC>mr410BU`MydjoUJpY;
zreWrx2y?TfmWhLG>^hCJZ+D_F5i;+GQ3w>s+^_%0yPns;sUT03ymsywNfHa9(-S`n
z3t5p(A7=BMBGh4{5wGj#v3n7imF_@I?Xrmbqgwuf!e;84bNYc~ulwFQ<{*d-?asHH
zoP-dDvj~9}%+AE^2JVAqqm8R$^tYnQdFrF6sK_90#{mDq`iEgHs4)!(!al-&gUN{X
zfx`7l2bxH-lNdp;CwsZNQS!pZLMQrgLU_ufq~x~Iq-0dC?-?#R#_YM)>*ww=w#KBz
z1or08yiR^%+F9m@9_VqI-%2x&TgBciPVwm|z-;j>ujo*{KC<Hda9etKo=d7+iihXu
zLD__^pkX-`Qf25KHv|?fx5bgWzq!8j^ssazpZ%8mfw*WELeSau{FwN+B-6#LWCs!C
z*}=L%F`pr$plAjRMHu2gy$e|&22pFOlY)2be%z?s+}=hS4Jv+~FRefvwn)}5>-q=@
zEPYGDaYU3;4YHfp5;%9P^L(nMO>lE<KD8c&pyBVskiJznYKmnTSs?egM_+n8`W36P
z&kePjCmwt!ukx%AcSR_i3Oa1-=VC*6BGz1e_Z#kvE|-)T>($n2D)-gptN7!bQe2es
z;kT%SJ%pt<HlDDKU}aY1@mN&(kGJnWfl?1WvczEBQHHa!I@?XS2dWj|vjNCW4dlIZ
z4pl$JWnm)cft1>SKgkp*5s4y}#~_Q8?MDWyMntKT7-Va=EYMN`NiR{h(v@T0MUFw#
z9F8fkfPesmf$%v?ok<(l{16I-So(7G%;Av~___k^CFzj6*|06>@90A-2dZq`Hv%2x
zf!f?GWG5-9Wpta@(v|Ns*O>B?72W3f(~r)*@>0pgYSu|WMkI&OMyX#Js_<r9N;KJv
zq~EH{rnlZG@v(nOmK$h8_k&ilRzJ8hlrsOJs+O1*=i9L`e6H6$3knNMo7xjEzC5Xr
z;@}{J(W8LZ>h}OJElvlL30#0n>*s1u45*Hz@O2jP)qLHs(1qa5<bQwXtOgMl@mo2;
zM`*r0QIBwImPat%Gh=aYPh(GZMr>^PtYbdFr<^Ey_lCpSIe>*{=Y!~%dH8@jOe>Qr
z?J7cX)7@<V5}pX>m|+3&Mj*rFUa8PM;Akc)vT=`zi*g2)t;T<87@VEzhTF(A6fwbh
zfetI0H(y>}P9q?yuC6YotV+6wgV6<A&byLX!Ea<mK$Vs90V?99>KvbPy>Iq&%j~C7
z99&F6F}D{DBDrx<ft_Bo%9rC=0Oi0-r7GLCwcCJk-H49U#Yuc@-}u<o#q-)n7mpp+
z-@clby)T>M?;mbixAP&CiYU1vKVfxZ78J`VfRHu8)bc(!HK~y%Hus|jmG^l1@{DW=
zBa_8!XFc5fkh!E{=TbF3s-jpBC4maUBc)h<I2a-xM=JNMa3EDe4}DVG>P`ch-~`gg
zjNqVAS8GA(j<T9<?M_X4fz)nDVP;K`Hr<O(rKW@2XJJ{T;mmy%y;rfJ+!olKo+@`o
z7&LDQE>us1No$lJFjjj}Wl$tuEGVE?bXfhFs52PYfX&&dlWLb!j(0N}bAmEzALtZh
zkiPfE918s|Pr|u02qDjpuvUqhUHW}cLd24<dU9#_ze|Ts*9nK<crX0BM*K<b+IwQm
z>_jO+zuB^PZHC#;%loVK(!UeOYco)l?hcW{j**wfguMkeARamQi6Syo-n7D^TTR8K
zfn7-_C&`g@UtAt7(U9@BVHUTP_$&zjgvQ*Y_<y$J{uPg;&JVY0r6qIZpH;`6|9FV`
zPVmwm<=%da8sWleUgMf-^Kf^k33IT0U5OqF0YLg`im~~7)2Gd_^}0EGlT;2&k^_*b
z99Td)j@x#ez`7ul<#n7WERjEOIKK?KA~vnRkV=*r6Dd6ic~;NoSYSC^VBX4lPi7n4
z`>r1W`JOAm5nEDh)Q<aYQ^<L(H5`<zQX(a*RVqXO3OSNO*=7JVAGHd%q7pkj;B@B!
zvtw+o(DvFqE^%5P<eY%oS_O{3f{uaqTqJY{ImfkCp-*u^*U0b9)YhIR_nPs}|I4Vy
zdz`dTQfT&vIgvsF^l&BNSMST>9^}<o;y>W!5QctMB}qajo}IEl2YiU&$}3Mr>JD{F
z?HB<F;;5veV&3~k>ulqf>{0?ADWm~#otIK{duvN7%ZsFJ6bwmIqweEkgH@`>{7A8&
zCIIr4=j6}h&c|6bJcn)3aod8>JFs=A%yQH@XLZVxBFLmS9j7OIyu$z6?&kN#<HG0>
zYjQSG=BrokVfj;}3~*C%ukua$?rS_oQir>z45An6BJgANP4a9Uy$Xj1`!XcWme>Es
zjvkJ6mcspKxE(uf@W9mpdadx^=r!m#fs0}B(DSYCqZ<pu!R4E}@9q28$M+g{IfZ$s
znZ$E1Ro!BtnqW(G+&B4z|Npe83Pj;YphVGnxHMOa+oEbTmLM9LP59h{VeYKla>}be
z{?sqd+h(Pv>qe-8e$UB5+Ai2R)ip(;Uo2!yK@()>GI#6CrSfUY)?$sPfDZpHlS1(6
zk+6v|<?s>ajchpGNs%D9LbTu2rozuqGeBlg<{;Mkgg39eLAVvaxeJ8c=t&qZi8EG0
zy7q1>voq;>w#%ahxWR~yb5F6#wmy^hm8N8tG?BLj_T(^vYwJ|Lyt6kA-9Aq%fNfMA
zmHHKXECC=(;A=&GnvVvRG8ke_ZkxUCgDnDadL~uI67H!Ur<{@!Jc$-MPh=u>WT4E^
z7!^rxh7wx$-``HpzSdU1RsmN4wG>I}u&b@qRJSPo*tJ-B_FiaR=`Kx*NQBqk4-XYC
zqM&5|-*enZzuhLLQF^DuGN`q^MSZ@|)Vv-)q9?xB+;8N#+jRp{`&!ufJ)LFQvbavB
z0-H59G)w-S4?~50`z%4pR$VD!Gqt-9*Zg<&mR&|~x|D@=TAGaNT4t<0<3j=~gVw&K
zytj7);A}T`*#Amf(}fNf#hFj<zvyM%(%soU6{EA#+kBk;<H>^~Eq26k=*cEf?nk=6
zzIK^~X^Q2Os!_1q&IXPlRe;C|5g>XG;c;v|4d}eCmRVOthSJgmdJ)XdO#^8MA6l|8
z1ijV>uJ7^TuMr@s_Yfv5)<J#LPfCX)OZa6NX{jEvgzF;wv*!`a=g4&PRv!7y+1V+T
zq~r+r&l>7U$$0JAS#5I_tHSmX*}<3!DK)sKu9ffeU@()kt=LZPX{&m1`siHda~uK^
z(4J~h<Sb^1gw5Q*&4Zpo3&}XLbUYV84|PW5*8+zM=)pW?=}SQ3n=LJ@w#<<ki!CSV
zN4~b73bnacf4K9qGNM>{T4kNOtW%4I?esS7KVOt}ZWV(7bLO?}ijm0e!;W`%R=$NL
zO5(ZR+l<oQ)nnZpS-7?B+U&3};KYzXVKZM?s^NCFz-49p$|I?V*Boqu`KqiQQWv4_
z8`q2<VoRo=zw?zg$!(s<3FVh1-}lyMKbL3IdZ9n-c!+(~e#4SnT6cHqKFwL*{bN5Q
zav~oAIb{NEDDlpJ@L@TTp#*<S>P&?zem>e?&;I(vOZm<m48cY|Q@dJsLpMtN^h-k_
z={rLM?~O+yhn3LbERK(!g*tL~i{aReD(^XC=`@^lX3->^Z0hPwU770EANRytS9_ZO
zhyh`P=F2k_#^*4_9<<w0`lWVv1+pf~FT(2+K-noG&|)nj5mB`=rQu*K=d~)7lq?qi
z-N;S?vyV2*%gj8p04=<$*<#R4aafc70b|A>`djeC^=i#(&>;~YLD-s!lPjpJEEqYB
zB=8Me!fn+O;B&}IP|8#@vl;<Dov>9G^MUgVj)hlK^n6kSI;+oZK>nkiGg{V+<bLL=
z`2@XVWU52}fuI1I>OJa8ioL>}L#1%}*G`xUCg7=d5|JFBSFBfL<=qQVjB?i$aUPC7
zM;~x(rkzt-x}B3tR)m?Iz5b2ni;1npb96Z;SgE553N)2e=ysTI)7PB6X6=#aIeLuM
zYxMgsz8UHhx8B?LwDyz6d>%R5PFL+C@w8ys2~eh|D-EGl(a5DgvgA%fW3D|%(FCsI
z)zfGt-E+ng<aBZs>PiWhOs+gP=f8Hfd8v}l`}R}}Te?`lQ-~m7H>cHZJ;xZX$l}~^
z*%8S~O;zvn>DdhF;k+AK)TIDMw=gi3O-)4z%3GSCR?PhGEXdjPo})S3viAg%!bzUh
z+k-Hb-d_`FA%AEHl?oNZ!Zd6J`Cz%q%+W?1i5|@PXn%Mwt8;1|_#sr~NlMaO`}EEx
zmtceh<mJak+EWSgZiovN(-zZ86-Qx4p&zQlVwxT8HF0_rzS|Bzri{qrOzX&t3%rVU
zF!RYzB8H1bWjA|vgYy&O;wY-t2I)k{jks{GWNA<Z)Y-qbT>CYr6ZP?aie<On<-M88
zn#7QVK6O1WBl#SP&xH?Pota)a(`d0HpkJ4mo=-v7c>er^nru|79P!tP(5K7`WOHL5
zWLTkgH<m8R{rx_$Adz@k&+%WdD<(%YY0Ln;xCKhyB4F_J0*W1xS(dQHN2&uvw<*Jt
zG@R{j^c}cKWCP1`X6-FgJl5X6bL>ExV>md*>P@0y4|@R@)~qf?50aAWX|h`YCZXs`
z;AdxN_W*D*wvJhNo{DrnaVEK3ZrN=ZYl8S0rzm3rsI3`{x_{>`<6gk~_SQ|;M~hpc
zfp&^W&8nSkg-rQae=9w)yyWgp{H9aaetxY&vk#kXW#~7jMVuY?yQR$4Bb1clyOuwP
z%T&OkLdD9um>6peL_X)w%JeV5w|)g;J^`QEe3l6=KVk?#dK8dw?caAt9;RM1*ixfm
z$p%))6(Yy}P$&g5?8I8!s!ma?fNS6+jH@LG@|ws|5+hDT;G2az()zN1Ja)kc;ciP8
zf6mn{B!oh->TKYSJMe-Z4a#NCGCUe7|Dwk*boWrA!G{8$oYut$e|&y68gQ%E_@#6|
zLynh5xX;b+`}aG{s<MU5QeKCg+d`bb>+X5-39D>yPI^3A+t?;c@s~6eoXXuYyk28@
zW=Yxb3;VmD-#s`vrq;<AGd*MgUA+R0b*3}zak?cobcnzRV|O+vqHZCkH@pu^njL&E
zD+@G*f|jt`Br5pJuS2EY@9)UfmgvCjXs}$`2-oaRds)|?Lv&F8BMh~y@N;F*q<E0I
zc4j0kw!Ra7Kgtz-?@qOcFyeJIYNy2A=Px@BY;K4H{2(7QS>A^Dsn<m+A5~RVhY6sQ
zhkl#`N@2V2yOrLN1e0P`<(L>t6*ZSfMb@g>Gq$P8q?>^E5<IN9#~pvcwzAgPq-HMb
z@L>ad5O$~T!u(S1@3!uv?^W-2J~OVXK5aWl;0HSnI|s*gwG*28cjRb3$-)YK#HPRs
zq7F*2>-7^DQ-aOnC7f80Zm%taJGxz&MDWVI2p-qzB=}IcpczhCsfoYTaXbokJx0X0
zbr8h_iG`1kj~tq{Uu|6lu74|_4%CJf0ddIUG8P}F*ezz$D^%ZAZO<!Q;0fcJO~BI~
zn4vO-M2bb6`F6|K3_cf`l57rXioJYWbT|CA(3`a3G?_95HZ~@XOC6jdXZ(*IkGiO<
zd4_}NSRxy9Waz}NBS%9E{Nhn-KHY`!OeYuumY=`b={WM}vaVC+n&Z7{xWIRfZdX3F
z^YinYb<lm?uvHzT4<^^i`S}Q#*?v7NGY%0CXkvVI^+G9pn-3Guy+q9GdIzvZfkrj`
zF7lIh=X?Pu03U_Wffy3=<pJ&k-`w1s06#R4pUn{N&ec2Sg`nk=%V?2^XV->rWd|iC
zWlK{SO{cxsmPA`yTRF^igfO$%k#2Eb-VWNmuDd%vBP$ilQK-dDHQki?FDy&R3ZpAy
z6|yzPe(PzhhBGEcaFKQ){mHO{wL{9)QLZ%-B+a$If4l>~A_vDW$9Cd`OFgPqdbM=&
zfnTJjRo4De{4B^ow9#;mD)G2@tMu#Q`R}Ic-SYo-T&Lr~_KH<jRyKuJm)X2_a<ep8
z%}_TI3^(vo;BY~#xfR~=+_gx9uc0EM&rO}cX1RhOY62m8Xb^H56Nl&$;-1A`Y{WFb
zq@UkMUma@-I7Fh`(%d`=-g!xn<>wvkAa((b+&cb`Jw!agd-b~(-WzGonZ!{+wFb$x
zWB8<|mX>F=(@V(U8<v?S=zGQF@f8@{vjD~#N0QNB6{M8RAInlu{66D5Y9od6Tb}sw
z*{BT`Ha15GxgS3^IvXrePS1jj$C~;bM=Qmk%FXTv_Ck{vsBK_98UWHZX&TJoDZYRl
z@ez#bBX2HV8W}580Hb<AP9NF&*~M0K1-a;(-fzLx6jW3Z{*=Y0zddOpc&eJFPnq86
z0l4@XAf8D9bE^=<1PEHUn6E9E(!9hFVvJgn2r=|ji|s1Hr_vm7@a5nlBqDN#X=?^-
zol(%P2S1)$b!kZtd%u}qk@I_RJ)?V~NCbr~stzOSkll}rin<K_h+6M%@h8v;<bw=y
z_Hi+MBE<5q-@F2wDsnby8)z6mC@>h8Ak|3Z$r4&h_Q&yI`;eK}G*Xnd6q{a;l*g>i
z_h&%2*lb@Cyo1EL`K|So`3+geB@}3G3nr%%D=fiTvU0{3kC|GZ`e7g3k*8buvh5j`
zybG=nNOihhDGfK80Eb&3|7}vYA+uC%9ykTZ;mn0U+tBj&=<a$j$Z()Kq8i(TkBQSn
zV;nHY>`wA{ucmV5H7rrBFBRm6&_|@(4C{l<2O$`bfQCF9_zUhog!v!VpS2No9=3u<
zGWHS%GSoaphyqd{NIdH<9x70?X@)8|s8n+ip=?E4T5@p8(J|iTQ9eJ{Hx4|*Sw3vX
zh}@@dc{7-bMP_FAnIcBrj(|A$3r~Vs7d=SBeZ2|R@ehy7ZIfMVb6xhIQ#;(~N|lp*
ztpVg3#dE>N<~$e?AH9Dss%>>&+_A0Fyp<BMyT=r9_Sgi$*iyfi?x*b6?*518spIHO
z&U0`$G%qpw_J@`M9-IX!8)lrh>YD{m%QRRrR1yS?5RnnwC!H(EF4%p*QKcP(#Zm|t
zE5u_SPU9LBe#N=b;Nmvv1CDAR(S{Bkfg54xZd3d1)juk~$ETwzLn4W~R*L!<pOl;o
zYO){hJt+U?pjg5Syy;P&W6f4pTcSGPt#WlG97e2v=;`SVeDIb)6kJ3@zM-o3`tc+j
z0;r56Uf;N4*Vr5WHY&kOHrV7HOG9PoYsujY$2|B>p-=fDrrREMi5CE*uCN3nkq4Z>
zSh~+A16N~tt$*KYN&ZmAn?CWV+PUBhC%l$SZqw2h-jU&OTL5aMO#J*;+occwUOzu@
zgmMf}^PK~<76D;q$m*|7j0n@E6I2cHPxl3x#jUy)7tn5QZtW<mJ0(zLKMY`=z#*4D
zJ*z=rIXQs1vb@B|>Lr(7{VUviug+Eq4oagxA(-&Ki+j`$T5lFt0-WD`x6rkxA-R6v
z$N-*0G2(ZD>v8pv^PDTfzll#sz>V{Itm-))<z~!S8-!gPvC}W&Q9!-&hV9zOiU^cR
z*KLh^!F-1faRfM_4w>ZM&G3ixqF?6-2~sq$(0}OAq5J+X@1R{Dm(DeBk4GN0k0#9C
z|J`3}2Oj&9HQ;e!_kgTeC0!s5jDU4WZVZ9JYWl}9nOZQGu7Bi=F0VYd^EfGK4t~`I
zTTK=ndnWhMk6mMnwC`5^`gERd;BPxTG}^28;1v*bb3L7ML`vMq&8<{sas_gS1t84k
zm7Y@??t48SNK7`O6T|8;K~M$l4z>}cNgz{5TvJzHgGY5tVqUe-3!apgkWm@9K=p7N
z*S3$YZq`ZOT&&&qqaWhq<;5?RxPizhQw4oyBh|DF33qT{F0<X*+S>bYzmF4|w?SmJ
z3Sn_elmmO1!1tVPD-(ZJ^QUZ|aEj@chYkfs9y}pmu%Wtva+r^AQGlm&=<uacA}&B2
zxYZGmmJ=1dBuYb){zg74&CHthr?OR?Qggh&>fElV6sUO1T5(-!=IIa-u9BaJ$C=&h
z(4kKvJdb4MroF3vXZRaD+UTL3(TOX4f4aCcggsz_Y}871e!23;cfgA8vir{u7QdeV
zP{9u!nRhaJF3Xic{&xrtNjvP5FUG=4e8(B=t8(9cmAl;7UqXLRJ)$Kmq=klsW#kQo
z-1`hERSk_Yb@9Qbwf{ramw-dLhJQ~<N}&=eNt+a*#ZvZ?Hd)JVEEUEwV;wTG6)A;E
zC_CB0*vCFdNhSL}!$`7@G1+4*-~D#}|L^*~uIqHp=_2z!@B2Q_egC%mXO;YSo)<z2
z-P{*{@ABOIEVpngN;Q8MZYwH>1YC4;eB{AtAwlHQTK8dNkx==(cOs&qROq-Jc+O3J
z{sC{c+oKZ)pyDlj^Jec-C3mWW_Y$nE8{W9;K>>`5XkM`2ib9#>&VD~9e$sSet-H9@
z=%M?Ih4I$Mt^4aFcV+fe34CA9OUdd#XRvDZJgUV(Cu;O`{)pH9l9L%$)Vh%x>aVHg
zDE+ct@70Hfd47pI^KwoaIcgMc6bJQXmq`6cux)hZ5BlxYu{a0?R^QLmE$B9Dfa5{h
zRk5r_Nr(MXx+1=)Lrb9#)aI)Pjy~hHZ+(68N6yH1Qzx=D=+QE<<b`ez=olyfw>z@4
zv#*m;D9nMnCX|1d*y+>7U{L%VKP1V?2_r!Kh02lDh!MhO>^yj(6^*@Wr7yG-6s9VS
zIJf44{(iF!bJgKua<)d^))G&c(R?2&JZmiTO2v;!P$AnxD^{J&hVqX(qI7CNc1rOp
zi)eSLfc8PjadkS{`0}k3xvh0J7@xcEhjXrFtaleRqUe2IUF|Z&aQtNJCqlZMBYk9`
z#+#s`;nXwW{ZIv2kwfMaZ`%hd(w0c(LL9m6-Pyw^dR+JU<43fDV)52dEADrvfO%*1
zP||<>y32x2jF_4ERag&H$A?M)fzNZDJyWMaO*!bNu93?73CSIYS&@~Dvf;2O$hYQE
zntvGzsa)~WGwm8u%S&5OmIJ$y2gJb9F{koMG@*DiEQo*9@m(IiLqP&LP}Sp%e0{6Y
z_%40Pc{2fyUAl<`{B5UZsLI^%?4x*{T-Z-@&2@FHK&G9AykEK8u%a2s=qJ73s0SS)
zY1+3>e>c6`<GU&>PCQ+Zd17&Wr?h9AZriA@JJrZ8r|E9DS)RpY_@^4blfQre?gg}d
zxW|6{LG)!$&@|2k7i$6yQHl(5$y?K;Duc(6Xu;-B5`Y>AK>Y$Vm~Ldj6#)ZhS{z{)
zECJ4jGCR^pOile<BZ@-N!;p8I4<;GjW(4>O{UF2mlK%Zv<hHlAkE2Q+H3j@BB(T##
zn*iFAu5JMdli!jN`-Pft=W-H8)1V)yVDs1nlpjfy&A~iI&M9Gsf}y^CxfKd^c(%Ib
zt<|t7&HgN0<QqeM6Prsm*9p<=-Ko>EJLd)|**Q7IfWY-dNunotJ|v5i;+*TY`w|%|
zfPeOTXrL+SefS<U(P^-H{pFtyR`<U6I~BQ)E=pplG9^9&AuVYMqGz<UYOiXfCCwR_
zVy$6Bdb}oho`d2^QtT-I^k11=aB0Z7>;pucFBfuACgGi(cX}dj0rY5wCO4SDZZ-Y7
zo-=Q=gT`DV&~OacxZUwWfz3@#B;dX3yVRoz>yZ2+Atlu!4EMf{n37dz5XI+JBO`H=
zUr^{C`u4iAG50osCO5I<ZMr2;mRK*sQ^z75kbk8wdJ1eT3F|LQ9Gc@UM!kA9)MM{h
z)Fdklct{PuFTqc?*OHA2uq2vE5mT7Te_Yws^|l+ooZa9EVpGzv&VE4d=;{WBzl{aR
z-b)_gJ%2Y3A2@qAFgCIC(w+Q?qUI$oljq=6SSm**Evlp@*REDqMC^gJ@85~apPhBx
zkShXSwoglO=1L9hOehpFn)@pFCCSsMG=hts*L>SGbj!Kgiq=ibP?1w%>X<Hd#{+nv
zmB8r`6&X1)Ir&V(>XE7t3KeM13S5*uL#|n(Rs^eMlM}1$$Wtos^NK$A9yjEu6WR6m
zXm1s6FAh<lubFTy+<Mrld#%g-V+Qg2w{I?@_v{aJk>IHA<u`R4>Zy|g7z+vDVnJ>_
z7UGO^5l(7)5o9+OWBGZ6@pX7!?HiI)cw?aPU!{mMbBN%&8&rltZF1GMWym;NK~N*&
zr~CVA44t=V-ESS#sNIhZnBAV1mNvZvds~0AGRx7^_2!!OUQ`nH7%T|3ANIfzS^mxL
z&VJ|?Gh{vdqpox81Xu$Zag|N(%z47Tc}qptCQCj`G#*C2Ko-hIA8>PKXpZr9*5C#O
zW=NQ!=b|^a_Vx84FY+U&;atJKiwbdfBWW!aA+x^g-<$Hqm8(A96bnHMZHrc|)uq1(
z!1Cq1OOGUoBwTb$S4n-6+wazE6}(I;aiCRs<#v)F+kmR2z_{c6$R>4s8Shx=Yj^Xj
zVfglivdd@5e{<eTa6XKJcf_7Y@sB^8Q@H8WM*w2Cp@nw9^Vo!H{emqYiSmG3$&x{C
zF~-|{moDU*GTz+QDo|SN{nXVJF$at11TzGpv)Sl3IjY$>+PaSQDJ}Ki<2dvnDcfP4
z0JQGZ6G5CazU`x9P!ikRaTLl(rQ>{cse|%LY5fBgO<i4myGG9Fxq%l?x8+<rw?Pyl
zT5Le@M)sCpoyjdwk=O!8I}==t29S!Rvi|o|UKd=XkRx=GzFe>N{*9x%4Zb-n+uEKf
zw+1TgrAjT;^7(cRBE(lL4h0KSc3(Sa#c|NtpMFXR)mj33uD@)0Qc^9NA_8w-7xd+H
z$&Wjc%QK3sYX)_DMLZyaxw$_-NZMwrisk3J`^$@n)U%(yGS_pq;ov<)OA6Q39-tuf
zIXlN}i6*iMrK-lK&u3s{@EgwMBqK-n7kJHyTdg~-GH9n|22cIjx8hth%IxCPO-(A0
z<+F2qkaYdtCpM7>?yr9WAHHT13Ofg+F%GYqP!}P^gYsHLW7R}6yt{I$@Hq+0e!`Eg
z4`10@EE7QcE=P4dUkT&)81Qu^aOi$5>Akx{Lrbd!-qjv%6sB^U9Gj}(Z8Nhe*_|OF
z#cBfZBnpk8^5r>sGlTQsEHAH!iVg}2ii(IBp48LRE4(RWWExWgLOTrX1Gz*VA^A?^
z?Gbnw1!kmP80#}hFlK|@Tv9~2ek*>8xz_!LL9?gFQ#x=Iy1mAW8?*L~3dgGUI&-fn
z$J&dZGPSF>4l*#Sus?Om!Y*y3-oVVbHHrAOvgVMXx$Y!RKhIA%vM^+i(?Qx_aXLwV
z?}P9i(=K8{8|~jRH%;=*TWqXEV=E@ok)3U#Jx#LTESi9&c~G%y2aakU(e|N{(3zWy
zMMg$Orc0m!&W#8_>g9xovo{14ALI-E-xbJr>^lefLTM~A%q~NyFJlNOH-pUvh06B;
z36CT6gswxkb(t0NKV92zh`OX~>yG8N1T$M-$)K;d-}NTz;;z^j$tJPM&}k^dijV+?
zu1%=g7;HaYP2pbWGlPk>oXV4pUril*w5z&qiajSEusR<Y-Oa-m(4eEs94!wLKV4cY
zUO~Lg8RCkyzTx|LNX$!2-MFOi^dL*Au}iSB<$L?XMvHg%F0wb$N#5ZS%{(SgZ+8F!
zroPxHRr6Qv$LrUxr{JS6IAEy=_6(F#hQ;}wW0TO6n0cp&#BkI#sd6n;<Ruj?ev-M$
z8g_Ma8{o^{gdz$K*`P2Z#Yb}3m;eFgs%$~7d)H3+ujk-=s2qth?f-ZU>o;+(hDZ5t
z620xBv+8TM2uv1~o(jL79y8-<N%6XIBotmI!=6oKC@;R#9t?9Ca-dMzF$KRlDy@F`
zNqk}1g%oDpG<{QgA$3U462DnVF4%Sbd1zQsLi~zpo)+7IH#j>o@pkZ`ZgG;8X<isx
z&b5E#RujQ}a%^&e*-<oyqW@QL70~S146)jRmhl~gEexmId5NHDiI0qms;EehCpdP0
z`*6ln<Sk5DXUVuJ$@VCH*z-zYl6Sv<_mxIz^oTuRxgIRF&GA*6P$t62w)K6Yb`0$K
zj=(a{1S6M@dXxquO=R82b!u#;{X@75Pr8fAtA3!}_qS|KBf+h`@44Ns?IRPyN-Ml1
zbu0?*27$uio0ynb{}~jDQaJmavr$U_XPTX8Y`uDeQR$o9xSS_X+g8w-Y~lJ{`rYH<
za#aL8c4d3<M#r#WM{bE_8=n?3?XJe4!(k3~jUtM<3Uv=Q0+jTP5E*WUZaj|`vVjBJ
z4KK|T&{9DYu6Fa6Y5exB0A{QAf=X}-Dg)1pPm$f2bH|P~Z>TSJAeY8ThG-%W5Yey5
z6oHcjffd&dAXj*JuRF>Wq%$5+s~E$%(;x5+%&UD!#mZfQ`p7RR=n#C+^(h)C;@n)X
zX;6aYBfhtweOHc*0U!JgA~MkE&Iq9xNiq5FDFfj+HFVVmc`O3sw7(-?$-O>EtZp@K
z#d{%+F!@LG9v{<B$&NS3Ex~!Ca_MSErj<7)WTQv@H~E8?mXhZ^Y_eF4;CvNknIf9n
zn-sQ29_&^+Xu?>V*Q8r-2)U6(>Q9u*@6rmum*@n?nzF^;&q|10@JYu1hP>k5OB_PK
zOG~g6{`m8@VHW49cb`i*!qigt4$dYGs6H&4-1$i0qa1(@lUq<4^Aah{;#&)0ALtd&
ztGbIcpGuoh66iOjkM?#Gj}Tvwp*lyx8T__E-%U#>epL?bDn(On;5QH2ufp+z@^kqJ
zulJ#{v%w|Y^5RUeJCy)rP~9bz-@zTT!K&Fnx}GNC_LsEV3;phpF1Mn#%MM`;&~8mK
z({4Qg#rT~(dP9lt#lEw3Te&H<w1hvQ^~=$CeujdWgrs|#TEnz~C-zixB~_I7MDL9T
zVfzfl)lmF|T&KOl+doSem0VX&Qr$YEJXk(FCc3&!XWAY-=X9-_(KoK-jyKq!cgNt3
zu@x>o4L{M5q#531ydF)`rdypYa9M9XU@!i|6nFNlOVpd!1}r14@UXKAg#LXj_jZm&
zfQl+Lq>15(1P93;FwCu4C-`CRW5xnK^x_`;dPW<Z)Lz|2nEfWo@Mq)BB;S9Kdh+w^
zx8K@1iV~kn4phI2G<i3;$5;Mf)kC|eroV?fwB(2OB7Z^A7|>27P(F1m4tQGlVSZ<3
zya5KGv8m>jfw8fbw&GkS<H7hY`pfoaF^LD{(VXXRC-=pw_$4!{XWC?)e?o*m)d_uO
zmqennA0XnS&_n0Hm_M*i!In1}7?`_7_Tu?@Z)4A=YnQ?;#yZuk8T3jeXZimG5eYUL
z?eUJzbtRxqM<*|PGG0bTrb~FwL4s5<@y>5zk~_V-N%(-Gh=|BE2_&6V;XR6++kis)
zh?D|befp9nUPH0m-7!qh;obVUI$8$jvoT)#oV$>I?wd()pIt_L|FcZZv>xKZkp-P@
zu=n_3{*15n`)#bDr7leJl|i%TyCX)SNzlaH?&48s((q&@dX^TH!sW42_@7QoN{ht>
z!HJljfw_FXpkdBjnwa;kTai8!#B6ilI%SV<BGFs$Du$U8=Ut%7qd*FUb<ZkGk4~)#
z*MAeuA|}6Ys;uG@Cu8gP&}A|ssLeY#*#8zr^P3pk1ucvxnnN=D{k{~l(o0lgc&U#m
z-->AWV(NEMVLyARjX^3-IIM)R{;XP?q^ttNcRZRjqm4`m1Z>_~a_Xtq5g&Z`M`W0q
z`y@=?jNvL5xLUlA>C?_(`|8Y|KMyB0D=7qG6I$o07bxDc6OT{f*6vj@O6E*=bFVx^
zyMI$({LQP~%iy8ekHtL*<1=bnEtM=jEq+?OSY3R~WUx3F*H<W6Y;kWoL}lv9_9cp2
zu;M+&uh#<?V&Cs$+O9uR!HzLJir%Cy%DS!G($LVHGi}>rZEH*IHg#g)NSf#+`?GWn
z`r`<dc*ja6xsvOUe68}vx{%Yr*>0ybYTXO=sQ3u$PjUla#Htc2=9j;Ue=RaD@+;o`
zsifd<S>V>h@b6hSW0!~B=>yq$3zO~MkuI2ocqQ9hhOB*@TuXXyXG=Qe<wv#EZhQvs
za`nc#_fo0d#ay3aq?aA6ST7z(!*3xP@(3&UBXg-stBFHHDYQ&Dh|u0J7iYjhNAy~(
zW8t&G3PMb<&5yTM5Z>jv0A`g+|DrF!qr=dR72VdlSkJBaN7Wm~CLZ;T+eC~A3x%0$
zeK?iyC=o#B6X9i|WI#i2*oRcjNLLvutU_}#mXq(E1x0^F%^0*7?n2cQe@B1;{5i;$
zf;}K~Oo5(LWV9aqvRjP?1LaH$?>~#}R@KPxT7k`-biVn*r$vf`RO#vMauwq!e*;wo
zZv-c#Xf%uM)Xv`zM+4^F-dm0zE-z5nM9;C~OgYKs?CJQQ#vg4?NlAGsg^Y}>3AO6}
zG*;jYuxx!Ouub;)BbL0*p>4`1{gW${HFdl64esdJ*9UneOR<Zw8<_72JB}a6oPu5)
zt3RS|V7z}tPhVGGaJ17krGOQfa!3D8k7C|ZURGg68!IsNL5IGDh!}w@lqT9+ANwU>
z3@g^ei&G2@RrxA%MtgkZ$r`y$`@*1LUYVEfT%fY&&_kN55|i*_FNS|_^(wB-y>jxC
zpoDCem9rZbI(<s}>a9_ZD}mkgw@ck&k4)q@nKU$bKtGVQHP%!<=)NZvE2jXHE75&W
zGj1=DQCrE$E-qd>q?(GK?EHr3TmlHT7seZnYTfDjb_wO*9gq+k!0(?B+k-ZxmwN$6
zJUykx)x)V6BTT^Ie8<bn?Z(T!7U17U2sm>k__L=8v8GZ!>n3h3O(xS@=e)0Xh_|}A
znV2|xn{+sIEe76%ZD%d{<NJidc?xTOVwh)p!jB)fAi5;ZG;yLe`Ejh)$CQae$o1@D
zxm>>dNJaXBG;Sd*GA?e45Vk#2P*2ARfoO4zk2YL9KW;m$D9GT5Jf}_zO~DblN>J&#
z*9kqtM0t5+Th)0OQ7bqs5zTYq&ta;~?-Bz8%4haD`H+yXMP;Y`i$5Z?d%eaI2akH=
zd`HVO7+o#QQtT6~l?aXE@l`*j>F+ELi@~b*=q*?H%l0X$&XMxDFRHS*c2UV!(248p
zgT{fbw%2(T{f>3?^JL~KMo<Z-A>OlP+gWVsl}PnIw5OsqPyf6hz29x_^Eck9P^m+O
zTpV2UCDnDUv87A2hs)m%Hk!P#WyN1;XAe`8_(Qw(aE^m1P}CNT8)-V4?B|r4Qrv!`
zO1eW&fmGzjDEc55WXQNEy;oZM&YL@wnmnJ@^`$?R^Zf@meVi;eKJjC%7Z>XhOZHxM
z%bq__DJw1Y!+0hb%~}^)Y~L-_>UO?POjNYtYS_Vv+`I3wlU%aBwNA!<Cc=(bC{0Z?
zrpxzBd^+EvI84BGSMw~~*Jx?l7S!GA=H{~!7SSEG+t>nr(xI4*@$&t|XQOrm1e-fA
zgfYlJ>YQY%Kr;7c$UJI-w@LNwI4b>e_6`Bb;+pjp@l175RZM><iKzYU>sRL^R_NEV
zd-F^cuw8;PDeBJ;U@a0;{uB`8y2~JBwRPMl#zeXq&`mj?M@ndE962#&dZ9rmGh34*
z0+8}C^T%4By&y=j|HhdByS`p}`x$m2fb^YA2UF}IG+9rsiA_oC{X(m9P;<OO<zV*v
zdlDoEZF*~(q0vqI=!B@ZuW^y<AHPI>Ux;$hw-TS^GZM=d7sT@DyO7xogO{B2XA(NI
zj{d0%I8+#WG;S`?*PbS5Jt$bCof$G3eEkQnObhjaX=cb$4o#3c@3pz<+D)?%uIu!%
zwUTLO#-kXY+ujrgs~_|1?6X|%z=%i20oGFf-4cI{dlnBQ-%6U8UpDTry)LvP3#!$v
z-65zXcD<LEZG(}tz%Ej9c0w&IpZ{pi&E%YOd3WB(6uhC|aq)9}#V0JxBsA(v)qgzA
zSvHwk4_&GZrCK@7lS#u>9q@w*9D?MQl{XOITR}?~bTA!k&o-3OxOL0DCioYLj(1qe
zl<uxpR_`!XvhML2z$a>a!s`csH>{lYN=ArJ(!fa3*^le?_D(kSVSOj97^lfnqIR1@
zdsRw84*sr$iSR;&E-~T8FopWmhr3APnlSH5;nLZXuD8dCJtwGchj*iP@pB$?YWF#&
z;LVEA%m~gAU$|9y((f5sZbrqx#CUR2^+NsU&t+6qsW-`cg!r(b>zKcjl=)$jI&nfd
zprosqUVyUSvN@X5da_K)|L1MdO%-Cq+?Pc0du*r}m6Cn1PVH&AU>__?GJk>~5!*!A
zH+^pm$vNX$Zg?*C4rf(ERI~tnO4%>xmB2XHaicUGkJ19QyA;zOu;=?suzi2P%;eGv
zgMNE+o<i@i{s)EWTDnutmT^z^5E$U5rvTK|z!{<bhXBR&r^yR?_p5|fo)S4DF@7XB
zw3T|Wc{4oJ4;-u(*M7b8So>`HUvKx_)%0aiYgU%&qCQ9KEGAyjnJ-f3NvwFbn4=f&
ziA1Bt{l-}X31fB*iAv{p5~h9m5*^}=a{{L3ZJf-R=V<b}Pt=%XVSma9PVrsP4nwSz
z+5NudcQkQJ_T4XQ7d<Uw532rYij`|YfH&`7&qN)euq%KOWR=<Vn@}-QNV9V}GkSD8
z?};+YB217e*?ki%jYI%JQ{y_u$!?&+)FfJ2Q)~iFFfqHVAT%@6z*+1&NyI{LRPu>i
z;YSy~7U+bH;%^b6mGT_W5ugn6QVQ#4H4II1>W$(yc(J<X5(MJp4VP!#B(y+x`L5lZ
zat>=MZw$##pM@2C{(E2J>B7zaED>edHu3FTPqN3)KAXA0FCfUo(nY&oyr=p6BJUB1
z_&IQbz+g<0M9YWfX*)Yx$IKEv8EiilIJSkpI(ChM$n)S#uj1Rgx6C{aIh~M^$){CR
z25SURNf)ggpl5vw!UGBvxud}687UErx3tFD?ItO+V;njiIzZQe1rj+o*PIH1AZv(?
zSrOw<QuFy>5AV|TOyjO+xLNIoW{>d9)~1BFGb!;K(=r}i4I2fCQEN6EtQiRfW_<S4
zWVlm-apNduhf381$pUMrRn|wU`8!PY$n9D0?P=+I_g<@TzD&A@*L}c6u2R^EyqoyE
zdr732wUUy9){7x&YdPsqMAA)MFMB%(4;EN?zwSwRX>-HnRMhKnC0e#zS-9crU$?7R
zX@ud-o~YI~LBHT#8(7uG-M#4<V>XA~=a(t=*+jFq%OEr=gzS*YonN5Twt<?+0()&U
zYzmKwW++Vh_r^x-Kdy8tHA1TpVR5+tbU>ksH90Q;Y^&@6e)F<~c=y&h;HV1Thsl4x
zsiCpv4fnQ~dxS62z%I?egjQT=-6JtoGO+F-bdO-1_xV!yF<*aD_LO~minl2<^<!>A
z4&jzl5AD2FQraDSQL{PObM~;{%c=mb@iU*lXEzE8`4yegH$Qa`oiEcy@V!95<tF>j
zOop6v?=y-Gk(O1|Ni7%(*sO}614QMexSY*_QOdTH1<Ro2B0;Qnw=C_!y`FFV?P>7Q
zfRWjO?1b-DV4lfTAg@+_O3G2cZOBETWHxgsbXDF4U<yHbNRUD$=LlM@MJQ2>TwDsW
z*_!r~!`M&<ZZp>2T+{C*dn#KhFsoxj`|fR=h;+FZmOso52Ih*N#;noqJVsHha?$g!
zsvn0gGSB9%hx!mYGCYP}MN{67DNRq>*Zg^^!AN!!COP4jzbKc_oL5--vjba-zA7ib
zKB{+>Dcc>UGI_tTsj)~*;EKA#uJQ7V^8g~fy4upD`WO6h&0&hO*I58cptYM3Sj7~D
zYGOxFrgVt<utC!HpygUt`*&SNkpx!_phkhdrwVP+_vtIN_JBIt7{Gr&sU)xM2Xkr=
z2x`P~6Dm_2M3;*~m3jE7-ZuXA^498v6{6<G3hP89vpNAc=(`Z_vs`buxZG)%`*5zS
z)O?Lj%F@<fYfM-1EBo$g;p0@~`?vn}p4W~w1uSC|`xq6Ow$}jhQn&#c`;APDDWMS@
z5JnqtpqPIM%B@UWB0@!?XRqwFpB}7H5zI$EwLd8x`xSv7KxcR#A@M&UXj)`|@A|T>
zAqQZO4=?`oXPZLsNftWV3Sj9{29)d`c$6wNO(Td&?x8I%j9E~NThjXkZr9{XDQB$S
zekW@kqxnv{etMM|zy9WmM*0H5hrgJXx^NstH2ryeYkcRfGCf}Z(d4SCeoju#oZ{k6
zpn|pu{Ci?_oc4mCui*3NEC2JnXuik(sQp%$yY$ItiS!T3<&N<M=Xn%J0VY*b9l<qK
z@^PzR*&rTe@o{zcv8!bjj}#%tBN`3A8Qi(^`^hF0h1*AJ=Yb1fuj0<PmmDgPv6lEQ
zYwC2*l$+X4WF_NuzUtDi%=hms_J!Z1Es)+^2%2XP$R6nhLT!SF9Tmt1xBY1nFxJ#6
zuepAvi;If~a8V|3Or!tdtNxbP0grynE&sK`ed5>Tq}?cl?icJoZ&N1UdT{*kx=k#0
zl;Fm#^ELyQXC332=skT=fB=*UhOrmN54Vket!zK08pI(}uyGb6AQhzB-$NqJM6K9V
z-vX=dzl{LaIR>Bs3l9IDxWI(EX8FTK@U>+GW8-%N59gW|fn_Zxs1E3y+J%!(8qBj$
zsT_@Q=vNf4*!#~fkI*c+Ni8tI2slAsH#|H6-IwW?!S*%niF^n{UELwvLb)g`gA_t;
zlYvVCWSG?lJFtC5oNI^>h(>a+*`ic2E`gg-b*J-P#2}K881FUu?mt4%|IhVXw{jTU
zwT_GuODNyB?%elta#F%`s4l4F;qokng=)HV^JWNKgb!Fa&lvV7^9xx*Tz5*g0}Wkp
zSDm3>2-jwEj`-YREq&T0%`!U^CToa~_5qhKcT&TRzjwAuebI2S|0?x-;YNN=ok&!{
zukfo>0WWLyOHU-etrrblDD*4+F%=YeVUw_u99vVgas)!+DuME45%SO|FtY+e1!yi-
zV?ZX*81RM!ZiRch?U<0G0+4iQZMBrg-{AI6d;VMGqnDJ_LO~u;(q|)RX!zh4vX#SK
z&2I{^0j=;yq3enZoww0w@&R8UjBrN&qqYn4IhMPiV%FFb=IrL^9=C9vX{)5LP?{iQ
zD1pB1ZQ8InKs0RF#6@x6IAphWnv9mCw-wAZEd9CJ@MgMOf~@_1c>Faj0xw;QJQC~f
zbqm`?<9;qG!~qf>6&vdS3=iqiqs<$KQ2v$(4QEx{c2%&Pk5-%Z`QInT;Pzs=MPxl`
zUbf;A5_k?nQO%h9AO(Kx$CI?&y1Ku&C4~wBV7*8vp`oD>*s3m0?<tfY-?!_+#6c7)
zsa&t@tTP{9d@bM2vu6wVc^P~I-KW~x&dPiuTE#xeR+1N6VY0ev!VOd2y9?)$*Dq96
zJYmc1!)=fIoYbN;WRv7Y@5xI<+##~o-}hEdq{rIl1#U%cQ-<PZ*JWT~5LVJuODilJ
zhTS&`9khAB7x~<+aUZUk1;ycC>ZbwaB@0^Fnl7_EX_(`eo*^TxP;t`$!ZBHBmW6wH
zFL>_<<=w}BK7k4KR7j+80%|!8lo2RtLwT2M-1u%)`rh7Y{`jixNz2c}!%Lwisem0u
zsQU%#a9}5IE0F%5(ysqoEr}@ZLR>*TzsKj@*UBmgVJwiCGk`?RBfCqsn!)zo2Q=O|
zL3Kwb5Z`wY<TX3na~AYI)CBMoA?yG~(!DU*xodk8zQY3#+gt8B@Q8opkgL6qyl)LQ
zH{e(R%~dCOxapJsermBh=d;PID}ceLvd}|g2&RaPAnXyBY>hj0JaxGg_!|JMA4F)%
ze&A9NuiAhphh8{Y=#zLC5lLV*Bu$t)c`r?RBtec8ycrX^7snm<dDn#xn^YUqeRjax
zS~1`?7GH9=p40Cn$`Xz6e}_9h_Jf|JJ`brVQLQWE{th50UNg}og94dEzBN%h1zX#=
zHFs0OXdl9Jdi1+o^SiF;G$Oxi|6er6Q3&kRN7yAn*tT}r2gU}JJO&t{dkkP{5|Y1+
zj7&yQ2rNu}_uT<M71^{7gDHzX1qr?L|7}{uI8O6<<i6+M(9-hw1g>`*gnis`flcBW
z!IcIl3<Hd_e}doAUp<5Xn7{?#8I2~kT>jrJ(&x#}{daBST%K?NW_3a{=J)Ke;fC;1
z5Yw`jP^cU(SoVAvc>ed^Kf>op25fZ=?d|RT%>UM19n2~S($Kt>>%i|xxV?*s8><bz
z;J7m6FyRbZ0tGAvX2a#dc#IV_Sg6Yy^ur)%6E)gIj8z^Ba4u3_LYY(t25u3+_(IJ+
z^;$!+puJtM5=^>`q{rNaP`G#6XrNFISIhRJx^DwfF>uM0fk9L*D3ncGTU$2}juf^c
zdCdDmnVZQv6F;#wHtBr){1x)>1^)W%-DzrqxZILo?U4p%qsW_=W?gS!V(wTU$whVF
zXfHe}o_CV8hgnk4ko`vgO&LpO-?gBnzq5OmR#i<6OJQXFjjgKm<b%(&7X6^5c7&Wd
zS^VT31=yq*FqUA3xd~;&i>y%?3@Zl*lpRSSqGZ6s6d_`PM1{|Qy`I^#p(eAgQ$4K{
zX3DVu|AkJ_ALbsBc6v4(Wf`V$@nYY?og!q<sUYN(gNK<BDo1mMqXdQW>!^5;G&WjT
zcn$z${X6<b>)%f|nwF<rI(4$SAW~#Gv}A;zP>QgDKOCffWPRwV)UGxRxj82>D5#Aa
zn$@SclJ$(@#@6CL^ZBcm8H;WYwy)vv|JrtA2k4DT5UgFYX4RGI(jbHdE$))(CX_>6
z_hwYiv4zuk_ybb|gQ$P3pQ>rf<3>&!`&dh$6)#CV7m)H8Mwd9gv%Y^{nvj^zA8I<>
z1gw*YMilbDQ3wGxGd429zJ||U1+fV(M#?BZscmuL6oDLbg0PnSb`)M@oWi-i9qP=n
z5I*ro>%LjzGU8WuXR&2hD2@TCav!9GdD(Q;X-MQ7mF(FLi&1-8Sy}n_&}i@Y1$x_u
znuS}!mP!h_CKc%mCCx$vqZV#1D#0u5KQ&g<|EjU#w;KIB1&HAbH-*Y>n&x$G>b^({
zX0iNBa)Cno*cFB<Rt8%{5khZ(;P)9NVgpv;-_!O;R*X%-2og}4lDsL6bmW;cQpnvf
zbc#30?&|8&*OW}AzxQB#;E)h<gbt!e5?x^g!IqB=5FQ--D5ag9omZ(n8JK=T6X-XJ
zz+5APtd=H6s0DdWw!6AoeYjh?hxsvKG=?7}O4G8v9U^CNnoD0OJ*9}euSq=lfl5b5
z$AEOtqVvgdw^R)`d&<+2@*O*NV4=j%?&N!mG&YnN=Y{^$`m_>{_bLafD`eOHQYSY4
z{{0UzDDmUN88CCjP$p6ghmLO=P@<~AtF#_K2$vsub9?H2xUwsrq0_#}8-;0%`NS=Y
zU3C!kk7{hX<koj&_k};Z1%w^8^9#@HiQYA)89Q2_X3&vVK6Q}$M@>^utRHzPt6=Gj
zqsYxUjhr?MZE*u3YmqeesM6D)W(`g|>U~33_kO==Xm2$ZF73LRBd(L>2&}oz^C-gu
zPA9(*N5a44QIU(?V(xtpOTS&rl|DhF>S)b<p>$_p;*uY#=x?SU4kgKu#!2>Z6~}Qu
zuMFyRxXZ)4^^e)aW1nvfZmcDuUF!J|wF|0P#^hQQ$cj97B;ng{)QeH7owQglHU%aw
z1_!OAo<L!4q-1@<2i9fe2T4j@{9iIJ^d0Dm+B^pEhMwQLEtjDl@3)<SuHOkCP1a#*
zfik^N2(<XqmQyP$h)fLv;JU%u?sxrnrhvH6PbEfi$LbNxc0^JCuR0vdh0|tT=Sq8y
zaS@^~k#%m}y0{qVbXszqsgpIUmsTH?>ptE)Fqtb+@8uZ_b&kjE_Tau#;SU|qEUp3y
z_lecGu1^`Eg-RttHlF<(FZuYocJhXnW*%->xZaklmZASeJd)4a;BBm(9eM?(aNTo@
z+OTGH5R7g)Hfb?XB)(CJ(zkCfXxzM!?UVE5TEkl*CEN=i`3W{}kYZwi=+3osJc^c_
zfYb=my|9a4g0$<Z#L7dCI{mU=RwT@0m`)3#zFT}i&RhaKaV1Um7=y*kFul}yl!__(
zNL$t89qrQ64XSg$v5`MRi?-G<?6o*QN5+S(nK5}^rFh}jSC>lwXk1cOccn$Hu08~J
zL<|Eu@7?i|DflKH(JF^nMrQ*h?YOCaV7jLJonnb^Mm7S6{2nhbRch0<6Q>Es)f+Qf
zsBjWuy~CkwubD025<J`gy)i~MvHtTNDi7`4bnmCd5-7SGeG)$1P>2SF0uGcejZ<*4
z7prk!{Oq(n7qlm3k9#Ly$-SL7$C%z2Os?2@H$U>to3frmA&hi{*oFYCscNULIrlSm
z75DGoFI#YDCp^9}-0jfgV8GM-G1Z06y27E@+2NW$@sGY6SnBF8cSB1x4yD#efg1+P
zwnXn~@v&Hk3J2%q3ILSs^M#tIn;nZ#QkA}<h7}?--Z0a<H-vNTi_R>q@NKUc>sQ1#
zkL8(r$YHmA(l=M9!}b>hEfm`(cvH;R=as31zoQ0st&B=@rDHE*tJjp>o`ouSzL7h8
zYtA>QFPeAM2xk+(aI5Q{G;MR*CbVYVHA0hJa!@h4bE}wv|9S>N*9%Ury;1K|DpkVr
z&{nIc!EPXe{!7fxVBVGpKcSUindh^fggxW#AL*5M;dj;2X!f%jV}mE9@%Z*`ngVb2
z(rAR7@4W9>Dm`D~(=6?}x?P&)!x;_@#v4b4@PW?QFEjw~n|LEd^cNGeg^M?oRuW7%
zdLfcz)d01Phd8DJ6X^c6dwsTvSZFR22MgDWaZ1Y_-%41tN~$H3MW161&Ximd+$ttu
zb2@)2?zCX_ge<Myvuh+TD$<MHOV(jAT=s6SEWdDc>raIbg<0)3>lX$HOOp=dig|PE
zgJ)?iQy1N^rMknXMNZYH`^t7b*?H(!sjLb?r8vwP$Y?4UUKv0Tdr}!gJCl&Y6A_go
zQWbA5sO2-Th2Kv2ikqBc6m^e1gt&1;-qQ!ZuT}oTW$uo5=3*A-Fvf+@t1U|mW%!sF
zqVbUfK;XhQ(bET}_O+-I4VD8^vqpdDV5L6P$;ZTwB7AmHvwWjZ;$i9Hu!YfBCq#wS
zU%b^szNv$9;^Od&^Zz76jjx@d(<nv-#`X-XJc*UTy6aS5l+4~HS9&WjHa2l#yBu`M
zwjRCfl}0@uO^qMwRc=+lp11MAX2kiH3_PR?5oP;x*vkGDdS2=wQNf81XP+_P`qp25
z-JUZ%UEHB1`ILWDe@cJcn+Yl)_hf~Ihh=c2R?^VWaB_f9Jz>W$JGCo$#!BbKQg>(d
zWY0*N6n~Xq?F|dLFLi#!8?Mx|RLu%XG7q}pt5hLR6ONA6?4@I`r6o>)-_Lux+_v?x
zC;c+BtuAN>`auDRU_qkL5|JM1;b?D5gQjr6hixvOGe$*X$KI<4m26&+|9rnfb&VzF
zR6R336BKKED-qWqBpc)G#yd_v+~5B)eaFz~lcPeoT<t+alZH0WZZ5fg9fcgw*g?5z
zCggB!F09(N6iO>W@9_eU=B`o`7u{!r2TUmH=ZEQb9&26=CB4pbw}A>bG;>Q{nCxg|
znQvQL!Q%06h(E+jUPq2}m)mkUrJYiw9-ukiWxuFyple_qUs39mKOiVZi0Zc%Cod=#
z&F7xN`ErqB@ZV3y%3H^f7k??x58~E;ciiyk>k=sAoy*F)ToXS;i|xPb<dfA-mXo<H
zF+YFWtI@DxjM*!p$P671oQ)d^;ujPc-rPJCBRVh5teH#JTz?=2UGeVZg;fZU{myu-
zgjA5Pt{s{&?M__G-i0%l3yj@;lOmezlL!qdep3n?k7BFSrbo}6-R9DV4H0YNjtdTh
z4Cq2^VeYz(&f;!f95)Z~-frAghZL_E=kxx4SIWEwh)!k33MY$?AOz5gS`1HJlLYV3
z=xD}=AsZ5(0AC+3&svW`&R36xm6Z2cj7;9<l8=IpmXY|y<;iNINdLpNg`P_4bumfF
zl4x_nHwk*|V`R!ZxBPh0)205L(49fmq@sH;8!T675gNrxRUJzXUFbcjcJ5%m2%eI0
zxIGNrlB<%VFhJDntzTOm-hlvT4Zc>^=Ept|d0-j_pw=29sD?`u9qb2wwW{%i{?(EI
zbv)?>B;ZkDOQ+ZQn=E<3J3KH398J(uv3_|M2qGHzsH7YI+vLP9oI}F=^0EFZ+%`G6
zD`n+JLM!3h=^ZPfgyo)!CPcmiwng6^>(55xq3Y#m3g!|VZMrs8UUBUX95szUipQ$(
z;V{L%)cQ$mBB32uF?^G*lAjkDJbYi9x%S<}1mk6_E^8T)OOtlIe@uFBRu*<5MNwQ_
zvb0)|(D?R@kouo>GgC#W#<h6zR)@-q^V(DCcKA0w^B<3UPfW<g?!qNt<obPs@RPl5
zL1mYly`9dTpC!6mzgrkM`GeUc+_%z1;F)mjqS3bnXWe9aQ({Gb@!lhP*UaZP@#;tF
zFH$yWCEJ-kP=%^q$&5fT^4dI`{(%;uTb_5PZI{avtZUkq1|qMr+6h2@#<cD~z5jDB
z2=+!twOJ=g8_OV5@nE^&6*WYc9m;Ezx5)(ucNc7vdoR<bs9CnZR^@1a)pWN^e@^@r
zM1XMQ-6%jSjj)u<cJ^h)S=nM(YxDFpj|scBg)nh?ftPXP=_99_Qo5Sl;v2Gvq`+9V
zO=H*F!+6+@iyx~va{TR4<=E$rs=C(@1{+Z8)h7h$&O)1PV##c<Y-&=ZN7(oer=YRD
zy&Yl4iEdlEyGYzA?VU-{vND~f#oaRQyH32GHz^(-1)jx`pX@_F$8sVsM8*0Y(`2qe
z(Lk5<%%qJTRcE$=+Xf4fZe}9=W{IONjB&%3VMH>M?Xa9)bBXSkvTUG$fdMVd>EN&J
z-Wu>S>;j_Q*-h<$rzyAGa{{*8lZC*Blk#2~qC9ry+ZV?&WZJ5Dx5+X6{_OUs-Q8eh
zcjLk3{cUG;WtXBYrgAsTu#oWQ@_eV9%3OcP;`cW!Y^;P_>7E^GC#%{WzX;4>r(e{2
zjF)p7KCz=h64mqYF{9@8&D5npB2jGTb`#`ewh^vT?ua!^!OoXS5Y2cGf8N_1BKEwn
z(#h}pp}$LWu(u>!@Ong6W*nh9|3Qh*nY(1_do!C1BYcbap3gegM3mU=I=&;Q*8BWK
zlW>*w)4p-F(pj5Vf6TZt{)hK&mnRj)FZFfC)+MWaP@TJ?ej{ydEQW&-bd3gw%;BT%
z{Wq!clV^Uuy%*-fQhKD$(%bgm10=%W)!#OaXhnubL0{7F-)_^GghvU@wYs<I8<X<%
z<7e$yMITt|+y9>@NNB=&uENun6Gd!ArfwT-otvFqJ%Y-&;gr*VW9TjTmhv^n;`>0z
zA;4a0(_Rt||9u}30G?25HV$rgeA6d+|CB#&{-apzOYsYwS3*X+uqAz8*kjoigg}B3
z8J{R`r#Y9)z4Phl7`O+&EYP@67$x_GXR7(e0qBKac@g*aUgp}_vAr&*QaaaUh+KA`
zI&b0KdsShYceZdwi`9EVA+$tNtz^DBR!#WJPLTzp?0l!PkWuRovp7Kq9{mqqv@g`l
z#{DXJ(%t;ue`$}N*gmE><hyz9O8n5!$@SB17}Jx_Sz}6GhyZa~yUP!?>&WDfBhIsF
zi|WC8P^`+VydTPT=m_sg7k677MwFTjn=_YRI1GA&2}c}7k&Rb;&&|<!DNMeq@y8GM
zhB>540C=(0BflPnN`UUZH$Hw}R^u!is<r>r;Vjy>`S_EtD7E8=P<m4SWtH>LWrf+V
z$I#BwXKvXNvaj7d{2C5H`!TdGPdcO*JmT7~*D)M^89VvS4KN)5whYO4#_jh3_<V^j
zS#h94jYsJY^}H7jmn($t)RhHaq2aaREU~)VVrzHfwsC@b*#P2|`iYmrll3NunG%i0
zn0L$O-%Lq4UoGzT1vNU_S$!%=GdGSZ{W=>GWopxW6tOm0m+z3sz`PUG9{o;W&@L3s
zo+mFn*a$*l-zpD_aZ2yOZQa$1AmjiCndN-|v1J^iuu&3_t74(R*iFSZ!1>?-rp-##
zsBzbk$q#xT0eI8l-PIlzAyL|2Sdyz@fw(%l%iV0{ZUwZN;>zoh44+BP7nAneVD6I#
zzHPYpHvhJaw{Q1>o#Zy-BdX~!Adf|rdchcT0K0=?E!d!^hbBPMjU2&-GT}gH%|W)}
z2c<rBvek#4SSaS2Kz$8F;Z0U2NR1(DqnxUP@U*Fci&6Wi&3lFoB(}TU;1`ayyfMQ?
zl|FsyNd2$7yb`C*rnRw-KM+wq(H5HFYpUs;vc!2^jt%dPv$2r(uW(Q4KtNOQFZ75B
zRiRW(FNN@^#-`RjC%Efnf_5rLNJwY@8B0~H<(<-S#o4E!;PLC?+qVY0^b}}B;liwk
z5KtMg-1S|D&$;X9(EU?*DIS10BPxAR)OLfBiNYH9f3(?Ua+AF3r?=6Yl15r98llFO
z0O?{EAE&O=dc^^C|0ffH63_@Im2aQ#&*ApIEc%@ynqh43+ORdv2N+n5TcpmvPp}_u
zn0w!i5ostb<)*FOadJ-d5R$l<{8&)?vCDDy;y0;xN>z4a=%8V#RcV`n*Y7z%S(x*q
z&GGaQ%qJvLj|3-mB_M2=0}D_0jjLY`XagL9vhY$csrDt|GnbjrC9;m0&q9}^(Ow;W
z{rZ5NSIhuyrk9uh!(m^}<yKDH$6`y~WjiRtXcte$kMk|=__kF=CtB6Z#iT8$Z3z%Y
zSqWjtj!^Nr;e)QgH^_T~OX?pvgpu5PH%k!5JyKniH7VvW-ympC2H0Z@Wn*F{+s;tX
zKgPLeQOaJ$+tNY-l|!sOm#WOwGjnmkmE8>`p?@XHJPx}xN043oveyX%ht*q?KMXWW
zE5z*(gEtv~M_=Ly=PDLs{GbI@tS=<*o)0r%%g^ZgOLFBMa#dFnQHIjZqn^(Y476ur
zz|32hs+x*Xas}nV2QE1WpNHU7%?JLkvrFXs`3^1R<=>P;sxmDI$F>L!0sxaqULA`I
zU?>^Vve_-sU<)!p@ChU25$dqs<daywo4@RjsnXM0$~b{=F*1~2o`5!r1T(rHMrs9J
zX^cS33g#fe-rBbxg*lZ{#f~<ryx#Go7g&gK?mhPyb`?SA`YHSBjyDB+7#)Nipai;O
z3hX=MJZL{aog<N6d=bnsl^Q=vPe7gm;=oh*Q_JR{mL^|>PJAEb`^5pcV>0CZNuGQX
zH4I335dyeZBa*;FM|Q(Rwx&X$277BS3HDNXs|(8H8@Kw5MDYt$v?t&5bo$il^hX~I
zb>;?7(mbX+ezJ`9Ng^5Ug}s4Sn9aVAuVK~MFXmng@eq=i+2>@f{*G_d#sqX2T$K6V
zxDh{NR`DTzUcoUQVsc4c)d+1?viY@MyS;GsP#f*&pK+IaQyn*i5zfL1jAEXe_jo6~
z#{tT~j{w!M6nyn6FvMhlQ9Ym=C-`MAHC*k5xeaz;-ciM3<n)TU<*e$ql;-q-lwdXa
zRk9}6f<0?_ERl*7SUl*+={exBOknE-eV<3}I^aN5Fg#-rdt~K{s`V2=>X0-rRoAY$
zdtcs{_xP;q9euO^Td!ETGFICw)Nf}vof%h(QSqzB0-HKLc>p#ZB7J|=#g5_*@4gQa
zr9Z+$@f=5_nK;Dj3QCR&FT=Ti!9W~B?k_hoORg~)2=wv3;YERf`8$j$t|&56ZYHGS
z?Ab2adn@h=)A?<S(AxIFKg`m=VA>qQpDfI-L8uYsNbtd5rCWLcRqfv-A;I?e22<V2
zDw%3N*-ea9k$wQ-Ed375fyz>q;|~zB0OnETBS_CB3t7xR2!z>e=_F;}Phb$50FzvA
z{n=VZQcg`UMrc?bu0!NRSooS9E0bc^0s8-AY9b}k(Dl41ic!%Xh%r9&Y|S+})obkk
zML&9IYx#V{c|o;rv4LmL>MwTvzTvU_>>dMw`e8E6Hz&vS`FE{LtLIykuu^`6M6A+7
zH}L`;^P@CFJ6Si%Lzd6z9zoCM%or}RbLJVAYu&-drqeJwyVt}=e1$9deN7IC3)}yH
z_~R^-7pH5j>(PSMraqQaaYA(V)Do8HigMS=Dk3u^wFnn;J>kwj$K(r+1C^o7j9laQ
zucZZ|SO)q0khhbv*YGtE87lEm+r9S>ZST{61FA>?zx+<EZzUbQn&eYcn*O^w6m^aD
ztT)P6F0lsRGs_ovuz8zRFWALvvi2f+1_(kZ{ct;DE7n_`UiN<#$&1xB{}joB#a2nK
zR$n$ZHh(J|ip32}_!y$s?Tz0VzO*f}*}xoog1tB6vYo3sLJZ3B(eMtUXI^!8wgyxG
z%kJT|9|`AsJOpK$^<L{aPTJnae*JmG*J18GLy~xG{J1As81W2KaXe#PRp9>V*ROv=
zYIP_B0|OQauo=^~*D&C{4=jDsrFo;t!G{U~aPNfbPov=~Y%PwZiPsum1Mt`4v|WYK
zQ2}AJQ(yw{H0(M6j>f@9_++0L5YCjZA<*jr&_RsSZjY?$^H)BOA~gFGZXtW5Dn}sG
zsJCy&DZ3t;G!TGIKr}fXkfgAz77(Q|SL~{Vuucp}ox*KgFAGuvK%?4}OV~<@usC}H
zW&1Xl2yv@+H_%&+ZkpI;FWSWEv<1Y>7V4SGI;CStT~YkRD|hyJgx%G&=Qg?(D_`HN
zuw+(xSKu_~KFrX2=R^a`x~dD?P6csS|NXT?V5bw-Hfh2~@2eF=!ORCIm3Js+a_wNh
zQOx!l`fJs)ayzJr4*>u%AHSeIH2US_@uUVU4ECBnF2a5zOnC)^5I$JY4Y?1m0n?8N
zY#i3)CeH@O3SKL_SSGEcPOUZ(=z3DE%vRd(`dl#g<$I5V4x)vdS=a!YX<ZZj3A7>b
z#qDKKNI&V$C>F|SS*1GFU|}3%A$S~Xov_Q&Oh5rV17qpf)F=My=jxgqK6*Pr=f)4X
zK~w!yUlDqj9r#OJg)%zH=O`<Op@rKfckE5EiUq40Xtr^h1w)wqa)7fNJ$2X|_O4h3
zD+|`c&gVs8!;=@D7jEb5%ZfM>l;i|6WHxlSvDY<Wu$22{#?dWa6APtSrq5#G>oZeh
z4ield<0v|*r@rK4rclngzz)s*t^L*)7iau<NS=dUgRd#|UKYN-$BtfR-f(}@*E`@@
z8t+Ltk|~a#Ecb#GQCv_u340t-s?~hRN$K5+Yi%KZCb`Q$O_B;TR{231@ErIgWU1ab
z1CVD~Ld|^nvHpHVXw<;spM4FQd7lkgq`&(T5g*TZWF>z@BcKf-Lm3Bk4qs)wd-o1E
zR(-iOG#;PJf^RxFH2SB#Dr*@+uv$onc~K*?dj|4&j4RI@GoRgbn7DL_DKRvPSA)N}
zu8GU8KQLBJqvHWYw&2!=5EV|gltp#F@9NAoDs1;L_41h8<IMk7wugG1Ytx!FKy;gj
zY-&W@krGJK-L>X&4w<mv%DO=*g}pZioMMPY{qhY%Km9UeW(M2@!T)YTTJ~GIeWtue
z_L5;^1Q>g};-y_6+@tc|XG&=nZAh&^c()96<Rm-pq0y)AwkF2L)_k-QO=}Tr>~olY
zVOn15vv)RSBP*L&=lyFX@9~~@db?NFNW|CN=ccQf+>0x3IHuCHr|o7&MzonETa~hb
z6|TvVjUdbo_dokkt<o!6Oem7Et+&Y+!I?FYJv9YB=YIm4(9>-J?C}B0Zlkvh1wu1O
z=(bG~;hWPa#@Qf|OgJcG{{}{weeL3-^*j?Ci*pOhe!jW&IlqJ}7Uln^twL>MeGQ#&
zT#U|Oy8;yc-p2b-w*<!Ja;EW~;WN6s#)}~rGqu$NynLoNS)xC@Z$kuj=6-8<&%)eC
zQvfI?XvSS=V~<l$z7q6}t)UH-B=WTPm5+q@DF=(AyF)qzOxAiXJ-fA?)V;4_=c;B~
zn=XHLVwr)?U3;9VeTxp{dPHn)4iF-*;5tVx;>-V5M33F!c}F>N+N5-C{C&71V%C;C
zkp5UL&i~Q%_Ntuh4_gQn-Ci%~M{<<1E#@*FHNiFoV~h2rnTT_Kddd%_`WLgGcxV{b
z$*%NJiuFABB&Tx^CYv`R&4OjSd`8{Pibq#4pPDFgCAhToXq!k?Y}X=53bonLrNcG>
zu(yQ*&}CFa%x*yD3iXip)KHkxJcHUpBAS)ABRN6<n2v#Q)MRso1VRe8PG%YkqGc6#
z?c<uS>dnv=HZ<I42ScPhz8(oK^LMlCh2gRTn~ojUlg?WN`5BxhB{$dJ*(Q7-o5gW^
zz{9SDu+WBvy~}_BhkPALLM2IX#wm(SKC@8zwMBAw?m`G0dHrDe`>$XYi#N;gF{`-z
zZjn9kvbuh`b<W#C%(oxt`;Bw_rdM&t7{+th8;gli=(5lJd4D^)=!3QehJ~Ebl=l9h
zs8_f12C}6Zji+ijldv7%c1)JPL#{Y&fgPXe3a%C^81}J9o;3Zh=;33>K7rE}hvYc`
zCeT`iq*EZ*%TDk-r1-!Yi>|SN%->v&gKft2jChY2r2Nm#&7T9Qgjx6t)#InGWLWzC
z{P~325hT5jC2xtw7=rGsN8jVRjg3tOZU5{)tij*1W914AiG(n87ZRNp*klj5zh#fr
z;b+yZwEChLY}?FyPVfCMy2H2o{k>1^BBYFeu^p*0j`WF0+=Pz=5iQ4@@j*n!72YBP
z4$K%zBO$fNVQDhHqk@&U8AF90(Lva9Ai{2wC3Yg@F4DX0kao)dxV5C7-?TS?;}GWG
z^9&}>8pBY)IVliLYr%q+4!QJ)|8walGC6h%?c~(aevas-cAU83>RPztMHsmJy6_uF
zN(w?88XEe$!}+)fC2a6ty`)+dP^RZ7^(H6m<5rs2VYT?J4^PGzc2PBSbzfyapENXc
z3DSIf=A$s+0B)HC-_8CdSzszd<Z68{kEnq&^cOrMJ&++giU?$CDV)#_GFEkhVnyV|
zzIf+e4S8}+-L$w%(43n7i^SmzerivZ8qglySwgf&P8n-WAl*y)AP=Q(?i~U|DfU4L
z-~^Ld%|;#=`Ajw$i;lUCoJBPW!QlkI{*3#-A~fh@?i3$eMyM<ZQuxuOJ~WEdA+r5u
zU?lfIxja#b;bmV0zcqt^)6&$$f0Fj&5tRJ_DPbd%F~P{oR|)e|(P;O>)*$wD=%3h*
z`fEE`Z`_D(TlvhbF!hsL>{(O+XnTrGGmszJeTDwoq_k81{*4>YRQ9Smy!UZkiKE}&
zioc6OX|@&IyCw(|-IeBB)fVB%h6aIb1Ji<1AzG}dreV<ip{fuo^OG<N)BK-Kqt<>L
zrFVELr*<5&Iz~1pQ`$~XUKEv+>tXowGj<W6L}oyf?}=~o*=#lLuj<sMS~gz$6(R&|
z5JOkCxO*v*YJ)gsCu6kzAOQ)H?jW%oTpgDpk-$E5J2zL*q+8C?<;ya@<fY_;o|#+f
zQUXSt^6g>*e=X40Iv=RXU@tFJuwA}5U2=IYhtMN@#?n6<K`9>Jf<SlB^1@YTzsGtp
zqT4;x2eQv^!k|0PS1x|)BI^mFa>7Ai&<DQP`x{Gs8@3R+LJkFA7?Pa?P3#}0)$|4b
zFxv^v`>0kkL~IDZVorki1ewl3wS3HFhCWh+IMI$$POTyGC@>rk*WC)Rf|qNW|LNYQ
zY>1RBfu^ssn}h4XeHcN2VQ^~&Eh6;<BJx6`;S&q4!Fz8;CU(q!YiaQ$qv3Q_#Hd@j
zh8i|L1EL?K5Rm_cTMZ@UX}7tz{x!@s>%*{CqUxUuR6h3Ezkh#dNuJZGlP8@^R|Nn0
zEB?ACsdkVHKsj>26Icd?Zzp>5OhGl_DL}r;9?fk4jTK`$khiVycR|A;w?+%NrX)#h
zwy20mxpPtOp{*bTSm*X>#^05L=k#MLemh#z5$uRXh~Eu(te?4mFFgF~?0Fdo>p2D(
z;&YT>w`$`0@1fqdXTkYHqb~!D`?<M7*8sgN=G9g#C@Iwq;?%c*Q5x9}4GWNd<p>c2
zx!hMmHhXd^ay)twW6M`Uy%(+oK^&6+&f7w+TMkjmxbQP#H5S026?AE1mlH$Nqem|%
zIte+qyK~yKT_BxqBXZlzcqA^I3Yd}WE~!?Z3%hyJyi~H`;9E&pE~hqnciDpCzlAGP
zJ8K?UOXse4Z@VCqc<k?9owl(n(xF{$T1mFH5~d`rGfp%`L`kPgO~+r0cf1AaYr4Lk
z-Y*=<DNOw2rfuwK^c|Kcup%}Ht%NwA+2fHhyFK4N0uuM@Q8VC@`8NOT{zp=3^*~x~
z|EakhCNY-2&jf8-Zf^X|iuoRJoiZjlWj@%p0}9;P6>z<6m0IoNE#SI0=p-1!AM}`d
z`EysF49r+I=xn6(8JZ0dPV?x*-n@f<6B+f}bb2-|s`9QbZ{uBYDRF!LQ?`tq-Iqoo
z+zxcsTqbRQAy%Tl*iecRI*{=}eYoQR>7ad%k57nsX$bdcb{0MxhGWzNPK>UUrGSuz
znTC73=4)?)Aq3xz!NehJ2!A@4yt#QL;qo}9ng-jUgZA+cnVI=;PkI)n!6D;cqDdVA
z=U&hM;qJYoqRh6gUsMo5K~#c@h-f1!NhK*r786QP$x#s`6+w~|k_1FSL_t8wIp<L1
zAS#GR&Q(PrBC$vc6dCW@XrFWXyze*0ckiFK#yEXi8!9}tpB>hk^EWpV?^5yK=m*k}
zw_i8URt@GZwW~<(Sq{pzDLBj6a{T1eEom*<B4Z~9+8KD%UXjg%dP<4o{UW&=;<q+3
z3z|ViV;C;slwE$&)q~M6jaCoqbjdE>D|5nZ9+)V0T%T%kx#XXec%+_SM(IriKnLA#
zIN89;7GpVucglxah*;Lcz<_`SDGAc(U+wc+3`r^h(ywzQUJt3;=nwT^Qqd$K6!+ta
zIo`Cw(`#=W(`VZRTW#fY&}*Lp|Eq&TC2g7T7#yfJMUkcwg_3czue#~{{r$m7$i~8g
zQSHus$e%6Toy;kzG=&tX3o9S34f@ZS<Ka@oSc8o1Xc}lmH>*W(I{dzS3s@@Ps=)e9
zKmL_AT#!bJyuH6OINfio-AmkP12!bK4ytcvU=NZm`7)`VcM@UN%dw|Vw;b8e{P~vP
zZu(jOkx`g^Ng%!+8ZqLSeSYJ4LGRLs<PdLa|8GAdskBRFc8_fl_e_M8O@Q02)F8>E
z8vBktQIB>|$=JoZij>{-r*QdXkB*r0o;sNupZ|#WlwQ&6*Exkj`624J`*O2X76luM
z+x?E}Xhmw=%5mcC(bxZ8*I{^wg|y^gd^|Sb81cDH`{Fgb3yd{+&ssac<%MPORx&&&
z6xF6p9m?_QLkd!tQH3AC@O3k&C8nehU{5lNZD3FtJIVC4TWR*>t>j(+zD~QbK_d65
zQ}kNaaW(kXip<!8t<8WC5!oi9n613UL-e9Vpjh9%eTy7|E76Ftyjj&8n4@~E7?X!M
zQfGyP*14#tF22B}$@kmYDX94j=X}9cT)K8gHJc@jRTv+t@y3|u<9T&m^)X4Q`k$59
z^;Oe~kH$3WUyDXXO<VFo@i%QvjXygjc&kJ!22OB;uVP}X|9A)+`*9)hm_s4ZC@?9Q
zWT<#iQE{R1)2Cboe^!wd{7JF~RC`9Q0l_a~MkI^9oYQ#SZ^Yn+fon6A%!whIZ&Ob4
zmzr+q0q`1d#<lzz$GFqQzg#Zcw|DQPj|Qnwa<PxF+CESFjg!N5Y@^$CaSk)~NiVZq
z`tTuodcvqcOQG`21=!~gVHB;xEbnn0Rh+r{T!V3cW%*P^2cxLl+QVw&b*KnyAcn#!
zFqklZSPA$Os!#8Zo_Rmjd^soo?9M@2p6m9nvg5z)CAfE*iI&V<LY1yn{{Jg|l@!Uk
zt*%hZ%r=gfL)_7NR!>t;&CFTrKq$Uc*^7fJJ)Qr2Qt-#)WBJQ}ijbtG^h`ZpC5Ad3
zEmaer(zl`ANy=WLlA`yQ4Z5YWd_R7uTb8#-%{pye3f?@eo7c3bj6^Po*XacA7ps$s
zn)j@PTvHs(5<SAAZK%E~@GR>A>{eIhkI6T#AaU>l6aJ9n2b9Z=Foc>&Ak6hD&Wi)$
z*mJ>r(HE*?HNHDw7sfnQLpI9-0me3a=Bif)VgGI)*5fBU)%y_I?Zh?qT`Q~e#c58X
zs4~OQQ8$7xLI|0(S!0yKrv<%!eGek1r=@NJ%?;`}nHaTVPeztTzuXhM}s7Fxf-
zAlAL0<Q=N~zf~A*-DR#{FKT)t)enXDLZ}MT;-LMo%0C#_(g+TNO=v<TY|*Ce_R+7b
zrL#?z#dI0Ax~OVuj%|Il61_u|<9Wy5wZ+118^D~TkQR4)RarteQOPwcrM^dtXV>-s
zogBR!t;(70!F7m_;79sTJ_6D@i#ko~lG_q|2OeMPaEXqH&?(21LS_u=D^0@o0tb;6
z<##~y@IR}JKIzA5$|}?-Z{D0*HUIfn`Pzp(#7gKzlnyab_m%6q4+niHU+k0#jWMMA
zI=csm*Z6ixl<+p00DGajMfdJd^8vMjI5tKW69c6;Mx}3Qa4mE?I%@lyPq!PW>sg78
z7jg2PI*zA^-+L2cvDN#Hz-vx5R^vq?rLbRe<D`?ECuMNV<#G(0D`~zo<5z#$%&n{z
z<;V-~^jFtp35H`Hvy)!)q==m38zx!@mPILvS(Q%5AI&uJSg(z(-^GpI(ZLEHyHHuL
z@qbfo3`9&wYZ^F{uhgSuo6=xzFbVFlDX2<JNk^`Y-y^ur^kZ@t*F`XOF04JDLUytW
z=o@OC*Al%OjHyVPNpCdZ=bfXUn;h+v#&;tELa+DsfvX{1A)-U|<J~D52IQ{N#ZyC1
zf4I4=W3s2pres5dUf;bX9bqoNefJNY2+pjXW9M4HXl98@olwr|#}r#UEHRBC{ZneC
zV=dd5Jhg(tW~T0A0evzF3*e#-6TS9E<=pftrP*aBBKvet=!d$G+Oo3IH{Py2(;2Zi
zu=iXj6CJ%U?`phjmUh+051kd9`0esG<NMRIH<HXUgOi!G#XV)nwBe*LEvDmzYprXU
zMn*{33^ydyE}=BTPdzw-0|iY7lhq|Vr~xf=5sAXy5gLI|jl*|>>ZrufH-bGOpb5@y
zWe!JaCJG0g-_fx3f?cwo(eB1RpD2fsEV(wwRe(k0WvdJOq|IF05GA+Yk<bNM%ujL;
ze*zhb$)CdBu}<MYL{M}DhpaXnPKhgD;TWF<D{25`Ey>vzy5`4-y4J@;sOQ5J#EENP
zn_39BlqEN*mlhpok)FnBl?j1V#jcaLO-SC-&~9^t>QL)ZIEwM#IyVC6>>|`yLZa=>
zBVlo7%*x<MOSOAFVLRq8Vq{)TzFofMQgQ~J7~A*0O!!)N_(TjHq!R<=!57XH9c!P6
za^YQKEx)VBFKp(tj}nREX3~C2pe?^LI08P?c5B%arpsXlx_7$revl|>#gX(ar!XJP
z#)(qzCVe^Gads`@5X9E-^kE6~Y3wI;2kgX65{P~jjnpF#x7I65uTBcNK$lnV(}B3n
z6A|ijB}>l<YoBVWULi$_JETL2<X1r@1>cBFyVW9(K=#Ju4dJ1+O*cTA47=}<5#P=4
zOkWb!>~4A4*bUY00by9j5vDf){ji(!V|;odHmv}&TYT(@b-xfk%gA(_h@@n{`@M%_
z3wx}rqUK54C5Vr{aJk^&fHuK63xPDPKF?7C0vo>TblVGUnm}Pr8nVk{o4IiK`71-m
zVUy5de92*9dsac<q4VvWD`HI&Q2XN;9Ko`uam7|=p7)L@+I^Ye7~i5OE9>d<Ye6#3
z0aV`0@L|Z=ZV&1X-0!`-Px=V)kQ{1u8*BHtLt{sG76qa^X^hfuca7QeTjX_0{ES+R
zEzNGwWz#b6$U16WiR;xlbkeuYq_&Clt<+VbAjU1+nC;;lq5Zi}(^2B1KctVD7n0k_
z6V#@WN`5^Q3uot2i9J<$>%%N8A)@ylmIg@S@Ii!}mF1`YVi6MWCll@`WS!<|zRP@9
zZd-VjxIi4^6Z;U6SP_-&-@q07p#DXX`(H#&Jlgrlu*XKJ(N~}B<)c3v2yoFU;T~Cj
z2u@8RoL2LYFWh%Yq7s^z`!s07cQ#ey-^Lr-#b#3tfYW?zB0QxUz`Z>Zk87`Z-hqO@
z?@r2A8H?n7#}2#Bs}jIKr>Ez+bKzXZz8hN$iPW<#g^c}i^1k?eU1|tkuSd%)&h<n;
zhl(mLaVDy!A<D9GYgRC>r&F=Ko8QZ|R;2Z2syv-{s9Z5#npAmTtbF`M#?)$Q4F2`Z
zKnA}-Q@Cjl$v%mJqnkvzP&?_7&_t1(o_XK_SXR9zN4$~u`b^g7Bw33y=jRemziPuc
zUh?N;l<2+pveSQ=P4Tw!x3-&=?r9EQKKNeW5?u(>1pAX15XJ@Enle>gT82Fz4(M2A
zjtm`_G8`X0n_h%Flz<L06Y;CLb9-K?IQja?VWGBL6mU=^9ha?N({(I0`v^Dv4A>D%
zMO|0yHG0-E5BEb@2%842NB2=k(LvRYs-dKf#nOohF1j1Hv&>T2XHrh>`si|2GUm2O
z_u=@P!_mbf&ngEFRx0QEZ&ZbkIw+H|{#KK2vVvHpnajU6t{$1Z0A9ahfjzN3lXdOA
zOJ2Id0b6sr*xSck<y6fFB2I5)IgI`amo8TVB};VAYMV6G)5Nkt6TP=PWXK5^5taq&
z?5$LB@l%mYOXtXtDu(H`xJ9`4KES-uWSc0iYTc!rSLk)9OXKmG4F~^h9kpr9RvrKi
zZ)azuOjkFY3bZC07i_Q-YT~x>oyi-~r1tpw>?f=Koqov#FF(PGpUG3DEhP1WPckS)
ztd}{<svQQ_AF+!+V9Urn&$wsrL?O46bFwRTRF$&AZmsj6{5w9%_vx-mp0fD&TM{<A
z3GWu@_wto_e*-Rhf6_NGyy-D_Q*x}AJ)-PPT`(!>UmjB%EdA@=Qw0~^Acc?IxL>Iq
zmNo+cMDC%s2V)P6dvxsrR*5v&RoQz0r*DMdk2~9FF^1O4OLgBSBKL5z3}X^mHha~J
z+XsBQ)IvhTLhhtRt(I_naY#$YeSfXQ8u7B^v*+m|7MAZ1hceLV?El=UE}vi&_#c}4
zhvYp&b-gLUQn`@EF+hQ-JG}0Ads3XevqcCpN^%}Npxs^lk2duifrfZRHYe~fbM8F=
z+#+aGlc8yg=$U9!m|TaPvSoFfed>T+m8?Gd!Gozxfb;Bn+^gV_5aYkw(C_Z)-CTVs
z&zMJ<BCN`@r;Mi#r+kKqaAX2XEYt1J${y*?kShCg0U^Sc+CJRW9eNl9$B)>qZ~*-f
zMXeXn&bH={SE^aZ{j&xA&kbU+)LJM8K(KC&(j7l-AzvYT@xfGt$|vP8gWH1isI=e`
zrF{wU<rkJRZ46ykDu{5ha)fNjK7YZgF)6XQT=3I5$tYIlY!BY3tF4vm849c7d3>Yt
z9=XUui^&q!nF8djToB-#H1<mN4>i_S-t8!O^<c4nxxO9PUN^BfS-Z!Nq$(-ViT-X)
zuU`KWCD8++k%PstNw;zgwO{oAs__z~%<h{CFF%Zn4{`Sumao$>?s>3AZU~<I8B8hK
zWJ-It-yHjm(?V-9o4#ZA!ern3RROwnI(>Zm$&;t%sw8+bU9myM&kjUmI3*QT@4QuW
z9tfUl532A{YMQmtd}}a)8B)_J@4RTeO5ofthmY(O9Tqci#aLIYL=$`yFy-#?n;XIn
z`yf4=hEgjn1FZv3*d|ZvYniLDsNHe5_N!RDq&!B7u#wDJyoe=@y)jjsVB$=6mW%N)
zUtLOgCTjeX?Ke;>!;ISFbUP(IR8~ARWhzd?z_rU-OByc~{r9$Swsi|-d2!|;AvVvA
zJiz*IjlKHddS}w?Eq&SOrttNIfc?0DkM-OS6`R$n5B<OFG)F%A*&qt#vvN3*^gEV6
z@%5(^Rf5PI!RE_)VqFhzlCJzhudQZ+@A^7IPDw&d6sjTR%ltb+;vZPM;x`vQb%77@
z4vUnjFHiyw)w7}W;e?Iibe>E?^>{<FR(Z8ByKLf=lkQ*{IeVu$<8}tKWklrH%8`<s
ztX?D<`p&rL4!cNic}8maRXJN$DKY#&Vz5q^OiVi7c_{YN^y|eYld8M|J!}I8H{QCT
zeosW>y7wZ-)QxJv6nBf!7&o7$rRmFJSu?O}HL+bgsL6@9YGv8la&BlB0jkDC+|?3i
z1E6ZaV@+u4X`68gizQ<x%a}&VdDwF>+*+E0vU?G#<ae=D-HM%u8{Wy`$j#1(f~}RF
z(UA^JKjZxc9t?`NRfI!NQ|VHNs{-KO?nQ6P(R?_9sI<lTe=+L@=9~NTHWuWN9(7l_
zEIw-ubBfNj9&r22y0P@O9D7lbW!P20p4{<n#k#j?#ky1Eds2)>dl{~vw`BjKi_s#T
z!g%=|4Yp*ZD}DuA0t$UIEnB;S2=zJ-e5u)UZ67A*xd{3`Y>B`Z9u8&xKG81re9n83
zWPe2&w{)dKjI<imDb==Oy*GKWj@MOe@-E%fH@=S%oV1q2O5ktB&vUdVHOx^{QQ!Ld
z!4?y<)zp>wWe;5{-hgFtUp6$!w8f!#1P_nn9mby!rU4&)n??O*Ac|<Tb%^Sc0D)0C
zc;7+FW;Y3{o#M})=V>nKJZPok4<0G4;g)7GRd2aG!Jla5p*8pL>(`*It<dVFj@(jc
zs{JI5ZS`Q6I^e@xhQnWm#mi-!5HxFRY)c(GK`^|i%wE*79oLjCFK6I*_-^HPr~IYw
z=W?V9@3=hud}YSDd_mEH3;(Lzd(`>zM7N8+PpO0>#yY`~u|rtB&nz`*@d{;N*dZZ9
z2y?o^H(*7hWaQbq?ksm;mE6e3)UJ{2CzBVG^)v?}_DC?|7&(HobY?ndC1(UgS_pX(
z8bMo_w6yQjdq?b~rzc`gT!fy=9}C_?jH*SMax6w<3d`5peX{q^4l!D#PpBr#0H_}H
zkWJWTy}r6wj2KMV>(`%`XBG?C@zDE@07M;1s~BfzXR9{?1uM`_K~VKu>_-{qBX?d5
zl3ShV)0(rVq7A1i+%CTSX|)^YSHdVd@wLP9yIabWs>zv<ZOXVRoyohXHYJ$olb)KI
zPoJ?%CoMfwow5H^y2F{px|w}`@uO-s#d$at){Jz@hME|j_4CbPN$Xo<sv&nGc`7s}
zs>NQtz4YoK$-HSF=|KkkAj^&Wl7dthgD82_TLa4;xu3YLuGagLs1VwBMe9}dhy0yF
z`~|tMC>1`q3+{QtEd0gBr3bS0e@Q_ifR<I;S+VHtLnky%`<BI>d)>KY*pm$HKw<{I
zoUZ6EXyhC`#E&|KRNk*0n`yC6J3ULKTvvKwp)iH6ll^<<mzsY{Q$FD=Pm!2z3N(Qa
zrey5mmNn+`N3^Km2>4gV3qPE9qNcyHIa_GZ%h#4?ejLh$i>|5TSz`oUqMb6^Be2R!
zS4>AGFXwX~&(z-gEr?G_H1C~_#<$A)4?Ms6v$2&(=qYf#ZSS|r>NtI!_{GQ{wwY{O
zA;@A5r1Q{U03iXqO&MPKF-CsRtzWhP>;b6(dx6g0-~33`qY!wG(@sqtXgkbd`(cj&
z6-TUMK5jmmv+ZZ@bDCDXX&!6y%{fkZl8t9dxoW+tahGY1`1|>-g?@bo@1ODNcxZTU
z+s$Bg{*zbDLL*z>-5ffIODj~qUhtuWS@DKdh2Hz%Zv-7br|RuPPiIW0f^KSwT#QI@
zjXSlHxev8lHCcW)Fl0WQJgsf_>`}qz&)1O2cMAIBjt(4O5G@}She9EQ^T~KD>HKJ<
z5$fM&kbgjX26wMvFX|q^!*m>E!n$;zY)DVf$jpl|2Xl!-6xV{=8s&5PXCwvqK@f?q
zbNf=X4Wpx_bpYgwpms(02YAR7BzV~AO*AZnk2}4;fs>8xKB8Vv<-TXk&NiHfO^_9c
z+$uBtv5wKAn1huPsJlhw!Ftv6GK&wVJPXK)&jZsRPE!C~`dx;miv9TP#S0vgE0sA;
zO-!J451{t-q0-yLM1wOlVjMx>gAxzelWXQ7O~<_Y*GBnf-wa>|_wfU9tqDpK`f#?9
zW`33EdQ*HHJjGI(3X%`&>*`i=wr2U%HceD&&E$~o!+Tjn!6NX8RfEhgF9&EitRH4!
zF-CPXRNDia@7R-ZnXmAv?m&-P1G5ei%|c}FK_X*#gzuXgFde9p92_x`;b|h@TR~V}
zR7gW@Q4kC3-Qfifb_OaUT1mC8#r8Z76`U=#>dB6hc#EFF9pNb8VH#pjr4nY>nU$&$
z1wk?$$f~Nr#<8pY-N`oDIK+KAnG$(-bHad7*9SGf!9d<oSUM#|#bd-ncj%)iGXnz)
znHju3l_>oMbb@8U6YteF`SD0;2)7|vT4(V4*4pw}SXfF4Aiu?qz)(u{{c{O!v~Q_B
zV^r6R!e@4;jf33^V7g(CSU66LBPY|QjM*oW<xw`f+a&_?jwau0sdb#6dpJJZlD|_2
z7!=3F+WLN5uy`By!`yk_DSii{%-8Qn;j?8%<9Isl3UK@gP#m{I%qPMLZ^q*SSW}`~
zBDCp_9UVp#Cw8lnciAQ1=+TDw*F<Yj7lWAZ-D+r2$tc$C0YN)FE{J=?Zj;~Cc09Yx
zoOl6vWysa;<Uo^$6c`A{pMj3<>ri~kX5%j82xnt<(`c2HmX<bE7`kPxD{h+QoRPPh
zsoZwX;cI3d4q9<N>1KQVdZHkC1Fj0>4RoPyB?Naku}}8sJ3+6B7_Kb0;AUPCK0+P2
zhaP5J3REcZ;NAMV8@@pqqr#k{pwGs5nM+Cv+ZUzRU6V1woZ1plM6-#2(q^3E1!t8P
zR0<9kfD-fc(P21Z7F%SO)`5&}qWV<fJ-h%Yo#Bh9Nk1pPIjU;RQ}0Iumre@^krw3o
zLw3(mhDLUFbg&zE_K*cu_uNf;!*6ITqQ0v5#Lbx!@pFXvZ|gI4%x3fj<Vt{C*m;r+
zSpt+jp<B?t=~0h7Sk351yXs)EvAcp&hxbz5>iN@<?M4{5u~okCoN}n=@cUsAZW`WU
z$1Ep1kOIZN$|<0gW@j6xS1CiWYXa#EQsaUdy6g(N!{lsP(ja6;r^GUPy=cv8)uJ!m
z_-gZ39WWGZe75SP^yHU@zFP1#W)Z+WXPK+4Z^78a_~>h?zP#gKuu({(wScc&X`fWE
zw2r;efvZrm=^2eg<4^`Pbek7JQ&D`Z8|ud7{&FXbUZr?7RHch(x!_|1lmXGNOUi0J
zQH>o|&W<iZ_6c4=9W$Tved=$DE3PITaq<C7F7?gkJxThN4zS~p@5$B!+dhaLu*2<`
z-1@8^i1S%#6#zUa7!FIfZr*&nQKmNk7V!d$H=D5JE@8Sg{c2a&YhTwp?RS4HkpR;_
zgzCw<OD||k*pC^~(a~8Q*iIe6NU{c?4C1c<9A*@*8#L%#n!2{x@7)6*NQZT-REw+_
z2c#^4<D?aPj(e`<yKq%{8vK&&tJ*!C`rXAw@8QqBngB!3ymd{P+~w@CxWvUU-BHgQ
zMOZ9Eob+lXxL(-B7nNEA@)60dPsO!#dECuo&>XI=@VjB@u@JkBNxXIc7$z04RMUHt
zkQOCF5daVTI=C<E+1s1|41<H!ws+yh!PspfS#Oh-Zrc|^1H`3+FWc;+i>3YTx!w=}
zG~{|NpSV3Ie`5C`-v@`)1wX>LS@U_Etaw7dnxq^cal1qEc8<i6*F)PUwvQS?%EQxR
zFLL3<n!37xwiMF`Gu7VqVOIF)b}7NNg)Oq=i}2w~pAha^-+fj0BnPtvpIs9Y46@Zt
zS%&cA-}4WZY_eCN=gaik7JADlNQ1~05H~$z+IqxET2+vrC(`CIYAt08l<^sZK*qpg
zIlVHbxA!ka^O(C=Pnz90)o_x7Ph3?0nUZ@Zm}D+;-EUhQLf|6csAR57H9?pPH2E~4
zriPY^LK<zhb~UwoAN^RSS!Kwvh6R-Mv;=AvxSW}Of8NfW#BIUrD+`-Kf^S1Z{kgzh
zLzW$s1_P-N-Ds9aS};95nAfJD9d0@(shLho2)BH2%YU(&eIHfqLc5c3jFhWoj4Q>~
z!F7=z{I}B;b4pHf2zI0sw-67f_woU|2M>t+;OiMQ!3-oOCTfCsNE-2dw*0vho}ON~
zT?!*g3k;IKrvnZ!US{j7sTm^$NE8&^)d52FWISkn;@w#Z2?DH5rdiArefNTIOhO1!
zI>X{U5LRUz=F`lrLF<-wLfPO5@Q@HgK_#bY;tODH;ja$@JPBTw%EROmtsn@#1sVj)
zF8qSCoQ3j*AKv6)E&JIaaMRmYo(HucQnezJ0(z|*^ZjpLzWi#%eez_(rNF}&xJR<H
zgWbU8-+UEvx?<JZHmJb-xwnwAZS0ydn09<3Ko&Co7zvP|@yzslGeM>80YL&}Qf0Y;
z5C{Y|33)iYIj@FBi8BC~L|rJB8a>==DC&C^LQ$rmuxWY&kVb|mHf&XjdEwp?fN4@F
zE^u*UMRtH1D!79A@$LP4Wymt<gBdpcRsjJn^5kr$e&of<bBMv^h&M|qEi--N_qaJI
zEbKl{%%l8uXmMu?fR|~0jhf2z$5x*8=TI;1TKMe@he`Y^nhE(slqPNhamCI@fS8$K
z)G4?HKa-p6XqKtRZFmDC11qE$Z*L}V2mGj^+Mln|)Tgt&;}SdO9)go27U&)E{bg{T
z)`6~}o?aZd$*cNMcL0`tO)WS~8*HPBHEvyumfPYvb0KQ20M1uBFbeeaG|oWEYZV$$
zn_s9Oj7>Hh0SM26mCM~U_qL9$SsY6Ui>B&$dQypfQpjr-EmdPTFI+f9j+bAM;<k8r
z;7Yk4UL-pHGZw>wee_DlcN;z(thDb&5J&C=yy>lfU#?4IG7aEkf?lQr1WMK1<`gn{
zp252$f*?6SoX*V8Z)eB=)dgxia#(JmicM14F$M(!96zoX1aNXKpp-E|^8C#^k6AmX
z?doT|)NTsS8T#Wa%)?mj6xow}4R*5M9|N)Hr+<D{?71GlM*2z$F&y^l%vgoE@sK2E
zpntgsu$wm8*UG^@U*hU54oDgLk4u}-nUMqvL~(ml3@UIH14StVH`)k2@^XY4f*aJv
zfhIQP`rErgCSMSINBc31w{nOqMNwk54nAH;!n$c~13X=9X*&*!#g-8cw=^{T@ZEkH
zuw)K1y*=2(g@VK58KEe%!VWSk66D|GqQ}>>T(Aa;%Ht-I;tLK7D~sc#ycmaT<5mb>
z7D&m!Eljo!h^J6;Cnn5)g-~GvYnx#9`-ani50HE6_qm!XRvpq9G7YNT+?q1MAHKPR
zV=7F&eBUPmRp2#x-gR-hExkL89pi$%d+hmk?v}1&;n!kG;HE?IbQ!#w!N59$sN79R
z-H05SA9}@BE*E+SP14e{^DnszKZ59qANceh`xqI5IetMimOq2tN`3bfyp6vP6jZsF
z#6Rt2XD7S$yklK>ge=<SWz1}BI>1~q5NiDVIUhU*EpR~votRj`W_L;BL@y9JC!rPz
zm(T}w5f(XMS!#{+&L0IXq^iEY6-2yEL+yu94lu}n&##*IJzMjEBnDzFq#e*;qlpFN
zn!Mt*Yv1-3z#&1F=Lc-Gq#OZgQeIXoj}|YqYx?~8^EoYefs4<(<(aLz8#F<@wxL4B
z{}y-V=NwpUKnQ13{GT6)>9+U@JLuhLLK-HBHmQW&VcqUdyT!9uE_ZRFUu(duEXyTd
z$?|&PNA2sHZu1w~+C<(>yh*i@BoDN(v#{t%@EwxI>d#!|$MX)ZT5NN-?qCcX>wiWE
z-jKONZ5u8_O$m3_+U&^Z)oK?=W6m3Hq*>Q#bGLZ@^k=A^5>b^<_#)nBF5kFuEsjb%
zAJ|t23C4Z=c)J~JcxudZ?{AmMNak42%Npm&Hn}eaZyp|UmsbrCxGPNe!LyxWw6`_X
z2>D5Up?Sg`tb&ZL4Vpn_KFc3TLYGDGhtq@d?!9GU3(+=KP+QtiXPKGFI+2l^-%hXd
zy0oxu)hB+ebmxPe7NqYEx3$!Oi2}g@r?2x=Hh=V7OwRwjS~&<kg{?C;N*AlV=PGU8
zXWECYr1<zxG7MaZ8=tr_TKo9uFTL#^pP&fB4M3Fst)_jj;$;E0A?o_o&GWLYYS*1A
zsZ4D3(m;lFA8GXkuKle0k&U)Jv>>f@lpc8UVl7N9bak7&49A}D0tO~A{m!o|7bq^F
zL;+ICW1D;9lB%yAepOO(qa2BDA&QbYIVek}?gfX1!J{8O3=lQMi5DNc-h)uxxL(Jn
zdJj6%(2`eNs5_CDTvF26EV;6sVDEK@0wSqp5Rz=3dek)ZhNYZfFSOu$6y?4fAG`EC
z*V9Whx0vUVk?oHkZvKpSBSL-~+Wy%j5I#33^FQru{~whklmCmIt^eUrfFl@V%Kny;
zgju=_hiFWG*rz<dp*|BBkPGWjJL9>pROlct{nuIh<w=lZekyaCu>#j@lC<#I!n8A>
z0YoyJDWJv9`d)gX-w2beB?|x9<b<?-YV$nd8fLK(Ae_Y`32JSmJilmvxr~$m2{{B{
z^qKxG7r_@<j26dpcetRmLc-V?BhUjK$A=Oujfa!mhQ$4zrQr^Aq!4U<18{JzZA8IG
z)!Y~6ol9ZqLI&Uh6hGr?C3gq*Q>;(~fO%)*<=0l1IIsI)J%qGbF@T%BMpPcsCRJ%R
z)hQoU{iUE*94p8!tOpQJA{P57%AwY<wPXRm5Dwe%wYYb2wid2e!txmu1jn(`P;+%h
zl%b}7*Zw;yP^uW=6Q;PxmGS($?20*6Ui|~L951$zPL+oa8Muo#WQ#9Qu^oii@rbp$
z5#^X?I|VCRQInYbGW?s8%;It5G3O3`$*hE=LJMpEv#j2u=OytUCOY#>O5fz&i(5Qf
zThNq*DYw!q*9lqlH8ByOObm|4D7agzsy<UtyG#J@;LM*Sji@=mN<Eyr=;HrkLEmCO
ziF1*Z=ww^3eKwTur|*+!Qbe|1;RchjqL5H6g_JtyH?8NQt>yfd-{92&+-MfX%}*m#
zQ`fTM4`hdxYKJt&zX~Q>$5vTdM6Dr8wJpT0`~J&i_IK_DyD-YVkhAVTCc)GA#JVg%
z?V+@TS^troBP}LP8*P_%5$e7T?Iq?HWdD!gi`2liKD!aTRYINCwVQr7)-BT+4qW(P
zO`|Q%ksv<zMF{ib+eefm+Y5ELiQ*%jeicmvcdcy`4_z`&lFkk3aJ;wbXd=BX+$eBv
z)lw%suNCcX;rz3{<^n)2v+>^LKk*fMDt4z$udJSJ7ANzOyHb4D7o*uHXV-V*9?kF^
zX<J>cX45ZrO3}6AA-=JQDu2@zFwgza`17iX&_HjWK;?H)g1xCbZ+=ktCCwnQ^{U8?
ztSI*t7SW+{&i=wGFuoEUg<FHn$_GK3?Vw@ak1F~buWWX@lxT4h%cosFIrh0a@$zQ;
z^!*m2YtwAj?H(wE@yc?-`TcCox-<UMx$mu_WxMNr<gT@R)^PPsAD4euM-~2rKkn8G
ziCW45A-vD$$HR!Svy&5ZnqmLx8V;g4zrD>M6uJs3Ds&aEDb4$K^F8FYd3$xe>6C+@
zMB1vU7K>)vj_YA%yoV2}R|`0B-YRx=u#c%RO3EwiWSpDe-RWo9nX2jtTb1%b>{J;8
zk!QA;dP6<n*lAMPVw%ow`15|VNvZs@GGWnOA{{s5+ChYguYxV$OX{n+U<?xj8ATUZ
zt6o;^hCcw_LmnFlLJK9Vwfr6{KrI#{D`4I)m<thi_lYrw|9?m!MlQ`YKR+Nuq^PWR
zLKaTJ%&FCFa#zVyygPUD@!F~S?-V1SokhoMXmi)Eb2Qyyr+$~z@}z1fiX6`Aa(dgn
z6J>oN!*+ia=g70}t8=v|N((}|DZb#gG1J3Lbf%%a({ifsiC2TyLX+E;!1<ig^swdI
zU3NM#LCX84h|J?e-8c88TQ=Ho>LurKuWalbqHOF&pA3!|xJOu&Te-m5pztbQ1BL#U
zJA6Vpb||+2hT;yfeO6XrT1VcwLUp{AsomfR%8!IB1->(98dkS*6Dx4`U(ZOL>AO2*
z|C0Z;wbqT2yu{R+px~gjJEn~GDnDRQ=OgD5Xa2^<($H?U2aV0mqI&v5U;MpZ0tS|$
zZy@nUx85GQ3(AIXCRX^mDlOCW1Gmz9dU0Tt9jgEORgk>x=!C6yTzt*L!kanufAR2?
zW1-$HVG|V{J<V7~{(=29|E5Ovp%2SEvF!OP(+Vixg@%TzuVS|jF<dCFOY7P9&<bSp
z91B$Y$TO|&4~2EX13D%;tL>m8#*`I5+A$=uQRBKGE+W9e%v?maEeoWc-uLi1b@Z*k
zef<W3yn=!`968a7?#0)>O6^Uh)lZ=YGdI?%@)vy)@6)R)8O|Vo`dbU7P1?KZrF$}e
z__uoI$thw5B2os6D4!o@c6z3tC2xMYq-v-uA;dIFb<Wwa-^tbV!XG8oK@isqUk-Od
z^|{5j>E$y=b&<+}@hjN{6}c^v9o(l{K#q;dwt8GQ>#f7Dt?u47II_iSwU-bhWtB$~
zHFfn51I&NLA;P0zev81CPCvi=$F&z$T}g)s_6hua0wfnn5;-#?9WY=`%MDn2@;G)d
zM}pCzM8v5%#_?11ea&k(UBJ?4cU&pb6#0q>zCTeLa^KRP!`=~eV#NyJ{PVXF(&oj8
z6@oW_@xgfe!ABlFH~vc2cypg2)04DwDslhWdsi@qLYnsZp0y%bKZFiUniUDmN1JgO
zEK<ciZV*?=z7tNOKTCG=+(x9=gS6Wcl}lfXkhGsBg5^3Z2eUz$eHy?_Osv-EcR=~S
ze)_{6j;Cx<l{uq$IOY(SgoK2qer?SB()}v$d0(<vJ&~EZ4_e~=MxFkP(0nAz`J4B=
z`+@e*nA^0EZ6|y#<%|Nr!ggpKs^vsa70eR#<302e;Mk~h1Vc*s3MxG#AV@#-)TXW5
zU+`kyoS@DJb5hBw>5$%#<j5N%T}kk;_*618?eac9zcOE5#}5XDW(`w?9F3e&)T-<_
zGP|FqjC}Zek1O*xmDD7+S?3#be)xIK5E;qY;-}HoZu@oKS*#!4VMCU}KCh*E#VGmB
z8Zc!~Z007AcB&CrvY?M6z9b#1ZORHJ5mdYpX@j2t-i-CogWA7t?p8-F9NI@}AcP5<
z0y938J6*o?Unci!|LSzz%JVae-&OyQ0aw@xzQtzyqgH>JF0(&V5rJBWVv?)nM4wvy
zbFeX{Ea3G!H{Q#XIJds6qO^qxYFkzmTd7;e%*Q{6ILZiPh%vhxVwj&gI<i*#C}N$!
z$Byf>@elN0JX|%g0~*{@DKYo8bM#$xYf7ij6$+di4Rgl*%I487|KR8y(Kb>6Gw5{h
zlqkW{2*sH$K-t_{Hg%8HaUzj*j};?7yt%Bx{?-vVmU(>Yh_9aZdtLRC`Dr%$Ud^gU
zrDQH~rX`i#ZQ`ccxsfNB<6ri|p<Ula=4K_$iB2&H4%9G!CYCEyr8B&x>?wIw^PAXQ
zATmZvj4QCu#-H{UHDnIor8}+aY3{QcC`r-O&@k0z*G2S!4FAWB$d0*AHu&|x!DrX~
z=E(8KUGXySuJS~ES0{GKzaDdDuGn#55e~Csjz>}#t36QF9Bq_!FhwC5<WdL2Uyvhh
z=Ws)e#sm_kYVf4|1u>rE$IHx)!6{7O3LLfw5SCb7+q<$V9H79pkK?v_iQatl391~9
z5YKV;-XF!;T!(~VF#$p4Z*iV8SaxlZ{?P^KQ4Z}c?AbPUu2`$6L#g{Vz_kdhrK{7O
zx0D@ts7__34JUVRW1+04%pM;c5kVuSZnL8Xj=lD)WfD_`!GsiHVAUYp^+5h~AqO-~
zcf&>|xfxc42@a=LQg=10U~c9l3vMC#SQb&8LF}^2;wSzu1u^dH?{IzQI{tyriqo-!
zBk2>@RyTZSGLdCIMKR{LWq#vd5>_yAU|xv(w*R=w;dQ%2h?%fpdT0>TcbGk!V$0{<
z*9Z)+7{zj`GOkg{WT?4wU#q0=*}cQ`SeeyR^*faSB4Wm=m}XlkE7H$wf7}!wWwEf0
z6G7Q9xmu{miMPo+F`MCGd!&~S|K>c{GuFdPNp!%kKVPjbA6JWXyE$(qb|9eeiiq7i
zBcDX_6UGH%!li(p79)@A=r5CZYTIXQTXGPbNk07)>%*u*rA511w1xFFNP>F29BaS~
zJ_RGoaga)NhwM8Qnxt)Lxs?Dp5a6fBZVWQ`Y~3cz=wr5(xmit9Wste;p-2|<(Os=}
zrXSDCEOsTiv&_<|oY3Qzardu_qjK@k_uV?ZC7h8yiFT~CYwlrxG~2vOzpb#CMe!L`
z!8^KP6za_GaD3vkA-$YYYO2_&w#CZsQDzW96unphj7U$mwYjT;L|c&(k2Y;5wp)5C
zk#3moK7Fsbt3>boB1Fr?FN~;w?ptDZMP7Eun8;wJ1I2GDneS=xEPBJYR{I@pnw?G)
zdST9XW21cR^82EJzIFYa%yxY>ty?)7>1&j(fP|4BGK54U+X<PgJUH6bd!|r|?0$?&
zlRM7P++z+`9XrC5s-~h@dDg-=@%zX~+2LrEn>FDXohJq<)=($b8+;6X!rm?xl?`~$
zh%WtrYp-jPG;C!B?5j5C%oF#rqW1~{c3Y#TIS6)iM4IYtVI^fCJSQUX-l!E)@|Az{
z<JI-J(8|7m9CFPh2JbG1(o7(`kQTJFs;_#^0DY-5YPh`NctpwSnA6moHm%}#kHW1Z
z^f|QHOm)GUvhShIKZC|QQpyz@3?4LaTUAUnX}@z=$Uiu?WfqnJJJ}yV!g|-mQm8%?
zO`lGioU(No-^RY<JFj<kO-Zu#S4ovv7nE}&>m^pWDE;=1t%DF3N$(VI#bS0m@!Q@Z
zb4qphaF?RuHGZz~nXfMVGkM@DXC()yR36XyshN`%pK0Q2WfZpDp{-TAC{}M#u@KYY
zVriDw6Z-P&I>SaTRX}lJJNseGnIHNe-7}}zI4m5Owisc4*3Y!r**%5-$!iP1KZj7B
zS>@$<kPweo2Hb9GvQQ+mYPYnnXd4?RN&J`u2#6C;*fT826$H^px$ns1XQnp{2O<68
z4<&}}D>uGUU%XKb{}STY9rAb?51W~(LZyt1SJW<LV=e|<_E|mMlFO$x?c<}nU0Jku
zj|lga2;UI4hHfQ|D>2-u=upqQRzqdGg&kSZc7;~!aJWEa@O9`eP*DvgW8!TA+_TTF
zs0n?8EBs_70wW-sHr7_1_yn>C=_+;#v1&Rhg)$7-vuC9C*x9{a4E`s5LtW20#nD(T
zscFr&4B$l?VWf=b?-z&{HuC@vNs1-hC<B8;|Bo`%IDuM~sQZapFqA>A8h`xgNNfD)
z=I-;UeM=K6@z$Iwd>ntoOYWE_i<M89+HP-OmJ-z~$85~ZX|&v+f6R^$QA{_u%oqkB
zg<V(A6XmP+Vovb(a?xKwO(a~Gx=v}C+(mjZ-okj9Kx}vw=m+%z2R!xP75z+9iQU>8
zuh_`@Cd<(5YrY<;RZqcm57hbk(z0j`*+c|%q<P1(Rkg(S+lOaBB~~dXdyewq-Zc|W
z%*^D_1qfg2FloZ9WaUw6E?vJ>4=G+oLtW&+7ccTN1SRXMR!zcn`gTz_M4V!>sv3O4
zuB#~-Bpd^L4S&S2S&=`g$U~i4zfeO*_v#y?()H*`sTj{-uA>Tb83J=T`_4>IYB=ez
z{AGz%p$9;vPw~C<LaFQ_xMlhqj=f4YUVyWRv{TTv6E44W*~1Oy_2ghdX&VI^M`it_
zQBKudDFbKe53El_io00ji*sKMrl~y*eIj};<``&Xw$f>93%1Q&!oJ<^?cXh3bbSM+
zN8KZb(Ij)vG^Qf^aT;`Sd^nxIzjA8?75=V^(JyTKA2jk)K)y|wvX)z7+FatZ)Jm3@
zd#2U}1&eQ4e=ZU*%XktI!nE{VzQ7tCHcQ7u3D0fjP9bgsi1ML68(nxRAv&8yo6+(}
zYW>)oH*fGSqvgEuSJahpo*udC6`kZFtibaChNj_;2!FrN^lYwG;7-u{q$}yfo0&Zx
z+qwuwyL*7aNh_cE@>U1~e05}y(&(92J*_5blp!WRrK=LyM4y$RVd!)8n8M5|GMoZ|
zy6NtaiX?M}?+=yv<D~+^{LD;USE(ly#M?7g#rMcbMo&=tTxk{z7YP4VbYZL~$KaxY
z|5!m%OZZl!S8jpxYxJ&*fG6NrglBve+J)ksBLu_;eE=R3>wJCC#C2d&l43}naOKoc
z7tZq4;-3x^G%yL~sW9Snn^)DWZCV)rD~(P6;XBtS5$_jwGhLf#zyfl_PD2N^XPM4>
zzL2s1HU(JiJ8<V^!(tBYf>%kd?<WdJfq82CPRZvhlhp5h`7dTG^>d5EJ*50!L~NP^
zXOPj<&3VabG3?!nF7M|9P1vLv^Iw2VXKyVp4$<7_a@x%2UzeYWOM6c_#PI5#OXCN8
zucWSEFq}$l*l$Cy0M?+p*<Z#`L9zi+9t3Lm=)I!t+plgOshRTRd?%tbE01rJIgvW*
zws16yw7wt#yf~U~s9<&8ZiIT+waY1}D#HF71DZ^zvZ9m<)tEN3dbmb6sYP0VYVrJ}
z4cIx<V?!pjat|Sm9Xla&49pDi?(|~ySn0<6P(r72b)L^$nCA7#bTW;$)6)R|{H9_&
zWao%QwpvNTrc-+p6abC9pG4MFwt?iEyBj8o1ar4gpy1bwxGyukz+oGCQafu|BW8__
z32$^s)L$&JtJcWT-(V^{j^DHQxpRQ=rV1jKzfDTpq0<%)9|UB~fi2{lzb}8rSQKC$
zr$0N;ivi$b!)<3RBr$+NW-O+*Y46nf2WM#u{G7g-n)>uQ>Ph{1Uz;Bv{Ubw7OKUv)
zvlw7p2@p_4WTAvZH<U?B=zen{BqDa8MCy`d1XUS$Y;%Noy`+?1JHkdN9PlXG86!+q
zBL}Ph^;}SBzeQi4n3SYtZ(nF^VzMINV}P&}e81kaX1}?=Gb~3t)Z~|O<J?)xJ4)|y
zK8^0hAGO>y)d%-BYMvQDc#2mV>dbsN?ml<CK_5~J<VPxayR{w%?u@3se)Q^fC*bFE
z!X@!o`O~TT{o1Y9Pj(*KAqOJ6lEZ>tT%zL55F~!TQhdQ$r7U?7rvyO)IrC32mEyZ|
zr^h$LWd0B$u-GJ{Yfj`)Qa#owvuC<XB4y#Uz}W!Ym6!pLQA1FbQw$2^fX(ryWa!T)
zZF(d3^3=o+2Pl1Rv@Wo5a2U0z>bGI~_p<2S0)<IU*7U6u{c37FIZ)og`dlmPNn&P8
zUTqU9kpk(2s`F3N_4l)RnD9Xl6;ukAumH+3h;7@EGdXFA+659?aZt(r-+u)>2LKi^
z3JD28NOt!V9-$^cSD40uN)6$e+@M?XFImO!*D<YQwwfjs=Y)iXp^6FWO9VmZPzMe;
zt9p`o&>=Tm_~%7^4qj9c$l!omiC!QvH@7vvpnxB}ThK^B+!H8a{_8gsE??FG1xx=7
zD5t{8X<GA{e}8j3MSn}!g#I+Xe!nGQBYH6>05_~xfjG^H{g5h2+1@K2D4e&_FoEVE
zi0cu45iS~wQO#)rpe@o=Za&Kr?Vr}_-yaOp2QtBF3?JMS^rhL0J)qj+Hs;Mr&8+de
zroqo`tN_^{_Y|PhsE%Fi8T!n7EwiMs6~<diYGTdjQ-1vqCjyO(eGVH;R&S4;`t<qp
zgTWCL`v3wMxJ=M<-u0(l{rd&O&o9iUt9*y%4j&xCIq~)^YAm4|CAB}*Mft$!i_8D3
zx=mE_c=ZW_-{;QguH1g!WqqyjA~xpxIuPHneah!!DJzS@Op~b&Fo;}3JKEd-53hnJ
z0z-!P<Vh64u_PZM@OxZaOLov|w!HXvKe7P&k^1`M(WIVsyhFiZj#aIkONR#%I;hB<
z+2vx<Qr)}`Ur%8wZ_;Xp6-KM;=}lGdjm4<smX?(CF5rn^?%(YF9z+2W|9W_s2%sTG
znX&-&lPK5-+{ae_j~&Id%*;&5lW~A5nZ5_3f-3Xye_b!12!yh#Z35HW0_5<}sb}k&
z!ALC{8#6_1%uVS-#(%xO5|om*ZP!#&3*iS111EhfH+(VqkYJ+&O}$Kbrp+58lkuM~
zRodID*<)9LjQ!BGI>2nH-qHj&5%=b@&ic>M`UQ<vz##B(bAKFZiLr*hh1*V#5qMz;
z<=q^p7SH~1-}B2rcX;Qy`^Ls?E<&x3Gr>{K^84rh=;{7kK7JX{bD)wjVEHDY7_;ar
zs`sCSS=OTDRcgFCBFthM;9f-8Zs=}~5_kCN3kVNGhhBi4{Ob`*^E4o!2pm@0AZ0<V
z5Kg=>i`sDL+qp1)Od?-nV{YbJ60R`z6@^Hnzk0M$uk?${+9uoe%Vag5i*a(+Cj(2x
zpX4H!1r}#TzEht;sLQJX_!dG37CA=v;g!0d|MQc2)HWeoj@s?py-?d9*^LSB9ouga
z_S$?ZNaA7f!ZkS;#cQTLHYL1ip_4^Cbv!QB#ZJ%!ze>4wQ&&RKPdV@P_mwH^BR@n`
zO~9Zk3cr3uZ+k~a7L1bL-yGdPzBz3V0Kl??Q)Sh)J5y^KHy+Q=eWnY~lc=@&K~3?&
zU0TKG%6XJLi1%@q6yU-|6)C5uLA0dU1+MHUL^%DBq;>PIOGb7!#elZ83>Kd<8#_2P
zWC57we|<Snr$FqG1?X0AhVQoOz=A)}F09t2*4?XIBu30EYkrB9c5^XSGwzRb|FtxA
zP}xX&1n-Hv12`WvAuje!b!CKY4qS^r^oZZzmj`P+z%(GoUIt3bIOw{q%5M?YpcfSc
zK^9E}wEHK}#90##sZam<f~jJC&^HXVbRs0qVBqt^TW(TC-!_Dxu4f1DMcq0yr`Le5
z@t?ov?_Yp47tkWNgdv1}uMHrPmcT+2=p+KSck|xf_^)fdV}V%FXA)65fRr_G%^a(@
znYy6{KeCh~Oc;vC*?gbUT))Mtzu&9O&OQ6~8OcA{l?T&fZ{&G9OXwD%d*)K5XbZem
z8gxy`|LZRXg@>D?4Kd0hL#3?UdQSA$#DKYcrj2Bs=e|2*b)Tt0|4>3@{u7F64u|PZ
zq<dUE&jG9)hZ$1;=A!TZUsw7s2#AE<fEnnCMKO3`_pvfW0(q{W$Y*r*eZGCeSsk3c
zk1?MCG1ql`uTI6ov@FeNj6WMcl51#1=6whiY<w`(psAnZ+PBx5*qB*XhIi+dA-@J;
zD8!`u!}L%dyyvcw(dN-}ZQnoEuEHa*--2F{z>zg@XD`e5C;{HBTyMT-FTtqX7S||B
zD|+Jcv{Pu5EinW)q`oR@y4urC+v`?-*n%zcf!9>t`#2<{FULqUH%kp3WEWfczI~|I
zY{|`WGVZ>Pt!kc{nnvkYp4NkC2$-})W6)IxJ}(R>IG~93Ui<gxfsEj1&z|K$vO+7`
zMj(_DQVCgW3H5kQ9*@A6c-56+Wl7f>Tlg(i=<WP5#!6ZVnC$P&-Gwg20XP>0G`cYg
zKHSi$FsVP}@SI^xx~7sfwrCmjzi9q)LR0aZ7I@)ql<WELhxQvZ4xj;#d<`ha&V5Xp
zj4#TNocka|nPMBjhsC&?8QfS;mtB4^5eAGB))N*TRb{JV&MB_qO;+W@qFAd-8HxH`
z?m#72TqeQ+ITNII0GEcB+OD%n@c8p;g{MKnfrE30HYkByVI#cJS`-`^Y55+v-vlL8
z_CF~fa~30+8ue@wX+5|O=vM(EF;1SA%?dKSej*i0uIN9f|Jo1r^#lM=8A6O9;;wDZ
z0b7qiD<a$&?S9eiC<^3{%{!<Y@f!dA(B8j5E%9*H5G0UOmT<Zw6J3NnT2s^0^C4HL
zomEhO(>uQzGY(g+2ETc%{QK8sc0ynL9@x(df`azCz)^WUj_Rlx=-ntVlC)rn0pICo
zkm#?mQawEs#jK{LXWXSetW+CIoi<h<kxlhjFdaYi3ne4{{m_1iTu10uK%WJY-wALf
z;n!cyA|?$0UCf{WRgQvA(8N?t^9rKHGKu8@&(36IW*+FqpJeXlB2D_nnDm{$A7%X3
zpREtFAI+dmY0$)R^aunJBdgZpGI-<JC!urk15Ex%9~fm@cYu|J!`RE0F<(GWLd#ge
zXTWcPg@a?Nse?w;dOAk^Yd_RSOC15Rxs(N&d&BkU^x`sA6y^$zj*ZsY|C(K3xw!}R
zj5JB07CS=Cb(7grOtqu<`SV>Mk)N9cm95>D_MHMHHP*6ru@~%Ak972@x8EcU^a+qA
zQ~Ij=&Zop!9oWg%tLN0u^225hffK57z|?$BVmvYU`VWzX$Npbcm77ihgFZQ;8+Nw>
zPcz0d2X_QO*LuKpH+8Z|>t3^stjx?pKn2yi-v7rmO+~)=?k$|En-RlX5wgLMK0|ci
zkzF;5%(*n*_XvgXWH;w@t@ryU40Ae6SHX8dK~A67Ez-pwyf2Dn^7|yge8LY|^Z;=)
zPva23c!5~)VE7u6vG+q~WrGP6v`N8S^HFj8xNH9y75;q7{BN+<-P{}S`c`aGDmi)d
z1zUE+K*(k<2(~Ryv?IAlt2)6Mi3E{$oKnYby(Ev%_S{BWrt$-*c4NDrJ%{on0mk*D
zQuEd8nRJnmF&+lNTI}NXsd~Wg!vX7TS^oWhZDxo-xiJIvsc*R?i0=`Ts0e%n@R3gd
zV4)sS3wkmJkyy})XzL5^$_{IVM2PCcgL}~!wrME4*xi(HOH0dae0&@SWpZtZg9UGE
zLQle0D$^?1yz4%r{^#6kL;n=vBpJ_tXYvPU2*d^ULhoj%c<YWNC_fG~OUztgKXca`
z^~XdXe7{nSHk~(Q|FM5nkByJ7O$Oy3Qmq2OZvd9YI0{sMdy$w^=|nF$XW+hr&HdkE
zyuWWI`2TPp(_fqA#{c*`s-u6ag#Z1Q9wu<s{`Vg@|Ly-jf5-J7)69{Jh3wgI07N@?
zRaI5+7~O^NyE#-CYSq21rq%~c3_Y|8=~rTrhhbfP^J1U?O!yIa)TU-;eqm8nISR+e
z^{V4|*IN)eY{lYt1M)44e<i|M<P<M&{|r0@D^em_H%=%88(z6`1xc_MNzj$mgn6Gm
zd%PbAfQv3Nur~r+2WC?#xVR2kn7N=EBv`{hFkLQGDnuc=!KK}5P=|mKDU?Xg(q@Yk
zu?Xddu5MPK(-gjI^R_K|(tV&lkaMQH|K_b*s0@Vj7byFLo&_FpC@v5^j$H5DMg%>>
zBs3U`kzTnYC9o1Sq}{N*{5s4qe&$y4^*pc_clk&%Te<<C+!Eo4XWB|2F%ge$3|{rj
zTtJ{9fJPP)ds+|@^@9V&Cr(62y5J&0$%=R0fT(Bypz`-n7Hu(_oLsD7ql`fkTKATN
z^hE{`hUW-a%Cc2mm_8i=9<iJSZ;d}jt_cMW>+opzc;qu`O?=OVOnU-|-~kSn;!wL!
z>D;?4U-Dl?(2oW=`IJa?(UaOHZDmwmBVIK_j(VNIO@|iMVBW@M+s)4lITD>NdH{sw
z2hu%_C7goIt2b6M2Jq(=_!ePdB|umj29~Sruu`**<mIe@TSr#FCz~f&wNxvqH1zc>
zUZg{zV+dqpb{+1n{&fk_bP9J4(HP$b$|n(HH1Q<eYfmohVoj9_l@fWiP8`xzQOQ-}
z&OMyufKvfgu}v|yvaIZq(FEl}|7-o!&G94CVN3n{YdLbA*{{_Yw+;L*x8taOhErp$
z7*$l3q1siZY*;a&_YlH7LqVE8fq9$k4yU_J*p5%*@`6C1F+k8&cBA(ZbF7wWGybeF
zggjYft#a2@3W_oIz+LBgfHuDryoDe_{cYq;0wfRzm#S<bO{JYY(O+J?0QJ>Mss2sQ
zqQ?k#x^~K6zc1erzD^+`EKe4Q6ut8>D#bAfc<J>(VORH@R;8rBTp_z<t|xpCP8kfX
z>BSW&`vC?O#9xw74^aY$mh0WPtkhJ~qRK7iOE60r0wK91q8TMBpbd|ec#aiYcyf*(
zUg+#uK3J4#Oqgw^;S}PYbI{n>c>3oim(%47#F&*<oQKP+*17r<dh!<56+fPU^c0U4
z!*2KPVVlJ6_i|Zq=8R%G0X9dg{!D>|3t2rVsa5;t%^)3j*!(vBxq)YYO-9j`+)!h$
z5Buvcx~s;fLA%}tU3&IcK+IqAN0V-bi<k<;%Z86SzaDYEEq734pV?lnXY>l(@0Xir
zihA;9Y?EDPN_$EdH{4qafSy6J$dSx((wxC+s3v@AiofVN=bx$0M;gDq_e9!g)Q;u>
z14XyUS8_YJJ|7M`pdf#>EQk8(vK{}6lg0%KX6^lF<1+Pfm`bU(G+_w1qJhFdlzN~8
z$i{Wf-2^}u=<KvS?r#HY?^HSWQwj*{>8@op!Z%^HP@5cKHKAQ>g{k%_xb6WC_N%o%
zM@$~uT%bN#@Pb>_nU!;gJQL#qst94TZwE!p3zZBDnB-pHPUK}}*r>{Xefyr`(>0Im
z*W))2oz9@caw$GS|NVnkCIaFT!H_rs{djivM||E)a!<c)i3t9%hp(?tI?v)jZwWeG
z?$6W;nzHA*#{QYe=jVMpNA1p`Tl=3sf9;DDk!a<mNc6ltZ<j0qadrGI9Wb$tBF#5h
zSHLXx$UI~b-T>T!_(N!P?CB{q>oBxvt2s0N+MwcL-YQ5)EIImeG~b*$M;woQQ7i1!
zKqA;g(YO{5weSWT$%?+vcr&BALsk65b;6q+1KBUvxA$E>%^IZu`}%5{m8Z3`$;$bh
zH)5pv^S7h*)CxucBaSul_Kd8oG0oXX%h!UH^FcI2dXP*J`c}Ay>**{qW6g2f?Gqo(
zz4QKYmcnIKSN{vXD0tEOg{;ltp5Z$j2kr#Io~xr6<$-soiNSU>)|)9l^$pB-2+5r(
z|5`L^vIbtxDc6C&aJ{!m-j~r~VWP_pNg<HKfRAbj_AmA@w_Q_tz+Y(G>Gai;R@)^P
zBqk-0_IISWj1^Bc$sdWc8~Ji3!rzr{wil8gEV0wtMdma~!SXso1zh_|Zs_b2ls5H0
zcev-;f!GV=b+<!oI>8Un*)HO&v0nsm9WhAHqL-nb<wp!1(SErN-Ew;Jz{MuQo4eoh
znr=+yUeoqTwfWf7G)=_om0*I88ds;TwNu^^eX06eC6n9^e6!^@g01~W0GR32lfXMe
z22%7Hi$;ZagIb7FvH+-Oywmq7SRvHDe*GMerHmc<<g{^Lmi1_g<R|NUD7f5k)C1$k
zKe)(d9Cq(*#LjIq$FM>(98yo<+)r42N?L$za|zmP;*4g_?gy9$C0Y8oms9A*!AZl3
zxN0sEqrjCB6Z@+x%B_`V(#v&i1_zd&WXBj(29Qx44H5RvLnaVNve1*M)v;oXCOD0R
zOAH7PQZB74vG|dUKivF|_D+1n&EqVuQ<SQV@ksz5JKGy{XqrVf<_n+K;lMAc>RI6y
z#F9L{Mc4vzyk<7uL!zzPX<40nsDXL%B58TaNg`sF6bNwINuw%mlWXQskj`~rC_M0G
z_WgC~!ULZwj=eZ{wD%O;Bbl77Y+4sS;nzMBmc(1P`QMyoWnSB})X+AZm+~X6ZqX?&
z>~8%}_WrOB%nj4DKizA+>84=^ds>fGVtc9`G|6qDG4CelUda^yP}Qd3#9q_yws${B
zoP}(#$9(4$Y$m=M${m@6eX+@|<gN0rYIfG7z33?ZYZj!=<#00SqCWYqiO3$Q#LaMs
z>E3Fs8N<0<Zx5a)%tn8G`C<9lzFE}cMn>=R(;kbo+}<wF67pey;wIs|kCWVk^2m{A
zg#Nqk=pz*8-2-#EVbej#{ZL<o?Y?Hz>$tgJ&^i)J(K{Z?hfYZ&k@F6%TFN|5N1Gvv
zLCpE*_Y20CpYMN_clT;dEv(i}cgW;15KY$_?%=xEN40#>=60_k|1Nt0luzD081O}&
zV!P{k-EQf%)~zKM2V*-JwZ6CxyD7sad22WQHV$3X7d}6>ui<J=dE2Y{nxl_XVd&g{
z;(Cgf4l57)?S5d~-g)5x0oL!MAP@OnH<8A5TU0P3HaiEEZNZ<q8)w2<RgIjLdUj1B
z&XK2SK9c_$le|!XPP8a+iei}-^UiFH>G0>^<&c?u^$hQt#_qhO7NX~(r=`e%*D}lK
zwdlGZZ}ye_e6j?0aBypxoUq(mWqoflh+9z?igEp5ruPc6;3^qR&&bZN(W?4?IJ)jY
zsNX+skL*qM2xZ@uy~)T*G-Pu|WjnI>-kZyeBHt8FS=oxSSLMtzL(Y~xe$V~>^@nwz
z&-1+BuX(8!Nzw$QyVB_9^5k+QRuED@#jni6M|nQRY*WoIw6w)bvqh%XP(ZPkV0i=r
z(h);O9d}*Vfizkag^zL>ED@T%1EZbn`AQ4h16j~!O*l7|63~9s@=%r-2+A(C91Pdl
zAT%K&?2Lkqi1Yq~CIEANqT0r^w@-Q6?z7J(8AdM`1=NyGVY*N0X1i25E+lX22x?A6
z)yE!9G>Ak;`xe^F0L}Xd77u=Z+PWiE&pgW7kdb3sO4<_i<zQvx8@X8vxYOp=@!{V~
z^%$8~Zgkocd3jl_bFJeQu&5QI99J4i%}Lmrz~VODhGs+4S7J4drBS{f&>jBp^!2h6
z@lk(2760p+_Zt;)G(Bj$M6p>AQspN9h|iq8m8mc}eCW{RtpwQcRy%*+D~WZuIXk%b
zf_rSMX0K9(axJPYv6v`Wx^QUd-Zj|vnOkrcnrWZdMTN4^l`ukT$vGyBitF8Df!X7g
zb`ugMf=fAo==zTDWbMxywY{2V3VMiJDQkQzon!rmQ9K0dT_gC7ZUp%olgnm0Az21w
ztUbAL*nux91KkQgTl~E#6vg|)KNs-tD7jL3?Eo3rS7|<d*+ztSXK0*(1n%vY*p=W<
z-ThkndRgYXc-c;FxI99Yfck7_7xRcT05?zS?-;POKc1ZhX<_9J-QeMK4<5HQ&nt24
zFUc?UUVw7SdA*w=+2fgXZ(3zOcw2Vdt6?ouD|<+HgZDSon9wY)sty1iba#uZ--F=q
zbU<12e&Ce?Z-+<Kg|Rj#Q`Jy#DM{cva2NQ_Q?W}YX(q4O==IqFzV4{t0-AUC#iN>A
zf%-*?a^tOm$2y?)!@jo<R{8j2PAh})dl4kixt7#_)y&R_I(KN^-TvVX98uLK;{Pd<
zm`@ylYe};|TO`-%+IMT3*nH9f==_FF>cKZp2fu(M`c2UXuN<e)9I#7^fx}KXu?0v2
zHos6rTehA375S*}QdR5u7iZhe(jJc$fUnj6EA_Yl=S}T-0>=qRa)=NkUIXQQNv5Bk
z-y8APZ{Vo_nDI@7a&W-If#wpKL(t6955l=)(!nz+fzFtzvS@<r1H&uYAD3Y7OLd>T
z7k4)8&tkg7L57(R3;@>U47dQF+JEe>U($n*ZH2qNt3b6@_6s05fGu`KcRu0OG*(ye
zAG$Y*Zg|=jbczCZ2A50U0GRXn&0T7vvzvCiC|uit`*rSU1{_HIxLgEqEu#_vC1=jI
z@&m*$v$&Xb@2?K<15N0cErcj;#99GE*NvlLiY*k_4%jLmzKzIs1<C#}kmryNZY1cV
z2Ddq%zv?kT0BEY;0jmy2rrN!iKjUx}W9grO54142i=wv)2(w(SOT&EGFhspwR<EXz
z?=6i4FTnVc4w9F@4}0$}bav)^_1FO*lZA-Jx1>*Rl7LlQGevP9h5lN{lRx?iJz2f1
z2=s^C{vdNTLMfWofqc41Q@OZH6bvJUee5SdR-#|*bO}ToS)TdA8IjlmU^?k@-WHKR
z0ca|N%Miy3E<C+pZHmcJt*6Ak>iO6Hl|>+VWt*u7HWMvyx6*O=Q)T7LdX{d*iteA^
z2oFgZ342Z2>Tt5V*qIa2DFb!r&w9p9A@2wdV*{0=9p}<$cbs~P`eh#lW_C5#+HF;~
z7erPGppnc$=2#;(_%rw~&E3`(a9*W@v%EKDNJg#o@qecA8-1cd5+|oXD9VOy6%W!r
z3B;vkphH65euhmN%;5A=#9ynzn|o5Z-PgL2VC|c_)F)YOZBN?=IjrRMRTRf-Ai4<Y
zb;Z&6N8aaeo?8Od;v~N|sDjEE^`(2yJwE_y9e>QnUWj88i$4l?vc!lD>^Um{Q7fa1
z8O53hD2D(ax?M}57<kzkWk8-+;wjr@M70mtywu_kZH^ansV2jV<yq|CbhV{s8p`)w
z@Y?P^EdYpGEd+F7J%r7-_;>zpQ3O>GQo&4?Ou;}n#FZX$d1lsP4hRH(@F)a5d`?!Y
zJVqN}ED)vLmH8v5vOZ7zmqgM}!EX;6Im(*Z_WFh4#?t<vW?k&O3nc4svUC0r{tt)Z
zAt`9M6wx@JZ_Zp8HljtN2<+j{wIm_xlG$F0NrU^l^Lti*oGMK#AJrT`@A3)2NxazU
za#DVMe5!y{)Sg)ccX<~^Q*m#GHD3E@UEgMf4birw3#U?#Luy3dV5$-`__=+0tKc*d
z1AFzrG$oqyZsoL8dVZG3Q*mh|0)w(bdPe)ml=Dy-jU*H}9!20R<2idK;L?x_AYoHu
z2!0wu9%>FtdT=C$EOOFmtx>a(7Hqd7tG!x0hmr6<`}#8b9E5qe<YY^tsbDF54D4HY
zQ)g4DRZlyzj$i>vu?TnN>kIF5gBe<tWolnCAB{*7D$&h-&>J`hO5HYbW~VwR3cgmc
zFL=&nwu#!$A)97)H@6AI?Gld32r&45Dx2e*h|QI;RY2`DIFIoS*y#UpbiBb+28FJt
z8Kkl~HBvtVq?p4xzlNnay_?hW%)&*-H&qgPB<zt8;?z$IX1q8B8K5(JJX7!b>NrzW
zWKdob4C5svyqabazRZP?DwY@)B*mF@yma)&oXJM!n;&H>VVs=@Mu(ziY3++nMyIfm
zqFV)f_e3YsCKs=xQ8ZIWOmFSSbMav1{33U+Re<q6hci#~RoFF0v7hlUUIJH-el9Kv
zWJtd2xJNGCnDep-dkprwHg;*3ydjGSYC}hu<H@sn7qf?YR-=1k6}S?<Yk;Qw*#@)2
zy-OBO+Tb*75JzTP{XcxROH_h(xxzNS7olZ#NE^<5_?fdX8*-8jFs==p@^&CZtX~=(
zg_b-#keYZVNKyCK&m8%oBm|OO2bM5FM+yqwDB32&pcc|v$e_TIPoJq|J|<7felXYK
zIoS*s>R9v2%u&Z5L>LUMB`51sf;#d{7im9;t+x^A`MWg<B3^80c)thSdI`Ug?gN~E
zVQ6PotyS&lx5)wj20-8POEUuC_77&C8X|jYT{LKt$Ra`gvOf_bQ*DhxKQcw+<4^`g
zL<OqNV>wwy3$R3-SttrNBEMKv)-1ru2K+igK;(t)$yE}o6yKBA;FA*Dq%^w$wWLqJ
zp#lP4KDBwR_OJH&^{v;#gTQNDyXm0G>a&|~Y}1DZ0fhFw2W2Q}@UK9Dahoekhnjyx
znESDtm^o3qS!u%ahw5a;%)H$X{yR!@1xE42uWY#75{Kvdra95Bu#|lt5pVCK+X;h1
zFpB*$WS^$y?_R&TEgVv`rYFb;2@Yr)z<{w->cee`b*lc^0=9MW^~Cr#5oX7F=U@Ll
z##&{p9)O$C=vhv5(#!P+ZElYByLv5#8a;wX#(x}nf78Hfra|*B_PmU$NYYll#(@e}
z%nG1vSEu@$5YB_S4BiAEraPu_vmmilZR6hVB~*`c=0$H!?$X{=JO+Fb1(0pFsv(MA
z5EN_(1E%AK=9*i14nkc0V}`stx7S#%gf@492#Vnp_cr>HVoQKCL&~wvQwd-)W-i=8
zgieJ%IbS_(8wKI<f(CD%$$d^tdaeA?S$gj{X4xiiRmQt6)JicQ@D)60WR5;W#)PJg
zG4vDgE5{AKxhH~t!?OK;q$@dzRo26%=02J6lM+rV0B1N5q)bwn)odz*)ZKw*ee-Zm
zHRcLn1n0H&XAW{}b33XCwzYO}8>XI}bb+~*bHR^c^+Y2ngZ*HGu3KKv{w}Wf4-2T>
zif3~tyR|g6{CRYOR~+dh0DYjR8=g&~o~kl~ZjPuq={BT^eG0w4N(VeO>DN#G+}((L
ze~fb~F6VXN2}=xeJp%{)XRlrgn0vO&=Y1L+LZe~zWt6VBrWTj#ga|Ptb&?rl=*e6i
znw5ajHQ{cb4BaDe8dKH(iIyL$4z^bFbZ{%Dbd7NDt_LOWo11!366SS|1|kDVcY)!Z
zsy+d!F6#}I#sKt|-K9_LMB2~Ej6PTh{H9T~e3PoL6@mKQK>BT>-N9b|6&I4Df>1?l
z?;f_h?F4#i`3Ne*-yJWZuI<<<m?A-Vve24J)c&#9;UQUiKBHoE5-l4N$hDvSzNM9W
z9_``<<HXg)%mVmg1LW}B%<`4axCFcy#TA1CK7@r5Ab<CnD9($k29pH;4?%3c=92~@
z^T1e?%`S+CF#rAM1A!eIVX3S6!#h$fnOUyD%hyA}=Jv=FgkL}RW#Hk5PJMsm2@t-S
ze;HEQqOjBO!AdY-)(3)aTo6qlg3e%tn0hEWgC*Lbmsy>R=bH)c-GRaPdAe~&SdA#f
z%$+AytXa&rm=5dx=8^}86fwBQcnEL06meP;=p4Cg#(#rao(Lj8_Ii~CxvAFVwJHi_
zKs;f{w&(pu89)HSYpFTy^yCY*$c$TT@=vPzVNiYz%{*|oeZy^!Au=z<zav}6sJ}Rm
zbwQ*)gFyy|E!NL<E5q~&rwOnh{ZQ*;AcJQTxaB_z(Y3YmGI0HSC}H-FVJM3s1_}Gd
zSI1GeZ?p5oWomp2Y*#szZ>p~6eQ#)-9|B=xBM^;@O*cxm4Fk*aEnjh5!7r`?=wT@w
zXI;)`B16HowYG58&{wIk=eUHmJnSD%zB)2Q8yL$-r(a>ES2X$NXunZga-GvSYa=Qh
zK-P!Ovm)Z+d{nUC5&Bi13we<eMVscr6u;3UrE^e(V{Z2M2>RDnJIx^zyP&?pa`+f>
zy3{Vj@Vq%%bYO71&xNOt2YP_B?E-}aLtVB~%Qy6QoH4x0)hhOKCDSN^eyV%Y;EBva
zAa2?^7?j=EI}^RMRaNN$DDa;gQ8T-1LS<$Mww7xYQ4K0<XC&y_z@*{l+38}nUU3qE
zg7;EN9R9o2Wi12Ez^m8%Jlw&TKsxW;R%j9Bp71&+8Ur9rO<e-a0tk%VdL!-n61qa?
zzU=f%kH`T4hnpc+r%rXmwdYGdn;9gKf)l==QBia^%snOcmD7=G$MIjM5IXf0!5ePO
z_YIp>O=MTnH0;8e;XRk2z3E87TvAD-@H;LgmUtX8gx7mpSk^u7Z}vvdGY?rQ2Q}l4
z%WnL<8xb%$($7@4qKDnf#YH|u;t|JGjy-f-7cPc6rF`mT%X5t^T9^g;g5H8`VOCj5
z&wi&HH*^7f?jkQ;ZfN*A1<{gu8h-YW(LXhOt>aq`j!DcvU`ml)BFkU8qq6q>n_d{+
z#0>ti$e8I*u6c6qT@OHn^vK@^uQ5Z{mPtLw$j|tK0Pt?i0espZCq}_Lf$;Mxu(v||
zwG~dm|D_3cz)6n^n&hc7%AEqF#ypJ4#BE#<nr))C!*Wa-OSsQrrcYY%T9q-@Td7cA
zotunQW|>H}$caL}mvz18JX~?Ljeg}ZD~^5l0n2jk?>!V$PlmR#q@=;&TV~AJh4-R+
z{icMl;_+^sI>vBSltI0ULahg2xT%-rmkWV6y0gOcH}vJOBoc(IaP=_g7Jm33`UBTr
z+XeC(YcQB@y;f7*rsYr%BiW+adU5hBzGL1G{G0=&4;dYCFg3c4rW(!}iZqrhc|8Vn
zASx72?lOnt!)TvF{Dd0UWU=_Yijh6hw0xAVjgvyW=4S$({wGZ}n`yS|F+Y@c>6)Ub
zV)S>FYcBr2n`Ot|yl5q|wTqOB`vWdPiLBx`(wqthfR~qQzjcHHE4-uYYfobSQkD~^
z5sXF6Em;}@j@qF{8I%%M8Pg>CfP4L2%K<`kU4>}8&Im%*Y(r}W8D(d)So6^fQaTAm
zQvI`|IIvt4c>$1{{t&9q$(_-ZvWp5On7;s&CaeGaDYcFMb8!i<TPn+<-?0AO!#(e+
z&0w7v3V{mO0-45<0-NH~&+NND78DptC3lDU8}<s968Dd2Ha9Rq0Ir<{z}6gC#~s4|
z$;`ns`wmTcByMXIuH&ONT~w70NkK!}sWeaI_xm_!Cpd`DtE^?(F%nzd;1F39Z(JaF
z4W@hZLY&r|iW>Js7_=?D>YX&WjK3&8F&oQu4t0(lFC<)T8p-M{E{YddYXaykI^&sV
zk%i1<gChGGG1yOF+|z4HN9b-&_^8^EimQ??L1wt&pN6tt`q`x9V(v6v^dQ<BXT+nj
z6RG0(aXr{%!UCb0neC;2>s=A)t^PUIb<uBq=HKMadZotL#UGR1I~N_EQ>4Xs=M=m*
zVk7eJ8-{62Qc#9CiIj10{s)ULWyqr*#l?T(D7P&TZkyvn(0xZGT#V?xHNemXXFWxu
zS&&a@WfM#)B=MEW8o(C&Ok1*Wl&IZ~NRWWnP+F+ple&Oq64m69d?C1duh8~yXJ>4>
zuA{_XFd`BT;-fD4J#v%qPaivvt3A2B^K6Bar%WB0WV+Gu)*n2MLW2ZPewOGgiY`iw
zq^)J>8#i5Foo`LO6|POCd5EHcg)amXGPVF&MsG-Ox7;k)=gSr8@WKgs+rtCZ$<nFT
zJJh(+hhkFLRv7mw{F4gQw$qZO9<zT1s<+8HC!@@Ckj|Fsa7#0X-)I;F0Dolf=3Kky
zrNAXWjpHXaO&2-3&hU|Nz{k`{-+LUZxTd2pBIhw*ph9TqaWgGAlltz}BbF&4a{U3K
zZ5nF$@EnFgA~Ahv{VwdwV6?B|Y@d$gb7_b#Kf6EasME!HXWibUkp~MW1`&bnPRF!|
zhJLgM2yncT$ltZoG|RY>PJN&EnzTVNSDL{E(8&4(g%W-yxQirN(oRg^Gqg+5tjJ%1
z8O9x93>AiE=f7(%6v=?h?I<0Zt=s#A`C-0^oe-45LTE(D$)6f%kOv9R)8HN_d3SQr
zgPLnxAH574OTLV|Tf0f8jb*_otWU#tEC*O1Jf-uZrH5(MyV@379;rD#gha2fOy|On
zn%b=wc8p#`24W*E8m)>Hj!907ofnHdC4yq;LWB-@!9^ggO5$HEaK_zy&zG}VvK_It
z3aY5d9#m6oF%}lW3+!@nf_|xBj+qx=z}N;3h<oOEp#t~{aK)HC`3(?p;vj9=av5d_
zP=U!T&ZeJgl48>My|yZFb1Vr-(nFzkGb2kPDu*|skzQGAZ4Xo1pTK1P6@n5PH-Muv
zhao<Cgpxg3^S9HZWR)x#^`-WqS2YaFZSTFB-&Hw|<>@OWQ)k+wAuuNw*KA*GHEOUq
zo~X{e<A->C8?iH|VZNFf`7kG(WGcqJ(1v2c&&tSv7}_wZg&)8n-xzy#K`HuEn?3)P
zhXmV0^^P0THxS!3+GOGe^|X=?xJh;hAb5e%PQsdMi%O*iYUNAXih%KPsbL7f$MCvR
zLyMNQZ{;yt5-Nr3ulJQ$ALD!*^67d+CQKwQUvXXKFkxsr;IY5{?tQ=<=otDwl!h}#
z*&rx!V<G>o>-Xd2)V#KzV`bpffF<>=_4=39?dGce1dL#vy9C$KVu(jjQ0)fRW0(z7
zEK&S`TeV^Tm@ar5z(4f|@2KJ0MO16P00m=wiH8709;ieHMP&6;KL)R~t!XdsqKEf*
zj#<MJQ(8cU{Tl=Q3tf2xEs2WsB@*p}2EkAP9~1yXpl?;OQv|Z?q!$EDSl=aCXy%lW
zny_59{xm40#CEQ6ZWrqlU6HLw$P+*yF1-u`_pQ0=7EWK?5@!F#XtuVx45IXw=0nb1
zUxU5T{952R3ysuQl@Tl-JkC}Eg}9x}yqe+hce>SKg@n|ycq36_GV^}+HPUim&2@Zd
z(d6|65LykXKmaX?&dB}H5%(+br?EEit4RkO?DnA}-UYyfwflWJI5LKwX}z<k4~I<i
zfqBiLOMWT$LrJnG)uhdcj=&u>KiI<RT>lTCQq|k&Sv~pmoQVz8eO49SdHkPd5ioAs
zys|1yP=$eOJvH0lYXNZLq<^sG#v<~7N0}E1ispr8Ra!K&qtQFMnS#WDEJ<Jv)h^Wv
zu4?-*P8)xRuJbpR{@$T|Z~PtZ&gm|?$0$1=T&J6_($yTsxh$E_zBh&H!Dk1ch^;;T
z@M`jN{Wic96Miu~E_boyE4`7Oy~q{>lw|235>p$XV5H_x0hNaWAr}!DuMl7-d<S6J
zCxZX&PBnuL#NHH^$Fi=4wCV!<vyKHmzs)+Q4>hTlbpYGvqOvjoR#Cc*`PRVaQ;Hr7
z9q*7fN7$*~^TwZn9uT)5nFs33Z2XJcg#eqK&B(nAAO=YXv$;p1S3L9dI&A+8=p7OZ
zwVR_4UV>#91{#k#=i}pVP6~e9=TCfrQ2~bGl9&i6fJk(JzOQN+V944aIxEvg&rWs{
zCp+msPz?O{m&v7%Vx-onSow)tH<ip?%R6+a5!_^iOWu1nWlC}Ev_AT_-ssL1NC83t
znt%)7s_I<<T@+`(?@d}TV4MD&;nL)0dj5G*^(}B>L6%VVs+kOs$L<5+7m;}#X}~Oa
zfgE}lt-L}IT?eaywiuj%xGhq0b^r`@+W$SRc5}FS*E!9UMf)kIN=OhuEd-xP|LQvT
z2O0nGgP*9!>A-;Gv3BRbNADjT72<EL<Bp_F@aec>>SA~Hz+qP7isr&q?YUe62-;!u
zMK`tbiH&(NS-&A@D0hhf$LCneP)H^7@G?LH$X`Aq#K`?Sxn!4da|uutya0b$`jGU@
z;8C~XgWp$vjY0s5Xvj8t9ZXCtx3DAT8VC@_q24s|6Z|w2Y$D~p^s_u*3(y|M;lJH=
z%WScW^QY3q%fKF|f&?f$LW1|#l7pPjJfPLpT-C{HNe=DZi{Boo0J6O^=jUio8KyK6
zDX}#K#9<sj(2{&v?4s6N-fBp+g$3-o+p6<GEurjiS*r3)a3GJ#`~0dj={<C#Id2D%
z4&{NpxyjaP1^^iFR4@FwSs#C-_r-&zCb%)TvLi(i{0N5MbnPCO7xzhx*1m}egQzxW
zs6y{z6L>}i(HS?lY1*vaUkPRGWOZ);kr$4we&Z9b8iR8$r#Jg-_Iy^Eig5D)s5MDo
zLIw)-jXH!d6$xP$fs}*O<u+?j_hIabGBbP)rp!J9upo9eK%8VBW87KWn!sP9=$itf
z#B^&M#99u3x2rz;?N(Ad_2CJQ0<CukyKy?0t;7Mzo09lxP<h=|sL0Q*<`z9jA=Is+
z3ER16X+9L(iCNh?#d+I<p4bMN_saA~6d^ts96r1PKx5sRuu&j4iRBS4R%J^ReWjQS
zr#Oz?|H1;M3#XzhsPWli>mj7=<*)yA&y}FWhzR8+%<UE7%fzeJ!_8L80}9L@C|;ra
znZdFWh?DAY>}-OvB6@%_V}zxJ9i->r6YnsJNBpigFtsYum>VHYI9h=7TH^8@AmS}+
zj+=Ka$0xU4mD@*s_kukw_a^(t8{9EbmzWc^7ooyX5G8v4*~Am1ZuP*``h_OU$_)!|
zep3;}MshWPGTS_^W)KXqCTDcEH*tywhQ)U{6ID7+i#7dtWf(Bvc3$hiY+L7pDg?*7
zuyAV*pdBzlMOhml%;4+Ry5GDOuKU2G=dKb!)1(xjzmPb6W71Rk8j;t4TZr-zFpmp=
z@Xo}GCW!5<vD*QZg{CNiFQ%D)KeNd_^8sjh+SKHRA1(;2t&V2W6rFd6S5u%Ah+|Ok
zH#!!c+Lfx0X;o=qw9kuOIFfGM5jM8{TiTPIcteoAmHl3p%OO?SGq$$_hZ?Zrgqs;p
ziqauC49?(JCZ$$sMqyWK(Wj@?MOzv@@>;o&@w+ecW~6QI%CDt!H->2Oc}noSeE0mf
zgVte>#%0pJ?M)u%-&Kg@j@9QV9d)e-THm#(U^BQ(_L+75(9~tyEJ^<SYifvL=3)cT
zROQ@{q<d%~GSyZZ<J?v)!jv?6Jc$RZ{KI<Rp!qeD$HU!!GS4vKtn5KXt4vFzZE3%~
zOMq>;O$2P@7Sm7jPtU(TJ96A!1y9kdcBP*Kbq-lp;A^5HNq|43ab|c?4X&3LuiAl}
zLLt-MIC2W28&#)};d%vV7|N>wiY=@b`zJ(mZh8~S2B{;}ENf~0;5Qj8f26sS@f;;P
zOg^P6NTWsP4g@Img&PD2X?KS=gBI&Vu;o$%Zh#T?nZxkegq=6#B+7mH0wv9)7{Xm{
zc@ulFm<{?s{(CbxT2NM8?*X(h^_#=xqJ~7hIx+2BD(X$(G5~>B!*v*9;wBwO+wxix
z$6X$C76|2B^7-F7ZqLwBf1m(%yB3N#4;t4MYQj~-Ygu`#0F{#M2$@o%Q`B&H8{yys
zH7(>t1opnR-Jx_Z&qsDPQ(Pu#iKZLvmD|a{HF3CmZk241b`nY(WBdIAmCnDF@9<rr
z&ZMUBHTPwt@s=Vfujb2|8I&p6mp%QDJE7-E|G+gp2<@iAK%{SaQJCE?53nir_-(yn
z%!ejbNOxg`J>tv1xyAd>P9d!}5<!MGj7b7F5NY6NYuWZ)eWR%&Ghvp6sRbeY74Zq8
zOimiJ?3d&tjN#k2qG<2qBNh<`v4aEaktYJD+?Sklqnm}W=RG63=UH(zh7XvXFFyYa
zAAuHmn86=8ep6c$2vk8*oAX);{U}aIrIS-DFUO4ofT3NlMm>k{+F@+GJ+4lInzTxS
z9b*VxzQ8=@V4u6LNoV=7gpL}Gz<NG(ogjvF2x!4bPA*(@*Mo6!K3$38TaJr`B0JU@
zYg2wx(1f`y2ph;VAaIO07kfZ@f2&uA$W=T0&SOByKZX?R+b%Q*wbS>0eE#*nOGDz-
z-A#=Pf8*kvvbP*&Mc!1yas}kfGsR|B<6?W0xBI1Sr>vf(y@wTY03mj8<O%DZc?ze(
z?-dHj+=v%A53chrH@DVG3C#1a)D8)zdCy+$aYL5r>p9t`_g*hOjR7$sJ;(<_`CY~O
z1MBkhfA~cpm*MO7u<!4RnYd-l1TVib%K)_iWRBdDa`(Pu;tz1|y=Z1%>vs>T`?opS
z00Ek&5{CwW38r(VRi6;0E1h`9%apoj)%%01R;}_L2qY^X6`%ZMKH2}|KhwU$W_{S*
z%Zl&zr&Hdw{u{k8X2BfX3~>g<KkabQt(*>AA*vG%0?6Kx%6`F#_+Qu)5*Ii`?_9YR
zz97_*6Mcf_KdY!!0O5K!zdiYTYXVxAIqsCK!eOm+98)!P^&EB6AQXOQ*L`7Rt<9Sn
z7G6%xtH~RGvlNV-9)JGe0B!nvzeV{uDERyO{vK|B+tG4sU!2#3;Ne{#>T0T)ULNUy
zNvw*aOpi@!AZ`W*%V<IjrWvc*I<Q_oAo+M=Tw!c4vkw|pR{NT9ryq&=fw~~A%6|pX
z>3Xo-gjnOV0&8$rx@OUrohcz;Zd}SiexeNgQ@2^iGRd?Iw!mdqdteI-MH-vH^7nfk
z7(GqZ0JRzI69QAw15y)y<NE?YBc>Icj-OOz+~#7d&6e)!Rb~U191;DmhR7Ug1Yl?W
zPku&RK<AUh0uk?J7@oz}jqL^nX}M|{WE%hMCW9e`YLcDSF+N%r=K(0?H%T6U9JMAo
z0V{6L-_DB986x9f9|Dt|5>djz)quW2&0<*~O6eORz<mWivr(&iuYQX@5r6qkaF7o;
zN;qC^cKIM5?tpyemuw1Yk6}YRWl<v@O)r1l$;7k;;cShU`b1MNf&?o+jJ;y}vBc}G
zJk>61g*0ydvWF8L^;ui9T=#bS0K9Om)(h1QMv`fyX|Ki~ex%E3;6p}4eq|>1w(VSU
z6+4KZM$DNbQ_{X>B2iypXE!`(#sLzalv@GR4t4q>Rz1;+(|u7JK8kQ?@zmWxa2AN2
zlQ}#aB~Gu?TZXuKVVbsWyJM#Q?S}Y$;J5tac-V$xF>4P5O(wt{$n7$uyv_o9y5u)I
zZ~=4Eirs4_*zvvi_M>${u3}(z@O5I*=1BN!-m0B|#!$sq{SR}Fv)!MPrE|2gL!5Vq
zMz?uL@y&k7L|ugr%dMfCCDG16Zr8BY04A!LYuE?=M50Y+!dj>0MZYiq+6>-vYUJ2K
zZ7ZPslv^CDVeaS#{!ImM=$a;pLcjM_CAK1>OX|1NA4f>c81uQj-w}+w3Eb<@=P1Jr
z)Deq%maDUQOYoDl!J#kO*ntR(uIhh4>iq`0H`->Kc<ReJ!)NTPIXwmTDE=qbjq^a(
zF@^O)D~aMtCtVKpaztx`)79p4_1XKAAn`EjtvzsQu^)UbCG8!ti71Tw6zO^lGP3iq
zdf!2vI~^N{8^bF0HKUZ`W9{dG<pz9GwiiR_RNKZ13sP4FuNY+0n<j)=uwM#x;G7|}
z`gW!`powBz#KXmUzY6^&ED4!s>o?{`a6z*>`5NLzX7w@JwhK!A?tdJo1rGW8?Ta&l
z#VIiswosW~r!t3_ad=6!HK>fOr*VA+?3|HeuPzL%+Skl=bC`a22jAWv94cr({ss<Q
zEoTjc8YDB?yOSp8FNfv^|HUVs{L`4))%Al14PV?b%3k2SSW72G(Ow{b_C^?XBsIsM
ziTY30q^{@x+i@*5TSsO$u~}~cd84gE+FNvNA9mT}x1OV=9$fz{SHb5m%;8yz+@HLt
z5PO=o*BC)Y@R3YwTRQ=n2mSEfO*QNND~BcW(O#TtfYN3EAaZaBCE+NJf7ae&!5`?=
z7)ozRIg{@?$hGiK`yydJ#xSSp6liM`e%yI0LT{cWoI+y8v~BI!BY4rfXHy+BF!nUb
z`uF*JC6u>a9_lxCKyYAIpYqLdAPuV|k1bmepOxEN7J<6nCQ_#YPc3X7$dgxBH~$^U
z)#1{Xb^o~2oi9pQ5r?U(%Qmw0(i*yQ7>Tk5$v$eeIUE3b%a)YoTSf5BAu>)CDpo!D
z3N~u5P%dzt|C7gmKvrHe7Dte#a}urAv8YJH{&6EBU+RqZ%B45V;MPizwm3!M{6>;t
zfmhqbLT6;;*H?RL+M*V(8cq1<7GDTau+L%@lFS;nHPx1<_&8=Q(xP8W6lr!2?E?Kz
z&+k}_3CD4j27<3~-Xw3qv7~!;hdX5LwES7GOs~Q^kUP@yslfOf+1PU3-ZX)+UfQ<+
z7tDw7MKf^E4)VMQJB#uQp)au=;_mNCg+}EHZ%o4_ax<yQ`?J97HS+iER&QJisb!>%
zqcsWVoop9vn!UnPSyUb8>|jLEpMTQK^6Tq)$1`SWVzU(|DVvfO=Kn1?7SO>B&zdWt
z#vRDmGrv^ffz||?h_z!tDbcdG^hmikZ<O1-vO|+P>7#2SCj=e?aT~i~K>b0{uHh}O
zc^CtH_8;5qpwgnby+Q!lmiiq(qsuQ&@SAT5$$2xDXZScqgJe)@1ng<n7e;}_A11Qg
zhZL$`d;|p$6q%kx<aH?vF(+YnN;nUEp_oI^J(@nwTrr2rUT}nkH++;mKH<rBscDPM
zCnwoQ7V+GS=mBEm8b;~HDbg=C+@sXJukQws1$1BQm`%SRnf>0~wz%L3cO%*0+06Jw
z@uiqZxsGOyfvY5s3`Qr-x|(jhUI#W!RSzZ~&ue;v%|z=dQn#@-2EW1^B-#N}W^W?%
zo5U|tf2vsm7}BifmJ~{DCv`2zI%w~QO`@>wiaPk)xd<0;kI1m?WZDMWM&^%w4K8JX
z`x7utbb7wvzVN5ZT73IS8F<`W+1oNaiZ%EeB~Gc_1lJ+i60xq85&16?b%nqC9?o^0
z4QWpC{Qm(7zEl<J5I^i3LY36J&P*StQDX0Au%4dPG%b@VIfyi}oe!VCt^FFjp9~v4
z+Wll))UoPUEE{>Zr8-PmonZV?cnT66iRPzEH{5!-K@l$LjG<i=2vQ<8r|*{Y50#DV
zS^vla_<YF>Vwr9L`8&&t&ZJ4rx9ieEH+K(W&fh@D-L%C0n|=YQYZPIqk_*nS@JaMc
zT6w}xr(^M4s5WteYWo`i#;Qd1Y$NiulW#I*Mia?Y>^lGj)q!BOaAL76qMBLhjk0cN
z2&LUm8%thf_ZthWIwP<Cb%WpD68g}@m~gCoDPDS8E&iUQgAJHXX5;AiU0#+%>;j-;
z`jET^#4^n=o>bc0&?u*k^*{L21d4VBLIQ!X?jt&@!`Pt%r&5<Tu)UKvzX%eNQGV0&
zI6|`gR#Hf+_)CxJLv`b2KxVLPBZ`r40W`D?)Vlf#w|FMkN1`|4K|ulNL^aWc{NvVS
zy73y<XqbiSv%&l_D-cgV?y3Vyujza5BkZez?|+zoY^i~X*!Y&%Np{f(q?3szp^4qT
z;l3f*OXuoSHXsVXiQ8U>zvB-i;9D{##`l>F@<~=ID~gal`ah-`J?+nddTNt!`uGF>
z3omiDbv%HKHDFM&xH6#~7>`WebV_9cFum2;xZ35B+<w_I&8Vtxy^@+qS<ZK~)_+%L
zU7R@j_KD*9P203foL%)cJ-+|YVQ?i(0V$b}l%-pLVdZXr3JwFiiPC^ZA#eu97$_xI
ziI7>4o<EWqiK#4lmSNl$<o_DPcui+L$0nv60Zx<DeDY_kRUN?kGiTQQ2uZ0a>jh)H
z^l$&j%0_hf9Ed}eAm@-mMicF`7w`2%S{T+pgnb@>+f*)?odzacoq<7c+MQR^&e;gJ
zxJ|y(WjHVPb=hC(tF1iw@A1b!K#}Rt-o5)t>MN(Hb=z#Y|0Td)XD?0<T-mpH&STV$
zY)Bue@a%kU`tv4FDSdPFH<Xx%M*)OgX`frZL3?yl*_)70!~}51(yFfz=uZZK6$??I
zOXQk2x$&Y7s1hf$Labms${#`d(VWlL^t~6YVRH*Uk5-uLE$`HP+)X4<)+lcl6SiQP
z7$=zg2L}5YcbY35xYdf}<d@5%nF>Xf6)EXEp?V7XZ?6HsH{)LZRt2~bu&*Jz+<xW}
zYl7zLjErpq0417opJpx}7?%E-$VI~;fi2S^Sq0@6ZtYW;&ESq}oDc((HIT!l^KIpA
zdx~#WNz@3!`vRy4hM4L2O#HYJZfyWfbxd_cmV`!OmL;nytf5oBCDsiftU|CDKh((>
zZFW*u$-*|$5MeEQkt{@j`Om!==Vxq=BITC5oX5pyTq7VV>Fzeck)fS48|&eR;pIR(
zT<-y%xVpfoYeMd50Age70AtsL)5V1_2pt0FWTRP~<Bv0ebTu6Ia5?;4x)3nH=iuh4
z61{}~EPT-GI0H&W9gptH3%708h$R<v&v!dU0j#+LSCthaM0i=(_yUM9H$i#UrIukT
zSd&6}BgGaPT)+N$BG}Mmq#oB*w%};I!gJR%pjQHv;mK&P0w2{Y>K6ssL?;#=oy7I6
zJk)eVr7X^}1yX5`!ZQ^(G#Pe8gMk3Yer*iEUeBDoZTGZ}a6wa@yt0{OUvTZ>k4Rdt
zfTn&MC`IZptltr=wLsbw?_<hf%0xY?e!7d_0~eqzF)4^5oNW@SETHiKsLwPgIm~vp
zWygOZEBI)vM2%1e6kE!;plgzHL_Rn2SyK}dERqKi$XkKuR{3~;K%%#x5@$J?E;+mi
z(<leo5l8Goc%32eqY|>EpK<`Lb<GF(gptSJ@`!o{r+Yks6IAdn9`Frqcdfn1`ZeeA
z_i6ppsrz|V!ttcsp9w|2I>-4hfL^_dstuf8VmhaT(2*~gqLXk-Sv-%2{E6w|>uf~+
z)kYo=TGKEr*`_P%D-c3XNk^=*GXC&ZKbHUdp==hgzHC3!<YsBEUC178{;bTrG$c88
z2Equ*HJJrU-n5ZO<$It{;XK)!qe5SLRcvP*^fNee9u!cFB&=CZ6XyFHdHRjnZeS+h
zn4-`pv!O@Yy)5eQVs_pGBh^v<5gj5T39qd}le0AF6|frJYx<!~<ZAHdZeRV_XFKj6
z-7<YPI#~Ckip)mP2-5lc`)K(iX_gYP9y%I}GMa611CMqve?C1=4()y|3ka^yY5nyY
zRy?^iB587H%F3XYtlrRkLuO+Z&Pt-;8k#d<h$PdO3Y3uxiwiOQ`CnaPuNW8$&ZS0`
z(F!c)v-epnVfal%Hi2nnw$9bT5tQ5ug>JNNW_XuT=kZ2w&gr>+7El(kH`COp)YsDz
zhx2G$Tb90JiJsT#cxP0k@onMXPtyha{Ycg+6%HcQbz5r8nd~*3aC<C%f>;EaSLB{3
zoz|9lf{(Rzwl}$T^0o-*UCnIn{2Qz95u&2!V>*EYLilCf>phBc^BQmN;KQ-3PPL5{
zg@wQ)-LSM71f>>A0;Let7v?@i6QV;5N$pfo?RY9H*Ml=gh67rTrH?1sMG}ObQamD=
z=08)vtke4v1eUhnn61m0FNqsx)L;f);l?_i_0{~S`55=qA3Ut0BsT)HmF0rE5fS=l
z;7Q+-kyeb49PgB)%_l_3!D0ZnR-!`xlpYi9mj7zuDGyNGmsw}1deT$%bmIxRhmNK;
z0a5%EIDQv#o*1uy<L#|&z(4yiL+&xq?t|}WZqtwRil@+ZJZuH0-PY@n-7ZGRz5Spt
zN}iwHS{{B;qWoUSTl#&fY8{&;YLSDw(c_Y!a~F;J0HbAHicI$$mhvKh&;M&2@W7ib
zBwEKY3XEir_B?{8DDnEEJbYhqyxd57T0kYMI4-uK<&r*^=rV;vptUI2zCn$LyAJ>U
z63Mxr<fKQdu){oT2vKliCn#szqJC=W^B8+>d$(YRl|?<yf`n~lm0-(3zTz%8*7Qk-
zjf*ew<@`Vzp<q_-Vl*4$dI3J{0a6Xh`rnrw)>-&C<N@NSIH`v+33Mu(Kl0u6pn@L~
z6l%jRjedoja(G<eqH}7zp1Io}g##EDg`?57!4BsQQsv^PP<*t7oiAiR9T3XL(*)e_
zE%g@V%sSwtn{D^dCNd<p=01j+hc9tt9*3<Zq&%2|D`&JeeIb=5JVxw<pHs-@<05yX
zFe%o4GASxoCuo^|nXJC!JDO%O^*y8(K)(&7^S|fq_=N@nGy|iSS@Ls&J@j!SQGN1}
zqGF(G-fof{s>hTt!I^N}VQx@Rb|zEJd=PtAS)}~6Xs&c4X-F6~XSeK+;PP?!Zp*s9
z#9$QznA2FDi^&C#kTJgTx0n!FZ<W4(J_s=g>ezrkVs@PDK7MfdB{@DQrivZ(_5jb%
zvIUOgQWf3uz*&KC#gO>V(3&t4eG)IUlju86A>Ei~2eUyH676HIjScZd+17ra(Yag%
z!}t4Q>v{7_6e|7>sJ{Loq_N9!b{7LP7Vur<@N<80;7q!{765XOBR_4bv*Uv8p4pHd
zN7>L6GjWYB>XLjfp_vvt`}nzKzaJ2VvRomoXL*lq1uk0A#bM8>nZ=&N!lU~Z=HIhh
zXa@@*@Ey;WIGQFm7T&B+o&mvS#Jy6{E(Kj_4T1o2tU&`U?R`9^b0(5$f?_sK#P^0Y
z*Y(7I!HtxE`d}ptead;asA@)nL&YEFHf*sf{ux-MKioR&a8z}&E4hb2z8IkwJCV)%
zg+6CnXD>GZ|H1U&U7En_+qGr_c;9=}Nex)?8EKFcG)rnB{!MRgz*w$cm9$G2G_hTJ
z0vhm${Zhu*E7c<WN~>6rVy5`JfNff|fVH|Cv?Kw4q$x;AJ?kzbuyz)l=rixxJcI<`
zr0_XZBN`74nkifMqBw<F0}u;!ngl7V+>Q8)XX6gx!;A$_U@m{2OQBDSRn0jXHWq>|
zE;apao=3td)PJ(aT~M*d*+xQD%8*E6L&+VqCPH^jUv*E7d?9#`!Yr{>od`h`z1S%H
z((ig*75{T$3D4(WMis@bWX`fnar{`B2fX-XaKS>r(bfh6EoBoW_1`Y}N``O-w9`8^
zYC8|XjNHA%*P0W1jMW1??c`QHYy(vUL~<rYhBxKwN7>Sh;7JuXUGDo&zbg4eJy7>g
z*N?}Pk4(LHFP#57DeZC)jZ@_?5nMd9m>dsh3<MDCao?ufY<o>NcWhF1>g(GkmXe%5
z^_&&~M{09DA?FF`koQC4PoI;uSG4hGETn2;lC8=9I%zQ;8Xhec-l4wKi_4(&m5QW)
zVSi$k_nWD;=t$~U6(Lr;f>&}O63=P+0g1K18~?bYbjnA{6F1o)8N|cm^(w$akn^=&
zSUzM~ZC-F-SSPTngkI%`iZ2EyJ_2O%%j;Z0zYxW5_9=2bSK6Vx_QHfN8DHODnOT7=
zYa3J;^<{49k?|(5!>IOe=Z{{kJ{5A<lfOM$)YDJ~9~_?_uN<&3MC!b~o?wQu-|T!U
zAi;Axs(4O_j!0*DCdvZ2^;>4vy(s(Ip!c3xErXIsyN%vSRlVY7O|?~)#mUvPnklH+
zI?IFdV>}GISq4KZ_o2U}^Epm&a7`}WQNA`aDE(76%nMY;VMB*6fg!|DmX*LVH$3hn
z6AyC(>JZJ)fv3h-Me6c`0Pma6remFslpe*_O~TPs#eE%i*oaIvb;N_94DPcItt3|4
zwVN@4x(}g!k1pf{Bai4TXJ^ETd?sWToj8+wH~+(_upDaaJ4%JW?JB=JYfHQ#F%#}B
zoX`mk(w?vGFNrmclvG4tggj*3B659C%KgRYM)r%~A5@d<!z3fEt5y}}jc%bz7XYO;
zzMIxTW6kR-aWw~gX+JJ1NjW@JwV;$yd-6&p-K9<ygj1WOQ?(LTjx_t-y^(Y(nFDp)
ziyv2u@I#2s-i&=z5<v1*3P}!RNr*(Dr~wEgM?A$C>~UvG_TnxPf}VPI=qKw9(r#oZ
z`UADo0ZPDGnt{x#6&$7ZB;qk#;j;*fSF()>VK*UUkkw#83I}rdzkb4~YWHB)AF^k`
zPIpNH{-YF@^xIuPo0^8$-rz@ut(ETS#pHT8k)#-Mq~9l|zQ03+&k<co03`gSqG4Fg
z-vpg?l;RHrgfhioe-pUz;6Mk`h~rRm<RYp0AeZfj<9ffz^_((ujdA_9*}7WK>eosm
z<(Xu~^WG9R_QI~n*$*~sxU0V{KI^-S$0vHw-E6J4sYe{ZJ7L5yh<!_#_L^sQ>f!Vr
z=k3|21V<aJhKH>J&qq~2kj{5LwiX`E7m;E15fxnvc!u{FC|nCi)YoRz+GPIfN`J^u
z{e(-O4zbU*E4I^1D=aSITVbo~gk#ZT$eMFD+Ju`CrexyXj(ihbYZ@f4AS!e%YP)P+
zF`LV?L8IC)hzi5hMk%uhNaT+}@O=^ck;GI%pP#m*0+iTOqUN#&;cqoXeTNZTydCFK
z>4Zca461oL*ZN-;SU~!gDwjDyYY}1;;N+f}Z@(16zVP9b?x)!(xzEsP>M9f@)fllA
zHocqjy&oUyHf!zpWnjd+JH+XUx-n7>^X@uwZA5hgPSGqjl|~+8KtkBW8a7$)YJQ$l
zJ7$K<yI?=j-W6XE(Kgy|b~jeFA*~Cr6`9D9G#89_8LcH}F2A(#kd1%1e$7{sQ6Fd4
z4U&8sOLD%Z)kM864#Yc29!(59T(>>rn(Xx{6|(=hocVy|S(ltI2n-9Eu#$=k3pnBG
zGfdq{#Ci?N>XwjfiMpCW&^?}e{>C}-<jsQUH_No&2k+JGvSa8F7IIvXI>=v>f|?-<
z=ZBZb`?o%JW2k%WbxDCRMiZU0%yD_#^|~kHRn*LlX$zM}B(I=o-m$@NA!;Lbyf4UH
zH5%Pb!0_v<=A^}P@CAVSW#1F`c&b}mH2yd&g;EaG*9;PdoL}G0Ox#oEg2NpxVNb|a
zL!_W|CD#A<UcBQ(-+eQr8;33Ba!fb*`Pow8H-6%TV1bz|LziK}?uTO2s7Mdm2ey&Y
zvup*$Hif1<vmSpT>iwxXy^BBY9&N}cZ=jE2`1nuyl*7D*Goz9EG|a;Z>)N-w&&Wn?
z?>_UBj{&P7z$;h@>io4)acovyQw`qa5hOrD&2q6enEpohNq<DdvP@OnxM!ptQ0_Xg
z!3t#x`h+!l_4wovF1&<xvKkVR>CZ^N)WRFb!=Wx{$pJSFT6$zM-aYx$akgXIxmyLR
zr2=7wORKVm<OJ1_U+s9>(UbQ_lOe5FyHZ`vH{}aP{Gv1j%#SkzWS>H$POCKGqT}H=
zxrCp***iu!%>!WMHPF2XTv*YI5ed_m<i?lj#UZI(sZ59iPX3T(@KAU|((a>*b`QS<
zxi1DRy={d(q>hvb$D<&KBflf~Q4_Ez*l!LU)LVD)hf()*e#;F6w2PS`;C^Q6?1@3E
zL1fQ)cc)3+JzPO+O+EGvdgq6lS~V$TO2(M2NNJ=nj8>ip578aQPGHZ9O3)~52cokt
z-++VD9$yt6vgYL!2Ec2g>HF>qyWc=v?<sO?H<9nW#qjTpDe?osm3)K*`CkPvUw#U{
z1!cH;3Ug@=W1qH?$aS6^7*|D^MisLkb4_Jq)_O$!N?}WpyC;HqJ{!Qa?1|GeOh-@Y
zoNPwYGK5p>U(<DZ2Yn-=uS*-tTgJl()LD-TWl(bKcghJ;+&pyPxtQq=G)(LMU|d!;
zS0WBsqH{5LcrS8){Tzg0Yh&MxPLT0wh3Yv9O{{fRaT2M-&Tv=D1X!lqKO8<+{~%#p
zxPGn8>61llN;vtzR}QIe4HBaqm!WxtdGC_|Wsxz*^7p$@m(MAY1m#WOq;qmny*oMB
zwF49)UAWYz{!uH(SLI^7`-B(?jNoVt;}4hm6aUuP?&0C@GV#L;1ADEp!9Rj#uFeJP
z96~NWBbM6#MbIldP0J$PN-NTDXDRQR>H&Uls924?v`wEkN?6|6J(!Z*D_RX6?|7j{
z>e|K)*T^r9pG#Dk%+&~`JooOtE}N+szxKw5u{0~$R7(oqYy&$C+CAtrB(0Q|FHpyX
zQI1&46rI*zEoIUka=9@1hO!UQq2oytUT4KaNbO>T-0(c0ND+dZEv@iE$tHdink9Nl
zN+qj7@~%cHPJjpKd9S-Ik7{q`9R_vd@O{nRFKfUn5--PnputyR_gPh25n+p}U#MUb
zzvI{7p|y0_0`7!Q{8}KcL>{gg=pQ@#eL<8`Uu1<8c$%WBtSU)9zw@G<a67lT+b?zB
zU6<d=efbT9SgGT+z^GYHym;5%Xn2@?G~vjGBB=2lrRtKmvh7eaisj~vfq!21SPVKX
z#%lG+pFN<Mb*g4KKd-KQ8!dd3Oq0i6V2eNU2J5V@Z#^7LOiJX;T~A;t5yU~NE_^4S
z*_?6H^K(h>#t_Wsi6beV+zyEd!8D%&mQ9AQ{|XdloD<FV`DqjjWT5<Mza*4pbI-_n
z1Z9cMryGv%<M%F|h+0q_-&L86EZ994q=>Osa%il`G9v2z&TH7CvO;V2ILHh}!%3)I
zr@ZM|!@zh2W|lvD$>8LBfoHbr6ABNe*JN~*<maqV?jvZkAxV&&(NSBxxWK}%E;Q%Y
zVz7M9kF%)!jwoZaLhYabxez6KzAM9VLQB((1?ARQoTK1C#4k9feLag(*=d&`z@^1%
zLv7Ly1N^6G9xM9n?;32sO=4`6&Qj?+J^O}_z%2EgWPEo)a|fzwT}BDj0CI2p7Zr1V
zo)M{L5>sO`M=l2OC@<&+7s8DqHV?vi&@_E;z3l-U%6-YW*ZHGBrCC6k25v+E8P)J-
zhV>hfYzdhm*ba@_iF`^3V;8xWa=T-FJBeA)N_I7kv_Ggidw_T8E2iaJOZAjsLDB{o
z2z)4*MQbpXCm<fl{<14b#MV5wxy3ra1M9NEVtdY<Pv82X#AYHUGLwAQ?uj7IH%RD}
zDnLId-Sud6%5(HytA*V|^ZyzJX;#zX!-lX7&Uj~S+&miXuWapsum^UxbI5{JUO8SZ
z&Q-l#RfhC1n1td6FH-M{Pdi%Jjx1-F--ymJp5sBK&Cm4M$}uS0TzA$Um%MRzRI<6&
z=ktv<3c?gIh_Y9(>;~)9cCzJgbcbnF5Fa`h&#6PW=Y=Wj#TRl_51;1q=uUR&fI9qP
ziJjf91>jS2uDn6d#~PPJ2axtndBg5fJR#gfzW`dH5){MFz$EyjbMy#tdrS)T{V{8o
z;R?`}-E%eH<op(|T7KrupO=K-2ugbdNl<5IVI1}cs>q{!@6u&46)2;}&c(XN-_mYz
zPS|bRW}$`o7@u~JU?N7wBQwHYp54@86;=1Q-i)J9-9TJ{3~1UuZ~xL&=OD>tC{)Bi
zc!f&26@^m%B8N*8{OYYgkwEnzrw>jm90+{i-^+u47z(KJGX>2MIpf|^x4}FqW>ft%
ze0+MCXAkdybos|}*HB=Z9PANf<(>chR-8cDxmS)fA~lovUwMQoWy;8@2@AdmESVoK
z%6p~2qobEpAI4rpXz1($+g<}X7A7Q<QM`>&9Sr4*mjFD)B{pyY-P(SFnQssRh)qe&
z=_9)fsv`A$P{F*f{^5!##lK-8nYyz=LF6t%1Gjb_B1OZ%|L@UTSHXw$+;`+}>x$*|
zx0KjO41&bZkO|)j-||Rr9g>-}=&-^C*BsM#|5bnKxJS<uZ?S*;gXRg-d-jOA&j6>|
z+|`a97>Q`>##6x1WRSt31o>kMawO*^5-A{yWtxO!?|uGD_BjTnq<sK*=*V{97c#dd
zLw*{RFM-Y3d-(9Oq!%iC1t8kG5PYP3*+*m2It4)r)s$HGSY;7{H{@_ZS%j(+3Cu%u
z8iKT2-dPIlb~Ab}!jPth2c6W|l`*RZKGYC}>UajBH%c8H%5CPK!`C|Rz3V!sWQ~e5
zd@zTm98~QpQ3!%waUB=}7>Da`1MLrLsI<+;vv(|%E;hT)^|q?1+_N1G@dk+D$wU=2
z&DEm$4Vsh^WlXA`Qc$k)IULgX8x9>BiwVf5vwqc#NX(?7-&?>OMIvN-ak*n5z>ACG
z++|wU{!WT@oxF&+IE-hnt$?z%Ja|+FX!)^_iCEU6Uxh11AtbZ}B~V?frnW8TGlAeo
zbo8Q&758(sj=Vy3lyztuY5BehH=3<b!oonrpr&XI6MjBsgBJB<l`tCdM8xtT1;0)(
z8^;5p>L}Yg)+!H}-wwo`>8qXyLb*KSqQSTXEldx2r(D<rkAWn}auL0K-M`q_3=($^
zm^?UDp694OQyG%gQlhRmwNZ3ZFyS_#PWSBSW^{lrtO<2AiNZ<9z-7pavVa`<t()@k
zYn4kb2#aQR4bN&K<+(V%_mvRF8MnX{$JA1-G7OoW<bRnMcc0odPBf9A><AXtI|dn#
z$c^IrDXA;90!(5k)nzprU&CH5UHN}Vy={%J6rW;1&^zAw^_~3Z$!xq{mGGCcVPW1~
zyx)KJzh}az4IB{9tH2*_dkT7lvWPuryby}gA@#k@8A-%dcS3nxxuEdFKjCsv86Hx;
z8FXk<ybW|X(hno?*@^6FJ;KX=&zPYe{ndXgQ&@J@@}gL-;zB(zyg);|{>4O(W1H>G
zSLJ0wfdvi!5($wp3z-W6>lVX5|Ex628C{Fg7eXC&p(hZ8qWwY}&oP)uohCj*CG%|D
zw;9wVl<hx&Jgz6}WUiRD*2^Ad{tgL~Yg@j;pAB0sdNM-_4v(gMQ4fMzRF5<wPMF0l
zoUer<?HvQIZZU03AydLTRZCdvHOoCPnYZxinyAjGn<*k!ZXio0-;KBX$*g}|kQHFT
zRknR{C;fKM#4-!AUUN9$F{l|iwKM>Ogrx>MSChHOg2q7Cn!BB-^@b^Gcu6a73F~=*
zuW+XRm)WP=V*uvg#w|1yyMNlEp}NcGyCYpr69YsSLhFs|+e!h4HF)r8SC_bplSIvp
z7<U1a^E)Qv!3QW<#Af(To>@Wy9~&J8Z!5ilknKa~LLzJ-^<C1)uD${t*N4Fdl#5}A
z*4O{B_vZgpuiYECc?c0@$V`Sxh|Kd46_Ip`P=<|U8#2pGG9;N&J7X%TBxF|R%wuGp
z$&h&n8Nch+InVQ)=Q-ck_Ye4femI@VZtwkmzwdk9YhCMF*9Dxh9t$F^7%L|C^C>*o
zO{eVWm9Z_7?Y1`{*1mD{Gw&Z|XC~*OgCfZS6hCNMOuf(|N!u7_g4sg{X3v+W4Dxb@
zYOju~oWKR_FbD>Onb9N!m09d5{NxnX{prKC_m!&l`0YiXF%44FigS|7sQtCK(Y_-N
zB~4w%PYzXruMd@L4xN4LEj=aNC`%N6%z^(E0pX+LNAO-uLBinz%=WCkv2t=P^<;)r
zjKu-cT0DZEX)nSL>^j;)gGBtg9Fu0yxgg=@x0n}q3U9;;6Rl+?xrU!kNzm$7t>*G;
z8Js%SK*!oL9sj+bkl_9_9#v)S35D$7l~;~u^o=l`!#6aO<mL3D<s>COkl`!M6Ukai
zC&*5+_-N}!+SG(VudDw)w%GfwOMGtaQzvfU$Wuh=2U#SAAITonuBpR&gK5V%^)>4d
zVYL#m|HS>ki%)Wk;{n~pfuMNqN-}8@t;v*Q3A<n1MHt^f-^UhEzr1kDp8j{+zOwVs
zFc;VoS*K0l&}kLudL-%vsvc_!&0h0oB_keewoZE1NUcX|KB-IfeW}GVhcV%*yd*N}
zOzFS*^ujkw$B7*d4~rtK8V^$jPD^|KbW0G2qtmx5_`CfQgMTEJgMAfa`Vn|afJ7J%
zOCZJT9s(lbQfL=hIbU|V2AoO~4#wVq8#AI>ZAzQavOY$6M(s5Z_Yp`Dx^ZNy=AP-4
z;sl;qby&(-Qjt{JOHXUp4SG3}Be9ufpS_VnMwx()act0}TBrK<Fpih`P|6vlzKF&r
zBO@};Z$4Do_7$q3-k|4tGBRM^3keXGm%{t{ng-F#((%#PuO5k0_SGgfDiRLmH{k86
ziq2vv{I@=Tcw#1+7F4=Kvv~F<zciU}yHMTx(Vc8fpB7_s<K!dc42-g6lo=bAby41f
z?vps}m>JW%+fKq|<(9!~ACG*=mpVo|vVH5?({IO*Yz!cUoA!W+fsKpghFYur=Tg3u
zQ6_49xbb<G1@%efDQ~C_a;W<fsWcKqk@fn_-XQso7cdYJ*}cL>D=*An%g1QCMr|Q`
zo`}$YiX9VM`jfnbi1ysq4|QT9!AE~JelF*uN%T`9i<CP&!WSBkCK%O1qrQa)PV1g7
zA)#i&Y8i&frtW$`Bivsuo_Ka`u1{h^$cLtECXhtyQnr|g9MgR!rqg6j<-c}H_jX!R
z`3Th-ksznL$O#WJU%0-6If?e2OYD9UMD*OMOpyU2UsgYaDc2ZR`aLvmpeDL;Xk&y}
z`k*6$<tUYc2rJ#jIA{B5?wP_G#?W}~`||CIvQRNj$f_MLdmjFggEHLJKf@DGx_!@O
zzQ1PxbZXb)rUTNF${fSXcTR+caUtJ7rWVEp#Txuj3f-8c@XUw4f~lu4<%bk6QFVot
zYo?y?xq;aXrB((WWf|iyoS>{OQx~Kf4omI+ciknxi7487iW_sGTK~Z;CYEHJ;-CqJ
zrrmp#g_^mKacEGdL42G>R9KjdtmlE*S}b@kz82loED~sQYHe=|AN1W`&fY+be@B&}
zGS09Y_u4sRY0~+V2_KrZFD*Dru#g}L=V?mGcycziN6X>v((ejOZ-h^hl3;Zdq{*eJ
zb<<&UwM(-w`d0H}2_o)vyFz2xzn%O5A2XSVG@F0IH2-AD<spy=GE2bI%)MZLrUhqN
zA>$h!bTD)<dI)!X>Q-5~wy#*LyE4rO_UA^u!#k=i-;Ib@GeC~J$-lkO=hNO)ufUZ4
z)FVnRj$%r}jj!ev0QtiP<6`YL@4mAU<EKhB^=#@5FqE|)XoZ3!SKG|XsSJ~Z!+jCy
zuY7GEcq!i3v4}RgNf4kH)Kq&q>(SSy{z|7=@3Pkl60>Lh!xytmXH1^3z)a~pcqQlP
zlQs}+^cCiBl=y80d!5H)@N4e3v(pe>IVjG#9u#hpXri-`5?Jd@c6XflxlpJ#Uusb`
z>GuGor6X-EYBKj95hfkLz4LPM;B;Ub$MZ@eB962_G2qW0Ri#lkp2=?5BB7|i9l9~~
z6u;KeiBCo(;(5IB*ka5^&wa(4v_u=Y5GnB?k-8&nFn+m$Yh!OJ98sx;mW~sN{V$FQ
zVa!ttVFr0g#UxISXJy7t2Rw5(%$M3nKk`P#Xh%E_0~&&UX;x5JOAh;L?pO9u>e#YV
ziF7v9cXf;8?V1BTw0w`Y+}p+Up3cU!zxIY^j{(=AACtI<o~SLqJ&DqtX}GbS?2Vp}
zKH-gK1S@f|g%k+*dy=nx5q~WdA}_hCe(jZZBoEsUm8*Dn1+#9{N{+@OH`iq%cD!uD
zU+39}Ht%<z9(Q9L_uiJ~RHY9&@f0}5w<<3>S(Q9VD?h>{j@3JMyOCJz`*%2E!yi99
z`mwy%nMuOd5CdZ|&ARLK2G~PA(C)^1ffj=446u%mx<iiXFGojrq%0C-wkO_vP!2rc
zQleufNh>zHj2)AN?wfX|>#=1tWUikl1~Aq#j98NzbRxB;$TUudcQe2Rpw1iTdCRW~
zqi%;!){M5i0g_!L#A?YF@%`DkZW$q+N{0mGNRq!<F#|Q{qjR6{{xsdwes<<~8mA0s
zj@5!ImQ~F`_9uZJEMki`A*HsZst>no!Pzrra?k_t`bhgEO@_hGZYlTgVm&%Gs5>W;
zfUk7=Y75NpF{B$kK_kTV_CAP3YHYJR4a2XqZpe``^C}r9EuF0>cx$H{+uYp+9f03c
zY`t^ftsn_H6ZQF^&rr|pBM)O|#tqje8gX=QbYF)*?g4kSi?-uIaJ>q=k9KIq-g1L0
zgVjsufJefWj`vh&!%UFc)pWf>9hoG(+nIvpm$OXIMt?TxIiH|oHsH<OM=d>-oP7Ti
z5*~AaqPS{pg<_IE<B@d47sO=Wld?$Jin(dg9B(!G<5Bc<g`DD~J4m?)JX@~tLdwaH
zzh4KoMG1@(7VILb;-l@?veKkKgIXS%A?11zV09QTIO~H3Qk{*HY$-d%0;e=>i%h!p
zoqq6xA@cYjl|;(sR+gs|ZhfvA%u~3Gikw2eo!$BHdF^_pm`8FS5{Y-AoTr+6avUi4
zp;(}$<k`VU9`{GfmV<feCcw>!gh98yLfur5AB+TXC?KC_V|zr}Su55b1-iD)Brn}P
zy1u?I&IMV;Cp3^|q1%3gqc1vF0ap8g8l)TZvE{_IjQCE5A4=D@0fNvZHNUyK@=D_g
zi9uK3G7_ep?vGJ--2;g?|M%94L*7tqVrA}{gN%SpspiNAC^lV4i{{d8JzrS8C_eiZ
zL{sF_OsKk(LCMh}(V?4p>SMRdp!|sBRPCTp&7J#{Otc+QPoTkn>iNz1u`Q3Oy@l>9
zvqm2cn1;vo7=xl#<XryHV0b{245*PAYuwI!2h)Xg#W&Wz?~Eh{K5wiFp_^m7v*0r1
z<!bOGcwZq67Du<7u?c(PV;|e4Jfc2ZP)bTB(TRQj@TrLTg~rz^eNk^8y?QC?v%7r`
zhI34Z2!<GUxIFoCK8)=0BPDm+neI*HaoSpSOoETyO7WT79sJoKIG3C!CSL>Ds#IQr
z9hZRR7{fS>^I_@SK}Ij&XeY7J8yFwDnz%6cJc#W;Ub;DWh@eTz*7{*rPk<WzPt7a?
zKU?jYgk9pKEbS@Jnbkwp4c%_7HH+<zwoA_TJ5%g15&1j;WV~~2c96pHy8NLjYjDrG
z{yJk(IZk8mbcv$Six$bTu$Pk;hIRpxc>J1OYCzc|{02WtvRW-2fsA1g7aGPW<$%fL
z@kzEb^Kh5h07p6Pw{~V`C~MUA2p>4dLhn^z;t{`zs*$Z@W-vZIQ>%%|&llY(0u|fN
z&2ygxH4R%~cQSN<C7fO9z}hQHFQ1V5u%lupu4+R9^R<4&En=ml^x5~Eb}foL=ra;f
z1=7ttOjFF#k;ZhJ#qe`m)n(L>HK#37TsT6hmKoI((HNxTXEjs1TQ+5+wyiqkWl&Sw
zj%dEIQd~?J4U4<%*>+fXP<i2RRv5ji(k^G;QG_LJlOy|Ln&K{1n6c?$!F5u`IaROS
zcsT|mr^ts_MvuNwd-Z;0vWhG%4KL4G$Ini8O7!R&B<*?5OA)8cAUk(gTZuXnu<2`U
z5p%dl!!xfw#rIH?=Ed^EN5U``hjW8G8iO&h_AX!2qAa*WnU=PI@UEA4-bW!j#OD#@
zXfcLQseG-XY6-riQz@p70>7bMjWI~nSD2y-@)t{e-!XGM-LWYBfJP=Zi-U@5Trw|6
zvdmKzT{%vwOQ$7Sh3jv-<4;bQFQI52y_0+UTekC;hg}1b4B6+Rr!jEjV*}p_!;|-G
z>@AzJ81BW96AnDIB&>B!HBzn7c+B%`Wfo$K`3P@7NLO7eduycI;Ja%d#92c$PhpNI
zt)C#9Ix)o-c9itT<c_hbyVbonxwRxJYf>V^zw83mhh~y*Xq$m9QIi0nG?O)?35U81
zb2uaF1Y}{m6EWduoqZ}6h||l|!ISb&qEA?b{h#GL^%8R*Lx0rsg$V=#EKa*l<PXlL
zP1I8N<R91s*&X)U13pB~^qo54rw6gBBGl2JX*?<ejDj8py!UUa4D$j&%^DZw(Vb<u
z4uljl7lQSmnMwU$lM^=NSjp|RRXQi=Vs(=Hu`X=MZV!DuU_-oP!IqKWeQ2SbY+XHa
z?s20FVi`Isk8{=D&K7RZ8`G{|_zLIU(@&2`^|k3uw*zY_J&QIh^dAWwD%4o3h56*Z
z?a;bpPjDVFo79J-8x96Z(jP14o<4WD(1dQ>AB?4px=S@l3J!<7{6sb$wP{?=f(hCl
zN}9%1^;GjstbQwB?YtJq+#E_N-4OSeE@TMdm^mhTGnsv4hALpU{k?&NwZW9k1e1Le
zCUD|<!L<-YZ_#MZk9^cjB2~>nE}`O7g)J3QVz*k$5{X5BjwoD9)d0MMWpHhE&PK`P
z=8whF=<@X0D&e+kRg`MJa#}3(A4A<d;%yrH>t}z?MpJGw<9-E~vSH6U8Siq*Om%%B
zEt}Qs?u_`svg5o_x`es=zD`k_Bab}7x{>1~bQS8)G86t}2}!TaA=FHGe1V3B#ZUAo
zH#uR%Ui%U<gSgVA7;&ol+6fvg(Wh``iRRQ$%iE6khG10KQi-4Fi-kkKFdQ3sZ@wZG
z{B~dbY9=jx%1<cLb_R0l{eY+~rY_#q*l}*qDv_-I4yart@sn^m^N9=|`q599T5kE)
zWnN}@o69(;>`wf~h~fyw{vs08-ua?`6%?5JlHPF8)GvYpY8>H1%Lgi)vzP{PVDmb`
z3M)*Y4vnBz<63;Dl_0&gjf+k6NYp&NB<xJPpr{l>#}Rx&J~PhuB*BNYkI;#7(IWPf
z1`JQeqqE;J<M^R|3W84sSL-p$nsleVHl2!-e7}CnG*LmU<B&xg5}U)#Bbt4by)!UZ
zR5eaMM}M&Oib%k6?S<aE_1q`N8q8R9`B)Qc)y6L=k><3{i#+7(3X-i^df-{!t+qCj
ze(`%U$v9p+p2!?~*ZJbG7dS1u3<h-}=NAl|C(|C?jV_l{n>bV!hE?}5X7BZ68LgG6
z=XlU&m6l{PQhuHoU!8FM8|h^}f6EGAF8WnAmc=@j9=7Jk$M4^{m8rl=1XC8ynPR7j
zYDe+ZyPknqp`7FV$t{;39d+~8-WaKcBP~Ie57`uVKFQQN4W1r+zA@S8?vW6^l8Sw6
ze0x|*^c($T_31m<WFK>iAF9;J+|g$C@^9jmOg3(~mGo<rFl697Xn51#r7-LAKF&DM
zQS;e6bPgG*eE#meB%dO&oGz*Dbd&SmIg&Lhe5P74ET^>9gRj-lAkRLq7M`EqI!4}D
zcg7E2>E2ZPRNYi4(aOtg;>?GV^xhX|Nmu7HwWIIe+G|U~-{Qgv39wGRM9DzHO+CIZ
z_c=E1-)%cD^$25cxA>0s@J~n%dfn;91Lo97dBlY`CA}|%m*)-}Sez$uj;IQFGu89R
zY*+#*k=x+$cCnOv*my^dH`@P^YJCb=u%Zb`jx}23)EyUz7bv#wdN9dwdWOf#tg{#d
z4%OP%zYK6RVaFPH=1t*uv-dM#Z)3@K>CX~S=!lH$JOhsy;!%?^Q%6x@&QdQK9^&43
zpau81`VWQ5AMd@0b(wYF#$SEdTFNt2!hf8D**$+{tcxOma%Jl>gHqP9^U8cZpg@G>
zptT_`5#2n$<jQr^N=PL4bfl|5*%ED?`OW)|Bi*=KTau+@m0`Q_{-v`i>h`uKtjC$d
zSfsv^kRBS=^gUgwJ8dIN*L!XAiIrt5ZgJ*$zT1%TM#-gXZ#OGiZwP^fAN{IIuh6Xb
zszBm-r6FRd->jdrzNUV%dxj*Z)!Xv+Ow9^pkk1CE&5w9RP4{|+H*qk}s;#Nha}Q;H
zY5T(q&z_e<=zQ9}Qx6-*??#+oE!>npNqaqoZ)>d8j#Wro<aj`a?|ZhA&h73o%6^_Z
zw3||dE{s(M-6hvKRULrO1qT}{8vo;$;CNnrdq@2sV?m48%yM^gs4%8ijV<y~ajCjy
zT=o^90LzbUbh2I`Y^JviGm~wRJ6G`j;|>1xeko<bW-Lrnb=C2dA}5g)fw(o1FyUF?
z>CNV&Ps}FOe_QjA*|HROF|hHga&XGo@}_@!A1R{t9d_UkWI#*Gwl;z@_V_Z`R@+0O
z_<jc|yBQ(fZIG9p2fE!jI;iyD$B9|fcW}UU1!ILl0Y2`ODQE=q+Vz3QTps*8<9DFc
ze+kBn{`ccl!?WC$OeOA&s!BLbU2?5Dq+S5VYXuWcaeYIeoKXyEN+*!;ZzAamCm0@Z
z0;PJYwZrg6s(BkwQVoDQ=Bz6?@?eJ}X;SuQng07jFd^rTjqdKO-=vT<%){ag3LVUm
zGNRtq4>xRlel<hh#=d2A{S8d@B9ANoz0OQvTEIl&Ue8Vbn<bx!WriT(h%GOKf+p_<
zy4yW|*d~lkB1Dm$p(1DNd{9E}1CDIlWx=<r>i$TX?Qc(*OeckNBXZcZNU7oRNrv=O
zk{!BlF7r@uy_|<ap$OSe4uH0C$UD&Wy5v9wsb9Vfl#>IX1#IOPa_xrus~NZvnSYS!
zT-w-$Ve#)E1#|q`b7kUuNP!DL+(4xJ`lhjQ6{vgufO&y==wTa3fHEGEU^US0)BSKm
zuIud|Ck<d&f_@feui+VqfOdz3X%*QzoD#*zLLQO&=0WnAGVcIqC@rxBk|F)uWn7>l
z!h<2bEc(NG-NP0|mrufDXVQVXjiaHuACBmCsHA&0<-Ilw&|EhE=lf8$6oLFno7_?r
zUB-pSC*}e4xdY67YWRfx_r7qTn^0gdqqchZJg2G!mS+1mUilxN8cYi#<B<0`N`MU<
z61Z1B)o~hJ)fze}G2uLpC-56Vy)@5w(v8fm+c+S1Aamr;TOS-1&^7n#U6}=ED1-jj
z|9Hp!2NQf5DehwHr=a>S1ld5|k;^aC9wz5F!l3sBz5B0#D}PlR(#3QEd@5uwXl?_N
zhHuR+fTQ;No2$AUXW+Ce`uh!nYl<Q8bou_ryQ{?3oyzvhV42vDy3a_>9~7|N5l3kq
z%D&>qC$II!v@c~+`!y0N=}v-~_W<&J4PaLK3WX~9g$zF%LJ~@QG%7kgiQp$zxbGmS
z{nrzDse+4xF^s=2vR5Sj;ntn$(|Mrv?i>p<F@?x$E?dZ>cGd9nUFW`7EIUD*pYarQ
zybEC47Qi}sPuKmgaI`;P@vl$#>pF2M!qI)ZuoLE?8<!V|ZRr_>UEvJgM0bQfE&6**
zJrC-K^JX5T_T<(fY?AQY<7ZvWK(>uLur+_(pcl}K5I$M_`^%;{=?LB~VCZ*%p|HPy
zR4^@3c^%-Dk7U3N>=d0N=uP&+fqevfkxB{2tsd@#oZ-;aJ<`xLgc=CSUy$U*F$1oR
zLgu^6uR@EVcI=13jTvjiP_F<A8uL(3IH9JxnOm*$XZUFmC@&QuKQ%N}0-8q`cqz#k
zWn9t`nYmw$+2(M16PkJil@a%98=!rcKg-6)AAlCbot4QJS6J51`#>62;N7R+m-Fg~
zx$VD}#9z-Qn3AK+9+{28-N+MY2&{XndGIaj6@sRGQvygh%|m*ZTV_G<3`s0e7{jy4
zeOw5lMguTAGtR4>$TE9MwJy-t+usS?hZ7b87dYdX+BFVfLQ5yWDFa-6ra{yfuVGPe
z{}WZM)czraN8+P_Y;4O?DMbb749tehZ{CssGj57owjF7aU`i}u8xIM<`s@PuI}Rh`
zISL2fr<<Vk?+Rzdf!j1Gn2N3WH-?4TpU1%U(H`s~wTqEB=O1a8IJ=9nS*BkOY&CEM
zXEP2Xxo+U9&;#A_e;%soIAol65VH}D0tu+BKyCg56vP*hs!l!#L=^!}SO~ggHOL_e
zxnF^GN?z<VF02jKg7&2cG(5~CWM?3+M^f{)Aa%SZ_tF3v8|8nYHy{#=Vcpm*yjeD6
z?_2Qa6FFq{>A$}PnT{sSOG&TIRlNuYC{hLh{+i6|chJ~UNQ9}NBA5m4^=GQ<zF-eS
zUxEBoG-(=Z6R>l8hnzHCU3hG&RANqEvbX4bvOs@-&BnOAT>3M9{q@M<AUd7p`O9G)
zlwb>?ciHDJ243oVNHxlMriiAh048JQP4SVHKAY`Pc@Lmu|Q8UHeGcy%#yi~%vY
zMB=^ITqUwh9b@OO^3C{c%}Jmq=GuNyqVN#6S^-!$wR*upW%VeIEPM%8b^!?b_mfC0
zx{g+b%mXe`C+g-mgdDQBfG&dKiRldV7O7>}>m3uZmPmf*>lRW4kbnsiW{x{>m=?Ut
zD5@WD?lM9WZnpc95aafS^>^$f1#R>g^BlK98t5A`y>yZNy;~22`u}g-NqLGSy*)tD
zWo{kz&^S11XrrT3KiNDbu<ZO=&)u2#Htf56ZkK|yo4>x&7{FO3PJ?UG9L$a=P#n}E
zE(d{7>bzxE85bwyApycd9qur|uZKhPWdsrW>T9d}T8nPOezssPFb}?L_Hc~2B8g2I
zn8*}h_TWXrS@R(L;EX2zt)ZPe1GZW+aPZ6tP3AxZEkvpYpMkTnw&U0g!y_SmAli#%
z6;|{g{$b?O^Q9gZ<9y!Y9)wJ6-`Foeiu!%=3DXT>%6#@HPytLOz~ZvF8K(FP0g;h2
zj}Toq0e~X|#zkF9fvjw9&>|03I%zTxc8p-gbT)oN!(|iW*ZF%jzEt^#O$zHWUUTgV
zhyBu1v+z5plWJVAN`e1?=+b7{#q1YRNB#hg;!s6JAjJUqeF;PhmzTXsmNnO}bzn(y
zXC$lsX^tFRanGn_W`!w;)`n~tf1q)eewfCY0VpR9W;}2B>^QHZ?h+Nde7_e+xQXB5
z+*f5dxeO=s2q@Q%C3>ytqg0|;O+;)9ruw<@zo4G$vVbA=WMdg=hA5>{8)!4SQp+y-
znupy-ez1R}>$QngMw__*=y)>^5Y$KGJK2?d{&(x>o3gwnCg9-@p{YIqZd?2lV1;`W
z+hLwe#{ZT3{=clE4G5T~N{@*|cL6br{VDcMnPVI*Ua;)O3Y-@RiMpc7KP6|Dz6LS6
z@(<&f%Y#oipCVT_w01K<Gb|PaHCvz0!z^OXYy(D#cY_f*)2+k0_&}#OYa-JV^%~|J
z_v}74iO;8hY<6goT?qqiuy_yHQv;wbHii5%CeN;!_mYQesDXa3d=Ch1G_LUo7s3%T
z565<X@@@JbsU@JoS<_4o3cJ?0BrBC<IPK?Q0yE#5>!cWd9bbY|R3C_d+sH6It-E}Y
z#*wT3iIANS`E}lQQKr{*sx5n9wr~g8UqEnp_ISno_c6{-_C4i7>iv51zn_W_SBYSL
zF$sBZ?7O#=y8?U49^?Y9W{QasG1Dr#K@cy3{z3Oc#?uwq3HLcU9Ljw0ZC9t-=x32u
zR3T^$i+BGJcv^@8s|n;ZZ_yq?@^j|{xGGz7HH^nNgIGrQQ}p*VJfs9G<Y{tf)?*J2
zLj7c6{K7hA2E7&+k*9WWzLsCN#NUH{gaewZ>jR^eQ^HRgYwI}1++hUhRP^bgLD;i)
zOb;tB-S-^;tIlt`lLbU#$T?vS(0O-)l)9M4O{Ax~%U8JqfoJllIQG__hxhi9x@$F)
zWz~;k!nnKu#W6P|w~I?&D4G#;tsv*q<26s7d;UIoE@ci4WA#JMYS$N~#Ow$y00RRe
zqVtaZ8!G{TSLnOk&K5-SO!OU1OO^Jv@s&VvKb)>lM^*wsK%ZH?xZ06}TdXG)V7z%G
zN5_|JxF6MnH6!VPoBUsA#}^{M5P98Ge$hn4v>WGIor(g>l>M`hbPHUdKzpPduZGn%
zeg+yS;QKa+yc&@KZTXEag!<8S!Q1sGKNLXM_e1nFPT&hn;5vhlW5A9!jc6AgwNevC
z;yze26@y@yfQhjvjb3AJ2}l&px2jN6b!LzsxS4zVkHwo7J$=YY61BEUrP$`wQ_3u+
z0Fjg<?LFrI6r!`U1Y~?5k?^DI!-DOnB{g(nH0<{0Sm{z+eeK2dPORoK@|1&1<mdl-
z?0-_ml&2hVqDqm9^wY@S5$YG)a*lg|8;Y9y3gTYQbiTJPB|pHs;`kK8`2b9A9?#na
z<=(uqAtxG+*??3Ef}RW{rXb-uZwLzKUB$E64|cTF00T4x7Vg}7%yHd*IQ(r&>2#pr
zqS&@DCh2+h`%Bb{|6{)3-<SrgEN<rpSi76wI+Bu}{q3qj;mHr5zCMHsAJ#b6hyxm-
z0Cn4!RL!RjRP;pADW!ggx~A8T<YYRG(0hB-PRKe=Xl{K5rbBV;DTC|GmpZ_CP{_7A
zjA^YH#`7~kpujfzqIlL`bQUNJR1>@<4_yPFK!Q@HwBOrLRp<Gz#eeU_d;Gj)XJkQ&
zb5_DH0^F;zk-P3rQaI8;2O-B|DB2|SxK-<3L4eADb7CIcP#loTFxb!ASA2)~;fmDq
z`k<-kFXu?=@2MY^1ulN;aGdlkfMH4j2*Z8#W)Q=K?LtC5yAItSwg&p70|dG5Y>Ld4
zg?s^xtpdN-=iwv&c=J-gpVSt3icZk8$lfDYl!eLS0chvU?WxkJZa~(lf4?tL&ZB6*
zopg`ChbHr8RKQR2R*Uo1P-2-e_4;YnK%+2gNAPw<&3nlG-d%YU1tVC5Li{toptaXk
zr}{hDQ@!(#_eTvL!vypnM?g*QB!%HFG~^6{IBy73Nc%N{{LZTGIvlVCApN*6s{9iM
zN9G`5p9eu!M_4hA;HyA(n^t*TTE6nmTaGD1fS&4`e^)4-eE)dO_wXtJCn$cMc(-26
zrnjRrlIJJ9p(E1ASDZjq4(M7GK@9Aa17!)@-R)m_?0!wm*ks!qoTHo+P8mwo7!fW)
zrmkPj4+uqsx5gYAHM7m4r`<uZuiVF4<f2_pn_9WgpSN8o`|kg2A@fl1C+fRNK)u5J
zX)@peIm_zLDmuYv0UDea@cZr1V=O`%S^!RSTy+8IQ$%iagxWc0@6BsK$51q;pZWxj
z0^N5x>qUsRwlpg-jJ%Q(T|mOWkI;zOby#hqP)8Y;QV`A&YMhX?1&DqQS(MBpQd+4l
zz$c^KzuG1`-u}^mD2uS+v*iB)Ye{KT9KHj!Q$P4U4ZvcYn1`gtSmQ3){gT=228bH%
z{V<q-`B|k>-2rK_^wm_*11OJm<`i~>uDDBO5VdQP=W+--HH(2IKM=vGA~1}*OJ;$h
zLO+D{sf^OyyZI1lzYs_V@;5B9E`G+>j}s+l(Gur)p4JVPIQ`JFGb^2JPM87Jfhcid
zsYCJk3a)E6A%on}s=jJqV_rkzUxHw9+zZ_$I82HWgu1^!P;c!2<LVTTF<oR9yFCuF
zcYN0%b%SfGO*brdvFXbP*{Q6?G!uRmV@`9V{BR9gkH#7fl6=|4sBt_WqpNiXlIX(X
z<@%EY#0-YR(4Cuf=`m-x21P(}4h_LZCs_rtNCGmzSd%$~ae<wb2dVsmzt|T-n{r^T
z+$Q8621qPViF*1em;%R1Ia(|ZJ@Y#vZzjVuP*<&~=qgem@!lXmd>{#|r_m<pS-=Pv
zn1YVQS~2928KD2LX7Kwo`sw!%i8gR;QaC7N{Pq-i$B;zHLm=YruG4gELkQWos6%Sx
zu{xg%ruz#&nj4Z5WP%ys2xNlHTMBI1Cn1LK%m;IaXDZ&J){m=Oz5yNhtv#^c$`xo`
zvi~elW*qW)t+&BDy6_iRF*@&Kee5l;3i}bK-LD-I9cMI<C$RD-h&My{4=53ILRGWc
z)R+rl<5g$VwInGFA@}YCcqH@C+Wq()S-as4A&Wk6s=2N<Hkt|^pYu?8<_}{yZvBGU
z$vY@&g4XAxz&jBip~7+6t`aW~R}kgU7Z$;9GC_G7)0m%EK{G%zb!%P-f`D8d$r(%|
zAn#=5l4M3p*)}vHdw2E=YiNF(`ZW{XbNuwNS-JrL2JNdE$e$3AZ2rWH(uMxYPXCq!
z1k<YTZ2lYorXDDEKVT3voI<p5S6Bmm%9#t0=q`YosP0xNC<<TAD*%-$vwpBkGJ*_g
zb`RD3Mo^DsKwmloj2_q4At7)=5^4rOLqLE<pWE2O_vx=8HOPRCM&CgNTe^hU=Hmi@
zjgv4-enSF!ETA7F)pro{aAFtL!MjPa?%6U>`3wLQH}dR^l_}G+g~Ca;b%@V>YcIm3
z>y6w-0yChjUMu~b&CF2z^Hb7G1M9RtO!P%V5Dqqk#Lz#NI6!d-@H;(ULBHmuD;b78
z1fF%*WdS72hoq}F3vwnl3fhAz#`X}#Y|dZhrNkw_u|uFNGOnp#CgMQjjIqZHLC#?Y
z6UnP9s-ISvh;*|_z6*C;%$r1|_8hofy8AzU^T2ot1cFTy?vi^Wb8AD;7@K23EQ&n5
zpR=H6Y74170t~Z?=#-?w%iZnmkcSEO(0(Z9+KPD~?5VTASN{G>O0Yhp4hG<1OWZ(v
zSTh+bc`2WRW-Sw)w17_*K{P3VebALny#R+!2CQj%NlhG&Mr`*IIUcWXArulyRMx>l
zD%F!$ls*xW?E&uWA{(xh?C6;gGHh6vE$gv{T?a@-k4C(_=OMF1-ins10uXB?kQnkh
zYW}$c_|t9!X$<|DgjvrzvZl|!;P9U-Fyt<8hFhJzrONtd_&OYnw<jA;7hY}tbIYeF
z{zHlQuOuWmo@2rD*za@b?^pci-(@BKL%{#{>$&*;@5lde-~R8m{CCOodw>1kYWerp
z`S<VswOZ;ALwDxU7Gh!T{q4N?*Agqd_xk|XNex!zLh|wssA>jO@G11kVhsR~hi(p3
zWqrtU5+TB9)Qhb1U;qBE4^>@C`CW>{90$uZGgl~hQKixK6C69|AcDbhwB`s-1dh<H
z^8-0xolBR|+j_(Z-5hL!v)37>xt)RXAqTo}^N=SvH#`xdzVPSAs4gj`5Nx|aUU9g!
zTDa8%Fyr#0f0jTQmjvHt{?*AczYk}0;eIa%AjR^dlgPm;A5y?#5IpH)wJ*cB?J{z8
z1`s#%Cwy~NeLp6u8vu%R6}#H4!v*%0C8I3;Aggq@Z!$m+g`j3b`f5Ly4rM2ZKv}GG
z2-b!3f<!kTq$!_~;+r8{RTFOys7CE0^D)r0sz7c}u7F|{Uli}DVnui$n7oMG42DIl
z6U*Ug4|taN%xNz?I7SdHs%rDab_9R99lE4o5kgiDn9g+(wP>_&Prdljnb8KBF~`Aq
zigJy9n7$f-k=bdGLAA^WnDiPLid};g>EucH*D+T?%G6Sc5I{Pl;`7#^$mtD&Z4rjv
zk5VM?a~ng<xO_|<ZS(`E39ns>L|ZHLh<{vG7Y-Mq&xeSRw>#2C#QW_lk#Bj9uh*ze
zI6@5wXokQTPy(t}gZv(gxI!eM40nfX56mRL^hRk2eeOW+$rBWu1rN%PAp3-5OSq<#
zoPfcHvmP*++Yhoj{gB04?@X-XbMTqlQE+yWBKcT!-Be8RK;Lv*2S|&=nzr)H4&>+W
z`yl-{MCL;ah?H_a5#7O~<&nP-f{jEi0QBeAi+chUT@h4KRpVnYW;QAg_I3bWqbJ-}
zes~#Noj*cxo9Uc~1jtjPoq$S#=zAH!EK!1vo|SJE;liht@R@J#o|xN``o{sFFoV$H
ztu-q`<l)Z42RwXcW!`iCUtg$GQ(#Fv_Zn&2QZF*cO=m$;6f2czd~5$Y5s|hSp#TGr
zF|8>Ok^{o}qZb?^Kc>w>31bWTWSOABuhRiDR%mUTvx&%4F$$NVqHm(A@!my=fewO#
zsWUyWb!>{f)!rij{}nkwd`%eB7%Uny{iBzaUbFiVIc=g1GY6|${INB(2>ogIH)4-D
znEcK|vhM<&q15S9zFHNH8j#B8DIRm8l{S6stP>pdh}wR>FaHAo`8P6MPN6#b*Oau=
zl(9H@yVc1>WwOZQ@@0jt3xo5J1s&+j2<+jAgX}G!n0!9P$N1g*ysy}+@L3mFSBZt=
z$^jaC@_K;<hZ3*rKxwvzLGE0?>ZuX5SJ5CD5$eDJ?))lD0WM{RSXv(Ekff6as1$jp
z#X<dqy6)kRRjqffL+953xhKasksapp^=+0*^=dgxLU8Du>TC9LVz7^Ucad+usE@o@
zJM0O{<h?nCAw@Ebx4xz6aJQeYEeM`N3S-v1yqp*Ki6lkOx}eTKz|sD>Gs-@?kQ|?i
zmf4jSX|jPpL>~`C$U4O*Po<sTnuqKGDjEQ<Vy+w}?`0&>O*TumyYlwRaeny1$}w1!
zGwr*PkW6Bp2NH=%*!Fjib1X+FRX5({@Gu~YJOvrKgFjmQ0A9;(Xv2fmQy7j|#U&mf
zWQxb7B!x9Q#Yf~uQ69u)1AoBv+aK2of$2aDOgrV^pA`6bL^Q|h4P(e9MVU5Kgby*X
zk_mEU8bi8D`8)m{W+8}203(IHmU-8UXvBVuH4mlKo#G+lI{xk>4G%@h3J7SI`BQ_V
z)TFV^?Tuz8&$=>=Sk$wE_A0SKAdTs%d)l6W(4um}77DrY-VT}$O?w7WIokff3?=&~
zv>pKI^4A?}7>*~yuw@Iye=CGawEl;{J^sT0Xh@ZtKQWrPPsL0RGjVWN4w7|qX?zEG
za{)=-hKW`-CdhQD<)zlkbE6+)Jg-_>$QT!Gpnk|7;N`sUdrubW1I+3X<j?8~OxGd+
z7-aO~o<R@mItMLbX6yOP5!iXm*i+Jy3M3ETc&G*YSFVeKvYRXLNeX~`Kx!=-Q1$?}
zZZm<<IW1o!<>9m90W?oe8B752&jOeFxKJxNiqwXZDP9QtvnXcksdIRa$vl6!q@RGx
zE(NnsrI4QiT{0cKaIIhkWzTln^q#rBT7FXu#JmEqu&m0KM(H;FHbkUfO65&ld_a+X
z`EV6w^PLPtT+zpWL8Fko^Dt#<9*^RK@Iz`Z=b=vM)PKglUzVlh&^3>P44S1Y1Un0!
z0vx3+5lzIG_W*d6U*BI&#AL@(UO0oZku7w?%6l7?6in{AXBQ%NmxXCB5NJLonuiK9
z5yXM(hbu+xRo_S&Vp5+$h_p7x`8@-=xrlB=wBgDgAks-A7U57AzEhX1AeZ_dDA<=c
z!uroSJw;zTQ{gLEj(5N!D`m)6{Qhu;X7qDR01^O0jl~Ixx(UUDD7dhXb4t&Fkgc%~
z1wqLs!uC*TOtss>J;MD`B;&jc5LzT1&ABzG`AGH<?*D~?<Qur67=p?`KYT82dJ`o}
zG{(K+^!Xs-glNq>28`Z&JFamTo(x+!d&6d^C60KkS+@xVJhAmMbveG%@M#{_o}-Ml
zDkPIw<x7N2$6yMHC4IkQ;%6jci8PP&Yv|sB$eyYB!D*JBqzLnLG*O`KSKVD`+Ov_}
z;vFU!VqqGfAQ<`u#v>z;Y9xh;)=_ZQlT0y8;WeIFD&5=p(CuFYHkUsTb9{fvrr-SZ
z`Qm6asys0-zywG6cNN3G;t54^26V9Jp-oBI`SSj3qc`Sw!eOX@>RnwBx|;IRw+~Oh
z2dc_2a~@&EAUuw2(P&&Sj>=w--dxSxAAqxIUhsRF+~3hakSFb-s++3Uqyq|2&TMla
z{=n_}nB%F;#~nY?1O}9ophk%~*C}|Kltq|l*rY<7DhZsGC+%Hy+50uUz}}_ZRZx{Y
zP@F{HsJr|e;@epF=DeX=voI;Ug3NOs9?w`CK~N-Q9$?>z)+ReJHS*G%&@_16S*+RS
z;44uIPTD`w&loGR&Xj;<a2q_(nNHEHu3*EGKnrHrSyp2x1bsay7=U<?nD6mYj{doI
zoHC;A`C~Dv7Ey0-2a8AjhbPd)0n(NYY<>%YQ#m*)C`oV~&T6vGadzn|*5BTmf7GNI
z4;J!OYJ#p2`Gv!579s+TVT{T#&Yr`Sz<TQEd17da-~7uD{|RLkV)U7bHgvqZCiIT*
z^si=IQC#vl;@f08*^5K70Bub-%Wq-htWGN=KLQ7`8VmQA4>^@CAdhE_@0+HeCOHq-
z>=}hey~p6;{PM$HeEMw(s$W-#ewLZyj*N|!941)oIG4D106Dn>y>hVAU#D&C6~87x
zDjzcG1M=(uji%h;iJ#M+h@lnAoSlRuA4SCB+<>UW0884;qE|8%%iC804d9!@l$Jfl
zzm~s4x&})E>$i(?JY=%7-lon@41uZnI>A$N`IL{3d!CUw9R|ZnB1&YDBOds3{}ig@
zjQ9YZD)Ei4q*p*5r=IpGWGAxsv^C?zn=Cw#Hflib8$|4a=bW5xXZEigM#q6O6FKm@
zXe;bEW%9}q37VO;*UZ~sv*8h|dLu<_`2O|B<SAZJcfJKA+}S=NEAY(<E)<4c@^c{F
zfIOG*S~)E5*&^4460K?r1#?l6XeGs3Z35&G2+N00KGPk%lFFZr(@fRQ(o(iokScaw
z6;VI*^w_;x8!~hT<{JU>p=+W0vj@lITjv_SgS=icy8NEP;3=t3EwoS!!NcZqbGD)Z
zINKXFG>6&U%d-HH&P;C-bjNZQfi_$OH>Bk=bUDhORT-N_ConO`8Czhn{&8YYF9FN#
zH?$QjQiD=NR*sWb(=*dGF_+6~xnvw6u?e`0uBGQ*SQAEOwm0{kxl-ln^Ox|lqlkOz
z_Il#8_fx7AVKlHZ51s0)<6Y5ypS4@tAoH4$cA33Zeom9=!<(K!ekq!6G_+ELIAEY!
z$gNjQqHqh`YKcVYu9Vx6SRUY1<sGKRLB?$!$oKRlr4403GJ<NY&1zd4%j|ktr%}3f
zfxG>+w(C9y2>O-&V(uo2)cB37OvxT}-I}AqKbe8X81h$jr3c2w`x!98m3s~|o;`s!
zl2~gbfbR>1sEG^oE{pl(fP*5F7(|2gftv=JQ~_lZC0<)aOJg;p)}4yUIxzHM1QFsC
zS%_Z~XqEn<b{68jd?xN5F(Q~bBkB*&$y;FKBm-uNh=gNBcp5VF(qU?}h6FNk)9Ze-
zjTlcD3Cf*8@T)Ik3?9h=vRz6?G=C;jVerF;^G&`cQOPv@&>{K`6#%$M{)XmKH2r?O
z&^&;if@!SK&3XClMHL{AoN7>0%>-p2`0ET2*cA=KKM3O_dT(*Jn~=$KIUe>4*JKic
zK2Ew};n&XqTgN_UB}+4=u>kZO+o}wR9`-Ym6(Wd(XJOU_88#wlfr1MdcH7urf&O!&
zIv0G4m?I^-o7Vf4<!Q6(Zpw3%ycm*W<6L(odvN4Vu+K;T2btnO-THnBs^220)0(}&
zQjWfAR#Y9@<(jw`_xR7!IBlRd53II6ix`t(Whi}Pr2Zg_JkomnDY3tJDzGSHpW|j5
z_m5e$@6AaG;*bUI$NXZa=~0w569$``K@r37-%TIY5WgPY8*U@SP*v^~LU+|5`2|hN
zYBunZh>rqskutk7+V8SHKh%~n=8RV)fr<L@<4o5Fp+f$9wdDVZ@uDvP_ZWVBrV;&r
z{}2EBOC;T&;qISb^Z(x;$2?Fa|FbW%zqc+UN3ri{O$9Nhp=Kx~ycrOp|AW8y=UsLn
z{WmntFD77+*SG_P9{ndAS*KmW$o&jx*4n;!D1M+b)?0W78ZUeZc<tU}#%B8ULFhDs
z0&UhuXLXShZ0of1ArF1IU@4sz;OYw9-H;sxc=m_@`!4zw0Mc1=iKtTx8Cfe(EbGE=
z0{?a$c}pWFTK@lj>Z<d}|Ly?4BJdXvqGTF{WowS#7{ZbEBzXcQwg6%jLvmXHI7kaB
z8S^r7l*?S9s2+ecZkFxJ`|IB>;zYiDgTstp=ghDJ^f(kumA(;8bfP}p6R`qP<f^p=
z?Fb_{00VM=1q^>j7OzmBH|_30Ubt^{3o~rSEswXhAo?2Mgoz}47RyP2#^{oT2jVc^
zy+GYHQTiKgq?T&Yl0d%2e-RbU(0(7d2=;iip1=%ZL&}uLGjHZ`L`;ps4t0VSMV65|
z6bA!)yXy)oO%oz;HrRuni#-sr@_t3RLU8T^+it)@noz(x%>M8FsB@xh+NJ*Z>jG$k
z3F$>MNz#+smW)Sf^y8DV(4?O-qUrwxoT_KsN62gwrJZj_l1k8dHi)`|E04giCv>TE
zl6$jjVH3~6cBk<mA;zDSIk*T>zj=3ZH_>ys4v{x=_U?q0f<7bSCFktP$rs@8)&a8D
z-zR9Y-ko~Bf90?64R=a+H{W?cAe!4lWEfWOjgbsk4}bMQp!&8J(910ITKd9}2MjIh
zH3iW#1fm^?2ATn_s0`GIh2qx*`BnCEe205Km;gM{dDPF_+ge{(K=xdw2~A6rNj@&{
zUkUJWYi9T62Z{}bz5u#+dvEf@Mi!7(e`LVG=vLCWaDOpWb-jCmftFj4L=_`F%T3Bf
zqp?!t(=Io&?fW6lbpimn+#*l1V;`?xPNGQ}2Z8gy79y;<IBl7^Gp=x_h^#v?MGyIK
zOkppapesTzaJ`qKz#S%2MMzIWL0!k<{pC=9KZ@^g6kVrrhxk4KWA1d=QwGC_(Uk81
zv}PI8>lFG`vQN>KQT7kfX-SsL!3^)3f>HyKJR<t9m8wJH9=z?J{*o@-PZ+bA1n3qj
zeBQ6KK7a!;mx%_-m*SVAym)iXz*jcY-|k8BS|+U7f%GGN>_J{cVEBn~ec4^N+7e7F
z`Gp`}rBbI84q9i4H^~#;%Fi6OA9QN8U>>hPd{aS?FYX?O6QrgX=<nAjg=exa0%T_d
z*`xoSs#TC(<g6Kj=qPW&$@Ky?b3RW_F(A?u5|Q8Mmaw+`)bh~D9`RDm6AqxBW1hQv
zhvXfZPVaD>vL))iZo%f5m6($mIx;7-$t;qjpLtnH4zN#&fkR1@6w4fsOP-QB6+z!e
z&&zjEZCF=!sYZjyhDcwgt$f*ojo2^weWqaj67G}$LodJ6<!oGv(AH$w!RhZCD9@ni
zk$Rx)3h6EN+#%8a0l34lCQPLPb}P|J#Z~FPh`}-gc@&S^IeJQsvKgd~?QJDF{W7{A
z>cGqCHcOw}SNfsHOtUhuHb2nke@{c%eg#C~rZb9uoY-$Bx(os(`Nhsny{RXX0HK-s
zP5QE!4rH2C`itSv;1z}GB<q1nkl`*C1Ykrb3Q2R*NIsysfoMs4eK}TUFTz6UZWtX-
zfIZl}YZ-GD_*rwV87n}MEQHjk#rp;JkguQ4Z$8I8e#xcsCICMRi{TvwqE)(AU$s+M
z9xqRnY$c0X2Ccv{o$Ny~yqP0vkJxPdZkLShK`aw;P(Q(nL9jMN<xi|nX4`;WOOY3Q
zs-nEfsUT{4H1uRf?fR8qCtlHqT&+C~9ruae>r$^5Ks%IvkpZ!mgEgN&H2$IEX-ld0
zoLi77#~eYM9BL#tTC>hwGLt2e|GMi1*3<Nw$fmRaTHYtSpE1=&Ll!e=1j>RFD%^~?
z<N?4ZiFi6ImViTZ*qWKH+`W~a7Na~&65ut(@+txItQ%`CJ>iXv*XF71TUyVzUMwj6
zMYXI&+NJe+4EC~ZxeP)w>pY}&r#l*4_ypJ2L0=|&{cMbFE6<d#MIPCzCBd3Ij1U%A
zcYOKuNX}!;2~r!6ufC$3B7tjkeGk|6yXdY_W$Lqvz1+RdB!;bdT<o`6nC__<BpsMl
z*~G$kJnW(E9>gSkZc)>_Y<{$VDt}qYFP=Hu0f6(|y|G_#HV91J_o5&a!C`ks@)AAn
z&uL@^m5T3j1syP@ppmUNzThwZS#zvJw3u@JMvNxou|<T{BH|0GuLg0dHnP%sFpxgy
zHL)c*l^g)P@}EGGABjUY2dFDOw=+EO37$R5a|39nM+Qcjk$vo(%<Du**t_vE+$7nQ
z%!pKYj&6_)QY(85_k|#4Y>7s12$n>aPPj4G?46^0zlMKyTMgN5gPX#V<gEP)maCq<
zEpBejt45AK+l~{3P&<h$b@l^JJMTxzCM=W3k^I28A<1ntguX!YrXnM;1VjAKL;aM;
zEDNE~F@!ACUu@bPdidCha|+3WC<I<Oq%)=%<1o>Z#2#{BwicT2+<-GaU;(^85-=8t
zuW<aG>);Pz0sKBP%{Ww*SRK<GFI9fyO~`@!=isOcKA6dK+mOT{^bs8SePSDqlH(C7
z{-+9Cz<`NGW&uh5?KINssGLFa_3DYBL|F^=zzj%GfE(7b=QygtFN{Be-^*TQXn^hv
zD-Mn@G=D=Ma?~^u(qz>^AbHjn+!^D7&OKFL@F)ftLy-{C`W%PdF()bmX;RLt!0C3D
zgp!e_Js0WR)gn*_Mia21aJY(p1@=R?Jft#87(h-Rq+icH!OwG`639f{aJWAl=!0en
zkwHCM?L6Y+xd?&Q*9T*bw#uz-fT7h8sk8<hV^Wa8XhneLHfS|)14}nwyuRU!<`X#j
z&fe}!XOaQ}^u9pBZKFyMH8Ay7{b37%Ad|;2f)7BB2dp1pEGH7^&0Jt#6W#?c(d*e3
zh`$L>g)4u+#b6u;iVoZsklfhTk{r3`9Ihhc33PPgSJ{;SoN)sORBe_KNTx>PkY?n1
zxOVDWewXsji-j03j2u&kDOIhAOR0x$LU5-mA)Tflblp4##98JJe%0OQNi)EZ6JZu=
z^N78L?1o<gFE3J8ONvLtq~hL7@j*C*ZEY;vhTton6$I*bvg*V(gq=v(=i_f4*bPHM
zM15hL_}2qjiYG!-mx0&hyy+J~1#_@prOmB7(hmIstp)$fIKR(w&~|bD(F<HEE=1M7
zbRp*0l(r{~l$p8Q_NI3#Md)0~hvT}bL}D5EJCkqUWrRNd&iV`Tgn;+B^89j-T%c#^
zv3jcSt7M1?u`B>TJe*ZXfkN6G4qI+yQ{lIzGlrxHxPkS2b5gH{%>#=WsR&ehGa8V$
z0LHqxGXlYhrNCx9t0gm+<D3ZS!r{ZC+KZ(%`4Ur?HjaV6CtKm(?iM$&$Zw6qGtS$y
zQpx%TGa_ToYt~Rz{*oIjuW1ABo?c<JmNb~8jgCX`5|8UiQUL^k8w};h^Ckp0vf4iH
zxVz4FpI%15paDe-#5Ou9pe>sI+<FD;g1#&E_|)Jh(WRf6@sQyt9p_X%ukIKUV+x6a
z7sHWd@wYrDa`s325T3kV&1|P<5dj)}z2^)?tPR19Dpu)U+iX}_*a`C3wv$Ij4qco%
zIb$yvucAbjWZl6*?QKq~#-9W>*oa-@q|S2Zp7|V?V>7s}9Ez!BQBx5;(cAS!`TjhR
zb%~)k=D`<v);ixlC|VIkNwRG|J_aMG*1Ee0w^5p2jc^XN@|FhAqvb$NqLdAjHKJb2
zM8XzAT;j#rGJnBg1~r}N^Qp;=NeT+uUSU@Sv1-u1Jg43<aq($jwTcUA_GFaOEugOD
zIll{-UaV!~$R=Fxq1!d;9NCEx04#~1R(?CUn;sCLoE_?%9*k9`rKH=U@kj1DNgvQ{
zx^6LUPa@HKCN&?_t(Z<al8a0rUPspPJSn@>e%=ShvW7BDNuUTpS<DW89y*z?jE$}N
zvcI)zKmEoLcZm<Tfj7iG+2Xv6t))LFemg^|hgQKz7N@3P3SGYUx}8F^(SqD>`Fo5T
zqK#(ZWX?^`W3!O4>dHvSCEdW){x~~vY8$3CC7M?RM?O?PsR}!xJkHQ-E)w=Nl{4sa
z6F&|099R35b_r#*G2o678+7uNB$1RdiVls}Sk@PZe>hTljd9%S?e04&@otWjJF0ae
zEth>{F~-eyNr$#tU7rT4*3cAEEo^|aiS@3R1;g^9KwWPGRtfvUNPPieqjlcYo5Uji
zuKr;$OI4+G#6OAe&7A*3U1_Ks`oTS##Td_ih-CtO4kjELqBfngJs$(atjoL3nAgV)
zmyY@^#O6hp+{kF3`PKgcilshB-W6%DI$2AL^9L0ylYK%;UIMOCzUl=X63U!Fw7C*-
zJ5T+>anHK%U(}erytlh^%4`p~U9&zG5lT1OVol=ify8dANoi;lxwL>h#p-teCu@-F
z$nl?R!oW>DkF^l?Q~;8(23e#*ZLdHeIM%mPu}HSY%MpnNz1GtrRnj0*fEU(Tv?lW#
z4~Isb<>F3Et_I-}qCImGT_=d@5<vXaQS_(bA(W0`8dvsc?kED2Kj?RXF&l124$Y@Y
zx}X9^B#6Z!SSrmvb0l7qxNnE6ll|;37B?R^p$ZBmDq<YlfuJe?p%PvTrluqU8SoMS
z2c1HibslB-q(pn~r^g$#na|3EZGVEI2Q_dFAu<~Q_>b+CVfjEz6_Yv$WTmHq+7U;7
zig>Y=b8DWQCDhFPg$nETf#~V&j<Yq~30pD1C%CG%9B_Qf{;232OM9tE1g)IE)jWCU
zCbW_0I#oFEb@xuQis~j2e4mmWe<m5U!J}_vBFP><1Y>nM9)8hr(`!(;++J&dM@b)}
zd9bEz?dN*f%1c5KO7jSJ?AWKNvXuniLZZn!51NwLEBHIafqoy%s>AL8zd!fl&swiZ
zp#?7ad;VJN$M5OwwdSEArFoP=tsPw4qM`JJ{de7-MEB<-m{1tUO9&>CXyt9q+5lxE
zeU9KDFN&jvmk-+u9`oLSa4m4DM<~8{f${9s_S8Tb^+F*;Yam{&(vE(1oYI)H@E&y)
z_oaJ&ZxnZ;`Ly#ql1`D8c_5c-iG;h5mgNi`3rb#js#UruM<ygY2`tO*)v+>1ER4MM
z1cuaa1tz-<lIut-)hG_7P%XAjdxAT1&weM&npzNehOTXA8T2DiFW+o|q}*iVIa&C6
z%**j(ToQ_1uihUUIp8Dr=~_<9#_244x1n3_7Qo&q&btVxeF)xAn$E47*`7|`v3NG4
zsl;b-`)7sXmWHv_C-zeV*-#@FBMn<CUq@Ngr|5C)ros7YzG!O6#n%LVzLm1n>byxK
zJpT%}M{bjC6s-XW<D%%EWZr@!Z;rK0!uO^`zxLDSa3NbpUzOI}(u4F-rN+fy?ZW#_
z%T!R|B-c4*ff~Z7+g_LF?{CwrD78p93u%DWUQqrKQp$p1DYJZ!IM#szK<HEVMn6u*
zrLvy&UWqTXtaT$f*7o`^n_IbKbFSs7d;I#tk5Y{e%+TeCK?ma{;u|)pCmrZLHtRuR
zM2FYFfhFlnd7b8UqL4!frc5NdU<7)LT_1N|S!h!_!l<?Yz=i%*I@%sUb2;18Zp3h<
z+}FXt{!wz6)PEZO1BL;^!+^}c3}=KY^2)6Rl!K-aavYnYTDVW&QU^nZgl^-hK|7A2
zql7+n!{jdM&2TG@(73ecOsI=*Hc2C<8UQIBQplBAfIej}q;#5ePq9CmP*ueLI1yeY
zfo?os`Xs0uQeGhEbU2iH8Ij_-nQd}(D(oZ&{ADHKD{#XrT`!s4h~O>}Xs>``_f$7m
zXtZ6)uj<r@)fWFZxa>L@erJ3q^Qj*iiAo`jO4`96ETNIyQOtd>R$4P!#<<K^&!Dmc
zx1>A92cXrFNaO>ScN6d_E^WD=S2D$<H0Px5j8@gch-XY|;xdJ9=Gsh`kO=G|<CYHN
znM<)&vz0bpZpVS_`4Zr=NDaZls#O=PME$Z4SAm4)NWJ@2z=N})m`jbnPhC6;$8y*#
zKoTwrQ3-@KSeSRa_<rH_weQ=O&GAfDKq<#Sp4RkHVNPLYl%bj2K)gpPYZro%m_g9k
z{gz6hbYS<+HO-eNo+oM9LbO~fN~txlL12_|#eM`icCO`8BuS`@*>t8)je!A8%lDc}
zCejKD0}CX~SmRQuClzJ8Xk7PVPff0U3*G0HPw(K%*}jC1tjjiZp4EW<^WE6m!HpUy
z;hX1Rx_Y^PX0gJ{?(55tX);+4PSv_mNE*dTllM}s_y7Wm$Z90OG(xIvBQMzd1W2PG
zoR)d3Ed}NC>E68x<7(bY2Pv7w1zZwqMN^kRIeeugYnz4I;AruI!r@1immz1Z-B=n6
zxQtUN_JMlhI&1&6)H^$n#9gG%J{Y$H*vP>P3<neOC$&BsiWZea1`FApQe4Z&*9UuD
z1}Vma_~Vi_0$+1lAR#HW&48fwNu-BSDz~*h)yCb;rE1YC*zU6F8nG7bB9@>K;z}*$
z0<ldE)Thn1Ozn<EGqcpp6z4ogIK|G-yYr)89t1?yJ!iGpboybeFnbKcwRa8Z4{s9g
z@5;g?yPp1TBBV)qR6S3oD<m3*+`L%y7l9$HH&C+sOw794JLyg}lTuyBHq2k1##Mh-
z65o{0a)lW-+L*(I2N!<8Py@Y(w?KFFzAmC5uB><smU-1?2n_0#88;lweD?wT4)u0E
zaqp)lVxn$OO1GCaK03bP-nOZ#T$<Wjs~Owc0#=a!`;h0m(0}il)!SzCzDe&%EYWYT
za!JIeb$z~++UdgP$Y&PJ^P%sk(RqR4lq<03XFV)OZrlKReCkO{f*q9&C14Rr^zA`+
zDCCzGC>@n1C$;gWsBgHC8_40jW65*A*K(WM?JLgBT`z$&_Z;wFO>1NT6Vbf?ozzL7
zSKgCvD(u$)yM8+q4&73#^8+$S^vihWXhc(o96-6&FDPb&)b_TZ`qvElu2);<#(J7{
zipa!+CSe=Oaf&>8w#@=G3i*zCh-`;`-~7w1$`367rRgf;xY5$}NyHtS3^9?JjCb^p
z!c}^W_A<a&MN9l-`AQvc2O7oE-;sT-X`BSOQ{~{HU5l}Jx0V9==75=t^bB08g2|0d
zugKK&Kq5>`yZRAK2*_lo3vW6A?Lho)2=-=}tQ;_*ux}-^ADliA9r;d^vkT63;{~x7
znEF7qq0lH&eadZ7%*#_u^&)<hvKS{n#AD0;1X8-}BB2q5_ZH;dc9U2qy!+!_tof4h
z2`LPo?!zSo-DNeZy5x?dDHn>(v0S1l{Kdzj_cZm-uT^Vus@zJMj;$l%VpSoF)JP{Y
zFMj2vOsYl9#94bolSD0>pIaeXY0X!i&AqBVN=oDiG~30c`m@Z`8)RcOeIE6$#2#@6
zb;4NvNvQO)DeI7i;U!a}h`D&a@BG@VAslpPKFUM{-i1NW^P>146((zbnHogl*L?(n
zTtiA@R>hX%kRC%Rhe4Fl$)2=2{tH(xisbRg*mXubuR?v6fBafuH3oTd&Ic)oGd0(W
zoFlPw;t@G4lCTQJCYF;<)qDKror>JW{zCe}T+BM3!X?t4E3GH%yq}zS!E9cq_$8eK
z<2vpMg#sZ~ZQFl?3coJ`D}}jedc9kdlli1WK$uj{^TO0g%U;3GG@VLJ6U;lk-&x^k
z(USYw;n@^ka~enN-<Ve>SHZ?7DzeTP@d%mlU0~(Xz2yPu_nob|BvSEf-sD3ky}9!#
z2%Q%bpEDdj(qB`NXbB3~JngR?4z22JS7=hranjK<Sy2O{%=qHnTe@zO0BMl7$Gzb$
zJ^XV^m(eZ5WGJpyP}ViOD(W%yt@helG?9$j1KmZK#d*$}S`jT7O_FPy^&;*!Rs)2K
zS!<H1RQSA)-EMeA*cUK{$J9LS^TOvn#|9|b*Ezj`(thV6U%>xE(pmV^{l0&EVoY~;
zo9XVJn2v2sH`CKo!!S&Z;W)Z&rl&dj9GxFM2S>M~`}g+!{R18zoO9pz^@`^;;5eii
znyTdcgmOIu^n3zfZ>lJYR2uH*eW)fTj7m=sSTK=bw|L1PELF#!^gP8+jKqI-+!^*&
zvqZ}~(KOs$EPH9g3{W5bxU$=n)X8n68ieyW2XUOGdj(&kWG6iM+8adyw`U8z%;#SF
z{%2>09_%*-sE-)3nSgrn@1Y8)DcJ3@JB!@+11C(Fwx+#<x9u*>CmVQRx8`Z^vpoC!
z92hR~MSFAsS?S<0T;3!>+FF#rz8XdjC?g{6(G7|7!j4cN7Uu@F+~l&ZbacR3VE-H(
z|1brV_>8h`d4S@1Bwd8;9S~m-E2P3s_S^on4XZza(Rth3yY^ppR^ZwS_b2o~hg@`;
zHxVjF4kb_Ms`=n&%M@}#Z<&+adxcgZssvAm%Yg*hG$b4n9XNW=5)zKPDxLTQk^wvw
zaAj)DT}f!fWftzn)4r+^T9j?}|KSuZffs^%&dm;VB{*)@Y%ZEgVdwGWG74yyMBq!p
zb}xk@?XcktAwg%fm2n6Ij;$W4p5_&jqC_T=r)<>8H$cA2p4a?;2xLIzcDA&tH4Y~<
z@XaIMt>;5fYj6GfdodshlRKOnGqwiEO^sA4$}c%?6u#*{1Bn1bQS_xmgYxq~@%{sR
z--j(p@#n<{9>`o_z`k`WZyo>XI6<+k#I@li&Hlr(Pn5TET(sdo24b+aX`Bu&nQqPe
zSvv&9aFW4KDdJ?n<?8ErOD=c`#56~e%L<ybXG+TSom{1<IGiqn*?H3bG%hcw#IQ5}
z%IY6{>2-QjSSBR)RN1I$p;D(4X*duIeX;`b3_nv+?d>s{fF89P@a(eyyWAz5n_F$u
z{^E&~VSQ_bnJn{)3T9Y~c8jc!hb;lOq!bcZK&lKpFxsCqF>Vd~&pu6fub0_tYo5_;
z0hjvUQ~X)2w6>>mNki3BkW-M#8^90?#$JEowiN`-iqr4~WVgtV?Cx20(SGImc&dDz
zcQO_nc0kvRmI~<U+P!!}PHQz<rhNlMNwzfCi2Y$;e!=}{obq$+sgpXKY!&djgi(<E
z2=KWA$Y(rFM}>xg`ZzN%q^Y@tCa4<M3dU0j_1AuC127ZGz-MoLprN;&QryE*SHry8
z57xat^hBym1}YrVV*&kqz#B2y&iWPZ(3+sw5ilWNk7g1P%qo(949)rLJgc4Y9J`%Q
z4g?NR1r#8f-|6?T5=GIYr&`vbR12yk>wH15#4_5l0r1eV1PUQF++y7I5dfnIyMY{c
zp%~~}3SGJ5*@heEg213Zj1Wr#7U<oHBm7AmvUL8O<X~m2bgN0Occ>#?$0&LZX!BJ2
zZ}}Y&z{P|xQgJ+s@TN*24%10?P@;o{20@lC?>d{4+DT+$hQHcsZW!nJB?;^SBGo9T
z5XHIWX~FyC7@T=TF!kN*5;I^`ZZa@2^G(*;X-uh?G0?G*{NuwtXPSi(19B-}E9TYw
zgxvV6<hpHNki8-5*~@iqS<6~0uLPhmR}0@Z1a6AYDi4-tU!N|?-8I=`zbEl^M&wvq
zD_8d4uCi!~U0XF3(}XdMa}#cG76t6d#4y3ZnC)%^VGjbbK+Y*QjCA0(Cvf_&^ZO|g
z2=MR7^Zw``eJsKHIl42KV1ByU9Wb{t|Aq!(4p;)00PSGiItb}<Iq$#__&$S22*k%j
zWouA43Sc8l9x;4Q@R2m3g8*m8WtLX<vKAFibn!Ekz=<y)?RnT`SVI`DQ_M>9_3(&o
zb)V?*1^oe&tL87!FGt6KEmMbt(e2YLklAAHA;Ha{y;1Tusny|;IoTkBW!_cbj1LXb
zl@w^ZwRI_$rgE)mzoHM$9$Yg0B!7VmL{cyI{Z#`m_NiQWDBB*N>T<yj^a*vcLSjO<
zlK`!Q&}9U7fp*`-0uwIy@ZIne6Me#fYzID{lvC@Il{WWzA)~-;7DU&}koa8UX9eCc
zdXSLU)~E;_6Pe4FY#wIrr@@z-Lz2Kh{Ler6#DOu1q?crL(GMK<m~pe&{#)ZI<AD=(
zPD2L&-d8y!HPg!cn8O$)pv%<+ycxlXv2G9i=>cxhAd~HY`qg24RR-*q*OK?D-)d1M
zJ7(jJ{&zhtg0G7iLEtC8(jv!FF33?qb|R#xP7Wa?HifAGj!Fy#l1{@04tI*8Yu>V%
z0P6RHoI=4p36Cj-C}zmH;doB;hP9r(+h&$y`bi;w%2zpHFB5y6>(g+Np+g;tCW+QS
zCuDYWFEp_9{SLYbjN94Pw`?XEcufCrUq~kc>z^4L2wHG_(LWJFbelSk!~gVLGrNc3
zj_ju#(sglkOM$UqZ*AX-AHJFh$5)2Pvv>S@a+@0%g4Lb?1b?7W#qR76nKg0Zm_d?f
zrPt@c=weN8CP=oOV`cL7as_xg6Ewt50@M->Eb*v&=#V0stow4CrE?eK9A4OuGWyip
zZVWLNLZ?)s?V{$yqh4)H6}6TXduq|$P0INUu4pgiJWEEV`bjF!0nX7Cd(tn}b>X8$
z-lP6mE8fcn^rg#BIPs~5Ye{VCrQvo&@LGUnr~RV8D%JUsVM#yp)(ZT8k4VBcQwASm
z(xlu`0w!#<Y$oxg`^Gn42u5=?^Y8OmqDHAm&ukOepNnl_^ieH+S84))6E%+$D1ymh
zl-bM2-7$2c)t+ik0Gedi@mU<=rSJI0kdWX-Oyf66iUpk(^0O=+^Ls<$fiITTeQD2z
zo^H~2Ih}=osUZdk``$(v<u|9L+zIAqgZ|ag+eX&M1xNd@Ts(wkRV-DnuEd>Ec4lCx
zE|CEC3Z(tTV5aBVQ`6h(NO{wosG>{M`|^rynY}j$M@kP%m=VU<k%js1`Qmgs$FVDb
z-sqb7tLrYl!d)TfIf5=cfu*iG4Ime6!}PtitvJXq4$}#kkH?+`qDZm+>t?hKw^&>K
zP)oNoT(=ES6DqWA#gF*Mc<3MLqolAob3b}~A!HWI<FO-5c=UC8eDWMDoqZJ&QtMaj
z7sOC~D6jSs)iHHTvIEflg}z1JI|e#&gnh<(rsP%|KWZlFiH(NL>J;8ZNC2z)WafUz
z9b=ISH-YvP9|+sls(9wReKFLT7Jqb!L`sPOJqwyZhn))6?TkI#*&T{esi_1WZ{a(*
zH%64yJPD5rRP{}s?yo%B-6Eke9e9q*3Ekk1H_p0P_Plu_Ygy74T6w6VY@x~5BMCdK
z>6e_+8bRu~7lpEiFSAq83CP$?3Bu%0A}-e`f~L1iw^hqK;RytbM^BZR#lXJvRUND9
z72pt{X>H`bl6^s(h#4H$`PK#9LUckgFoN$8@TqVwH1Xl&V|*#v-Z^|nIG<l`S-i{B
z>K;X2qR^%IHgmqf6q{O2;E|V$3T3#y@HZdGgZE$xFy>N{#<U&#s_;G+L!7=2A?{tB
zo#-!^;t2QM2EuSPf%3+v!Y|_vwl25kIh&eozZ|hF9j-L;U@yjtHWfV=LxX?v_Yi@f
zKCK3K(ISWlYu8j^=z^ebt670T3dgT^D7I)+AJ3smqVaT6qH`aF$7lGDY1_HDO?q%#
znH3y>x0Qj)=jUUoTZzl6(w#ub#D4E2emt>HhK)Z~kQ?@Sh9g{-`%DMJpH)(fJV+bJ
zO_%LNgT5rFgbOVEr+i-H!KWr4mGFHzeK?m**$MNSM4LNYwu`a1fF05`f_@j3;!r(~
zagr^>PiumnE!UR)Y{~F`{p!4@Yor%LfRNWz_1AL<Y6Ra8BKYR*b8w0;p3L-Z1n|3U
z0zDhD=~}=ai4$s?$7G(GUGX7XaJhSTV#(oelDM^cS<JvF*EKTtY?>s^MB3fu*=X2v
zi@>?ZPWPMKAi_`5Fuz>oAGPRMrwLd020Yt@xL*{bt@vFF1Y^k8*7dL7e^HpU3YEk8
zL}i8vp?IkDzmET|mA=0Zc%a|@<pMI6i3`eJ_dsAb&Jk;kbDPC#h_s6<#!m-SxQY0e
ztgjMnBn93ne)OO9m_YyuiY2l&I`v-9X6QA|cT26Vxu>#@VY$adzm$=Ie*s2G@v0n9
zHFm*{1_&aHh9pll4rjnMh@&nMja0IV5p_(P%#|z$+a&4dzN7<M_YL1Cw^bnozoTE$
zJtg>Ofs6OI``9=szMfro36K4aS!EocOvaZf>=dY^#9_1E=I-EUeB`DA#>Ix|dp)$F
zheT|$z;q)E!UAk?d#+|K(c5X4O!UWL5OGA{EfA8yC{F3QehMJ-ejNTEQ44S_c;{+2
zGYbY|+Uusr>al2__MeEhI}~^&a%nyRAL^VK?xecmK!mRqKrx9HI?1lBN@x5Cm-L61
zrJSy2TV*x?9+92&2&Ru2P=4}l*Bt01CAZ3`Tm??`#+P))^nl|6o?-gcxo~eKM_%#^
zMljtaO!XjZkjp7CZa?L#V3=I**9`oOi%@oDG9$2J#!;NR&__aa6J_IQU(x_Vk+uEM
z612}i!r;J<t3V}D3qb(Wvn>TWNz~gQ0J>=BGFSolv8}+dIPYyAa|OJyU0cL2l-^m}
z@Nc|(ve$_NPR_FdndU<7M#8}B*6EE5phDF;HD`RLO4^vCn&Z>_Nv#8fJxu|Dw&D;_
zbugT9Ft?6@jO>E@?p7uc_xM$0kS1uyBT8(L3g~2eC1`<j5MZx>s2R^?XU}Ky87N=s
zW!_XCN#P#q;y8Tbwr8W;gCQff0thT!$c^m+5!^a>`HGRWh6~y{O$#B^y2bu+zl=gg
z&g5#Zr=b_WOH})>hdbz3O_{<b1h_ldd-4GjQ1s6d7DtvPaPrQa&|9BAnOY5QJCntS
z0H3WE4kVAC`c9idCybYlm%Y@EaL3uF_kv}-5Cs18J-SP$UC>{+dLkG+!kU1wW8QuD
zA8_Yug`kdwm5<}BMI*UC)Wc)|+4ur%a}GpYLMSLq`DO=GOMt&2WB^6J;b~Z3M}PQ8
zun3Y(4FvEk5On9+zFXENhi#p0=PRoK_iH&K*epO~?+VH%;n2pNsl>TG<p%mVmMOQ=
zm;|43J_Cd@ghsFGB@nN|bUsz2I!oX+YpD=o`!yRQy=@9J*|)vRE?>DZzH=XS1&RWq
zcsx_ALig>Et<KX<ObcB=R?WTzB*^*4EHQ)0_f_Wq9{8}w<8FaA*v;(!qUFw&=?yO{
zG}cV)-k2N;jY*POLC7y%fv8@INu%rHjQ23`Pv{F;={!1aeFhAljjcf9Ww?>%!m1Dx
zAp{3f;x@i$mmz?3QX*F%#U2qD2pA)ar*W76KIN?LJ<mA;zAg?A3&(Z5IA0;J58X>T
z&bzzCVhM(aUhiXfyj{-s=hVn0_a!~r2ZjRMhquewroFcb1QP2>8SpFM7uQ-K_dM9X
zFeNyW4Cb9HjX8{jx%$5c9&@Kgtv#2Kc*DZC)_6}Xht{VJ$F2lOZ-5G=exAS&<6A(5
zYui8r;mSa+Vx;8qe9dI6$f7<^69@|4G|F5F9?OuD0pq+7oJf-M^IM~asQmkDz>?-B
zw_NEAbJ`F;Ah;2`%oU9mO$+>P-d%qUBnS%5o%Ew3AGVe6A2q9V7(}L)qkY_VZBCBc
zK$4Gu8}w#pYDMxm!jt}~1A7aAJtBDay4!&cL(~rJiMz3brI`Bq>fQB&%o7Sw;yMB^
zdJG;~x_!GXQ!fJ3v1WIK#0<Q+{dN*VKqo0&>`D^_Py>}#1Lc5`bU2~to+<5X$DD^n
zC-CsL44Jj{RI68q`R|L~;R3O~oPkQf3o?>J8+uZQ@Yg#UMZSqJm2g99SYP9L%5Im-
zgGcV;A&oHIqcO!9dLU7GvAEX^k_RW6GSWvkP*Z8`6W3V5^p?@cUEF7$8iE%}>=TU<
zTABER)=*D87|n9v-7O4%`Bg$F0Dx)*5(~xw-rt_gP1_kjlXj)Mr-QM1``qySZ<)$e
zw9S=&fA2R|w0YR6s&Bv(&_ci}H{_<geUTfm1O%@4Z^N(Ln&sNSAo-=WJ_-w$;13U=
z6Z21%ZBG;q5gIzs=w+YG>r2!HOgP_9{0`Nlqb_!+j`H_7&JATb54~<I2V*OB(Q`M^
z7}1OC(WT*SxJSu`El!~bWpOg^ZTIef0l<_Jo12_t%VlNg)--w*Nu;f3MLM0DQ5K%0
zxB2y0@g07Nyqc<~z1sz75$3o$E5Ji+z|G3c)#UOOe}git-^=nWZfvIOhx(>{4#CvB
z6qKH$beDWLm5|~V0^6e(vwdo>a)`#HvffID#BedE#jtR({-Lk^ZHr9sNX+QxBx%~p
z3jK9@jB}(m-9&JqsconbbI|imGB-H=sLTQqf>oDc3a~RS%vFC*&b8dxKQg_Fgf{{w
zBbAN~(~O*6Phaih^%nFJ%spgn6~i@JgW!)%67BAR$*Vwx?q`TpX{`#MgF?OsBU2P|
zFTU*bQXVk8t#p;7R+$m11%z;&5^EK!Npf4%17a5T0nzSm(&3YFQRKlCIr5*t$CUdY
z3IPkjDpZ0pHq$HBdz+cbW6wuAI|T;RUXzomJR0yBbpK$B#WjRUmGEFYJm(x79+7sa
zWaHL=QIm>Xg-`A&2JV$E#!>T$)@BfuhCIez4=)XKYO83a48-V-KA5LWq*fGz?2lHL
zPwpfb(yFDuQ-2hV#6O}eY^FMh8AecX1QPgf0i{A$kkXx0B5%LrjCYGBvpBx7^g#b>
z`}eh#o`2dfm*i@{c=8E`wKVZPWN(3Equt~E1|X+FrB4lyml1a%JKiP!;=F|uAZl=+
z=DYaN6x&WR=EZT|NYx+~f|U3VTV{5<Y6~tFArXwNEH`G%NsX|aPYM{kXZ8zw-X7c?
zY%X*cg=Rq#yw1GvhOq_tds~=BYPlHwnJs*|;Fg@-OGvVAEI|bXV73;TDKK_zsXces
zAAa~Sl89T#;fZX8hvdZkQ>KYB-@jxrQ3_IF9Q-OI#*#9=l`^k3AMUU(B(~+Zx}1E@
zL|@4U2DB88yVNP#lwo2}=PA-ysrg9r-w4pMXvQ(780cPunADPxy_GT|77{}fB$UGq
zp|YTu-=0)3*{yp~!!M<5#E?INdmB7X5G1;M7fx$Q?XtTnvF0#5t&)IwAMJqH>%QE(
zcN$osx0+2(9<?9<osL(*w4*EgTBFPq?RjfguRm?`0Jl2!$3dJ+eiyk<vJYZoVV7jB
z@fAsP->wFe!d3;PfB$?no1Gu;)ek4TKnT1dJ{NG69?Q~9wiUPiWni0s8D~wyqJvl!
zpWEH`@6gV9WqecpX9BG}U2v`rW@V9Zs>YgvVjOF>0aw`NXeE=Zgy%*Es#85M@4Yn8
zb;Rs8{?9)rGP|9btj*8-(sFe^Ss~rw7RYvi$6^9KfMHx2Fq=|JX^pFY*bOVXpBW%e
zA67IDfLEYPC?v<BOEI|q)oKO2Et*9UB>%F<Pk~$~=cQ0%o}bm_8ieWg58sg2xdAe2
z_159hBl}EY<$d?1{Dp~&<7kBMSLYJktv9Xj#*bQAyIa*5zChl$A?k5nD+F!Ymw+*H
zq8}du<cR<NH)nH|$l2qkv-z$wcWse(clhV<NWEX14J`54d$cV&CaCc$_HNkI)~8TL
zRn#N#t^?3Z1oO;rFCQ7FU@t64fpwoJ$5Kc=EZ7q6l@&~TXOB6B3GOHfyGvw<4&FBD
z*&@UMjROICqjpmbLAZg{O2>rXTA~t-is*GgIKuNNAoot7`SA+oM6mNp@u-hs!<7KC
za-^LmLO*^IBsJ(#xE*NQi$6<bKAy6zfqe=@{MVDmw$Y}QLdoV81}5(S?|GquVzpwl
zKITk|Z4D?n#$T@*`9mh!n+T?d?&$?>zx_j#`^|=P|FRzPbSLF>!+{kkLMNx>X_|mA
zazUcAHZ+lt59g?h-g(5nR2atqK$CyFX4-lk-0T%f71Q5L>)`eNSTQ-@h)GsYvjg4K
za7@V5i0CUoc#zOp4F<1TD(qvMs>I=u&SA`uG%dkr(RG-on*O2>ZO1bH48p$7B_MFK
z1HcRZ`w2#H<Ab;*>|R+smXyOev5z@JyJL~{s<SwLYl*}9BVf+Y1t;BMHCs`XE$%-B
z-$)0)O*)MWEdd-oqyANd+DvIe{1<MVA-)`v`<a**4sQ5-F!jo~4xxSf8@NPC<4Ks`
z3ZR}Q9P~(~m07Uh9tF->guyxH{aD`s)f?VbOX07j{-vvZ^Y5p}`8PR${QWcZM82_b
z1x2L<0TTRCB+it;lsH?2GXbU;VtRCp6kq(ezDNS6z)2K2PB)n<`IJXMAy=EFBgZGx
zsF#3(BDW!e|Nf|ct1acFyzEL?pVZQv7%+BmYOgw<;UxG~rn4<$jfFFVHFvtzDc`B+
zVsB?*ALV}RO73nXdWSy6(`K<FdEo(6$@`Cn+Bff4+Y>3a+gNr=IFyNwH}vwb1bc{*
zxHuPIjhGYJs*^7zy&x6E^@Z>$d=7Fbu>Ddy(72Jy@FrAG9Lflk3BIUzJkQc9#}Gaa
ziIj@@5%y`QahEQ=oP5DHD?Etd1m(j?b@mr#Nm7rfC``1~G6sNkFhHE3;eb9HHN~y>
zg)52}<qu3z5=5L$gX1#+ikZxLNtwrax~e^K6`5d@dU-6vwYy^f9gp0Waj)spJAsvj
z)^S7XT`-gxXN)mr#a`0Nf9plH2CLtFI0+F;nv;@27!kB4fWUvW4MLen*%M<+f-{yO
zN`y8Xkt4rl^UIIE`R6WuUrzvGb+X#yG0r70zNa|3C6~iAXm?GWfrh24jH{Hwoiu?r
z#^dOz%S0kS`UK`&Vqhe94{Vt9Ec4j&`fxHhSJ4({`L^07`4a4xt!?7XCQ0o<Tkv~w
zCJOWW$se1DqRH%}M%gbZND#Vsz?Eo5W?b;K?9;4bIh1+y;~CEadqbfd``%pw$09H=
z`=(muyRsP-^6NS%goB+N+TD8YTLAiO1W&nw3PSi)FrtBHc>?Bz3w%N<Uj0(AvcjfW
z`W{S7F#BU<#l9rw44EVd!dPUgDj&<myiDy90>%&YW+lv+M|&q4$|Zfn)aey_c~yd2
z`H9CVJZsxl0yhOw4kUO|VDmnIDRe(R{0lrbxEzy4Fy$-y0H>OV&}DR2MhL^9&M$@g
zZF=)`>s1N%S`a4%zMK83G4XZ`5B<^6N;Z2n?><FWx;oTYdfRrj%XLnwyo5nDYAxM{
zP%L{qrjh_GN4uhx9l~|vpY(68_~F_Me(cPO&9y$ay0Up3o&~JJv!rezK(T~<4(b>P
zFBS@Opr)5j3@v9w^AidSB)Skd;aQPW6BQ?d+xd@+Tt2hVX7(SoV)$y&1oyU{nuv!-
zG!O=-Tl(JBbo9{wi*h&!7TPWh8rm+4S)p5(IROTMS%4xrFA}9Ni#$M^)wu0#vGt$>
z(64F14)xAJfr<JA9vkY*J?D<Q4HF#*2T#D;gLiVBnjXX5Q@>~}6AbEN`Y2e1gHz_c
zpECgkfyR^LNB@5ek9fXbl*@7qy~B<2i&T&tU;_jj+Jaw|P&MJYzTsHBUr`Z;m;r^X
zg#|^(iDq~Nmi_sKXo$;AUk{^3qU3IwQTr7JU~7`PjL>hBu&SRx^C2uLMW)Z68$Y!H
z`xBz!)O6prC<yLlS&_$f6DcPH99%e0e>26v*MXYV4^Kip&b`t$I?RjU$W+|zOEB?H
z6mb7nXnbNoL^OXhd4btzg{Zb*ZsPUseXR52^QimJC;t)C!k6z=i!OHBG%wcIH!Wpk
z%ANv4)i|s_K`uiTDJVZTRVKbpr)n*{l)$oGc)iVBLgvEN$J-&;;?iBlDfxHDyNtxx
zSDRx@;&DqZ_q+mL2N`p(+8fRUiJS&4R{=HCTaa<xX5-9_8Dy_913kJnSH8)v*F()l
znTEGd+{0{a%I%=g+2a&&GkpI^cik>nD^tS1hk?G67{(WFbd6|!y<CLcFK$@uO=!p3
zbZVX{x4W6I$M2NrB|JY^;`)v2Rx<ouK;!IvpQP`u1&4e5!C__BNIitIRp+SC%#5Oq
zW`b7(!C$|%lQIVUxKt%AJA$&h-Yec4a`A_Hk=^k}hM~ZlPrulk*8KY5Z|I84AJNXB
z{Ap>jJ^o5&xQg^k!#>(AV*lDwJ!B0+O2;M>C*N&Z6W5cbYKId0pd8@Ix`&L&T&+a3
z(nns-L1ldfUCUCd`d6zSZ>r*;FExcm*Uo$BFRHC~gG&D9lINs2p%_YQhwa?vo)vMB
z9d!w(@RhXZzT+PZb$SXv?n`&CP9%nSpIj-F%!J-9!p)_*zPM`PfYy#O$TRv7ktOkQ
zNDE)EIYXb#w(M@9>_=pu#a&;DQ(@VhD*b9F0?prh#r<K^ojj3N96<UH>bS}k{D8`E
z?-4nf1<yDHzdJEPJ6`l3eg@&oe0S_iZ=?RfbID%7^-9OTUIDpb@vxBs><9Skp9N(|
zOFUR<f^6`(znm0Zoq*ET@jgjjYeX?CMEJmH8Q>XI5)T`w_uvWHt5<w?M<-1jqiS?~
z|Fn5I4oZg%b`M-!jD-eyBzUxuB=9B1lqpGetUTxA3^5UOy&_MXS-;!3L>g%~oGxw2
z`fVi>XR)+(02#B`Sy$QPFapv<##OP0Q@Ka46Zfe%<|i+rotWf6?_A<S!S6g`A5XV?
z&K3t)CIwu3L<S_DRZcm`>>0OC>LU6j1pe@+Rk8OKR{JmgSKwKB>_|#~eX>RYY4R^}
z$d-FNmCMzn@#t%wSqD@ZF8b^4zmrj?IiEZhuDFo*q3!`^T(eX4`W*%h$2UK#g6xtL
zbzbehHtxQx%?`b741IOMW@dsFib&?VBd1p&9ZJ5-v@((Y<gy^Y*xZqMH_3Oef8sdr
zWK%KMC`oIA9OiWrCLR3lq~wYGX>t9t&v`Nu+N@2((6{%k9wG2%g*GPf)1l3RKQ9vE
zAbSexvx$QFrAYsQUv^v`NN1+Cr~>O`5n}<J9R?+*oNEA~fi$u5celXioUU87&ic_*
z|IRv)ZE}&`3iytHt1VMHQZFFWyj>8-&i8pDE>`t^nhB3{Nc^!3JpG>yaRLnv1T<Eg
zq@4<xHT4=9{o5Zf;?8okA|tIR5`4(;u*wkIVn`8`X7hSJy#uW37p!)jVeT|94w0BG
z&-EISe!L#zqkpAk_OmVRlxDiL3`f7JkVh}tIYIi_x{`EMrfSnfgQE$I#D9sr>0Q$y
zNy89)04%@U3{#Do$(KF3g35IS{k@-aN7C#Lo=jxNsoac*Xxec&jR>syyj|#z^j>cY
znTrlKIx$9m-tE=8>iC6pNxssmhdV*W?OjbA>&8ori@fPe8l<++Tr+rgMgut?NoEWd
zUr%0nw3j;5rAj3R4BHI8kEMS&j@AJb(Dxk+ZhpsQBa-!E+ovr+M<;HU;jW9JZHj?H
zFFFr`8?^cFD8$c3sswvu7JfGZ*91h5gtc?kpk7r{pCdafNcp8f+A512l7*uxV8l6A
zwRtArOun7_KQTvlZzpHn=rymqcQ-$;{}63(9lX8yOtLV2Hnwr)w-B~+h2)%`lLH}c
z@*wwbt3JP-(7AHTy>QyFXsBt=eZ0<v??mL|D+Z@D1e0|Dxwl0$X!6av&i%9wS=FMh
zY#n48Z~L^6;TQ*Uj1vbP44I$^*7L+K^1bDLn0>slkn*veJO@l`gx`5NK}^eyvjuQ)
zW*@D6D75$~JH~Yu*uHPa_i6#5wneZr`+RHSGHC3Q)b;E=<mSKE7I=v=n?dW+d3@4l
zNA<}8to+b)VGh?FoyYCOhwZhaX2Zt90~F*u5dLayY9M)tcNX0sFeNy%%l7ET>f7U*
z?t{JZALdVtf5;=a$wTsi6P-7(bo>=P-8izq^*Z9dXM0nR)i6np9UTb%&ghAaX+%qa
z;%&ThdI!O>#zSut+U$A79Qo{}P|nHs0f4kI8L-+~)wCA7MtvCT%oC4tVzPWzB6dJM
z%iM0Td?vtfD)5>idxl~|G(fl8$jIOkYW{k;$N!_E1<JuX`x$|dwmdb$OYYJuuBLmN
zM0S;gJ@+yox6vT_Iz{d}rNF}1(X?m!JxPb3-iEjh$M@5c4x0Xt7RVpzq&|#;eM=5O
z{SKrXtTulcUCUJk6BeHP2=;qEB^Io|$DD8?-;fXb^#^c{DbR)03iaWQLobl&kRW6)
zhir|%S!69+0*QfzTCUFaquPe}IU3Sj_I;$VI8YCYbJdTwy$cgmT!<^n)rF$CuD8iF
zzL`FO^*kc^9&7!z0>23KOgEZFUvSKZ{>n{}EAotBcafWM-%E1u^X0PH55C3yC5=o@
zTyi?qbtvW?nOn)w^(FG_d{ki2*uBh)&s{L8Cj-zU`_}CQYuMk;QFpqU1cQZLWlx3V
zyh>@UxJ7<qYKbQR*PSDQeiVCR;1VJ>gmti8avCw^*?S9re8~0<Ql`qjdCl3VR#oyq
zFs>~F<oDPuj-OlTw%NNx3JRF@_<S>A*8bjbQAmGYhP2qLkqZJ`m@|V(sNrnRs`N%9
z5Q#+Vb54K)p1(<j^C{I*+h&so!V>+tm5D;DCh0d}UVR0P!eiBtbyaq`+d4TDTjAWB
z^4t%$Gs2F%0GGW$K#_$tUvElej?5*l9}ABu{MU9yezNix{4i-CJfE2bGzvCaIbQd$
z`|_(8Rsbd7g@S6<Z)qw-w`!`J4xtwg6!8Xvq10?H>5m-3Z$j^9L)(Ky@P!LH_F6lf
zIXcs{?+mfjUUX_G;J~lq;Z3jpv@rj9L8#er+X@LpzJefMy)OPTh_dsBEwMXZ5j5Iq
zxb4v~UIQ2L2p{#K?iS{ict^{?mF!(h^tC@vRng%Z_{zzVN3trk8X9d^AZYV@a^XV~
ziq)3bodtqJ68h1n=jT<S!Pg%JB>=rR4)L(>AlJIxlt=6hV0OvK&?O-|FKqKL4gKdJ
zq@9yr!!u7)&sIM$l`%b!HJC3!`-<H+m2*+Qc5isGriJewgrG4&lig8X`G62Z06`!Z
z+V8+g7hgKaAnx8o-kN1|x)KO`)W;;<5~tGy+SGiNuO(}@@3dcduP&AT_{Zvl{wcez
zeM@>v;&o(3n0^RF_PJrjfWeR4Yf$by743d_ZH%S9n||4^<A}33G-A_N>&5F7P7GA&
zh(Ii)y>8^*&o(A}TjbHYj1~lZ7a{#}GYmKLN7|ilWpIetwQ0J_%(xons1RzafiaQ>
zazfLmCD+{8asEdtyUqg1W+7-0(*10$5x6yv2EmloY>+Lfd0D3sJf8JHtPRm?kMu6u
z1dc5y>bVlHWCi_>bQG1rYyX7yJ+q^Qm(Kc7_Rvz4k=tw9(75c>^-FYx($ivWJ5p#4
zji0>aR1zCuO4x_NH<MwPMSC%4R(U`15tT2x^V$%!l{m1xHb%26t@713H&aea8~r>X
z92<1En4@neHK~Op!yWxRdN4M$Ne0`!S<ttne6$BqkfjZgcS$WYFoXGb-FxCNwPj+d
z`n1Rv!Sf59>r|bW=5-d{lM^Z|#}S`}4y1Nr-gEtMe%6jl_s0u&KP2&kPHXsR=dbz^
z3S^5B=7;H!(TKJjWca5DQRhX)Qc1M@IOP_v2rVu@b)~_a${p=%utzX=3q6;Uujvsw
z3oC9$kpjzsN(dbq57lt~gLyQh6g+&*9i032fa#{cW7D~#BuL~X2B}S_DaFfY3BK%h
z;v482=e2~win%1)r^Ocg<vPJ1Pg<~0SW^GXYs<r%ol%v~<wNQ52`gsA<E+zvMzCRA
zVZl~Jb0F;Ty=D2^zy(mvI<rCTa#WfyN1Y{xezAnH?_5nCqWaM7zAryCh#s40l+R_o
zFV~95t}B4E|6Fy+Ju~gS^ay%Es+A(=L0hI#f9~h;5Oj1I;(q;6|Ll_3=)Wkq!fmFn
z@cmyc7)$wHiKt|-*%@6i4cVRt-FTvWl90IA_NzB@Zn)xzJLg6F?wYNjotp<Oh56nl
zP1@77J61>$LzJ*pR#Z^hMK@qRS)ARLItQ6&-JUg;++}vKhYyn=Df?SGn}=ja;+!K+
z6Kilr=PPkYAW4ZyVt%h5>8}NLhOgCi3E(&lJ%9V$*Y8*okBGk&o)p|^1P89mE%6JM
ztkl-5v?K;AnWm(QXmJiT<v(Aas!#lVlV0|l2p4nE<fb9IBRNa*?LJ!mlIgT(2|fi{
z3gp5W;`?4Mm<+XsvQ9_rLYJbfg^CA?cf=R8iW3(iexo;erA(Kgp2-*oABz`o?Xt_G
z)d^lZ(-2r@@Wd-_cy>E3Vgw2iz41YU*NfW21xkfgRAe<4f8hnE_J$=j8vdL6nO1e%
zQuPXn86N7Ouwsv^zad%tZ}z!ZPf?4UfQhI6pyYJ3KHQmPA-m?VPx)nVIJkUBFT^tf
zANY`9PE(b)mVos;Yj$eohE&Y6+&&h|4pK_m9DLV^s3Ga+vX6-`tju=P-n{zz{FZ$h
zgvh`{RJbBaXpcne#Srmo^(+Wh=C_n`v37*e){mxHH^D7b8CTp3+Ge_LM0}}9=B_Eb
zCp0g_4<kP7RY(y&rlO8{nIfD}WspR>CgnP>!DB0%BC1U4VJYKQvh3*eea1E*_3*qh
zNn!qsKTN*8Lcc$lV2Zt9FRn{U=x@>16?B&D(U0b)>nB}%>-a^Vi5aaVAO5u)0n|em
z&fCq7gw5Eo8L4&hP}M(_#<E7b?=~@e#6J7eAx>e#&-R=MB~*Z)TQ%a0tjfPndz>$l
z*>Amml{O!#XeUB`fd&2U#q$u43I-XzSWECTS2awsVS-7Rz9m{|BreOXlslAV?yM|F
z%V8X(^w8>&B<pl-5^egO-koLaD4u?;9YQiIbDPD5<Na=2S7+NWhHmF=8D~+HEalgE
z=j;ve7t5klNSLJs1~~{Mh;K>|BmH&n3yR8NLa9=MbIOW&B~}OcRP<fiqT4ejIZOU8
z$Oz}80|Adtkxu#NvqXOPo)H)kRGzxAR3U3xa$1x{%r7WRb<mqTR`J|9?GJ1%e}IW!
zpvL2|xMit}{Y#oLO+;T1tX6?i;F)txp|g6~VBQX_kiW?L(`ps1t%<Cd7U<7Ixu!v>
zFJgmaA6W;YuXv99fHe55@t{KZM1;3VOSxn4EU0zSL#HfR;>GQ?Hst9Vx+HKVC0~>j
z23e8^qApXJT3d*_WjUaSmY(K%vE%WISTU62=pK5S>-h@Bp+;EII*%G)L|LOHBi`^!
zLw{1$z@&`*<#G{M$C5rF$8@F?K6U3_cqb-Pc`qSh_~xS&yWABd(<&ZR8x*&x4I>U%
z7l-<8pT5u8|GFg1>&g>f)ZCK3)p;f}%ech|#|lBiTjA{@M-MJ(VSvVe`UwUXz0Jpe
z4N{~!Z`+coGJ>VA;Yy;Di2NHTpC~5<wA4%DJb8|H>5)M~1DM%1;OIRLnQWVRPLh{_
zYkxIlJLCVZhYhExKBR}Y45UvnF6&-(v>htmcxyQ)=y8LsTN1G#LJeE*<L_fo0*jcc
zZi@oD8}v;KCdD@tQq9n$FR5?Rty|;nc=&o)FbJG-8K2+1`?+%$k5W&{IdsBkR5+Gr
zjr*(kp<^G6ef?+WrAYntw(3DRJm=<xnhr+FUQPkY-=84bSEw=i{6veD)P(D|1~iGT
zlOfJDMZbIe__s$HUy0+_r(Y+CX1(7jaZHek7<Cm=Dmmc$_=zNh;JhSbCTNTKSY}B+
zYdqIjY|%$q1{9;J4|nUxmOLXO!Ts;~Vo_DJ_ez^}ZH)NJ!dFCQIAIx1pFCCr8OJk5
zzWjLEnU-Bjk2X+bN?Yabrp|)RaK_+?HEj$Q<qL1^y6nCIQ~SPi6*$Rlw?J`Kf-LPQ
zL5_!#Oom`;$0M&$YCP5!>xM41MxH6t$d%l|vm0Xt2%k>D^k<ea^=qwP@ZK79x;~NY
z-Tu^gr{OwmJMnA9mi$=3*kbGrC0xToNCt;GevG6Y_j^t##oIK<W&6=TtPJZYYt)IB
z`j^`}Z=8A`1kI<@-cK=%UcH~Sv~Ey8roQUn4I5c;5_MwNOyGfvT%_o3Y3-;JO89j8
zBYqTpG!>gJmJjASN-R@^^V?X|r<4oL@_bj-6N}SP-;cQCXi(iD;dm&(2{#*fOj?K%
z7|X!)(QU}?e?Q=y>DItB#;jBF&_Ckbo4}8usELP|?Zp|l=SYhM8}ui97V*?7zgG^<
z^*o)%B!d3B%}e}pp|sn$*_N+8X7tKa+Xu%6xx@)(??7FoUi0?~Ucc9N4OW_76<5^<
z^*SIs{CCf?Qg%KUYAv0Y(-j2<b<@~5y8OnvU21?!bVOg6WEy_y3}h$&L+t)*jr}X>
zU1fXMyP?dXSHotn&WF0`<ZUw<z1Y+$@aWh)$!!li)glc^P^G5ms<b%K5fu$f<<oY)
zP|+nj>LX>R&&nHI!CQVITiTdXC{<1kZ^An#Wl6pnQrs<m9bF)0)KGYnXO#X$l=@WQ
zxJD!TOkyi*>hmmZq-7gU8n$WXzb5s4{}t-rnLA8!eC4bqREL>_#~G3m<+i;mkCNUP
zgoFdbe>@xV*wM3!I^DR4ToW5ut7YE0%t3f}icVHrV2N}nolDJXEKyNIapq?Q15dn_
zVOoi48=7)&Vvhh|*B#ll^T#~)I~uY_@g`N4BK#u`-Be>eN9D~$jj|>og9#0bn@OZa
z!|AfHjRys~=a2WrR9~90qO}DvShwpP`u|OPFz5Y*C-YZ#`GDL;VH4__{B!{yyZ@#Q
z_I-1f_Gt*Sv_Dj<1S_OQiR{$Hf(gaxQ`vT!JQDh7K5x6IRe|EeyY4z(<P|c32(LzP
z`+U%v_Hm#B|2iYY13gIW^^5a+Yep~!=XfJ>Ps)i`N{CUbKxEMv-XEpevwD`!QZZgo
z9{&oYCCg^V?F{pZa{lQh09YL-euEmLh2C!C&7&QDuKXo8lv~nh@6g3dy>e*4Y7TDG
zR`3BSeJJi?sEx!c6FTbACH^EyqbuIZmrg%lurpJp3&zq+O)5se{gooHt>hsmre44L
zArBw3k_6cdEU2o0mELft3IuFvEFAtiY4tx7xt6$oJ&5_KKA-X{iz}9Ro|n6tKv|R|
z`Za0S&fA^&`lK23qB3yCVZ9Oz>Y#P$gL9a4ktuyutMM<OD%MFUyREV+PCB*0joQ%8
z<5ziTBo&E4@E1vpE}~)c+2==FCGW|{L-HOvxP#=-Ogx`~RtQjAn_t#Ct=hlDDAt#X
z_3hQIBd^s8w@vw#r#C2;GmN=wfi60gwyv&MKXi+p`2!!fqxg&8Lefe32dyRy8#w!-
zBaWL&?)_feDHxu#aQn?Cg2{8qK<))xL#p0YW#g;!tMeW&+>EY@19dvuy~=A^h{V6P
z^vSOw5x-6)c(WGK-w^_#9H9ib?wCEl1i%$iqRBi>l(oK5?4M+(B&j4riuDUNoya6~
z8Llo_uc1w*bx66fS_wuNd)|SB**9j-_B@3+?<JgSDQ_INFBwqbs>|}hnfFI^<Dvht
zRr41dMU8pd@NY4QH3})<+6WKJs@(_;JiE8};J&V~?u0cP8=x&RNS?-;7AMjF+U7o9
zenB|SAwd#b2b72ZqO!&?od)}Mutr<FKTdpfTD9!9xYK>GvE`wV_9)IyR*1DRzWnl<
zj#g^d&xsfXDYlEX?mjKEOTKG`j?sUEYWF$o`<MHKTWyI>Tc+=g^Ep3u1=2tZp{B3Q
z+_ASm|4TU%+4xUu@+&pg$vd+>gYN`TFvaNr!{+NHL+sDR?M4(+$|1ukmbq8G9OQ_g
z-g{k9fp<^`^8ZRqga<YI>E!80*A06QbT>V0xUT~(XmcrVm5hg*I8!oY0I9CZOwFSI
z5YZc%DyCG#b6#iU>-RJLy7}${OM6Q{$t1?NqheaKY30wo9>p9v$vM50z2L73U^(q9
z)gUT`+XX3HH*>E52YXq5y-3vW^M7+5&Pv62he_3<VHF_KpYh@*+#vngFUF{6lNIcw
z*e{<os=GLf<|9cNcsjEsf>DzPnx+shw^vr(1W?PipCvA;XD`?&5x(c5<s8rOOi_%N
zS4@&c|1%Pfk~N*I`Ap#^N0hWpATMK3-Nf$i(20HZ%h9E!zesY2@<J<fvTtfhA3l!j
zuYN=E(VFwkqRL#UZ5Z|A`Xg}Fii3Le;+@8}QB@!*HkzIQEVDDYgsM!$To^Z?D1=^f
z@LU;+E0#t0eaJ<7J;Lw~=H9H4;$@rGiZdVtQ(Y@m|26(h0w^yJy-(3b^ED${$>N&3
zo2eAyC4vpEkc8!%VT@<|6O}<m<BMY$E>P2~yW_eQAwg7VFa$Got7lSVeNpnXeKK06
ztGK(q@f%q{j7HjzDo8>VbeFhM=FnG!$}rvZ^Sdae;J=glr%i~%mlj8#CoqKdxh7ug
z#BY6-S4R$(Aapnscgr^0Dn7H4@AR%X{F2jkJ26361|@jsX`g3pNtgO(@2a~h5C$cH
zJ^YI}Arj_^KAbpL*=leDF*Ffzipgfp1^%nQ!%%AtALI?gELub#`c)}D|8mdYY>d)9
zkL;2JqfsxU60l7Y^OkqVb6<V`J4@)d2#z5YY9isz5J7n*C{uROG~Y|P(*z~dA7wg8
zB}yx|2w+-2@#ZJa$SJj1>^_MRVktM)^qXm(a8C2yVlNhNjVSVD%8jqXGO(cAC3*ly
zefHR=8HsRUxtX7wVl3m(g?|f9lGr7i#uTT|gZ~=RI$mkb7)Z5&%1#iBpGRFWCGnyc
zu<lEV1)WS&xe>a4XgbLR8yJAo;JW`^ivAWy=#foka|H71;&$Z9VqfHT;DrAW=N%qa
zwosp%%2&g@i6PnLHgi8*rCn`zBFwq5(42akpOcPps!nqgfBiUq)n3jsEF#a~_HP6s
zG0FX((3}{?K{PJ&N>hn(xsih}Z)MHXL4>}7G;$dQe{~iqc#P#3V69i8EYi|Z$>$5p
zdzWLW0y)tYg8Y#hCAwL2OyQp!X~NZMT~m>+G(kdsF_I=Qpg5o96Q=UNs*IZ^NJ*fA
zCZB$ljx;Wq(#$<&W>^hE#C%%1TXx9TT5M!Us4tF(W-!7McV4jtcliuRl%GRIy05V-
z@sK0D2)jU{^GrjX{I<&9w|Z&G91~jv_Qyqsv(t@3`~5qc?6NvkLblgq0@_fjvsqs2
zw#*xaHi>vRJ=6xARN60~w!oy+@H%6fV`j{Mki||I!3!)=Xw=Q|K%*sLW=%y1+>85u
zCo4Lk@Am^WMTL0uhm_k0%63m_QU#t<r!-7l#42=}G6-zfVxLR(mu4u3&6U)Ts}3vU
zu9qsUNa`HuEl{~002>%ZJ93?6s~*Q9TubkwYFoK<tcDN49XsIIj=9v!Vp)cM;utHd
zA1n(i(?{kH$aI~Y|9M?BQvCuuK%fN+8Zu)XC?T7AinSr_wB)CrOQ*O?LQU-hGK%u-
z=<j$GtvRHuO35dhRjyEd^M36ZIS-~f)zJ~y+zesga{A@&bV>;bjYxcO2GJ}N2@7NT
zJO-Ft64v~?bV&5~_z44z?eH&J8bht^xp=xR=>>Z=&rN$S?cx6UukymwEZ%~XU1~|9
zT_xy8f-GA?x!1$izS{P?lv3Ewxx&g3S>a)=Zw&I7&~SYcH9w}%cfFt<HY_M({mbK>
zR@^Tq&aU+QpikRV61&B_9~zz%%bYvZcW-AOC5v_`5KP5LwKf5M+i`9J@!`0NO7O6!
z`qQn6>y#HYsx#{Fhfgw+QgdVB<LCMpWV(_o%~+9_pQ2gfQ7WObXdH%11|gGQos$Qh
zy8VVF#rw~b1}TxeX+|C1bmIjivD&4)bMH~}NhEt(WYfNV`6WEW`}46))5bT7a(~3-
zWiU0xZ+T<Il}{f%?g4@MQ!?M=H*G)d$qDF+w#9lg`UKms_dBr&p9J}ZGxKoNR`izA
zetnY4;yJa0NeKl9Eo|PEyYk(#RXFIHx`-`oY3b{9R4|j-WPlDxgTs}iK?l<<7gT>u
zPp_3JiSLL$D}(g~`J+^<h|yVAYP#a}B(q1tBuaNh&r3eUhXQSj%ehy&I+}DfS(iH}
z;8SacHC(aj$Yw0B|K|9Rf|59(<Q$sdZM8Kl_9sEL<2Oqx5+uLYKy%rW`WWQS?V!GQ
zx5<c?=$&ZCd)=|a>&jkvNvSI@3#Kn_e-UI+p)<BXJ}gJk*vwg^wSR=b=>OFqdaE*@
zjbS1$`-YKTjQ<^vv~kQu;BITd-PR_Q7fl8C!z4c1fhs*;tLEJ@Qv~ntn`Qg1=KjgA
zr%}F=Vt@Net53j=s*?@HI$7WZsuv{;iIxsI59tV@nnR^qK?qg_R`6~4{aC}~cgXMF
z>kK!>t-Dfq8_%&NIqhkxFKyji^kUQ{ltvhdvKydRMYndhnXwtXRFA+4y6FNeC$osN
zw)A>-SbV2_xcW}rn*Bb*RTzU~F#551S4}A-az&w1&#ih>#U+Qcr}vfVY!MwoPJoY5
zj@?KcqvBiv&Vl0Y<jX&rn2Kq@ThzIgkNcCu_qA+qz<?1dTno-7w13*_bn0nPHN#+M
z*hUoF7Mv{B`1dEY&Zt+^D;34l1-!>7%OqOB5ECRN)0c1|EOt0v)vGLY-A%&lXalVY
zzL}buLXDEAr-F)8sTwOwXa|d=wWm4-92?W^T7Q3Ca-z}j`U8ICeeAgq@Wff1u4~~I
zAp9<!e50$JD<)J}a*qjziW7v5e(y3c*M-~ucy=@8kgcY@K#I<?Db&yy51$azq<f`R
zkVNjL7<~TQ;-7QHZ!9~FU6VZR9E(#e<R#P<FHA7z=-J{Z6ah+#6L=8UV-?e!%(3hy
zChu<mC4D^!-5u)<tC%vtj~R(2(Irw+>GYbV`nEV;nP)zB#eOegMzKJjm1t)3{9TwA
z`%Jd@dj}baL{+qOqgQ?4lo5#?`^l>vto0?$*O{fYsSN=BKKp%z^N~>yK{YwoSUsZf
z+1}a9RHtvfxK#wy&uU1j$26<Gk$smW{t~v)+8um8c>dJ+-cg>7Z1F@Gw2rnvJSWF@
zQ?3)S!f2Pmu*07@xp<n7=WSk&ej2_Gl71{p5~M*DYWmC5#y5)8Qt~Q8(9xuu`CMye
z{f*qK*1-(IT`EmpA~%(LmEhUtd;%<FlPDpH02n*)uU;$|kIpilvXk=pHU}J`NRBv=
zSW{P#>z8<tW)r;=so{vA35Q5UW>Qs=adPJhetfN{Da#!`YMEp2q!F7=g5R{z9OY>)
z?`?!^fH>K92Kybk<ZpdMwG)$vgs3>80>x75<(NhU+uj%XM&aMmbWy_?!=7)#Al}F4
z12iPN1Om^pTn&qz|LgvjRpTWttCz2xe#$m#8p)ge2bZ$ft7BKl`*X=@tn*j=NM5wn
zHZfV$M7Vsl6}WO%rTfxD>HV(wiga<Z#alN|nc~i^v*vus^rF{HW5q&=#yG^tKx9=5
z_|*W8{uaY5DaySPx~#`Pk2=~%%vqYcM{k8v{hK90{%3u7-0%}RxE}6sF^#brL3m4<
zj_{8D!)YK4F<Bv3gh?0mfqRtA-c>{49qsR5^1SMMiF?^yeHml=eDP@4O3W6CVnx2q
z#?^0dZ;EM;J{7J>b1rT_s-L5Fqy*J|d?$(2L^YlqX_!vLdKa*xVIg^)&v28!5b109
z`2!kUwNqn}WdDlSjmr)$o;KXy`vqRxck%o{6axg}Mr?%~ZhhuCGZ~hg=&lg=YjOgi
zXu7Se-P(ZpR>dYCnC3v2Le<OcB^nk(6;uB)xvp7?og*4<{t<4fH|E#yIfd%W;UQ4p
zZn;l&E0e6FNR0la=s1pi9V(7etcjs3qN@p~3VwsmJ>Id2p+pzg5oC{BoS0<1_rkga
zf5=B8CtEj)a4z{~<)#3_E-Qc=BzAAJx12kA4R!yf6OQf*xf62^PR{LP{5QuZQQvkL
zZM+LwkJ!olv#`m0oP9FjW4h&YPC5t^-ysQ}S`yaD8Bx~1?ry>nx`Tpuu{064_9Ng=
zXR6Q^u6u-;HResM9h<mp@UFnR)Xx2N!{%!l>4f`n9W4t6Xq53~EAMwz&!sh&x;(nq
z^LPDX9W^hkD>DUhk4o{?AymPMOPtWF$olsJ<*F6wdJnyKb$koG*IHle3fyukZ7Toy
zdnwZlHq7ZLNQl@P_jMFKkgPQz@1l&?0ASVy^1q^tvSfAMfm1d25R)9SQ<~PZvBc*(
z>ECVQQwL7J%k(4g+%nm!(`3m|vs-zWzTGrIWhzhOWq!-kv1^y~H&1VsSdJceS9+LV
zHYd08-7tPLcr!WjJ5P>TtD;{v=|NWD(~&?^z=&R0!gE%XVpqIpf=2Xp@5OA?us>&0
zL<YE2Twr+==#jw3Iy;l_z|x369}TBoY$OmIy2K{VFeUwL<#8I<706@xA(d_Zcr#1!
zd`>ct(58QcmMqK|Q_0aEI<H^OIYA}6CzvW5zaxv3`f+P$XcHNOt&scX6T?19ofrph
z(nM0iwlYUGv8kVT*?XT7;CtW5NXOy5Ny0chLN)wti2JAaut)p*k#9rtTqqMtV@tp%
z#3*`?dE|vU+Nu=fR4NYoYVt(YfkDVYAV~vrjhn78*wa8`ADtDCYH7FjnDZy4Em(|p
ztzsl~&!%HYsDL{@vDmhOc2s11PBXD?Kh8Tr%$k2iN2!?07115Y2}X=?C~Z`EKlnAD
zurc$wzM`3fc)RJE|2KlFANhamefLvS@4Bx7f(VF8mtLeuH<-{7l_pgY0TB?8CcPH}
z5l~R+y%P|msUU)M2q=Ue5Rei|=%E@3HKF9LxX-y~?=$xgxIcVnGR%;&%G=iaJkO^X
z{E`RBO>um!NHG%L=`MeT>)}luI2f+iv!_Soa=`5h&991AxKTWAo#$*V2pk~v_owFk
zAPk7k9UJ6IthFegv$Jwd=S+N1LhrXx*Ssv5tC(FMWXoZ1!_rGZ?Q~_o>H36{A3o8+
z(!*0AUf0dIwofmOp6Ki)8lBOe#HZkyBabNa&_OFxg{$mW#Y>L$z@6><8f@HIN5w{B
zVNkZ^N0>8?s%%rVDe5L+RCfe;ix{$c!J%3+g@zov{D)pvDameA{3qvgsQfs>pAl<K
zS2Qv&ADNc*4aN7`MU<KDnX|v#0*N7w9yD}qqN!r9c-~I95GFl6msvNUKw4FcH@s@g
zS;d&`Q@k-!Bwte2^`YIfmc>!fiUsB4aCC2?i~ZG2X7uD5mw@Dh1Q;8Aw~w9g?Wq^t
z$1g*4yHXc#hxUwceneqvUyG<cnpZlHwATysiEow9<LYruQ1*K}`I2ck3JigLd|tR}
z_C$9{YbjMsQo-YN*O2790zOBOa8r*n{2p}W2sy?PA|Dgrg^GaY>M)!~jylY7t&|1O
z5|pavByU?4C&uq>l`Ml&63bBapS+WTtuHVyDh1ins2eJ*yDrTviSO8MI+Wh>S)bmO
z^kRsZyuaZ-2dBXrZyv44@0DSU;reH1Tpha`U0Xf4)R64#BLMcrY9xqX^(CirIdZ7<
zhY<<`2orTKQ2~NRKTsK*C*}ls2(FMvXEUsZ&CAlLQhS`b3Q{A>dh_fP-k5Kl8#y8G
z++u}yGm)6KfopeCO_ma4(u?uQijsESv?P>q6p(w8zqanJZ|G-bI_;#Vii#B(d@;MT
zvaU9_MlH*&5E>0ln!GM6%rxjml(TKV&9we>du<1(XD(>iSaWO`E-op{rpgPiN8o}6
zU-<VL5@k1t%QcfRPc3|=mv_6hRKEfRRELW$FKToyxVHkz2=V5DT#wVc3Ify%rElg9
z*`HB*hl`)$xUG5!r{Vn>_@P<`eCTvM)UI#D9lsR3VS!O>0BD3F0BlNMc8U`h-(|a5
zPY37QdWGbvHXf-`q>F>-evfIN*1uCQ;#dG$771Mt2|lM@aa&nrjs3&Zt?M@@+Wj5$
zccjkmD*Y?jU<=OKJ=qL^>UTYA7QC1J8p({MU{R%BU(J}0GYFr`)QLQ^@CN_tY#P7c
zKwrcCs5l>rERMOixwiC=?(fTHpO3gjpO*yRYY1~-rAqI-Xtw|Mol0(-8yzk>=&ltH
zlF$1p%?9(O-Z`tR+{lYFz9n+Gp<a9yjEa=DSN-%ic6so%MIJMS23APFU%MQrw>21@
zoVAAN!%*rWV<O|*jkK^3hx#-2)O!VimPspAwI%9MMOFs}_w+|$UtgOujo4MztJ3}!
z_@c)6HGg)0NklEEgfa#i8TT!)@E&Ic2em4G(1==j%h^zTY?1~oApK&p@A*ciYZMWD
zR==vynP*9Gl#WQHzqD1`tS2n3$88PlQid9RpNvd$^Hv!;N*QLXCXXi$-VmJ(xa22Y
zh~PW-$)~wA-4YPG@7$;mWvrjSme!MmjB5RI$gYLgBc5js!}Bw!Ce{s6zhk2HRnPm*
zL~(2Kd;YvpJpboAK^k9dZU<>LWZPjfOoUbZ!fwPU%7wfh6+x$Y5Yjxv9Nf<>PXk)2
z_p?=@Z0d6T^7O-VE<oY^-JbnI2D0mdF)zD7y`za!l#dT1r2g{ZciE@HRRB)XZ`=<+
zHl3!t@_j>DSo8x>+cRo?j;va0DYK3XUSX$xuK-&UymyjXb5cJk2D>`lJQ2FCYe={~
z&POpE*KUx&EAv$88Nz5962}-c_}*Rk8L1&I=pM(()7{RNqZynOlD8W+JSXMc5n9B_
zIU2W-+>V>T=$nuG-9lVwmsW147OUia{x#oZvDr~CN@OX_|Hj!HV$wsz!rxj}$rOFv
z<AJv=#<RVF?LzcfnWYbweO<4b^BT?8Dd(O%*)8Hr2}(K9W2Qoiag^jEgtbDyQ(Y=U
zgnfO}rcxn@f8F>R;lowm{?3=ePHw0FX;z^D(*`q@4dV$jH8Oi42AMK%+2=JJ*XUkO
z`Lj#q*_`6kyOR~tVLZu9BDziC`{8*et@~Qg@upc5E?weX(Q&&oJRyPG!V1on{3JUa
zC!g2?cilO^evnw@10d}yY;kYvO0PM3@6L>`PHU(BDy`k(Hmy<zsIxhCUxCTcO~4&Z
z2m`{V1tgO&b2d#^RNz}?UgUP+*0;CA3YqBM(T@+fOBj}Yq0)PeqaNQxN3DlHP1nHQ
zngjv4=_ei4FKd1B;+=5pVB3efTEa;VCKRvT8tWZzK72}_``tNG%GYi5CAEIecC@DU
z^Cbp;T+9HkNYAII+p->19$p9R+|$f?CIJaa?ZXpRY||!JdBu=3Mars<k9;LMs8zXz
zsNO7rTxuozn|l_8B9&*OFL9!Mt%lff*Qt9F4DNu@KE9<gx*E4ds9DY$@yEqq4?=?S
zWX)b%Y=mvZATNg9@hu;kyyC^w^>ycF?*(fAkz11NMz)w$iKXAl4mY0WM``JKU)<5|
z3B=9|6vfrPnyY3*9CmgxF%l*E_u({2UHLNjS5;Wp<>j4f_{k>z7Z_D0AMI#e<fn}5
z{^6kGLQ(Y~f5B{9sZ32MBt8U65~wt}+Nz9Z*_7t4scO}^rO2T7#c<ker&LR&JW%p8
z9h$QL>-V`U^~IugQh>mn<+zw=`mnLlAtwlyXnKF}`FC(x)cs;v`LscHO^&vw+80LO
zLj!@(&a$8CNB;SMl98(3ST!p6eb&oP0}SDJY<Sm%lmUF%JJfQmy1{x|8B-SOnqv5f
zL_RIyHdGI!-s@aUx-Qn@Yz_To8uH7)%7D;jx2IiL`;v+xe)e>~j*am1AQX2XB^N&}
zmlFjTsd>pJ%gZy;ex1+ppu4*SEl{3oex|wWS3aWs;&O;Ziq_i7JtAd~qcOZ)8Q-db
zk4UL}$%kwOb>GM8sq?zV`*#T(8H+B~_lOQ${E>gj-rMAl7$SWxf3&tx0^4(E30`A5
z#p;eXZ1>Lp^en&b0!G6k7bh_2kn~Q2QO0DR-N@tK9_#)`clh|_y{mxfdS(_UVmKyt
zRE&L2*YGAEHvm7a8=*mYtzFHzJ0skhK9?bH)^hz=*xmiwp9`Y{^^<RPR99GbsMmwV
ztml;EaZS{hJt>15!IRe1C5w6sI}7N0d#3xbC+opaqS_9aM)g|T20EQ(vUXhFC<jZ=
zD@Q|YJ(YKElr#1kxQiAH?Dm?reqF6Z3&k+VWHLhj@BpNmZpv>8qEn)d!y^_AJfb74
zUOt@TJRu^^&2Km2O788qJ1!V&baU>UM)D`}Ous_ieM)QhXIK59g7;GQ5+rmH(rcRh
zzA}n)hQ017w87m*FM>3JNhao>H?W(wE9I=t>=spZ&ZtV;l|Lvj0)OBPy9K>Ho~?D*
zvMn4EJ{ARiM{~rw6N<duMC~&W?E}Z$`NItnOH3~gnUADcmyWJ4xb>K3Nx#2MH;4-T
zP;K8%?U8beXR6c4g99w_+_-b2R|74iBOw5EN3|X}TCY-wa0<s$%!L2Qz?T}6rrogQ
z)0%?)8|zGBmvU~ro!oP5Ih#cMk?|974m6e3xxSYowS39%z1(c4!kw&}xv)F=vz^KD
z53G41Lx=^I$_bA6;u+lC*ca)705~9K3D9_yuy%9IQ%0&Wet-NLO3gxzYjXJgth7wv
zjN)39#Iwc4kcqD5pUj*^&))k!>{K#>oI4vU9oSCyPD_61X^GEMo~o+uMNTk5Hppx4
z4Ti(f%8ki!t<Xor|BM91S?4mQoc0DX_VM}{2Y~LlJT$Q)n~!c{9|{HH&qi^+L})$E
z_3=*d56;;yBW9E!ePibjf^XU>-B)dR6-ta7ZfRlPb28FDL~>e)zR;1*3mkH^dHJ#(
zD~ft(NHeY+ApvCnk`!&*`|Z3|%3HhHj72EUv*%p<OnX;5ch3&MC+%FH;f_&_pVx4G
zxv~Zps<;_<r+oaUvkxF>%Cg~`cF8w0T&_oVUGe0D>|)llgn0Fqhqw}bjfT5<SMEEm
zycJp7Hce5dub2JE8zkT-8Gi9Rh0U4Q-Z30!01-+}Rf;?Hp*x(yBdS9-$(P#5luG7y
z$LT}^5g7<o()g9T8V&7w1Th)6^P6nkTGOSsReJ{nsKh@IRp=10e2*wTO)@4(^>3yQ
zI^E^D{nGn_d_j(&wPO>N!_G6Vyjgs?X-oMbG>0QE?$dbd{x_xN3tdYkFk(sc*7j~r
zUCWkRXX}k06eN-S%r0mWib@j{sMYwjRB1T-W$b8Tw`?IC*k|uv`vW(JYX|Vay7{QO
zBKSldemmxa)ezTW8G{73K2EURI*Ko88Bn|<ewJei*B{7sU$di8A%rQV%JM!>(t(Wl
zmC}Qxap?=oa@7=<^XZ4*g;nB6r#NXVY-v{sroZ*RL&@Z$CceQUt3--tVsx;1w$K8z
z!EMX__jKqhAECAvmd_bJq_97?74DbO(%?Zl>zD1Dd;`9GY=0I@eNwQt7Fa|Hi7!Dw
z=7S5QDA#pIDZ6fru<q3cQYs^`WB{#0-ow|v^O1h*muayfo4oUlx@$jQ5&6`q%3!Hm
zOOV9DXg8$JtqI8b?K`VJr(RZ<oVM5Cr)!-qs+>n>!Q4Uf&GB!F2L<-sk~~mTY=$oq
zx0&5vao>1pPcQnTdr*`zv!Cx=@pGR9MAzHv_2#eU`q=MI(~PqdWbN;Ar58hs5c12`
zyOu+$I8YpN!h}AsaQ3pu(bX#ial`q*6%f3EY5J}j9VD{|bLj&n+1+1YBGNpwYzIHp
zke0>jx%jaE&MGHIIZx-|HBeuPmwFrsGAjG=&nG7=Syivef%d~}68<6a?JDnT_(3Np
z_athF$^KGzYWSDcY`d`~slDogpRiQ-B+BJOBlXSUMt)Kui605}3VBc>5dVH)h-K>P
zS6t$ToaM(+ZfBp8Y_W|Y@V(^Impw;~F*;vyZn6r~XKwQbKHs@y7K~EBGH=k@2SdZ9
z_Eu`MyTvRfvGRl&tGk43r2nm8&yoAkVRt6s=PyRGXCF?#x!0iPkW#fhJs(*TIQwY+
zSTIg>2C7G5-Fs)BFM0bV=sa>|rT!so$%EjR-|}N_g`tfvs986>ZCaI*D*ASz7^?TS
z-G`02^9=QerM5iFAm*!6zAuG+xpvs2UTL~E+ojZeuxWg|`sM|p&)SOq3CKvLa^jXC
zgWb!8;-KS2Uh4`sM$JDHrBdt((O6z?!G5Z0ZMlUJL9Sa-m&OIdZqTZ`M28loBjd9l
z*tY76%-o>SUj;Vq<*y9nd#h!a+NlmYIQ>^Qx$gB-mgZMZ-D0VB7$Mv$4FCFUw(XH(
zxm|*l1<iNG#Q>lNc>(~Oxa|$s^@_Lq{U2ZthlXELsmJ6?Y1qN@!M)$)e$Y`?(qHeo
z@!+vY&JQZHV=`d?wbucpi!(FX1RW|$V&3Ie`G(3y%SPCcW#?sAHMKaVgy2hSGH#UY
zP+VQ;Mx8;%HvxET(o<oyv9nC%$p@ymE#!WGbCCMg1R?A9sP0$=D)$|W`c~)c+)(10
zhKxy8f$SC};#dKH$w5xYQ=#CKU6Ze->=|t=`&qmGq)SRv<|TF+XKRiVr+wvzSskp;
z6Z5$Q@-xkm88eFfgAdelEVwuoe~#R`wuaLGUL=j>#!{{sw5dSyy_6rEyg5LIx#=u+
z#-<IzPIsa?kJR&e`X#34fFK+FN5KKS(Br6f{6npILz5+;GQqGUSYTNk(j{Z;%ZX=p
zcpP25dS6q@7Ob-$9cogmpI~r1JBp}&ujI{fTnXKWx6JHM_4igPL~)|n2W{Y~B11{I
zO&rYeOzK(GZe|c~k0K+AH?KKmNHu77CvUugly0Y+9Ug2ruHF%}o!c*=o!|yIoXaDO
zJ%!c`RAf}wbMk#1_Nb>y82apbvOQyE%rYG2ugxWeo$}MHV%wh{nL;~FHycr_AF*W~
zR5X66!`aYC=<CJY1Zksq?USBe^`EsdxU%nr&bvai<MtSr3Wg(1ZqUGm)bQ${VO>*b
zq^i_<9c>W(o+F+u)PrsGWF&TI)3kBTLz?d}JX_H@ejrQB)0iIeAbhtFQ+?g&K3ZJV
zu|7zVI#Q;c_Jlp;s7b8P=_6?WZi^Hyns4=bnqbXhLs<hIUNt;&SoOXEGV?g{t{OwT
zPLb}qZa!BLJwW;pe>biW{#uOf%6h#sl2ozk@_}A&O*8jt_as5*NWO{RkZ(@7L#jGa
zGsSe5K_)U|u%Z`N+)QQ91<9$4O?^=8b>~UB5{SAZHq0$7G~}l=+fga)()#fJoAXzM
z{;2JH9G~Jyp_kdmzHwozw|Abf-7zrY`^<^{Qo~?-NoJWcq_-w&73==oFv*c=v-_2q
zmvWHR65FoF18XYC7a8@Zzw||Fyh=xQ0)$~_w(ssn`MxFOBXTjB>xT-h$#VC$tu~oL
zb_g-wQr>pFEXpo&j!Kd;Syoun4F2hE8-5`#t2#Z=pUb27f)Q@c;Smv1O7}2U#B<u&
zLS~yOWN}&|Esm7oRSgCemjquxgzdBV!OJl^)_jX#uj%wEP9jZOSnXBpi#UI^@mrhG
zKWA+{cc}9dVnAXEwD&WRlToJE9F(axeP=|jzAm%5r4^LZX=C+}z5a)s4e#Qo%zV##
zPQDNAHx(4?nwmY5FAt^sz9c9~^c~gQNQk5I>)=4Fb-cyub6?%B@-ocoG*@B^^GQaP
zJ>)NWa9fa{A?g0w$qGOvw6)y$*hd&=%gyzzm7rsIMBQ@b_jBI9e1_DOK*7tD1HKas
z{O4T4CV5tJQyo|WAF4Rtj!;D{sL>58qNoNw<z+u^^%k74<Jrlu&2`Bzm{Gn|bOC42
zm)FG`4h{VYg8ux8y5)aex85pKKh9uw*Gb@1Gf43B<K{Sa&vj!>?+T`zE4<QrA!$%4
z-j0G8;w1cJ()Q6xMtTG^dT`m#ruR{}A8qM8$%K6<2<4M!T$9V*@0cHj&rsw9Ic~T3
z3SYkTLn4vtbqD4NMEka4$H8U3gc1hKKum5*dk}Z(Mbq`fCAA{)ZdmsL?XyBk8Qy-q
z!<oPAIj9iZLD<%Ew}lfUkD{;BR~YHkPVtLV<+cUhJ2OrR9Srrz`YiemhkKFNFL<tG
zCuB3=m&b2$lBD0VFo}oeSJwIsE?q^{hRkI^BVE;D46NFB+O@T9QO^;>w<8ZKEZSaZ
zTrP&W8)@$;SGa_4ci*9X=EQ0CjJn?AsMbTAnxh*es$1SmiC@MM@^E6-`tLX`^Nyym
zteDGvC2ye7{?w4sqL*5=gM1HzKRK`+3*#;EPg(KOt#AyIN&7ssP#K0#hCiXIExIM2
zP$_%M3<8ok8{<{{oTA_(wJqA{H}VYMe(agVH@^2E<t1}PCaChBD!zO%2Jb{v4TgQx
ze!pFj%aqzmtdMrqAx*0G8-31B4kedIoS6ECzG2=XWP4&v&Jz`iFAC52&DBJPuusuu
zJUgOV?9w?WfZ}kV5NtcY$>i6=E~-lXq<VUkdFm4tj|`uI0z7Zl_;oM^WeYU#soZdO
zP5(wZRI6Db?)1|7i|w~@m(PyTBTG1n)<#5}6t@-=N?|@bmWq%bT)j<V*sPqfBMY9j
z!V)i*SKOtSM(eB{l0^jXNrYeRj$a>2d-_M&En-8J@%hBF6y0gFHiBlTR`7>LU$&x~
zVQ<SS6Ze@7(fr(96&04(7{b6e)g{-8C422D<a^S)eIC3(T!fV{X7~#%-rF@SZYzJ&
zO1thk8r!y~i)aV5YNsYxui+Nonvq4&3DU{7(~0<k_{PR_%QAbPn7OnpBTxHB2YdIl
zhPWZuO=4#f(?KInT#mx>*W<W-JLLr-5fQ%EJZlFx$Mjcq7le1r9E*>OTH6N{*UBpV
zCV0_QT#oC+r7|w;M3lNx_^z&<b`4#r#rEuVt^i@id}&Gkq0l!yb>1=3Ms)^Zktyd!
zRcOb0kJi0M1FXn&Hm0ja#a+sod|s#*#4Y(KdEP9ec)dN_UfyBX%j(2o#ra5TG>z<O
zlyVf9%}q!6d%l!@3tXheTg976a$E@h0h1L>_+-dk`rXeUG~NC2IiN^9w%lZ_rc4ky
znM(0kLmT+%p<h`h#19$dTlPG=KV7dAba(3Q)&mUo=n92y&)~=Ps3MKck8>-R-Cr80
z_bbOnK;gKBgP-H-K;#44zma!a<5EzTT;$g<f5qi1A&SSbv;tz|PVt_nUdC7UF1ve{
zC_jnvKL_x#n~a0>NmsXDrzB6iq8ju+F(H!MwgRicAz<asnsS4h^F`u&<xsrwI_O22
z<fjWG_tL>_WJ=p-=W{Qw?xOHsya!$uBh+(aHC0BfAG4k9pN@lzSx)iNS|>*c($Ux=
zFX=G%K%X;o+1mfegS3TkQz29Bf-q!Cna4>yX<Mxq@hF>>+5%u7@>cI;I?q?#baPFE
zsXTxD$6X)v1^BVJ!m{<czPP5v$h~fqV{z=^XEMW0oD@7-WAk-GWrX@3A^mw#*GKD<
z^@Wx-pOFiCgmF84x|g{JxxwpYo!BTmnLT9TnB#>+?IR9eAnK0$Hh%+5y3g^%(s=ab
zN{zt7(`B>4(EaLw*)H!%`*c558WNUt47V8Rof^vqNRoK#xCJganCS0T7wvJ3^q3~}
z*L-i<3uA=lAM3U_clu&MInh9z1bcjHU+28&hYcC&?HiLm{w|#YE89nq4oI`Xz!K36
z+}}Cd4Mx%*#y-Sve;^{<YL4Go2V|!uNjEr$!B*8?LA}O#!%Fa>Lx3fFJTOLQ1!&5`
z4x?bAqz?$#aTjblc(jn`n~%Gm_$Lbzj&y>+S8BCv$9hZ$4U%IQ_Z9#QE=d}8MbAwU
zrfbf6_U|1Yz(@xcaJ(4&>rS4t-REOnP;V-k06RmN?z29{<E5Lt7?2w;kIUno?>Jzq
z8DWP%>O!~1Lq8w)L1(w)0$lYuKPXLw&eK_&oqm|KKKW(Mvg}Koh7qJmACCKEiWv@a
z-F$M$q}EcPVT&0GbKOF_qoCSur$kH4o~07*Xo&G-=(BS~({bN%aqLL0n<3{P4UX{@
z1VFKE{1^iV@Ao1`1+7&88ohrj)&<}J^&z-AUy$e8rfa(Qd;shqpbs&&=rf|Zhr$-e
z_I?J84qA>k?mw}!-nX}|t!A`bzo%bXnIQe8#hKD)!wcYGjsdD;%{y6&411THQ$_1S
zmrX<MH|&Az_!!`2X8A;%Ob&f;`c0_<4)`&IIx0zw4wm<77)6q8@hk>Ie)~jkyb9g`
zbWEGSd0<-KyNAxdW^*U&I9dR;K*UJXZ&K?)i^s+w>3A?YSdbu$Vc8~<X|T~QiHd9S
zKyo%6HW}NzXbRgitqc7_1N$<O&gs!yReP};=rj!J<TIHCE`^s4r9?z|6GzleMxy;^
zAkZHWX6IcplW(~Mofx|L13;n&xT~z`7+%N60y5+w8-OW+G`e8vXU)#~AIN$qz?fG1
zy0=>beDar>djjyXd8+rw`Uo2UrGE!t2?7YI4Ki0U(ZO%ZR?R6OiIr;#VE<Q?N=si|
zBSu1+3*;*S@XL6vvE_D9oXN4I30B#;y^2V#)GvgLrk^fIpT0kK0ktjy9*muYKYP}s
zz0Pe?jp0$vLXJG3$6uRAhRyC>C-R;WD@l#VDMfy_Pj?H|h=m#ow}X;c*At%LFuVGg
zhfCa*FJ?C09a#GPGU-Gl#*cvC!3$1L$v3~879dzTgMg7L4n|mmzcb|-)v$DH&EnJQ
zTu(L!PhArYhpo45c=v6Ta34@Qvm`+CC(Yv1KDqguh)AcwA=cxZK|+pg0go<09e(Y^
zvPvb5HB@QpkbJe?AAfZpsIDcemL1YNs}tnt@Xoyz@h21UGlWnylg@QYW4M@GI~gD)
zMN*_+#{+7m{#7BvS#n3@j>K02SSsQpHGuA0efZ?DDiEbWH^_|EXz!>+!dPAFH+gBR
z;{`Uh<x@eP?KcY{$0+i|mq4|@*;m4vqj~H@(!XW_plu1Rc)%8?=(z7bjF1j%7-?M$
z$OCL8HLPW@kgXlE25M<_6#{TWS*xh!3t@z+YUQqvS$IgI8`fHCMoOhy2m>Bc=n)t&
znv9Chg&?<c?2bGD>54wdElrN&yo2VF`iem5wO(-AYaHyL31gW;aE6&{Ls05*vLWod
z*atKro#Iwid)xrxqf=J9OJ0&IzWmfXPTY>pYpMu@y%2I10Kve%0wZS6LPO<Muw5`O
z_9DjEbi4$`eFV5h`&jL@6Aa-nv?kFC&q#b-Mn@vcFjOT_A9E4}5Mc*Nu+G-20Qj|`
zMiNDd=O8w~RvbeeHpt^Sdgm2J-|9vCIkwH_^xdQN%F}f;@kkh0GKnScXE{bT0NSlY
zui!eqCIU}Xb%p{aQ*2$4c9+#&04w#_iZhgLi*~ke4@rP9?nf&IE3!?jq?%fppZY;&
zbuE>ac~d&sEPe0)RJ)ru>d0@2uaZM?;4@NKyLe&H#KD1xjcB=hQ$?=NIq!_rd*%%V
zd?zHt3F`Kyx8jakJvPWtlXu4l<g|A!S((6gI;K{6{92IBG5xqHONBy3*CF?k<EU3R
zL}9RuWRyO4yo>>I8#$IZ5$O+B6R&*mfPlp^%270;%tMB!ot=O0ED_AkTRhv&uKmfb
z_?jh5-%lTzX}$ZNZ3`L+mR$qUA&0~`M`}f}k()F$dzaSluPK?yhmJ<AMa|0_pLQ(j
zVU)3F*VxsxLd1As3y=;kvovYqd+F=FH`jZXe#IOmX#EV$x5}H<YB@$J;UwyOC5Q?S
zRPXU#@q4dYY9~|tLm{g*dC|bNoh(@JzEulxo(=&Iy@5&voRbRzr4jI*>+g9*Vtb4{
zN)Yj?qU*uH5(_iUQPPUz5<@v6Hx>dpu_u@8B!-LU9v3vfUCaq#L+>nY?TVSk>I1%v
zAsXC@EpRVvF<1&$!u1C8vqq-)fV`~5E;24L$nKX8-p({*(@h#0=dp9jO4Cv!{<OgC
zs9=njEY~pI*(6|Aew#+$Un;2C8$M!p*+i#LpR*?c<p@)jDPedk5Uuti`s2O|7i&xb
z)eq1Z?-UmRJKL_g?-PUR@aOWfabqXV*B1?5;x%O{OfQ_i=XM^gYO>ft+m&4Pbrd^l
zU(ho1X#a+T=1klH3=m@(8v|r-$cNmK&3myM(Lbd+LIl+ZMF3Kf+&#~Pm<`Bgq4otS
zL+pijatuI<#9^%S1d3^zo?3t8$ZU1@6X&0z0xlS3rq>J~#cO?f_Z1)CVL*uYb+5Lo
z(AQBGC%L-|M@|{0eou_g4|(N=r!RapjmXx)vJV;jNDkvxTwV8!`}tIuJ#26(RwG8X
zJ`)zt;(oOmaTtv-1BUR`KZC(z)&8@6x1$0qWqu5`4*)KXa}_wp`NNuX_AV+3l{Y-^
z(y({c^flxaUgj8NR17SaxL%)$<YmF^@=%*JJ$)*@azFZlyTeN{|KOzY;h=GrWmbF5
z*|XheE>PMzH_<Pg9FR^iz(Z894eT%D{=gH&UG8O+vGYOlCBN-l<Vhv5KO;O_L1ZDQ
z^XU9lmmh@0b={>!Urp0rJN3v&vi8qAKcUv_t*-{yJ5#qJYD_&p4;cgkE>-Vbs@F9K
z3V^+8oGwAz_y{OCi%`8wti)$KlsPVGi`3pB{!wyJx6(Zc`<epYvbwNub}f!`4W(dU
zQCp!e=-iUPJ5q9aN*EYlMKwoR?!J73dG=4^gGC_5qu=-idOxvKO*$6D^}Xa(cXHdh
zF}z6z>IJCk2I;-*{#2^gp{_X$I+rhd22ijYXC)cTWWUTU_*s&HmMNkPThgaQ&@P`j
z3FU&<;4InV#M`%mLIAWXeNJJn9<io?l<@MZ>K#O&$rlC41#DQI^L#*ZYgsN6Te$J6
zUF99ZA(PrRlTui>mrb?=0Rj4=t@ez2IIX>7RMpDg6I5FA6UQV%zt;3;N}+B&yuQp%
z6{x~1t@v;;#@U4`2M%}@^EO`eOOfZhH#-KY=XgT7TZRlRsi5nM2K#<j_+G?gg0r6w
zFv*1-Po;;hrL&&pdqJDb(GmK+{?beBA(fD*m>-^>nYh%47RVrn-@(#rJ@vPK9U1`a
zY6n);uFxHlD&3+;N?2n1K>3db^-D&^xnj$@Io2jHET&;HD?4-DDAecFG$hY0+4Sp|
zJW{SpNgvg{oMhSh2Hba?kap&+&DusryAWskv_V<wNyiwzE;G&b#ghKQR*2lX^loJr
zhAX{xu^&$h|3j-0q>a&yQ;zZ4Jq)ewITVB3yWx;SbC1b01SmnISd@Z2Jb@sZT?ESo
zkh8yg2+Jf^#WQE5l2p{{XoYkkoXFQcsV-rdPBX957YYdW%7hwDf>Ov-jG-|udat1I
zbuE`09o|qC2!BSb-fYp^f*O~0s6MYiB0F9yM`Zu5Pb_qMK?Nz<_EObqdiOOpGz!|}
zT#&2%MVu+yZyOcRTJ0pAaPSD=)6uI>Efwzi$S7zNIZr?)i_s|<FTM2oPsRJD*3;9w
zqa~`}Ccu72{I*%zQ4dQ*Bpcn6Y1Ku24qZ(`ge1AtdT%b!oxfgr;d#m6_1atnAYajR
ztg8~9y+~C=rR6hQ!=EP_OPA}9cK#gJx!dF^$h3$IQea{0l?~tL;PkiyH$y*44_OU&
zdB<5Ya(W4Bz*Vphj>v}4bH|F^l9PIP+T+v!dK;b)M?>+jp)ajJHKwuL*6>_Q`F+hh
zRW87+TnxgBut0ww3snntzo8c7Hj)!qII<!Rr>9vcu;!}D)+<O-9YOo*pt`c0tPGMD
z1SnqPn_5>rOGe5skPPyTprkG!Okg`Fv8JWoeLBqkHnv6n$AA@sJ9VzT?D?42gT_CL
zo)+KMrp&#am>Dxd4{<h6pK};Wh-J}0ouxRWz3{=tAnGOpG%MG3`*od|k;i2~wmz{$
zDQ@I@!-If3FURO2y2Rju*6)4bJEeVXG`UCpc`SqW*Yl}9Jv4vl2_gi$K6}8ia<%-&
zrixsf?QGxI(m96?jwy3dpN5YJT1?+eQVM^{HxtT}AR1})(tanS*SNx%9?r6C=IQ=3
z?ygU&hr%ZPqi!sVG2H8ArLJbLLB)yzlZVDD?fTWOQOorq{=V9UBaT~@-)p1j-Kn{G
zMRI+IQ3oZjzc!1#(HOQJ;%A}x!!DDB6}y;J)DjEk*t$f$y;k|Yf@1?}LPsgq--wiG
zvRog_kG<Pwonun%UJ#;tk_<Ms<h-f%)O3^c<Kqb_M0~3@@i<WJ<ZX?56Lo2a>fq=B
zdcUJlIAufjPa@cBJ;H8CVvmrtvRigB7BdpCvhpSb`s<^W$u4Mzu&Y$gijK&EaE+J0
zlt(3M3{3aeI^%{(ZB>St`*lMlJ^rf^PIr_NI0se(D$tJ}v&&rjjM=LQNQHk&3(q!g
zlMA`fchTKI8xnrNAvbvR=OZiXY#vd4D(@_+R@FR?JIF9cuJE}{K0MSW{9@LS+NC2t
z04}7dc#(=~^c=F}HAWvswJ1ZSv_v_(WTz){$J77nn+l5wR&~ah<%bM89*S}NC(^rx
zb<1LYbk4_an0>d;kdHDvDMVa0MPk!?<qssOEt(*!nPl_>PoMM~b#DA~P1oxQZh*=d
z>cuKX;7>3Q6$II;hcwC(uKQV^2)`kyxR>FpH^sUxI!&da22DS`wa%2nA5-?oP1<_3
zOQ<_`@^=&95H$R{+|5LCNi3x-#aP)s>{t=uUv6Z&=*;Y_<QgHOI}pKFD9<y%etTqq
zz50D<cAU?+a_XX9NG!gg9Ij$J21OdMYn1{GcIfUP;FeXT@RmRisr)1N*4*e6B-{qh
z3LhK({z6-1os%%Z78atHqe+;)#@$0|AVg;7T)SDQ(#Fmgq&BWrEdlx{(_Yshm&mqV
zB!Vxj*bDCEMfNnLz5SMNpgr@EZb3dnFGfCom+B0WKJcn|P{24*!JZ~a=BUlJvuyC?
zoJp@Ho;g&+jRE=jt*p&v%|@v3CZnvPSlru^iYv(-6SA0rP`=-cm>-H;xm+ZqJSA?v
zh3fIa8n06_Z+3BgX2mLK?)WL(aZ*@)R@o%H<cjQ$n&GvD=|byBn4N7!Es+8d{d7$g
z5nZzqvX=3O;M<&aiFrVw(@`|4A+j-F$}scZ8QEme6`xxnZ{+1G5K`&`I@2`6tsAOx
z1(u1(ar1g9q7@@rxoaD~Mq9vuHze&ECOd1&HEbg}MMnC+9gl|saf+56S<|RT4wS9D
zEM}Ogd_2zx$R)Www#k438dyJ<7*FRI-;EDKS3n{_SgU6K$utujCjyAyz>mqa7lQP_
zVXL!-4L(BcFe2Gm@cr@ljJ)3<U?<Z<R^&@34bP-Qd(!pD3RC*UvGG6#WseM_1ujH2
z^O1Kitn7d+IF$@2t?7mCnZo?=aRJSRhY(dIHwl)F2HfdyTpqdX<x~|47+D+qZrrHo
zi3(kfVy(p9l&ldk3?5Dv9??Sts(fzKv)U^+W!b3CVl7G*QJ$wwK0uI8Iyaop0w>~&
z-ctkwa}cuR%8x0umND*N!|I^1rzYV#$$qMaFGu-wJ05-vNc(AQ2ct`KxBxVVna7RK
z^ai0o=u&J(3YR_%@9{Vp^UzmajZiHOw2X3z+F{|Ea=zvO*c+8FSANtJ&(z4$6Q@{4
z$Yq1`MSx&dO$BJGK9~aQIMX<<DzQ*47|`J};5nM;0<M0WoD)grJ*wgr2NKP4LXzK3
z|Ax)=ns_LQtTZM<R@H(KrUy@^dmMqQFi_oQQmd**6|?O2)FhcNsV!M7jnLu<WH~|s
zc;)R=LX4wwp&6+={<ymbcQT99SKX*q{TMj&485A&45Wr6#wJDZlgGi(si|2ofgE`W
z#CJtOyQB14Pd5;u-asUyXP~^@(Nhy{eLNNb=mI5MAAPgV*5h>PJbDjkjV~v&HP4+}
z{#aPd@J;}xXU|6HH$3hzWZtmU=gdv6JnpTO2=&2V=H0&Bi3piY4>3=?$h&u+_hu$o
zQFuhte7lt_`IhsyK(w9Ry#d7Rq~i>{BRVh#y3GdLeuh32CE4GY1bj1}q0OXvX?rz7
zAwd&L7y_yX$RQ%qaf;8;w{oFVbs-jn=b>EDC8~R6or+zVxKkiCu(`1JsiGO*+jDdL
ziSZ{N*S~ovFf13mBy7FSVl7Mf0n`-%Li~ovsP2Qu$@@inH3g<i$tfyphu%ENr+-zl
znhiq9C<6JCKVPC$T)huw0@$3VpP`-LK+2Fq3Cl@X^?@Hv+qPW9UOxi(ECH;TothGr
z&xgOcu$?sp@&sT);ByxTj}Yr0Tc3NceMo0TB-gyBFILV1=LZZ6wZw0&_}xqZ8;0VO
zqkZRF*sKC=yxayOFnizGT0QaP3tUFH;%LT4$Z9;N(E!~<q!|~26F&u<g}c&8kGDui
zq*H_dd=Y&b1tbICLrLU%5z;?XNXPOg;%-RpGSCi#@4$3^57t9R`_z_=RX>z!jcDeh
z6m=1-Q-!(eQ-8>-Ks5Nw7I?iD*v`R?YTmB)74YH`<Dt(8W&S{h@)Ywvrsx!P`lw*~
z_z#exT&NrJ&&Pehc|5hoocs=8J5h%+Zs7oL>FVPRSErBF`n?1|FV+2T3RvSP(_d-J
zmaHO{d;kcFbYdd!TEh34x2#&TRb`1^%y1FDB@F%En2-aOsY18gkA0pfSRd*GhOEIq
z$I8CrN<umsx(I*B2_6kz4NEnz?;iQ^2;5Q&{J01Hq-MF?2t#ZFHe>H|HPo($2<?{r
znW@=O12Q_!crqJ7o`gonD4-b7zjrM#fN7KloNleV0eL#~sEBcnyg>CCjtZ(MzzJ^0
z!uxMA->w%icD-KIMM!UXtygl{p;tFKLo$w0Kmutn6S~<I>PqPG=SrsG34H23<yObi
zwG8yHbTq)de^sl3T?8`6Qxk^SU*KHE#HaF66A<F7b^I%-VQ_;cY02=kXjPn#x6mUR
zs4p@i2;?MOwCX3}qVbl4Sqs<b<9Jn}3fO+?@f+o|<5xS+QoCNzvquxRFsEBRK#cls
z<DK1~p*xJJFcsFWjNL`WLRhX>EI8*!%}04_QO?z!hQG1#epf@k!fhBomI3?6CvPXG
z=O6@gkcyLkci^qRZH13(4RYVj=u&pT@7Ez(x;>ci7l&hO1)P60^aj!f{rMy>yc^pB
z<SZocvM6(6b|gDu=(#7)18VQjRma=Br0pd#;3itt3B`|Bh}-!q+-G;`iRtKBG5FEk
z<3d9c-~%b$8Zn+@IHy>^`^qP|`81qPN_72^rO`p*u?W1oi}TPe1%9mLr_vi(dqhS$
zc8eccT5hZCs*hj{LkITR`<$+BxZIhAb#VtU+g~473sObELoBG)g;G?w9EqJ}i^gL~
zrrX)2q!1uQ6nvjrW&5q6#5#9Mfo0L+U)0my3*@*$t8035RO8u@rQ=pWr4r0eLu{i_
zHCpn3y64?UtTC`VU*mPSC5Blx`|5`BSPxBE)<5yy{gD{CRJn9eV|V!3*<zHSeFu5N
zX>hmYk&q7h<6nY_o5;HGF6`$D-@d_%>6!<X44t{$(;7G2BsTTVVQM@BZh|zMiN7kP
z93E#nur8;?by|Mu4_9)dXAMZP4qp2JR4csFsjCA#4+4Jy`%-i5`iQS<N9~v(Dmyfd
zgW%G^qXFRzR-T5=8ACr17z-qwLOmR7<I9&X#|Pf^!j9BbJ!*z$3XGh3LLPGe4xU$O
zPG7teeDO74Cz@KrJFO3v1{hhL+EdTQqNVDOVmWF6i|$cmlMR8hy3zAs1Xvk7SOZL!
zXGy0AYyr<pLRJ+8Z-P3DYaGS~Yt3)Bxz;tqUvoUE|5y%am_F%`>v1d(73{0AdD1_W
z@Vnau4`hUG9C<Th)0OffFF8tNf-9nx5H%e2h4D?Riwcmw@0+wZC|0TO^P?Aw;STOd
z5<!hrB5FK*gl4Vq_$?e$oh0qO;^28;_bZul_`BcH7uQG2H3^tsDw=Q1AEF(=+I?PK
z+;w{?CCc{WuHUoee0=c0Lx3%I+0*#3@rvmH*NxiDZ1vnoj;3;l(uIIOhl|J4b6ii4
z^y7seck~Zzieo9N(?5jR2p0tm%KJnX&2%dT-Z&5HyKf*1;vMG#HJ<<xkk)+z;MsQS
zBKw1X*;0bkU9yrJrkhk`;<CXw9lZ*9R?FA>0)1;2?tBvHK8W-+zMK6<%M5f!@dO(K
z+1@pDs9SjpKIV*<D2CU>lT1-*$Ye%yCjeck%0YCU;30XS9iTX6Iz$*IsgO$tH&4q@
zw5VJ!MFM1fKV-PYyWLpibu)2eMKK{CWPVFDzpz%xeq{=q^Pw`g)fCBuRe}8CwG-xY
zjO#p_J!oyOu#daem9nU7CEKAFcSq2p2oZ}>8EnwX>&Dr!`XXVOmq&=vLOLfv<>kag
zHZ2#~9Qa;id_vU??C3sAnc@7pX|jPbnM1l>95f))$2~or+v`eG0tBf`Mac&1axc!7
zFjUhUh#z$-26+3oSR`eF>a!Ckx$DJ~lsFoU)0&JjRSE{VWBTdaJ#2V0^dpqi8Z45`
zuQVv7U=-bQm;+3`1H`HYyt|xvH+ci*zv};fxY7h@d2Px1P*isddBGl_A7z5CL{FZp
zk4RRUYFJF!<JaTV>-=<iZ9*oRF5nF+!mUcbHaAoa^x3zQp0)p0yM$=b<;n)*EIHd1
z?%#h_Do*7KZ^hvp#vV9)Tit1r@5-1Lnvv`a8cQ3Smdtb5TnU~7`GI=wPN(+Iv`*{v
z_X|LAKX_07EKDy!Zg2*VXGR`MU^ypf97NV`Wa~0js5l_!(VYR%t^j7xO8{wCDWh~Y
z0O@lOq8Q&ar|ekl<B;ajRJ+i>@T9N*>n)Dql{G^cacRIK)ThdTr#HrkH)WvcOs}Ma
zl>@6;#Ye?yLg+6OQ<i0FkYW+0?-S`SXkqV7bBq!$^W52fp%Zcu#S9nSoX2r*LaTQS
zyyUTo{aedfdlH}mYPwK83vo-nk&PK}y(Lkmhr5yO$qN{*y2vI|$fNq{k@Ryrfu}og
zgbUKz;mh;vv(X$Zhi?5}bMckJ{lvCS{vr@a4(lAUGXP=h;x7p8AWXc%*{|#{Lgy$u
zH^!S+Zgzefer2woVIDKd*WH!*I&1RFhEZ)Ik8(q}d3lzM1vQ`nrat28mXg{3TeBrP
z<SDBosw(Jyoh?#gIPOO3WJ33g$nrkz7aTz}hL;KZ9;AJ|wQy&@O^u_I;QhLyoT7eg
zk1#C|CAbvOCkp9gziyRtK-s0)<dy$OUR+I15z<KlUf{Ea*H_Ar9n><XCu9+5KV_>I
z5$yv>HCoNT{Q$rMRA?xh&ow;vTW0;+@TU(cevd3l(nbo%C!e`Xp<2d_mp7x3p>4$l
z3sS{9E&VKaje1&Md4jHV3-MJAoMwwR?*JUXWC&T6ge)ZI^T5sDoR~wTz<I?P=5~FF
zX^FPNt3mV}XRWCop90%U=;bAiZ;@?d<$O;lkU(xNw5)#n^}*$beYiXt2!p5OW#!(*
zuJd5QSRHHX+@OcN>I3x3)w9<Qlh1BITGsS6UW#u}m0s!Z9gs5&SvQW>n(^AKrwzXs
z+L-woGkkErLI3=!{SX(IBfyAMz3}B?{P6OM;BeSt&`%9EmaZDQI8H28eDSsO88yOg
z4<7p@(*t6f9~NS@6x<I5+(xSSh8nhxmyZQSv+Q&q!~Mq0Kc78m#(nk(aoN_kMEUR-
z1_DM~>9EgTLA`q#o(j&Lg8a025zLAM2kIJ7jEDeFv)`2gwO`t#jK|F<#_h}ncyUc!
zTr<qShIOH5PnT1|pW$ih)OWH>NKb?`?|zWZRX&;=lp>iV3AtTBQ`AIrOasbW`jJ4H
z2k~nnE$v_ZH+GIm%?e=sBxk!fmIa<%1C&KO%{aDMlE{5XBU3FN7T=!{w}VouJpWjz
z-slAl=qFRmc?ZGDY?VM)d6=;$$nXMRhW96J4D<Apo8o@F4}U&5Bi-I4q4>_%hW~RH
z)Sy3tPb*Kj4fhQB$l-(4&2Vu*m)KDcsJ(<%oG)LZrgeCS72`@;(V86`xIuoZU>8XJ
zONOd#-?|v+_y!lV7K<;g`}RM?9IVMD2|26CSTI29TX%ACfFlc8W_#(Kc!enG`rpAQ
z^cj+Osoyv{^DvecA=R|`wFf9c1G}nUR*s(4LR)7&g8D3ktq=UHO{qFB#q6&@5Dgi!
zCP_sVPT*#81>HdqTTJOLA2``(1^!Eh!E+}?b`0F00+WDprSW#rnY@Q>0L3$~Lr^##
zD9OK@+@<vfW<mB_BE&E+h&Tebn*O9WIY<xwtCSs}O`ah_Ivdd?>^r{0f9LE52qkZa
zM~}DGX0(`xlN)(HgRmpsx*-0pDc2LQn$-^lYBJ;I;A=W9MtM*YP{v=HYmeyM07^JE
zc%a<ph+oxGYYdbG4(x0;U1Xq=!}-e`N|F9w)A1Z+9|24}@jQp#WZglaTGaz18j_sd
z@@`jjg6hqaz|&2@zP^W?dNu$`pQnX^C+|#~ZSlugHH2BZP?<Q-x!oWj7ELC{VA2lp
zCu9bf?TY-r+V}6@B7T)m#|R;3O4%Qb@vhoo1LShsw!E=U67gwmJ>dD=aNZU9H`0`9
z*&VjE{8uCV{p+kv4bdH@KElFIu>xnd0A1DfB{9RG-lcN@)PISr%ug`YNoowj9L+)+
z<|8@Z`SC=Zyb@8i`IjOz`KJH-C0DdqTiokM{ulka<V-VACe4E`LPG7fiSq!MVF}6U
zk)yoGF(_)K`#(PtV(6K3`0pe9_n`{^e8H3c?K^)zuXzAm>Hm83>bZ#QYya!lfH2y?
z|N2^zX8Zr+Bu{}6_@BQmx-SEC$bY^$EXqDD@t<E4a%QG?|F7Blf4?ku;h)R<|GM?m
zGk(52bEZvK=dSw0e>z&|pK0>XEY>OfXAS)43G&Ya?w{?!Kf9NIwgmrd3I0FX*cWj;
zfo^vu167^h85-npL{917!yIS*(Q_lH>M#0xKIE*ua{w9nL;5;J7UQV+8>tX){CgNv
z6!#mjckdw!z_lulg;CN7i{u5`67G?YJevL=!IGaZ;7^p|GIbHK#-2o@(dHF^b_`yc
z{LLbBE{NL`x73aQiI0kI226W(rMe{dXs}tzH2_|XeWqFCfT~E9%h<|~C`LmAz;pwj
zN)C~n&!hf5ih4j3FdO99P|Gdv{`7AU#xVFF0h(exuJx$*ThB90Yshle-vf~2)c-m4
zX!{EwBK6iMzf&XnA0J&{1WbCC0QBgTxqIVUF<v^k2S7@;Y<Nfjso2Ma@fk9*)NVFA
zt$skUS)>Jy(=Xo-BQutyFh48YG3)!$ZY2jDb1N<t4G!bjrp-HftzK^t)hOjIkz%na
zo%Q{<zUAJ_sir(Tv#M)wxm-a%3^#*c1-Ut|^8R~2>BOG5Qdx`v^_pr~h7y*S(Y4Iy
zp@0rwD#`nku5?RHAfx(M%W1&gy^}<1@EJ|>ho^RunK?V$W@BG+i>*)K%S^I?Vj0v=
zB9s%ic4aANBN&==C+Z>#3CljZ#kAIOT6AlbnM>a&phA}@B39b4#-)R?Wb>RY@_0;6
zbNuJUYz28evPd&`ct7)ys;&6U;&gT1-Y0K2C8uw{Lrl&mZCz>3a?p;e79Qspt(B6m
z7yBaL2)L^CezPeuf7K))Q>UBYIlOmxmxhr?Vz~9Xk%CrZl^PYS&iNkfOQpX0fI@4v
z%Ozz89Xj&(TeSPP$ht@+mLqJZZ9tC6E$f?qW#h^IQ~<@(%&h<y7Z*nb&$(OMxE`RA
z*CZ};2;kbAW(SiT=nb?FRGs?+R;HBqMveOr?jJ8qe7^7=RhOItJ0$?^2xK&ZuqxY4
z_>lP!6TJDWNzG#}-Mln6_3t|HMW)N5c_;z^^7k6Y;_Y5BC-iT};_Q1yNJ+X<V&ndT
zf8^D`gjzFs4*}JYYv)79Y7&4kB&YiCV+dV+zTP$K@*%mHHojjhNB28XQ0v{?^6L7>
zN~!TUfj4sJ`tks>?lOX>6O5nxRsIxx-L-mM2?yMW<=NUzA0C+y063lQGIgk;P&?Rq
zkZE2IpaEp29AQ4k70TS@;Wa)X@rH4BiGxo4{^i3_A(a>AP$TdSF+&)|w?&*zdzXp4
z$Dsv%3hoM(+JAK?<G+usEpu|>y5Z61>qb76{Fn9scVY?an}RYo8Pf)~^VsWqW18H`
z!`%wW1cN72{<xNdG?$YvI7^rdCn}qLNcW7VG5S&h=g5ca+D-R>Hrs9}KjZtQrC$0I
zWb1_mv1>AiHVG9G|8Xg7H0V!2s`<!mpkIgU|2-ArJor58n?ewPJ?;J0Ql`uI-1=yL
zOMJYMI|3|{<9WNGR+2GNl`Q@A&CQa+9-9i&;yLrgo^*NwbfDCc!p61&z**@1Mp&MD
zw>J1`V4M9QlS7Hx3|sACYTnU6P9HiG{yoi7<0zZ$p1l~a*7{`X#YHZ8ql$qQVAkew
zkryEeFU>{%@a(C$`>Gp%KBQYIHsE{3`%I$~X%_uyg;AIh)*&U_HpjgY*PehGKhuWV
zEubV*t}If{>QHI$8*qN}{){#o{(F<h|9R5CQ}^*rhd8$j)6>3$m@Z3`b0rn%`5#fh
zjZv9Z$Nybbq<{2Acs1o{5niAvf*n;<`$p}N%lx12{GEyGNMLa*>=Z12(8WeqnZ8_{
z?T+4?v8(CbO?>ZHZ$)0-fLGZ?5D`2u3k3kQX)fyvz~ayDX1%>u0#^m}Nwf*;q7HEm
z@TiO4ai9kQnf%Icaoo0#HcVXThJHW)?^Uu$AIPeXeFq){U&KA7tOIjWk)3v6)iRK*
zWOG`Q@4!_d>3^NeS-KIM_d*yl8)!#(&Itm0xVdeunP(rpk0&(mpv0}YHEzi|bEE^H
zpcI&;RGbI~KDZFWyyR+4uwBO99$zNUgE~H)q_LUnBD+4{?>MWlPk*{Ecm`0f1KRaE
z>BH6d>U)_AXM-Pe$4@%gL{f-rccD9c6?|8Xwn?%oJVt--SSKm%Ek}+W-|_$i^W;>+
z($c%<+A<nU%+u+UrG5j71|2=RnY_c{m?PVL`0Eo$W>9f)r_s~ZD2e&Q+xm4@kwH%0
z_{l^0`GWNt%Ss8m765)XCi;OsAdRm{yrTa7laU)i{a~%;BNrwfKX8h^VR{4&BP$89
zlI8M_^!Hg(w5-EKy%e1$Qmh05@~Ol^UX^_~h-n{~#ulwtE9H_wAU~~fYgkAFxGCgl
zKh<Tbk!o)R*Hc#&hf*UQd%I2DVN`htJahMNhzwe&@l+2iyo&k-zGnGA!g^}&o$o;0
zRsiSpr=R4(D9&rDL8IMhtSUti{7&|D^VaWMkWC)rWXYPC-{gk=Z4pVWsaIz&p1FPx
zg5iWpI)5U=t-ReVeog$$SO)oFf;T=dqc;tJSp}S$jAN+y)rU#;u;X4n%TlceWF*mC
z26=U%$`09rdy-$|=jZQdrvXZlLv<?1fjs3I2R(ZCvC<*2?7^#96wiW~%~E&Y$jk=J
zwT0bR9ebV})L*n0@Ph#YJpb|Ie=o;5kUmR};l_kV@ta!*K$^S|dQB(WCdTkeOf`h@
z@@PW(o+S|@4P^C!%V|9K*0jg*&&ou++ar0MVQ=}MS>kqv&c^G^k{!;=PS}S)7Xc1;
z*JrB%TJZwO&epS9GlF^(n5&Ol(a26?Hook|5L4?AKf=AfIiOv5DeZzjM2@5A|K@jr
zr1gIdj$aFH;U^C7r0VCwfyX~m9G+X}oMuZsZ5qbWpG8F2!3bp~d5<dw;y6=n+vKJ^
zf`bLx@5q*B4Z8OZ7zE`rLAGjQHU0#|WePci{`(rQc^JOjkcHjT?}&ZVEP~+oq6Zqv
zX(^Y$>}}WV<eSo^_ZYTzQKBObeTe&4!<bRs><o(p_Bd0O#gD1{+`bFmzvkB3EMXUk
zfcjfmjjOB&{ro><y$Lkb?;Ac`DOyOYeal+1gzOWQHX(({I+O`bjD0XMRN8GJGj=IU
z#+EP`%%m_emYT5-Mi^o+8Czq0KcnyOfBx_Lc5<B4IUVMC?&o>#`?{~|y0tiYEk=94
zx=Z^b56wOkcD5^NSIR1W6L{jc%+)W!QlJV`Ey*LlkMYzulzqH@;EmLJ1{C)@z$Bp}
z<liPz9%d6Yd@K)D)O7&A&Pm|c+1-aw<)3T{rarz^d3H!&VD9F1R!p!^xl~mm8bAB<
zekYw4B+OPOiWh?1AzisVWRRpxV9q!#jS)Maw-5`h-9P2@UD~IG875u3Igv-V5594Q
z;};G4<`*3SEl8cZJ6s`U0GT+a`{G*SNu4X)>9_uHP5qERcYp(sT_SAi;8E7me9@@n
zS7QYPEcqa#*kqNll!lyUC&<UNWCRb}m%ux}hpbNJV@h*|KIS*sUs8b0B=1#fU86u<
zLN|xQtTM70i4Pk$Tw4}s+&O)Wfw1J_Gh5zI4zgLDJcJq!jOuQ1uemzx$_%#RJ5^4Q
z@<zT`di!u`!RnoY`rUvFV&Etfm;fL1RX}&}W(gb+Y%yCan@o4c4N5{@5a%=1cs2^G
zpPc``Ugl^z;Jp8VX@eSAz~A8JUq{T2AK<VR<yd>$nNWy<3?gS~U-Y$|C19<6Ig8Ur
zDq2EAe5lB)pH8uU8TNMn=(UXvY>SNX<1jE7&oOgPg6Ho5t*HdXnvj_MtF+u3mphj1
zBVRnnJLlBrO-=9#m8NxL@pt7^nNIFLc+i<3^h1*K+v!^-YG9;Y+e(i@Tomz?8p_-0
z8Zp%V@c^7*MmTG_v>sL#oshG+{RF|e+&h;V#n~(UX`KlQrclx)Jy3X^Me33|uO2nO
z?mKR6wu<gtQfUYnR=s=Nw0qamKDCiG-KB|qK%JFO)ju*zClZ|!<%{J8bo^%e_6gF~
zY-~A0b_@;X`vQ7sCLve}H0X@~zqdXyZoW+K*IiWVc<)S}dEOo0h3BuINsv`UXEhnY
z7u8p9NNeWhJt9d+eh<srSDv0Q2bq&ltd2L&H6xu}>qplVkJe&PZTM>`A-2aZLH1h*
znmST)urd~ZOF%=Ze=;EZ2g>XlmyXX5;{(l;rpj`cWIHVaO%s*p6`yr!h(u<u<=j2n
zxFkEP&_(?&m+Bq9qt^mU`}y&wf6kaS;@g#r1X5^E*&zD%)OIe0Tc|c#%5pQ~untk$
z3(9*cg;Y0sa6$Lqwtg&IId_ece70L%;ik~a6f`kM<JbJy?#bIHl2fkA<@+hDep;}P
z5q@SL$(hSzjrr7h9M)1i>huMd_9UG{dryck*Sq>RgEKR9c&BLHiza(n1z5fQuU}q?
z2NetddMklISj(+oF<UPK*30-`=fWoOVymmI@v+EH8tH#N8CkGBajf>IAGG28_rIkB
zYG+4@0W9Ntyd0yp89H!{UKvMy{(ysNN_MWRCB)@kC%C9kd4o8;@VXAV^%B6}{lG@4
zfQh=s&+9sh*|iu%8=LhDk@(jcjYX9jY=UXU*IkU#$keFZQ|JCVK6L3`xh+|WXX1QT
z$7vIYBmynwc^%=4PaNyj6owTM9`@Yavn^3=K0sw5J#8V!^zBw=&Kx~WW%^;f4g_q}
zg_s|(kHv-+!U~kHvO%8<if%<{zze63AZu<fW!4v|!Cg08KjtdaTT9EZtFUnX!s)9~
zLPVnXQ~;brujfZ@lyxRZC#t#Gf+4mE6~&&Sj$rTRhi)pt(`*jb|2TL<5H%od;nvW{
zbkGneT&|s_zh7T4U9YNcbM$#dYmIYsbSPc$<KCoQYCc(uu-@W}gSP0)g%8$ns^Br2
zM#j`i8?_!bMZu(^vCCt?g~nME%J$ic*xXbzgKS;PT8uWc-U`kNv^=nOD<4<{de+vm
zQSW8zOwF#PXLT-7i}we@HSakH#;ciRrj_TJ4iQUh+c^r#6%b#j#Jx7HbUZ(NFVfu#
zbL-MQ^LZ`5Kku-g3QwD3dBsxqpNa*C`K&t^{o95y@XFeotThXwI(-ZKRmqaB$O-@4
zg)(Nr2Xx12o&&eTT&!1RwuTUs5%gI_&g4Wr;U;44c75soH7y$lXiuQ%>R`H(#rtX(
zj<&?YBQ;Vy{q1lkMc(o%8aE~ne-HAxUn|9C7O}KTH?gs|)FxnvC9k+4*QSbMeE90y
zrO=-s*imE0-V~~0kLNT_!&B1hB+~hePa57cBkUS-L!)%<GK5WVBA|pywN0_;mB=nt
zFvGRTHZKfU0y&Ja*^168bxdu|Em`ZJ*z^=#1iM_KS%J|ESf93qdjYYLAWBeD_bFT!
zWQL`4(@;brDWFlIawkdNClOqUe9=`ISB@=CuBx0Kpm5gM;q+>ojp22X+e?O}{{<?{
z)0njK*=9Dhd%kqQ8@zhEGI3$i6?R>46FqFZR1YQ<&f#a%j5s*vDst6ZSB$-SahQIX
z3M}aQU;dPyWF^Sxq}_zRu7_!27(K1yCt~5#lpuw-W~s-KT=~E}%XpcToW-4sJMc%X
zW<0?kzE)-nk-FO`hkXyba;ro#ia39*KpAB8AQkzx6epeA_yIRP9v4^*jK2o{f8qMv
zWvOyCz5KBcXY-z28e@%BlNLt~9|5d!a@H!|opga4a^E+cICn??WL8I1(ZfS)biAVo
zgd@XLhMyPo8q+N!4MLTFy>^^<l*<{e37YwEdZK$0I8DdnhFhd}UMA=lr}a)8UN?*Y
z90#tnHXEb;yRmE^it*LVW@2J#6G_H&`gvWn=SziB;n>T=&4gJTt+ld$98s9fbXXWI
z`|?)%7ENwUFBZAs4H-C-pkwl|?STUxBpW#NGq&V`t<A4n$spyoBwySwjZAP{)A+*T
zt-z-6cJ}w5m+u&3rTX=smcYKQ1S8vgzkaZyLVaOTfyGM2|D7=lFLj%mktYXQE9XQ0
zH1Gj+%XX#q{A!vGE=lxisTlo&*w`y5qauUWJUMlsowOh_Y5cF|Sam2I2wWKqu>3h}
zhHv&)W!7SlZTQi_xWA}%v;=ApIcSR6Jle6xC~eG;z3DSBjF^Qr`}OPMNc!lp5C)BT
zL`jR6Turbd@=gXy1-zBcD$7}V-`TDPOK>Tl%!&xF!EN$;51+9}O5UDM-`jjb{oa%>
z>q*Ceo^QN5@+znly86SO4sP>e5w|w|XYKOS{jb;P5W^h7N%8kn==DX=9&jdSvY{Wm
z%%TI<VQE!6KD>*b+&4K;MC2>;?_=PdE8U!2Or7mIJ>y~ZMFHhLspC8kkeAh^jw)Y=
zh*_cdQT5lDPXo>gDvucW;O9?_qQC;40;h>(g{oVMF3gAg3cwtbu*sU5rv_jt--?&`
zo;o%@3}f&ROv;v5{RRUHK=X~%x}@;DGDhj0oAEn^(Ry#b-!WeeM&s_>9{4#GoPQy`
z!e&V>r!E5*5~gl8DA<_RdvsOO)iCpMc9<b&B}nv>!`W41_Ch2*jb#YaD_rj@>ynIA
zn~LWvUa2X20EtTkj%Lmr@YJLnmGTx}t<CuJW1rx!r!PnjJvIH>7CM0TP+XA}UE<Fr
zs(X&T;cLe2neUh`shv~q#m(0vec?k#_};O&g)Y48cFL(r)XHZd4dUDh#hhoYpM&tu
z(8ezmaP)1T^*_aS)Y$zMko2wHOU4rb1y{E+<)P^0gbIvn$&uvQot6JY7*TL%S)05h
z3x5K-`Ofp3B{``VenaoqQ-2GJGc`A62wY^{G^_T$r1AkYxy6Js;YjMoK5zcwV07o=
z+IwtiERIy9rSo``2Y2C-*RanHLa=E0uf=%!r*E4!?dc|B6KlhJrkoH9r(hQhni`ay
z{F;t494gn{?UoCCq~{H!l(=Q=5JI#w=<7FlRPvi*a!7<N2RAV4jphuI4csA&+1pAW
zCjzkXEkB@>p?AN2voGyOaI+g&sDzGavvbV2v}_1?>@8nokUnW)h5vBHu+m9w@UZJ0
zmVsl>k~UfLaiKZWEj<lIl`jpP;DMX+KP;(b`bwcngkjb{-o^F0&@$3YVAIz|eBjCY
zD)q*^`k$n#lF)egk+1|})olDP;O03Q@wW3O8|69$h?n!mXl{;3hvv?k?v2E<Gls5-
z$j&M!5Z@?8H$y0U4s<Ui*Ti!eYVQ_3WxHZX>nOHw553WRHMpHNbv!a@R3$p<qi4IE
z^!jfrdNlHEhXJz)sDFe!j=C47^6^N68w%g~oWQNv`#cB@OeuTCdf-VM=Rp;wBR@{Z
zzq8=EfPnSq6lW<3D*B|xyofN~#wBTMhGe5++P{}L?x<8xz}Ihc1B6g}Qc)oY{m$&&
zitOm&^gn+-UWT}oo6lip82bcuPbKSn0PC1N_PIbaU>mF$i|>5eTY278>rPJYtg94u
z*C@XY*$~)-$F2}YIYq@}e@Wk2XdR*XO%D{L3vG&L6^NgV+Iec`8z@-v`asaXniD@*
zqaXKHP-jS=Ob@Z_Jx>apJo$JRA||Jz{p|g$C#Rv`G)`EK`apK^V>m;cWflNb_`^kZ
z`>}_>d&8rN**6}%)0L!G6oWo}IDnImJe`0~JN3edZgmI2&l^MWaXe0_E%@-LV(c8G
zwezwBxh$Wq$&a`(k(E_><Jf}OlUKh%HxPuf?n*YO{FFc<Xs`G0l;iRR*D=fNKKDW~
zD@;Q|2^-$7bzdKy^1>B)C8ai6+^q0WjzsslY2A*q!$Q$UPZ4P+xG*q9M+sD<d+86h
z`BdE1DgW3>mZ)rAuH{W-sGy355i~=Ux$6J*8?-$^v5;`$E&y!%$Ve4qf>W&?pGXdj
zPD)-cDZ|;@K0gxawWb1&6C3orjcDtU+<5@}c;_)?4pPTvWCc4;%x410P9=td7u>}d
z9U0y(FeOh5Uh98*y-LSyzmvs*oll@>m#b0y>#{pOo1JmE_zsGBXX-AjFjV;DS-|e_
zBW<?APNHR{@W&|f`dnSW6PASXpEoGx5zvogdSoAFqI&rjWY_DX9nbKywtMXPQG~Km
z@Z)ai7v%YH>T#kRZ{>uLp9(2GoUA#nZz^su9HQfyadLPh!9DmT&*5_K;A>Osv1?yr
z6d<dIM_Ex?7p_xeo7QVOxXW2+zZz|;A%4RaIaCk-6A|A5T4>_}9V16zDU{a>23hk+
zDX7s6Zi=`H1m#0$`WrX|$j4_yR<eicVa*|^7=X&?@7?jRy@UtQ^&UH(YIldf|AfI=
zgU+!LCE?kd4RRI(?%%BI!II?$<?gHHLYn3H@dUG00JPihi|WvPbT+7vKxj_rfg0*k
zi}LsJ*!$f%?ebplw?fQLE&9ac!rf56x!AJkPIAj--tfckFfQd~&dF$?<i|t|HG2#^
zQEbVw!Ut$U2AwlWGJAyc0B`<;Ngw2JhT}xAwez^7+U_WwJ>$zw%VS31J^EcJ=?s&3
ziBY>|c-c7Y;sByXCqy1$5MjkhL1S-x%<j}RkY#(OjV1Z06H@~0+3$W~QDka?@*{xh
zZWnuQ<B*~5i|M{-p?JP#@vrVRWr<_bJkL#e8t>$XWeLAxwK7pE9FB!pE((4$g3g)D
zaw##TxavE0KgjWi^6O4?0h23I`9##MrS4=2s@>Xp2}1&knk3H!`xj%}tPiGhBc#t_
zSZNU9_tiuRlztq#6MVE3K#+bm?GqG+CYIVqrfKizj7-Y%1}(7q#z|Ic-!!=oNX9wH
zu3+{GzhCgp@EaKbhn6uA)F8%l8|D=#aLkSmiYGL`?Sbm+9(6yL!MD@e1O}ALI=f4n
zm>^;4Nkbt)qrX7z1^@18C@UE4=D+_&u|I$w2uDOcPJ-~<*%w0g_@hu-y#I%SbP4`v
zY)6&Iy*3R=YB04rmUUtO-gMpXDS@5htU$d961E`xvPn9f<e`Vwr^pKq7wzBGnLENq
z(NZ^FKsh&Z(7~5JS;X4L2FProqR`U86ygK=wR})92C*H&pFV=l7_kcr)(ehCzIIg-
zTRXInastTBu4P1kC!tB8_S>T86=6QvATrbQr-(<Pg9kKOAiogwC?rWMWb*MIzq}9Y
z&1a`Q7I<ZgsM{CnS;K+G#b3F=`o(p-wV8GUhj@A%`Vi8zqO){D0QhGNX`f*5Sn%Z9
z=Tpdc4eesjK<A$|(6jl17OsXGdNzfj{o3%a8+iZau@5<+Y<QcjasH^>?1Cs1J0~Mn
z2$CsnO)e>Q%SB)UMaeb$#Kcj`*5J{x=E?5B`fKokxwB3$T32uO2C3<c??tyoS{IH>
zIwLM5?u#fr5JEOIwCiN@|3vgcY)jytWF^eT5b{u9!jtrr3w5PfnVFN8TlfxHO7_&s
z<CVs<cW+Oq^}SGw*~;#$!jAmPg9i!JN$f&i=TBwS-M=2OY?ybB;S3?1?JAQ9SXCu!
zvcK3Hq>R=ajguQK`eD*jIdNf#U@3)}6oyQ<B%D1q?K#dljGWCoC{es0Vde2n^fow^
zeQZzb2v&g=DtFRgL$y*Aw0-=WTlWd}0&kNP8CXc*+Jr+>|D1_v9pXy#N{V%XuoUB*
z-z`}NQClrxM@K)=MXW#2i86Ap!Czq4Q3+-@zqnx_w@ZNX_Al$SU`UF`AvpT=ulG;(
z4m|nvsiU{IDCv*dlqNdhD2G)f)`xY#^SUo-k1xHi&o_Iw*=L}_2FXb$mn6CmVI5ta
z({#sI$ED{TIz9Bs0!XckgkoGB;yB&ni}?_LRgNy{?r=)_hcF^LEok+%z^Gd9L44p2
zmC-OV`8n<p-K~|!d12(QGN9d6@5NQ_X~)3~(a;-2H@kaMB9Sc%9oae@fp^H8ocGfX
z7JJ>X*p;$I9p~0D{9vOPPY%8-Q2}=CEmA{We8CIMe4ySAI$MF?S%_qE!2hk3GOILC
zy=$K!2`)-1It}DMD!@C0^FAsyG4-YT7rqg$tx;|N;X*@l=ab75eU-jmX-$WbXVl8?
zRtQKftVF33s>5>c|0JnI+`9+4b5e2<dGkEg=+L8MJkoz>>N3_j`U!k><9krnk9!c$
zD@vxQwuB)7QAc~WH~XVhWs5b;@X@~pcTY*2#-MP9fp>%kN`wn6oR@9v8PFGn<4CIP
zE+YH61YMLTI}M$DwUH#RK5z&*ShO0Z+wk&~UEcnfZ}#qfQb&-U-DNR5OTjzKYD%=K
z1yBS=43n@kCkoA17qqXUlTHm9JFiJDlL%c^{q~-Ho}#mnVPG?yO;a4MzKuXJ8ahn6
zDkmCPa-~rSJA=jngD>1Bb_P2oMV>aWGa+Z`g6JWp)Z$h&Y9ia77cHbfoDcfAvvBag
ztTNP0%JMvM?9Il@8zFjim!-?ok4otPPf&kbLeK96HQ*|1;3UVH9IomnS?CVgl*GIM
zj_z^yX0qR5tq~{8DgV3kD{2j5{9Vl#9M1fP=+dMvD6eNUc%44iEre|Q9s=DVPRdq0
zv^?Nhs@jVy69kizpsB)69FM|JL@-V6W)iXK(cX@-x;vdN<q^o$KX^3=mh#zhb+I96
z4DoeyoL0R5x)gb-@?}MH(bVVP0p(GkYl?z)-U)o}h<($UD-YubD)!9!Is3KGX+wCF
zw6l(lr}OpOCLJK3C!|gmFZ>qs(pco6`SLQ66Df=Vz44u;5O(tVIk@h@wg44UW;prN
zOVFDjv+2LtN2^%o@48MyQCg*^mCDKsm@&_y&|5uf84(o%RG;ij`cj@P&=h1W@vmw(
z$NHbd1EK_SC4<ZiD#%28pPa@6byk-Jg<fs{KoY26U`DVaRn_5p21Us@C_np$Yp!2o
zMOTdE_30NuH;r(VeCeOSrRejM)V5DBP5;;3%F8+0J;<-$p1!*8-{ppvDNe3)_ktSo
z>UswLep7rgPelAM?AKRpLg%BTGuP6D3H)8R;fC%f%ZFRagjLwdjN`lZ@506N-AL%4
z+?ft0X-irEN#>O7x!k?Xe!Q!r82|1C_KA^qRIlmg@OoK-Y476HX=0iZTvydbh+WZW
zS5gZ6e0Ng}Py@i(o+V_j#C>arPD5urFgGa3QsDwqu!(`#bn~MV8NOfl0X@x<3n9C=
z@^^ZoLDH|Er~2uiQ?zg2J4#*%Zhhv42&8_J_kkn<m*;w_2yKR0mhRme;SUsM_F4Qu
z4h5|GnQ{G;*nNnTu_rj{Zk8_N`}WZaJU?V^zo^SdP4v!kyNN%J_^zE(dS<gG)8RQE
zcpfEGR4vYq-F+0rcKxm?M|_ovnzo7+h+(x+Ka?1K@<PQW<}6)ye#`F1Hl5GxmV5bb
zy6;n)Vb2G~yxu{%9)TAQSawaaZmfoMj<ZCB2~`ufL%ty9s8orx5-9NNw|gqRy|NUs
z@;tJLA}IQ$c5A#4V)Edc81?nWWN_>=AnX-*O%@(~D@ksW70By(rF9+A?U6^VzkiDq
zeX)R9Hd+r(36vyMksn>`rC&Z_3obJ|`MY*qXjg6sfUoV3#~OZH%dwQsF_Zd~REXVu
zhyQ;+?tMqQ8vBMohqbaB>c5VE-dPa<yd3b|9G?`QJkBts2ZV{T&wo=3#&kwiB)b*h
zKUjBvr!Op=$<lxyz7MQ+Tdo1vN$8g4$Ak!<UboULA1DZ&CTmG7F$=$8RpmLoSYSf3
zoXNre`Fem{35~~GDoYGZa!2Mwh_xlj!w>Rizt496wsS+hY;eqdF`L(tjkn%3MF0AS
zLL+9iQkrDBt9wcOIUeb_dDW<G&93?Eqk7>SsEuyVu7RYweDAi4g}RG=Iq4+_s(<>r
zo{I_d&ER=D<v70nIW`}0(by{~?Ca+WAjO(iWhVovEl@PfcpQes*i+m@C*7r;Jizm&
z93NA&a4$WA;JL+{oCizXuGC@QYdc%Mgs18K1!U`%TGzD^%K0*<&|zQfNe*2aW+Y{G
znZh@w3&VNmtu}iYp%)sG!fhevl~})65chYCs;*qYNm-idq!^thbS=tgipsav5XAIF
zb%}oa?@rNNtm*Im_hzOkyaAPd>easToB(8PQ(<Q0<j&J2%w*#qA@+evl{{AD2BgSP
z_}VOEV01jjo9$Hc_yjqQptBJcwN!-dNH>_T2O}yqq{tQ;o%$)$p=HBY@-4G2ysuNU
z>8-(_@Bh9*0GyW^1B@y;)4Za9EawEPJUdRthy2Gtoi8CT$PzqM<GE!nzWU661`57;
zcnggoLH?v*=@=ZQch3Uu+Z!Qdx_mJPo5H~3xq@tMRk2yJ5$PoBL$4k`Lc&@UVtd03
z;ydSiP(QJ}XV1oSi?ZDoRz&DgC6L7M`&iN0{u0vb6`dx>@xQ}r8&pVyFti@9(|Y;>
zJoWiwK)`LUG|v(r3DK#>dB`|n$qi^(#yv)<Rp+^7HbiKaVd0-E_LwrV;50#8FM{@x
zHc|T?93Gr@SyD^$$07&2^Yux$F0dKKTrbyWU26Y_Fh@=({-aqIHZYdnA0#nAQKCmU
z2Ol;*icy=q6`t9gOP*Y)5Sw;N*DXF=C5*w*wOKX&x)!6z2Fg<PRWLADYpm`i^YVZ^
zN9DH(UnzqoO_fYa^ZqR!oqDG4uz34fO^+7Zr1m05hs<9_t^oWpfszXIrGNb#N9Q>R
z4YdSPjZ0G3hN2JVJss;t=sewiz02*Z9)Hv;*G9@N8BM=Q$Z0>s_vlQQmmZQ6v&I72
zNog+K?~dqtkx(85wXbTUK&sQY;O*KWs{G@aJPh^2xnO_hcxvYw%${9$=WyJmo-(}~
z$n%%Ny<A1Fh?AGQ|At5i%f)*1s@_V!R^VMARuzTN!j-+=>^7Qa&tpeUx9;RguT-Om
z1k6MhCq9AN<0tZ?%@#K6I*vAl-J3x+h^R~_=R&*P>QtK?&+bWJSE<nt?7Bx~VGlfD
zoLjFqi#|ZiRYO^YXLe{4s#M<yp(y!+%aOA^uZ{*Yntiu36Hh!p%KPAnrUTlNN`It;
zC@?SJC_SiO%w@E88PcabT`=l-VYA!cmPb8dJdBu~?n@${6Ez~*eyeCL-e3RMh^JxQ
z=R{Wl*Qa2>d;;w`cE;?F?`CG0xQWy@oS>pCm=k$wc!SPpehczN2?4|6Oloij9Iw=W
zgc$M1>l*dyz-%D^xT!dGpRD4lBQcyNxR-&*Lyqez7q@=qEfzum0nJzPtFAtQcd=%o
z@DB_2E^QrZ&odJ$I-4JoPHE4s5fQm7?imJ(WyY<?LcdWIZo-SK{(z-ET{8Y)Iq}2b
zRqwqaP0Mo%-AF7N2a?(HqJ=l6oyCu<`_YgY@Fe<>`>pLKHZBs#sy%PPVyf$_D>h1y
zo$W|!&ULDvtEg6FTBU=N%<hWZFFJs4A$J5xDTi2*jWrOhZQDV+JbXSka_C@N6FE|3
zp&w~mY$h|I^4y4y#p!lcYCHw~sWuy#`tJtOJybu%tzVxna;-u=YgIJ`L4dz(Yo#|E
zdfemVeFs-x;fAjkq&F!EQ~=`o&g9I2&aeL+i&O7S&ERGzsq(Nyl?OT!yiZ5lOgI8&
z3)gurLfqS@3gNZuDD-Rx^cD%oL4GQJ_lU97)eLM{Tjlk-ufvJ?(F+NN)ZC64c~L^T
zMIQ6(>a*!)hH1XIA{V<hG4_S~k;uZ<gyp3^m(uTkj^sH=qQ5$FpLLXlA}i!YDGG=N
z;FDi<F%zGzpx!WazhY@1weY1*nd2dPEiO1j)6CK+x#^1z&njZ?om$}TdBD<auj<F0
z+cjr(UgGgXcyQ^FWXzd9DZ^Eu1Iy3<xfs__Pax%x=U?uW<b-R`g838R2Eo{l$~sQ(
zGRgv2zL0besbd2@PH=<gBYG2Y^tshF|M~Tc)&rBo-03ihRXa7=jnu}@pqgQ9BTDh(
zD|<eFj{d+RB<efQ;VQ?fEYqxwcE;qTA&sdu!v&P<6&$WkRm!CTrAQ!prYM?P9bxW<
zyR9fQ+&-C{PH2|((dwWsce^s&Oo!vTt`dqhFxkwH1)cZ4kG-thdN4c-$Ddfu87Nv!
zZX3w&&)>3g5NnR8@lHAa<h=eSYkP4B&cxor*JJ%$l%~SQ=3C)5I>PFk1(bd>>zh$(
z_}|GZl6t=H)|uY<nGdHsLh<1%0F$njXaktjJxr^H6HYrYf)m{>XtMRAlg#1X72Q88
ze>cO3hqgKrq-(J#GqcTMHF~dn9@1e#pFSEyv8uF0;(O}VEu#oT^;YWZ-07-jdI}mp
zmPz!<gucSAv?qpJjC#~M`G7|eSMc2})QYLK=SE70SIWH|O*3&^2Feyi&6qSz$(h#G
zktBxIS`f1z&{W`~ldG9#2^C6pW0H=J>PS<L>-0?d$}+RsD5*6*Z}p4FIHOKJW+yy0
zSyxp{y`5;N1{t`h;Sw`DfnC-$8`6QMsj9wJwYa@BgtVt9WK56KUK8auLmdEM+Jb~*
z2C*xmvkIqK_YH&7mSO0?HmbTR%(!q<wZ+(w=~rYBF^$Frh#@A`&8&%6HODo?S3@rQ
zIYKB31+;uDJ$`FgZ3>g7Bml4^IvWf)lg-Y=9x4BBFm3j0BXB$s9M{%ff^&ZF={thl
zE?&j1vP8e0+=CftFw4hb+Th7T$Ew~<t7o$naIM!gZ}F3M6Tu`R!hYJ|_1fn1ybDj|
z>F(47qAtA?SZ(+33&juK<uI)(Sqolq3WB@fVsAe>rt%sCZ-|J&{|Uhhb$HLch^b8J
ztb5-Bj`)SbBQ5>XRN%c~Y7<aIR;hu{G-VeDF&sR_79TZge`s`#(hNQG=$$j~?!7_7
z%u=(m^arOsY*p1G6=3{qokmSI#Rxu@hjVYUrLN(3hvw;A&s4WnMNE}pSsm1p0@Yqc
zI^S}!S!i`Z3?|Fc!i+{BX=W<q1`Gw~5GS7-&=c%eZ?I<%A|z_l17I*uPg_*p1K4!F
z*l4l<st(%-ugEpCsq%rW_N7u(buWpH)9FgZ?67xJsen*dtoDV)X+X>jFw(pngw>^#
zbfe_1#vaQm1x##K%(-Mk!n8Y=x|qr(5BnF31E$0-LQ)s{7=M9D2_HjzK%F7xs&O3>
zlsA*&alzy3Qm3WHLI6T58*CVEMwL7L!if9)+Q-kKI?7ITws0+NddD&>0SYA0(n1dV
z0fP0VaQQ#mz#V+7Z&FXVFDQ`RqJ;7MrVnsnqdw=6ee@REw8)h$C8VtD3A?14%p^Cl
zg^G#goy&-Aa>S-(|Eyd&fL_iPas7ZiejVO|qI-$L8JKM~Iae?q);&itQ&%;jP5=Vt
z%L6WejW&bWWjK|S_<C8G=KYN@j9M9D6h7d>!4@sSxLFt58AmT-55Thh3qcJ8%!Ja7
z6ahGx^{zNgd^HRj(Wy5U&F-ENLQ1TShPD*qM^{#+)@B0Qo*Owc@AJca0kdwjCv6U(
zs&T2>FoDCrxKdgeBKh27ERy;))V-nTAeaW7(k#Ec$-!;B)ItXKhY#w|j{_u##J`zg
z1#9MAE4t&87pcMHEcmK<x`zB_edh`SI1kl<`ii%VOiZ09UZ>{i*yVbdI0Vfjpv4O8
zCzd?dL)V<3l$x%4(V=N?2rzMQ`MAxi^3Jo8S@(tmH1l-L62sgjjA*vqH8+*QU8up`
z87>GjOkg{M{&NMG%QI_HusK{Q_2~h!{vu_fg}LaL-C?MMto7*ufcY{33|bjH`xC3<
z0SQ%&@EKN%GVAu~h=YRl%Uf9`*GcvRcM-%B^xNRHPjhQl{cTp=C56}H@SbwOZ#`Ql
z;8<x4p0deha&A|$Ae}MTS@5h21dnTpFaZzrzRH45J?sFZNFb8e@3C(AaNM-PjO?5b
zIJMp1{JDAL`Z*Nkr16Wjyi%agkle?!-3d#u$%cROOd2J`ocJL-dmxI(BOyoUl%2a5
z!!r?d^Ag3qVE^?fvdBUq$S#ro=_K+UMC!Ml0`Ha2<Fjaxi(A0~nYKtZ`_utRiPFEr
z8Yo@%N=|O4M$xK(1-=e*_WmmTw^*QklD7(YD&Db?Bec~_sc0`D`n?=`xxN-MbUD*U
zTe22J{J4LA=2EiiXo&W!tin}ENMl7|D}7BWF`Ftwccvjk8Kj5tZjr#R{r;SnLpESw
zkx;Q0aIjfU0IU)IcZG3pvIkzJ<RxI%XyxB65w6E^(-zlQr{$GWrd?57)5Z$W<uy&P
znFRop45z@KmlL_%r*(jvR*b`Maa92=+fzx!@)IqMYMjJ}6);X#B^F$+>)7~UK&Prp
zcP&?`PzmS01-;n$6~NEEKCDt4F4Y?Ibjjl!)1FZXg#avJpr#LH)mJ$c;$~QR>mO7x
zwE%Ne5s+LAjsqFN>8;#a;Es6f+09-guFchwD?eO|%%k%TAEl0QZJBxp$^;<;r6yTE
zw$4bm8eB0v4KaDq`!K2OG+U0Kbk{gFR+6YIRpsbilWU#X!$?+@ix4rSo(GPH#y<wK
z5M!o1j<;<-LJ|F^ayuc3+tS|Zj6Rk8c;k-D5zZHm@_6LvsXq=0IR?91#&=34R9x>`
zp@9~Em~e5Oh9ba`)2gOt24E7O+@;P$*M)a7lZ}AP)w!lejn^7Cv>ORH=e_k@AXjw@
z{jGh?QarN^Q1BUrL)Uy_FH5~Oj0+=f=e@<mZSw0-Nk)#@mr2=<Dx(WuP^xQsibxqR
z4B_#{8kgyg-%Z6ymb)<oq3&XU{6O`lek51fk#kvpZKk-muteF#oC9Q%YTMuB!ch;F
zU-p-QTD4|-?UpCs&)mY+aTWDFrp_y+4zUvYR)kOqK!sA_x#e9q-^^BTXLmBlT+(&0
zH?$VaV%Cn&J`JmdPl?kcAp;UXW;*~7c9@Nwjn4wguhZ#Y=woZOGq&qP7G_E7Yj~W?
z0$rP#5PNhoV130t_G)jZOt_jFf^?W;G|_wKI7KTwZ}#tp+2l5V?$rfpTdg^n=h9s^
z6<{tD&s&~Zm0alss0761{zt)Awh_3gEpScEM9j%~DO^VSulWHU7`O9h06TCaP5Y5|
zJo@-xI^V4h{5UK*AL;1p{@?%@UU+>lC{qV$3+q%YjZWHQ3FR!G?=&Bawd3?&w*t!K
z+Is*W0%hQLACwEvV`*IK9eZi?xWW{qWRHKH)w1G&hT=Z1XSWn(MFCFG&f8Deq(oaM
z$G*b_Sm?5lzKV--rq2KzH>CFii6YDGk%u0R!vcrLnrus>K;6dJUw8xoMz_j<SJj}u
zS(znhHK?CWvb8<8y!t*$ZF=$JUGDX4j-B582~2-+EQuijW-nZh<<{mJxzfF>w+i=q
z->27%FOPW`E?Dm21PGkVvozb1f_?CMK%A0Piu-x6j(Z$zqY?+g3eN&iql+-tj-m!<
z7iAQ?Xd!Qbv{fVMdP8qd2#%RWuBRJwpEYgZ11tfuk=t0c<e<!FaBNnW{e=&Bpdy;)
z@_%7oB5!82ZdPC0ZF2}z_xcOai>Tt-S^#|H1o>j&>Hhzi><Fh_k1PQTMYc;bKpm~y
zW)L;Ke*6=KE-WSB2cHZadX$+J^-lpHvU?~KP$2<!ia@yex0QJvcqwhQIRwFIr27==
z#TMR1sNhx7-WuC%5Y)&wVQ(;d$oqd|a_nzzy_|O@SErn=naWEGLam4tYoc<>0PBN+
zv1x<TM+{Cj_rbPrW%9*0JUkYK2mSNlI?W?@2V!#K9&?>39D>_MBqH0Jok+Q;^M4Ru
zRf@=aLwql$Ge(@Ey@?yk{&0<dJSXw;g8>3X52JmDI;$>AlI%V1WFnd;OWLGwr}2gb
zheu0J_Top@V=km~M&)0OjcJGjE`3pTJ;U*Q-*i=(f!=^xW7ZFmaU3>(;~_T~2GCE^
z7u-tuk1^s(Z$!;r;V!K9e?)e!Yh#Ik(pKyXsfQn(sP9#oypFq0xSp3U7ocuBJ_7=C
z`#SwkN<uDwIad82zVK*(i!Zp}-8@rrwi=ij4&1C5mvCf_VvOy>fi+X544X|e?aYgr
zPuTczq=N*Y2hg9bpr#+jf6dE3koe9Y&Nd_gbl&1)!F9F*(aj3i<F+0+q@ThX&NaTw
zIQ~LV+S%UY8E`dl--`mu2wjCIGz`bOW3pa?@8o7SP4u;no&>3(fu#WQYNkPsHqGzT
z4T@r`$1{bO_lCo?FnlF{BnMRfZF=$4tI{YPASiuUT)+O_W@ZDQv`X)E`;m$aq7uDX
zrA@jyk+%!EAntS<scHuQSo-5e8Y6Yv?N3`Zk>nN7C>p*7+UZK2Z3_Gq%np6wZE_HB
zFo6k1354t-S^giv8xYUg<63w`hV~noJ-i1+y?%=w%HW&tY3~bS7FP*vvBbv%{){w?
zZb6KzidY5T5~n{2N5bW21=>D~A8zZJR7}<3<mm10M1K1|8sDt((e<T$(2LJ6MZYEj
zTY;SwK%y#A7<y9r{y9#C7{20R-){m8hkCMFZIKgA=h6t%xkWm4R|hG9SJ=t-0w8w*
zPHgCeDb&GuaED_O->v+D)R8l#Oeesuoso)ef+`kg;h9=XiI<(|Pyt^ZAeg`Xqa-_J
z$Z}U6xY`t3_;%Lv&NR#X#x}fAMjm3Ncx2j_%%XR}S9hO0%>UL%cugoxg&8`XBQs@0
zS2txo?N8%A+`wdJ_an0gdKumqVF`R6xmKRVJKwKo<O|-{eIm8*(1U<~n#1Ir`?uIB
z9%<fR9hyHB0?duQ>}WRKFzQ6y*gQ!ZV0M`yFp9g2o8h;%Jn<9#y(0J8Jzne&8){rX
zVXO#m7%RNNQ$h|2^IPh+#duPx|2)mCgQIu-VJlh5Z}aka=hU-E<^w8&$w?)hF9~Fg
z;T(70@`@LX7>VuRk~jTE=DCUI9cVuPnmgCV$x|q@Yj05DLkCAAyPt?Zvb=V|Df^K2
zbn6!~S$%v46C|(e6cBfQk^k&T-h5=EFJ##4-Syt9YDeEC@VOn4aS$FfeJ2^AB*;o#
zVI9xex3mLL&V7nsY>hhrBYw{>ozUvMy+_Ap)>d;-Luxgwa6fyz%2!~Vg81qFeJr{6
zD94=8jy>NOCS)G#2o{SsLJkFd7d@-15iye7n0BSFH}Cv7ICm$l6t7m>wy9dYYjW+M
znBod8&hz7eVULkbe?ZdF-n5irne&F8tjh~@PCoqn@!?_?y6>7rOl$RzH{XB$${?z%
zf@6l23r@5h5kCoD`$Fl`YwezO86uR;E@t-qFctVy5!n9%gc>^%;gNxiwKTWJC3ekP
z4}H1(V6iFJa#hJ<(v<eD<<MlozeCzQyAI680UDf3SwB54eKGm^aE7n&s}3}azD-e?
zMH@R9hFd0rzTjtdx#2QiK7&BstCcT4?M}yj<$ur7<1v%^n9#N7CwB%AsqIikoNBIu
zbOhy=#<`Qi3l(D_mvi)C#QU5!I0t!j<#Yr~_K6GtpB$7naw?H*(thIu@J+u9pd=Rh
za~I%8_NMWDI`SxuFUKbL)}}ti_4oD?Rs)F*Kn0mf?%JcGt|@@+0Hd*;Rzm!!u-xo%
z#vX=gcw`Kqol=DBluWKG*5X8}+yJkp&?60n$PY)hueYGHd-Z@u>07ZQh?r#M0-mfL
z-B{H52NK$DBBx|<-dnD69*6tX1f~oMs8ICd7iuJ>>jJ^CCPPNKqWdX3Zte$Yor?(5
zE%`m#x*1ASwai@|%tZ^ne~}ntI~)-R;8y_I4lA{fzL*>`PHXdcV>Y+Vd2;OilF(I^
zGTuP0aYI=qf%GKmybm10<RES@h5RZ>o+?*6Z*cedZ_wWI_RWnovi6d|F`42*cZTzB
zcW<V@7u73f9wfK-Jxjz+*d)_u_pG3H+N^A>+!}^Yd6F&TcIb`O@oLD6vvyr7BWY;k
zH#k&8r!w`?LcXdX=Ju;PtqJHL{}0469hsXPi_KNFbYbL#7Os02v6B(EFb7r2hh+p@
zYuK|0(^4lYvg+kSYhgfiGWNzQ%+~4ur99Xco!B?#<eKD@>n0}-!6;XqgKK6!lUpnO
z&Qv2!nl8q=p`(MW<4-X%227P-w)~w2hUneklspq;F_LYx&j;{_bh&w1JZ`!*w4=Gm
z>Pr9d6clFH=_&s(|81Enkvy_@s(CZ8W&wX{qk*8aM|<+`4I^rk$`qhn17bC2zE#@C
zBI|Y{*8VxoU8=(aRC2(%W?OjtVSv{TyZV<s!WjHa$iL2i==IdFkRH&Wh}GD=YY@NN
zKktz{x<m`bzVA0oKX$3T&t{;cd`<GQLrx&T?O|uS88>IJ3JrZIM!91xNL;ig;`>5O
zK>EtrJv<A#!_<4XNE+~}8$-$JOXrMw8NsR#uh1>X(iB#U$35@QZD-Gvb{n+NK67S%
zN1dl7^r7>T4{kPx;v3g;{NwCm-7N7{uUXDb8qC)ypVukZFBHHx1P{Z=9$42JtA~hJ
z^<(Gis;27F++^F!ME|E!Kx@FJKz~cJJKJ;2Qrn*3?-en91#-gf9m_i|2~VEdceOCz
zKLzjv4K9wW-lFb*$SEEA6S~luzXbc`Lhz&ks&U}B%-2(ST{xvz=Q)cj6<xWkih2LG
zP<uA(QusPHJfM5oe~OOu$@mKauURS78>@QBk#Ou4aPBV<DPPTEf$oS%r&uN7kgK*E
zMm8JG%IkCMD2`D_;=z9}jDs{X>$Y_SJj}&udK_hLv2kr41sMiLBYnaX%H<=B$+Ey!
ztcRJW+2gh~VbFvs)k0V4X8F0(<oDpp(=;>|_rTm^AOVTjRkbKn=2#uK1Pbyin}o~X
z$6(XT3I(r;Fh_QBT8`zz=G+3yY)gFpvyG2bT@-+-MTBNC-=DG+od(G1n9C2(!i_~W
zi(g#Boak(~r^?e`<OQ6@_z=D6x9`p?JV#?^pE#0YY1Lb()Au-gvV=D41%y$wXT#di
z5uos}OZ8134PDr1j|&)L{R&MB_gn|0-HKbod5bLv60lI+&iR7tRQ!{=>Cn{Wdex1E
zv0(-4$rVy(BmDnb49MEiG+x;B>U(x)SAA)T`s-ZN?lt>q;L5}{R$SXiDC;aOk-nAC
z(`-0=tK@AM<p2Mrvr(yYQL6J0Mx$9|e0GH3XN&?jS%6zsq7-~S*f!<b)Rz_rxGaS(
zK)*8wl>t=}No6Y&hkFQ6l)DMGl3Uo>+qpjAL7Plx6^p3`I%N$@sG1JxhE$=bN_3sl
z!o?x)v*Uo?f&~;yge}fIuwojP_{Pq%wgB&rR7K9FZEkSJ`orG~{g;`&avy&dw%RPX
zMJJ^w`q9(&zf|Vz>9oQiJC)sK5o;KaU2u|2=bb{${J$&qaWIez`=Sgc-wk{vJqq?M
zfi(%J?=7jgPK5pqQ$U^^$V|*8!J9kV{}(%<_QO}ZdRSV#Wj+Po5zsAZCS(;i8fpgw
zl8aw~cy$ZkwNa~;6z+YQEL4!Cnt2+I%1$`@aCc$-xB`v2zBN<+AL38&jz9spD$~Ic
zS#*sM_-f1!R|l{DzHB#~H*+L7zA6{$WHvnc#j01Q`1RWT*GjKYJSs>~`@iKgcD9(^
zTp#pVMFAgv>BIOGO`dLv#<M2tE!Ligg<8;Fvpla$j}vR>)>*Yf@>_#-y~5azA?ynH
zZp8EJo^7dWCRtp)N)|npyy6+p33L%mn|q`4oeOLD7Y}c%O=m3t>8^K;PV~Q`oI;G^
z&XNMMzV>&(5mm|x^9KlZsV#3kqY@)X+w87x8ZjaQKp@EB9S_59a4|=CI0xst3b=p|
z)y6JxjUh@Z(}b=w2JZQ9%htP}8(D52u>_rVfZncCvq&)mDoF1d2D$|>4c0}DJmzbS
z5Y0NEUiZm~HcVFrY#%LZa6|clT*J)LY2%|?=ax+vt}eZR7Sn($^5<aJaAV8TVSgI@
z;Z?vc#BSDBXLNN2O{91TZCy2YF?BHW$U2vDCchQ%L0sOV&ma6>--+fz99M9=@E(Bx
z@@BMW_e(dCfKU-+9r?|_B1w}wPQkDVG6*CK0AiC@EwmZ5EkF!1oNqiDTzS_%qNh9)
zOfa}D6%eqkgYUl08Hxe~lD;=cK_C>r1u<?+iW+J31X*%`vat<-z`5^7Z_pU9YXF|J
z!rI1jn&CftZNG-<<<p{10IWgpAdAEp8(w`+lkwnQ8&!DxI`rrY>fvL|)_?#}J3Kto
z@W9`>>SBEE{$P{Fl?utoFk<0c-pdG&6h>9kLhkIs`nhly%)&?2jY)kY6!okW5oiJr
z2AOZIhk8IpjoSWCWZxRLO;TSBjR6}awq|?fi93^saxCLkV=AuwBugnOtJtinFYY@I
zy4t(srpgTUx5#R#QaAOC6HS+M!JJn3|9s_IL=;yh4QN>$fR}2tKvnR#rVy8PC&D;U
z%SX7X>CL6G4KZ4LRJ2(OjiaHq2f8}vCRvUT2u5$TtmMw>1|6m*=XyufzC;NlQ1TF}
zQcFYt#9(Pijor!bhdN;_Z2!DRfy)F_868a5wqS2`RslyKe_gLQK}**snXFE%b1Kwn
zKeOyDztyD@d{l#az--7%wotSEEfBne`@V*2Lfd5rw}Ay5upr#-Y7Lk^+kKf9O*XN6
z5y&-b07~dwL}u}8d+2*$&PBNsO~^(1q=#W%Rty0+Q|80L{flqQ|JrD}KaE}cMo;GG
z$x4oS^aafjv4%oGiRfg+L>%*ICjf4it=gszP@o#;;GItWf4|_Xp2fx1mgg#+3WNWt
zDtsxXN`MAD_MWAhbSr=mf=l3Iq1JVlv?H`GxSy(tz1z%fTCh4Z8IeSq3PgSm-ON1U
ziel&YPEI-{ap`sJ^eB{YnfkpVGy;_y{>i>bwix5*-I1tRE@nNL3P?Df7qq7-YxO#Z
z!fWz$0AGWv@hvgOBX@$2@6~i&4*e}NncNUua7Jmqo_SNIN)#(w%dNq;O;F@bQHUvz
zhudxp^RIZ0B7b;8e7z+uMX@dnUZL(5M(*$v`xL#F$ah_Oe;mIB&4`P-L=+ft7eoSu
zza@1|ikirh_S{j&U0|>uz_}(Tf4osx7TqFJ`}^qI)Lotngg8WH5z`a>ZUCIOq}kE#
zwp*-pmG`+KKwy6dfUq9^V==nuQrxY_T<e(fq+~*}_V_<Lfu<&NgJ!qm!Pn#^ESFDY
zHHii;Cn6`c-rcw3aDE_aR;LTes{gE63rZ2`#ma!V0ca7=hSznyz^pKuMgZLQTotg-
z#z%P~QWR=#Nd3v+opAl(BjtqxB(WIJt2{*u740jb_Vh$RjSggx(<yNFok@|K+y11`
zs@S7ang3&HB~(0yMqhUHiapvb;K5Zo^i66kw}_C8;wOs!@ydIr2E7to#{51%1_Q(C
zOm1br+SB}>MS;^l6}mx<DXEP21@%<tCV0pcsAxU-HF;W!M43gR9K3Ik@W1?$;keR|
zWuIp(hIHzY&AVmptXC}#um5}pPSla-gj$RJBqp!U{q8io(71?dLS4Vm8m6|q#GpZX
zRxTmm1oP*_x{65wb5H<5FBcvA#3gd-0;9O_YS&+5rfc<X4Nb@P<3G5#N-9z$E^db6
z)l48Rp{I&5Cy33Yvv;31v|A~%cIR6q3+hB4KMvNMs2c;|nNsy$cMSa;RpFy<M5p55
zFLY;^)&wbS+YLw_j^(btFrO`@sLAh4wz8gX$KUi}aSxE9MJjLkn7Ima6%z968Drq*
zmnkkb{@0lOX#OuJ>^TOw(~m`d;Fuek1z72N;<!On9EC{z^JW?1MOQ17oVbK2ckI?E
zJi4~W6=a+Cceu{S^>7bdwjEitx+-SoP)e@pe+o@ubtZQJRP$W(tdtwg%B9r@{e-)L
z;jd05@F<>x2=>Z2&F<<ptc_DWnEEebV8|Xg4(r7KIXCVV3D(^36gx7gw~vR#&?<|-
z!mlv<EJY%t5A&%}*SxELJs;ib+kOmHZ|r)rVywmtJ;Li+QZtdt?k=N?GLG8!5x23s
zs3c2SVVaML-+TOB)v;uRHo8S*AwYSVS+sB|6%swQDrW8A^Yv0T=V<{P6-5SsgtPfz
zp%Dvq?Z=5EJ|t=93j+)!$R2o!C3%_xkdMF52mdcBy6y7&vHnP7>ls7Ohxgpq9f!BL
z&mi!$xf<U!I=r)?3x*RJzM5srzkY7pAqDPt<Wb$09}wGTOe`;D4FNB(ZS5uKES>AD
zlw)y$cJ8|F--9i$rk__vLwmaI6rpXM1$_}^9Y<kCe@7w#SV#lnLcY%2ra1@P=G@yU
zLaXugEq~jhHJ%qe$?awIqFI2Iig(?ZoRGYU`Q0qzp!db2T$7_YF|U#GH1@}5VOQR9
z4Iq~0#5X%MxB&_LP3WTwb#E9>D{8+J{PX}fDNnpWR6b<T(Q!n2-oCpE!*?QoR-GC8
z{y&;g_l{zD({jL)DJ^KInyPanH{5j~p=a7-X6h<Ra}EmLu%i57>mAtj`?(4+{iAot
zHi`QV1=QycPSj|Yxw(30;??6+#ucVo1Fl>T&?na1_Q@zMwWo+dC~hi~6Ghve5ODFM
z%F(Jgz)$LwwKnv6=81e>%Wm@%<nMI_Du<lRWpvi!$&vTdq`vi$wjpk~9DJ{9$Kk~c
z;e#BHUeVx>3?6fdC~U<JAmi0{zn%Fn4|+SpRo2srPhHdR2$QH>+Bp$<XB*WHvf;lJ
zi^>A8r3eP)qy(Us&h6WPgEuNrfudmvIf%v(EB+C(u#%hox#l<6SOK%4>crdXF~{?p
zcKr7K9^i@>D6?TeHCW<MBTSaDMU?I@SmGg%_$s$oAAUc~+&27hIH!aa?|C0*KkRa|
zS0~>^rulb~t7h}MM9n`8BggD)BM_6+{L-*mh>wW$KW?zfl;(4Qz?Ne%oE5Z<h>hL#
zEw{;5Hi-pXsgyXOW9D*E3C8XkbK(b5+!oU(LHSN;f}#&FS3wggbfC{-ixySiAE(!T
z+7Aqi&nFcH@7~^WdDy~u`H@I_s{xxmnv=R?liQF)arpCW{FkY)i!bHFC%Fx}^#~wZ
z$2Z_@Mdg*1-T3iHOE`~zLdA`}GIzpcrT=!uZ{?QpFElW&lTJ!oM^UO1AD3Gh`w4x;
z$$Th-e%4?=Hfpe^Bo6_%K4ak46sR=qq}sXScLi<c+i?MMUleX6?2I*m$jrP~g5HZL
z#9bBrO7E+B8lb`=+5xM<rGVkYOOGxq(Y?Vp*<3EKg@b`7zKC`yd&Utw5SUW%@Ho(A
zQ+{(ISoD(256nvQ4iB}>%fXt1TsEVFp=K6#=TrMz*A5j89;egKQriqZ9O-3%UQN4?
zaT}Ka96FpRm_AZe-l5z(&B(goC_M-y(}0kIPqMdWolOQna4<b-hE`STWN08q{Y>EF
zS7z`;L)I=XgyX}k_)HzHf*XV(5U#K>RVe1mb0gBr9s5i}#WnVhvzQVeRTT!k92Bww
z&!_@(h+&-Aq3MAyH*9q404Z}A@4e}3UUGs5bBl?;TSN*0D&#l4Dm@Zb#Z|VQ%gUEx
zzQv^pJxN&jM`8v(IFOEw4W{quy-N^O0h6A1hQ+UG0(MflV&;|3!M3|ZrG<m=;!k%>
zx&?(>+x^+FptsP4k~lYi-Jw}r=varhrO<EcS^mvH-WAdK_%+myZTRxv1yE6y@z0P;
zZR6@<XH!Ftn(hcm2D@(fA#9{%%6&uRWxI@plvmw%)`el?0T0*5VLdY?ad(q)%4EM}
zEAQ2bficXCO3Gf_e_NJ~wU+98Bb}zVc?C(Fg2D$3DI&qtBTX7T_*~^LGdP;}>0Vrw
z#`1hWJ`Arc^eAk2hX;ID$9$ehl;RZZoW*uv7`TuBgv1?Z!CzaqA~K@On5_5a1*t6t
z_Wy+hCHK?>KQcp`%XR%|YUW{qxtx&})$9W&TiUh*jv`XRw;ZPD!V65G#^IU#g>mZ(
z7PJ!|uxo~;W0N$46ZpB{^^UM#KJb&il(l`7*{Eopa1ST^y{`)rSp=AvI2qFMVT)K_
z8&^55BFJMzelgGY^^T0VY}(UYGvA&vTH}6Y?3rWzUf9hGHWg9nA0NQ0viBEPcvf2A
z3!mFC6^kpFSPPr3kf9v7a?j<j5jF+&w+~#o^}Zqv$1Jgb68U&$|K~D|J57%)MtVB+
zSt0bbx%ARdkB*dp4wh2PoYqQPik8b{Tbp4gC^0THbxJv3iKU1d4np(n0RE6wEia`p
zMsGTELaZt$4MeMjlH9Mn!eK#v51kChIx-Bc&jv2f^dA#IEa`Uwa=Z~AdjYJuos^Q1
zv6^|$=%`Ii`VRDEr*!qxzD;}9{dy&)nPM7FGZBgqkGpHG{||HT8P?R+wT&*U8yiXy
zm1aS@Ac}N|4Jisp??n&+Y0{;H;C5R8A<`8P6r_dTJ3(nesM5Ovp%*Cu5=ipR6?8w(
zd(Qj!T;Jh`7m=*B<{D$nQSMPDB0MLxpP@mTucvS9{EbB4?{t?9{1)ANcm9@7ccp9o
zTp@|FSzDpx@)7dBr6oQula>-Mw?!K;W9-cI<}*$8yx6|*5uLyDtqh7Ku#HQW#^-1#
zXNlgcly8+!4!RjrAe3Oxz5QNeRXkjitJ=&&Xg;?G|9zu)Aku1kWN2mlpA8xE8Tc(B
zU47Yj`7pbQo47*Oljm<>)Hvh2Tex~gR=MX&x2`VTRN-z?7=L2?>z&(*FsH3S&|wF!
z{ju5dyuzCGmD6itt&%E)={}1}=P!rN-{1b*h|-V0jHCQR<lk%@GEm3M+kcmj9*Ah<
zz^~jOR=FO@8~BWuP@{}yv5%=H8KXjN#8iJ~7u#EH^P>>sr9Q@l`;foRN0+O#r3u|P
ziFA(Im#SnQ_z!x9hhK2uo{Arai8sZ|-o{ia%~#A?FJbLhErZ^{W9&-ETSi`Ww((~f
zn^ig>+z$|fs(0S!Zc?^iN_9aQ%fE-rBeqQ1(c2THGK}$`Ho@run!gg&kt$e9_u6?f
ziI5u4dg&JR@3i3~v}Z%P4^J9273?ewi?IZ(HP?Fe{M>2USEex`>$~;D9aK4euKuLl
zW6DYxuqwi53rI{yI@uLyw{w&@rgEs439W5j(_u>}Ty*sG5sbv;=&Dbj7nDE`9;?k{
zc{!vXty)~M(=hNDKc%rYSm@wT;<DyZ(wOClz;90xV;PJ#LeX`s6&S}dt9N{?D8hVS
zju~~8fLaZoeT8g0Uv_$Th5q<F5YF&f5HvkkC!5w)JjbuDwzKzfApB&j<~3IgrG~-5
zT;f&ObQ#a3Ve|eSa#Fbl&Qc@6M7UzBB}*XnT#7?`yj(1$ue)ch<MVKQgL`<2oIEdA
zwP{<De3D;PckhO-43gwF;nV1@I&rD-YOA&S1+M8*VR=-Xc%M~v7LAkd(6+&Yy5l|?
z0@Ie?S2K%><Q%QH`LWXz)m<HI;Gk$Wwq-xhIj>MZGD)jFXno!+g|h$tpI6ZLvAXsh
zc~$$U$v^owo%*7Yu>vgWE;AjU=D;kN^yNff14Tk7aEHWo|8{TzFBz(%bvKnwAYXW{
zAXZ>iTy;$Bj!xT$J6#@EvKbfo8XL7^9WcW?li}(i!+tR->8*>G?A_mAYqcJVjK!^}
zUMQ|lIrPOL2WJ?IbBe3hb#!#~8E)IqQfo|GgdlU4N+I(8UDE2`1+~bv7Xy6Y*_dZL
zg&D7H^Mp;fgzoE4PN}O_Qo2;3#Mn~rbDrNN4tO;?$yQv-e#EWw&N<q=mm6fKYwxfI
zyeR`oF*$|SDdGT#PZ!S)h_cd$<k=4~PPC`a4wt#kMh3;mi-cWRbKvW>l#icj#-G4B
z3@$g+G9Y%oZ!k?XH5v(rcWi8&49LN6%Jk|<Rren_`RSg$V@$D&RDH2N<=8*My;ft<
zX0M6asY$l6gCW8w>Z2mNzHH{B*N}~LknW4gN4sxh?w~Mk$Xyna@3}n6OlW*@m{n7(
z&}Varxk!YOZ>_FcTB=A{8xh>MI@xR+Zhk>DH`DYCeUNICPw4Fd?apfgg;UB6d8XUz
z0~+<$xOnRFgSknIJW`D=A{ljeZn~FcH*>cda{tpyKdP!@Z|N1$6st=ALv{Slv*Wm{
z4dH^RWkHKsnKNt?LK(!D{Rf)877WWqEjh$gjf7HNyxQ$dHoS=L4yIUCmp}$qQNax;
zfQ$dihY{TH8W^J*d$vN!>RP)vp5^t02l@BZ95i{TA$Q}BtaxiNK6<@xMAqQ)_>~h<
zo&c~)v6)#IDByoAzT7Sx{?X1o%vJkDLeJ;9Ec~hyW{VAHK3w_Y6ptCFMyMB<wv#8z
zYwP1<r^3l8(WWtUlXcwlqIz8LqQ$WE>)Ezw6nC%$S-hxBc)N0E>H#Mf1wmrre>6m9
zma|T*9Z>!E0!g3lJ-U?P6|(y60{RG}jiS5Ncf0jzTx#YIX|;Gssr2$0(0-YaxG30o
zjeo`SL;?qWTav(V!)l0o-iS(DnM=9a2kFSf0ld!FRN_*1it?dF3!m7FUQb7xKlfdc
zs%`?{No3-uMea7W0(dFq;yGgo2#Qg5Jh02*UR^Dgk?)`;Aw1EKFZ@04#b1s(@At7K
z81dXj&n05)7eO(YlE!9A`my0i19=&NVMlxWBjr4y+U1b~Z4Lt<!kh4J4L3<ub(9Aq
z2Ll`Ie0&7M2@IUF@8J8HrYaYTyaF(^N5*{qGA_ps_iMY)s>cuVSNJbtDAW6BJaY}D
zF9`ZPKI7Z1+-8-C<c_;zF(-TNqP1gRA^kfCCnqbHIe-kr?cSC6f&bO%XvvBZ_km4(
zUy(e8;_iOoFm#;@yw}M&%Jwp9wobZyZMr>G&*oOOy`@2c>39gqmyK^Z*Gw0`Ondhl
z4=~M=!!kpHOU_$Nft=?$-Nt-WHTEA*fPPj-D6x%v4lH-jVIQgT@eDjQ4GexyQ#h~I
z*nRGlwj?AqRFTu*X{^uCkP)$J#%TXWrQxa=%cLDKSCu7t$S@jd=4UcLv20eR)_dtE
zJESiX7He=Q^j8dTe&k5yvi_9jihgE_JJSg8|GVz5e<1XSXrMO-)$}NBcx(`k#HQa~
zi{Uoe^(F+vRM1?Ac+$&63s-JvGw-qM`-dRfWJpOf^0HVL8Uc0Q-%q{cX6(Q@<Yj&w
zDz-_*f}uB>V+tA<i;bhh8OMjT{Wc0mq@A3QCeaxmjs3bj930VjCvy44xV_N4g3Hw^
zUEaS;LD|MEqIEn3FWsb$A0uM=G`dW_6v1fI<u}b=$UPh0Z@6vgGe!n0Je>kxVxKv)
zQu5O?)C-9=GO#H5X9XT=^SU`0z{LAqkjzBi7wT&gv_bYN#8n)V;L5u+#p$>8li3}v
z*aPOZaIDeOyfc8DQC+2qsgYHYw>MZR%b9m!5%TtV19I9`ghNo~m8RBpO>$aX7I)<c
z@cH=@?Lup$ang^=@4l<Ivy;1%Wb5n1dr|q;Vt=0Hb8M(21H6tJdvL(qX0lCMP;u|-
zRk-z%xwGhsZIPfek{6rJq?457y?(y1s%mktNKoOHb$h(324Z2fN=D&U7k7J9?c{`w
zkI4p-=$_?-MRAd56oIb>sz;dVpiCaHoHoEPws78wNkObp^-^==6%JT<-1vL7-q#pr
z$9AQvr|Jz$4eIq;N+iZ8ma*f6^$>$kjP-Q?g2%UNiuqC#&zva{aI|PDsj|wHJqoWl
zSINqKOgMg3Pu`>_d`q`IT`Lu6*>4sKK<Yu&GjhF?nNX`6_6ql4)w!@rc)NP1yf<|W
ztMpjJ$y`JK2&C^G7CRdWI*6!Y&sU|>%j`d<_n`j@`U#5qxK~_`HHW7vJq>ohUk=dw
zgH-gSzGuh=nov4CULxFk*A3|>HqHl*e>Dqy+3W|e2I3J6f)w(H#CpsC&eHpO{*VSo
zlw%~zQ`{kJkhUq#K?}%y*Vf>UpS|AuIO*1+FfhCHvyF`meRep_su&3ym%dGGC9Q9l
zz*ggEQxF98KAU{xeL-y>9K&`?xWV>Vxi$IJ5^Sr{!jYc)#sJ2}|M+B6URSo_RHOGp
zjl`cBl@)R%y}TPVuj=F7PDif#yDl0IZi9!~XsZ2=AXAzXz&HXH%T`Dr{jSATRLXfq
zy(eyRSHxt$<Oy224?6cecLHb>vwP~|;-#?buJ|2cP43jGdGYMXH`_~5>JNiAr|7dy
zGI8=E*sO9;cd98SCY)Z$fJNnHH}kGE|5<&KtTLME#j2wc=_jzk{AUKsT&)B3d3rAd
zF-l~2uin|*q0-2A4^|cY<$Rd3B_Ng$BRikQJgzk5X}K1#Z|+K&I3v5_#o0UOO)EJA
zVuCO(gL--Q5=nMK+bNTc`lfjA04uKjHszY8=wOFbV<*)v9XlV6lB%j}7oRm$)_H!^
zMu|+#&U7a6p9#c|iRFkUSS90EtH9!`!Qx;4^J|BsZ7-7)7RpN8W=-fU%x<=;grE!+
zu)~jgew;dpcfKN;b0}|Rz*)1S8-zkt@;8EnvA3>{`^vgYJoY67D37X^$GV0ln4BS`
z#V-n^3YMoZ;WZkvhHM+PgxhzJgeKHzJ^ei2&_M5<rjq9%^DWg=T+TV~z_+B`rht+%
z>9RLUD*ic>V!Ll<TN=y=?z-y8S)7zXY|mInfNEKO492oCB-zH!LMoz5YJQpKkJeln
z?C)3Ve5C3?=!{g?$_iFVlye@hyU3C_&pncl%OOTKy_**{;|$%=7p_<}yeqV(zhPpB
zQImOG-uwW!N7uo|#|QQ{1BC;ZuS;cXj0GvjG+fKZF<D;dEEb}C7t68w+pa~+w5Y7N
zzI?%(c<Cnb_7G|NT~4fF9~PBVoRG5F=!ER@J_zY6fSvSWRYL^dbenbVb5*IOdju(a
z!<JEDKD<rxXF!E$Z1+S)c<6jxcM4NDY2V|ReP6v$9>mjVd6G@wpaw6Wc)I%19MOic
z>5XVhsk;$6b#|ZonU&L4d$lCN?6W}O$38}f-NTmB?)>ddX_)nvb5yvumgXSYee|+X
zS(jJmy#0GODJpSUg<M)#euM9fZ*jikgb#a{ruf1O(&oJ|T6B{;cYZeOo^G73_8yMN
zvnD}@IzfH43bLyVjG)%6OPhC0s>^r8G>^RClfKqk9&8sTYG3_9VaS)YPi1g;^t>&$
zy~i<W+(m283ZJM*lH=_e3s~VfC<v_?6z3>VDfOh7b+)5W?qhC=oHWVV*AKJH=Y2Hw
zxD)Wric^J`7=JcgT#P)g;ik!GugxBemv7~G7g~Ax=&2+|EmzSG;bG({@&G)_H}K`S
zYf0GKe(sbU{u_B>0(9b2Ss+#juuUlXa<TY@MuLVe`?7^m(5!>X_YXSJ^Uk^}Wh+M4
zvffb*&d{+|wM8lSttE`LXiCgY(oYrmqU^eMHtL^NV4l#lW(RBM6bJp2F7ETa^sSw$
zM)d1InLPj5cu_;~L6CQ)iP@SFPoB^m{)(E=&?%lMf^7YC@Sx+IEvC=f-r9X7S-7aI
zs$QJ4_RZb%A$=C_6khKew@r2WzF8Cm`xGTCgbf{CE6(KBMdveqcj^3#HpibG7o4hp
zzAR~JvtTM4pnQwa7{n_To3c{>e0^O-0xqGRT}!mnRMT@4iBJ2i_bL&~o?=_ds{R+-
ztDtOKKb-q1a<YP-hmB##3f3Sv2JK>;x2Sd|<>Z<U1Jit7cj3J|NQvh5)<%wrrpT_Y
z!Z$JZ3bJ})Qjmj-Nw#sSU6PN>)HK@^yYjg%qRiY>*Sf{BR1-Q&+{INWqbbYd+{D5V
zQhZyvT6sKm6<MS~<w~~Q7Vfj+L$xOkf$CnGasvNMDdMMCn0l@@>Qs%umYg*4^~GVJ
z&R{oZkhSN*+MxvAM%n7*Y8ekO?0ObadnkFjJwYAWs+J&+RKD0>8op{=JCfIk=E_lv
zlME#Z2R05aG%Xzuc9))Yt(8T{EZu8;bvVyHiL~UA(cj>LUYVY&c;=dfDFXdFGszVp
zv7AlJIPNGN;o=vz-8xp5@1s1wO?3_T6zl4C2d{|Bg$Wfucj1h6E8|Sn@l(sJNbw4^
zz0}v0=5V%T#=Tf*N|frQGqn}pYvD`ukep8<S{OEuy*WOlL6m!K`>x24=8Rm=@txD+
zS6WX!+nMn9ZPXz~GVO!G2Jk#}^1rAIblp$RUr5B*Cd3H|bly>D%bvtpN41~6hCDHy
zQ(yUpiRIS(gA1Ig#=`hgR^mXJ^N?|+xUv*icyYVSpqhHxZJ9PP9Cr#YwQ`2%(tO88
z@yTXPdDk1y!Jj1+oVPNAc930}u`WclH3On|Q1<X6Qej&|)0o7p%mDWo=bcL>2E9$P
zQwXl&xF}ygo=fPhIA7!N2;74~2O6^SF<PG36dVlBDL>UX=7}}Jf(V!}Ki0ohZ^qsL
zL4wx-2d`#7c3lK@p~@PFI6=%IGvK}PpAix8x#K>dVWNGmRRLA)+kB{WVgZK<hiAj{
zmv{dOBy@yRzbDF9q+fY_Datc5NL&z#?(&%HPG@cv&S8{q^-R^(rCxF`%EIfoZ!QeD
zDn~9YzT5Q9{2(MCN;A`E7PBjsR66fVh42I!TH`D@*UWS+g)=bI69IG04!U1L+M64>
z)(n>}&_ph(p<;}~iVHI*w|tsHp5&!r5?Bg`^iA=5$R5ai|7UJ%-P@*KuG)IKQYMA@
zjLU^Aw{V-0CI&2pnd@aej%K<Vh3wOxt-#pGGwpoDQXD@2TRSH&%4{?k6CpkCTQ^Vq
z)pgHEetDvt2S2UgKA_y}HTXC>CpCX{p>Y18;4(cJrs-&0Kjd--w`?Ase}?dxz{Qgl
zUY%K>TuiDqtX{a26>ZxGGh_@AY{*M2ZE(oJud7*RY}2^mKMEXMsa*m3k2FP9ae=j`
z4OdzmgJYdXV9sL(JZrqW#5AfXaW3C$#nY-|aiD;gY|ST-yflVI5Ly*Y>SZuB#a4aU
zCj4izf*i6k@54vjrlzs28KOZk{q4Y)DMX~eEB;0e!)|FK9+P&I!D;CY1y!J1A`&su
z9t--w$mk+V)ORUss{N#GR{cgIVt)XInVY2bc1Hb1{sI}65SO*UGSHhQtbC`1=Ar%@
z-aLVeqN^kPPn*Ou_dV3yGg;`dJo@2$gOuykJ$K-jbxSZSH-t|17b$XjJ$&0;$!B73
zhu<8JvCCH0C@D8ZdwrcR9n02~x0eseGTa<{l?~3${BpK;Bv@kf9Z9?bA7!K|W}LIO
zRrN>TKqLj1wL^gq>n0k}snws-!cNoIATtMzd1xs!{yE+FQ*w7bC%=V?9pDMrx9(yj
zBzU~!QrI~sFcQ1lv$M=~TG)UV#Ay006`Gh87b#>mD%crvb-87%Zg+?|bpcg~qU;do
z;(eBskvas*CKjO(9q4eW?@^EYpGBBUDLI;IXnc`Umy~fHzwMojI{#BTEXQsQ(|elU
z(@mtfei)!9afyy_QUW+vnA#N%{f8D*0ed@>ti~)|^U=rk)3#aL%eP{Iuv0>APp4(d
zV{mxo&OcA6@qRmePo#1gxqP?tJ}bQg-WmYAS3$^P!kr)<@Oevi_8R7Bbfo$8ryvIh
zngB@qY}f}*r3Mj7VL;`mYPh!1F|80w!Cvy_Cmaz0GrM>Sgqg~n8xd=6;N+RlfBkvb
z3=;@NZW^#`JUhr~bLmr-$B27hvJId7^Bxy?A0Hj@7;@l`$q_Cta*3n4CZu_ql6MeP
z9>QP7OBP#<pt#CosH-oZXTj&cXco%hWld0I0{@;rk09L!PU8t357*Fl(yA<dwvjBp
zNz!iIqn%k-%JPB*KtE98&8IUKMs{bcW5>|S#rd4=A7r8vJDc~d+cFw3uuHy8{3IUM
z--q9Pp#9ZLZ_UiF(IU3LzyDqT;!uf5mF2sL;fCUP^}E{VuwX!s7T2HWcJKlhEI4hH
zo!+`EjYryH|MWpF-^&U~k@VdXBW_)FpUa*iL3?OA+K^kGQ{GpS5bOc!5>jpW)D7*8
z43HkiEI-&BOV25cfVIiMh{Vfg;z*!)-vkZf_(bzQ3zaTkVlrq%PFotTanC<>GE&B5
zY;E7q4tH*vaA-$WM(N#+w=w}V1>02GYxQAZaY|eR2v8&x{;cx)n37|PUR#`0cw$hZ
zz<daY%pKhmRiJg}V9qo>I_dTv_xBN}=@XN}WG>K&o1*ts>12+Va{yPL@iFY`H|)Cl
zC{V?bQoRw`V{JLa-)Ge2)-!0_2=<#|2)lBpf~d#}2VW0xW(SSYR*5c^sqEHTR~9;x
zKt#$spJgjme?>r$E_!(+L}v&2+C6McjInF5F#guini&swG(B#@80P1hm<T?uA)79@
zJBhxPC%g26yo6AKf8N5M0%UgC-roMRO+niEGs=&x;Asmf=fv3}Z~Khb1>6<5-PiQN
zDw@|VN;#6|flC4pT;Hrre=2XGqE{Q~(d`yl8`Tp~k`d&vxIWtj!k+5A_^mrg5fz7=
z#{6<OsWzpTmzZ!D=t}PW<6x+U-?lI))F~<}4#YB8MUH!a5WBdyM2d<R*XI#JcSZ0a
z(gWRSOLa8G-lDB??f7DfRmDu^NZKA&@E^HKKsu6@o(MCkr@Ai<mxa=QFG@RZ!t+4w
z%H5t$9oC-v)+cb~=>ndtiKGRwdGRn?%YI*(pnc6L0^f!@ftgm`&I>O26ht`HrN<)>
z-OP<Y9_bd#SfUtU)uF@kOJ^JT+DZnuQz%Ns7qbL37w{xvX*;?jZSnCSQsG{0rQa*s
zy7c8&>b_RXr=I}m?+B2ElJhHKVG*gylbK90NwMP3;K-IKJnh2iY)&WczpgOj5>16C
z0RH*F!k}HtcQkD=B|gO)+2A40f7-KRaJ1Kg4GrAty^VIFEs{XvcvmJ(vUs_MX0k8G
zKB^wf?l(3p8hhpK*NkaNviGFyZm%qERJ2ZXEGATu(W5Ho6hSWJ!MHn1EFHW+K7}i;
zCiUg%l83>EpghY9S9XJY2+}_T+_@ZJ!OOcPgf=cad}4fgzKjSCN>M@9o)<KclVSu|
z&TRT{iv>6bod2mt-7fgvm*8#s*$mYOtjq4tb&)jiovLX$9YPRR@(pS>`X!3MK%L{F
z^dNRJP+NM`UpbVYW8&KgV$%a!44=!b?KmnQ2``YO>~b}TmA>thno!q&ecOy&izU56
z4J{pnpP_#~EVe`)&gfi6{EJuWUvc1-;F9+(g^yJ^uo5rlgSl$mc4XWcE;*S4?JHb$
zuqg(vspxCF%`p_p9f<U?aarfmdji?lf-S>bq$WeS5T<Z#2b?A_<$eDsra`q<jJ^xM
zy*BG;sN0ndl##y`A%7i~IQU0;1vK*=q1?IYre)#!`hmwnzlI#ZYiAKj^_N8#(mszL
z59krS=le*HNA*^V-4Q0`=7K>O7|oZ4V?J;L-SB?_^+koqpGr5gDwKqh<uv%EqU=m&
zz2b%(D;(^vJjskb^~iALeV*SCa~JE{)hs2=cplq|lRe4v|NPR_y7m|>OXuGlj=r77
zfCOe|YEIxQ?4MIVT>?=cMjZUO`)n*I=NwbG;ufCrc`Rk+gRIw;DnlJWmZ6B_zQEFc
zxeR6lsZmb{Qe0$t)#8+L9CdZILuN(B*t#NPBMMD?wtl`ci=n<lJ5THbYyd$qO{O6K
zB9^B72@L)6NQHy~Sy%5)eD@`30~toQ3uUElQ!VdR>DxkUjMeP4<%PrJfjQ`ttOm`+
zgye@mk`&P?)Zz=p?}t|=8V`1v1<p2yXV#{DUNrtt$+32FEz~YX4}QA~|4;Z{VZ30j
zb@BDX5ofryo%!eoIUjL_TX5E{^S-uWHEcS}3X~4Si?s+@7=2@kxNuG;=a5O@<YXGV
ziJi)zBcpPsgPH_D1+RquFW~#kcUm$wg7+3;qu(;NS4aC{H9*O<#&#ki-{JmQ;DKA&
zfCX_D;};YMU~DF^yEKV_Y6b(FE5gAM?AQ3`a+EekV8cczJM*g)?@P15_@1}Zv!I;n
zUS|i*?e1)T(Ci#xVFK)H=GFh)geD*{3XBd3On>(&ygy!<_RktPGVVM8BkkE>ORZAj
zv8V!+OpSNgf7UOvRBCBYn1YG=T47K{)0veMwX?#ksz<1ZVu(e9h5Fz9cf<4!zQ1aX
z`R#o5SLWq?dJLloE${zJB==7%J<6_N;#K>s_akxF+pz{Wap(TS4u8`jI6i#I>9df>
z+^Q$V0gGIx4ZK2dul{?#)2<LC@;>?eN+o>M8Ze#ibJ~G}u0OxNU=A*(WtV8&ONy+G
zm;hIq|4RqRF8f~T2kp~RrU}-J>sckEF^Qi*xv47#(^Meoxnvx82l#?RnqqFCj5^t-
zkcKy=vBNqd_TSgkcLiNMCSZk6e>`J05eN%}p}}qm1c*}s+$`0q%IP&33TFn?k+CK)
z+s@G3={prbgfc*VcXIVlm%#Q@cu<ub8&)$>C3+0p{?5NiirlH@=5O$H_9AemPPeB9
z_q<xT_V5e9iKM{-YxOy{!92@G^B9#-e~ui5$jP+T;m`N9L%1hh;w@$I)DTWN@Jd^6
z02}~HVGrO$^{Rnx`7b7Yq`4U{69t^P|C%<5&otsW(_Rbsrs<|}PfO~9)t-&Cxn>yU
z0k6_78eh5U^7`|Pi@`P3Tf}OBIcE$41$%k_AGv~#U?jLeE|(Bol9v~nNDOLk6BJfw
zRPKjSnYp0_Ff^u;Tcb>yhyRtnZfK@#7D#;@l?Rr>zlmD{NDusT`3Y#hKN9vzQO7Ez
z@8tV_W8gQ}nM*e}<I0q}Lmng!u9XHhg{H|m#^1T9shICl>0}({T6wZItsh=W6^BT?
z(j`g@)9%gSfAxI?{@hzANF6Cai&^G-0cM~3w<#r*HTl%;cm3tJ$5}JxBv1vIQSuUo
zlx%jU!Hg6}abH9~oPG@yk?!l}-<uG^oo6(V5dTkTnd6Ezd;~TNI0|JYk@@$V<Q{1b
ztRnSQ0IhERLg`Q53x1gQPpesx-KWC;*4+G8n&6M#H~y7s@TueQA1w&~&ENFxpX~^L
zT>tyeW`aL`Wc`<l@W-mNe|8c4Y34s%0-vsn{LcmbfAh!}9Bd*gqCoRxfi130__T5m
zvGwJP8Au!;2wI41TiXHZz81fJTf390AY2Q5yBESKYib~Tf9&N-tKJ@2J~oa<?M(FG
z%qXh>k<Sp=@X4bd&KnCN|MuL4265lbbZbyV5vtYOAM7R{-tC3fjjG$T!-MqSL{}}0
zf6BAuhk9>RV_mfX&yUo*7o(92me1jB#uM<jhr5Q%;Ds`;7nAf-paWx5b04&B5U(Av
zjC+sOs~l(H2kH+Fv05;1{rA;KyZkJa38V+Ya5-zIQsYL2N7F}xb6z*w5~#$4)W4va
zf}QIUW6@VpUYgN|^`OkXO|6-S=#`*MHdeI?{H!T><~>|d)Dj2^&oR0{=0wSkMF!Sv
zNMC|TX=CEne-ttSejf}k|MOibZ%^Yg!*j$Jaljq)0Z|f3Xw3SqfT7U;>muPekGrDh
zzynh7>{T*XY;=_<_^mYrbq!>YkWtG895cdE@RDM8cmx~I30-Y;{=KU7<M65k5l-42
z*(Om_hcuE8KvC+|?Yg4QdB&xC%tt0A3~ZlRzLyHwYd%u?Wbjho5V+u7R2+KAW<~#;
z*Ir#yBt0~f<D0N((QQ%oWPeS0=Z^-=6ZV5O<<9JVS(Rss=N-TmZzlNPkA&VRxVb8#
z`0o|hJ$IjB^TbkTawrE#bMLc>Qb+v$zl@#0HZo^dZ(0aRF1u;`jm{q*zFc7P#xPT_
zYEB2>`A*1rBmO=9J(0`HtK_pnv6Wx+V^2ZzH7~jxy##>!0ChFDv&osHn;6RKD*2sT
z1%r3gPe2{kM0q34P7Am!Z<n{<Ha&@c$D@MxaYMbqhf_zq@q%XW6EWUkuniCf2#N-`
zSzA*sR{tZOikccI$tXY=$zu<6Ce^Puadj~O!5ka&V$|Qxu3T+qw!Hw%t+{NUVL45*
z%tD;})?$A%Z<<x@9oCnK+8!EHI{{^8`=X{L|FMcf&?)R;gyzrg-enj9qFPh98pqJo
zx)?TGd2?9#7=&vy@g@JfBMO#zKtlHgZM_?x9d{pQc&N!u5v;I@%}ASVpFjTXF0DW}
zhO9!E1*FeFqzI2Oe9iCVIZ#s`Iy`)-@g#V+dpICq0BwJ}gFAQbAQbg{?+E3I5a6IQ
z`&Y~_v8&)wnEN9xdu3sAx@0BGgvIK;{s*L$<&U{-*XA)p^9{~_Wt<=LlauE3cYnLQ
z%-&d}&Ia6uUE*IXFo7?SX`(YHDhbT(N_xmGeU`zxU6Fs$weg!*E_+?zg&YsQ1m*g2
zvk)3}^h_cXF{A>-b^$Y8&0O<uF2#25ZjeY3E%g`RIp%RY>~ig654YjBsLaEIUhTWP
zTpp@VtM>*Y-eSRBNPXD&^N_yDZz2Gfj7EekJuImQh>~>zQXCGkpQP_piXswdH#<%*
zwY!p6u=)s|I8G~0=?$Ko`a|*TA{xaz`}Y9WJaa@DBMCkHE`WO8zeTF`e|v|w9;KrI
z6R#<p^rc-+(|E8*8G{34MRa6HZJyOya=_w0KLzP(EKFOVSS_fm+c)%e8Q+3e2iqK%
z2bcVGxrB^zG_?v&HVfutni4R2N5{coE2EZ@bRVZJ%s93ej&J|!k1o&`Hl@oI7AwwE
zVXvjjb!5l63l7c*gAR%t3*KztHc69GT+W>Q(@8L=-UNYnmNkAo$EE%iGB=srmQqKX
z4@kWP8(%VNKAyIX?}a6ZG!tzSCZ|{?ERI1!3?Sm=Mf`laF<`B=56YNk8{4`QC{~)c
zBMhb>&IJl)pQ;-pws~UUj<(}_YXkzx#tX|g7pN8pCBQSV$1eu}k}5lziV~x_vG?hr
zb@b;%iu2Dy{_Z~||IwL{JO+OGI_o?6Vpk=6RQ9V*`)C65`xGlsp<bn@dJs;&6Kq=A
zI%dRXJ+NmprqwBv>Y9aK)PuO@t`<n2mFU;@qHAfg@f)kKu@Wqv#t{i3<-OnK0Rg87
zIUr?(nFD=nz~SvsBvwn0y(*9#qmsuG&ckZf!OO+9n)=)-a!e?#{5+J=!X!C$0dc1d
z{Q=m4k5h(sOTb#*eUR}?Q7XCt&Bz=qCx>(0g%zOyZqt=WVTg)^_1cTcDPqSRpiyeL
zf#lo;K&ghqaVY8)*m4??2mRecm#2px)(d>&B2K?VLAnNh?9-toBhFPI>Ey4xx~9-)
zILKS(Rj&kV!gJ|qsO<7N%-ppcuhz4EKviLK{0JGa$S5z2Ss+*~u&mn%eGgb<SO>$W
zCRClgwE|z_d@U_65WuRhUz1dCY42QHQyM%6?g>k7Po$oy)N3rU)yew^FSM?`kYs7b
zVKK(B{e<+T)dI?trWegTj}AGwD;9g^!4aaw=DDLzPixN#i|7MBUYEU*TYW;jjcY<S
z%meWA1~70Rsj~5(vFvy0a_3ejjz{j(X9@X9V~1L-W(m6)V8rD>U`OC@6F-nRYw02K
z<V|f9etu$yxCSeCXMnXZr*AaQmCj)@FnyI%*Pd^I83Sq6q@J8(K&@TOLj{qIUz1H2
zs55N<H;V?FeP<exa30*c-#7kU0^&O-;4xoL`8r+%C8YpePng`cX=){}-a@RySz!_6
z>|OXlEA=9Nq6)E_KDi64;-Wn)bovU8Q3*LE)r2hAOaQJuB6?Z)QIvcDvp?>rK|nop
zs1xM}fldzN^};uqLAe6p9f83Qt7I$#4A%`+9Bu0}+d7Oor=UXs1%4?oj4GbMJ2j0i
zgjIDI@O8+k78WRldMr51)Z#b_XsZnP&|%oo`2pnd%);2sh2>S160oR6;%}0yG@^DI
z!J1?l5L?d?`X=DO#OGV;)OGcY929vThydhII63{wIsVjmrDz+MExc2i&7z{K>`Naf
zskDNEdx_U{{(i5Kt|rRD8v{U*TW>Cn08+Fgms|lU@SEVI;m<Z}lw-O#{EQcEA3>St
z)qlLh?sR@7UU&tBN8gM{eBd{#Q~^_hL&ifJ4i%9wx1Cmzt_ua0W2)H7MF*$5p+Ix$
z-mNynZF=S&l5IWWuQRP|z7}ofv|WqXsRe!sl-nl1J<y(Fv*vXHHgk!7Tdz=(3bb1R
z8(>y#D!=x=9l*~~X4Ph{z$AHf#g1yjru+F87*A;krXHyu1yZm-&n&2M^kx58y&rlB
z&V4B8xRcgrcb`BD9UbJIKEoO=;_-8+!;Dxhg*_KQfny?28RLsWu7Hhbu+VOS)$RJx
zAV5n=z61^u;3(O!8k=MU5MZ!<9J~i#0~Yog#j#FFal!M50&QXebqO0Kplq^MrU?uD
z)f9QiJk%l~PS2}pb6{Oj`+74|^{R{row-3|<UZIt=suWHdz1=gVtlbv^z3U)jV%aL
z5+a6#ne#+#dIB8^)krtDAD-}C!DM8sAPa$897w8O-mac&1#ZOI5N-ij^ceEgvz?>^
zk?soxv#HoER;ooH?5tgz+%E7%9L(U(c}RTU?#rV9<?gJKV}R=Mo|YK{ZVl<f81Vy*
zFd?gJUw3>%H^An5KupS~^ifG>z(+aBKgK(~{TS%<6GSplf^)D!pWEw?XWGu|Pv`-f
z9Rnj?%tyJ#mOEFV%)k2+>ix2!mX~Kt{T6&db-Aj#73{eo>xkxYtS^Cll=glX1$%IT
z*KeFxQ(FhS>4S|v4~Vpibg9lsLHYeS==ZT4w5@5G>5xmP8)HC&<9Nr=^^{8+uDOBZ
zohvY`gskOFg=+F~o7Q;=@GMqMuC-q=eU&MsCNL4HTTh3&f}k|c0o9;{1T4yYF3Ip_
z?aSb3mCwQHAUEsAh9J$BL!^#Z^4cb)PaYiS0uxKU`zl7Sft^6~S?^TLKoN2%J!eNj
zZ4IFl?dNv9%PfJio|*x`chBS4Ih`DgA3+aQ<Xy`)dU@ucztzfmm%1Jo<=3kW_=K~L
z9HhU_<_a2BNy-`{W!=~b@vKZD5kXJ@b~0{G&kwI>>V2pY-lTe5TQvs{h^{g94N@p$
z)a@S6>a`E+T);PRw%h>-gdqSnmzAmS7qk*c+HhVh8e_1hM!*L+r3U0!)SA-)FD}?`
z2!zu~ggi9T{y3Jr=#=9}j7E7K-wUm69>)GU++&T{9=Ngdg~2Zu0D{!BDPtg6sE_=4
z*z8nY=SNQf{~xn37tiq-na6NZSGdN$AKe4y_-GTb)J<wOJU2I)3KhIoK@nagmsH{}
z^#F|FfM_O01VzO4w3CP1ldCbL;IXaXIdDp}8WPGiu3iat(nifYk+T3Vup4&RDSr0D
zjOw?Dp46qWWO+y*iP~JIjHs%MoWhr&wo5Y1s01^0a3v{aL@{3u?9AbUc6k|_b&MWJ
zOpY0INW0m<Zv(W|rgo~@hck6D9t)?q^`G8ua*+fjH-u2MFE@d1h$S+cGG|84NO#Jo
zNx+Xb>yI3H>J^{^O_M7#8?~xVX}YUSb`;uY{$7DDmhU0cc*;DA(oQ9weIyE!-Rin%
z+11yW2q^P~Ek@J3oDQ1jZo|PTz_}4n1WsZw0cz>Ms-p8A@<ue}yBUT;GNaD-pvnE{
zWa>R$fzuRt+hkBdCQzNk&|!^OyNb{v2V++xG`VosT`m^d4Nj^^uwJitR8<B=4WuH-
zvvZ?9%N%uJzzp$+zN4Tz11L%L2Hor#45+Qzp0#!aVg>=a=?U4MRd#>^Zosyio*KTq
zLu?0f#-+obB#q}=(SH84{KnIHqcQ2y6Z82vVYc<Xko~L4scS1Z><+Gnx|2Y?N}xk}
zg8Di=6h3DsvRh(wd8chzTM^Bvio8BXu2bK+O@JjO9c{(P%1r&iK>0`lv-_ebdt1iy
z8aaK^^Lva&SEJ_O3dg5$pq^dVZ0jrQ0q0?Q<bO%e0g3xC=kHOU5zG;L7GIOUp{ZMF
zr`ZF~z%by)PqeDn`1)hA;uPs1dp!fUaS7C#1Y5!#Qm~V+<uC4)7~Yq3kOLs_9Y1m(
z3VFYW0DKA+Kt?^-l4YRCIaGId(4m+@72BSYz#5RBqkb{a9GzLjb+f8jRi`uB)>LpH
z<ML;qPoqn3oW(Twfw+ouT^%EtGR^}H;pw4{Y=Z>o2fbv6aMMkwMpl6^MdHawAP*#D
zZ7hw*ymr;dlM;}4Rhlk|0YGaZs7bx99w+0OEe)Cv38^Sj>T^m0DLny0nHt-Pef~6p
z`iqNlivZ&m$Cro83Z&uI3UET&F%lg_nyL$6>S>hU$h#q%o+slZI|i_L0@#C3fZr>`
zt#`8`MK#;am9EgPHx^)C#q;n+IJkfPE1EKc)}<~akPB|aZKqP#6LhJ|R5JDkdp(je
zXtr$!Z2HHe00r`%-1J-C#K2Go{%pvh7gP#RAYaCKGzh<(sEb&#CZQI!#Xx;P03n1c
zkezi6;=8YA+eKy>u#P=TFoAubGE!N>b{V`&SJ<!`CcyJcXMi3tsWSj)V(a-FY*tAO
zmxGkFDGSyJnb%{hQ6<`qAslRV6YQW-ne>&l`toZq!xtcV&d2u_c#X`P>VeHb)+aPb
zREv@iLgw<-6haO|wn87J3q?}zfny+G+dy2F;WuUN$3xJ0K0gSLx&*1$8en`5%)H+j
zZy($CLFJSKu=RlR>||4T50+d)^*FBX^MD>Q?*!`8FPQ`zqZ>P22y$1?LHS?L0I9Yb
z5vJr`CvxvuzeX@2g}l>F-8p*zGN+6mc=o^TCJEwtD#Bz0==A53j)UmAS>U{~9RP`?
zn$@jF>K2z?!uIg=ffWQvk(x%r0Wvd;zhzzY9vT|eB?qBaL=K2T*Nsf0D0@1Xh!guK
zK0k@rxrXN62U?~mp984dD5_JSIF7p9#0)ZDECEf+DC#z_X>xG+;o~SQ=W;j<QR4Vf
zdvFtIM110>N-CWFIssh=KIPu^dwz{}+#9mn3k4uOv}G2*9*#W-eQa+&umYn8=}vs4
zwU^H5%b-}W5}3S%dm1_b)h;HjMq}eh;z88L`JyVHP1wiO7k2{a0tkoH<%tgiU#?QP
zC_lLX*0B4SmU%NOX-?5^Qc)AE4P+lc?v!eFgl(A)(mw$6B?DAvrB-94L0ty8xNho{
z@JqneJotp2IgaJ0igOv5G4jZmYUd*&)pF}8fZ=lEMoGOTDQOsaDzP18#FyJ&?S*WD
zCLj58HVZPVsW|Gk9tW!;1{?3zn#gaKwI|!GJ%J#hUKtP^G9OJ4@8zbV<N?f(>znwi
zZWB4Sd2}3{!}^KzJ-S-#^@P*<tEVQ<4nZGbFw~n*UB8VBZ-Arn0)P{|EhvW9ER=dL
zHAyDI_tYIdz@k31)mu^>NqSig0vbo}L$5%w5v1=2d#V~b<W4SfXA1TliUazn3g2*M
z(Fx^40F?ASo`67AlVDMPeXDK-d%U(T7qE<5-B4IiVwzmxxeVwC1)c2aU!5ob>A%n5
zWzj#i0aOLtX7Ipkz|)5nb=TNi>@lbV6mCOug&_5>${IxZ#X!BR5Ib>-=jDD#p9dB_
zOkdTK`*TSF3KCfN({(E)+0dz`%Wy1v5P+uSUl$Oo7x>H9>Dh^@kKs3~S#1uF2I;Mm
zStl3;cB3gPJj+q+uNNYpZCn>L7J-LE`ou;0#H`c9iruPLMctxEgFC$~QHX46^}^DK
zaFiC=0#7g;K@8vh#`RcO0JXKgs=oz>B=c{soiAMXG+bR=cdzEXG#wdpYcv573glPc
zG_=wfp}aMlnve}DU&_9W9j8YBXEpS4W`JkF%>zLSD(<{80<5|m&X#o>uS@_3))k~B
zXM!Xue;)0bH{C41v6JP5%pf)ERbQcT89s-g2Y8$fz;S|vO0GO3!bQ!4aa%{A4sn>8
zEIRM!!@rbXUk4ND7|LOX<T<t84o3KK0#3)BR2*R!4t_>>N@}pzcMuI_W>;R?gjK9&
zA(09}4j{GCp(WxofD`|4+!Q#29X;bkr-0Ttt*YYKdl_&|ofuv>_jzh3-7;PbAT=2m
zMQ+o=Q2zULklS5d_Uq_KWdtK!(6<6`rRs7pjpD!x@Lr7IDXh=2=O|n`d!Y^lJmMoz
zcr@;$I!8tokV05;au2P}f4349hWxVu{yvi@0gM>`8B-yb{J)^gu$`w<R}+Z$0@<el
zvTxv*smm)dEist^!$lbv5e-xtiq%Mgt^>ef@4CL<%~Pxas{)c<<5xkNv6;y-9-N@e
z45t!i3Y42#L-4>0FQS1`04xO>fq!rZ1^E}lDmQP(;=Z<n?tY+5E)rK-K&_J|_qhW=
z+n9of=z*~Y184mJppyYx@m~^k)Co|~WbR%G979zN9VCb(lsl)Wz+9>VbBV?W$Y~TA
zu&_hsk(26)Pk}F^H7N;H*YfH_QM>QdRel#ZWtPFGZb4b{#KxWnZ2bKOrmdG5V|BoS
zb(KfA$Y26UvQm;HbbSo3+>$`unbxAE0d+fB^o%tC=9{B}yw%A?JqXPN!m1@G{Ht`C
zwWXzH$BQj9uRZiouD$76OyB1;Of_(bQ*G9$bkIz~PRcgijiUsoR5CI7XJ71Lfv)$#
z^fT@X_!O=Hdgvw_#o7^6-$3?xK=zT?(e)IteZa)%5AaH%TuigLkwfY4i-vpj%swOr
z#ZV4{$E_atMMLGk!&2i(Tp0x3YV>&!H^LWLB4JMb&nFqX_vrM%xXBHW4i(*EBd?%9
zNy0n;aZ~{SH8e)?2o$FRg{sei&#SgXK_Bg4?W6|Qp4;3!ai&oU?B!^#0y*l=8UPw$
zqRs*I52Shlg+k9m{*JIvm8AsT6b2DqMxt!CGw8GFKoLcUKxax7vlQqO_Sezjxf<Qn
z_Io3^>X{+kL3KC@7~?B2&XMa&!<8a)eDP;T`}<Gr1XH#U;Dx-KCm(?d3jb_ae9BVx
zaltzq^OTSQ$nhzk3-b4K2?te+nE<ecYAWF`Nx{DfbnzVn_5sivsv(tvu6Zr7&m64K
zObp;)yq$Mks-o{6DB~u0!x|SF%rZYgd!zgB7yj({zK9<eW`Urx09rs%T^VNNIp(90
zu+^U98*;!swEivAyU&9Yr@3+Lpqa3S^kjztYKeuP<WnzbssSS<={aZWRuF&+_jR}K
zuk3~3`aBpgS;6R42`JpMLO|Dtz+#1-?M!wAoQHB%U=(xraqF~N3VkkE=V*y(Z|sVH
z4I`|IGX<1^#>O={vjY;K0o3B^tuep=RF)zeboU2v(C>Cmor25<lmmg4RfDI6?{>X_
zJvGjf14;^LUj_ubdmUyr2Bw!#Dh<4c*97HCn^IPzQ*F`~4nhEOc;tWa?HF-RSRZV;
zr*Y>1?S2z~u@n$rY7o-jLu~p~VNU0-lQ@3xU(()^5r!^10WwBij~}iCW(i1%5Oy`4
zIbM?v%4OeW68t(eqFsb*BJ?kETL1MgL3jVwd&mFc*-zkaI%nzuN5UsSDqf!}gi7b{
z1*o69Z*}rfKpS9vCyn){D}j2SX$yyRaqy5cRTLdm4tBPA6P$w74FFJ?KYl$w+M&Ag
zJ|HTTfv@GFJfXSRAT{{W&X5gWZwJ^hu!!Sfn{O@!l2IVchsr@!ig^><0G-MB9}a+|
zDGR)HA)z;)Pk~D&CE;Y>uG+ZxR?kisez9xt)|CL=vmdGOi-R8%TBSzKP2^TBSGN30
zfcg>2p5J8o{ny-mejC=P;z7`|`Z0)>Ha-dJiQsEHB7dhk!S6NNG^~IG`|x`3Q{-OI
z?r#$eUiIIfkF2mK`R_+aDB^$q_4lH7zwm!QmHU4od;I^aM+yT7BqX{V48l*P?g4JV
zF56-5*x!iXspwgP3uY~26TsoY*mWYUFls+EbC4#6G#=*ioPST+Efp?;+tcWv_2>WL
zxIPoDT=pfXr*ZB9YS#4Msv!un8;>$_RPOA6OU~?as>A_+FBJcuOKrY1G&Hn~z|||G
za$GB3w4NLtLdPwJ<iDVgT>p`ynln-^li%((^}vxX^52Rlcy<3>98jYo1%g@vXbb)f
zpv?D5jxVD?pW{TbBdC6z#jX+hEzu4!A)xCIQT5%7xGwy-%sE|h0N1B#Zv@{eH)Pc#
z-`%d(c-jjn?SC}-c5u|`k<Z+t&dZBeQqQJj%wA0znwwTDV7C~C>ss8wL1QMXQbuLR
zO#L3cu{=riSzCI^=BRWFf`CTPta3hB)#>hayxli)egh!jvn(fVhnwu(df^I>%#iX+
zjv1^@^Ba4_&EA;3++dpb^NDgm0;87=Pf2_t^t4M=BAIF|5cbsaUG=17ci%J1@;hbV
zpp=8P_hR|j8^3l5zdGf4Y223aUB&S(#t}X=g0fZj05a!Lc6{W}bMV!~G4I;UgIzUl
zDN^r`f=Zte^HPNm_VB)4EPL|v>klX6$`1r%Y<4wEZ`FshQ3~2;GZtx8YE~moBUiGW
zAZRd>i$RT1>R6E9;GIdmd*#RCf{3wh7ap>+HWp170H7-kbfKleM<A>x5MR#*&kq+o
zF=2;<!-iW1(*=!N1dgSYtjhn;bT0WN#9Q#QJ6#L(TQn?oz5{FMP^XDa3ZgFuznsNn
z#p<B3c$}F3SLo&8&BxUl#Y@&j9~`Vs_elUuIjHh)<q_QsK~SLM`!+4s6E4NeF<l20
zhQ^vTm%@DJH{(FP9=QZ5>ST4r<AZseCtj@1c`40uN|NGGUTqxW3b*A%26-$FMkW#i
z_TgQ;W20`kCG&MmgCLMwqTtcE8rERR#y(7sp6(GVuM6>le~LRO=J}jvFmgOM(s}O_
z4HM;$OYGY%>PRNjk@U7){oaF++XSuATL%EeLJD0?Lxkps?Oqw^6DNC)Im5N*Ha1}5
zLl2na6iXu6>hzK`2m5uSoM|jp8VtVOpJJEd{@sOJetKNedvq~IweRl>MAGgk2Dk<=
zY;sho*|A*M89-scewuP7gHjaZeD;&hqq_1pc0fmEFz&2aR)vcn-7e2>TeuF-_Hi%$
z^=5BFzTh(Ro4u2gH3y29XuX{Zs-CA5S$VzAEm`b0m$q_o87Lb<k^2vjaGNat?#!$h
zyG~t+#TOecrL^MldHzAZwT&<^Z=X+r{2zfJ0B1}@AxUA})yw1>;#k6~{C;EOgCUdi
z&drr?XhmjxgUUFfr1!c_pfC&Woa0|Dsy>v?m-!YR#%u9zt`_%PP2HuZJmb5LKuGSg
z_eIAKqE!Q0onM)A-w#pI&t7KEWJtNF|8=7-z?x|CCcI2T=luk?NcHn1u<Rd+(#rX>
zdG>JAp5x`XJEHpRV|q}pPFJuDz*$u~pW>e+1)j<bw-HHqI=<|~Vm9x$9c2sXoh!)&
z0CdnGJi=?#p2$z{)$RVnc+zUJ>6>#)Lc%Rt*TI=U?jOpHbzrt8a7qiOxg5SldriK(
z=d)uvmDJ)IL-!F4<Ye`{^T%0#xiimrN6zVIgvX_FaN2m##?q*|j?>pX1jVz|I_{=0
zu(UVX)j6W0u+o)>W>WJ_&a%T&GI8zb^ns7~2P0rnYICvQ8{E6N$&L!fKCOb#D=!X2
zbR)Td8SO*e9!p64l;Zl@>Nt_V3>?C8Q6YS{0?!*9y95#~^T2ou=J-BTejUEwe1+DI
z0u>9KxwuSg7Ou)ZqxP(`e5?A7)$~m96;tS4$y0AFegPNN@{ZAU?zA5-t7uE8*@@^g
z7lB)k9U~jbFv8IJ(2DU_5?Vec@$R(`7a~qZo-!7G&gZ64@>6YYT-mRTR%i+3#sgY>
zPjs%7&6R^|{YmM5x81c^d-{tn2p<p&-lQqP7U9t$v9=j7_&n~VA(u%eRyf+Z5*xG<
zl24l&;IR3RP?W7)YuVFb4S57;rLA6l(7X(ed5xKp(W*{eDkdTAEM>lxw6A9W)EN4j
z7W5{mnBY=*eG@)}g4x7vXKUpy=K5_t2~4ZzB|01QvLH0S^z#*$TIZv1MjgeX=~kD#
z^5C^Og_2u!Qr<+vk;p|g{CroNC6Q?4(8$;7IugBhng5w|1kPg+e@%sLs99)UCZe{l
z_6?i*(4yoDcc|}9m(aH1fX8AwHv}2!@vumY*!RC!m8`ngJAzrI9}3;e*odBx1!D#H
z&y<5hd$hVQ^+eHq1Q`JX+fMzsAyDH8PlZjX_Dg5l-zb+TjmfLOY-DSU-VB!Zdi|VQ
z-ud*5m*zxi#rb6bF@Cx1V6tzvpt#Sh4_8|KjcM6Q6YbeOZ=@ry!dsnGU_ALQmGo7;
z>k53}x|Un|Q+2nbmR01uiwxY1asV}dSTU)W0M2|Cds^jqHZ2;L=1^6={Z#Y$o{o^M
z>_{v_r;-$=*-kb@IE)9)E)@pA@*qI6H`&?l3;lV_*VrOY8JT7ZU(#ah)g3x_Ct%{W
z@f(S#M#&X#3b8ZF8&oQHm&mP|ZXO92u!s#T{-81E5ts6CHjB@xMQ~`kk)LT`xqLnw
zxCYmC;ARztTVP14Cr|;6B}6HuxS<I8?<TedgZZgv_vS9a!qa?b2_W++X=dj;-HbKu
z`Gv2vxa3(yDQYWPZhSt>QE<=hHPfq8%a}O}vU}N^iGo<+h}K)&vk|=U6T-PdD#rKO
zB}`N$l)G8)S)Zsy-(6aAk$D|-SG2WjRFtDu)lj&sc&Y9{gACj+^m1H6+|TYAWd*t4
zeB|25j8+g8U9K!nN#Ip#P?#Mo-F#tXTRW&CQzr)6H9<(I&zUrM&O#~*H~;Asr%LCB
zkj2PV`{!}Gg<K_|`ke93DnSe<77?(7yrj7Ys<B{)ry1OG&hBudoa|e|?Yzz!zC0Ku
zDUy-UD`A)VYd<s(qF}*{^iE$>^qKbx!`Jl1SMR(CTCFL{G(NE=Zui{vO%l7)XumO=
z=cfykU5v{jji*hzE?h`W*RQlMH$<6Sn%HVt^*Ir6t?Nz2B~`R8nyEd@o=amkH-5^v
zOIAT*k=~s0ZEJ_@ym}fPB2vGZTnY6Ta@^Jn42n(?Zg4N+=w7uIZZzWg^lIm(opwyi
zD<?zYjI9r^s$E$TLJY75ZM_O+awUFR_4Uv;y6yG+zCq<jcBkw`+UB`EZbKeS!$$`F
z#H|rDl)FLWm1^hxH`pw;ypwrLtXaVhR=or{75lwJYXv=?>Q_p~Y?Cgf8mosNvi--#
z2sb1YJIFu>y)%`qzff{SAz*ya(vjB66}T3jGBIA-7U!wjw>0fFVLY(p1D8G1K?T5l
zXny>7IKD6GP6|tKG2Y~PXYO$KJC1|HoxkET1as6hc@4xl3LBFy;#OWN_gKswzL~_S
zdb&1(_iTaooc;lmY^-pUGq=TbkK@fsD#&aAR61qW;cnN9qT^khym1cN0RthWZy8OH
zdHk$hqw6zUtJ{n?_wM~Ir>v!@Nu06W^&a;zC@z&e6S1sR@3IJ1Nz1Z`qlYp!KD?5r
z%`kX5=sRo>-X9%t^hKvbvW20n@<&_a&Q_Njaws$6!+%bxQ@pz_t2S?TkBBXEq}qBX
z+Ff{N-Z{s6N(_vku~#q}`o_0r%H`l^wzh1Movo|sku=56mC`<zAYS~!m+cbzi=xBf
zB*!iGqAIj>@j>$$n&%XVw2ZIO*LBE}Bh7$m20VPx(|G(-*EPwU(d?|kTP^2DxhC2o
z9YpZ0zZ}eV%<9UgE!fn$#I<?Vq8$)<i)iTsF}eoOkLvBEyPY;xu~ucRd!Wm)tMq+V
zLl5=f>DkOj@r~=@_rl+fxKYH_j4R?cQo4#Glm`lg0NMa5&oeVukCoa$3A)@fVkVhw
z72*-BDv6?AntMFn%Rc>4^NcxIm-D&=zexN)&H;Q$!hhk<6GgH2Pw3A6jq01vX|-Y>
za(n-pgV!%y;8(<i<6UEI+wubOZe^(<Wq;dSTHigxuY7tGgEutQf8)jJ{xc1?Y<RD>
zl!=rQWHu3X7uhLUGIH3W<|#bQJMd)#Io@9J!#BO9yN^4+NwzL~$i>gBP6lW$Se6us
z0JFL5q@r?qbF0jI@J@hjyx6^PY3F=f@0)ViB-7;r?+;P*N6PvgE#BFN-Ji}27J7_q
zncprq0dvva$}V-&ixa%Y(%d;Da_i>_N7)Jar;Dl@scS#!`ZFu<b2#u3%ba&cCCD$Q
zuwCv7{X4@2>`t}@gSjaVulfU18YTJ`{Z=GMt}qX}%gsEO0dk-zW>`p$81gHVYr*Wu
z*KhG~aN(OI@<Mov@&FGE3m@PYZP#S0X{7{W+B^nmt>Vte3Cy(**vRp6<Rs!vg>6C0
zC!36~E(0Etn8g#&JJ3ELq$D;Ib+leJ;Gg6xUQe_qsJanNDM^@=mc&XK*C-kO?M(G~
zrx>dpP!s?wsGAb}bR~9qLgSxZv@b^Ki-)r3zgB6p>WOh)W%@1|8t+jS#XB;TC0-c0
zJSfHr&d9iiR`jAdBInSCe>>JYsS#zQmu3$eoly3lVAQi)sgRqM@QGQOoI`#QO8n{Z
zorzDyoe?i&v1QAsb>XLr4x7jY<)=~ZXK)WR_dM<!`gXn#^vLH7^`tJVM-Sa(Z)|i^
z-<E7U<@i0n=~AtwJRO*~WqJg^e<L4E6*C(K1Jj>liDlD5thh#lhitt<i^q*lG@irf
z2eWmIKh2&^f9L>MX6Cu;*>yLpxOfd46{}8Jm^9`YXQ@2|i66V>iLzpJ&Z=dJ=D>k7
zwQ8;tHU@5&8amxtiyVV8r$yT?jC;EdsJf0++t<cUu|J8i#HV=ta8|%W{+-+swSWJg
z?ymeT$-Lb&lhd@(UY1(Tm`m=NTZ>DJX_|<pDek3dD4^nwYj2rp2#z6WE;%ltrQ(Q+
z1f))i6sG2e2`VL`qmDUZq~g+f@ICK!&iNM(KXP4MJkNK#zxVxF?!rys4B?CZd*ZtX
zVmj@mgIhWQ7knV>q_di%nnZuY-EutWrZ!-0xsJMfG*{EJzwkrXbytnYg!j&!r=LLm
zeW!x?ck(57SggJ09X(#7`SUiy7DT`6<DdD1UssQ|fcstF71<;kL5DBGl4EvVpk(Vq
zVd>>*5sAG-JMe81=GFQ)flC7>{-j-*R<N3Wd2Y+9q2EdZ5NI>-B0Q1HNq7Vw(B%k>
zdy*7qUzs<<JwwGTw&X~zf>3PQ_ek2yTQb3mXQsPMx}Z`0Zhn9FFI9A+ex2y|!8fs%
z_W}?Z{X_O1VFQvc18)WD>B)4*aPZ1T9jn*U>M(9;V0)c>2IkyLvZe;>#|G*T^?q?b
zj?Ljj)<I`WOTGMf7G3#I47d{#54MauB&DnUmgw^clL*v--EKDgi^Oq9c`J5j&5fT;
z^nMe88QaH+72yS<kM*o+s*3GffvQLf&qZi=oUWms`C6&z&MSRg>rE@m=|3TQrt#-F
zQk69vL<j2MI#sM+vdv1N`@xJA_RL>=x3Lwo>z8jmy}0sMSr!?-%1!$lozaB;(b-QS
z#It#!CAg|UuK-iiVoE||3`?~<%J!&EYcwOu_CMCRxdnB-u+VID`$+l7?(tNHuOERS
z3H`Krug&$GnpZmQ;cXmhUya3b7MQ&q^LH~_rsGZ}GdqQIXlQbJTE}t`4vmX9kK5(4
z(Tr#AeTEgb{WYV|<E>jkwi%Hu8CfQ{s=_nty?L7#AXDttx6~4&j?u65g}f=USm0jg
z7xMC-p@xzCNj*|$Wyd^)mfc*Pg-P^ldI=R4e;B0wR%LKM$DaxJgi5JeS%(6Kb6OtO
zJN(>w{**vNqPbl>cd*WYYY;z0#4LscL?06JH-mRjl4b3)=g0h+{#M6|htzmil<oFB
zzgn9>uHRHjH!i4AsFy!gM&4VaYtb?=Nx&2_T#HlQ_u;M|+1;z5+-8#TttYMqx#d{&
zXtbNS&d2+}F_YK5B$&ohM|3Z_eDvB8{T}xCYeRfrdBrEw(YH#YmF+WUzr63UyWIZ|
zfNc~%2l{m!qx+^n`dy0aJ0gm5?tnqFfFfF_s`{~#%`v+EWsmje23h+0%2eBoc5JjG
zxsW46AdcoLo+SHlus1Xh5;X~;{UwJ3kKZihtuwbeRA|*v4!0Edo;nOp@Y)9s7d=s#
zQE2ykn&YHIEYHK*u&E1?q@;^3Z$b!EYKWShBjdN@ovK1xwnXoMssBdj*0;eOKHZUi
zL>#>iXKZ3R#hqIOI*n;DTm^z_LY{4|aL80wwn~_lEUA(MTvcP>vQgzGBv<(6bm$m}
z2N^caZYpa>TW=_P&TEQdjiJ^Qov4S@(Xf%Lp;Lneo9H+n$q%^ap%*b~^qLxe1+!(?
zZDLkW-XTDX0SJAVa(fvCQ0uAQWLOMjdtGm+G79kC3DLodUN8SmrqSWCI<->XyVn?Z
znn@O-zOzStJV{KKM5cSQ!dw#&F3RD%inGkVk3;|-Fo8VRizO;4QQ~t|GhLw5K=w==
zjJloVeaN4zsQ6HIU&%q-SayzQtn;5)HNlbcaSeKL=JhqSbB*~WBx4)(n&_oo&r7Z8
zkyvmZyRzU)NbettxH}7iGg#K=&>U*W6=jaMn6R7tnm#rFJ8M4{u7t}Y>^DLLKDhhT
zY2n{d#1PVtXU?lS(?`rqOpv)jko(0Q4T5VYhHTx1Lvu52OLui>l7wt`oQk?IsIy(H
zvB@Mb9<X6wxp&jqvhii&S{N{#R@>Etw(axb&9xb4zoP(?vqvrsPZwvVQA;0@Iag~E
z4jb@pCbN`<?1&3G0vX@F8NeQ{_BTKW$5rm;#|S(e1U7zH#B0dAwlZtML^b;-@}apJ
zKuU>j6E{pfFifg{4^5B$gSglwvAG0-xyv)MBxt6$4J7L;ev5>@H^&dYt-f$qcy?f7
z@1{C@AnFnoIwNf$Qdm2OV?fB8#vAM~cBKt%8I@7~&J;obS=jfNjgO}Q?w$@;c0s)K
zQusD4)O_owD(4(M^eBZiD&Jawdy93|p!D?Rd1)j&7AUlgqRM+_1NI4r(6WElk5<eH
zu{6C-NGb^HG^XPHY-kb{Cxtj+`a&>9K5q>|I0^RMRRx<RxB{H)dyJm{X#WW@I&?*W
zuy)}*qI4Umm5~u3I$M0y{rBISvyHmZ{KFiH;TMnYqH)<&d9d7)Czy{C*@ZzkI5d8*
z=q)qiylAB41vg5!>PYf{afcz2)jSv@j$b1@X`AiIpqPjKcrRKVSVwMdqQ@P5H{*=M
zF`opJSHDW`UwL}U$=&G%+wPL0rfn6nPliZ1n!Eij*8bba$7j(x^R06)pL}r386*j+
zyQi32k?x~#n6Ejdi>Zp#$8%=d+sSuQmxXS}j~!pl3|3y}uA|qty$)tX2=h-^5jpu~
z+Kc*Cb1IKW+y4kW)Zz_Xh^f_CmWh6=|Evf14bJ}rS|n<oHl527C7M}%&(buQm=9+B
zpc%G=UB5K!`-vsH0d!sr9Vt#*PEpLV^lfL{jR{Qn920u0i#Tic-ItW1UKR620U%bL
z*NVO{+5oLfR}+wzY|XCUK(0r<VicHS%<v16C5X|eh>YQte`e^J%&ShnI@s@_aW)G<
zIBtSlStBm`9<Ei=<UuyZs0A_WTUyU&kG!`>gse4h24z^iT5Jv@1i4%M6P`u&R69IT
zYx^KlrM0$<!t+z?q&qmJ{PX9}F6}YI?LPI$pGC`*A5brqPj&8OXP^Gy`uul9cKPrl
z>vl@$H?6QJt*}&&7@y;hc>EC?pa}eRZuPvqyRi6%U$Oz{<FhjhQ3D%iYd;iNVQvqA
z&x+A+<ww5i)F8zFX%4jEln!AO=#ul`GoP9s-NVb7dl;B79y2j()|@LfC0PX;@)~J?
zWRE|2<N$~SAaHJ;#>u%^>KR)H;-VHxH!Uob^3^{#u=YCR5mov6Yne=DeRbw*$H~SG
zKCDA*=asy#WPV%~)(lBQ3+~h;LfyH_r?}AqQuGGphq-fd-?8n474`%s-I~qX;idPo
zb@I>-ZpaRwJXgJ#!<Z)>G1|)g8>ZCi*|I&rUSP;JCS+d|erWyn?+ca~ENTSWrJlQ5
zAkN5sMYRyivmJ)((A3~!$fJ*VNm|J@B%XUGP!L>Tc33ZDG?$ZzvJ6HrW%QaH)Ekth
zl38Q%)dIidYO@d@0IQ9O<L(6MngQtwi){NZ>j0EFFOL6UIPQ+fEfZ0VSLiao{cBng
zS;=c9?ycSSxAmtE7;Tm=ObW>UUM`p4s3jpM47w2Ojg6U|6M2*;;T0xx;H{g{9Pq_B
z66h;%dUY&S|M+MAU@RDBC8s6!elSnDFuqi`#=2&oInf^BcSNyos^||Gw9}2@aomCf
zPZHWpqOyfU9*yhkb$Xy`k|e0i`Os~VnZ*<B>kw$rPO;_Z&Dzy-hGp%S1TVJ{;~Xq4
zQ`Xy4XP}>(aBj^_{@%o*&S^N6NTb$NFIk4_h*?kq+`KcfUB(skj5EK<PiQF^=Q#ud
z{f1RuRP71y6gN&fn|c2TT9=nvPtW+r8b@*doUhcTWmhZJ_Vm$<%-U^F&eKzesAuer
z$MM(c_~}f}l}SLn{dDq2$EO$fF7C@>ce5X+jg*J5vkzL%QGv8kdR1|@wkpsYFq)dJ
z(U=Q!uNJ^K3!_TWgiA^OK=!7R8}6rZv<IQAor|g#1@A8mklBENK5}4K7~1)jgHoQm
z_&$J00p=@!>yeO&(XL|CZg$l;l;=&JMfy0rEFEE+Qs2)80OMr`td#-TH~Cu0$*2$|
z_ji_aKPr+ks$a46eu2^oIT&dv|JR_wsD3ANb=4&~a0EY<R!l|(Jh@uE>f{!qFA&++
zZFB}2bKUr-S6Ma27J6lli3X^^F+^a2??w_<Y!nJCnu|5beGW-Qm;uA!wH6jng;Nx`
z0U$8|;Ow!pH#}MH@e}*v>^91tdyAnuhfZ?SmXB~MAI#)Y&KREAe>z|Pxb?||71-Oj
zc{=vTMz}71B{&~1Yi&kOd<W>dRu%C2#Q0f-!5eBm?cWRZci<R##+?y}>qR4$*K=zN
z{(W8qdvZ{U(GlqW<)*5{^7#IEc)Y?)`GIc9zIuqj>Akzx;G>W_q{x}_YT1&Vn0b8!
zKdl^#uBn<=YE^9y^IIbgj+-Ur2juA!Ga5IM6<S5LO;bn<ComA}LGpSEE7Uw5+lT}D
znZR-=%~mB@Es7u{bc5+TMt9K`jBDKdtt*V4(etjSjcHly>w2MG*MEacdqh^<n+@}%
z6?LrU^G$;4Dx*&TwEw-YU_IisOt0@{$miflXMz2w<)9khK-74q4&$vXi{XcH8mA%g
z@xOpTsbtM99K&FhA(9U!dEeAYG2|KO;&(YhWxZvlaz}T)lG!sd_ptO*v`avkxvUO}
ztW|!tNI~AoT6!<r_Lcl#RnlsiS(VBA3N(~mv?k_tOZ;!B$w)yyp-H`L*=)#BGYA6C
z*Ux`~73@{Sk!w;31(T^pv=Yf>k8@!_vh=W#)_ym4d-v`9_Bm(bZw&r!Kx5L<CZ7MK
zs(pv3xTIKOzBOOH<aVLth&Cx!O}qLrb;p?QyEo!9`Wzwxq3kg!ts~AO&Lz47YteYR
z4Tw!%?q7N|)af0~`X|UEQ#oAa+HSzvyYx#>mE!Pj!x}l45q@ei%(cL;p=fgP1b3;&
zKYP|PXK_C_CO={w8lZ#9!;ZO0dR{QkOj}qBcyzUin)eBm;G$G?@pcfX5n$&T`(_oX
zjU52~jFdGI#IrXZ3qv9uMqxgWxrY`uoE3iv5ua?*%qZ`2#xWt|phW(KodK+Rm5HWv
zDGS4fMe?M$FC|TNr9|t+9iEt{2$bI`B=jyOk<d(QfB4eF$||k+TWVzf=kd$V-nS55
z-k*lK;DaK49#Ad>RaLz3zeHfpHv<N*UKSdB3iW;%p=M;45%!}danWifjo?8P&7E0@
z9OH@)uMP(9KgtbM7Nw(ceUqkrP10WRQnc?o7oX%5`y{~A>elS0p)42@*>CT2%=F16
z&M|{ji56Ili2{yzEb<Xx!&|=?@BsF#EVQAPSj$;$iWhw?9ZG5la}+opKtbyp<{(TT
z@!`6fob7{vAxwz9ufBW(Lpb&Iy0IWodI0b3-Sp7Dx;rY&j_`h!ssBFj4l3%5UyRA`
z_$d3`j1gRQ&03VO%j$Y*fVX-2Qs(uwOyIiYvAZ>ZCB3v!xn&Iw!w;1e*jS{LksF_N
z%kE#ZSSwG>tkG?1h9|5?H)gh#&;2@(vF77_tI{f^FCIS>K=+_6?VUfmw5<zfQ^#UB
z2`?H>H$C@l?!^_5^qaQainjI-_ExCX2{-ZCm6e(qSK|OG91^8;DpzRST*WCo#;E;H
zT76aNYYMp^q`Qc2BZ_e1X8Xafohw-7=nnPU?cdzp(sVezKqg-y?PV`Dj?6;|$gwnF
z_a?0a<BHg{u`XfV_;N}LX^k$OJu6NYZAOs~=G|2R%U2t(WcD?rByO7M`VRXZ5Djzd
z`hkH>zui&uosks8qgBLTc-jb#923~<a?pz>W@z&f7(8_lvj<XK0^SL_)gX(beF?G%
z^@)~BSDZ&#J#C<SyIFJ>fWJi=Xii!k|5E;x8RthJXhK7k^kte)CoKRBpKt6C^&9|s
ze9kzG$|X(U#$n^O%t!#Sfru)Zd8EGS{t7d&kz@aw%}@i9yTJ2VYXL(<&l<7f97KLg
zMBWEu@3mSxcfqy4I%V+HRi%8|=ZI#1enCfeOU1mfxUX7pdF8@j!)ubixv0ZKJJ+`V
z+fM+GMG}X|7ZqU&q{}-1fcc*Ext!^s`=V0j=@whm0dNquLaBKb3?*L*#n&qqW6}h8
zSfF0+Viwu@XB`;S$D6sH!3Jwp%*(0GwYzaumdcCDi%yS2q6i(#UHOv++DoKGH@97x
zOU9_3C7r19J+oz1^9W>{p#!C`Hm?F^iJFzHx@dEn(uDv?o^J$s2oSUY(N(UT@c;wt
zs~gGfZ_xhBa`tWW%6Yj<M+a7oeQk0LQ1|3)7#+-@W?6iL%^;v^@MmLh0*JGmpsf9i
zr)Omz8ipyD%hPIgx*F<(v9EBt@kvoDNku_<*OqY#v$SaG`t&StR)D+?a7tIeu>}0j
zfI<xflM|*uw=%B!e+GCK?Gta}EYh%_71f_y2vD+7kL&m@k}^UN7KtwGQQByn2=|~T
zKgS6J1iL@Od)Z$hH)@N~cCFI0ckK>-!NS}P=R{9pW~Jx5XhTv{>R<A0ZjzQ2d_tYn
zYb^NNEoxzXIv$`=+-l}(hDAjq<x|ia^0988`*-;u08eATFz~n_l%XXBhixqo2fd=m
zyB5U*%^GhAokrd(n!S}jbL*-9SYCX13=mS><=UC3K>tYdt}FhVbS1)n+#h~-S@@+F
zz{ySIs!&iXT>h@|4}26@m|N|-dN;prh(W@g{})#&{-XH*Fq!^`V*>p2{|{H`;?4CG
YoqF0W`pFu5`JmWcb+o2jzIFe<0M3JKQvd(}

literal 0
HcmV?d00001

diff --git a/tools/test/perf/CMakeLists.txt b/tools/test/perf/CMakeLists.txt
index 4a1a8d0b1..0405adfcf 100644
--- a/tools/test/perf/CMakeLists.txt
+++ b/tools/test/perf/CMakeLists.txt
@@ -34,12 +34,14 @@ set(CUTLASS_PERF_TEST_HEADERS
 )
 
 set(CUTLASS_PERF_TEST_SOURCES
-  cutlass_perf_test.cpp
+  cutlass_perf_test.cu
   gemm/sgemm.cu
   gemm/dgemm.cu
   gemm/hgemm.cu
   gemm/igemm.cu
   gemm/wmma_gemm.cu
+  gemm/wmma_binary_gemm.cu
+  gemm/wmma_integer_gemm.cu
 )
 
 source_group("Source\ Files" FILES ${CUTLASS_PERF_TEST_SOURCES})
@@ -56,4 +58,6 @@ cutlass_add_executable(
     ${CUTLASS_PERF_TEST_SOURCES}
     ${CUTLASS_PERF_TEST_HEADERS}
 )
-CUDA_ADD_CUBLAS_TO_TARGET(cutlass_perf_test)
+
+target_link_libraries(cutlass_perf_test ${CUBLAS_LIBRARY})
+
diff --git a/tools/test/perf/cutlass_perf_test.cpp b/tools/test/perf/cutlass_perf_test.cu
similarity index 60%
rename from tools/test/perf/cutlass_perf_test.cpp
rename to tools/test/perf/cutlass_perf_test.cu
index e77646d35..dee4c5afc 100644
--- a/tools/test/perf/cutlass_perf_test.cpp
+++ b/tools/test/perf/cutlass_perf_test.cu
@@ -27,19 +27,24 @@
     \brief CUTLASS Performance Tests
 */
 
-#include <tools/test/perf/testbench_options.h>
-#include <tools/test/perf/testbench_output.h>
+#include <vector>
+#include "tools/test/perf/performance_result.h"
+#include "tools/test/perf/testbench_configs.h"
+#include "tools/test/perf/testbench_options.h"
+#include "tools/test/perf/testbench_output.h"
+
+#include "tools/test/perf/cutlass_perf_test.h"
+
+static std::vector<perf::GemmProfileFunc*> GemmProfileFuncs;
 
 //
 // Profiling entry points defined in corresponding .cu files
 //
 namespace perf {
 
-int profile_sgemm(TestbenchOutput &output, TestbenchOptions const &options);
-int profile_dgemm(TestbenchOutput &output, TestbenchOptions const &options);
-int profile_hgemm(TestbenchOutput &output, TestbenchOptions const &options);
-int profile_igemm(TestbenchOutput &output, TestbenchOptions const &options);
-int profile_wmma_gemm(TestbenchOutput &output, TestbenchOptions const &options);
+void RegisterGemmProfileFunc(GemmProfileFunc * profileFunc) {
+  GemmProfileFuncs.push_back(profileFunc);
+}
 
 }  // namespace perf
 
@@ -47,6 +52,22 @@ int profile_wmma_gemm(TestbenchOutput &output, TestbenchOptions const &options);
 // Executes profiling functionality
 //
 
+template <typename Problem>
+int profile(int (**functions)(perf::TestbenchOutput<Problem> &,
+                              perf::TestbenchOptions const &,
+                              perf::Config const &),
+            perf::TestbenchOutput<Problem> &output,
+            perf::TestbenchOptions options,
+            int result) {
+  perf::TestbenchConfigs test_configs(options);
+  for (size_t j = 0; !result && j < test_configs.configs.size(); j++) {
+    for (size_t i = 0; !result && functions[i] != 0; ++i) {
+      result = (functions[i])(output, options, test_configs.configs[j]);
+    }
+  }
+  return result;
+}
+
 /// Entry point to CUTLASS performance test
 int main(int argc, const char **argv) {
   cutlass::CommandLine args(argc, argv);
@@ -57,20 +78,17 @@ int main(int argc, const char **argv) {
     return 0;
   }
 
-  perf::TestbenchOutput output(options);
-
-  int (*profile_gemm[])(perf::TestbenchOutput &, perf::TestbenchOptions const &) = {
-      perf::profile_sgemm,
-      perf::profile_dgemm,
-      perf::profile_hgemm,
-      perf::profile_igemm,
-      perf::profile_wmma_gemm,
-      0};
-
-  int result = 0;
-  for (int i = 0; !result && profile_gemm[i]; ++i) {
-    result = (profile_gemm[i])(output, options);
+  if (args.check_cmd_line_flag("version")) {
+    perf::TestbenchOptions::version(std::cout);
+    std::cout << std::endl;
+    return 0;
   }
 
-  return result;
+  int result = 0;
+
+      std::vector<perf::GemmProfileFunc*> profileFuncs = GemmProfileFuncs;
+      profileFuncs.push_back(0); // Passing as array reference below, so need NULL termination.
+      perf::TestbenchOutput<perf::GemmProblem> output_gemm(options);
+      result = profile(&profileFuncs[0], output_gemm, options, result);
+      return result;
 }
diff --git a/tools/test/perf/cutlass_perf_test.h b/tools/test/perf/cutlass_perf_test.h
new file mode 100644
index 000000000..70320740e
--- /dev/null
+++ b/tools/test/perf/cutlass_perf_test.h
@@ -0,0 +1,44 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#pragma once
+
+#pragma diag_suppress boolean_controlling_expr_is_constant
+#include <gtest/gtest.h>
+#pragma diag_warning boolean_controlling_expr_is_constant
+
+#include "tools/test/perf/testbench_output.h"
+#include "tools/test/perf/gemm/gemm_profiler.h"
+
+namespace perf {
+
+typedef int (GemmProfileFunc)(
+  TestbenchOutput <GemmProblem> &output,
+  TestbenchOptions const &options,
+  Config const &config);
+
+void RegisterGemmProfileFunc(GemmProfileFunc*);
+
+} // perf
diff --git a/tools/test/perf/gemm/bmma_gemm.cu b/tools/test/perf/gemm/bmma_gemm.cu
new file mode 100644
index 000000000..147b5a4bb
--- /dev/null
+++ b/tools/test/perf/gemm/bmma_gemm.cu
@@ -0,0 +1,121 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/// \file {nv-internal-release}
+
+#if (defined(__CUDACC__) && (!defined(__CUDA_ARCH__) || __CUDA_ARCH__ >= 750))
+#pragma warning( disable : 4503)
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/bmma_gemm_traits.h"
+#include "tools/test/perf/cutlass_perf_test.h"
+#include "tools/test/perf/gemm/gemm_profiler.h"
+#include "tools/test/perf/gemm/cutlass_dispatch.h"
+#include "tools/test/perf/gemm/gemm_perf_testbed.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template<typename Traits>
+struct BmmaGemmDispatch {
+
+  typedef cutlass::gemm::Gemm<Traits> Gemm;
+
+  typedef typename Gemm::Params Params;
+
+  /// Indicate warp-level GEMM
+  static bool const kThreadMultiplyAdd = false;
+
+  static bool const kRunCuBLAS = false;
+
+  static cutlass::MatrixLayout::Kind const kLayoutA = Traits::kLayoutA;
+  static cutlass::MatrixLayout::Kind const kLayoutB = Traits::kLayoutB;
+
+  //
+  // Data members
+  //
+
+  /// Params argument
+  Params params;
+
+  //
+  // Methods
+  //
+
+  BmmaGemmDispatch() {}
+
+  /// Initializes params object
+  BmmaGemmDispatch(int m, int n, int k, int alpha,
+                   cutlass::Vector<cutlass::bin1_t, 32> const* d_a, int lda,
+                   cutlass::Vector<cutlass::bin1_t, 32> const* d_b, int ldb, int beta,
+                   int const* d_c, int ldc, int* d_d, int ldd) {
+
+    params.initialize(m, n, k * 32, alpha, d_a, lda, d_b, ldb, beta, d_c, ldc, d_d, ldd);
+  }
+
+  /// Initializes params object
+  BmmaGemmDispatch(Params const& _params) : params(_params) {}
+
+  /// Launches kernel
+  cudaError_t operator()() { return Gemm::launch(params); }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace perf {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+int profile_bmma_gemm(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
+  typedef perf::GemmProfiler<cutlass::Vector<cutlass::bin1_t, 32>, cutlass::Vector<cutlass::bin1_t, 32>, int, int, int> GemmProfiler;
+
+  int results = 0;
+
+  {
+
+    typedef cutlass::gemm::BmmaGemmTraits<cutlass::Shape<1024, 128, 128>,
+                                          cutlass::Shape<1024, 32, 32>,
+                                          cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::MatrixLayout::kColumnMajor>
+      BmmaGemmTraits;
+
+    typedef BmmaGemmDispatch<BmmaGemmTraits> Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "bmma_gemm_tn", options, config);
+  }
+
+  return results;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+struct BmmaGemmRegistrar {
+  BmmaGemmRegistrar() { RegisterGemmProfileFunc(profile_bmma_gemm); }
+};
+
+volatile BmmaGemmRegistrar _BmmaGemmRegistrar;
+
+} // namespace perf
+
+#endif // if (defined(__CUDACC__) && (!defined(__CUDA_ARCH__) || __CUDA_ARCH__ >= 750)
diff --git a/tools/test/perf/gemm/cublas_dispatch.h b/tools/test/perf/gemm/cublas_dispatch.h
index 0679e5c8e..a30e3d96c 100644
--- a/tools/test/perf/gemm/cublas_dispatch.h
+++ b/tools/test/perf/gemm/cublas_dispatch.h
@@ -24,8 +24,8 @@
  **************************************************************************************************/
 #pragma once
 
-#include <cutlass/matrix_traits.h>
-#include <tools/util/type_traits.h>
+#include "cutlass/matrix_traits.h"
+#include "tools/util/type_traits.h"
 
 namespace perf {
 
diff --git a/tools/test/perf/gemm/cutlass_dispatch.h b/tools/test/perf/gemm/cutlass_dispatch.h
index 9c0f89a26..f6c85ba64 100644
--- a/tools/test/perf/gemm/cutlass_dispatch.h
+++ b/tools/test/perf/gemm/cutlass_dispatch.h
@@ -32,7 +32,8 @@ template <typename Gemm_,
           typename ScalarD_,
           typename Compute_,
           typename ScalarEpilogue_,
-          bool ThreadMultiplyAdd_>
+          bool ThreadMultiplyAdd_,
+          bool RunCuBLAS_ = true>
 struct CutlassDispatch {
   typedef typename Gemm_::Params Params;
   typedef Gemm_ Gemm;
@@ -45,6 +46,7 @@ struct CutlassDispatch {
   typedef ScalarEpilogue_ ScalarEpilogue;
 
   static bool const kThreadMultiplyAdd = ThreadMultiplyAdd_;
+  static bool const kRunCuBLAS = RunCuBLAS_;
 
   static cutlass::MatrixLayout::Kind const kLayoutA = Gemm::Traits::kLayoutA;
   static cutlass::MatrixLayout::Kind const kLayoutB = Gemm::Traits::kLayoutB;
@@ -60,7 +62,7 @@ struct CutlassDispatch {
   // Methods
   //
 
-  CutlassDispatch() {}
+  // CutlassDispatch() {}
 
   /// Initializes params object
   CutlassDispatch(Index m,
@@ -84,33 +86,6 @@ struct CutlassDispatch {
 
   /// Launches kernel
   cudaError_t operator()() { return Gemm::launch(params); }
-
-  /// Determines if problem is aligned (assuming no padding)
-  static bool is_problem_aligned(
-    int m,
-    int n,
-    int k) {
-
-    bool aligned = true;
-
-    if (kLayoutA == cutlass::MatrixLayout::kColumnMajor) {
-      aligned = aligned && !(m % Gemm::Traits::GemmConfig::kScalarsPerLdgA);
-    }
-    else {
-      aligned = aligned && !(k % Gemm::Traits::GemmConfig::kScalarsPerLdgA);
-    }
-
-    if (kLayoutB == cutlass::MatrixLayout::kColumnMajor) {
-      aligned = aligned && !(k % Gemm::Traits::GemmConfig::kScalarsPerLdgB);
-    }
-    else {
-      aligned = aligned && !(n % Gemm::Traits::GemmConfig::kScalarsPerLdgB);
-    }
-
-    aligned = aligned && !(m % Gemm::Traits::GemmConfig::kScalarsPerLdgC);
-
-    return aligned;
-  }
 };
 
 /// Basic dispatcher inferred from GEMM traits
diff --git a/tools/test/perf/gemm/dgemm.cu b/tools/test/perf/gemm/dgemm.cu
index 7e9c16443..3f4b63b85 100644
--- a/tools/test/perf/gemm/dgemm.cu
+++ b/tools/test/perf/gemm/dgemm.cu
@@ -23,26 +23,29 @@
  *
  **************************************************************************************************/
 
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/dgemm_traits.h>
-
-#include <tools/test/perf/gemm/gemm_perf_testbed.h>
-
-#include <tools/test/perf/gemm/gemm_profiler.h>
-#include <tools/test/perf/gemm/cutlass_dispatch.h>
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/dgemm_traits.h"
 
+#include "tools/test/perf/cutlass_perf_test.h"
+#include "tools/test/perf/gemm/gemm_perf_testbed.h"
+#include "tools/test/perf/gemm/gemm_profiler.h"
+#include "tools/test/perf/gemm/cutlass_dispatch.h"
+#pragma warning( disable : 4503)
 namespace perf {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-int profile_dgemm(TestbenchOutput &output, TestbenchOptions const &options) {
-
+int profile_dgemm(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
   typedef perf::GemmProfiler<double, double, double, double, double> GemmProfiler;
 
   int results = 0;
-  
-  if (!results) {
-    
+
+  // compute capability check
+  if (!options.compute_capability(6, 0)) {
+    return 0;
+  }
+
+  {
     typedef cutlass::gemm::DgemmTraits<
       cutlass::MatrixLayout::kColumnMajor,
       cutlass::MatrixLayout::kRowMajor
@@ -50,11 +53,10 @@ int profile_dgemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "dgemm_nt", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "dgemm_nt", options, config);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::DgemmTraits<
       cutlass::MatrixLayout::kColumnMajor,
       cutlass::MatrixLayout::kColumnMajor
@@ -62,11 +64,10 @@ int profile_dgemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "dgemm_nn", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "dgemm_nn", options, config);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::DgemmTraits<
       cutlass::MatrixLayout::kRowMajor,
       cutlass::MatrixLayout::kColumnMajor
@@ -74,11 +75,10 @@ int profile_dgemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "dgemm_tn", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "dgemm_tn", options, config);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::DgemmTraits<
       cutlass::MatrixLayout::kRowMajor,
       cutlass::MatrixLayout::kRowMajor
@@ -86,12 +86,18 @@ int profile_dgemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "dgemm_tt", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "dgemm_tt", options, config);
   }
 
   return results;
 }
 
+struct DgemmRegistrar {
+  DgemmRegistrar() { RegisterGemmProfileFunc(profile_dgemm); }
+};
+
+volatile DgemmRegistrar _DgemmRegistrar;
+
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 } // namespace perf
diff --git a/tools/test/perf/gemm/gemm_perf_testbed.h b/tools/test/perf/gemm/gemm_perf_testbed.h
index f3766a637..27769b1c9 100644
--- a/tools/test/perf/gemm/gemm_perf_testbed.h
+++ b/tools/test/perf/gemm/gemm_perf_testbed.h
@@ -36,200 +36,35 @@
 #include <curand_kernel.h>
 
 // Cutlass includes
-#include <tools/test/perf/gemm/cublas_dispatch.h>
-#include <tools/test/perf/performance_result.h>
-#include <tools/test/perf/testbench_options.h>
-#include <tools/util/device_memory.h>
-#include <tools/util/type_traits.h>
-#include <tools/util/host_tensor.h>
-#include <tools/util/tensor_view_io.h>
+#include "tools/test/perf/gemm/cublas_dispatch.h"
+#include "tools/test/perf/performance_result.h"
+#include "tools/test/perf/testbench_options.h"
+#include "tools/util/device_memory.h"
+#include "tools/util/host_matrix.h"
+#include "tools/util/reference/device/tensor_elementwise.h"
+#include "tools/util/tensor_view_io.h"
+#include "tools/util/type_traits.h"
 
 namespace perf {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/// Kernel to determine if two tensors are equal
-template <typename Type>
-__global__ void tensor_equals(int *result,
-                              int dim_contiguous,
-                              int dim_strided,
-                              Type const *experimental,
-                              int lde,
-                              Type const *reference,
-                              int ldr) {
-  typedef typename cutlass::TypeTraits<Type>::unsigned_type UnsignedType;
+namespace detail {
 
-  int c_idx = blockIdx.x * blockDim.x + threadIdx.x;
-  int s_idx = blockIdx.y * blockDim.x;
+  template <typename T>
+  struct ElementCount {
+    static int const kValue = 1;
+  };
 
-  experimental += s_idx * lde + c_idx;
-  reference += s_idx * ldr + c_idx;
+  template <typename T, int Elements>
+  struct ElementCount<cutlass::Vector<T, Elements> > {
+    static int const kValue = Elements * ElementCount<T>::kValue;
+  };
 
-  for (int s_offset = 0; s_offset < blockDim.x; ++s_offset, ++s_idx) {
-    if (s_idx < dim_strided && c_idx < dim_contiguous) {
-      UnsignedType exp = *reinterpret_cast<UnsignedType const *>(experimental);
-      UnsignedType ref = *reinterpret_cast<UnsignedType const *>(reference);
-
-      if (exp != ref) {
-        *result = -1;
-        return;
-      }
-
-      experimental += lde;
-      reference += ldr;
-    }
-  }
-}
+} // namespace detail
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/// Kernel to initialize tensor to uniform distribution
-template <typename T>
-__global__ void initialize_uniform(
-    Distribution dist, int64_t seed, int dim_contiguous, int dim_strided, T *tensor, int ldm) {
-  __shared__ curandState_t rng_state[1024];
-
-  uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x + blockIdx.y * gridDim.x * blockDim.x;
-
-  curand_init(seed, gtid, 0, &rng_state[threadIdx.x]);
-
-  int c_idx = blockIdx.x * blockDim.x + threadIdx.x;
-  int s_idx = blockIdx.y * blockDim.x;
-
-  tensor += s_idx * ldm + c_idx;
-
-  for (int s_offset = 0; s_offset < blockDim.x; ++s_offset, ++s_idx) {
-    if (s_idx < dim_strided && c_idx < dim_contiguous) {
-      double range = dist.uniform.max - dist.uniform.min;
-
-      double rnd = curand_uniform(&rng_state[threadIdx.x]);
-
-      rnd = dist.uniform.min + range * rnd;
-
-      // Random values are cast to integer after scaling by a power of two to facilitate error
-      // testing
-      if (dist.int_scale >= 0) {
-        rnd = double(int(rnd * double(1 << dist.int_scale)));
-        *tensor = T(rnd / double(1 << dist.int_scale));
-      } else {
-        *tensor = T(rnd);
-      }
-
-      tensor += ldm;
-    }
-  }
-}
-
-/// Kernel to initialize tensor to uniform distribution
-template <typename T>
-__global__ void initialize_gaussian(
-    Distribution dist, int64_t seed, int dim_contiguous, int dim_strided, T *tensor, int ldm) {
-  __shared__ curandState_t rng_state[1024];
-
-  uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x + blockIdx.y * gridDim.x * blockDim.x;
-
-  curand_init(seed, gtid, 0, &rng_state[threadIdx.x]);
-
-  int c_idx = blockIdx.x * blockDim.x + threadIdx.x;
-  int s_idx = blockIdx.y * blockDim.x;
-
-  tensor += s_idx * ldm + c_idx;
-
-  for (int s_offset = 0; s_offset < blockDim.x; ++s_offset, ++s_idx) {
-    if (s_idx < dim_strided && c_idx < dim_contiguous) {
-      // Random values are cast to integer after scaling by a power of two to facilitate error
-      // testing
-
-      double rnd = curand_normal(&rng_state[threadIdx.x]);
-
-      rnd = dist.gaussian.mean + dist.gaussian.stddev * rnd;
-
-      if (dist.int_scale >= 0) {
-        rnd = double(int(rnd * double(1 << dist.int_scale)));
-        *tensor = T(rnd / double(1 << dist.int_scale));
-      } else {
-        *tensor = T(rnd);
-      }
-    }
-  }
-}
-
-/// Kernel to initialize tensor to an identity matrix
-template <typename T>
-__global__ void initialize_linear(
-    Distribution dist, int64_t seed, int dim_contiguous, int dim_strided, T *tensor, int ldm) {
-  __shared__ curandState_t rng_state[1024];
-
-  uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x + blockIdx.y * gridDim.x * blockDim.x;
-
-  curand_init(seed, gtid, 0, &rng_state[threadIdx.x]);
-
-  int c_idx = blockIdx.x * blockDim.x + threadIdx.x;
-  int s_idx = blockIdx.y * blockDim.x;
-
-  tensor += s_idx * ldm + c_idx;
-
-  for (int s_offset = 0; s_offset < blockDim.x; ++s_offset, ++s_idx) {
-    if (s_idx < dim_strided && c_idx < dim_contiguous) {
-      *tensor =
-          dist.linear.offset + dist.linear.delta_row * c_idx + dist.linear.delta_column * s_idx;
-    }
-  }
-}
-
-/// Kernel to initialize tensor to an identity matrix
-template <typename T>
-__global__ void initialize_identity(
-    Distribution dist, int64_t seed, int dim_contiguous, int dim_strided, T *tensor, int ldm) {
-  __shared__ curandState_t rng_state[1024];
-
-  uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x + blockIdx.y * gridDim.x * blockDim.x;
-
-  curand_init(seed, gtid, 0, &rng_state[threadIdx.x]);
-
-  int c_idx = blockIdx.x * blockDim.x + threadIdx.x;
-  int s_idx = blockIdx.y * blockDim.x;
-
-  tensor += s_idx * ldm + c_idx;
-
-  for (int s_offset = 0; s_offset < blockDim.x; ++s_offset, ++s_idx) {
-    if (s_idx < dim_strided && c_idx < dim_contiguous) {
-      *tensor = (c_idx == s_idx ? T(1) : T(0));
-    }
-  }
-}
-
-/// Dispatcher to appropriate initialization kernel
-template <typename T>
-inline void initialize(Distribution const &dist,
-                       int64_t seed,
-                       int dim_contiguous,
-                       int dim_strided,
-                       T *tensor,
-                       int ldm) {
-  dim3 block(256, 1, 1);
-  dim3 grid((dim_contiguous + block.x - 1) / block.x, (dim_strided + block.x - 1) / block.x);
-
-  switch (dist.kind) {
-    case Distribution::Uniform:
-      initialize_uniform<<<grid, block>>>(dist, seed, dim_contiguous, dim_strided, tensor, ldm);
-      break;
-    case Distribution::Gaussian:
-      initialize_gaussian<<<grid, block>>>(dist, seed, dim_contiguous, dim_strided, tensor, ldm);
-      break;
-    case Distribution::Linear:
-      initialize_linear<<<grid, block>>>(dist, seed, dim_contiguous, dim_strided, tensor, ldm);
-      break;
-    case Distribution::Identity:
-      initialize_identity<<<grid, block>>>(dist, seed, dim_contiguous, dim_strided, tensor, ldm);
-      break;
-    default:
-      break;
-  }
-}
-
-///////////////////////////////////////////////////////////////////////////////////////////////////
-
 /// Host-side implementation of performance testbed
 template <typename AType, typename BType, typename CType, typename Accumulator, typename Scalar>
 class GemmTestbed {
@@ -295,14 +130,13 @@ class GemmTestbed {
 
   /// Helper to resize a matrix with a given size and layout if needed
   template <typename T>
-  static void resize_device_allocation(
-                     cutlass::device_memory::allocation<T> &tensor,
-                     Distribution const &dist,
-                     int64_t seed,
-                     int rows,
-                     int columns,
-                     cutlass::MatrixLayout::Kind layout,
-                     int ldm = 0) {
+  static void resize_device_allocation(cutlass::device_memory::allocation<T> &tensor,
+                                       cutlass::Distribution const &dist,
+                                       int64_t seed,
+                                       int rows,
+                                       int columns,
+                                       cutlass::MatrixLayout::Kind layout,
+                                       int ldm = 0) {
     if (!ldm) {
       ldm = (layout == cutlass::MatrixLayout::kColumnMajor ? rows : columns);
     }
@@ -315,65 +149,79 @@ class GemmTestbed {
       int c_dim = (layout == cutlass::MatrixLayout::kColumnMajor ? rows : columns);
       int s_dim = (layout == cutlass::MatrixLayout::kColumnMajor ? columns : rows);
 
-      initialize(dist, seed, c_dim, s_dim, tensor.get(), ldm);
+      cutlass::TensorView<T, 2> view(
+        tensor.get(), 
+        cutlass::make_Coord(ldm, 1), 
+        cutlass::make_Coord(s_dim, c_dim));
+
+      cutlass::reference::device::TensorInitialize(view, seed, dist);
     }
   }
 
   /// Resizes each tensor
   void resize_helper(GemmProblem const &problem) {
-    resize_device_allocation(
-           A,
-           initial_distribution.dist_A,
-           initial_distribution.seed,
-           problem.m,
-           problem.k,
-           problem.layout_A);
+    resize_device_allocation(A,
+                             initial_distribution.dist_A,
+                             initial_distribution.seed,
+                             problem.m,
+                             problem.k,
+                             problem.layout_A);
 
     resize_device_allocation(
-           B,
-           initial_distribution.dist_B,
-           initial_distribution.seed + 17,  // compute distinct value from initial seed
-           problem.k,
-           problem.n,
-           problem.layout_B);
+        B,
+        initial_distribution.dist_B,
+        initial_distribution.seed + 17,  // compute distinct value from initial seed
+        problem.k,
+        problem.n,
+        problem.layout_B);
 
     resize_device_allocation(
-           C_initial,
-           initial_distribution.dist_C,
-           initial_distribution.seed + 101,  // compute distinct value from initial seed
-           problem.m,
-           problem.n,
-           cutlass::MatrixLayout::kColumnMajor);
+        C_initial,
+        initial_distribution.dist_C,
+        initial_distribution.seed + 101,  // compute distinct value from initial seed
+        problem.m,
+        problem.n,
+        cutlass::MatrixLayout::kColumnMajor);
 
-    resize_device_allocation(
-        reference, Distribution(), 0, problem.m, problem.n, cutlass::MatrixLayout::kColumnMajor);
+    resize_device_allocation(reference,
+                             cutlass::Distribution(),
+                             0,
+                             problem.m,
+                             problem.n,
+                             cutlass::MatrixLayout::kColumnMajor);
 
-    resize_device_allocation(
-        experimental, Distribution(), 0, problem.m, problem.n, cutlass::MatrixLayout::kColumnMajor);
+    resize_device_allocation(experimental,
+                             cutlass::Distribution(),
+                             0,
+                             problem.m,
+                             problem.n,
+                             cutlass::MatrixLayout::kColumnMajor);
   }
 
   /// Functor to print errors
   struct PrintErrors {
-
     /// Equivalently sized integer type
     typedef typename cutlass::TypeTraits<CType>::integer_type integer_t;
 
+    /// Performance testbench defined for a TensorView of rank-2 contiguous matrices
+    typedef cutlass::TensorView<CType, 2, cutlass::MatrixLayout::ContiguousLayout> MatrixView;
+
     /// Output stream to write to
-    std::ostream& out;
+    std::ostream &out;
 
     /// Reference tensor view
-    cutlass::HostTensorView<CType> const& reference;
+    MatrixView const &reference;
 
     /// Computed tensor view
-    cutlass::HostTensorView<CType> const& experimental;
+    MatrixView const &experimental;
 
     /// Errors greater than or this amount result in printing
     integer_t ulps_threshold;
 
     ///
-    PrintErrors(std::ostream& _out,
-                cutlass::HostTensorView<CType> const& _reference,
-                cutlass::HostTensorView<CType> const& _experimental,
+    PrintErrors(std::ostream &_out,
+                MatrixView const &_reference,
+                MatrixView const &_experimental,
                 integer_t _ulps_threshold = 1)
         : out(_out),
           reference(_reference),
@@ -381,18 +229,15 @@ class GemmTestbed {
           ulps_threshold(_ulps_threshold) {}
 
     /// Compares one element
-    void operator()(
-      CType const& element,
-      typename cutlass::HostTensorView<CType>::Coord_t coord) {
-
+    void operator()(CType const &element, typename MatrixView::TensorCoord coord) {
       CType exp = experimental.at(coord);
       CType ref = reference.at(coord);
 
       int64_t int_exp = 0;
       int64_t int_ref = 0;
 
-      *reinterpret_cast<CType*>(&int_exp) = exp;
-      *reinterpret_cast<CType*>(&int_ref) = ref;
+      *reinterpret_cast<CType *>(&int_exp) = exp;
+      *reinterpret_cast<CType *>(&int_ref) = ref;
 
       integer_t ulps = integer_t(int_exp - int_ref);
 
@@ -405,11 +250,10 @@ class GemmTestbed {
           relative /= double(ref);
         }
 
-        out << "[" << coord << "] expected: " << ref << " (0x"
-            << std::hex << std::setw(width) << std::setfill('0') << integer_t(int_ref) << std::dec
-            << ")"
-            << ",  got: " << exp << " (0x" << std::hex
-            << std::setw(width) << std::setfill('0') << integer_t(int_exp) << std::dec << ")"
+        out << "[" << coord << "] expected: " << ref << " (0x" << std::hex << std::setw(width)
+            << std::setfill('0') << integer_t(int_ref) << std::dec << ")"
+            << ",  got: " << exp << " (0x" << std::hex << std::setw(width) << std::setfill('0')
+            << integer_t(int_exp) << std::dec << ")"
             << "  relative error: " << relative << ", ulps: " << ulps << "\n";
       }
     }
@@ -497,7 +341,7 @@ class GemmTestbed {
 
   /// Returns the number of flops implied by the computation (1 multiply-accumulate = 2 flops)
   uint64_t flops() const {
-    return uint64_t(problem.m) * uint64_t(problem.n) * uint64_t(problem.k) * 2ULL;
+    return uint64_t(problem.m) * uint64_t(problem.n) * uint64_t(problem.k) * detail::ElementCount<AType>::kValue * 2ULL;
   }
 
   /// Computes the speed of the computation in GFLOPs/s
@@ -555,25 +399,17 @@ class GemmTestbed {
 
   /// Verifies the 'test' tensor with 'ref'
   bool verify(TensorC const &test, TensorC const &ref) {
-    cutlass::device_memory::allocation<int> flag_device(1);
 
-    int flag = 0;
-    cutlass::device_memory::copy_to_device(flag_device.get(), &flag, 1);
-
-    dim3 block(256, 1, 1);
-    dim3 grid((problem.m + block.x - 1) / block.x, (problem.n + block.x - 1) / block.x);
-
-    tensor_equals<CDeviceType><<<grid, block>>>(flag_device.get(),
-                                                problem.m,
-                                                problem.n,
-                                                experimental.get(),
-                                                problem.m,
-                                                reference.get(),
-                                                problem.m);
-
-    cutlass::device_memory::copy_to_host(&flag, flag_device.get(), 1);
-
-    return flag == 0;
+    return cutlass::reference::device::TensorEquals(
+      cutlass::TensorView<CDeviceType, 2>(
+        test.get(), 
+        cutlass::make_Coord(problem.m, 1),
+        cutlass::make_Coord(problem.n, problem.m)),
+      cutlass::TensorView<CDeviceType, 2>(
+        ref.get(), 
+        cutlass::make_Coord(problem.m, 1), 
+        cutlass::make_Coord(problem.n, problem.m))
+    );
   }
 
   /// Computes the reference output
@@ -587,12 +423,11 @@ class GemmTestbed {
 
   /// Writes the problem to an ostream in human-readable form
   void write_problem(std::ostream &results_output, std::ostream &errors_output) {
-
-    cutlass::HostTensor<AType, false> host_A;
-    cutlass::HostTensor<BType, false> host_B;
-    cutlass::HostTensor<CType, false> host_C;
-    cutlass::HostTensor<CType, false> host_D;
-    cutlass::HostTensor<CType, false> host_Ref;
+    cutlass::HostMatrix<AType> host_A;
+    cutlass::HostMatrix<BType> host_B;
+    cutlass::HostMatrix<CType> host_C;
+    cutlass::HostMatrix<CType> host_D;
+    cutlass::HostMatrix<CType> host_Ref;
 
     host_A.resize_matrix(M(), K(), layout_a());
     host_B.resize_matrix(K(), N(), layout_b());
@@ -608,11 +443,16 @@ class GemmTestbed {
     host_Ref.copy_to_host(ptr_reference());
 
     // write out human readable
-    results_output << "A =\n" << host_A << "\n"
-      << "B =\n" << host_B << "\n"
-      << "C = \n" << host_C << "\n"
-      << "Ref =\n" << host_Ref << "\n"
-      << "Experimental =\n" << host_D << "\n";
+    results_output << "A =\n"
+                   << host_A << "\n"
+                   << "B =\n"
+                   << host_B << "\n"
+                   << "C = \n"
+                   << host_C << "\n"
+                   << "Ref =\n"
+                   << host_Ref << "\n"
+                   << "Experimental =\n"
+                   << host_D << "\n";
 
     // write out list of errors
     PrintErrors printer(errors_output, host_Ref, host_D);
diff --git a/tools/test/perf/gemm/gemm_profiler.h b/tools/test/perf/gemm/gemm_profiler.h
index 30eecff6d..6cdb07b94 100644
--- a/tools/test/perf/gemm/gemm_profiler.h
+++ b/tools/test/perf/gemm/gemm_profiler.h
@@ -29,16 +29,18 @@
 #include <stdexcept>
 #include <utility>
 
-#if defined(WIN32)
+#include "cutlass/util/platform.h"
+#if defined(CUTLASS_OS_WINDOWS)
 #include <Windows.h>
 #else
 // needed for sleep
 #include <unistd.h>
 #endif
 
-#include <tools/test/perf/gemm/gemm_perf_testbed.h>
-#include <tools/test/perf/testbench_options.h>
-#include <tools/test/perf/testbench_output.h>
+#include "tools/test/perf/gemm/gemm_perf_testbed.h"
+#include "tools/test/perf/testbench_configs.h"
+#include "tools/test/perf/testbench_options.h"
+#include "tools/test/perf/testbench_output.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
@@ -63,17 +65,23 @@ class GemmProfiler {
   //
 
   /// Reference to TestbenchOutput instance
-  TestbenchOutput &output;
+  TestbenchOutput<GemmProblem> &output;
 
   /// Reference to options object
   TestbenchOptions const &options;
 
+  // Reference to config object
+  Config const &config;
+
   /// Performance test environment
   PerfTestbed testbed;
 
   /// Kernel name
   std::string kernel_name;
 
+  /// Cutlass algorithm
+  std::string cutlass_algo;
+
   /// Timing events
   cudaEvent_t events[2];
 
@@ -93,14 +101,17 @@ class GemmProfiler {
   //
 
   /// Constructs performance testebed
-  GemmProfiler(TestbenchOutput &_output,
+  GemmProfiler(TestbenchOutput<GemmProblem> &_output,
                std::string const &_kernel_name,
-               TestbenchOptions const &_options)
+               std::string const &_cutlass_algo,
+               TestbenchOptions const &_options,
+               Config const &_config)
       : output(_output),
         options(_options),
+        config(_config),
         kernel_name(_kernel_name),
+        cutlass_algo(_cutlass_algo),
         testbed(_options.initial_distribution) {
-
     for (int i = 0; i < 2; ++i) {
       cudaError_t result = cudaEventCreate(&events[i]);
       if (result != cudaSuccess) {
@@ -112,34 +123,47 @@ class GemmProfiler {
   ~GemmProfiler() {}
 
   /// Writes the workspace to text files
-  void write_problem(std::string const &kernel_name) {
+  void write_problem(Provider::Kind provider, std::string const &kernel_name) {
+    std::stringstream base_filename;
 
-      std::stringstream base_filename;
+    base_filename << provider << "_" << kernel_name << "_" << testbed.M() << "x" << testbed.N()
+                  << "x" << testbed.K();
 
-      base_filename
-        << kernel_name << "_"
-        << testbed.M() << "x" << testbed.N() << "x" << testbed.K();
+    std::string results_name = base_filename.str() + "_results.txt";
+    std::string errors_name = base_filename.str() + "_errors.txt";
 
-      std::string results_name = base_filename.str() + "_results.txt";
-      std::string errors_name = base_filename.str() + "_errors.txt";
-
-      std::ofstream results(results_name.c_str());
-      std::ofstream errors(errors_name.c_str());
-      testbed.write_problem(results, errors);
+    std::ofstream results(results_name.c_str());
+    std::ofstream errors(errors_name.c_str());
+    testbed.write_problem(results, errors);
   }
 
   /// Profiles Cutlass
   template <typename CutlassDispatch>
-  PerformanceResult execute_cutlass(GemmProblem const &problem, cublasGemmAlgo_t algorithm) {
-    PerformanceResult result(kernel_name, problem);
+  PerformanceResult<GemmProblem> execute_cutlass(GemmProblem const &problem,
+                                                 cublasGemmAlgo_t algorithm) {
+    PerformanceResult<GemmProblem> result(
+      Provider::Cutlass
+      , kernel_name
+      , problem
+    );
 
-    testbed.compute_reference(algorithm);
-
-    if (cudaDeviceSynchronize() != cudaSuccess) {
-      result.disposition = Disposition::NotVerified;
+    if (options.dry_run) {
+      result.disposition = Disposition::NotRun;
       return result;
     }
 
+    if (CutlassDispatch::kRunCuBLAS) {
+      testbed.compute_reference(algorithm);
+
+      if (cudaDeviceSynchronize() != cudaSuccess) {
+        result.disposition = Disposition::NotVerified;
+        return result;
+      }
+    }
+    else {
+      result.disposition = Disposition::Passed;
+    }
+
     CutlassDispatch dispatch(testbed.M(),
                              testbed.N(),
                              testbed.K(),
@@ -161,14 +185,16 @@ class GemmProfiler {
       return result;
     }
 
-    if (testbed.verify_with_reference()) {
-      result.disposition = Disposition::Passed;
-    } else {
-      result.disposition = Disposition::Incorrect;
+    if (CutlassDispatch::kRunCuBLAS) {
+      if (testbed.verify_with_reference()) {
+        result.disposition = Disposition::Passed;
+      } else {
+        result.disposition = Disposition::Incorrect;
+      }
     }
 
     if (options.save_workspace(result.disposition == Disposition::Passed)) {
-      write_problem(kernel_name);
+      write_problem(Provider::Cutlass, kernel_name);
     }
 
     if (cudaDeviceSynchronize() != cudaSuccess) {
@@ -212,30 +238,38 @@ class GemmProfiler {
     result.gflops = testbed.GFLOPs_per_sec(result.runtime);
 
     if (result.disposition != Disposition::Passed) {
-      std::cout << kernel_name << " failed with disposition: " << result.disposition;
+      std::cout << "[\033[1;31mFAILED\033[0m]: " << kernel_name
+                << " failed with disposition: " << result.disposition << "\n";
     }
 
     return result;
   }
 
+  template <typename T, typename F>
+  bool contains(T const &container, F const &val) {
+    return std::find(container.begin(), container.end(), val) != container.end();
+  }
+
   /// Executes all kernels for this problem size
   template <typename CutlassDispatch>
-  std::vector<PerformanceResult> execute(GemmProblem const &problem) {
+  std::vector<PerformanceResult<GemmProblem> > execute(GemmProblem const &problem) {
 
     // New problem size
     output.begin_problem();
 
-    cublasGemmAlgo_t algorithm =
-        (CutlassDispatch::kThreadMultiplyAdd ? CUBLAS_GEMM_DEFAULT : CUBLAS_GEMM_DEFAULT_TENSOR_OP);
+    bool const tensor_op = !(CutlassDispatch::kThreadMultiplyAdd);
+    cublasGemmAlgo_t algorithm = tensor_op ?
+      CUBLAS_GEMM_DEFAULT_TENSOR_OP : CUBLAS_GEMM_DEFAULT;
 
     testbed.resize(problem);
 
-    std::vector<PerformanceResult> results;
-
-    results.push_back(execute_cutlass<CutlassDispatch>(problem, algorithm));
+    std::vector<PerformanceResult<GemmProblem> > results;
 
+      results.push_back(execute_cutlass<CutlassDispatch>(problem, algorithm));
     // cool-down period
-    pause(2);
+    if (!options.dry_run) {
+      pause(options.sleep_time);
+    }
 
     return results;
   }
@@ -243,25 +277,20 @@ class GemmProfiler {
   /// Runs the test and collects performance for all results
   template <typename CutlassDispatch>
   void schmoo(Range const &M, Range const &N, Range const &K) {
-    for (int m = M.start; m <= M.end; m += M.increment) {
-      for (int n = N.start; n <= N.end; n += N.increment) {
-        for (int k = K.start; k <= K.end; k += K.increment) {
+    for (int m = M.start; m <= M.end; m = M.next(m)) {
+      for (int n = N.start; n <= N.end; n = N.next(n)) {
+        for (int k = K.start; k <= K.end; k = K.next(k)) {
 
-          // Avoid evaluating problem if problem size does not satisfy alignment
-          if (!CutlassDispatch::is_problem_aligned(m, n, k)) {
-            continue;
-          }
-
-          std::vector<PerformanceResult> results =
+          std::vector<PerformanceResult<GemmProblem> > results =
               execute<CutlassDispatch>(GemmProblem(m,
                                                    n,
                                                    k,
                                                    CutlassDispatch::kLayoutA,
                                                    CutlassDispatch::kLayoutB,
-                                                   options.alpha,
-                                                   options.beta));
+                                                   config.alpha,
+                                                   config.beta));
 
-          for (std::vector<PerformanceResult>::const_iterator it = results.begin();
+          for (std::vector<PerformanceResult<GemmProblem> >::const_iterator it = results.begin();
                it != results.end();
                ++it) {
             output.append(*it);
@@ -274,46 +303,53 @@ class GemmProfiler {
   /// Runs the test over the problem space and reports only the best performance
   template <typename CutlassDispatch>
   void peak(Range const &M, Range const &N, Range const &K) {
+    typedef std::map<Provider::Kind, PerformanceResult<GemmProblem> > ProviderPerformanceMap;
 
-    PerformanceResult max_perf;
-    bool first_result = true;
+    ProviderPerformanceMap max_perf;
 
-    for (int m = M.start; m <= M.end; m += M.increment) {
-      for (int n = N.start; n <= N.end; n += N.increment) {
-        for (int k = K.start; k <= K.end; k += K.increment) {
-
-          // Avoid evaluating problem if problem size does not satisfy alignment
-          if (!CutlassDispatch::is_problem_aligned(m, n, k)) {
-            continue;
-          }
-
-          std::vector<PerformanceResult> results =
+    for (int m = M.start; m <= M.end; m += M.next(m)) {
+      for (int n = N.start; n <= N.end; n += N.next(n)) {
+        for (int k = K.start; k <= K.end; k += K.next(k)) {
+          std::vector<PerformanceResult<GemmProblem> > results =
               execute<CutlassDispatch>(GemmProblem(m,
                                                    n,
                                                    k,
                                                    CutlassDispatch::kLayoutA,
                                                    CutlassDispatch::kLayoutB,
-                                                   options.alpha,
-                                                   options.beta));
+                                                   config.alpha,
+                                                   config.beta));
 
-          for (std::vector<PerformanceResult>::const_iterator it = results.begin();
+          for (std::vector<PerformanceResult<GemmProblem> >::const_iterator it = results.begin();
                it != results.end();
                ++it) {
-
             /// Writes the output without appending it
             output.pretty_print(*it);
 
-            /// Updates maximum performing kernel
-            if (first_result || max_perf.gflops > it->gflops) {
-              max_perf = *it;
+            if (it->disposition == Disposition::Passed) {
+              /// Updates maximum performing kernel
+              ProviderPerformanceMap::iterator max_perf_it = max_perf.find(it->provider);
+
+              if (max_perf_it == max_perf.end()) {
+                max_perf.insert(std::make_pair(it->provider, *it));
+              } else if (max_perf_it->second.gflops < it->gflops) {
+                max_perf_it->second = *it;
+              }
             }
-            first_result = false;
           }
         }
       }
     }
 
-    output.append(max_perf);
+    Provider::Kind providers[] = {
+      Provider::Cutlass,
+      Provider::Invalid
+    };
+    for (int i = 0; providers[i] != Provider::Invalid; ++i) {
+      ProviderPerformanceMap::const_iterator it = max_perf.find(providers[i]);
+      if (it != max_perf.end()) {
+        output.append(it->second);
+      }
+    }
   }
 };
 
@@ -321,17 +357,19 @@ class GemmProfiler {
 
 /// Dispatches to GEMM performance profiler
 template <typename Dispatch, typename GemmProfiler>
-int profile_gemm(TestbenchOutput &output,
+int profile_gemm(TestbenchOutput<GemmProblem> &output,
                  std::string const &kernel,
-                 TestbenchOptions const &options) {
-  if (options.kernel_enabled(kernel)) {
-    GemmProfiler perf(output, kernel, options);
+                 TestbenchOptions const &options,
+                 Config const &config,
+                 std::string const &cutlass_algo = "") {
+  if (config.kernel_enabled(kernel)) {
+    GemmProfiler perf(output, kernel, cutlass_algo, options, config);
     if (options.peak_performance) {
       perf.template peak<Dispatch>(
-          options.problem_range.M, options.problem_range.N, options.problem_range.K);
+          config.problem_range.M, config.problem_range.N, config.problem_range.K);
     } else {
       perf.template schmoo<Dispatch>(
-          options.problem_range.M, options.problem_range.N, options.problem_range.K);
+          config.problem_range.M, config.problem_range.N, config.problem_range.K);
     }
   }
 
diff --git a/tools/test/perf/gemm/hgemm.cu b/tools/test/perf/gemm/hgemm.cu
index e7e9af7fa..5b47e66dd 100644
--- a/tools/test/perf/gemm/hgemm.cu
+++ b/tools/test/perf/gemm/hgemm.cu
@@ -22,62 +22,62 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/hgemm_traits.h>
 
-#include <tools/test/perf/gemm/gemm_perf_testbed.h>
-
-#include <tools/test/perf/gemm/gemm_profiler.h>
-#include <tools/test/perf/gemm/cutlass_dispatch.h>
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/hgemm_traits.h"
+#include "tools/test/perf/cutlass_perf_test.h"
+#include "tools/test/perf/gemm/gemm_perf_testbed.h"
+#include "tools/test/perf/gemm/gemm_profiler.h"
+#include "tools/test/perf/gemm/cutlass_dispatch.h"
 
+#pragma warning( disable : 4503)
 
 namespace perf {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-int profile_hgemm(TestbenchOutput &output, TestbenchOptions const &options) {
-
+int profile_hgemm(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
   typedef perf::GemmProfiler<
-    cutlass::half_t, 
-    cutlass::half_t, 
-    cutlass::half_t, 
-    cutlass::half_t, 
+    cutlass::half_t,
+    cutlass::half_t,
+    cutlass::half_t,
+    cutlass::half_t,
     cutlass::half_t> GemmProfiler;
 
   int results = 0;
 
-  if (!results) {
-    
-    typedef cutlass::gemm::HgemmTraits<
-      cutlass::MatrixLayout::kColumnMajor,
-      cutlass::MatrixLayout::kRowMajor,
-      cutlass::Shape<8, 128, 128>
-    >
-    GemmTraits;
-
-    typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
-
-    profile_gemm<Dispatch, GemmProfiler>(output, "hgemm_nt", options);
+  // compute capability check
+  if (!options.compute_capability(6, 0)) {
+    return 0;
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::HgemmTraits<
       cutlass::MatrixLayout::kColumnMajor,
-      cutlass::MatrixLayout::kColumnMajor,
+      cutlass::MatrixLayout::kRowMajor,
       cutlass::Shape<8, 128, 128>
     >
     GemmTraits;
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "hgemm_nn", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "hgemm_nt", options, config);
   }
 
-  if (!results) {
-    
+  {
+    typedef cutlass::gemm::HgemmTraits<
+      cutlass::MatrixLayout::kColumnMajor,
+      cutlass::MatrixLayout::kColumnMajor,
+      cutlass::Shape<8, 128, 128>
+    >
+    GemmTraits;
+
+    typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "hgemm_nn", options, config);
+  }
+
+  {
     typedef cutlass::gemm::HgemmTraits<
       cutlass::MatrixLayout::kRowMajor,
       cutlass::MatrixLayout::kColumnMajor,
@@ -87,11 +87,10 @@ int profile_hgemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "hgemm_tn", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "hgemm_tn", options, config);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::HgemmTraits<
       cutlass::MatrixLayout::kRowMajor,
       cutlass::MatrixLayout::kRowMajor,
@@ -101,13 +100,18 @@ int profile_hgemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "hgemm_tt", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "hgemm_tt", options, config);
   }
 
   return results;
 }
 
+struct HgemmRegistrar {
+  HgemmRegistrar() { RegisterGemmProfileFunc(profile_hgemm); }
+};
+
+volatile HgemmRegistrar _HgemmRegistrar;
+
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 } // namespace perf
-
diff --git a/tools/test/perf/gemm/igemm.cu b/tools/test/perf/gemm/igemm.cu
index 879ee0abf..24d721a91 100644
--- a/tools/test/perf/gemm/igemm.cu
+++ b/tools/test/perf/gemm/igemm.cu
@@ -23,24 +23,31 @@
  *
  **************************************************************************************************/
 
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/igemm_traits.h>
-#include <tools/test/perf/gemm/gemm_perf_testbed.h>
-#include <tools/test/perf/gemm/gemm_profiler.h>
-#include <tools/test/perf/gemm/cutlass_dispatch.h>
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/igemm_traits.h"
+#include "tools/test/perf/cutlass_perf_test.h"
+#include "tools/test/perf/gemm/gemm_perf_testbed.h"
+#include "tools/test/perf/gemm/gemm_profiler.h"
+#include "tools/test/perf/gemm/cutlass_dispatch.h"
+
+#pragma warning( disable : 4503)
 
 namespace perf {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-int profile_igemm(TestbenchOutput &output, TestbenchOptions const &options) {
+int profile_igemm(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
 
   typedef perf::GemmProfiler<int8_t, int8_t, int, int, int> GemmProfiler;
 
+  // compute capability check
+  if (!options.compute_capability(6, 1)) {
+    return 0;
+  }
+
   int results = 0;
-  
-  if (!results) {
-    
+
+  {
     typedef cutlass::gemm::IgemmTraits<
       cutlass::MatrixLayout::kColumnMajor,
       cutlass::MatrixLayout::kRowMajor
@@ -48,11 +55,10 @@ int profile_igemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "igemm_nt", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "igemm_nt", options, config);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::IgemmTraits<
       cutlass::MatrixLayout::kColumnMajor,
       cutlass::MatrixLayout::kColumnMajor
@@ -60,11 +66,10 @@ int profile_igemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "igemm_nn", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "igemm_nn", options, config);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::IgemmTraits<
       cutlass::MatrixLayout::kRowMajor,
       cutlass::MatrixLayout::kColumnMajor
@@ -72,11 +77,10 @@ int profile_igemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "igemm_tn", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "igemm_tn", options, config);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::IgemmTraits<
       cutlass::MatrixLayout::kRowMajor,
       cutlass::MatrixLayout::kRowMajor
@@ -84,12 +88,62 @@ int profile_igemm(TestbenchOutput &output, TestbenchOptions const &options) {
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "igemm_tt", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "igemm_tt", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<128, 32, 32>, int,
+            cutlass::gemm::LinearScaling<int>, cutlass::Shape<32, 8, 4> > GemmTraits;
+
+    typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "igemm_32x32x128_nn",
+            options, config);
+  }
+
+  {
+    typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kRowMajor, cutlass::Shape<128, 32, 32>, int,
+            cutlass::gemm::LinearScaling<int>, cutlass::Shape<32, 8, 4> > GemmTraits;
+
+    typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "igemm_32x32x128_nt",
+            options, config);
+  }
+
+  {
+    typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<128, 32, 32>, int,
+            cutlass::gemm::LinearScaling<int>, cutlass::Shape<32, 8, 4> > GemmTraits;
+
+    typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "igemm_32x32x128_tn",
+            options, config);
+  }
+
+  {
+    typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kRowMajor, cutlass::Shape<128, 32, 32>, int,
+            cutlass::gemm::LinearScaling<int>, cutlass::Shape<32, 8, 4> > GemmTraits;
+
+    typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
+
+    results = profile_gemm<Dispatch, GemmProfiler>(output, "igemm_32x32x128_tt",
+            options, config);
   }
 
   return results;
 }
 
+struct IgemmRegistrar {
+  IgemmRegistrar() { RegisterGemmProfileFunc(profile_igemm); }
+};
+
+volatile IgemmRegistrar _IgemmRegistrar;
+
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 } // namespace perf
diff --git a/tools/test/perf/gemm/sgemm.cu b/tools/test/perf/gemm/sgemm.cu
index cdbbe3d57..1448ae0d4 100644
--- a/tools/test/perf/gemm/sgemm.cu
+++ b/tools/test/perf/gemm/sgemm.cu
@@ -22,80 +22,96 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
 
-#include <tools/test/perf/gemm/gemm_perf_testbed.h>
-
-#include <tools/test/perf/gemm/gemm_profiler.h>
-#include <tools/test/perf/gemm/cutlass_dispatch.h>
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/perf/cutlass_perf_test.h"
+#include "tools/test/perf/gemm/gemm_perf_testbed.h"
+#include "tools/test/perf/gemm/gemm_profiler.h"
+#include "tools/test/perf/gemm/cutlass_dispatch.h"
+#pragma warning( disable : 4503)
 
 namespace perf {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-int profile_sgemm(TestbenchOutput &output, TestbenchOptions const &options) {
+template <typename OutputTile>
+int profile_sgemm_kernel(
+  TestbenchOutput<GemmProblem> &output,
+  TestbenchOptions const &options,
+  Config const &config,
+  std::string const &name,
+  std::string const &algo) {
 
   typedef perf::GemmProfiler<float, float, float, float, float> SGemmProfiler;
 
   int results = 0;
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::SgemmTraits<
       cutlass::MatrixLayout::kColumnMajor,
       cutlass::MatrixLayout::kRowMajor,
-      cutlass::Shape<8, 128, 128>
+      OutputTile
     > GemmTraits;
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, SGemmProfiler>(output, "sgemm_nt", options);
+    results |= profile_gemm<Dispatch, SGemmProfiler>(output, name + "_nt", options, config, algo);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::SgemmTraits<
       cutlass::MatrixLayout::kColumnMajor,
       cutlass::MatrixLayout::kColumnMajor,
-      cutlass::Shape<8, 128, 128>
+      OutputTile
     > GemmTraits;
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, SGemmProfiler>(output, "sgemm_nn", options);
+    results |= profile_gemm<Dispatch, SGemmProfiler>(output, name + "_nn", options, config, algo);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::SgemmTraits<
       cutlass::MatrixLayout::kRowMajor,
       cutlass::MatrixLayout::kColumnMajor,
-      cutlass::Shape<8, 128, 128>
+      OutputTile
     > GemmTraits;
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, SGemmProfiler>(output, "sgemm_tn", options);
+    results |= profile_gemm<Dispatch, SGemmProfiler>(output, name + "_tn", options, config, algo);
   }
 
-  if (!results) {
-    
+  {
     typedef cutlass::gemm::SgemmTraits<
       cutlass::MatrixLayout::kRowMajor,
       cutlass::MatrixLayout::kRowMajor,
-      cutlass::Shape<8, 128, 128>
+      OutputTile
     > GemmTraits;
 
     typedef typename CutlassDispatchBasic<GemmTraits>::Dispatch Dispatch;
 
-    profile_gemm<Dispatch, SGemmProfiler>(output, "sgemm_tt", options);
+    results |= profile_gemm<Dispatch, SGemmProfiler>(output, name + "_tt", options, config, algo);
   }
+  return results;
+}
+
+/// Profiles all SGEMM tile sizes
+int profile_sgemm(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
+  int results = 0;
+
+  results |= profile_sgemm_kernel<cutlass::Shape<8, 128, 128> >(output, options, config, "sgemm", "128x128");
 
   return results;
 }
 
+struct SgemmRegistrar {
+  SgemmRegistrar() { RegisterGemmProfileFunc(profile_sgemm); }
+};
+
+volatile SgemmRegistrar _SgemmRegistrar;
+
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 } // namespace perf
-
diff --git a/tools/test/perf/gemm/wmma_binary_gemm.cu b/tools/test/perf/gemm/wmma_binary_gemm.cu
new file mode 100644
index 000000000..4ae236f4d
--- /dev/null
+++ b/tools/test/perf/gemm/wmma_binary_gemm.cu
@@ -0,0 +1,149 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#include "tools/test/perf/cutlass_perf_test.h"
+#include "tools/test/perf/gemm/gemm_profiler.h"
+#include "tools/test/perf/gemm/gemm_perf_testbed.h"
+
+#include "cutlass/wmma_matrix.h"
+#ifdef CUTLASS_USE_WMMA_API
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/wmma_gemm_traits.h"
+#include "tools/test/perf/gemm/cutlass_dispatch.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template<typename Traits>
+struct WmmaBinaryGemmDispatch {
+
+  typedef cutlass::gemm::Gemm<Traits> Gemm;
+
+  typedef typename Gemm::Params Params;
+
+  /// Indicate warp-level GEMM
+  static bool const kThreadMultiplyAdd = false;
+
+  static bool const kRunCuBLAS = false;
+
+  static cutlass::MatrixLayout::Kind const kLayoutA = Traits::kLayoutA;
+  static cutlass::MatrixLayout::Kind const kLayoutB = Traits::kLayoutB;
+
+  //
+  // Data members
+  //
+
+  /// Params argument
+  Params params;
+
+  //
+  // Methods
+  //
+
+  WmmaBinaryGemmDispatch() {}
+
+  /// Initializes params object
+  WmmaBinaryGemmDispatch(int m, int n, int k, int alpha,
+                       cutlass::Vector<cutlass::bin1_t, 32> const* d_a, int lda,
+                       cutlass::Vector<cutlass::bin1_t, 32> const* d_b, int ldb, int beta,
+                       int const* d_c, int ldc, int* d_d, int ldd) {
+
+    params.initialize(m, n, k * 32, alpha, d_a, lda, d_b, ldb, beta, d_c, ldc, d_d, ldd);
+  }
+
+  /// Initializes params object
+  WmmaBinaryGemmDispatch(Params const& _params) : params(_params) {}
+
+  /// Launches kernel
+  cudaError_t operator()() { return Gemm::launch(params); }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace perf {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+int profile_wmma_binary_gemm(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
+  typedef perf::GemmProfiler<cutlass::Vector<cutlass::bin1_t, 32>, cutlass::Vector<cutlass::bin1_t, 32>, int, int, int> GemmProfiler;
+
+  int results = 0;
+
+  // compute capability check
+  if (!options.compute_capability_exact(7, 5)) {
+    return 0;
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::Shape<1024, 128, 128>,
+                                          cutlass::Vector<cutlass::bin1_t, 32>,
+                                          cutlass::Vector<cutlass::bin1_t, 32>,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<1024, 32, 64>,
+                                          cutlass::Shape<128, 8, 8>,
+                                          128,
+                                          128>
+      WmmaGemmTraits;
+
+    typedef WmmaBinaryGemmDispatch<WmmaGemmTraits> Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_binary_gemm_tn", options, config);
+  }
+
+  return results;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace perf
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#else // ! CUTLASS_USE_SUBBYTE_WMMA
+
+namespace perf {
+
+int profile_wmma_binary_gemm(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
+  return 0;
+}
+
+} // namespace perf
+
+#endif
+
+struct WmmaBinaryGemmRegistrar {
+  WmmaBinaryGemmRegistrar() { perf::RegisterGemmProfileFunc(perf::profile_wmma_binary_gemm); }
+};
+
+volatile WmmaBinaryGemmRegistrar _WmmaBinaryGemmRegistrar;
+
+#endif // CUTLASS_USE_WMMA_API
diff --git a/tools/test/perf/gemm/wmma_gemm.cu b/tools/test/perf/gemm/wmma_gemm.cu
index 022191393..825712092 100644
--- a/tools/test/perf/gemm/wmma_gemm.cu
+++ b/tools/test/perf/gemm/wmma_gemm.cu
@@ -23,17 +23,19 @@
  *
  **************************************************************************************************/
 
-#include <cutlass/wmma_matrix.h>
+#include "cutlass/wmma_matrix.h"
 #ifdef CUTLASS_USE_WMMA_API
 
+#pragma warning( disable : 4503)
+
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-#include <cutlass/gemm/gemm.h>
-
-#include <tools/test/perf/gemm/gemm_profiler.h>
-#include <tools/test/perf/gemm/cutlass_dispatch.h>
-#include <tools/test/perf/gemm/gemm_perf_testbed.h>
-#include <cutlass/gemm/wmma_gemm_traits.h>
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/wmma_gemm_traits.h"
+#include "tools/test/perf/cutlass_perf_test.h"
+#include "tools/test/perf/gemm/gemm_profiler.h"
+#include "tools/test/perf/gemm/cutlass_dispatch.h"
+#include "tools/test/perf/gemm/gemm_perf_testbed.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
@@ -47,9 +49,17 @@ struct WmmaGemmDispatch {
   /// Indicate warp-level GEMM
   static bool const kThreadMultiplyAdd = false;
 
+  static bool const kRunCuBLAS = true;
+
   static cutlass::MatrixLayout::Kind const kLayoutA = Traits::kLayoutA;
   static cutlass::MatrixLayout::Kind const kLayoutB = Traits::kLayoutB;
 
+  typedef typename Traits::ScalarA ScalarA;
+  typedef typename Traits::ScalarB ScalarB;
+  typedef typename Traits::ScalarC ScalarC;
+  typedef typename Traits::ScalarD ScalarD;
+  typedef typename Traits::Epilogue::Functor::Scalar Scalar;
+
   //
   // Data members
   //
@@ -64,9 +74,20 @@ struct WmmaGemmDispatch {
   WmmaGemmDispatch() {}
 
   /// Initializes params object
-  WmmaGemmDispatch(int m, int n, int k, float alpha, half const* d_a, int lda,
-                  half const* d_b, int ldb, float beta, float const* d_c, int ldc,
-                  float* d_d, int ldd) {
+  WmmaGemmDispatch(
+    int m,
+    int n,
+    int k,
+    Scalar alpha,
+    ScalarA const* d_a,
+    int lda,
+    ScalarB const* d_b,
+    int ldb,
+    Scalar beta,
+    ScalarC const* d_c,
+    int ldc,
+    ScalarD* d_d,
+    int ldd) {
 
     params.initialize(m, n, k, alpha, d_a, lda, d_b, ldb, beta, d_c, ldc, d_d, ldd);
   }
@@ -76,33 +97,6 @@ struct WmmaGemmDispatch {
 
   /// Launches kernel
   cudaError_t operator()() { return Gemm::launch(params); }
-
-  /// Determines if problem is aligned (assuming no padding)
-  static bool is_problem_aligned(
-    int m,
-    int n,
-    int k) {
-
-    bool aligned = true;
-
-    if (kLayoutA == cutlass::MatrixLayout::kColumnMajor) {
-      aligned = aligned && !(m % Gemm::Traits::GemmConfig::kScalarsPerLdgA);
-    }
-    else {
-      aligned = aligned && !(k % Gemm::Traits::GemmConfig::kScalarsPerLdgA);
-    }
-
-    if (kLayoutB == cutlass::MatrixLayout::kColumnMajor) {
-      aligned = aligned && !(k % Gemm::Traits::GemmConfig::kScalarsPerLdgB);
-    }
-    else {
-      aligned = aligned && !(n % Gemm::Traits::GemmConfig::kScalarsPerLdgB);
-    }
-
-    aligned = aligned && !(m % Gemm::Traits::GemmConfig::kScalarsPerLdgC);
-
-    return aligned;
-  }
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
@@ -111,54 +105,49 @@ namespace perf {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-int profile_wmma_gemm(TestbenchOutput &output, TestbenchOptions const &options) {
-
+int profile_wmma_gemm_f32(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
   typedef perf::GemmProfiler<cutlass::half_t, cutlass::half_t, float, float, float> GemmProfiler;
 
   int results = 0;
 
-  if (!results) {
-
+  {
     typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::MatrixLayout::kRowMajor>
     WmmaGemmTraits;
 
     typedef WmmaGemmDispatch<WmmaGemmTraits> Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_nt", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_nt", options, config);
   }
 
-  if (!results) {
-
+  {
     typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::MatrixLayout::kColumnMajor>
     WmmaGemmTraits;
 
     typedef WmmaGemmDispatch<WmmaGemmTraits> Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_nn", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_nn", options, config);
   }
 
-  if (!results) {
-
+  {
     typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
                                         cutlass::MatrixLayout::kColumnMajor>
       WmmaGemmTraits;
 
     typedef WmmaGemmDispatch<WmmaGemmTraits> Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_tn", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_tn", options, config);
   }
 
-  if (!results) {
-
+  {
     typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
                                         cutlass::MatrixLayout::kRowMajor>
       WmmaGemmTraits;
 
     typedef WmmaGemmDispatch<WmmaGemmTraits> Dispatch;
 
-    profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_tt", options);
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_tt", options, config);
   }
 
   return results;
@@ -166,6 +155,112 @@ int profile_wmma_gemm(TestbenchOutput &output, TestbenchOptions const &options)
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+int profile_wmma_gemm_f16(
+    TestbenchOutput<GemmProblem> &output,
+    TestbenchOptions const &options,
+    Config const &config) {
+
+  typedef perf::GemmProfiler<
+    cutlass::half_t,
+    cutlass::half_t,
+    cutlass::half_t,
+    cutlass::half_t,
+    cutlass::half_t> GemmProfiler;
+
+  int results = 0;
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<
+      cutlass::MatrixLayout::kColumnMajor,
+      cutlass::MatrixLayout::kRowMajor,
+      cutlass::Shape<32, 128, 128>,
+      half,
+      half,
+      half,
+      cutlass::gemm::LinearScaling<half>,
+      half,
+      cutlass::Shape<32, 64, 64>
+    >
+      WmmaGemmTraits;
+
+    typedef WmmaGemmDispatch<WmmaGemmTraits> Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_f16_nt", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<
+      cutlass::MatrixLayout::kColumnMajor,
+      cutlass::MatrixLayout::kColumnMajor,
+      cutlass::Shape<32, 128, 128>,
+      half,
+      half,
+      half,
+      cutlass::gemm::LinearScaling<half>,
+      half,
+      cutlass::Shape<32, 64, 64>
+    >
+      WmmaGemmTraits;
+
+    typedef WmmaGemmDispatch<WmmaGemmTraits> Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_f16_nn", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<
+      cutlass::MatrixLayout::kRowMajor,
+      cutlass::MatrixLayout::kColumnMajor,
+      cutlass::Shape<32, 128, 128>,
+      half,
+      half,
+      half,
+      cutlass::gemm::LinearScaling<half>,
+      half,
+      cutlass::Shape<32, 64, 64>
+    >
+      WmmaGemmTraits;
+
+    typedef WmmaGemmDispatch<WmmaGemmTraits> Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_f16_tn", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<
+      cutlass::MatrixLayout::kRowMajor,
+      cutlass::MatrixLayout::kRowMajor,
+      cutlass::Shape<32, 128, 128>,
+      half,
+      half,
+      half,
+      cutlass::gemm::LinearScaling<half>,
+      half,
+      cutlass::Shape<32, 64, 64>
+    >
+      WmmaGemmTraits;
+
+    typedef WmmaGemmDispatch<WmmaGemmTraits> Dispatch;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_gemm_f16_tt", options, config);
+  }
+
+  return results;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+struct WmmaGemmRegistrar {
+  WmmaGemmRegistrar() {
+    RegisterGemmProfileFunc(profile_wmma_gemm_f32);
+    RegisterGemmProfileFunc(profile_wmma_gemm_f16);
+  }
+};
+
+volatile WmmaGemmRegistrar _WmmaGemmRegistrar;
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 } // namespace perf
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/perf/gemm/wmma_integer_gemm.cu b/tools/test/perf/gemm/wmma_integer_gemm.cu
new file mode 100644
index 000000000..db615989a
--- /dev/null
+++ b/tools/test/perf/gemm/wmma_integer_gemm.cu
@@ -0,0 +1,455 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#include "tools/test/perf/cutlass_perf_test.h"
+#include "tools/test/perf/gemm/gemm_perf_testbed.h"
+#include "tools/test/perf/gemm/gemm_profiler.h"
+
+#include "cutlass/wmma_matrix.h"
+#ifdef CUTLASS_USE_WMMA_API
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/wmma_gemm_traits.h"
+#include "tools/test/perf/gemm/cutlass_dispatch.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template<typename Traits, typename ScalarA, typename ScalarB>
+struct WmmaIntegerGemmDispatch {
+
+  typedef cutlass::gemm::Gemm<Traits> Gemm;
+
+  typedef typename Gemm::Params Params;
+
+  /// Indicate warp-level GEMM
+  static bool const kThreadMultiplyAdd = false;
+
+  static bool const kRunCuBLAS = false;
+
+  static cutlass::MatrixLayout::Kind const kLayoutA = Traits::kLayoutA;
+  static cutlass::MatrixLayout::Kind const kLayoutB = Traits::kLayoutB;
+
+  //
+  // Data members
+  //
+
+  /// Params argument
+  Params params;
+
+  //
+  // Methods
+  //
+
+  WmmaIntegerGemmDispatch() {}
+
+  /// Initializes params object
+  WmmaIntegerGemmDispatch(int m, int n, int k, int alpha,
+                       ScalarA const* d_a, int lda,
+                       ScalarB const* d_b, int ldb, int beta,
+                       int const* d_c, int ldc, int* d_d, int ldd) {
+
+    params.initialize(m, n, k, alpha, d_a, lda, d_b, ldb, beta, d_c, ldc, d_d, ldd);
+  }
+
+  /// Initializes params object
+  WmmaIntegerGemmDispatch(Params const& _params) : params(_params) {}
+
+  /// Launches kernel
+  cudaError_t operator()() { return Gemm::launch(params); }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template<typename Traits>
+struct WmmaIntegerGemmDispatch<Traits,
+                               cutlass::Vector<cutlass::int4_t, 8>,
+                               cutlass::Vector<cutlass::int4_t, 8> > {
+
+  typedef typename cutlass::Vector<cutlass::int4_t, 8> ScalarA;
+  typedef typename cutlass::Vector<cutlass::int4_t, 8> ScalarB;
+
+  typedef cutlass::gemm::Gemm<Traits> Gemm;
+
+  typedef typename Gemm::Params Params;
+
+  /// Indicate warp-level GEMM
+  static bool const kThreadMultiplyAdd = false;
+
+  static bool const kRunCuBLAS = false;
+
+  static cutlass::MatrixLayout::Kind const kLayoutA = Traits::kLayoutA;
+  static cutlass::MatrixLayout::Kind const kLayoutB = Traits::kLayoutB;
+
+  //
+  // Data members
+  //
+
+  /// Params argument
+  Params params;
+
+  //
+  // Methods
+  //
+
+  WmmaIntegerGemmDispatch() {}
+
+  /// Initializes params object
+  WmmaIntegerGemmDispatch(int m, int n, int k, int alpha,
+                       ScalarA const* d_a, int lda,
+                       ScalarB const* d_b, int ldb, int beta,
+                       int const* d_c, int ldc, int* d_d, int ldd) {
+
+    params.initialize(m, n, k * 8, alpha, d_a, lda, d_b, ldb, beta, d_c, ldc, d_d, ldd);
+  }
+
+  /// Initializes params object
+  WmmaIntegerGemmDispatch(Params const& _params) : params(_params) {}
+
+  /// Launches kernel
+  cudaError_t operator()() { return Gemm::launch(params); }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template<typename Traits>
+struct WmmaIntegerGemmDispatch<Traits,
+                               cutlass::Vector<cutlass::uint4_t, 8>,
+                               cutlass::Vector<cutlass::uint4_t, 8> > {
+
+  typedef typename cutlass::Vector<cutlass::uint4_t, 8> ScalarA;
+  typedef typename cutlass::Vector<cutlass::uint4_t, 8> ScalarB;
+
+  typedef cutlass::gemm::Gemm<Traits> Gemm;
+
+  typedef typename Gemm::Params Params;
+
+  /// Indicate warp-level GEMM
+  static bool const kThreadMultiplyAdd = false;
+
+  static bool const kRunCuBLAS = false;
+
+  static cutlass::MatrixLayout::Kind const kLayoutA = Traits::kLayoutA;
+  static cutlass::MatrixLayout::Kind const kLayoutB = Traits::kLayoutB;
+
+  //
+  // Data members
+  //
+
+  /// Params argument
+  Params params;
+
+  //
+  // Methods
+  //
+
+  WmmaIntegerGemmDispatch() {}
+
+  /// Initializes params object
+  WmmaIntegerGemmDispatch(int m, int n, int k, int alpha,
+                       ScalarA const* d_a, int lda,
+                       ScalarB const* d_b, int ldb, int beta,
+                       int const* d_c, int ldc, int* d_d, int ldd) {
+
+    params.initialize(m, n, k * 8, alpha, d_a, lda, d_b, ldb, beta, d_c, ldc, d_d, ldd);
+  }
+
+  /// Initializes params object
+  WmmaIntegerGemmDispatch(Params const& _params) : params(_params) {}
+
+  /// Launches kernel
+  cudaError_t operator()() { return Gemm::launch(params); }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace perf {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+int profile_wmma_integer_gemm(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
+
+  int results = 0;
+
+  // compute capability check
+  if (!options.compute_capability(7, 5)) {
+    return 0;
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::Shape<128, 128, 128>,
+                                          signed char,
+                                          signed char,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<128, 32, 32>,
+                                          cutlass::Shape<16, 16, 16>,
+                                          16,
+                                          16> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits, signed char, signed char> Dispatch;
+
+    typedef perf::GemmProfiler<signed char, signed char, int, int, int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_s8_16x16x16_nn", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::Shape<128, 128, 128>,
+                                          signed char,
+                                          signed char,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<128, 32, 32>,
+                                          cutlass::Shape<16, 16, 16>,
+                                          16,
+                                          16> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits, signed char, signed char> Dispatch;
+
+    typedef perf::GemmProfiler<signed char, signed char, int, int, int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_s8_16x16x16_nt", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::Shape<128, 128, 128>,
+                                          signed char,
+                                          signed char,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<128, 32, 32>,
+                                          cutlass::Shape<16, 16, 16>,
+                                          16,
+                                          16> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits, signed char, signed char> Dispatch;
+
+    typedef perf::GemmProfiler<signed char, signed char, int, int, int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_s8_16x16x16_tn", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::Shape<128, 128, 128>,
+                                          signed char,
+                                          signed char,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<128, 32, 32>,
+                                          cutlass::Shape<16, 16, 16>,
+                                          16,
+                                          16> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits, signed char, signed char> Dispatch;
+
+    typedef perf::GemmProfiler<signed char, signed char, int, int, int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_s8_16x16x16_tt", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::Shape<128, 128, 128>,
+                                          unsigned char,
+                                          unsigned char,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<128, 32, 32>,
+                                          cutlass::Shape<16, 16, 16>,
+                                          16,
+                                          16> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits, unsigned char, unsigned char> Dispatch;
+
+    typedef perf::GemmProfiler<unsigned char, unsigned char, int, int, int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_u8_16x16x16_nn", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::Shape<128, 128, 128>,
+                                          unsigned char,
+                                          unsigned char,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<128, 32, 32>,
+                                          cutlass::Shape<16, 16, 16>,
+                                          16,
+                                          16> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits, unsigned char, unsigned char> Dispatch;
+
+    typedef perf::GemmProfiler<unsigned char, unsigned char, int, int, int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_u8_16x16x16_nt", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::Shape<128, 128, 128>,
+                                          unsigned char,
+                                          unsigned char,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<128, 32, 32>,
+                                          cutlass::Shape<16, 16, 16>,
+                                          16,
+                                          16> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits, unsigned char, unsigned char> Dispatch;
+
+    typedef perf::GemmProfiler<unsigned char, unsigned char, int, int, int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_u8_16x16x16_tn", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::Shape<128, 128, 128>,
+                                          unsigned char,
+                                          unsigned char,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<128, 32, 32>,
+                                          cutlass::Shape<16, 16, 16>,
+                                          16,
+                                          16> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits, unsigned char, unsigned char> Dispatch;
+
+    typedef perf::GemmProfiler<unsigned char, unsigned char, int, int, int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_u8_16x16x16_tt", options, config);
+  }
+
+  // compute capability check
+  if (!options.compute_capability_exact(7, 5)) {
+    return 0;
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::Shape<256, 128, 128>,
+                                          cutlass::Vector<cutlass::int4_t, 8>,
+                                          cutlass::Vector<cutlass::int4_t, 8>,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<256, 32, 32>,
+                                          cutlass::Shape<32, 8, 8>,
+                                          32,
+                                          32> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits,
+                                 cutlass::Vector<cutlass::int4_t, 8>,
+                                 cutlass::Vector<cutlass::int4_t, 8> > Dispatch;
+
+    typedef perf::GemmProfiler<cutlass::Vector<cutlass::int4_t, 8>,
+                               cutlass::Vector<cutlass::int4_t, 8>,
+                               int,
+                               int,
+                               int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_s4_tn", options, config);
+  }
+
+  {
+    typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                          cutlass::MatrixLayout::kColumnMajor,
+                                          cutlass::Shape<256, 128, 128>,
+                                          cutlass::Vector<cutlass::uint4_t, 8>,
+                                          cutlass::Vector<cutlass::uint4_t, 8>,
+                                          int,
+                                          cutlass::gemm::LinearScaling<int>,
+                                          int,
+                                          cutlass::Shape<256, 32, 32>,
+                                          cutlass::Shape<32, 8, 8>,
+                                          32,
+                                          32> WmmaGemmTraits;
+
+    typedef WmmaIntegerGemmDispatch<WmmaGemmTraits,
+                                 cutlass::Vector<cutlass::uint4_t, 8>,
+                                 cutlass::Vector<cutlass::uint4_t, 8> > Dispatch;
+
+    typedef perf::GemmProfiler<cutlass::Vector<cutlass::uint4_t, 8>,
+                               cutlass::Vector<cutlass::uint4_t, 8>,
+                               int,
+                               int,
+                               int> GemmProfiler;
+
+    results |= profile_gemm<Dispatch, GemmProfiler>(output, "wmma_integer_gemm_u4_tn", options, config);
+  }
+
+  return results;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace perf
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#else // ! CUTLASS_USE_SUBBYTE_WMMA
+
+namespace perf {
+
+int profile_wmma_integer_gemm(TestbenchOutput<GemmProblem> &output, TestbenchOptions const &options, Config const &config) {
+  return 0;
+}
+
+}
+
+#endif
+
+struct WmmaIntegerGemmRegistrar {
+  WmmaIntegerGemmRegistrar() { perf::RegisterGemmProfileFunc(perf::profile_wmma_integer_gemm); }
+};
+
+volatile WmmaIntegerGemmRegistrar _WmmaIntegerGemmRegistrar;
+
+#endif // ifdef CUTLASS_USE_WMMA_API
diff --git a/tools/test/perf/performance_result.h b/tools/test/perf/performance_result.h
index 65ec4b18e..38674b76a 100644
--- a/tools/test/perf/performance_result.h
+++ b/tools/test/perf/performance_result.h
@@ -25,25 +25,39 @@
 
 #pragma once
 
-#include <cutlass/matrix_traits.h>
-#include <tools/util/command_line.h>
+#include "cutlass/matrix_traits.h"
+#include "tools/util/command_line.h"
+#include "tools/test/perf/provider.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 namespace perf {
 
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 /// Outcome of test
 struct Disposition {
-  enum Kind { Unknown = 0, NotRun, Passed, Incorrect, Failed, NotVerified, Invalid };
+  enum Kind {
+    Unknown = 0,
+    NotRun,
+    Passed,
+    Incorrect,
+    Failed,
+    NotVerified,
+    Invalid
+  };
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-}  // namespace perf
-
-inline std::ostream &operator<<(std::ostream &out, perf::Disposition::Kind value) {
-  char const *str[] = {
-      "unknown", "not_run", "passed", "incorrect", "failed", "not_verified", "invalid"};
+inline std::ostream &operator<<(std::ostream &out, Disposition::Kind value) {
+  char const *str[] = {"unknown",
+                       "not_run",
+                       "passed",
+                       "incorrect",
+                       "failed",
+                       "not_verified",
+                       "invalid"};
   if (value >= perf::Disposition::Unknown && value < perf::Disposition::Invalid) {
     out << str[value];
   } else {
@@ -62,10 +76,6 @@ inline std::ostream &operator<<(std::ostream &out, cutlass::MatrixLayout::Kind l
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-namespace perf {
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 /// Size and layout of a GEMM problem
 struct GemmProblem {
   //
@@ -86,7 +96,7 @@ struct GemmProblem {
   //
 
   /// Static method to print GemmProblem headers
-  static std::string header() { return "M, N, K, Layout_A, Layout_B, Beta"; }
+  static std::string header() { return "M,N,K,Layout_A,Layout_B,Beta"; }
 
   //
   // Methods
@@ -129,34 +139,27 @@ struct GemmProblem {
   }
 };
 
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-}  // namespace perf
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 /// Prints a problem to an output stream
-inline std::ostream &operator<<(std::ostream &out, perf::GemmProblem const &problem) {
-  out << problem.m << ", " << problem.n << ", " << problem.k << ", " << problem.layout_A << ", "
-      << problem.layout_B << ", " << problem.beta;
+inline std::ostream &operator<<(std::ostream &out, GemmProblem const &problem) {
+  out << problem.m << "," << problem.n << "," << problem.k << "," << problem.layout_A << ","
+      << problem.layout_B << "," << problem.beta;
 
   return out;
 }
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-namespace perf {
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 /// Result object
+template <typename Problem>
 struct PerformanceResult {
+  /// Provider of GEMM implementation
+  Provider::Kind provider;
 
   /// Name of kernel
   std::string kernel_name;
 
   /// Problem size
-  GemmProblem problem;
+  Problem problem;
 
   /// Outcome of test
   Disposition::Kind disposition;
@@ -166,40 +169,45 @@ struct PerformanceResult {
 
   /// Throughput in units of GFLOPs
   double gflops;
+
   //
   // Methods
   //
 
-  PerformanceResult(
-                    std::string const &_kernel_name = "",
-                    GemmProblem const &_problem = GemmProblem(),
-                    Disposition::Kind _disposition = Disposition::NotRun,
-                    double _runtime = 0,
-                    double _gflops = 0)
-      :
-        kernel_name(_kernel_name),
-        problem(_problem),
-        disposition(_disposition),
-        runtime(_runtime),
-        gflops(_gflops) {}
+  PerformanceResult(Provider::Kind _provider = Provider::Cutlass
+                    , std::string const &_kernel_name = ""
+                    , Problem const &_problem = Problem()
+                    , Disposition::Kind _disposition = Disposition::NotRun
+                    , double _runtime = 0
+                    , double _gflops = 0
+  ):
+    provider(_provider)
+    , kernel_name(_kernel_name)
+    , problem(_problem)
+    , disposition(_disposition)
+    , runtime(_runtime)
+    , gflops(_gflops)
+  {}
 
   /// Displays headers
   static std::string header() {
-    return std::string("Kernel, ") + GemmProblem::header() +
-           ", Disposition, Runtime, GFLOPs";
+    std::stringstream ss;
+    
+    ss << "Provider,Kernel," <<  Problem::header();
+    ss << ",Disposition,Runtime,GFLOPs";
+    return ss.str();
   }
 
   /// Prints human-readable results
   std::ostream &pretty_print(std::ostream &out) const {
-
     out << "Kernel: \033[1m" << kernel_name << "\033[0m\n"
+        << "    provider: " << provider << "\n"
         << "    problem: ";
 
     std::stringstream disposition_str;
     if (disposition == Disposition::Passed) {
       disposition_str << "\033[1m";
-    }
-    else {
+    } else {
       disposition_str << "\033[1;31m";
     }
     disposition_str << disposition << "\033[0m";
@@ -215,15 +223,16 @@ struct PerformanceResult {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-}  // namespace perf
-
 /// Outputs result
-inline std::ostream &operator<<(std::ostream &out, perf::PerformanceResult const &result) {
+template <typename Problem>
+inline std::ostream &operator<<(std::ostream &out, PerformanceResult<Problem> const &result) {
 
-  out << result.kernel_name << ", " << result.problem << ", "
-      << result.disposition << ", " << result.runtime << ", " << result.gflops;
+  out << result.provider << "," << result.kernel_name << "," << result.problem << ","
+      << result.disposition << "," << result.runtime << "," << result.gflops;
 
   return out;
 }
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace perf
diff --git a/tools/test/perf/provider.h b/tools/test/perf/provider.h
new file mode 100644
index 000000000..544ee3fbb
--- /dev/null
+++ b/tools/test/perf/provider.h
@@ -0,0 +1,71 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#pragma once
+
+#include <iosfwd>
+
+namespace perf {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Implementation under test
+struct Provider {
+  enum Kind {
+    Unknown = 0,
+    Cutlass,
+    Invalid
+  };
+
+  static Provider::Kind from_string(std::string const &str) {
+    if (str == "cutlass" || str == "Cutlass") {
+      return Cutlass;
+    }
+    else {
+      return Invalid;
+    }
+  }
+};
+
+/// Prints provider
+inline std::ostream &operator<<(std::ostream &out, Provider::Kind provider) {
+  char const *str[] = {
+    "unknown",
+    "Cutlass",
+    "invalid"
+  };
+  if (provider >= perf::Provider::Unknown && provider < perf::Provider::Invalid) {
+    out << str[provider];
+  } else {
+    out << str[perf::Provider::Invalid];
+  }
+  return out;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+}  // namespace perf
+
+
diff --git a/tools/test/perf/testbench_configs.h b/tools/test/perf/testbench_configs.h
new file mode 100644
index 000000000..a7036aba8
--- /dev/null
+++ b/tools/test/perf/testbench_configs.h
@@ -0,0 +1,189 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#pragma once
+
+#include <stdlib.h>
+#include <algorithm>
+#include <fstream>
+#include <string>
+
+#include "tools/test/perf/testbench_options.h"
+
+namespace perf {
+
+// Structure of configurations to run
+struct Config {
+  // Scalar value for GEMM
+  double alpha;
+
+  /// Scalar value for GEMM
+  double beta;
+
+  // kernel to run
+  std::vector<std::string> kernels;
+
+  /// Range of problem sizes
+  GemmProblemRange problem_range;
+
+  // Reference GFLOPs
+  double gflops_ref;
+
+  // Reference Runtime
+  double runtime_ref;
+
+  // Reference Peak Throughput
+  double peak_throughput_ref;
+
+  // Returns true if the kernel name appears among the enabled kernels
+  bool kernel_enabled(std::string const &kernel) const {
+    typedef std::vector<std::string>::const_iterator kernel_iterator;
+
+    for (kernel_iterator it = kernels.begin(); it != kernels.end(); ++it) {
+      if (kernel.find(*it) != std::string::npos) {
+        return true;
+      }
+    }
+
+    return false;
+  }
+};
+
+// Class to set the configurations to run
+struct TestbenchConfigs {
+  //
+  // Data members
+  //
+
+  // Vector of configurations to run
+  std::vector<perf::Config> configs;
+
+  // Options to test environment
+  TestbenchOptions options;
+
+  // Input CSV file to read (if applicable)
+  std::ifstream threshold_file;
+
+  //
+  // Methods
+  //
+
+  // Determines the configurations to run from the threshold file
+  void configs_from_file() {
+    // Set the values of kernels, M, N, K and beta based off of values read from CSVs
+    threshold_file.open(options.threshold_filename.c_str());
+    if (threshold_file.is_open()) {
+      std::string line;
+      int provider_idx = -1;
+      int kernel_idx = -1;
+      int beta_idx = -1;
+      int m_idx = -1;
+      int n_idx = -1;
+      int k_idx = -1;
+      int gflops_idx = -1;
+      int runtime_idx = -1;
+      int peak_throughput_idx = -1;
+
+      // Read the header and get the indices of the columns
+      if (getline(threshold_file, line)) {
+        char delim = ',';
+        size_t s_idx = 0;
+        size_t d_idx = std::string::npos;
+        int idx = 0;
+        line.erase(std::remove(line.begin(), line.end(), ' '), line.end());
+        while (s_idx < line.size()) {
+          d_idx = line.find_first_of(delim, s_idx);
+          size_t end_idx = (d_idx != std::string::npos ? d_idx : line.size());
+          std::string item = line.substr(s_idx, end_idx - s_idx);
+          if (item.compare("Provider") == 0) provider_idx = idx;
+          if (item.compare("Kernel") == 0) kernel_idx = idx;
+          if (item.compare("Beta") == 0) beta_idx = idx;
+          if (item.compare("M") == 0) m_idx = idx;
+          if (item.compare("N") == 0) n_idx = idx;
+          if (item.compare("K") == 0) k_idx = idx;
+          if (item.compare("GFLOPs") == 0) gflops_idx = idx;
+          if (item.compare("Runtime") == 0) runtime_idx = idx;
+          if (item.compare("SOL") == 0) peak_throughput_idx = idx;
+          s_idx = end_idx + 1;  // For comma
+          idx++;
+        }
+      }
+
+      while (getline(threshold_file, line)) {
+        char delim = ',';
+        size_t s_idx = 0;
+        size_t d_idx = std::string::npos;
+        std::vector<std::string> tokens;
+        line.erase(std::remove(line.begin(), line.end(), ' '), line.end());
+        while (s_idx < line.size()) {
+          d_idx = line.find_first_of(delim, s_idx);
+          size_t end_idx = (d_idx != std::string::npos ? d_idx : line.size());
+          std::string item = line.substr(s_idx, end_idx - s_idx);
+          tokens.push_back(item);
+          s_idx = end_idx + 1;  // For comma
+        }
+        if (tokens[provider_idx].compare("Cutlass") == 0) {
+          // Create a new config
+          Config config = Config();
+          config.alpha = options.alpha;
+          config.beta = strtod(tokens[beta_idx].c_str(), NULL);
+          config.kernels.push_back(tokens[kernel_idx]);
+          config.problem_range.M = Range((int)strtol(tokens[m_idx].c_str(), NULL, 10));
+          config.problem_range.N = Range((int)strtol(tokens[n_idx].c_str(), NULL, 10));
+          config.problem_range.K = Range((int)strtol(tokens[k_idx].c_str(), NULL, 10));
+          config.gflops_ref = strtod(tokens[gflops_idx].c_str(), NULL);
+          config.runtime_ref = strtod(tokens[runtime_idx].c_str(), NULL);
+          config.peak_throughput_ref = strtod(tokens[peak_throughput_idx].c_str(), NULL);
+          configs.push_back(config);
+        }
+      }
+    } else {  // !threshold_file.is_open()
+      std::cout << "ERROR: Could not open threshold file " << options.threshold_filename << "\n";
+    }
+  }
+
+  // Determines the configurations to run from the command line arguments
+  void configs_from_args() {
+    Config config = Config();
+    config.alpha = options.alpha;
+    config.beta = options.beta;
+    for (int i = 0; i < options.kernels.size(); i++) {
+      config.kernels.push_back(options.kernels[i]);
+    }
+    config.problem_range = options.problem_range;
+    configs.push_back(config);
+  }
+
+  // Constructor
+  TestbenchConfigs(TestbenchOptions const &_options) : options(_options) {
+    if (!options.threshold_filename.empty()) {
+      configs_from_file();
+    } else {
+      configs_from_args();
+    }
+  }
+};
+
+}  // namespace perf
diff --git a/tools/test/perf/testbench_options.h b/tools/test/perf/testbench_options.h
index dd2676294..25dff1526 100644
--- a/tools/test/perf/testbench_options.h
+++ b/tools/test/perf/testbench_options.h
@@ -25,8 +25,16 @@
 
 #pragma once
 
+#include <cuda_runtime.h>
+#include <cublas_v2.h>
+
 #include <stdint.h>
-#include <tools/util/command_line.h>
+#include <stdexcept>
+
+#include "cutlass/cutlass.h"
+#include "tools/util/command_line.h"
+#include "tools/util/distribution.h"
+#include "tools/test/perf/provider.h"
 
 namespace perf {
 
@@ -34,14 +42,73 @@ namespace perf {
 
 /// Range of problem sizes
 struct Range {
+
+  enum Operator {
+    Add,
+    Multiply
+  };
+
+  //
+  // Data members
+  //
+
   int start;
   int end;
   int increment;
+  Operator increment_op;
 
-  Range(int _start = 0) : start(_start), end(_start), increment(1) {}
+  //
+  // Methods
+  //
 
-  Range(int _start, int _end, int _increment = 1)
-      : start(_start), end(_end), increment(_increment) {}
+  Range(int _start = 0) : start(_start), end(_start), increment(1), increment_op(Add) {}
+
+  Range(int _start, int _end, int _increment = 1, Operator _op = Add)
+      : start(_start), end(_end), increment(_increment), increment_op(_op) {}
+
+  /// Returns the next item in series
+  int next(int val) const {
+    switch (increment_op) {
+      case Add: val += increment; break;
+      case Multiply: val *= increment; break;
+      default: val = end; break;
+    }
+    return val;
+  }
+
+  void import_from_strings(const std::vector<std::string>& values) {
+    if (values.size() > 0) {
+      std::stringstream ss;
+      ss << values.at(0);
+      ss >> start;
+    }
+
+    if (values.size() > 1) {
+      std::stringstream ss;
+      ss << values.at(1);
+      ss >> end;
+    } else {
+      end = start;
+    }
+
+    if (values.size() > 2 && !values.at(2).empty()) {
+      std::stringstream ss;
+
+      char first = values.at(2).at(0);
+      if (first == '*' || first == '+') {
+        ss << values.at(2).substr(1);
+        switch (first) {
+        case '*': increment_op = Multiply; break;
+        case '+': increment_op = Add; break;
+        default: break;
+        }
+      }
+      else {
+        ss << values.at(2);
+      }
+      ss >> increment;
+    }
+  }
 };
 
 ///////////////////////////////////////////////////////////////////////////////////////////////////
@@ -77,25 +144,7 @@ struct GemmProblemRange {
       std::vector<std::string> values;
       args.get_cmd_line_arguments(arg.c_str(), values, ':');
 
-      if (values.size() > 0) {
-        std::stringstream ss;
-        ss << values.at(0);
-        ss >> range.start;
-      }
-
-      if (values.size() > 1) {
-        std::stringstream ss;
-        ss << values.at(1);
-        ss >> range.end;
-      } else {
-        range.end = range.start;
-      }
-
-      if (values.size() > 2) {
-        std::stringstream ss;
-        ss << values.at(2);
-        ss >> range.increment;
-      }
+      range.import_from_strings(values);
     } else {
       range = _default;
     }
@@ -111,105 +160,6 @@ struct GemmProblemRange {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-/// Distribution type
-struct Distribution {
-  /// Variant types
-  enum Kind { Invalid, Uniform, Gaussian, Linear, Identity };
-
-  /// Distribution state
-  union {
-    /// Uniform distribution
-    struct {
-      double min;
-      double max;
-    } uniform;
-
-    /// Gaussian distribution
-    struct {
-      double mean;
-      double stddev;
-    } gaussian;
-
-    /// Elements are linear combination of row and column index
-    struct {
-      double offset;
-      double delta_row;
-      double delta_column;
-    } linear;
-  };
-
-  /// Active variant kind
-  Kind kind;
-
-  /// Random values are cast to integer after scaling by this power of two
-  int int_scale;
-
-  //
-  // Methods
-  //
-
-  Distribution() : kind(Invalid), int_scale(0) {}
-
-  /// Configures distribution as uniform random
-  Distribution &set_uniform(double _min, double _max, int _int_scale = 0) {
-    kind = Uniform;
-    uniform.min = _min;
-    uniform.max = _max;
-    int_scale = _int_scale;
-    return *this;
-  }
-
-  /// Configures distribution as Gaussian distribution
-  Distribution &set_gaussian(double _mean, double _stddev, int _int_scale = 0) {
-    kind = Gaussian;
-    gaussian.mean = _mean;
-    gaussian.stddev = _stddev;
-    int_scale = _int_scale;
-    return *this;
-  }
-
-
-  /// Sets identity
-  Distribution &set_identity() {
-    kind = Identity;
-    return *this;
-  }
-};
-
-}  // namespace perf
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-/// Prints a Distribution to ostream
-inline std::ostream &operator<<(std::ostream &out, perf::Distribution const &dist) {
-  switch (dist.kind) {
-    case perf::Distribution::Uniform:
-      out << "uniorm, min: " << dist.uniform.min << ", max: " << dist.uniform.max;
-      break;
-    case perf::Distribution::Gaussian:
-      out << "gaussian, mean: " << dist.gaussian.mean << ", stddev: " << dist.gaussian.stddev;
-      break;
-    case perf::Distribution::Linear:
-      out << "linear, mean: " << dist.linear.offset << ", delta_row: " << dist.linear.delta_row
-          << ", delta_column: " << dist.linear.delta_column;
-      break;
-    case perf::Distribution::Identity:
-      break;
-    default:
-      out << "unknown";
-  }
-
-  out << ", int_scale: " << dist.int_scale;
-
-  return out;
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-namespace perf {
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 /// Defines a vector of string pairs
 typedef std::vector<std::pair<std::string, std::string> > KeyValueVector;
 
@@ -219,13 +169,13 @@ typedef KeyValueVector::const_iterator KeyValueIterator;
 /// Structure captures the initial configuration of matrices
 struct InitialDistribution {
   /// Distribution of A matrix operand
-  Distribution dist_A;
+  cutlass::Distribution dist_A;
 
   /// Distribution of B matrix operand
-  Distribution dist_B;
+  cutlass::Distribution dist_B;
 
-  /// Distribution of C matrix operand
-  Distribution dist_C;
+  /// cutlass::Distribution of C matrix operand
+  cutlass::Distribution dist_C;
 
   /// Seed for random number generation
   int64_t seed;
@@ -237,15 +187,15 @@ struct InitialDistribution {
   /// Gets the initial distribution
   static void get_distribution(cutlass::CommandLine const &args,
                                std::string const &arg,
-                               Distribution &dist) {
+                               cutlass::Distribution &dist) {
     struct {
       const char *label;
-      Distribution::Kind kind;
-    } distribution_kinds[] = {{"uniform", Distribution::Uniform},
-                              {"gaussian", Distribution::Gaussian},
-                              {"linear", Distribution::Linear},
-                              {"identity", Distribution::Identity},
-                              {0, Distribution::Invalid}};
+      cutlass::Distribution::Kind kind;
+    } distribution_kinds[] = {{"uniform", cutlass::Distribution::Uniform},
+                              {"gaussian", cutlass::Distribution::Gaussian},
+                              {"linear", cutlass::Distribution::Linear},
+                              {"identity", cutlass::Distribution::Identity},
+                              {0, cutlass::Distribution::Invalid}};
 
     struct {
       char const *label;
@@ -276,13 +226,17 @@ struct InitialDistribution {
 
     // Subsequent key-value pairs update the named field of the distribution struct.
     for (; it != values.end(); ++it) {
-
       // Integer scaling factor - if < 0, no integer rounding is performed.
       if (it->first == "scale" && !it->second.empty()) {
         std::stringstream ss;
         ss << it->second;
         ss >> dist.int_scale;
+        continue;  // next token
+      }
 
+      // Casts as integer without scaling
+      if (it->first == "integer") {
+        dist.int_scale = 0;
         continue;  // next token
       }
 
@@ -326,12 +280,12 @@ struct InitialDistribution {
     args.get_cmd_line_argument("seed", seed, seed);
 
     // Update all distributions at once
-    Distribution dist_all;
+    cutlass::Distribution dist_all;
     if (args.check_cmd_line_flag("dist")) {
-       get_distribution(args, "dist", dist_all);
-       dist_A = dist_all;
-       dist_B = dist_all;
-       dist_C = dist_all;
+      get_distribution(args, "dist", dist_all);
+      dist_A = dist_all;
+      dist_B = dist_all;
+      dist_C = dist_all;
     }
 
     get_distribution(args, "dist_A", dist_A);
@@ -344,19 +298,18 @@ struct InitialDistribution {
 
 /// Defines how to execute the benchmarks
 struct ExecutionMode {
-  enum Kind {
-    Profile,
-    Verify,
-    Single,
-    Invalid
-  };
+  enum Kind { Profile, Verify, Single, Invalid };
 
   static std::string to_string(Kind kind) {
     switch (kind) {
-      case Profile: return "profile";
-      case Verify: return "verify";
-      case Single: return "single";
-      default: return "invalid";
+      case Profile:
+        return "profile";
+      case Verify:
+        return "verify";
+      case Single:
+        return "single";
+      default:
+        return "invalid";
     }
   }
 
@@ -370,18 +323,18 @@ struct ExecutionMode {
 
 /// Indicates when the workspace is saved
 struct WorkspaceSaveMode {
-  enum Kind {
-    Never,
-    Incorrect,
-    Always
-  };
+  enum Kind { Never, Incorrect, Always };
 
   static std::string to_string(Kind kind) {
     switch (kind) {
-      case Never: return "never";
-      case Incorrect: return "incorrect";
-      case Always: return "always";
-      default: return "incorrect";
+      case Never:
+        return "never";
+      case Incorrect:
+        return "incorrect";
+      case Always:
+        return "always";
+      default:
+        return "incorrect";
     }
   }
 
@@ -397,7 +350,6 @@ struct WorkspaceSaveMode {
 
 /// Class holding testbench command line options
 struct TestbenchOptions {
-
   //
   // Data members
   //
@@ -408,18 +360,24 @@ struct TestbenchOptions {
   // Path to output file name
   std::string output_filename;
 
+  // Path to input file name
+  std::string threshold_filename;
+
   /// If true, output is appended
   bool append;
 
   /// Number of iterations
   int iterations;
-
+  
   /// Defines how to run the benchmark
   ExecutionMode::Kind execution_mode;
 
   /// Indicates when the workspace is saved
   WorkspaceSaveMode::Kind save_workspace_mode;
 
+  /// Properties of CUDA device
+  cudaDeviceProp device_properties;
+
   /// Enabled kernel names
   std::vector<std::string> kernels;
 
@@ -432,12 +390,21 @@ struct TestbenchOptions {
   /// Range of problem sizes
   GemmProblemRange problem_range;
 
+  /// If true, kernels are not executed, and no sleep waits are inserted
+  bool dry_run;
+
   /// Tags to describe the profiler output
   KeyValueVector pivot_tags;
 
   /// If enabled, only the peak performance for a given kernel is reported
   bool peak_performance;
 
+  /// Performance Degradatiom Margin before flagging as test failure
+  double perf_margin;
+
+  /// Cool-down period
+  int sleep_time;
+
   //
   // Methods
   //
@@ -447,26 +414,47 @@ struct TestbenchOptions {
       : initial_distribution(args),
         execution_mode(ExecutionMode::Profile),
         save_workspace_mode(WorkspaceSaveMode::Never),
-        problem_range(args) {
+        problem_range(args),
+        dry_run(false),
+        sleep_time(1) {
+
+    // Set the CUDA device and/or specify clock rate
+    configure_cuda_device(args);
 
     // fetch command line arguments
     args.get_cmd_line_argument("iterations", iterations, 25);
     args.get_cmd_line_argument("append", append, false);
     args.get_cmd_line_argument("output", output_filename);
+    args.get_cmd_line_argument("threshold", threshold_filename);
     args.get_cmd_line_argument("alpha", alpha, 1.0);
     args.get_cmd_line_argument("beta", beta, 0.0);
     args.get_cmd_line_argument("peak", peak_performance, false);
     args.get_cmd_line_argument_pairs("tags", pivot_tags);
+    args.get_cmd_line_argument("perf-margin", perf_margin, 0.97);
+    args.get_cmd_line_argument("dry-run", dry_run, false);
+    args.get_cmd_line_argument("sleep-time", sleep_time, 1);
 
-    if (args.check_cmd_line_flag("execution_mode")) {
+    if (args.check_cmd_line_flag("execution-mode")) {
       std::string str;
-      args.get_cmd_line_argument("execution_mode", str);
+      args.get_cmd_line_argument("execution-mode", str);
       execution_mode = ExecutionMode::from_string(str);
     }
 
-    if (args.check_cmd_line_flag("save_workspace")) {
+    if (args.check_cmd_line_flag("save-workspace")) {
       std::string str;
-      args.get_cmd_line_argument("save_workspace", str);
+      args.get_cmd_line_argument("save-workspace", str);
+      save_workspace_mode = WorkspaceSaveMode::from_string(str);
+    }
+
+    if (args.check_cmd_line_flag("execution-mode")) {
+      std::string str;
+      args.get_cmd_line_argument("execution-mode", str);
+      execution_mode = ExecutionMode::from_string(str);
+    }
+
+    if (args.check_cmd_line_flag("save-workspace")) {
+      std::string str;
+      args.get_cmd_line_argument("save-workspace", str);
       save_workspace_mode = WorkspaceSaveMode::from_string(str);
     }
 
@@ -474,13 +462,50 @@ struct TestbenchOptions {
     if (args.check_cmd_line_flag("kernels")) {
       args.get_cmd_line_arguments("kernels", kernels, ',');
     } else {
-      char const *gemms[] = {"sgemm", "dgemm", "hgemm", "igemm", "wmma_gemm", 0};
+      char const *gemms[] = {
+        "sgemm",
+        "dgemm",
+        "hgemm",
+        "igemm",
+        "wmma_gemm",
+        "wmma_gemm_f16",
+        "wmma_binary_gemm",
+        "wmma_integer_gemm",
+        0
+      };
       char const *layouts[] = {"nn", "nt", "tn", "tt", 0};
       for (int i = 0; gemms[i]; ++i) {
         for (int j = 0; layouts[j]; ++j) {
+          if ((std::string(gemms[i]).compare("wmma_binary_gemm") == 0 ||
+               std::string(gemms[i]).compare("wmma_integer_gemm") == 0)
+               && std::string(layouts[j]).compare("tn") != 0) {
+            continue;
+          }
           kernels.push_back(std::string(gemms[i]) + "_" + layouts[j]);
         }
       }
+
+    }
+  }
+
+  void configure_cuda_device(cutlass::CommandLine const &args) {
+    int device_id = 0;
+    args.get_cmd_line_argument("device", device_id, 0);
+
+    cudaError_t result;
+    result = cudaGetDeviceProperties(&device_properties, device_id);
+    if (result != cudaSuccess) {
+      throw std::runtime_error("cudaGetDeviceProperties() failed for given device.");
+    }
+    result = cudaSetDevice(device_id);
+    if (result != cudaSuccess) {
+      throw std::runtime_error("cudaSetDevice() failed for given device.");
+    }
+
+    // Get the clock rate (specified in cmd line in MHz)
+    if (args.check_cmd_line_flag("clock")) {
+      args.get_cmd_line_argument("clock", device_properties.clockRate);
+      device_properties.clockRate *= 1000;
     }
   }
 
@@ -501,15 +526,31 @@ struct TestbenchOptions {
   /// be saved to the file system.
   bool save_workspace(bool correct) const {
     if (save_workspace_mode == WorkspaceSaveMode::Always ||
-      (save_workspace_mode == WorkspaceSaveMode::Incorrect && !correct)) {
+        (save_workspace_mode == WorkspaceSaveMode::Incorrect && !correct)) {
       return true;
     }
     return false;
   }
 
+  /// Returns true if the selected device can satisfy the given compute capability
+  bool compute_capability(int major, int minor) const {
+    return (device_properties.major > major ||
+      (device_properties.major == major && device_properties.minor >= minor));
+  }
+
+  /// Requires an exact match of compute capability
+  bool compute_capability_exact(int major, int minor) const {
+    return major == device_properties.major && minor == device_properties.minor;
+  }
+
+  /// Prints version
+  static void version(std::ostream &out) {
+    out << "CUTLASS " << CUTLASS_MAJOR << "." << CUTLASS_MINOR << "." << CUTLASS_PATCH
+        << " built on " << __DATE__ << " at " << __TIME__;
+  }
+
   /// Prints the usage statement
   static void usage(std::ostream &out) {
-
     out << "cutlass_perf_test [options]\n\n"
 
         << "  --help\n"
@@ -523,15 +564,27 @@ struct TestbenchOptions {
         << "  --beta=<beta>                                 "
         << "    Value for beta to be used in GEMM experiments\n"
 
-        << "  --dist_{A,B,C}=<distribution>                 "
+        << "  --device=<int>                                "
+        << "    Specifies the CUDA device to use. Default is device 0.\n"
+
+        << "  --clock=<MHz>                                 "
+        << "    Specifies the SM clock rate in MHz.\n"
+
+        << "  --dist-{A,B,C}=<distribution>                 "
         << "    Describes the random distribution of each of the input matrix operands.\n"
 
-        << "  --execution_mode=<mode>                       "
+        << "  --dry-run=<bool>                              "
+        << "    If true, kernels are not executed and sleep is not inserted.\n"
+
+        << "  --execution-mode=<mode>                       "
         << "    Specifies execution mode: profile, verify, single\n"
 
         << "  --output=<filename.csv>                       "
         << "    Writes summary of profiling to specified .csv file\n"
 
+        << "  --threshold=<filename.csv>                    "
+        << "    Reads previous output summary and re-executes the same configurations.\n"
+
         << "  --iterations=<timing iterations>              "
         << "    maximum number of iterations to execute when profiling\n"
 
@@ -546,14 +599,19 @@ struct TestbenchOptions {
         << "  --k=<depth>[:max depth[:step]]                "
         << "    Size of inner dimension of A and B. May specify a range with optional step size.\n"
 
-        << "  --kernels={s|d|h|i|wmma_}gemm_{nn,nt,tn,tt}   "
+        << "  --kernels=<{s|d|h|i|wmma_|wmma_binary_|wmma_integer_}gemm_{nn,nt,tn,tt}>\n"
+        << "                                                "
         << "    Select GEMM datatype and layout to use for tests\n"
 
         << "  --peak=<bool>                                 "
         << "    If true, only reports peak performance per kernel after profiling specified "
            "problem space.\n"
 
-        << "  --save_workspace={*never,incorrect,always}    "
+        << "  --perf-margin=<perf-margin>                   "
+        << "    Allowable performance degradation before flagging test as failure (e.g. 3% slowdown"
+           " = 0.97).\n"
+
+        << "  --save-workspace={*never,incorrect,always}    "
         << "    Specifies when to save the GEMM inputs and results to the filesystem.\n"
 
         << "  --seed=<seed>                                 "
@@ -563,8 +621,17 @@ struct TestbenchOptions {
         << "    Inserts leading columns in output table and uniform values for each column. Useful "
            "for generating pivot tables.\n"
 
-        << "\n\n"
+        << "  --sleep-time=<second>                         "
+        << "    Sleep period between profiling kernels to cool down the device.\n"
 
+        << "  --version                                     "
+        << "    ";
+
+    version(out);
+
+    out << "\n\n";
+
+    out << "\n\n"
         << "Example usage:\n\n"
 
         << "# Runs one problem size for all kernels\n"
diff --git a/tools/test/perf/testbench_output.h b/tools/test/perf/testbench_output.h
index 5c0cb28b3..297f02f89 100644
--- a/tools/test/perf/testbench_output.h
+++ b/tools/test/perf/testbench_output.h
@@ -27,15 +27,16 @@
 
 #include <fstream>
 
-#include <tools/test/perf/performance_result.h>
-#include <tools/test/perf/testbench_options.h>
-#include <tools/util/command_line.h>
+#include "tools/test/perf/performance_result.h"
+#include "tools/test/perf/testbench_options.h"
+#include "tools/util/command_line.h"
 
 namespace perf {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 /// Wraps an output stream and constructs a comma-separated value table of results
+template <typename Problem>
 class TestbenchOutput {
  public:
   /// Options to test environment
@@ -51,7 +52,7 @@ class TestbenchOutput {
   bool buffer_csv_output;
 
   /// Vector holding performance results
-  std::vector<PerformanceResult> buffered_perf_results;
+  std::vector<PerformanceResult<Problem> > buffered_perf_results;
 
  private:
   /// Opens the output file and updates output_ptr
@@ -74,11 +75,11 @@ class TestbenchOutput {
     // pivot tags
     for (KeyValueIterator tag_it = options.pivot_tags.begin(); tag_it != options.pivot_tags.end();
          ++tag_it) {
-      ss << tag_it->first << ", ";
+      ss << tag_it->first << ",";
     }
 
     // performance result header
-    ss << PerformanceResult::header();
+    ss << PerformanceResult<Problem>::header();
 
     return ss.str();
   }
@@ -95,14 +96,23 @@ class TestbenchOutput {
 
   /// Writes output to CSV
   ~TestbenchOutput() {
-    std::cout << std::endl;
-    if (buffer_csv_output) {
-      out() << "\n\n" << header() << std::endl;
-      for (std::vector<PerformanceResult>::const_iterator it = buffered_perf_results.begin();
-           it != buffered_perf_results.end();
-           ++it) {
-        write_csv(*it);
+    if (buffered_perf_results.size() != 0) {
+      std::cout << std::endl;
+      if (buffer_csv_output) {
+        out() << "\n\n" << header() << std::endl;
+        for (typename std::vector<PerformanceResult<Problem> >::const_iterator it =
+                 buffered_perf_results.begin();
+             it != buffered_perf_results.end();
+             ++it) {
+          write_csv(*it);
+        }
       }
+        std::cout << "\n[\033[1;32mPASSED\033[0m]";
+        if (!options.threshold_filename.empty()) {
+          std::cout << " - Performance Test Successful" << std::endl;
+        } else {
+          std::cout << std::endl;
+        }
     }
   }
 
@@ -122,11 +132,11 @@ class TestbenchOutput {
   }
 
   /// Writes a performance result to CSV output
-  TestbenchOutput &write_csv(PerformanceResult const &result) {
+  TestbenchOutput &write_csv(PerformanceResult<Problem> const &result) {
     // pivot tags
     for (KeyValueIterator tag_it = options.pivot_tags.begin(); tag_it != options.pivot_tags.end();
          ++tag_it) {
-      out() << tag_it->second << ", ";
+      out() << tag_it->second << ",";
     }
 
     out() << result << std::endl;
@@ -134,24 +144,26 @@ class TestbenchOutput {
   }
 
   /// Prints the output without appending it for CSV writing
-  TestbenchOutput &pretty_print(PerformanceResult const &result) {
+  TestbenchOutput &pretty_print(PerformanceResult<Problem> const &result) {
     result.pretty_print(std::cout) << std::endl;
 
     return *this;
   }
 
   /// Emits the result as output
-  TestbenchOutput &append(PerformanceResult const &result) {
+  TestbenchOutput &append(PerformanceResult<Problem> const &result) {
     if (buffer_csv_output) {
       buffered_perf_results.push_back(result);
     } else {
       write_csv(result);
+      buffered_perf_results.push_back(result);
     }
 
     pretty_print(result);
 
     return *this;
   }
+
 };
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/CMakeLists.txt b/tools/test/unit/CMakeLists.txt
index 93d0290ec..36f92ecf5 100644
--- a/tools/test/unit/CMakeLists.txt
+++ b/tools/test/unit/CMakeLists.txt
@@ -37,14 +37,23 @@ link_libraries(
 set(CUTLASS_UNIT_TEST_HEADERS
   cutlass_unit_test.h
   core/layout_verification.h
+  gemm/run_gemm.h
+  gemm/gemm_testbed.h
 )
 
 set(CUTLASS_UNIT_TEST_SOURCES
   cutlass_unit_test.cpp
+  core/tensor_ref.cu
+  core/tensor_view.cu
+  util/unique_ptr.cu
   util/host_tensor.cu
+  util/complex.cu
+  util/tensor_foreach.cu
+  util/tensor_elementwise.cu
   core/layout_verification.cu
   core/predicate_vector.cu
   core/tile_iterator.cu
+  core/zip_tile_iterator.cu
   gemm/dgemm.cu
   gemm/hgemm_128x128x8.cu
   gemm/hgemm_128x128x16.cu
@@ -68,7 +77,19 @@ set(CUTLASS_UNIT_TEST_SOURCES
   gemm/sgemm_64x64x16.cu
   gemm/sgemm_64x32x8.cu
   gemm/sgemm_64x32x16.cu
+  gemm/fp16_sgemm_fp32_128x128x16.cu
+  gemm/fp16_sgemm_fp16_128x128x16.cu
   gemm/wmma_gemm.cu
+  gemm/wmma_binary_gemm.cu
+  gemm/wmma_integer_gemm.cu
+  gemm/sgemm_threadblock_swizzle_nn.cu
+  gemm/sgemm_threadblock_swizzle_nt.cu
+  gemm/sgemm_threadblock_swizzle_tn.cu
+  gemm/sgemm_threadblock_swizzle_tt.cu
+  gemm/batched_strided_sgemm_128x128x8.cu
+  gemm/batched_strided_dgemm_128x128x8.cu
+  gemm/batched_strided_hgemm_128x128x8.cu
+  gemm/epilogue_functor.cu
 )
 
 if (CUTLASS_NVRTC_ENABLE)
@@ -101,4 +122,6 @@ if (CUTLASS_NVRTC_ENABLE)
   endif()
 endif()
 
-CUDA_ADD_CUBLAS_TO_TARGET(cutlass_unit_test)
+target_link_libraries(cutlass_unit_test ${CUBLAS_LIBRARY})
+
+
diff --git a/tools/test/unit/core/layout_verification.cu b/tools/test/unit/core/layout_verification.cu
index 523967c3d..c043ced09 100644
--- a/tools/test/unit/core/layout_verification.cu
+++ b/tools/test/unit/core/layout_verification.cu
@@ -22,9 +22,9 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
+#include "cutlass_unit_test.h"
 #include <algorithm>
-#include <tools/test/unit/core/layout_verification.h>
+#include "tools/test/unit/core/layout_verification.h"
 
 
 namespace test {
diff --git a/tools/test/unit/core/layout_verification.h b/tools/test/unit/core/layout_verification.h
index 42306edb0..a0716131d 100644
--- a/tools/test/unit/core/layout_verification.h
+++ b/tools/test/unit/core/layout_verification.h
@@ -29,12 +29,12 @@
 #include <iostream>
 #include <vector>
 
-#include <cutlass/tensor_view.h>
+#include "cutlass/tensor_view.h"
 
-#include <tools/util/half.h>
-#include <tools/util/host_tensor_view.h>
-#include <tools/util/tensor_view_io.h>
-#include <tools/util/type_traits.h>
+#include "tools/util/half.h"
+#include "tools/util/host_tensor_view.h"
+#include "tools/util/tensor_view_io.h"
+#include "tools/util/type_traits.h"
 
 namespace test {
 
@@ -275,6 +275,8 @@ class VerifyLayout {
     for (int index = 0; index < count; ++index) {
       SourceBits element = hash(layout(index));
 
+      // std::cout << "  " << index << ": 0x" << std::hex << element << std::dec << std::endl;
+
       data[index] = element;
     }
   }
diff --git a/tools/test/unit/core/predicate_vector.cu b/tools/test/unit/core/predicate_vector.cu
index d873cc3cf..6e0b00ced 100644
--- a/tools/test/unit/core/predicate_vector.cu
+++ b/tools/test/unit/core/predicate_vector.cu
@@ -26,9 +26,9 @@
 #include <cublas_v2.h>
 #include <cstring>
 
-#include <cutlass_unit_test.h>
-#include <cutlass/predicate_vector.h>
-#include <tools/util/host_tensor.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/predicate_vector.h"
+#include "tools/util/host_tensor.h"
 
 namespace test {
 
@@ -118,3 +118,126 @@ TEST(PredicateVector, Basic) {
     }
   }
 }
+
+TEST(PredicateVector, Count) {
+
+  {
+    typedef cutlass::PredicateVector<4, 8> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<4, 8> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<4, 4> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<4, 4> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<4, 2> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<4, 2> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<4, 1> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<4, 1> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<8, 8> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<8, 8> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<8, 4> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<8, 4> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<8, 2> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<8, 2> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<8, 1> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 2)
+      << "PredicateVector<8, 1> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<16, 8> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<16, 8> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<16, 4> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<16, 4> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<16, 2> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 2)
+      << "PredicateVector<16, 2> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<16, 1> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 4)
+      << "PredicateVector<16, 1> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<32, 8> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 1)
+      << "PredicateVector<32, 8> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<32, 4> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 2)
+      << "PredicateVector<32, 4> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<32, 2> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 4)
+      << "PredicateVector<32, 2> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<32, 1> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 8)
+      << "PredicateVector<32, 1> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<64, 8> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 2)
+      << "PredicateVector<64, 8> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<64, 4> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 4)
+      << "PredicateVector<64, 4> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<64, 2> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 8)
+      << "PredicateVector<64, 2> word count: " << PredicateVector::kWordCount;
+  }
+
+  {
+    typedef cutlass::PredicateVector<64, 1> PredicateVector;
+    EXPECT_EQ(int(PredicateVector::kWordCount), 16)
+      << "PredicateVector<64, 1> word count: " << PredicateVector::kWordCount;
+  }
+}
diff --git a/tools/test/unit/core/tensor_ref.cu b/tools/test/unit/core/tensor_ref.cu
new file mode 100644
index 000000000..ee16f92f1
--- /dev/null
+++ b/tools/test/unit/core/tensor_ref.cu
@@ -0,0 +1,220 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+
+#include "cutlass/tensor_ref.h"
+#include "cutlass/matrix_traits.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorRef, basic_rank2) {
+  int const M = 8;
+  int const N = 16;
+  
+  int matrix_data[M * N] = {0};
+
+  cutlass::TensorRef<int, 2> matrix_ref(matrix_data, cutlass::make_Coord(N, 1));
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; ++n) {
+      matrix_ref.at(cutlass::make_Coord(m, n)) = m * N + n;
+    }
+  }
+
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; ++n) {
+      EXPECT_EQ(matrix_data[m * N + n], int(m * N + n));
+    }
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorRef, rank2_column_major) {
+  int const M = 8;
+  int const N = 8;
+  
+  int matrix_data[M * N];
+
+  cutlass::TensorRef<int, 2, cutlass::MatrixLayout::ColumnMajor> ref(matrix_data, M); 
+
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; ++n) {
+      ref.at(cutlass::make_Coord(m, n)) = m * N + n;
+    }
+  }
+
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; ++n) {
+      EXPECT_EQ(matrix_data[m + n * M], int(m * N + n));
+    }
+  }
+}
+
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorRef, rank2_row_major) {
+  int const M = 8;
+  int const N = 16;
+  
+  int matrix_data[M * N] = { 0 };
+
+  cutlass::TensorRef<int, 2, cutlass::MatrixLayout::RowMajor> ref(matrix_data, N); 
+
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; ++n) {
+      ref.at(cutlass::make_Coord(m, n)) = m * N + n;
+    }
+  }
+
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; ++n) {
+      EXPECT_EQ(matrix_data[m * N + n], int(m * N + n));
+    }
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorRef, rank2_contiguous_dynamic) {
+  int const M = 8;
+  int const N = 16;
+  
+  typedef cutlass::TensorRef<int, 2, cutlass::MatrixLayout::ContiguousLayout> ContiguousTensorRef;
+
+  cutlass::MatrixLayout::Kind layouts[] = {
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor
+  };
+
+  for (int i = 0; i < 2; ++i) {
+
+    int matrix_data[M * N] = { 0 };
+
+    int ldm;
+    int row_stride;
+    int col_stride;
+
+    if (layouts[i] == cutlass::MatrixLayout::kColumnMajor) {
+      row_stride = 1;
+      col_stride = M;
+      ldm = col_stride;
+    }
+    else {
+      row_stride = N;
+      col_stride = 1;
+      ldm = row_stride;
+    } 
+
+    // Use helper to determine stride vector from leading dimension
+    ContiguousTensorRef ref(
+      matrix_data, 
+      cutlass::MatrixLayout::ContiguousLayout::stride(layouts[i], ldm));
+
+    for (int m = 0; m < M; ++m) {
+      for (int n = 0; n < N; ++n) {
+        ref.at(cutlass::make_Coord(m, n)) = m * N + n;
+      }
+    }
+
+    for (int m = 0; m < M; ++m) {
+      for (int n = 0; n < N; ++n) {
+        EXPECT_EQ(matrix_data[m * row_stride + n * col_stride], int(m * N + n));
+      }
+    }
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorRef, rank2_column_major_interleaved) {
+  int const M = 16;
+  int const N = 16;
+  int const kInterleave = 4;
+
+  int matrix_data[M * N] = {0};
+
+  // Define the TensorRefMapFunc for a column-major interleaved matrix format
+  typedef cutlass::MatrixLayout::ColumnMajorInterleaved<kInterleave> TensorRefMapFunc;
+
+  // Construct a TensorRef
+  cutlass::TensorRef<
+    int, 
+    2, 
+    TensorRefMapFunc> ref(matrix_data, TensorRefMapFunc::stride(M)); 
+
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; ++n) {
+      ref.at(cutlass::make_Coord(m, n)) = m + n * M;
+    }
+  }
+
+  // Verify
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; n += kInterleave) {
+      for (int i = 0; i < kInterleave; ++i) {
+        EXPECT_EQ(matrix_data[m * kInterleave + n * M + i], int(m + (n + i) * M));
+      }
+    }
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorRef, rank2_row_major_interleaved) {
+  int const M = 16;
+  int const N = 16;
+  int const kInterleave = 4;
+
+  int matrix_data[M * N] = {0};
+
+  // Define the TensorRefMapFunc for a row-major interleaved matrix format
+  typedef cutlass::MatrixLayout::RowMajorInterleaved<kInterleave> TensorRefMapFunc;
+
+  // Construct a TensorRef
+  cutlass::TensorRef<
+    int, 
+    2, 
+    TensorRefMapFunc> ref(matrix_data, TensorRefMapFunc::stride(N)); 
+
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; ++n) {
+      ref.at(cutlass::make_Coord(m, n)) = m + n * M;
+    }
+  }
+
+  // Verify
+  for (int m = 0; m < M; m += kInterleave) {
+    for (int n = 0; n < N; ++n) {
+      for (int i = 0; i < kInterleave; ++i) {
+        EXPECT_EQ(matrix_data[m * N + i + n * kInterleave], int((m + i) + n * M));
+      }
+    }
+  }
+}
+
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
diff --git a/tools/test/unit/core/tensor_view.cu b/tools/test/unit/core/tensor_view.cu
new file mode 100644
index 000000000..8090f468d
--- /dev/null
+++ b/tools/test/unit/core/tensor_view.cu
@@ -0,0 +1,235 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+
+#include "cutlass/tensor_view.h"
+#include "cutlass/matrix_traits.h"
+
+#include "tools/util/tensor_view_io.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorView, rank2_contiguous_dynamic) {
+  int const M = 8;
+  int const N = 16;
+  
+  typedef cutlass::TensorView<int, 2, cutlass::MatrixLayout::ContiguousLayout> ContiguousTensorView;
+
+  cutlass::MatrixLayout::Kind layouts[] = {
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor
+  };
+
+  cutlass::Coord<2> bounds = cutlass::make_Coord(M - 2, N - 2);
+
+  for (int i = 0; i < 2; ++i) {
+
+    int matrix_data[M * N] = { 0 };
+
+    int ldm;
+    int row_stride;
+    int col_stride;
+
+    if (layouts[i] == cutlass::MatrixLayout::kColumnMajor) {
+      row_stride = 1;
+      col_stride = M;
+      ldm = col_stride;
+    }
+    else {
+      row_stride = N;
+      col_stride = 1;
+      ldm = row_stride;
+    } 
+
+    // Use helper to determine stride vector from leading dimension
+    ContiguousTensorView view(
+      matrix_data, 
+      cutlass::MatrixLayout::ContiguousLayout::stride(layouts[i], ldm),
+      bounds);
+
+    ASSERT_TRUE(view.good());
+
+    for (int m = 0; m < M; ++m) {
+      for (int n = 0; n < N; ++n) {
+        cutlass::Coord<2> coord = cutlass::make_Coord(m, n);
+        if (view.contains(coord)) {
+          view.at(coord) = m * N + n;
+        }
+      }
+    }
+
+    for (int m = 0; m < M; ++m) {
+      for (int n = 0; n < N; ++n) {
+        int expected = 0;
+        if (m < bounds[0] && n < bounds[1]) {
+          expected = int(m * N + n);
+        }
+        EXPECT_EQ(matrix_data[m * row_stride + n * col_stride], expected);
+      }
+    }
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// Uncomment the following line to observe output from printing TensorView objects
+//
+
+// #define OBSERVE_TENSORVIEW_IO   // uncomment to enable printing
+
+#ifdef OBSERVE_TENSORVIEW_IO
+
+// This test construct a TensorView of rank=2 with matrix layouts known at runtime. This
+// uses TensorRefMapFunc classes defined in cutlass/matrix_traits.h to define the mapping
+// from logical tensor indices to storage in memory.
+//
+// Helpers in tools/util/tensor_view_io.h print both the logical TensorView and the
+// linear memory of the tensor.
+TEST(TensorView, contiguous) {
+  
+  int const M = 8;
+  int const N = 16;
+  
+  typedef cutlass::TensorView<
+    int32_t, 
+    2, 
+    cutlass::MatrixLayout::ContiguousLayout> ContiguousTensorView;
+
+  cutlass::MatrixLayout::Kind layouts[] = {
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor
+  };
+
+  cutlass::Coord<2> bounds = cutlass::make_Coord(M, N);
+
+  for (int i = 0; i < 2; ++i) {
+
+    int matrix_data[M * N] = { 0 };
+
+    int ldm;
+    int row_stride;
+    int col_stride;
+
+    if (layouts[i] == cutlass::MatrixLayout::kColumnMajor) {
+      row_stride = 1;
+      col_stride = M;
+      ldm = col_stride;
+    }
+    else {
+      row_stride = N;
+      col_stride = 1;
+      ldm = row_stride;
+    } 
+
+    // Use helper to determine stride vector from leading dimension
+    ContiguousTensorView view(
+      matrix_data, 
+      cutlass::MatrixLayout::ContiguousLayout::stride(layouts[i], ldm),
+      bounds);
+
+    for (int m = 0; m < M; ++m) {
+      for (int n = 0; n < N; ++n) {
+        cutlass::Coord<2> coord = cutlass::make_Coord(m, n);
+        if (view.contains(coord)) {
+          view.at(coord) = m * N + n;
+        }
+      }
+    }
+
+    std::cout << "---------\n";
+    std::cout << (layouts[i] == cutlass::MatrixLayout::kColumnMajor ? 
+      "Column-major:" : "Row-major:") << "\n\n";
+
+    std::cout << "Logical view:\n";
+    std::cout.width(4);
+    std::cout << view << "\n" << std::endl;   // Print TensorView object.
+
+    std::cout << "Linear memory:";
+    for (int idx = 0; idx < view.capacity(); ++idx) {
+      if (!(idx % (layouts[i] == cutlass::MatrixLayout::kColumnMajor ? M : N))) {
+        std::cout << std::endl;
+      }
+      std::cout << std::setw(4) << view.at(idx) << " ";
+    }
+
+    std::cout << "\n" << std::endl;
+  }
+}
+
+// This test is similar to the previous except it uses a column-major, interleaved data
+// layout. The test prints both the logical representation (a typical column-major matrix)
+// and a representation of linear memory.
+//
+// Note, the interleave=4 structure implies that every four consecutive elements in the
+// same row shall be adjacent in memory followed by the next row.
+TEST(TensorView, rank2_column_major_interleaved) {
+  int const M = 16;
+  int const N = 16;
+  int const kInterleave = 4;
+
+  int matrix_data[M * N] = {0};
+
+  cutlass::Coord<2> bounds = cutlass::make_Coord(M, N);
+
+  // Define the TensorRefMapFunc for a column-major interleaved matrix format
+  typedef cutlass::MatrixLayout::ColumnMajorInterleaved<kInterleave> TensorRefMapFunc;
+
+  // Define a TensorView of rank=2 using the column-major interleaved mapping function
+  typedef cutlass::TensorView<
+    int, 
+    2, 
+    TensorRefMapFunc> InterleavedTensorView;
+
+  InterleavedTensorView view(
+    matrix_data, 
+    TensorRefMapFunc::stride(M), 
+    bounds); 
+
+  // Initialize
+  for (int m = 0; m < M; ++m) {
+    for (int n = 0; n < N; ++n) {
+      view.at(cutlass::make_Coord(m, n)) = m + n * M;
+    }
+  }
+
+  // Print logical view
+  std::cout << "Column-major, interleave=" << kInterleave << " (logical view):\n";
+
+  std::cout << std::setw(4) << view << "\n" << std::endl;
+
+  // Now define a linear view of the same data in memory
+  typedef cutlass::TensorView<int, 2, cutlass::MatrixLayout::RowMajor> LinearTensorView;
+
+  LinearTensorView linear_view(matrix_data, cutlass::make_Coord(N), bounds);
+
+  std::cout << "Linear view in memory:\n";
+  std::cout << std::setw(4) << linear_view << std::endl;
+}
+
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+
diff --git a/tools/test/unit/core/tile_iterator.cu b/tools/test/unit/core/tile_iterator.cu
index 144e4393f..c7f959812 100644
--- a/tools/test/unit/core/tile_iterator.cu
+++ b/tools/test/unit/core/tile_iterator.cu
@@ -3,14 +3,14 @@
  *
  * Redistribution and use in source and binary forms, with or without modification, are permitted
  * provided that the following conditions are met:
- *   * Redistributions of source code must retain the above copyright notice, this list of
- *     conditions and the following disclaimer.
- *   * Redistributions in binary form must reproduce the above copyright notice, this list of
- *     conditions and the following disclaimer in the documentation and/or other materials
- *     provided with the distribution.
- *   * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
- *     to endorse or promote products derived from this software without specific prior written
- *     permission.
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
  *
  * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
  * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
@@ -22,29 +22,37 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <tools/util/host_tensor.h>
-#include <tools/util/tensor_view_io.h>
-#include <cutlass/shape.h>
-#include <cutlass/predicate_vector.h>
-#include <cutlass/tile_iterator.h>
-#include <cutlass/tile_traits_standard.h>
-#include <cutlass/iterator_access.h>
+#include "cutlass_unit_test.h"
+#include "tools/util/host_matrix.h"
+#include "tools/util/tensor_view_io.h"
+#include "cutlass/shape.h"
+#include "cutlass/predicate_vector.h"
+#include "cutlass/tile_iterator.h"
+#include "cutlass/tile_traits_standard.h"
+#include "cutlass/iterator_access.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 namespace test {
 
-  template <typename Traits, typename Scalar>
-  __global__ void load_store_global(
-        typename cutlass::TileLoadIterator<Traits, Scalar, cutlass::IteratorAdvance::kH,
-        cutlass::MemorySpace::kGlobal>::Scalar const *input,
-        typename cutlass::TileStoreIterator<Traits, Scalar, cutlass::IteratorAdvance::kH,
-        cutlass::MemorySpace::kGlobal>::Scalar *output
-      ) {
+template <typename Traits, typename Scalar>
+__global__ void load_store_global(
+            typename cutlass::TileLoadIterator<Traits, Scalar, cutlass::IteratorAdvance::kH,
+            cutlass::MemorySpace::kGlobal>::Scalar const *input,
+            typename cutlass::TileStoreIterator<Traits, Scalar, cutlass::IteratorAdvance::kH,
+            cutlass::MemorySpace::kGlobal>::Scalar *output,
+            int kW,
+            int kH,
+            typename cutlass::TileStoreIterator<Traits, Scalar, cutlass::IteratorAdvance::kH,
+            cutlass::MemorySpace::kGlobal>::Scalar identity = 0
+        ) {
 
+    /// Load iterator
     typedef cutlass::TileLoadIterator<Traits, Scalar, cutlass::IteratorAdvance::kH, cutlass::MemorySpace::kGlobal> LoadIterator;
+    /// Store iterator
     typedef cutlass::TileStoreIterator<Traits, Scalar, cutlass::IteratorAdvance::kH, cutlass::MemorySpace::kGlobal> StoreIterator;
+    /// Predicate vector
+    typedef typename LoadIterator::PredicateVector PredicateVector;
 
     typename LoadIterator::Params load_params;
     typename StoreIterator::Params store_params;
@@ -56,98 +64,144 @@ namespace test {
 
     LoadIterator load_iterator(load_params);
     StoreIterator store_iterator(store_params);
+    PredicateVector predicates;
+
+    load_iterator.initialize_predicates(predicates.begin(), cutlass::make_Coord(1, kH, kW));
 
     typename LoadIterator::Fragment fragment;
 
-    load_iterator.load(fragment);
-    store_iterator.store(fragment);
+    load_iterator.load_post_increment(fragment, predicates.begin());
+    store_iterator.store_post_increment(fragment);
+}
+
+/// Launches the load_store_global test
+template <typename Scalar, typename Tile, int kThreadsPerThreadBlock>
+void run_load_store_global(int kW, int kH) {
+
+  typedef cutlass::TileTraitsStandard<Tile, kThreadsPerThreadBlock> Traits;
+
+  typedef typename cutlass::TypeTraits<Scalar>::device_type ScalarDevice;
+
+  cutlass::HostMatrix<Scalar> input;
+  cutlass::HostMatrix<Scalar> output;
+
+  input.resize(cutlass::make_Coord(Tile::kW, Tile::kH), cutlass::MatrixLayout::kColumnMajor);
+  output.resize(cutlass::make_Coord(Tile::kW, Tile::kH), cutlass::MatrixLayout::kColumnMajor);
+
+  input.fill_linear(cutlass::make_Coord(1, Tile::kW));
+  output.fill(0);
+
+  test::load_store_global<Traits, ScalarDevice> <<<
+      dim3(1, 1, 1),
+      dim3(kThreadsPerThreadBlock, 1)
+    >>>(input.device_data(), output.device_data(), kW, kH);
+
+  cudaError_t result = cudaDeviceSynchronize();
+
+  ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
+                               << "\n";
+  output.sync_host();
+
+  bool passed = true;
+  for(int i = 0; i < Tile::kW; ++i) {
+    for(int j = 0; j < Tile::kH; ++j) {
+      if(i < kW && j < kH && output.at(cutlass::make_Coord(i, j)) != Scalar(Tile::kW*j+i)){
+        std::cout << "FAILED: (" << i << ", " << j
+                  << ") -- expected: " << (Tile::kW*j+i)
+                  << ", actual: " << output.at(cutlass::make_Coord(i, j))
+                  << std::endl;
+        passed = false;
+        break;
+      }
+    }
   }
 
+  EXPECT_TRUE(passed);
+}
+
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(TileIterator, tile_128x8_contiguous) {
-
-  static int const M = 128;
-  static int const N = 1;
-  static int const K = 8;
-
-  static int const kThreads = M;
-
-  typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-  typedef cutlass::TileTraitsStandard<cutlass::Shape<N, K, M>, kThreads> Traits;
-
-  cutlass::HostTensor<float> input;
-  cutlass::HostTensor<float> output;
-
-  input.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-      cutlass::MatrixLayout::kColumnMajor);
-
-  output.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-      cutlass::MatrixLayout::kColumnMajor);
-
-  input.fill_linear(cutlass::make_Coord(1, 1, ThreadBlockTile::kW, 1));
-  output.fill(0);
-
-  test::load_store_global< Traits, float ><<<
-    dim3(1,1,1),
-    dim3(kThreads, 1)
-  >>>(
-    input.device_data(),
-    output.device_data()
-  );
-
-  cudaError_t result = cudaDeviceSynchronize();
-  ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                 << "\n";
-  output.sync_host();
-
-  EXPECT_TRUE(input.bit_equals(output));
-
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 128>(128, 8);
 }
+
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(TileIterator, tile_128x8_rake) {
-
-  static int const M = 128;
-  static int const N = 1;
-  static int const K = 8;
-
-  static int const kThreads = 32;
-
-  typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-  typedef cutlass::TileTraitsStandard<cutlass::Shape<N, K, M>, kThreads> Traits;
-
-  cutlass::HostTensor<float> input;
-  cutlass::HostTensor<float> output;
-
-  input.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-      cutlass::MatrixLayout::kColumnMajor);
-
-  output.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-      cutlass::MatrixLayout::kColumnMajor);
-
-  input.fill_linear(cutlass::make_Coord(1, 1, ThreadBlockTile::kW, 1));
-  output.fill(0);
-
-  test::load_store_global< Traits, float ><<<
-    dim3(1,1,1),
-    dim3(kThreads, 1)
-  >>>(
-    input.device_data(),
-    output.device_data()
-  );
-
-  cudaError_t result = cudaDeviceSynchronize();
-  ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                 << "\n";
-
-  output.sync_host();
-
-  EXPECT_TRUE(input.bit_equals(output));
-
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 32>(128, 8);
 }
+
 ////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_127x8_contiguous) {
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 128>(127, 8);
 }
 
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_129x8_contiguous) {
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 128>(129, 8);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_112x8_contiguous) {
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 128>(112, 8);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_67x8_contiguous) {
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 128>(67, 8);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_113x7_contiguous) {
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 128>(113, 7);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_113x10_contiguous) {
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 128>(113, 10);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_131x7_contiguous) {
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 128>(131, 7);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_131x9_contiguous) {
+    run_load_store_global<float, cutlass::Shape<1, 8, 128>, 128>(131, 9);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+// Half
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_128x8_contiguous_f16) {
+    run_load_store_global<cutlass::half_t, cutlass::Shape<1, 8, 128>, 128>(128, 8);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+// Double
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_128x8_contiguous_f64) {
+    run_load_store_global<double, cutlass::Shape<1, 8, 128>, 128>(128, 8);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+// Int
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TileIterator, tile_128x8_contiguous_s32) {
+    run_load_store_global<int, cutlass::Shape<1, 8, 128>, 128>(128, 8);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+} // namespace test
diff --git a/tools/test/unit/core/zip_tile_iterator.cu b/tools/test/unit/core/zip_tile_iterator.cu
new file mode 100644
index 000000000..2117e012d
--- /dev/null
+++ b/tools/test/unit/core/zip_tile_iterator.cu
@@ -0,0 +1,173 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "tools/util/host_matrix.h"
+#include "tools/util/tensor_view_io.h"
+#include "cutlass/shape.h"
+#include "cutlass/predicate_vector.h"
+#include "cutlass/tile_iterator.h"
+#include "cutlass/tile_traits_standard.h"
+
+#include "cutlass/zip_tile_iterator.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace test {
+
+/// Kernel which can use tile iterators and zip iterators
+template <typename LoadIterator, typename StoreIterator>
+__global__ void zip_iterator_kernel(
+  typename LoadIterator::Params load_params,
+  typename StoreIterator::Params store_params) {
+
+  LoadIterator load_iterator(load_params);
+  StoreIterator store_iterator(store_params);
+
+  typename LoadIterator::Fragment fragment;
+
+  load_iterator.load_post_increment(fragment);
+  store_iterator.store_post_increment(fragment);
+}
+
+} // namespace test
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Test framework
+template <typename Scalar, typename Shape>
+struct ZipIteratorTest {
+
+  //
+  // Type definitions
+  //
+
+  static int const kThreadCount = 128;
+
+  typedef cutlass::TileTraitsStandard<Shape, kThreadCount> TileTraits;
+
+  typedef cutlass::TileLoadIterator<TileTraits, Scalar> ScalarLoadIterator;
+  typedef cutlass::TileStoreIterator<TileTraits, Scalar> ScalarStoreIterator;
+
+  typedef cutlass::ZipTileIterator<ScalarLoadIterator, ScalarLoadIterator> ZipLoadIterator;
+  typedef cutlass::ZipTileIterator<ScalarStoreIterator, ScalarStoreIterator> ZipStoreIterator;
+
+  //
+  // Data members
+  //
+
+  cutlass::HostMatrix<Scalar> tensor_source_real;
+  cutlass::HostMatrix<Scalar> tensor_source_imag;
+
+  cutlass::HostMatrix<Scalar> tensor_dest_real;
+  cutlass::HostMatrix<Scalar> tensor_dest_imag;
+
+  //
+  // Methods
+  //
+
+  /// Ctor
+  ZipIteratorTest() {
+
+    tensor_source_real.resize(cutlass::make_Coord(Shape::kH, Shape::kW), cutlass::MatrixLayout::kRowMajor);
+    tensor_source_imag.resize(cutlass::make_Coord(Shape::kH, Shape::kW), cutlass::MatrixLayout::kRowMajor);
+    tensor_dest_real.resize(cutlass::make_Coord(Shape::kH, Shape::kW), cutlass::MatrixLayout::kRowMajor);
+    tensor_dest_imag.resize(cutlass::make_Coord(Shape::kH, Shape::kW), cutlass::MatrixLayout::kRowMajor);
+  }
+
+  /// Runs test
+  void run() {
+
+    tensor_source_real.fill_sequential();
+    tensor_source_imag.fill_sequential();
+
+    tensor_dest_real.fill(0);
+    tensor_dest_imag.fill(0);
+
+    tensor_source_real.sync_device();
+    tensor_source_imag.sync_device();
+    tensor_dest_real.sync_device();
+    tensor_dest_imag.sync_device();
+
+
+    typename ZipLoadIterator::Params load_params;
+    typename ZipStoreIterator::Params store_params;
+
+    load_params.first.initialize(
+      tensor_source_real.device_data(),
+      0,
+      tensor_source_real.leading_dim(),
+      1
+    );
+
+    load_params.second.initialize(
+      tensor_source_imag.device_data(),
+      0,
+      tensor_source_real.leading_dim(),
+      1
+    );
+
+    store_params.first.initialize(
+      tensor_dest_real.device_data(),
+      0,
+      tensor_source_real.leading_dim(),
+      1
+    );
+
+    store_params.second.initialize(
+      tensor_dest_imag.device_data(),
+      0,
+      tensor_source_real.leading_dim(),
+      1
+    );
+
+    /// Launch kernel
+    test::zip_iterator_kernel<ZipLoadIterator, ZipStoreIterator><<<
+      dim3(1,1),
+      dim3(kThreadCount, 1)
+    >>>(
+      load_params,
+      store_params
+    );
+
+    cudaError_t result = cudaGetLastError();
+    EXPECT_EQ(result, cudaSuccess) << "Error on kernel launch: " << cudaGetErrorString(result);
+
+    tensor_dest_real.sync_host();
+    tensor_dest_imag.sync_host();
+
+    // Verify equivalence
+    EXPECT_TRUE(tensor_dest_real.bit_equals(tensor_source_real));
+    EXPECT_TRUE(tensor_dest_imag.bit_equals(tensor_source_imag));
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(ZipTileIterator, tile_128x8) {
+  ZipIteratorTest<int, cutlass::Shape<1, 8, 128> >().run();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
diff --git a/tools/test/unit/cutlass_unit_test.cpp b/tools/test/unit/cutlass_unit_test.cpp
index ec78c8a65..be9bd15bd 100644
--- a/tools/test/unit/cutlass_unit_test.cpp
+++ b/tools/test/unit/cutlass_unit_test.cpp
@@ -29,19 +29,65 @@
 #include <cuda_runtime_api.h>
 #include <gtest/gtest.h>
 
+/// Sets flags for Unit test
 void set_gtest_flag() {
   // Default flags can be overwritten by --gtest_filter from commandline
+  cudaError_t err;
+
+  int cudaDeviceId;
+  err = cudaGetDevice(&cudaDeviceId);
+  if (cudaSuccess != err) {
+    std::cerr << "*** Error: Could not detect active GPU device ID"
+              << " [" << cudaGetErrorString(err) << "]" << std::endl;
+    exit(1);
+  }
+
   cudaDeviceProp deviceProperties;
-  cudaGetDeviceProperties(&deviceProperties, 0);
+  err = cudaGetDeviceProperties(&deviceProperties, cudaDeviceId);
+  if (cudaSuccess != err) {
+    std::cerr << "*** Error: Could not get device properties for GPU " << cudaDeviceId << " ["
+              << cudaGetErrorString(err) << "]" << std::endl;
+    exit(1);
+  }
 
   int deviceMajorMinor = deviceProperties.major * 10 + deviceProperties.minor;
 
-  if (deviceMajorMinor < 53)
-    ::testing::GTEST_FLAG(filter) = "-*Igemm*:*Hgemm*:*mma*";
-  else if (deviceMajorMinor < 61)
-    ::testing::GTEST_FLAG(filter) = "-*Igemm*:*mma*";
-  else if (deviceMajorMinor < 70)
-    ::testing::GTEST_FLAG(filter) = "-*mma*";
+  // Defines text filters for each GEMM kernel based on minimum supported compute capability
+  struct {
+
+    /// Unit test filter string
+    char const *filter;
+
+    /// Minimum compute capability for the kernels in the named test
+    int compute_capability;
+
+    /// If true, the tests are enabled strictly for one compute capability
+    bool experimental;
+  } test_filters[] = {
+    { "Sgemm*",                    50, false },
+    { "Dgemm*",                    60, false },
+    { "Fp16_sgemm*",               60, false },
+    { "Hgemm*",                    60, false },
+    { "Igemm*",                    61, false },
+    { "WmmaGemm*",                 70, false },
+    { "WmmaInt8*",                 72, false },
+    { "WmmaInt4*",                 75, true  },
+    { "WmmaBinary*",               75, true  },
+    { 0, 0, false }
+  };
+
+  // Set negative test filters
+  std::stringstream ss;
+  ss << "-";
+  for (int i = 0, j = 0; test_filters[i].filter; ++i) {
+    if (deviceMajorMinor < test_filters[i].compute_capability ||
+        (test_filters[i].experimental && deviceMajorMinor != test_filters[i].compute_capability)) {
+
+      ss << (j++ ? ":" : "") << test_filters[i].filter;
+    }
+  }
+
+  ::testing::GTEST_FLAG(filter) = ss.str();
 }
 
 int main(int argc, char* arg[]) {
diff --git a/tools/test/unit/cutlass_unit_test.h b/tools/test/unit/cutlass_unit_test.h
index 0d559ca5c..2ffced582 100644
--- a/tools/test/unit/cutlass_unit_test.h
+++ b/tools/test/unit/cutlass_unit_test.h
@@ -28,3 +28,4 @@
 #pragma diag_suppress boolean_controlling_expr_is_constant
 #include <gtest/gtest.h>
 #pragma diag_warning boolean_controlling_expr_is_constant
+#pragma warning( disable : 4503)
diff --git a/tools/test/unit/gemm/batched_strided_dgemm_128x128x8.cu b/tools/test/unit/gemm/batched_strided_dgemm_128x128x8.cu
new file mode 100644
index 000000000..8b0bc1635
--- /dev/null
+++ b/tools/test/unit/gemm/batched_strided_dgemm_128x128x8.cu
@@ -0,0 +1,103 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/dgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(dgemm_strided_batched_128x128x8, dgemm_256x384x64x3_nn) {
+  typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+      DgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<DgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(dgemm_strided_batched_128x128x8, sgemm_128x384x192x2_nn) {
+  typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    DgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<DgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(dgemm_strided_batched_128x128x8, dgemm_256x384x64x3_nt) {
+  typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    DgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<DgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(dgemm_strided_batched_128x128x8, sgemm_128x384x192x2_nt) {
+  typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    DgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<DgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(dgemm_strided_batched_128x128x8, dgemm_256x384x64x3_tn) {
+  typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    DgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<DgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(dgemm_strided_batched_128x128x8, sgemm_128x384x192x2_tn) {
+  typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    DgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<DgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(dgemm_strided_batched_128x128x8, dgemm_256x384x64x3_tt) {
+  typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    DgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<DgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
diff --git a/tools/test/unit/gemm/batched_strided_hgemm_128x128x8.cu b/tools/test/unit/gemm/batched_strided_hgemm_128x128x8.cu
new file mode 100644
index 000000000..4738d29f9
--- /dev/null
+++ b/tools/test/unit/gemm/batched_strided_hgemm_128x128x8.cu
@@ -0,0 +1,112 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/hgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Hgemm_strided_batched_128x128x8, hgemm_256x384x64x3_nn) {
+  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+      HgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<HgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Hgemm_strided_batched_128x128x8, hgemm_128x384x192x2_nn) {
+  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    HgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<HgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Hgemm_strided_batched_128x128x8, hgemm_256x384x64x3_nt) {
+  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    HgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<HgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Hgemm_strided_batched_128x128x8, hgemm_128x384x192x2_nt) {
+  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    HgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<HgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Hgemm_strided_batched_128x128x8, hgemm_256x384x64x3_tn) {
+  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    HgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<HgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Hgemm_strided_batched_128x128x8, hgemm_128x384x192x2_tn) {
+  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    HgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<HgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Hgemm_strided_batched_128x128x8, hgemm_256x384x64x3_tt) {
+  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    HgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<HgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Hgemm_strided_batched_128x128x8, hgemm_128x384x192x2_tt) {
+  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    HgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<HgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu b/tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu
new file mode 100644
index 000000000..ffeba34f4
--- /dev/null
+++ b/tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu
@@ -0,0 +1,135 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_256x384x64x3_nn) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+      SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_128x384x192x2_nn) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_127x384x192x2_nn) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(127/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_127x388x190x2_nn) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(127/*m*/, 388/*n*/, 190/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_256x384x64x3_nt) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_128x384x192x2_nt) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_256x384x64x3_tn) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_128x384x192x2_tn) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_256x384x64x3_tt) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_strided_batched_128x128x8, sgemm_128x384x192x2_tt) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  //think about using run_gemm directly
+  run_batched_strided_gemm<SgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/gemm/binary_gemm.h b/tools/test/unit/gemm/binary_gemm.h
new file mode 100644
index 000000000..927413838
--- /dev/null
+++ b/tools/test/unit/gemm/binary_gemm.h
@@ -0,0 +1,77 @@
+/***************************************************************************************************
+* Copyright (c) 2018, NVIDIA CORPORATION.  All rights reserved.
+*
+* Redistribution and use in source and binary forms, with or without modification, are permitted
+* provided that the following conditions are met:
+*     * Redistributions of source code must retain the above copyright notice, this list of
+*       conditions and the following disclaimer.
+*     * Redistributions in binary form must reproduce the above copyright notice, this list of
+*       conditions and the following disclaimer in the documentation and/or other materials
+*       provided with the distribution.
+*     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+*       to endorse or promote products derived from this software without specific prior written
+*       permission.
+*
+* THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+* IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+* FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+* FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+* BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+* OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+* STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+* OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+*
+**************************************************************************************************/
+
+#include "cutlass/cutlass.h"
+
+template <typename GemmTraits_>
+static void run_binary_gemm(int m, int n, int k, int alpha = 1, int beta = 1) {
+  typedef cutlass::gemm::Gemm<GemmTraits_> Gemm;
+  typename Gemm::Params params;
+
+  test::GemmTestbed<cutlass::Vector<cutlass::bin1_t, 32>,  // AType
+                    cutlass::Vector<cutlass::bin1_t, 32>,  // BType
+                    int32_t,                               // CType
+                    int32_t,                               // Accumulator
+                    int                                    // Scalar
+                    >
+      testbed(m,
+              n,
+              k / 32,
+              test::convert(GemmTraits_::kLayoutA),
+              test::convert(GemmTraits_::kLayoutB),
+              alpha,
+              beta);
+
+  // Initializes the input vectors for computation
+  testbed.initialize_binary();
+
+  // Compute the reference result on the host (CPU)
+  testbed.compute_host();
+
+  params.initialize(testbed.M(),
+                    testbed.N(),
+                    testbed.K() * 32,
+                    testbed.alpha,
+                    testbed.ptr_A(),
+                    testbed.lda(),
+                    testbed.ptr_B(),
+                    testbed.ldb(),
+                    testbed.beta,
+                    testbed.ptr_C_initial(),
+                    testbed.ldc(),
+                    testbed.ptr_computed(),
+                    testbed.ldc());
+
+  Gemm::launch(params);
+
+  cudaError_t result = cudaDeviceSynchronize();
+  ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
+                                 << "\n";
+
+  testbed.computed.sync_host();
+
+  // Check the results
+  ASSERT_TRUE(testbed.computed.bit_equals(testbed.ref_host));
+}
diff --git a/tools/test/unit/gemm/dgemm.cu b/tools/test/unit/gemm/dgemm.cu
index be78450b9..ebfeba920 100644
--- a/tools/test/unit/gemm/dgemm.cu
+++ b/tools/test/unit/gemm/dgemm.cu
@@ -24,11 +24,11 @@
  **************************************************************************************************/
 #include <cublas_v2.h>
 #include <cstring>
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/dgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/dgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
@@ -40,6 +40,7 @@ TEST(Dgemm_64x32x8, dgemm_64x32x8_nt) {
   run_gemm<GemmTraits>(64, 32, 8);
 }
 
+
 TEST(Dgemm_64x32x8, dgemm_256x128x64_nt) {
 
   typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kColumnMajor,
@@ -569,5 +570,3 @@ TEST(Dgemm_128x32x16, dgemm_256x64x64_tt) {
 }
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
-
-
diff --git a/tools/test/unit/gemm/epilogue_functor.cu b/tools/test/unit/gemm/epilogue_functor.cu
new file mode 100644
index 000000000..cc0373516
--- /dev/null
+++ b/tools/test/unit/gemm/epilogue_functor.cu
@@ -0,0 +1,121 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/linear_scaling_device_ptr.h"
+#include "cutlass/gemm/sgemm_traits.h"
+
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+// This example defines an SGEMM with a linear scaling functor that supports optionally passing
+// alpha and beta via device-side pointers as in cuBLAS.
+TEST(Sgemm_epilogue_functor, device_ptr_mode_sgemm_1024x512x128_nt) {
+
+  typedef cutlass::gemm::SgemmTraits<
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<8, 128, 128>,
+    cutlass::gemm::LinearScalingDevicePtr<float>
+  >
+    SgemmTraits;
+
+  // Define a GEMM problem size
+  int const m = 1025;
+  int const n = 512;
+  int const k = 128;
+
+  // Define scalars
+  float alpha_host = 3;
+  float beta_host = 2;
+
+  // Define a device-backed tensor to contain the scalars
+  cutlass::HostTensor<float, 1> device_scalars(2);
+
+  // Copy scalar values to device memory for device-ptr mode
+  device_scalars.at(0) = alpha_host;
+  device_scalars.at(1) = beta_host;
+  device_scalars.sync_device();
+
+  // Construct a GemmTestbed instance
+  test::GemmTestbed<
+    float,  // AType
+    float,  // BType
+    float,  // CType
+    float,  // Accumulator
+    float   // Scalar
+    >
+    testbed(m,
+            n,
+            k,
+            test::convert(SgemmTraits::kLayoutA),
+            test::convert(SgemmTraits::kLayoutB),
+            alpha_host,
+            beta_host);
+
+  testbed.initialize();
+
+  //
+  // Construct a CUTLASS GEMM and initialize parameters
+  //
+  typedef typename SgemmTraits::KernelClass Gemm;
+  typename Gemm::Params params;
+
+  params.initialize(testbed.M(),
+                    testbed.N(),
+                    testbed.K(),
+                    0,                // alpha ignored
+                    testbed.ptr_A(),
+                    testbed.lda(),
+                    testbed.ptr_B(),
+                    testbed.ldb(),
+                    0,                // beta ignored
+                    testbed.ptr_C_initial(),
+                    testbed.ldc(),
+                    testbed.ptr_computed(),
+                    testbed.ldc());
+
+  // Explicitly call the epilogue functor's initialize method to pass additional arguments
+  params.epilogue.functor.initialize(
+    device_scalars.device_data() + 0,   // pointer to alpha in device memory
+    device_scalars.device_data() + 1);  // pointer to beta in device memory
+
+  // Launch the CUTLASS SGEMM kernel
+  Gemm::launch(params);
+
+  // Report any errors
+  cudaError_t result = cudaDeviceSynchronize();
+  ASSERT_EQ(result, cudaSuccess)
+    << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
+    << "\n";
+
+  // Verify result
+  ASSERT_TRUE(testbed.verify_with_cublas());
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/gemm/fp16_sgemm_fp16_128x128x16.cu b/tools/test/unit/gemm/fp16_sgemm_fp16_128x128x16.cu
new file mode 100644
index 000000000..41ed3c855
--- /dev/null
+++ b/tools/test/unit/gemm/fp16_sgemm_fp16_128x128x16.cu
@@ -0,0 +1,321 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/fp16_sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp16_fp16_128x128x16, fp16_sgemm_fp16_128x128x16_nn) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+   alpha and beta are both fp16*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                     cutlass::MatrixLayout::kColumnMajor, 
+                                     cutlass::Shape<16, 128, 128>,
+                                     half, /*A type*/
+                                     half, /*B type*/
+                                     half, /*C type*/
+                                     half, /*D type*/
+                                     half  /*alpha, beta type*/
+  >
+      SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp16_fp16_128x128x16, fp16_sgemm_fp16_128x128x16_nt) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp16*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    half  /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp16_fp16_128x128x16, fp16_sgemm_fp16_128x128x16_tn) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp16*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    half  /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp16_fp16_128x128x16, fp16_sgemm_fp16_128x128x16_tt) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp16*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    half  /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp16_fp16_128x128x16, fp16_sgemm_fp16_128x112x17_nn) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp16*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    half  /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp16_fp16_128x128x16, fp16_sgemm_fp16_128x112x17_nt) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp16*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    half  /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp16_fp16_128x128x16, fp16_sgemm_fp16_128x112x17_tn) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp16*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    half  /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp16_fp16_128x128x16, fp16_sgemm_fp16_128x112x17_tt) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp16*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    half  /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//alpha and beta are both fp32
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp16_128x128x16, fp16_sgemm_fp16_128x128x16_nn) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp16_128x128x16, fp16_sgemm_fp16_128x128x16_nt) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp16_128x128x16, fp16_sgemm_fp16_128x128x16_tn) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp16_128x128x16, fp16_sgemm_fp16_128x128x16_tt) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp16_128x128x16, fp16_sgemm_fp16_128x112x17_nn) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp16_128x128x16, fp16_sgemm_fp16_128x112x17_nt) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp16_128x128x16, fp16_sgemm_fp16_128x112x17_tn) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp16_128x128x16, fp16_sgemm_fp16_128x112x17_tt) {
+  /*A, B, C, D are half typed, accumulator is always float for sgemm
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    half, /*C type*/
+    half, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
diff --git a/tools/test/unit/gemm/fp16_sgemm_fp32_128x128x16.cu b/tools/test/unit/gemm/fp16_sgemm_fp32_128x128x16.cu
new file mode 100644
index 000000000..d45ecb7bd
--- /dev/null
+++ b/tools/test/unit/gemm/fp16_sgemm_fp32_128x128x16.cu
@@ -0,0 +1,174 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/fp16_sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+
+
+
+TEST(Fp16_sgemm_alphaFp32_fp32_128x128x16, fp16_sgemm_fp32_128x128x16_nn) {
+  /*A, B are half typed, accumulator is always float for sgemm, C, D are float typed
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    float, /*C type*/
+    float, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp32_128x128x16, fp16_sgemm_fp32_128x128x16_nt) {
+  /*A, B are half typed, accumulator is always float for sgemm, C, D are float typed
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    float, /*C type*/
+    float, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp32_128x128x16, fp16_sgemm_fp32_128x128x16_tn) {
+  /*A, B are half typed, accumulator is always float for sgemm, C, D are float typed
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    float, /*C type*/
+    float, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp32_128x128x16, fp16_sgemm_fp32_128x128x16_tt) {
+  /*A, B are half typed, accumulator is always float for sgemm, C, D are float typed
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    float, /*C type*/
+    float, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 128, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp32_128x128x16, fp16_sgemm_fp32_128x112x17_nn) {
+  /*A, B are half typed, accumulator is always float for sgemm, C, D are float typed
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    float, /*C type*/
+    float, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp32_128x128x16, fp16_sgemm_fp32_128x112x17_nt) {
+  /*A, B are half typed, accumulator is always float for sgemm, C, D are float typed
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    float, /*C type*/
+    float, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp32_128x128x16, fp16_sgemm_fp32_128x112x17_tn) {
+  /*A, B are half typed, accumulator is always float for sgemm, C, D are float typed
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    float, /*C type*/
+    float, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Fp16_sgemm_alphaFp32_fp32_128x128x16, fp16_sgemm_fp32_128x112x17_tt) {
+  /*A, B are half typed, accumulator is always float for sgemm, C, D are float typed
+  alpha and beta are both fp32*/
+  typedef cutlass::gemm::Fp16SgemmSgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<16, 128, 128>,
+    half, /*A type*/
+    half, /*B type*/
+    float, /*C type*/
+    float, /*D type*/
+    float /*alpha, beta type*/
+  >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(128, 112, 17);
+}
diff --git a/tools/test/unit/gemm/gemm_nvrtc.cu b/tools/test/unit/gemm/gemm_nvrtc.cu
index 0607b2173..89dfe1a61 100644
--- a/tools/test/unit/gemm/gemm_nvrtc.cu
+++ b/tools/test/unit/gemm/gemm_nvrtc.cu
@@ -22,13 +22,13 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/dgemm_traits.h>
-#include <cutlass/gemm/igemm_traits.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm_nvrtc.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/dgemm_traits.h"
+#include "cutlass/gemm/igemm_traits.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/gemm_nvrtc.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/gemm_nvrtc.h b/tools/test/unit/gemm/gemm_nvrtc.h
index a8710313f..fae1e7d6f 100644
--- a/tools/test/unit/gemm/gemm_nvrtc.h
+++ b/tools/test/unit/gemm/gemm_nvrtc.h
@@ -25,10 +25,10 @@
 
 #define NVRTC_GET_TYPE_NAME 1
 
-#include <cutlass/cutlass.h>
+#include "cutlass/cutlass.h"
 
 #include <nvrtc.h>
-#include <tools/nvrtc/cutlass/nvrtc/environment.h>
+#include "tools/nvrtc/cutlass/nvrtc/environment.h"
 #include <string>
 
 static inline bool check_nvrtc_error(nvrtcResult error) {
@@ -76,13 +76,13 @@ static __host__ void run_gemm_nvrtc(
   nvrtcResult result_nvrtc;
   nvrtcProgram program;
   static char const *src =
-      "#include <cutlass/gemm/gemm.h>\n"
-      "#include <cutlass/gemm/sgemm_traits.h>\n"
-      "#include <cutlass/gemm/dgemm_traits.h>\n"
-      "#include <cutlass/gemm/igemm_traits.h>\n"
+      "#include "cutlass/gemm/gemm.h"\n"
+      "#include "cutlass/gemm/sgemm_traits.h"\n"
+      "#include "cutlass/gemm/dgemm_traits.h"\n"
+      "#include "cutlass/gemm/igemm_traits.h"\n"
 #if defined(CUTLASS_NVRTC_HAS_FP16)
-      "#include <cutlass/gemm/hgemm_traits.h>\n"
-      "#include <cutlass/gemm/wmma_gemm_traits.h>\n"
+      "#include "cutlass/gemm/hgemm_traits.h"\n"
+      "#include "cutlass/gemm/wmma_gemm_traits.h"\n"
 #endif
       ;
 
diff --git a/tools/test/unit/gemm/gemm_shared_mem_layouts.cu b/tools/test/unit/gemm/gemm_shared_mem_layouts.cu
deleted file mode 100644
index 6da198df3..000000000
--- a/tools/test/unit/gemm/gemm_shared_mem_layouts.cu
+++ /dev/null
@@ -1,621 +0,0 @@
-/***************************************************************************************************
- * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
- *
- * Redistribution and use in source and binary forms, with or without modification, are permitted
- * provided that the following conditions are met:
- *     * Redistributions of source code must retain the above copyright notice, this list of
- *       conditions and the following disclaimer.
- *     * Redistributions in binary form must reproduce the above copyright notice, this list of
- *       conditions and the following disclaimer in the documentation and/or other materials
- *       provided with the distribution.
- *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
- *       to endorse or promote products derived from this software without specific prior written
- *       permission.
- *
- * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
- * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
- * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
- * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
- * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
- * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
- * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
- * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
- *
- **************************************************************************************************/
-#include <cutlass_unit_tests.h>
-#include <tools/util/host_tensor.h>
-#include <tools/util/tensor_view_io.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/shape.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <cutlass/gemm/dgemm_traits.h>
-#include <cutlass/gemm/hgemm_traits.h>
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-namespace test {
-
-    // M/N/K struct.
-    struct GemmDesc { 
-      int m, n, k; 
-      inline __host__ __device__ GemmDesc(int m_, int n_, int k_) : m(m_), n(n_), k(k_) {} 
-    };
-
- /// Simple test to load from global memory and store to shared memory
-
-    // Loading from global memory and storing to shared memory for A
-    template <typename Traits>
-    __global__ void gemm_load_global_store_shared_a(
-        typename Traits::GlobalLoadStreamA::Scalar *output,
-        typename Traits::GlobalLoadStreamA::Scalar const *input,
-        int M,
-        int N,
-        int K,
-        int ldm,
-        int skew) {
-
-        //Create shared memory.
-        __shared__ typename Traits::SharedStorage shared_storage;
-
-        // Create those iterators.
-        typedef typename Traits::GlobalLoadStreamA GlobalLoadStreamA;
-
-        typename GlobalLoadStreamA::Params global_load_params;
-        GemmDesc desc(M, N, K);
-        global_load_params.initialize(desc, input, ldm);
-
-        GlobalLoadStreamA stream_a(global_load_params, shared_storage.main_loop.stream_a.global, M, N, K, cutlass::make_Coord(0, 0, 0));
-        stream_a.copy();
-        stream_a.commit();
-
-        // store barrier
-        __syncthreads();
-
-        // one thread writes everything out
-        if (threadIdx.x == 0) {
-            for (int i = 0; i < (M+skew)*K; ++i) {
-                output[i] = shared_storage.main_loop.stream_a.shared.scalars[i];
-            }
-        }
-
-    }
-
-    // Loading from global memory and storing to shared memory for B
-    template <typename Traits>
-    __global__ void gemm_load_global_store_shared_b(
-        typename Traits::GlobalLoadStreamB::Scalar *output,
-        typename Traits::GlobalLoadStreamB::Scalar const *input,
-        int M,
-        int N,
-        int K,
-        int ldm,
-        int skew) {
-
-        //Create shared memory.
-        __shared__ typename Traits::SharedStorage shared_storage;
-
-        // Create those iterators.
-        typedef typename Traits::GlobalLoadStreamB GlobalLoadStreamB;
-        typename GlobalLoadStreamB::Params global_load_params;
-        GemmDesc desc(M, N, K);
-        global_load_params.initialize(desc, input, ldm);
-
-        GlobalLoadStreamB stream_b(global_load_params, shared_storage.main_loop.stream_b.global, M, N, K, cutlass::make_Coord(0, 0, 0));
-        stream_b.copy();
-        stream_b.commit();
-
-        // store barrier
-        __syncthreads();
-
-        // one thread writes everything out
-        if (threadIdx.x == 0) {
-            for (int i = 0; i < (N+skew)*K; ++i) {
-                output[i] = shared_storage.main_loop.stream_b.shared.scalars[i];
-            }
-        }
-
-    }
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, A_float_contiguous) {
-
-    static int const M = 64;
-    static int const N = 64;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor, cutlass::MatrixLayout::kRowMajor, ThreadBlockTile >
-            SgemmTraits;
-
-    
-    cutlass::HostTensor<float> input;
-    cutlass::HostTensor<float> output;
-    int skew = 0;
-
-    input.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kColumnMajor);
-    output.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kColumnMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, 1, ThreadBlockTile::kW, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_a< SgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(SgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        M,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-
-    output.sync_host();
-
-    EXPECT_TRUE(input.bit_equals(output));
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, A_float_crosswise) {
-
-    static int const M = 64;
-    static int const N = 64;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor, cutlass::MatrixLayout::kRowMajor, ThreadBlockTile >
-            SgemmTraits;
-
-    
-    cutlass::HostTensor<float> input;
-    cutlass::HostTensor<float> output;
-    int skew = 4;
-
-    input.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kRowMajor);
-    output.resize_matrix(ThreadBlockTile::kW + skew, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kColumnMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, ThreadBlockTile::kD, 1, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_a< SgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(SgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        K,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-    output.sync_host();
-
-    EXPECT_TRUE(input.bit_equals(output));
-
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, B_float_contiguous) {
-
-    static int const M = 64;
-    static int const N = 64;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor, cutlass::MatrixLayout::kRowMajor, ThreadBlockTile >
-            SgemmTraits;
-
-    
-    cutlass::HostTensor<float> input;
-    cutlass::HostTensor<float> output;
-    int skew = 0;
-
-    input.resize_matrix(ThreadBlockTile::kD, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kRowMajor);
-    output.resize_matrix(ThreadBlockTile::kD, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kRowMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, ThreadBlockTile::kH, 1, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_b< SgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(SgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        N,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-
-    output.sync_host();
-
-    EXPECT_TRUE(input.bit_equals(output));
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, B_float_crosswise) {
-
-    static int const M = 64;
-    static int const N = 64;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-            cutlass::MatrixLayout::kColumnMajor, ThreadBlockTile >
-            SgemmTraits;
-
-    
-    cutlass::HostTensor<float> input;
-    cutlass::HostTensor<float> output;
-    int skew = 4;
-
-    input.resize_matrix(ThreadBlockTile::kD, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kColumnMajor);
-    output.resize_matrix(ThreadBlockTile::kD + skew, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kRowMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, 1, ThreadBlockTile::kD, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_b< SgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(SgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        K,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-    output.sync_host();
-
-    EXPECT_TRUE(input.bit_equals(output));
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, A_double_contiguous) {
-
-    static int const M = 64;
-    static int const N = 64;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kColumnMajor, cutlass::MatrixLayout::kRowMajor, ThreadBlockTile >
-            DgemmTraits;
-
-    
-    cutlass::HostTensor<double> input;
-    cutlass::HostTensor<double> output;
-    int skew = 0;
-
-    input.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kColumnMajor);
-    output.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kColumnMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, 1, ThreadBlockTile::kW, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_a< DgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(DgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        M,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-
-    output.sync_host();
-
-    EXPECT_TRUE(input.bit_equals(output));
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, A_double_crosswise) {
-
-    static int const M = 64;
-    static int const N = 64;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kRowMajor, cutlass::MatrixLayout::kRowMajor, ThreadBlockTile >
-            DgemmTraits;
-
-    
-    cutlass::HostTensor<double> input;
-    cutlass::HostTensor<double> output;
-    int skew = 2;
-
-    input.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kRowMajor);
-    output.resize_matrix(ThreadBlockTile::kW + skew, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kColumnMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, ThreadBlockTile::kD, 1, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_a< DgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(DgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        K,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-    output.sync_host();
-
-    EXPECT_TRUE(input.bit_equals(output));
-
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, B_double_contiguous) {
-
-    static int const M = 64;
-    static int const N = 64;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kColumnMajor, cutlass::MatrixLayout::kRowMajor, ThreadBlockTile >
-            DgemmTraits;
-
-    
-    cutlass::HostTensor<double> input;
-    cutlass::HostTensor<double> output;
-    int skew = 0;
-
-    input.resize_matrix(ThreadBlockTile::kD, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kRowMajor);
-    output.resize_matrix(ThreadBlockTile::kD, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kRowMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, ThreadBlockTile::kH, 1, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_b< DgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(DgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        N,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-
-    output.sync_host();
-
-    EXPECT_TRUE(input.bit_equals(output));
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, B_double_crosswise) {
-
-    static int const M = 64;
-    static int const N = 64;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::DgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-            cutlass::MatrixLayout::kColumnMajor, ThreadBlockTile >
-            DgemmTraits;
-
-    
-    cutlass::HostTensor<double> input;
-    cutlass::HostTensor<double> output;
-    int skew = 2;
-
-    input.resize_matrix(ThreadBlockTile::kD, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kColumnMajor);
-    output.resize_matrix(ThreadBlockTile::kD + skew, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kRowMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, 1, ThreadBlockTile::kD, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_b< DgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(DgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        K,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-    output.sync_host();
-
-    EXPECT_TRUE(input.bit_equals(output));
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, A_half_crosswise) {
-
-    static int const M = 128;
-    static int const N = 128;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kRowMajor, cutlass::MatrixLayout::kRowMajor, ThreadBlockTile >
-            HgemmTraits;
-
-    
-    cutlass::HostTensor<cutlass::half_t> input;
-    cutlass::HostTensor<cutlass::half_t> output;
-    int skew = 8;
-
-    input.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kRowMajor);
-    output.resize_matrix(ThreadBlockTile::kW + skew, ThreadBlockTile::kD,
-            cutlass::MatrixLayout::kColumnMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, ThreadBlockTile::kD, 1, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_a< HgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(HgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        K,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-    output.sync_host();
-    
-    EXPECT_TRUE(input.bit_equals(output));
-
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-TEST(GemmSharedMemLayout, B_half_crosswise) {
-
-    static int const M = 128;
-    static int const N = 128;
-    static int const K = 8;
-
-    typedef cutlass::Shape<K, N, M> ThreadBlockTile;
-
-    typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-            cutlass::MatrixLayout::kColumnMajor, ThreadBlockTile >
-            HgemmTraits;
-
-    
-    cutlass::HostTensor<cutlass::half_t> input;
-    cutlass::HostTensor<cutlass::half_t> output;
-    int skew = 8;
-
-    input.resize_matrix(ThreadBlockTile::kD, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kColumnMajor);
-    output.resize_matrix(ThreadBlockTile::kD + skew, ThreadBlockTile::kH,
-            cutlass::MatrixLayout::kRowMajor);
-
-
-    input.fill_linear(cutlass::make_Coord(1, 1, ThreadBlockTile::kD, 1));
-
-    output.fill(0);
-
-    test::gemm_load_global_store_shared_b< HgemmTraits ><<<
-        dim3(1,1,1),
-        dim3(HgemmTraits::kThreads, 1)
-    >>>(
-        output.device_data(),
-        input.device_data(),
-        M,
-        N,
-        K,
-        K,
-        skew
-    );
-
-    cudaError_t result = cudaDeviceSynchronize();
-    ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
-                                 << "\n";
-
-    output.sync_host();
-
-    EXPECT_TRUE(input.bit_equals(output));
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-}
-
diff --git a/tools/test/unit/gemm/gemm_testbed.h b/tools/test/unit/gemm/gemm_testbed.h
index 47e90f61c..e937742ce 100644
--- a/tools/test/unit/gemm/gemm_testbed.h
+++ b/tools/test/unit/gemm/gemm_testbed.h
@@ -32,30 +32,39 @@
 #include <iomanip>
 #include <sstream>
 #include <string>
+#include <algorithm>
 
 #include <cublas_v2.h>
 
-#include <cutlass/matrix_traits.h>
-#include <cutlass/util/platform.h>
+#include "cutlass/matrix_traits.h"
+#include "cutlass/util/platform.h"
+#include "cutlass/gemm/gemm_coord.h"
 
-#include <tools/util/host_tensor.h>
-#include <tools/util/tensor_view_io.h>
-#include <tools/util/type_traits.h>
+#include "tools/util/host_matrix.h"
+#include "tools/util/host_matrix_view.h"
+#include "tools/util/tensor_view_io.h"
+#include "tools/util/type_traits.h"
+
+#include "tools/util/reference/host/gemm.h"
+#include "tools/util/reference/host/tensor_elementwise.h"
+
+//////////////////////////////////////////////////////////////////////////////////////////
 
 namespace cutlass {
 
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
 template <cutlass::GemmOperand::Kind kOperand_,
           cutlass::MatrixLayout::Kind kLayout_,
           typename Scalar_,
           typename WmmaShape_>
 struct WmmaMatrix;
-}
+
+}  // namespace cutlass
+
+//////////////////////////////////////////////////////////////////////////////////////////
 
 namespace test {
 
-////////////////////////////////////////////////////////////////////////////////////////////////////
+//////////////////////////////////////////////////////////////////////////////////////////
 
 template <typename T>
 struct GemmTestbedTraits : public cutlass::TypeTraits<T> {};
@@ -66,14 +75,39 @@ template <cutlass::GemmOperand::Kind kOperand_,
           typename WmmaShape_>
 struct GemmTestbedTraits<cutlass::WmmaMatrix<kOperand_, kLayout_, Scalar_, WmmaShape_> > {
   static cudaDataType_t const cublas_type = cutlass::TypeTraits<Scalar_>::cublas_type;
-  typedef Scalar_ host_type;
-  typedef Scalar_ device_type;
+  typedef typename cutlass::TypeTraits<Scalar_>::host_type host_type;
+  typedef typename cutlass::TypeTraits<Scalar_>::device_type device_type;
   static inline double remove_negative_zero(double x) { return x == -0.0 ? 0.0 : x; }
   static inline double to_print(double x) { return x; }
 };
 
-////////////////////////////////////////////////////////////////////////////////////////////////////
+inline cublasOperation_t convert(cutlass::MatrixLayout::Kind layout) {
+  switch (layout) {
+    case cutlass::MatrixLayout::kRowMajor:
+      return CUBLAS_OP_T;
+    case cutlass::MatrixLayout::kColumnMajor:
+      return CUBLAS_OP_N;
+    default:
+      break;
+  }
+  return CUBLAS_OP_N;
+}
 
+inline cutlass::MatrixLayout::Kind convert(cublasOperation_t transform) {
+  switch (transform) {
+    case CUBLAS_OP_T:
+      return cutlass::MatrixLayout::kRowMajor;
+    case CUBLAS_OP_N:
+      return cutlass::MatrixLayout::kColumnMajor;
+    default:
+      break;
+  }
+  return cutlass::MatrixLayout::kColumnMajor;
+}
+
+//////////////////////////////////////////////////////////////////////////////////////////
+
+/// Testbed for evaluating real-valued GEMMs
 template <typename AType, typename BType, typename CType, typename Accumulator, typename Scalar>
 struct GemmTestbed {
   //
@@ -81,13 +115,13 @@ struct GemmTestbed {
   //
 
   /// Host tensor for operand A
-  typedef cutlass::HostTensor<AType> HostTensorA;
+  typedef cutlass::HostMatrix<AType> HostMatrixA;
 
   /// Host tensor for operand B
-  typedef cutlass::HostTensor<BType> HostTensorB;
+  typedef cutlass::HostMatrix<BType> HostMatrixB;
 
   /// Host tensor for operand C
-  typedef cutlass::HostTensor<CType> HostTensorC;
+  typedef cutlass::HostMatrix<CType> HostMatrixC;
 
   /// Functor to print errors
   struct PrintErrors {
@@ -98,18 +132,18 @@ struct GemmTestbed {
     std::ostream& out;
 
     /// Reference tensor view
-    cutlass::HostTensorView<CType> const& reference;
+    HostMatrixC const& reference;
 
     /// Computed tensor view
-    cutlass::HostTensorView<CType> const& experimental;
+    HostMatrixC const& experimental;
 
     /// Errors greater than or this amount result in printing
     integer_t ulps_threshold;
 
     ///
     PrintErrors(std::ostream& _out,
-                cutlass::HostTensorView<CType> const& _reference,
-                cutlass::HostTensorView<CType> const& _experimental,
+                HostMatrixC const& _reference,
+                HostMatrixC const& _experimental,
                 integer_t _ulps_threshold = 1)
         : out(_out),
           reference(_reference),
@@ -117,7 +151,7 @@ struct GemmTestbed {
           ulps_threshold(_ulps_threshold) {}
 
     /// Compares one element
-    void operator()(CType const& element, typename HostTensorC::Coord_t coord) {
+    void operator()(CType const& element, typename HostMatrixC::TensorCoord coord) {
       CType exp = experimental.at(coord);
       CType ref = reference.at(coord);
 
@@ -165,6 +199,20 @@ struct GemmTestbed {
     bool only_ones;
   };
 
+  template <typename T>
+  struct RandomBitGenerator {
+    RandomBitGenerator(int seed = -1) { srand(seed); }
+
+    T operator()() {
+      uint32_t val = 0;
+      for (int i = 0; i < 32; i++) {
+        val |= rand() % 2;
+        val <<= 1;
+      }
+      return T(val);
+    }
+  };
+
   //
   // Data members
   //
@@ -178,29 +226,32 @@ struct GemmTestbed {
   /// cuBLAS GEMM algorithm selector
   cublasGemmAlgo_t algorithm;
 
+  /// Problem size as a GemmCoord
+  cutlass::gemm::GemmCoord problem_size;
+
   /// A matrix operand
-  HostTensorA A;
+  HostMatrixA A;
 
   /// Layout of A matrix
   cublasOperation_t layout_A;
 
   /// B matrix operand
-  HostTensorB B;
+  HostMatrixB B;
 
   /// Layout of B matrix
   cublasOperation_t layout_B;
 
   /// C matrix operand
-  HostTensorC C_initial;
+  HostMatrixC C_initial;
 
   /// Reference result computed on the host
-  cutlass::HostTensor<CType, false> ref_host;
+  HostMatrixC ref_host;
 
   /// Reference result computed with cublas
-  HostTensorC ref_cublas;
+  HostMatrixC ref_cublas;
 
   /// Computed result
-  HostTensorC computed;
+  HostMatrixC computed;
 
   /// Linear scalaring factor
   Scalar alpha;
@@ -208,36 +259,105 @@ struct GemmTestbed {
   /// Linear scaling factor
   Scalar beta;
 
+  /// batch count
+  int batch_count;
+
+  /// distance between A[i] and A[i+1] for strided batched gemm
+  long long int batch_stride_A;
+
+  /// distance between B[i] and B[i+1] for strided batched gemm
+  long long int batch_stride_B;
+
+  /// distance between C[i] and C[i+1] for strided batched gemm
+  long long int batch_stride_C;
+
   //
   // Static helpers
   //
 
   /// Helper to resize a matrix with a given size and layout
-  template <typename T, bool DeviceBacked>
-  static void resize(cutlass::HostTensor<T, DeviceBacked>& tensor,
+  template <typename T>
+  static void resize(cutlass::HostMatrix<T>& tensor,
                      int rows,
                      int columns,
                      cublasOperation_t layout,
                      int ldm = 0) {
-    if (!ldm) {
-      ldm = (layout == CUBLAS_OP_N ? rows : columns);
-    }
 
-    typedef cutlass::Coord<cutlass::HostTensor<T>::Rank> Coord_t;
-
-    size_t matrix_stride = layout == CUBLAS_OP_N ? columns * ldm : rows * ldm;
-    // TODO: Remove that (int) cast.
-    Coord_t stride = cutlass::make_Coord(
-        (int)matrix_stride, layout == CUBLAS_OP_N ? 1 : ldm, layout == CUBLAS_OP_N ? ldm : 1, 1);
-    Coord_t size = cutlass::make_Coord(1, rows, columns, 1);
-    tensor.reset(stride, size);
+    tensor.resize(cutlass::make_Coord(rows, columns), convert(layout), ldm);
   }
 
   //
   // Methods
   //
 
-  /// Constructs a workspace for verifying GEMM.
+  /// Constructs a workspace for verifying GEMM, assumes
+  /// dense packing.
+  GemmTestbed(int M_,
+              int N_,
+              int K_,
+              cublasOperation_t layout_a,
+              cublasOperation_t layout_b,
+              Scalar alpha_ = Scalar(1),
+              Scalar beta_ = Scalar(0),
+              cublasGemmAlgo_t algorithm_ = CUBLAS_GEMM_DEFAULT,
+              cublasOperation_t layout_c = CUBLAS_OP_N)
+      : problem_size(K_, N_, M_, 1),
+        layout_A(layout_a),
+        layout_B(layout_b),
+        alpha(alpha_),
+        beta(beta_),
+        algorithm(algorithm_),
+        batch_count(1),
+        batch_stride_A(static_cast<long long int>(0)),
+        batch_stride_B(static_cast<long long int>(0)),
+        batch_stride_C(static_cast<long long int>(0)) {
+    status = cublasCreate(&handle);
+    if (status != CUBLAS_STATUS_SUCCESS) {
+      throw cutlass::cuda_exception("Failed to create CUBLAS handle");
+    }
+
+    resize(A, M_, K_, layout_a);
+    resize(B, K_, N_, layout_b);
+    resize(C_initial, M_, N_, layout_c);
+    resize(ref_host, M_, N_, layout_c);
+    resize(ref_cublas, M_, N_, layout_c);
+    resize(computed, M_, N_, layout_c);
+  }
+
+  /// Constructs a workspace for verifying GEMM, assumes
+  /// dense packing.
+  GemmTestbed(cublasHandle_t handle_,
+              int M_,
+              int N_,
+              int K_,
+              cublasOperation_t layout_a,
+              cublasOperation_t layout_b,
+              Scalar alpha_ = Scalar(1),
+              Scalar beta_ = Scalar(0),
+              cublasGemmAlgo_t algorithm_ = CUBLAS_GEMM_DEFAULT,
+              cublasOperation_t layout_c = CUBLAS_OP_N)
+      : status(CUBLAS_STATUS_SUCCESS),
+        handle(handle_),
+        problem_size(K_, N_, M_, 1),
+        layout_A(layout_a),
+        layout_B(layout_b),
+        alpha(alpha_),
+        beta(beta_),
+        algorithm(algorithm_),
+        batch_count(1),
+        batch_stride_A(static_cast<long long int>(0)),
+        batch_stride_B(static_cast<long long int>(0)),
+        batch_stride_C(static_cast<long long int>(0)) {
+
+    resize(A, M_, K_ * batch_count, layout_a);
+    resize(B, K_ * batch_count, N_, layout_b);
+    resize(C_initial, M_, N_ * batch_count, layout_c);
+    resize(ref_host, M_, N_ * batch_count, layout_c);
+    resize(ref_cublas, M_, N_ * batch_count, layout_c);
+    resize(computed, M_, N_ * batch_count, layout_c);
+  }
+
+  /// Constructs a workspace for verifying GEMM with arbitrary strides
   GemmTestbed(int M_,
               int N_,
               int K_,
@@ -250,7 +370,16 @@ struct GemmTestbed {
               Scalar beta_ = Scalar(0),
               cublasGemmAlgo_t algorithm_ = CUBLAS_GEMM_DEFAULT,
               cublasOperation_t layout_c = CUBLAS_OP_N)
-      : layout_A(layout_a), layout_B(layout_b), alpha(alpha_), beta(beta_), algorithm(algorithm_) {
+      : problem_size(K_, N_, M_, 1),
+        layout_A(layout_a),
+        layout_B(layout_b),
+        alpha(alpha_),
+        beta(beta_),
+        algorithm(algorithm_),
+        batch_count(1),
+        batch_stride_A(static_cast<long long int>(0)),
+        batch_stride_B(static_cast<long long int>(0)),
+        batch_stride_C(static_cast<long long int>(0)) {
     status = cublasCreate(&handle);
     if (status != CUBLAS_STATUS_SUCCESS) {
       throw cutlass::cuda_exception("Failed to create CUBLAS handle");
@@ -264,39 +393,119 @@ struct GemmTestbed {
     resize(computed, M_, N_, layout_c, ldc);
   }
 
-  ~GemmTestbed() { status = cublasDestroy(handle); }
+  /// Constructs a workspace for verifying GEMM with arbitrary strides
+  GemmTestbed(cublasHandle_t handle_,
+              int M_,
+              int N_,
+              int K_,
+              int ldc,
+              cublasOperation_t layout_a,
+              int lda,
+              cublasOperation_t layout_b,
+              int ldb,
+              Scalar alpha_ = Scalar(1),
+              Scalar beta_ = Scalar(0),
+              cublasGemmAlgo_t algorithm_ = CUBLAS_GEMM_DEFAULT,
+              cublasOperation_t layout_c = CUBLAS_OP_N)
+      : status(CUBLAS_STATUS_SUCCESS),
+        handle(handle_),
+        problem_size(K_, N_, M_, 1),
+        alpha(alpha_),
+        beta(beta_),
+        algorithm(algorithm_),
+        batch_count(1),
+        batch_stride_A(static_cast<long long int>(0)),
+        batch_stride_B(static_cast<long long int>(0)),
+        batch_stride_C(static_cast<long long int>(0)) {
+
+    resize(A, M_, K_ * batch_count, layout_a);
+    resize(B, K_ * batch_count, N_, layout_b);
+    resize(C_initial, M_, N_ * batch_count, layout_c);
+    resize(ref_host, M_, N_ * batch_count, layout_c);
+    resize(ref_cublas, M_, N_ * batch_count, layout_c);
+    resize(computed, M_, N_ * batch_count, layout_c);
+  }
+
+  /// Constructs a workspace for verifying strided batched GEMM, assumes
+  /// dense packing.
+  /// batches are "concated" along K for matrix A and matrix B, and along N for matrix C
+  /// a full implementation of strided batched GEMM should handle other corner cases
+  GemmTestbed(int M_,
+              int N_,
+              int K_,
+              int batch_count_,
+              cublasOperation_t layout_a,
+              cublasOperation_t layout_b,
+              Scalar alpha_ = Scalar(1),
+              Scalar beta_ = Scalar(0),
+              cublasGemmAlgo_t algorithm_ = CUBLAS_GEMM_DEFAULT,
+              cublasOperation_t layout_c = CUBLAS_OP_N)
+      : problem_size(K_, N_, M_, batch_count_),
+        layout_A(layout_a),
+        layout_B(layout_b),
+        alpha(alpha_),
+        beta(beta_),
+        algorithm(algorithm_),
+        batch_count(batch_count_) {
+
+    status = cublasCreate(&handle);
+    if (status != CUBLAS_STATUS_SUCCESS) {
+      throw cutlass::cuda_exception("Failed to create CUBLAS handle");
+    }
+
+    resize(A, M_, K_ * batch_count, layout_a);
+    resize(B, K_ * batch_count, N_, layout_b);
+    resize(C_initial, M_, N_ * batch_count, layout_c);
+    resize(ref_host, M_, N_ * batch_count, layout_c);
+    resize(ref_cublas, M_, N_ * batch_count, layout_c);
+    resize(computed, M_, N_ * batch_count, layout_c);
+
+    batch_stride_A = (layout_a == CUBLAS_OP_N) ? M_ * K_ : K_;
+    batch_stride_B = (layout_b == CUBLAS_OP_N) ? K_ : K_ * N_;
+    batch_stride_C = M_ * N_;
+  }
+
+  /// Destructs the GEMM testbed
+  ~GemmTestbed() {
+    if (status != CUBLAS_STATUS_NOT_INITIALIZED) {
+      status = cublasDestroy(handle);
+    }
+  }
 
   /// Returns true if the last CUBLAS call returned successfully
   bool good() const { return status == CUBLAS_STATUS_SUCCESS; }
 
   /// Returns a pointer to the A operand
-  typename HostTensorA::DeviceType* ptr_A() const { return A.device_data(); }
+  typename HostMatrixA::DeviceType* ptr_A() const { return A.device_data(); }
 
   /// Stride of A matrix
-  int lda() const { return std::max(A.stride(HostTensorA::Dim_H), A.stride(HostTensorA::Dim_W)); }
+  int lda() const { return A.leading_dim(); }
 
   /// Returns a pointer to the B operand
-  typename HostTensorB::DeviceType* ptr_B() const { return B.device_data(); }
+  typename HostMatrixB::DeviceType* ptr_B() const { return B.device_data(); }
 
   /// Stride of B matrix
-  int ldb() const { return std::max(B.stride(HostTensorB::Dim_H), B.stride(HostTensorB::Dim_W)); }
+  int ldb() const { return B.leading_dim(); }
 
   /// Returns a pointer to the initial state of the result tensor in device memory
-  typename HostTensorC::DeviceType* ptr_C_initial() const { return C_initial.device_data(); }
+  typename HostMatrixC::DeviceType* ptr_C_initial() const { return C_initial.device_data(); }
 
   /// Returns a pointer to the result tensor in device memory
-  typename HostTensorC::DeviceType* ptr_computed() const { return computed.device_data(); }
+  typename HostMatrixC::DeviceType* ptr_computed() const { return computed.device_data(); }
 
   /// Returns a pointer to the result tensor in device memory
-  typename HostTensorC::DeviceType* ptr_cublas() const { return ref_cublas.device_data(); }
+  typename HostMatrixC::DeviceType* ptr_cublas() const { return ref_cublas.device_data(); }
 
   /// Stride of C matrix
   int ldc() const {
-    return std::max(C_initial.stride(HostTensorC::Dim_H), C_initial.stride(HostTensorC::Dim_W));
+    //return std::max(C_initial.stride(HostTensorC::Dim_H), C_initial.stride(HostTensorC::Dim_W));
+    return C_initial.leading_dim();
   }
 
   /// Returns the number of flops implied by the computation (1 multiply-accumulate = 2 flops)
-  uint64_t flops() const { return uint64_t(M()) * uint64_t(N()) * uint64_t(K()) * 2ULL; }
+  uint64_t flops() const {
+    return uint64_t(batch_count) * uint64_t(M()) * uint64_t(N()) * uint64_t(K()) * 2ULL;
+  }
 
   /// Computes the speed of the computation in GFLOPs/s
   double GFLOPs_per_sec(double runtime_ms) const { return double(flops()) / runtime_ms / 1.0e6; }
@@ -307,53 +516,151 @@ struct GemmTestbed {
   /// Matrix layout of B
   cublasOperation_t layout_b() const { return layout_B; }
 
-  /// Number of rows of problem
-  int M() const { return C_initial.size(HostTensorC::Dim_H); }
+  /// Number of rows of problem, per batch; assumptions made here that we concat C by adding columns
+  int M() const {
+    return problem_size.m();
+  }
 
-  /// Number of columns of problem
-  int N() const { return C_initial.size(HostTensorC::Dim_W); }
+  /// Number of columns of problem, per batch; assumptions made here that we concat C by adding
+  /// columns
+  int N() const {
+    return problem_size.n();
+  }
 
-  /// Number of columns of problem
-  int K() const { return A.size(HostTensorA::Dim_W); }
+  /// Number of columns of problem, per batch; assumptions made here that we concat A by adding
+  /// columns
+  int K() const {
+    return problem_size.k();
+  }
+
+  /// Number of batches
+  int get_batch_count() const {
+    return problem_size.batch();
+  }
+
+  ///
+  long long int get_batch_stride_A() const { return batch_stride_A; }
+
+  ///
+  long long int get_batch_stride_B() const { return batch_stride_B; }
+
+  ///
+  long long int get_batch_stride_C() const { return batch_stride_C; }
+
+  ///
 
   /// Initializes data, randomly
   void initialize(int seed = -1) {
-    A.fill_random(RandomGenerator<AType>(seed));
-    B.fill_random(RandomGenerator<BType>(seed + 11));
-    C_initial.fill_random(RandomGenerator<CType>(seed + 13));
+
+    // Initialize the source matrix with a uniform distribution
+    cutlass::Distribution dist;
+    dist.set_uniform(-8, 8);
+
+    cutlass::reference::host::TensorInitialize(A.host_view(), seed, dist);
+    cutlass::reference::host::TensorInitialize(B.host_view(), seed + 11, dist);
+    cutlass::reference::host::TensorInitialize(C_initial.host_view(), seed + 13, dist);
+
+    A.sync_device();
+    B.sync_device();
+    C_initial.sync_device();
+  }
+
+  /// Initializes binary data
+  void initialize_binary(int seed = -1) {
+    //A.fill_random(RandomBitGenerator<AType>(seed));
+    //B.fill_random(RandomBitGenerator<BType>(seed + 11));
+    //C_initial.fill_random(RandomGenerator<CType>(seed + 13));
+    A.fill_sequential();
+    B.fill_sequential();
+    C_initial.fill(0);
+  }
+
+  /// Initializes integer data (sequential for now)
+  void initialize_integer(int seed =-1) {
+    A.fill_sequential();
+    B.fill_sequential();
+    C_initial.fill(0);
   }
 
   /// Computes the matrix product on the host
   void compute_host() {
     ref_host.fill(C_initial);
-    ref_host.template gemm<AType, BType, Accumulator, Scalar>(A, B, alpha, beta);
+
+    cutlass::reference::host::Gemm(problem_size, alpha, A.host_ref(), B.host_ref(), beta, ref_host.host_ref(), Accumulator(0));
   }
 
   /// Excutes an equivalent GEMM using cuBLAS
   bool execute_cublas() {
-    status = cublasGemmEx(handle,
-                          layout_a(),
-                          layout_b(),
-                          M(),
-                          N(),
-                          K(),
-                          &alpha,
-                          ptr_A(),
-                          cutlass::TypeTraits<AType>::cublas_type,
-                          lda(),
-                          ptr_B(),
-                          cutlass::TypeTraits<BType>::cublas_type,
-                          ldb(),
-                          &beta,
-                          ref_cublas.device_data(),
-                          cutlass::TypeTraits<CType>::cublas_type,
-                          ldc(),
-                          cutlass::TypeTraits<Accumulator>::cublas_type,
-                          algorithm);
+    if (batch_count == 1) {
+      status = cublasGemmEx(handle,
+                            layout_a(),
+                            layout_b(),
+                            M(),
+                            N(),
+                            K(),
+                            &alpha,
+                            ptr_A(),
+                            cutlass::TypeTraits<AType>::cublas_type,
+                            lda(),
+                            ptr_B(),
+                            cutlass::TypeTraits<BType>::cublas_type,
+                            ldb(),
+                            &beta,
+                            ref_cublas.device_data(),
+                            cutlass::TypeTraits<CType>::cublas_type,
+                            ldc(),
+                            cutlass::TypeTraits<Accumulator>::cublas_type,
+                            algorithm);
 
-    return status == CUBLAS_STATUS_SUCCESS;
+      return status == CUBLAS_STATUS_SUCCESS;
+    } else {
+      // call strided batched gemm
+      status = cublasGemmStridedBatchedTemplate(handle,
+                                                layout_a(),
+                                                layout_b(),
+                                                M(),
+                                                N(),
+                                                K(),
+                                                &alpha,
+                                                ptr_A(),
+                                                lda(),
+                                                batch_stride_A,
+                                                ptr_B(),
+                                                ldb(),
+                                                batch_stride_B,
+                                                &beta,
+                                                ref_cublas.device_data(),
+                                                ldc(),
+                                                batch_stride_C,
+                                                batch_count);
+
+      return status == CUBLAS_STATUS_SUCCESS;
+    }
   }
 
+  /// Helper function to use cublasGemmStridedBatched
+  cublasStatus_t cublasGemmStridedBatchedTemplate(cublasHandle_t handle,
+                                                  cublasOperation_t transa,
+                                                  cublasOperation_t transb,
+                                                  int M,
+                                                  int N,
+                                                  int K,
+                                                  const Scalar *alpha,
+                                                  const typename HostMatrixA::DeviceType *ptr_A,
+                                                  int lda,
+                                                  long long int stride_A,
+                                                  const typename HostMatrixB::DeviceType *ptr_B,
+                                                  int ldb,
+                                                  long long int stride_B,
+                                                  const Scalar *beta,
+                                                  typename HostMatrixC::DeviceType *ptr_C,
+                                                  int ldc,
+                                                  long long int stride_C,
+                                                  int batchCount) {
+    return CUBLAS_STATUS_NOT_SUPPORTED;
+  }
+
+
   /// Computes the matrix product using cuBLAS
   void compute_cublas() {
     ref_cublas.fill(C_initial);
@@ -374,8 +681,11 @@ struct GemmTestbed {
        << (layout_b() == CUBLAS_OP_N ? "n" : "t") << "_" << typeid(AType).name() << "_"
        << typeid(BType).name() << "_" << typeid(CType).name() << "_" << typeid(Accumulator).name()
        << "_" << typeid(Scalar).name() << "_" << M() << "x" << N() << "x" << K();
-
-    return ss.str();
+    //make sure there is no space in the ss
+    std::string thisString = ss.str();
+    std::replace(thisString.begin(), thisString.end(), ' ', '_');
+    std::replace(thisString.begin(), thisString.end(), ':', '_');
+    return thisString;
   }
 
   /// Writes the workspace to an ostream
@@ -389,8 +699,8 @@ struct GemmTestbed {
 
   /// Outputs each mismatching element
   std::ostream& write_errors(std::ostream& out,
-                             cutlass::HostTensorView<CType> const& experimental,
-                             cutlass::HostTensorView<CType> const& ref) const {
+                             HostMatrixC const& experimental,
+                             HostMatrixC const& ref) const {
     PrintErrors printer(out, ref, experimental);
 
     computed.visit(printer);
@@ -419,8 +729,8 @@ struct GemmTestbed {
   }
 
   /// Saves the workspace to files
-  void save_workspace(cutlass::HostTensorView<CType> const& experimental,
-                      cutlass::HostTensorView<CType> const& ref) {
+  void save_workspace(HostMatrixC const& experimental,
+                      HostMatrixC const& ref) {
     std::string name = workspace_name();
 
     std::string results_name = name + "_results.txt";
@@ -453,6 +763,7 @@ struct GemmTestbed {
     ref_cublas.sync_host();
     computed.sync_host();
 
+
     bool passed = computed.bit_equals(ref_cublas);
 
     if ((!passed && save_on_error) || always_print) {
@@ -494,22 +805,116 @@ struct GemmTestbed {
   bool has_cublas_support() const { return cutlass::platform::is_same<Accumulator, Scalar>::value; }
 };
 
+//
+//specialization for cublasGemmStridedBatchedTemplate
+template<> inline cublasStatus_t GemmTestbed<float, float, float, float, float>::cublasGemmStridedBatchedTemplate(cublasHandle_t handle,
+                                                                                                    cublasOperation_t transa,
+                                                                                                    cublasOperation_t transb,
+                                                                                                    int M,
+                                                                                                    int N,
+                                                                                                    int K,
+                                                                                                    const float *alpha,
+                                                                                                    const float *ptr_A,
+                                                                                                    int lda,
+                                                                                                    long long int stride_A,
+                                                                                                    const float *ptr_B,
+                                                                                                    int ldb,
+                                                                                                    long long int stride_B,
+                                                                                                    const float *beta,
+                                                                                                    float *ptr_C,
+                                                                                                    int ldc,
+                                                                                                    long long int stride_C,
+                                                                                                    int batchCount) {
+  return cublasSgemmStridedBatched(handle,
+    transa,
+    transb,
+    M, N, K,
+    alpha,
+    ptr_A,
+    lda,
+    stride_A,
+    ptr_B,
+    ldb,
+    stride_B,
+    beta,
+    ptr_C,
+    ldc,
+    stride_C,
+    batchCount);
+}
+
+template<> inline cublasStatus_t GemmTestbed<double, double, double, double, double>::cublasGemmStridedBatchedTemplate(cublasHandle_t handle,
+                                                                                                                cublasOperation_t transa,
+                                                                                                                cublasOperation_t transb,
+                                                                                                                int M,
+                                                                                                                int N,
+                                                                                                                int K,
+                                                                                                                const double *alpha,
+                                                                                                                const double *ptr_A,
+                                                                                                                int lda,
+                                                                                                                long long int stride_A,
+                                                                                                                const double *ptr_B,
+                                                                                                                int ldb,
+                                                                                                                long long int stride_B,
+                                                                                                                const double *beta,
+                                                                                                                double *ptr_C,
+                                                                                                                int ldc,
+                                                                                                                long long int stride_C,
+                                                                                                                int batchCount) {
+  return cublasDgemmStridedBatched(handle,
+    transa,
+    transb,
+    M, N, K,
+    alpha,
+    ptr_A,
+    lda,
+    stride_A,
+    ptr_B,
+    ldb,
+    stride_B,
+    beta,
+    ptr_C,
+    ldc,
+    stride_C,
+    batchCount);
+}
+
+template<> inline cublasStatus_t GemmTestbed<cutlass::half_t, cutlass::half_t, cutlass::half_t, cutlass::half_t, cutlass::half_t>::cublasGemmStridedBatchedTemplate(cublasHandle_t handle,
+                                                                                                      cublasOperation_t transa,
+                                                                                                      cublasOperation_t transb,
+                                                                                                      int M,
+                                                                                                      int N,
+                                                                                                      int K,
+                                                                                                      const cutlass::half_t *alpha,
+                                                                                                      const half *ptr_A,
+                                                                                                      int lda,
+                                                                                                      long long int stride_A,
+                                                                                                      const half *ptr_B,
+                                                                                                      int ldb,
+                                                                                                      long long int stride_B,
+                                                                                                      const cutlass::half_t *beta,
+                                                                                                      half *ptr_C,
+                                                                                                      int ldc,
+                                                                                                      long long int stride_C,
+                                                                                                      int batchCount) {
+  half temp_alpha = alpha->operator half();
+  half temp_beta = beta->operator half();
+  return cublasHgemmStridedBatched(handle,
+    transa,
+    transb,
+    M, N, K,
+    &temp_alpha,
+    ptr_A,
+    lda,
+    stride_A,
+    ptr_B,
+    ldb,
+    stride_B,
+    &temp_beta,
+    ptr_C,
+    ldc,
+    stride_C,
+    batchCount);
+}
+
 }  // namespace test
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-namespace cutlass {
-inline cublasOperation_t convert(cutlass::MatrixLayout::Kind layout) {
-  switch (layout) {
-    case cutlass::MatrixLayout::kRowMajor:
-      return CUBLAS_OP_T;
-    case cutlass::MatrixLayout::kColumnMajor:
-      return CUBLAS_OP_N;
-    default:
-      break;
-  }
-  return CUBLAS_OP_N;
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-}
diff --git a/tools/test/unit/gemm/hgemm_128x128x16.cu b/tools/test/unit/gemm/hgemm_128x128x16.cu
index 1d72971d2..7715cf836 100644
--- a/tools/test/unit/gemm/hgemm_128x128x16.cu
+++ b/tools/test/unit/gemm/hgemm_128x128x16.cu
@@ -22,30 +22,12 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <tools/util/half.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/hgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-TEST(Hgemm_128x128x16, hgemm_2x2x2_nt) {
-  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
-      HgemmTraits;
-  run_gemm<HgemmTraits>(2, 2, 2);
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-TEST(Hgemm_128x128x16, hgemm_128x128x8_nt) {
-  typedef cutlass::gemm::HgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
-      HgemmTraits;
-  run_gemm<HgemmTraits>(128, 128, 8);
-}
+#include "cutlass_unit_test.h"
+#include "tools/util/half.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/hgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/hgemm_128x128x8.cu b/tools/test/unit/gemm/hgemm_128x128x8.cu
index 266cce8a1..341ae2e95 100644
--- a/tools/test/unit/gemm/hgemm_128x128x8.cu
+++ b/tools/test/unit/gemm/hgemm_128x128x8.cu
@@ -22,12 +22,12 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <tools/util/half.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/hgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "tools/util/half.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/hgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/hgemm_128x32x8.cu b/tools/test/unit/gemm/hgemm_128x32x8.cu
index 557415ea6..c9ab620ea 100644
--- a/tools/test/unit/gemm/hgemm_128x32x8.cu
+++ b/tools/test/unit/gemm/hgemm_128x32x8.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/hgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/hgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/hgemm_128x64x8.cu b/tools/test/unit/gemm/hgemm_128x64x8.cu
index ea4968b4e..e1b1540a3 100644
--- a/tools/test/unit/gemm/hgemm_128x64x8.cu
+++ b/tools/test/unit/gemm/hgemm_128x64x8.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/hgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/hgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/igemm_128x128x32.cu b/tools/test/unit/gemm/igemm_128x128x32.cu
index aad3d4929..6c891a45c 100644
--- a/tools/test/unit/gemm/igemm_128x128x32.cu
+++ b/tools/test/unit/gemm/igemm_128x128x32.cu
@@ -22,16 +22,17 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/igemm_traits.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/igemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Igemm_128x128x32, igemm_128x128x4_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 4);
@@ -41,7 +42,7 @@ TEST(Igemm_128x128x32, igemm_128x128x4_nt) {
 
 TEST(Igemm_128x128x32, igemm_128x128x32_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 32);
@@ -51,7 +52,7 @@ TEST(Igemm_128x128x32, igemm_128x128x32_nt) {
 
 TEST(Igemm_128x128x32, igemm_128x128x36_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 36);
@@ -61,7 +62,7 @@ TEST(Igemm_128x128x32, igemm_128x128x36_nt) {
 
 TEST(Igemm_128x128x32, igemm_128x128x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 64);
@@ -71,7 +72,7 @@ TEST(Igemm_128x128x32, igemm_128x128x64_nt) {
 
 TEST(Igemm_128x128x32, igemm_128x128x256_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 256);
@@ -81,7 +82,7 @@ TEST(Igemm_128x128x32, igemm_128x128x256_nt) {
 
 TEST(Igemm_128x128x32, igemm_256x128x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 128, 64);
@@ -91,7 +92,7 @@ TEST(Igemm_128x128x32, igemm_256x128x64_nt) {
 
 TEST(Igemm_128x128x32, igemm_128x256x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 256, 64);
@@ -101,7 +102,7 @@ TEST(Igemm_128x128x32, igemm_128x256x64_nt) {
 
 TEST(Igemm_128x128x32, igemm_256x256x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 256, 64);
@@ -189,6 +190,12 @@ TEST(Igemm_128x128x32, igemm_256x256x64_nn) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+// NB: I have removed tests in which k=1. These result in the test environment definining matrices
+//     in which ld{a,b} = 1 which cannot be launched by cuBLAS.
+//
+// This problem size remains untested. --akerr
+//
+
 TEST(Igemm_128x128x32, igemm_128x128x4_tn) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
@@ -281,7 +288,7 @@ TEST(Igemm_128x128x32, igemm_128x128x4_tt) {
 
 TEST(Igemm_128x128x32, igemm_128x128x32_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 32);
@@ -291,7 +298,7 @@ TEST(Igemm_128x128x32, igemm_128x128x32_tt) {
 
 TEST(Igemm_128x128x32, igemm_128x128x36_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 36);
@@ -301,7 +308,7 @@ TEST(Igemm_128x128x32, igemm_128x128x36_tt) {
 
 TEST(Igemm_128x128x32, igemm_128x128x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 64);
@@ -311,7 +318,7 @@ TEST(Igemm_128x128x32, igemm_128x128x64_tt) {
 
 TEST(Igemm_128x128x32, igemm_128x128x256_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 256);
@@ -321,7 +328,7 @@ TEST(Igemm_128x128x32, igemm_128x128x256_tt) {
 
 TEST(Igemm_128x128x32, igemm_256x128x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 128, 64);
@@ -331,7 +338,7 @@ TEST(Igemm_128x128x32, igemm_256x128x64_tt) {
 
 TEST(Igemm_128x128x32, igemm_128x256x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 256, 64);
@@ -341,7 +348,7 @@ TEST(Igemm_128x128x32, igemm_128x256x64_tt) {
 
 TEST(Igemm_128x128x32, igemm_256x256x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int, cutlass::gemm::LinearScaling<int> >
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 256, 64);
diff --git a/tools/test/unit/gemm/igemm_128x128x32_float.cu b/tools/test/unit/gemm/igemm_128x128x32_float.cu
index 9367e5d37..08b7dbff2 100644
--- a/tools/test/unit/gemm/igemm_128x128x32_float.cu
+++ b/tools/test/unit/gemm/igemm_128x128x32_float.cu
@@ -22,17 +22,17 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/igemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/igemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Igemm_128x128x32_float, igemm_128x128x4_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 4);
@@ -42,7 +42,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x4_nt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x128x32_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 32);
@@ -52,7 +52,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x32_nt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x128x36_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 36);
@@ -62,7 +62,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x36_nt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x128x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 64);
@@ -72,7 +72,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x64_nt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x128x256_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 256);
@@ -82,7 +82,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x256_nt) {
 
 TEST(Igemm_128x128x32_float, igemm_256x128x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 128, 64);
@@ -92,7 +92,7 @@ TEST(Igemm_128x128x32_float, igemm_256x128x64_nt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x256x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 256, 64);
@@ -102,7 +102,7 @@ TEST(Igemm_128x128x32_float, igemm_128x256x64_nt) {
 
 TEST(Igemm_128x128x32_float, igemm_256x256x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 256, 64);
@@ -190,6 +190,12 @@ TEST(Igemm_128x128x32_float, igemm_256x256x64_nn) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+// NB: I have removed tests in which k=1. These result in the test environment definining matrices
+//     in which ld{a,b} = 1 which cannot be launched by cuBLAS.
+//
+// This problem size remains untested. --akerr
+//
+
 TEST(Igemm_128x128x32_float, igemm_128x128x4_tn) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
@@ -282,7 +288,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x4_tt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x128x32_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 32);
@@ -292,7 +298,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x32_tt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x128x36_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 36);
@@ -302,7 +308,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x36_tt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x128x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 64);
@@ -312,7 +318,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x64_tt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x128x256_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 256);
@@ -322,7 +328,7 @@ TEST(Igemm_128x128x32_float, igemm_128x128x256_tt) {
 
 TEST(Igemm_128x128x32_float, igemm_256x128x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 128, 64);
@@ -332,7 +338,7 @@ TEST(Igemm_128x128x32_float, igemm_256x128x64_tt) {
 
 TEST(Igemm_128x128x32_float, igemm_128x256x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 256, 64);
@@ -342,7 +348,7 @@ TEST(Igemm_128x128x32_float, igemm_128x256x64_tt) {
 
 TEST(Igemm_128x128x32_float, igemm_256x256x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, float>
       IgemmTraits;
 
diff --git a/tools/test/unit/gemm/igemm_128x128x32_int8.cu b/tools/test/unit/gemm/igemm_128x128x32_int8.cu
index bf053a6b5..fbf5ca406 100644
--- a/tools/test/unit/gemm/igemm_128x128x32_int8.cu
+++ b/tools/test/unit/gemm/igemm_128x128x32_int8.cu
@@ -22,17 +22,17 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/igemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/igemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Igemm_128x128x32_int8, igemm_128x128x4_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 4);
@@ -42,7 +42,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x4_nt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x128x32_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 32);
@@ -52,7 +52,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x32_nt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x128x36_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 36);
@@ -62,7 +62,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x36_nt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x128x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 64);
@@ -72,7 +72,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x64_nt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x128x256_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 256);
@@ -82,7 +82,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x256_nt) {
 
 TEST(Igemm_128x128x32_int8, igemm_256x128x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 128, 64);
@@ -92,7 +92,7 @@ TEST(Igemm_128x128x32_int8, igemm_256x128x64_nt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x256x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 256, 64);
@@ -102,7 +102,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x256x64_nt) {
 
 TEST(Igemm_128x128x32_int8, igemm_256x256x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 256, 64);
@@ -190,6 +190,14 @@ TEST(Igemm_128x128x32_int8, igemm_256x256x64_nn) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+// NB: I have removed tests in which k=1. These result in the test environment definining matrices
+//     in which ld{a,b} = 1 which cannot be launched by cuBLAS.
+//
+// This problem size remains untested. --akerr
+//
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 TEST(Igemm_128x128x32_int8, igemm_128x128x4_tn) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
@@ -282,7 +290,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x4_tt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x128x32_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 32);
@@ -292,7 +300,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x32_tt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x128x36_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 36);
@@ -302,7 +310,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x36_tt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x128x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 64);
@@ -312,7 +320,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x64_tt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x128x256_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 256);
@@ -322,7 +330,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x128x256_tt) {
 
 TEST(Igemm_128x128x32_int8, igemm_256x128x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 128, 64);
@@ -332,7 +340,7 @@ TEST(Igemm_128x128x32_int8, igemm_256x128x64_tt) {
 
 TEST(Igemm_128x128x32_int8, igemm_128x256x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 256, 64);
@@ -342,7 +350,7 @@ TEST(Igemm_128x128x32_int8, igemm_128x256x64_tt) {
 
 TEST(Igemm_128x128x32_int8, igemm_256x256x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 128, 128>, int8_t>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 256, 64);
diff --git a/tools/test/unit/gemm/igemm_128x32x32.cu b/tools/test/unit/gemm/igemm_128x32x32.cu
index 448d8f03c..dabeb07df 100644
--- a/tools/test/unit/gemm/igemm_128x32x32.cu
+++ b/tools/test/unit/gemm/igemm_128x32x32.cu
@@ -22,17 +22,17 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/igemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/igemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Igemm_128x32x32, igemm_128x32x32x4_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 32, 4);
@@ -42,7 +42,7 @@ TEST(Igemm_128x32x32, igemm_128x32x32x4_nt) {
 
 TEST(Igemm_128x32x32, igemm_128x32x32_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 32, 20);
@@ -52,7 +52,7 @@ TEST(Igemm_128x32x32, igemm_128x32x32_nt) {
 
 TEST(Igemm_128x32x32, igemm_128x32x36_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 32, 36);
@@ -62,7 +62,7 @@ TEST(Igemm_128x32x32, igemm_128x32x36_nt) {
 
 TEST(Igemm_128x32x32, igemm_128x32x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 32, 64);
@@ -72,7 +72,7 @@ TEST(Igemm_128x32x32, igemm_128x32x64_nt) {
 
 TEST(Igemm_128x32x32, igemm_128x32x256_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 32, 256);
@@ -82,7 +82,7 @@ TEST(Igemm_128x32x32, igemm_128x32x256_nt) {
 
 TEST(Igemm_128x32x32, igemm_256x32x64_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 32, 64);
@@ -92,7 +92,7 @@ TEST(Igemm_128x32x32, igemm_256x32x64_nt) {
 
 TEST(Igemm_128x32x32, igemm_128x128x32_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 32);
@@ -102,7 +102,7 @@ TEST(Igemm_128x32x32, igemm_128x128x32_nt) {
 
 TEST(Igemm_128x32x32, igemm_256x128x32_nt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 128, 32);
@@ -190,6 +190,15 @@ TEST(Igemm_128x32x32, igemm_256x128x32_nn) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+// FIXME: This test fails in cuBLAS. I don't know why!!!
+// TEST(Igemm_128x32x32, igemm_128x32x1_tn) {
+//     typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
+//     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<32, 32, 128> > IgemmTraits;
+//     run_gemm<IgemmTraits>(128, 32, 1);
+// }
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 TEST(Igemm_128x32x32, igemm_128x32x4_tn) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
@@ -282,7 +291,7 @@ TEST(Igemm_128x32x32, igemm_128x32x4_tt) {
 
 TEST(Igemm_128x32x32, igemm_128x32x32_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 32, 32);
@@ -292,7 +301,7 @@ TEST(Igemm_128x32x32, igemm_128x32x32_tt) {
 
 TEST(Igemm_128x32x32, igemm_128x32x36_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 32, 36);
@@ -302,7 +311,7 @@ TEST(Igemm_128x32x32, igemm_128x32x36_tt) {
 
 TEST(Igemm_128x32x32, igemm_128x32x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 32, 64);
@@ -312,7 +321,7 @@ TEST(Igemm_128x32x32, igemm_128x32x64_tt) {
 
 TEST(Igemm_128x32x32, igemm_128x32x256_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 32, 256);
@@ -322,7 +331,7 @@ TEST(Igemm_128x32x32, igemm_128x32x256_tt) {
 
 TEST(Igemm_128x32x32, igemm_256x32x64_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 32, 64);
@@ -332,7 +341,7 @@ TEST(Igemm_128x32x32, igemm_256x32x64_tt) {
 
 TEST(Igemm_128x32x32, igemm_128x128x32_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(128, 128, 32);
@@ -342,7 +351,7 @@ TEST(Igemm_128x32x32, igemm_128x128x32_tt) {
 
 TEST(Igemm_128x32x32, igemm_256x128x32_tt) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                     cutlass::MatrixLayout::kRowMajor, 
+                                     cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<32, 32, 128>, int>
       IgemmTraits;
   run_gemm<IgemmTraits>(256, 128, 32);
diff --git a/tools/test/unit/gemm/igemm_128x64x32.cu b/tools/test/unit/gemm/igemm_128x64x32.cu
index 9e080ac40..279daafec 100644
--- a/tools/test/unit/gemm/igemm_128x64x32.cu
+++ b/tools/test/unit/gemm/igemm_128x64x32.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/igemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/igemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
@@ -190,6 +190,15 @@ TEST(Igemm_128x64x32, igemm_256x128x64_nn) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+// FIXME: This test fails in cuBLAS. I don't know why!!!
+// TEST(Igemm_128x64x32, igemm_128x64x1_tn) {
+//     typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
+//     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<32, 64, 128> > IgemmTraits;
+//     run_gemm<IgemmTraits>(128, 64, 1);
+// }
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
 TEST(Igemm_128x64x32, igemm_128x64x4_tn) {
   typedef cutlass::gemm::IgemmTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
diff --git a/tools/test/unit/gemm/igemm_32x32x128.cu b/tools/test/unit/gemm/igemm_32x32x128.cu
index 8af1f4e33..02434572f 100644
--- a/tools/test/unit/gemm/igemm_32x32x128.cu
+++ b/tools/test/unit/gemm/igemm_32x32x128.cu
@@ -22,10 +22,10 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/igemm_traits.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/igemm_traits.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/gemm.h b/tools/test/unit/gemm/integer_gemm.h
similarity index 53%
rename from tools/test/unit/gemm/gemm.h
rename to tools/test/unit/gemm/integer_gemm.h
index 78cdbd11b..18925336b 100644
--- a/tools/test/unit/gemm/gemm.h
+++ b/tools/test/unit/gemm/integer_gemm.h
@@ -23,57 +23,54 @@
 *
 **************************************************************************************************/
 
-#include <cutlass/cutlass.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
+#include "cutlass/cutlass.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
+/// Helper Function to get the number of elements in the scalar.
+template <typename T>
+unsigned getElementsPerScalar() { return 1; }
+
+template<>
+unsigned getElementsPerScalar<cutlass::Vector<cutlass::int4_t, 8> >() { return 8; }
+
+template<>
+unsigned getElementsPerScalar<cutlass::Vector<cutlass::uint4_t, 8> >() { return 8; }
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Function to run GEMM for integer operands
 template <typename GemmTraits_>
-static void run_gemm(
-    int m,
-    int n,
-    int k,
-    int lda,
-    int ldb,
-    int ldc,
-    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type alpha =
-        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(1),
-    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type beta =
-        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(0)) {
+static void run_integer_gemm(int m, int n, int k, int alpha = 1, int beta = 1) {
   typedef cutlass::gemm::Gemm<GemmTraits_> Gemm;
   typename Gemm::Params params;
 
-  test::GemmTestbed<
-      typename test::GemmTestbedTraits<
-          typename GemmTraits_::GemmConfig::ScalarA>::host_type,  // AType
-      typename test::GemmTestbedTraits<
-          typename GemmTraits_::GemmConfig::ScalarB>::host_type,  // BType
-      typename test::GemmTestbedTraits<
-          typename GemmTraits_::Epilogue::ScalarC>::host_type,  // CType
-      typename test::GemmTestbedTraits<
-          typename GemmTraits_::Epilogue::Accumulators::Element>::host_type,  // Accumulator
-      typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type  // Scalar
-      >
+  unsigned const elementsPerScalar =
+      getElementsPerScalar<typename GemmTraits_::GemmConfig::ScalarA>();
+
+  test::GemmTestbed<typename GemmTraits_::GemmConfig::ScalarA, // AType
+                    typename GemmTraits_::GemmConfig::ScalarB, // BType
+                    int, // CType
+                    int, // Accumulator
+                    int // Scalar
+                    >
       testbed(m,
               n,
-              k,
-              lda,
-              ldb,
-              ldc,
-              cutlass::convert(GemmTraits_::kLayoutA),
-              cutlass::convert(GemmTraits_::kLayoutB),
+              k / elementsPerScalar,
+              test::convert(GemmTraits_::kLayoutA),
+              test::convert(GemmTraits_::kLayoutB),
               alpha,
               beta);
 
-  testbed.initialize();
+  // Initializes the input vectors for computation FIXME
+  testbed.initialize_integer();
 
-  if (testbed.has_cublas_support()) {
-    EXPECT_TRUE(testbed.verify_host_with_cublas());
-  }
+  // Compute the reference result on the host (CPU)
+  testbed.compute_host();
 
   params.initialize(testbed.M(),
                     testbed.N(),
-                    testbed.K(),
+                    testbed.K() * elementsPerScalar,
                     testbed.alpha,
                     testbed.ptr_A(),
                     testbed.lda(),
@@ -91,28 +88,8 @@ static void run_gemm(
   ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
                                  << "\n";
 
-  if (testbed.has_cublas_support()) {
-    ASSERT_TRUE(testbed.verify_with_cublas());
-  } else {
-    ASSERT_TRUE(testbed.verify_with_host());
-  }
+  testbed.computed.sync_host();
+
+  // Check the results
+  ASSERT_TRUE(testbed.computed.bit_equals(testbed.ref_host));
 }
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-template <typename GemmTraits_>
-static void run_gemm(
-    int m,
-    int n,
-    int k,
-    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type alpha =
-        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(1),
-    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type beta =
-        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(0)) {
-  int lda = GemmTraits_::kLayoutA == cutlass::MatrixLayout::kColumnMajor ? m : k;
-  int ldb = GemmTraits_::kLayoutB == cutlass::MatrixLayout::kColumnMajor ? k : n;
-
-  run_gemm<GemmTraits_>(m, n, k, lda, ldb, m, alpha, beta);
-}
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/gemm/run_gemm.h b/tools/test/unit/gemm/run_gemm.h
new file mode 100644
index 000000000..debdca5ef
--- /dev/null
+++ b/tools/test/unit/gemm/run_gemm.h
@@ -0,0 +1,244 @@
+/***************************************************************************************************
+* Copyright (c) 2018, NVIDIA CORPORATION.  All rights reserved.
+*
+* Redistribution and use in source and binary forms, with or without modification, are permitted
+* provided that the following conditions are met:
+*     * Redistributions of source code must retain the above copyright notice, this list of
+*       conditions and the following disclaimer.
+*     * Redistributions in binary form must reproduce the above copyright notice, this list of
+*       conditions and the following disclaimer in the documentation and/or other materials
+*       provided with the distribution.
+*     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+*       to endorse or promote products derived from this software without specific prior written
+*       permission.
+*
+* THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+* IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+* FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+* FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+* BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+* OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+* STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+* OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+*
+**************************************************************************************************/
+
+#pragma once
+
+#include "cutlass/cutlass.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+template <typename GemmTraits_>
+static void run_gemm(
+    int m,
+    int n,
+    int k,
+    int lda,
+    int ldb,
+    int ldc,
+    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type alpha =
+        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(1),
+    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type beta =
+        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(0)) {
+
+  typedef typename GemmTraits_::KernelClass Gemm;
+  typename Gemm::Params params;
+
+  test::GemmTestbed<
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::GemmConfig::ScalarA>::host_type,  // AType
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::GemmConfig::ScalarB>::host_type,  // BType
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::Epilogue::ScalarC>::host_type,  // CType
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::Epilogue::Accumulators::Element>::host_type,  // Accumulator
+      typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type  // Scalar
+      >
+      testbed(m,
+              n,
+              k,
+              lda,
+              ldb,
+              ldc,
+              test::convert(GemmTraits_::kLayoutA),
+              test::convert(GemmTraits_::kLayoutB),
+              alpha,
+              beta);
+
+  testbed.initialize();
+
+  if (testbed.has_cublas_support()) {
+    EXPECT_TRUE(testbed.verify_host_with_cublas());
+  }
+
+  params.initialize(testbed.M(),
+                    testbed.N(),
+                    testbed.K(),
+                    testbed.alpha,
+                    testbed.ptr_A(),
+                    testbed.lda(),
+                    testbed.ptr_B(),
+                    testbed.ldb(),
+                    testbed.beta,
+                    testbed.ptr_C_initial(),
+                    testbed.ldc(),
+                    testbed.ptr_computed(),
+                    testbed.ldc());
+
+  Gemm::launch(params);
+
+  cudaError_t result = cudaDeviceSynchronize();
+  ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
+                                 << "\n";
+
+  if (testbed.has_cublas_support()) {
+    ASSERT_TRUE(testbed.verify_with_cublas());
+  } else {
+    ASSERT_TRUE(testbed.verify_with_host());
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename GemmTraits_>
+static void run_gemm(
+    int m,
+    int n,
+    int k,
+    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type alpha =
+        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(1.0f),
+    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type beta =
+        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(0.0f)) {
+  //typedef cutlass::gemm::Gemm<GemmTraits_> Gemm;
+  typedef typename GemmTraits_::KernelClass Gemm;
+  typename Gemm::Params params;
+
+  typedef test::GemmTestbed<
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::GemmConfig::ScalarA>::host_type,  // AType
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::GemmConfig::ScalarB>::host_type,  // BType
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::Epilogue::ScalarC>::host_type,  // CType
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::Epilogue::Accumulators::Element>::host_type,  // Accumulator
+      typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type  // Scalar
+      > GemmTestbed;
+
+  GemmTestbed testbed(m,
+              n,
+              k,
+              test::convert(GemmTraits_::kLayoutA),
+              test::convert(GemmTraits_::kLayoutB),
+              alpha,
+              beta);
+
+  testbed.initialize();
+
+  if (testbed.has_cublas_support()) {
+    EXPECT_TRUE(testbed.verify_host_with_cublas());
+  }
+
+  params.initialize(testbed.M(),
+                    testbed.N(),
+                    testbed.K(),
+                    testbed.alpha,
+                    testbed.ptr_A(),
+                    testbed.lda(),
+                    testbed.ptr_B(),
+                    testbed.ldb(),
+                    testbed.beta,
+                    testbed.ptr_C_initial(),
+                    testbed.ldc(),
+                    testbed.ptr_computed(),
+                    testbed.ldc());
+
+  Gemm::launch(params);
+
+  cudaError_t result = cudaDeviceSynchronize();
+  ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
+                                 << "\n";
+
+  if (testbed.has_cublas_support()) {
+    ASSERT_TRUE(testbed.verify_with_cublas());
+  } else {
+    ASSERT_TRUE(testbed.verify_with_host());
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename GemmTraits_>
+static void run_batched_strided_gemm(
+    int m,
+    int n,
+    int k,
+    int batch_count,
+    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type alpha =
+        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(1),
+    typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type beta =
+        typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type(0)) {
+  //typedef cutlass::gemm::Gemm<GemmTraits_> Gemm;
+  typedef typename GemmTraits_::KernelClass Gemm;
+  typename Gemm::Params params;
+  test::GemmTestbed<
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::GemmConfig::ScalarA>::host_type,  // AType
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::GemmConfig::ScalarB>::host_type,  // BType
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::Epilogue::ScalarC>::host_type,  // CType
+      typename test::GemmTestbedTraits<
+          typename GemmTraits_::Epilogue::Accumulators::Element>::host_type,  // Accumulator
+      typename test::GemmTestbedTraits<typename GemmTraits_::Epilogue::Scalar>::host_type  // Scalar
+      >
+      testbed(m,
+              n,
+              k,
+              batch_count,
+              test::convert(GemmTraits_::kLayoutA),
+              test::convert(GemmTraits_::kLayoutB),
+              alpha,
+              beta);
+
+  testbed.initialize();
+
+  // host support is not implemented for strided batched gemm
+  // if (testbed.has_cublas_support()) {
+  //  EXPECT_TRUE(testbed.verify_host_with_cublas());
+  //}
+
+  params.initialize(testbed.M(),
+                    testbed.N(),
+                    testbed.K(),
+                    testbed.alpha,
+                    testbed.ptr_A(),
+                    testbed.lda(),
+                    testbed.get_batch_stride_A(),
+                    testbed.ptr_B(),
+                    testbed.ldb(),
+                    testbed.get_batch_stride_B(),
+                    testbed.beta,
+                    testbed.ptr_C_initial(),
+                    testbed.ldc(),
+                    testbed.get_batch_stride_C(),
+                    testbed.ptr_computed(),
+                    testbed.ldc(),
+                    testbed.get_batch_stride_C(),
+                    testbed.get_batch_count());
+
+  Gemm::launch(params);
+
+  cudaError_t result = cudaDeviceSynchronize();
+  ASSERT_EQ(result, cudaSuccess) << "\nCUDA kernel launch error: " << cudaGetErrorString(result)
+                                 << "\n";
+
+  if (testbed.has_cublas_support()) {
+    ASSERT_TRUE(testbed.verify_with_cublas());
+  } else {
+    // ASSERT_TRUE(testbed.verify_with_host());
+    ASSERT_TRUE(false) << "host support is not implemented for strided batched gemm" << std::endl;
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/gemm/sgemm_128x128x16.cu b/tools/test/unit/gemm/sgemm_128x128x16.cu
index 234a2d976..40e49980d 100644
--- a/tools/test/unit/gemm/sgemm_128x128x16.cu
+++ b/tools/test/unit/gemm/sgemm_128x128x16.cu
@@ -22,16 +22,16 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x128x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 128, 16);
@@ -40,7 +40,7 @@ TEST(Sgemm_128x128x16, sgemm_128x128x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x81x1_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 81, 1);
@@ -49,7 +49,7 @@ TEST(Sgemm_128x128x16, sgemm_128x81x1_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x112x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 112, 16);
@@ -58,7 +58,7 @@ TEST(Sgemm_128x128x16, sgemm_128x112x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x112x17_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 112, 17);
@@ -67,7 +67,7 @@ TEST(Sgemm_128x128x16, sgemm_128x112x17_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x73x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 73, 16);
@@ -76,7 +76,7 @@ TEST(Sgemm_128x128x16, sgemm_128x73x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_97x112x64_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(97, 112, 64);
@@ -85,7 +85,7 @@ TEST(Sgemm_128x128x16, sgemm_97x112x64_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_256x112x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 112, 16);
@@ -94,7 +94,7 @@ TEST(Sgemm_128x128x16, sgemm_256x112x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x240x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 240, 16);
@@ -103,7 +103,7 @@ TEST(Sgemm_128x128x16, sgemm_128x240x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_256x240x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 240, 16);
@@ -112,7 +112,7 @@ TEST(Sgemm_128x128x16, sgemm_256x240x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x128x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 128, 16);
@@ -121,7 +121,7 @@ TEST(Sgemm_128x128x16, sgemm_128x128x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x112x1_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -131,7 +131,7 @@ TEST(Sgemm_128x128x16, sgemm_128x112x1_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_79x112x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -141,7 +141,7 @@ TEST(Sgemm_128x128x16, sgemm_79x112x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x81x17_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -151,7 +151,7 @@ TEST(Sgemm_128x128x16, sgemm_128x81x17_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x112x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -161,7 +161,7 @@ TEST(Sgemm_128x128x16, sgemm_128x112x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x73x64_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -171,7 +171,7 @@ TEST(Sgemm_128x128x16, sgemm_128x73x64_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_256x112x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -181,7 +181,7 @@ TEST(Sgemm_128x128x16, sgemm_256x112x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x256x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -191,7 +191,7 @@ TEST(Sgemm_128x128x16, sgemm_128x256x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_256x256x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -201,7 +201,7 @@ TEST(Sgemm_128x128x16, sgemm_256x256x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x128x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 128, 16);
@@ -210,7 +210,7 @@ TEST(Sgemm_128x128x16, sgemm_128x128x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x128x1_tn) {
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<16, 128, 128> > SgemmTraits;
     run_gemm<SgemmTraits>(128, 128, 1);
 }
@@ -218,7 +218,7 @@ TEST(Sgemm_128x128x16, sgemm_128x128x1_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_127x112x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -228,7 +228,7 @@ TEST(Sgemm_128x128x16, sgemm_127x112x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_21x112x17_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -238,7 +238,7 @@ TEST(Sgemm_128x128x16, sgemm_21x112x17_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x73x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -248,7 +248,7 @@ TEST(Sgemm_128x128x16, sgemm_128x73x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x81x64_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -258,7 +258,7 @@ TEST(Sgemm_128x128x16, sgemm_128x81x64_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_256x112x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -268,7 +268,7 @@ TEST(Sgemm_128x128x16, sgemm_256x112x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_47x256x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -278,7 +278,7 @@ TEST(Sgemm_128x128x16, sgemm_47x256x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_211x256x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 128, 128> >
       SgemmTraits;
@@ -288,7 +288,7 @@ TEST(Sgemm_128x128x16, sgemm_211x256x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x128x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 128, 16);
@@ -297,7 +297,7 @@ TEST(Sgemm_128x128x16, sgemm_128x128x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x128x1_tt) {
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> > SgemmTraits;
     run_gemm<SgemmTraits>(128, 128, 1);
 }
@@ -305,7 +305,7 @@ TEST(Sgemm_128x128x16, sgemm_128x128x1_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_109x112x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(109, 112, 16);
@@ -314,7 +314,7 @@ TEST(Sgemm_128x128x16, sgemm_109x112x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x112x17_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 112, 17);
@@ -323,7 +323,7 @@ TEST(Sgemm_128x128x16, sgemm_128x112x17_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x112x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 112, 16);
@@ -332,7 +332,7 @@ TEST(Sgemm_128x128x16, sgemm_128x112x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_123x112x64_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(123, 112, 64);
@@ -341,7 +341,7 @@ TEST(Sgemm_128x128x16, sgemm_123x112x64_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_256x112x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 112, 16);
@@ -350,7 +350,7 @@ TEST(Sgemm_128x128x16, sgemm_256x112x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x256x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 256, 16);
@@ -359,7 +359,7 @@ TEST(Sgemm_128x128x16, sgemm_128x256x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_256x256x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 256, 16);
@@ -369,13 +369,12 @@ TEST(Sgemm_128x128x16, sgemm_256x256x16_tt) {
 
 TEST(Sgemm_128x128x16, sgemm_120x112x64_ldg4_nt) {
   // Load 4 floats per LDG for A/B.
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<16, 128, 128>,
                                      cutlass::gemm::LinearScaling<float>,
                                      cutlass::Shape<8, 8, 8>,
-                                     4, 
-                                     4>
+                                     4, 4>
       SgemmTraits;
   run_gemm<SgemmTraits>(120, 112, 64);
 }
@@ -383,7 +382,7 @@ TEST(Sgemm_128x128x16, sgemm_120x112x64_ldg4_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x128x16_alpha2_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 128, 16, 2.f, 0.f);
@@ -392,7 +391,7 @@ TEST(Sgemm_128x128x16, sgemm_128x128x16_alpha2_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x112x16_beta1_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 112, 16, 1.f, 1.f);
@@ -401,7 +400,7 @@ TEST(Sgemm_128x128x16, sgemm_128x112x16_beta1_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x128x16, sgemm_128x112x16_alpha2_beta1_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 112, 16, 2.f, 1.f);
diff --git a/tools/test/unit/gemm/sgemm_128x128x8.cu b/tools/test/unit/gemm/sgemm_128x128x8.cu
index 51f91217b..a9931f340 100644
--- a/tools/test/unit/gemm/sgemm_128x128x8.cu
+++ b/tools/test/unit/gemm/sgemm_128x128x8.cu
@@ -22,11 +22,20 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+ ////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_128x128x8, sgemm_1024x512x8_nt) {
+  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
+    SgemmTraits;
+  run_gemm<SgemmTraits>(1024, 512, 8);
+}
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/sgemm_128x32x16.cu b/tools/test/unit/gemm/sgemm_128x32x16.cu
index 6b5d80210..2886eef5c 100644
--- a/tools/test/unit/gemm/sgemm_128x32x16.cu
+++ b/tools/test/unit/gemm/sgemm_128x32x16.cu
@@ -22,16 +22,16 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x1_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 32, 1);
@@ -40,7 +40,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x1_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 32, 16);
@@ -49,7 +49,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x17_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 32, 17);
@@ -58,7 +58,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x17_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x32_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 32, 32);
@@ -67,7 +67,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x32_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_256x32x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 32, 16);
@@ -76,7 +76,7 @@ TEST(Sgemm_128x32x16, sgemm_256x32x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x64x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 16);
@@ -85,7 +85,7 @@ TEST(Sgemm_128x32x16, sgemm_128x64x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_256x64x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 64, 16);
@@ -94,7 +94,7 @@ TEST(Sgemm_128x32x16, sgemm_256x64x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x1_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -104,7 +104,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x1_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -114,7 +114,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x17_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -124,7 +124,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x17_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x32_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -134,7 +134,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x32_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_256x32x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -144,7 +144,7 @@ TEST(Sgemm_128x32x16, sgemm_256x32x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x64x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -154,7 +154,7 @@ TEST(Sgemm_128x32x16, sgemm_128x64x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_256x64x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -164,7 +164,7 @@ TEST(Sgemm_128x32x16, sgemm_256x64x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x1_tn) {
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<16, 128, 128> > SgemmTraits;
     run_gemm<SgemmTraits>(128, 128, 1);
 }
@@ -172,7 +172,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x1_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -182,7 +182,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x17_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -192,7 +192,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x17_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x32_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -202,7 +202,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x32_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_256x32x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -212,7 +212,7 @@ TEST(Sgemm_128x32x16, sgemm_256x32x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x64x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -222,7 +222,7 @@ TEST(Sgemm_128x32x16, sgemm_128x64x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_256x64x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 32, 128> >
       SgemmTraits;
@@ -232,7 +232,7 @@ TEST(Sgemm_128x32x16, sgemm_256x64x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x1_tt) {
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> > SgemmTraits;
     run_gemm<SgemmTraits>(128, 128, 1);
 }
@@ -240,7 +240,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x1_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 32, 16);
@@ -249,7 +249,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x17_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 32, 17);
@@ -258,7 +258,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x17_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x32x32_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 32, 32);
@@ -267,7 +267,7 @@ TEST(Sgemm_128x32x16, sgemm_128x32x32_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_256x32x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 32, 16);
@@ -276,7 +276,7 @@ TEST(Sgemm_128x32x16, sgemm_256x32x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_128x64x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 16);
@@ -285,7 +285,7 @@ TEST(Sgemm_128x32x16, sgemm_128x64x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x32x16, sgemm_256x64x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 32, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 64, 16);
diff --git a/tools/test/unit/gemm/sgemm_128x32x8.cu b/tools/test/unit/gemm/sgemm_128x32x8.cu
index 9f4c07154..5e7a9f75b 100644
--- a/tools/test/unit/gemm/sgemm_128x32x8.cu
+++ b/tools/test/unit/gemm/sgemm_128x32x8.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/sgemm_128x64x16.cu b/tools/test/unit/gemm/sgemm_128x64x16.cu
index d49f7b19a..5852a6b17 100644
--- a/tools/test/unit/gemm/sgemm_128x64x16.cu
+++ b/tools/test/unit/gemm/sgemm_128x64x16.cu
@@ -22,16 +22,16 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x1_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 1);
@@ -40,7 +40,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x1_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 16);
@@ -49,7 +49,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x17_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 17);
@@ -58,7 +58,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x17_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x64_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 64);
@@ -67,7 +67,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x64_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_256x64x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 64, 16);
@@ -76,7 +76,7 @@ TEST(Sgemm_128x64x16, sgemm_256x64x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x128x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 128, 16);
@@ -85,7 +85,7 @@ TEST(Sgemm_128x64x16, sgemm_128x128x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_256x128x16_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 128, 16);
@@ -94,7 +94,7 @@ TEST(Sgemm_128x64x16, sgemm_256x128x16_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x1_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -104,7 +104,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x1_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x8_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -114,7 +114,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x8_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x17_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -124,7 +124,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x17_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x64_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -134,7 +134,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x64_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_256x64x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -144,7 +144,7 @@ TEST(Sgemm_128x64x16, sgemm_256x64x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x128x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -154,7 +154,7 @@ TEST(Sgemm_128x64x16, sgemm_128x128x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_256x128x16_nn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -164,7 +164,7 @@ TEST(Sgemm_128x64x16, sgemm_256x128x16_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x1_tn) {
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<16, 128, 128> > SgemmTraits;
     run_gemm<SgemmTraits>(128, 128, 1);
 }
@@ -172,7 +172,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x1_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -182,7 +182,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x17_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -192,7 +192,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x17_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x64_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -202,7 +202,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x64_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_256x64x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -212,7 +212,7 @@ TEST(Sgemm_128x64x16, sgemm_256x64x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x128x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -222,7 +222,7 @@ TEST(Sgemm_128x64x16, sgemm_128x128x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_256x128x16_tn) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::Shape<16, 64, 128> >
       SgemmTraits;
@@ -232,7 +232,7 @@ TEST(Sgemm_128x64x16, sgemm_256x128x16_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x1_tt) {
-    typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+    typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 128, 128> > SgemmTraits;
     run_gemm<SgemmTraits>(128, 128, 1);
 }
@@ -240,7 +240,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x1_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 16);
@@ -249,7 +249,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x17_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 17);
@@ -258,7 +258,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x17_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x64x64_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 64);
@@ -267,7 +267,7 @@ TEST(Sgemm_128x64x16, sgemm_128x64x64_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_128x128x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 128, 16);
@@ -276,7 +276,7 @@ TEST(Sgemm_128x64x16, sgemm_128x128x16_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_128x64x16, sgemm_256x128x16_tt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kRowMajor,
                                      cutlass::MatrixLayout::kRowMajor, cutlass::Shape<16, 64, 128> >
       SgemmTraits;
   run_gemm<SgemmTraits>(256, 128, 16);
diff --git a/tools/test/unit/gemm/sgemm_128x64x8.cu b/tools/test/unit/gemm/sgemm_128x64x8.cu
index fc8185dbb..e07c38db3 100644
--- a/tools/test/unit/gemm/sgemm_128x64x8.cu
+++ b/tools/test/unit/gemm/sgemm_128x64x8.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
@@ -348,7 +348,7 @@ TEST(Sgemm_128x64x8, sgemm_128x64x64_4x8_accumulators_nt) {
                                      cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<8, 64, 128>,
                                      cutlass::gemm::LinearScaling<float>,
-                                     cutlass::Shape<8, 8, 4> >
+                                     cutlass::Shape<8, 8, 8> >
       SgemmTraits;
   run_gemm<SgemmTraits>(128, 64, 64);
 }
diff --git a/tools/test/unit/gemm/sgemm_64x128x16.cu b/tools/test/unit/gemm/sgemm_64x128x16.cu
index 5fdeb1f6f..c4afa3414 100644
--- a/tools/test/unit/gemm/sgemm_64x128x16.cu
+++ b/tools/test/unit/gemm/sgemm_64x128x16.cu
@@ -22,16 +22,16 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(Sgemm_64x128x16, sgemm_64x128x64_4x8_accumulators_nt) {
-  typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
+  typedef cutlass::gemm::SgemmLBTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kRowMajor,
                                      cutlass::Shape<16, 128, 64>,
                                      cutlass::gemm::LinearScaling<float>,
diff --git a/tools/test/unit/gemm/sgemm_64x128x8.cu b/tools/test/unit/gemm/sgemm_64x128x8.cu
index 6d3448e0d..e87abd2fb 100644
--- a/tools/test/unit/gemm/sgemm_64x128x8.cu
+++ b/tools/test/unit/gemm/sgemm_64x128x8.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/sgemm_64x32x16.cu b/tools/test/unit/gemm/sgemm_64x32x16.cu
index e0f7841a2..0cb0f2b76 100644
--- a/tools/test/unit/gemm/sgemm_64x32x16.cu
+++ b/tools/test/unit/gemm/sgemm_64x32x16.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/sgemm_64x32x8.cu b/tools/test/unit/gemm/sgemm_64x32x8.cu
index e1ec1aebf..3e8c60aaf 100644
--- a/tools/test/unit/gemm/sgemm_64x32x8.cu
+++ b/tools/test/unit/gemm/sgemm_64x32x8.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/sgemm_64x64x16.cu b/tools/test/unit/gemm/sgemm_64x64x16.cu
index 3dd79e607..45619cef8 100644
--- a/tools/test/unit/gemm/sgemm_64x64x16.cu
+++ b/tools/test/unit/gemm/sgemm_64x64x16.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/sgemm_64x64x8.cu b/tools/test/unit/gemm/sgemm_64x64x8.cu
index 5c373974f..7b02c46db 100644
--- a/tools/test/unit/gemm/sgemm_64x64x8.cu
+++ b/tools/test/unit/gemm/sgemm_64x64x8.cu
@@ -22,11 +22,11 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/sgemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
diff --git a/tools/test/unit/gemm/sgemm_threadblock_swizzle_nn.cu b/tools/test/unit/gemm/sgemm_threadblock_swizzle_nn.cu
new file mode 100644
index 000000000..fab590660
--- /dev/null
+++ b/tools/test/unit/gemm/sgemm_threadblock_swizzle_nn.cu
@@ -0,0 +1,1481 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+#pragma warning( disable : 4503)
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Row Major Swizzle
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_nn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+      cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+      1/*kScalarsPerLdgA*/,
+      1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+      SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_nn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_nn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Row Major Swizzle Boustrophedon
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_nn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_nn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_nn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_RowMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Column Major Swizzle
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_nn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x128x16_nn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_nn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_nn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Column Major Swizzle
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_nn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x128x16_nn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_nn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_nn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nn_ColumnMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+
diff --git a/tools/test/unit/gemm/sgemm_threadblock_swizzle_nt.cu b/tools/test/unit/gemm/sgemm_threadblock_swizzle_nt.cu
new file mode 100644
index 000000000..c436cdf53
--- /dev/null
+++ b/tools/test/unit/gemm/sgemm_threadblock_swizzle_nt.cu
@@ -0,0 +1,1481 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+#pragma warning( disable : 4503)
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Row Major Swizzle
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_nt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+      cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+      1/*kScalarsPerLdgA*/,
+      1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+      SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_nt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_nt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Row Major Swizzle Boustrophedon
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_nt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_nt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_nt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_RowMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Column Major Swizzle
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_nt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x128x16_nt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_nt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_nt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Column Major Swizzle
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_nt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x128x16_nt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_nt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_nt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_nt_ColumnMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+
diff --git a/tools/test/unit/gemm/sgemm_threadblock_swizzle_tn.cu b/tools/test/unit/gemm/sgemm_threadblock_swizzle_tn.cu
new file mode 100644
index 000000000..b8b9f7fdc
--- /dev/null
+++ b/tools/test/unit/gemm/sgemm_threadblock_swizzle_tn.cu
@@ -0,0 +1,1481 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+#pragma warning( disable : 4503)
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Row Major Swizzle
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_tn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+      cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+      1/*kScalarsPerLdgA*/,
+      1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+      SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_tn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_tn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Row Major Swizzle Boustrophedon
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_tn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_tn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_tn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_RowMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Column Major Swizzle
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_tn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x128x16_tn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_tn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_tn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Column Major Swizzle
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_tn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x128x16_tn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_tn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_tn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tn_ColumnMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kColumnMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+
diff --git a/tools/test/unit/gemm/sgemm_threadblock_swizzle_tt.cu b/tools/test/unit/gemm/sgemm_threadblock_swizzle_tt.cu
new file mode 100644
index 000000000..e1ceae68f
--- /dev/null
+++ b/tools/test/unit/gemm/sgemm_threadblock_swizzle_tt.cu
@@ -0,0 +1,1481 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/sgemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
+
+#pragma warning( disable : 4503)
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Row Major Swizzle
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_tt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+      cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+      1/*kScalarsPerLdgA*/,
+      1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+      SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_tt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_tt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Row Major Swizzle Boustrophedon
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_tt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_tt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_tt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_RowMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::RowMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Column Major Swizzle
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_tt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x128x16_tt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_tt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_tt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_groupCol2) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_groupCol3) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::OneDirection>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//Column Major Swizzle
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x128x16_tt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x128x16_tt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 128, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_512x256x16_swizzle, sgemm_128x64x16_tt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(512, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_516x260x16_swizzle, sgemm_128x64x16_tt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 64, 128>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(516, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<1, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_groupCol2_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<2, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1030, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1024x256x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 256, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Sgemm_1030x260x16_swizzle, sgemm_64x32x16_tt_ColumnMajorSwizzle_groupCol3_Boustrophedon) {
+  typedef int index;
+  typedef cutlass::gemm::SgemmConfig<cutlass::Shape<16, 32, 64>/*OutputTile*/,
+    cutlass::Shape<8, 8, 8>/*ThreadGemmShape*/,
+    1/*kScalarsPerLdgA*/,
+    1/*kScalarsPerLdgB*/>
+    thisGemmConfig;
+  typedef cutlass::gemm::GemmTileTraitsHelperA<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperA;
+  typedef cutlass::gemm::GemmTileTraitsHelperB<cutlass::MatrixLayout::kRowMajor, thisGemmConfig>
+    GemmTileTraitsHelperB;
+  typedef cutlass::gemm::SimplifiedGemmTraitsHelper<GemmTileTraitsHelperA, GemmTileTraitsHelperB, index>
+    Helper;
+  typedef cutlass::gemm::LinearScaling<float>
+    EpilogueFunctor;
+  typedef cutlass::gemm::SimplifiedGemmEpilogueTraits<thisGemmConfig, EpilogueFunctor, index>
+    GemmEpilogueTraits;
+  typedef cutlass::gemm::ClearAccumulators<typename thisGemmConfig::Accumulators::Element>
+    ClearAccumulators;
+
+  typedef cutlass::gemm::GemmTraits<
+    thisGemmConfig,
+    typename Helper::GlobalLoadStreamA,
+    typename Helper::GlobalLoadStreamB,
+    typename Helper::SharedLoadStreamA,
+    typename Helper::SharedLoadStreamB,
+    typename cutlass::gemm::GemmEpilogue<GemmEpilogueTraits>,
+    typename cutlass::gemm::ColumnMajorBlockSwizzle<3, cutlass::gemm::swizzleDirection::Boustrophedon>,
+    index,
+    ClearAccumulators
+  >
+    SgemmTraits;
+  //
+  run_gemm<SgemmTraits>(1024, 260, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+
diff --git a/tools/test/unit/gemm/warp_multiply_add_nvcuda.cu b/tools/test/unit/gemm/warp_multiply_add_nvcuda.cu
new file mode 100644
index 000000000..7214e372e
--- /dev/null
+++ b/tools/test/unit/gemm/warp_multiply_add_nvcuda.cu
@@ -0,0 +1,276 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+// Guard conditions around the entire file.
+#if !defined(__CUDA_ARCH__) || __CUDA_ARCH__ >= 700
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#include "cutlass_unit_tests.h"
+#include "tools/util/half.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "cutlass/gemm/warp_multiply_add_nvcuda.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// Tests for Warp-level Multiply Add operation using NvCuda API
+//
+
+namespace test {
+
+///
+template <typename WarpMultiplyAdd>
+__global__ void warp_multiply_add(
+    typename WarpMultiplyAdd::ScalarA const *A,
+    int lda,
+    typename WarpMultiplyAdd::ScalarB const *B,
+    int ldb,
+    typename WarpMultiplyAdd::ScalarC *C, int ldc) {
+
+    typename WarpMultiplyAdd::LoadIteratorA iteratorA(A, lda);
+    typename WarpMultiplyAdd::LoadIteratorB iteratorB(B, ldb);
+    typename WarpMultiplyAdd::StoreIteratorC iteratorC(C, ldc);
+
+    typename WarpMultiplyAdd::FragmentA fragmentA;
+    typename WarpMultiplyAdd::FragmentB fragmentB;
+    typename WarpMultiplyAdd::FragmentC fragmentC;
+
+    iteratorA.load(fragmentA);
+    iteratorB.load(fragmentB);
+
+    fragmentC.clear();
+
+    WarpMultiplyAdd::multiply_add(fragmentC, fragmentA, fragmentB, fragmentC);
+
+    iteratorC.store(fragmentC);
+}
+
+/// Test environment for Warp Multiply Add operation
+template <
+    cutlass::MatrixLayout::Kind LayoutA,
+    cutlass::MatrixLayout::Kind LayoutB,
+    cutlass::MatrixLayout::Kind LayoutC,
+    typename ScalarC,
+    typename WarpTile,
+    typename WmmaTile
+>
+struct TestWarpMultiplyAdd {
+
+    typedef cutlass::gemm::WarpMultiplyAddNvcuda<
+        LayoutA,
+        LayoutB,
+        LayoutC,
+        half,
+        half,
+        ScalarC,
+        WarpTile,
+        cutlass::Shape<1, 1, 1, 1>,
+        WmmaTile
+    > WarpMultiplyAdd;
+
+    /// Testbed type
+    typedef test::GemmTestbed<
+        cutlass::half_t,
+        cutlass::half_t,
+        ScalarC,
+        ScalarC,
+        ScalarC
+    > GemmTestbed;
+
+    //
+    // Data members
+    //
+
+    GemmTestbed testbed;
+
+    //
+    // Methods
+    //
+
+    TestWarpMultiplyAdd(): testbed(
+        WarpTile::kW,   // M
+        WarpTile::kH,   // N
+        WarpTile::kD,   // K
+        cutlass::convert(LayoutA),
+        cutlass::convert(LayoutB),
+        1,
+        0,
+        CUBLAS_GEMM_DEFAULT_TENSOR_OP,
+        cutlass::convert(LayoutC))
+    {
+
+    }
+
+    /// Run
+    void run() {
+        testbed.initialize();
+
+        // launch
+        warp_multiply_add<WarpMultiplyAdd><<<
+            dim3(1,1,1), dim3(32, 1, 1)
+        >>>(
+            testbed.ptr_A(),
+            testbed.lda(),
+            testbed.ptr_B(),
+            testbed.ldb(),
+            testbed.ptr_computed(),
+            testbed.ldc()
+        );
+
+        // verify
+        ASSERT_TRUE(testbed.verify_with_host());
+    }
+};
+
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <
+    typename ScalarC,
+    typename WarpTile,
+    typename WmmaTile
+>
+struct TestWarpMultiplyAddForAllLayouts {
+
+    void run() {
+
+        test::TestWarpMultiplyAdd<
+            cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kColumnMajor,
+            ScalarC,
+            WarpTile,
+            WmmaTile
+        >().run();
+
+        test::TestWarpMultiplyAdd<
+            cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kColumnMajor,
+            ScalarC,
+            WarpTile,
+            WmmaTile
+        >().run();
+
+        test::TestWarpMultiplyAdd<
+            cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kColumnMajor,
+            ScalarC,
+            WarpTile,
+            WmmaTile
+        >().run();
+
+        test::TestWarpMultiplyAdd<
+            cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kColumnMajor,
+            ScalarC,
+            WarpTile,
+            WmmaTile
+        >().run();
+
+
+        test::TestWarpMultiplyAdd<
+            cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kRowMajor,
+            ScalarC,
+            WarpTile,
+            WmmaTile
+        >().run();
+
+        test::TestWarpMultiplyAdd<
+            cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kRowMajor,
+            ScalarC,
+            WarpTile,
+            WmmaTile
+        >().run();
+
+        test::TestWarpMultiplyAdd<
+            cutlass::MatrixLayout::kRowMajor,
+            cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kRowMajor,
+            ScalarC,
+            WarpTile,
+            WmmaTile
+        >().run();
+
+        test::TestWarpMultiplyAdd<
+            cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kColumnMajor,
+            cutlass::MatrixLayout::kRowMajor,
+            ScalarC,
+            WarpTile,
+            WmmaTile
+        >().run();
+    }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// 16x16x16 WMMA Tile Shape with F32 accumulation
+//
+
+TEST(WmmaGemm, WarpMultiplyAdd_f32_16x16x16_16x16x16) {
+    TestWarpMultiplyAddForAllLayouts<
+        float,
+        cutlass::Shape<16, 16, 16>,
+        cutlass::Shape<16, 16, 16>
+    >().run();
+}
+
+TEST(WmmaGemm, WarpMultiplyAdd_f32_16x16x32_16x16x16) {
+    TestWarpMultiplyAddForAllLayouts<
+        float,
+        cutlass::Shape<16, 16, 32>,
+        cutlass::Shape<16, 16, 16>
+    >().run();
+}
+
+TEST(WmmaGemm, WarpMultiplyAdd_f32_16x32x32_16x16x16) {
+    TestWarpMultiplyAddForAllLayouts<
+        float,
+        cutlass::Shape<16, 32, 32>,
+        cutlass::Shape<16, 16, 16>
+    >().run();
+}
+
+TEST(WmmaGemm, WarpMultiplyAdd_f32_16x32x64_16x16x16) {
+    TestWarpMultiplyAddForAllLayouts<
+        float,
+        cutlass::Shape<16, 32, 64>,
+        cutlass::Shape<16, 16, 16>
+    >().run();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#endif
diff --git a/tools/test/unit/gemm/wmma_binary_gemm.cu b/tools/test/unit/gemm/wmma_binary_gemm.cu
new file mode 100644
index 000000000..b545179d5
--- /dev/null
+++ b/tools/test/unit/gemm/wmma_binary_gemm.cu
@@ -0,0 +1,236 @@
+/***************************************************************************************************
+ * Copyright (c) 2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass/wmma_matrix.h"
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/wmma_gemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/binary_gemm.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_32x32x256, wmma_binary_gemm_32x32x256) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<256, 32, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<256, 32, 32>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        32,
+                                        32>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(32, 32, 256);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_32x32x512, wmma_binary_gemm_32x32x512) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<512, 32, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<512, 32, 32>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        32,
+                                        32>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(32, 32, 512);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_64x64x256, wmma_binary_gemm_64x64x256) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<256, 64, 64>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<256, 32, 32>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        32,
+                                        32>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(64, 64, 256);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_64x32x256, wmma_binary_gemm_64x32x256) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<256, 32, 64>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<256, 32, 32>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        32,
+                                        32>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(64, 32, 256);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_32x64x256, wmma_binary_gemm_32x64x256) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<256, 64, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<256, 32, 32>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        32,
+                                        32>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(32, 64, 256);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_128x128x256, wmma_binary_gemm_128x128x256) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<256, 128, 128>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<256, 64, 64>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        128,
+                                        128>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(128, 128, 256);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_128x128x256, wmma_binary_gemm_512x512x256) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<256, 128, 128>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<256, 64, 64>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        32,
+                                        32>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(512, 512, 256);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_32x32x256, wmma_binary_gemm_32x32x512) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<256, 32, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<256, 32, 32>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        32,
+                                        32>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(32, 32, 512);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_32x32x1024, wmma_binary_gemm_128x128x1024) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<1024, 128, 128>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<1024, 32, 32>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        128,
+                                        128>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(128, 128, 1024);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaBinaryGemm_64x32x1024, wmma_binary_gemm_128x128x1024) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<1024, 128, 128>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        cutlass::Vector<cutlass::bin1_t, 32>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<1024, 32, 64>,
+                                        cutlass::Shape<128, 8, 8>,
+                                        128,
+                                        128>
+      WmmaGemmTraits;
+  run_binary_gemm<WmmaGemmTraits>(128, 128, 1024);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#endif // ifdef CUTLASS_USE_SUBBYTE_WMMA
diff --git a/tools/test/unit/gemm/wmma_gemm.cu b/tools/test/unit/gemm/wmma_gemm.cu
index 6db07afce..07cb9bde2 100644
--- a/tools/test/unit/gemm/wmma_gemm.cu
+++ b/tools/test/unit/gemm/wmma_gemm.cu
@@ -22,20 +22,81 @@
  * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
  *
  **************************************************************************************************/
-#include <cutlass/wmma_matrix.h>
+#include "cutlass/wmma_matrix.h"
 #if defined(CUTLASS_USE_WMMA_API)
 
-#include <cutlass_unit_test.h>
-#include <cutlass/gemm/gemm.h>
-#include <cutlass/gemm/wmma_gemm_traits.h>
-#include <tools/test/unit/gemm/gemm_testbed.h>
-#include <tools/test/unit/gemm/gemm.h>
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/wmma_gemm_traits.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/run_gemm.h"
 
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// FP16 accumulation
+//
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm_16x16x32_f16, wmma_gemm_16x16x16_nn) {
+  typedef cutlass::gemm::WmmaGemmTraits<
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<32, 16, 16>,
+    half,
+    half,
+    half,
+    cutlass::gemm::LinearScaling<half>,
+    half
+  >
+  WmmaGemmTraits;
+
+  run_gemm<WmmaGemmTraits>(16, 16, 16);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm_16x16x32_f16, wmma_gemm_16x16x32_nn) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<32, 16, 16>,
+    half,
+    half,
+    half,
+    cutlass::gemm::LinearScaling<half>,
+    half
+  >
+      WmmaGemmTraits;
+  run_gemm<WmmaGemmTraits>(16, 16, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm_128x128x32_f16, wmma_16x16x16_gemm_256x256x128_nn) {
+  typedef cutlass::gemm::WmmaGemmTraits<
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::Shape<32, 128, 128>,
+    half,
+    half,
+    half,
+    cutlass::gemm::LinearScaling<half>,
+    half
+  >
+    WmmaGemmTraits;
+  run_gemm<WmmaGemmTraits>(256, 256, 128);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// FP32 accumulation
+//
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x16_nt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 16, 16> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(16, 16, 16);
@@ -45,7 +106,7 @@ TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x16_nt) {
 
 TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x32_nt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 16, 16> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(16, 16, 32);
@@ -53,9 +114,9 @@ TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x32_nt) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_nt) { 
+TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_nt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 128, 128> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(256, 256, 128);
@@ -64,10 +125,12 @@ TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 #if defined(CUDA_VERSION) && CUDA_VERSION >= 9100
-TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_nt) { 
+TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_nt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 128, 128>,
+                                        half,
+                                        half,
                                         float,
                                         cutlass::gemm::LinearScaling<float>,
                                         float,
@@ -82,10 +145,12 @@ TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_nt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 #if defined(CUDA_VERSION) && CUDA_VERSION >= 9100
-TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_nt) { 
+TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_nt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 128, 128>,
+                                        half,
+                                        half,
                                         float,
                                         cutlass::gemm::LinearScaling<float>,
                                         float,
@@ -100,7 +165,7 @@ TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_nt) {
 
 TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x16_nn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 16, 16> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(16, 16, 16);
@@ -110,7 +175,7 @@ TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x16_nn) {
 
 TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x32_nn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 16, 16> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(16, 16, 32);
@@ -118,9 +183,9 @@ TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x32_nn) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_nn) { 
+TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_nn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 128, 128> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(256, 256, 128);
@@ -129,10 +194,12 @@ TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 #if defined(CUDA_VERSION) && CUDA_VERSION >= 9100
-TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_nn) { 
+TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_nn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 128, 128>,
+                                        half,
+                                        half,
                                         float,
                                         cutlass::gemm::LinearScaling<float>,
                                         float,
@@ -147,10 +214,12 @@ TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_nn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 #if defined(CUDA_VERSION) && CUDA_VERSION >= 9100
-TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_nn) { 
+TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_nn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 128, 128>,
+                                        half,
+                                        half,
                                         float,
                                         cutlass::gemm::LinearScaling<float>,
                                         float,
@@ -165,7 +234,7 @@ TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_nn) {
 
 TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x16_tt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 16, 16> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(16, 16, 16);
@@ -175,7 +244,7 @@ TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x16_tt) {
 
 TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x32_tt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 16, 16> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(16, 16, 32);
@@ -183,9 +252,9 @@ TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x32_tt) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_tt) { 
+TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_tt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 128, 128> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(256, 256, 128);
@@ -194,10 +263,12 @@ TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 #if defined(CUDA_VERSION) && CUDA_VERSION >= 9100
-TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_tt) { 
+TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_tt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 128, 128>,
+                                        half,
+                                        half,
                                         float,
                                         cutlass::gemm::LinearScaling<float>,
                                         float,
@@ -212,10 +283,12 @@ TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_tt) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 #if defined(CUDA_VERSION) && CUDA_VERSION >= 9100
-TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_tt) { 
+TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_tt) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kRowMajor, 
+                                        cutlass::MatrixLayout::kRowMajor,
                                         cutlass::Shape<32, 128, 128>,
+                                        half,
+                                        half,
                                         float,
                                         cutlass::gemm::LinearScaling<float>,
                                         float,
@@ -230,7 +303,7 @@ TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_tt) {
 
 TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x16_tn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 16, 16> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(16, 16, 16);
@@ -240,7 +313,7 @@ TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x16_tn) {
 
 TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x32_tn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 16, 16> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(16, 16, 32);
@@ -248,9 +321,9 @@ TEST(WmmaGemm_16x16x32, wmma_gemm_16x16x32_tn) {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_tn) { 
+TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_tn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 128, 128> >
       WmmaGemmTraits;
   run_gemm<WmmaGemmTraits>(256, 256, 128);
@@ -259,10 +332,12 @@ TEST(WmmaGemm_128x128x32, wmma_16x16x16_gemm_256x256x128_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 #if defined(CUDA_VERSION) && CUDA_VERSION >= 9100
-TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_tn) { 
+TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_tn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 128, 128>,
+                                        half,
+                                        half,
                                         float,
                                         cutlass::gemm::LinearScaling<float>,
                                         float,
@@ -277,10 +352,12 @@ TEST(WmmaGemm_128x128x32, wmma_8x32x16_gemm_256x256x128_tn) {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 #if defined(CUDA_VERSION) && CUDA_VERSION >= 9100
-TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_tn) { 
+TEST(WmmaGemm_128x128x32, wmma_32x8x16_gemm_256x256x128_tn) {
   typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
-                                        cutlass::MatrixLayout::kColumnMajor, 
+                                        cutlass::MatrixLayout::kColumnMajor,
                                         cutlass::Shape<32, 128, 128>,
+                                        half,
+                                        half,
                                         float,
                                         cutlass::gemm::LinearScaling<float>,
                                         float,
diff --git a/tools/test/unit/gemm/wmma_gemm_epilogue.cu b/tools/test/unit/gemm/wmma_gemm_epilogue.cu
new file mode 100644
index 000000000..b7fab2ae9
--- /dev/null
+++ b/tools/test/unit/gemm/wmma_gemm_epilogue.cu
@@ -0,0 +1,446 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+// Guard conditions around the entire file.
+#if !defined(__CUDA_ARCH__) || __CUDA_ARCH__ >= 700
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#include "cutlass_unit_tests.h"
+#include "tools/util/half.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "cutlass/gemm/wmma_gemm_traits.h"
+#include "cutlass/gemm/wmma_gemm_epilogue.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename GemmTraits, typename EpilogueTraits, typename LoadAccumulatorIterator>
+__global__ void test_epilogue_kernel(
+  typename EpilogueTraits::Params params,
+  cutlass::Coord<3> problem,
+  typename EpilogueTraits::AccumulatorScalar *accum_ptr,
+  int ldm) {
+
+  // Shared memory allocation
+  __shared__ typename EpilogueTraits::SharedStorage shared_storage;
+
+  //
+  // Load accumulators from memory - normally, a GEMM would compute these
+  //
+
+  // Traits class defines tiling
+  GemmTraits traits;
+
+  int warp_id = (threadIdx.x / 32);
+  cutlass::Coord<3> warp_offset = traits(warp_id);
+
+  // Accumulator fragment
+  typename EpilogueTraits::AccumulatorFragment accumulator;
+
+  // Construct an out-of-band LoadIterator for accumulators to initialize them
+
+  LoadAccumulatorIterator load_accum_iterator(accum_ptr, ldm, warp_offset);
+  load_accum_iterator.load(accumulator);
+
+  __syncthreads();
+
+  //
+  // Test the epilogue itself
+  //
+
+  typedef cutlass::gemm::WmmaGemmEpilogue<EpilogueTraits> Epilogue;
+
+  Epilogue epilogue(params, problem, warp_offset);
+
+  // Perform the epilogue operation
+  epilogue.update(shared_storage, accumulator);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <
+  typename ThreadBlockTile,
+  typename WarpTile,
+  typename WmmaTile,
+  typename EpilogueTile,
+  typename StreamTile,
+  typename AccumulatorType,
+  typename ScalarC
+>
+struct TestWmmaGemmEpilogue {
+
+  typedef cutlass::gemm::WmmaGemmTraits<
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    ThreadBlockTile,
+    WarpTile,
+    WmmaTile,
+    AccumulatorType,
+    AccumulatorType,
+    1,
+    AccumulatorType,
+    EpilogueTile,
+    StreamTile
+  > Traits;
+
+  // Construct an actual epilogue
+  typedef cutlass::gemm::EpilogueLinearScaling<ScalarC, ScalarC, ScalarC, ScalarC> EpilogueLinearScaling;
+
+  /// Define some traits
+  typedef cutlass::gemm::WmmaGemmEpilogueTraitsBasic<
+    ScalarC,
+    typename Traits::WarpMultiplyAdd::StoreIteratorC,
+    ScalarC,
+    ThreadBlockTile,
+    32 * Traits::Warps::kCount,
+    WarpTile,
+    WmmaTile,
+    EpilogueTile,
+    StreamTile,
+    EpilogueLinearScaling
+  > WmmaGemmEpilogueTraits;
+
+  /// Type alias for EpilogueTraits type
+  typedef typename WmmaGemmEpilogueTraits::Traits EpilogueTraits;
+
+  TestWmmaGemmEpilogue() {
+
+  }
+
+  void run(cutlass::Coord<3> problem) {
+    //
+    // Prepare accumulator tile
+    //
+    cutlass::HostTensor<ScalarC> accumulator_matrix;
+    cutlass::HostTensor<ScalarC> source_matrix;
+    cutlass::HostTensor<ScalarC> destination_matrix;
+
+    accumulator_matrix.resize_matrix(
+      ThreadBlockTile::kW,
+      ThreadBlockTile::kH,
+      cutlass::MatrixLayout::kColumnMajor);
+
+    source_matrix.resize_matrix(
+      problem[2],
+      problem[1],
+      cutlass::MatrixLayout::kColumnMajor);
+
+    destination_matrix.resize_matrix(
+      problem[2],
+      problem[1],
+      cutlass::MatrixLayout::kColumnMajor);
+
+    accumulator_matrix.fill_sequential();
+
+    source_matrix.fill_sequential();
+
+    int value = 0;
+    for (int row = 0; row < ThreadBlockTile::kW; ++row) {
+      for (int col = 0; col < ThreadBlockTile::kH; ++col, ++value) {
+        if (row < problem[2] && col < problem[1]) {
+          source_matrix.at(cutlass::make_Coord(0, row, col, 0)) = ScalarC(value);
+        }
+      }
+    }
+
+    destination_matrix.fill(0);
+
+    //
+    // Launch test kernel
+    //
+    dim3 grid(1,1);
+    dim3 block(32 * Traits::Warps::kCount, 1, 1);
+
+    EpilogueLinearScaling functor;
+    functor.initialize(1, 0);
+
+    typename EpilogueTraits::Params params;
+
+    params.initialize(
+      functor,
+      source_matrix.device_data(),
+      source_matrix.leading_dim(),
+      destination_matrix.device_data(),
+      destination_matrix.leading_dim()
+    );
+
+    test_epilogue_kernel<
+      Traits,
+      EpilogueTraits,
+      typename Traits::WarpMultiplyAdd::LoadIteratorC
+    ><<< grid, block >>>(
+      params,
+      problem,
+      accumulator_matrix.device_data(),
+      accumulator_matrix.leading_dim()
+    );
+
+    destination_matrix.sync_host();
+
+    EXPECT_TRUE(accumulator_matrix.bit_equals(destination_matrix))
+      << "Accumulators:\n" << accumulator_matrix << "\nDestination:\n" << destination_matrix;
+  }
+
+  void run() {
+    run(cutlass::make_Coord(ThreadBlockTile::kD, ThreadBlockTile::kH, ThreadBlockTile::kW));
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Small epilogue
+TEST(WmmaGemm_16x16x16, wmma_epilogue_basic) {
+
+  // GEMM threadblock structure
+  typedef cutlass::Shape<16, 16, 16> ThreadBlockTile;
+  typedef cutlass::Shape<16, 16, 16> WarpTile;
+  typedef cutlass::Shape<16, 16, 16> WmmaTile;
+
+  // Epilogue shapes
+  typedef cutlass::Shape<1, 16, 16> EpilogueTile;
+  typedef cutlass::Shape<1, 16, 16> StreamTile;
+
+  typedef float AccumulatorType;
+  typedef float ScalarC;
+
+  TestWmmaGemmEpilogue<
+    ThreadBlockTile,
+    WarpTile,
+    WmmaTile,
+    EpilogueTile,
+    StreamTile,
+    AccumulatorType,
+    ScalarC
+  >().run();
+}
+
+TEST(WmmaGemm_16x16x16, wmma_epilogue_ragged) {
+
+  // GEMM threadblock structure
+  typedef cutlass::Shape<16, 16, 16> ThreadBlockTile;
+  typedef cutlass::Shape<16, 16, 16> WarpTile;
+  typedef cutlass::Shape<16, 16, 16> WmmaTile;
+
+  // Epilogue shapes
+  typedef cutlass::Shape<1, 16, 16> EpilogueTile;
+  typedef cutlass::Shape<1, 16, 16> StreamTile;
+
+  typedef float AccumulatorType;
+  typedef float ScalarC;
+
+  TestWmmaGemmEpilogue<
+    ThreadBlockTile,
+    WarpTile,
+    WmmaTile,
+    EpilogueTile,
+    StreamTile,
+    AccumulatorType,
+    ScalarC
+  >().run(cutlass::make_Coord(0, 15, 15));
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Small epilogue
+TEST(WmmaGemm_32x32x16, wmma_epilogue_basic_32x32_32x32) {
+
+  // GEMM threadblock structure
+  typedef cutlass::Shape<16, 32, 32> ThreadBlockTile;
+  typedef cutlass::Shape<16, 32, 32> WarpTile;
+  typedef cutlass::Shape<16, 16, 16> WmmaTile;
+
+  // Epilogue shapes
+  typedef cutlass::Shape<1, 32, 32> EpilogueTile;
+  typedef cutlass::Shape<1, 4, 32> StreamTile;
+
+  typedef float AccumulatorType;
+  typedef float ScalarC;
+
+  TestWmmaGemmEpilogue<
+    ThreadBlockTile,
+    WarpTile,
+    WmmaTile,
+    EpilogueTile,
+    StreamTile,
+    AccumulatorType,
+    ScalarC
+  >().run();
+}
+
+/// Small epilogue
+TEST(WmmaGemm_32x32x16, wmma_epilogue_basic_32x32_32x32_ragged) {
+
+  // GEMM threadblock structure
+  typedef cutlass::Shape<16, 32, 32> ThreadBlockTile;
+  typedef cutlass::Shape<16, 32, 32> WarpTile;
+  typedef cutlass::Shape<16, 16, 16> WmmaTile;
+
+  // Epilogue shapes
+  typedef cutlass::Shape<1, 32, 32> EpilogueTile;
+  typedef cutlass::Shape<1, 4, 32> StreamTile;
+
+  typedef float AccumulatorType;
+  typedef float ScalarC;
+
+  TestWmmaGemmEpilogue<
+    ThreadBlockTile,
+    WarpTile,
+    WmmaTile,
+    EpilogueTile,
+    StreamTile,
+    AccumulatorType,
+    ScalarC
+  >().run(cutlass::make_Coord(0, 14, 17));
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Small epilogue
+TEST(WmmaGemm_32x32x16, wmma_epilogue_basic_32x32_16x16) {
+
+  // GEMM threadblock structure
+  typedef cutlass::Shape<16, 32, 32> ThreadBlockTile;
+  typedef cutlass::Shape<16, 16, 16> WarpTile;
+  typedef cutlass::Shape<16, 16, 16> WmmaTile;
+
+  // Epilogue shapes
+  typedef cutlass::Shape<1, 32, 32> EpilogueTile;
+  typedef cutlass::Shape<1, 4, 32> StreamTile;
+
+  typedef float AccumulatorType;
+  typedef float ScalarC;
+
+  TestWmmaGemmEpilogue<
+    ThreadBlockTile,
+    WarpTile,
+    WmmaTile,
+    EpilogueTile,
+    StreamTile,
+    AccumulatorType,
+    ScalarC
+  >().run();
+}
+
+/// Small epilogue
+TEST(WmmaGemm_32x32x16, wmma_epilogue_basic_32x32_16x16_ragged) {
+
+  // GEMM threadblock structure
+  typedef cutlass::Shape<16, 32, 32> ThreadBlockTile;
+  typedef cutlass::Shape<16, 16, 16> WarpTile;
+  typedef cutlass::Shape<16, 16, 16> WmmaTile;
+
+  // Epilogue shapes
+  typedef cutlass::Shape<1, 32, 32> EpilogueTile;
+  typedef cutlass::Shape<1, 4, 32> StreamTile;
+
+  typedef float AccumulatorType;
+  typedef float ScalarC;
+
+  TestWmmaGemmEpilogue<
+    ThreadBlockTile,
+    WarpTile,
+    WmmaTile,
+    EpilogueTile,
+    StreamTile,
+    AccumulatorType,
+    ScalarC
+  >().run(cutlass::make_Coord(0, 23, 19));
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Large epilogue
+TEST(WmmaGemm_128x128x16, wmma_epilogue_basic_32x32_16x16) {
+
+  // GEMM threadblock structure
+  typedef cutlass::Shape<16, 128, 128> ThreadBlockTile;
+  typedef cutlass::Shape<16, 32, 64> WarpTile;
+  typedef cutlass::Shape<16, 16, 16> WmmaTile;
+
+  // Epilogue shapes
+  typedef cutlass::Shape<1, 64, 64> EpilogueTile;
+  typedef cutlass::Shape<1, 4, 64> StreamTile;
+
+  typedef float AccumulatorType;
+  typedef float ScalarC;
+
+  typedef cutlass::gemm::WmmaGemmEpilogueStructure<
+    ThreadBlockTile,
+    EpilogueTile,
+    StreamTile,
+    WarpTile,
+    WmmaTile
+  > Structure;
+
+  TestWmmaGemmEpilogue<
+    ThreadBlockTile,
+    WarpTile,
+    WmmaTile,
+    EpilogueTile,
+    StreamTile,
+    AccumulatorType,
+    ScalarC
+  >().run();
+}
+
+/// Large epilogue
+TEST(WmmaGemm_128x128x16, wmma_epilogue_basic_32x32_16x16_ragged) {
+
+  // GEMM threadblock structure
+  typedef cutlass::Shape<16, 128, 128> ThreadBlockTile;
+  typedef cutlass::Shape<16, 32, 64> WarpTile;
+  typedef cutlass::Shape<16, 16, 16> WmmaTile;
+
+  // Epilogue shapes
+  typedef cutlass::Shape<1, 64, 64> EpilogueTile;
+  typedef cutlass::Shape<1, 4, 64> StreamTile;
+
+  typedef float AccumulatorType;
+  typedef float ScalarC;
+
+  typedef cutlass::gemm::WmmaGemmEpilogueStructure<
+    ThreadBlockTile,
+    EpilogueTile,
+    StreamTile,
+    WarpTile,
+    WmmaTile
+  > Structure;
+
+  TestWmmaGemmEpilogue<
+    ThreadBlockTile,
+    WarpTile,
+    WmmaTile,
+    EpilogueTile,
+    StreamTile,
+    AccumulatorType,
+    ScalarC
+  >().run(cutlass::make_Coord(0, 119, 101));
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#endif // end guard conditional on SM70
diff --git a/tools/test/unit/gemm/wmma_gemm_fragment_stream.cu b/tools/test/unit/gemm/wmma_gemm_fragment_stream.cu
new file mode 100644
index 000000000..446dedcae
--- /dev/null
+++ b/tools/test/unit/gemm/wmma_gemm_fragment_stream.cu
@@ -0,0 +1,504 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+// Guard conditions around the entire file.
+#if !defined(__CUDA_ARCH__) || __CUDA_ARCH__ >= 700
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#include "cutlass_unit_tests.h"
+
+#include "tools/util/half.h"
+#include "tools/util/tensor_view_io.h"
+#include "tools/util/host_tensor.h"
+
+#include "tools/test/unit/gemm/gemm_testbed.h"
+
+#include "cutlass/gemm/gemm_fragment_stream.h"
+#include "cutlass/gemm/warp_multiply_add_nvcuda.h"
+
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace test {
+
+template <typename FragmentStream>
+__global__ void fragment_stream(typename FragmentStream::Params params, half *output) {
+
+  __shared__ typename FragmentStream::Storage storage;
+
+  params.store_params.initialize(storage);
+  FragmentStream stream(
+    params,
+    cutlass::make_Coord(16, 256, 256)
+  );
+
+  // load
+  stream.load();
+
+  // store
+  stream.commit();
+
+  __syncthreads();
+
+  // one thread writes it all out
+  if (threadIdx.x == 0) {
+
+    half const *ptr = reinterpret_cast<half const *>(storage.data());
+
+    CUTLASS_PRAGMA_NO_UNROLL
+    for (int i = 0; i < FragmentStream::Storage::Shape::kCount; ++i) {
+      output[i] = ptr[i];
+    }
+  }
+}
+
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+struct TestGemmDesc {
+  int m, n, k;
+  inline __host__ __device__ TestGemmDesc() : m(0), n(0), k(0) {}
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <
+  typename ThreadBlockTile,
+  cutlass::MatrixLayout::Kind LayoutA,
+  cutlass::MatrixLayout::Kind LayoutB,
+  int Threads,
+  int ScalarsPerAccess
+>
+struct TestGemmFragmentStream {
+
+  /// TileStream for Operand A
+  typedef cutlass::gemm::GemmFragmentStreamTraits<
+    cutlass::gemm::GemmOperand::kA,
+    uint16_t,
+    LayoutA,
+    ThreadBlockTile,
+    Threads,
+    ScalarsPerAccess
+  > FragmentStreamTraitsA;
+
+  /// Defines fragment stream for A operand
+  typedef typename cutlass::gemm::GemmFragmentStream<FragmentStreamTraitsA> FragmentStreamA;
+
+  /// TileStream for Operand B
+  typedef typename cutlass::gemm::GemmFragmentStreamTraits<
+    cutlass::gemm::GemmOperand::kB,
+    uint16_t,
+    LayoutB,
+    ThreadBlockTile,
+    Threads,
+    ScalarsPerAccess
+  > FragmentStreamTraitsB;
+
+  /// Defines fragment stream for A operand
+  typedef typename cutlass::gemm::GemmFragmentStream<FragmentStreamTraitsB> FragmentStreamB;
+
+  //
+  // Data members
+  //
+
+  cutlass::HostTensor<cutlass::half_t> tensor_A_in;
+  cutlass::HostTensor<cutlass::half_t> tensor_A_out;
+
+  cutlass::HostTensor<cutlass::half_t> tensor_B_in;
+  cutlass::HostTensor<cutlass::half_t> tensor_B_out;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  TestGemmFragmentStream() {
+    tensor_A_in.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD, LayoutA);
+    tensor_A_out.resize_matrix(ThreadBlockTile::kW, ThreadBlockTile::kD, LayoutA);
+
+    tensor_B_in.resize_matrix(ThreadBlockTile::kD, ThreadBlockTile::kH, LayoutB);
+    tensor_B_out.resize_matrix(ThreadBlockTile::kD, ThreadBlockTile::kH, LayoutB);
+  }
+
+  /// Writes details about TileStream
+  template <typename TileStream>
+  std::ostream & write(std::ostream &out, typename TileStream::Params const &params) {
+
+    out << "TileStream::LoadIterator\n"
+      << "  Tile(" << TileStream::LoadIterator::Tile::kH << ", "
+      << TileStream::LoadIterator::Tile::kW << ")\n"
+      << "  Delta(" << TileStream::LoadIterator::Steps::kH << ", "
+      << TileStream::LoadIterator::Steps::kW << ")\n"
+      << "  Iterations(" << TileStream::LoadIterator::Iterations::kH << ", "
+      << TileStream::LoadIterator::Iterations::kW << ")\n";
+
+    out
+      << "  stride_h: " << params.load_params.stride_h << "\n"
+      << "  stride_w: " << params.load_params.stride_w << "\n"
+      << "  inc_d: " << params.load_params.inc_d << "\n"
+      << "  inc_h: " << params.load_params.inc_h << "\n"
+      << "  inc_w: " << params.load_params.inc_w << std::endl;
+
+    out << "output elements: " << TileStream::Storage::Shape::kCount << std::endl;
+
+    return out;
+  }
+
+  /// Runs test
+  void run() {
+
+    tensor_A_in.fill_linear(
+        LayoutA == cutlass::MatrixLayout::kColumnMajor ?
+        cutlass::make_Coord(1, 1, ThreadBlockTile::kW, 1) :
+        cutlass::make_Coord(1, ThreadBlockTile::kD, 1, 1));
+
+    tensor_A_out.fill(0);
+
+    tensor_A_in.sync_device();
+    tensor_A_out.sync_device();
+
+    tensor_B_in.fill_linear(
+        LayoutB == cutlass::MatrixLayout::kColumnMajor ?
+        cutlass::make_Coord(1, 1, ThreadBlockTile::kD, 1) :
+        cutlass::make_Coord(1, ThreadBlockTile::kH, 1, 1));
+
+    tensor_B_out.fill(0);
+
+    tensor_B_in.sync_device();
+    tensor_B_out.sync_device();
+
+
+    typename FragmentStreamA::Params params_A;
+    typename FragmentStreamB::Params params_B;
+
+    TestGemmDesc desc;
+    params_A.initialize(
+      desc,
+      reinterpret_cast<uint16_t const *>(tensor_A_in.device_ref().data()),
+      tensor_A_in.leading_dim()
+    );
+
+    params_B.initialize(
+      desc,
+      reinterpret_cast<uint16_t const *>(tensor_A_in.device_ref().data()),
+      tensor_B_in.leading_dim()
+    );
+
+    test::fragment_stream<FragmentStreamA><<< dim3(1,1,1), dim3(Threads,1,1) >>>(
+      params_A,
+      tensor_A_out.device_data()
+    );
+
+    test::fragment_stream<FragmentStreamB><<< dim3(1,1,1), dim3(Threads,1,1) >>>(
+      params_B,
+      tensor_B_out.device_data()
+    );
+
+    tensor_A_out.sync_host();
+    tensor_B_out.sync_host();
+
+    bool passed_A = tensor_A_in.bit_equals(tensor_A_out);
+    bool passed_B = tensor_B_in.bit_equals(tensor_B_out);
+
+    EXPECT_TRUE(passed_A) << tensor_A_out;
+    if (!passed_A) {
+      this->template write<FragmentStreamA>(std::cout, params_A);
+    }
+
+    EXPECT_TRUE(passed_B) << "In: " << tensor_B_in << "\n, Out:\n" << tensor_B_out;
+    if (!passed_B) {
+      this->template write<FragmentStreamB>(std::cout, params_B);
+    }
+  }
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemmFragmentStream, half_32x32x16_col_row) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 32, 32>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    32,
+    2
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half_128x64x16_col_row) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 64, 128>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    32,
+    2
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half_256x128x16_col_row) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    32,
+    1
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    64,
+    2
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    128,
+    4
+  >().run();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemmFragmentStream, half_32x32x16_col_col) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 32, 32>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    32,
+    2
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half_128x64x16_col_col) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 64, 128>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    32,
+    2
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half_256x128x16_col_col) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    32,
+    1
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    64,
+    2
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    128,
+    4
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kColumnMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    128,
+    8
+  >().run();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemmFragmentStream, half_32x32x16_row_col) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 32, 32>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    32,
+    2
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half_128x64x16_row_col) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 64, 128>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    32,
+    2
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half_256x128x16_row_col) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    32,
+    2
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    64,
+    4
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kColumnMajor,
+    128,
+    8
+  >().run();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemmFragmentStream, half_32x32x16_row_row) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 32, 32>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    32,
+    2
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half_128x64x16_row_row) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 64, 128>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    32,
+    2
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half_256x128x16_row_row) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    32,
+    2
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    64,
+    4
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    128,
+    8
+  >().run();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemmFragmentStream, half4_32x32x16_row_row) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 32, 32>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    32,
+    4
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half4_128x64x16_row_row) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 64, 128>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    32,
+    4
+  >().run();
+}
+
+TEST(WmmaGemmFragmentStream, half4_256x128x16_row_row) {
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    32,
+    4
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    64,
+    4
+  >().run();
+
+  TestGemmFragmentStream<
+    cutlass::Shape<16, 128, 256>,
+    cutlass::MatrixLayout::kRowMajor,
+    cutlass::MatrixLayout::kRowMajor,
+    128,
+    8
+  >().run();
+}
+
+#endif
diff --git a/tools/test/unit/gemm/wmma_gemm_multiply_add.cu b/tools/test/unit/gemm/wmma_gemm_multiply_add.cu
new file mode 100644
index 000000000..9ca4df9fa
--- /dev/null
+++ b/tools/test/unit/gemm/wmma_gemm_multiply_add.cu
@@ -0,0 +1,629 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#include "cutlass/wmma_matrix.h"
+
+#ifdef CUTLASS_USE_WMMA_API
+
+#include "cutlass_unit_tests.h"
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/util/half.h"
+
+#include "cutlass/gemm/gemm_global_stream.h"
+#include "cutlass/gemm/gemm_shared_stream.h"
+#include "cutlass/gemm/wmma_gemm_multiply_add.h"
+#include "cutlass/gemm/wmma_gemm_global_tile.h"
+#include "cutlass/gemm/wmma_gemm_shared_tile.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+struct ProblemDesc {
+  int m, n, k;
+  inline __device__ ProblemDesc(int m_, int n_, int k_) : m(m_), n(n_), k(k_) {}
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename StoreIterator_, typename LoadIterator_>
+union SharedStorage {
+  // Storage to store the data.
+  typename StoreIterator_::SharedStorage store;
+  // Storage to load the data.
+  typename LoadIterator_::SharedStorage load;
+};
+
+template <class> struct Debug {};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename Threads_, int kW_, bool = (Threads_::kW > kW_)>
+struct ReshapeThreadsA {
+  typedef cutlass::Shape<Threads_::kD, Threads_::kH, Threads_::kW> Threads;
+};
+
+template <typename Threads_, int kW_>
+struct ReshapeThreadsA<Threads_, kW_, true> {
+  typedef cutlass::Shape<Threads_::kD, Threads_::kH * Threads_::kW / kW_, kW_> Threads;
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename Threads_, int kH_, bool = (Threads_::kW > kH_)>
+struct ReshapeThreadsB {
+  typedef cutlass::Shape<Threads_::kD, Threads_::kH, Threads_::kW> Threads;
+};
+
+template <typename Threads_, int kH_>
+struct ReshapeThreadsB<Threads_, kH_, true> {
+  typedef cutlass::Shape<Threads_::kD, Threads_::kH * Threads_::kW / kH_, kH_> Threads;
+};
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#if 1
+template <typename Traits_>
+static __global__ void kernel_nt(half const *d_a, int lda, half const *d_b, int ldb, float *d_c,
+                                 int ldc) {
+#if 0
+  // The default configuration of threads.
+  typedef cutlass::Shape<1, Warps_::kCount, 32> Threads_;
+  // The threads.
+  typedef typename ReshapeThreadsA<Threads_, OutputTile_::kW>::Threads ThreadsA;
+  // The threads.
+  typedef typename ReshapeThreadsB<Threads_, OutputTile_::kH>::Threads ThreadsB;
+  // The number of elements loaded per LDG.
+  int const kScalarsPerLdg = 1;
+  // The tile for A.
+  typedef cutlass::Shape<1, OutputTile_::kD, OutputTile_::kW> TileA;
+  // The tile for B.
+  typedef cutlass::Shape<1, OutputTile_::kD, OutputTile_::kH> TileB;
+  // The tile for C.
+  typedef cutlass::Shape<1, Warps_::kH*WmmaShape_::kH, OutputTile_::kW> TileC;
+#endif
+
+  // The problem descriptor.
+  ProblemDesc desc(Traits_::OutputTile::kW, Traits_::OutputTile::kH, Traits::OutputTile::kD);
+
+  // The elements computed by a single warp.
+  typedef typename cutlass::ShapeDiv<OutputTile_, Warps_>::Shape AccumulatorsPerWarp;
+
+  // Global memory load for A.
+  typedef cutlass::gemm::GemmGlobalIteratorAb<
+    cutlass::gemm::GemmGlobalIteratorTraits<
+      cutlass::GemmOperand::kA, cutlass::MatrixLayout::kColumnMajor, half const, TileA, ThreadsA, kScalarsPerLdg> 
+    >
+    GlobalLoadIteratorA;
+
+  // Shared store iterator for A.
+  typedef cutlass::gemm::GemmSharedStoreIteratorAb<
+    cutlass::gemm::GemmSharedStoreIteratorAbTraits<
+      half, TileA, ThreadsA, kScalarsPerLdg> 
+    >
+    SharedStoreIteratorA;
+
+  // The global stream for A.
+  typedef cutlass::gemm::GlobalLoadStream<
+    GlobalLoadIteratorA,
+    cutlass::Copy<typename GlobalLoadIteratorA::Fragment>,
+    SharedStoreIteratorA>
+  GlobalLoadStreamA;
+
+  // Shared load iterator for A.
+  typedef cutlass::gemm::WmmaGemmSharedLoadIteratorA<
+    cutlass::gemm::WmmaGemmSharedLoadIteratorAbTraits<
+      cutlass::GemmOperand::kA, 
+      cutlass::MatrixLayout::kColumnMajor, half, OutputTile_, Warps_, WmmaShape_> >
+        SharedLoadIteratorA;
+
+  // Global memory load for B.
+  typedef cutlass::gemm::GemmGlobalIteratorAb<
+    cutlass::gemm::GemmGlobalIteratorTraits<
+      cutlass::GemmOperand::kB, cutlass::MatrixLayout::kRowMajor, half const, TileB, ThreadsB, kScalarsPerLdg> >
+      GlobalLoadIteratorB;
+
+  // Shared store iterator for B.
+  typedef cutlass::gemm::GemmSharedStoreIteratorAb<
+    cutlass::gemm::GemmSharedStoreIteratorAbTraits<
+      half, TileB, ThreadsB, kScalarsPerLdg> >
+      SharedStoreIteratorB;
+
+  // The global stream for B.
+  typedef cutlass::gemm::GlobalLoadStream<GlobalLoadIteratorB,
+                                          cutlass::Copy<typename GlobalLoadIteratorB::Fragment>,
+                                          SharedStoreIteratorB>
+      GlobalLoadStreamB;
+
+  // Shared load iterator for B.
+  typedef cutlass::gemm::WmmaGemmSharedLoadIteratorB<
+    cutlass::gemm::WmmaGemmSharedLoadIteratorAbTraits<
+      cutlass::GemmOperand::kB, 
+      cutlass::MatrixLayout::kRowMajor, half, OutputTile_, Warps_, WmmaShape_> >
+      SharedLoadIteratorB;
+
+  // Share memory to exchange data for A.
+  __shared__ SharedStorage<GlobalLoadStreamA, SharedLoadIteratorA> shared_storage_a;
+
+  // Share memory to exchange data for B.
+  __shared__ SharedStorage<GlobalLoadStreamB, SharedLoadIteratorB> shared_storage_b;
+
+  // Iterator to load A.
+  typename GlobalLoadStreamA::Params global_params_a;
+  global_params_a.initialize(desc, d_a, lda);
+  GlobalLoadStreamA global_load_a(global_params_a, shared_storage_a.store, desc.m, desc.n, desc.k,
+                                  cutlass::make_Coord(0, 0, 0));
+
+  // Iterator to load B.
+  typename GlobalLoadStreamB::Params global_params_b;
+  global_params_b.initialize(desc, d_b, ldb);
+  GlobalLoadStreamB global_load_b(global_params_b, shared_storage_b.store, desc.m, desc.n, desc.k,
+                                  cutlass::make_Coord(0, 0, 0));
+
+  // Load A/B.
+  global_load_a.copy();
+  global_load_b.copy();
+
+  // Copy to shared memory.
+  global_load_a.commit();
+  global_load_b.commit();
+
+  // Make sure the data is in shared memory.
+  __syncthreads();
+
+  // Load iterator A.
+  typename SharedLoadIteratorA::Params shared_params_a;
+  shared_params_a.initialize(desc);
+  SharedLoadIteratorA shared_load_a(shared_params_a, shared_storage_a.load);
+
+  // Load iterator B.
+  typename SharedLoadIteratorB::Params shared_params_b;
+  shared_params_b.initialize(desc);
+  SharedLoadIteratorB shared_load_b(shared_params_b, shared_storage_b.load);
+
+  // Copy A from shared memory.
+  typename SharedLoadIteratorA::Fragment fragment_a;
+  cutlass::gemm::load_shared(shared_load_a, fragment_a);
+
+  // Copy B from shared memory.
+  typename SharedLoadIteratorB::Fragment fragment_b;
+  cutlass::gemm::load_shared(shared_load_b, fragment_b);
+
+  // The functor to do WMMA.
+  typedef cutlass::gemm::WmmaGemmMultiplyAdd<
+    cutlass::MatrixLayout::kColumnMajor, 
+    cutlass::MatrixLayout::kRowMajor, 
+    cutlass::MatrixLayout::kColumnMajor, 
+    float, 
+    AccumulatorsPerWarp, 
+    WmmaShape_> WmmaGemmMultiplyAdd;
+
+  // The output fragment.
+  typename WmmaGemmMultiplyAdd::Accumulators fragment_c;
+  fragment_c.clear();
+
+  // Do the WMMA.
+  WmmaGemmMultiplyAdd multiply_add;
+  multiply_add.multiply_add(fragment_a, fragment_b, fragment_c, fragment_c);
+
+  // Global memory stream to store D.
+  typedef cutlass::gemm::WmmaGemmGlobalIteratorCd<
+    cutlass::gemm::WmmaGemmGlobalIteratorCdTraits<
+      float, TileC, ThreadsA, 1> 
+    >
+    GlobalStoreIteratorD;
+  typedef cutlass::gemm::GlobalStoreStream<GlobalStoreIteratorD> GlobalStoreStreamD;
+
+  // The shared memory to store D.
+  __shared__ typename GlobalStoreStreamD::SharedStorage shared_storage_stream_d;
+
+  // Iterator to store C.
+  typename GlobalStoreStreamD::Params global_params_d;
+  global_params_d.initialize(desc, d_c, ldc);
+  GlobalStoreStreamD global_store_d(global_params_d, shared_storage_stream_d, desc.m, desc.n, desc.k,
+                                  cutlass::make_Coord(0, 0, 0));
+
+  // Shared store iterator/stream for C.
+  typedef cutlass::gemm::WmmaGemmSharedStoreIteratorD<
+    cutlass::gemm::WmmaGemmSharedStoreIteratorDTraits<
+      cutlass::MatrixLayout::kColumnMajor, float, OutputTile_, Warps_, WmmaShape_> >
+    SharedStoreIteratorD;
+  typedef cutlass::gemm::SharedStoreStream<SharedStoreIteratorD> SharedStoreStreamD;
+
+  // Shared load iterator/stream for D.
+  typedef cutlass::gemm::WmmaGemmSharedLoadIteratorD<
+    cutlass::gemm::WmmaGemmSharedLoadIteratorDTraits<
+      float, typename SharedStoreIteratorD::Tile, ThreadsA, 1> >
+    SharedLoadIteratorD;
+  typedef cutlass::gemm::SharedLoadStream<SharedLoadIteratorD> SharedLoadStreamD;
+
+  // The shared memory structure to swizzle D.
+  union SharedStorageD {
+    typename SharedStoreStreamD::SharedStorage store;
+    typename SharedLoadStreamD::SharedStorage load;
+  };
+
+  // The shared memory for D.
+  __shared__ SharedStorageD shared_storage_d;
+
+  // Store iterator D.
+  typename SharedStoreStreamD::Params shared_store_params_d;
+  shared_store_params_d.initialize();
+
+  // Store iterator D.
+  typename SharedLoadStreamD::Params shared_load_params_d;
+  shared_load_params_d.initialize();
+
+  // The number of WMMA in the tile H/W dimension (N/M in GEMM).
+  int const kWmmaPerH = OutputTile_::kH / Warps_::kH / WmmaShape_::kH;
+  int const kWmmaPerW = OutputTile_::kW / Warps_::kW / WmmaShape_::kW;
+
+  // Iterate over the data.
+  for (int i = 0; i < kWmmaPerH; ++i) {
+      // Make sure the shared memory can be written to.
+      __syncthreads();
+
+      // Create the iterator to store to SMEM.
+      SharedStoreStreamD shared_store_d(shared_store_params_d, 
+                                        shared_storage_d.store, 
+                                        fragment_c, 
+                                        i*kWmmaPerW);
+      shared_store_d.copy();
+      shared_store_d.commit();
+
+      // Make sure the shared memory was written.
+      __syncthreads();
+
+      // Create the iterator to load from SMEM.
+      SharedLoadStreamD shared_load_d(shared_load_params_d, shared_storage_d.load);
+      shared_load_d.copy();
+      shared_load_d.commit();
+
+      // Copy the data.
+      cutlass::Copy<typename SharedLoadStreamD::Fragment> copy;
+      copy.transform(shared_load_d.fragment(), global_store_d.fragment());
+
+      // Copy the data to global memory.
+      global_store_d.copy();
+      global_store_d.commit();
+  }
+}
+#else
+template <typename OutputTile_, typename Warps_, typename WmmaShape_>
+static __global__ void kernel_nt(half const *d_a, int lda, half const *d_b, int ldb, float *d_c,
+                                 int ldc) {
+  // The default configuration of threads.
+  typedef cutlass::Shape<1, Warps_::kCount, 32> Threads_;
+  // The threads.
+  typedef typename ReshapeThreadsA<Threads_, OutputTile_::kW>::Threads ThreadsA;
+  // The threads.
+  typedef typename ReshapeThreadsB<Threads_, OutputTile_::kH>::Threads ThreadsB;
+  // The number of elements loaded per LDG.
+  int const kScalarsPerLdg = 1;
+  // The tile for A.
+  typedef cutlass::Shape<1, OutputTile_::kD, OutputTile_::kW> TileA;
+  // The tile for B.
+  typedef cutlass::Shape<1, OutputTile_::kD, OutputTile_::kH> TileB;
+  // The tile for C.
+  typedef cutlass::Shape<1, Warps_::kH*WmmaShape_::kH, OutputTile_::kW> TileC;
+
+  // The problem descriptor.
+  ProblemDesc desc(OutputTile_::kW, OutputTile_::kH, OutputTile_::kD);
+
+  // The elements computed by a single warp.
+  typedef typename cutlass::ShapeDiv<OutputTile_, Warps_>::Shape AccumulatorsPerWarp;
+
+  // Global memory load for A.
+  typedef cutlass::gemm::GemmGlobalIteratorAb<
+    cutlass::gemm::GemmGlobalIteratorTraits<
+      cutlass::GemmOperand::kA, cutlass::MatrixLayout::kColumnMajor, half const, TileA, ThreadsA, kScalarsPerLdg> 
+    >
+    GlobalLoadIteratorA;
+
+  // Shared store iterator for A.
+  typedef cutlass::gemm::GemmSharedStoreIteratorAb<
+    cutlass::gemm::GemmSharedStoreIteratorAbTraits<
+      half, TileA, ThreadsA, kScalarsPerLdg> 
+    >
+    SharedStoreIteratorA;
+
+  // The global stream for A.
+  typedef cutlass::gemm::GlobalLoadStream<
+    GlobalLoadIteratorA,
+    cutlass::Copy<typename GlobalLoadIteratorA::Fragment>,
+    SharedStoreIteratorA>
+  GlobalLoadStreamA;
+
+  // Shared load iterator for A.
+  typedef cutlass::gemm::WmmaGemmSharedLoadIteratorA<
+    cutlass::gemm::WmmaGemmSharedLoadIteratorAbTraits<
+      cutlass::GemmOperand::kA, 
+      cutlass::MatrixLayout::kColumnMajor, half, OutputTile_, Warps_, WmmaShape_> >
+        SharedLoadIteratorA;
+
+  // Global memory load for B.
+  typedef cutlass::gemm::GemmGlobalIteratorAb<
+    cutlass::gemm::GemmGlobalIteratorTraits<
+      cutlass::GemmOperand::kB, cutlass::MatrixLayout::kRowMajor, half const, TileB, ThreadsB, kScalarsPerLdg> >
+      GlobalLoadIteratorB;
+
+  // Shared store iterator for B.
+  typedef cutlass::gemm::GemmSharedStoreIteratorAb<
+    cutlass::gemm::GemmSharedStoreIteratorAbTraits<
+      half, TileB, ThreadsB, kScalarsPerLdg> >
+      SharedStoreIteratorB;
+
+  // The global stream for B.
+  typedef cutlass::gemm::GlobalLoadStream<GlobalLoadIteratorB,
+                                          cutlass::Copy<typename GlobalLoadIteratorB::Fragment>,
+                                          SharedStoreIteratorB>
+      GlobalLoadStreamB;
+
+  // Shared load iterator for B.
+  typedef cutlass::gemm::WmmaGemmSharedLoadIteratorB<
+    cutlass::gemm::WmmaGemmSharedLoadIteratorAbTraits<
+      cutlass::GemmOperand::kB, 
+      cutlass::MatrixLayout::kRowMajor, half, OutputTile_, Warps_, WmmaShape_> >
+      SharedLoadIteratorB;
+
+  // Share memory to exchange data for A.
+  __shared__ SharedStorage<GlobalLoadStreamA, SharedLoadIteratorA> shared_storage_a;
+
+  // Share memory to exchange data for B.
+  __shared__ SharedStorage<GlobalLoadStreamB, SharedLoadIteratorB> shared_storage_b;
+
+  // Iterator to load A.
+  typename GlobalLoadStreamA::Params global_params_a;
+  global_params_a.initialize(desc, d_a, lda);
+  GlobalLoadStreamA global_load_a(global_params_a, shared_storage_a.store, desc.m, desc.n, desc.k,
+                                  cutlass::make_Coord(0, 0, 0));
+
+  // Iterator to load B.
+  typename GlobalLoadStreamB::Params global_params_b;
+  global_params_b.initialize(desc, d_b, ldb);
+  GlobalLoadStreamB global_load_b(global_params_b, shared_storage_b.store, desc.m, desc.n, desc.k,
+                                  cutlass::make_Coord(0, 0, 0));
+
+  // Load A/B.
+  global_load_a.copy();
+  global_load_b.copy();
+
+  // Copy to shared memory.
+  global_load_a.commit();
+  global_load_b.commit();
+
+  // Make sure the data is in shared memory.
+  __syncthreads();
+
+  // Load iterator A.
+  typename SharedLoadIteratorA::Params shared_params_a;
+  shared_params_a.initialize(desc);
+  SharedLoadIteratorA shared_load_a(shared_params_a, shared_storage_a.load);
+
+  // Load iterator B.
+  typename SharedLoadIteratorB::Params shared_params_b;
+  shared_params_b.initialize(desc);
+  SharedLoadIteratorB shared_load_b(shared_params_b, shared_storage_b.load);
+
+  // Copy A from shared memory.
+  typename SharedLoadIteratorA::Fragment fragment_a;
+  cutlass::gemm::load_shared(shared_load_a, fragment_a);
+
+  // Copy B from shared memory.
+  typename SharedLoadIteratorB::Fragment fragment_b;
+  cutlass::gemm::load_shared(shared_load_b, fragment_b);
+
+  // The functor to do WMMA.
+  typedef cutlass::gemm::WmmaGemmMultiplyAdd<
+    cutlass::MatrixLayout::kColumnMajor, 
+    cutlass::MatrixLayout::kRowMajor, 
+    cutlass::MatrixLayout::kColumnMajor, 
+    float, 
+    AccumulatorsPerWarp, 
+    WmmaShape_> WmmaGemmMultiplyAdd;
+
+  // The output fragment.
+  typename WmmaGemmMultiplyAdd::Accumulators fragment_c;
+  fragment_c.clear();
+
+  // Do the WMMA.
+  WmmaGemmMultiplyAdd multiply_add;
+  multiply_add.multiply_add(fragment_a, fragment_b, fragment_c, fragment_c);
+
+  // Global memory stream to store D.
+  typedef cutlass::gemm::WmmaGemmGlobalIteratorCd<
+    cutlass::gemm::WmmaGemmGlobalIteratorCdTraits<
+      float, TileC, ThreadsA, 1> 
+    >
+    GlobalStoreIteratorD;
+  typedef cutlass::gemm::GlobalStoreStream<GlobalStoreIteratorD> GlobalStoreStreamD;
+
+  // The shared memory to store D.
+  __shared__ typename GlobalStoreStreamD::SharedStorage shared_storage_stream_d;
+
+  // Iterator to store C.
+  typename GlobalStoreStreamD::Params global_params_d;
+  global_params_d.initialize(desc, d_c, ldc);
+  GlobalStoreStreamD global_store_d(global_params_d, shared_storage_stream_d, desc.m, desc.n, desc.k,
+                                  cutlass::make_Coord(0, 0, 0));
+
+  // Shared store iterator/stream for C.
+  typedef cutlass::gemm::WmmaGemmSharedStoreIteratorD<
+    cutlass::gemm::WmmaGemmSharedStoreIteratorDTraits<
+      cutlass::MatrixLayout::kColumnMajor, float, OutputTile_, Warps_, WmmaShape_> >
+    SharedStoreIteratorD;
+  typedef cutlass::gemm::SharedStoreStream<SharedStoreIteratorD> SharedStoreStreamD;
+
+  // Shared load iterator/stream for D.
+  typedef cutlass::gemm::WmmaGemmSharedLoadIteratorD<
+    cutlass::gemm::WmmaGemmSharedLoadIteratorDTraits<
+      float, typename SharedStoreIteratorD::Tile, ThreadsA, 1> >
+    SharedLoadIteratorD;
+  typedef cutlass::gemm::SharedLoadStream<SharedLoadIteratorD> SharedLoadStreamD;
+
+  // The shared memory structure to swizzle D.
+  union SharedStorageD {
+    typename SharedStoreStreamD::SharedStorage store;
+    typename SharedLoadStreamD::SharedStorage load;
+  };
+
+  // The shared memory for D.
+  __shared__ SharedStorageD shared_storage_d;
+
+  // Store iterator D.
+  typename SharedStoreStreamD::Params shared_store_params_d;
+  shared_store_params_d.initialize();
+
+  // Store iterator D.
+  typename SharedLoadStreamD::Params shared_load_params_d;
+  shared_load_params_d.initialize();
+
+  // The number of WMMA in the tile H/W dimension (N/M in GEMM).
+  int const kWmmaPerH = OutputTile_::kH / Warps_::kH / WmmaShape_::kH;
+  int const kWmmaPerW = OutputTile_::kW / Warps_::kW / WmmaShape_::kW;
+
+  // Iterate over the data.
+  for (int i = 0; i < kWmmaPerH; ++i) {
+      // Make sure the shared memory can be written to.
+      __syncthreads();
+
+      // Create the iterator to store to SMEM.
+      SharedStoreStreamD shared_store_d(shared_store_params_d, 
+                                        shared_storage_d.store, 
+                                        fragment_c, 
+                                        i*kWmmaPerW);
+      shared_store_d.copy();
+      shared_store_d.commit();
+
+      // Make sure the shared memory was written.
+      __syncthreads();
+
+      // Create the iterator to load from SMEM.
+      SharedLoadStreamD shared_load_d(shared_load_params_d, shared_storage_d.load);
+      shared_load_d.copy();
+      shared_load_d.commit();
+
+      // Copy the data.
+      cutlass::Copy<typename SharedLoadStreamD::Fragment> copy;
+      copy.transform(shared_load_d.fragment(), global_store_d.fragment());
+
+      // Copy the data to global memory.
+      global_store_d.copy();
+      global_store_d.commit();
+  }
+}
+#endif
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename OutputTile_, typename Warps_, typename WmmaShape_>
+void run() {
+  /// Testbed type.
+  typedef test::GemmTestbed<cutlass::half_t, cutlass::half_t, float, float, float> GemmTestbed;
+
+  // Create the testbed.
+  GemmTestbed testbed(OutputTile_::kW,  // M
+                      OutputTile_::kH,  // N
+                      OutputTile_::kD,  // K
+                      cutlass::convert(cutlass::MatrixLayout::kColumnMajor),
+                      cutlass::convert(cutlass::MatrixLayout::kRowMajor), 1, 0,
+                      CUBLAS_GEMM_DEFAULT_TENSOR_OP,
+                      cutlass::convert(cutlass::MatrixLayout::kColumnMajor));
+
+  // Initialize.
+  testbed.initialize();
+
+  // Launch the kernel.
+  kernel_nt<OutputTile_, Warps_, WmmaShape_><<<1, 32*Warps_::kCount>>>(
+      testbed.ptr_A(), testbed.lda(), 
+      testbed.ptr_B(), testbed.ldb(), 
+      testbed.ptr_computed(), testbed.ldc());
+  ASSERT_EQ(cudaSuccess, cudaGetLastError());
+
+  // Make sure it worked as expected.
+  ASSERT_TRUE(testbed.verify_with_host());
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_16x16x16_16x16x16) {
+  run<cutlass::Shape<16, 16, 16>, cutlass::Shape<1, 1, 1>, cutlass::Shape<16, 16, 16> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_16x32x16_16x16x16) {
+  run<cutlass::Shape<16, 32, 16>, cutlass::Shape<1, 1, 1>, cutlass::Shape<16, 16, 16> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_32x16x16_16x16x16) {
+  run<cutlass::Shape<16, 16, 32>, cutlass::Shape<1, 1, 1>, cutlass::Shape<16, 16, 16> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_64x16x16_16x16x16) {
+  run<cutlass::Shape<16, 16, 64>, cutlass::Shape<1, 1, 1>, cutlass::Shape<16, 16, 16> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_64x64x16_16x16x16) {
+  run<cutlass::Shape<16, 64, 64>, cutlass::Shape<1, 1, 1>, cutlass::Shape<16, 16, 16> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_128x128x16_16x16x16) {
+  run<cutlass::Shape<16, 128, 128>, cutlass::Shape<1, 2, 2>, cutlass::Shape<16, 16, 16> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_32x8x16_32x8x16) {
+  run<cutlass::Shape<16, 8, 32>, cutlass::Shape<1, 1, 1>, cutlass::Shape<16, 8, 32> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_128x128x16_32x8x16) {
+  run<cutlass::Shape<16, 128, 128>, cutlass::Shape<1, 2, 2>, cutlass::Shape<16, 8, 32> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_8x32x16_8x32x16) {
+  run<cutlass::Shape<16, 32, 8>, cutlass::Shape<1, 1, 1>, cutlass::Shape<16, 32, 8> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaGemm, multiply_add_f32_128x128x16_8x32x16) {
+  run<cutlass::Shape<16, 128, 128>, cutlass::Shape<1, 2, 2>, cutlass::Shape<16, 32, 8> >();
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#endif  // defined CUTLASS_USE_WMMA_API
diff --git a/tools/test/unit/gemm/wmma_integer_gemm.cu b/tools/test/unit/gemm/wmma_integer_gemm.cu
new file mode 100644
index 000000000..857408c86
--- /dev/null
+++ b/tools/test/unit/gemm/wmma_integer_gemm.cu
@@ -0,0 +1,630 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include "cutlass/wmma_matrix.h"
+#ifdef CUTLASS_USE_SUBBYTE_WMMA
+
+#include "cutlass_unit_test.h"
+#include "cutlass/gemm/gemm.h"
+#include "cutlass/gemm/wmma_gemm_traits.h"
+
+#include "tools/test/unit/gemm/gemm_testbed.h"
+#include "tools/test/unit/gemm/integer_gemm.h"
+
+/*
+    TEST(TestGroup, TestName)
+
+      - TestGroup should follow this template:
+          WmmaIntegerGemm_<CTAShape>_<InstructionShape>_<datatype>_<layout>
+
+      - TestName should follow this template
+          wmma_integer_gemm_<ProblemShape>_{optional additional specifier(s)}
+
+      - Shapes should be specified as MxNxK (opposite to the Shape<> definition which is KxNxM)
+*/
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+//    S4 Integer GEMM Unit Tests
+//
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt4Gemm_32x32x64_8x8x32_s4, wmma_integer_gemm_32x32x64) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<64, 32, 32>,
+                                        cutlass::Vector<cutlass::int4_t, 8>,
+                                        cutlass::Vector<cutlass::int4_t, 8>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<64, 32, 32>,
+                                        cutlass::Shape<32, 8, 8>,
+                                        8,
+                                        8>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 64);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt4Gemm_32x32x256_8x8x32_s4, wmma_integer_gemm_128x128x256) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<256, 128, 128>,
+                                        cutlass::Vector<cutlass::int4_t, 8>,
+                                        cutlass::Vector<cutlass::int4_t, 8>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<256, 32, 32>,
+                                        cutlass::Shape<32, 8, 8>,
+                                        32,
+                                        32>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(128, 128, 256);
+}
+
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+//    U4 Integer GEMM Unit Tests
+//
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt4Gemm_32x32x64_8x8x32_u4, wmma_integer_gemm_32x32x64) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<64, 32, 32>,
+                                        cutlass::Vector<cutlass::uint4_t, 8>,
+                                        cutlass::Vector<cutlass::uint4_t, 8>,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<64, 32, 32>,
+                                        cutlass::Shape<32, 8, 8>,
+                                        8,
+                                        8>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 64);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+//    S8 Integer GEMM Unit Tests
+//
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+//
+//  16x16x16
+//
+
+TEST(WmmaInt8Gemm_32x32x32_16x16x16_s8_tn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 16, 16>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_16x16x16_s8_tt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 16, 16>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_16x16x16_s8_nt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 16, 16>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_16x16x16_s8_nn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 16, 16>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+//
+// 32x8x16
+//
+
+TEST(WmmaInt8Gemm_32x32x32_32x8x16_s8_tn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 8, 32>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_32x8x16_s8_tt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 8, 32>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_32x8x16_s8_nt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 8, 32>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_32x8x16_s8_nn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 8, 32>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+//
+// 8x32x16
+//
+
+TEST(WmmaInt8Gemm_32x32x32_8x32x16_s8_tn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 32, 8>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_8x32x16_s8_tt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 32, 8>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_8x32x16_s8_nt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 32, 8>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_8x32x16_s8_nn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        signed char,
+                                        signed char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 32, 8>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+//    U8 Integer GEMM Unit Tests
+//
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+//
+//  16x16x16
+//
+
+TEST(WmmaInt8Gemm_32x32x32_16x16x16_u8_tn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 16, 16>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_16x16x16_u8_tt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 16, 16>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_16x16x16_u8_nt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 16, 16>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_16x16x16_u8_nn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 16, 16>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+//
+// 32x8x16
+//
+
+TEST(WmmaInt8Gemm_32x32x32_32x8x16_u8_tn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 8, 32>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_32x8x16_u8_tt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 8, 32>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_32x8x16_u8_nt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 8, 32>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_32x8x16_u8_nn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 8, 32>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+//
+// 8x32x16
+//
+
+TEST(WmmaInt8Gemm_32x32x32_8x32x16_u8_tn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 32, 8>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_8x32x16_u8_tt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 32, 8>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_8x32x16_u8_nt, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kRowMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 32, 8>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(WmmaInt8Gemm_32x32x32_8x32x16_u8_nn, wmma_integer_gemm_32x32x32) {
+
+  typedef cutlass::gemm::WmmaGemmTraits<cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::MatrixLayout::kColumnMajor,
+                                        cutlass::Shape<32, 32, 32>,
+                                        unsigned char,
+                                        unsigned char,
+                                        int,
+                                        cutlass::gemm::LinearScaling<int>,
+                                        int,
+                                        cutlass::Shape<32, 32, 32>,
+                                        cutlass::Shape<16, 32, 8>,
+                                        4,
+                                        4>
+      WmmaGemmTraits;
+  run_integer_gemm<WmmaGemmTraits>(32, 32, 32);
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+#endif // ifdef CUTLASS_USE_SUBBYTE_WMMA
diff --git a/tools/test/unit/util/complex.cu b/tools/test/unit/util/complex.cu
new file mode 100644
index 000000000..12d840fdb
--- /dev/null
+++ b/tools/test/unit/util/complex.cu
@@ -0,0 +1,102 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#include <complex>
+
+#include "cutlass_unit_test.h"
+#include "cutlass/util/complex.h"
+#include "tools/util/half.h"
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace test {
+
+  /// Thorough testing for basic complex math operators. Uses std::complex as a reference.
+  template <typename T, int N, int M>
+  struct ComplexOperators {
+    ComplexOperators() {
+      for (int ar = -N; ar <= N; ++ar) {
+        for (int ai = -N; ai <= N; ++ai) {
+          for (int br = -N; br <= N; ++br) {
+            for (int bi = -N; bi <= N; ++bi) {
+
+              cutlass::platform::complex<T> Ae(T(ar) / T(M), T(ai) / T(M));
+              cutlass::platform::complex<T> Be(T(br) / T(M), T(bi) / T(M));
+
+              std::complex<T> Ar(T(ar) / T(M), T(ai) / T(M));
+              std::complex<T> Br(T(br) / T(M), T(bi) / T(M));
+
+              cutlass::platform::complex<T> add_e = Ae + Be;
+              cutlass::platform::complex<T> sub_e = Ae - Be;
+              cutlass::platform::complex<T> mul_e = Ae * Be;
+
+              std::complex<T> add_r = (Ar + Br);
+              std::complex<T> sub_r = (Ar - Br);
+              std::complex<T> mul_r = (Ar * Br);
+
+              EXPECT_EQ(real(add_e), real(add_r));
+              EXPECT_EQ(imag(add_e), imag(add_r));
+
+              EXPECT_EQ(real(sub_e), real(sub_r));
+              EXPECT_EQ(imag(sub_e), imag(sub_r));
+
+              EXPECT_EQ(real(mul_e), real(mul_r));
+              EXPECT_EQ(imag(mul_e), imag(mul_r));
+
+              if (!(br == 0 && bi == 0)) {
+
+                cutlass::platform::complex<T> div_e = Ae * Be;
+                std::complex<T> div_r = Ar * Br;
+
+                EXPECT_EQ(real(div_e), real(div_r));
+                EXPECT_EQ(imag(div_e), imag(div_r));
+              }
+            }
+          }
+        }
+      }
+    }
+  };
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Complex, host_float) {
+  test::ComplexOperators<float, 32, 8> test;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Complex, host_double) {
+  test::ComplexOperators<double, 32, 8> test;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////
+
+TEST(Complex, host_half) {
+  // Fewer test cases since half_t is emulated
+  test::ComplexOperators<cutlass::half_t, 14, 4> test;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/util/host_tensor.cu b/tools/test/unit/util/host_tensor.cu
index aff6648aa..ce3b22489 100644
--- a/tools/test/unit/util/host_tensor.cu
+++ b/tools/test/unit/util/host_tensor.cu
@@ -1,66 +1,342 @@
-/******************************************************************************
-* Copyright (c) 2018, NVIDIA CORPORATION.  All rights reserved.
-*
-* Redistribution and use in source and binary forms, with or without
-* modification, are not permitted.
-*
-* THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND
-* ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
-* WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
-* DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY
-* DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
-* (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
-* LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
-* ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
-* (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
-* SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
-*
-******************************************************************************/
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/* \file
 
-/*! \file
-    \brief Tests for Host_tensor, Host_tensor_view, and Tensor_view
+  \brief Defines unit tests for HostTensor and HostMatrix.
+
+  HostTensor is a utility class for allocating memory on the host and on the selected CUDA device
+  and presenting a TensorView of this memory.
+
+  HostMatrix is new in CUTLASS 1.1 that offers a matrix-like interface to a HostTensor with rank 2.
+  Several examples are shown in this source file.
 */
 
-//#include <gtest/gtest.h>
-#include <cutlass_unit_test.h>
-#include <tools/util/host_tensor.h>
-#include <tools/util/tensor_view_io.h>
+#include "cutlass_unit_test.h"
 
-/// Random number generator
-struct RandomGenerator {
-    RandomGenerator(int seed = 17) {
-        srand(seed);
-    }
+#include "cutlass/matrix_traits.h"
 
-    float operator()() {
-        return float(rand() % 64) / 8.0f;
-    }
-};
+#include "tools/util/tensor_view_io.h"
+#include "tools/util/host_tensor.h"
+#include "tools/util/host_matrix.h"
 
-TEST(HostTensor, gemm) {
+////////////////////////////////////////////////////////////////////////////////////////////////////
 
-    int const M = 16;
-    int const N = 16;
-    int const K = 16;
+namespace test {
 
-    typedef cutlass::HostTensor<float, false> HostTensor;
+/// Kernel to compute a thread's unique coordinate within a CUDA kernel grid and write a value
+/// using a CUTLASS TensorView.
+template <typename TensorView>
+__global__ void fill_sequential(TensorView view) {
 
-    // allocate a host tensor
-    HostTensor A(
-        cutlass::make_Coord(1, K, M, 1)
-    );
+  // Compute the thread's coordinate in the 2D CUDA kernel grid
+  cutlass::Coord<2> coord = cutlass::make_Coord(
+    blockIdx.x * blockDim.x + threadIdx.x,
+    blockIdx.y * blockDim.y + threadIdx.y
+  );
 
-    HostTensor B(
-        cutlass::make_Coord(1, N, K, 1)
-    );
-
-    HostTensor C(
-        cutlass::make_Coord(1, N, M, 1)
-    );
-
-    A.fill_random(RandomGenerator());
-    B.fill_random(RandomGenerator());
-
-    C.gemm<float, float, float, float>(A, B, 1.0f, 0.0f);
+  // Write a value into the view
+  if (view.contains(coord)) {
+    view.at(coord) = coord[0] + view.size(0) * coord[1];
+  }
 }
 
+} // namespace test
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+// This test constructs a CUTLASS HostTensor  with column-major layout.
+TEST(HostTensor, fill_sequential_column_major) {
+
+  int const M = 16;
+  int const N = 32;
+
+  cutlass::Coord<2> bounds = cutlass::make_Coord(M, N);
+
+  // Construct a rank=2 host tensor of size M-by-N with leading dimension M
+  cutlass::HostTensor<
+    int,
+    2,
+    cutlass::MatrixLayout::ColumnMajor> host_tensor(cutlass::make_Coord(M, 1), bounds);
+
+  // Fill it with zeros and synchronize device
+  host_tensor.fill(0);
+  host_tensor.sync_device();
+
+  // Launch a CUDA kernel by obtaining a TensorView of the device memory
+  dim3 block(16, 16);
+  dim3 grid((M + block.x - 1) / block.x, (N + block.y - 1) / block.y);
+
+  test::fill_sequential<<< grid, block >>>(host_tensor.device_view());
+
+  ASSERT_EQ(cudaDeviceSynchronize(), cudaSuccess);
+
+  // Synchronize the host data
+  host_tensor.sync_host();
+
+  // Verify host_tensor contains sequential elements
+  int errors = 0;
+  for (int n = 0; n < N; ++n) {
+    for (int m = 0; m < M; ++m) {
+      int expected = m + n * M;
+      int got = host_tensor.at(cutlass::make_Coord(m, n));
+      if (expected != got) {
+        ++errors;
+      }
+    }
+  }
+
+  EXPECT_EQ(errors, 0) << std::setw(4) << host_tensor << std::endl;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+// This test constructs a CUTLASS HostTensor with column-major interleaved layout
+TEST(HostTensor, fill_sequential_column_major_interleaved) {
+
+  int const M = 16;
+  int const N = 16;
+  int const kInterleave = 4;
+
+  cutlass::Coord<2> bounds = cutlass::make_Coord(M, N);
+
+  // Define a mapping function for column-major interleaved layout
+  typedef cutlass::MatrixLayout::ColumnMajorInterleaved<kInterleave> TensorRefMapFunc;
+
+  // Construct a rank=2 host tensor of size M-by-N
+  cutlass::HostTensor<
+    int,
+    2,
+    TensorRefMapFunc > host_tensor(TensorRefMapFunc::stride(M), bounds);
+
+  // Fill it with zeros and synchronize device
+  host_tensor.fill(0);
+  host_tensor.sync_device();
+
+  // Launch a CUDA kernel by obtaining a TensorView of the device memory
+  dim3 block(16, 16);
+  dim3 grid((M + block.x - 1) / block.x, (N + block.y - 1) / block.y);
+
+  test::fill_sequential<<< grid, block >>>(host_tensor.device_view());
+
+  ASSERT_EQ(cudaDeviceSynchronize(), cudaSuccess);
+
+  // Synchronize the host data
+  host_tensor.sync_host();
+
+  // Verify host_tensor contains sequential elements
+  int errors = 0;
+  for (int n = 0; n < N; ++n) {
+    for (int m = 0; m < M; ++m) {
+      int expected = m + n * M;
+      int got = host_tensor.at(cutlass::make_Coord(m, n));
+      if (got != expected) {
+        ++errors;
+      }
+    }
+  }
+
+  EXPECT_EQ(errors, 0) << std::setw(4) << host_tensor << std::endl;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// cutlass::HostMatrix extends cutlass::HostTensor of rank=2 to facilitate allocate and operating
+// on matrices in device memory.
+//
+// cutlass::HostMatrix<T> accommodates both row-major and column-major matrices with a single
+// leading dimension.
+//
+// The first test demonstrates use of HostMatrix<> in the same circumstances as HostTensor but with
+// simplifcations to the calling interface.
+//
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+// This test constructs a CUTLASS cutlass::HostMatrix  with column-major layout.
+TEST(HostMatrix, fill_sequential_column_major) {
+
+  int const M = 16;
+  int const N = 32;
+  int const ldm = M + 2; // define leading dimension with padding
+
+  cutlass::Coord<2> bounds = cutlass::make_Coord(M, N);
+
+  // Construct a HostMatrix of size M-by-N with leading dimension ldm
+  cutlass::HostMatrix<int> host_matrix(bounds, cutlass::MatrixLayout::kColumnMajor, ldm);
+
+  // Fill it with zeros and synchronize device
+  host_matrix.fill(0);
+  host_matrix.sync_device();
+
+  // Launch a CUDA kernel by obtaining a TensorView of the device memory
+  dim3 block(16, 16);
+  dim3 grid((M + block.x - 1) / block.x, (N + block.y - 1) / block.y);
+
+  test::fill_sequential<<< grid, block >>>(host_matrix.device_view());
+
+  ASSERT_EQ(cudaDeviceSynchronize(), cudaSuccess);
+
+  // Synchronize the host data
+  host_matrix.sync_host();
+
+  // Verify host_matrix contains sequential elements
+  int errors = 0;
+  for (int n = 0; n < N; ++n) {
+    for (int m = 0; m < M; ++m) {
+      int expected = m + n * M;
+      int got = host_matrix.at(cutlass::make_Coord(m, n));
+      if (expected != got) {
+        ++errors;
+      }
+    }
+  }
+
+  EXPECT_EQ(errors, 0) << std::setw(4) << host_matrix << std::endl;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// Previously, cutlass::HostTensorView<> offered a gemm() method defined for the H and W dimensions.
+// The other dimensions were ignored.
+//
+// To improve the interface, we We have moved this into the HostMatrixView<> and HostMatrix<>
+// classes which require rank=2. To accommodate matrix operands of differing layout, we have extracted
+// the host-side GEMM implementation into cutlass::reference::host::Gemm() which can compute the
+// general matrix product of matrices with arbitrary layout.
+//
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+// This test constructs a CUTLASS cutlass::HostMatrix  with column-major layout.
+TEST(HostMatrix, gemm) {
+
+  // Problem size intentionally small, as reference check has complexity O(MNK).
+  int const M = 32;
+  int const N = 16;
+  int const K = 4;
+
+  int const lda = M;
+  int const ldb = N;
+  int const ldc = M;
+
+  // Construct matrix operands
+  cutlass::HostMatrix<int> A(cutlass::make_Coord(M, K), cutlass::MatrixLayout::kColumnMajor, lda);
+  cutlass::HostMatrix<int> B(cutlass::make_Coord(K, N), cutlass::MatrixLayout::kRowMajor, ldb);
+  cutlass::HostMatrix<int> C(cutlass::make_Coord(M, N), cutlass::MatrixLayout::kColumnMajor, ldc);
+
+  A.fill_sequential();
+  B.fill_sequential();
+  C.fill(0);
+
+  int alpha = 1;
+
+  // Compute host-side GEMM reference
+  cutlass::reference::host::Gemm(
+    cutlass::gemm::GemmCoord(K, N, M),
+    alpha,
+    A.host_ref(),
+    B.host_ref(),
+    int(0), // beta
+    C.host_ref());
+
+  // Verify result
+  int errors = 0;
+
+  // Primitive reference implementation for matrix product
+  for (int i = 0; i < M; ++i) {
+    for (int j = 0; j < N; ++j) {
+      int result = 0;
+      for (int k = 0; k < K; ++k) {
+        result += A.at(cutlass::make_Coord(i, k)) * B.at(cutlass::make_Coord(k, j));
+      }
+      if (C.at(cutlass::make_Coord(i, j)) != alpha * result) {
+        ++errors;
+      }
+    }
+  }
+
+  EXPECT_EQ(errors, 0) << "GEMM error\n"
+    << "A =\n" << A << "\nB = \n" << B << "\nC =\n" << C << "\n";
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+// When layout is known at compile time, we may be use the corresponding helper classes to smplify
+// matrix instantiation. The matrix layout becomes part of the type which reduces the StorageRank
+// of the internal stride vector.
+//
+// Apart from specifying the matrix layout at compile time, this test is functionally identical to
+// HostMatrix.gemm.
+//
+TEST(HostMatrix, gemm_compile_time_layout) {
+
+  // Problem size intentionally small, as reference check has complexity O(MNK).
+  int const M = 32;
+  int const N = 16;
+  int const K = 4;
+
+  int const lda = M;
+  int const ldb = N;
+  int const ldc = M;
+
+  // Construct matrix operands
+  cutlass::HostMatrixColumnMajor<int> A(cutlass::make_Coord(M, K), lda);
+  cutlass::HostMatrixRowMajor<int>    B(cutlass::make_Coord(K, N), ldb);
+  cutlass::HostMatrixColumnMajor<int> C(cutlass::make_Coord(M, N), ldc);
+
+  A.fill_sequential();
+  B.fill_sequential();
+  C.fill(0);
+
+  int alpha = 1;
+
+  // Compute host-side GEMM reference
+  cutlass::reference::host::Gemm(
+    cutlass::gemm::GemmCoord(K, N, M),
+    alpha,
+    A.host_ref(),
+    B.host_ref(),
+    int(0), // beta
+    C.host_ref());
+
+  // Verify result
+  int errors = 0;
+
+  // Primitive reference implementation for matrix product
+  for (int i = 0; i < M; ++i) {
+    for (int j = 0; j < N; ++j) {
+      int result = 0;
+      for (int k = 0; k < K; ++k) {
+        result += A.at(cutlass::make_Coord(i, k)) * B.at(cutlass::make_Coord(k, j));
+      }
+      if (C.at(cutlass::make_Coord(i, j)) != alpha * result) {
+        ++errors;
+      }
+    }
+  }
+
+  EXPECT_EQ(errors, 0) << "GEMM error\n"
+    << "A =\n" << A << "\nB = \n" << B << "\nC =\n" << C << "\n";
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/util/tensor_elementwise.cu b/tools/test/unit/util/tensor_elementwise.cu
new file mode 100644
index 000000000..a983a4f4c
--- /dev/null
+++ b/tools/test/unit/util/tensor_elementwise.cu
@@ -0,0 +1,324 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/* \file
+
+  \brief
+
+    These tests initialize host- and device-side tensors according to several random distributions.
+*/
+
+#include "cutlass_unit_test.h"
+
+#include "cutlass/matrix_traits.h"
+
+#include "tools/util/tensor_view_io.h"
+#include "tools/util/host_tensor.h"
+#include "tools/util/host_matrix.h"
+
+#include "tools/util/reference/device/tensor_foreach.h"
+#include "tools/util/reference/device/tensor_elementwise.h"
+
+#include "tools/util/reference/host/tensor_foreach.h"
+#include "tools/util/reference/host/tensor_elementwise.h"
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+#define ENABLE_OUTPUT 0 // Supress output by default.
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorInitialize, uniform_device) {
+
+  // Define the problem size
+  int const M = 517;
+  int const N = 117;
+
+  // Define HostMatrix type
+  typedef cutlass::HostMatrix<float> HostMatrix;
+
+  // Construct the host matrix
+  HostMatrix source(cutlass::MatrixCoord(M, N), cutlass::MatrixLayout::kRowMajor);
+  source.fill(0);
+
+  // Initialize the source matrix with a uniform distribution
+  cutlass::Distribution dist;
+  dist.set_uniform(0, 128, -1);
+
+  // RNG seed is hard-coded for determinism in the test.
+  unsigned seed = 2080;
+
+  cutlass::reference::device::TensorInitialize(source.device_view(), seed, dist);
+
+  source.sync_host();
+
+  if (ENABLE_OUTPUT) {
+    std::ofstream result("TensorInitialize_uniform_device.csv");
+
+    for (int i = 0; i < M; ++i) {
+      for (int j = 0; j < N; ++j) {
+        result << source.at(cutlass::make_Coord(i, j)) << "\n";
+      }
+    }
+  }
+}
+
+TEST(TensorInitialize, uniform_host) {
+
+  // Define the problem size
+  int const M = 517;
+  int const N = 117;
+
+  bool const kDeviceBacked = false;
+
+  // Define HostMatrix type
+  typedef cutlass::HostMatrix<float> HostMatrix;
+
+  // Construct the host matrix
+  HostMatrix source(cutlass::MatrixCoord(M, N), cutlass::MatrixLayout::kRowMajor, kDeviceBacked);
+  source.fill(0);
+
+  // Initialize the source matrix with a uniform distribution
+  cutlass::Distribution dist;
+  dist.set_uniform(0, 128, -1);
+
+  // RNG seed is hard-coded for determinism in the test.
+  unsigned seed = 2080;
+
+  cutlass::reference::host::TensorInitialize(source.host_view(), seed, dist);
+
+  if (ENABLE_OUTPUT) {
+    std::ofstream result("TensorInitialize_uniform_host.csv");
+
+    for (int i = 0; i < M; ++i) {
+      for (int j = 0; j < N; ++j) {
+        result << source.at(cutlass::make_Coord(i, j)) << "\n";
+      }
+    }
+  }
+}
+
+TEST(TensorInitialize, gaussian_device) {
+
+  // Define the problem size
+  int const M = 517;
+  int const N = 117;
+
+
+  // Define HostMatrix type
+  typedef cutlass::HostMatrix<float> HostMatrix;
+
+  // Construct the host matrix
+  HostMatrix source(cutlass::MatrixCoord(M, N), cutlass::MatrixLayout::kRowMajor);
+  source.fill(0);
+
+  // Initialize the source matrix with a uniform distribution
+  cutlass::Distribution dist;
+  dist.set_gaussian(1, 2, -1);
+
+  // RNG seed is hard-coded for determinism in the test.
+  unsigned seed = 2080;
+
+  cutlass::reference::device::TensorInitialize(source.device_view(), seed, dist);
+
+  source.sync_host();
+
+  if (ENABLE_OUTPUT) {
+    std::ofstream result("TensorInitialize_gaussian_device.csv");
+
+    for (int i = 0; i < M; ++i) {
+      for (int j = 0; j < N; ++j) {
+        result << source.at(cutlass::make_Coord(i, j)) << "\n";
+      }
+    }
+  }
+}
+
+TEST(TensorInitialize, gaussian_host) {
+  // Define the problem size
+  int const M = 517;
+  int const N = 117;
+
+  bool const kDeviceBacked = false;
+
+  // Define HostMatrix type
+  typedef cutlass::HostMatrix<float> HostMatrix;
+
+  // Construct the host matrix
+  HostMatrix source(cutlass::MatrixCoord(M, N), cutlass::MatrixLayout::kRowMajor, kDeviceBacked);
+  source.fill(0);
+
+  // Initialize the source matrix with a uniform distribution
+  cutlass::Distribution dist;
+  dist.set_gaussian(1, 2, -1);
+
+  // RNG seed is hard-coded for determinism in the test.
+  unsigned seed = 2080;
+
+  cutlass::reference::host::TensorInitialize(source.host_view(), seed, dist);
+
+  if (ENABLE_OUTPUT) {
+    std::ofstream result("TensorInitialize_gaussian_host.csv");
+
+    for (int i = 0; i < M; ++i) {
+      for (int j = 0; j < N; ++j) {
+        result << source.at(cutlass::make_Coord(i, j)) << "\n";
+      }
+    }
+  }
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// Interleaved matrix layouts
+//
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorInitialize, interleaved_gaussian_device) {
+
+  // Define the problem size
+  int const M = 512;
+  int const N = 128;
+
+  // Define a mapping function for column-major interleaved layout
+  int const kInterleave = 4;
+  typedef cutlass::MatrixLayout::ColumnMajorInterleaved<kInterleave> TensorRefMapFunc;
+
+  // Construct a rank=2 host tensor of size M-by-N
+  cutlass::HostTensor<
+    float,
+    2,
+    TensorRefMapFunc > source(TensorRefMapFunc::stride(M), cutlass::make_Coord(M, N));
+
+  source.fill(0);
+
+  // Initialize the source matrix with a uniform distribution
+  cutlass::Distribution dist;
+  dist.set_gaussian(1, 2, -1);
+
+  // RNG seed is hard-coded for determinism in the test.
+  unsigned seed = 2080;
+
+  cutlass::reference::device::TensorInitialize(source.device_view(), seed, dist);
+
+  source.sync_host();
+
+  if (ENABLE_OUTPUT) {
+    std::ofstream result("TensorInitialize_interleaved_gaussian_device.csv");
+
+    for (int i = 0; i < M; ++i) {
+      for (int j = 0; j < N; ++j) {
+        result << source.at(cutlass::make_Coord(i, j)) << "\n";
+      }
+    }
+  }
+}
+
+TEST(TensorInitialize, interleaved_gaussian_host) {
+  // Define the problem size
+  int const M = 512;
+  int const N = 128;
+
+  bool const kDeviceBacked = false;
+
+  // Define a mapping function for column-major interleaved layout
+  int const kInterleave = 4;
+  typedef cutlass::MatrixLayout::ColumnMajorInterleaved<kInterleave> TensorRefMapFunc;
+
+  // Construct a rank=2 host tensor of size M-by-N
+  cutlass::HostTensor<
+    float,
+    2,
+    TensorRefMapFunc > source(TensorRefMapFunc::stride(M), cutlass::make_Coord(M, N), kDeviceBacked);
+
+  // Construct the host matrix
+  source.fill(0);
+
+  // Initialize the source matrix with a uniform distribution
+  cutlass::Distribution dist;
+  dist.set_gaussian(1, 2, -1);
+
+  // RNG seed is hard-coded for determinism in the test.
+  unsigned seed = 2080;
+
+  cutlass::reference::host::TensorInitialize(source.host_view(), seed, dist);
+
+  if (ENABLE_OUTPUT) {
+    std::ofstream result("TensorInitialize_interleaved_gaussian_host.csv");
+
+    for (int i = 0; i < M; ++i) {
+      for (int j = 0; j < N; ++j) {
+        result << source.at(cutlass::make_Coord(i, j)) << "\n";
+      }
+    }
+  }
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// Comparison operator
+//
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+TEST(TensorEquals, interleaved_device) {
+
+  // Define the problem size
+  int const M = 512;
+  int const N = 128;
+
+  // Define a mapping function for column-major interleaved layout
+  int const kInterleave = 4;
+  typedef cutlass::MatrixLayout::ColumnMajorInterleaved<kInterleave> TensorRefMapFunc;
+
+  // Construct two rank=2 host tensor of size M-by-N
+  cutlass::HostTensor<
+    float,
+    2,
+    TensorRefMapFunc > left(TensorRefMapFunc::stride(M), cutlass::make_Coord(M, N));
+
+  cutlass::HostTensor<
+    float,
+    2,
+    TensorRefMapFunc > right(TensorRefMapFunc::stride(M), cutlass::make_Coord(M, N));
+
+  // Initialize
+  left.fill_sequential();
+  right.fill_sequential();
+
+  // Assert equality
+  EXPECT_TRUE(cutlass::reference::device::TensorEquals(left.device_view(), right.device_view()));
+
+  // Overwrite one with an unexpected element
+  left.at(cutlass::make_Coord(24, 17)) = -1;
+  left.sync_device();
+
+  // Assert inequality
+  EXPECT_FALSE(cutlass::reference::device::TensorEquals(left.device_view(), right.device_view()));
+}
+
+TEST(TensorEquals, interleaved_host) {
+
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/util/tensor_foreach.cu b/tools/test/unit/util/tensor_foreach.cu
new file mode 100644
index 000000000..dcb965987
--- /dev/null
+++ b/tools/test/unit/util/tensor_foreach.cu
@@ -0,0 +1,217 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/* \file
+
+  \brief
+
+    These tests are intended to demonstrate the CUTLASS reference implementation for basic for-each
+    operators on the index space of TensorView objects. They instantiate a HostMatrix, initialize
+    its elements with random data according to specified random distributions, and clamp the
+    elements using a TensorForEach() operation.
+
+    Both device-side and host-side reference implementations are called.
+*/
+
+#include "cutlass_unit_test.h"
+
+#include "cutlass/matrix_traits.h"
+
+#include "tools/util/tensor_view_io.h"
+#include "tools/util/host_tensor.h"
+#include "tools/util/host_matrix.h"
+
+#include "tools/util/reference/device/tensor_foreach.h"
+#include "tools/util/reference/device/tensor_elementwise.h"
+
+#include "tools/util/reference/host/tensor_foreach.h"
+#include "tools/util/reference/host/tensor_elementwise.h"
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace test {
+
+/// Define a functor that computes the ReLu operation on a tensor.
+template <typename View>
+struct ReLuFunc {
+
+  /// Coordinate of index space
+  typedef typename View::TensorCoord TensorCoord;
+
+  /// Scalar type
+  typedef typename View::Storage T;
+
+  //
+  // Data members
+  //
+
+  /// Tensor view
+  View view;
+
+  /// ReLu threshold
+  T threshold;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  CUTLASS_HOST_DEVICE
+  ReLuFunc(View const &view, T threshold): view(view), threshold(threshold) { }
+
+  /// ReLu function
+  CUTLASS_HOST_DEVICE
+  void operator()(TensorCoord const &coord) {
+    T value = view.at(coord);
+
+    if (value < threshold) {
+      value = threshold;
+    }
+
+    view.at(coord) = value;
+  }
+};
+
+} // namespace test
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// This tests models the computation of ReLu using reference utility code.
+TEST(TensorForEach, ReLu_device) {
+
+  // Define HostMatrix type
+  typedef cutlass::HostMatrix<float> HostMatrix;
+  typedef typename HostMatrix::DeviceTensorView View;
+
+  // Define the problem size
+  int const M = 517;
+  int const N = 117;
+
+  float threshold = 0;
+
+  // Construct the host matrix
+  HostMatrix source(cutlass::MatrixCoord(M, N), cutlass::MatrixLayout::kRowMajor);
+  source.fill(0);
+
+  // Initialize the source matrix with a uniform distribution
+  cutlass::Distribution dist;
+  dist.set_uniform(-16, 16);
+
+  // RNG seed is hard-coded for determinism in the test.
+  int64_t seed = 2080;
+
+  cutlass::reference::device::TensorInitialize(source.device_view(), seed, dist);
+
+  // Define a functor called by TensorForEach<>
+  typedef test::ReLuFunc<View> ReLuFunc;
+
+  // Instantiate on host with TensorView and threshold value
+  ReLuFunc relu_func(source.device_view(), threshold);
+
+  // Launch kernel that applies the element-wise operator over the tensor's index space.
+  cutlass::reference::device::TensorForEach<
+    ReLuFunc,
+    View::kRank,
+    ReLuFunc>(source.size(), relu_func);
+
+  // Verify no element is less than the ReLu threshold.
+  source.sync_host();
+
+  int errors = 0;
+  for (cutlass::MatrixCoord coord(0, 0); coord.row() < M; ++coord.row()) {
+    for (coord.column() = 0; coord.column() < N; ++coord.column()) {
+      if (source.at(coord) < threshold) {
+        ++errors;
+        if (errors < 10) {
+          std::cout << "Error - source(" << coord << ") = "
+            << source.at(coord) << " is less than threshold " << threshold << std::endl;
+        }
+      }
+    }
+  }
+
+  EXPECT_EQ(errors, 0)
+    << "Result: " << source;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Test to apply the ReLu operation using host-side utilities
+TEST(TensorForEach, ReLu_host) {
+
+  // Define HostMatrix type
+  typedef cutlass::HostMatrix<float> HostMatrix;
+  typedef typename HostMatrix::HostTensorView View;
+
+  // Define the problem size
+  int const M = 517;
+  int const N = 117;
+
+  float threshold = 0;
+
+  bool const kDeviceBacked = false;
+
+  // Construct the host matrix
+  HostMatrix source(cutlass::MatrixCoord(M, N), cutlass::MatrixLayout::kRowMajor, kDeviceBacked);
+  source.fill(0);
+
+  // Initialize the source matrix with a uniform distribution
+  cutlass::Distribution dist;
+  dist.set_gaussian(-1, 4);
+
+  // RNG seed is hard-coded for determinism in the test.
+  unsigned seed = 2080;
+
+  cutlass::reference::host::TensorInitialize(source.host_view(), seed, dist);
+
+  // Define a functor called by TensorForEach<>
+  typedef test::ReLuFunc<View> ReLuFunc;
+
+  // Instantiate on host with TensorView and threshold value
+  ReLuFunc relu_func(source.host_view(), threshold);
+
+  // Invoke host-side for-each computation on the tensor
+  cutlass::reference::host::TensorForEach<
+    ReLuFunc,
+    View::kRank,
+    ReLuFunc>(source.size(), relu_func);
+
+  int errors = 0;
+  for (cutlass::MatrixCoord coord(0, 0); coord.row() < M; ++coord.row()) {
+    for (coord.column() = 0; coord.column() < N; ++coord.column()) {
+      if (source.at(coord) < threshold) {
+        ++errors;
+        if (errors < 10) {
+          std::cout << "Error - source(" << coord << ") = "
+            << source.at(coord) << " is less than threshold " << threshold << std::endl;
+        }
+      }
+    }
+  }
+
+  EXPECT_EQ(errors, 0)
+    << "Result: " << source;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/test/unit/util/unique_ptr.cu b/tools/test/unit/util/unique_ptr.cu
new file mode 100644
index 000000000..7676efb5e
--- /dev/null
+++ b/tools/test/unit/util/unique_ptr.cu
@@ -0,0 +1,25 @@
+/******************************************************************************
+* Copyright (c) 2018, NVIDIA CORPORATION.  All rights reserved.
+*
+* Redistribution and use in source and binary forms, with or without
+* modification, are not permitted.
+*
+* THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND
+* ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED
+* WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE
+* DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY
+* DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES
+* (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;
+* LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND
+* ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
+* (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS
+* SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+*
+******************************************************************************/
+
+#include "cutlass_unit_test.h"
+#include "cutlass/util/platform.h"
+
+TEST(unique_ptr, basic) {
+    cutlass::platform::unique_ptr<int> ptr(new int);
+}
diff --git a/tools/util/command_line.h b/tools/util/command_line.h
index 8f2b17aa9..d4bb96fea 100644
--- a/tools/util/command_line.h
+++ b/tools/util/command_line.h
@@ -108,7 +108,7 @@ struct CommandLine {
   }
 
   /**
-   * Returns the commandline parameter for a given index (not including flags)
+   * Returns the boolean value specified for a given commandline parameter --<flag>=<bool>
    */
   void get_cmd_line_argument(const char* arg_name, bool& val, bool _default = true) const {
     val = _default;
@@ -156,27 +156,7 @@ struct CommandLine {
       for (int i = 0; i < keys.size(); ++i) {
         if (keys[i] == string(arg_name)) {
           string val_string(values[i]);
-          istringstream str_stream(val_string);
-          string::size_type old_pos = 0;
-          string::size_type new_pos = 0;
-
-          // Iterate <sep>-delimited values
-          value_t val;
-          while ((new_pos = val_string.find(sep, old_pos)) != string::npos) {
-            if (new_pos != old_pos) {
-              str_stream.width(new_pos - old_pos);
-              str_stream >> val;
-              vals.push_back(val);
-            }
-
-            // skip over delimiter
-            str_stream.ignore(1);
-            old_pos = new_pos + 1;
-          }
-
-          // Read last value
-          str_stream >> val;
-          vals.push_back(val);
+          seperate_string(val_string, vals, sep);
         }
       }
     }
@@ -184,7 +164,7 @@ struct CommandLine {
 
   /**
    * Returns the values specified for a given commandline parameter
-   * --<flag>=<key:value>,<key:value>*
+   * --<flag>=<value>,<value_start:value_end>*
    */
   void get_cmd_line_argument_pairs(const char* arg_name,
                                    std::vector<std::pair<std::string, std::string> >& tokens,
@@ -198,6 +178,26 @@ struct CommandLine {
     }
   }
 
+  /**
+   * Returns a list of ranges specified for a given commandline parameter
+   * --<flag>=<key:value>,<key:value>*
+   */
+  void get_cmd_line_argument_ranges(const char* arg_name,
+                                    std::vector<std::vector<std::string> >& vals,
+                                    char delim = ',',
+                                    char sep = ':') const {
+    std::vector<std::string> ranges;
+    get_cmd_line_arguments(arg_name, ranges, delim);
+
+    for (std::vector<std::string>::const_iterator range = ranges.begin();
+      range != ranges.end(); ++range) {
+
+      std::vector<std::string> range_vals;
+      seperate_string(*range, range_vals, sep);
+      vals.push_back(range_vals);
+    }
+  }
+
   /**
    * The number of pairs parsed
    */
@@ -249,6 +249,33 @@ struct CommandLine {
       tokens.push_back(tok->first);
     }
   }
+
+  template <typename value_t>
+  static void seperate_string(std::string const& str,
+                              std::vector<value_t>& vals,
+                              char sep = ',') {
+    std::istringstream str_stream(str);
+    std::string::size_type old_pos = 0;
+    std::string::size_type new_pos = 0;
+
+    // Iterate <sep>-delimited values
+    value_t val;
+    while ((new_pos = str.find(sep, old_pos)) != std::string::npos) {
+      if (new_pos != old_pos) {
+        str_stream.width(new_pos - old_pos);
+        str_stream >> val;
+        vals.push_back(val);
+      }
+
+      // skip over delimiter
+      str_stream.ignore(1);
+      old_pos = new_pos + 1;
+    }
+
+    // Read last value
+    str_stream >> val;
+    vals.push_back(val);
+  }
 };
 
 }  // namespace cutlass
diff --git a/tools/util/device_memory.h b/tools/util/device_memory.h
index c627c54cc..0aa0532cb 100644
--- a/tools/util/device_memory.h
+++ b/tools/util/device_memory.h
@@ -26,9 +26,9 @@
 
 #include <memory>
 
-#include <cutlass/util/debug.h>
-#include <cutlass/util/platform.h>
-#include <tools/util/exceptions.h>
+#include "cutlass/util/debug.h"
+#include "cutlass/util/platform.h"
+#include "tools/util/exceptions.h"
 
 namespace cutlass {
 namespace device_memory {
@@ -124,6 +124,10 @@ struct allocation {
     }
   };
 
+  //
+  // Data members
+  //
+
   /// Number of elements of T allocated on the current CUDA device
   size_t capacity;
 
@@ -131,7 +135,7 @@ struct allocation {
   platform::unique_ptr<T, deleter> smart_ptr;
 
   //
-  //
+  // Methods
   //
 
   /// Constructor: allocates no memory
@@ -140,6 +144,11 @@ struct allocation {
   /// Constructor: allocates \p capacity elements on the current CUDA device
   allocation(size_t _capacity) : smart_ptr(allocate<T>(_capacity)), capacity(_capacity) {}
 
+  /// Copy constructor
+  allocation(allocation const &p): smart_ptr(allocate<T>(p.capacity)), capacity(p.capacity) {
+    copy_device_to_device(smart_ptr.get(), p.get(), capacity);
+  }
+
   /// Destructor
   ~allocation() { reset(); }
 
@@ -172,6 +181,16 @@ struct allocation {
 
   /// Returns the deleter object which would be used for destruction of the managed object (const)
   const deleter& get_deleter() const { return smart_ptr.get_deleter(); }
+
+  /// Copies a device-side memory allocation
+  allocation & operator=(allocation const &p) {
+    if (capacity != p.capacity) {
+      smart_ptr.reset(allocate<T>(p.capacity));
+      capacity = p.capacity;
+    }
+    copy_device_to_device(smart_ptr.get(), p.get(), capacity);
+    return *this;
+  }
 };
 
 }  // namespace device_memory
diff --git a/tools/util/distribution.h b/tools/util/distribution.h
new file mode 100644
index 000000000..1c2701fc3
--- /dev/null
+++ b/tools/util/distribution.h
@@ -0,0 +1,138 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#pragma once
+
+/*! \file
+    \brief This header contains a class to parametrize a statistical distribution function.
+*/
+
+#include <fstream>
+
+namespace cutlass {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Distribution type
+struct Distribution {
+  /// Variant types
+  enum Kind { Invalid, Uniform, Gaussian, Linear, Identity };
+
+  /// Distribution state
+  union {
+    /// Uniform distribution
+    struct {
+      double min;
+      double max;
+    } uniform;
+
+    /// Gaussian distribution
+    struct {
+      double mean;
+      double stddev;
+    } gaussian;
+
+    /// Elements are linear combination of row and column index
+    struct {
+      double offset;
+      double delta_row;
+      double delta_column;
+    } linear;
+  };
+
+  /// Active variant kind
+  Kind kind;
+
+  /// Random values are cast to integer after scaling by this power of two
+  int int_scale;
+
+  //
+  // Methods
+  //
+
+  Distribution() : kind(Invalid), int_scale(0) {}
+
+  /// Configures distribution as uniform random
+  Distribution &set_uniform(double _min, double _max, int _int_scale = 0) {
+    kind = Uniform;
+    uniform.min = _min;
+    uniform.max = _max;
+    int_scale = _int_scale;
+    return *this;
+  }
+
+  /// Configures distribution as Gaussian distribution
+  Distribution &set_gaussian(double _mean, double _stddev, int _int_scale = 0) {
+    kind = Gaussian;
+    gaussian.mean = _mean;
+    gaussian.stddev = _stddev;
+    int_scale = _int_scale;
+    return *this;
+  }
+
+  /// Sets identity
+  Distribution &set_identity() {
+    kind = Identity;
+    return *this;
+  }
+
+  /// Configures distribution as linear combination of row and column index
+  Distribution &set_linear(double _offset, double _delta_row, double _delta_column) {
+    kind = Linear;
+    linear.offset = _offset;
+    linear.delta_row = _delta_row;
+    linear.delta_column = _delta_column;
+    return *this;
+  }
+};
+
+}  // namespace cutlass
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Prints a Distribution to ostream
+inline std::ostream &operator<<(std::ostream &out, cutlass::Distribution const &dist) {
+  switch (dist.kind) {
+    case cutlass::Distribution::Uniform:
+      out << "uniform, min: " << dist.uniform.min << ", max: " << dist.uniform.max;
+      break;
+    case cutlass::Distribution::Gaussian:
+      out << "gaussian, mean: " << dist.gaussian.mean << ", stddev: " << dist.gaussian.stddev;
+      break;
+    case cutlass::Distribution::Linear:
+      out << "linear, mean: " << dist.linear.offset << ", delta_row: " << dist.linear.delta_row
+          << ", delta_column: " << dist.linear.delta_column;
+      break;
+    case cutlass::Distribution::Identity:
+      break;
+    default:
+      out << "unknown";
+  }
+
+  out << ", int_scale: " << dist.int_scale;
+
+  return out;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
diff --git a/tools/util/exceptions.h b/tools/util/exceptions.h
index 72d99fec0..3683fbf4f 100644
--- a/tools/util/exceptions.h
+++ b/tools/util/exceptions.h
@@ -28,7 +28,7 @@
 #include <iosfwd>
 #include <stdexcept>
 
-#include <cutlass/util/platform.h>
+#include "cutlass/util/platform.h"
 
 namespace cutlass {
 
diff --git a/tools/util/half.h b/tools/util/half.h
index ee536e5b3..91e8b1130 100644
--- a/tools/util/half.h
+++ b/tools/util/half.h
@@ -107,6 +107,33 @@ class half_t {
   uint16_t& raw() { return x; }
   uint16_t raw() const { return x; }
 
+  //
+  // Stream interactions
+  //
+
+  /// put to stream - half_t-precision types bitcast as unsigned shorts if base is hexadecimal
+  friend std::ostream& operator<<(std::ostream& out, cutlass::half_t const& h) {
+    if (out.flags() & std::ios::hex) {
+      return out << h.x;
+    } else {
+      return out << float(h);
+    }
+  }
+
+  /// read from stream - half_t-precision types parsed as unsigned shorts if base is hexadecimal
+  friend std::istream& operator>>(std::istream& in, cutlass::half_t& h) {
+    if (in.flags() & std::ios::hex) {
+      unsigned short u = 0;
+      in >> u;
+      h = cutlass::half_t::bitcast(u);
+    } else {
+      float f = 0;
+      in >> f;
+      h = cutlass::half_t(f);
+    }
+    return in;
+  }
+
  public:
   /// data
   unsigned short x;
@@ -167,9 +194,6 @@ cutlass::half_t operator-(float, cutlass::half_t const&);
 cutlass::half_t operator*(float, cutlass::half_t const&);
 cutlass::half_t operator/(float, cutlass::half_t const&);
 
-std::ostream& operator<<(std::ostream&, cutlass::half_t const&);  /// writes a half_t
-std::istream& operator>>(std::istream&, cutlass::half_t&);        /// reads a half_t
-
 #ifdef BOOST_LEXICAL_CAST_INCLUDED
 namespace boost {
 
@@ -714,30 +738,3 @@ inline cutlass::half_t sqrt(cutlass::half_t const& h) {
   return cutlass::half_t(std::sqrt(float(h)));
 }
 }  // namespace std
-
-//
-// Stream interactions
-//
-
-/// put to stream - half_t-precision types bitcast as unsigned shorts if base is hexadecimal
-inline std::ostream& operator<<(std::ostream& out, cutlass::half_t const& h) {
-  if (out.flags() & std::ios::hex) {
-    return out << h.x;
-  } else {
-    return out << float(h);
-  }
-}
-
-/// read from stream - half_t-precision types parsed as unsigned shorts if base is hexadecimal
-inline std::istream& operator>>(std::istream& in, cutlass::half_t& h) {
-  if (in.flags() & std::ios::hex) {
-    unsigned short u = 0;
-    in >> u;
-    h = cutlass::half_t::bitcast(u);
-  } else {
-    float f = 0;
-    in >> f;
-    h = cutlass::half_t(f);
-  }
-  return in;
-}
diff --git a/tools/util/host_matrix.h b/tools/util/host_matrix.h
new file mode 100644
index 000000000..9812f757d
--- /dev/null
+++ b/tools/util/host_matrix.h
@@ -0,0 +1,264 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#pragma once
+
+/*! \file
+  \brief HostMatrix is a helper to define a HostTensor of rank=2 with a contiguous layout.
+
+  See tools/util/host_tensor.h for more details.
+*/
+
+#include "cutlass/matrix_traits.h"
+#include "tools/util/host_tensor.h"
+
+#include "tools/util/reference/host/gemm.h"
+
+namespace cutlass {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to define a rank=2 host matrix with contiguous layout
+template <
+  typename T
+>
+class HostMatrix :
+  public HostTensor<T, 2, MatrixLayout::ContiguousLayout, 3, int, long long> {
+public:
+
+  /// Base class is a HostTensor of rank=2 with contiguous layout
+  typedef HostTensor<T, 2, MatrixLayout::ContiguousLayout, 3, int, long long> Base;
+
+  /// Index type
+  typedef typename Base::Index Index;
+
+private:
+
+  /// Layout of contiguous matrix
+  MatrixLayout::Kind layout_;
+
+public:
+
+  /// Default ctor
+  HostMatrix(): layout_(MatrixLayout::kColumnMajor) { }
+
+  /// Constructs a HostTensor from size. Assumes column-major and infers leading dimension
+  HostMatrix(MatrixCoord const& size, bool _device_backed = true): layout_(MatrixLayout::kColumnMajor) {
+    Index ldm = size[0];
+    this->reset(MatrixLayout::ContiguousLayout::stride(layout_, ldm), size, _device_backed);
+  }
+
+  /// Constructs a HostTensor from size and layout - infers leading dimension
+  HostMatrix(MatrixCoord const& size, MatrixLayout::Kind layout, bool _device_backed = true): layout_(layout) {
+    Index ldm = (layout_ == MatrixLayout::kColumnMajor ? size[0] : size[1]);
+    this->reset(MatrixLayout::ContiguousLayout::stride(layout_, ldm), size, _device_backed);
+  }
+
+  /// Constructs a HostTensor given size, layout, and leading dimension
+  HostMatrix(MatrixCoord const& size, Index ldm, MatrixLayout::Kind layout, bool _device_backed = true): layout_(layout) {
+    this->reset(MatrixLayout::ContiguousLayout::stride(layout_, ldm), size, _device_backed);
+  }
+
+  /// Returns contiguous matrix layout kind
+  MatrixLayout::Kind get_layout() const {
+    return layout_;
+  }
+
+  /// Resizes a matrix
+  void resize(MatrixCoord const &_size, MatrixLayout::Kind layout, Index ldm = 0, bool _device_backed = true) {
+    if (!ldm) {
+      ldm = (layout == MatrixLayout::kColumnMajor ? _size[0] : _size[1]);
+    }
+    layout_ = layout;
+    this->reset(MatrixLayout::ContiguousLayout::stride(layout_, ldm), _size, _device_backed);
+  }
+
+  /// Helper to resize matrix
+  void resize(Index rows, Index columns, MatrixLayout::Kind layout, Index ldm = 0, bool _device_backed = true) {
+    this->resize(MatrixCoord(rows, columns), layout, ldm,_device_backed);
+  }
+
+  /// Helper to resize matrix
+  void resize_matrix(Index rows, Index columns, MatrixLayout::Kind layout, Index ldm = 0, bool _device_backed = true) {
+    this->resize(MatrixCoord(rows, columns), layout, ldm,_device_backed);
+  }
+
+  /// Gets the leading dimension of the matrix
+  Index leading_dim() const {
+    if (layout_ == MatrixLayout::kColumnMajor) {
+      return this->stride(MatrixLayout::ContiguousLayout::kColumn);
+    }
+    else {
+      return this->stride(MatrixLayout::ContiguousLayout::kRow);
+    }
+  }
+
+  /// Returns size as a MatrixCoord
+  MatrixCoord size() const {
+    return MatrixCoord(Base::size());
+  }
+
+  /// Returns size in the given dimension
+  Index size(int idx) const {
+    return Base::size(idx);
+  }
+
+  /// Helper to call GEMM operation on HostMatrix objects that differ only in their scalar type.
+  template <typename A, typename B, typename Ctype, typename Stype>
+  void gemm(
+    HostMatrix<A> const& tensor_a,
+    HostMatrix<B> const& tensor_b,
+    Stype alpha = Stype(1),
+    Stype beta = Stype(0)) {
+
+    gemm::GemmCoord problem_size(
+      tensor_a.size().column(),
+      this->size().column(),
+      this->size().row(),
+      1);
+
+    cutlass::reference::host::Gemm(
+      problem_size,
+      alpha,
+      tensor_a,
+      tensor_b,
+      beta,
+      *this,
+      Ctype(0));
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to define a rank=2 host matrix with column-major layout
+template <
+  typename T
+>
+class HostMatrixColumnMajor :
+  public HostTensor<T, 2, MatrixLayout::ColumnMajor, 2, int, long long> {
+public:
+
+  /// Base class is a HostTensor of rank=2 with contiguous layout
+  typedef HostTensor<T, 2, MatrixLayout::ColumnMajor, 2, int, long long> Base;
+
+  /// Tensor coordinate
+  typedef typename Base::TensorCoord TensorCoord;
+
+  /// Index type
+  typedef typename Base::Index Index;
+
+public:
+
+  /// Default ctor
+  HostMatrixColumnMajor() { }
+
+  /// Constructs a HostMatrixColumnMajor from size. Assumes column-major and infers leading dimension
+  HostMatrixColumnMajor(TensorCoord const& size, bool _device_backed = true): Base(size, size[0], _device_backed) {
+
+  }
+
+  /// Constructs a HostMatrixColumnMajor given size, layout, and leading dimension
+  HostMatrixColumnMajor(TensorCoord const& size, Index ldm, bool _device_backed = true) {
+    this->reset(make_Coord(ldm, 1), size, _device_backed);
+  }
+
+  /// Resizes a matrix
+  void resize(MatrixCoord const &size, int ldm = 0, bool _device_backed = true) {
+    this->reset(ldm, size, _device_backed);
+  }
+
+  /// Returns contiguous matrix layout kind
+  MatrixLayout::Kind get_layout() const {
+    return MatrixLayout::kColumnMajor;
+  }
+
+  /// Gets the leading dimension of the matrix
+  Index leading_dim() const {
+    return this->stride(0);
+  }
+
+  /// Returns size as a MatrixCoord
+  MatrixCoord size() const {
+    return MatrixCoord(Base::size());
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to define a rank=2 host matrix with row-major layout
+template <
+  typename T
+>
+class HostMatrixRowMajor :
+  public HostTensor<T, 2, MatrixLayout::RowMajor, 2, int, long long> {
+public:
+
+  /// Base class is a HostTensor of rank=2 with contiguous layout
+  typedef HostTensor<T, 2, MatrixLayout::RowMajor, 2, int, long long> Base;
+
+  /// Tensor coordinate
+  typedef typename Base::TensorCoord TensorCoord;
+
+  /// Index type
+  typedef typename Base::Index Index;
+
+public:
+
+  /// Default ctor
+  HostMatrixRowMajor() { }
+
+  /// Constructs a HostTensor from size. Assumes column-major and infers leading dimension
+  HostMatrixRowMajor(TensorCoord const& size, bool _device_backed = true) {
+    this->reset(make_Coord(size[1], 1), size, _device_backed);
+  }
+
+  /// Constructs a HostTensor given size, layout, and leading dimension
+  HostMatrixRowMajor(TensorCoord const& size, Index ldm, bool _device_backed = true) {
+    this->reset(make_Coord(ldm, 1), size, _device_backed);
+  }
+
+  /// Resizes a matrix
+  void resize(MatrixCoord const &size, int ldm = 0, bool _device_backed = true) {
+    this->reset(ldm, size, _device_backed);
+  }
+
+  /// Returns contiguous matrix layout kind
+  MatrixLayout::Kind get_layout() const {
+    return MatrixLayout::kRowMajor;
+  }
+
+  /// Gets the leading dimension of the matrix
+  Index leading_dim() const {
+    return this->stride(0);
+  }
+
+  /// Returns size as a MatrixCoord
+  MatrixCoord size() const {
+    return MatrixCoord(Base::size());
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/tools/util/host_matrix_view.h b/tools/util/host_matrix_view.h
new file mode 100644
index 000000000..84767878c
--- /dev/null
+++ b/tools/util/host_matrix_view.h
@@ -0,0 +1,205 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#pragma once
+
+/*! \file
+  \brief HostMatrix is a helper to define a HostTensor of rank=2 with a contiguous layout.
+
+  See tools/util/host_tensor.h for more details.
+*/
+
+#include "cutlass/matrix_traits.h"
+#include "tools/util/host_tensor.h"
+
+#include "tools/util/reference/host/gemm.h"
+
+namespace cutlass {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to define a rank=2 host matrix with contiguous layout
+template <
+  typename T
+>
+class HostMatrixView :
+  public HostTensorView<T, 2, MatrixLayout::ContiguousLayout, 3, int> {
+public:
+
+  /// Base class is a HostTensor of rank=2 with contiguous layout
+  typedef HostTensorView<T, 2, MatrixLayout::ContiguousLayout, 3, int> Base;
+
+  /// Tensor coordinate
+  typedef typename Base::TensorCoord TensorCoord;
+
+  /// Index type
+  typedef typename Base::Index Index;
+
+private:
+
+  /// Layout of contiguous matrix
+  MatrixLayout::Kind layout_;
+
+public:
+
+  /// Default ctor
+  HostMatrixView(): layout_(MatrixLayout::kColumnMajor) { }
+
+  /// Constructs a HostTensor from size. Assumes column-major and infers leading dimension
+  HostMatrixView(TensorCoord const& size): layout_(MatrixLayout::kColumnMajor) {
+    Index ldm = size[0];
+    this->reset(MatrixLayout::ContiguousLayout::stride(layout_, ldm), size);
+  }
+
+  /// Constructs a HostTensor from size and layout - infers leading dimension
+  HostMatrixView(TensorCoord const& size, MatrixLayout::Kind layout): layout_(layout) {
+    Index ldm = (layout_ == MatrixLayout::kColumnMajor ? size[0] : size[1]);
+    this->reset(MatrixLayout::ContiguousLayout::stride(layout_, ldm), size);
+  }
+
+  /// Constructs a HostTensor given size, layout, and leading dimension
+  HostMatrixView(TensorCoord const& size, Index ldm, MatrixLayout::Kind layout): layout_(layout) {
+    this->reset(MatrixLayout::ContiguousLayout::stride(layout_, ldm), size);
+  }
+
+  /// Gets the leading dimension of the matrix
+  Index leading_dim() const {
+    if (layout_ == MatrixLayout::kColumnMajor) {
+      return this->stride(MatrixLayout::ContiguousLayout::kColumn);
+    }
+    else {
+      return this->stride(MatrixLayout::ContiguousLayout::kRow);
+    }
+  }
+
+  /// Returns contiguous matrix layout kind
+  MatrixLayout::Kind get_layout() const {
+    return layout_;
+  }
+
+  /// Returns size as a MatrixCoord
+  MatrixCoord size() const {
+    return MatrixCoord(Base::size());
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to define a rank=2 host matrix with column-major layout
+template <typename T>
+class HostMatrixViewColumnMajor :
+  public HostTensorView<T, 2, MatrixLayout::ColumnMajor, 2, int, long long> {
+public:
+
+  /// Base class is a HostTensorView of rank=2 with contiguous layout
+  typedef HostTensorView<T, 2, MatrixLayout::ColumnMajor, 2, int, long long> Base;
+
+  /// Tensor coordinate
+  typedef typename Base::TensorCoord TensorCoord;
+
+  /// Index type
+  typedef typename Base::Index Index;
+
+public:
+
+  /// Default ctor
+  HostMatrixViewColumnMajor() { }
+
+  /// Constructs a HostMatrixViewColumnMajor from size. Assumes column-major and infers leading dimension
+  HostMatrixViewColumnMajor(TensorCoord const& size): Base(size, size[0]) {
+
+  }
+
+  /// Constructs a HostMatrixViewColumnMajor given size, layout, and leading dimension
+  HostMatrixViewColumnMajor(TensorCoord const& size, Index ldm) {
+    this->reset(make_Coord(ldm, 1), size);
+  }
+
+  /// Returns contiguous matrix layout kind
+  MatrixLayout::Kind get_layout() const {
+    return MatrixLayout::kColumnMajor;
+  }
+
+  /// Gets the leading dimension of the matrix
+  Index leading_dim() const {
+    return this->stride(0);
+  }
+
+  /// Returns size as a MatrixCoord
+  MatrixCoord size() const {
+    return MatrixCoord(Base::size());
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to define a rank=2 host matrix with row-major layout
+template <typename T>
+class HostMatrixViewRowMajor :
+  public HostTensorView<T, 2, MatrixLayout::RowMajor, 2, int, long long> {
+public:
+
+  /// Base class is a HostTensor of rank=2 with contiguous layout
+  typedef HostTensorView<T, 2, MatrixLayout::RowMajor, 2, int, long long> Base;
+
+  /// Tensor coordinate
+  typedef typename Base::TensorCoord TensorCoord;
+
+  /// Index type
+  typedef typename Base::Index Index;
+
+public:
+
+  /// Default ctor
+  HostMatrixViewRowMajor() { }
+
+  /// Constructs a HostMatrixViewRowMajor from size. Assumes column-major and infers leading dimension
+  HostMatrixViewRowMajor(TensorCoord const& size): Base(size, size[1]) {
+
+  }
+
+  /// Constructs a HostMatrixViewRowMajor given size, layout, and leading dimension
+  HostMatrixViewRowMajor(TensorCoord const& size, Index ldm) {
+    this->reset(make_Coord(ldm, 1), size);
+  }
+
+  /// Returns contiguous matrix layout kind
+  MatrixLayout::Kind get_layout() const {
+    return MatrixLayout::kRowMajor;
+  }
+
+  /// Gets the leading dimension of the matrix
+  Index leading_dim() const {
+    return this->stride(0);
+  }
+
+  /// Returns size as a MatrixCoord
+  MatrixCoord size() const {
+    return MatrixCoord(Base::size());
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/tools/util/host_tensor.h b/tools/util/host_tensor.h
index cc9963c22..fc042b0b7 100644
--- a/tools/util/host_tensor.h
+++ b/tools/util/host_tensor.h
@@ -25,51 +25,126 @@
 #pragma once
 
 /*! \file
-    \brief Template class to perform computations on tensors and manage memory.
+  \brief HostTensor contributes management for both host and device memory.
+
+  HostTensor allocates host and device memory upon construction. Basic element-wise operations on
+  host memory synchronize device memory automatically. Explicit copy operations provide abstractions
+  for CUDA memcpy operations.
+
+  Call device_{data, ref, view} for accessing device memory allocations.
+
+  See cutlass/tensor_ref.h, cutlass/tensor_view.h, and tools/util/host_tensor_view.h for more details.
 */
 
-#include <cutlass/cutlass.h>
-#include <cutlass/matrix_traits.h>
-#include <tools/util/device_memory.h>
-#include <tools/util/host_tensor_view.h>
-#include <tools/util/type_traits.h>
+#include "cutlass/cutlass.h"
+#include "cutlass/matrix_traits.h"
+#include "cutlass/tensor_ref.h"
+#include "tools/util/device_memory.h"
+#include "tools/util/host_tensor_view.h"
+#include "tools/util/type_traits.h"
 #include <vector>
 
 namespace cutlass {
 
-template <typename T, bool DeviceBacked_ = true>
-class HostTensor : public HostTensorView<T> {
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Host tensor
+template <
+  /// Scalar data type (may be mapped to compatible types for use on host and device)
+  typename T,
+  /// Rank of logical tensor
+  int Rank_ = 4,
+  /// Maps a Coord<Rank_> in the logical tensor index space to the internal n-D array
+  typename MapFunc_ = IdentityTensorMapFunc<Rank_>,
+  /// Rank of internal n-D array
+  int StorageRank_ = MapFunc_::kStorageRank,
+  /// Index type used for coordinates
+  typename Index_ = int,
+  /// Index type used for offsets and pointer differences
+  typename LongIndex_ = long long
+>
+class HostTensor : public HostTensorView<
+  typename TypeTraits<T>::host_type,
+  Rank_,
+  MapFunc_,
+  StorageRank_,
+  Index_,
+  LongIndex_> {
  public:
+  /// Type used for host-side allocations
+  typedef typename TypeTraits<T>::host_type HostType;
+
   /// Type used for device-side allocations
   typedef typename TypeTraits<T>::device_type DeviceType;
 
   /// Base class
-  typedef HostTensorView<T> Base;
-
-  /// If true, allocates device side memory
-  static bool const DeviceBacked = DeviceBacked_;
-
-  /// Rank of tensor
-  static int const Rank = Base::Rank;
+  typedef HostTensorView<
+    typename TypeTraits<T>::host_type,
+    Rank_,
+    MapFunc_,
+    StorageRank_,
+    Index_,
+    LongIndex_> Base;
 
   /// Type used to compute the offset of an element to the base of a tensor
-  typedef typename Base::Offset_t Offset_t;
-
-  /// Tensor reference to host memory
-  typedef typename Base::TensorRef_t TensorRef_t;
+  typedef LongIndex_ LongIndex;
 
   /// Tensor reference to device memory
-  typedef TensorRef<DeviceType, TensorRef_t::Rank> DeviceTensorRef;
+  typedef typename cutlass::TensorRef<
+    DeviceType,
+    Rank_,
+    MapFunc_,
+    StorageRank_,
+    Index_,
+    LongIndex_> DeviceTensorRef;
 
   /// Tensor reference to constant device memory
-  typedef TensorRef<DeviceType const, TensorRef_t::Rank> ConstDeviceTensorRef;
+  typedef typename DeviceTensorRef::ConstTensorRef ConstDeviceTensorRef;
 
-  /// Coordinate into tensor
-  typedef typename Base::Coord_t Coord_t;
+  /// TensorView to device memory
+  typedef TensorView<
+    DeviceType,
+    Rank_,
+    MapFunc_,
+    StorageRank_,
+    Index_,
+    LongIndex_> DeviceTensorView;
+
+  /// Tensor reference to constant device memory
+  typedef typename DeviceTensorView::ConstTensorView ConstDeviceTensorView;
+
+  /// Tensor reference to host memory
+  typedef typename Base::TensorRef TensorRef;
+
+  /// Tensor view to host memory
+  typedef TensorView<
+    typename TypeTraits<T>::host_type,
+    Rank_,
+    MapFunc_,
+    StorageRank_,
+    Index_,
+    LongIndex_> HostTensorView;
+
+  /// Tensor view to host memory
+  typedef typename HostTensorView::ConstTensorView ConstHostTensorView;
+
+  /// Coordinate in logical tensor space
+  typedef typename TensorRef::TensorCoord TensorCoord;
+
+  /// Coordinate in storage n-D array
+  typedef typename TensorRef::StorageCoord StorageCoord;
+
+  /// Stride vector in storage coordinate space
+  /// Least significant stride is = 1 and not stored
+  typedef typename TensorRef::StrideVector StrideVector;
+
+  /// Rank of internal storage.
+  static int const kStorageRank = Base::kStorageRank;
 
  private:
+
   /// Host-side memory allocation
-  std::vector<T> host_;
+  std::vector<HostType> host_;
 
   /// Device-side memory
   cutlass::device_memory::allocation<DeviceType> device_;
@@ -82,232 +157,173 @@ class HostTensor : public HostTensorView<T> {
   /// Default constructor
   HostTensor() {}
 
-  /// Constructs a Tensor_view from stride and size
-  HostTensor(Coord_t const& _stride, Coord_t const& _size) { reset(_stride, _size); }
-
-  /// Constructs a HostTensor from size - infers strides
-  HostTensor(Coord_t const& _size) {
-    Coord_t _stride = make_Coord(
-        _size.at(2) * _size.at(1) * _size.at(0), _size.at(1) * _size.at(0), _size.at(0), 1);
-    reset(_stride, _size);
+  /// Constructor for resizing the least significant rank
+  HostTensor(Index_ size_1D, bool device_backed = true) {
+    this->resize(size_1D, device_backed);
   }
 
-  /// Returns the number of elements needed to back vector
-  size_t capacity() { return Base::capacity(); }
+  /// Helper to construct from pointer, stride, and size
+  HostTensor(
+    StorageCoord const &_stride,
+    TensorCoord const& _size,
+    bool _device_backed = true
+  ) {
 
-  /// Returns true if the Tensor_view is bound to some memory
-  bool good() const { return Base::good(); }
+    this->reset(_stride, _size);
+  }
+
+  /// Clears the HostTensor allocation to size/capacity = 0
+  void reset() {
+    host_.clear();
+    device_.reset();
+    Base::reset();
+  }
+
+  /// Helper to resize the least significant rank
+  void resize(
+    Index_ size_1D,
+    bool _device_backed = true) {
+
+    TensorCoord _size;
+    _size[Base::kRank - 1] = size_1D;
+    for (int i = 0; i < Base::kRank - 1; ++i) {
+      _size[i] = 1;
+    }
+    StorageCoord _stride;
+    _stride[Base::kStorageRank - 1] = 1;
+    for (int i = 0; i < Base::kStorageRank - 1; ++i) {
+      _stride[i] = size_1D;
+    }
+    this->reset(_stride, _size, _device_backed);
+  }
 
   /// Updates the reference and size of a Tensor_view object
-  void reset(Coord_t const& _stride, Coord_t const& _size) {
-    size_t _capacity = _size.at(0) * _stride.at(0);
+  void reset(
+    StorageCoord const& stride,
+    TensorCoord const& size,
+    bool _device_backed = true) {
 
+    // Construct a temporary TensorView so we can calculate the new capacity
+    size_t _capacity = Base(nullptr, stride, size).capacity();
+
+    // Allocate memory
     DeviceType* _device_memory = nullptr;
-    if (DeviceBacked) {
+    if (_device_backed) {
       _device_memory = cutlass::device_memory::allocate<DeviceType>(_capacity);
     }
 
     host_.clear();
     host_.resize(_capacity);
-    for (size_t i = 0; i < _capacity; ++i) {
-      host_[i] = T((int)0xdeadbeef);
-    }
     device_.reset(_device_memory, _capacity);
 
-    Base::reset(TensorRef_t(host_.data(), _stride), _size);
+    Base::reset(TensorRef(host_.data(), stride), size);
   }
 
-  /// Initializes the host tensor as a matrix
-  void resize_matrix(int rows, int columns, MatrixLayout::Kind layout) {
-    bool col_major = (layout == MatrixLayout::kColumnMajor);
-    int ldm = (col_major ? rows : columns);
+  /// Accesses the tensor reference pointing to data
+  TensorRef host_ref() { return Base::ref(); }
 
-    Coord_t stride = make_Coord(rows * columns, col_major ? 1 : ldm, col_major ? ldm : 1, 1);
+  /// Accesses the tensor reference pointing to data
+  TensorRef host_ref() const { return Base::ref(); }
 
-    Coord_t size = make_Coord(1, rows, columns, 1);
-
-    reset(stride, size);
+  /// Accesses the tensor reference pointing to data
+  DeviceTensorRef device_ref() const {
+    return DeviceTensorRef(device_data(), this->stride());
   }
 
-  /// Simplifies resizing the host tensor
-  void resize(int elements) { resize_matrix(1, elements, MatrixLayout::kColumnMajor); }
+  /// Accesses the tensor reference pointing to data
+  HostTensorView host_view() {
+    return HostTensorView(host_data(), this->stride(), this->size());
+  }
+
+  /// Accesses the tensor reference pointing to data
+  ConstHostTensorView host_view() const {
+    return HostTensorView(host_data(), this->stride(), this->size());
+  }
+
+  /// Accesses the tensor reference pointing to data
+  DeviceTensorView device_view() const {
+    return DeviceTensorView(device_data(), this->stride(), this->size());
+  }
 
   /// Gets pointer to host data
-  T const* host_data() const { return &host_[0]; }
-
-  /// Gets pointer to host data
-  T* host_data() { return &host_[0]; }
+  HostType * host_data() { return host_.data(); }
 
   /// Gets pointer to device data
-  DeviceType* device_data() const { return device_.get(); }
+  DeviceType* device_data() { return device_.get(); }
+
+  /// Gets pointer to host data
+  HostType const * host_data() const { return host_.data(); }
+
+  /// Gets pointer to device data
+  DeviceType * device_data() const { return device_.get(); }
+
+  /// Returns true if device memory is allocated
+  bool device_backed() const {
+    return device_.get();
+  }
 
   /// Copies data from device to host
   void sync_host() {
-    if (DeviceBacked) {
+    if (device_.get()) {
       device_memory::copy_to_host(
-          host_.data(), reinterpret_cast<T const*>(device_.get()), host_.size());
+          host_.data(), reinterpret_cast<HostType const*>(device_.get()), host_.size());
     }
   }
 
   /// Copies data from host to device
   void sync_device() {
-    if (DeviceBacked) {
+    if (device_.get()) {
       device_memory::copy_to_device(
-          device_.get(), reinterpret_cast<DeviceType const*>(host_.data()), host_.size());
+        device_.get(),
+        reinterpret_cast<DeviceType const*>(host_.data()),
+        host_.size());
     }
   }
 
-  /// Copy data from a caller-supplied device pointer
-  void copy_to_host(DeviceType const *ptr_device) {
+  /// Copy data from a caller-supplied device pointer into host memory
+  void copy_to_host(DeviceType const* ptr_device) {
     device_memory::copy_to_host(
-      host_.data(), reinterpret_cast<T const *>(ptr_device), host_.size());
+      host_.data(), reinterpret_cast<HostType const*>(ptr_device), host_.size());
   }
 
-  /// Copies data to a caller-supplied device pointer
-  void copy_to_device(DeviceType *ptr_device) {
+  /// Copies device-to-device
+  void copy_to_device(DeviceType* ptr_device) {
     device_memory::copy_to_device(
-      ptr_device, reinterpret_cast<DeviceType const *>(host_.data()), host_.size());
-  }
-
-  /// Accesses the tensor reference pointing to data
-  TensorRef_t& host_ref() { return Base::ref(); }
-
-  /// Accesses the tensor reference pointing to data
-  TensorRef_t const& host_ref() const { return Base::ref(); }
-
-  /// Accesses the tensor reference pointing to data
-  DeviceTensorRef device_ref() const { return DeviceTensorRef(device_data(), stride()); }
-
-  /// Returns a tensor ref to constant memory on the device
-  ConstDeviceTensorRef const_device_ref() const {
-    return ConstDeviceTensorRef(device_data(), stride());
-  }
-
-  /// Accesses the size
-  Coord_t const& size() const { return Base::size(); }
-
-  /// Accesses the size
-  int size(int dim) const { return Base::size(dim); }
-
-  /// Accesses the size
-  Coord_t const& stride() const { return Base::stride(); }
-
-  /// Accesses the size
-  int stride(int dim) const { return Base::stride(dim); }
-
-  /// Returns the index of an element
-  Offset_t offset(Coord_t const& coord) const { return Base::offset(coord); }
-
-  /// Determines whether a location is within a tensor
-  bool contains(Coord_t const& coord) const { return Base::contains(coord); }
-
-  /// Element-wise accessor
-  T& at(Coord_t const& coord) const { return Base::at(coord); }
-
-  /// Element-wise accessor
-  T& operator[](Coord_t const& coord) { return at(coord); }
-
-  /// Element-wise accessor with basic offset
-  T& at(int idx) const { return Base::at(idx); }
-
-  /// Returns a Tensor_view given location and size quantities
-  TensorView<T> subview(Coord_t const& _location, Coord_t _size) const {
-    return Base::subview(_location, _size);
-  }
-
-  /// Recurses through all dimensions and applies a unary operation
-  template <typename F>
-  void elementwise_in_place(F& op, int dim = 0, Offset_t dst_offset_base = 0) {
-    Base::elementwise_in_place(op, dim, dst_offset_base);
-  }
-
-  /// Recurses through all dimensions and applies a unary operator, supplying the logical
-  /// coordinate within the tensor as an argument
-  template <typename F>
-  void elementwise_stream(F& op, int dim = 0, Offset_t dst_offset_base = 0) {
-    Base::elementwise_stream(op, dim, dst_offset_base);
-  }
-
-  /// Recurses through all dimensions and applies a unary operator, supplying the logical
-  /// coordinate within the tensor as an argument
-  template <typename F>
-  void elementwise_generate(F& op,
-                            int dim = 0,
-                            Offset_t dst_offset_base = 0,
-                            Coord_t coord = Coord_t(0)) {
-    Base::elementwise_generate(op, dim, dst_offset_base, coord);
-  }
-
-  /// Recurses through all dimensions and applies a binary operation
-  template <typename Src, typename F>
-  bool elementwise_in_place(F& op,
-                            int dim,
-                            TensorView<Src> const& tensor,
-                            Offset_t dst_offset_base = 0,
-                            Offset_t src_offset_base = 0) {
-    return Base::elementwise_in_place(op, dim, tensor, dst_offset_base, src_offset_base);
+      ptr_device, reinterpret_cast<DeviceType const*>(host_.data()), host_.size());
   }
 
   /// Accumulate in place
-  template <typename Src>
-  TensorView<T>& operator+=(TensorView<Src> const& tensor) {
+  template <typename SrcTensorView>
+  HostTensor& operator+=(SrcTensorView const& tensor) {
     Base::operator+=(tensor);
     sync_device();
     return *this;
   }
 
   /// Subtract in place
-  template <typename Src>
-  TensorView<T>& operator-=(TensorView<Src> const& tensor) {
+  template <typename SrcTensorView>
+  HostTensor& operator-=(SrcTensorView const& tensor) {
     Base::operator-=(tensor);
     sync_device();
     return *this;
   }
 
   /// Multiply in place
-  template <typename Src>
-  TensorView<T>& operator*=(TensorView<Src> const& tensor) {
+  template <typename SrcTensorView>
+  HostTensor& operator*=(SrcTensorView const& tensor) {
     Base::operator*=(tensor);
     sync_device();
     return *this;
   }
 
   /// Divide in place
-  template <typename Src>
-  TensorView<T>& operator/=(TensorView<Src> const& tensor) {
+  template <typename SrcTensorView>
+  HostTensor& operator/=(SrcTensorView const& tensor) {
     Base::operator/=(tensor);
     sync_device();
     return *this;
   }
 
-  /// equality with epsilon tolerance
-  bool equals(TensorView<T> const& tensor, T epsilon) const {
-    return Base::equals(tensor, epsilon);
-  }
-
-  /// equality with ulps tolerance
-  bool bit_equals(TensorView<T> const& tensor, long long ulps_threshold = 0) {
-    return Base::bit_equals(tensor, ulps_threshold);
-  }
-
-  /// Computes general matrix product among select dimensions of a tensor
-  /// Assumes:
-  ///   D: number of independent GEMMs to compute
-  ///   H: height of matrix
-  ///   W: width of matrix
-  template <
-      /// Data type of A matrix elements
-      typename A,
-      /// Data type of B matrix elements
-      typename B,
-      /// Data type of "compute" type (i.e. accumulator)
-      typename Ctype,
-      /// Data type of scale factors
-      typename Stype>
-  void gemm(TensorView<A> const& tensor_a, TensorView<B> const& tensor_b, Stype alpha, Stype beta) {
-    Base::template gemm<A, B, Ctype, Stype>(tensor_a, tensor_b, alpha, beta);
-  }
-
   /// Fills with random data
   template <typename Gen>
   void fill_random(Gen generator) {
@@ -335,31 +351,38 @@ class HostTensor : public HostTensorView<T> {
   }
 
   /// computes elements as a linear combination of their coordinates
-  void fill_linear(Coord_t v, T offset = T(0)) {
+  void fill_linear(TensorCoord v, HostType offset = HostType(0)) {
     Base::fill_linear(v, offset);
     sync_device();
   }
 
   /// computes elements as a linear combination of their coordinates
-  void fill_sequential(T v = T(1), T offset = T(0)) {
+  void fill_sequential(HostType v = HostType(1), HostType offset = HostType(0)) {
     Base::fill_sequential(v, offset);
     sync_device();
   }
 
   /// fills with a value
-  void fill(T val = T(0)) {
+  void fill(HostType val = HostType(0)) {
     Base::fill(val);
     sync_device();
   }
 
-  /// Copies from external data source and performs type conversion
-  template <typename Src>
-  void fill(TensorView<Src> const& tensor) {
+  /// copies from external data source and performs type conversion
+  template <
+    typename SrcType,
+    typename SrcMapFunc_,
+    int SrcStorageRank_,
+    typename SrcIndex_,
+    typename SrcLongIndex_
+  >
+  void fill(
+    TensorView<SrcType, Base::kRank, SrcMapFunc_, SrcStorageRank_, SrcIndex_, SrcLongIndex_> const& tensor) {
     Base::fill(tensor);
     sync_device();
   }
-
-  /// Computes the norm of the matrix in double-precision
-  double norm() const { return Base::norm(); }
 };
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
 }  // namespace cutlass
diff --git a/tools/util/host_tensor_view.h b/tools/util/host_tensor_view.h
index de3227f24..4b7f90c74 100644
--- a/tools/util/host_tensor_view.h
+++ b/tools/util/host_tensor_view.h
@@ -23,45 +23,77 @@
  *
  **************************************************************************************************/
 /*! \file
-    \brief Host-side implementation of useful operations
+    \brief Host-side implementation of basic tensor operations.
+
+    See cutlass/tensor_ref.h and cutlass/tensor_view.h for more details.
 */
 
 #pragma once
 
-#include <cutlass/cutlass.h>
-#include <cutlass/tensor_view.h>
-#include <tools/util/type_traits.h>
+#include "cutlass/cutlass.h"
+#include "cutlass/tensor_view.h"
+#include "tools/util/type_traits.h"
 
 namespace cutlass {
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename SrcType, typename DstType>
-struct Cast {
-  static inline DstType apply(SrcType src) { return static_cast<DstType>(src); };
-};
-
-template <>
-struct Cast<float, int8_t> {
-  static inline int8_t apply(float src) {
-    return static_cast<int8_t>(fmaxf(-128.f, fminf(127.f, src)));
-  };
-};
-
-template <>
-struct Cast<float, uint8_t> {
-  static inline uint8_t apply(float src) {
-    return static_cast<uint8_t>(fmaxf(0.f, fminf(255.f, src)));
-  };
-};
-
-////////////////////////////////////////////////////////////////////////////////////////////////////
-
-template <typename T>
-class HostTensorView : public TensorView<T> {
+template <
+  /// Data type of element stored within tensor
+  typename Storage_,
+  /// Rank of logical tensor
+  int Rank_ = 4,
+  /// Maps a Coord<Rank_> in the logical tensor index space to the internal n-D array
+  typename MapFunc_ = IdentityTensorMapFunc<Rank_>,
+  /// Rank of internal n-D array
+  int StorageRank_ = Rank_,
+  /// Index type used for coordinates
+  typename Index_ = int,
+  /// Index type used for offsets and pointer differences
+  typename LongIndex_ = long long
+>
+class HostTensorView :
+  public TensorView<Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_> {
  public:
   /// Base class
-  typedef TensorView<T> TensorView_t;
+  typedef TensorView<Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_> Base;
+
+  /// Storage type
+  typedef typename Base::Storage Storage;
+
+  /// Alias for underlying TensorRef
+  typedef typename Base::TensorRef TensorRef;
+
+  /// Index type
+  typedef typename Base::Index Index;
+
+  /// Coordinate in logical tensor space
+  typedef typename TensorRef::TensorCoord TensorCoord;
+
+  /// Coordinate in storage n-D array
+  typedef typename TensorRef::StorageCoord StorageCoord;
+
+  /// Stride vector in storage coordinate space
+  /// Least significant stride is = 1 and not stored
+  typedef typename TensorRef::StrideVector StrideVector;
+
+  /// Long index type for pointer offsets
+  typedef typename Base::LongIndex LongIndex;
+
+  /// Rank of tensor index space
+  static int const kRank = Base::kRank;
+
+  //
+  // Definitions included for backwards compatibility - These will be remmoved
+  // in the next major release.
+  //
+
+  /// Base class
+  typedef Base TensorView_t;
+
+  //
+  // These definitions are meaningful for rank=4 tensors.
+  //
 
   /// Convention: depth is the first dimension
   static int const Dim_D = 0;
@@ -75,19 +107,8 @@ class HostTensorView : public TensorView<T> {
   /// Convention: channel is the second dimension
   static int const Dim_C = 3;
 
-  /// Rank of tensor
-  static int const Rank = TensorView_t::Rank;
-
-  /// Type used to compute the offset of an element to the base of a tensor
-  typedef typename TensorView_t::Offset_t Offset_t;
-
-  /// Reference and stride
-  typedef typename TensorView_t::TensorRef_t TensorRef_t;
-
-  /// Coordinate into tensor
-  typedef typename TensorView_t::Coord_t Coord_t;
-
  public:
+
   //
   // Device and Host Methods
   //
@@ -95,91 +116,87 @@ class HostTensorView : public TensorView<T> {
   /// Default constructor
   HostTensorView() {}
 
-  /// Constructs a Tensor_view from a TensorRef and size
-  HostTensorView(TensorRef_t const& _ref, Coord_t const& _size) : TensorView_t(_ref, _size) {}
+  /// Helper to construct from pointer, stride, and size
+  HostTensorView(
+    Storage_ *_ptr,
+    StrideVector const &_stride,
+    TensorCoord const& _size
+  ) : Base(TensorRef(_ptr, _stride), _size) {}
 
-  /// Accesses the size
-  Coord_t const& size() const { return TensorView_t::size(); }
+  /// Helper to construct from pointer, stride, and size
+  HostTensorView(
+    Storage_ *_ptr,
+    StorageCoord const &_stride,
+    TensorCoord const& _size
+  ) : Base(TensorRef(_ptr, _stride), _size) {}
 
-  /// Accesses the size of a specified dimension
-  int size(int dim) const { return size().at(dim); }
-
-  /// Accesses the stride
-  Coord_t const& stride() const { return TensorView_t::stride(); }
-
-  /// Accesses the stride along a specified dimension
-  int stride(int dim) const { return stride().at(dim); }
-
-  /// Returns the number of scalar elements needed to store tensor
-  size_t capacity() const { return size(3) * stride(3) * stride(2) * stride(1) * stride(0); }
-
-  /// Returns true if the Tensor_view is bound to some memory
-  bool good() const { return TensorView_t::good(); }
-
-  /// Updates the reference and size of a TensorView object
-  void reset(TensorRef_t const& _ref = TensorRef_t(0), Coord_t const& _size = Coord_t()) {
-    return TensorView_t::reset(_ref, _size);
-  }
-
-  /// Accesses the tensor reference pointing to data
-  TensorRef_t& ref() { return TensorView_t::ref(); }
-
-  /// Accesses the tensor reference pointing to data
-  TensorRef_t const& ref() const { return TensorView_t::ref(); }
+  /// Constructs a Tensor_view from a TensorRef and size assuming dense packing
+  HostTensorView(
+    TensorRef const& _ref,
+    TensorCoord const& _size) : Base(_ref, _size) {}
 
   /// Assigns a tensor view
-  HostTensorView& operator=(TensorView_t const& _tensor) {
-    reset(_tensor.ref(), _tensor.size());
+  HostTensorView& operator=(Base const& _tensor) {
+    this->reset(_tensor.ref(), _tensor.size());
     return *this;
   }
 
-  /// Returns the index of an element
-  Offset_t offset(Coord_t const& coord) const { return TensorView_t::offset(coord); }
+  /// Returns a TensorView offset by a given amount
+  CUTLASS_HOST_DEVICE
+  HostTensorView operator+(TensorCoord const& b) const {
+    HostTensorView result(*this);
+    result.add_pointer_offset(this->offset(b));
+    return result;
+  }
 
-  /// Determines whether a location is within a tensor
-  bool contains(Coord_t const& coord) const { return TensorView_t::contains(coord); }
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  HostTensorView& operator+=(TensorCoord const& b) {
+    this->add_pointer_offset(this->offset(b));
+    return *this;
+  }
 
-  /// Element-wise accessor
-  T& at(Coord_t const& coord) const { return TensorView_t::at(coord); }
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  HostTensorView operator-(TensorCoord const& b) const {
+    TensorRef result(*this);
+    result.add_pointer_offset(-this->offset(b));
+    return result;
+  }
 
-  /// Element-wise accessor
-  T& operator[](Coord_t const& coord) const { return at(coord); }
-
-  /// Accesses an element with a raw offset
-  T& at(int idx) const { return TensorView_t::at(idx); }
-
-  /// Accesses an element with a raw offset
-  T& operator[](int idx) const { return at(idx); }
-
-  /// Returns a Tensor_view given location and size quantities
-  TensorView_t subview(Coord_t const& location, Coord_t size) const {
-    return TensorView_t::subview(location, size);
+  /// Returns a TensorRef offset by a given amount
+  CUTLASS_HOST_DEVICE
+  HostTensorView& operator-=(TensorCoord const& b) {
+    this->add_pointer_offset(-this->offset(b));
+    return *this;
   }
 
   /// Recurses through all dimensions and applies a unary operation in place
   template <typename F>
-  void elementwise_in_place(F& op, int dim = 0, Offset_t dst_offset_base = 0) {
-    Offset_t dst_offset = dst_offset_base;
+  void elementwise_in_place(F& op, int dim = 0, TensorCoord const &start_coord = TensorCoord()) {
 
-    for (int idx = 0; idx < size(dim); ++idx, dst_offset += stride(dim)) {
-      if (dim < Rank - 1) {
-        elementwise_in_place(op, dim + 1, dst_offset);
+    TensorCoord coord(start_coord);
+    for (int idx = 0; idx < this->size(dim); ++idx) {
+      coord[dim] = idx;
+      if (dim < kRank - 1) {
+        elementwise_in_place(op, dim + 1, coord);
       } else {
-        op(ref().data()[dst_offset]);
+        op(this->at(coord));
       }
     }
   }
 
   /// Recurses through all dimensions and applies a unary operator with no arguments
   template <typename F>
-  void elementwise_stream(F& op, int dim = 0, Offset_t dst_offset_base = 0) {
-    Offset_t dst_offset = dst_offset_base;
+  void elementwise_stream(F& op, int dim = 0, TensorCoord const &start_coord = TensorCoord()) {
 
-    for (int idx = 0; idx < size(dim); ++idx, dst_offset += stride(dim)) {
-      if (dim < Rank - 1) {
-        elementwise_stream(op, dim + 1, dst_offset);
+    TensorCoord coord(start_coord);
+    for (int idx = 0; idx < this->size(dim); ++idx) {
+      coord[dim] = idx;
+      if (dim < kRank - 1) {
+        elementwise_stream(op, dim + 1, coord);
       } else {
-        ref().data()[dst_offset] = op();
+        this->at(coord) = op();
       }
     }
   }
@@ -189,61 +206,56 @@ class HostTensorView : public TensorView<T> {
   template <typename F>
   void elementwise_generate(F& op,
                             int dim = 0,
-                            Offset_t dst_offset_base = 0,
-                            Coord_t coord = Coord_t(0)) {
-    Offset_t dst_offset = dst_offset_base;
+                            TensorCoord const & start_coord = TensorCoord()) {
 
-    for (int idx = 0; idx < size(dim); ++idx, dst_offset += stride(dim)) {
-      coord.at(dim) = idx;
-
-      if (dim < Rank - 1) {
-        elementwise_generate(op, dim + 1, dst_offset, coord);
+    TensorCoord coord(start_coord);
+    for (int idx = 0; idx < this->size(dim); ++idx) {
+      coord[dim] = idx;
+      if (dim < kRank - 1) {
+        elementwise_generate(op, dim + 1, coord);
       } else {
-        ref().data()[dst_offset] = op(coord);
+        this->at(coord) = op(coord);
       }
     }
   }
 
   /// Recurses through all dimensions and applies a unary operator, supplying the logical
-  /// coordinate within the tensor as an argument
+  /// coordinate within the tensor as an argument. Mutable.
   template <typename F>
   void elementwise_visit(F& op,
                          int dim = 0,
-                         Offset_t dst_offset_base = 0,
-                         Coord_t coord = Coord_t(0)) const {
-    Offset_t dst_offset = dst_offset_base;
+                         TensorCoord const & start_coord = TensorCoord()) const {
 
-    for (int idx = 0; idx < size(dim); ++idx, dst_offset += stride(dim)) {
-      coord.at(dim) = idx;
+    TensorCoord coord(start_coord);
+    for (int idx = 0; idx < this->size(dim); ++idx) {
+      coord[dim] = idx;
 
-      if (dim < Rank - 1) {
-        elementwise_visit(op, dim + 1, dst_offset, coord);
+      if (dim < kRank - 1) {
+        elementwise_visit(op, dim + 1, coord);
       } else {
-        op(ref().data()[dst_offset], coord);
+        op(this->at(coord), coord);
       }
     }
   }
 
   /// Recurses through all dimensions and applies a binary operation
-  template <typename Src, typename F>
+  template <typename F, typename SrcTensorView>
   bool elementwise_in_place(F& op,
-                            TensorView<Src> const& tensor,
+                            SrcTensorView const& tensor,
                             int dim = 0,
-                            Offset_t dst_offset_base = 0,
-                            Offset_t src_offset_base = 0) {
-    Offset_t dst_offset = dst_offset_base;
-    Offset_t src_offset = src_offset_base;
+                            TensorCoord const &start_coord = TensorCoord()) {
 
-    if (size().at(dim) != tensor.size().at(dim)) {
+    if (this->size(dim) != tensor.size(dim)) {
       return false;
     }
 
-    for (int idx = 0; idx < size(dim);
-         ++idx, dst_offset += stride(dim), src_offset += tensor.stride(dim)) {
-      if (dim < Rank - 1) {
-        elementwise_in_place(op, tensor, dim + 1, dst_offset, src_offset);
+    TensorCoord coord(start_coord);
+    for (int idx = 0; idx < this->size(dim); ++idx) {
+      coord[dim] = idx;
+      if (dim < kRank - 1) {
+        elementwise_in_place(op, tensor, dim + 1, coord);
       } else {
-        op(data()[dst_offset], tensor.data()[src_offset]);
+        op(this->at(coord), tensor.at(coord));
       }
     }
 
@@ -252,55 +264,55 @@ class HostTensorView : public TensorView<T> {
 
   template <typename Src>
   struct LambdaBinaryAddition {
-    void operator()(T& a, Src b) const { a += T(b); }
+    void operator()(Storage_& a, Src b) const { a += Storage_(b); }
   };
 
   template <typename Src>
   struct LambdaBinarySubtraction {
-    void operator()(T& a, Src b) const { a -= T(b); }
+    void operator()(Storage_& a, Src b) const { a -= Storage_(b); }
   };
 
   template <typename Src>
   struct LambdaBinaryMultiplication {
-    void operator()(T& a, Src b) const { a *= T(b); }
+    void operator()(Storage_& a, Src b) const { a *= Storage_(b); }
   };
 
   template <typename Src>
   struct LambdaBinaryDivision {
-    void operator()(T& a, Src b) const { a /= T(b); }
+    void operator()(Storage_& a, Src b) const { a /= Storage_(b); }
   };
 
   /// Accumulate in place
-  template <typename Src>
-  TensorView<T>& operator+=(TensorView<Src> const& tensor) {
-    LambdaBinaryAddition<Src> op;
+  template <typename SrcTensorView>
+  HostTensorView& operator+=(SrcTensorView const& tensor) {
+    LambdaBinaryAddition<typename SrcTensorView::Storage> op;
     elementwise_in_place(op, tensor);
 
     return *this;
   }
 
   /// Subtract in place
-  template <typename Src>
-  TensorView<T>& operator-=(TensorView<Src> const& tensor) {
-    LambdaBinarySubtraction<Src> op;
+  template <typename SrcTensorView>
+  HostTensorView& operator-=(SrcTensorView const& tensor) {
+    LambdaBinarySubtraction<typename SrcTensorView::Storage> op;
     elementwise_in_place(op, tensor);
 
     return *this;
   }
 
   /// Multiply in place
-  template <typename Src>
-  TensorView<T>& operator*=(TensorView<Src> const& tensor) {
-    LambdaBinaryMultiplication<Src> op;
+  template <typename SrcTensorView>
+  HostTensorView& operator*=(SrcTensorView const& tensor) {
+    LambdaBinaryMultiplication<typename SrcTensorView::Storage> op;
     elementwise_in_place(op, tensor);
 
     return *this;
   }
 
   /// Divide in place
-  template <typename Src>
-  TensorView<T>& operator/=(TensorView<Src> const& tensor) {
-    LambdaBinaryDivision<Src> op;
+  template <typename SrcTensorView>
+  HostTensorView& operator/=(SrcTensorView const& tensor) {
+    LambdaBinaryDivision<typename SrcTensorView::Storage> op;
     elementwise_in_place(op, tensor);
 
     return *this;
@@ -309,19 +321,19 @@ class HostTensorView : public TensorView<T> {
   /// Comparison operator
   struct EqualsOperator {
     bool equal;
-    T eps;
+    Storage_ eps;
 
-    EqualsOperator(T _epsilon) : equal(true), eps(_epsilon) {}
+    EqualsOperator(Storage_ _epsilon) : equal(true), eps(_epsilon) {}
 
-    void operator()(T a, T b) {
-      if (std::abs(T(a - b)) > eps * std::max(std::abs(a), std::abs(b))) {
+    void operator()(Storage_ a, Storage_ b) {
+      if (std::abs(Storage_(a - b)) > eps * std::max(std::abs(a), std::abs(b))) {
         equal = false;
       }
     }
   };
 
   /// equality with epsilon tolerance
-  bool equals(TensorView<T> const& tensor, T epsilon) const {
+  bool equals(Base const& tensor, Storage epsilon) const {
     EqualsOperator comparison_op(epsilon);
     bool equal_size = elementwise_in_place(comparison_op, tensor);
 
@@ -336,13 +348,13 @@ class HostTensorView : public TensorView<T> {
 
     BitEqualsOperator(long long _ulps_threshold) : equal(true), eps(_ulps_threshold), index(0) {}
 
-    void operator()(T a, T b) {
+    void operator()(Storage_ a, Storage_ b) {
       // convert bits to integers
       long long bits_a = 0;
       long long bits_b = 0;
 
-      *reinterpret_cast<T*>(&bits_a) = TypeTraits<T>::remove_negative_zero(a);
-      *reinterpret_cast<T*>(&bits_b) = TypeTraits<T>::remove_negative_zero(b);
+      *reinterpret_cast<Storage_*>(&bits_a) = TypeTraits<Storage_>::remove_negative_zero(a);
+      *reinterpret_cast<Storage_*>(&bits_b) = TypeTraits<Storage_>::remove_negative_zero(b);
 
       // compute diff
       long long ulps = bits_a - bits_b;
@@ -354,85 +366,13 @@ class HostTensorView : public TensorView<T> {
   };
 
   /// equality with ulps tolerance
-  bool bit_equals(TensorView<T> const& tensor, long long ulps_threshold = 0) {
+  bool bit_equals(Base const& tensor, long long ulps_threshold = 0) {
     BitEqualsOperator comparison_op(ulps_threshold);
     bool equal_size = elementwise_in_place(comparison_op, tensor);
 
     return equal_size && comparison_op.equal;
   }
 
-  /// Gets naked pointer to data
-  T* data() const { return TensorView_t::data(); }
-
-  /// Computes general matrix product among select dimensions of a tensor
-  /// Assumes:
-  ///   D: number of independent GEMMs to compute
-  ///   H: height of matrix
-  ///   W: width of matrix
-  ///   C: "channels" of each element
-  template <typename A, typename B, typename Ctype, typename Stype>
-  void gemm(TensorView<A> const& tensor_a, TensorView<B> const& tensor_b, Stype alpha, Stype beta) {
-    int const Batch = size(Dim_D);
-    int const M = size(Dim_H);
-    int const N = size(Dim_W);
-    int const K = tensor_a.size(Dim_W);
-    int const C = tensor_a.size(Dim_C);
-
-    // Sizes must match
-    if (tensor_a.size(Dim_H) != M || tensor_b.size(Dim_W) != N || tensor_b.size(Dim_C) != C ||
-        tensor_b.size(Dim_H) != K) {
-      return;
-    }
-
-    int const Mblock = 32;
-    int const Nblock = 32;
-
-    for (int batch = 0; batch < Batch; ++batch) {
-      for (int row_block = 0; row_block < M; row_block += Mblock) {
-        for (int col_block = 0; col_block < N; col_block += Nblock) {
-          Ctype accum[Mblock][Nblock];
-
-          for (int j = 0; j < Nblock; j++) {
-            for (int i = 0; i < Mblock; i++) {
-              accum[i][j] = Ctype(0);
-            }
-          }
-
-          for (int k_block = 0; k_block < K; ++k_block) {
-            for (int j = 0; j < Nblock; j++) {
-              for (int i = 0; i < Mblock; i++) {
-                int row = row_block + i;
-                int col = col_block + j;
-
-                if (row < M && col < N) {
-                  for (int channel = 0; channel < C; ++channel) {
-                    Ctype a(tensor_a.at(make_Coord(batch, row, k_block, channel)));
-                    Ctype b(tensor_b.at(make_Coord(batch, k_block, col, channel)));
-
-                    accum[i][j] += a * b;
-                  }
-                }
-              }
-            }
-          }
-
-          for (int j = 0; j < Nblock; j++) {
-            for (int i = 0; i < Mblock; i++) {
-              int row = row_block + i;
-              int col = col_block + j;
-
-              Coord_t coord = make_Coord(batch, row, col, 0);
-              if (row < M && col < N) {
-                at(coord) =
-                    Cast<Stype, T>::apply(alpha * Stype(accum[i][j]) + beta * Stype(at(coord)));
-              }
-            }
-          }
-        }
-      }
-    }
-  }
-
   /// Fills with random data
   template <typename Gen>
   void fill_random(Gen generator) {
@@ -453,7 +393,9 @@ class HostTensorView : public TensorView<T> {
 
   /// Generator to fill a tensor with the identity matrix
   struct LambdaFillIdentity {
-    T operator()(Coord_t const& coord) { return (coord.at(1) == coord.at(2) ? T(1) : T(0)); }
+    Storage_ operator()(TensorCoord const& coord) {
+      return (coord.at(1) == coord.at(2) ? Storage_(1) : Storage_(0));
+    }
   };
 
   /// initializes with identity
@@ -464,39 +406,41 @@ class HostTensorView : public TensorView<T> {
 
   /// Lambda for fill_linear()
   struct LambdaFillLinear {
-    Coord_t v_;
-    T offset_;
+    TensorCoord v_;
+    Storage_ offset_;
 
-    LambdaFillLinear(Coord_t const& _v, T _offset) : v_(_v), offset_(_offset) {}
+    LambdaFillLinear(TensorCoord const& _v, Storage_ _offset) : v_(_v), offset_(_offset) {}
 
-    T operator()(Coord_t const& coord) { return T(v_.template dot<int>(coord)) + offset_; }
+    Storage_ operator()(TensorCoord const& coord) {
+      return Storage_(v_.template dot<int>(coord)) + offset_;
+    }
   };
 
   /// computes elements as a linear combination of their coordinates
-  void fill_linear(Coord_t v, T offset = T(0)) {
+  void fill_linear(TensorCoord v, Storage_ offset = Storage_(0)) {
     LambdaFillLinear lambda(v, offset);
     elementwise_generate(lambda);
   }
 
   /// computes elements as a linear combination of their coordinates
-  void fill_sequential(T v = T(1), T offset = T(0)) {
-    int const count = size().count();
+  void fill_sequential(Storage_ v = Storage_(1), Storage_ offset = Storage_(0)) {
+    int const count = this->size().count();
     for (int i = 0; i < count; ++i) {
-      data()[i] = T(i);
+      this->data()[i] = Storage_(i);
     }
   }
 
   /// Returns a constant value
   struct LambdaFillValue {
-    T value;
+    Storage_ value;
 
-    LambdaFillValue(T _value) : value(_value) {}
+    LambdaFillValue(Storage_ _value) : value(_value) {}
 
-    T operator()() { return value; }
+    Storage_ operator()() { return value; }
   };
 
   /// fills with a value
-  void fill(T val = T(0)) {
+  void fill(Storage_ val = Storage_(0)) {
     LambdaFillValue op(val);
     elementwise_stream(op);
   }
@@ -504,13 +448,21 @@ class HostTensorView : public TensorView<T> {
   /// Conversion from Src to T
   template <typename Src>
   struct LambdaAssign {
-    void operator()(T& a, Src b) const { a = T(b); }
+    void operator()(Storage_& a, Src b) const { a = Storage_(b); }
   };
 
   /// copies from external data source and performs type conversion
-  template <typename Src>
-  void fill(TensorView<Src> const& tensor) {
-    LambdaAssign<Src> op;
+  template <
+    typename SrcType,
+    typename SrcMapFunc_,
+    int SrcStorageRank_,
+    typename SrcIndex_,
+    typename SrcLongIndex_
+  >
+  void fill(
+    TensorView<SrcType, kRank, SrcMapFunc_, SrcStorageRank_, SrcIndex_, SrcLongIndex_> const& tensor) {
+
+    LambdaAssign<SrcType> op;
     elementwise_in_place(op, tensor);
   }
 
@@ -520,7 +472,7 @@ class HostTensorView : public TensorView<T> {
 
     LambdaNorm() : sum(0) {}
 
-    void operator()(T const& element) {
+    void operator()(Storage const& element) {
       double value(element);
       double conj(element);  // TODO - conjugates for complex
 
@@ -540,3 +492,4 @@ class HostTensorView : public TensorView<T> {
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 }  // namespace cutlass
+
diff --git a/tools/util/reference/device/kernel/tensor_elementwise.h b/tools/util/reference/device/kernel/tensor_elementwise.h
new file mode 100644
index 000000000..31f7a2d8d
--- /dev/null
+++ b/tools/util/reference/device/kernel/tensor_elementwise.h
@@ -0,0 +1,162 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#pragma once
+
+#include <curand_kernel.h>
+
+#include "cutlass/cutlass.h"
+
+namespace cutlass {
+namespace reference {
+namespace device {
+namespace kernel {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Kernel to initialize tensor to uniform random distribution
+template <typename T>
+__global__ void TensorInitializeUniform(
+    Distribution dist, int64_t seed, int dim_contiguous, int dim_strided, T *tensor, int ldm) {
+  __shared__ curandState_t rng_state[1024];
+
+  uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x + blockIdx.y * gridDim.x * blockDim.x;
+
+  curand_init(seed, gtid, 0, &rng_state[threadIdx.x]);
+
+  int c_idx = blockIdx.x * blockDim.x + threadIdx.x;
+  int s_idx = blockIdx.y * blockDim.x;
+
+  tensor += s_idx * ldm + c_idx;
+
+  for (int s_offset = 0; s_offset < blockDim.x; ++s_offset, ++s_idx) {
+    if (s_idx < dim_strided && c_idx < dim_contiguous) {
+      double range = dist.uniform.max - dist.uniform.min;
+
+      double rnd = curand_uniform(&rng_state[threadIdx.x]);
+
+      rnd = dist.uniform.min + range * rnd;
+
+      // Random values are cast to integer after scaling by a power of two to facilitate error
+      // testing
+      if (dist.int_scale >= 0) {
+        rnd = double(int(rnd * double(1 << dist.int_scale)));
+        *tensor = T(rnd / double(1 << dist.int_scale));
+      } else {
+        *tensor = T(rnd);
+      }
+
+      tensor += ldm;
+    }
+  }
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Kernel to initialize tensor to uniform distribution
+template <typename T>
+__global__ void TensorInitializeGaussian(
+    Distribution dist, int64_t seed, int dim_contiguous, int dim_strided, T *tensor, int ldm) {
+  __shared__ curandState_t rng_state[1024];
+
+  uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x + blockIdx.y * gridDim.x * blockDim.x;
+
+  curand_init(seed, gtid, 0, &rng_state[threadIdx.x]);
+
+  int c_idx = blockIdx.x * blockDim.x + threadIdx.x;
+  int s_idx = blockIdx.y * blockDim.x;
+
+  tensor += s_idx * ldm + c_idx;
+
+  for (int s_offset = 0; s_offset < blockDim.x; ++s_offset, ++s_idx) {
+    if (s_idx < dim_strided && c_idx < dim_contiguous) {
+      // Random values are cast to integer after scaling by a power of two to facilitate error
+      // testing
+
+      double rnd = curand_normal(&rng_state[threadIdx.x]);
+
+      rnd = dist.gaussian.mean + dist.gaussian.stddev * rnd;
+
+      if (dist.int_scale >= 0) {
+        rnd = double(int(rnd * double(1 << dist.int_scale)));
+        *tensor = T(rnd / double(1 << dist.int_scale));
+      } else {
+        *tensor = T(rnd);
+      }
+    }
+  }
+}
+
+/// Kernel to initialize tensor to an identity matrix
+template <typename T>
+__global__ void TensorInitializeLinear(
+    Distribution dist, int64_t seed, int dim_contiguous, int dim_strided, T *tensor, int ldm) {
+  __shared__ curandState_t rng_state[1024];
+
+  uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x + blockIdx.y * gridDim.x * blockDim.x;
+
+  curand_init(seed, gtid, 0, &rng_state[threadIdx.x]);
+
+  int c_idx = blockIdx.x * blockDim.x + threadIdx.x;
+  int s_idx = blockIdx.y * blockDim.x;
+
+  tensor += s_idx * ldm + c_idx;
+
+  for (int s_offset = 0; s_offset < blockDim.x; ++s_offset, ++s_idx) {
+    if (s_idx < dim_strided && c_idx < dim_contiguous) {
+      *tensor =
+          dist.linear.offset + dist.linear.delta_row * c_idx + dist.linear.delta_column * s_idx;
+    }
+  }
+}
+
+/// Kernel to initialize tensor to an identity matrix
+template <typename T>
+__global__ void TensorInitializeIdentity(
+    Distribution dist, int64_t seed, int dim_contiguous, int dim_strided, T *tensor, int ldm) {
+  __shared__ curandState_t rng_state[1024];
+
+  uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x + blockIdx.y * gridDim.x * blockDim.x;
+
+  curand_init(seed, gtid, 0, &rng_state[threadIdx.x]);
+
+  int c_idx = blockIdx.x * blockDim.x + threadIdx.x;
+  int s_idx = blockIdx.y * blockDim.x;
+
+  tensor += s_idx * ldm + c_idx;
+
+  for (int s_offset = 0; s_offset < blockDim.x; ++s_offset, ++s_idx) {
+    if (s_idx < dim_strided && c_idx < dim_contiguous) {
+      *tensor = (c_idx == s_idx ? T(1) : T(0));
+    }
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace kernel
+} // namespace device
+} // namespace reference
+} // namespace cutlass
diff --git a/tools/util/reference/device/kernel/tensor_foreach.h b/tools/util/reference/device/kernel/tensor_foreach.h
new file mode 100644
index 000000000..5396d5618
--- /dev/null
+++ b/tools/util/reference/device/kernel/tensor_foreach.h
@@ -0,0 +1,112 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+
+#pragma once
+
+#include "cutlass/cutlass.h"
+#include "cutlass/coord.h"
+
+namespace cutlass {
+namespace reference {
+namespace device {
+namespace kernel {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Defines several helpers
+namespace detail {
+
+/// Helper to perform for-each operation
+template <typename Func, int Rank, int RankRemaining>
+struct TensorForEachHelper {
+
+  /// Constructor for general rank
+  __inline__ __device__
+  TensorForEachHelper(Func &func, Coord<Rank> const &size, Coord<Rank> &coord, int64_t index) {
+
+    int64_t product = 1;
+
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = Rank - RankRemaining; i < Rank; ++i) {
+      product *= size[i];
+    }
+
+    coord[Rank - 1 - RankRemaining] = index / product;
+    int64_t remaining = index % product;
+    
+    TensorForEachHelper<Func, Rank, RankRemaining-1>(func, size, coord, remaining);
+  }
+};
+
+/// Helper to perform for-each operation
+template <typename Func, int Rank>
+struct TensorForEachHelper<Func, Rank, 0> {
+
+  /// Constructor for fastest chaning rank
+  __inline__ __device__
+  TensorForEachHelper(Func &func, Coord<Rank> const &size, Coord<Rank> &coord, int64_t index) {
+
+    coord[Rank - 1] = index;
+
+    if (coord < size) {
+      func(coord);
+    }
+  }
+};
+
+} // namespace detail
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to perform for-each operation
+template <typename Func, int Rank, typename Params>
+__global__ void TensorForEach(Coord<Rank> size, Params params = Params()) {
+
+  Func func(params);
+
+  int64_t index = threadIdx.x + blockIdx.x * blockDim.x;
+  int64_t max_index = 1;
+
+  CUTLASS_PRAGMA_UNROLL
+  for (int i = 0; i < Rank; ++i) {
+    max_index *= size[i];
+  }
+
+  CUTLASS_PRAGMA_NO_UNROLL
+  while  (index < max_index) {
+    Coord<Rank> coord;
+
+    detail::TensorForEachHelper<Func, Rank, Rank - 1>(func, size, coord, index); 
+    index += blockDim.x * gridDim.x;
+  }
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace kernel
+} // namespace device
+} // namespace reference
+} // namespace cutlass
+
diff --git a/tools/util/reference/device/tensor_elementwise.h b/tools/util/reference/device/tensor_elementwise.h
new file mode 100644
index 000000000..2b1eb2487
--- /dev/null
+++ b/tools/util/reference/device/tensor_elementwise.h
@@ -0,0 +1,772 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/* \file
+  \brief Defines device-side elementwise operations on TensorView. Note, the operations defined
+    in this header are not specialized for any particular data layout and are therefore not
+    intended to offer the best possible performance. Rather, they are intended to be generic
+    reference implementations to support the CUTLASS unit tests.
+*/
+
+#pragma once
+
+// Standard Library includes
+#include <fstream>
+#include <ostream>
+#include <stdexcept>
+#include <string>
+#include <utility>
+
+// CUDA includes
+#include <cublas_v2.h>
+#include <curand_kernel.h>
+
+// Cutlass includes
+#include "cutlass/cutlass.h"
+#include "tools/util/device_memory.h"
+#include "tools/util/distribution.h"
+#include "tools/util/type_traits.h"
+#include "tools/util/host_tensor.h"
+#include "tools/util/reference/device/tensor_foreach.h"
+
+namespace cutlass {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace reference {
+namespace device {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace detail {
+
+/// Computes a random uniform distribution
+template <typename View_>
+struct RandomUniformFunc {
+
+  /// View type
+  typedef View_ View;
+
+  /// Scalar type
+  typedef typename View::Storage T;
+
+  /// Coordinate in tensor's index space
+  typedef typename View::TensorCoord TensorCoord;
+
+  /// Parameters structure
+  struct Params {
+
+    /// View object
+    View view;
+
+    /// RNG seed
+    int64_t seed;
+
+    /// Distriubtion
+    Distribution dist;
+
+    /// Default ctor
+    CUTLASS_HOST_DEVICE
+    Params() { }
+
+    /// Constructor
+    CUTLASS_HOST_DEVICE
+    Params(
+      View const &view,
+      int64_t seed,
+      Distribution dist
+    ): view(view), seed(seed), dist(dist) { }
+  };
+
+  //
+  // Data members
+  //
+
+  /// Parameters object
+  Params params;
+
+  /// RNG state object
+  curandState_t rng_state;
+
+  //
+  // Methods
+  //
+
+  /// Device-side initialization of RNG
+  CUTLASS_DEVICE
+  RandomUniformFunc(Params const &params): params(params) {
+
+    uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x;
+
+    curand_init(params.seed, gtid, 0, &rng_state);
+  }
+
+  /// Compute random value and update RNG state
+  CUTLASS_DEVICE
+  void operator()(TensorCoord const &coord) {
+
+    double range = params.dist.uniform.max - params.dist.uniform.min;
+    double rnd = curand_uniform(&rng_state);
+    rnd = params.dist.uniform.min + range * rnd;
+
+    // Random values are cast to integer after scaling by a power of two to facilitate error
+    // testing
+    T result;
+    if (params.dist.int_scale >= 0) {
+      rnd = double(int(rnd * double(1 << params.dist.int_scale)));
+      result = T(rnd / double(1 << params.dist.int_scale));
+    }
+    else {
+      result = T(rnd);
+    }
+
+    params.view.at(coord) = result;
+  }
+};
+
+/// Computes a random Gaussian distribution
+template <typename View_>
+struct RandomGaussianFunc {
+
+  /// View type
+  typedef View_ View;
+
+  /// Scalar type
+  typedef typename View::Storage T;
+
+  /// Coordinate in tensor's index space
+  typedef typename View::TensorCoord TensorCoord;
+
+  /// Parameters structure
+  struct Params {
+
+    /// View object
+    View view;
+
+    /// RNG seed
+    int64_t seed;
+
+    /// RNG distribution
+    Distribution dist;
+
+    /// Default ctor
+    CUTLASS_HOST_DEVICE
+    Params() { }
+
+    /// Constructor
+    CUTLASS_HOST_DEVICE
+    Params(
+      View const &view,
+      int64_t seed,
+      Distribution dist
+    ): view(view), seed(seed), dist(dist) { }
+  };
+
+  //
+  // Data members
+  //
+
+  /// Parameters object
+  Params params;
+
+  /// RNG state object
+  curandState_t rng_state;
+
+  //
+  // Methods
+  //
+
+  /// Device-side initialization of RNG
+  CUTLASS_DEVICE
+  RandomGaussianFunc(Params const &params): params(params) {
+
+    uint64_t gtid = threadIdx.x + blockIdx.x * blockDim.x;
+
+    curand_init(params.seed, gtid, 0, &rng_state);
+  }
+
+  /// Compute random value and update RNG state
+  CUTLASS_DEVICE
+  void operator()(TensorCoord const &coord) {
+
+    double rnd = curand_normal(&rng_state);
+    rnd = params.dist.gaussian.mean + params.dist.gaussian.stddev * rnd;
+
+    T result;
+    if (params.dist.int_scale >= 0) {
+      rnd = double(int(rnd * double(1 << params.dist.int_scale)));
+      result = T(rnd / double(1 << params.dist.int_scale));
+    }
+    else {
+      result = T(rnd);
+    }
+
+    params.view.at(coord) = result;
+  }
+};
+
+/// Computes a linear combination of each element
+template <typename View_>
+struct LinearCombinationFunc {
+
+  /// View type
+  typedef View_ View;
+
+  /// Scalar type
+  typedef typename View::Storage T;
+
+  /// Coordinate in tensor's index space
+  typedef typename View::TensorCoord TensorCoord;
+
+  //
+  // Data members
+  //
+
+  /// TensorView object
+  View view;
+
+  /// Delta
+  Coord<View::kRank, double> delta;
+
+  /// Offset
+  double offset;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  CUTLASS_HOST_DEVICE
+  LinearCombinationFunc(
+    View const &view,
+    Distribution dist
+  ): view(view) {
+
+    offset = dist.linear.offset;
+    if (View::kRank >= 1) {
+      delta[View::kRank - 1] = dist.linear.delta_column;
+    }
+    if (View::kRank >= 2) {
+      delta[View::kRank - 2] = dist.linear.delta_row;
+    }
+    // Additional ranks have delta of zero
+    for (int i = View::kRank - 2; i > 0; --i) {
+      delta[i - 1] = 0;
+    }
+  }
+
+  /// Compute linear combination
+  CUTLASS_HOST_DEVICE
+  void operator()(TensorCoord const &coord) {
+    double result = offset;
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < View::kRank; ++i) {
+      result += delta[i] * double(coord[i]);
+    }
+    view.at(coord) = T(result);
+  }
+};
+
+/// Returns 1 or 0 if the coordinate is along the tensor's diagonal
+template <typename View_>
+struct IdentityFunc {
+
+  /// TensorView
+  typedef View_ View;
+
+  /// Scalar type
+  typedef typename View::Storage T;
+
+  /// Coordinate in tensor's index space
+  typedef typename View::TensorCoord TensorCoord;
+
+  //
+  // Data members
+  //
+
+  /// View object
+  View view;
+
+  /// Default ctor
+  CUTLASS_HOST_DEVICE
+  IdentityFunc(View const &view): view(view) { }
+
+  CUTLASS_HOST_DEVICE
+  void operator()(TensorCoord const &coord) {
+    bool equal = true;
+    CUTLASS_PRAGMA_UNROLL
+    for (int i = 0; i < View::kRank; ++i) {
+      if (coord[i] != coord[0]) {
+        equal = false;
+      }
+    }
+    view.at(coord) = equal ? T(1) : T(0);
+  }
+};
+
+} // namespace detail
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Initializes a tensor randomly or procedurally.
+template <typename View>
+void TensorInitialize(View const &view,
+                      int64_t seed,
+                      Distribution const &dist) {
+
+  typedef typename View::Storage Scalar;
+
+  switch (dist.kind) {
+    case Distribution::Uniform:
+    {
+      typedef detail::RandomUniformFunc<View> Func;
+      typedef typename Func::Params Params;
+
+      TensorForEach<Func, View::kRank, Params>(
+        view.size(),
+        Params(view, seed, dist)
+      );
+    }
+      break;
+    case Distribution::Gaussian:
+    {
+      typedef detail::RandomGaussianFunc<View> Func;
+      typedef typename Func::Params Params;
+
+      TensorForEach<Func, View::kRank, Params>(
+        view.size(),
+        Params(view, seed, dist)
+      );
+    }
+      break;
+    case Distribution::Linear:
+    {
+      typedef detail::LinearCombinationFunc<View> Func;
+      TensorForEach<Func, View::kRank, Func>(
+        view.size(),
+        Func(view, dist));
+    }
+      break;
+    case Distribution::Identity:
+    {
+      typedef detail::IdentityFunc<View> Func;
+
+      Func func(view);
+
+      TensorForEach<Func, View::kRank, Func>(view.size(), func);
+    }
+      break;
+    default:
+      break;
+  }
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace device
+} // namespace reference
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Dispatcher to appropriate initialization kernel - preserved for backwards compatibility
+template <typename T>
+inline void tensor_initialize(Distribution const &dist,
+                              int64_t seed,
+                              int dim_contiguous,
+                              int dim_strided,
+                              T *tensor,
+                              int ldm) {
+
+  TensorView<T, 2> view(tensor, make_Coord(ldm, 1), make_Coord(dim_strided, dim_contiguous));
+  reference::device::TensorInitialize(view, seed, dist);
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace reference {
+namespace device {
+namespace detail {
+
+/// Compares two tensor views of equal rank and dimension.
+template <typename ViewL, typename ViewR>
+struct TensorEqualsFunc {
+
+  /// Storage type
+  typedef typename ViewL::Storage T;
+
+  /// Unsigned integer type of same size as View type
+  typedef typename cutlass::TypeTraits<T>::unsigned_type UnsignedType;
+
+  /// Coordinate in tensor's index space
+  typedef typename ViewL::TensorCoord TensorCoord;
+
+  /// Assertions
+  static_assert(ViewL::kRank == ViewR::kRank,
+    "Cannot compare tensors of different rank");
+
+  //
+  // Data members
+  //
+
+  /// View of left-hand-side tensor
+  ViewL lhs;
+
+  /// View of right-hand-side tensor
+  ViewR rhs;
+
+  /// Pointer to result scalar - only written with 0 if values are incorrect
+  int *result;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  CUTLASS_HOST_DEVICE
+  TensorEqualsFunc(ViewL const &lhs, ViewR const &rhs, int *result): lhs(lhs), rhs(rhs), result(result) { }
+
+  /// Equality check
+  CUTLASS_HOST_DEVICE
+  void operator()(TensorCoord const &coord) {
+    UnsignedType _lhs = reinterpret_cast<UnsignedType const &>(lhs.at(coord));
+    UnsignedType _rhs = reinterpret_cast<UnsignedType const &>(rhs.at(coord));
+    if (_lhs != _rhs) {
+      *result = 0;
+    }
+  }
+};
+
+} // namespace detail
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Returns true if two tensor views are equal.
+template <typename ViewL, typename ViewR>
+bool TensorEquals(ViewL const &lhs, ViewR const &rhs) {
+
+  // Sizes must be identical
+  if (lhs.size() != rhs.size()) {
+    return false;
+  }
+
+  // Allocate device memory to contain result of kernel reduction
+  HostTensor<int, 1> result(1);
+  result.fill(1);
+  result.sync_device();
+
+  typedef detail::TensorEqualsFunc<ViewL, ViewR> Func;
+  Func func(lhs, rhs, result.device_data());
+
+  TensorForEach<Func, ViewL::kRank, Func>(lhs.size(), func);
+  result.sync_host();
+
+  return result.at(0) != 0;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to apply a binary operator in place
+template <typename ViewL, typename ViewR, typename BinaryFunc>
+struct TensorFuncBinaryOp {
+
+  /// Coordinate in tensor's index space
+  typedef typename ViewL::TensorCoord TensorCoord;
+
+  //
+  // Data members
+  //
+
+  /// View of left-hand-side tensor
+  ViewL lhs;
+
+  /// View of right-hand-side tensor
+  ViewR rhs;
+
+  /// Binary function applied to each element
+  BinaryFunc func;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  CUTLASS_HOST_DEVICE
+  TensorFuncBinaryOp(
+    ViewL const &lhs,
+    ViewR const &rhs,
+    BinaryFunc func = BinaryFunc()): lhs(lhs), rhs(rhs), func(func) { }
+
+  /// Equality check
+  CUTLASS_HOST_DEVICE
+  void operator()(TensorCoord const &coord) {
+    lhs.at(coord) = func(lhs.at(coord), rhs.at(coord));
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace detail {
+
+/// Helper to apply a binary operator in place
+template <typename ViewL, typename ViewR>
+struct TensorFillFunc {
+
+  /// Coordinate in tensor's index space
+  typedef typename ViewL::TensorCoord TensorCoord;
+
+  /// Destination element type
+  typedef typename ViewL::Storage DestType;
+
+  /// Source element type
+  typedef typename ViewR::Storage SrcType;
+
+  /// Parameters object
+  struct Params {
+
+    //
+    // Data members
+    //
+
+    /// View of left-hand-side tensor
+    ViewL lhs;
+
+    /// View of right-hand-side tensor
+    ViewR rhs;
+
+    /// Source offset coordinate
+    TensorCoord source_offset;
+
+    /// Size of the subtensor copied from the source
+    TensorCoord source_size;
+
+    /// Offset in destination
+    TensorCoord dest_offset;
+
+    //
+    // Methods
+    //
+
+    /// Constructs a parameters object for filling a tensor
+    Params(
+      ViewL const &lhs,
+      ViewR const &rhs,
+      TensorCoord const &source_offset = TensorCoord()
+    ):
+      lhs(lhs), rhs(rhs), source_offset(source_offset), source_size(rhs.size() - source_offset) { }
+
+    /// Constructs a parameters object for filling a tensor
+    Params(
+      ViewL const &lhs,
+      ViewR const &rhs,
+      TensorCoord const &source_offset,
+      TensorCoord const &source_size,
+      TensorCoord const &dest_offset = TensorCoord()
+    ):
+      lhs(lhs), rhs(rhs), source_offset(source_offset), source_size(source_size), dest_offset(dest_offset) { }
+  };
+
+  //
+  // Data members
+  //
+
+  Params params;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  CUTLASS_HOST_DEVICE
+  TensorFillFunc(
+    Params const &params): params(params) { }
+
+  /// Equality check
+  CUTLASS_HOST_DEVICE
+  void operator()(TensorCoord const &coord) {
+
+    TensorCoord dst_coord = params.dest_offset + coord;
+    TensorCoord src_coord = params.source_offset + coord;
+
+    if (dst_coord < params.lhs.size() && src_coord < params.rhs.size()) {
+      params.lhs.at(dst_coord) = DestType(params.rhs.at(src_coord));
+    }
+  }
+};
+
+} // namespace detail
+
+/// Fills a TensorView with the elements from another TensorView
+template <typename ViewL, typename ViewR>
+void TensorFill(
+  ViewL lhs,
+  ViewR rhs,
+  typename ViewL::TensorCoord const &source_offset,
+  typename ViewL::TensorCoord const &source_size,
+  typename ViewL::TensorCoord const &dest_offset) {
+
+  typedef typename ViewL::TensorCoord TensorCoord;
+
+  TensorCoord dst_size = lhs.size() - dest_offset;
+  TensorCoord src_size = rhs.size() - source_offset;
+
+  TensorCoord fill_size = dst_size.clamp(src_size);
+
+  // Fill function
+  typedef detail::TensorFillFunc<ViewL, ViewR> Func;
+  typedef typename Func::Params Params;
+
+  Params params(lhs, rhs, source_offset, source_size, dest_offset);
+
+  TensorForEach<Func, ViewL::kRank, Params>(fill_size, params);
+}
+
+/// Fills a TensorView with the elements from another TensorView
+template <typename ViewL, typename ViewR>
+void TensorFill(
+  ViewL lhs,
+  ViewR rhs,
+  typename ViewL::TensorCoord const &source_offset = typename ViewL::TensorCoord()) {
+
+  typedef typename ViewL::TensorCoord TensorCoord;
+
+  TensorFill(lhs, rhs, source_offset, rhs.size(), TensorCoord());
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace detail {
+
+/// Helper to apply a binary operator in place
+template <typename ViewL>
+struct TensorFillElementFunc {
+
+  /// Coordinate in tensor's index space
+  typedef typename ViewL::TensorCoord TensorCoord;
+
+  /// Destination element type
+  typedef typename ViewL::Storage DestType;
+
+  /// Parameters object
+  struct Params {
+
+    //
+    // Data members
+    //
+
+    /// View of left-hand-side tensor
+    ViewL lhs;
+
+    /// Source offset coordinate
+    TensorCoord offset;
+
+    /// Element to overwrite with
+    DestType value;
+
+    //
+    // Methods
+    //
+
+    /// Constructs a parameters object for filling a tensor
+    CUTLASS_HOST_DEVICE
+    Params(
+      ViewL const &lhs,
+      DestType const &value,
+      TensorCoord const &offset = TensorCoord()
+    ):
+      lhs(lhs), value(value), offset(offset) { }
+  };
+
+  //
+  // Data members
+  //
+
+  Params params;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  CUTLASS_HOST_DEVICE
+  TensorFillElementFunc(
+    Params const &params): params(params) { }
+
+  /// Equality check
+  CUTLASS_HOST_DEVICE
+  void operator()(TensorCoord const &coord) {
+
+    TensorCoord dst_coord = params.offset + coord;
+
+    if (dst_coord < params.size) {
+      params.lhs.at(dst_coord) = params.value;
+    }
+  }
+};
+
+} // namespace detail
+
+/// Method to perform the actual fill
+template <typename ViewL>
+void TensorFillElement(
+  ViewL const &lhs,
+  typename ViewL::Storage const &value,
+  typename ViewL::TensorCoord const &offset,
+  typename ViewL::TensorCoord const &size) {
+
+  // Fill function
+  typedef detail::TensorFillElementFunc<ViewL> Func;
+  typedef typename Func::Params Params;
+
+  Params params(lhs, value, offset);
+
+  TensorForEach<Func, ViewL::kRank, Params>(size, params);
+}
+
+/// Fills a tensor
+template <typename ViewL>
+void TensorFillElement(
+  ViewL lhs,
+  typename ViewL::Storage value,
+  typename ViewL::TensorCoord const &offset =typename ViewL::Storage()) {
+
+  TensorFillElement(lhs, value, offset, lhs.size() - offset);
+}
+
+/// Constructs a parameters object for filling a tensor
+template <typename ViewL>
+void TensorFillElement(
+  ViewL lhs,
+  typename ViewL::Storage value,
+  typename ViewL::Storage const &offset,
+  typename ViewL::Storage const &size) {
+
+  TensorFillElement(lhs, value, offset, size);
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace device
+} // namespace reference
+} // namespace cutlass
+
diff --git a/tools/util/reference/device/tensor_foreach.h b/tools/util/reference/device/tensor_foreach.h
new file mode 100644
index 000000000..1c3a72a6c
--- /dev/null
+++ b/tools/util/reference/device/tensor_foreach.h
@@ -0,0 +1,72 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#pragma once
+
+#include <stdexcept>
+#include "cutlass/cutlass.h"
+#include "tools/util/reference/device/kernel/tensor_foreach.h"
+
+namespace cutlass  {
+namespace reference {
+namespace device {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Launches a kernel for each element in a tensor's index space.
+template <typename Func, int Rank, typename Params>
+struct TensorForEach {
+
+  /// Constructor performs the operation.
+  TensorForEach(Coord<Rank> size, Params params = Params(), int grid_size = 0, int block_size = 0) {
+
+    if (!grid_size || !block_size) {
+
+      // if grid_size or block_size are zero, query occupancy using the CUDA Occupancy API
+      cudaError_t result = cudaOccupancyMaxPotentialBlockSize(
+        &grid_size,
+        &block_size,
+        reinterpret_cast<void const *>(kernel::TensorForEach<Func, Rank, Params>));
+
+      if (result != cudaSuccess) {
+        throw std::runtime_error("Failed to query occupancy.");
+      }
+
+      // Limit block size. This has the effect of increasing the number of items processed by a
+      // single thread and reduces the impact of initialization overhead.
+      block_size = (block_size < 128 ? block_size : 128);
+    }
+
+    dim3 grid(grid_size, 1, 1);
+    dim3 block(block_size, 1, 1);
+
+    kernel::TensorForEach<Func, Rank, Params><<< grid, block >>>(size, params);
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace device
+} // namespace reference
+} // namesace cutlass
diff --git a/tools/util/reference/host/gemm.h b/tools/util/reference/host/gemm.h
new file mode 100644
index 000000000..dd20532cc
--- /dev/null
+++ b/tools/util/reference/host/gemm.h
@@ -0,0 +1,270 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/*! \file
+    \brief Reference implementation for GEMM in host-side code.
+*/
+
+#pragma once
+
+#include "cutlass/coord.h"
+#include "cutlass/matrix_traits.h"
+#include "cutlass/tensor_view.h"
+#include "cutlass/gemm/gemm_coord.h"
+
+namespace cutlass {
+namespace reference {
+namespace host {
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace detail {
+
+/// Template function to compute an inner product.
+template <typename Atype, typename Btype, typename Ctype>
+Ctype inner_product(Atype a, Btype b, Ctype c) {
+  return Ctype(a) * Ctype(b) + c;
+}
+
+/// Specialization for matrix multiplication with binary operands
+template <>
+inline int inner_product<Vector<bin1_t, 32>, Vector<bin1_t, 32>, int>(
+    Vector<bin1_t, 32> a,
+    Vector<bin1_t, 32> b,
+    int c) {
+
+  int accum = 0;
+  for (int bit = 0; bit < 32; bit++) {
+    accum += a[bit] ^ b[bit];
+  }
+  return accum + c;
+}
+
+/// Specialization for matrix multiplication with signed 4-bit integer operands
+template <> inline
+int inner_product<Vector<int4_t, 8>, Vector<int4_t, 8>, int>(
+    Vector<int4_t, 8> a,
+    Vector<int4_t, 8> b,
+    int c) {
+
+  int accum = 0;
+  for (int k = 0; k < 8; k++) {
+    accum += a[k] * b[k];
+  }
+  return accum + c;
+}
+
+/// Specialization for matrix multiplication with unsigned 4-bit integer operands
+template <> inline
+int inner_product<Vector<uint4_t, 8>, Vector<uint4_t, 8>, int>(
+    Vector<uint4_t, 8> a,
+    Vector<uint4_t, 8> b,
+    int c) {
+
+  int accum = 0;
+  for (int k = 0; k < 8; k++) {
+    accum += a[k] * b[k];
+  }
+  return accum + c;
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <typename SrcType, typename DstType>
+struct Cast {
+  // Default behavior: convert to the destination type
+  static inline DstType apply(SrcType src) { return static_cast<DstType>(src); };
+};
+
+template <>
+struct Cast<float, int8_t> {
+  static inline int8_t apply(float src) {
+    // Clamp to the range of signed 8-bit integers.
+    return static_cast<int8_t>(fmaxf(-128.f, fminf(127.f, src)));
+  };
+};
+
+template <>
+struct Cast<float, uint8_t> {
+  static inline uint8_t apply(float src) {
+    // Clamp to the range of signed 8-bit integers.
+    return static_cast<uint8_t>(fmaxf(0.f, fminf(255.f, src)));
+  };
+};
+
+} // namespace detail
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Computes a general matrix product among matrices (tensors of rank=2) pointed to by TensorRef
+/// objects.
+///
+/// Explicitly naming types needed by this template can be cumbersome, particularly for the
+/// accumulator type, so a function argument 'initial_accum' is exposed. Passing
+/// AccumulatorType(0) as the last function argument can be easier than naming all template
+/// arguments explicitly.
+template <
+  typename TensorRefA,
+  typename TensorRefB,
+  typename TensorRefC,
+  typename ScalarType,
+  typename AccumulatorType
+>
+void Gemm(
+  gemm::GemmCoord problem_size,
+  ScalarType alpha,
+  TensorRefA tensor_a,
+  TensorRefB tensor_b,
+  ScalarType beta,
+  TensorRefC tensor_c,
+  AccumulatorType initial_accum) {
+
+  typedef typename TensorRefA::Storage AType;
+  typedef typename TensorRefB::Storage BType;
+  typedef typename TensorRefC::Storage CType;
+
+  static_assert(
+    TensorRefA::kRank == 2 &&
+    TensorRefB::kRank == 2 &&
+    TensorRefC::kRank == 2, "Tensors must be of rank 2");
+
+  // Note: batch is ignored.
+  int const M = problem_size.m();
+  int const N = problem_size.n();
+  int const K = problem_size.k();
+
+  // Blocking necessary to speedup reference implementation
+  int const Mblock = 32;
+  int const Nblock = 32;
+
+  for (int row_block = 0; row_block < M; row_block += Mblock) {
+    for (int col_block = 0; col_block < N; col_block += Nblock) {
+      AccumulatorType accum[Mblock][Nblock];
+
+      for (int j = 0; j < Nblock; j++) {
+        for (int i = 0; i < Mblock; i++) {
+          accum[i][j] = initial_accum;
+        }
+      }
+
+      for (int k_block = 0; k_block < K; ++k_block) {
+        for (int j = 0; j < Nblock; j++) {
+          for (int i = 0; i < Mblock; i++) {
+            int row = row_block + i;
+            int col = col_block + j;
+
+            if (row < M && col < N) {
+              AType a = tensor_a.at(MatrixCoord(row, k_block));
+              BType b = tensor_b.at(MatrixCoord(k_block, col));
+
+              accum[i][j] = detail::inner_product(a, b, accum[i][j]);
+            }
+          }
+        }
+      }
+
+      for (int j = 0; j < Nblock; j++) {
+        for (int i = 0; i < Mblock; i++) {
+          int row = row_block + i;
+          int col = col_block + j;
+
+          MatrixCoord coord = MatrixCoord(row, col);
+          if (row < M && col < N) {
+
+            tensor_c.at(coord) = detail::Cast<ScalarType, CType>::apply(
+              alpha * ScalarType(accum[i][j]) +
+              beta * ScalarType(tensor_c.at(coord)));
+          }
+        }
+      }
+    }
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Computes a general matrix product among matrices (tensors of rank=2) pointed to by TensorRef
+/// objects.
+///
+/// This assumes the accumulator type is the same type as the scalars.
+template <
+  typename TensorRefA,
+  typename TensorRefB,
+  typename TensorRefC,
+  typename ScalarType
+>
+void Gemm(
+  gemm::GemmCoord problem_size,
+  ScalarType alpha,
+  TensorRefA tensor_a,
+  TensorRefB tensor_b,
+  ScalarType beta,
+  TensorRefC tensor_c) {
+
+  Gemm(problem_size, alpha, tensor_a, tensor_b, beta, tensor_c, ScalarType(0));
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Computes a batch of GEMMs over a set of matrices of common dimension.
+template <
+  typename TensorRefCollectionA,
+  typename TensorRefCollectionB,
+  typename TensorRefCollectionC,
+  typename ScalarType,
+  typename AccumulatorType
+>
+void BatchGemm(
+  gemm::GemmCoord problem_size,
+  ScalarType alpha,
+  TensorRefCollectionA const& tensor_a,
+  TensorRefCollectionB const& tensor_b,
+  ScalarType beta,
+  TensorRefCollectionC &tensor_c,
+  AccumulatorType initial_accum = AccumulatorType(0)) {
+
+  typename TensorRefCollectionA::ConstIterator tensor_a_it = tensor_a.begin();
+  typename TensorRefCollectionB::ConstIterator tensor_b_it = tensor_b.begin();
+  typename TensorRefCollectionC::ConstIterator tensor_c_it = tensor_c.begin();
+
+  for (int batch = 0;
+    batch < problem_size.batch();
+    ++batch, ++tensor_a_it, ++tensor_b_it, ++tensor_c_it) {
+
+    Gemm(
+      problem_size,
+      alpha,
+      *tensor_a_it,
+      *tensor_b_it,
+      beta,
+      *tensor_c_it,
+      initial_accum);
+  }
+}
+
+////////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace host
+} // namespace reference
+} // namespace cutlass
diff --git a/tools/util/reference/host/tensor_elementwise.h b/tools/util/reference/host/tensor_elementwise.h
new file mode 100644
index 000000000..88f46bcdf
--- /dev/null
+++ b/tools/util/reference/host/tensor_elementwise.h
@@ -0,0 +1,478 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+/* \file
+  \brief Defines host-side elementwise operations on TensorView.
+*/
+
+#pragma once
+
+// Standard Library includes
+#include <fstream>
+#include <ostream>
+#include <stdexcept>
+#include <string>
+#include <utility>
+#include <cstdlib>
+#include <cmath>
+
+// Cutlass includes
+#include "cutlass/cutlass.h"
+#include "tools/util/distribution.h"
+#include "tools/util/type_traits.h"
+#include "tools/util/reference/host/tensor_foreach.h"
+
+namespace cutlass {
+namespace reference {
+namespace host {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace detail {
+
+/// Computes a random uniform distribution
+template <typename View_>
+struct RandomUniformFunc {
+
+  /// View type
+  typedef View_ View;
+
+  /// Scalar type
+  typedef typename View::Storage T;
+
+  /// Coordinate in tensor's index space
+  typedef typename View::TensorCoord TensorCoord;
+
+  /// Parameters structure
+  struct Params {
+
+    /// View object
+    View view;
+
+    /// RNG seed
+    unsigned seed;
+
+    /// Distriubtion
+    Distribution dist;
+
+    /// Default ctor
+    Params() { }
+
+    /// Constructor
+    Params(
+      View const &view,
+      unsigned seed,
+      Distribution dist
+    ): view(view), seed(seed), dist(dist) { }
+  };
+
+  //
+  // Data members
+  //
+
+  /// Parameters object
+  Params params;
+
+  //
+  // Methods
+  //
+
+  /// Device-side initialization of RNG
+  RandomUniformFunc(Params const &params): params(params) {
+    std::srand(params.seed);
+  }
+
+  /// Compute random value and update RNG state
+  void operator()(TensorCoord const &coord) {
+
+    double range = params.dist.uniform.max - params.dist.uniform.min;
+
+    double rnd = double(std::rand()) / double(RAND_MAX);
+
+    rnd = params.dist.uniform.min + range * rnd;
+
+    // Random values are cast to integer after scaling by a power of two to facilitate error
+    // testing
+    T result;
+    if (params.dist.int_scale >= 0) {
+      rnd = double(int(rnd * double(1 << params.dist.int_scale)));
+      result = T(rnd / double(1 << params.dist.int_scale));
+    }
+    else {
+      result = T(rnd);
+    }
+
+    params.view.at(coord) = result;
+  }
+};
+
+/// Computes a random Gaussian distribution
+template <typename View_>
+struct RandomGaussianFunc {
+
+  /// View type
+  typedef View_ View;
+
+  /// Scalar type
+  typedef typename View::Storage T;
+
+  /// Coordinate in tensor's index space
+  typedef typename View::TensorCoord TensorCoord;
+
+  /// Parameters structure
+  struct Params {
+
+    /// View object
+    View view;
+
+    /// RNG seed
+    unsigned seed;
+
+    /// RNG distribution
+    Distribution dist;
+
+    /// Default ctor
+    Params() { }
+
+    /// Constructor
+    Params(
+      View const &view,
+      unsigned seed,
+      Distribution dist
+    ): view(view), seed(seed), dist(dist) { }
+  };
+
+  //
+  // Data members
+  //
+
+  /// Parameters object
+  Params params;
+
+  /// Constant PI
+  double pi;
+
+  //
+  // Methods
+  //
+
+  /// Device-side initialization of RNG
+  RandomGaussianFunc(Params const &params): params(params) {
+    pi = std::acos(-1);
+  }
+
+  /// Compute random value and update RNG state
+  void operator()(TensorCoord const &coord) {
+
+    // Box-Muller transform to generate random numbers with Normal distribution
+    double u1 = double(std::rand()) / double(RAND_MAX);
+    double u2 = double(std::rand()) / double(RAND_MAX);
+
+    double rnd = std::sqrt(-2 * std::log(u1)) * std::cos(2 * pi * u2);
+
+    // Scale according to Gaussian distribution parameters
+    rnd = params.dist.gaussian.mean + params.dist.gaussian.stddev * rnd;
+
+    T result;
+    if (params.dist.int_scale >= 0) {
+      rnd = double(int(rnd * double(1 << params.dist.int_scale)));
+      result = T(rnd / double(1 << params.dist.int_scale));
+    }
+    else {
+      result = T(rnd);
+    }
+
+    params.view.at(coord) = result;
+  }
+};
+
+/// Computes a linear combination of each element
+template <typename View_>
+struct LinearCombinationFunc {
+
+  /// View type
+  typedef View_ View;
+
+  /// Scalar type
+  typedef typename View::Storage T;
+
+  /// Coordinate in tensor's index space
+  typedef typename View::TensorCoord TensorCoord;
+
+  //
+  // Data members
+  //
+
+  /// TensorView object
+  View view;
+
+  /// Delta
+  Coord<View::kRank, double> delta;
+
+  /// Offset
+  double offset;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  LinearCombinationFunc(
+    View const &view,
+    Distribution dist
+  ): view(view) {
+
+    offset = dist.linear.offset;
+    if (View::kRank >= 1) {
+      delta[View::kRank - 1] = dist.linear.delta_column;
+    }
+    if (View::kRank >= 2) {
+      delta[View::kRank - 2] = dist.linear.delta_row;
+    }
+    // Additional ranks have delta of zero
+    for (int i = View::kRank - 2; i > 0; --i) {
+      delta[i - 1] = 0;
+    }
+  }
+
+  /// Compute linear combination
+  void operator()(TensorCoord const &coord) {
+    double result = offset;
+
+    for (int i = 0; i < View::kRank; ++i) {
+      result += delta[i] * double(coord[i]);
+    }
+    view.at(coord) = T(result);
+  }
+};
+
+/// Returns 1 or 0 if the coordinate is along the tensor's diagonal
+template <typename View_>
+struct IdentityFunc {
+
+  /// TensorView
+  typedef View_ View;
+
+  /// Scalar type
+  typedef typename View::Storage T;
+
+  /// Coordinate in tensor's index space
+  typedef typename View::TensorCoord TensorCoord;
+
+  //
+  // Data members
+  //
+
+  /// View object
+  View view;
+
+  /// Default ctor
+  IdentityFunc(View const &view): view(view) { }
+
+  /// Computes an identity
+  void operator()(TensorCoord const &coord) {
+    bool equal = true;
+    for (int i = 0; i < View::kRank; ++i) {
+      if (coord[i] != coord[0]) {
+        equal = false;
+      }
+    }
+    view.at(coord) = equal ? T(1) : T(0);
+  }
+};
+
+} // namespace detail
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Initializes a tensor randomly or procedurally.
+template <typename View>
+void TensorInitialize(View const &view,
+                      unsigned seed,
+                      Distribution const &dist) {
+
+  typedef typename View::Storage Scalar;
+
+  switch (dist.kind) {
+    case Distribution::Uniform:
+    {
+      typedef detail::RandomUniformFunc<View> Func;
+      typedef typename Func::Params Params;
+
+      TensorForEach<Func, View::kRank, Params>(
+        view.size(),
+        Params(view, seed, dist)
+      );
+    }
+      break;
+    case Distribution::Gaussian:
+    {
+      typedef detail::RandomGaussianFunc<View> Func;
+      typedef typename Func::Params Params;
+
+      TensorForEach<Func, View::kRank, Params>(
+        view.size(),
+        Params(view, seed, dist)
+      );
+    }
+      break;
+    case Distribution::Linear:
+    {
+      typedef detail::LinearCombinationFunc<View> Func;
+      TensorForEach<Func, View::kRank, Func>(
+        view.size(),
+        Func(view, dist));
+    }
+      break;
+    case Distribution::Identity:
+    {
+      typedef detail::IdentityFunc<View> Func;
+
+      Func func(view);
+
+      TensorForEach<Func, View::kRank, Func>(view.size(), func);
+    }
+      break;
+    default:
+      break;
+  }
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+namespace detail {
+
+/// Compares two tensor views of equal rank and dimension.
+template <typename ViewL, typename ViewR>
+struct TensorEqualsFunc {
+
+  /// Storage type
+  typedef typename ViewL::Storage T;
+
+  /// Unsigned integer type of same size as View type
+  typedef typename cutlass::TypeTraits<T>::unsigned_type UnsignedType;
+
+  /// Coordinate in tensor's index space
+  typedef typename ViewL::TensorCoord TensorCoord;
+
+  /// Assertions
+  static_assert(ViewL::kRank == ViewR::kRank,
+    "Cannot compare tensors of different rank");
+
+  //
+  // Data members
+  //
+
+  /// View of left-hand-side tensor
+  ViewL lhs;
+
+  /// View of right-hand-side tensor
+  ViewR rhs;
+
+  /// Pointer to result scalar - only written with 0 if values are incorrect
+  int *result;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  TensorEqualsFunc(ViewL const &lhs, ViewR const &rhs, int *result): lhs(lhs), rhs(rhs), result(result) { }
+
+  /// Equality check
+  void operator()(TensorCoord const &coord) {
+    UnsignedType _lhs = reinterpret_cast<UnsignedType const &>(lhs.at(coord));
+    UnsignedType _rhs = reinterpret_cast<UnsignedType const &>(rhs.at(coord));
+    if (_lhs != _rhs) {
+      *result = 0;
+    }
+  }
+};
+
+} // namespace detail
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Returns true if two tensor views are equal.
+template <typename ViewL, typename ViewR>
+bool TensorEquals(ViewL const &lhs, ViewR const &rhs) {
+
+  // Sizes must be identical
+  if (lhs.size() != rhs.size()) {
+    return false;
+  }
+
+  int result = 1;
+
+  typedef detail::TensorEqualsFunc<ViewL, ViewR> Func;
+  Func func(lhs, rhs, &result);
+
+  TensorForEach<Func, ViewL::kRank, Func>(lhs.size(), func);
+
+  return result != 0;
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Helper to apply a binary operator in place
+template <typename ViewL, typename ViewR, typename BinaryFunc>
+struct TensorFuncBinaryOp {
+
+  /// Coordinate in tensor's index space
+  typedef typename ViewL::TensorCoord TensorCoord;
+
+  //
+  // Data members
+  //
+
+  /// View of left-hand-side tensor
+  ViewL lhs;
+
+  /// View of right-hand-side tensor
+  ViewR rhs;
+
+  /// Binary function applied to each element
+  BinaryFunc func;
+
+  //
+  // Methods
+  //
+
+  /// Constructor
+  TensorFuncBinaryOp(
+    ViewL const &lhs,
+    ViewR const &rhs,
+    BinaryFunc func = BinaryFunc()): lhs(lhs), rhs(rhs), func(func) { }
+
+  /// Equality check
+  void operator()(TensorCoord const &coord) {
+    lhs.at(coord) = func(lhs.at(coord), rhs.at(coord));
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace host
+} // namespace reference
+} // namespace cutlass
diff --git a/tools/util/reference/host/tensor_foreach.h b/tools/util/reference/host/tensor_foreach.h
new file mode 100644
index 000000000..bd4455693
--- /dev/null
+++ b/tools/util/reference/host/tensor_foreach.h
@@ -0,0 +1,102 @@
+/***************************************************************************************************
+ * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.
+ *
+ * Redistribution and use in source and binary forms, with or without modification, are permitted
+ * provided that the following conditions are met:
+ *     * Redistributions of source code must retain the above copyright notice, this list of
+ *       conditions and the following disclaimer.
+ *     * Redistributions in binary form must reproduce the above copyright notice, this list of
+ *       conditions and the following disclaimer in the documentation and/or other materials
+ *       provided with the distribution.
+ *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used
+ *       to endorse or promote products derived from this software without specific prior written
+ *       permission.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND ANY EXPRESS OR
+ * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND
+ * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE
+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,
+ * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,
+ * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
+ * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ *
+ **************************************************************************************************/
+#pragma once
+
+#include <stdexcept>
+#include "cutlass/cutlass.h"
+#include "tools/util/reference/device/kernel/tensor_foreach.h"
+
+namespace cutlass  {
+namespace reference {
+namespace host {
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Defines several helpers
+namespace detail {
+
+/// Helper to perform for-each operation
+template <typename Func, int Rank, int RankRemaining>
+struct TensorForEachHelper {
+
+  /// Index of the active rank
+  static int const kActiveRank = Rank - RankRemaining - 1;
+
+  /// Constructor for general rank
+  TensorForEachHelper(
+    Func &func,
+    Coord<Rank> const &size,
+    Coord<Rank> &coord) {
+
+    for (int i = 0; i < size.at(kActiveRank); ++i) {
+      coord[kActiveRank] = i;
+      TensorForEachHelper<Func, Rank, RankRemaining - 1>(func, size, coord);
+    }
+  }
+};
+
+/// Helper to perform for-each operation
+template <typename Func, int Rank>
+struct TensorForEachHelper<Func, Rank, 0> {
+
+  /// Index of the active rank
+  static int const kActiveRank = Rank - 1;
+
+  /// Constructor for fastest chaning rank
+  TensorForEachHelper(
+    Func &func,
+    Coord<Rank> const &size,
+    Coord<Rank> &coord) {
+
+    for (int i = 0; i < size.at(kActiveRank); ++i) {
+      coord[kActiveRank] = i;
+      func(coord);
+    }
+  }
+};
+
+} // namespace detail
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Iterates over the index space of a tensor
+template <typename Func, int Rank, typename Params>
+struct TensorForEach {
+
+  /// Constructor performs the operation.
+  TensorForEach(Coord<Rank> size, Params params = Params()) {
+
+    Func func(params);
+    Coord<Rank> coord;
+
+    detail::TensorForEachHelper<Func, Rank, Rank - 1>(func, size, coord);
+  }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace host
+} // namespace reference
+} // namespace cutlass
diff --git a/tools/util/tensor_view_io.h b/tools/util/tensor_view_io.h
index 6e9cd6bcf..c1b954eae 100644
--- a/tools/util/tensor_view_io.h
+++ b/tools/util/tensor_view_io.h
@@ -24,38 +24,135 @@
 **************************************************************************************************/
 #pragma once
 
-#include <cutlass/core_io.h>
-#include <cutlass/tensor_view.h>
+#include "cutlass/core_io.h"
+#include "cutlass/tensor_view.h"
 
-template <typename T>
-inline std::ostream& tensor_view_output(std::ostream& out, T t) {
-  out << t;
-  return out;
-}
+namespace cutlass {
 
-template <>
-inline std::ostream& tensor_view_output<int8_t>(std::ostream& out, int8_t t) {
-  out << int(t);
-  return out;
-}
+///////////////////////////////////////////////////////////////////////////////////////////////////
 
-template <typename T>
-inline std::ostream& operator<<(std::ostream& out, cutlass::TensorView<T> const& tensor) {
-  for (int batch = 0; batch < tensor.size(0); ++batch) {
-    out << "[\n  ";
-    for (int h = 0; h < tensor.size(1); ++h) {
-      for (int w = 0; w < tensor.size(2); ++w) {
-        for (int c = 0; c < tensor.size(3); ++c) {
-          out << ((c | w) ? ", " : "");
-          tensor_view_output(out, tensor.at(cutlass::make_Coord(batch, h, w, c)));
-        }
-      }
-      if (h + 1 < tensor.size(1)) {
-        out << " ;\n  ";
-      }
+namespace detail {
+
+/// Helper to write the least significant rank of a TensorView
+template <
+  typename Storage_,
+  int Rank_,
+  typename MapFunc_,
+  int StorageRank_,
+  typename Index_,
+  typename LongIndex_
+>
+inline std::ostream & TensorView_WriteLeastSignificantRank(
+  std::ostream& out, 
+  cutlass::TensorView<
+    Storage_, 
+    Rank_, 
+    MapFunc_, 
+    StorageRank_, 
+    Index_, 
+    LongIndex_> const& tensor,
+  cutlass::Coord<Rank_> const &start_coord,
+  int rank,
+  std::streamsize width) {
+
+  for (int idx = 0; idx < tensor.size(rank); ++idx) {
+
+    Coord<Rank_> coord(start_coord);
+    coord[rank] = idx;
+
+    if (idx) {
+      out.width(0);
+      out << ", ";
     }
-    out << " ]";
+    if (idx || coord) {
+      out.width(width);
+    }
+    out << ScalarIO<Storage_>(tensor.at(coord));
   }
 
   return out;
 }
+
+/// Helper to write a rank of a TensorView
+template <
+  typename Storage_,
+  int Rank_,
+  typename MapFunc_,
+  int StorageRank_,
+  typename Index_,
+  typename LongIndex_
+>
+inline std::ostream & TensorView_WriteRank(
+  std::ostream& out, 
+  cutlass::TensorView<
+    Storage_, 
+    Rank_, 
+    MapFunc_, 
+    StorageRank_, 
+    Index_, 
+    LongIndex_> const& tensor,
+  cutlass::Coord<Rank_> const &start_coord,
+  int rank,
+  std::streamsize width) {
+
+  // If called on the least significant rank, write the result as a row
+  if (rank + 1 == Rank_) {
+    return TensorView_WriteLeastSignificantRank(out, tensor, start_coord, rank, width);
+  }
+
+  // Otherwise, write a sequence of rows and newlines
+  for (int idx = 0; idx < tensor.size(rank); ++idx) {
+
+    Coord<Rank_> coord(start_coord);
+    coord[rank] = idx;
+
+    if (rank + 2 == Rank_) {
+      // Write least significant ranks asa matrix with rows delimited by ";\n"
+      out << (idx ? ";\n" : "");
+      TensorView_WriteLeastSignificantRank(out, tensor, coord, rank + 1, width);
+    }
+    else {
+      // Higher ranks are separated by newlines
+      out << (idx ? "\n" : "");
+      TensorView_WriteRank(out, tensor, coord, rank + 1, width);
+    }
+  }
+
+  return out;
+}
+
+} // namespace detail
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+/// Prints human-readable representation of a TensorView to an ostream
+template <
+  typename Storage_,
+  int Rank_,
+  typename MapFunc_,
+  int StorageRank_,
+  typename Index_,
+  typename LongIndex_
+>
+inline std::ostream& operator<<(
+  std::ostream& out, 
+  TensorView<
+    Storage_, 
+    Rank_, 
+    MapFunc_, 
+    StorageRank_, 
+    Index_, 
+    LongIndex_> const& tensor) {
+
+  // Prints a TensorView according to the following conventions:
+  //   - least significant rank is printed as rows separated by ";\n"
+  //   - all greater ranks are delimited with newlines
+  //
+  // The result is effectively a whitespace-delimited series of 2D matrices.
+
+  return detail::TensorView_WriteRank(out, tensor, Coord<Rank_>(), 0, out.width());
+}
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+} // namespace cutlass
diff --git a/tools/util/type_traits.h b/tools/util/type_traits.h
index 995cf96fc..50d478cc2 100644
--- a/tools/util/type_traits.h
+++ b/tools/util/type_traits.h
@@ -33,12 +33,52 @@
 #include <stdint.h>
 
 #include "half.h"
+#include "cutlass/vector.h"
+#include "cutlass/util/complex.h"
 
 namespace cutlass {
 struct half_t;
 
 template <typename T>
-struct TypeTraits;
+struct TypeTraits {
+  typedef T host_type;
+  typedef T device_type;
+  static inline T remove_negative_zero(T x) { return x; }
+  static inline T to_print(T x) { return x; }
+};
+
+template <>
+struct TypeTraits<Vector<bin1_t, 32> > {
+  static cudaDataType_t const cublas_type = CUDA_R_32I;
+  typedef Vector<bin1_t, 32> host_type;
+  typedef Vector<bin1_t, 32> device_type;
+  typedef uint32_t integer_type;
+  typedef uint32_t unsigned_type;
+  static inline uint32_t remove_negative_zero(uint32_t x) { return x; }
+  static inline uint32_t to_print(uint32_t x) { return x; }
+};
+
+template <>
+struct TypeTraits< Vector<int4_t, 8> > {
+  static cudaDataType_t const cublas_type = CUDA_R_32I;
+  typedef Vector<int4_t, 8> host_type;
+  typedef Vector<int4_t, 8> device_type;
+  typedef uint32_t integer_type;
+  typedef uint32_t unsigned_type;
+  static inline uint32_t remove_negative_zero(uint32_t x) { return x; }
+  static inline uint32_t to_print(uint32_t x) { return x; }
+};
+
+template <>
+struct TypeTraits< Vector<uint4_t, 8> > {
+  static cudaDataType_t const cublas_type = CUDA_R_32I;
+  typedef Vector<uint4_t, 8> host_type;
+  typedef Vector<uint4_t, 8> device_type;
+  typedef uint32_t integer_type;
+  typedef uint32_t unsigned_type;
+  static inline uint32_t remove_negative_zero(uint32_t x) { return x; }
+  static inline uint32_t to_print(uint32_t x) { return x; }
+};
 
 template <>
 struct TypeTraits<int8_t> {
@@ -158,4 +198,73 @@ struct TypeTraits<double> {
   static inline double remove_negative_zero(double x) { return x == -0.0 ? 0.0 : x; }
   static inline double to_print(double x) { return x; }
 };
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+//
+// Complex types
+//
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
+template <>
+struct TypeTraits<platform::complex<half> > {
+  static cudaDataType_t const cublas_type = CUDA_C_16F;
+  typedef platform::complex<half_t> host_type;
+  typedef platform::complex<half> device_type;
+  typedef int16_t integer_type;
+  typedef uint16_t unsigned_type;
+};
+
+template <>
+struct TypeTraits<platform::complex<half_t> > {
+  static cudaDataType_t const cublas_type = CUDA_C_16F;
+  typedef platform::complex<half_t> host_type;
+  typedef platform::complex<half> device_type;
+  typedef int16_t integer_type;
+  typedef uint16_t unsigned_type;
+  static inline platform::complex<half_t> remove_negative_zero(platform::complex<half_t> x) {
+    return platform::complex<half_t>(
+      real(x) == -0.f ? half_t(0) : real(x),
+      imag(x) == -0.f ? half_t(0) : imag(x)
+    );
+  }
+  static inline platform::complex<half_t> to_print(platform::complex<half_t> x) { return x; }
+};
+
+template <>
+struct TypeTraits<platform::complex<float> > {
+
+  static cudaDataType_t const cublas_type = CUDA_C_32F;
+  typedef platform::complex<float> host_type;
+  typedef platform::complex<float> device_type;
+  typedef int64_t integer_type;
+  typedef uint64_t unsigned_type;
+
+  static inline platform::complex<float> remove_negative_zero(platform::complex<float> x) {
+    return platform::complex<float>(
+      real(x) == -0.f ? 0.f : real(x),
+      imag(x) == -0.f ? 0.f : imag(x)
+    );
+  }
+
+  static inline platform::complex<float> to_print(platform::complex<float> x) { return x; }
+};
+
+template <>
+struct TypeTraits<platform::complex<double> > {
+  static cudaDataType_t const cublas_type = CUDA_C_64F;
+  typedef platform::complex<double> host_type;
+  typedef platform::complex<double> device_type;
+  struct integer_type { int64_t real, imag; };
+  struct unsigned_type { uint64_t real, imag; };
+  static inline platform::complex<double> remove_negative_zero(platform::complex<double> x) {
+    return platform::complex<double>(
+      real(x) == -0.0 ? 0.0 : real(x),
+      imag(x) == -0.0 ? 0.0 : imag(x)
+    );
+  }
+  static inline platform::complex<double> to_print(platform::complex<double> x) { return x; }
+};
+
+///////////////////////////////////////////////////////////////////////////////////////////////////
+
 }  // namespace cutlass

From d7137f9c0a1633b76455109373887e1640713b5d Mon Sep 17 00:00:00 2001
From: akerr <akerr@nvidia.com>
Date: Wed, 19 Sep 2018 14:02:08 -0700
Subject: [PATCH 2/4] Updated doxygen

---
 docs/annotated.html                           |  649 ++++----
 ...dicateVector_1_1ConstIterator-members.html |    2 +-
 ...s_1_1PredicateVector_1_1ConstIterator.html |    2 +-
 ..._1PredicateVector_1_1Iterator-members.html |    2 +-
 ...utlass_1_1PredicateVector_1_1Iterator.html |    2 +-
 docs/classcutlass_1_1TensorRef-members.html   |   61 +-
 docs/classcutlass_1_1TensorRef.html           | 1318 ++++++++++------
 docs/classcutlass_1_1TensorRef.png            |  Bin 0 -> 2451 bytes
 ...nsorRefArray_1_1ConstIterator-members.html |  101 ++
 ...ss_1_1TensorRefArray_1_1ConstIterator.html |  440 ++++++
 ...BatchStrided_1_1ConstIterator-members.html |  102 ++
 ...ensorRefBatchStrided_1_1ConstIterator.html |  476 ++++++
 ...Index___00_01LongIndex___01_4-members.html |  124 ++
 ...11_00_01Index___00_01LongIndex___01_4.html | 1092 +++++++++++++
 docs/classcutlass_1_1TensorView-members.html  |   95 +-
 docs/classcutlass_1_1TensorView.html          | 1289 +++++++++-------
 docs/classcutlass_1_1TensorView.png           |  Bin 690 -> 1605 bytes
 ...asscutlass_1_1ZipTileIterator-members.html |  125 ++
 docs/classcutlass_1_1ZipTileIterator.html     | 1290 ++++++++++++++++
 ..._1_1detail_1_1ScalarOrPointer-members.html |  101 ++
 ...scutlass_1_1detail_1_1ScalarOrPointer.html |  434 ++++++
 ...earScalingDevicePtr_1_1Params-members.html |   98 ++
 ...m_1_1LinearScalingDevicePtr_1_1Params.html |  389 +++++
 ...utlass_1_1platform_1_1complex-members.html |  100 ++
 docs/classcutlass_1_1platform_1_1complex.html |  413 +++++
 ...ss_1_1platform_1_1unique__ptr-members.html |    2 +-
 ...asscutlass_1_1platform_1_1unique__ptr.html |    2 +-
 docs/classes.html                             |  174 ++-
 docs/clear__accumulators_8h.html              |    4 +-
 docs/clear__accumulators_8h_source.html       |    7 +-
 docs/complex_8h.html                          |  263 ++++
 docs/complex_8h_source.html                   |  123 ++
 docs/convert_8h.html                          |    4 +-
 docs/convert_8h_source.html                   |    4 +-
 docs/coord_8h.html                            |   22 +-
 docs/coord_8h_source.html                     |   80 +-
 docs/core__io_8h.html                         |   79 +-
 docs/core__io_8h_source.html                  |   12 +-
 docs/cutlass_8h.html                          |   64 +-
 docs/cutlass_8h_source.html                   |    7 +-
 docs/cutlass__math_8h.html                    |   14 +-
 docs/cutlass__math_8h_source.html             |   14 +-
 docs/debug_8h.html                            |    2 +-
 docs/debug_8h_source.html                     |    2 +-
 docs/dgemm__traits_8h.html                    |   20 +-
 docs/dgemm__traits_8h_source.html             |   16 +-
 .../dir_1417ee5ebebc309c36b7962f26a92c39.html |   29 +-
 .../dir_18d6a367a3982a494d65599933fc67a3.html |   32 +-
 .../dir_c5917a9a879e9a6c73eaf5237444ab84.html |    6 +-
 docs/files.html                               |  119 +-
 docs/fp16__sgemm__multiply__add_8h.html       |  111 ++
 .../fp16__sgemm__multiply__add_8h_source.html |  107 ++
 docs/fp16__sgemm__traits_8h.html              |  117 ++
 docs/fp16__sgemm__traits_8h_source.html       |  104 ++
 docs/fragment_8h.html                         |   10 +-
 docs/fragment_8h_source.html                  |   82 +-
 docs/fragment__multiply__add_8h.html          |    8 +-
 docs/fragment__multiply__add_8h_source.html   |   30 +-
 docs/functions.html                           |  104 +-
 docs/functions_0x7e.html                      |    2 +-
 docs/functions_b.html                         |   68 +-
 docs/functions_c.html                         |   91 +-
 docs/functions_d.html                         |   60 +-
 docs/functions_e.html                         |   12 +-
 docs/functions_enum.html                      |    8 +-
 docs/functions_eval.html                      |   40 +-
 docs/functions_f.html                         |  132 +-
 docs/functions_func.html                      |   27 +-
 docs/functions_func_0x7e.html                 |    2 +-
 docs/functions_func_b.html                    |   10 +-
 docs/functions_func_c.html                    |   65 +-
 docs/functions_func_d.html                    |   24 +-
 docs/functions_func_e.html                    |    8 +-
 docs/functions_func_f.html                    |   19 +-
 docs/functions_func_g.html                    |   60 +-
 docs/functions_func_h.html                    |   11 +-
 docs/functions_func_i.html                    |  103 +-
 docs/functions_func_k.html                    |   98 ++
 docs/functions_func_l.html                    |   50 +-
 docs/functions_func_m.html                    |   31 +-
 docs/functions_func_n.html                    |   89 ++
 docs/functions_func_o.html                    |  151 +-
 docs/functions_func_p.html                    |   22 +-
 docs/functions_func_r.html                    |   35 +-
 docs/functions_func_s.html                    |   68 +-
 docs/functions_func_t.html                    |   40 +-
 docs/functions_func_u.html                    |    2 +-
 docs/functions_func_v.html                    |   18 +-
 docs/functions_func_w.html                    |    7 +-
 docs/functions_func_z.html                    |   95 ++
 docs/functions_g.html                         |  133 +-
 docs/functions_h.html                         |   11 +-
 docs/functions_i.html                         |  214 +--
 docs/functions_k.html                         |  203 ++-
 docs/functions_l.html                         |   77 +-
 docs/functions_m.html                         |   53 +-
 docs/functions_n.html                         |   13 +-
 docs/functions_o.html                         |  160 +-
 docs/functions_p.html                         |   89 +-
 docs/functions_r.html                         |   43 +-
 docs/functions_s.html                         |  374 +++--
 docs/functions_t.html                         |  194 ++-
 docs/functions_type.html                      |   69 +-
 docs/functions_type_b.html                    |   35 +-
 docs/functions_type_c.html                    |   25 +-
 docs/functions_type_d.html                    |   24 +-
 docs/functions_type_e.html                    |    6 +-
 docs/functions_type_f.html                    |   64 +-
 docs/functions_type_g.html                    |   67 +-
 docs/functions_type_i.html                    |   75 +-
 docs/functions_type_k.html                    |   86 ++
 docs/functions_type_l.html                    |   10 +-
 docs/functions_type_m.html                    |   15 +-
 docs/functions_type_n.html                    |    2 +-
 docs/functions_type_o.html                    |    9 +-
 docs/functions_type_p.html                    |   23 +-
 docs/functions_type_s.html                    |  211 +--
 docs/functions_type_t.html                    |  117 +-
 docs/functions_type_v.html                    |    8 +-
 docs/functions_type_w.html                    |    4 +-
 docs/functions_type_y.html                    |    2 +-
 docs/functions_u.html                         |    2 +-
 docs/functions_v.html                         |   27 +-
 docs/functions_vars.html                      |   12 +-
 docs/functions_vars_b.html                    |   26 +-
 docs/functions_vars_c.html                    |    5 +-
 docs/functions_vars_d.html                    |   16 +-
 docs/functions_vars_e.html                    |    2 +-
 docs/functions_vars_f.html                    |   23 +-
 docs/functions_vars_g.html                    |   14 +-
 docs/functions_vars_i.html                    |   22 +-
 docs/functions_vars_k.html                    |  157 +-
 docs/functions_vars_l.html                    |   21 +-
 docs/functions_vars_m.html                    |   13 +-
 docs/functions_vars_n.html                    |    9 +-
 docs/functions_vars_o.html                    |   86 ++
 docs/functions_vars_p.html                    |   28 +-
 docs/functions_vars_r.html                    |   10 +-
 docs/functions_vars_s.html                    |   73 +-
 docs/functions_vars_t.html                    |   29 +-
 docs/functions_vars_v.html                    |    3 +-
 docs/functions_w.html                         |    9 +-
 docs/functions_y.html                         |    2 +-
 docs/functions_z.html                         |   95 ++
 docs/gemm_8h.html                             |   26 +-
 docs/gemm_8h_source.html                      |   74 +-
 docs/gemm__config_8h.html                     |  109 ++
 docs/gemm__config_8h_source.html              |  123 ++
 docs/gemm__coord_8h.html                      |  111 ++
 docs/gemm__coord_8h_source.html               |  131 ++
 docs/gemm__desc_8h.html                       |  111 ++
 docs/gemm__desc_8h_source.html                |  121 ++
 docs/gemm__epilogue_8h.html                   |   19 +-
 docs/gemm__epilogue_8h_source.html            |   73 +-
 docs/gemm__epilogue__traits_8h.html           |   24 +-
 docs/gemm__epilogue__traits_8h_source.html    |  121 +-
 docs/gemm__global__stream_8h.html             |   20 +-
 docs/gemm__global__stream_8h_source.html      |   93 +-
 docs/gemm__global__tile_8h.html               |   16 +-
 docs/gemm__global__tile_8h_source.html        |  235 +--
 docs/gemm__operand_8h.html                    |    8 +-
 docs/gemm__operand_8h_source.html             |   24 +-
 docs/gemm__shared__stream_8h.html             |    5 +-
 docs/gemm__shared__stream_8h_source.html      |   53 +-
 docs/gemm__shared__tile_8h.html               |    4 +-
 docs/gemm__shared__tile_8h_source.html        |  181 +--
 docs/gemm__stream__pair_8h.html               |  132 ++
 docs/gemm__stream__pair_8h_source.html        |  142 ++
 docs/gemm__traits_8h.html                     |   38 +-
 docs/gemm__traits_8h_source.html              |  267 ++--
 docs/globals.html                             |   11 +-
 docs/globals_defs.html                        |    5 +-
 docs/globals_func.html                        |    6 +-
 docs/group__IdentityBlockSwizzle.html         |   84 +
 docs/group__fragment__concept.html            |    5 +-
 docs/group__fragment__iterator__concept.html  |    2 +-
 docs/group__layout__concept.html              |    2 +-
 docs/group__predicate__iterator__concept.html |    2 +-
 docs/group__predicate__tile__adapter.html     |    2 +-
 docs/group__predicate__vector__concept.html   |    2 +-
 .../group__tile__load__iterator__concept.html |    4 +-
 ...group__tile__store__iterator__concept.html |    4 +-
 docs/group__tile__traits__concept.html        |    4 +-
 docs/hgemm__global__tile_8h.html              |   10 +-
 docs/hgemm__global__tile_8h_source.html       |   16 +-
 docs/hgemm__multiply__add_8h.html             |   10 +-
 docs/hgemm__multiply__add_8h_source.html      |   31 +-
 docs/hgemm__swizzle_8h.html                   |    4 +-
 docs/hgemm__swizzle_8h_source.html            |    8 +-
 docs/hgemm__traits_8h.html                    |   30 +-
 docs/hgemm__traits_8h_source.html             |  122 +-
 docs/hierarchy.html                           |  685 +++++----
 docs/igemm__epilogue_8h.html                  |   16 +-
 docs/igemm__epilogue_8h_source.html           |   50 +-
 docs/igemm__global__tile_8h.html              |   16 +-
 docs/igemm__global__tile_8h_source.html       |   41 +-
 docs/igemm__multiply__add_8h.html             |   10 +-
 docs/igemm__multiply__add_8h_source.html      |   31 +-
 docs/igemm__swizzle_8h.html                   |    4 +-
 docs/igemm__swizzle_8h_source.html            |    8 +-
 docs/igemm__traits_8h.html                    |   46 +-
 docs/igemm__traits_8h_source.html             |  141 +-
 docs/index.html                               |    2 +-
 docs/iterator__access_8h.html                 |   70 +-
 docs/iterator__access_8h_source.html          |   20 +-
 docs/kernel__launch_8h.html                   |  108 ++
 docs/kernel__launch_8h_source.html            |   95 ++
 docs/linear__scaling_8h.html                  |   15 +-
 docs/linear__scaling_8h_source.html           |   36 +-
 docs/linear__scaling__device__ptr_8h.html     |  114 ++
 ...inear__scaling__device__ptr_8h_source.html |  109 ++
 docs/load__store_8h.html                      |   42 +-
 docs/load__store_8h_source.html               |   83 +-
 docs/matrix__traits_8h.html                   |   28 +-
 docs/matrix__traits_8h_source.html            |   91 +-
 docs/menudata.js                              |   17 +
 docs/modules.html                             |   17 +-
 docs/namespacecutlass.html                    | 1356 ++++++++---------
 docs/namespacecutlass_1_1detail.html          |   95 ++
 docs/namespacecutlass_1_1gemm.html            |  144 +-
 docs/namespacecutlass_1_1platform.html        | 1185 +++++++++++++-
 docs/namespacemembers.html                    |  146 +-
 docs/namespacemembers_func.html               |  144 +-
 docs/namespacemembers_type.html               |    2 +-
 docs/namespaces.html                          |    7 +-
 docs/numeric__types_8h.html                   |  107 ++
 docs/numeric__types_8h_source.html            |   91 ++
 docs/platform_8h.html                         |    4 +-
 docs/platform_8h_source.html                  |  166 +-
 docs/predicate__vector_8h.html                |   11 +-
 docs/predicate__vector_8h_source.html         |  128 +-
 docs/reshape__tile_8h.html                    |    4 +-
 docs/reshape__tile_8h_source.html             |    6 +-
 docs/scalar__or__pointer_8h.html              |  109 ++
 docs/scalar__or__pointer_8h_source.html       |  101 ++
 docs/search/all_0.js                          |    1 +
 docs/search/all_1.js                          |   20 +-
 docs/search/all_10.js                         |   21 +-
 docs/search/all_11.js                         |  130 +-
 docs/search/all_12.js                         |   77 +-
 docs/search/all_13.js                         |    1 +
 docs/search/all_14.js                         |   17 +-
 docs/search/all_15.js                         |    5 +-
 docs/search/all_17.js                         |    9 +-
 docs/search/all_18.html                       |   30 +
 docs/search/all_18.js                         |    4 +
 docs/search/all_2.js                          |   19 +-
 docs/search/all_3.js                          |   55 +-
 docs/search/all_4.js                          |   21 +-
 docs/search/all_5.js                          |    7 +-
 docs/search/all_6.js                          |   45 +-
 docs/search/all_7.js                          |   87 +-
 docs/search/all_8.js                          |    5 +-
 docs/search/all_9.js                          |   71 +-
 docs/search/all_a.js                          |   93 +-
 docs/search/all_b.js                          |   40 +-
 docs/search/all_c.js                          |   27 +-
 docs/search/all_d.js                          |    7 +-
 docs/search/all_e.js                          |   53 +-
 docs/search/all_f.js                          |   22 +-
 docs/search/classes_1.js                      |    1 +
 docs/search/classes_10.js                     |   33 +-
 docs/search/classes_11.js                     |    9 +-
 docs/search/classes_12.js                     |   15 +-
 docs/search/classes_13.html                   |   30 +
 docs/search/classes_13.js                     |    5 +
 docs/search/classes_14.html                   |   30 +
 docs/search/classes_14.js                     |    8 +
 docs/search/classes_2.js                      |   18 +-
 docs/search/classes_3.js                      |    5 +-
 docs/search/classes_5.js                      |   11 +-
 docs/search/classes_6.js                      |   20 +-
 docs/search/classes_8.js                      |   17 +-
 docs/search/classes_9.js                      |   12 +-
 docs/search/classes_a.js                      |   22 +-
 docs/search/classes_b.js                      |    8 +-
 docs/search/classes_c.js                      |   13 +-
 docs/search/classes_d.js                      |   23 +-
 docs/search/classes_e.js                      |   45 +-
 docs/search/classes_f.js                      |   62 +-
 docs/search/defines_1.js                      |    1 +
 docs/search/enums_0.js                        |    2 +-
 docs/search/enumvalues_1.js                   |   17 +-
 docs/search/enumvalues_2.js                   |   19 +-
 docs/search/enumvalues_3.js                   |    2 +-
 docs/search/enumvalues_4.html                 |   30 +
 docs/search/enumvalues_4.js                   |    4 +
 docs/search/enumvalues_5.html                 |   30 +
 docs/search/enumvalues_5.js                   |    4 +
 docs/search/files_0.js                        |    1 +
 docs/search/files_10.html                     |   30 +
 docs/search/files_10.js                       |    6 +
 docs/search/files_2.js                        |    3 +-
 docs/search/files_3.js                        |    4 +
 docs/search/files_5.js                        |    1 -
 docs/search/files_6.js                        |    3 +-
 docs/search/files_7.js                        |    4 +-
 docs/search/files_8.js                        |    3 +-
 docs/search/files_9.js                        |    2 +-
 docs/search/files_a.js                        |    4 +-
 docs/search/files_b.js                        |    6 +-
 docs/search/files_c.js                        |    4 +-
 docs/search/files_d.js                        |   16 +-
 docs/search/files_e.js                        |    7 +-
 docs/search/files_f.html                      |   30 +
 docs/search/files_f.js                        |    9 +
 docs/search/functions_0.js                    |    3 +-
 docs/search/functions_1.js                    |    7 +-
 docs/search/functions_10.js                   |   19 +-
 docs/search/functions_11.js                   |   21 +-
 docs/search/functions_12.js                   |   14 +-
 docs/search/functions_13.js                   |    2 +-
 docs/search/functions_14.js                   |    3 +-
 docs/search/functions_15.html                 |   30 +
 docs/search/functions_15.js                   |    5 +
 docs/search/functions_16.html                 |   30 +
 docs/search/functions_16.js                   |    7 +
 docs/search/functions_17.html                 |   30 +
 docs/search/functions_17.js                   |    4 +
 docs/search/functions_2.js                    |    4 +-
 docs/search/functions_3.js                    |   31 +-
 docs/search/functions_4.js                    |    8 +-
 docs/search/functions_5.js                    |    7 +-
 docs/search/functions_6.js                    |   12 +-
 docs/search/functions_7.js                    |   29 +-
 docs/search/functions_8.js                    |    5 +-
 docs/search/functions_9.js                    |   31 +-
 docs/search/functions_a.js                    |   11 +-
 docs/search/functions_b.js                    |   17 +-
 docs/search/functions_c.js                    |   43 +-
 docs/search/functions_d.js                    |    6 +-
 docs/search/functions_e.js                    |   38 +-
 docs/search/functions_f.js                    |   22 +-
 docs/search/groups_1.js                       |    2 +-
 docs/search/groups_2.js                       |    4 +-
 docs/search/groups_3.js                       |    6 +-
 docs/search/groups_4.html                     |   30 +
 docs/search/groups_4.js                       |    6 +
 docs/search/namespaces_0.js                   |    1 +
 docs/search/searchdata.js                     |   16 +-
 docs/search/typedefs_0.js                     |    9 +-
 docs/search/typedefs_1.js                     |    7 +-
 docs/search/typedefs_10.js                    |    4 +-
 docs/search/typedefs_11.js                    |    2 +-
 docs/search/typedefs_12.html                  |   30 +
 docs/search/typedefs_12.js                    |    4 +
 docs/search/typedefs_2.js                     |    9 +-
 docs/search/typedefs_3.js                     |    3 +-
 docs/search/typedefs_4.js                     |    2 +-
 docs/search/typedefs_5.js                     |   19 +-
 docs/search/typedefs_6.js                     |   32 +-
 docs/search/typedefs_7.js                     |   14 +-
 docs/search/typedefs_8.js                     |    2 +-
 docs/search/typedefs_9.js                     |    5 +-
 docs/search/typedefs_a.js                     |    5 +-
 docs/search/typedefs_b.js                     |    4 +-
 docs/search/typedefs_c.js                     |    6 +-
 docs/search/typedefs_d.js                     |   32 +-
 docs/search/typedefs_e.js                     |   52 +-
 docs/search/typedefs_f.js                     |   29 +-
 docs/search/variables_0.js                    |    5 +-
 docs/search/variables_1.js                    |    9 +-
 docs/search/variables_10.js                   |    9 +-
 docs/search/variables_11.html                 |   30 +
 docs/search/variables_11.js                   |    5 +
 docs/search/variables_2.js                    |    1 +
 docs/search/variables_3.js                    |    6 +-
 docs/search/variables_5.js                    |    8 +-
 docs/search/variables_6.js                    |    5 +-
 docs/search/variables_7.js                    |   16 +-
 docs/search/variables_8.js                    |   74 +-
 docs/search/variables_9.js                    |    8 +-
 docs/search/variables_a.js                    |    5 +-
 docs/search/variables_b.js                    |    2 +-
 docs/search/variables_c.js                    |    7 +-
 docs/search/variables_d.js                    |   10 +-
 docs/search/variables_e.js                    |   18 +-
 docs/search/variables_f.js                    |   22 +-
 docs/sgemm__traits_8h.html                    |   23 +-
 docs/sgemm__traits_8h_source.html             |   19 +-
 docs/shape_8h.html                            |   20 +-
 docs/shape_8h_source.html                     |   23 +-
 docs/structDebugType.html                     |   88 ++
 docs/structDebugValue.html                    |   88 ++
 docs/structcutlass_1_1AlignedStruct.html      |    2 +-
 ...ass_1_1ComputeOffsetFromShape-members.html |    4 +-
 ...ructcutlass_1_1ComputeOffsetFromShape.html |   12 +-
 ...s_1_1ComputeOffsetFromStrides-members.html |    4 +-
 ...ctcutlass_1_1ComputeOffsetFromStrides.html |   12 +-
 ...omputeThreadOffsetFromStrides-members.html |    2 +-
 ...ass_1_1ComputeThreadOffsetFromStrides.html |    2 +-
 ...011_03ed682791cf043da79a7cc93228a8c85.html |    2 +-
 ...011_0e75281d7e02fa191f5d498e10e25dc1b.html |    2 +-
 ...01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html |    2 +-
 ...01T__f2e6d84a53db391977c787a65ed62aca.html |    2 +-
 ..._1_1ConstPredicateTileAdapter-members.html |    2 +-
 ...tcutlass_1_1ConstPredicateTileAdapter.html |    2 +-
 docs/structcutlass_1_1Convert.html            |    2 +-
 ...3_01Ob568b5e19b6f78a5fa50d1f821f0bc2a.html |    2 +-
 ...3_01Ofca5985d18bcb54bc1f49355f3cee121.html |    2 +-
 docs/structcutlass_1_1Coord-members.html      |   62 +-
 docs/structcutlass_1_1Coord.html              |  633 +++++---
 docs/structcutlass_1_1Copy-members.html       |    2 +-
 docs/structcutlass_1_1Copy.html               |    2 +-
 docs/structcutlass_1_1DumpType.html           |   92 ++
 docs/structcutlass_1_1Extent-members.html     |    2 +-
 docs/structcutlass_1_1Extent.html             |    2 +-
 ...or_3_01T_00_01Lanes_01_4_01_4-members.html |    2 +-
 ...3_01Vector_3_01T_00_01Lanes_01_4_01_4.html |    2 +-
 ..._00_01Lanes_01_4_01const_01_4-members.html |    2 +-
 ...or_3_01T_00_01Lanes_01_4_01const_01_4.html |    2 +-
 docs/structcutlass_1_1Fragment-members.html   |   13 +-
 docs/structcutlass_1_1Fragment.html           |   77 +-
 ...lass_1_1FragmentConstIterator-members.html |   14 +-
 ...tructcutlass_1_1FragmentConstIterator.html |   76 +-
 ...utlass_1_1FragmentElementType-members.html |   93 ++
 .../structcutlass_1_1FragmentElementType.html |  125 ++
 ...ctcutlass_1_1FragmentIterator-members.html |   16 +-
 docs/structcutlass_1_1FragmentIterator.html   |   88 +-
 .../structcutlass_1_1GemmOperand-members.html |    2 +-
 docs/structcutlass_1_1GemmOperand.html        |    2 +-
 docs/structcutlass_1_1Identity-members.html   |    2 +-
 docs/structcutlass_1_1Identity.html           |    2 +-
 ...lass_1_1IdentityTensorMapFunc-members.html |   92 ++
 ...tructcutlass_1_1IdentityTensorMapFunc.html |  166 ++
 ...uctcutlass_1_1IteratorAdvance-members.html |    2 +-
 docs/structcutlass_1_1IteratorAdvance.html    |    2 +-
 ..._1_1KernelLaunchConfiguration-members.html |   94 ++
 ...tcutlass_1_1KernelLaunchConfiguration.html |  213 +++
 ...ctcutlass_1_1KernelLaunchConfiguration.png |  Bin 0 -> 2229 bytes
 docs/structcutlass_1_1Load-members.html       |   10 +-
 docs/structcutlass_1_1Load.html               |   36 +-
 ...1_1kS1b28106546bd22002cd52e60197548ce.html |  171 +++
 ...1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html |  171 +++
 ...1_1kS840de374cd1e3ee3a4aa6a70a9fa83d1.html |   92 ++
 ...1_1kS91ff65dd36f118bca4542df6128d6d99.html |  171 +++
 ...1_1kS966cdf9ba449f056a92458bf87878053.html |   92 ++
 ...1_1kSc8e65d97c8f615e98ac2e03f0bcd236e.html |   92 ++
 ...1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html |  174 +++
 ...1_1kSf2952bcb62d20c76c595eac4c59f7239.html |   92 ++
 ...1_1kW847237836867f08e1121b00b7e44d8ae.html |   92 ++
 ...1_1kWe58d0048e24352beeec002fd483c53b2.html |  171 +++
 ..._01Fr16ad55dd7bca84e6a7fc608c26eee889.html |   92 ++
 ..._01Fra240d9c28383cd3945277ec3a927c538.html |  171 +++
 ...01Fra03475418f27732d726d18feb23feeed2.html |   92 ++
 ...01Fra934529165fa8fecdd392b5302d25ef26.html |  171 +++
 ..._01Fr23088b868c6eeec9377c46892553686f.html |  171 +++
 ..._01Frc8b0aa6ddd9b4317158c26574a6881de.html |   92 ++
 ...0_01d9e675253ca19588f1ae4bd898579523f.html |   92 ++
 ...00_01double_00_01kStride_00_0116_01_4.html |  171 +++
 .../structcutlass_1_1MatrixCoord-members.html |  140 ++
 docs/structcutlass_1_1MatrixCoord.html        |  748 +++++++++
 docs/structcutlass_1_1MatrixCoord.png         |  Bin 0 -> 640 bytes
 ...structcutlass_1_1MatrixLayout-members.html |    2 +-
 docs/structcutlass_1_1MatrixLayout.html       |   25 +-
 ..._1MatrixLayout_1_1ColumnMajor-members.html |   92 ++
 ...utlass_1_1MatrixLayout_1_1ColumnMajor.html |  161 ++
 ...out_1_1ColumnMajorBlockLinear-members.html |   95 ++
 ...atrixLayout_1_1ColumnMajorBlockLinear.html |  257 ++++
 ...out_1_1ColumnMajorInterleaved-members.html |   94 ++
 ...atrixLayout_1_1ColumnMajorInterleaved.html |  230 +++
 ...rixLayout_1_1ContiguousLayout-members.html |   95 ++
 ...s_1_1MatrixLayout_1_1ContiguousLayout.html |  254 +++
 ...s_1_1MatrixLayout_1_1RowMajor-members.html |   92 ++
 ...ctcutlass_1_1MatrixLayout_1_1RowMajor.html |  161 ++
 ...Layout_1_1RowMajorBlockLinear-members.html |   95 ++
 ..._1MatrixLayout_1_1RowMajorBlockLinear.html |  257 ++++
 ...Layout_1_1RowMajorInterleaved-members.html |   94 ++
 ..._1MatrixLayout_1_1RowMajorInterleaved.html |  230 +++
 ...uctcutlass_1_1MatrixTransform-members.html |   93 ++
 docs/structcutlass_1_1MatrixTransform.html    |  126 ++
 docs/structcutlass_1_1Max-members.html        |   91 ++
 docs/structcutlass_1_1Max.html                |  126 ++
 .../structcutlass_1_1MemorySpace-members.html |    2 +-
 docs/structcutlass_1_1MemorySpace.html        |    2 +-
 docs/structcutlass_1_1Min-members.html        |   91 ++
 docs/structcutlass_1_1Min.html                |  126 ++
 ...tlass_1_1PredicateTileAdapter-members.html |    2 +-
 ...structcutlass_1_1PredicateTileAdapter.html |    2 +-
 ...uctcutlass_1_1PredicateVector-members.html |    2 +-
 docs/structcutlass_1_1PredicateVector.html    |    2 +-
 ...cateVector_1_1TrivialIterator-members.html |    2 +-
 ...1_1PredicateVector_1_1TrivialIterator.html |    2 +-
 ...s_1_1PredicatedTileLoadStream-members.html |  111 ++
 ...ctcutlass_1_1PredicatedTileLoadStream.html |  402 +++++
 ...uctcutlass_1_1PredicatedTileLoadStream.png |  Bin 0 -> 1349 bytes
 ..._1_1PredicatedTileStoreStream-members.html |  112 ++
 ...tcutlass_1_1PredicatedTileStoreStream.html |  466 ++++++
 ...ctcutlass_1_1PredicatedTileStoreStream.png |  Bin 0 -> 1350 bytes
 ..._1RegularTilePredicateFunctor-members.html |   94 ++
 ...utlass_1_1RegularTilePredicateFunctor.html |  223 +++
 .../structcutlass_1_1ReshapeTile-members.html |    2 +-
 docs/structcutlass_1_1ReshapeTile.html        |    2 +-
 ...1kAccessSize___00_01true_01_4-members.html |    2 +-
 ...e___00_01kAccessSize___00_01true_01_4.html |    2 +-
 docs/structcutlass_1_1ScalarIO-members.html   |   93 ++
 docs/structcutlass_1_1ScalarIO.html           |  188 +++
 docs/structcutlass_1_1Shape-members.html      |    2 +-
 docs/structcutlass_1_1Shape.html              |    2 +-
 docs/structcutlass_1_1ShapeAdd-members.html   |    2 +-
 docs/structcutlass_1_1ShapeAdd.html           |    2 +-
 docs/structcutlass_1_1ShapeCount-members.html |    2 +-
 docs/structcutlass_1_1ShapeCount.html         |    2 +-
 docs/structcutlass_1_1ShapeDiv-members.html   |    2 +-
 docs/structcutlass_1_1ShapeDiv.html           |    2 +-
 ...uctcutlass_1_1ShapeDivCeiling-members.html |   91 ++
 docs/structcutlass_1_1ShapeDivCeiling.html    |  118 ++
 docs/structcutlass_1_1ShapeMax-members.html   |    2 +-
 docs/structcutlass_1_1ShapeMax.html           |    2 +-
 docs/structcutlass_1_1ShapeMin-members.html   |    2 +-
 docs/structcutlass_1_1ShapeMin.html           |    2 +-
 docs/structcutlass_1_1ShapeMul-members.html   |    2 +-
 docs/structcutlass_1_1ShapeMul.html           |    2 +-
 docs/structcutlass_1_1ShapeScale-members.html |    2 +-
 docs/structcutlass_1_1ShapeScale.html         |    2 +-
 ...structcutlass_1_1ShapeStrides-members.html |    8 +-
 docs/structcutlass_1_1ShapeStrides.html       |   18 +-
 docs/structcutlass_1_1ShapeSub-members.html   |    2 +-
 docs/structcutlass_1_1ShapeSub.html           |    2 +-
 .../structcutlass_1_1StorageType-members.html |    8 +-
 docs/structcutlass_1_1StorageType.html        |   18 +-
 ...ass_1_1StorageType_3_011_01_4-members.html |    2 +-
 ...ructcutlass_1_1StorageType_3_011_01_4.html |    2 +-
 ...ass_1_1StorageType_3_012_01_4-members.html |    2 +-
 ...ructcutlass_1_1StorageType_3_012_01_4.html |    2 +-
 ...ass_1_1StorageType_3_014_01_4-members.html |    2 +-
 ...ructcutlass_1_1StorageType_3_014_01_4.html |    2 +-
 docs/structcutlass_1_1Store-members.html      |   10 +-
 docs/structcutlass_1_1Store.html              |   36 +-
 ..._1_1k004b304998a534d76357f834068909f8.html |   92 ++
 ..._1_1k12f5c8a016a307e76de374322fc00a66.html |   92 ++
 ..._1_1k220d5790f803f10840e2a92fb9a51dac.html |  171 +++
 ..._1_1k28cc0b88a16efca73d258128312d2a7e.html |  171 +++
 ..._1_1k40d038d4bce377843c21a56ebf97d011.html |  171 +++
 ..._1_1k60eedca420c41e94fd40b41299967ef2.html |   92 ++
 ..._1_1k775a1d27affec5236489735ed4503c92.html |   92 ++
 ..._1_1k84da7dcd68ee74b8d2bdb67885b0ca56.html |   92 ++
 ..._1_1kd9a7e85f80a21c504388612a60462417.html |  171 +++
 ..._1_1ke6d73d34fa7b5254cf828804a19842e1.html |  171 +++
 ...00_013d38935f41bf709e067932b9e042255a.html |   92 ++
 ...00_0160391c6be5cb1d3f99e012a6a18e486d.html |  171 +++
 ...ructcutlass_1_1TensorRefArray-members.html |  101 ++
 docs/structcutlass_1_1TensorRefArray.html     |  398 +++++
 ...lass_1_1TensorRefBatchStrided-members.html |  134 ++
 ...tructcutlass_1_1TensorRefBatchStrided.html |  537 +++++++
 ...structcutlass_1_1TensorRefBatchStrided.png |  Bin 0 -> 1810 bytes
 ...00_01LongIndex___01_4_1_1StrideVector.html |   97 ++
 ...ructcutlass_1_1TileAllocation-members.html |  101 ++
 docs/structcutlass_1_1TileAllocation.html     |  366 +++++
 docs/structcutlass_1_1TileCoord-members.html  |  151 ++
 docs/structcutlass_1_1TileCoord.html          | 1127 ++++++++++++++
 docs/structcutlass_1_1TileCoord.png           |  Bin 0 -> 720 bytes
 ...ctcutlass_1_1TileIteratorBase-members.html |   54 +-
 docs/structcutlass_1_1TileIteratorBase.html   |  402 ++---
 docs/structcutlass_1_1TileIteratorBase.png    |  Bin 2958 -> 2987 bytes
 ...1_1TileIteratorBase_1_1Params-members.html |   30 +-
 ...cutlass_1_1TileIteratorBase_1_1Params.html |  328 +++-
 ...tcutlass_1_1TileIteratorBase_1_1Params.png |  Bin 4162 -> 4455 bytes
 ...ctcutlass_1_1TileLoadIterator-members.html |  102 +-
 docs/structcutlass_1_1TileLoadIterator.html   | 1015 +++++++-----
 docs/structcutlass_1_1TileLoadIterator.png    |  Bin 2304 -> 2306 bytes
 ...1_1TileLoadIterator_1_1Params-members.html |   44 +-
 ...cutlass_1_1TileLoadIterator_1_1Params.html |  499 ++++--
 ...tcutlass_1_1TileLoadIterator_1_1Params.png |  Bin 3293 -> 3444 bytes
 ...ructcutlass_1_1TileLoadStream-members.html |  106 ++
 docs/structcutlass_1_1TileLoadStream.html     |  525 +++++++
 docs/structcutlass_1_1TileLoadStream.png      |  Bin 0 -> 1352 bytes
 ...s_1_1TileLoadStream_1_1Params-members.html |   93 ++
 ...ctcutlass_1_1TileLoadStream_1_1Params.html |  188 +++
 ..._1_1TileLoadStream_1_1PredicateVector.html |   95 ++
 ...tcutlass_1_1TileStoreIterator-members.html |  103 +-
 docs/structcutlass_1_1TileStoreIterator.html  | 1205 ++++++++++-----
 docs/structcutlass_1_1TileStoreIterator.png   |  Bin 2309 -> 2318 bytes
 ..._1TileStoreIterator_1_1Params-members.html |   43 +-
 ...utlass_1_1TileStoreIterator_1_1Params.html |  424 +++++-
 ...cutlass_1_1TileStoreIterator_1_1Params.png |  Bin 2388 -> 2515 bytes
 ...uctcutlass_1_1TileStoreStream-members.html |  107 ++
 docs/structcutlass_1_1TileStoreStream.html    |  556 +++++++
 docs/structcutlass_1_1TileStoreStream.png     |  Bin 0 -> 1351 bytes
 ..._1_1TileStoreStream_1_1Params-members.html |   93 ++
 ...tcutlass_1_1TileStoreStream_1_1Params.html |  188 +++
 ...1_1TileStoreStream_1_1PredicateVector.html |   95 ++
 docs/structcutlass_1_1TileTraits-members.html |   16 +-
 docs/structcutlass_1_1TileTraits.html         |  113 +-
 ..._1_1TileTraitsContiguousMajor-members.html |    2 +-
 ...tcutlass_1_1TileTraitsContiguousMajor.html |    2 +-
 ...cutlass_1_1TileTraitsStandard-members.html |   11 +-
 docs/structcutlass_1_1TileTraitsStandard.html |   29 +-
 ...lass_1_1TileTraitsStrideMajor-members.html |    2 +-
 ...tructcutlass_1_1TileTraitsStrideMajor.html |    2 +-
 ...cutlass_1_1TileTraitsWarpRake-members.html |    2 +-
 docs/structcutlass_1_1TileTraitsWarpRake.html |    2 +-
 ...raitsWarpRake_1_1ThreadOffset-members.html |    2 +-
 ...1_1TileTraitsWarpRake_1_1ThreadOffset.html |    2 +-
 ...tcutlass_1_1TiledThreadOffset-members.html |    2 +-
 docs/structcutlass_1_1TiledThreadOffset.html  |    2 +-
 ..._1TrivialPredicateTileAdapter-members.html |    2 +-
 ...utlass_1_1TrivialPredicateTileAdapter.html |    2 +-
 ...structcutlass_1_1VectorTraits-members.html |    2 +-
 docs/structcutlass_1_1VectorTraits.html       |    2 +-
 ...or_3_01T_00_01Lanes_01_4_01_4-members.html |    2 +-
 ...3_01Vector_3_01T_00_01Lanes_01_4_01_4.html |    2 +-
 ..._00_01Lanes_01_4_01const_01_4-members.html |    2 +-
 ...or_3_01T_00_01Lanes_01_4_01const_01_4.html |    2 +-
 docs/structcutlass_1_1Vectorize-members.html  |    2 +-
 docs/structcutlass_1_1Vectorize.html          |    2 +-
 ..._0132_01_4_00_01kLanes___01_4-members.html |   91 ++
 ...n1__t_00_0132_01_4_00_01kLanes___01_4.html |  118 ++
 ...0_018_01_4_00_01kLanes___01_4-members.html |   91 ++
 ...nt4__t_00_018_01_4_00_01kLanes___01_4.html |  118 ++
 ...0_018_01_4_00_01kLanes___01_4-members.html |   91 ++
 ...nt4__t_00_018_01_4_00_01kLanes___01_4.html |  118 ++
 docs/structcutlass_1_1ZipConvert-members.html |   99 ++
 docs/structcutlass_1_1ZipConvert.html         |  340 +++++
 .../structcutlass_1_1ZipFragment-members.html |   98 ++
 docs/structcutlass_1_1ZipFragment.html        |  310 ++++
 ...structcutlass_1_1ZipTensorRef-members.html |   96 ++
 docs/structcutlass_1_1ZipTensorRef.html       |  255 ++++
 ...tcutlass_1_1ZipTileAllocation-members.html |   98 ++
 docs/structcutlass_1_1ZipTileAllocation.html  |  287 ++++
 ..._1_1ZipTileIterator_1_1Params-members.html |   94 ++
 ...tcutlass_1_1ZipTileIterator_1_1Params.html |  217 +++
 docs/structcutlass_1_1bin1__t.html            |   92 ++
 ...ructcutlass_1_1divide__assert-members.html |    2 +-
 docs/structcutlass_1_1divide__assert.html     |    2 +-
 ..._1_1gemm_1_1ClearAccumulators-members.html |    3 +-
 ...tcutlass_1_1gemm_1_1ClearAccumulators.html |   34 +-
 ...1_1ClearAccumulators_1_1SharedStorage.html |    2 +-
 ...mm_1_1ColumnMajorBlockSwizzle-members.html |   95 ++
 ...ss_1_1gemm_1_1ColumnMajorBlockSwizzle.html |  260 ++++
 ...utlass_1_1gemm_1_1DgemmConfig-members.html |   59 +-
 .../structcutlass_1_1gemm_1_1DgemmConfig.html |  163 +-
 docs/structcutlass_1_1gemm_1_1DgemmConfig.png |  Bin 2957 -> 3040 bytes
 ...utlass_1_1gemm_1_1DgemmTraits-members.html |   19 +-
 .../structcutlass_1_1gemm_1_1DgemmTraits.html |   37 +-
 docs/structcutlass_1_1gemm_1_1DgemmTraits.png |  Bin 8483 -> 8474 bytes
 ...ss_1_1gemm_1_1Fp16SgemmConfig-members.html |  118 ++
 ...uctcutlass_1_1gemm_1_1Fp16SgemmConfig.html |  186 +++
 ...ructcutlass_1_1gemm_1_1Fp16SgemmConfig.png |  Bin 0 -> 3199 bytes
 ...1gemm_1_1Fp16SgemmSgemmTraits-members.html |  114 ++
 ...tlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html |  182 +++
 ...utlass_1_1gemm_1_1Fp16SgemmSgemmTraits.png |  Bin 0 -> 8749 bytes
 ..._1gemm_1_1FragmentMultiplyAdd-members.html |   19 +-
 ...utlass_1_1gemm_1_1FragmentMultiplyAdd.html |  131 +-
 ...half_00_01half_00_01true_01_4-members.html |   96 ++
 ...Add_3_01half_00_01half_00_01true_01_4.html |  287 ++++
 ...structcutlass_1_1gemm_1_1Gemm-members.html |   12 +-
 docs/structcutlass_1_1gemm_1_1Gemm.html       |  151 +-
 ...cutlass_1_1gemm_1_1GemmConfig-members.html |   59 +-
 docs/structcutlass_1_1gemm_1_1GemmConfig.html |  427 +++---
 ...tcutlass_1_1gemm_1_1GemmCoord-members.html |  152 ++
 docs/structcutlass_1_1gemm_1_1GemmCoord.html  | 1102 ++++++++++++++
 docs/structcutlass_1_1gemm_1_1GemmCoord.png   |  Bin 0 -> 691 bytes
 ...ctcutlass_1_1gemm_1_1GemmDesc-members.html |   44 +-
 docs/structcutlass_1_1gemm_1_1GemmDesc.html   |  669 ++++++--
 ...tlass_1_1gemm_1_1GemmEpilogue-members.html |   41 +-
 ...structcutlass_1_1gemm_1_1GemmEpilogue.html |  147 +-
 ...1_1gemm_1_1GemmEpilogueTraits-members.html |   38 +-
 ...cutlass_1_1gemm_1_1GemmEpilogueTraits.html |  228 +--
 ...m_1_1GemmEpilogueTraitsHelper-members.html |   11 +-
 ...s_1_1gemm_1_1GemmEpilogueTraitsHelper.html |   65 +-
 ...1GemmEpilogueTraits_1_1Params-members.html |   22 +-
 ...1gemm_1_1GemmEpilogueTraits_1_1Params.html |  118 +-
 ...ilogueTraits_1_1SharedStorage-members.html |    9 +-
 ..._1GemmEpilogueTraits_1_1SharedStorage.html |   54 +-
 ...1gemm_1_1GemmGlobalIteratorAb-members.html |  109 +-
 ...tlass_1_1gemm_1_1GemmGlobalIteratorAb.html |  723 ++++++---
 ...utlass_1_1gemm_1_1GemmGlobalIteratorAb.png |  Bin 3492 -> 4486 bytes
 ...emmGlobalIteratorAb_1_1Params-members.html |   42 +-
 ...emm_1_1GemmGlobalIteratorAb_1_1Params.html |  135 +-
 ...gemm_1_1GemmGlobalIteratorAb_1_1Params.png |  Bin 3308 -> 3459 bytes
 ...1gemm_1_1GemmGlobalIteratorCd-members.html |   72 +-
 ...tlass_1_1gemm_1_1GemmGlobalIteratorCd.html |  531 +++++--
 ...utlass_1_1gemm_1_1GemmGlobalIteratorCd.png |  Bin 1734 -> 2546 bytes
 ...emmGlobalIteratorCd_1_1Params-members.html |    7 +-
 ...emm_1_1GemmGlobalIteratorCd_1_1Params.html |   48 +-
 ...gemm_1_1GemmGlobalIteratorCd_1_1Params.png |  Bin 0 -> 1464 bytes
 ...emm_1_1GemmGlobalTileCdTraits-members.html |    5 +-
 ...ass_1_1gemm_1_1GemmGlobalTileCdTraits.html |   43 +-
 ...lTileCdTraits_1_1ThreadOffset-members.html |    2 +-
 ...emmGlobalTileCdTraits_1_1ThreadOffset.html |    2 +-
 ...1gemm_1_1GemmGlobalTileTraits-members.html |   11 +-
 ...tlass_1_1gemm_1_1GemmGlobalTileTraits.html |   75 +-
 ...utlass_1_1gemm_1_1GemmGlobalTileTraits.png |  Bin 2856 -> 2833 bytes
 ...balTileTraits_1_1ThreadOffset-members.html |    2 +-
 ...1GemmGlobalTileTraits_1_1ThreadOffset.html |    2 +-
 ...emm_1_1GemmMultiplicandTraits-members.html |    2 +-
 ...ass_1_1gemm_1_1GemmMultiplicandTraits.html |    2 +-
 ..._1gemm_1_1GemmOperandTraitsAb-members.html |    2 +-
 ...utlass_1_1gemm_1_1GemmOperandTraitsAb.html |    2 +-
 ..._1_1GemmSharedLoadTileATraits-members.html |    6 +-
 ..._1_1gemm_1_1GemmSharedLoadTileATraits.html |   25 +-
 ...adTileATraits_1_1ThreadOffset-members.html |    2 +-
 ...SharedLoadTileATraits_1_1ThreadOffset.html |    2 +-
 ..._1_1GemmSharedLoadTileBTraits-members.html |    6 +-
 ..._1_1gemm_1_1GemmSharedLoadTileBTraits.html |   25 +-
 ...adTileBTraits_1_1ThreadOffset-members.html |    2 +-
 ...SharedLoadTileBTraits_1_1ThreadOffset.html |    2 +-
 ..._1_1GemmSharedLoadTileDTraits-members.html |   23 +-
 ..._1_1gemm_1_1GemmSharedLoadTileDTraits.html |   66 +-
 ...adTileDTraits_1_1ThreadOffset-members.html |    2 +-
 ...SharedLoadTileDTraits_1_1ThreadOffset.html |    2 +-
 ..._1GemmSharedStoreTileAbTraits-members.html |    2 +-
 ..._1gemm_1_1GemmSharedStoreTileAbTraits.html |    2 +-
 ...eTileAbTraits_1_1ThreadOffset-members.html |    2 +-
 ...aredStoreTileAbTraits_1_1ThreadOffset.html |    2 +-
 ...1_1GemmSharedStoreTileDTraits-members.html |    2 +-
 ...1_1gemm_1_1GemmSharedStoreTileDTraits.html |    2 +-
 ...reTileDTraits_1_1ThreadOffset-members.html |    2 +-
 ...haredStoreTileDTraits_1_1ThreadOffset.html |    2 +-
 ...aredStoreWithSkewTileAbTraits-members.html |    2 +-
 ..._1GemmSharedStoreWithSkewTileAbTraits.html |    2 +-
 ...wTileAbTraits_1_1ThreadOffset-members.html |    2 +-
 ...eWithSkewTileAbTraits_1_1ThreadOffset.html |    2 +-
 ...lass_1_1gemm_1_1GemmTileTraitsHelperA.html |    2 +-
 ...nMajor_00_01GemmConfig___01_4-members.html |    2 +-
 ..._1kColumnMajor_00_01GemmConfig___01_4.html |    8 +-
 ...1_1kColumnMajor_00_01GemmConfig___01_4.png |  Bin 1679 -> 1846 bytes
 ...wMajor_00_01GemmConfig___01_4-members.html |    9 +-
 ...t_1_1kRowMajor_00_01GemmConfig___01_4.html |   67 +-
 ...lass_1_1gemm_1_1GemmTileTraitsHelperB.html |    2 +-
 ...nMajor_00_01GemmConfig___01_4-members.html |    9 +-
 ..._1kColumnMajor_00_01GemmConfig___01_4.html |   67 +-
 ...wMajor_00_01GemmConfig___01_4-members.html |    2 +-
 ...t_1_1kRowMajor_00_01GemmConfig___01_4.html |    8 +-
 ...ut_1_1kRowMajor_00_01GemmConfig___01_4.png |  Bin 1637 -> 1731 bytes
 ...cutlass_1_1gemm_1_1GemmTraits-members.html |   15 +-
 docs/structcutlass_1_1gemm_1_1GemmTraits.html |  143 +-
 ...aits_1_1MainLoopSharedStorage-members.html |    6 +-
 ..._1GemmTraits_1_1MainLoopSharedStorage.html |   31 +-
 ...1gemm_1_1GemmTraits_1_1Params-members.html |   18 +-
 ...tlass_1_1gemm_1_1GemmTraits_1_1Params.html |  393 +++--
 ...utlass_1_1gemm_1_1GemmTraits_1_1Params.png |  Bin 0 -> 2212 bytes
 docs/structcutlass_1_1gemm_1_1GetExtent.html  |    2 +-
 ...perand_1_1kA_00_01Tile___01_4-members.html |    2 +-
 ..._01GemmOperand_1_1kA_00_01Tile___01_4.html |    2 +-
 ...perand_1_1kB_00_01Tile___01_4-members.html |    2 +-
 ..._01GemmOperand_1_1kB_00_01Tile___01_4.html |    2 +-
 ...s_1_1gemm_1_1GlobalLoadStream-members.html |   58 +-
 ...ctcutlass_1_1gemm_1_1GlobalLoadStream.html |  809 ++++++++--
 ...1gemm_1_1GlobalLoadStreamPair-members.html |  104 ++
 ...tlass_1_1gemm_1_1GlobalLoadStreamPair.html |  519 +++++++
 ...lobalLoadStreamPair_1_1Params-members.html |   94 ++
 ...emm_1_1GlobalLoadStreamPair_1_1Params.html |  217 +++
 ...adStreamPair_1_1SharedStorage-members.html |   92 ++
 ...GlobalLoadStreamPair_1_1SharedStorage.html |  139 ++
 ...1_1GlobalLoadStream_1_1Params-members.html |   94 ++
 ...1_1gemm_1_1GlobalLoadStream_1_1Params.html |  215 +++
 ..._1_1GlobalLoadStream_1_1SharedStorage.html |   97 ++
 ...utlass_1_1gemm_1_1HgemmConfig-members.html |   59 +-
 .../structcutlass_1_1gemm_1_1HgemmConfig.html |  163 +-
 docs/structcutlass_1_1gemm_1_1HgemmConfig.png |  Bin 2911 -> 2958 bytes
 ...gemmCrosswiseGlobalTileTraits-members.html |    9 +-
 ...emm_1_1HgemmCrosswiseGlobalTileTraits.html |   59 +-
 ...balTileTraits_1_1ThreadOffset-members.html |    2 +-
 ...swiseGlobalTileTraits_1_1ThreadOffset.html |    2 +-
 ...tlass_1_1gemm_1_1HgemmSwizzle-members.html |    2 +-
 ...structcutlass_1_1gemm_1_1HgemmSwizzle.html |    2 +-
 ...ass_1_1gemm_1_1HgemmTileTraitsHelperA.html |    2 +-
 ...wMajor_00_01GemmConfig___01_4-members.html |    9 +-
 ...t_1_1kRowMajor_00_01GemmConfig___01_4.html |   55 +-
 ...ass_1_1gemm_1_1HgemmTileTraitsHelperB.html |    2 +-
 ...nMajor_00_01GemmConfig___01_4-members.html |    9 +-
 ..._1kColumnMajor_00_01GemmConfig___01_4.html |   55 +-
 ...utlass_1_1gemm_1_1HgemmTraits-members.html |   19 +-
 .../structcutlass_1_1gemm_1_1HgemmTraits.html |   37 +-
 docs/structcutlass_1_1gemm_1_1HgemmTraits.png |  Bin 3190 -> 3169 bytes
 ..._1_1gemm_1_1HgemmTraitsHelper-members.html |   44 +-
 ...tcutlass_1_1gemm_1_1HgemmTraitsHelper.html |  270 ++--
 ...tcutlass_1_1gemm_1_1HgemmTransformerA.html |    2 +-
 ...umnMajor_00_01Iterator___01_4-members.html |    2 +-
 ..._1_1kColumnMajor_00_01Iterator___01_4.html |    2 +-
 ...RowMajor_00_01Iterator___01_4-members.html |    2 +-
 ...out_1_1kRowMajor_00_01Iterator___01_4.html |    2 +-
 ...tcutlass_1_1gemm_1_1HgemmTransformerB.html |    2 +-
 ...umnMajor_00_01Iterator___01_4-members.html |    2 +-
 ..._1_1kColumnMajor_00_01Iterator___01_4.html |    2 +-
 ...RowMajor_00_01Iterator___01_4-members.html |    2 +-
 ...out_1_1kRowMajor_00_01Iterator___01_4.html |    2 +-
 ...1gemm_1_1IdentityBlockSwizzle-members.html |    9 +-
 ...tlass_1_1gemm_1_1IdentityBlockSwizzle.html |  111 +-
 ...utlass_1_1gemm_1_1IgemmConfig-members.html |   59 +-
 .../structcutlass_1_1gemm_1_1IgemmConfig.html |  163 +-
 docs/structcutlass_1_1gemm_1_1IgemmConfig.png |  Bin 2603 -> 2581 bytes
 ...t_00_01ThreadGemmShape___01_4-members.html |  118 ++
 ...01int8__t_00_01ThreadGemmShape___01_4.html |  186 +++
 ..._01int8__t_00_01ThreadGemmShape___01_4.png |  Bin 0 -> 2442 bytes
 ...lass_1_1gemm_1_1IgemmEpilogue-members.html |   43 +-
 ...tructcutlass_1_1gemm_1_1IgemmEpilogue.html |   59 +-
 ..._1gemm_1_1IgemmEpilogueScalar-members.html |    2 +-
 ...utlass_1_1gemm_1_1IgemmEpilogueScalar.html |    2 +-
 ...mmEpilogueScalar_3_01int_01_4-members.html |    2 +-
 ...m_1_1IgemmEpilogueScalar_3_01int_01_4.html |    2 +-
 ..._1gemm_1_1IgemmEpilogueTraits-members.html |   34 +-
 ...utlass_1_1gemm_1_1IgemmEpilogueTraits.html |  100 +-
 ...cutlass_1_1gemm_1_1IgemmEpilogueTraits.png |  Bin 3581 -> 3632 bytes
 ..._1_1IgemmEpilogueTraitsHelper-members.html |   13 +-
 ..._1_1gemm_1_1IgemmEpilogueTraitsHelper.html |   47 +-
 ...ilogueTraits___00_01true_01_4-members.html |   43 +-
 ...01GemmEpilogueTraits___00_01true_01_4.html |   59 +-
 ..._1_1IgemmFloatToInt8Converter-members.html |    2 +-
 ..._1_1gemm_1_1IgemmFloatToInt8Converter.html |    2 +-
 ...gemm_1_1IgemmGlobalIteratorAb-members.html |  151 ++
 ...lass_1_1gemm_1_1IgemmGlobalIteratorAb.html |  597 ++++++++
 ...tlass_1_1gemm_1_1IgemmGlobalIteratorAb.png |  Bin 0 -> 4485 bytes
 ...1_1IgemmGlobalLoadTransformer-members.html |    2 +-
 ...1_1gemm_1_1IgemmGlobalLoadTransformer.html |    2 +-
 ...ements___01_4_00_01float_01_4-members.html |    2 +-
 ...00_01kElements___01_4_00_01float_01_4.html |    2 +-
 ..._1IgemmGlobalStoreTransformer-members.html |    2 +-
 ..._1gemm_1_1IgemmGlobalStoreTransformer.html |    2 +-
 ..._t_00_01kElements___01_4_01_4-members.html |    2 +-
 ..._01int8__t_00_01kElements___01_4_01_4.html |    2 +-
 ...gemm_1_1IgemmGlobalTileTraits-members.html |  105 ++
 ...lass_1_1gemm_1_1IgemmGlobalTileTraits.html |  257 ++++
 ...tlass_1_1gemm_1_1IgemmGlobalTileTraits.png |  Bin 0 -> 2081 bytes
 ...balTileTraits_1_1ThreadOffset-members.html |   91 ++
 ...IgemmGlobalTileTraits_1_1ThreadOffset.html |  132 ++
 ..._1_1IgemmInt8ToFloatConverter-members.html |    2 +-
 ..._1_1gemm_1_1IgemmInt8ToFloatConverter.html |    2 +-
 ..._1IgemmSharedStoreTransformer-members.html |    2 +-
 ..._1gemm_1_1IgemmSharedStoreTransformer.html |    2 +-
 ...tlass_1_1gemm_1_1IgemmSwizzle-members.html |    2 +-
 ...structcutlass_1_1gemm_1_1IgemmSwizzle.html |    2 +-
 ...ass_1_1gemm_1_1IgemmTileTraitsHelperA.html |   14 +-
 ...lass_1_1gemm_1_1IgemmTileTraitsHelperA.png |  Bin 1401 -> 1476 bytes
 ...emmConfig___00_01Index___01_4-members.html |   99 ++
 ...r_00_01GemmConfig___00_01Index___01_4.html |  237 +++
 ...or_00_01GemmConfig___00_01Index___01_4.png |  Bin 0 -> 1837 bytes
 ...emmConfig___00_01Index___01_4-members.html |   98 ++
 ...r_00_01GemmConfig___00_01Index___01_4.html |  273 ++++
 ...ass_1_1gemm_1_1IgemmTileTraitsHelperB.html |   14 +-
 ...lass_1_1gemm_1_1IgemmTileTraitsHelperB.png |  Bin 1400 -> 1476 bytes
 ...emmConfig___00_01Index___01_4-members.html |   98 ++
 ...r_00_01GemmConfig___00_01Index___01_4.html |  273 ++++
 ...emmConfig___00_01Index___01_4-members.html |   99 ++
 ...r_00_01GemmConfig___00_01Index___01_4.html |  237 +++
 ...or_00_01GemmConfig___00_01Index___01_4.png |  Bin 0 -> 1727 bytes
 ...utlass_1_1gemm_1_1IgemmTraits-members.html |   19 +-
 .../structcutlass_1_1gemm_1_1IgemmTraits.html |   37 +-
 docs/structcutlass_1_1gemm_1_1IgemmTraits.png |  Bin 3096 -> 3065 bytes
 ..._1_1gemm_1_1IgemmTraitsHelper-members.html |   42 +-
 ...tcutlass_1_1gemm_1_1IgemmTraitsHelper.html |  256 ++--
 ...tcutlass_1_1gemm_1_1IgemmTransformerA.html |    2 +-
 ...umnMajor_00_01Iterator___01_4-members.html |    2 +-
 ..._1_1kColumnMajor_00_01Iterator___01_4.html |    2 +-
 ...RowMajor_00_01Iterator___01_4-members.html |    2 +-
 ...out_1_1kRowMajor_00_01Iterator___01_4.html |    2 +-
 ...tcutlass_1_1gemm_1_1IgemmTransformerB.html |    2 +-
 ...umnMajor_00_01Iterator___01_4-members.html |    2 +-
 ..._1_1kColumnMajor_00_01Iterator___01_4.html |    2 +-
 ...RowMajor_00_01Iterator___01_4-members.html |    2 +-
 ...out_1_1kRowMajor_00_01Iterator___01_4.html |    2 +-
 ...ructcutlass_1_1gemm_1_1Launch-members.html |   91 ++
 docs/structcutlass_1_1gemm_1_1Launch.html     |  155 ++
 ...unch_3_01Gemm_00_01false_01_4-members.html |   91 ++
 ...mm_1_1Launch_3_01Gemm_00_01false_01_4.html |  155 ++
 ...lass_1_1gemm_1_1LinearScaling-members.html |   16 +-
 ...tructcutlass_1_1gemm_1_1LinearScaling.html |  254 ++-
 ...structcutlass_1_1gemm_1_1LinearScaling.png |  Bin 0 -> 1511 bytes
 ...emm_1_1LinearScalingDevicePtr-members.html |  103 ++
 ...ass_1_1gemm_1_1LinearScalingDevicePtr.html |  232 +++
 ...lass_1_1gemm_1_1LinearScalingDevicePtr.png |  Bin 0 -> 1507 bytes
 ...mm_1_1LinearScaling_1_1Params-members.html |    6 +-
 ...ss_1_1gemm_1_1LinearScaling_1_1Params.html |   96 +-
 ...ructcutlass_1_1gemm_1_1ProjectOperand.html |    2 +-
 ...rand_1_1kA_00_01Kstrided_01_4-members.html |    2 +-
 ...1GemmOperand_1_1kA_00_01Kstrided_01_4.html |    2 +-
 ...rand_1_1kB_00_01Kstrided_01_4-members.html |    2 +-
 ...1GemmOperand_1_1kB_00_01Kstrided_01_4.html |    2 +-
 ...mOperand_1_1kC_00_01true_01_4-members.html |    2 +-
 ..._3_01GemmOperand_1_1kC_00_01true_01_4.html |    2 +-
 ...mOperand_1_1kD_00_01true_01_4-members.html |    2 +-
 ..._3_01GemmOperand_1_1kD_00_01true_01_4.html |    2 +-
 ...ass_1_1gemm_1_1ReshapeThreads-members.html |    2 +-
 ...ructcutlass_1_1gemm_1_1ReshapeThreads.html |    2 +-
 ...00_01Threads___00_01true_01_4-members.html |    2 +-
 ...1Tile___00_01Threads___00_01true_01_4.html |    2 +-
 ...1gemm_1_1RowMajorBlockSwizzle-members.html |   95 ++
 ...tlass_1_1gemm_1_1RowMajorBlockSwizzle.html |  260 ++++
 ...utlass_1_1gemm_1_1SgemmConfig-members.html |   59 +-
 .../structcutlass_1_1gemm_1_1SgemmConfig.html |  163 +-
 docs/structcutlass_1_1gemm_1_1SgemmConfig.png |  Bin 2930 -> 3126 bytes
 ...lass_1_1gemm_1_1SgemmLBTraits-members.html |  114 ++
 ...tructcutlass_1_1gemm_1_1SgemmLBTraits.html |  185 +++
 ...structcutlass_1_1gemm_1_1SgemmLBTraits.png |  Bin 0 -> 8497 bytes
 ...utlass_1_1gemm_1_1SgemmTraits-members.html |   19 +-
 .../structcutlass_1_1gemm_1_1SgemmTraits.html |   37 +-
 docs/structcutlass_1_1gemm_1_1SgemmTraits.png |  Bin 8487 -> 8476 bytes
 ...s_1_1gemm_1_1SharedLoadStream-members.html |   31 +-
 ...ctcutlass_1_1gemm_1_1SharedLoadStream.html |  251 ++-
 ...1_1SharedLoadStream_1_1Params-members.html |    2 +-
 ...1_1gemm_1_1SharedLoadStream_1_1Params.html |    2 +-
 ...s_1_1gemm_1_1SharedStreamPair-members.html |  101 ++
 ...ctcutlass_1_1gemm_1_1SharedStreamPair.html |  411 +++++
 ...1_1SharedStreamPair_1_1Params-members.html |   92 ++
 ...1_1gemm_1_1SharedStreamPair_1_1Params.html |  139 ++
 ...1SimplifiedGemmEpilogueTraits-members.html |   34 +-
 ...1gemm_1_1SimplifiedGemmEpilogueTraits.html |  100 +-
 ..._1gemm_1_1SimplifiedGemmEpilogueTraits.png |  Bin 3650 -> 3705 bytes
 ...1gemm_1_1SimplifiedGemmTraits-members.html |   15 +-
 ...tlass_1_1gemm_1_1SimplifiedGemmTraits.html |   27 +-
 ...1_1SimplifiedGemmTraitsHelper-members.html |    6 +-
 ...1_1gemm_1_1SimplifiedGemmTraitsHelper.html |   26 +-
 ..._1_1gemm_1_1ThreadMultiplyAdd-members.html |   31 +-
 ...tcutlass_1_1gemm_1_1ThreadMultiplyAdd.html |  201 +--
 ...1half030e27fde4380ad93cd574bc743e0ba3.html |  103 ++
 ...1half8ea66703da782e035d986e48031ff835.html |  103 ++
 ...__00_01half_00_01half_00_01float_01_4.html |  401 +++++
 ...___00_01half_00_01half_00_01half_01_4.html |  402 +++++
 ...1int86f255c0f34c1afba22b3a7d64d8f85bf.html |  103 ++
 ..._01int8__t_00_01int8__t_00_01int_01_4.html |  401 +++++
 ...m_1_1WmmaGemmGlobalIteratorCd-members.html |   82 +-
 ...s_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html |  717 ++++-----
 ...ss_1_1gemm_1_1WmmaGemmGlobalIteratorCd.png |  Bin 1763 -> 2539 bytes
 ...mmaGemmGlobalIteratorCdTraits-members.html |   11 +-
 ...emm_1_1WmmaGemmGlobalIteratorCdTraits.html |   31 +-
 ...ratorCdTraits_1_1ThreadOffset-members.html |    2 +-
 ...lobalIteratorCdTraits_1_1ThreadOffset.html |    2 +-
 ...emmGlobalIteratorCd_1_1Params-members.html |   19 +-
 ...1_1WmmaGemmGlobalIteratorCd_1_1Params.html |  203 +--
 ..._1_1WmmaGemmGlobalIteratorCd_1_1Params.png |  Bin 0 -> 1460 bytes
 ...s_1_1gemm_1_1swizzleDirection-members.html |   93 ++
 ...ctcutlass_1_1gemm_1_1swizzleDirection.html |  122 ++
 docs/structcutlass_1_1int4__t.html            |   92 ++
 docs/structcutlass_1_1is__pow2-members.html   |    2 +-
 docs/structcutlass_1_1is__pow2.html           |    2 +-
 docs/structcutlass_1_1log2__down-members.html |    2 +-
 docs/structcutlass_1_1log2__down.html         |    2 +-
 ..._3_01N_00_011_00_01Count_01_4-members.html |    2 +-
 ...g2__down_3_01N_00_011_00_01Count_01_4.html |    2 +-
 docs/structcutlass_1_1log2__up-members.html   |    2 +-
 docs/structcutlass_1_1log2__up.html           |    2 +-
 ..._3_01N_00_011_00_01Count_01_4-members.html |    2 +-
 ...log2__up_3_01N_00_011_00_01Count_01_4.html |    2 +-
 ...cutlass_1_1platform_1_1aligned__chunk.html |    2 +-
 ...1platform_1_1aligned__storage-members.html |    2 +-
 ...tlass_1_1platform_1_1aligned__storage.html |    2 +-
 ..._1_1platform_1_1alignment__of-members.html |    2 +-
 ...tcutlass_1_1platform_1_1alignment__of.html |    2 +-
 ...tform_1_1alignment__of_1_1pad-members.html |    2 +-
 ...s_1_1platform_1_1alignment__of_1_1pad.html |    2 +-
 ..._of_3_01const_01value__t_01_4-members.html |    2 +-
 ...ignment__of_3_01const_01value__t_01_4.html |    2 +-
 ...st_01volatile_01value__t_01_4-members.html |    2 +-
 ..._3_01const_01volatile_01value__t_01_4.html |    2 +-
 ...lignment__of_3_01double2_01_4-members.html |    2 +-
 ...orm_1_1alignment__of_3_01double2_01_4.html |    2 +-
 ...lignment__of_3_01double4_01_4-members.html |    2 +-
 ...orm_1_1alignment__of_3_01double4_01_4.html |    2 +-
 ...alignment__of_3_01float4_01_4-members.html |    2 +-
 ...form_1_1alignment__of_3_01float4_01_4.html |    2 +-
 ..._1alignment__of_3_01int4_01_4-members.html |    2 +-
 ...atform_1_1alignment__of_3_01int4_01_4.html |    2 +-
 ...1alignment__of_3_01long4_01_4-members.html |    2 +-
 ...tform_1_1alignment__of_3_01long4_01_4.html |    2 +-
 ...gnment__of_3_01longlong2_01_4-members.html |    2 +-
 ...m_1_1alignment__of_3_01longlong2_01_4.html |    2 +-
 ...gnment__of_3_01longlong4_01_4-members.html |    2 +-
 ...m_1_1alignment__of_3_01longlong4_01_4.html |    2 +-
 ...1alignment__of_3_01uint4_01_4-members.html |    2 +-
 ...tform_1_1alignment__of_3_01uint4_01_4.html |    2 +-
 ...alignment__of_3_01ulong4_01_4-members.html |    2 +-
 ...form_1_1alignment__of_3_01ulong4_01_4.html |    2 +-
 ...nment__of_3_01ulonglong2_01_4-members.html |    2 +-
 ..._1_1alignment__of_3_01ulonglong2_01_4.html |    2 +-
 ...nment__of_3_01ulonglong4_01_4-members.html |    2 +-
 ..._1_1alignment__of_3_01ulonglong4_01_4.html |    2 +-
 ..._3_01volatile_01value__t_01_4-members.html |    2 +-
 ...ment__of_3_01volatile_01value__t_01_4.html |    2 +-
 ...1_1platform_1_1bool__constant-members.html |    2 +-
 ...cutlass_1_1platform_1_1bool__constant.html |    2 +-
 ...ss_1_1platform_1_1conditional-members.html |    2 +-
 ...uctcutlass_1_1platform_1_1conditional.html |    2 +-
 ..._3_01false_00_01T_00_01F_01_4-members.html |    2 +-
 ...ditional_3_01false_00_01T_00_01F_01_4.html |    2 +-
 ..._1platform_1_1default__delete-members.html |    2 +-
 ...utlass_1_1platform_1_1default__delete.html |    2 +-
 ..._1_1default__delete_3_01T[]_4-members.html |    2 +-
 ...platform_1_1default__delete_3_01T[]_4.html |    2 +-
 ...ass_1_1platform_1_1enable__if-members.html |    2 +-
 ...ructcutlass_1_1platform_1_1enable__if.html |    2 +-
 ...m_1_1enable__if_3_01false_00_01T_01_4.html |    2 +-
 ...utlass_1_1platform_1_1greater-members.html |    2 +-
 .../structcutlass_1_1platform_1_1greater.html |    2 +-
 ...latform_1_1integral__constant-members.html |    2 +-
 ...ass_1_1platform_1_1integral__constant.html |    2 +-
 ...1_1platform_1_1is__arithmetic-members.html |    2 +-
 ...cutlass_1_1platform_1_1is__arithmetic.html |    2 +-
 ...s_1_1platform_1_1is__base__of-members.html |    2 +-
 ...ctcutlass_1_1platform_1_1is__base__of.html |    2 +-
 ...tform_1_1is__base__of__helper-members.html |    2 +-
 ...s_1_1platform_1_1is__base__of__helper.html |    2 +-
 ...is__base__of__helper_1_1dummy-members.html |    2 +-
 ...form_1_1is__base__of__helper_1_1dummy.html |    2 +-
 ...atform_1_1is__floating__point-members.html |    2 +-
 ...ss_1_1platform_1_1is__floating__point.html |    2 +-
 ..._1platform_1_1is__fundamental-members.html |    2 +-
 ...utlass_1_1platform_1_1is__fundamental.html |    2 +-
 ...s_1_1platform_1_1is__integral-members.html |    2 +-
 ...ctcutlass_1_1platform_1_1is__integral.html |    2 +-
 ...1_1is__integral_3_01char_01_4-members.html |    2 +-
 ...latform_1_1is__integral_3_01char_01_4.html |    2 +-
 ...__integral_3_01const_01T_01_4-members.html |    2 +-
 ...rm_1_1is__integral_3_01const_01T_01_4.html |    2 +-
 ...3_01const_01volatile_01T_01_4-members.html |    2 +-
 ...ntegral_3_01const_01volatile_01T_01_4.html |    2 +-
 ..._1_1is__integral_3_01int_01_4-members.html |    2 +-
 ...platform_1_1is__integral_3_01int_01_4.html |    2 +-
 ...1_1is__integral_3_01long_01_4-members.html |    2 +-
 ...latform_1_1is__integral_3_01long_01_4.html |    2 +-
 ...integral_3_01long_01long_01_4-members.html |    2 +-
 ..._1_1is__integral_3_01long_01long_01_4.html |    2 +-
 ..._1is__integral_3_01short_01_4-members.html |    2 +-
 ...atform_1_1is__integral_3_01short_01_4.html |    2 +-
 ...tegral_3_01signed_01char_01_4-members.html |    2 +-
 ..._1is__integral_3_01signed_01char_01_4.html |    2 +-
 ...gral_3_01unsigned_01char_01_4-members.html |    2 +-
 ...is__integral_3_01unsigned_01char_01_4.html |    2 +-
 ...egral_3_01unsigned_01int_01_4-members.html |    2 +-
 ...1is__integral_3_01unsigned_01int_01_4.html |    2 +-
 ...gral_3_01unsigned_01long_01_4-members.html |    2 +-
 ...is__integral_3_01unsigned_01long_01_4.html |    2 +-
 ...01unsigned_01long_01long_01_4-members.html |    2 +-
 ...egral_3_01unsigned_01long_01long_01_4.html |    2 +-
 ...ral_3_01unsigned_01short_01_4-members.html |    2 +-
 ...s__integral_3_01unsigned_01short_01_4.html |    2 +-
 ...ntegral_3_01volatile_01T_01_4-members.html |    2 +-
 ...1_1is__integral_3_01volatile_01T_01_4.html |    2 +-
 ...ss_1_1platform_1_1is__pointer-members.html |    2 +-
 ...uctcutlass_1_1platform_1_1is__pointer.html |    2 +-
 ...atform_1_1is__pointer__helper-members.html |    2 +-
 ...ss_1_1platform_1_1is__pointer__helper.html |    2 +-
 ...inter__helper_3_01T_01_5_01_4-members.html |    2 +-
 ..._1is__pointer__helper_3_01T_01_5_01_4.html |    2 +-
 ...tlass_1_1platform_1_1is__same-members.html |    2 +-
 ...structcutlass_1_1platform_1_1is__same.html |    2 +-
 ...1_1is__same_3_01A_00_01A_01_4-members.html |    2 +-
 ...latform_1_1is__same_3_01A_00_01A_01_4.html |    2 +-
 ...rm_1_1is__trivially__copyable-members.html |    2 +-
 ..._1platform_1_1is__trivially__copyable.html |    2 +-
 ...tlass_1_1platform_1_1is__void-members.html |    2 +-
 ...structcutlass_1_1platform_1_1is__void.html |    2 +-
 ...s_1_1platform_1_1is__volatile-members.html |    2 +-
 ...ctcutlass_1_1platform_1_1is__volatile.html |    2 +-
 ...olatile_3_01volatile_01T_01_4-members.html |    2 +-
 ...1_1is__volatile_3_01volatile_01T_01_4.html |    2 +-
 ...ctcutlass_1_1platform_1_1less-members.html |    2 +-
 docs/structcutlass_1_1platform_1_1less.html   |    2 +-
 ...ructcutlass_1_1platform_1_1nullptr__t.html |    2 +-
 ...ctcutlass_1_1platform_1_1plus-members.html |    2 +-
 docs/structcutlass_1_1platform_1_1plus.html   |    2 +-
 ..._1_1platform_1_1remove__const-members.html |    2 +-
 ...tcutlass_1_1platform_1_1remove__const.html |    2 +-
 ...ove__const_3_01const_01T_01_4-members.html |    2 +-
 ...m_1_1remove__const_3_01const_01T_01_4.html |    2 +-
 ...ass_1_1platform_1_1remove__cv-members.html |    2 +-
 ...ructcutlass_1_1platform_1_1remove__cv.html |    2 +-
 ...1platform_1_1remove__volatile-members.html |    2 +-
 ...tlass_1_1platform_1_1remove__volatile.html |    2 +-
 ...olatile_3_01volatile_01T_01_4-members.html |    2 +-
 ...emove__volatile_3_01volatile_01T_01_4.html |    2 +-
 docs/structcutlass_1_1sqrt__est-members.html  |    2 +-
 docs/structcutlass_1_1sqrt__est.html          |    2 +-
 docs/structcutlass_1_1uint4__t.html           |   92 ++
 docs/tensor__ref_8h.html                      |   19 +-
 docs/tensor__ref_8h_source.html               |  102 +-
 docs/tensor__ref__collection_8h.html          |  115 ++
 docs/tensor__ref__collection_8h_source.html   |  146 ++
 docs/tensor__view_8h.html                     |   15 +-
 docs/tensor__view_8h_source.html              |   82 +-
 docs/thread__multiply__add_8h.html            |    6 +-
 docs/thread__multiply__add_8h_source.html     |   33 +-
 docs/threadblock__swizzle_8h.html             |  126 ++
 docs/threadblock__swizzle_8h_source.html      |  120 ++
 docs/tile__allocation_8h.html                 |  114 ++
 docs/tile__allocation_8h_source.html          |  121 ++
 docs/tile__coord_8h.html                      |  107 ++
 docs/tile__coord_8h_source.html               |  128 ++
 docs/tile__iterator_8h.html                   |   35 +-
 docs/tile__iterator_8h_source.html            |  353 +++--
 docs/tile__stream_8h.html                     |  130 ++
 docs/tile__stream_8h_source.html              |  162 ++
 docs/tile__traits__standard_8h.html           |    4 +-
 docs/tile__traits__standard_8h_source.html    |   13 +-
 docs/unioncutlass_1_1Vector-members.html      |    6 +-
 docs/unioncutlass_1_1Vector.html              |   26 +-
 ..._01bin1__t_00_01kLanes___01_4-members.html |   98 ++
 ...Vector_3_01bin1__t_00_01kLanes___01_4.html |  329 ++++
 ..._1Vector_3_01half_00_011_01_4-members.html |   97 ++
 ...utlass_1_1Vector_3_01half_00_011_01_4.html |  279 ++++
 ...r_3_01half_00_01kLanes___01_4-members.html |   10 +-
 ...1_1Vector_3_01half_00_01kLanes___01_4.html |   68 +-
 ..._01int4__t_00_01kLanes___01_4-members.html |   98 ++
 ...Vector_3_01int4__t_00_01kLanes___01_4.html |  329 ++++
 ...01uint4__t_00_01kLanes___01_4-members.html |   98 ++
 ...ector_3_01uint4__t_00_01kLanes___01_4.html |  329 ++++
 ...Traits_1_1StreamSharedStorage-members.html |   10 +-
 ...EpilogueTraits_1_1StreamSharedStorage.html |   30 +-
 ..._1GemmTraits_1_1SharedStorage-members.html |    2 +-
 ..._1gemm_1_1GemmTraits_1_1SharedStorage.html |    6 +-
 docs/vector_8h.html                           |   34 +-
 docs/vector_8h_source.html                    |   90 +-
 docs/wmma__gemm__epilogue__traits_8h.html     |    4 +-
 ...mma__gemm__epilogue__traits_8h_source.html |   14 +-
 docs/wmma__gemm__global__tile_8h.html         |    4 +-
 docs/wmma__gemm__global__tile_8h_source.html  |   92 +-
 docs/wmma__gemm__multiply__add_8h.html        |    4 +-
 docs/wmma__gemm__multiply__add_8h_source.html |   11 +-
 docs/wmma__gemm__shared__tile_8h.html         |    4 +-
 docs/wmma__gemm__shared__tile_8h_source.html  |   20 +-
 docs/wmma__gemm__traits_8h.html               |    4 +-
 docs/wmma__gemm__traits_8h_source.html        |   24 +-
 docs/wmma__matrix_8h.html                     |    2 +-
 docs/wmma__matrix_8h_source.html              |   12 +-
 docs/zip__fragment_8h.html                    |  127 ++
 docs/zip__fragment_8h_source.html             |  114 ++
 docs/zip__tensor__ref_8h.html                 |  116 ++
 docs/zip__tensor__ref_8h_source.html          |   99 ++
 docs/zip__tile__iterator_8h.html              |  113 ++
 docs/zip__tile__iterator_8h_source.html       |  139 ++
 1121 files changed, 64211 insertions(+), 12918 deletions(-)
 create mode 100644 docs/classcutlass_1_1TensorRef.png
 create mode 100644 docs/classcutlass_1_1TensorRefArray_1_1ConstIterator-members.html
 create mode 100644 docs/classcutlass_1_1TensorRefArray_1_1ConstIterator.html
 create mode 100644 docs/classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator-members.html
 create mode 100644 docs/classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html
 create mode 100644 docs/classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4-members.html
 create mode 100644 docs/classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html
 create mode 100644 docs/classcutlass_1_1ZipTileIterator-members.html
 create mode 100644 docs/classcutlass_1_1ZipTileIterator.html
 create mode 100644 docs/classcutlass_1_1detail_1_1ScalarOrPointer-members.html
 create mode 100644 docs/classcutlass_1_1detail_1_1ScalarOrPointer.html
 create mode 100644 docs/classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params-members.html
 create mode 100644 docs/classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html
 create mode 100644 docs/classcutlass_1_1platform_1_1complex-members.html
 create mode 100644 docs/classcutlass_1_1platform_1_1complex.html
 create mode 100644 docs/complex_8h.html
 create mode 100644 docs/complex_8h_source.html
 create mode 100644 docs/fp16__sgemm__multiply__add_8h.html
 create mode 100644 docs/fp16__sgemm__multiply__add_8h_source.html
 create mode 100644 docs/fp16__sgemm__traits_8h.html
 create mode 100644 docs/fp16__sgemm__traits_8h_source.html
 create mode 100644 docs/functions_func_k.html
 create mode 100644 docs/functions_func_n.html
 create mode 100644 docs/functions_func_z.html
 create mode 100644 docs/functions_type_k.html
 create mode 100644 docs/functions_vars_o.html
 create mode 100644 docs/functions_z.html
 create mode 100644 docs/gemm__config_8h.html
 create mode 100644 docs/gemm__config_8h_source.html
 create mode 100644 docs/gemm__coord_8h.html
 create mode 100644 docs/gemm__coord_8h_source.html
 create mode 100644 docs/gemm__desc_8h.html
 create mode 100644 docs/gemm__desc_8h_source.html
 create mode 100644 docs/gemm__stream__pair_8h.html
 create mode 100644 docs/gemm__stream__pair_8h_source.html
 create mode 100644 docs/group__IdentityBlockSwizzle.html
 create mode 100644 docs/kernel__launch_8h.html
 create mode 100644 docs/kernel__launch_8h_source.html
 create mode 100644 docs/linear__scaling__device__ptr_8h.html
 create mode 100644 docs/linear__scaling__device__ptr_8h_source.html
 create mode 100644 docs/namespacecutlass_1_1detail.html
 create mode 100644 docs/numeric__types_8h.html
 create mode 100644 docs/numeric__types_8h_source.html
 create mode 100644 docs/scalar__or__pointer_8h.html
 create mode 100644 docs/scalar__or__pointer_8h_source.html
 create mode 100644 docs/search/all_18.html
 create mode 100644 docs/search/all_18.js
 create mode 100644 docs/search/classes_13.html
 create mode 100644 docs/search/classes_13.js
 create mode 100644 docs/search/classes_14.html
 create mode 100644 docs/search/classes_14.js
 create mode 100644 docs/search/enumvalues_4.html
 create mode 100644 docs/search/enumvalues_4.js
 create mode 100644 docs/search/enumvalues_5.html
 create mode 100644 docs/search/enumvalues_5.js
 create mode 100644 docs/search/files_10.html
 create mode 100644 docs/search/files_10.js
 create mode 100644 docs/search/files_f.html
 create mode 100644 docs/search/files_f.js
 create mode 100644 docs/search/functions_15.html
 create mode 100644 docs/search/functions_15.js
 create mode 100644 docs/search/functions_16.html
 create mode 100644 docs/search/functions_16.js
 create mode 100644 docs/search/functions_17.html
 create mode 100644 docs/search/functions_17.js
 create mode 100644 docs/search/groups_4.html
 create mode 100644 docs/search/groups_4.js
 create mode 100644 docs/search/typedefs_12.html
 create mode 100644 docs/search/typedefs_12.js
 create mode 100644 docs/search/variables_11.html
 create mode 100644 docs/search/variables_11.js
 create mode 100644 docs/structDebugType.html
 create mode 100644 docs/structDebugValue.html
 create mode 100644 docs/structcutlass_1_1DumpType.html
 create mode 100644 docs/structcutlass_1_1FragmentElementType-members.html
 create mode 100644 docs/structcutlass_1_1FragmentElementType.html
 create mode 100644 docs/structcutlass_1_1IdentityTensorMapFunc-members.html
 create mode 100644 docs/structcutlass_1_1IdentityTensorMapFunc.html
 create mode 100644 docs/structcutlass_1_1KernelLaunchConfiguration-members.html
 create mode 100644 docs/structcutlass_1_1KernelLaunchConfiguration.html
 create mode 100644 docs/structcutlass_1_1KernelLaunchConfiguration.png
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS840de374cd1e3ee3a4aa6a70a9fa83d1.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS966cdf9ba449f056a92458bf87878053.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSc8e65d97c8f615e98ac2e03f0bcd236e.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf2952bcb62d20c76c595eac4c59f7239.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kW847237836867f08e1121b00b7e44d8ae.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fr16ad55dd7bca84e6a7fc608c26eee889.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra03475418f27732d726d18feb23feeed2.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html
 create mode 100644 docs/structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Frc8b0aa6ddd9b4317158c26574a6881de.html
 create mode 100644 docs/structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01d9e675253ca19588f1ae4bd898579523f.html
 create mode 100644 docs/structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html
 create mode 100644 docs/structcutlass_1_1MatrixCoord-members.html
 create mode 100644 docs/structcutlass_1_1MatrixCoord.html
 create mode 100644 docs/structcutlass_1_1MatrixCoord.png
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1ColumnMajor-members.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1ColumnMajor.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear-members.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved-members.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1ContiguousLayout-members.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1RowMajor-members.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1RowMajor.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear-members.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved-members.html
 create mode 100644 docs/structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html
 create mode 100644 docs/structcutlass_1_1MatrixTransform-members.html
 create mode 100644 docs/structcutlass_1_1MatrixTransform.html
 create mode 100644 docs/structcutlass_1_1Max-members.html
 create mode 100644 docs/structcutlass_1_1Max.html
 create mode 100644 docs/structcutlass_1_1Min-members.html
 create mode 100644 docs/structcutlass_1_1Min.html
 create mode 100644 docs/structcutlass_1_1PredicatedTileLoadStream-members.html
 create mode 100644 docs/structcutlass_1_1PredicatedTileLoadStream.html
 create mode 100644 docs/structcutlass_1_1PredicatedTileLoadStream.png
 create mode 100644 docs/structcutlass_1_1PredicatedTileStoreStream-members.html
 create mode 100644 docs/structcutlass_1_1PredicatedTileStoreStream.html
 create mode 100644 docs/structcutlass_1_1PredicatedTileStoreStream.png
 create mode 100644 docs/structcutlass_1_1RegularTilePredicateFunctor-members.html
 create mode 100644 docs/structcutlass_1_1RegularTilePredicateFunctor.html
 create mode 100644 docs/structcutlass_1_1ScalarIO-members.html
 create mode 100644 docs/structcutlass_1_1ScalarIO.html
 create mode 100644 docs/structcutlass_1_1ShapeDivCeiling-members.html
 create mode 100644 docs/structcutlass_1_1ShapeDivCeiling.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k004b304998a534d76357f834068909f8.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k12f5c8a016a307e76de374322fc00a66.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k60eedca420c41e94fd40b41299967ef2.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k775a1d27affec5236489735ed4503c92.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k84da7dcd68ee74b8d2bdb67885b0ca56.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html
 create mode 100644 docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html
 create mode 100644 docs/structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_013d38935f41bf709e067932b9e042255a.html
 create mode 100644 docs/structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html
 create mode 100644 docs/structcutlass_1_1TensorRefArray-members.html
 create mode 100644 docs/structcutlass_1_1TensorRefArray.html
 create mode 100644 docs/structcutlass_1_1TensorRefBatchStrided-members.html
 create mode 100644 docs/structcutlass_1_1TensorRefBatchStrided.html
 create mode 100644 docs/structcutlass_1_1TensorRefBatchStrided.png
 create mode 100644 docs/structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html
 create mode 100644 docs/structcutlass_1_1TileAllocation-members.html
 create mode 100644 docs/structcutlass_1_1TileAllocation.html
 create mode 100644 docs/structcutlass_1_1TileCoord-members.html
 create mode 100644 docs/structcutlass_1_1TileCoord.html
 create mode 100644 docs/structcutlass_1_1TileCoord.png
 create mode 100644 docs/structcutlass_1_1TileLoadStream-members.html
 create mode 100644 docs/structcutlass_1_1TileLoadStream.html
 create mode 100644 docs/structcutlass_1_1TileLoadStream.png
 create mode 100644 docs/structcutlass_1_1TileLoadStream_1_1Params-members.html
 create mode 100644 docs/structcutlass_1_1TileLoadStream_1_1Params.html
 create mode 100644 docs/structcutlass_1_1TileLoadStream_1_1PredicateVector.html
 create mode 100644 docs/structcutlass_1_1TileStoreStream-members.html
 create mode 100644 docs/structcutlass_1_1TileStoreStream.html
 create mode 100644 docs/structcutlass_1_1TileStoreStream.png
 create mode 100644 docs/structcutlass_1_1TileStoreStream_1_1Params-members.html
 create mode 100644 docs/structcutlass_1_1TileStoreStream_1_1Params.html
 create mode 100644 docs/structcutlass_1_1TileStoreStream_1_1PredicateVector.html
 create mode 100644 docs/structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4-members.html
 create mode 100644 docs/structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html
 create mode 100644 docs/structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4-members.html
 create mode 100644 docs/structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html
 create mode 100644 docs/structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4-members.html
 create mode 100644 docs/structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html
 create mode 100644 docs/structcutlass_1_1ZipConvert-members.html
 create mode 100644 docs/structcutlass_1_1ZipConvert.html
 create mode 100644 docs/structcutlass_1_1ZipFragment-members.html
 create mode 100644 docs/structcutlass_1_1ZipFragment.html
 create mode 100644 docs/structcutlass_1_1ZipTensorRef-members.html
 create mode 100644 docs/structcutlass_1_1ZipTensorRef.html
 create mode 100644 docs/structcutlass_1_1ZipTileAllocation-members.html
 create mode 100644 docs/structcutlass_1_1ZipTileAllocation.html
 create mode 100644 docs/structcutlass_1_1ZipTileIterator_1_1Params-members.html
 create mode 100644 docs/structcutlass_1_1ZipTileIterator_1_1Params.html
 create mode 100644 docs/structcutlass_1_1bin1__t.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GemmCoord-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GemmCoord.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GemmCoord.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1Launch-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1Launch.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1LinearScaling.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1RowMajorBlockSwizzle-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1SgemmLBTraits-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1SgemmLBTraits.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1SgemmLBTraits.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1SharedStreamPair-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1SharedStreamPair.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half030e27fde4380ad93cd574bc743e0ba3.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half8ea66703da782e035d986e48031ff835.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int86f255c0f34c1afba22b3a7d64d8f85bf.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.png
 create mode 100644 docs/structcutlass_1_1gemm_1_1swizzleDirection-members.html
 create mode 100644 docs/structcutlass_1_1gemm_1_1swizzleDirection.html
 create mode 100644 docs/structcutlass_1_1int4__t.html
 create mode 100644 docs/structcutlass_1_1uint4__t.html
 create mode 100644 docs/tensor__ref__collection_8h.html
 create mode 100644 docs/tensor__ref__collection_8h_source.html
 create mode 100644 docs/threadblock__swizzle_8h.html
 create mode 100644 docs/threadblock__swizzle_8h_source.html
 create mode 100644 docs/tile__allocation_8h.html
 create mode 100644 docs/tile__allocation_8h_source.html
 create mode 100644 docs/tile__coord_8h.html
 create mode 100644 docs/tile__coord_8h_source.html
 create mode 100644 docs/tile__stream_8h.html
 create mode 100644 docs/tile__stream_8h_source.html
 create mode 100644 docs/unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4-members.html
 create mode 100644 docs/unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html
 create mode 100644 docs/unioncutlass_1_1Vector_3_01half_00_011_01_4-members.html
 create mode 100644 docs/unioncutlass_1_1Vector_3_01half_00_011_01_4.html
 create mode 100644 docs/unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4-members.html
 create mode 100644 docs/unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html
 create mode 100644 docs/unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4-members.html
 create mode 100644 docs/unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html
 create mode 100644 docs/zip__fragment_8h.html
 create mode 100644 docs/zip__fragment_8h_source.html
 create mode 100644 docs/zip__tensor__ref_8h.html
 create mode 100644 docs/zip__tensor__ref_8h_source.html
 create mode 100644 docs/zip__tile__iterator_8h.html
 create mode 100644 docs/zip__tile__iterator_8h_source.html

diff --git a/docs/annotated.html b/docs/annotated.html
index e6c405d59..da54a8ee0 100644
--- a/docs/annotated.html
+++ b/docs/annotated.html
@@ -74,303 +74,368 @@ $(function() {
 <div class="contents">
 <div class="textblock">Here are the classes, structs, unions and interfaces with brief descriptions:</div><div class="directory">
 <div class="levels">[detail level <span onclick="javascript:toggleLevel(1);">1</span><span onclick="javascript:toggleLevel(2);">2</span><span onclick="javascript:toggleLevel(3);">3</span><span onclick="javascript:toggleLevel(4);">4</span>]</div><table class="directory">
-<tr id="row_0_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_0_" class="arrow" onclick="toggleFolder('0_')">&#9660;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass.html" target="_self">cutlass</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_0_" class="arrow" onclick="toggleFolder('0_0_')">&#9654;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1gemm.html" target="_self">gemm</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_0_" class="arrow" onclick="toggleFolder('0_0_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html" target="_self">ClearAccumulators</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_0_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html" target="_self">SharedStorage</a></td><td class="desc">The shared storage </td></tr>
-<tr id="row_0_0_1_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html" target="_self">DgemmConfig</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_2_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html" target="_self">DgemmTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_3_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html" target="_self">FragmentMultiplyAdd</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_4_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html" target="_self">FragmentMultiplyAdd&lt; half &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_5_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_5_" class="arrow" onclick="toggleFolder('0_0_5_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html" target="_self">Gemm</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_5_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_0_0_6_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">GemmConfig</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_7_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html" target="_self">GemmDesc</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_8_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html" target="_self">GemmEpilogue</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_9_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_9_" class="arrow" onclick="toggleFolder('0_0_9_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" target="_self">GemmEpilogueTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_9_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_0_0_9_1_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html" target="_self">SharedStorage</a></td><td class="desc">The shared memory to swizzle the data in the epilogue </td></tr>
-<tr id="row_0_0_9_2_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html" target="_self">StreamSharedStorage</a></td><td class="desc">The shared memory storage to exchange data </td></tr>
-<tr id="row_0_0_10_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html" target="_self">GemmEpilogueTraitsHelper</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_11_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_11_" class="arrow" onclick="toggleFolder('0_0_11_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html" target="_self">GemmGlobalIteratorAb</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_11_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html" target="_self">Params</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_12_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_12_" class="arrow" onclick="toggleFolder('0_0_12_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html" target="_self">GemmGlobalIteratorCd</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_12_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_0_0_13_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_13_" class="arrow" onclick="toggleFolder('0_0_13_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html" target="_self">GemmGlobalTileCdTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_13_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_0_14_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_14_" class="arrow" onclick="toggleFolder('0_0_14_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html" target="_self">GemmGlobalTileTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_14_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_0_15_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html" target="_self">GemmMultiplicandTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_16_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html" target="_self">GemmOperandTraitsAb</a></td><td class="desc">Helper to describe attributes of GEMM matrix operands </td></tr>
-<tr id="row_0_0_17_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_17_" class="arrow" onclick="toggleFolder('0_0_17_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html" target="_self">GemmSharedLoadTileATraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_17_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_0_18_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_18_" class="arrow" onclick="toggleFolder('0_0_18_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html" target="_self">GemmSharedLoadTileBTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_18_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_0_19_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_19_" class="arrow" onclick="toggleFolder('0_0_19_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html" target="_self">GemmSharedLoadTileDTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_19_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_0_20_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_20_" class="arrow" onclick="toggleFolder('0_0_20_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html" target="_self">GemmSharedStoreTileAbTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_20_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_21_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_21_" class="arrow" onclick="toggleFolder('0_0_21_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html" target="_self">GemmSharedStoreTileDTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_21_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_0_22_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_22_" class="arrow" onclick="toggleFolder('0_0_22_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html" target="_self">GemmSharedStoreWithSkewTileAbTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_22_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_23_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html" target="_self">GemmTileTraitsHelperA</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_24_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_25_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_26_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html" target="_self">GemmTileTraitsHelperB</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_27_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_28_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_29_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_29_" class="arrow" onclick="toggleFolder('0_0_29_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">GemmTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_29_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html" target="_self">GlobalLoadStream</a></td><td class="desc">Assemble the global load streams for A/B </td></tr>
-<tr id="row_0_0_29_1_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html" target="_self">MainLoopSharedStorage</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_29_2_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_0_0_29_3_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html" target="_self">SharedLoadStream</a></td><td class="desc">Assemble the shared load stream for A/B </td></tr>
-<tr id="row_0_0_29_4_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html" target="_self">SharedStorage</a></td><td class="desc">The storage in shared memory </td></tr>
-<tr id="row_0_0_29_5_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html" target="_self">StreamSharedStorage</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_30_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent.html" target="_self">GetExtent</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_31_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html" target="_self">GetExtent&lt; GemmOperand::kA, Tile_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_32_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html" target="_self">GetExtent&lt; GemmOperand::kB, Tile_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_33_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html" target="_self">GlobalLoadStream</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_34_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_34_" class="arrow" onclick="toggleFolder('0_0_34_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html" target="_self">GlobalLoadStreamBase</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_34_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_0_0_34_1_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html" target="_self">SharedStorage</a></td><td class="desc">The storage in shared memory needed by that stream </td></tr>
-<tr id="row_0_0_35_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html" target="_self">HgemmConfig</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_36_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_36_" class="arrow" onclick="toggleFolder('0_0_36_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html" target="_self">HgemmCrosswiseGlobalTileTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_36_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_0_37_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html" target="_self">HgemmSwizzle</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_38_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html" target="_self">HgemmTileTraitsHelperA</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_39_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_40_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html" target="_self">HgemmTileTraitsHelperB</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_41_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_42_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html" target="_self">HgemmTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_43_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html" target="_self">HgemmTraitsHelper</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_44_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html" target="_self">HgemmTransformerA</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_45_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_46_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_47_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html" target="_self">HgemmTransformerB</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_48_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_49_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_50_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html" target="_self">IdentityBlockSwizzle</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_51_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html" target="_self">IgemmConfig</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_52_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01AccumulatorsPerThread___01_4.html" target="_self">IgemmConfig&lt; OutputTile_, int8_t, AccumulatorsPerThread_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_53_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_53_" class="arrow" onclick="toggleFolder('0_0_53_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html" target="_self">IgemmContiguousGlobalTileTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_53_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_0_54_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html" target="_self">IgemmEpilogue</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_55_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html" target="_self">IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_56_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html" target="_self">IgemmEpilogueScalar</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_57_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html" target="_self">IgemmEpilogueScalar&lt; int &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_58_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html" target="_self">IgemmEpilogueTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_59_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html" target="_self">IgemmEpilogueTraitsHelper</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_60_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html" target="_self">IgemmFloatToInt8Converter</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_61_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html" target="_self">IgemmGlobalLoadTransformer</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_62_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html" target="_self">IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_63_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html" target="_self">IgemmGlobalStoreTransformer</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_64_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html" target="_self">IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_65_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html" target="_self">IgemmInt8ToFloatConverter</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_66_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html" target="_self">IgemmSharedStoreTransformer</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_67_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html" target="_self">IgemmSwizzle</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_68_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html" target="_self">IgemmTileTraitsHelperA</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_69_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_70_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html" target="_self">IgemmTileTraitsHelperB</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_71_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_72_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html" target="_self">IgemmTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_73_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html" target="_self">IgemmTraitsHelper</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_74_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html" target="_self">IgemmTransformerA</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_75_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_76_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_77_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html" target="_self">IgemmTransformerB</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_78_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_79_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_80_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_80_" class="arrow" onclick="toggleFolder('0_0_80_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html" target="_self">LinearScaling</a></td><td class="desc">Functor to compute linear combination of fragments </td></tr>
-<tr id="row_0_0_80_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html" target="_self">Params</a></td><td class="desc">The parameters </td></tr>
-<tr id="row_0_0_81_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand.html" target="_self">ProjectOperand</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_82_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html" target="_self">ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;</a></td><td class="desc">Project A operand - (0, K, M) </td></tr>
-<tr id="row_0_0_83_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html" target="_self">ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;</a></td><td class="desc">Project B operand - (0, K, N) </td></tr>
-<tr id="row_0_0_84_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html" target="_self">ProjectOperand&lt; GemmOperand::kC, true &gt;</a></td><td class="desc">Project C operand - (0, N, M) </td></tr>
-<tr id="row_0_0_85_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html" target="_self">ProjectOperand&lt; GemmOperand::kD, true &gt;</a></td><td class="desc">Project D operand - (0, N, M) </td></tr>
-<tr id="row_0_0_86_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html" target="_self">ReshapeThreads</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_87_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html" target="_self">ReshapeThreads&lt; Tile_, Threads_, true &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_88_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html" target="_self">SgemmConfig</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_89_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html" target="_self">SgemmTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_90_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_90_" class="arrow" onclick="toggleFolder('0_0_90_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html" target="_self">SharedLoadStream</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_90_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_0_0_91_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html" target="_self">SimplifiedGemmEpilogueTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_92_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" target="_self">SimplifiedGemmTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_93_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html" target="_self">SimplifiedGemmTraitsHelper</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_94_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html" target="_self">ThreadMultiplyAdd</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
-<tr id="row_0_0_95_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html" target="_self">ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
-<tr id="row_0_0_96_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html" target="_self">ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
-<tr id="row_0_0_97_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_97_" class="arrow" onclick="toggleFolder('0_0_97_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html" target="_self">WmmaGemmGlobalIteratorCd</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_97_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_0_0_98_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_0_98_" class="arrow" onclick="toggleFolder('0_0_98_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html" target="_self">WmmaGemmGlobalIteratorCdTraits</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_98_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_1_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_1_" class="arrow" onclick="toggleFolder('0_1_')">&#9654;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1platform.html" target="_self">platform</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1aligned__chunk.html" target="_self">aligned_chunk</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1aligned__storage.html" target="_self">aligned_storage</a></td><td class="desc">Std::aligned_storage </td></tr>
-<tr id="row_0_1_2_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_2_" class="arrow" onclick="toggleFolder('0_1_2_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of.html" target="_self">alignment_of</a></td><td class="desc">Std::alignment_of </td></tr>
-<tr id="row_0_1_2_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html" target="_self">pad</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_3_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html" target="_self">alignment_of&lt; const value_t &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_4_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html" target="_self">alignment_of&lt; const volatile value_t &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_5_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html" target="_self">alignment_of&lt; double2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_6_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html" target="_self">alignment_of&lt; double4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_7_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html" target="_self">alignment_of&lt; float4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_8_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html" target="_self">alignment_of&lt; int4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_9_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html" target="_self">alignment_of&lt; long4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_10_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html" target="_self">alignment_of&lt; longlong2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_11_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html" target="_self">alignment_of&lt; longlong4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_12_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html" target="_self">alignment_of&lt; uint4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_13_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html" target="_self">alignment_of&lt; ulong4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_14_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html" target="_self">alignment_of&lt; ulonglong2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_15_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html" target="_self">alignment_of&lt; ulonglong4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_16_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html" target="_self">alignment_of&lt; volatile value_t &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_17_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1bool__constant.html" target="_self">bool_constant</a></td><td class="desc">Std::bool_constant </td></tr>
-<tr id="row_0_1_18_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1conditional.html" target="_self">conditional</a></td><td class="desc">Std::conditional (true specialization) </td></tr>
-<tr id="row_0_1_19_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html" target="_self">conditional&lt; false, T, F &gt;</a></td><td class="desc">Std::conditional (false specialization) </td></tr>
-<tr id="row_0_1_20_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1default__delete.html" target="_self">default_delete</a></td><td class="desc">Default deleter </td></tr>
-<tr id="row_0_1_21_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html" target="_self">default_delete&lt; T[]&gt;</a></td><td class="desc">Partial specialization for deleting array types </td></tr>
-<tr id="row_0_1_22_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1enable__if.html" target="_self">enable_if</a></td><td class="desc">Std::enable_if (true specialization) </td></tr>
-<tr id="row_0_1_23_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html" target="_self">enable_if&lt; false, T &gt;</a></td><td class="desc">Std::enable_if (false specialization) </td></tr>
-<tr id="row_0_1_24_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1greater.html" target="_self">greater</a></td><td class="desc">Std::greater </td></tr>
-<tr id="row_0_1_25_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">integral_constant</a></td><td class="desc">Std::integral_constant </td></tr>
-<tr id="row_0_1_26_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__arithmetic.html" target="_self">is_arithmetic</a></td><td class="desc">Std::is_arithmetic </td></tr>
-<tr id="row_0_1_27_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of.html" target="_self">is_base_of</a></td><td class="desc">Std::is_base_of </td></tr>
-<tr id="row_0_1_28_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_28_" class="arrow" onclick="toggleFolder('0_1_28_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html" target="_self">is_base_of_helper</a></td><td class="desc">Helper for std::is_base_of </td></tr>
-<tr id="row_0_1_28_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html" target="_self">dummy</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_29_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__floating__point.html" target="_self">is_floating_point</a></td><td class="desc">Std::is_floating_point </td></tr>
-<tr id="row_0_1_30_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__fundamental.html" target="_self">is_fundamental</a></td><td class="desc">Std::is_fundamental </td></tr>
-<tr id="row_0_1_31_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral.html" target="_self">is_integral</a></td><td class="desc">Std::is_integral </td></tr>
-<tr id="row_0_1_32_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html" target="_self">is_integral&lt; char &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_33_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html" target="_self">is_integral&lt; const T &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_34_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html" target="_self">is_integral&lt; const volatile T &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_35_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html" target="_self">is_integral&lt; int &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_36_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html" target="_self">is_integral&lt; long &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_37_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html" target="_self">is_integral&lt; long long &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_38_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html" target="_self">is_integral&lt; short &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_39_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html" target="_self">is_integral&lt; signed char &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_40_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html" target="_self">is_integral&lt; unsigned char &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_41_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html" target="_self">is_integral&lt; unsigned int &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_42_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html" target="_self">is_integral&lt; unsigned long &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_43_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html" target="_self">is_integral&lt; unsigned long long &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_44_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html" target="_self">is_integral&lt; unsigned short &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_45_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html" target="_self">is_integral&lt; volatile T &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_46_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer.html" target="_self">is_pointer</a></td><td class="desc">Std::is_pointer </td></tr>
-<tr id="row_0_1_47_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper.html" target="_self">is_pointer_helper</a></td><td class="desc">Helper for std::is_pointer (false specialization) </td></tr>
-<tr id="row_0_1_48_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html" target="_self">is_pointer_helper&lt; T * &gt;</a></td><td class="desc">Helper for std::is_pointer (true specialization) </td></tr>
-<tr id="row_0_1_49_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same.html" target="_self">is_same</a></td><td class="desc">Std::is_same (false specialization) </td></tr>
-<tr id="row_0_1_50_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html" target="_self">is_same&lt; A, A &gt;</a></td><td class="desc">Std::is_same (true specialization) </td></tr>
-<tr id="row_0_1_51_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__trivially__copyable.html" target="_self">is_trivially_copyable</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_52_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__void.html" target="_self">is_void</a></td><td class="desc">Std::is_void </td></tr>
-<tr id="row_0_1_53_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__volatile.html" target="_self">is_volatile</a></td><td class="desc">Std::is_volatile </td></tr>
-<tr id="row_0_1_54_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html" target="_self">is_volatile&lt; volatile T &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_55_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1less.html" target="_self">less</a></td><td class="desc">Std::less </td></tr>
-<tr id="row_0_1_56_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1nullptr__t.html" target="_self">nullptr_t</a></td><td class="desc">Std::nullptr_t </td></tr>
-<tr id="row_0_1_57_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1plus.html" target="_self">plus</a></td><td class="desc">Platform::plus </td></tr>
-<tr id="row_0_1_58_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__const.html" target="_self">remove_const</a></td><td class="desc">Std::remove_const (non-const specialization) </td></tr>
-<tr id="row_0_1_59_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html" target="_self">remove_const&lt; const T &gt;</a></td><td class="desc">Std::remove_const (const specialization) </td></tr>
-<tr id="row_0_1_60_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__cv.html" target="_self">remove_cv</a></td><td class="desc">Std::remove_cv </td></tr>
-<tr id="row_0_1_61_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__volatile.html" target="_self">remove_volatile</a></td><td class="desc">Std::remove_volatile (non-volatile specialization) </td></tr>
-<tr id="row_0_1_62_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html" target="_self">remove_volatile&lt; volatile T &gt;</a></td><td class="desc">Std::remove_volatile (volatile specialization) </td></tr>
-<tr id="row_0_1_63_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html" target="_self">unique_ptr</a></td><td class="desc">Std::unique_ptr </td></tr>
-<tr id="row_0_2_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1AlignedStruct.html" target="_self">AlignedStruct</a></td><td class="desc"></td></tr>
-<tr id="row_0_3_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html" target="_self">ComputeOffsetFromShape</a></td><td class="desc">Compute the offset for the given coordinates in a cube </td></tr>
-<tr id="row_0_4_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html" target="_self">ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube with one channel and a depth of 1 </td></tr>
-<tr id="row_0_5_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html" target="_self">ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube with a depth of 1 </td></tr>
-<tr id="row_0_6_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html" target="_self">ComputeOffsetFromStrides</a></td><td class="desc">Compute the offset for the given coordinates in a cube </td></tr>
-<tr id="row_0_7_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html" target="_self">ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube with one channel and a depth of 1 </td></tr>
-<tr id="row_0_8_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html" target="_self">ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube with a depth of 1 </td></tr>
-<tr id="row_0_9_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html" target="_self">ComputeThreadOffsetFromStrides</a></td><td class="desc">Decompose threadId.x into coordinate of a cube whose dimensions are specified by Threads_. Afterwards compute the offset of those coordinates using Strides_ </td></tr>
-<tr id="row_0_10_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html" target="_self">ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a></td><td class="desc">Specialization for D=1 and C=1 </td></tr>
-<tr id="row_0_11_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html" target="_self">ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a></td><td class="desc">Specialization for D=1 </td></tr>
-<tr id="row_0_12_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html" target="_self">ConstPredicateTileAdapter</a></td><td class="desc">Adapter to enable random access to predicates via logical coordinate within a tile </td></tr>
-<tr id="row_0_13_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Convert.html" target="_self">Convert</a></td><td class="desc"></td></tr>
-<tr id="row_0_14_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html" target="_self">Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_15_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">Coord</a></td><td class="desc">Statically-sized array specifying Coords within a tensor </td></tr>
-<tr id="row_0_16_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Copy.html" target="_self">Copy</a></td><td class="desc"></td></tr>
-<tr id="row_0_17_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1divide__assert.html" target="_self">divide_assert</a></td><td class="desc"></td></tr>
-<tr id="row_0_18_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent.html" target="_self">Extent</a></td><td class="desc">Returns the extent of a scalar or vector </td></tr>
-<tr id="row_0_19_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html" target="_self">Extent&lt; Vector&lt; T, Lanes &gt; &gt;</a></td><td class="desc">Returns the number of lanes of a vector if need be </td></tr>
-<tr id="row_0_20_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html" target="_self">Extent&lt; Vector&lt; T, Lanes &gt; const &gt;</a></td><td class="desc">Returns the number of lanes of a vector if need be </td></tr>
-<tr id="row_0_21_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Fragment.html" target="_self">Fragment</a></td><td class="desc">A template defining <a class="el" href="group__fragment__concept.html">Fragment Concept</a> </td></tr>
-<tr id="row_0_22_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentConstIterator.html" target="_self">FragmentConstIterator</a></td><td class="desc"></td></tr>
-<tr id="row_0_23_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentIterator.html" target="_self">FragmentIterator</a></td><td class="desc">A template defining <a class="el" href="group__fragment__iterator__concept.html">Fragment Iterator Concept</a> </td></tr>
-<tr id="row_0_24_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentLoad.html" target="_self">FragmentLoad</a></td><td class="desc"></td></tr>
-<tr id="row_0_25_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html" target="_self">FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_26_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html" target="_self">FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_27_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentStore.html" target="_self">FragmentStore</a></td><td class="desc"></td></tr>
-<tr id="row_0_28_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html" target="_self">FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_29_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html" target="_self">FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_30_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1GemmOperand.html" target="_self">GemmOperand</a></td><td class="desc">Gemm operand - D = A * B + C </td></tr>
-<tr id="row_0_31_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Identity.html" target="_self">Identity</a></td><td class="desc">Describes identity elements </td></tr>
-<tr id="row_0_32_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1is__pow2.html" target="_self">is_pow2</a></td><td class="desc"></td></tr>
-<tr id="row_0_33_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1IteratorAdvance.html" target="_self">IteratorAdvance</a></td><td class="desc">Specifies dimension in which post-increment accesses advance </td></tr>
-<tr id="row_0_34_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1IteratorFragment.html" target="_self">IteratorFragment</a></td><td class="desc">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix </td></tr>
-<tr id="row_0_35_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load.html" target="_self">Load</a></td><td class="desc"></td></tr>
-<tr id="row_0_36_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html" target="_self">Load&lt; double, 2, Memory_, true, 16 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_37_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html" target="_self">Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_38_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html" target="_self">Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_39_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html" target="_self">Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_40_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__down.html" target="_self">log2_down</a></td><td class="desc"></td></tr>
-<tr id="row_0_41_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html" target="_self">log2_down&lt; N, 1, Count &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_42_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__up.html" target="_self">log2_up</a></td><td class="desc"></td></tr>
-<tr id="row_0_43_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html" target="_self">log2_up&lt; N, 1, Count &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_44_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout.html" target="_self">MatrixLayout</a></td><td class="desc">Describes layouts of matrices </td></tr>
-<tr id="row_0_45_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MemorySpace.html" target="_self">MemorySpace</a></td><td class="desc">Enum to specify which memory space data resides in </td></tr>
-<tr id="row_0_46_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateTileAdapter.html" target="_self">PredicateTileAdapter</a></td><td class="desc">Adapter to enable random access to predicates via logical coordinate within a tile </td></tr>
-<tr id="row_0_47_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_47_" class="arrow" onclick="toggleFolder('0_47_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector.html" target="_self">PredicateVector</a></td><td class="desc">Statically sized array of bits implementing </td></tr>
-<tr id="row_0_47_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html" target="_self">ConstIterator</a></td><td class="desc">A const iterator implementing <a class="el" href="group__predicate__iterator__concept.html">Predicate Iterator Concept</a> enabling sequential read-only access to prediactes </td></tr>
-<tr id="row_0_47_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html" target="_self">Iterator</a></td><td class="desc">An iterator implementing <a class="el" href="group__predicate__iterator__concept.html">Predicate Iterator Concept</a> enabling sequential read and write access to predicates </td></tr>
-<tr id="row_0_47_2_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html" target="_self">TrivialIterator</a></td><td class="desc"><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html" title="An iterator implementing Predicate Iterator Concept enabling sequential read and write access to pred...">Iterator</a> that always returns true </td></tr>
-<tr id="row_0_48_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ReshapeTile.html" target="_self">ReshapeTile</a></td><td class="desc"></td></tr>
-<tr id="row_0_49_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html" target="_self">ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_50_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Shape.html" target="_self">Shape</a></td><td class="desc">A <a class="el" href="structcutlass_1_1Shape.html" title="A Shape implementing Layout Concept describing the dimensions of a cube. ">Shape</a> implementing <a class="el" href="group__layout__concept.html">Layout Concept</a> describing the dimensions of a cube </td></tr>
-<tr id="row_0_51_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeAdd.html" target="_self">ShapeAdd</a></td><td class="desc"></td></tr>
-<tr id="row_0_52_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeCount.html" target="_self">ShapeCount</a></td><td class="desc">Compute derived counted of a <a class="el" href="group__layout__concept.html">Layout Concept</a> based class </td></tr>
-<tr id="row_0_53_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeDiv.html" target="_self">ShapeDiv</a></td><td class="desc"></td></tr>
-<tr id="row_0_54_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMax.html" target="_self">ShapeMax</a></td><td class="desc"></td></tr>
-<tr id="row_0_55_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMin.html" target="_self">ShapeMin</a></td><td class="desc"></td></tr>
-<tr id="row_0_56_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMul.html" target="_self">ShapeMul</a></td><td class="desc"></td></tr>
-<tr id="row_0_57_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeScale.html" target="_self">ShapeScale</a></td><td class="desc"></td></tr>
-<tr id="row_0_58_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeStrides.html" target="_self">ShapeStrides</a></td><td class="desc"></td></tr>
-<tr id="row_0_59_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeSub.html" target="_self">ShapeSub</a></td><td class="desc"></td></tr>
-<tr id="row_0_60_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1sqrt__est.html" target="_self">sqrt_est</a></td><td class="desc"></td></tr>
-<tr id="row_0_61_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType.html" target="_self">StorageType</a></td><td class="desc"></td></tr>
-<tr id="row_0_62_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_011_01_4.html" target="_self">StorageType&lt; 1 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_63_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_012_01_4.html" target="_self">StorageType&lt; 2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_64_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_014_01_4.html" target="_self">StorageType&lt; 4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_65_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store.html" target="_self">Store</a></td><td class="desc"></td></tr>
-<tr id="row_0_66_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html" target="_self">Store&lt; double, 2, Memory_, true, 16 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_67_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html" target="_self">Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_68_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html" target="_self">Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_69_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html" target="_self">Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_70_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef.html" target="_self">TensorRef</a></td><td class="desc">Structure modeling a pointer and stride into a tensor </td></tr>
-<tr id="row_0_71_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorView.html" target="_self">TensorView</a></td><td class="desc">Host-side reference implementation of tensor operations </td></tr>
-<tr id="row_0_72_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TiledThreadOffset.html" target="_self">TiledThreadOffset</a></td><td class="desc">Basic thread offset function computed from a thread shape </td></tr>
-<tr id="row_0_73_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_73_" class="arrow" onclick="toggleFolder('0_73_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase.html" target="_self">TileIteratorBase</a></td><td class="desc">Iterator for accessing a stripmined tile in memory </td></tr>
-<tr id="row_0_73_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters to the iterator </td></tr>
-<tr id="row_0_74_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_74_" class="arrow" onclick="toggleFolder('0_74_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator.html" target="_self">TileLoadIterator</a></td><td class="desc">An iterator implementing <a class="el" href="group__tile__load__iterator__concept.html">Tile Load Iterator Concept</a> for loading a tile from memory </td></tr>
-<tr id="row_0_74_0_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters </td></tr>
-<tr id="row_0_75_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_75_" class="arrow" onclick="toggleFolder('0_75_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreIterator.html" target="_self">TileStoreIterator</a></td><td class="desc">An iterator implementing <a class="el" href="group__tile__store__iterator__concept.html">Tile Store Iterator Concept</a> for storing a tile to memory </td></tr>
-<tr id="row_0_75_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters </td></tr>
-<tr id="row_0_76_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraits.html" target="_self">TileTraits</a></td><td class="desc">A template defining <a class="el" href="group__tile__traits__concept.html">Tile Traits Concept</a> </td></tr>
-<tr id="row_0_77_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html" target="_self">TileTraitsContiguousMajor</a></td><td class="desc"></td></tr>
-<tr id="row_0_78_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsStandard.html" target="_self">TileTraitsStandard</a></td><td class="desc">Chooses 'best' shape to enable warp raking along contiguous dimension if possible </td></tr>
-<tr id="row_0_79_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html" target="_self">TileTraitsStrideMajor</a></td><td class="desc"></td></tr>
-<tr id="row_0_80_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_80_" class="arrow" onclick="toggleFolder('0_80_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsWarpRake.html" target="_self">TileTraitsWarpRake</a></td><td class="desc">Tiling in which warps rake across the contiguous dimension </td></tr>
-<tr id="row_0_80_0_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_0_81_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html" target="_self">TrivialPredicateTileAdapter</a></td><td class="desc">Always returns true predicate </td></tr>
-<tr id="row_0_82_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector.html" target="_self">Vector</a></td><td class="desc"></td></tr>
-<tr id="row_0_83_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html" target="_self">Vector&lt; half, kLanes_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_84_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize.html" target="_self">Vectorize</a></td><td class="desc"></td></tr>
-<tr id="row_0_85_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html" target="_self">Vectorize&lt; Element_, 1 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_0_86_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits.html" target="_self">VectorTraits</a></td><td class="desc">Traits describing properties of vectors and scalar-as-vectors </td></tr>
-<tr id="row_0_87_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html" target="_self">VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a></td><td class="desc">Partial specialization for actual <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a> </td></tr>
-<tr id="row_0_88_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html" target="_self">VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a></td><td class="desc">Partial specialization for actual <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a> </td></tr>
+<tr id="row_0_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_0_" class="arrow" onclick="toggleFolder('0_')">&#9654;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass.html" target="_self">cutlass</a></td><td class="desc"></td></tr>
+<tr id="row_0_0_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_0_" class="arrow" onclick="toggleFolder('0_0_')">&#9654;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1detail.html" target="_self">detail</a></td><td class="desc"></td></tr>
+<tr id="row_0_0_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html" target="_self">ScalarOrPointer</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_1_" class="arrow" onclick="toggleFolder('0_1_')">&#9654;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1gemm.html" target="_self">gemm</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_0_" class="arrow" onclick="toggleFolder('0_1_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html" target="_self">ClearAccumulators</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_0_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html" target="_self">SharedStorage</a></td><td class="desc">The shared storage </td></tr>
+<tr id="row_0_1_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html" target="_self">ColumnMajorBlockSwizzle</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_2_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html" target="_self">DgemmConfig</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_3_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html" target="_self">DgemmTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_4_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html" target="_self">Fp16SgemmConfig</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_5_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html" target="_self">Fp16SgemmSgemmTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_6_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html" target="_self">FragmentMultiplyAdd</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_7_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html" target="_self">FragmentMultiplyAdd&lt; half, half, true &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_8_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html" target="_self">Gemm</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_9_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">GemmConfig</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_10_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html" target="_self">GemmCoord</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_11_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html" target="_self">GemmDesc</a></td><td class="desc">GEMM problem description </td></tr>
+<tr id="row_0_1_12_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html" target="_self">GemmEpilogue</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_13_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_13_" class="arrow" onclick="toggleFolder('0_1_13_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" target="_self">GemmEpilogueTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_13_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_0_1_13_1_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html" target="_self">SharedStorage</a></td><td class="desc">The shared memory to swizzle the data in the epilogue </td></tr>
+<tr id="row_0_1_13_2_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html" target="_self">StreamSharedStorage</a></td><td class="desc">The shared memory storage to exchange data </td></tr>
+<tr id="row_0_1_14_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html" target="_self">GemmEpilogueTraitsHelper</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_15_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_15_" class="arrow" onclick="toggleFolder('0_1_15_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html" target="_self">GemmGlobalIteratorAb</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_15_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html" target="_self">Params</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_16_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_16_" class="arrow" onclick="toggleFolder('0_1_16_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html" target="_self">GemmGlobalIteratorCd</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_16_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_0_1_17_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_17_" class="arrow" onclick="toggleFolder('0_1_17_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html" target="_self">GemmGlobalTileCdTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_17_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_1_18_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_18_" class="arrow" onclick="toggleFolder('0_1_18_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html" target="_self">GemmGlobalTileTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_18_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_1_19_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html" target="_self">GemmMultiplicandTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_20_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html" target="_self">GemmOperandTraitsAb</a></td><td class="desc">Helper to describe attributes of GEMM matrix operands </td></tr>
+<tr id="row_0_1_21_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_21_" class="arrow" onclick="toggleFolder('0_1_21_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html" target="_self">GemmSharedLoadTileATraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_21_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_1_22_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_22_" class="arrow" onclick="toggleFolder('0_1_22_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html" target="_self">GemmSharedLoadTileBTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_22_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_1_23_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_23_" class="arrow" onclick="toggleFolder('0_1_23_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html" target="_self">GemmSharedLoadTileDTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_23_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_1_24_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_24_" class="arrow" onclick="toggleFolder('0_1_24_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html" target="_self">GemmSharedStoreTileAbTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_24_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_25_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_25_" class="arrow" onclick="toggleFolder('0_1_25_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html" target="_self">GemmSharedStoreTileDTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_25_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_1_26_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_26_" class="arrow" onclick="toggleFolder('0_1_26_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html" target="_self">GemmSharedStoreWithSkewTileAbTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_26_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_27_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html" target="_self">GemmTileTraitsHelperA</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_28_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_29_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_30_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html" target="_self">GemmTileTraitsHelperB</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_31_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_32_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_33_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_33_" class="arrow" onclick="toggleFolder('0_1_33_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">GemmTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_33_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html" target="_self">MainLoopSharedStorage</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_33_1_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters object constructable on the host </td></tr>
+<tr id="row_0_1_33_2_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html" target="_self">SharedStorage</a></td><td class="desc">The storage in shared memory </td></tr>
+<tr id="row_0_1_34_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent.html" target="_self">GetExtent</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_35_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html" target="_self">GetExtent&lt; GemmOperand::kA, Tile_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_36_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html" target="_self">GetExtent&lt; GemmOperand::kB, Tile_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_37_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_37_" class="arrow" onclick="toggleFolder('0_1_37_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html" target="_self">GlobalLoadStream</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_37_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_0_1_37_1_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html" target="_self">SharedStorage</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_38_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_38_" class="arrow" onclick="toggleFolder('0_1_38_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html" target="_self">GlobalLoadStreamPair</a></td><td class="desc">Collect the global load streams for multiplicands </td></tr>
+<tr id="row_0_1_38_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters object </td></tr>
+<tr id="row_0_1_38_1_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html" target="_self">SharedStorage</a></td><td class="desc">Defines a structure containing shared storage for each pair </td></tr>
+<tr id="row_0_1_39_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html" target="_self">HgemmConfig</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_40_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_40_" class="arrow" onclick="toggleFolder('0_1_40_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html" target="_self">HgemmCrosswiseGlobalTileTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_40_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_1_41_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html" target="_self">HgemmSwizzle</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_42_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html" target="_self">HgemmTileTraitsHelperA</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_43_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_44_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html" target="_self">HgemmTileTraitsHelperB</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_45_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_46_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html" target="_self">HgemmTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_47_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html" target="_self">HgemmTraitsHelper</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_48_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html" target="_self">HgemmTransformerA</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_49_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_50_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_51_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html" target="_self">HgemmTransformerB</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_52_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_53_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_54_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html" target="_self">IdentityBlockSwizzle</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_55_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html" target="_self">IgemmConfig</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_56_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html" target="_self">IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_57_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html" target="_self">IgemmEpilogue</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_58_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html" target="_self">IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_59_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html" target="_self">IgemmEpilogueScalar</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_60_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html" target="_self">IgemmEpilogueScalar&lt; int &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_61_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html" target="_self">IgemmEpilogueTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_62_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html" target="_self">IgemmEpilogueTraitsHelper</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_63_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html" target="_self">IgemmFloatToInt8Converter</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_64_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html" target="_self">IgemmGlobalIteratorAb</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_65_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html" target="_self">IgemmGlobalLoadTransformer</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_66_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html" target="_self">IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_67_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html" target="_self">IgemmGlobalStoreTransformer</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_68_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html" target="_self">IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_69_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_69_" class="arrow" onclick="toggleFolder('0_1_69_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html" target="_self">IgemmGlobalTileTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_69_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_1_70_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html" target="_self">IgemmInt8ToFloatConverter</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_71_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html" target="_self">IgemmSharedStoreTransformer</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_72_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html" target="_self">IgemmSwizzle</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_73_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html" target="_self">IgemmTileTraitsHelperA</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_74_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html" target="_self">IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_75_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html" target="_self">IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_76_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html" target="_self">IgemmTileTraitsHelperB</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_77_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html" target="_self">IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_78_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html" target="_self">IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_79_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html" target="_self">IgemmTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_80_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html" target="_self">IgemmTraitsHelper</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_81_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html" target="_self">IgemmTransformerA</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_82_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_83_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_84_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html" target="_self">IgemmTransformerB</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_85_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_86_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_87_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Launch.html" target="_self">Launch</a></td><td class="desc">Partial specialization for launching the GEMM kernel with or without launch bounds </td></tr>
+<tr id="row_0_1_88_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html" target="_self">Launch&lt; Gemm, false &gt;</a></td><td class="desc">Partial specialization for launching the GEMM kernel with or without launch bounds </td></tr>
+<tr id="row_0_1_89_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_89_" class="arrow" onclick="toggleFolder('0_1_89_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html" target="_self">LinearScaling</a></td><td class="desc">Functor to compute linear combination of fragments </td></tr>
+<tr id="row_0_1_89_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html" target="_self">Params</a></td><td class="desc">The parameters </td></tr>
+<tr id="row_0_1_90_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_90_" class="arrow" onclick="toggleFolder('0_1_90_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html" target="_self">LinearScalingDevicePtr</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_90_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html" target="_self">Params</a></td><td class="desc">The parameters </td></tr>
+<tr id="row_0_1_91_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand.html" target="_self">ProjectOperand</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_92_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html" target="_self">ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;</a></td><td class="desc">Project A operand - (0, K, M) </td></tr>
+<tr id="row_0_1_93_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html" target="_self">ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;</a></td><td class="desc">Project B operand - (0, K, N) </td></tr>
+<tr id="row_0_1_94_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html" target="_self">ProjectOperand&lt; GemmOperand::kC, true &gt;</a></td><td class="desc">Project C operand - (0, N, M) </td></tr>
+<tr id="row_0_1_95_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html" target="_self">ProjectOperand&lt; GemmOperand::kD, true &gt;</a></td><td class="desc">Project D operand - (0, N, M) </td></tr>
+<tr id="row_0_1_96_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html" target="_self">ReshapeThreads</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_97_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html" target="_self">ReshapeThreads&lt; Tile_, Threads_, true &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_98_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html" target="_self">RowMajorBlockSwizzle</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_99_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html" target="_self">SgemmConfig</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_100_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html" target="_self">SgemmLBTraits</a></td><td class="desc">Helper to define SGEMM traits using <a class="el" href="structcutlass_1_1gemm_1_1Launch.html" title="Partial specialization for launching the GEMM kernel with or without launch bounds. ">Launch</a> Bounds </td></tr>
+<tr id="row_0_1_101_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html" target="_self">SgemmTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_102_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_102_" class="arrow" onclick="toggleFolder('0_1_102_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html" target="_self">SharedLoadStream</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_102_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_0_1_103_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_103_" class="arrow" onclick="toggleFolder('0_1_103_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html" target="_self">SharedStreamPair</a></td><td class="desc">Collect the global load streams for multiplicands </td></tr>
+<tr id="row_0_1_103_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters object passed to load iterators </td></tr>
+<tr id="row_0_1_104_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html" target="_self">SimplifiedGemmEpilogueTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_105_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" target="_self">SimplifiedGemmTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_106_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html" target="_self">SimplifiedGemmTraitsHelper</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_107_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html" target="_self">swizzleDirection</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_108_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html" target="_self">ThreadMultiplyAdd</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
+<tr id="row_0_1_109_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html" target="_self">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
+<tr id="row_0_1_110_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html" target="_self">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
+<tr id="row_0_1_111_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html" target="_self">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
+<tr id="row_0_1_112_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_112_" class="arrow" onclick="toggleFolder('0_1_112_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html" target="_self">WmmaGemmGlobalIteratorCd</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_112_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html" target="_self">Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_0_1_113_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_1_113_" class="arrow" onclick="toggleFolder('0_1_113_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html" target="_self">WmmaGemmGlobalIteratorCdTraits</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_113_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_2_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_2_" class="arrow" onclick="toggleFolder('0_2_')">&#9654;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1platform.html" target="_self">platform</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1aligned__chunk.html" target="_self">aligned_chunk</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1aligned__storage.html" target="_self">aligned_storage</a></td><td class="desc">Std::aligned_storage </td></tr>
+<tr id="row_0_2_2_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_2_2_" class="arrow" onclick="toggleFolder('0_2_2_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of.html" target="_self">alignment_of</a></td><td class="desc">Std::alignment_of </td></tr>
+<tr id="row_0_2_2_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html" target="_self">pad</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_3_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html" target="_self">alignment_of&lt; const value_t &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_4_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html" target="_self">alignment_of&lt; const volatile value_t &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_5_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html" target="_self">alignment_of&lt; double2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_6_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html" target="_self">alignment_of&lt; double4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_7_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html" target="_self">alignment_of&lt; float4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_8_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html" target="_self">alignment_of&lt; int4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_9_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html" target="_self">alignment_of&lt; long4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_10_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html" target="_self">alignment_of&lt; longlong2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_11_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html" target="_self">alignment_of&lt; longlong4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_12_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html" target="_self">alignment_of&lt; uint4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_13_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html" target="_self">alignment_of&lt; ulong4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_14_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html" target="_self">alignment_of&lt; ulonglong2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_15_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html" target="_self">alignment_of&lt; ulonglong4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_16_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html" target="_self">alignment_of&lt; volatile value_t &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_17_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1bool__constant.html" target="_self">bool_constant</a></td><td class="desc">Std::bool_constant </td></tr>
+<tr id="row_0_2_18_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1platform_1_1complex.html" target="_self">complex</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_19_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1conditional.html" target="_self">conditional</a></td><td class="desc">Std::conditional (true specialization) </td></tr>
+<tr id="row_0_2_20_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html" target="_self">conditional&lt; false, T, F &gt;</a></td><td class="desc">Std::conditional (false specialization) </td></tr>
+<tr id="row_0_2_21_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1default__delete.html" target="_self">default_delete</a></td><td class="desc">Default deleter </td></tr>
+<tr id="row_0_2_22_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html" target="_self">default_delete&lt; T[]&gt;</a></td><td class="desc">Partial specialization for deleting array types </td></tr>
+<tr id="row_0_2_23_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1enable__if.html" target="_self">enable_if</a></td><td class="desc">Std::enable_if (true specialization) </td></tr>
+<tr id="row_0_2_24_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html" target="_self">enable_if&lt; false, T &gt;</a></td><td class="desc">Std::enable_if (false specialization) </td></tr>
+<tr id="row_0_2_25_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1greater.html" target="_self">greater</a></td><td class="desc">Std::greater </td></tr>
+<tr id="row_0_2_26_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">integral_constant</a></td><td class="desc">Std::integral_constant </td></tr>
+<tr id="row_0_2_27_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__arithmetic.html" target="_self">is_arithmetic</a></td><td class="desc">Std::is_arithmetic </td></tr>
+<tr id="row_0_2_28_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of.html" target="_self">is_base_of</a></td><td class="desc">Std::is_base_of </td></tr>
+<tr id="row_0_2_29_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_0_2_29_" class="arrow" onclick="toggleFolder('0_2_29_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html" target="_self">is_base_of_helper</a></td><td class="desc">Helper for std::is_base_of </td></tr>
+<tr id="row_0_2_29_0_" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html" target="_self">dummy</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_30_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__floating__point.html" target="_self">is_floating_point</a></td><td class="desc">Std::is_floating_point </td></tr>
+<tr id="row_0_2_31_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__fundamental.html" target="_self">is_fundamental</a></td><td class="desc">Std::is_fundamental </td></tr>
+<tr id="row_0_2_32_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral.html" target="_self">is_integral</a></td><td class="desc">Std::is_integral </td></tr>
+<tr id="row_0_2_33_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html" target="_self">is_integral&lt; char &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_34_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html" target="_self">is_integral&lt; const T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_35_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html" target="_self">is_integral&lt; const volatile T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_36_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html" target="_self">is_integral&lt; int &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_37_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html" target="_self">is_integral&lt; long &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_38_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html" target="_self">is_integral&lt; long long &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_39_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html" target="_self">is_integral&lt; short &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_40_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html" target="_self">is_integral&lt; signed char &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_41_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html" target="_self">is_integral&lt; unsigned char &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_42_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html" target="_self">is_integral&lt; unsigned int &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_43_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html" target="_self">is_integral&lt; unsigned long &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_44_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html" target="_self">is_integral&lt; unsigned long long &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_45_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html" target="_self">is_integral&lt; unsigned short &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_46_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html" target="_self">is_integral&lt; volatile T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_47_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer.html" target="_self">is_pointer</a></td><td class="desc">Std::is_pointer </td></tr>
+<tr id="row_0_2_48_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper.html" target="_self">is_pointer_helper</a></td><td class="desc">Helper for std::is_pointer (false specialization) </td></tr>
+<tr id="row_0_2_49_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html" target="_self">is_pointer_helper&lt; T * &gt;</a></td><td class="desc">Helper for std::is_pointer (true specialization) </td></tr>
+<tr id="row_0_2_50_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same.html" target="_self">is_same</a></td><td class="desc">Std::is_same (false specialization) </td></tr>
+<tr id="row_0_2_51_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html" target="_self">is_same&lt; A, A &gt;</a></td><td class="desc">Std::is_same (true specialization) </td></tr>
+<tr id="row_0_2_52_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__trivially__copyable.html" target="_self">is_trivially_copyable</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_53_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__void.html" target="_self">is_void</a></td><td class="desc">Std::is_void </td></tr>
+<tr id="row_0_2_54_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__volatile.html" target="_self">is_volatile</a></td><td class="desc">Std::is_volatile </td></tr>
+<tr id="row_0_2_55_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html" target="_self">is_volatile&lt; volatile T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_56_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1less.html" target="_self">less</a></td><td class="desc">Std::less </td></tr>
+<tr id="row_0_2_57_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1nullptr__t.html" target="_self">nullptr_t</a></td><td class="desc">Std::nullptr_t </td></tr>
+<tr id="row_0_2_58_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1plus.html" target="_self">plus</a></td><td class="desc">Platform::plus </td></tr>
+<tr id="row_0_2_59_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__const.html" target="_self">remove_const</a></td><td class="desc">Std::remove_const (non-const specialization) </td></tr>
+<tr id="row_0_2_60_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html" target="_self">remove_const&lt; const T &gt;</a></td><td class="desc">Std::remove_const (const specialization) </td></tr>
+<tr id="row_0_2_61_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__cv.html" target="_self">remove_cv</a></td><td class="desc">Std::remove_cv </td></tr>
+<tr id="row_0_2_62_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__volatile.html" target="_self">remove_volatile</a></td><td class="desc">Std::remove_volatile (non-volatile specialization) </td></tr>
+<tr id="row_0_2_63_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html" target="_self">remove_volatile&lt; volatile T &gt;</a></td><td class="desc">Std::remove_volatile (volatile specialization) </td></tr>
+<tr id="row_0_2_64_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html" target="_self">unique_ptr</a></td><td class="desc">Std::unique_ptr </td></tr>
+<tr id="row_0_3_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1AlignedStruct.html" target="_self">AlignedStruct</a></td><td class="desc"></td></tr>
+<tr id="row_0_4_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1bin1__t.html" target="_self">bin1_t</a></td><td class="desc"></td></tr>
+<tr id="row_0_5_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html" target="_self">ComputeOffsetFromShape</a></td><td class="desc">Compute the offset for the given coordinates in a cube </td></tr>
+<tr id="row_0_6_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html" target="_self">ComputeOffsetFromStrides</a></td><td class="desc">Compute the offset for the given coordinates in a cube </td></tr>
+<tr id="row_0_7_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html" target="_self">ComputeThreadOffsetFromStrides</a></td><td class="desc">Decompose threadId.x into coordinate of a cube whose dimensions are specified by Threads_. Afterwards compute the offset of those coordinates using Strides_ </td></tr>
+<tr id="row_0_8_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html" target="_self">ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a></td><td class="desc">Specialization for D=1 and C=1 </td></tr>
+<tr id="row_0_9_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html" target="_self">ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a></td><td class="desc">Specialization for D=1 </td></tr>
+<tr id="row_0_10_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html" target="_self">ConstPredicateTileAdapter</a></td><td class="desc">Adapter to enable random access to predicates via logical coordinate within a tile </td></tr>
+<tr id="row_0_11_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Convert.html" target="_self">Convert</a></td><td class="desc"></td></tr>
+<tr id="row_0_12_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html" target="_self">Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_13_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">Coord</a></td><td class="desc">Statically-sized array specifying Coords within a tensor </td></tr>
+<tr id="row_0_14_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Copy.html" target="_self">Copy</a></td><td class="desc"></td></tr>
+<tr id="row_0_15_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1divide__assert.html" target="_self">divide_assert</a></td><td class="desc"></td></tr>
+<tr id="row_0_16_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1DumpType.html" target="_self">DumpType</a></td><td class="desc"></td></tr>
+<tr id="row_0_17_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent.html" target="_self">Extent</a></td><td class="desc">Returns the extent of a scalar or vector </td></tr>
+<tr id="row_0_18_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html" target="_self">Extent&lt; Vector&lt; T, Lanes &gt; &gt;</a></td><td class="desc">Returns the number of lanes of a vector if need be </td></tr>
+<tr id="row_0_19_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html" target="_self">Extent&lt; Vector&lt; T, Lanes &gt; const &gt;</a></td><td class="desc">Returns the number of lanes of a vector if need be </td></tr>
+<tr id="row_0_20_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Fragment.html" target="_self">Fragment</a></td><td class="desc">A template defining <a class="el" href="group__fragment__concept.html">Fragment Concept</a> </td></tr>
+<tr id="row_0_21_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentConstIterator.html" target="_self">FragmentConstIterator</a></td><td class="desc"></td></tr>
+<tr id="row_0_22_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentElementType.html" target="_self">FragmentElementType</a></td><td class="desc">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix </td></tr>
+<tr id="row_0_23_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentIterator.html" target="_self">FragmentIterator</a></td><td class="desc">A template defining <a class="el" href="group__fragment__iterator__concept.html">Fragment Iterator Concept</a> </td></tr>
+<tr id="row_0_24_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1GemmOperand.html" target="_self">GemmOperand</a></td><td class="desc">Gemm operand - D = A * B + C </td></tr>
+<tr id="row_0_25_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Identity.html" target="_self">Identity</a></td><td class="desc">Describes identity elements </td></tr>
+<tr id="row_0_26_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html" target="_self">IdentityTensorMapFunc</a></td><td class="desc"></td></tr>
+<tr id="row_0_27_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1int4__t.html" target="_self">int4_t</a></td><td class="desc"></td></tr>
+<tr id="row_0_28_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1is__pow2.html" target="_self">is_pow2</a></td><td class="desc"></td></tr>
+<tr id="row_0_29_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1IteratorAdvance.html" target="_self">IteratorAdvance</a></td><td class="desc">Specifies dimension in which post-increment accesses advance </td></tr>
+<tr id="row_0_30_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html" target="_self">KernelLaunchConfiguration</a></td><td class="desc">Structure containing the basic launch configuration of a CUDA kernel </td></tr>
+<tr id="row_0_31_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load.html" target="_self">Load</a></td><td class="desc"></td></tr>
+<tr id="row_0_32_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html" target="_self">Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_33_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html" target="_self">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td><td class="desc">Partial specialization for 16b loads </td></tr>
+<tr id="row_0_34_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html" target="_self">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_35_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html" target="_self">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_36_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html" target="_self">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_37_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html" target="_self">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_38_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html" target="_self">Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_39_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html" target="_self">Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_40_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html" target="_self">Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_41_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__down.html" target="_self">log2_down</a></td><td class="desc"></td></tr>
+<tr id="row_0_42_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html" target="_self">log2_down&lt; N, 1, Count &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_43_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__up.html" target="_self">log2_up</a></td><td class="desc"></td></tr>
+<tr id="row_0_44_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html" target="_self">log2_up&lt; N, 1, Count &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_45_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixCoord.html" target="_self">MatrixCoord</a></td><td class="desc"></td></tr>
+<tr id="row_0_46_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_46_" class="arrow" onclick="toggleFolder('0_46_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout.html" target="_self">MatrixLayout</a></td><td class="desc">Defines data layouts of various matrix formats usable by <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> and other classes </td></tr>
+<tr id="row_0_46_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html" target="_self">ColumnMajor</a></td><td class="desc">Mapping function for column-major matrices </td></tr>
+<tr id="row_0_46_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html" target="_self">ColumnMajorBlockLinear</a></td><td class="desc"></td></tr>
+<tr id="row_0_46_2_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html" target="_self">ColumnMajorInterleaved</a></td><td class="desc"></td></tr>
+<tr id="row_0_46_3_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html" target="_self">ContiguousLayout</a></td><td class="desc"></td></tr>
+<tr id="row_0_46_4_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html" target="_self">RowMajor</a></td><td class="desc">Mapping function for row-major matrices </td></tr>
+<tr id="row_0_46_5_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html" target="_self">RowMajorBlockLinear</a></td><td class="desc"></td></tr>
+<tr id="row_0_46_6_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html" target="_self">RowMajorInterleaved</a></td><td class="desc"></td></tr>
+<tr id="row_0_47_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixTransform.html" target="_self">MatrixTransform</a></td><td class="desc">Transformation applied to matrix operands </td></tr>
+<tr id="row_0_48_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Max.html" target="_self">Max</a></td><td class="desc"></td></tr>
+<tr id="row_0_49_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MemorySpace.html" target="_self">MemorySpace</a></td><td class="desc">Enum to specify which memory space data resides in </td></tr>
+<tr id="row_0_50_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Min.html" target="_self">Min</a></td><td class="desc"></td></tr>
+<tr id="row_0_51_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html" target="_self">PredicatedTileLoadStream</a></td><td class="desc">Generic stream for loading and transforming fragments </td></tr>
+<tr id="row_0_52_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html" target="_self">PredicatedTileStoreStream</a></td><td class="desc">Generic stream for transforming and storing fragments </td></tr>
+<tr id="row_0_53_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateTileAdapter.html" target="_self">PredicateTileAdapter</a></td><td class="desc">Adapter to enable random access to predicates via logical coordinate within a tile </td></tr>
+<tr id="row_0_54_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_54_" class="arrow" onclick="toggleFolder('0_54_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector.html" target="_self">PredicateVector</a></td><td class="desc">Statically sized array of bits implementing </td></tr>
+<tr id="row_0_54_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html" target="_self">ConstIterator</a></td><td class="desc">A const iterator implementing <a class="el" href="group__predicate__iterator__concept.html">Predicate Iterator Concept</a> enabling sequential read-only access to prediactes </td></tr>
+<tr id="row_0_54_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html" target="_self">Iterator</a></td><td class="desc">An iterator implementing <a class="el" href="group__predicate__iterator__concept.html">Predicate Iterator Concept</a> enabling sequential read and write access to predicates </td></tr>
+<tr id="row_0_54_2_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html" target="_self">TrivialIterator</a></td><td class="desc"><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html" title="An iterator implementing Predicate Iterator Concept enabling sequential read and write access to pred...">Iterator</a> that always returns true </td></tr>
+<tr id="row_0_55_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html" target="_self">RegularTilePredicateFunctor</a></td><td class="desc">Functor computing a predicate given the logical position of an access </td></tr>
+<tr id="row_0_56_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ReshapeTile.html" target="_self">ReshapeTile</a></td><td class="desc"></td></tr>
+<tr id="row_0_57_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html" target="_self">ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_58_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ScalarIO.html" target="_self">ScalarIO</a></td><td class="desc">Helper to enable formatted printing of CUTLASS scalar types to an ostream </td></tr>
+<tr id="row_0_59_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Shape.html" target="_self">Shape</a></td><td class="desc">A <a class="el" href="structcutlass_1_1Shape.html" title="A Shape implementing Layout Concept describing the dimensions of a cube. ">Shape</a> implementing <a class="el" href="group__layout__concept.html">Layout Concept</a> describing the dimensions of a cube </td></tr>
+<tr id="row_0_60_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeAdd.html" target="_self">ShapeAdd</a></td><td class="desc"></td></tr>
+<tr id="row_0_61_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeCount.html" target="_self">ShapeCount</a></td><td class="desc">Compute derived counted of a <a class="el" href="group__layout__concept.html">Layout Concept</a> based class </td></tr>
+<tr id="row_0_62_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeDiv.html" target="_self">ShapeDiv</a></td><td class="desc"></td></tr>
+<tr id="row_0_63_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeDivCeiling.html" target="_self">ShapeDivCeiling</a></td><td class="desc"></td></tr>
+<tr id="row_0_64_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMax.html" target="_self">ShapeMax</a></td><td class="desc"></td></tr>
+<tr id="row_0_65_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMin.html" target="_self">ShapeMin</a></td><td class="desc"></td></tr>
+<tr id="row_0_66_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMul.html" target="_self">ShapeMul</a></td><td class="desc"></td></tr>
+<tr id="row_0_67_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeScale.html" target="_self">ShapeScale</a></td><td class="desc"></td></tr>
+<tr id="row_0_68_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeStrides.html" target="_self">ShapeStrides</a></td><td class="desc"></td></tr>
+<tr id="row_0_69_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeSub.html" target="_self">ShapeSub</a></td><td class="desc"></td></tr>
+<tr id="row_0_70_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1sqrt__est.html" target="_self">sqrt_est</a></td><td class="desc"></td></tr>
+<tr id="row_0_71_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType.html" target="_self">StorageType</a></td><td class="desc"></td></tr>
+<tr id="row_0_72_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_011_01_4.html" target="_self">StorageType&lt; 1 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_73_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_012_01_4.html" target="_self">StorageType&lt; 2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_74_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_014_01_4.html" target="_self">StorageType&lt; 4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_75_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store.html" target="_self">Store</a></td><td class="desc"></td></tr>
+<tr id="row_0_76_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html" target="_self">Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_77_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html" target="_self">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_78_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html" target="_self">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_79_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html" target="_self">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_80_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html" target="_self">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_81_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html" target="_self">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_82_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef.html" target="_self">TensorRef</a></td><td class="desc"></td></tr>
+<tr id="row_0_83_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_83_" class="arrow" onclick="toggleFolder('0_83_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html" target="_self">TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="desc">Specialization for rank=1 case with no internal <a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">StrideVector</a> </td></tr>
+<tr id="row_0_83_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html" target="_self">StrideVector</a></td><td class="desc"></td></tr>
+<tr id="row_0_84_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_84_" class="arrow" onclick="toggleFolder('0_84_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TensorRefArray.html" target="_self">TensorRefArray</a></td><td class="desc"></td></tr>
+<tr id="row_0_84_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html" target="_self">ConstIterator</a></td><td class="desc">TensorRefIterator over <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects in <a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a> </td></tr>
+<tr id="row_0_85_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_85_" class="arrow" onclick="toggleFolder('0_85_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html" target="_self">TensorRefBatchStrided</a></td><td class="desc"></td></tr>
+<tr id="row_0_85_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html" target="_self">ConstIterator</a></td><td class="desc">Constant iterator over tensors implied by <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a> </td></tr>
+<tr id="row_0_86_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorView.html" target="_self">TensorView</a></td><td class="desc">Defines a view into a logical tensor </td></tr>
+<tr id="row_0_87_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileAllocation.html" target="_self">TileAllocation</a></td><td class="desc">Class for storing a tile in memory and accessing it through a tensor ref </td></tr>
+<tr id="row_0_88_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileCoord.html" target="_self">TileCoord</a></td><td class="desc"></td></tr>
+<tr id="row_0_89_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TiledThreadOffset.html" target="_self">TiledThreadOffset</a></td><td class="desc">Basic thread offset function computed from a thread shape </td></tr>
+<tr id="row_0_90_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_90_" class="arrow" onclick="toggleFolder('0_90_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase.html" target="_self">TileIteratorBase</a></td><td class="desc">Iterator for accessing a stripmined tile in memory </td></tr>
+<tr id="row_0_90_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters to the iterator </td></tr>
+<tr id="row_0_91_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_91_" class="arrow" onclick="toggleFolder('0_91_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator.html" target="_self">TileLoadIterator</a></td><td class="desc">An iterator implementing <a class="el" href="group__tile__load__iterator__concept.html">Tile Load Iterator Concept</a> for loading a tile from memory </td></tr>
+<tr id="row_0_91_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters </td></tr>
+<tr id="row_0_92_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_92_" class="arrow" onclick="toggleFolder('0_92_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadStream.html" target="_self">TileLoadStream</a></td><td class="desc">Generic stream for loading and transforming fragments </td></tr>
+<tr id="row_0_92_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters object used to construct generic load stream </td></tr>
+<tr id="row_0_92_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html" target="_self">PredicateVector</a></td><td class="desc">Empty predicate vector struct </td></tr>
+<tr id="row_0_93_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_93_" class="arrow" onclick="toggleFolder('0_93_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreIterator.html" target="_self">TileStoreIterator</a></td><td class="desc">An iterator implementing <a class="el" href="group__tile__store__iterator__concept.html">Tile Store Iterator Concept</a> for storing a tile to memory </td></tr>
+<tr id="row_0_93_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters </td></tr>
+<tr id="row_0_94_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_94_" class="arrow" onclick="toggleFolder('0_94_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreStream.html" target="_self">TileStoreStream</a></td><td class="desc">Generic stream for transforming and storing fragments </td></tr>
+<tr id="row_0_94_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html" target="_self">Params</a></td><td class="desc">Parameters used to construct the stream </td></tr>
+<tr id="row_0_94_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html" target="_self">PredicateVector</a></td><td class="desc">Empty predicate vector struct </td></tr>
+<tr id="row_0_95_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraits.html" target="_self">TileTraits</a></td><td class="desc">A template defining <a class="el" href="group__tile__traits__concept.html">Tile Traits Concept</a> </td></tr>
+<tr id="row_0_96_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html" target="_self">TileTraitsContiguousMajor</a></td><td class="desc"></td></tr>
+<tr id="row_0_97_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsStandard.html" target="_self">TileTraitsStandard</a></td><td class="desc">Chooses 'best' shape to enable warp raking along contiguous dimension if possible </td></tr>
+<tr id="row_0_98_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html" target="_self">TileTraitsStrideMajor</a></td><td class="desc"></td></tr>
+<tr id="row_0_99_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_99_" class="arrow" onclick="toggleFolder('0_99_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsWarpRake.html" target="_self">TileTraitsWarpRake</a></td><td class="desc">Tiling in which warps rake across the contiguous dimension </td></tr>
+<tr id="row_0_99_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html" target="_self">ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_0_100_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html" target="_self">TrivialPredicateTileAdapter</a></td><td class="desc">Always returns true predicate </td></tr>
+<tr id="row_0_101_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1uint4__t.html" target="_self">uint4_t</a></td><td class="desc"></td></tr>
+<tr id="row_0_102_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector.html" target="_self">Vector</a></td><td class="desc"></td></tr>
+<tr id="row_0_103_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html" target="_self">Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="desc"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 1-bit binary datatype </td></tr>
+<tr id="row_0_104_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html" target="_self">Vector&lt; half, 1 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_105_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html" target="_self">Vector&lt; half, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_106_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html" target="_self">Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="desc"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit signed integer datatype </td></tr>
+<tr id="row_0_107_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html" target="_self">Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="desc"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit unsigned integer datatype </td></tr>
+<tr id="row_0_108_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize.html" target="_self">Vectorize</a></td><td class="desc"></td></tr>
+<tr id="row_0_109_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html" target="_self">Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_110_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html" target="_self">Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_111_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html" target="_self">Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_0_112_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits.html" target="_self">VectorTraits</a></td><td class="desc">Traits describing properties of vectors and scalar-as-vectors </td></tr>
+<tr id="row_0_113_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html" target="_self">VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a></td><td class="desc">Partial specialization for actual <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a> </td></tr>
+<tr id="row_0_114_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html" target="_self">VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a></td><td class="desc">Partial specialization for actual <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a> </td></tr>
+<tr id="row_0_115_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipConvert.html" target="_self">ZipConvert</a></td><td class="desc">Zips two convert operations </td></tr>
+<tr id="row_0_116_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipFragment.html" target="_self">ZipFragment</a></td><td class="desc">A template defining <a class="el" href="group__fragment__concept.html">Fragment Concept</a> </td></tr>
+<tr id="row_0_117_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipTensorRef.html" target="_self">ZipTensorRef</a></td><td class="desc"></td></tr>
+<tr id="row_0_118_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipTileAllocation.html" target="_self">ZipTileAllocation</a></td><td class="desc">Manages a pair of tile allocations as if they are one allocation </td></tr>
+<tr id="row_0_119_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_0_119_" class="arrow" onclick="toggleFolder('0_119_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1ZipTileIterator.html" target="_self">ZipTileIterator</a></td><td class="desc">Constructs an iterator from a pair of iterators </td></tr>
+<tr id="row_0_119_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html" target="_self">Params</a></td><td class="desc"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html" title="Params object. ">Params</a> object </td></tr>
+<tr id="row_1_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structDebugType.html" target="_self">DebugType</a></td><td class="desc"></td></tr>
+<tr id="row_2_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structDebugValue.html" target="_self">DebugValue</a></td><td class="desc"></td></tr>
 </table>
 </div><!-- directory -->
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1PredicateVector_1_1ConstIterator-members.html b/docs/classcutlass_1_1PredicateVector_1_1ConstIterator-members.html
index 860cd05cb..18f59fc0c 100644
--- a/docs/classcutlass_1_1PredicateVector_1_1ConstIterator-members.html
+++ b/docs/classcutlass_1_1PredicateVector_1_1ConstIterator-members.html
@@ -91,7 +91,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1PredicateVector_1_1ConstIterator.html b/docs/classcutlass_1_1PredicateVector_1_1ConstIterator.html
index 1fbdc759c..7e7089a06 100644
--- a/docs/classcutlass_1_1PredicateVector_1_1ConstIterator.html
+++ b/docs/classcutlass_1_1PredicateVector_1_1ConstIterator.html
@@ -381,7 +381,7 @@ template&lt;int kPredicates_, int kPredicatesPerByte_ = 4, int kPredicateStart_
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1PredicateVector_1_1Iterator-members.html b/docs/classcutlass_1_1PredicateVector_1_1Iterator-members.html
index ca3ff04aa..73d0ebcaa 100644
--- a/docs/classcutlass_1_1PredicateVector_1_1Iterator-members.html
+++ b/docs/classcutlass_1_1PredicateVector_1_1Iterator-members.html
@@ -93,7 +93,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1PredicateVector_1_1Iterator.html b/docs/classcutlass_1_1PredicateVector_1_1Iterator.html
index 42a069382..2cbc797d8 100644
--- a/docs/classcutlass_1_1PredicateVector_1_1Iterator.html
+++ b/docs/classcutlass_1_1PredicateVector_1_1Iterator.html
@@ -443,7 +443,7 @@ template&lt;int kPredicates_, int kPredicatesPerByte_ = 4, int kPredicateStart_
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1TensorRef-members.html b/docs/classcutlass_1_1TensorRef-members.html
index 4bf37ad13..202c9ab42 100644
--- a/docs/classcutlass_1_1TensorRef-members.html
+++ b/docs/classcutlass_1_1TensorRef-members.html
@@ -73,35 +73,52 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::TensorRef&lt; Storage_, Rank_ &gt; Member List</div>  </div>
+<div class="title">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">advance</a>(Coord&lt; Rank &gt; const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">at</a>(Coord&lt; Rank &gt; const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215">at</a>(int idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">convert</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">data</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">good</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">leading_dim</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">offset</a>(Coord&lt; Rank &gt; const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">operator+</a>(Coord&lt; Rank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">operator-</a>(Coord&lt; Rank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974">operator[]</a>(Coord&lt; Rank &gt; const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c">operator[]</a>(int idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">reset</a>(Storage *ptr=nullptr, Coord&lt; Rank &gt; stride=Coord&lt; Rank &gt;(0))</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31">stride</a>(int dim) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">TensorRef</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8">TensorRef</a>(Storage *ptr, Coord&lt; Rank &gt; stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(LongIndex delta)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">at</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">at</a>(LongIndex idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">const_ref</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">Coord_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">data</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">good</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">leading_dim</a>(int idx=0) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">operator+</a>(TensorCoord const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">operator+=</a>(TensorCoord const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">operator-</a>(TensorCoord const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">operator-=</a>(TensorCoord const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">operator[]</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">operator[]</a>(LongIndex idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">Rank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a>(Storage *ptr=nullptr)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">reset</a>(Storage *ptr, StorageCoord const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">stride</a>(int dim) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">TensorRef</a>(Storage *ptr=nullptr)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">TensorRef</a>(Storage *ptr, Index ldm)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">TensorRef</a>(Storage *ptr, StrideVector const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0">TensorRef</a>(Storage *ptr, StorageCoord const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">TensorRef</a>(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1TensorRef.html b/docs/classcutlass_1_1TensorRef.html
index 05a9b3dd5..1053ca0a9 100644
--- a/docs/classcutlass_1_1TensorRef.html
+++ b/docs/classcutlass_1_1TensorRef.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::TensorRef&lt; Storage_, Rank_ &gt; Class Template Reference</title>
+<title>Cutlass: cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Class Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -78,93 +78,278 @@ $(function() {
 <a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="classcutlass_1_1TensorRef-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::TensorRef&lt; Storage_, Rank_ &gt; Class Template Reference</div>  </div>
+<div class="title">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Class Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>Structure modeling a pointer and stride into a tensor.  
-</p>
-
 <p><code>#include &lt;<a class="el" href="tensor__ref_8h_source.html">tensor_ref.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="classcutlass_1_1TensorRef.png" usemap="#cutlass::TensorRef_3C_20Storage_5F_2C_20Rank_5F_2C_20MapFunc_5F_2C_20StorageRank_5F_2C_20Index_5F_2C_20LongIndex_5F_20_3E_map" alt=""/>
+  <map id="cutlass::TensorRef_3C_20Storage_5F_2C_20Rank_5F_2C_20MapFunc_5F_2C_20StorageRank_5F_2C_20Index_5F_2C_20LongIndex_5F_20_3E_map" name="cutlass::TensorRef_3C_20Storage_5F_2C_20Rank_5F_2C_20MapFunc_5F_2C_20StorageRank_5F_2C_20Index_5F_2C_20LongIndex_5F_20_3E_map">
+<area href="structcutlass_1_1TensorRefBatchStrided.html" alt="cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;" shape="rect" coords="0,56,584,80"/>
+<area href="classcutlass_1_1TensorView.html" title="Defines a view into a logical tensor. " alt="cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;" shape="rect" coords="594,56,1178,80"/>
+</map>
+ </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:a604921388cb7ee18ddb8127b8ca2f7fd"><td class="memItemLeft" align="right" valign="top">typedef Storage_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a></td></tr>
-<tr class="memdesc:a604921388cb7ee18ddb8127b8ca2f7fd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Data type of individual access.  <a href="#a604921388cb7ee18ddb8127b8ca2f7fd">More...</a><br /></td></tr>
-<tr class="separator:a604921388cb7ee18ddb8127b8ca2f7fd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad327edfe1f8085632ff682d354922009"><td class="memItemLeft" align="right" valign="top">typedef Storage_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a></td></tr>
+<tr class="memdesc:ad327edfe1f8085632ff682d354922009"><td class="mdescLeft">&#160;</td><td class="mdescRight">Data type of individual access.  <a href="#ad327edfe1f8085632ff682d354922009">More...</a><br /></td></tr>
+<tr class="separator:ad327edfe1f8085632ff682d354922009"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad0273300d26125278b6930b1e463ff29"><td class="memItemLeft" align="right" valign="top">typedef MapFunc_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a></td></tr>
+<tr class="memdesc:ad0273300d26125278b6930b1e463ff29"><td class="mdescLeft">&#160;</td><td class="mdescRight">Mapping function from logical coordinate to internal n-D array.  <a href="#ad0273300d26125278b6930b1e463ff29">More...</a><br /></td></tr>
+<tr class="separator:ad0273300d26125278b6930b1e463ff29"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2beda7a1946bde2858e730bece21b890"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a></td></tr>
+<tr class="memdesc:a2beda7a1946bde2858e730bece21b890"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#a2beda7a1946bde2858e730bece21b890">More...</a><br /></td></tr>
+<tr class="separator:a2beda7a1946bde2858e730bece21b890"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a42ca6a39ab0e44296fed71a77c57b7b1"><td class="memItemLeft" align="right" valign="top">typedef LongIndex_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a></td></tr>
+<tr class="memdesc:a42ca6a39ab0e44296fed71a77c57b7b1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Typically, strides in memory can be very large.  <a href="#a42ca6a39ab0e44296fed71a77c57b7b1">More...</a><br /></td></tr>
+<tr class="separator:a42ca6a39ab0e44296fed71a77c57b7b1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a35b7e1fc59298e0f06f484652d62fd65"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a></td></tr>
+<tr class="memdesc:a35b7e1fc59298e0f06f484652d62fd65"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="#a35b7e1fc59298e0f06f484652d62fd65">More...</a><br /></td></tr>
+<tr class="separator:a35b7e1fc59298e0f06f484652d62fd65"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a455a2df539b53086699c210d06df1c5d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a></td></tr>
+<tr class="memdesc:a455a2df539b53086699c210d06df1c5d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in storage n-D array.  <a href="#a455a2df539b53086699c210d06df1c5d">More...</a><br /></td></tr>
+<tr class="separator:a455a2df539b53086699c210d06df1c5d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07c4b1ace7c8799537553b54cfe0a059"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a></td></tr>
+<tr class="separator:a07c4b1ace7c8799537553b54cfe0a059"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8281d11677512d6e229504ab4babad17"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a></td></tr>
+<tr class="memdesc:a8281d11677512d6e229504ab4babad17"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to of constant value.  <a href="#a8281d11677512d6e229504ab4babad17">More...</a><br /></td></tr>
+<tr class="separator:a8281d11677512d6e229504ab4babad17"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a758f24783e36ffc393b360d0b8640bc6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">Coord_t</a></td></tr>
+<tr class="memdesc:a758f24783e36ffc393b360d0b8640bc6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="#a758f24783e36ffc393b360d0b8640bc6">More...</a><br /></td></tr>
+<tr class="separator:a758f24783e36ffc393b360d0b8640bc6"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a54f6edc293b0b8ac97f02e8ab951c478"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">TensorRef</a> ()</td></tr>
-<tr class="memdesc:a54f6edc293b0b8ac97f02e8ab951c478"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor.  <a href="#a54f6edc293b0b8ac97f02e8ab951c478">More...</a><br /></td></tr>
-<tr class="separator:a54f6edc293b0b8ac97f02e8ab951c478"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae48325312183ff61dbd312c64f31fcb8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> *ptr, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; <a class="el" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>)</td></tr>
-<tr class="memdesc:ae48325312183ff61dbd312c64f31fcb8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from a pointer, size, and stride.  <a href="#ae48325312183ff61dbd312c64f31fcb8">More...</a><br /></td></tr>
-<tr class="separator:ae48325312183ff61dbd312c64f31fcb8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abefe392e81da2c09cb127f963ae90674"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">reset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; <a class="el" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>=<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt;(0))</td></tr>
-<tr class="memdesc:abefe392e81da2c09cb127f963ae90674"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates the pointer, stride, and location within a <a class="el" href="classcutlass_1_1TensorRef.html" title="Structure modeling a pointer and stride into a tensor. ">TensorRef</a>.  <a href="#abefe392e81da2c09cb127f963ae90674">More...</a><br /></td></tr>
-<tr class="separator:abefe392e81da2c09cb127f963ae90674"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7eb4444e2b3fce5a5ccde65a75df633c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
-<tr class="memitem:a7eb4444e2b3fce5a5ccde65a75df633c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; T, <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">convert</a> ()</td></tr>
-<tr class="memdesc:a7eb4444e2b3fce5a5ccde65a75df633c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Conversion function.  <a href="#a7eb4444e2b3fce5a5ccde65a75df633c">More...</a><br /></td></tr>
-<tr class="separator:a7eb4444e2b3fce5a5ccde65a75df633c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0c049e523ee0fc98769ed8cd2d026780"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">good</a> () const</td></tr>
-<tr class="memdesc:a0c049e523ee0fc98769ed8cd2d026780"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if the <a class="el" href="classcutlass_1_1TensorRef.html" title="Structure modeling a pointer and stride into a tensor. ">TensorRef</a> may be safely accessed.  <a href="#a0c049e523ee0fc98769ed8cd2d026780">More...</a><br /></td></tr>
-<tr class="separator:a0c049e523ee0fc98769ed8cd2d026780"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8e23c78658f45c6f197a1774cc85c5b7"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">data</a> () const</td></tr>
-<tr class="memdesc:a8e23c78658f45c6f197a1774cc85c5b7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the pointer to referenced data.  <a href="#a8e23c78658f45c6f197a1774cc85c5b7">More...</a><br /></td></tr>
-<tr class="separator:a8e23c78658f45c6f197a1774cc85c5b7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a89380141d25528c4c7ba6c365b96a878"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a> () const</td></tr>
-<tr class="memdesc:a89380141d25528c4c7ba6c365b96a878"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor.  <a href="#a89380141d25528c4c7ba6c365b96a878">More...</a><br /></td></tr>
-<tr class="separator:a89380141d25528c4c7ba6c365b96a878"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af47f192552544272774a29d7a0829a31"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31">stride</a> (int dim) const</td></tr>
-<tr class="memdesc:af47f192552544272774a29d7a0829a31"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor in the given dimension.  <a href="#af47f192552544272774a29d7a0829a31">More...</a><br /></td></tr>
-<tr class="separator:af47f192552544272774a29d7a0829a31"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8e1c61910ffb49ec64930f66dd342b77"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">leading_dim</a> () const</td></tr>
-<tr class="memdesc:a8e1c61910ffb49ec64930f66dd342b77"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the maximum stride element as the 'leading dimension'.  <a href="#a8e1c61910ffb49ec64930f66dd342b77">More...</a><br /></td></tr>
-<tr class="separator:a8e1c61910ffb49ec64930f66dd342b77"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a02ee5d16ed4ce4705a99bb16b2ae1ae8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">offset</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;coord) const</td></tr>
-<tr class="memdesc:a02ee5d16ed4ce4705a99bb16b2ae1ae8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the offset of an index from the origin of the tensor.  <a href="#a02ee5d16ed4ce4705a99bb16b2ae1ae8">More...</a><br /></td></tr>
-<tr class="separator:a02ee5d16ed4ce4705a99bb16b2ae1ae8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7eff42a37e4dbee488bfa726f3f0df4f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">at</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;coord) const</td></tr>
-<tr class="memdesc:a7eff42a37e4dbee488bfa726f3f0df4f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="#a7eff42a37e4dbee488bfa726f3f0df4f">More...</a><br /></td></tr>
-<tr class="separator:a7eff42a37e4dbee488bfa726f3f0df4f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6a2aa88ed77557c089a165da0df1e974"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974">operator[]</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;coord) const</td></tr>
-<tr class="memdesc:a6a2aa88ed77557c089a165da0df1e974"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise accessor.  <a href="#a6a2aa88ed77557c089a165da0df1e974">More...</a><br /></td></tr>
-<tr class="separator:a6a2aa88ed77557c089a165da0df1e974"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5702dea703104ab431c098c7b039c215"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215">at</a> (int idx) const</td></tr>
-<tr class="memdesc:a5702dea703104ab431c098c7b039c215"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="#a5702dea703104ab431c098c7b039c215">More...</a><br /></td></tr>
-<tr class="separator:a5702dea703104ab431c098c7b039c215"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a34e97ab2190b4681d1c1199186d66f1c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c">operator[]</a> (int idx) const</td></tr>
-<tr class="memdesc:a34e97ab2190b4681d1c1199186d66f1c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise accessor.  <a href="#a34e97ab2190b4681d1c1199186d66f1c">More...</a><br /></td></tr>
-<tr class="separator:a34e97ab2190b4681d1c1199186d66f1c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aab0dafb81a462320e55e0dc4a5886478"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">advance</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;b)</td></tr>
-<tr class="memdesc:aab0dafb81a462320e55e0dc4a5886478"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds an offset to the pointer.  <a href="#aab0dafb81a462320e55e0dc4a5886478">More...</a><br /></td></tr>
-<tr class="separator:aab0dafb81a462320e55e0dc4a5886478"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa7b80d225c01c9dc12aafc515cf15842"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">operator+</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;b) const</td></tr>
-<tr class="memdesc:aa7b80d225c01c9dc12aafc515cf15842"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html" title="Structure modeling a pointer and stride into a tensor. ">TensorRef</a> offset by a given amount.  <a href="#aa7b80d225c01c9dc12aafc515cf15842">More...</a><br /></td></tr>
-<tr class="separator:aa7b80d225c01c9dc12aafc515cf15842"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3843ccfd1d097f25eff45dc159709938"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">operator-</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;b) const</td></tr>
-<tr class="memdesc:a3843ccfd1d097f25eff45dc159709938"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html" title="Structure modeling a pointer and stride into a tensor. ">TensorRef</a> offset by a given amount.  <a href="#a3843ccfd1d097f25eff45dc159709938">More...</a><br /></td></tr>
-<tr class="separator:a3843ccfd1d097f25eff45dc159709938"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5a667a48c64fb916c31802b73b769765"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>)</td></tr>
+<tr class="memdesc:a5a667a48c64fb916c31802b73b769765"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper for 1-D memory. All higher ranks are projected onto the fastest changing rank.  <a href="#a5a667a48c64fb916c31802b73b769765">More...</a><br /></td></tr>
+<tr class="separator:a5a667a48c64fb916c31802b73b769765"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a48b9b4ad9034f6cf2b7c2ee479aea135"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> ldm)</td></tr>
+<tr class="memdesc:a48b9b4ad9034f6cf2b7c2ee479aea135"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct from a pointer and single stride element for 2-D pitch linear memory.  <a href="#a48b9b4ad9034f6cf2b7c2ee479aea135">More...</a><br /></td></tr>
+<tr class="separator:a48b9b4ad9034f6cf2b7c2ee479aea135"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afe4fc6fa539f36b2764707d50351905c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>)</td></tr>
+<tr class="memdesc:afe4fc6fa539f36b2764707d50351905c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from a single pointer and stride vector.  <a href="#afe4fc6fa539f36b2764707d50351905c">More...</a><br /></td></tr>
+<tr class="separator:afe4fc6fa539f36b2764707d50351905c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeca439296c8446741ba84b78f5a601e0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>)</td></tr>
+<tr class="separator:aeca439296c8446741ba84b78f5a601e0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afe92be0a61fb8fc84426f4907faca6c1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &gt;::type, <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>, <a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> &gt; const &amp;ref)</td></tr>
+<tr class="memdesc:afe92be0a61fb8fc84426f4907faca6c1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Enables conversion from <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> of non-const type.  <a href="#afe92be0a61fb8fc84426f4907faca6c1">More...</a><br /></td></tr>
+<tr class="separator:afe92be0a61fb8fc84426f4907faca6c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6ab468e38773f5a971a8428673fb5e47"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">const_ref</a> () const</td></tr>
+<tr class="memdesc:a6ab468e38773f5a971a8428673fb5e47"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to constant-valued tensor.  <a href="#a6ab468e38773f5a971a8428673fb5e47">More...</a><br /></td></tr>
+<tr class="separator:a6ab468e38773f5a971a8428673fb5e47"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ec815838aed4e02dd96acb1000614c0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>)</td></tr>
+<tr class="memdesc:a7ec815838aed4e02dd96acb1000614c0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates only the pointer.  <a href="#a7ec815838aed4e02dd96acb1000614c0">More...</a><br /></td></tr>
+<tr class="separator:a7ec815838aed4e02dd96acb1000614c0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7a1da27a46883eb68e3f8983670b784b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">reset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>)</td></tr>
+<tr class="memdesc:a7a1da27a46883eb68e3f8983670b784b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates the pointer, stride, and location within a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="#a7a1da27a46883eb68e3f8983670b784b">More...</a><br /></td></tr>
+<tr class="separator:a7a1da27a46883eb68e3f8983670b784b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2dbee889626b4764d30e9058ef3a7ae8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">good</a> () const</td></tr>
+<tr class="memdesc:a2dbee889626b4764d30e9058ef3a7ae8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if the <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> may be safely accessed.  <a href="#a2dbee889626b4764d30e9058ef3a7ae8">More...</a><br /></td></tr>
+<tr class="separator:a2dbee889626b4764d30e9058ef3a7ae8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae1c80b524cd9491e2d499d703e1459f7"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">data</a> () const</td></tr>
+<tr class="memdesc:ae1c80b524cd9491e2d499d703e1459f7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the pointer to referenced data.  <a href="#ae1c80b524cd9491e2d499d703e1459f7">More...</a><br /></td></tr>
+<tr class="separator:ae1c80b524cd9491e2d499d703e1459f7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adb52dd6f9f68e7b8b67b8ddfb5c0021c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a> () const</td></tr>
+<tr class="memdesc:adb52dd6f9f68e7b8b67b8ddfb5c0021c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor.  <a href="#adb52dd6f9f68e7b8b67b8ddfb5c0021c">More...</a><br /></td></tr>
+<tr class="separator:adb52dd6f9f68e7b8b67b8ddfb5c0021c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa6956072f1231b79fe8925a78c4760b7"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">stride</a> (int dim) const</td></tr>
+<tr class="memdesc:aa6956072f1231b79fe8925a78c4760b7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor in the given dimension.  <a href="#aa6956072f1231b79fe8925a78c4760b7">More...</a><br /></td></tr>
+<tr class="separator:aa6956072f1231b79fe8925a78c4760b7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa60b92372db1da1d2aa997d6a03e01ca"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">leading_dim</a> (int idx=0) const</td></tr>
+<tr class="memdesc:aa60b92372db1da1d2aa997d6a03e01ca"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the maximum stride element as the 'leading dimension'.  <a href="#aa60b92372db1da1d2aa997d6a03e01ca">More...</a><br /></td></tr>
+<tr class="separator:aa60b92372db1da1d2aa997d6a03e01ca"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07dfe328d4a8316e79e9acde50582360"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a07dfe328d4a8316e79e9acde50582360"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps a logical coordinate to an n-D array in memory.  <a href="#a07dfe328d4a8316e79e9acde50582360">More...</a><br /></td></tr>
+<tr class="separator:a07dfe328d4a8316e79e9acde50582360"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4da903ecbeaaf80c35084e8779e920a1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a4da903ecbeaaf80c35084e8779e920a1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the offset of an index from the origin of the tensor.  <a href="#a4da903ecbeaaf80c35084e8779e920a1">More...</a><br /></td></tr>
+<tr class="separator:a4da903ecbeaaf80c35084e8779e920a1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4169a1344897c2c87822ee49d5e0002f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">at</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a4169a1344897c2c87822ee49d5e0002f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="#a4169a1344897c2c87822ee49d5e0002f">More...</a><br /></td></tr>
+<tr class="separator:a4169a1344897c2c87822ee49d5e0002f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab0cf071be50423dece4e931878573a1c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">at</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> idx) const</td></tr>
+<tr class="memdesc:ab0cf071be50423dece4e931878573a1c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given linear index.  <a href="#ab0cf071be50423dece4e931878573a1c">More...</a><br /></td></tr>
+<tr class="separator:ab0cf071be50423dece4e931878573a1c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada832ce3a57aaf4919b1ed89192f1fa6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">operator[]</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:ada832ce3a57aaf4919b1ed89192f1fa6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="#ada832ce3a57aaf4919b1ed89192f1fa6">More...</a><br /></td></tr>
+<tr class="separator:ada832ce3a57aaf4919b1ed89192f1fa6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a207a0dabf6c368fa1edcb32baa2110e3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">operator[]</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> idx) const</td></tr>
+<tr class="memdesc:a207a0dabf6c368fa1edcb32baa2110e3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given linear index.  <a href="#a207a0dabf6c368fa1edcb32baa2110e3">More...</a><br /></td></tr>
+<tr class="separator:a207a0dabf6c368fa1edcb32baa2110e3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5f0363da1e0544f256438e066d3cc143"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> delta)</td></tr>
+<tr class="memdesc:a5f0363da1e0544f256438e066d3cc143"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds an offset to each pointer.  <a href="#a5f0363da1e0544f256438e066d3cc143">More...</a><br /></td></tr>
+<tr class="separator:a5f0363da1e0544f256438e066d3cc143"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0a4fd9ace579b46bc9d575b8adc6882f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">operator+</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a0a4fd9ace579b46bc9d575b8adc6882f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#a0a4fd9ace579b46bc9d575b8adc6882f">More...</a><br /></td></tr>
+<tr class="separator:a0a4fd9ace579b46bc9d575b8adc6882f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a727d9c25d6df0aa9e795123b638b9306"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">operator+=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a727d9c25d6df0aa9e795123b638b9306"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#a727d9c25d6df0aa9e795123b638b9306">More...</a><br /></td></tr>
+<tr class="separator:a727d9c25d6df0aa9e795123b638b9306"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4a56b323aed2a3b2c843c276b68378fa"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">operator-</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a4a56b323aed2a3b2c843c276b68378fa"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#a4a56b323aed2a3b2c843c276b68378fa">More...</a><br /></td></tr>
+<tr class="separator:a4a56b323aed2a3b2c843c276b68378fa"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5b5af26da32278d19c27c0d5a4a18890"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">operator-=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a5b5af26da32278d19c27c0d5a4a18890"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#a5b5af26da32278d19c27c0d5a4a18890">More...</a><br /></td></tr>
+<tr class="separator:a5b5af26da32278d19c27c0d5a4a18890"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
-<tr class="memitem:a22ac53a60e63a743613e732586ad0c66"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> = Rank_</td></tr>
-<tr class="memdesc:a22ac53a60e63a743613e732586ad0c66"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of tensor.  <a href="#a22ac53a60e63a743613e732586ad0c66">More...</a><br /></td></tr>
-<tr class="separator:a22ac53a60e63a743613e732586ad0c66"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a429692d4ac03a3427fbd8fdfaac4ae31"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> = Rank_</td></tr>
+<tr class="memdesc:a429692d4ac03a3427fbd8fdfaac4ae31"><td class="mdescLeft">&#160;</td><td class="mdescRight">Logical rank of tensor index space.  <a href="#a429692d4ac03a3427fbd8fdfaac4ae31">More...</a><br /></td></tr>
+<tr class="separator:a429692d4ac03a3427fbd8fdfaac4ae31"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a425ff3d894ed1153eee79b1944fa5ed2"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> = StorageRank_</td></tr>
+<tr class="memdesc:a425ff3d894ed1153eee79b1944fa5ed2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of internal storage.  <a href="#a425ff3d894ed1153eee79b1944fa5ed2">More...</a><br /></td></tr>
+<tr class="separator:a425ff3d894ed1153eee79b1944fa5ed2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2088b39881deef375af08511bca1e90a"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">Rank</a> = <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a></td></tr>
+<tr class="memdesc:a2088b39881deef375af08511bca1e90a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Logical rank of tensor index space.  <a href="#a2088b39881deef375af08511bca1e90a">More...</a><br /></td></tr>
+<tr class="separator:a2088b39881deef375af08511bca1e90a"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a604921388cb7ee18ddb8127b8ca2f7fd"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a604921388cb7ee18ddb8127b8ca2f7fd">&#9670;&nbsp;</a></span>Storage</h2>
+<a id="a8281d11677512d6e229504ab4babad17"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8281d11677512d6e229504ab4babad17">&#9670;&nbsp;</a></span>ConstTensorRef</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Storage_ <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a></td>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt;<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a758f24783e36ffc393b360d0b8640bc6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a758f24783e36ffc393b360d0b8640bc6">&#9670;&nbsp;</a></span>Coord_t</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">Coord_t</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<p>Require at least rank=1. Mathematically, a rank=0 tensor would be considered to be a scalar, but degenerate cases such as these are difficult to accommodate without extensive C++ metaprogramming or support for zero-length arrays. </p>
+
+</div>
+</div>
+<a id="a2beda7a1946bde2858e730bece21b890"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2beda7a1946bde2858e730bece21b890">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Index_ <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a42ca6a39ab0e44296fed71a77c57b7b1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a42ca6a39ab0e44296fed71a77c57b7b1">&#9670;&nbsp;</a></span>LongIndex</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef LongIndex_ <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad0273300d26125278b6930b1e463ff29"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad0273300d26125278b6930b1e463ff29">&#9670;&nbsp;</a></span>MapFunc</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef MapFunc_ <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad327edfe1f8085632ff682d354922009"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad327edfe1f8085632ff682d354922009">&#9670;&nbsp;</a></span>Storage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Storage_ <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a455a2df539b53086699c210d06df1c5d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a455a2df539b53086699c210d06df1c5d">&#9670;&nbsp;</a></span>StorageCoord</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a>&gt; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a07c4b1ace7c8799537553b54cfe0a059"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a07c4b1ace7c8799537553b54cfe0a059">&#9670;&nbsp;</a></span>StrideVector</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1&gt; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<p>Stride vector in storage coordinage space - assumes least significant stride is 1 and does not store it. </p>
+
+</div>
+</div>
+<a id="a35b7e1fc59298e0f06f484652d62fd65"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a35b7e1fc59298e0f06f484652d62fd65">&#9670;&nbsp;</a></span>TensorCoord</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>&gt; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -172,21 +357,22 @@ template&lt;typename Storage_, int Rank_&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a54f6edc293b0b8ac97f02e8ab951c478"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a54f6edc293b0b8ac97f02e8ab951c478">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[1/2]</span></h2>
+<a id="a5a667a48c64fb916c31802b73b769765"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5a667a48c64fb916c31802b73b769765">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[1/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
           <td>(</td>
-          <td class="paramname"></td><td>)</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em> = <code><a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a></code></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -199,27 +385,65 @@ template&lt;typename Storage_, int Rank_&gt; </div>
 
 </div>
 </div>
-<a id="ae48325312183ff61dbd312c64f31fcb8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae48325312183ff61dbd312c64f31fcb8">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[2/2]</span></h2>
+<a id="a48b9b4ad9034f6cf2b7c2ee479aea135"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a48b9b4ad9034f6cf2b7c2ee479aea135">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[2/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> *&#160;</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td>
           <td class="paramname"><em>ptr</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt;&#160;</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td>
+          <td class="paramname"><em>ldm</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="afe4fc6fa539f36b2764707d50351905c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afe4fc6fa539f36b2764707d50351905c">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[3/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> const &amp;&#160;</td>
           <td class="paramname"><em>stride</em>&#160;</td>
         </tr>
         <tr>
@@ -237,363 +461,541 @@ template&lt;typename Storage_, int Rank_&gt; </div>
 
 </div>
 </div>
-<h2 class="groupheader">Member Function Documentation</h2>
-<a id="aab0dafb81a462320e55e0dc4a5886478"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aab0dafb81a462320e55e0dc4a5886478">&#9670;&nbsp;</a></span>advance()</h2>
+<a id="aeca439296c8446741ba84b78f5a601e0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeca439296c8446741ba84b78f5a601e0">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[4/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::advance </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>b</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a7eff42a37e4dbee488bfa726f3f0df4f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7eff42a37e4dbee488bfa726f3f0df4f">&#9670;&nbsp;</a></span>at() <span class="overload">[1/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::at </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a5702dea703104ab431c098c7b039c215"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5702dea703104ab431c098c7b039c215">&#9670;&nbsp;</a></span>at() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::at </td>
-          <td>(</td>
-          <td class="paramtype">int&#160;</td>
-          <td class="paramname"><em>idx</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a7eb4444e2b3fce5a5ccde65a75df633c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7eb4444e2b3fce5a5ccde65a75df633c">&#9670;&nbsp;</a></span>convert()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<div class="memtemplate">
-template&lt;typename T &gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;T, <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a>&gt; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::convert </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a8e23c78658f45c6f197a1774cc85c5b7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8e23c78658f45c6f197a1774cc85c5b7">&#9670;&nbsp;</a></span>data()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>* <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::data </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a0c049e523ee0fc98769ed8cd2d026780"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0c049e523ee0fc98769ed8cd2d026780">&#9670;&nbsp;</a></span>good()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::good </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a8e1c61910ffb49ec64930f66dd342b77"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8e1c61910ffb49ec64930f66dd342b77">&#9670;&nbsp;</a></span>leading_dim()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::leading_dim </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a02ee5d16ed4ce4705a99bb16b2ae1ae8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a02ee5d16ed4ce4705a99bb16b2ae1ae8">&#9670;&nbsp;</a></span>offset()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> long long <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::offset </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aa7b80d225c01c9dc12aafc515cf15842"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa7b80d225c01c9dc12aafc515cf15842">&#9670;&nbsp;</a></span>operator+()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::operator+ </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>b</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a3843ccfd1d097f25eff45dc159709938"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3843ccfd1d097f25eff45dc159709938">&#9670;&nbsp;</a></span>operator-()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::operator- </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>b</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a6a2aa88ed77557c089a165da0df1e974"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6a2aa88ed77557c089a165da0df1e974">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::operator[] </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a34e97ab2190b4681d1c1199186d66f1c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a34e97ab2190b4681d1c1199186d66f1c">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::operator[] </td>
-          <td>(</td>
-          <td class="paramtype">int&#160;</td>
-          <td class="paramname"><em>idx</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="abefe392e81da2c09cb127f963ae90674"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abefe392e81da2c09cb127f963ae90674">&#9670;&nbsp;</a></span>reset()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::reset </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> *&#160;</td>
-          <td class="paramname"><em>ptr</em> = <code><a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a></code>, </td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt;&#160;</td>
-          <td class="paramname"><em>stride</em> = <code><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a>&gt;(0)</code>&#160;</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>stride</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Constructs from a pointer and a stride vector of size kRank. If fastest changing stride is not 1, construction fails and subsequent calls to <a class="el" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8" title="Returns true if the TensorRef may be safely accessed. ">good()</a> will return false. </p>
+
+</div>
+</div>
+<a id="afe92be0a61fb8fc84426f4907faca6c1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afe92be0a61fb8fc84426f4907faca6c1">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[5/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &gt;::type, <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>, <a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a5f0363da1e0544f256438e066d3cc143"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5f0363da1e0544f256438e066d3cc143">&#9670;&nbsp;</a></span>add_pointer_offset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::add_pointer_offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td>
+          <td class="paramname"><em>delta</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4169a1344897c2c87822ee49d5e0002f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4169a1344897c2c87822ee49d5e0002f">&#9670;&nbsp;</a></span>at() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::at </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab0cf071be50423dece4e931878573a1c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab0cf071be50423dece4e931878573a1c">&#9670;&nbsp;</a></span>at() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::at </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6ab468e38773f5a971a8428673fb5e47"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6ab468e38773f5a971a8428673fb5e47">&#9670;&nbsp;</a></span>const_ref()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::const_ref </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae1c80b524cd9491e2d499d703e1459f7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae1c80b524cd9491e2d499d703e1459f7">&#9670;&nbsp;</a></span>data()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>* <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::data </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a2dbee889626b4764d30e9058ef3a7ae8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2dbee889626b4764d30e9058ef3a7ae8">&#9670;&nbsp;</a></span>good()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::good </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa60b92372db1da1d2aa997d6a03e01ca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa60b92372db1da1d2aa997d6a03e01ca">&#9670;&nbsp;</a></span>leading_dim()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::leading_dim </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>idx</em> = <code>0</code></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a07dfe328d4a8316e79e9acde50582360"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a07dfe328d4a8316e79e9acde50582360">&#9670;&nbsp;</a></span>map()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::map </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4da903ecbeaaf80c35084e8779e920a1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4da903ecbeaaf80c35084e8779e920a1">&#9670;&nbsp;</a></span>offset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0a4fd9ace579b46bc9d575b8adc6882f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0a4fd9ace579b46bc9d575b8adc6882f">&#9670;&nbsp;</a></span>operator+()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator+ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a727d9c25d6df0aa9e795123b638b9306"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a727d9c25d6df0aa9e795123b638b9306">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4a56b323aed2a3b2c843c276b68378fa"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4a56b323aed2a3b2c843c276b68378fa">&#9670;&nbsp;</a></span>operator-()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5b5af26da32278d19c27c0d5a4a18890"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5b5af26da32278d19c27c0d5a4a18890">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator-= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ada832ce3a57aaf4919b1ed89192f1fa6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ada832ce3a57aaf4919b1ed89192f1fa6">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator[] </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a207a0dabf6c368fa1edcb32baa2110e3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a207a0dabf6c368fa1edcb32baa2110e3">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator[] </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7ec815838aed4e02dd96acb1000614c0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7ec815838aed4e02dd96acb1000614c0">&#9670;&nbsp;</a></span>reset() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::reset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em> = <code><a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a></code></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7a1da27a46883eb68e3f8983670b784b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7a1da27a46883eb68e3f8983670b784b">&#9670;&nbsp;</a></span>reset() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::reset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>stride</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -610,19 +1012,19 @@ template&lt;typename Storage_, int Rank_&gt; </div>
 
 </div>
 </div>
-<a id="a89380141d25528c4c7ba6c365b96a878"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a89380141d25528c4c7ba6c365b96a878">&#9670;&nbsp;</a></span>stride() <span class="overload">[1/2]</span></h2>
+<a id="adb52dd6f9f68e7b8b67b8ddfb5c0021c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adb52dd6f9f68e7b8b67b8ddfb5c0021c">&#9670;&nbsp;</a></span>stride() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a>&gt; const&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::stride </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::stride </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td> const</td>
@@ -637,19 +1039,19 @@ template&lt;typename Storage_, int Rank_&gt; </div>
 
 </div>
 </div>
-<a id="af47f192552544272774a29d7a0829a31"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af47f192552544272774a29d7a0829a31">&#9670;&nbsp;</a></span>stride() <span class="overload">[2/2]</span></h2>
+<a id="aa6956072f1231b79fe8925a78c4760b7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa6956072f1231b79fe8925a78c4760b7">&#9670;&nbsp;</a></span>stride() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::stride </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::stride </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>dim</em></td><td>)</td>
@@ -666,19 +1068,67 @@ template&lt;typename Storage_, int Rank_&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="a22ac53a60e63a743613e732586ad0c66"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a22ac53a60e63a743613e732586ad0c66">&#9670;&nbsp;</a></span>Rank</h2>
+<a id="a429692d4ac03a3427fbd8fdfaac4ae31"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a429692d4ac03a3427fbd8fdfaac4ae31">&#9670;&nbsp;</a></span>kRank</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Storage_, int Rank_&gt; </div>
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_ &gt;::Rank = Rank_</td>
+          <td class="memname">int const <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::kRank = Rank_</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a425ff3d894ed1153eee79b1944fa5ed2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a425ff3d894ed1153eee79b1944fa5ed2">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::kStorageRank = StorageRank_</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a2088b39881deef375af08511bca1e90a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2088b39881deef375af08511bca1e90a">&#9670;&nbsp;</a></span>Rank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::Rank = <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a></td>
         </tr>
       </table>
   </td>
@@ -696,7 +1146,7 @@ template&lt;typename Storage_, int Rank_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1TensorRef.png b/docs/classcutlass_1_1TensorRef.png
new file mode 100644
index 0000000000000000000000000000000000000000..f8caaa61d05cb4460b85cc8dce3844d1f38cc22d
GIT binary patch
literal 2451
zcmb_edo+~o7N^o>+*VO2bjr{umz5A@NMF)m7=}T}=a$Aa?lco4A7OnXqb7+_#&sk{
zavKrm(;1UnVvcbcV?;F}_uMaYUh1r~*7@VC^T&DCdf#Wi&$IVl``N$!+t2$a!q!q6
zbQB~eCMFHLcEv$VY!3yH5&L%o@0-ap5x}H~uyM2yi9~=nyZDXP9Ptp4b{-~^>GB$f
z0zUVLJJ=${0Hy8G+vcbzCU)Q??25S~PJD|0DKh^;<^4}d-t-}n`n^h@cy*?XVkkM2
zQ@MEa*sbd84#htdKr2Kq#YAt##9YNhFPs7-Csq;yHy1wzQ8E{Iwx`7HvPI~{?JCRD
zmymdt<GV+~-2x2)8JV~42h|dL<mH3o$Oq+v4+mi;?AQu~B%T?rRWD%R%hu}i(+tV}
z5Bd!r1io>~SZ^be->4F`xap$N4|A0RECjyrsB`!BLQg&=(7J+LIW>JuV!d@~=jcbK
z<x8leiYmSI0BEJiIIoxoy*Jh*pf&}v-)!>yve$liEyv@n=iY~j%3qdkt_%pz1|WA2
za*ML9`XfnPO8Td;imo!g)W;gNUe%XnZcKInc1GYnANnQ8L&i7md71%mu#ij0&VfwF
z#=E$;SQ)`ohwi$Kt^)pUa+Zk?e=@sdHLgY**>y_p$WZDy3TL()v-jKJ9|5UOeL5qd
zz1`JlX=?aTCYlrFl~thu896O;9VtYlDl9x2Do=c}(7|4cL<@A6zcM57v@YzcYARNx
zJ8GhO-z7UAc>AmqftMIuHR#ieePE_^JiN399g*<8J^cN%HcC!xi4g|Q>GsHK+w2rB
zPw$a(Im@QoUAa@Biau|*>b*h#-DQ5YA*;Lj{?c{Mbbzcg1DzqHkNeR!M<EyhrO^U|
z&Qqo9JQq&0MmjqZ6fim{*Bz}|K2mL8Rm>AXjXyj#zzR(-jK)e31n+vWLY#N&I(-~Z
z+uh>G1+ZnCW9r(Y&~W}j55=(AkX~%8NmqMo@_pGVTeaIiNe;^kerQ^Ad}8w8J}s9b
zBLp8s;;!FuL7vN3$&^t-ZUd{5RMwJpL$uLwU>(`Fz$p-Z9qJ_9oc5w);hu(F>(oAE
z6V3VDME*?ZRga0NkshbPe#;cbY-7%PtVeZ;feB*juL+98voI|wKT>vyOX)_lKGi=i
zeh0NV1}4BmbfPi=Ue+2{rs6i0oZl2y(!QOyl`Mlr{A8Cb<6gZ+m0F}FMNLhoB*9;~
zy<Ycj*9cO>$ZDtR?p4!<q1R?51P@n^l_c~<FO2xX5lp8vT28E7+5^DP|6Ke3L7H8S
z&t(Db>;kR0ZsQ2dcvI81tQ{%jUn^TiNW7dp;*z)-9Eb*(o8t5|wyk2sfiNzKOKj}=
zr7E#~UJ3bG$!%CckP!t00FOL^shb0^0<iGB^vgjkP=Nn-An0VX*_Ly_u#X0YyBJ_n
zpY|{(76Y*`7cYXGFc<Gb5CKlxUk0irS03PW-hBY~-!uVETO2q5s!enNI88isNIqD)
z5CR#IR|i8zj#}9xn3`7C5KM!#yqs9%|HI*|#F!C@WkebaGi?b`P7YCK7p3I^(y{~b
zC_5xN<t&T{)+B$1UdLFGPXaPNwSu<2Anyl<Ie=RY(hSsLkHAHco$a#RQcXa|*uoV_
zmWPE(|J2cJqmT=(kuf-L_&a}VvUVb`35;*mo9KEs+B+uvF}X#Eac`khQ3SHDE>CXY
zL)8oP8&z0E((dhMRgysvr25shP;?Frk=zS2Jo7TZc$OQt>ds16&M?971|50}y4L>2
zZ2U3Uv*Lwt5jFgz>6{77(8ysbcY<s(*yIOK+QU$*l3#Fk<-E&G>e}vL$%9){7Qr)|
zB>q!j`sgF!lK+@fmT%|_x9^UuybP=$fXu(Jq*4=9+?Y)xri`F&xmnl^ue+ocsZEzI
zAtLx!P1130T4Am2DsLl<AC6-&YkU9dWOzD<*INJ~=5L318{R2JdySG!Wpo}ILd6XD
z-+lAGa_*&_-pp4ui}jG0iL~`^mCA%(D6B7iv19TXSaLeK@$m2~uckw=y2u=$FF`%a
z!Q+{qw+hBS*mS}!+=dHI)N=p)+7J-#OkA}f!pP3y+<#0>j<Mcp)l8FOoYI$3XEK(0
z)gsJhkty1nbgEC(d9A?0LR}5?U|n|02DyrUa8NHA+U4BGng*IE15;R&u=KrgMUS&F
zp^d4#9?Yv4*KKg<(6zTAza6bMfJ@fahN&_>3YYztxjlJz#o@0|+^V7YnC_XV28v)5
z^t_EXRJq7+0NIk&Ig6YpO%eNI)T{Wts%3%5En&iv9%t%{0XN(sxKcXY8pmTe*pSOM
z%e~2;59`v4`Ex9&p<BmgMI|yxd)c+Km^v?qnRu+ffLW7*9eF#v6alTwCKu!%9E_aK
zSCfGqDLobSqHaprPNqNi;w+4YKc@4VRv9;0iY7K}Is@q-9Y+Ci=T*|y|7Kkn-ep~Q
z`#u)95WabKp#9*RgfQxm30s#@R&PtzpBg}!CVSkFvCh>FZ0Xx^j#PdTc*ZiS;Ld(}
zW;e+urDM2)RwA)HPtsz6(LC8R8n7E@-8fWRhRyjbst#ow-8R?}Gkq>h7UQH(!2i8t
zEPD7RbzmLLU`HNTWtn8Jt(vZxTn%~|RJSb2e~OcJ5AY3PMSKdI;xylh2ui^f4953j
zwfirthW&77dGAxO9KqAT*o!|=rl2lsu{LyA;MOy$+%&N0wB1ZBc$F-C-RBGIsrJdj
zhy19wx)2D5&0{oK(e>LI6*U@Y>lA0L&bWS1d3~`*S!r%Sg$lMNec>xK_|Ix0fz1EL
zbtJBu?SLy_&_wAPu*UeHYa1!O8m$;xsV!Moq^1UJX)YyRWLCaI@{6lacL==-`$=Ks
zPqz0VfS4@E&+>LQ-z5IGj_@hfAZ5(x$gd`orO(wTjk!Gdxe_#QR;#p-chttk1^9y!
OgIU;KDZBi8+&=-q^tC<!

literal 0
HcmV?d00001

diff --git a/docs/classcutlass_1_1TensorRefArray_1_1ConstIterator-members.html b/docs/classcutlass_1_1TensorRefArray_1_1ConstIterator-members.html
new file mode 100644
index 000000000..44c118956
--- /dev/null
+++ b/docs/classcutlass_1_1TensorRefArray_1_1ConstIterator-members.html
@@ -0,0 +1,101 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a></li><li class="navelem"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541">ConstIterator</a>(TensorArrayRef const &amp;ref, int idx=0)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">operator</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a9fcd43018e60f12cb328859c76ec7891">operator+</a>(Index idx)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a8ce80124ab0f4ab9981f1a4d64d976a5">operator++</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a051f34d90c0680dc5f4e4e1c4d79e929">operator++</a>(int)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a22b87d281057c8e03b80db7046c54dd8">operator+=</a>(Index idx)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a143ec893406d930aa4c5aa860052197e">operator-</a>(Index idx)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a0f395558e2c589ac48179447a23b59d8">operator--</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ac9019febbc8b6bfea06ac4d23d253d57">operator--</a>(int)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ae3561f863072cd7be7dcdee2cb5cc1f0">operator-=</a>(Index idx)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">TensorRef</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1TensorRefArray_1_1ConstIterator.html b/docs/classcutlass_1_1TensorRefArray_1_1ConstIterator.html
new file mode 100644
index 000000000..aa40085cb
--- /dev/null
+++ b/docs/classcutlass_1_1TensorRefArray_1_1ConstIterator.html
@@ -0,0 +1,440 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator Class Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a></li><li class="navelem"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="classcutlass_1_1TensorRefArray_1_1ConstIterator-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator Class Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>TensorRefIterator over <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects in <a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a>.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tensor__ref__collection_8h_source.html">tensor_ref_collection.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ad19f348ecb951eae63a3ef2c47d34f4f"><td class="memItemLeft" align="right" valign="top">typedef Base&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">TensorRef</a></td></tr>
+<tr class="memdesc:ad19f348ecb951eae63a3ef2c47d34f4f"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> returned by the iterator.  <a href="#ad19f348ecb951eae63a3ef2c47d34f4f">More...</a><br /></td></tr>
+<tr class="separator:ad19f348ecb951eae63a3ef2c47d34f4f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a45331031771aeb9f71d5c1abdf42e541"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541">ConstIterator</a> (<a class="el" href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">TensorArrayRef</a> const &amp;ref, int idx=0)</td></tr>
+<tr class="memdesc:a45331031771aeb9f71d5c1abdf42e541"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html" title="TensorRefIterator over TensorRef objects in TensorRefArray. ">ConstIterator</a> over the <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects.  <a href="#a45331031771aeb9f71d5c1abdf42e541">More...</a><br /></td></tr>
+<tr class="separator:a45331031771aeb9f71d5c1abdf42e541"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa6e59a5ecb15c9842c5ee80cc168f679"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">TensorRef</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">operator</a> () const</td></tr>
+<tr class="memdesc:aa6e59a5ecb15c9842c5ee80cc168f679"><td class="mdescLeft">&#160;</td><td class="mdescRight">Obtains a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> pointed to by this iterator.  <a href="#aa6e59a5ecb15c9842c5ee80cc168f679">More...</a><br /></td></tr>
+<tr class="separator:aa6e59a5ecb15c9842c5ee80cc168f679"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8ce80124ab0f4ab9981f1a4d64d976a5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a8ce80124ab0f4ab9981f1a4d64d976a5">operator++</a> ()</td></tr>
+<tr class="memdesc:a8ce80124ab0f4ab9981f1a4d64d976a5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Advances to next <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="#a8ce80124ab0f4ab9981f1a4d64d976a5">More...</a><br /></td></tr>
+<tr class="separator:a8ce80124ab0f4ab9981f1a4d64d976a5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a051f34d90c0680dc5f4e4e1c4d79e929"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a051f34d90c0680dc5f4e4e1c4d79e929">operator++</a> (int)</td></tr>
+<tr class="memdesc:a051f34d90c0680dc5f4e4e1c4d79e929"><td class="mdescLeft">&#160;</td><td class="mdescRight">Advances to next <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="#a051f34d90c0680dc5f4e4e1c4d79e929">More...</a><br /></td></tr>
+<tr class="separator:a051f34d90c0680dc5f4e4e1c4d79e929"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9fcd43018e60f12cb328859c76ec7891"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a9fcd43018e60f12cb328859c76ec7891">operator+</a> (<a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx)</td></tr>
+<tr class="separator:a9fcd43018e60f12cb328859c76ec7891"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a22b87d281057c8e03b80db7046c54dd8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a22b87d281057c8e03b80db7046c54dd8">operator+=</a> (<a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx)</td></tr>
+<tr class="separator:a22b87d281057c8e03b80db7046c54dd8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0f395558e2c589ac48179447a23b59d8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a0f395558e2c589ac48179447a23b59d8">operator--</a> ()</td></tr>
+<tr class="separator:a0f395558e2c589ac48179447a23b59d8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac9019febbc8b6bfea06ac4d23d253d57"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ac9019febbc8b6bfea06ac4d23d253d57">operator--</a> (int)</td></tr>
+<tr class="memdesc:ac9019febbc8b6bfea06ac4d23d253d57"><td class="mdescLeft">&#160;</td><td class="mdescRight">Advances to next <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="#ac9019febbc8b6bfea06ac4d23d253d57">More...</a><br /></td></tr>
+<tr class="separator:ac9019febbc8b6bfea06ac4d23d253d57"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae3561f863072cd7be7dcdee2cb5cc1f0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ae3561f863072cd7be7dcdee2cb5cc1f0">operator-=</a> (<a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx)</td></tr>
+<tr class="separator:ae3561f863072cd7be7dcdee2cb5cc1f0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a143ec893406d930aa4c5aa860052197e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a143ec893406d930aa4c5aa860052197e">operator-</a> (<a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx)</td></tr>
+<tr class="separator:a143ec893406d930aa4c5aa860052197e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ad19f348ecb951eae63a3ef2c47d34f4f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad19f348ecb951eae63a3ef2c47d34f4f">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Base <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">ConstIterator::TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a45331031771aeb9f71d5c1abdf42e541"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a45331031771aeb9f71d5c1abdf42e541">&#9670;&nbsp;</a></span>ConstIterator()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator::ConstIterator </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">TensorArrayRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>idx</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="aa6e59a5ecb15c9842c5ee80cc168f679"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa6e59a5ecb15c9842c5ee80cc168f679">&#9670;&nbsp;</a></span>operator()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">TensorRef</a>* <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator::operator </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9fcd43018e60f12cb328859c76ec7891"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9fcd43018e60f12cb328859c76ec7891">&#9670;&nbsp;</a></span>operator+()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">ConstIterator::operator</a>+ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8ce80124ab0f4ab9981f1a4d64d976a5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8ce80124ab0f4ab9981f1a4d64d976a5">&#9670;&nbsp;</a></span>operator++() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>&amp; <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">ConstIterator::operator</a>++ </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a051f34d90c0680dc5f4e4e1c4d79e929"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a051f34d90c0680dc5f4e4e1c4d79e929">&#9670;&nbsp;</a></span>operator++() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">ConstIterator::operator</a>++ </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a22b87d281057c8e03b80db7046c54dd8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a22b87d281057c8e03b80db7046c54dd8">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>&amp; <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">ConstIterator::operator</a>+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a143ec893406d930aa4c5aa860052197e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a143ec893406d930aa4c5aa860052197e">&#9670;&nbsp;</a></span>operator-()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">ConstIterator::operator</a>- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0f395558e2c589ac48179447a23b59d8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0f395558e2c589ac48179447a23b59d8">&#9670;&nbsp;</a></span>operator--() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>&amp; <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">ConstIterator::operator</a>-- </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac9019febbc8b6bfea06ac4d23d253d57"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac9019febbc8b6bfea06ac4d23d253d57">&#9670;&nbsp;</a></span>operator--() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">ConstIterator::operator</a>-- </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae3561f863072cd7be7dcdee2cb5cc1f0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae3561f863072cd7be7dcdee2cb5cc1f0">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>&amp; <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">ConstIterator::operator</a>-= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this class was generated from the following file:<ul>
+<li><a class="el" href="tensor__ref__collection_8h_source.html">tensor_ref_collection.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator-members.html b/docs/classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator-members.html
new file mode 100644
index 000000000..bb3876187
--- /dev/null
+++ b/docs/classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator-members.html
@@ -0,0 +1,102 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a></li><li class="navelem"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed">ConstIterator</a>(TensorRefBatchStrided const &amp;ref, LongIndex offset=0)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">operator</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a1d48f4fea3fa85a7bf1b26b421387afd">operator+</a>(Index idx)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a3481d6f41defd25ab574bb19ee5fe424">operator++</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#aca860ff7f125e02f35c7dc174e84708d">operator++</a>(int)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab07a5d1a4ec6d96ec53e868b3a6d7cae">operator+=</a>(Index idx)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad1d8099e8d63b6d88c53738ec68a7589">operator-</a>(Index idx)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab92bc090d6753ff5e17676ba85a1e478">operator-</a>(ConstIterator const &amp;it)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad5290f0e7814892cb4fff55e9518562b">operator--</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a09909fbe2e4365b5f34ddb61658f27b3">operator--</a>(int)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ac4018b51e78842fb252d6917738fa571">operator-=</a>(Index idx)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">TensorRef</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html b/docs/classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html
new file mode 100644
index 000000000..c3dbd9dfc
--- /dev/null
+++ b/docs/classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html
@@ -0,0 +1,476 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator Class Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a></li><li class="navelem"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator Class Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Constant iterator over tensors implied by <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a>.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tensor__ref__collection_8h_source.html">tensor_ref_collection.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a5557f98c75b51751f834c4a7d6385efc"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">TensorRef</a></td></tr>
+<tr class="memdesc:a5557f98c75b51751f834c4a7d6385efc"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> returned by the iterator.  <a href="#a5557f98c75b51751f834c4a7d6385efc">More...</a><br /></td></tr>
+<tr class="separator:a5557f98c75b51751f834c4a7d6385efc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a28da80c1ba56e354ddb9352b54b231ed"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed">ConstIterator</a> (<a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a> const &amp;ref, <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> <a class="el" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>=0)</td></tr>
+<tr class="memdesc:a28da80c1ba56e354ddb9352b54b231ed"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html" title="Constant iterator over tensors implied by TensorRefBatchStrided. ">ConstIterator</a> from a parent <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a>.  <a href="#a28da80c1ba56e354ddb9352b54b231ed">More...</a><br /></td></tr>
+<tr class="separator:a28da80c1ba56e354ddb9352b54b231ed"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab0ea61995928c0935ec03c260463ef15"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">TensorRef</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">operator</a> () const</td></tr>
+<tr class="memdesc:ab0ea61995928c0935ec03c260463ef15"><td class="mdescLeft">&#160;</td><td class="mdescRight">Obtains a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> pointed to by the iterator.  <a href="#ab0ea61995928c0935ec03c260463ef15">More...</a><br /></td></tr>
+<tr class="separator:ab0ea61995928c0935ec03c260463ef15"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3481d6f41defd25ab574bb19ee5fe424"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a3481d6f41defd25ab574bb19ee5fe424">operator++</a> ()</td></tr>
+<tr class="memdesc:a3481d6f41defd25ab574bb19ee5fe424"><td class="mdescLeft">&#160;</td><td class="mdescRight">Advances the iterator to point to the next tensor.  <a href="#a3481d6f41defd25ab574bb19ee5fe424">More...</a><br /></td></tr>
+<tr class="separator:a3481d6f41defd25ab574bb19ee5fe424"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aca860ff7f125e02f35c7dc174e84708d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#aca860ff7f125e02f35c7dc174e84708d">operator++</a> (int)</td></tr>
+<tr class="memdesc:aca860ff7f125e02f35c7dc174e84708d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Advances the iterator to point to the next tensor.  <a href="#aca860ff7f125e02f35c7dc174e84708d">More...</a><br /></td></tr>
+<tr class="separator:aca860ff7f125e02f35c7dc174e84708d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1d48f4fea3fa85a7bf1b26b421387afd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a1d48f4fea3fa85a7bf1b26b421387afd">operator+</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx)</td></tr>
+<tr class="memdesc:a1d48f4fea3fa85a7bf1b26b421387afd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns an iterator advanced by (idx) amount.  <a href="#a1d48f4fea3fa85a7bf1b26b421387afd">More...</a><br /></td></tr>
+<tr class="separator:a1d48f4fea3fa85a7bf1b26b421387afd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab07a5d1a4ec6d96ec53e868b3a6d7cae"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab07a5d1a4ec6d96ec53e868b3a6d7cae">operator+=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx)</td></tr>
+<tr class="memdesc:ab07a5d1a4ec6d96ec53e868b3a6d7cae"><td class="mdescLeft">&#160;</td><td class="mdescRight">Advances this iterator by (idx) and returns a reference to self.  <a href="#ab07a5d1a4ec6d96ec53e868b3a6d7cae">More...</a><br /></td></tr>
+<tr class="separator:ab07a5d1a4ec6d96ec53e868b3a6d7cae"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad5290f0e7814892cb4fff55e9518562b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad5290f0e7814892cb4fff55e9518562b">operator--</a> ()</td></tr>
+<tr class="memdesc:ad5290f0e7814892cb4fff55e9518562b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Moves to the previous tensor.  <a href="#ad5290f0e7814892cb4fff55e9518562b">More...</a><br /></td></tr>
+<tr class="separator:ad5290f0e7814892cb4fff55e9518562b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a09909fbe2e4365b5f34ddb61658f27b3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a09909fbe2e4365b5f34ddb61658f27b3">operator--</a> (int)</td></tr>
+<tr class="memdesc:a09909fbe2e4365b5f34ddb61658f27b3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Moves to the previous tensor.  <a href="#a09909fbe2e4365b5f34ddb61658f27b3">More...</a><br /></td></tr>
+<tr class="separator:a09909fbe2e4365b5f34ddb61658f27b3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad1d8099e8d63b6d88c53738ec68a7589"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad1d8099e8d63b6d88c53738ec68a7589">operator-</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx)</td></tr>
+<tr class="memdesc:ad1d8099e8d63b6d88c53738ec68a7589"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns an iterator moved forward by (idx) amount.  <a href="#ad1d8099e8d63b6d88c53738ec68a7589">More...</a><br /></td></tr>
+<tr class="separator:ad1d8099e8d63b6d88c53738ec68a7589"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac4018b51e78842fb252d6917738fa571"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ac4018b51e78842fb252d6917738fa571">operator-=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx)</td></tr>
+<tr class="memdesc:ac4018b51e78842fb252d6917738fa571"><td class="mdescLeft">&#160;</td><td class="mdescRight">Moves this iterator by (idx) and returns a reference to self.  <a href="#ac4018b51e78842fb252d6917738fa571">More...</a><br /></td></tr>
+<tr class="separator:ac4018b51e78842fb252d6917738fa571"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab92bc090d6753ff5e17676ba85a1e478"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> Stride&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab92bc090d6753ff5e17676ba85a1e478">operator-</a> (<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> const &amp;it)</td></tr>
+<tr class="memdesc:ab92bc090d6753ff5e17676ba85a1e478"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the difference in offset between two iterators.  <a href="#ab92bc090d6753ff5e17676ba85a1e478">More...</a><br /></td></tr>
+<tr class="separator:ab92bc090d6753ff5e17676ba85a1e478"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a5557f98c75b51751f834c4a7d6385efc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5557f98c75b51751f834c4a7d6385efc">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">ConstIterator::TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a28da80c1ba56e354ddb9352b54b231ed"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a28da80c1ba56e354ddb9352b54b231ed">&#9670;&nbsp;</a></span>ConstIterator()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator::ConstIterator </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td>
+          <td class="paramname"><em>offset</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ab0ea61995928c0935ec03c260463ef15"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab0ea61995928c0935ec03c260463ef15">&#9670;&nbsp;</a></span>operator()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">TensorRef</a>* <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator::operator </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1d48f4fea3fa85a7bf1b26b421387afd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1d48f4fea3fa85a7bf1b26b421387afd">&#9670;&nbsp;</a></span>operator+()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">ConstIterator::operator</a>+ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3481d6f41defd25ab574bb19ee5fe424"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3481d6f41defd25ab574bb19ee5fe424">&#9670;&nbsp;</a></span>operator++() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>&amp; <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">ConstIterator::operator</a>++ </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aca860ff7f125e02f35c7dc174e84708d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aca860ff7f125e02f35c7dc174e84708d">&#9670;&nbsp;</a></span>operator++() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">ConstIterator::operator</a>++ </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab07a5d1a4ec6d96ec53e868b3a6d7cae"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab07a5d1a4ec6d96ec53e868b3a6d7cae">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>&amp; <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">ConstIterator::operator</a>+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad1d8099e8d63b6d88c53738ec68a7589"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad1d8099e8d63b6d88c53738ec68a7589">&#9670;&nbsp;</a></span>operator-() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">ConstIterator::operator</a>- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab92bc090d6753ff5e17676ba85a1e478"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab92bc090d6753ff5e17676ba85a1e478">&#9670;&nbsp;</a></span>operator-() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> Stride <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">ConstIterator::operator</a>- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> const &amp;&#160;</td>
+          <td class="paramname"><em>it</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad5290f0e7814892cb4fff55e9518562b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad5290f0e7814892cb4fff55e9518562b">&#9670;&nbsp;</a></span>operator--() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>&amp; <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">ConstIterator::operator</a>-- </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a09909fbe2e4365b5f34ddb61658f27b3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a09909fbe2e4365b5f34ddb61658f27b3">&#9670;&nbsp;</a></span>operator--() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">ConstIterator::operator</a>-- </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac4018b51e78842fb252d6917738fa571"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac4018b51e78842fb252d6917738fa571">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>&amp; <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">ConstIterator::operator</a>-= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this class was generated from the following file:<ul>
+<li><a class="el" href="tensor__ref__collection_8h_source.html">tensor_ref_collection.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4-members.html b/docs/classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4-members.html
new file mode 100644
index 000000000..8af74ab9b
--- /dev/null
+++ b/docs/classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4-members.html
@@ -0,0 +1,124 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a93ff0a9fda3e136a1674aeb82de050db">add_pointer_offset</a>(LongIndex delta)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a597bb02594c918c50f0bdb0cb4ce74c8">at</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a92371a586e756734522a853bef74324d">at</a>(LongIndex idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0a48de201c35cbc9d5e3b94fa597a617">const_ref</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">ConstTensorRef</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031">Coord_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a67b25cc51ce867b073feead7b94e6aa3">data</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98">good</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">kRank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">kStorageRank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6c580a451a36143d1eb0e409e7b13e33">leading_dim</a>(int idx=0) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a215f63b5a1b3799654c5670ef108fcfb">map</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">MapFunc</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a07c7f56e724cfbc844777e8ee9f616b5">offset</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ad054f14b5580c9480d671b8fc8ef016a">operator+</a>(TensorCoord const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0753aeb57365a976bc0a88481af504cb">operator+=</a>(TensorCoord const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#afde28cda18918d3e177d3e5024ed3dd4">operator-</a>(TensorCoord const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a11964d045ac8e41c80026515adb03008">operator-=</a>(TensorCoord const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a64a5e91e01555b8bfd22875543573d22">operator[]</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a57f132816e51bbdb4c807d57c067b619">operator[]</a>(LongIndex idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a233fba9abdbbd0fe3a2cc7465ea76a41">Rank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a1043f0ef382179b8ecd9f4e710f6e106">reset</a>(Storage *ptr=nullptr)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6339a8ac88f9172acf0337d149b98cb4">reset</a>(Storage *ptr, StorageCoord const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9">stride</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af83380ffc0e5949d40d1a5039a5ddc00">stride</a>(int dim) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa091e497277d0ba8a98c4ebf73c0cdba">TensorRef</a>(Storage *ptr=nullptr)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a3464537a35ef7fbfc9349e5ce2233f1c">TensorRef</a>(Storage *ptr, StrideVector const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeacb444d31783eafe27a9e8d8cab98f8">TensorRef</a>(Storage *ptr, StorageCoord const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af815dd66739801b10d43acc097e23636">TensorRef</a>(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html b/docs/classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html
new file mode 100644
index 000000000..2dfd10c99
--- /dev/null
+++ b/docs/classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html
@@ -0,0 +1,1092 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt; Class Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt; Class Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Specialization for rank=1 case with no internal <a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">StrideVector</a>.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tensor__ref_8h_source.html">tensor_ref.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">StrideVector</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ab5dbedeff1ae3d2936b6ce76023a18f7"><td class="memItemLeft" align="right" valign="top">typedef Storage_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a></td></tr>
+<tr class="memdesc:ab5dbedeff1ae3d2936b6ce76023a18f7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Data type of individual access.  <a href="#ab5dbedeff1ae3d2936b6ce76023a18f7">More...</a><br /></td></tr>
+<tr class="separator:ab5dbedeff1ae3d2936b6ce76023a18f7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac19ed34103d115d99e835ad9c1164a2f"><td class="memItemLeft" align="right" valign="top">typedef MapFunc_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">MapFunc</a></td></tr>
+<tr class="memdesc:ac19ed34103d115d99e835ad9c1164a2f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Mapping function from logical coordinate to internal n-D array.  <a href="#ac19ed34103d115d99e835ad9c1164a2f">More...</a><br /></td></tr>
+<tr class="separator:ac19ed34103d115d99e835ad9c1164a2f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa72857a51fafb4764ef338aea16ddfa3"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a></td></tr>
+<tr class="memdesc:aa72857a51fafb4764ef338aea16ddfa3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#aa72857a51fafb4764ef338aea16ddfa3">More...</a><br /></td></tr>
+<tr class="separator:aa72857a51fafb4764ef338aea16ddfa3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ad2f8da5e7e6b616dd05f792032699b"><td class="memItemLeft" align="right" valign="top">typedef LongIndex_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a></td></tr>
+<tr class="memdesc:a9ad2f8da5e7e6b616dd05f792032699b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Typically, strides in memory can be very large.  <a href="#a9ad2f8da5e7e6b616dd05f792032699b">More...</a><br /></td></tr>
+<tr class="separator:a9ad2f8da5e7e6b616dd05f792032699b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeca2ec193d8a07dc9073c6b199215c88"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">kRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a></td></tr>
+<tr class="memdesc:aeca2ec193d8a07dc9073c6b199215c88"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="#aeca2ec193d8a07dc9073c6b199215c88">More...</a><br /></td></tr>
+<tr class="separator:aeca2ec193d8a07dc9073c6b199215c88"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6893c1a9057713560b46a9062b29b116"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a></td></tr>
+<tr class="memdesc:a6893c1a9057713560b46a9062b29b116"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in storage n-D array.  <a href="#a6893c1a9057713560b46a9062b29b116">More...</a><br /></td></tr>
+<tr class="separator:a6893c1a9057713560b46a9062b29b116"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0c95903f2b959003534cd2d78d4b9496"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> &gt;::type const, Rank_, MapFunc_, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">kStorageRank</a>, Index_, LongIndex_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">ConstTensorRef</a></td></tr>
+<tr class="memdesc:a0c95903f2b959003534cd2d78d4b9496"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to of constant value.  <a href="#a0c95903f2b959003534cd2d78d4b9496">More...</a><br /></td></tr>
+<tr class="separator:a0c95903f2b959003534cd2d78d4b9496"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a705c22cb328c4dc9365c2f370ece2031"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031">Coord_t</a></td></tr>
+<tr class="memdesc:a705c22cb328c4dc9365c2f370ece2031"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="#a705c22cb328c4dc9365c2f370ece2031">More...</a><br /></td></tr>
+<tr class="separator:a705c22cb328c4dc9365c2f370ece2031"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:aa091e497277d0ba8a98c4ebf73c0cdba"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa091e497277d0ba8a98c4ebf73c0cdba">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>)</td></tr>
+<tr class="memdesc:aa091e497277d0ba8a98c4ebf73c0cdba"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper for 1-D memory. All higher ranks are projected onto the fastest changing rank.  <a href="#aa091e497277d0ba8a98c4ebf73c0cdba">More...</a><br /></td></tr>
+<tr class="separator:aa091e497277d0ba8a98c4ebf73c0cdba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3464537a35ef7fbfc9349e5ce2233f1c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a3464537a35ef7fbfc9349e5ce2233f1c">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *ptr, StrideVector const &amp;<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9">stride</a>)</td></tr>
+<tr class="memdesc:a3464537a35ef7fbfc9349e5ce2233f1c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from a single pointer and stride vector.  <a href="#a3464537a35ef7fbfc9349e5ce2233f1c">More...</a><br /></td></tr>
+<tr class="separator:a3464537a35ef7fbfc9349e5ce2233f1c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeacb444d31783eafe27a9e8d8cab98f8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeacb444d31783eafe27a9e8d8cab98f8">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9">stride</a>)</td></tr>
+<tr class="separator:aeacb444d31783eafe27a9e8d8cab98f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af815dd66739801b10d43acc097e23636"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af815dd66739801b10d43acc097e23636">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> &gt;::type, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">kRank</a>, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">MapFunc</a>, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">kStorageRank</a>, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a>, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> &gt; const &amp;ref)</td></tr>
+<tr class="memdesc:af815dd66739801b10d43acc097e23636"><td class="mdescLeft">&#160;</td><td class="mdescRight">Enables conversion from <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> of non-const type.  <a href="#af815dd66739801b10d43acc097e23636">More...</a><br /></td></tr>
+<tr class="separator:af815dd66739801b10d43acc097e23636"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0a48de201c35cbc9d5e3b94fa597a617"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">ConstTensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0a48de201c35cbc9d5e3b94fa597a617">const_ref</a> () const</td></tr>
+<tr class="memdesc:a0a48de201c35cbc9d5e3b94fa597a617"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to constant-valued tensor.  <a href="#a0a48de201c35cbc9d5e3b94fa597a617">More...</a><br /></td></tr>
+<tr class="separator:a0a48de201c35cbc9d5e3b94fa597a617"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1043f0ef382179b8ecd9f4e710f6e106"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a1043f0ef382179b8ecd9f4e710f6e106">reset</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>)</td></tr>
+<tr class="memdesc:a1043f0ef382179b8ecd9f4e710f6e106"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates only the pointer.  <a href="#a1043f0ef382179b8ecd9f4e710f6e106">More...</a><br /></td></tr>
+<tr class="separator:a1043f0ef382179b8ecd9f4e710f6e106"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6339a8ac88f9172acf0337d149b98cb4"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6339a8ac88f9172acf0337d149b98cb4">reset</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9">stride</a>)</td></tr>
+<tr class="memdesc:a6339a8ac88f9172acf0337d149b98cb4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates the pointer, stride, and location within a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="#a6339a8ac88f9172acf0337d149b98cb4">More...</a><br /></td></tr>
+<tr class="separator:a6339a8ac88f9172acf0337d149b98cb4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8e1cfab3a220175dad58239c764a5d98"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98">good</a> () const</td></tr>
+<tr class="memdesc:a8e1cfab3a220175dad58239c764a5d98"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if the <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> may be safely accessed.  <a href="#a8e1cfab3a220175dad58239c764a5d98">More...</a><br /></td></tr>
+<tr class="separator:a8e1cfab3a220175dad58239c764a5d98"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a67b25cc51ce867b073feead7b94e6aa3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a67b25cc51ce867b073feead7b94e6aa3">data</a> () const</td></tr>
+<tr class="memdesc:a67b25cc51ce867b073feead7b94e6aa3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the pointer to referenced data.  <a href="#a67b25cc51ce867b073feead7b94e6aa3">More...</a><br /></td></tr>
+<tr class="separator:a67b25cc51ce867b073feead7b94e6aa3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af5615a41f73259e579a122c86e08d6f9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9">stride</a> () const</td></tr>
+<tr class="memdesc:af5615a41f73259e579a122c86e08d6f9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor.  <a href="#af5615a41f73259e579a122c86e08d6f9">More...</a><br /></td></tr>
+<tr class="separator:af5615a41f73259e579a122c86e08d6f9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af83380ffc0e5949d40d1a5039a5ddc00"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af83380ffc0e5949d40d1a5039a5ddc00">stride</a> (int dim) const</td></tr>
+<tr class="memdesc:af83380ffc0e5949d40d1a5039a5ddc00"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor in the given dimension.  <a href="#af83380ffc0e5949d40d1a5039a5ddc00">More...</a><br /></td></tr>
+<tr class="separator:af83380ffc0e5949d40d1a5039a5ddc00"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6c580a451a36143d1eb0e409e7b13e33"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6c580a451a36143d1eb0e409e7b13e33">leading_dim</a> (int idx=0) const</td></tr>
+<tr class="memdesc:a6c580a451a36143d1eb0e409e7b13e33"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the maximum stride element as the 'leading dimension'.  <a href="#a6c580a451a36143d1eb0e409e7b13e33">More...</a><br /></td></tr>
+<tr class="separator:a6c580a451a36143d1eb0e409e7b13e33"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a215f63b5a1b3799654c5670ef108fcfb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a215f63b5a1b3799654c5670ef108fcfb">map</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a215f63b5a1b3799654c5670ef108fcfb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps a logical coordinate to an n-D array in memory.  <a href="#a215f63b5a1b3799654c5670ef108fcfb">More...</a><br /></td></tr>
+<tr class="separator:a215f63b5a1b3799654c5670ef108fcfb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07c7f56e724cfbc844777e8ee9f616b5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a07c7f56e724cfbc844777e8ee9f616b5">offset</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a07c7f56e724cfbc844777e8ee9f616b5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the offset of an index from the origin of the tensor.  <a href="#a07c7f56e724cfbc844777e8ee9f616b5">More...</a><br /></td></tr>
+<tr class="separator:a07c7f56e724cfbc844777e8ee9f616b5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a597bb02594c918c50f0bdb0cb4ce74c8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a597bb02594c918c50f0bdb0cb4ce74c8">at</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a597bb02594c918c50f0bdb0cb4ce74c8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="#a597bb02594c918c50f0bdb0cb4ce74c8">More...</a><br /></td></tr>
+<tr class="separator:a597bb02594c918c50f0bdb0cb4ce74c8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a92371a586e756734522a853bef74324d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a92371a586e756734522a853bef74324d">at</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> idx) const</td></tr>
+<tr class="memdesc:a92371a586e756734522a853bef74324d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given linear index.  <a href="#a92371a586e756734522a853bef74324d">More...</a><br /></td></tr>
+<tr class="separator:a92371a586e756734522a853bef74324d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64a5e91e01555b8bfd22875543573d22"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a64a5e91e01555b8bfd22875543573d22">operator[]</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a64a5e91e01555b8bfd22875543573d22"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="#a64a5e91e01555b8bfd22875543573d22">More...</a><br /></td></tr>
+<tr class="separator:a64a5e91e01555b8bfd22875543573d22"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a57f132816e51bbdb4c807d57c067b619"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a57f132816e51bbdb4c807d57c067b619">operator[]</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> idx) const</td></tr>
+<tr class="memdesc:a57f132816e51bbdb4c807d57c067b619"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given linear index.  <a href="#a57f132816e51bbdb4c807d57c067b619">More...</a><br /></td></tr>
+<tr class="separator:a57f132816e51bbdb4c807d57c067b619"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a93ff0a9fda3e136a1674aeb82de050db"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a93ff0a9fda3e136a1674aeb82de050db">add_pointer_offset</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> delta)</td></tr>
+<tr class="memdesc:a93ff0a9fda3e136a1674aeb82de050db"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds an offset to each pointer.  <a href="#a93ff0a9fda3e136a1674aeb82de050db">More...</a><br /></td></tr>
+<tr class="separator:a93ff0a9fda3e136a1674aeb82de050db"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad054f14b5580c9480d671b8fc8ef016a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ad054f14b5580c9480d671b8fc8ef016a">operator+</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:ad054f14b5580c9480d671b8fc8ef016a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#ad054f14b5580c9480d671b8fc8ef016a">More...</a><br /></td></tr>
+<tr class="separator:ad054f14b5580c9480d671b8fc8ef016a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0753aeb57365a976bc0a88481af504cb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0753aeb57365a976bc0a88481af504cb">operator+=</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a0753aeb57365a976bc0a88481af504cb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#a0753aeb57365a976bc0a88481af504cb">More...</a><br /></td></tr>
+<tr class="separator:a0753aeb57365a976bc0a88481af504cb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afde28cda18918d3e177d3e5024ed3dd4"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#afde28cda18918d3e177d3e5024ed3dd4">operator-</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:afde28cda18918d3e177d3e5024ed3dd4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#afde28cda18918d3e177d3e5024ed3dd4">More...</a><br /></td></tr>
+<tr class="separator:afde28cda18918d3e177d3e5024ed3dd4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a11964d045ac8e41c80026515adb03008"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a11964d045ac8e41c80026515adb03008">operator-=</a> (<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a11964d045ac8e41c80026515adb03008"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#a11964d045ac8e41c80026515adb03008">More...</a><br /></td></tr>
+<tr class="separator:a11964d045ac8e41c80026515adb03008"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:abff03af38d99413315824c476e9a7d78"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">kRank</a> = Rank_</td></tr>
+<tr class="memdesc:abff03af38d99413315824c476e9a7d78"><td class="mdescLeft">&#160;</td><td class="mdescRight">Logical rank of tensor index space.  <a href="#abff03af38d99413315824c476e9a7d78">More...</a><br /></td></tr>
+<tr class="separator:abff03af38d99413315824c476e9a7d78"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9bae6c2fd5ac6c97c97786c89862c298"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">kStorageRank</a> = 1</td></tr>
+<tr class="memdesc:a9bae6c2fd5ac6c97c97786c89862c298"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of internal storage.  <a href="#a9bae6c2fd5ac6c97c97786c89862c298">More...</a><br /></td></tr>
+<tr class="separator:a9bae6c2fd5ac6c97c97786c89862c298"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a233fba9abdbbd0fe3a2cc7465ea76a41"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a233fba9abdbbd0fe3a2cc7465ea76a41">Rank</a> = <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">kRank</a></td></tr>
+<tr class="memdesc:a233fba9abdbbd0fe3a2cc7465ea76a41"><td class="mdescLeft">&#160;</td><td class="mdescRight">Logical rank of tensor index space.  <a href="#a233fba9abdbbd0fe3a2cc7465ea76a41">More...</a><br /></td></tr>
+<tr class="separator:a233fba9abdbbd0fe3a2cc7465ea76a41"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a0c95903f2b959003534cd2d78d4b9496"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0c95903f2b959003534cd2d78d4b9496">&#9670;&nbsp;</a></span>ConstTensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt;<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>&gt;::type const, Rank_, MapFunc_, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">kStorageRank</a>, Index_, LongIndex_&gt; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">ConstTensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a705c22cb328c4dc9365c2f370ece2031"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a705c22cb328c4dc9365c2f370ece2031">&#9670;&nbsp;</a></span>Coord_t</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031">Coord_t</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa72857a51fafb4764ef338aea16ddfa3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa72857a51fafb4764ef338aea16ddfa3">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Index_ <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9ad2f8da5e7e6b616dd05f792032699b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9ad2f8da5e7e6b616dd05f792032699b">&#9670;&nbsp;</a></span>LongIndex</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef LongIndex_ <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac19ed34103d115d99e835ad9c1164a2f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac19ed34103d115d99e835ad9c1164a2f">&#9670;&nbsp;</a></span>MapFunc</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef MapFunc_ <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">MapFunc</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab5dbedeff1ae3d2936b6ce76023a18f7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab5dbedeff1ae3d2936b6ce76023a18f7">&#9670;&nbsp;</a></span>Storage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Storage_ <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6893c1a9057713560b46a9062b29b116"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6893c1a9057713560b46a9062b29b116">&#9670;&nbsp;</a></span>StorageCoord</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">kStorageRank</a>&gt; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aeca2ec193d8a07dc9073c6b199215c88"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeca2ec193d8a07dc9073c6b199215c88">&#9670;&nbsp;</a></span>TensorCoord</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">kRank</a>&gt; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="aa091e497277d0ba8a98c4ebf73c0cdba"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa091e497277d0ba8a98c4ebf73c0cdba">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[1/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em> = <code><a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a></code></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3464537a35ef7fbfc9349e5ce2233f1c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3464537a35ef7fbfc9349e5ce2233f1c">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[2/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">StrideVector const &amp;&#160;</td>
+          <td class="paramname"><em>stride</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aeacb444d31783eafe27a9e8d8cab98f8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeacb444d31783eafe27a9e8d8cab98f8">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[3/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>stride</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Constructs from a pointer and a stride vector of size kRank. If fastest changing stride is not 1, construction fails and subsequent calls to <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98" title="Returns true if the TensorRef may be safely accessed. ">good()</a> will return false. </p>
+
+</div>
+</div>
+<a id="af815dd66739801b10d43acc097e23636"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af815dd66739801b10d43acc097e23636">&#9670;&nbsp;</a></span>TensorRef() <span class="overload">[4/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> &gt;::type, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">kRank</a>, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">MapFunc</a>, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">kStorageRank</a>, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a>, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a93ff0a9fda3e136a1674aeb82de050db"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a93ff0a9fda3e136a1674aeb82de050db">&#9670;&nbsp;</a></span>add_pointer_offset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::add_pointer_offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a>&#160;</td>
+          <td class="paramname"><em>delta</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a597bb02594c918c50f0bdb0cb4ce74c8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a597bb02594c918c50f0bdb0cb4ce74c8">&#9670;&nbsp;</a></span>at() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::at </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a92371a586e756734522a853bef74324d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a92371a586e756734522a853bef74324d">&#9670;&nbsp;</a></span>at() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::at </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0a48de201c35cbc9d5e3b94fa597a617"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0a48de201c35cbc9d5e3b94fa597a617">&#9670;&nbsp;</a></span>const_ref()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">ConstTensorRef</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::const_ref </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a67b25cc51ce867b073feead7b94e6aa3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a67b25cc51ce867b073feead7b94e6aa3">&#9670;&nbsp;</a></span>data()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>* <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::data </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8e1cfab3a220175dad58239c764a5d98"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8e1cfab3a220175dad58239c764a5d98">&#9670;&nbsp;</a></span>good()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::good </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6c580a451a36143d1eb0e409e7b13e33"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6c580a451a36143d1eb0e409e7b13e33">&#9670;&nbsp;</a></span>leading_dim()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::leading_dim </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>idx</em> = <code>0</code></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a215f63b5a1b3799654c5670ef108fcfb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a215f63b5a1b3799654c5670ef108fcfb">&#9670;&nbsp;</a></span>map()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::map </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a07c7f56e724cfbc844777e8ee9f616b5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a07c7f56e724cfbc844777e8ee9f616b5">&#9670;&nbsp;</a></span>offset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad054f14b5580c9480d671b8fc8ef016a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad054f14b5580c9480d671b8fc8ef016a">&#9670;&nbsp;</a></span>operator+()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator+ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0753aeb57365a976bc0a88481af504cb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0753aeb57365a976bc0a88481af504cb">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="afde28cda18918d3e177d3e5024ed3dd4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afde28cda18918d3e177d3e5024ed3dd4">&#9670;&nbsp;</a></span>operator-()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a11964d045ac8e41c80026515adb03008"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a11964d045ac8e41c80026515adb03008">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator-= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a64a5e91e01555b8bfd22875543573d22"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a64a5e91e01555b8bfd22875543573d22">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator[] </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a57f132816e51bbdb4c807d57c067b619"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a57f132816e51bbdb4c807d57c067b619">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>&amp; <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator[] </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1043f0ef382179b8ecd9f4e710f6e106"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1043f0ef382179b8ecd9f4e710f6e106">&#9670;&nbsp;</a></span>reset() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::reset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em> = <code><a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a></code></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6339a8ac88f9172acf0337d149b98cb4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6339a8ac88f9172acf0337d149b98cb4">&#9670;&nbsp;</a></span>reset() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::reset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>stride</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af5615a41f73259e579a122c86e08d6f9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af5615a41f73259e579a122c86e08d6f9">&#9670;&nbsp;</a></span>stride() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::stride </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af83380ffc0e5949d40d1a5039a5ddc00"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af83380ffc0e5949d40d1a5039a5ddc00">&#9670;&nbsp;</a></span>stride() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a> <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::stride </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>dim</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="abff03af38d99413315824c476e9a7d78"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abff03af38d99413315824c476e9a7d78">&#9670;&nbsp;</a></span>kRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::kRank = Rank_</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9bae6c2fd5ac6c97c97786c89862c298"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9bae6c2fd5ac6c97c97786c89862c298">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::kStorageRank = 1</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a233fba9abdbbd0fe3a2cc7465ea76a41"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a233fba9abdbbd0fe3a2cc7465ea76a41">&#9670;&nbsp;</a></span>Rank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_ , typename Index_ , typename LongIndex_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a>&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Rank = <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">kRank</a></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this class was generated from the following file:<ul>
+<li><a class="el" href="tensor__ref_8h_source.html">tensor_ref.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1TensorView-members.html b/docs/classcutlass_1_1TensorView-members.html
index e9401f9cc..9f5c32535 100644
--- a/docs/classcutlass_1_1TensorView-members.html
+++ b/docs/classcutlass_1_1TensorView-members.html
@@ -73,51 +73,70 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::TensorView&lt; T &gt; Member List</div>  </div>
+<div class="title">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">advance</a>(Coord&lt; Rank &gt; const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#ad894a8b373c413d308cb1b7c7ba545ce">at</a>(Coord_t const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#acc55581896fae8c0449b44b56d750155">at</a>(Offset_t idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">Base</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a23564f1d333bb16343ed3a885f894285">const_ref</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">ConstTensorRef_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#aa94063d9a9c6e599d3f53e22433274be">contains</a>(Coord_t const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">convert</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8">data</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a837881bc82704491accf54aad2b9def9">good</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">leading_dim</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a064f3630e69798e7915f910c4ee99ab7">offset</a>(Coord_t const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">operator+</a>(Coord&lt; Rank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">operator-</a>(Coord&lt; Rank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#aa9e9e19f35ce3111f64b763ca49b51ef">operator=</a>(TensorView const &amp;_tensor)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a7fe7e44e15fd1ac58fb55edf72e8fb23">operator[]</a>(Coord&lt; Rank &gt; const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c">TensorRef&lt; T, 4 &gt;::operator[]</a>(int idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">Rank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a5cbff89d3d8dc71d27a4d6c1d7abb58a">ref</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a8b1785a1ea5d7aa7eba8e45297d539d3">reset</a>(TensorRef_t const &amp;_ref=TensorRef_t(0), Coord_t const &amp;_size=Coord_t())</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">TensorRef&lt; T, 4 &gt;::reset</a>(Storage *ptr=nullptr, Coord&lt; Rank &gt; stride=Coord&lt; Rank &gt;(0))</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027">size</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a6218d8555679966eab784a6bb1fa4ed1">size</a>(int dim) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a3ac125a25199fd91f73d2cfe9fc3d09b">stride</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a522630bb0df977282a9bff17e6fee843">stride</a>(int dim) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#aee43c516397d7c06eb8012711d8d7c15">subview</a>(Coord_t const &amp;location, Coord_t size) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">TensorRef</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8">TensorRef</a>(Storage *ptr, Coord&lt; Rank &gt; stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a22401348796d603546e44d6c196018dc">TensorView</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a80480aa986a488a106a9b0aea331c317">TensorView</a>(TensorRef_t const &amp;_ref, Coord_t const &amp;_size)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(LongIndex delta)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">at</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">at</a>(LongIndex idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#ad870c366ffe904d3363df1dfb0d5f04c">capacity</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a559f7210b445c77a167ab1f41c8d0827">const_ref</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57">ConstTensorRef</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165">ConstTensorRef_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719">ConstTensorView</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a3f448bcf6e664c244f472e2659215628">contains</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#ab16a0244199ca2800ea5460ed8ed6ae2">Coord_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">data</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">good</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a5a3f096a01e6a2dfe984d7e605380599">Index</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">leading_dim</a>(int idx=0) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1">Offset_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#aa2390d8e127a51df239affd2ca36e97a">operator+</a>(TensorCoord const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a4fa8fa35d00eb4d0097da492c738cddc">operator+=</a>(TensorCoord const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a1e4b2bb02c5843898f72f62787403add">operator-</a>(TensorCoord const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#abc088fad6debb6a0ceb04c5d2767e81b">operator-=</a>(TensorCoord const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#acf0c156efb9197bc7538f7e9057d8a68">operator=</a>(TensorView const &amp;_tensor)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">operator[]</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">operator[]</a>(LongIndex idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a8dbb7043546fae133547d2c3e46dddab">Rank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a7e2beb56a3bc2d58c9ec65467b78c4f3">ref</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#ae142eb93cf91e000b635d32fcacf1db3">reset</a>(Base const &amp;_ref=Base(), TensorCoord const &amp;_size=TensorCoord())</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">cutlass::TensorRef::reset</a>(Storage *ptr=nullptr)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">cutlass::TensorRef::reset</a>(Storage *ptr, StorageCoord const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a3778dc1c62a27ed811f1bb82a420096e">size</a>(int dim) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a52fb77744c7c7ecf0f8a3a725556293d">Storage</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#abaf7ec0e96bc99cf0ce243e703b8711c">StorageCoord</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">stride</a>(int dim) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a625892aa9063eebf769bb2ed0cba7684">StrideVector</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#ad4b3faa318699b786f94cf8735a11dbb">subview</a>(TensorCoord const &amp;location, TensorCoord size) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e">TensorCoord</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">cutlass::TensorRef::TensorRef</a>(Storage *ptr=nullptr)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">cutlass::TensorRef::TensorRef</a>(Storage *ptr, Index ldm)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">cutlass::TensorRef::TensorRef</a>(Storage *ptr, StrideVector const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0">cutlass::TensorRef::TensorRef</a>(Storage *ptr, StorageCoord const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">cutlass::TensorRef::TensorRef</a>(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606">TensorRef_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a36d48227f65ad482a7bded99d6a3d0c1">TensorView</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#aad06edac0f43c358c5644dffb5fe9ad7">TensorView</a>(Base const &amp;_ref, TensorCoord const &amp;_size)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#a73f049694ca1ea4825b5a651852827f5">TensorView</a>(Storage *ptr, StrideVector const &amp;stride, TensorCoord const &amp;size)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html#af64d4195fd6ba2cba53179e1ae678737">TensorView</a>(Storage *ptr, StorageCoord const &amp;stride, TensorCoord const &amp;size)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1TensorView.html b/docs/classcutlass_1_1TensorView.html
index 7dba23228..276d1077d 100644
--- a/docs/classcutlass_1_1TensorView.html
+++ b/docs/classcutlass_1_1TensorView.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::TensorView&lt; T &gt; Class Template Reference</title>
+<title>Cutlass: cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Class Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -78,242 +78,438 @@ $(function() {
 <a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="classcutlass_1_1TensorView-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::TensorView&lt; T &gt; Class Template Reference</div>  </div>
+<div class="title">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Class Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>Host-side reference implementation of tensor operations.  
+<p>Defines a view into a logical tensor.  
 </p>
 
 <p><code>#include &lt;<a class="el" href="tensor__view_8h_source.html">tensor_view.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::TensorView&lt; T &gt;:</div>
+Inheritance diagram for cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="classcutlass_1_1TensorView.png" usemap="#cutlass::TensorView_3C_20T_20_3E_map" alt=""/>
-  <map id="cutlass::TensorView_3C_20T_20_3E_map" name="cutlass::TensorView_3C_20T_20_3E_map">
-<area href="classcutlass_1_1TensorRef.html" alt="cutlass::TensorRef&lt; T, 4 &gt;" shape="rect" coords="0,0,162,24"/>
+  <img src="classcutlass_1_1TensorView.png" usemap="#cutlass::TensorView_3C_20Storage_5F_2C_20Rank_5F_2C_20MapFunc_5F_2C_20StorageRank_5F_2C_20Index_5F_2C_20LongIndex_5F_20_3E_map" alt=""/>
+  <map id="cutlass::TensorView_3C_20Storage_5F_2C_20Rank_5F_2C_20MapFunc_5F_2C_20StorageRank_5F_2C_20Index_5F_2C_20LongIndex_5F_20_3E_map" name="cutlass::TensorView_3C_20Storage_5F_2C_20Rank_5F_2C_20MapFunc_5F_2C_20StorageRank_5F_2C_20Index_5F_2C_20LongIndex_5F_20_3E_map">
+<area href="classcutlass_1_1TensorRef.html" alt="cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;" shape="rect" coords="0,0,521,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:a27f09c55f879410cceb75eb25fe542d4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; T, 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">Base</a></td></tr>
-<tr class="memdesc:a27f09c55f879410cceb75eb25fe542d4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Reference and stride.  <a href="#a27f09c55f879410cceb75eb25fe542d4">More...</a><br /></td></tr>
-<tr class="separator:a27f09c55f879410cceb75eb25fe542d4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a762fc3d887ab14f4c7bcde85f0af16ab"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">Base</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a></td></tr>
-<tr class="memdesc:a762fc3d887ab14f4c7bcde85f0af16ab"><td class="mdescLeft">&#160;</td><td class="mdescRight">Reference and stride.  <a href="#a762fc3d887ab14f4c7bcde85f0af16ab">More...</a><br /></td></tr>
-<tr class="separator:a762fc3d887ab14f4c7bcde85f0af16ab"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8ef76170bc5ba832dc01339133021830"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; T const, 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">ConstTensorRef_t</a></td></tr>
-<tr class="memdesc:a8ef76170bc5ba832dc01339133021830"><td class="mdescLeft">&#160;</td><td class="mdescRight">Reference to constant type.  <a href="#a8ef76170bc5ba832dc01339133021830">More...</a><br /></td></tr>
-<tr class="separator:a8ef76170bc5ba832dc01339133021830"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a215946fb080a5253815feb1f639c8f6f"><td class="memItemLeft" align="right" valign="top">typedef int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a></td></tr>
-<tr class="memdesc:a215946fb080a5253815feb1f639c8f6f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Type used to compute the offset of an element to the base of a tensor.  <a href="#a215946fb080a5253815feb1f639c8f6f">More...</a><br /></td></tr>
-<tr class="separator:a215946fb080a5253815feb1f639c8f6f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4037baf5069138ec3967810d2e185017"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">Rank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a></td></tr>
-<tr class="memdesc:a4037baf5069138ec3967810d2e185017"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate into tensor.  <a href="#a4037baf5069138ec3967810d2e185017">More...</a><br /></td></tr>
-<tr class="separator:a4037baf5069138ec3967810d2e185017"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_types_classcutlass_1_1TensorRef"><td colspan="2" onclick="javascript:toggleInherit('pub_types_classcutlass_1_1TensorRef')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td></tr>
-<tr class="memitem:a604921388cb7ee18ddb8127b8ca2f7fd inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef T&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a></td></tr>
-<tr class="memdesc:a604921388cb7ee18ddb8127b8ca2f7fd inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Data type of individual access.  <a href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">More...</a><br /></td></tr>
-<tr class="separator:a604921388cb7ee18ddb8127b8ca2f7fd inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2d0d8ed1c19485318e84db99b8b4e9e6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a></td></tr>
+<tr class="memdesc:a2d0d8ed1c19485318e84db99b8b4e9e6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base tensor reference.  <a href="#a2d0d8ed1c19485318e84db99b8b4e9e6">More...</a><br /></td></tr>
+<tr class="separator:a2d0d8ed1c19485318e84db99b8b4e9e6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3861f7f09da0b8153d0e3686f2c7cf57"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; Storage_ &gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57">ConstTensorRef</a></td></tr>
+<tr class="memdesc:a3861f7f09da0b8153d0e3686f2c7cf57"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to of constant value.  <a href="#a3861f7f09da0b8153d0e3686f2c7cf57">More...</a><br /></td></tr>
+<tr class="separator:a3861f7f09da0b8153d0e3686f2c7cf57"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af0237fca8d8df1cf4f17d9cb43eae507"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a></td></tr>
+<tr class="memdesc:af0237fca8d8df1cf4f17d9cb43eae507"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base tensor reference.  <a href="#af0237fca8d8df1cf4f17d9cb43eae507">More...</a><br /></td></tr>
+<tr class="separator:af0237fca8d8df1cf4f17d9cb43eae507"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a52fb77744c7c7ecf0f8a3a725556293d"><td class="memItemLeft" align="right" valign="top">typedef Base::Storage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a52fb77744c7c7ecf0f8a3a725556293d">Storage</a></td></tr>
+<tr class="memdesc:a52fb77744c7c7ecf0f8a3a725556293d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage type.  <a href="#a52fb77744c7c7ecf0f8a3a725556293d">More...</a><br /></td></tr>
+<tr class="separator:a52fb77744c7c7ecf0f8a3a725556293d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5a3f096a01e6a2dfe984d7e605380599"><td class="memItemLeft" align="right" valign="top">typedef Base::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a5a3f096a01e6a2dfe984d7e605380599">Index</a></td></tr>
+<tr class="memdesc:a5a3f096a01e6a2dfe984d7e605380599"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#a5a3f096a01e6a2dfe984d7e605380599">More...</a><br /></td></tr>
+<tr class="separator:a5a3f096a01e6a2dfe984d7e605380599"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada8a241b6b2c5439183b0d6c456c934e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorRef::TensorCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e">TensorCoord</a></td></tr>
+<tr class="memdesc:ada8a241b6b2c5439183b0d6c456c934e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="#ada8a241b6b2c5439183b0d6c456c934e">More...</a><br /></td></tr>
+<tr class="separator:ada8a241b6b2c5439183b0d6c456c934e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abaf7ec0e96bc99cf0ce243e703b8711c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">TensorRef::StorageCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#abaf7ec0e96bc99cf0ce243e703b8711c">StorageCoord</a></td></tr>
+<tr class="memdesc:abaf7ec0e96bc99cf0ce243e703b8711c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in storage n-D array.  <a href="#abaf7ec0e96bc99cf0ce243e703b8711c">More...</a><br /></td></tr>
+<tr class="separator:abaf7ec0e96bc99cf0ce243e703b8711c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a625892aa9063eebf769bb2ed0cba7684"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">TensorRef::StrideVector</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a625892aa9063eebf769bb2ed0cba7684">StrideVector</a></td></tr>
+<tr class="separator:a625892aa9063eebf769bb2ed0cba7684"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab879a7b6552c879a81c49cbc0946d719"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719">ConstTensorView</a></td></tr>
+<tr class="memdesc:ab879a7b6552c879a81c49cbc0946d719"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="classcutlass_1_1TensorView.html" title="Defines a view into a logical tensor. ">TensorView</a> of constant value.  <a href="#ab879a7b6552c879a81c49cbc0946d719">More...</a><br /></td></tr>
+<tr class="separator:ab879a7b6552c879a81c49cbc0946d719"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab16a0244199ca2800ea5460ed8ed6ae2"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#ab16a0244199ca2800ea5460ed8ed6ae2">Coord_t</a></td></tr>
+<tr class="memdesc:ab16a0244199ca2800ea5460ed8ed6ae2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="#ab16a0244199ca2800ea5460ed8ed6ae2">More...</a><br /></td></tr>
+<tr class="separator:ab16a0244199ca2800ea5460ed8ed6ae2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a408d9a8026115bdaf70a37c86dc720b1"><td class="memItemLeft" align="right" valign="top">typedef Base::LongIndex&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1">Offset_t</a></td></tr>
+<tr class="memdesc:a408d9a8026115bdaf70a37c86dc720b1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Type used to compute the offset of an element to the base of a tensor.  <a href="#a408d9a8026115bdaf70a37c86dc720b1">More...</a><br /></td></tr>
+<tr class="separator:a408d9a8026115bdaf70a37c86dc720b1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a25eb8c0fe380114ddaabb37453be4606"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606">TensorRef_t</a></td></tr>
+<tr class="memdesc:a25eb8c0fe380114ddaabb37453be4606"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base class.  <a href="#a25eb8c0fe380114ddaabb37453be4606">More...</a><br /></td></tr>
+<tr class="separator:a25eb8c0fe380114ddaabb37453be4606"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a162c4cb4f4e866892d63cd37f7f72165"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">TensorRef::ConstTensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165">ConstTensorRef_t</a></td></tr>
+<tr class="memdesc:a162c4cb4f4e866892d63cd37f7f72165"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> to const-valued type.  <a href="#a162c4cb4f4e866892d63cd37f7f72165">More...</a><br /></td></tr>
+<tr class="separator:a162c4cb4f4e866892d63cd37f7f72165"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_classcutlass_1_1TensorRef"><td colspan="2" onclick="javascript:toggleInherit('pub_types_classcutlass_1_1TensorRef')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="memitem:ad327edfe1f8085632ff682d354922009 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef Storage_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a></td></tr>
+<tr class="memdesc:ad327edfe1f8085632ff682d354922009 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Data type of individual access.  <a href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">More...</a><br /></td></tr>
+<tr class="separator:ad327edfe1f8085632ff682d354922009 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad0273300d26125278b6930b1e463ff29 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef MapFunc_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a></td></tr>
+<tr class="memdesc:ad0273300d26125278b6930b1e463ff29 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Mapping function from logical coordinate to internal n-D array.  <a href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">More...</a><br /></td></tr>
+<tr class="separator:ad0273300d26125278b6930b1e463ff29 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2beda7a1946bde2858e730bece21b890 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a></td></tr>
+<tr class="memdesc:a2beda7a1946bde2858e730bece21b890 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">More...</a><br /></td></tr>
+<tr class="separator:a2beda7a1946bde2858e730bece21b890 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a42ca6a39ab0e44296fed71a77c57b7b1 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef LongIndex_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a></td></tr>
+<tr class="memdesc:a42ca6a39ab0e44296fed71a77c57b7b1 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Typically, strides in memory can be very large.  <a href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">More...</a><br /></td></tr>
+<tr class="separator:a42ca6a39ab0e44296fed71a77c57b7b1 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a35b7e1fc59298e0f06f484652d62fd65 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a></td></tr>
+<tr class="memdesc:a35b7e1fc59298e0f06f484652d62fd65 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">More...</a><br /></td></tr>
+<tr class="separator:a35b7e1fc59298e0f06f484652d62fd65 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a455a2df539b53086699c210d06df1c5d inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a></td></tr>
+<tr class="memdesc:a455a2df539b53086699c210d06df1c5d inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in storage n-D array.  <a href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">More...</a><br /></td></tr>
+<tr class="separator:a455a2df539b53086699c210d06df1c5d inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07c4b1ace7c8799537553b54cfe0a059 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a></td></tr>
+<tr class="separator:a07c4b1ace7c8799537553b54cfe0a059 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8281d11677512d6e229504ab4babad17 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a></td></tr>
+<tr class="memdesc:a8281d11677512d6e229504ab4babad17 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to of constant value.  <a href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">More...</a><br /></td></tr>
+<tr class="separator:a8281d11677512d6e229504ab4babad17 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a758f24783e36ffc393b360d0b8640bc6 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">Coord_t</a></td></tr>
+<tr class="memdesc:a758f24783e36ffc393b360d0b8640bc6 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">More...</a><br /></td></tr>
+<tr class="separator:a758f24783e36ffc393b360d0b8640bc6 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a22401348796d603546e44d6c196018dc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a22401348796d603546e44d6c196018dc">TensorView</a> ()</td></tr>
-<tr class="memdesc:a22401348796d603546e44d6c196018dc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#a22401348796d603546e44d6c196018dc">More...</a><br /></td></tr>
-<tr class="separator:a22401348796d603546e44d6c196018dc"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a80480aa986a488a106a9b0aea331c317"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a80480aa986a488a106a9b0aea331c317">TensorView</a> (<a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a> const &amp;_ref, <a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;_size)</td></tr>
-<tr class="memdesc:a80480aa986a488a106a9b0aea331c317"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a Tensor_view from a <a class="el" href="classcutlass_1_1TensorRef.html" title="Structure modeling a pointer and stride into a tensor. ">TensorRef</a> and size.  <a href="#a80480aa986a488a106a9b0aea331c317">More...</a><br /></td></tr>
-<tr class="separator:a80480aa986a488a106a9b0aea331c317"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a837881bc82704491accf54aad2b9def9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a837881bc82704491accf54aad2b9def9">good</a> () const</td></tr>
-<tr class="memdesc:a837881bc82704491accf54aad2b9def9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if the Tensor_view is bound to some memory.  <a href="#a837881bc82704491accf54aad2b9def9">More...</a><br /></td></tr>
-<tr class="separator:a837881bc82704491accf54aad2b9def9"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a248e4240ccf96c976254464710a73fc8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8">data</a> () const</td></tr>
-<tr class="memdesc:a248e4240ccf96c976254464710a73fc8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a pointer to data.  <a href="#a248e4240ccf96c976254464710a73fc8">More...</a><br /></td></tr>
-<tr class="separator:a248e4240ccf96c976254464710a73fc8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8b1785a1ea5d7aa7eba8e45297d539d3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a8b1785a1ea5d7aa7eba8e45297d539d3">reset</a> (<a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a> const &amp;_ref=<a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a>(0), <a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;_size=<a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a>())</td></tr>
-<tr class="memdesc:a8b1785a1ea5d7aa7eba8e45297d539d3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates the reference and size of a Tensor_view object.  <a href="#a8b1785a1ea5d7aa7eba8e45297d539d3">More...</a><br /></td></tr>
-<tr class="separator:a8b1785a1ea5d7aa7eba8e45297d539d3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8650860460ea24944c803a671095be09"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a> ()</td></tr>
-<tr class="memdesc:a8650860460ea24944c803a671095be09"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the tensor reference pointing to data.  <a href="#a8650860460ea24944c803a671095be09">More...</a><br /></td></tr>
-<tr class="separator:a8650860460ea24944c803a671095be09"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a23564f1d333bb16343ed3a885f894285"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">ConstTensorRef_t</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a23564f1d333bb16343ed3a885f894285">const_ref</a> ()</td></tr>
-<tr class="separator:a23564f1d333bb16343ed3a885f894285"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5cbff89d3d8dc71d27a4d6c1d7abb58a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a5cbff89d3d8dc71d27a4d6c1d7abb58a">ref</a> () const</td></tr>
-<tr class="memdesc:a5cbff89d3d8dc71d27a4d6c1d7abb58a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the tensor reference pointing to data.  <a href="#a5cbff89d3d8dc71d27a4d6c1d7abb58a">More...</a><br /></td></tr>
-<tr class="separator:a5cbff89d3d8dc71d27a4d6c1d7abb58a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a541a7c22e7109d4059044f146fe69027"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027">size</a> () const</td></tr>
-<tr class="memdesc:a541a7c22e7109d4059044f146fe69027"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the size.  <a href="#a541a7c22e7109d4059044f146fe69027">More...</a><br /></td></tr>
-<tr class="separator:a541a7c22e7109d4059044f146fe69027"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6218d8555679966eab784a6bb1fa4ed1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a6218d8555679966eab784a6bb1fa4ed1">size</a> (int dim) const</td></tr>
-<tr class="memdesc:a6218d8555679966eab784a6bb1fa4ed1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the size.  <a href="#a6218d8555679966eab784a6bb1fa4ed1">More...</a><br /></td></tr>
-<tr class="separator:a6218d8555679966eab784a6bb1fa4ed1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3ac125a25199fd91f73d2cfe9fc3d09b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a3ac125a25199fd91f73d2cfe9fc3d09b">stride</a> () const</td></tr>
-<tr class="memdesc:a3ac125a25199fd91f73d2cfe9fc3d09b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the stride.  <a href="#a3ac125a25199fd91f73d2cfe9fc3d09b">More...</a><br /></td></tr>
-<tr class="separator:a3ac125a25199fd91f73d2cfe9fc3d09b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a522630bb0df977282a9bff17e6fee843"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a522630bb0df977282a9bff17e6fee843">stride</a> (int dim) const</td></tr>
-<tr class="memdesc:a522630bb0df977282a9bff17e6fee843"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the stride.  <a href="#a522630bb0df977282a9bff17e6fee843">More...</a><br /></td></tr>
-<tr class="separator:a522630bb0df977282a9bff17e6fee843"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa9e9e19f35ce3111f64b763ca49b51ef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#aa9e9e19f35ce3111f64b763ca49b51ef">operator=</a> (<a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> const &amp;_tensor)</td></tr>
-<tr class="memdesc:aa9e9e19f35ce3111f64b763ca49b51ef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assigns the Tensor_view.  <a href="#aa9e9e19f35ce3111f64b763ca49b51ef">More...</a><br /></td></tr>
-<tr class="separator:aa9e9e19f35ce3111f64b763ca49b51ef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a064f3630e69798e7915f910c4ee99ab7"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a064f3630e69798e7915f910c4ee99ab7">offset</a> (<a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;coord) const</td></tr>
-<tr class="memdesc:a064f3630e69798e7915f910c4ee99ab7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the index of an element.  <a href="#a064f3630e69798e7915f910c4ee99ab7">More...</a><br /></td></tr>
-<tr class="separator:a064f3630e69798e7915f910c4ee99ab7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa94063d9a9c6e599d3f53e22433274be"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#aa94063d9a9c6e599d3f53e22433274be">contains</a> (<a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;coord) const</td></tr>
-<tr class="memdesc:aa94063d9a9c6e599d3f53e22433274be"><td class="mdescLeft">&#160;</td><td class="mdescRight">Determines whether a location is within a tensor.  <a href="#aa94063d9a9c6e599d3f53e22433274be">More...</a><br /></td></tr>
-<tr class="separator:aa94063d9a9c6e599d3f53e22433274be"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad894a8b373c413d308cb1b7c7ba545ce"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#ad894a8b373c413d308cb1b7c7ba545ce">at</a> (<a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;coord) const</td></tr>
-<tr class="memdesc:ad894a8b373c413d308cb1b7c7ba545ce"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise accessor.  <a href="#ad894a8b373c413d308cb1b7c7ba545ce">More...</a><br /></td></tr>
-<tr class="separator:ad894a8b373c413d308cb1b7c7ba545ce"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7fe7e44e15fd1ac58fb55edf72e8fb23"><td class="memItemLeft" align="right" valign="top">T &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a7fe7e44e15fd1ac58fb55edf72e8fb23">operator[]</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">Rank</a> &gt; const &amp;coord) const</td></tr>
-<tr class="memdesc:a7fe7e44e15fd1ac58fb55edf72e8fb23"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise accessor.  <a href="#a7fe7e44e15fd1ac58fb55edf72e8fb23">More...</a><br /></td></tr>
-<tr class="separator:a7fe7e44e15fd1ac58fb55edf72e8fb23"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:acc55581896fae8c0449b44b56d750155"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#acc55581896fae8c0449b44b56d750155">at</a> (<a class="el" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a> idx) const</td></tr>
-<tr class="memdesc:acc55581896fae8c0449b44b56d750155"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise accessor.  <a href="#acc55581896fae8c0449b44b56d750155">More...</a><br /></td></tr>
-<tr class="separator:acc55581896fae8c0449b44b56d750155"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aee43c516397d7c06eb8012711d8d7c15"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&lt; T &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#aee43c516397d7c06eb8012711d8d7c15">subview</a> (<a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;location, <a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> <a class="el" href="classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027">size</a>) const</td></tr>
-<tr class="memdesc:aee43c516397d7c06eb8012711d8d7c15"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a Tensor_view given location and size quantities.  <a href="#aee43c516397d7c06eb8012711d8d7c15">More...</a><br /></td></tr>
-<tr class="separator:aee43c516397d7c06eb8012711d8d7c15"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_classcutlass_1_1TensorRef"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_classcutlass_1_1TensorRef')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td></tr>
-<tr class="memitem:a54f6edc293b0b8ac97f02e8ab951c478 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">TensorRef</a> ()</td></tr>
-<tr class="memdesc:a54f6edc293b0b8ac97f02e8ab951c478 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor.  <a href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">More...</a><br /></td></tr>
-<tr class="separator:a54f6edc293b0b8ac97f02e8ab951c478 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae48325312183ff61dbd312c64f31fcb8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> *ptr, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; <a class="el" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>)</td></tr>
-<tr class="memdesc:ae48325312183ff61dbd312c64f31fcb8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from a pointer, size, and stride.  <a href="classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8">More...</a><br /></td></tr>
-<tr class="separator:ae48325312183ff61dbd312c64f31fcb8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abefe392e81da2c09cb127f963ae90674 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">reset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; <a class="el" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>=<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt;(0))</td></tr>
-<tr class="memdesc:abefe392e81da2c09cb127f963ae90674 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates the pointer, stride, and location within a TensorRef.  <a href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">More...</a><br /></td></tr>
-<tr class="separator:abefe392e81da2c09cb127f963ae90674 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7eb4444e2b3fce5a5ccde65a75df633c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; T, <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">convert</a> ()</td></tr>
-<tr class="memdesc:a7eb4444e2b3fce5a5ccde65a75df633c inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Conversion function.  <a href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">More...</a><br /></td></tr>
-<tr class="separator:a7eb4444e2b3fce5a5ccde65a75df633c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0c049e523ee0fc98769ed8cd2d026780 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">good</a> () const</td></tr>
-<tr class="memdesc:a0c049e523ee0fc98769ed8cd2d026780 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if the TensorRef may be safely accessed.  <a href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">More...</a><br /></td></tr>
-<tr class="separator:a0c049e523ee0fc98769ed8cd2d026780 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8e23c78658f45c6f197a1774cc85c5b7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">data</a> () const</td></tr>
-<tr class="memdesc:a8e23c78658f45c6f197a1774cc85c5b7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the pointer to referenced data.  <a href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">More...</a><br /></td></tr>
-<tr class="separator:a8e23c78658f45c6f197a1774cc85c5b7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a89380141d25528c4c7ba6c365b96a878 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a> () const</td></tr>
-<tr class="memdesc:a89380141d25528c4c7ba6c365b96a878 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor.  <a href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">More...</a><br /></td></tr>
-<tr class="separator:a89380141d25528c4c7ba6c365b96a878 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af47f192552544272774a29d7a0829a31 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31">stride</a> (int dim) const</td></tr>
-<tr class="memdesc:af47f192552544272774a29d7a0829a31 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor in the given dimension.  <a href="classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31">More...</a><br /></td></tr>
-<tr class="separator:af47f192552544272774a29d7a0829a31 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8e1c61910ffb49ec64930f66dd342b77 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">leading_dim</a> () const</td></tr>
-<tr class="memdesc:a8e1c61910ffb49ec64930f66dd342b77 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the maximum stride element as the 'leading dimension'.  <a href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">More...</a><br /></td></tr>
-<tr class="separator:a8e1c61910ffb49ec64930f66dd342b77 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a02ee5d16ed4ce4705a99bb16b2ae1ae8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">offset</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;coord) const</td></tr>
-<tr class="memdesc:a02ee5d16ed4ce4705a99bb16b2ae1ae8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the offset of an index from the origin of the tensor.  <a href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">More...</a><br /></td></tr>
-<tr class="separator:a02ee5d16ed4ce4705a99bb16b2ae1ae8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7eff42a37e4dbee488bfa726f3f0df4f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">at</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;coord) const</td></tr>
-<tr class="memdesc:a7eff42a37e4dbee488bfa726f3f0df4f inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given Coord.  <a href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">More...</a><br /></td></tr>
-<tr class="separator:a7eff42a37e4dbee488bfa726f3f0df4f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5702dea703104ab431c098c7b039c215 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215">at</a> (int idx) const</td></tr>
-<tr class="memdesc:a5702dea703104ab431c098c7b039c215 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given Coord.  <a href="classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215">More...</a><br /></td></tr>
-<tr class="separator:a5702dea703104ab431c098c7b039c215 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6a2aa88ed77557c089a165da0df1e974 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974">operator[]</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;coord) const</td></tr>
-<tr class="memdesc:a6a2aa88ed77557c089a165da0df1e974 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise accessor.  <a href="classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974">More...</a><br /></td></tr>
-<tr class="separator:a6a2aa88ed77557c089a165da0df1e974 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a34e97ab2190b4681d1c1199186d66f1c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c">operator[]</a> (int idx) const</td></tr>
-<tr class="memdesc:a34e97ab2190b4681d1c1199186d66f1c inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise accessor.  <a href="classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c">More...</a><br /></td></tr>
-<tr class="separator:a34e97ab2190b4681d1c1199186d66f1c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aab0dafb81a462320e55e0dc4a5886478 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">advance</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;b)</td></tr>
-<tr class="memdesc:aab0dafb81a462320e55e0dc4a5886478 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds an offset to the pointer.  <a href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">More...</a><br /></td></tr>
-<tr class="separator:aab0dafb81a462320e55e0dc4a5886478 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa7b80d225c01c9dc12aafc515cf15842 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">operator+</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;b) const</td></tr>
-<tr class="memdesc:aa7b80d225c01c9dc12aafc515cf15842 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a TensorRef offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">More...</a><br /></td></tr>
-<tr class="separator:aa7b80d225c01c9dc12aafc515cf15842 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3843ccfd1d097f25eff45dc159709938 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">operator-</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> &gt; const &amp;b) const</td></tr>
-<tr class="memdesc:a3843ccfd1d097f25eff45dc159709938 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a TensorRef offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">More...</a><br /></td></tr>
-<tr class="separator:a3843ccfd1d097f25eff45dc159709938 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a36d48227f65ad482a7bded99d6a3d0c1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a36d48227f65ad482a7bded99d6a3d0c1">TensorView</a> ()</td></tr>
+<tr class="memdesc:a36d48227f65ad482a7bded99d6a3d0c1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#a36d48227f65ad482a7bded99d6a3d0c1">More...</a><br /></td></tr>
+<tr class="separator:a36d48227f65ad482a7bded99d6a3d0c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aad06edac0f43c358c5644dffb5fe9ad7"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#aad06edac0f43c358c5644dffb5fe9ad7">TensorView</a> (<a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a> const &amp;_ref, <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;_size)</td></tr>
+<tr class="memdesc:aad06edac0f43c358c5644dffb5fe9ad7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a <a class="el" href="classcutlass_1_1TensorView.html" title="Defines a view into a logical tensor. ">TensorView</a> from a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> and size.  <a href="#aad06edac0f43c358c5644dffb5fe9ad7">More...</a><br /></td></tr>
+<tr class="separator:aad06edac0f43c358c5644dffb5fe9ad7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a73f049694ca1ea4825b5a651852827f5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a73f049694ca1ea4825b5a651852827f5">TensorView</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>)</td></tr>
+<tr class="memdesc:a73f049694ca1ea4825b5a651852827f5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a <a class="el" href="classcutlass_1_1TensorView.html" title="Defines a view into a logical tensor. ">TensorView</a> from a pointer, a stride vector, and size.  <a href="#a73f049694ca1ea4825b5a651852827f5">More...</a><br /></td></tr>
+<tr class="separator:a73f049694ca1ea4825b5a651852827f5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af64d4195fd6ba2cba53179e1ae678737"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#af64d4195fd6ba2cba53179e1ae678737">TensorView</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>)</td></tr>
+<tr class="memdesc:af64d4195fd6ba2cba53179e1ae678737"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a <a class="el" href="classcutlass_1_1TensorView.html" title="Defines a view into a logical tensor. ">TensorView</a> from a pointer, a stride vector, and size.  <a href="#af64d4195fd6ba2cba53179e1ae678737">More...</a><br /></td></tr>
+<tr class="separator:af64d4195fd6ba2cba53179e1ae678737"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae142eb93cf91e000b635d32fcacf1db3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#ae142eb93cf91e000b635d32fcacf1db3">reset</a> (<a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a> const &amp;_ref=<a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a>(), <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;_size=<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a>())</td></tr>
+<tr class="memdesc:ae142eb93cf91e000b635d32fcacf1db3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates the reference and size of a Tensor_view object.  <a href="#ae142eb93cf91e000b635d32fcacf1db3">More...</a><br /></td></tr>
+<tr class="separator:ae142eb93cf91e000b635d32fcacf1db3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad116076aa4ec7dc2d4b23b62e5dfbb7a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a> () const</td></tr>
+<tr class="memdesc:ad116076aa4ec7dc2d4b23b62e5dfbb7a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the size.  <a href="#ad116076aa4ec7dc2d4b23b62e5dfbb7a">More...</a><br /></td></tr>
+<tr class="separator:ad116076aa4ec7dc2d4b23b62e5dfbb7a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3778dc1c62a27ed811f1bb82a420096e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a3778dc1c62a27ed811f1bb82a420096e">size</a> (int dim) const</td></tr>
+<tr class="memdesc:a3778dc1c62a27ed811f1bb82a420096e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the size.  <a href="#a3778dc1c62a27ed811f1bb82a420096e">More...</a><br /></td></tr>
+<tr class="separator:a3778dc1c62a27ed811f1bb82a420096e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acf0c156efb9197bc7538f7e9057d8a68"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#acf0c156efb9197bc7538f7e9057d8a68">operator=</a> (<a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> const &amp;_tensor)</td></tr>
+<tr class="memdesc:acf0c156efb9197bc7538f7e9057d8a68"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assigns the Tensor_view.  <a href="#acf0c156efb9197bc7538f7e9057d8a68">More...</a><br /></td></tr>
+<tr class="separator:acf0c156efb9197bc7538f7e9057d8a68"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3f448bcf6e664c244f472e2659215628"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a3f448bcf6e664c244f472e2659215628">contains</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a3f448bcf6e664c244f472e2659215628"><td class="mdescLeft">&#160;</td><td class="mdescRight">Determines whether a location is within a tensor.  <a href="#a3f448bcf6e664c244f472e2659215628">More...</a><br /></td></tr>
+<tr class="separator:a3f448bcf6e664c244f472e2659215628"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7e2beb56a3bc2d58c9ec65467b78c4f3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a7e2beb56a3bc2d58c9ec65467b78c4f3">ref</a> () const</td></tr>
+<tr class="memdesc:a7e2beb56a3bc2d58c9ec65467b78c4f3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> pointing to the first element of the tensor.  <a href="#a7e2beb56a3bc2d58c9ec65467b78c4f3">More...</a><br /></td></tr>
+<tr class="separator:a7e2beb56a3bc2d58c9ec65467b78c4f3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a559f7210b445c77a167ab1f41c8d0827"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a559f7210b445c77a167ab1f41c8d0827">const_ref</a> () const</td></tr>
+<tr class="memdesc:a559f7210b445c77a167ab1f41c8d0827"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> pointing to the first element of the tensor.  <a href="#a559f7210b445c77a167ab1f41c8d0827">More...</a><br /></td></tr>
+<tr class="separator:a559f7210b445c77a167ab1f41c8d0827"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad4b3faa318699b786f94cf8735a11dbb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#ad4b3faa318699b786f94cf8735a11dbb">subview</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;location, <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> <a class="el" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>) const</td></tr>
+<tr class="memdesc:ad4b3faa318699b786f94cf8735a11dbb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a Tensor_view given location and size quantities.  <a href="#ad4b3faa318699b786f94cf8735a11dbb">More...</a><br /></td></tr>
+<tr class="separator:ad4b3faa318699b786f94cf8735a11dbb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad870c366ffe904d3363df1dfb0d5f04c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> size_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#ad870c366ffe904d3363df1dfb0d5f04c">capacity</a> () const</td></tr>
+<tr class="memdesc:ad870c366ffe904d3363df1dfb0d5f04c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the number of scalar elements needed to store tensor.  <a href="#ad870c366ffe904d3363df1dfb0d5f04c">More...</a><br /></td></tr>
+<tr class="separator:ad870c366ffe904d3363df1dfb0d5f04c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa2390d8e127a51df239affd2ca36e97a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#aa2390d8e127a51df239affd2ca36e97a">operator+</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:aa2390d8e127a51df239affd2ca36e97a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorView.html" title="Defines a view into a logical tensor. ">TensorView</a> offset by a given amount.  <a href="#aa2390d8e127a51df239affd2ca36e97a">More...</a><br /></td></tr>
+<tr class="separator:aa2390d8e127a51df239affd2ca36e97a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4fa8fa35d00eb4d0097da492c738cddc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a4fa8fa35d00eb4d0097da492c738cddc">operator+=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a4fa8fa35d00eb4d0097da492c738cddc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#a4fa8fa35d00eb4d0097da492c738cddc">More...</a><br /></td></tr>
+<tr class="separator:a4fa8fa35d00eb4d0097da492c738cddc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e4b2bb02c5843898f72f62787403add"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a1e4b2bb02c5843898f72f62787403add">operator-</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a1e4b2bb02c5843898f72f62787403add"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#a1e4b2bb02c5843898f72f62787403add">More...</a><br /></td></tr>
+<tr class="separator:a1e4b2bb02c5843898f72f62787403add"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abc088fad6debb6a0ceb04c5d2767e81b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#abc088fad6debb6a0ceb04c5d2767e81b">operator-=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:abc088fad6debb6a0ceb04c5d2767e81b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="#abc088fad6debb6a0ceb04c5d2767e81b">More...</a><br /></td></tr>
+<tr class="separator:abc088fad6debb6a0ceb04c5d2767e81b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_classcutlass_1_1TensorRef"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_classcutlass_1_1TensorRef')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="memitem:a5a667a48c64fb916c31802b73b769765 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>)</td></tr>
+<tr class="memdesc:a5a667a48c64fb916c31802b73b769765 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper for 1-D memory. All higher ranks are projected onto the fastest changing rank.  <a href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">More...</a><br /></td></tr>
+<tr class="separator:a5a667a48c64fb916c31802b73b769765 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a48b9b4ad9034f6cf2b7c2ee479aea135 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> ldm)</td></tr>
+<tr class="memdesc:a48b9b4ad9034f6cf2b7c2ee479aea135 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct from a pointer and single stride element for 2-D pitch linear memory.  <a href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">More...</a><br /></td></tr>
+<tr class="separator:a48b9b4ad9034f6cf2b7c2ee479aea135 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afe4fc6fa539f36b2764707d50351905c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>)</td></tr>
+<tr class="memdesc:afe4fc6fa539f36b2764707d50351905c inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from a single pointer and stride vector.  <a href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">More...</a><br /></td></tr>
+<tr class="separator:afe4fc6fa539f36b2764707d50351905c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeca439296c8446741ba84b78f5a601e0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>)</td></tr>
+<tr class="separator:aeca439296c8446741ba84b78f5a601e0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afe92be0a61fb8fc84426f4907faca6c1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &gt;::type, <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>, <a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> &gt; const &amp;ref)</td></tr>
+<tr class="memdesc:afe92be0a61fb8fc84426f4907faca6c1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Enables conversion from <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> of non-const type.  <a href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">More...</a><br /></td></tr>
+<tr class="separator:afe92be0a61fb8fc84426f4907faca6c1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6ab468e38773f5a971a8428673fb5e47 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">const_ref</a> () const</td></tr>
+<tr class="memdesc:a6ab468e38773f5a971a8428673fb5e47 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to constant-valued tensor.  <a href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">More...</a><br /></td></tr>
+<tr class="separator:a6ab468e38773f5a971a8428673fb5e47 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ec815838aed4e02dd96acb1000614c0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>)</td></tr>
+<tr class="memdesc:a7ec815838aed4e02dd96acb1000614c0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates only the pointer.  <a href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">More...</a><br /></td></tr>
+<tr class="separator:a7ec815838aed4e02dd96acb1000614c0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7a1da27a46883eb68e3f8983670b784b inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">reset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>)</td></tr>
+<tr class="memdesc:a7a1da27a46883eb68e3f8983670b784b inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates the pointer, stride, and location within a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">More...</a><br /></td></tr>
+<tr class="separator:a7a1da27a46883eb68e3f8983670b784b inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2dbee889626b4764d30e9058ef3a7ae8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">good</a> () const</td></tr>
+<tr class="memdesc:a2dbee889626b4764d30e9058ef3a7ae8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if the <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> may be safely accessed.  <a href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">More...</a><br /></td></tr>
+<tr class="separator:a2dbee889626b4764d30e9058ef3a7ae8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae1c80b524cd9491e2d499d703e1459f7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">data</a> () const</td></tr>
+<tr class="memdesc:ae1c80b524cd9491e2d499d703e1459f7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the pointer to referenced data.  <a href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">More...</a><br /></td></tr>
+<tr class="separator:ae1c80b524cd9491e2d499d703e1459f7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adb52dd6f9f68e7b8b67b8ddfb5c0021c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a> () const</td></tr>
+<tr class="memdesc:adb52dd6f9f68e7b8b67b8ddfb5c0021c inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor.  <a href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">More...</a><br /></td></tr>
+<tr class="separator:adb52dd6f9f68e7b8b67b8ddfb5c0021c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa6956072f1231b79fe8925a78c4760b7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">stride</a> (int dim) const</td></tr>
+<tr class="memdesc:aa6956072f1231b79fe8925a78c4760b7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor in the given dimension.  <a href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">More...</a><br /></td></tr>
+<tr class="separator:aa6956072f1231b79fe8925a78c4760b7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa60b92372db1da1d2aa997d6a03e01ca inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">leading_dim</a> (int idx=0) const</td></tr>
+<tr class="memdesc:aa60b92372db1da1d2aa997d6a03e01ca inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the maximum stride element as the 'leading dimension'.  <a href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">More...</a><br /></td></tr>
+<tr class="separator:aa60b92372db1da1d2aa997d6a03e01ca inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07dfe328d4a8316e79e9acde50582360 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a07dfe328d4a8316e79e9acde50582360 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps a logical coordinate to an n-D array in memory.  <a href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">More...</a><br /></td></tr>
+<tr class="separator:a07dfe328d4a8316e79e9acde50582360 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4da903ecbeaaf80c35084e8779e920a1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a4da903ecbeaaf80c35084e8779e920a1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the offset of an index from the origin of the tensor.  <a href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">More...</a><br /></td></tr>
+<tr class="separator:a4da903ecbeaaf80c35084e8779e920a1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4169a1344897c2c87822ee49d5e0002f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">at</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a4169a1344897c2c87822ee49d5e0002f inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">More...</a><br /></td></tr>
+<tr class="separator:a4169a1344897c2c87822ee49d5e0002f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab0cf071be50423dece4e931878573a1c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">at</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> idx) const</td></tr>
+<tr class="memdesc:ab0cf071be50423dece4e931878573a1c inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given linear index.  <a href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">More...</a><br /></td></tr>
+<tr class="separator:ab0cf071be50423dece4e931878573a1c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada832ce3a57aaf4919b1ed89192f1fa6 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">operator[]</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:ada832ce3a57aaf4919b1ed89192f1fa6 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">More...</a><br /></td></tr>
+<tr class="separator:ada832ce3a57aaf4919b1ed89192f1fa6 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a207a0dabf6c368fa1edcb32baa2110e3 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">operator[]</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> idx) const</td></tr>
+<tr class="memdesc:a207a0dabf6c368fa1edcb32baa2110e3 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given linear index.  <a href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">More...</a><br /></td></tr>
+<tr class="separator:a207a0dabf6c368fa1edcb32baa2110e3 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5f0363da1e0544f256438e066d3cc143 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> delta)</td></tr>
+<tr class="memdesc:a5f0363da1e0544f256438e066d3cc143 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds an offset to each pointer.  <a href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">More...</a><br /></td></tr>
+<tr class="separator:a5f0363da1e0544f256438e066d3cc143 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0a4fd9ace579b46bc9d575b8adc6882f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">operator+</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a0a4fd9ace579b46bc9d575b8adc6882f inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">More...</a><br /></td></tr>
+<tr class="separator:a0a4fd9ace579b46bc9d575b8adc6882f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a727d9c25d6df0aa9e795123b638b9306 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">operator+=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a727d9c25d6df0aa9e795123b638b9306 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">More...</a><br /></td></tr>
+<tr class="separator:a727d9c25d6df0aa9e795123b638b9306 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4a56b323aed2a3b2c843c276b68378fa inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">operator-</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a4a56b323aed2a3b2c843c276b68378fa inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">More...</a><br /></td></tr>
+<tr class="separator:a4a56b323aed2a3b2c843c276b68378fa inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5b5af26da32278d19c27c0d5a4a18890 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">operator-=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a5b5af26da32278d19c27c0d5a4a18890 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">More...</a><br /></td></tr>
+<tr class="separator:a5b5af26da32278d19c27c0d5a4a18890 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
-<tr class="memitem:a22c39e8cf314884c5d523914cf4cac90"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">Rank</a> = TensorRef_t::Rank</td></tr>
-<tr class="memdesc:a22c39e8cf314884c5d523914cf4cac90"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of tensor.  <a href="#a22c39e8cf314884c5d523914cf4cac90">More...</a><br /></td></tr>
-<tr class="separator:a22c39e8cf314884c5d523914cf4cac90"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_static_attribs_classcutlass_1_1TensorRef"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_classcutlass_1_1TensorRef')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; T, 4 &gt;</a></td></tr>
-<tr class="memitem:a22ac53a60e63a743613e732586ad0c66 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a></td></tr>
-<tr class="memdesc:a22ac53a60e63a743613e732586ad0c66 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of tensor.  <a href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">More...</a><br /></td></tr>
-<tr class="separator:a22ac53a60e63a743613e732586ad0c66 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8dbb7043546fae133547d2c3e46dddab"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html#a8dbb7043546fae133547d2c3e46dddab">Rank</a> = Base::kRank</td></tr>
+<tr class="memdesc:a8dbb7043546fae133547d2c3e46dddab"><td class="mdescLeft">&#160;</td><td class="mdescRight">Logical rank of tensor index space.  <a href="#a8dbb7043546fae133547d2c3e46dddab">More...</a><br /></td></tr>
+<tr class="separator:a8dbb7043546fae133547d2c3e46dddab"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_classcutlass_1_1TensorRef"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_classcutlass_1_1TensorRef')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="memitem:a429692d4ac03a3427fbd8fdfaac4ae31 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> = Rank_</td></tr>
+<tr class="memdesc:a429692d4ac03a3427fbd8fdfaac4ae31 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Logical rank of tensor index space.  <a href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">More...</a><br /></td></tr>
+<tr class="separator:a429692d4ac03a3427fbd8fdfaac4ae31 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a425ff3d894ed1153eee79b1944fa5ed2 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> = StorageRank_</td></tr>
+<tr class="memdesc:a425ff3d894ed1153eee79b1944fa5ed2 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of internal storage.  <a href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">More...</a><br /></td></tr>
+<tr class="separator:a425ff3d894ed1153eee79b1944fa5ed2 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2088b39881deef375af08511bca1e90a inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">Rank</a> = <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a></td></tr>
+<tr class="memdesc:a2088b39881deef375af08511bca1e90a inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Logical rank of tensor index space.  <a href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">More...</a><br /></td></tr>
+<tr class="separator:a2088b39881deef375af08511bca1e90a inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a27f09c55f879410cceb75eb25fe542d4"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a27f09c55f879410cceb75eb25fe542d4">&#9670;&nbsp;</a></span>Base</h2>
+<a id="a2d0d8ed1c19485318e84db99b8b4e9e6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2d0d8ed1c19485318e84db99b8b4e9e6">&#9670;&nbsp;</a></span>Base</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;T, 4&gt; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">Base</a></td>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>&lt;Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a8ef76170bc5ba832dc01339133021830"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8ef76170bc5ba832dc01339133021830">&#9670;&nbsp;</a></span>ConstTensorRef_t</h2>
+<a id="a3861f7f09da0b8153d0e3686f2c7cf57"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3861f7f09da0b8153d0e3686f2c7cf57">&#9670;&nbsp;</a></span>ConstTensorRef</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;T const, 4&gt; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">ConstTensorRef_t</a></td>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt;Storage_&gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a4037baf5069138ec3967810d2e185017"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4037baf5069138ec3967810d2e185017">&#9670;&nbsp;</a></span>Coord_t</h2>
+<a id="a162c4cb4f4e866892d63cd37f7f72165"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a162c4cb4f4e866892d63cd37f7f72165">&#9670;&nbsp;</a></span>ConstTensorRef_t</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">Rank</a>&gt; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a></td>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">TensorRef::ConstTensorRef</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165">ConstTensorRef_t</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a215946fb080a5253815feb1f639c8f6f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a215946fb080a5253815feb1f639c8f6f">&#9670;&nbsp;</a></span>Offset_t</h2>
+<a id="ab879a7b6552c879a81c49cbc0946d719"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab879a7b6552c879a81c49cbc0946d719">&#9670;&nbsp;</a></span>ConstTensorView</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef int <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a></td>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt;<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719">ConstTensorView</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a762fc3d887ab14f4c7bcde85f0af16ab"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a762fc3d887ab14f4c7bcde85f0af16ab">&#9670;&nbsp;</a></span>TensorRef_t</h2>
+<a id="ab16a0244199ca2800ea5460ed8ed6ae2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab16a0244199ca2800ea5460ed8ed6ae2">&#9670;&nbsp;</a></span>Coord_t</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">Base</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a></td>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">Coord_t</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5a3f096a01e6a2dfe984d7e605380599"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5a3f096a01e6a2dfe984d7e605380599">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Base::Index <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a408d9a8026115bdaf70a37c86dc720b1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a408d9a8026115bdaf70a37c86dc720b1">&#9670;&nbsp;</a></span>Offset_t</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Base::LongIndex <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1">Offset_t</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a52fb77744c7c7ecf0f8a3a725556293d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a52fb77744c7c7ecf0f8a3a725556293d">&#9670;&nbsp;</a></span>Storage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Base::Storage <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="abaf7ec0e96bc99cf0ce243e703b8711c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abaf7ec0e96bc99cf0ce243e703b8711c">&#9670;&nbsp;</a></span>StorageCoord</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">TensorRef::StorageCoord</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a625892aa9063eebf769bb2ed0cba7684"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a625892aa9063eebf769bb2ed0cba7684">&#9670;&nbsp;</a></span>StrideVector</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">TensorRef::StrideVector</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<p>Stride vector in storage coordinate space Least significant stride is = 1 and not stored </p>
+
+</div>
+</div>
+<a id="ada8a241b6b2c5439183b0d6c456c934e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ada8a241b6b2c5439183b0d6c456c934e">&#9670;&nbsp;</a></span>TensorCoord</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorRef::TensorCoord</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af0237fca8d8df1cf4f17d9cb43eae507"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af0237fca8d8df1cf4f17d9cb43eae507">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a25eb8c0fe380114ddaabb37453be4606"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a25eb8c0fe380114ddaabb37453be4606">&#9670;&nbsp;</a></span>TensorRef_t</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606">TensorRef_t</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -321,19 +517,19 @@ template&lt;typename T&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a22401348796d603546e44d6c196018dc"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a22401348796d603546e44d6c196018dc">&#9670;&nbsp;</a></span>TensorView() <span class="overload">[1/2]</span></h2>
+<a id="a36d48227f65ad482a7bded99d6a3d0c1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a36d48227f65ad482a7bded99d6a3d0c1">&#9670;&nbsp;</a></span>TensorView() <span class="overload">[1/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -348,27 +544,27 @@ template&lt;typename T&gt; </div>
 
 </div>
 </div>
-<a id="a80480aa986a488a106a9b0aea331c317"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a80480aa986a488a106a9b0aea331c317">&#9670;&nbsp;</a></span>TensorView() <span class="overload">[2/2]</span></h2>
+<a id="aad06edac0f43c358c5644dffb5fe9ad7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aad06edac0f43c358c5644dffb5fe9ad7">&#9670;&nbsp;</a></span>TensorView() <span class="overload">[2/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a> const &amp;&#160;</td>
           <td class="paramname"><em>_ref</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
           <td class="paramname"><em>_size</em>&#160;</td>
         </tr>
         <tr>
@@ -386,332 +582,34 @@ template&lt;typename T&gt; </div>
 
 </div>
 </div>
-<h2 class="groupheader">Member Function Documentation</h2>
-<a id="ad894a8b373c413d308cb1b7c7ba545ce"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad894a8b373c413d308cb1b7c7ba545ce">&#9670;&nbsp;</a></span>at() <span class="overload">[1/2]</span></h2>
+<a id="a73f049694ca1ea4825b5a651852827f5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a73f049694ca1ea4825b5a651852827f5">&#9670;&nbsp;</a></span>TensorView() <span class="overload">[3/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::at </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="acc55581896fae8c0449b44b56d750155"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#acc55581896fae8c0449b44b56d750155">&#9670;&nbsp;</a></span>at() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::at </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a>&#160;</td>
-          <td class="paramname"><em>idx</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a23564f1d333bb16343ed3a885f894285"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a23564f1d333bb16343ed3a885f894285">&#9670;&nbsp;</a></span>const_ref()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">ConstTensorRef_t</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::const_ref </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aa94063d9a9c6e599d3f53e22433274be"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa94063d9a9c6e599d3f53e22433274be">&#9670;&nbsp;</a></span>contains()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::contains </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a248e4240ccf96c976254464710a73fc8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a248e4240ccf96c976254464710a73fc8">&#9670;&nbsp;</a></span>data()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T* <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::data </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a837881bc82704491accf54aad2b9def9"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a837881bc82704491accf54aad2b9def9">&#9670;&nbsp;</a></span>good()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::good </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a064f3630e69798e7915f910c4ee99ab7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a064f3630e69798e7915f910c4ee99ab7">&#9670;&nbsp;</a></span>offset()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::offset </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aa9e9e19f35ce3111f64b763ca49b51ef"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa9e9e19f35ce3111f64b763ca49b51ef">&#9670;&nbsp;</a></span>operator=()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::operator= </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&lt; T &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>_tensor</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a7fe7e44e15fd1ac58fb55edf72e8fb23"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7fe7e44e15fd1ac58fb55edf72e8fb23">&#9670;&nbsp;</a></span>operator[]()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">T&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::operator[] </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">Rank</a> &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a8650860460ea24944c803a671095be09"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8650860460ea24944c803a671095be09">&#9670;&nbsp;</a></span>ref() <span class="overload">[1/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a>&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::ref </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a5cbff89d3d8dc71d27a4d6c1d7abb58a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5cbff89d3d8dc71d27a4d6c1d7abb58a">&#9670;&nbsp;</a></span>ref() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a> const&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::ref </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a8b1785a1ea5d7aa7eba8e45297d539d3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8b1785a1ea5d7aa7eba8e45297d539d3">&#9670;&nbsp;</a></span>reset()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::reset </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a> const &amp;&#160;</td>
-          <td class="paramname"><em>_ref</em> = <code><a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a>(0)</code>, </td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;&#160;</td>
-          <td class="paramname"><em>_size</em> = <code><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a>()</code>&#160;</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> const &amp;&#160;</td>
+          <td class="paramname"><em>stride</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>size</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -728,19 +626,64 @@ template&lt;typename T&gt; </div>
 
 </div>
 </div>
-<a id="a541a7c22e7109d4059044f146fe69027"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a541a7c22e7109d4059044f146fe69027">&#9670;&nbsp;</a></span>size() <span class="overload">[1/2]</span></h2>
+<a id="af64d4195fd6ba2cba53179e1ae678737"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af64d4195fd6ba2cba53179e1ae678737">&#9670;&nbsp;</a></span>TensorView() <span class="overload">[4/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::size </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>stride</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>size</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ad870c366ffe904d3363df1dfb0d5f04c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad870c366ffe904d3363df1dfb0d5f04c">&#9670;&nbsp;</a></span>capacity()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> size_t <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::capacity </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td> const</td>
@@ -755,19 +698,306 @@ template&lt;typename T&gt; </div>
 
 </div>
 </div>
-<a id="a6218d8555679966eab784a6bb1fa4ed1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6218d8555679966eab784a6bb1fa4ed1">&#9670;&nbsp;</a></span>size() <span class="overload">[2/2]</span></h2>
+<a id="a559f7210b445c77a167ab1f41c8d0827"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a559f7210b445c77a167ab1f41c8d0827">&#9670;&nbsp;</a></span>const_ref()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::size </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::const_ref </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3f448bcf6e664c244f472e2659215628"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3f448bcf6e664c244f472e2659215628">&#9670;&nbsp;</a></span>contains()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::contains </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa2390d8e127a51df239affd2ca36e97a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa2390d8e127a51df239affd2ca36e97a">&#9670;&nbsp;</a></span>operator+()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator+ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4fa8fa35d00eb4d0097da492c738cddc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4fa8fa35d00eb4d0097da492c738cddc">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1e4b2bb02c5843898f72f62787403add"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1e4b2bb02c5843898f72f62787403add">&#9670;&nbsp;</a></span>operator-()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="abc088fad6debb6a0ceb04c5d2767e81b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abc088fad6debb6a0ceb04c5d2767e81b">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator-= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="acf0c156efb9197bc7538f7e9057d8a68"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acf0c156efb9197bc7538f7e9057d8a68">&#9670;&nbsp;</a></span>operator=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::operator= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>_tensor</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7e2beb56a3bc2d58c9ec65467b78c4f3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7e2beb56a3bc2d58c9ec65467b78c4f3">&#9670;&nbsp;</a></span>ref()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ref </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae142eb93cf91e000b635d32fcacf1db3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae142eb93cf91e000b635d32fcacf1db3">&#9670;&nbsp;</a></span>reset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::reset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_ref</em> = <code><a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a>()</code>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_size</em> = <code><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a>()</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad116076aa4ec7dc2d4b23b62e5dfbb7a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad116076aa4ec7dc2d4b23b62e5dfbb7a">&#9670;&nbsp;</a></span>size() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::size </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3778dc1c62a27ed811f1bb82a420096e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3778dc1c62a27ed811f1bb82a420096e">&#9670;&nbsp;</a></span>size() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::size </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>dim</em></td><td>)</td>
@@ -783,82 +1013,27 @@ template&lt;typename T&gt; </div>
 
 </div>
 </div>
-<a id="a3ac125a25199fd91f73d2cfe9fc3d09b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3ac125a25199fd91f73d2cfe9fc3d09b">&#9670;&nbsp;</a></span>stride() <span class="overload">[1/2]</span></h2>
+<a id="ad4b3faa318699b786f94cf8735a11dbb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad4b3faa318699b786f94cf8735a11dbb">&#9670;&nbsp;</a></span>subview()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::stride </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::subview </td>
           <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a522630bb0df977282a9bff17e6fee843"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a522630bb0df977282a9bff17e6fee843">&#9670;&nbsp;</a></span>stride() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const&amp; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::stride </td>
-          <td>(</td>
-          <td class="paramtype">int&#160;</td>
-          <td class="paramname"><em>dim</em></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aee43c516397d7c06eb8012711d8d7c15"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aee43c516397d7c06eb8012711d8d7c15">&#9670;&nbsp;</a></span>subview()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename T&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorView.html">TensorView</a>&lt;T&gt; <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::subview </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;&#160;</td>
           <td class="paramname"><em>location</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a>&#160;</td>
           <td class="paramname"><em>size</em>&#160;</td>
         </tr>
         <tr>
@@ -877,19 +1052,19 @@ template&lt;typename T&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="a22c39e8cf314884c5d523914cf4cac90"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a22c39e8cf314884c5d523914cf4cac90">&#9670;&nbsp;</a></span>Rank</h2>
+<a id="a8dbb7043546fae133547d2c3e46dddab"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8dbb7043546fae133547d2c3e46dddab">&#9670;&nbsp;</a></span>Rank</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename T&gt; </div>
+template&lt;typename Storage_ , int Rank_ = 4, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; T &gt;::Rank = TensorRef_t::Rank</td>
+          <td class="memname">int const <a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::Rank = Base::kRank</td>
         </tr>
       </table>
   </td>
@@ -907,7 +1082,7 @@ template&lt;typename T&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1TensorView.png b/docs/classcutlass_1_1TensorView.png
index 40500e8a3a854639f0a6a25982cb66d99a343817..46861ac917aafe499ecdf03bd95fbfbe0af5725f 100644
GIT binary patch
literal 1605
zcmZXUdpOg39LIkfvSm(}=_0wDHFlgFa%ZC=x1og`w_N5DvXsiC6B2u5<Tg2kNt(!s
zxrFI9mveGPH8i)e&>WU5EBEWp^gQQzs`GuG@Av!uT)v;b-mfp&31=(6b>CJ10OYZD
zRxSVlhDx*(L`rhfN_G!RuDwo<uGV6)SRzI9g8Qw+Oo{rko12?GYNFjFAtcfTcM^~^
zZLZ!9S3Llb;b5&ST%$ok>e#vIpJAjU8ZIN^tQpgS?Pq0cyM$8<p+365I=nnIkht90
z5Pm9Ps6p7)qJf2CS3+rUq-GW_lV*jspzM4vjkR|)xoeh$oOfDK#Xh#anc|SnW|NVu
zdpgBz*AN{)R7OqJ0%q!Cz{GR9?s_sjc=3vK{ojoHaT~wGS4wkea_J@Bgt|wcQn>0w
z3U^5!7n-h<!Bo8_9IRvV4inS1VLn%%G$`scG~K9IRV8q%Y!Z<eGh$Ac&Ml%P><CN6
zfd@qn)|5nHsSfx~H)ej>c;0d>3;d=FY7?gZZ0$|(E6+uRc0;0`DB8Anr;od`_e3fZ
zgP6Y!!EQCF?U7pySwv-yzewO35{<6wexMAOo9@>t3`%ihnzSgE94}N9yk$8F`aHOo
z-hbvtPy0X{4Pvr_Zp4yfJJeZiCO;<m&G8z<XX*)4=vDVSSV~)|W3CdWeY~s)b2m6l
zgx)V3rL-Hnr|<%=5k1jY!=)vyUu~f%IMV|$&gIJw;rDyB|M;*nOGFLp-DZ{HLZ34q
z$*e9hss-Q?-$G!v$!;ry?l3vlBxJT>^o68d^_^2I``LasCe8hu=V&PJxB2+gA~@RL
z2esF~0cdO@_B&7%?|Ekg@K2L*5bC?Qc7*1reNAyyyFZ;vg1;nd<OO6$;FgB$(~GH-
zg3`*$LHF7PK&-||5)3t_W^<Cx_y*?;)>q2k7IAFxS^<pD+QV{aqsXuWohe*vqQ-TU
zZTW~|Yz5@@HWg)ktPAOK0&?95HbX+1|7Efe;(=_cX<gxW6Cx?oOFSGTH;M_<pQI*J
zi#-Q*D{^Q%`l2UGLX7B+l*ksH8R#({Wp3ZwqiZ(xl*kNsWAQpY5vh)R|I7|$=YpWB
zVabsRNcA2l<<=qGKts60*`bD5BjB)#9{`QtW{U=?we-7tfz+~afZdv*r59+FzbVb0
zN*Gv*puqu&L*uO^ZJXJzLQvj!iLXLwyv_d~{8x`x{AM8cgk~wyUh|(e3y>WUW6%Qy
z$dTZq2r7_ihXRmACS&aJv|}9`QW2@<?}|Pk&G?{+Zug#$in?5S_N1r#sxtAi?xm6b
zJl_kgTI-U@N@fTRnACRXesD1CVk{&dCM&>O3n}R0G;ufdmEhXM#@hN4;Y9wrFg51k
zC;#?O89~$~%z2cy*COP}+PGl=fO+kW`DNYG6ZNMkd%A|BEK?o0IUpCCTZ@a<D)3>v
zP@v)!+^RZ{g!k>gz&`8!MsGTq3im1^kk>BOJzEA3_@6KD?V*o7c!%Jrx2VcQ1X>95
z(FLr$xaKsc21W#h<-s#;>8(6Im;dyVC2Y3QKS<X$bjF@hIwptzf(6LzCOm*4Ox`#O
z?06H_&mk@_gDYl8ILc(+&8HX?M_S(Z2EXv0QJ3HpE@tMj2Ess|5Sq<VqwRrh-^9Y}
zJ1m-9=BfCD`?v|Qm%InMps%jXzn>y5fu)E0)ffCuMgX#W(&5FabQy?<klQ<NTEzT;
zeYG|I!3bRYgk!Ze8_IhzlM|IaVQt2$eBvAbEgN8IZ_VADd6Q{sK}3RSw{-TC^pM@J
zjq!eQkGlF^P4hhtPOFl*vWY!)%Bx#;s;nk9Yo8xd0^flKvTQvXlgB!qh-Re?^*=U!
z5Hd=loT;pF){d!=4q`b(9U`Fv6g8)`tC`*^!U1Mq-~f#KTvpn;M=B?ejFKYGEOs8c
z_ZuQAA^3E=Gg~UzgHKH@8hok;I=3cgez#0%R93X*opFT>qg}2*e1I->6g(QfX{@h&
kb_n-V=`AbG(io!+sToy*IYd+=FZuHUtToQ6$`YUOFIczx`2YX_

delta 645
zcmX@gvx!x)Gr-TCmrII^fq{Y7)59eQNG}5701jp#xwb6MdZMCLJ(HuSi(^Oy<J-9x
z`yMOsxbm9^{r^9Cd$59pQ^xjt>~60G%{^_8$>hx0QzUbI<8}*`%yia8DwU!glb&4V
zO{(JcoTd5H-ZLue%d6#Q7M)3|YpoFWo@BLm&aCI9=Q3vI?N)rooBG#g|GZB!)o+`w
zTkefkJgpct$MYV$^GwB)eZut{KWx4I#C`LutH!r1mP@r;91eRg*c;q_W1^Y!$r($`
ztd3k<n|SNe6wB*TXZ)|f+~Kyy`wojfhgqT5rO@T~S6Q$6&au-aXR==Bmbn*p_Eyw7
zhDFLq)yzA(?egu-JM_LVeVn{GgJ<*Rj9uo**Zgcw2fxk`x*@xD<Knk=e)gVeXS(Z^
zPxi^~)62iNQCeZ&Z>~T0^0%nGUF0xDWj#~iq&-zia>omEbQ|hdvmdy3Oa9}>8}kb5
zkElO<*R!9&&`RpSdIy#dS^|uFxLg?4GYKA8jhp+=`^c1_ThS^Fb45EC;#id$!oPR;
z|8Ck>Zzg@f>t?d-Yu_FDg6FR?idhLVPTTeMrNC#qO|O2hcyl)H_tn#L?&;otW#<3)
z#@dJL1y3I-oBb!_TG>xSl?{spBKH)(7rXf8rp?za%1PoIB-6gW5^&$nw(-{Qts257
zws$-gxi7kF&Zpf+wu;8BT(@t1p=a2AdwJzsOWPdQ-fF(B8=VxrY2N4jO%Vse(hFl>
zWIOv@eEt95C!JaE&d%7%&0Vs3vFCzX?ii~okNq3te}CURo$o*$l5by?D=eFG>Dn*m
Y*ZfM>QKdJefGLZ?)78&qol`;+0NEli^Z)<=

diff --git a/docs/classcutlass_1_1ZipTileIterator-members.html b/docs/classcutlass_1_1ZipTileIterator-members.html
new file mode 100644
index 000000000..6de74a494
--- /dev/null
+++ b/docs/classcutlass_1_1ZipTileIterator-members.html
@@ -0,0 +1,125 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::ZipTileIterator&lt; First_, Second_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a0752af296e110d9104a45ae24bd0a104">add_pointer_offset</a>(Index offset)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6">decrement</a>(int count=1)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a></td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808">increment</a>(int count=1)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">Index</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a8f334010614b50d962e4769904d7b76f">initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ab0f93878bbe5aac072450f9bf1dd8b64">initialize_predicates</a>(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a23b72b086f350dfe07cff22ac010c45c">load</a>(Fragment &amp;fragment) const</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a9a3f2f913ee73f0c04e74ec89c6c5cbb">load</a>(Fragment &amp;fragment, Coord&lt; 4 &gt; const &amp;offset) const</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a4c9997488be2f09b9653d8ef8ac06c2b">load</a>(Fragment &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a95b8db4af9228beed273669b3b0b12fe">load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a3020bcd0a49efad674ca5539ea1c96c0">load_post_increment</a>(Fragment &amp;fragment, Coord&lt; 4 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a53045f40d203a805af9c92fa0b5bc684">load_post_increment</a>(Fragment &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a47d270fc4a119d7b95b2d5dd3ee5b87b">operator++</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a60ba516d7382cb7788d5430023f7fc44">operator+=</a>(int count)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a200a4e88ee6d23dcc80e974c77f8fa1f">operator+=</a>(Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a3d22dab34b2abd0d05c00668f8591151">operator--</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a7bae0f9b789e75bb154c5f37db50e14c">operator-=</a>(int count)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a></td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a884983cd1df81739fc971b46697b851c">store</a>(Fragment const &amp;fragment) const</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a425b4a4f2e66f3ff5960742d19d06bc2">store</a>(Fragment const &amp;fragment, Coord&lt; 4 &gt; const &amp;offset) const</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#aa617653e75535fe13aafa80bc4cc9cc4">store</a>(Fragment const &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a961a340f902542f3000dc80e852958f2">store_post_increment</a>(Fragment const &amp;fragment)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a18ed76e6be1a02d0229cdf1d6528e34f">store_post_increment</a>(Fragment const &amp;fragment, Coord&lt; 4 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a3a2cae47533c1122eb8ec404473a0d9e">store_post_increment</a>(Fragment const &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">TensorRef</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a09eab0c5218fc122848b623462c18149">ZipTileIterator</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a45a8ba275f8d4f71deb102ad46712b3e">ZipTileIterator</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a31553842afd1cfd5a18a2fd6c39e17b5">ZipTileIterator</a>(First const &amp;_first, Second const &amp;_second)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a808e06560609aa5b7bb693ec79a3aa57">ZipTileIterator</a>(TensorRef const &amp;ref)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a9d70b24bf38122c0fea49558c6f6b344">ZipTileIterator</a>(Params const &amp;_params, TensorRef const &amp;ref)</td><td class="entry"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1ZipTileIterator.html b/docs/classcutlass_1_1ZipTileIterator.html
new file mode 100644
index 000000000..7cf7a392b
--- /dev/null
+++ b/docs/classcutlass_1_1ZipTileIterator.html
@@ -0,0 +1,1290 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::ZipTileIterator&lt; First_, Second_ &gt; Class Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="classcutlass_1_1ZipTileIterator-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::ZipTileIterator&lt; First_, Second_ &gt; Class Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Constructs an iterator from a pair of iterators.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="zip__tile__iterator_8h_source.html">zip_tile_iterator.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html" title="Params object. ">Params</a> object.  <a href="structcutlass_1_1ZipTileIterator_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a0c3046a077ef69a9325d7df817865bf7"><td class="memItemLeft" align="right" valign="top">typedef First_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a></td></tr>
+<tr class="memdesc:a0c3046a077ef69a9325d7df817865bf7"><td class="mdescLeft">&#160;</td><td class="mdescRight">First iterator type.  <a href="#a0c3046a077ef69a9325d7df817865bf7">More...</a><br /></td></tr>
+<tr class="separator:a0c3046a077ef69a9325d7df817865bf7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae34d88ee2878174707dcfdda4f3fa76c"><td class="memItemLeft" align="right" valign="top">typedef Second_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a></td></tr>
+<tr class="memdesc:ae34d88ee2878174707dcfdda4f3fa76c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second iterator type.  <a href="#ae34d88ee2878174707dcfdda4f3fa76c">More...</a><br /></td></tr>
+<tr class="separator:ae34d88ee2878174707dcfdda4f3fa76c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae239840776fe7c3bd679b798188d9d06"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt; typename First::Fragment, typename Second::Fragment &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a></td></tr>
+<tr class="memdesc:ae239840776fe7c3bd679b798188d9d06"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> type.  <a href="#ae239840776fe7c3bd679b798188d9d06">More...</a><br /></td></tr>
+<tr class="separator:ae239840776fe7c3bd679b798188d9d06"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa853fa2a2e73397d8950567f3f5b7a15"><td class="memItemLeft" align="right" valign="top">typedef First::PredicateVector&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15">PredicateVector</a></td></tr>
+<tr class="memdesc:aa853fa2a2e73397d8950567f3f5b7a15"><td class="mdescLeft">&#160;</td><td class="mdescRight">Predicate vector.  <a href="#aa853fa2a2e73397d8950567f3f5b7a15">More...</a><br /></td></tr>
+<tr class="separator:aa853fa2a2e73397d8950567f3f5b7a15"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab48ad3cf2ffeec356d8592d94f6b81f0"><td class="memItemLeft" align="right" valign="top">typedef First::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">Index</a></td></tr>
+<tr class="memdesc:ab48ad3cf2ffeec356d8592d94f6b81f0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#ab48ad3cf2ffeec356d8592d94f6b81f0">More...</a><br /></td></tr>
+<tr class="separator:ab48ad3cf2ffeec356d8592d94f6b81f0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1dea96f5cf56aade14bd815aee91d09c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt; typename First::TensorRef, typename Second::TensorRef &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">TensorRef</a></td></tr>
+<tr class="memdesc:a1dea96f5cf56aade14bd815aee91d09c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference.  <a href="#a1dea96f5cf56aade14bd815aee91d09c">More...</a><br /></td></tr>
+<tr class="separator:a1dea96f5cf56aade14bd815aee91d09c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a09eab0c5218fc122848b623462c18149"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a09eab0c5218fc122848b623462c18149">ZipTileIterator</a> ()</td></tr>
+<tr class="memdesc:a09eab0c5218fc122848b623462c18149"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#a09eab0c5218fc122848b623462c18149">More...</a><br /></td></tr>
+<tr class="separator:a09eab0c5218fc122848b623462c18149"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a45a8ba275f8d4f71deb102ad46712b3e"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a45a8ba275f8d4f71deb102ad46712b3e">ZipTileIterator</a> (<a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;threadblock_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:a45a8ba275f8d4f71deb102ad46712b3e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a zip iterator from params.  <a href="#a45a8ba275f8d4f71deb102ad46712b3e">More...</a><br /></td></tr>
+<tr class="separator:a45a8ba275f8d4f71deb102ad46712b3e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a31553842afd1cfd5a18a2fd6c39e17b5"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a31553842afd1cfd5a18a2fd6c39e17b5">ZipTileIterator</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a> const &amp;_first, <a class="el" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a> const &amp;_second)</td></tr>
+<tr class="memdesc:a31553842afd1cfd5a18a2fd6c39e17b5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a zip iterator from iterator instances.  <a href="#a31553842afd1cfd5a18a2fd6c39e17b5">More...</a><br /></td></tr>
+<tr class="separator:a31553842afd1cfd5a18a2fd6c39e17b5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a808e06560609aa5b7bb693ec79a3aa57"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a808e06560609aa5b7bb693ec79a3aa57">ZipTileIterator</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">TensorRef</a> const &amp;ref)</td></tr>
+<tr class="memdesc:a808e06560609aa5b7bb693ec79a3aa57"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a zip iterator from iterator instances.  <a href="#a808e06560609aa5b7bb693ec79a3aa57">More...</a><br /></td></tr>
+<tr class="separator:a808e06560609aa5b7bb693ec79a3aa57"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9d70b24bf38122c0fea49558c6f6b344"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a9d70b24bf38122c0fea49558c6f6b344">ZipTileIterator</a> (<a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">TensorRef</a> const &amp;ref)</td></tr>
+<tr class="memdesc:a9d70b24bf38122c0fea49558c6f6b344"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a zip iterator from iterator instances.  <a href="#a9d70b24bf38122c0fea49558c6f6b344">More...</a><br /></td></tr>
+<tr class="separator:a9d70b24bf38122c0fea49558c6f6b344"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f334010614b50d962e4769904d7b76f"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:a8f334010614b50d962e4769904d7b76f"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a8f334010614b50d962e4769904d7b76f">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:a8f334010614b50d962e4769904d7b76f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using a <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html" title="Functor computing a predicate given the logical position of an access. ">RegularTilePredicateFunctor</a>.  <a href="#a8f334010614b50d962e4769904d7b76f">More...</a><br /></td></tr>
+<tr class="separator:a8f334010614b50d962e4769904d7b76f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab0f93878bbe5aac072450f9bf1dd8b64"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </td></tr>
+<tr class="memitem:ab0f93878bbe5aac072450f9bf1dd8b64"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ab0f93878bbe5aac072450f9bf1dd8b64">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;functor, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset)</td></tr>
+<tr class="memdesc:ab0f93878bbe5aac072450f9bf1dd8b64"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using an arbitrary predicate functor.  <a href="#ab0f93878bbe5aac072450f9bf1dd8b64">More...</a><br /></td></tr>
+<tr class="separator:ab0f93878bbe5aac072450f9bf1dd8b64"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a95b8db4af9228beed273669b3b0b12fe"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a95b8db4af9228beed273669b3b0b12fe"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a95b8db4af9228beed273669b3b0b12fe">load_post_increment</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;fragment)</td></tr>
+<tr class="memdesc:a95b8db4af9228beed273669b3b0b12fe"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and increments without predicates.  <a href="#a95b8db4af9228beed273669b3b0b12fe">More...</a><br /></td></tr>
+<tr class="separator:a95b8db4af9228beed273669b3b0b12fe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3020bcd0a49efad674ca5539ea1c96c0"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a3020bcd0a49efad674ca5539ea1c96c0"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a3020bcd0a49efad674ca5539ea1c96c0">load_post_increment</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;fragment, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a3020bcd0a49efad674ca5539ea1c96c0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and increments without predicates.  <a href="#a3020bcd0a49efad674ca5539ea1c96c0">More...</a><br /></td></tr>
+<tr class="separator:a3020bcd0a49efad674ca5539ea1c96c0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a23b72b086f350dfe07cff22ac010c45c"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a23b72b086f350dfe07cff22ac010c45c"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a23b72b086f350dfe07cff22ac010c45c">load</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;fragment) const</td></tr>
+<tr class="memdesc:a23b72b086f350dfe07cff22ac010c45c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without predicates.  <a href="#a23b72b086f350dfe07cff22ac010c45c">More...</a><br /></td></tr>
+<tr class="separator:a23b72b086f350dfe07cff22ac010c45c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9a3f2f913ee73f0c04e74ec89c6c5cbb"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a9a3f2f913ee73f0c04e74ec89c6c5cbb"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a9a3f2f913ee73f0c04e74ec89c6c5cbb">load</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;fragment, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;offset) const</td></tr>
+<tr class="memdesc:a9a3f2f913ee73f0c04e74ec89c6c5cbb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without predicates.  <a href="#a9a3f2f913ee73f0c04e74ec89c6c5cbb">More...</a><br /></td></tr>
+<tr class="separator:a9a3f2f913ee73f0c04e74ec89c6c5cbb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a961a340f902542f3000dc80e852958f2"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a961a340f902542f3000dc80e852958f2"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a961a340f902542f3000dc80e852958f2">store_post_increment</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;fragment)</td></tr>
+<tr class="memdesc:a961a340f902542f3000dc80e852958f2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and increments without predicates.  <a href="#a961a340f902542f3000dc80e852958f2">More...</a><br /></td></tr>
+<tr class="separator:a961a340f902542f3000dc80e852958f2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a18ed76e6be1a02d0229cdf1d6528e34f"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a18ed76e6be1a02d0229cdf1d6528e34f"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a18ed76e6be1a02d0229cdf1d6528e34f">store_post_increment</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;fragment, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a18ed76e6be1a02d0229cdf1d6528e34f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and increments without predicates.  <a href="#a18ed76e6be1a02d0229cdf1d6528e34f">More...</a><br /></td></tr>
+<tr class="separator:a18ed76e6be1a02d0229cdf1d6528e34f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a884983cd1df81739fc971b46697b851c"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a884983cd1df81739fc971b46697b851c"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a884983cd1df81739fc971b46697b851c">store</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;fragment) const</td></tr>
+<tr class="memdesc:a884983cd1df81739fc971b46697b851c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment without predicates.  <a href="#a884983cd1df81739fc971b46697b851c">More...</a><br /></td></tr>
+<tr class="separator:a884983cd1df81739fc971b46697b851c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a425b4a4f2e66f3ff5960742d19d06bc2"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a425b4a4f2e66f3ff5960742d19d06bc2"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a425b4a4f2e66f3ff5960742d19d06bc2">store</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;fragment, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;offset) const</td></tr>
+<tr class="memdesc:a425b4a4f2e66f3ff5960742d19d06bc2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment without predicates.  <a href="#a425b4a4f2e66f3ff5960742d19d06bc2">More...</a><br /></td></tr>
+<tr class="separator:a425b4a4f2e66f3ff5960742d19d06bc2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a53045f40d203a805af9c92fa0b5bc684"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:a53045f40d203a805af9c92fa0b5bc684"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a53045f40d203a805af9c92fa0b5bc684">load_post_increment</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;fragment, PredicateIterator pred_it)</td></tr>
+<tr class="memdesc:a53045f40d203a805af9c92fa0b5bc684"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and increments, using predicates.  <a href="#a53045f40d203a805af9c92fa0b5bc684">More...</a><br /></td></tr>
+<tr class="separator:a53045f40d203a805af9c92fa0b5bc684"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4c9997488be2f09b9653d8ef8ac06c2b"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:a4c9997488be2f09b9653d8ef8ac06c2b"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a4c9997488be2f09b9653d8ef8ac06c2b">load</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;fragment, PredicateIterator pred_it) const</td></tr>
+<tr class="memdesc:a4c9997488be2f09b9653d8ef8ac06c2b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment with predicates.  <a href="#a4c9997488be2f09b9653d8ef8ac06c2b">More...</a><br /></td></tr>
+<tr class="separator:a4c9997488be2f09b9653d8ef8ac06c2b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3a2cae47533c1122eb8ec404473a0d9e"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:a3a2cae47533c1122eb8ec404473a0d9e"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a3a2cae47533c1122eb8ec404473a0d9e">store_post_increment</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;fragment, PredicateIterator pred_it)</td></tr>
+<tr class="memdesc:a3a2cae47533c1122eb8ec404473a0d9e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and increments, using predicates.  <a href="#a3a2cae47533c1122eb8ec404473a0d9e">More...</a><br /></td></tr>
+<tr class="separator:a3a2cae47533c1122eb8ec404473a0d9e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa617653e75535fe13aafa80bc4cc9cc4"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:aa617653e75535fe13aafa80bc4cc9cc4"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#aa617653e75535fe13aafa80bc4cc9cc4">store</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;fragment, PredicateIterator pred_it) const</td></tr>
+<tr class="memdesc:aa617653e75535fe13aafa80bc4cc9cc4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment with predicates.  <a href="#aa617653e75535fe13aafa80bc4cc9cc4">More...</a><br /></td></tr>
+<tr class="separator:aa617653e75535fe13aafa80bc4cc9cc4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a738f23c02f4a7437981d9e3e22470808"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808">increment</a> (int count=1)</td></tr>
+<tr class="memdesc:a738f23c02f4a7437981d9e3e22470808"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increments store iterator to next tile.  <a href="#a738f23c02f4a7437981d9e3e22470808">More...</a><br /></td></tr>
+<tr class="separator:a738f23c02f4a7437981d9e3e22470808"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a47d270fc4a119d7b95b2d5dd3ee5b87b"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a47d270fc4a119d7b95b2d5dd3ee5b87b">operator++</a> ()</td></tr>
+<tr class="memdesc:a47d270fc4a119d7b95b2d5dd3ee5b87b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increments to next tile.  <a href="#a47d270fc4a119d7b95b2d5dd3ee5b87b">More...</a><br /></td></tr>
+<tr class="separator:a47d270fc4a119d7b95b2d5dd3ee5b87b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60ba516d7382cb7788d5430023f7fc44"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a60ba516d7382cb7788d5430023f7fc44">operator+=</a> (int count)</td></tr>
+<tr class="separator:a60ba516d7382cb7788d5430023f7fc44"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a200a4e88ee6d23dcc80e974c77f8fa1f"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a200a4e88ee6d23dcc80e974c77f8fa1f">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a200a4e88ee6d23dcc80e974c77f8fa1f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a vector offset to the underlying iterators.  <a href="#a200a4e88ee6d23dcc80e974c77f8fa1f">More...</a><br /></td></tr>
+<tr class="separator:a200a4e88ee6d23dcc80e974c77f8fa1f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6f2f86a1d23ccbaed285550a1d1f92e6"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6">decrement</a> (int count=1)</td></tr>
+<tr class="memdesc:a6f2f86a1d23ccbaed285550a1d1f92e6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increments store iterator to previous tile.  <a href="#a6f2f86a1d23ccbaed285550a1d1f92e6">More...</a><br /></td></tr>
+<tr class="separator:a6f2f86a1d23ccbaed285550a1d1f92e6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3d22dab34b2abd0d05c00668f8591151"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a3d22dab34b2abd0d05c00668f8591151">operator--</a> ()</td></tr>
+<tr class="memdesc:a3d22dab34b2abd0d05c00668f8591151"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increments to subsequent tile.  <a href="#a3d22dab34b2abd0d05c00668f8591151">More...</a><br /></td></tr>
+<tr class="separator:a3d22dab34b2abd0d05c00668f8591151"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7bae0f9b789e75bb154c5f37db50e14c"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a7bae0f9b789e75bb154c5f37db50e14c">operator-=</a> (int count)</td></tr>
+<tr class="memdesc:a7bae0f9b789e75bb154c5f37db50e14c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Decrements to previous tile.  <a href="#a7bae0f9b789e75bb154c5f37db50e14c">More...</a><br /></td></tr>
+<tr class="separator:a7bae0f9b789e75bb154c5f37db50e14c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0752af296e110d9104a45ae24bd0a104"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a0752af296e110d9104a45ae24bd0a104">add_pointer_offset</a> (<a class="el" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">Index</a> offset)</td></tr>
+<tr class="memdesc:a0752af296e110d9104a45ae24bd0a104"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds an offset to both iterators.  <a href="#a0752af296e110d9104a45ae24bd0a104">More...</a><br /></td></tr>
+<tr class="separator:a0752af296e110d9104a45ae24bd0a104"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:af961a2621c6b42f2b3ba645afcb250a9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a></td></tr>
+<tr class="memdesc:af961a2621c6b42f2b3ba645afcb250a9"><td class="mdescLeft">&#160;</td><td class="mdescRight">First iterator.  <a href="#af961a2621c6b42f2b3ba645afcb250a9">More...</a><br /></td></tr>
+<tr class="separator:af961a2621c6b42f2b3ba645afcb250a9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab88ce07b3012ae2e6a92ad784c8067f0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a></td></tr>
+<tr class="memdesc:ab88ce07b3012ae2e6a92ad784c8067f0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second iterator.  <a href="#ab88ce07b3012ae2e6a92ad784c8067f0">More...</a><br /></td></tr>
+<tr class="separator:ab88ce07b3012ae2e6a92ad784c8067f0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a0c3046a077ef69a9325d7df817865bf7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0c3046a077ef69a9325d7df817865bf7">&#9670;&nbsp;</a></span>First</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef First_ <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae239840776fe7c3bd679b798188d9d06"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae239840776fe7c3bd679b798188d9d06">&#9670;&nbsp;</a></span>Fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt;typename First::Fragment, typename Second::Fragment&gt; <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab48ad3cf2ffeec356d8592d94f6b81f0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab48ad3cf2ffeec356d8592d94f6b81f0">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef First::Index <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa853fa2a2e73397d8950567f3f5b7a15"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa853fa2a2e73397d8950567f3f5b7a15">&#9670;&nbsp;</a></span>PredicateVector</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef First::PredicateVector <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15">PredicateVector</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae34d88ee2878174707dcfdda4f3fa76c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae34d88ee2878174707dcfdda4f3fa76c">&#9670;&nbsp;</a></span>Second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Second_ <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1dea96f5cf56aade14bd815aee91d09c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1dea96f5cf56aade14bd815aee91d09c">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt; typename First::TensorRef, typename Second::TensorRef&gt; <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a09eab0c5218fc122848b623462c18149"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a09eab0c5218fc122848b623462c18149">&#9670;&nbsp;</a></span>ZipTileIterator() <span class="overload">[1/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a45a8ba275f8d4f71deb102ad46712b3e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a45a8ba275f8d4f71deb102ad46712b3e">&#9670;&nbsp;</a></span>ZipTileIterator() <span class="overload">[2/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>threadblock_offset</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;0,&#160;0)</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a31553842afd1cfd5a18a2fd6c39e17b5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a31553842afd1cfd5a18a2fd6c39e17b5">&#9670;&nbsp;</a></span>ZipTileIterator() <span class="overload">[3/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_first</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_second</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a808e06560609aa5b7bb693ec79a3aa57"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a808e06560609aa5b7bb693ec79a3aa57">&#9670;&nbsp;</a></span>ZipTileIterator() <span class="overload">[4/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9d70b24bf38122c0fea49558c6f6b344"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9d70b24bf38122c0fea49558c6f6b344">&#9670;&nbsp;</a></span>ZipTileIterator() <span class="overload">[5/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::<a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a0752af296e110d9104a45ae24bd0a104"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0752af296e110d9104a45ae24bd0a104">&#9670;&nbsp;</a></span>add_pointer_offset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::add_pointer_offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">Index</a>&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6f2f86a1d23ccbaed285550a1d1f92e6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6f2f86a1d23ccbaed285550a1d1f92e6">&#9670;&nbsp;</a></span>decrement()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a>&amp; <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::decrement </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>count</em> = <code>1</code></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a738f23c02f4a7437981d9e3e22470808"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a738f23c02f4a7437981d9e3e22470808">&#9670;&nbsp;</a></span>increment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a>&amp; <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::increment </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>count</em> = <code>1</code></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8f334010614b50d962e4769904d7b76f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8f334010614b50d962e4769904d7b76f">&#9670;&nbsp;</a></span>initialize_predicates() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename PredicateIterator &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::initialize_predicates </td>
+          <td>(</td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>predicate_it</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>bounds</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>block_offset</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;0,&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;&#160;0)</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab0f93878bbe5aac072450f9bf1dd8b64"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab0f93878bbe5aac072450f9bf1dd8b64">&#9670;&nbsp;</a></span>initialize_predicates() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::initialize_predicates </td>
+          <td>(</td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>predicate_it</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">PredicateFunctor const &amp;&#160;</td>
+          <td class="paramname"><em>functor</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>block_offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a23b72b086f350dfe07cff22ac010c45c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a23b72b086f350dfe07cff22ac010c45c">&#9670;&nbsp;</a></span>load() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9a3f2f913ee73f0c04e74ec89c6c5cbb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9a3f2f913ee73f0c04e74ec89c6c5cbb">&#9670;&nbsp;</a></span>load() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4c9997488be2f09b9653d8ef8ac06c2b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4c9997488be2f09b9653d8ef8ac06c2b">&#9670;&nbsp;</a></span>load() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment , typename PredicateIterator &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>pred_it</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a95b8db4af9228beed273669b3b0b12fe"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a95b8db4af9228beed273669b3b0b12fe">&#9670;&nbsp;</a></span>load_post_increment() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::load_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3020bcd0a49efad674ca5539ea1c96c0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3020bcd0a49efad674ca5539ea1c96c0">&#9670;&nbsp;</a></span>load_post_increment() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::load_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a53045f40d203a805af9c92fa0b5bc684"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a53045f40d203a805af9c92fa0b5bc684">&#9670;&nbsp;</a></span>load_post_increment() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment , typename PredicateIterator &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::load_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>pred_it</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a47d270fc4a119d7b95b2d5dd3ee5b87b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a47d270fc4a119d7b95b2d5dd3ee5b87b">&#9670;&nbsp;</a></span>operator++()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a>&amp; <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::operator++ </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a60ba516d7382cb7788d5430023f7fc44"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a60ba516d7382cb7788d5430023f7fc44">&#9670;&nbsp;</a></span>operator+=() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a>&amp; <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>count</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a200a4e88ee6d23dcc80e974c77f8fa1f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a200a4e88ee6d23dcc80e974c77f8fa1f">&#9670;&nbsp;</a></span>operator+=() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a>&amp; <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3d22dab34b2abd0d05c00668f8591151"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3d22dab34b2abd0d05c00668f8591151">&#9670;&nbsp;</a></span>operator--()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a>&amp; <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::operator-- </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7bae0f9b789e75bb154c5f37db50e14c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7bae0f9b789e75bb154c5f37db50e14c">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a>&amp; <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::operator-= </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>count</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a884983cd1df81739fc971b46697b851c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a884983cd1df81739fc971b46697b851c">&#9670;&nbsp;</a></span>store() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a425b4a4f2e66f3ff5960742d19d06bc2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a425b4a4f2e66f3ff5960742d19d06bc2">&#9670;&nbsp;</a></span>store() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa617653e75535fe13aafa80bc4cc9cc4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa617653e75535fe13aafa80bc4cc9cc4">&#9670;&nbsp;</a></span>store() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment , typename PredicateIterator &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>pred_it</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a961a340f902542f3000dc80e852958f2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a961a340f902542f3000dc80e852958f2">&#9670;&nbsp;</a></span>store_post_increment() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::store_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a18ed76e6be1a02d0229cdf1d6528e34f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a18ed76e6be1a02d0229cdf1d6528e34f">&#9670;&nbsp;</a></span>store_post_increment() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::store_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3a2cae47533c1122eb8ec404473a0d9e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3a2cae47533c1122eb8ec404473a0d9e">&#9670;&nbsp;</a></span>store_post_increment() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment , typename PredicateIterator &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::store_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>pred_it</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="af961a2621c6b42f2b3ba645afcb250a9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af961a2621c6b42f2b3ba645afcb250a9">&#9670;&nbsp;</a></span>first</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a> <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::first</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab88ce07b3012ae2e6a92ad784c8067f0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab88ce07b3012ae2e6a92ad784c8067f0">&#9670;&nbsp;</a></span>second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a> <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::second</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this class was generated from the following file:<ul>
+<li><a class="el" href="zip__tile__iterator_8h_source.html">zip_tile_iterator.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1detail_1_1ScalarOrPointer-members.html b/docs/classcutlass_1_1detail_1_1ScalarOrPointer-members.html
new file mode 100644
index 000000000..8da714665
--- /dev/null
+++ b/docs/classcutlass_1_1detail_1_1ScalarOrPointer-members.html
@@ -0,0 +1,101 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1detail.html">detail</a></li><li class="navelem"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a1661baed19b4aa4eea725a6f6e6b26a3">get</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a6b066568947df37094e4125b0347faf1">get_ptr</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a81bd7b4f50b8d7c5effe5291ad920380">get_scalar</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a95373f3d1b286c61cb204ba6a1282ce0">is_pointer</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a896f35e776c1291ceda0f432cc3da654">operator Scalar</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b29491782c3a129355fa4ef159cb970">operator=</a>(Scalar const &amp;scalar_)</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a54357e2f1d52aa8355b2ae7796740ea3">operator=</a>(Scalar const *ptr_)</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a45cf72b3f0e3408a4b51990b648b71ee">ScalarOrPointer</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b85e1940149922942c7d495f9d12134">ScalarOrPointer</a>(Scalar const &amp;val)</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a03a54e9150c2cccb26d9fa688ea03f96">ScalarOrPointer</a>(Scalar const *ptr_)</td><td class="entry"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1detail_1_1ScalarOrPointer.html b/docs/classcutlass_1_1detail_1_1ScalarOrPointer.html
new file mode 100644
index 000000000..6a28c38f8
--- /dev/null
+++ b/docs/classcutlass_1_1detail_1_1ScalarOrPointer.html
@@ -0,0 +1,434 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt; Class Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1detail.html">detail</a></li><li class="navelem"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="classcutlass_1_1detail_1_1ScalarOrPointer-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt; Class Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="scalar__or__pointer_8h_source.html">scalar_or_pointer.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a9d3006fc0c8bd98b9262606858b26cad"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a></td></tr>
+<tr class="memdesc:a9d3006fc0c8bd98b9262606858b26cad"><td class="mdescLeft">&#160;</td><td class="mdescRight">Underlying scalar type.  <a href="#a9d3006fc0c8bd98b9262606858b26cad">More...</a><br /></td></tr>
+<tr class="separator:a9d3006fc0c8bd98b9262606858b26cad"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a45cf72b3f0e3408a4b51990b648b71ee"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a45cf72b3f0e3408a4b51990b648b71ee">ScalarOrPointer</a> ()</td></tr>
+<tr class="memdesc:a45cf72b3f0e3408a4b51990b648b71ee"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor.  <a href="#a45cf72b3f0e3408a4b51990b648b71ee">More...</a><br /></td></tr>
+<tr class="separator:a45cf72b3f0e3408a4b51990b648b71ee"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3b85e1940149922942c7d495f9d12134"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b85e1940149922942c7d495f9d12134">ScalarOrPointer</a> (<a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const &amp;val)</td></tr>
+<tr class="memdesc:a3b85e1940149922942c7d495f9d12134"><td class="mdescLeft">&#160;</td><td class="mdescRight">Object behaves as a scalar.  <a href="#a3b85e1940149922942c7d495f9d12134">More...</a><br /></td></tr>
+<tr class="separator:a3b85e1940149922942c7d495f9d12134"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a03a54e9150c2cccb26d9fa688ea03f96"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a03a54e9150c2cccb26d9fa688ea03f96">ScalarOrPointer</a> (<a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const *ptr_)</td></tr>
+<tr class="memdesc:a03a54e9150c2cccb26d9fa688ea03f96"><td class="mdescLeft">&#160;</td><td class="mdescRight">Object behaves as a scalar.  <a href="#a03a54e9150c2cccb26d9fa688ea03f96">More...</a><br /></td></tr>
+<tr class="separator:a03a54e9150c2cccb26d9fa688ea03f96"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a95373f3d1b286c61cb204ba6a1282ce0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a95373f3d1b286c61cb204ba6a1282ce0">is_pointer</a> () const</td></tr>
+<tr class="memdesc:a95373f3d1b286c61cb204ba6a1282ce0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if is pointer.  <a href="#a95373f3d1b286c61cb204ba6a1282ce0">More...</a><br /></td></tr>
+<tr class="separator:a95373f3d1b286c61cb204ba6a1282ce0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6b066568947df37094e4125b0347faf1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a6b066568947df37094e4125b0347faf1">get_ptr</a> () const</td></tr>
+<tr class="memdesc:a6b066568947df37094e4125b0347faf1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the pointer value.  <a href="#a6b066568947df37094e4125b0347faf1">More...</a><br /></td></tr>
+<tr class="separator:a6b066568947df37094e4125b0347faf1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a81bd7b4f50b8d7c5effe5291ad920380"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a81bd7b4f50b8d7c5effe5291ad920380">get_scalar</a> () const</td></tr>
+<tr class="memdesc:a81bd7b4f50b8d7c5effe5291ad920380"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the pointer value.  <a href="#a81bd7b4f50b8d7c5effe5291ad920380">More...</a><br /></td></tr>
+<tr class="separator:a81bd7b4f50b8d7c5effe5291ad920380"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3b29491782c3a129355fa4ef159cb970"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b29491782c3a129355fa4ef159cb970">operator=</a> (<a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const &amp;scalar_)</td></tr>
+<tr class="memdesc:a3b29491782c3a129355fa4ef159cb970"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assigns to a scalar and sets pointer to nullptr.  <a href="#a3b29491782c3a129355fa4ef159cb970">More...</a><br /></td></tr>
+<tr class="separator:a3b29491782c3a129355fa4ef159cb970"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54357e2f1d52aa8355b2ae7796740ea3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a54357e2f1d52aa8355b2ae7796740ea3">operator=</a> (<a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const *ptr_)</td></tr>
+<tr class="memdesc:a54357e2f1d52aa8355b2ae7796740ea3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assigns to a pointer value.  <a href="#a54357e2f1d52aa8355b2ae7796740ea3">More...</a><br /></td></tr>
+<tr class="separator:a54357e2f1d52aa8355b2ae7796740ea3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1661baed19b4aa4eea725a6f6e6b26a3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a1661baed19b4aa4eea725a6f6e6b26a3">get</a> () const</td></tr>
+<tr class="memdesc:a1661baed19b4aa4eea725a6f6e6b26a3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access the element.  <a href="#a1661baed19b4aa4eea725a6f6e6b26a3">More...</a><br /></td></tr>
+<tr class="separator:a1661baed19b4aa4eea725a6f6e6b26a3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a896f35e776c1291ceda0f432cc3da654"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a896f35e776c1291ceda0f432cc3da654">operator Scalar</a> () const</td></tr>
+<tr class="memdesc:a896f35e776c1291ceda0f432cc3da654"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the element.  <a href="#a896f35e776c1291ceda0f432cc3da654">More...</a><br /></td></tr>
+<tr class="separator:a896f35e776c1291ceda0f432cc3da654"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;typename Scalar_&gt;<br />
+class cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</h3>
+
+<p>Helper class defines an object which operates as either a scalar or a pointer. If the pointer is non-null, it is dereferenced when the object is accessed. </p>
+</div><h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a9d3006fc0c8bd98b9262606858b26cad"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9d3006fc0c8bd98b9262606858b26cad">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Scalar_ <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::<a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a45cf72b3f0e3408a4b51990b648b71ee"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a45cf72b3f0e3408a4b51990b648b71ee">&#9670;&nbsp;</a></span>ScalarOrPointer() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::<a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3b85e1940149922942c7d495f9d12134"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3b85e1940149922942c7d495f9d12134">&#9670;&nbsp;</a></span>ScalarOrPointer() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::<a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const &amp;&#160;</td>
+          <td class="paramname"><em>val</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a03a54e9150c2cccb26d9fa688ea03f96"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a03a54e9150c2cccb26d9fa688ea03f96">&#9670;&nbsp;</a></span>ScalarOrPointer() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::<a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>ptr_</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a1661baed19b4aa4eea725a6f6e6b26a3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1661baed19b4aa4eea725a6f6e6b26a3">&#9670;&nbsp;</a></span>get()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::get </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6b066568947df37094e4125b0347faf1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6b066568947df37094e4125b0347faf1">&#9670;&nbsp;</a></span>get_ptr()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const* <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::get_ptr </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a81bd7b4f50b8d7c5effe5291ad920380"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a81bd7b4f50b8d7c5effe5291ad920380">&#9670;&nbsp;</a></span>get_scalar()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::get_scalar </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a95373f3d1b286c61cb204ba6a1282ce0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a95373f3d1b286c61cb204ba6a1282ce0">&#9670;&nbsp;</a></span>is_pointer()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::is_pointer </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a896f35e776c1291ceda0f432cc3da654"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a896f35e776c1291ceda0f432cc3da654">&#9670;&nbsp;</a></span>operator Scalar()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::operator <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3b29491782c3a129355fa4ef159cb970"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3b29491782c3a129355fa4ef159cb970">&#9670;&nbsp;</a></span>operator=() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a>&amp; <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::operator= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const &amp;&#160;</td>
+          <td class="paramname"><em>scalar_</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a54357e2f1d52aa8355b2ae7796740ea3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a54357e2f1d52aa8355b2ae7796740ea3">&#9670;&nbsp;</a></span>operator=() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a>&amp; <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a>&lt; Scalar_ &gt;::operator= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>ptr_</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this class was generated from the following file:<ul>
+<li><a class="el" href="scalar__or__pointer_8h_source.html">scalar_or_pointer.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params-members.html b/docs/classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params-members.html
new file mode 100644
index 000000000..323b1406c
--- /dev/null
+++ b/docs/classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params-members.html
@@ -0,0 +1,98 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">LinearScalingDevicePtr</a></li><li class="navelem"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ad1b2291b898091ee1966b73bd1ad56fa">initialize</a>(Scalar alpha, Scalar beta)</td><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ab4dbffb32daffb64d2033e3091963507">initialize</a>(Scalar const *alpha, Scalar const *beta)</td><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a491496037bf6613e128e667f87fda696">initialize</a>(GemmDesc_ const &amp;desc)</td><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae28323819fc8950bc0fee3a34b2184ff">Params</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a26b04702140a550f3ab598132a74cd93">Params</a>(Scalar alpha, Scalar beta)</td><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a38aa3e6beb09c7c4bea952094a2ea682">Params</a>(Scalar const *alpha_ptr, Scalar const *beta_ptr)</td><td class="entry"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html b/docs/classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html
new file mode 100644
index 000000000..5fc5d05e3
--- /dev/null
+++ b/docs/classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html
@@ -0,0 +1,389 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params Class Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">LinearScalingDevicePtr</a></li><li class="navelem"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params Class Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>The parameters.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="linear__scaling__device__ptr_8h_source.html">linear_scaling_device_ptr.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:ae28323819fc8950bc0fee3a34b2184ff"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae28323819fc8950bc0fee3a34b2184ff">Params</a> ()</td></tr>
+<tr class="separator:ae28323819fc8950bc0fee3a34b2184ff"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a26b04702140a550f3ab598132a74cd93"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a26b04702140a550f3ab598132a74cd93">Params</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>, <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>)</td></tr>
+<tr class="separator:a26b04702140a550f3ab598132a74cd93"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a38aa3e6beb09c7c4bea952094a2ea682"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a38aa3e6beb09c7c4bea952094a2ea682">Params</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> const *alpha_ptr, <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> const *beta_ptr)</td></tr>
+<tr class="separator:a38aa3e6beb09c7c4bea952094a2ea682"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad1b2291b898091ee1966b73bd1ad56fa"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ad1b2291b898091ee1966b73bd1ad56fa">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>, <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>)</td></tr>
+<tr class="memdesc:ad1b2291b898091ee1966b73bd1ad56fa"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize the parameters.  <a href="#ad1b2291b898091ee1966b73bd1ad56fa">More...</a><br /></td></tr>
+<tr class="separator:ad1b2291b898091ee1966b73bd1ad56fa"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab4dbffb32daffb64d2033e3091963507"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ab4dbffb32daffb64d2033e3091963507">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> const *<a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>, <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> const *<a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>)</td></tr>
+<tr class="memdesc:ab4dbffb32daffb64d2033e3091963507"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize the parameters.  <a href="#ab4dbffb32daffb64d2033e3091963507">More...</a><br /></td></tr>
+<tr class="separator:ab4dbffb32daffb64d2033e3091963507"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a491496037bf6613e128e667f87fda696"><td class="memTemplParams" colspan="2">template&lt;typename GemmDesc_ &gt; </td></tr>
+<tr class="memitem:a491496037bf6613e128e667f87fda696"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a491496037bf6613e128e667f87fda696">initialize</a> (GemmDesc_ const &amp;desc)</td></tr>
+<tr class="memdesc:a491496037bf6613e128e667f87fda696"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize the parameters.  <a href="#a491496037bf6613e128e667f87fda696">More...</a><br /></td></tr>
+<tr class="separator:a491496037bf6613e128e667f87fda696"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae4038a59658c87d52cee3330bee59662"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a> () const</td></tr>
+<tr class="memdesc:ae4038a59658c87d52cee3330bee59662"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the alpha scalar.  <a href="#ae4038a59658c87d52cee3330bee59662">More...</a><br /></td></tr>
+<tr class="separator:ae4038a59658c87d52cee3330bee59662"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0938bcb61d2572d5cf6cf2de95d11816"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a> () const</td></tr>
+<tr class="memdesc:a0938bcb61d2572d5cf6cf2de95d11816"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the beta scalar.  <a href="#a0938bcb61d2572d5cf6cf2de95d11816">More...</a><br /></td></tr>
+<tr class="separator:a0938bcb61d2572d5cf6cf2de95d11816"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ae28323819fc8950bc0fee3a34b2184ff"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae28323819fc8950bc0fee3a34b2184ff">&#9670;&nbsp;</a></span>Params() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a26b04702140a550f3ab598132a74cd93"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a26b04702140a550f3ab598132a74cd93">&#9670;&nbsp;</a></span>Params() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a>&#160;</td>
+          <td class="paramname"><em>alpha</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a>&#160;</td>
+          <td class="paramname"><em>beta</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a38aa3e6beb09c7c4bea952094a2ea682"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a38aa3e6beb09c7c4bea952094a2ea682">&#9670;&nbsp;</a></span>Params() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>alpha_ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>beta_ptr</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ae4038a59658c87d52cee3330bee59662"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae4038a59658c87d52cee3330bee59662">&#9670;&nbsp;</a></span>alpha()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::alpha </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0938bcb61d2572d5cf6cf2de95d11816"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0938bcb61d2572d5cf6cf2de95d11816">&#9670;&nbsp;</a></span>beta()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::beta </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad1b2291b898091ee1966b73bd1ad56fa"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad1b2291b898091ee1966b73bd1ad56fa">&#9670;&nbsp;</a></span>initialize() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a>&#160;</td>
+          <td class="paramname"><em>alpha</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a>&#160;</td>
+          <td class="paramname"><em>beta</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab4dbffb32daffb64d2033e3091963507"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab4dbffb32daffb64d2033e3091963507">&#9670;&nbsp;</a></span>initialize() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>alpha</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>beta</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a491496037bf6613e128e667f87fda696"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a491496037bf6613e128e667f87fda696">&#9670;&nbsp;</a></span>initialize() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename GemmDesc_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype">GemmDesc_ const &amp;&#160;</td>
+          <td class="paramname"><em>desc</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this class was generated from the following file:<ul>
+<li><a class="el" href="linear__scaling__device__ptr_8h_source.html">linear_scaling_device_ptr.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1platform_1_1complex-members.html b/docs/classcutlass_1_1platform_1_1complex-members.html
new file mode 100644
index 000000000..3e19742e0
--- /dev/null
+++ b/docs/classcutlass_1_1platform_1_1complex-members.html
@@ -0,0 +1,100 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1platform.html">platform</a></li><li class="navelem"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::platform::complex&lt; T &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a2e852c886e61a39e884026d6f4c32c1e">complex</a>(T r=T(0), T i=T(0))</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a71ee9d620f72fbcd54f6e3049707eb99">complex</a>(cuFloatComplex const &amp;z)</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#af40324ec4d1d35a0ceda676c8de968f8">complex</a>(cuDoubleComplex const &amp;z)</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">imag</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a835363f62c6a079496c22074ab428651">imag</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a3b92e54de1c4262c7e481218162be7ec">operator cuDoubleComplex</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#ac5a3a0dc9815dadbe539312eb6fe36c4">operator cuFloatComplex</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">real</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#acda3e2050b2fefb1aca1fa8aa2063f8b">real</a>()</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">value_type</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1platform_1_1complex.html b/docs/classcutlass_1_1platform_1_1complex.html
new file mode 100644
index 000000000..672fef7e9
--- /dev/null
+++ b/docs/classcutlass_1_1platform_1_1complex.html
@@ -0,0 +1,413 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::platform::complex&lt; T &gt; Class Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1platform.html">platform</a></li><li class="navelem"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="classcutlass_1_1platform_1_1complex-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::platform::complex&lt; T &gt; Class Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="complex_8h_source.html">complex.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:aa7c319b0c67f8ffeee3d1bb4b83ea0d6"><td class="memItemLeft" align="right" valign="top">typedef T&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">value_type</a></td></tr>
+<tr class="memdesc:aa7c319b0c67f8ffeee3d1bb4b83ea0d6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Type alias for scalar type.  <a href="#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">More...</a><br /></td></tr>
+<tr class="separator:aa7c319b0c67f8ffeee3d1bb4b83ea0d6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a2e852c886e61a39e884026d6f4c32c1e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a2e852c886e61a39e884026d6f4c32c1e">complex</a> (T r=T(0), T i=T(0))</td></tr>
+<tr class="memdesc:a2e852c886e61a39e884026d6f4c32c1e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor.  <a href="#a2e852c886e61a39e884026d6f4c32c1e">More...</a><br /></td></tr>
+<tr class="separator:a2e852c886e61a39e884026d6f4c32c1e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a71ee9d620f72fbcd54f6e3049707eb99"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a71ee9d620f72fbcd54f6e3049707eb99">complex</a> (cuFloatComplex const &amp;z)</td></tr>
+<tr class="memdesc:a71ee9d620f72fbcd54f6e3049707eb99"><td class="mdescLeft">&#160;</td><td class="mdescRight">Conversion from cuFloatComplex.  <a href="#a71ee9d620f72fbcd54f6e3049707eb99">More...</a><br /></td></tr>
+<tr class="separator:a71ee9d620f72fbcd54f6e3049707eb99"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af40324ec4d1d35a0ceda676c8de968f8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#af40324ec4d1d35a0ceda676c8de968f8">complex</a> (cuDoubleComplex const &amp;z)</td></tr>
+<tr class="memdesc:af40324ec4d1d35a0ceda676c8de968f8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Conversion from cuDoubleComplex.  <a href="#af40324ec4d1d35a0ceda676c8de968f8">More...</a><br /></td></tr>
+<tr class="separator:af40324ec4d1d35a0ceda676c8de968f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab06cbc1eefd47df3d3748d42d6d95974"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">real</a> () const</td></tr>
+<tr class="memdesc:ab06cbc1eefd47df3d3748d42d6d95974"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the real part of the complex number.  <a href="#ab06cbc1eefd47df3d3748d42d6d95974">More...</a><br /></td></tr>
+<tr class="separator:ab06cbc1eefd47df3d3748d42d6d95974"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acda3e2050b2fefb1aca1fa8aa2063f8b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#acda3e2050b2fefb1aca1fa8aa2063f8b">real</a> ()</td></tr>
+<tr class="memdesc:acda3e2050b2fefb1aca1fa8aa2063f8b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the real part of the complex number.  <a href="#acda3e2050b2fefb1aca1fa8aa2063f8b">More...</a><br /></td></tr>
+<tr class="separator:acda3e2050b2fefb1aca1fa8aa2063f8b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a57360dbcada12083ecb92fba32fae801"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">imag</a> () const</td></tr>
+<tr class="memdesc:a57360dbcada12083ecb92fba32fae801"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the imaginary part of the complex number.  <a href="#a57360dbcada12083ecb92fba32fae801">More...</a><br /></td></tr>
+<tr class="separator:a57360dbcada12083ecb92fba32fae801"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a835363f62c6a079496c22074ab428651"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a835363f62c6a079496c22074ab428651">imag</a> ()</td></tr>
+<tr class="memdesc:a835363f62c6a079496c22074ab428651"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the imaginary part of the complex number.  <a href="#a835363f62c6a079496c22074ab428651">More...</a><br /></td></tr>
+<tr class="separator:a835363f62c6a079496c22074ab428651"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac5a3a0dc9815dadbe539312eb6fe36c4"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#ac5a3a0dc9815dadbe539312eb6fe36c4">operator cuFloatComplex</a> () const</td></tr>
+<tr class="memdesc:ac5a3a0dc9815dadbe539312eb6fe36c4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Converts to cuFloatComplex.  <a href="#ac5a3a0dc9815dadbe539312eb6fe36c4">More...</a><br /></td></tr>
+<tr class="separator:ac5a3a0dc9815dadbe539312eb6fe36c4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3b92e54de1c4262c7e481218162be7ec"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html#a3b92e54de1c4262c7e481218162be7ec">operator cuDoubleComplex</a> () const</td></tr>
+<tr class="memdesc:a3b92e54de1c4262c7e481218162be7ec"><td class="mdescLeft">&#160;</td><td class="mdescRight">Converts to cuDoubleComplex.  <a href="#a3b92e54de1c4262c7e481218162be7ec">More...</a><br /></td></tr>
+<tr class="separator:a3b92e54de1c4262c7e481218162be7ec"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;typename T&gt;<br />
+class cutlass::platform::complex&lt; T &gt;</h3>
+
+<p>Class for representing and manipulating complex numbers with conversions from built-in CUDA complex types. </p>
+</div><h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="aa7c319b0c67f8ffeee3d1bb4b83ea0d6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">&#9670;&nbsp;</a></span>value_type</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef T <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">value_type</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a2e852c886e61a39e884026d6f4c32c1e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2e852c886e61a39e884026d6f4c32c1e">&#9670;&nbsp;</a></span>complex() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a> </td>
+          <td>(</td>
+          <td class="paramtype">T&#160;</td>
+          <td class="paramname"><em>r</em> = <code>T(0)</code>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">T&#160;</td>
+          <td class="paramname"><em>i</em> = <code>T(0)</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a71ee9d620f72fbcd54f6e3049707eb99"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a71ee9d620f72fbcd54f6e3049707eb99">&#9670;&nbsp;</a></span>complex() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a> </td>
+          <td>(</td>
+          <td class="paramtype">cuFloatComplex const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af40324ec4d1d35a0ceda676c8de968f8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af40324ec4d1d35a0ceda676c8de968f8">&#9670;&nbsp;</a></span>complex() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a> </td>
+          <td>(</td>
+          <td class="paramtype">cuDoubleComplex const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a57360dbcada12083ecb92fba32fae801"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a57360dbcada12083ecb92fba32fae801">&#9670;&nbsp;</a></span>imag() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const&amp; <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::imag </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a835363f62c6a079496c22074ab428651"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a835363f62c6a079496c22074ab428651">&#9670;&nbsp;</a></span>imag() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&amp; <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::imag </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3b92e54de1c4262c7e481218162be7ec"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3b92e54de1c4262c7e481218162be7ec">&#9670;&nbsp;</a></span>operator cuDoubleComplex()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::operator cuDoubleComplex </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac5a3a0dc9815dadbe539312eb6fe36c4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac5a3a0dc9815dadbe539312eb6fe36c4">&#9670;&nbsp;</a></span>operator cuFloatComplex()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::operator cuFloatComplex </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab06cbc1eefd47df3d3748d42d6d95974"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab06cbc1eefd47df3d3748d42d6d95974">&#9670;&nbsp;</a></span>real() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const&amp; <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::real </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="acda3e2050b2fefb1aca1fa8aa2063f8b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acda3e2050b2fefb1aca1fa8aa2063f8b">&#9670;&nbsp;</a></span>real() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&amp; <a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a>&lt; T &gt;::real </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this class was generated from the following file:<ul>
+<li><a class="el" href="complex_8h_source.html">complex.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/classcutlass_1_1platform_1_1unique__ptr-members.html b/docs/classcutlass_1_1platform_1_1unique__ptr-members.html
index 696f47884..1242de683 100644
--- a/docs/classcutlass_1_1platform_1_1unique__ptr-members.html
+++ b/docs/classcutlass_1_1platform_1_1unique__ptr-members.html
@@ -98,7 +98,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classcutlass_1_1platform_1_1unique__ptr.html b/docs/classcutlass_1_1platform_1_1unique__ptr.html
index cf455f2e5..625e790b8 100644
--- a/docs/classcutlass_1_1platform_1_1unique__ptr.html
+++ b/docs/classcutlass_1_1platform_1_1unique__ptr.html
@@ -546,7 +546,7 @@ template&lt;class T, class Deleter = default_delete&lt;T&gt;&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/classes.html b/docs/classes.html
index 9896653f6..6a517312c 100644
--- a/docs/classes.html
+++ b/docs/classes.html
@@ -72,100 +72,116 @@ $(function() {
 <div class="title">Class Index</div>  </div>
 </div><!--header-->
 <div class="contents">
-<div class="qindex"><a class="qindex" href="#letter_a">a</a>&#160;|&#160;<a class="qindex" href="#letter_b">b</a>&#160;|&#160;<a class="qindex" href="#letter_c">c</a>&#160;|&#160;<a class="qindex" href="#letter_d">d</a>&#160;|&#160;<a class="qindex" href="#letter_e">e</a>&#160;|&#160;<a class="qindex" href="#letter_f">f</a>&#160;|&#160;<a class="qindex" href="#letter_g">g</a>&#160;|&#160;<a class="qindex" href="#letter_h">h</a>&#160;|&#160;<a class="qindex" href="#letter_i">i</a>&#160;|&#160;<a class="qindex" href="#letter_l">l</a>&#160;|&#160;<a class="qindex" href="#letter_m">m</a>&#160;|&#160;<a class="qindex" href="#letter_n">n</a>&#160;|&#160;<a class="qindex" href="#letter_p">p</a>&#160;|&#160;<a class="qindex" href="#letter_r">r</a>&#160;|&#160;<a class="qindex" href="#letter_s">s</a>&#160;|&#160;<a class="qindex" href="#letter_t">t</a>&#160;|&#160;<a class="qindex" href="#letter_u">u</a>&#160;|&#160;<a class="qindex" href="#letter_v">v</a>&#160;|&#160;<a class="qindex" href="#letter_w">w</a></div>
+<div class="qindex"><a class="qindex" href="#letter_a">a</a>&#160;|&#160;<a class="qindex" href="#letter_b">b</a>&#160;|&#160;<a class="qindex" href="#letter_c">c</a>&#160;|&#160;<a class="qindex" href="#letter_d">d</a>&#160;|&#160;<a class="qindex" href="#letter_e">e</a>&#160;|&#160;<a class="qindex" href="#letter_f">f</a>&#160;|&#160;<a class="qindex" href="#letter_g">g</a>&#160;|&#160;<a class="qindex" href="#letter_h">h</a>&#160;|&#160;<a class="qindex" href="#letter_i">i</a>&#160;|&#160;<a class="qindex" href="#letter_k">k</a>&#160;|&#160;<a class="qindex" href="#letter_l">l</a>&#160;|&#160;<a class="qindex" href="#letter_m">m</a>&#160;|&#160;<a class="qindex" href="#letter_n">n</a>&#160;|&#160;<a class="qindex" href="#letter_p">p</a>&#160;|&#160;<a class="qindex" href="#letter_r">r</a>&#160;|&#160;<a class="qindex" href="#letter_s">s</a>&#160;|&#160;<a class="qindex" href="#letter_t">t</a>&#160;|&#160;<a class="qindex" href="#letter_u">u</a>&#160;|&#160;<a class="qindex" href="#letter_v">v</a>&#160;|&#160;<a class="qindex" href="#letter_w">w</a>&#160;|&#160;<a class="qindex" href="#letter_z">z</a></div>
 <table class="classindex">
 <tr><td rowspan="2" valign="bottom"><a name="letter_a"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;a&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">IgemmEpilogueScalar</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html">Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">GlobalLoadStreamBase::SharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html">FragmentMultiplyAdd&lt; half &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html">IgemmEpilogueScalar&lt; int &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1log2__down.html">log2_down</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1FragmentStore.html">FragmentStore</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">IgemmEpilogueTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html">log2_down&lt; N, 1, Count &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1aligned__storage.html">aligned_storage</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html">FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">IgemmEpilogueTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1log2__up.html">log2_up</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html">FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">IgemmFloatToInt8Converter</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html">log2_up&lt; N, 1, Count &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1sqrt__est.html">sqrt_est</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_g"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;g&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">IgemmGlobalLoadTransformer</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_m"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;m&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1StorageType.html">StorageType</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html">alignment_of&lt; const value_t &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html">IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1StorageType_3_011_01_4.html">StorageType&lt; 1 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html">alignment_of&lt; const volatile value_t &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html">IgemmGlobalStoreTransformer</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">GemmTraits::MainLoopSharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1StorageType_3_012_01_4.html">StorageType&lt; 2 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html">alignment_of&lt; double2 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html">IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1StorageType_3_014_01_4.html">StorageType&lt; 4 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html">alignment_of&lt; double4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">IgemmInt8ToFloatConverter</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store.html">Store</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html">alignment_of&lt; float4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">IgemmSharedStoreTransformer</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_n"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;n&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html">Store&lt; double, 2, Memory_, true, 16 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html">alignment_of&lt; int4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">GemmEpilogueTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">IgemmSwizzle</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html">Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html">alignment_of&lt; long4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1nullptr__t.html">nullptr_t</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html">Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html">alignment_of&lt; longlong2 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_p"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;p&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html">Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html">alignment_of&lt; longlong4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">GemmTraits::StreamSharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html">alignment_of&lt; uint4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">alignment_of::pad</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">GemmEpilogueTraits::StreamSharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html">alignment_of&lt; ulong4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html">IgemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">WmmaGemmGlobalIteratorCd::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_t"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;t&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">IgemmTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">LinearScalingDevicePtr::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html">Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">GlobalLoadStream::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">SharedStreamPair::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1aligned__storage.html">aligned_storage</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">WmmaGemmGlobalIteratorCd::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">GemmEpilogueTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">ZipTileIterator::Params</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">GemmTraits::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html">alignment_of&lt; const value_t &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">LinearScaling::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">GemmEpilogueTraits::StreamSharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html">alignment_of&lt; const volatile value_t &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1int4__t.html">int4_t</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">GemmGlobalIteratorAb::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StrideVector</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html">alignment_of&lt; double2 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">GlobalLoadStreamPair::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html">swizzleDirection</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html">alignment_of&lt; double4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__arithmetic.html">is_arithmetic</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">GemmGlobalIteratorCd::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_t"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;t&#160;&#160;</div></td></tr></table>
 </td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html">alignment_of&lt; ulonglong2 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">IgemmTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">GemmTraits::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html">alignment_of&lt; ulonglong4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1GemmOperand.html">GemmOperand</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">GlobalLoadStreamBase::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html">alignment_of&lt; volatile value_t &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html">GemmOperandTraitsAb</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">TileIteratorBase::Params</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html">alignment_of&lt; float4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__base__of.html">is_base_of</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">GemmEpilogueTraits::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html">alignment_of&lt; int4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1GemmOperand.html">GemmOperand</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html">is_base_of_helper</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">TileIteratorBase::Params</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html">alignment_of&lt; long4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html">GemmOperandTraitsAb</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__floating__point.html">is_floating_point</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">TileLoadIterator::Params</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html">alignment_of&lt; longlong2 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__fundamental.html">is_fundamental</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">TileStoreIterator::Params</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html">alignment_of&lt; longlong4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">TileLoadStream::Params</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html">alignment_of&lt; uint4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html">is_integral&lt; char &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">TileStoreStream::Params</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1TensorView.html">TensorView</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html">alignment_of&lt; ulong4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html">is_integral&lt; const T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">SharedLoadStream::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html">alignment_of&lt; ulonglong2 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html">is_integral&lt; const volatile T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1plus.html">plus</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html">alignment_of&lt; ulonglong4 &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html">is_integral&lt; int &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">PredicatedTileLoadStream</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html">alignment_of&lt; volatile value_t &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html">is_integral&lt; long &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">PredicatedTileStoreStream</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
 <tr><td rowspan="2" valign="bottom"><a name="letter_b"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;b&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">GemmGlobalIteratorCd::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">TileLoadIterator::Params</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1bool__constant.html">bool_constant</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">TileStoreIterator::Params</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html">ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html">is_integral&lt; long long &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1PredicateTileAdapter.html">PredicateTileAdapter</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html">GemmSharedStoreTileAbTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html">is_integral&lt; short &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html">TileLoadStream::PredicateVector</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html">WmmaGemmGlobalIteratorCdTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html">is_integral&lt; signed char &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html">GemmGlobalTileCdTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1bool__constant.html">bool_constant</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html">is_integral&lt; unsigned char &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html">TileStoreStream::PredicateVector</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html">GemmSharedLoadTileATraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
 <tr><td rowspan="2" valign="bottom"><a name="letter_c"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;c&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">GemmEpilogueTraits::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html">GemmSharedLoadTileBTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Gemm::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html">GemmGlobalTileCdTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__arithmetic.html">is_arithmetic</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">SharedLoadStream::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html">IgemmContiguousGlobalTileTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html">ComputeOffsetFromShape</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__base__of.html">is_base_of</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">LinearScaling::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html">GemmGlobalTileTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html">ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html">is_base_of_helper</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">GemmGlobalIteratorAb::Params</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html">GemmSharedLoadTileDTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html">ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__floating__point.html">is_floating_point</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1plus.html">plus</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html">GemmSharedLoadTileATraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html">ComputeOffsetFromStrides</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__fundamental.html">is_fundamental</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1PredicateTileAdapter.html">PredicateTileAdapter</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html">GemmSharedStoreTileDTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html">ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html">HgemmCrosswiseGlobalTileTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html">ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html">is_integral&lt; char &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html">GemmSharedStoreTileAbTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">ComputeThreadOffsetFromStrides</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html">is_integral&lt; const T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html">ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html">TileTraitsWarpRake::ThreadOffset</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html">ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html">is_integral&lt; const volatile T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html">ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html">GemmSharedStoreWithSkewTileAbTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html">ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html">GetExtent&lt; GemmOperand::kA, Tile_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html">is_integral&lt; int &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html">ProjectOperand&lt; GemmOperand::kC, true &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html">WmmaGemmGlobalIteratorCdTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1conditional.html">conditional</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html">GetExtent&lt; GemmOperand::kB, Tile_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html">is_integral&lt; long &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html">ProjectOperand&lt; GemmOperand::kD, true &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TiledThreadOffset.html">TiledThreadOffset</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html">conditional&lt; false, T, F &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html">GemmTraits::GlobalLoadStream</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html">is_integral&lt; long long &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_r"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;r&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">PredicateVector::ConstIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html">is_integral&lt; short &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html">ConstPredicateTileAdapter</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">GlobalLoadStreamBase</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html">is_integral&lt; signed char &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__const.html">remove_const</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1Convert.html">Convert</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1greater.html">greater</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html">is_integral&lt; unsigned char &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html">remove_const&lt; const T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraits.html">TileTraits</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html">Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_h"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;h&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html">is_integral&lt; unsigned int &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__cv.html">remove_cv</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html">TileTraitsContiguousMajor</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html">is_integral&lt; unsigned long &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__volatile.html">remove_volatile</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">TileTraitsStandard</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1Copy.html">Copy</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html">is_integral&lt; unsigned long long &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html">remove_volatile&lt; volatile T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html">TileTraitsStrideMajor</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html">is_integral&lt; unsigned int &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html">GemmSharedStoreWithSkewTileAbTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html">is_integral&lt; unsigned long &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html">ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">IgemmGlobalTileTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html">is_integral&lt; unsigned long long &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html">ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html">GemmSharedLoadTileBTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">MatrixLayout::ColumnMajor</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html">GetExtent&lt; GemmOperand::kA, Tile_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html">is_integral&lt; unsigned short &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html">ProjectOperand&lt; GemmOperand::kC, true &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html">GemmGlobalTileTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">MatrixLayout::ColumnMajorBlockLinear</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html">GetExtent&lt; GemmOperand::kB, Tile_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html">is_integral&lt; volatile T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html">ProjectOperand&lt; GemmOperand::kD, true &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html">GemmSharedLoadTileDTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">ColumnMajorBlockSwizzle</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__pointer.html">is_pointer</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_r"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;r&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html">TileTraitsWarpRake::ThreadOffset</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">MatrixLayout::ColumnMajorInterleaved</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper.html">is_pointer_helper</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html">GemmSharedStoreTileDTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1greater.html">greater</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html">is_pointer_helper&lt; T * &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">RegularTilePredicateFunctor</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html">HgemmCrosswiseGlobalTileTraits::ThreadOffset</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html">ComputeOffsetFromShape</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_h"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;h&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1is__pow2.html">is_pow2</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__const.html">remove_const</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileAllocation.html">TileAllocation</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html">ComputeOffsetFromStrides</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__same.html">is_same</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html">remove_const&lt; const T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">ComputeThreadOffsetFromStrides</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html">is_same&lt; A, A &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__cv.html">remove_cv</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TiledThreadOffset.html">TiledThreadOffset</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html">ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__trivially__copyable.html">is_trivially_copyable</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__volatile.html">remove_volatile</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html">ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">HgemmSwizzle</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__void.html">is_void</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html">remove_volatile&lt; volatile T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1conditional.html">conditional</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__volatile.html">is_volatile</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html">conditional&lt; false, T, F &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html">is_volatile&lt; volatile T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html">ReshapeThreads&lt; Tile_, Threads_, true &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">PredicateVector::ConstIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html">PredicateVector::Iterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">TensorRefBatchStrided::ConstIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1IteratorAdvance.html">IteratorAdvance</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html">ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraits.html">TileTraits</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">TensorRefArray::ConstIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html">HgemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_k"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;k&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">MatrixLayout::RowMajor</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html">TileTraitsContiguousMajor</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html">ConstPredicateTileAdapter</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">HgemmTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">MatrixLayout::RowMajorBlockLinear</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">TileTraitsStandard</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">MatrixLayout::ContiguousLayout</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">KernelLaunchConfiguration</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">RowMajorBlockSwizzle</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html">TileTraitsStrideMajor</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1Convert.html">Convert</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_l"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;l&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">MatrixLayout::RowMajorInterleaved</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsWarpRake.html">TileTraitsWarpRake</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html">Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_s"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;s&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html">Launch</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html">TrivialPredicateTileAdapter</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1Copy.html">Copy</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html">Launch&lt; Gemm, false &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_u"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;u&#160;&#160;</div></td></tr></table>
+</td></tr>
 <tr><td rowspan="2" valign="bottom"><a name="letter_d"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;d&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html">is_integral&lt; unsigned short &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TileTraitsWarpRake.html">TileTraitsWarpRake</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">HgemmSwizzle</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html">is_integral&lt; volatile T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html">ReshapeThreads&lt; Tile_, Threads_, true &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1default__delete.html">default_delete</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__pointer.html">is_pointer</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html">TrivialPredicateTileAdapter</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html">default_delete&lt; T[]&gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper.html">is_pointer_helper</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html">ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_u"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;u&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1less.html">less</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a> (<a class="el" href="namespacecutlass_1_1detail.html">cutlass::detail</a>)&#160;&#160;&#160;</td></tr>
+<tr><td rowspan="2" valign="bottom"><a name="letter_i"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;i&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html">SgemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structDebugType.html">DebugType</a>&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">LinearScalingDevicePtr</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html">SgemmLBTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structDebugValue.html">DebugValue</a>&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Identity.html">Identity</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load.html">Load</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html">SgemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_v"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;v&#160;&#160;</div></td></tr></table>
 </td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html">DgemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html">is_pointer_helper&lt; T * &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_s"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;s&#160;&#160;</div></td></tr></table>
-</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html">DgemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1is__pow2.html">is_pow2</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1divide__assert.html">divide_assert</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html">HgemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__same.html">is_same</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html">SgemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_v"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;v&#160;&#160;</div></td></tr></table>
-</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">is_base_of_helper::dummy</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">HgemmTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html">is_same&lt; A, A &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html">SgemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1default__delete.html">default_delete</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html">Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Shape.html">Shape</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html">default_delete&lt; T[]&gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">IdentityTensorMapFunc</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeAdd.html">ShapeAdd</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html">DgemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">Vector&lt; bin1_t, kLanes_ &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html">DgemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html">IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">Vector&lt; half, 1 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1divide__assert.html">divide_assert</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeDivCeiling.html">ShapeDivCeiling</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">Vector&lt; half, kLanes_ &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">is_base_of_helper::dummy</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html">IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeMax.html">ShapeMax</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">Vector&lt; int4_t, kLanes_ &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1DumpType.html">DumpType</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">IgemmEpilogueScalar</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html">Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeMin.html">ShapeMin</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">Vector&lt; uint4_t, kLanes_ &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
 <tr><td rowspan="2" valign="bottom"><a name="letter_e"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;e&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__trivially__copyable.html">is_trivially_copyable</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Shape.html">Shape</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__void.html">is_void</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeAdd.html">ShapeAdd</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">Vector&lt; half, kLanes_ &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1enable__if.html">enable_if</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__volatile.html">is_volatile</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html">enable_if&lt; false, T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html">is_volatile&lt; volatile T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html">Vectorize&lt; Element_, 1 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1Extent.html">Extent</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html">PredicateVector::Iterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeMax.html">ShapeMax</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1VectorTraits.html">VectorTraits</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html">Extent&lt; Vector&lt; T, Lanes &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1IteratorAdvance.html">IteratorAdvance</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeMin.html">ShapeMin</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html">VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html">Extent&lt; Vector&lt; T, Lanes &gt; const &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_i"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;i&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1IteratorFragment.html">IteratorFragment</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html">VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html">IgemmEpilogueScalar&lt; int &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html">Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">IgemmEpilogueTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html">Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeScale.html">ShapeScale</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1enable__if.html">enable_if</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">IgemmEpilogueTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1log2__down.html">log2_down</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html">enable_if&lt; false, T &gt;</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">IgemmFloatToInt8Converter</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html">log2_down&lt; N, 1, Count &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeSub.html">ShapeSub</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1Extent.html">Extent</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1log2__up.html">log2_up</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1VectorTraits.html">VectorTraits</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html">Extent&lt; Vector&lt; T, Lanes &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">IgemmGlobalLoadTransformer</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html">log2_up&lt; N, 1, Count &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">GemmEpilogueTraits::SharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html">VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html">Extent&lt; Vector&lt; T, Lanes &gt; const &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html">IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_m"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;m&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">GlobalLoadStreamPair::SharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html">VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
 <tr><td rowspan="2" valign="bottom"><a name="letter_f"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;f&#160;&#160;</div></td></tr></table>
-</td><td rowspan="2" valign="bottom"><a name="letter_l"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;l&#160;&#160;</div></td></tr></table>
-</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeScale.html">ShapeScale</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_w"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;w&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html">IgemmGlobalStoreTransformer</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">GemmTraits::SharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_w"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;w&#160;&#160;</div></td></tr></table>
 </td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1Identity.html">Identity</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1less.html">less</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ShapeSub.html">ShapeSub</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">FragmentConstIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html">GemmTraits::SharedLoadStream</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html">WmmaGemmGlobalIteratorCdTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01AccumulatorsPerThread___01_4.html">IgemmConfig&lt; OutputTile_, int8_t, AccumulatorsPerThread_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load.html">Load</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td></td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1FragmentLoad.html">FragmentLoad</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html">IgemmContiguousGlobalTileTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html">Load&lt; double, 2, Memory_, true, 16 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">ClearAccumulators::SharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td></td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html">FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html">Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">GemmEpilogueTraits::SharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td></td></tr>
-<tr><td valign="top"><a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html">FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html">IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html">Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">GemmTraits::SharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td></td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html">IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">GemmTraits::MainLoopSharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">GlobalLoadStream::SharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">Fp16SgemmConfig</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">ClearAccumulators::SharedStorage</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html">Fp16SgemmSgemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">IgemmInt8ToFloatConverter</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html">WmmaGemmGlobalIteratorCdTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">IgemmSharedStoreTransformer</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1MatrixTransform.html">MatrixTransform</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_z"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;z&#160;&#160;</div></td></tr></table>
+</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">FragmentConstIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">IgemmSwizzle</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Max.html">Max</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ZipConvert.html">ZipConvert</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Min.html">Min</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1sqrt__est.html">sqrt_est</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_n"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;n&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1StorageType.html">StorageType</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">FragmentMultiplyAdd&lt; half, half, true &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1StorageType_3_011_01_4.html">StorageType&lt; 1 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">ZipTileAllocation</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td rowspan="2" valign="bottom"><a name="letter_g"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;g&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1nullptr__t.html">nullptr_t</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1StorageType_3_012_01_4.html">StorageType&lt; 2 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td rowspan="2" valign="bottom"><a name="letter_p"></a><table border="0" cellspacing="0" cellpadding="0"><tr><td><div class="ah">&#160;&#160;p&#160;&#160;</div></td></tr></table>
+</td><td valign="top"><a class="el" href="structcutlass_1_1StorageType_3_014_01_4.html">StorageType&lt; 4 &gt;</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td></td></tr>
+<tr><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html">IgemmTraits</a> (<a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a>)&#160;&#160;&#160;</td><td valign="top"><a class="el" href="structcutlass_1_1Store.html">Store</a> (<a class="el" href="namespacecutlass.html">cutlass</a>)&#160;&#160;&#160;</td><td></td></tr>
+<tr><td></td><td></td><td valign="top"><a class="el" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">alignment_of::pad</a> (<a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a>)&#160;&#160;&#160;</td><td></td><td></td></tr>
 <tr><td></td><td></td><td></td><td></td><td></td></tr>
 </table>
-<div class="qindex"><a class="qindex" href="#letter_a">a</a>&#160;|&#160;<a class="qindex" href="#letter_b">b</a>&#160;|&#160;<a class="qindex" href="#letter_c">c</a>&#160;|&#160;<a class="qindex" href="#letter_d">d</a>&#160;|&#160;<a class="qindex" href="#letter_e">e</a>&#160;|&#160;<a class="qindex" href="#letter_f">f</a>&#160;|&#160;<a class="qindex" href="#letter_g">g</a>&#160;|&#160;<a class="qindex" href="#letter_h">h</a>&#160;|&#160;<a class="qindex" href="#letter_i">i</a>&#160;|&#160;<a class="qindex" href="#letter_l">l</a>&#160;|&#160;<a class="qindex" href="#letter_m">m</a>&#160;|&#160;<a class="qindex" href="#letter_n">n</a>&#160;|&#160;<a class="qindex" href="#letter_p">p</a>&#160;|&#160;<a class="qindex" href="#letter_r">r</a>&#160;|&#160;<a class="qindex" href="#letter_s">s</a>&#160;|&#160;<a class="qindex" href="#letter_t">t</a>&#160;|&#160;<a class="qindex" href="#letter_u">u</a>&#160;|&#160;<a class="qindex" href="#letter_v">v</a>&#160;|&#160;<a class="qindex" href="#letter_w">w</a></div>
+<div class="qindex"><a class="qindex" href="#letter_a">a</a>&#160;|&#160;<a class="qindex" href="#letter_b">b</a>&#160;|&#160;<a class="qindex" href="#letter_c">c</a>&#160;|&#160;<a class="qindex" href="#letter_d">d</a>&#160;|&#160;<a class="qindex" href="#letter_e">e</a>&#160;|&#160;<a class="qindex" href="#letter_f">f</a>&#160;|&#160;<a class="qindex" href="#letter_g">g</a>&#160;|&#160;<a class="qindex" href="#letter_h">h</a>&#160;|&#160;<a class="qindex" href="#letter_i">i</a>&#160;|&#160;<a class="qindex" href="#letter_k">k</a>&#160;|&#160;<a class="qindex" href="#letter_l">l</a>&#160;|&#160;<a class="qindex" href="#letter_m">m</a>&#160;|&#160;<a class="qindex" href="#letter_n">n</a>&#160;|&#160;<a class="qindex" href="#letter_p">p</a>&#160;|&#160;<a class="qindex" href="#letter_r">r</a>&#160;|&#160;<a class="qindex" href="#letter_s">s</a>&#160;|&#160;<a class="qindex" href="#letter_t">t</a>&#160;|&#160;<a class="qindex" href="#letter_u">u</a>&#160;|&#160;<a class="qindex" href="#letter_v">v</a>&#160;|&#160;<a class="qindex" href="#letter_w">w</a>&#160;|&#160;<a class="qindex" href="#letter_z">z</a></div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/clear__accumulators_8h.html b/docs/clear__accumulators_8h.html
index b4bd3b39c..cd8f6307a 100644
--- a/docs/clear__accumulators_8h.html
+++ b/docs/clear__accumulators_8h.html
@@ -82,7 +82,7 @@ $(function() {
 
 <p>Defines abstractions for efficiently clearing accumulator tiles.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&quot;</code><br />
 </div>
 <p><a href="clear__accumulators_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -104,7 +104,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/clear__accumulators_8h_source.html b/docs/clear__accumulators_8h_source.html
index 1a6f517fb..7c0423a5f 100644
--- a/docs/clear__accumulators_8h_source.html
+++ b/docs/clear__accumulators_8h_source.html
@@ -76,16 +76,17 @@ $(function() {
 <div class="title">clear_accumulators.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="clear__accumulators_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kLanes_ = 1&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">   40</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">SharedStorage</a> {};</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef">   43</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef">ClearAccumulators</a>(<a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">SharedStorage</a>&amp; shared_storage) {}</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">   47</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">clear</a>(Fragment_&amp; fragment) {</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;    fragment.clear();</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  }</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;};</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<a href="clear__accumulators_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kLanes_ = 1&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">   40</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">SharedStorage</a> {};</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef">   43</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef">ClearAccumulators</a>(<a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">SharedStorage</a>&amp; shared_storage) {}</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#aef1832b62ae8caef5e6d34cb1d1564e3">   46</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#aef1832b62ae8caef5e6d34cb1d1564e3">ClearAccumulators</a>() {}</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">   50</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">clear</a>(Fragment_&amp; fragment) {</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    fragment.clear();</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  }</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;};</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators.html">cutlass::gemm::ClearAccumulators</a></div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:38</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_html_a4ba07ea6d6fef961de1cb95b13c672ef"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef">cutlass::gemm::ClearAccumulators::ClearAccumulators</a></div><div class="ttdeci">CUTLASS_DEVICE ClearAccumulators(SharedStorage &amp;shared_storage)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:43</div></div>
 <div class="ttc" id="vector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div><div class="ttdoc">Defines a 1D vector of elements held in the registers of each thread. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_html_adb8026a19b09e9a581ec767c2c2da4ab"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">cutlass::gemm::ClearAccumulators::clear</a></div><div class="ttdeci">CUTLASS_DEVICE void clear(Fragment_ &amp;fragment)</div><div class="ttdoc">Clear the fragment. </div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:47</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_html_adb8026a19b09e9a581ec767c2c2da4ab"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">cutlass::gemm::ClearAccumulators::clear</a></div><div class="ttdeci">CUTLASS_DEVICE void clear(Fragment_ &amp;fragment)</div><div class="ttdoc">Clear the fragment. </div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:50</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">cutlass::gemm::ClearAccumulators::SharedStorage</a></div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:40</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_html_aef1832b62ae8caef5e6d34cb1d1564e3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators.html#aef1832b62ae8caef5e6d34cb1d1564e3">cutlass::gemm::ClearAccumulators::ClearAccumulators</a></div><div class="ttdeci">CUTLASS_DEVICE ClearAccumulators()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:46</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/complex_8h.html b/docs/complex_8h.html
new file mode 100644
index 000000000..e94494d21
--- /dev/null
+++ b/docs/complex_8h.html
@@ -0,0 +1,263 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: complex.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_c5917a9a879e9a6c73eaf5237444ab84.html">util</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a> &#124;
+<a href="#func-members">Functions</a>  </div>
+  <div class="headertitle">
+<div class="title">complex.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+<div class="textblock"><code>#include &lt;cuComplex.h&gt;</code><br />
+<code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+<code>#include &lt;iosfwd&gt;</code><br />
+</div>
+<p><a href="complex_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex&lt; T &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1platform"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html">cutlass::platform</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
+Functions</h2></td></tr>
+<tr class="memitem:a25a36d44c7b9f182eb404a3251cd4f39"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">cutlass::platform::real</a> (cuFloatComplex const &amp;z)</td></tr>
+<tr class="memdesc:a25a36d44c7b9f182eb404a3251cd4f39"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">More...</a><br /></td></tr>
+<tr class="separator:a25a36d44c7b9f182eb404a3251cd4f39"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa9b17e4705337452761c0d3bd5edfc67"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa9b17e4705337452761c0d3bd5edfc67">cutlass::platform::real</a> (cuFloatComplex &amp;z)</td></tr>
+<tr class="memdesc:aa9b17e4705337452761c0d3bd5edfc67"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="namespacecutlass_1_1platform.html#aa9b17e4705337452761c0d3bd5edfc67">More...</a><br /></td></tr>
+<tr class="separator:aa9b17e4705337452761c0d3bd5edfc67"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1f13c0049c5f94b0480c619612608f7b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a1f13c0049c5f94b0480c619612608f7b">cutlass::platform::real</a> (cuDoubleComplex const &amp;z)</td></tr>
+<tr class="memdesc:a1f13c0049c5f94b0480c619612608f7b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="namespacecutlass_1_1platform.html#a1f13c0049c5f94b0480c619612608f7b">More...</a><br /></td></tr>
+<tr class="separator:a1f13c0049c5f94b0480c619612608f7b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3365c0200a034973b7baecede9728239"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a3365c0200a034973b7baecede9728239">cutlass::platform::real</a> (cuDoubleComplex &amp;z)</td></tr>
+<tr class="memdesc:a3365c0200a034973b7baecede9728239"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="namespacecutlass_1_1platform.html#a3365c0200a034973b7baecede9728239">More...</a><br /></td></tr>
+<tr class="separator:a3365c0200a034973b7baecede9728239"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a18bc43cfdc4d066a6c10ad2002196ee6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">cutlass::platform::imag</a> (cuFloatComplex const &amp;z)</td></tr>
+<tr class="memdesc:a18bc43cfdc4d066a6c10ad2002196ee6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">More...</a><br /></td></tr>
+<tr class="separator:a18bc43cfdc4d066a6c10ad2002196ee6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af127cab494309510051d6b45914faf33"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#af127cab494309510051d6b45914faf33">cutlass::platform::imag</a> (cuFloatComplex &amp;z)</td></tr>
+<tr class="memdesc:af127cab494309510051d6b45914faf33"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="namespacecutlass_1_1platform.html#af127cab494309510051d6b45914faf33">More...</a><br /></td></tr>
+<tr class="separator:af127cab494309510051d6b45914faf33"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1739f880ca8398f808ee57a3f0c3c30b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a1739f880ca8398f808ee57a3f0c3c30b">cutlass::platform::imag</a> (cuDoubleComplex const &amp;z)</td></tr>
+<tr class="memdesc:a1739f880ca8398f808ee57a3f0c3c30b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="namespacecutlass_1_1platform.html#a1739f880ca8398f808ee57a3f0c3c30b">More...</a><br /></td></tr>
+<tr class="separator:a1739f880ca8398f808ee57a3f0c3c30b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f356af3c5828b7d31279a5d075c5bc9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a8f356af3c5828b7d31279a5d075c5bc9">cutlass::platform::imag</a> (cuDoubleComplex &amp;z)</td></tr>
+<tr class="memdesc:a8f356af3c5828b7d31279a5d075c5bc9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="namespacecutlass_1_1platform.html#a8f356af3c5828b7d31279a5d075c5bc9">More...</a><br /></td></tr>
+<tr class="separator:a8f356af3c5828b7d31279a5d075c5bc9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a01e98d1c13ac9384f2bdc407fce6131b"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a01e98d1c13ac9384f2bdc407fce6131b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const  &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a01e98d1c13ac9384f2bdc407fce6131b">cutlass::platform::real</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a01e98d1c13ac9384f2bdc407fce6131b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="namespacecutlass_1_1platform.html#a01e98d1c13ac9384f2bdc407fce6131b">More...</a><br /></td></tr>
+<tr class="separator:a01e98d1c13ac9384f2bdc407fce6131b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa5cfa5849e12b745236485dd2db5f854"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aa5cfa5849e12b745236485dd2db5f854"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa5cfa5849e12b745236485dd2db5f854">cutlass::platform::real</a> (complex&lt; T &gt; &amp;z)</td></tr>
+<tr class="memdesc:aa5cfa5849e12b745236485dd2db5f854"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="namespacecutlass_1_1platform.html#aa5cfa5849e12b745236485dd2db5f854">More...</a><br /></td></tr>
+<tr class="separator:aa5cfa5849e12b745236485dd2db5f854"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a714db927a811c86cda26fc12ca830356"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a714db927a811c86cda26fc12ca830356"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const  &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a714db927a811c86cda26fc12ca830356">cutlass::platform::imag</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a714db927a811c86cda26fc12ca830356"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="namespacecutlass_1_1platform.html#a714db927a811c86cda26fc12ca830356">More...</a><br /></td></tr>
+<tr class="separator:a714db927a811c86cda26fc12ca830356"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa35ea4f804f9ed39578b595ba2620c1d"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aa35ea4f804f9ed39578b595ba2620c1d"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa35ea4f804f9ed39578b595ba2620c1d">cutlass::platform::imag</a> (complex&lt; T &gt; &amp;z)</td></tr>
+<tr class="memdesc:aa35ea4f804f9ed39578b595ba2620c1d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="namespacecutlass_1_1platform.html#aa35ea4f804f9ed39578b595ba2620c1d">More...</a><br /></td></tr>
+<tr class="separator:aa35ea4f804f9ed39578b595ba2620c1d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab4c3e4eabba020d7a9faf86ee6cf437a"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ab4c3e4eabba020d7a9faf86ee6cf437a"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#ab4c3e4eabba020d7a9faf86ee6cf437a">cutlass::platform::operator&lt;&lt;</a> (std::ostream &amp;out, complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="separator:ab4c3e4eabba020d7a9faf86ee6cf437a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a043e8559161ee0fcaf943a1dfe1a9cbb"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a043e8559161ee0fcaf943a1dfe1a9cbb"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">cutlass::platform::operator==</a> (complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a043e8559161ee0fcaf943a1dfe1a9cbb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Equality operator.  <a href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">More...</a><br /></td></tr>
+<tr class="separator:a043e8559161ee0fcaf943a1dfe1a9cbb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa8b8911c3529ee9d433b0c4d90bde50c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aa8b8911c3529ee9d433b0c4d90bde50c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">cutlass::platform::operator!=</a> (complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:aa8b8911c3529ee9d433b0c4d90bde50c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Inequality operator.  <a href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">More...</a><br /></td></tr>
+<tr class="separator:aa8b8911c3529ee9d433b0c4d90bde50c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a93b0f0d73fa3cf11c5018460b257837c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a93b0f0d73fa3cf11c5018460b257837c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c">cutlass::platform::operator+</a> (complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a93b0f0d73fa3cf11c5018460b257837c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Addition.  <a href="namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c">More...</a><br /></td></tr>
+<tr class="separator:a93b0f0d73fa3cf11c5018460b257837c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa486433971cdd6b7648c1e5459c42763"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aa486433971cdd6b7648c1e5459c42763"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763">cutlass::platform::operator-</a> (complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:aa486433971cdd6b7648c1e5459c42763"><td class="mdescLeft">&#160;</td><td class="mdescRight">Subtraction.  <a href="namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763">More...</a><br /></td></tr>
+<tr class="separator:aa486433971cdd6b7648c1e5459c42763"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a34950f01ed89108b1d79c651aa58ecba"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a34950f01ed89108b1d79c651aa58ecba"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba">cutlass::platform::operator*</a> (complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a34950f01ed89108b1d79c651aa58ecba"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiplication.  <a href="namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba">More...</a><br /></td></tr>
+<tr class="separator:a34950f01ed89108b1d79c651aa58ecba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aef5da2c88431ab40b58fdd6afea13dba"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aef5da2c88431ab40b58fdd6afea13dba"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aef5da2c88431ab40b58fdd6afea13dba">cutlass::platform::operator*</a> (complex&lt; T &gt; const &amp;lhs, T const &amp;s)</td></tr>
+<tr class="memdesc:aef5da2c88431ab40b58fdd6afea13dba"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar Multiplication.  <a href="namespacecutlass_1_1platform.html#aef5da2c88431ab40b58fdd6afea13dba">More...</a><br /></td></tr>
+<tr class="separator:aef5da2c88431ab40b58fdd6afea13dba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a289b6e31bdc0be1302b8dbab55eb568c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a289b6e31bdc0be1302b8dbab55eb568c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a289b6e31bdc0be1302b8dbab55eb568c">cutlass::platform::operator*</a> (T const &amp;s, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a289b6e31bdc0be1302b8dbab55eb568c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar Multiplication.  <a href="namespacecutlass_1_1platform.html#a289b6e31bdc0be1302b8dbab55eb568c">More...</a><br /></td></tr>
+<tr class="separator:a289b6e31bdc0be1302b8dbab55eb568c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4fe79c19fb599cd9b85d08676a711f9f"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a4fe79c19fb599cd9b85d08676a711f9f"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">cutlass::platform::operator/</a> (complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a4fe79c19fb599cd9b85d08676a711f9f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Division.  <a href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">More...</a><br /></td></tr>
+<tr class="separator:a4fe79c19fb599cd9b85d08676a711f9f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a33f75d77ff629335c9666128837c4581"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a33f75d77ff629335c9666128837c4581"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a33f75d77ff629335c9666128837c4581">cutlass::platform::operator/</a> (complex&lt; T &gt; const &amp;lhs, T const &amp;s)</td></tr>
+<tr class="memdesc:a33f75d77ff629335c9666128837c4581"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar Division.  <a href="namespacecutlass_1_1platform.html#a33f75d77ff629335c9666128837c4581">More...</a><br /></td></tr>
+<tr class="separator:a33f75d77ff629335c9666128837c4581"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae302b414576ecb5afb0cdfdda6b30ad3"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ae302b414576ecb5afb0cdfdda6b30ad3"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#ae302b414576ecb5afb0cdfdda6b30ad3">cutlass::platform::operator/</a> (T const &amp;s, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:ae302b414576ecb5afb0cdfdda6b30ad3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar divided by complex.  <a href="namespacecutlass_1_1platform.html#ae302b414576ecb5afb0cdfdda6b30ad3">More...</a><br /></td></tr>
+<tr class="separator:ae302b414576ecb5afb0cdfdda6b30ad3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a34c5ca341da805d5d1bc703c53c96d9d"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a34c5ca341da805d5d1bc703c53c96d9d"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d">cutlass::platform::operator+=</a> (complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a34c5ca341da805d5d1bc703c53c96d9d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Addition.  <a href="namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d">More...</a><br /></td></tr>
+<tr class="separator:a34c5ca341da805d5d1bc703c53c96d9d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abff9e10130849ea46f6245f4e8cc2cc9"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:abff9e10130849ea46f6245f4e8cc2cc9"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9">cutlass::platform::operator-=</a> (complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:abff9e10130849ea46f6245f4e8cc2cc9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Subtraction.  <a href="namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9">More...</a><br /></td></tr>
+<tr class="separator:abff9e10130849ea46f6245f4e8cc2cc9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9a4928ab582beee4e7ddd337529d45ac"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a9a4928ab582beee4e7ddd337529d45ac"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac">cutlass::platform::operator*=</a> (complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a9a4928ab582beee4e7ddd337529d45ac"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiplication.  <a href="namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac">More...</a><br /></td></tr>
+<tr class="separator:a9a4928ab582beee4e7ddd337529d45ac"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a21adde191e48e604908ce886690c6d6b"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a21adde191e48e604908ce886690c6d6b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a21adde191e48e604908ce886690c6d6b">cutlass::platform::operator*=</a> (complex&lt; T &gt; &amp;lhs, T s)</td></tr>
+<tr class="memdesc:a21adde191e48e604908ce886690c6d6b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar multiplication.  <a href="namespacecutlass_1_1platform.html#a21adde191e48e604908ce886690c6d6b">More...</a><br /></td></tr>
+<tr class="separator:a21adde191e48e604908ce886690c6d6b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac594526ef64ecf364ae957753ce64b40"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ac594526ef64ecf364ae957753ce64b40"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40">cutlass::platform::operator/=</a> (complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:ac594526ef64ecf364ae957753ce64b40"><td class="mdescLeft">&#160;</td><td class="mdescRight">Division.  <a href="namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40">More...</a><br /></td></tr>
+<tr class="separator:ac594526ef64ecf364ae957753ce64b40"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1fbf209c41242b3f605ac220c39e8fd5"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a1fbf209c41242b3f605ac220c39e8fd5"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5">cutlass::platform::abs</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a1fbf209c41242b3f605ac220c39e8fd5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the magnitude of the complex number.  <a href="namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5">More...</a><br /></td></tr>
+<tr class="separator:a1fbf209c41242b3f605ac220c39e8fd5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8a1a03766dbd2c2ce10b10498f281bf0"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a8a1a03766dbd2c2ce10b10498f281bf0"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0">cutlass::platform::arg</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a8a1a03766dbd2c2ce10b10498f281bf0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the magnitude of the complex number.  <a href="namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0">More...</a><br /></td></tr>
+<tr class="separator:a8a1a03766dbd2c2ce10b10498f281bf0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9d631b040eea94d9b5af04faa5c20bb1"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a9d631b040eea94d9b5af04faa5c20bb1"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">cutlass::platform::norm</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a9d631b040eea94d9b5af04faa5c20bb1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the squared magnitude.  <a href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">More...</a><br /></td></tr>
+<tr class="separator:a9d631b040eea94d9b5af04faa5c20bb1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7167baf0f7fcf52471c0413f084d98d4"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a7167baf0f7fcf52471c0413f084d98d4"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4">cutlass::platform::conj</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a7167baf0f7fcf52471c0413f084d98d4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the complex conjugate.  <a href="namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4">More...</a><br /></td></tr>
+<tr class="separator:a7167baf0f7fcf52471c0413f084d98d4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4e57cfad9bf0b78e338d536ff1bdda39"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a4e57cfad9bf0b78e338d536ff1bdda39"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39">cutlass::platform::proj</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a4e57cfad9bf0b78e338d536ff1bdda39"><td class="mdescLeft">&#160;</td><td class="mdescRight">Projects the complex number z onto the Riemann sphere.  <a href="namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39">More...</a><br /></td></tr>
+<tr class="separator:a4e57cfad9bf0b78e338d536ff1bdda39"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6c9200b03868a5090027e5cfc8e27c62"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a6c9200b03868a5090027e5cfc8e27c62"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62">cutlass::platform::polar</a> (T const &amp;r, T const &amp;theta=T())</td></tr>
+<tr class="memdesc:a6c9200b03868a5090027e5cfc8e27c62"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a complex number with magnitude r and phase theta.  <a href="namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62">More...</a><br /></td></tr>
+<tr class="separator:a6c9200b03868a5090027e5cfc8e27c62"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1a6ab5742404272f76faeaf22f3ec11b"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a1a6ab5742404272f76faeaf22f3ec11b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">cutlass::platform::exp</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a1a6ab5742404272f76faeaf22f3ec11b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the complex exponential of z.  <a href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">More...</a><br /></td></tr>
+<tr class="separator:a1a6ab5742404272f76faeaf22f3ec11b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adc1afc18e182f42f72210e2203ba293c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:adc1afc18e182f42f72210e2203ba293c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">cutlass::platform::log</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:adc1afc18e182f42f72210e2203ba293c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the complex exponential of z.  <a href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">More...</a><br /></td></tr>
+<tr class="separator:adc1afc18e182f42f72210e2203ba293c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a62dd6ae0e1b4476fd62ac70c26f12a06"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a62dd6ae0e1b4476fd62ac70c26f12a06"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06">cutlass::platform::log10</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a62dd6ae0e1b4476fd62ac70c26f12a06"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the complex exponential of z.  <a href="namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06">More...</a><br /></td></tr>
+<tr class="separator:a62dd6ae0e1b4476fd62ac70c26f12a06"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a81308ccea406262e143e27193cbdf747"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a81308ccea406262e143e27193cbdf747"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">cutlass::platform::sqrt</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a81308ccea406262e143e27193cbdf747"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the square root of complex number z.  <a href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">More...</a><br /></td></tr>
+<tr class="separator:a81308ccea406262e143e27193cbdf747"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae0ad2891ed2be526d97bc5665d5c0a92"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ae0ad2891ed2be526d97bc5665d5c0a92"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">cutlass::platform::cos</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:ae0ad2891ed2be526d97bc5665d5c0a92"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the cosine of complex z.  <a href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">More...</a><br /></td></tr>
+<tr class="separator:ae0ad2891ed2be526d97bc5665d5c0a92"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3c5dc10135c54b3b212c9e107ba1476a"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a3c5dc10135c54b3b212c9e107ba1476a"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> complex&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">cutlass::platform::sin</a> (complex&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a3c5dc10135c54b3b212c9e107ba1476a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the sin of complex z.  <a href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">More...</a><br /></td></tr>
+<tr class="separator:a3c5dc10135c54b3b212c9e107ba1476a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/complex_8h_source.html b/docs/complex_8h_source.html
new file mode 100644
index 000000000..6270d22da
--- /dev/null
+++ b/docs/complex_8h_source.html
@@ -0,0 +1,123 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: complex.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_c5917a9a879e9a6c73eaf5237444ab84.html">util</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">complex.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="complex_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;</div><div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="preprocessor">#include &lt;cuComplex.h&gt;</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#include &lt;iosfwd&gt;</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00032"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html">   32</a></span>&#160;<span class="keyword">namespace </span>platform {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment">// Accessors for CUDA complex types</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">   44</a></span>&#160;<span class="keywordtype">float</span> <span class="keyword">const</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(cuFloatComplex <span class="keyword">const</span> &amp;z) { <span class="keywordflow">return</span> z.x; }</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#aa9b17e4705337452761c0d3bd5edfc67">   50</a></span>&#160;<span class="keywordtype">float</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(cuFloatComplex &amp;z) { <span class="keywordflow">return</span> z.x; }</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a1f13c0049c5f94b0480c619612608f7b">   56</a></span>&#160;<span class="keywordtype">double</span> <span class="keyword">const</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(cuDoubleComplex <span class="keyword">const</span> &amp;z) { <span class="keywordflow">return</span> z.x; }</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a3365c0200a034973b7baecede9728239">   62</a></span>&#160;<span class="keywordtype">double</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(cuDoubleComplex &amp;z) { <span class="keywordflow">return</span> z.x; }</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">   68</a></span>&#160;<span class="keywordtype">float</span> <span class="keyword">const</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(cuFloatComplex <span class="keyword">const</span> &amp;z) { <span class="keywordflow">return</span> z.y; }</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#af127cab494309510051d6b45914faf33">   74</a></span>&#160;<span class="keywordtype">float</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(cuFloatComplex &amp;z) { <span class="keywordflow">return</span> z.y; }</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a1739f880ca8398f808ee57a3f0c3c30b">   80</a></span>&#160;<span class="keywordtype">double</span> <span class="keyword">const</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(cuDoubleComplex <span class="keyword">const</span> &amp;z) { <span class="keywordflow">return</span> z.y; }</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a8f356af3c5828b7d31279a5d075c5bc9">   86</a></span>&#160;<span class="keywordtype">double</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(cuDoubleComplex &amp;z) { <span class="keywordflow">return</span> z.y; }</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html">   93</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1platform_1_1complex.html">complex</a> {</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">   96</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">value_type</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  T _real;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  T _imag;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="comment">// Methods</span></div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00118"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#a2e852c886e61a39e884026d6f4c32c1e">  118</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1complex.html#a2e852c886e61a39e884026d6f4c32c1e">complex</a>(T r = T(0), T i = T(0)) : _real(r), _imag(i) {}</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#a71ee9d620f72fbcd54f6e3049707eb99">  124</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1complex.html#a71ee9d620f72fbcd54f6e3049707eb99">complex</a>(cuFloatComplex <span class="keyword">const</span> &amp;z) : _real(platform::<a class="code" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">real</a>(z)), _imag(platform::<a class="code" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">imag</a>(z)) {}</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00130"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#af40324ec4d1d35a0ceda676c8de968f8">  130</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1complex.html#af40324ec4d1d35a0ceda676c8de968f8">complex</a>(cuDoubleComplex <span class="keyword">const</span> &amp;z) : _real(platform::<a class="code" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">real</a>(z)), _imag(platform::<a class="code" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">imag</a>(z)) {}</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">  136</a></span>&#160;  T <span class="keyword">const</span> &amp;<a class="code" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">real</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> _real; }</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00142"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#acda3e2050b2fefb1aca1fa8aa2063f8b">  142</a></span>&#160;  T &amp;<a class="code" href="classcutlass_1_1platform_1_1complex.html#acda3e2050b2fefb1aca1fa8aa2063f8b">real</a>() { <span class="keywordflow">return</span> _real; }</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">  148</a></span>&#160;  T <span class="keyword">const</span> &amp;<a class="code" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">imag</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> _imag; }</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#a835363f62c6a079496c22074ab428651">  154</a></span>&#160;  T &amp;<a class="code" href="classcutlass_1_1platform_1_1complex.html#a835363f62c6a079496c22074ab428651">imag</a>() { <span class="keywordflow">return</span> _imag; }</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#ac5a3a0dc9815dadbe539312eb6fe36c4">  160</a></span>&#160;  <span class="keyword">operator</span> cuFloatComplex()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> make_cuFloatComplex(<a class="code" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">real</a>(), <a class="code" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">imag</a>()); }</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1complex.html#a3b92e54de1c4262c7e481218162be7ec">  166</a></span>&#160;  <span class="keyword">operator</span> cuDoubleComplex()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> make_cuDoubleComplex(<a class="code" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">real</a>(), <a class="code" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">imag</a>()); }</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;};</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;<span class="comment">// Accessors for complex template</span></div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00177"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a01e98d1c13ac9384f2bdc407fce6131b">  177</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <span class="keyword">const</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  <span class="keywordflow">return</span> z.<a class="code" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">real</a>();</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;}</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#aa5cfa5849e12b745236485dd2db5f854">  185</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;z) {</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;  <span class="keywordflow">return</span> z.<a class="code" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">real</a>();</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;}</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00193"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a714db927a811c86cda26fc12ca830356">  193</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <span class="keyword">const</span> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  <span class="keywordflow">return</span> z.<a class="code" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">imag</a>();</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;}</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#aa35ea4f804f9ed39578b595ba2620c1d">  201</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;z) {</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;  <span class="keywordflow">return</span> z.<a class="code" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">imag</a>();</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;}</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;<span class="comment">// Output operators</span></div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00210"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ab4c3e4eabba020d7a9faf86ee6cf437a">  210</a></span>&#160;std::ostream &amp;operator&lt;&lt;(std::ostream &amp;out, complex&lt;T&gt; <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  T _r = <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z);</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;  T _i = <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z);</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;  <span class="keywordflow">return</span> out &lt;&lt; _r &lt;&lt; <span class="stringliteral">&quot;+i&quot;</span> &lt;&lt; _i;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;}</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;<span class="comment">// Non-member operators defined for complex types</span></div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">  224</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">operator==</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(lhs) == (rhs) &amp;&amp; <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(lhs) == <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs);</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;}</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00232"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">  232</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">operator!=</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;  <span class="keywordflow">return</span> !(lhs == rhs);</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;}</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00240"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c">  240</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c">operator+</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(lhs) + <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(rhs), <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(lhs) + <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs));</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;}</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00248"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763">  248</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763">operator-</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(lhs) - <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(rhs), <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(lhs) - <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs));</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;}</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00256"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba">  256</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba">operator*</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(lhs) * <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(rhs) - <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(lhs) * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs),</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;                    <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(lhs) * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs) + <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(lhs) * <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(rhs));</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;}</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00265"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#aef5da2c88431ab40b58fdd6afea13dba">  265</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba">operator*</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;lhs, T <span class="keyword">const</span> &amp;s) {</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(lhs) * s, <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(lhs) * s);</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;}</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00273"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a289b6e31bdc0be1302b8dbab55eb568c">  273</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba">operator*</a>(T <span class="keyword">const</span> &amp;s, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(s * <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(rhs), s * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs));</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;}</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00281"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">  281</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">operator/</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;  T d = (<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(rhs) * (rhs) + <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs) * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs));</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>((<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(lhs) * (rhs) + <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(lhs) * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs)) / d,</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;                    (<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(lhs) * (rhs)-<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(lhs) * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs)) / d);</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;}</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00292"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a33f75d77ff629335c9666128837c4581">  292</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">operator/</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;lhs, T <span class="keyword">const</span> &amp;s) {</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(lhs) / s, <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(lhs) / s);</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;}</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ae302b414576ecb5afb0cdfdda6b30ad3">  300</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">operator/</a>(T <span class="keyword">const</span> &amp;s, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;  T d = (<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(rhs) * (rhs) + <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs) * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs));</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>((s * (rhs)) / d, -(s * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(rhs)) / d);</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;}</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00310"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d">  310</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d">operator+=</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;  lhs = (lhs + rhs);</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;  <span class="keywordflow">return</span> lhs;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;}</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00319"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9">  319</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;<a class="code" href="namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9">operator-=</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;  lhs = (lhs - rhs);</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;  <span class="keywordflow">return</span> lhs;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;}</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00328"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac">  328</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac">operator*=</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;  lhs = (lhs * rhs);</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;  <span class="keywordflow">return</span> lhs;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;}</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00337"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a21adde191e48e604908ce886690c6d6b">  337</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;<a class="code" href="namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac">operator*=</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;lhs, T s) {</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;  lhs = (lhs * s);</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;  <span class="keywordflow">return</span> lhs;</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;}</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00346"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40">  346</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;<a class="code" href="namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40">operator/=</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> &amp;lhs, <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;rhs) {</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;  lhs = (lhs / rhs);</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;  <span class="keywordflow">return</span> lhs;</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;}</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;<span class="comment">// Non-member functions defined for complex numbers</span></div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00359"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5">  359</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="code" href="namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5">abs</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">sqrt</a>(<a class="code" href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">norm</a>(z));</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;}</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00367"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0">  367</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="code" href="namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0">arg</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;  <span class="keywordflow">return</span> atan2(<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z), <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z));</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;}</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00375"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">  375</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="code" href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">norm</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z) * <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z) + <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z) * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z);</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;}</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00383"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4">  383</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4">conj</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z), -<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z));</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;}</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00391"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39">  391</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39">proj</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;  T d = <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z) * <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z) + <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z) * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z) + T(1);</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>((T(2) * <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z)) / d, (T(2) * <a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z)) / d);</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;}</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00400"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62">  400</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62">polar</a>(T <span class="keyword">const</span> &amp;r, T <span class="keyword">const</span> &amp;theta = T()) {</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(r * <a class="code" href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">cos</a>(theta), r * <a class="code" href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">sin</a>(theta));</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;}</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00408"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">  408</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">exp</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(<a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z) * <a class="code" href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">cos</a>(<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z)), <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z) * <a class="code" href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">sin</a>(<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z)));</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;}</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00416"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">  416</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">log</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(<a class="code" href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">log</a>(<a class="code" href="namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5">abs</a>(z)), <a class="code" href="namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0">arg</a>(z));</div><div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;}</div><div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;</div><div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00424"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06">  424</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06">log10</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">log</a>(z) / T(<a class="code" href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">log</a>(T(10)));</div><div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;}</div><div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;</div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00432"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">  432</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">sqrt</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">sqrt</a>(T(2)) / T(2) *</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;         <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(<a class="code" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">sqrt</a>(<a class="code" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">sqrt</a>(<a class="code" href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">norm</a>(z)) + <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z)),</div><div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;                    (<a class="code" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a>(z) &lt; 0 ? T(-1) : T(1)) * <a class="code" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">sqrt</a>(<a class="code" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">sqrt</a>(<a class="code" href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">norm</a>(z)) - <a class="code" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a>(z)));</div><div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;}</div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;</div><div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00442"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">  442</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">cos</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;  <span class="keywordflow">return</span> (<a class="code" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">exp</a>(z) + <a class="code" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">exp</a>(-z)) / T(2);</div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;}</div><div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;<span class="preprocessor">#pragma hd_warning_disable  // Suppresses warnings when attempting to instantiate complex&lt;T&gt; with a</span></div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;                            <span class="comment">// host-only type</span></div><div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00450"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">  450</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">sin</a>(<a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a> <span class="keyword">const</span> &amp;z) {</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;  <span class="keywordflow">return</span> (<a class="code" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">exp</a>(-z) - <a class="code" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">exp</a>(z)) * <a class="code" href="classcutlass_1_1platform_1_1complex.html">complex&lt;T&gt;</a>(T(0), T(1) / T(2));</div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;}</div><div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;}  <span class="comment">// namespace platform</span></div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_1_1platform_html_a4e57cfad9bf0b78e338d536ff1bdda39"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39">cutlass::platform::proj</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; proj(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Projects the complex number z onto the Riemann sphere. </div><div class="ttdef"><b>Definition:</b> complex.h:391</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1complex_html_a835363f62c6a079496c22074ab428651"><div class="ttname"><a href="classcutlass_1_1platform_1_1complex.html#a835363f62c6a079496c22074ab428651">cutlass::platform::complex::imag</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T &amp; imag()</div><div class="ttdoc">Accesses the imaginary part of the complex number. </div><div class="ttdef"><b>Definition:</b> complex.h:154</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a043e8559161ee0fcaf943a1dfe1a9cbb"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">cutlass::platform::operator==</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator==(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Equality operator. </div><div class="ttdef"><b>Definition:</b> complex.h:224</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1complex_html_a57360dbcada12083ecb92fba32fae801"><div class="ttname"><a href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">cutlass::platform::complex::imag</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T const  &amp; imag() const</div><div class="ttdoc">Accesses the imaginary part of the complex number. </div><div class="ttdef"><b>Definition:</b> complex.h:148</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a34950f01ed89108b1d79c651aa58ecba"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba">cutlass::platform::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; operator*(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Multiplication. </div><div class="ttdef"><b>Definition:</b> complex.h:256</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_abff9e10130849ea46f6245f4e8cc2cc9"><div class="ttname"><a href="namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9">cutlass::platform::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; &amp; operator-=(complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Subtraction. </div><div class="ttdef"><b>Definition:</b> complex.h:319</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_aa486433971cdd6b7648c1e5459c42763"><div class="ttname"><a href="namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763">cutlass::platform::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; operator-(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Subtraction. </div><div class="ttdef"><b>Definition:</b> complex.h:248</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1complex_html_acda3e2050b2fefb1aca1fa8aa2063f8b"><div class="ttname"><a href="classcutlass_1_1platform_1_1complex.html#acda3e2050b2fefb1aca1fa8aa2063f8b">cutlass::platform::complex::real</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T &amp; real()</div><div class="ttdoc">Accesses the real part of the complex number. </div><div class="ttdef"><b>Definition:</b> complex.h:142</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a25a36d44c7b9f182eb404a3251cd4f39"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">cutlass::platform::real</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE float const  &amp; real(cuFloatComplex const &amp;z)</div><div class="ttdoc">Returns the real part of the complex number. </div><div class="ttdef"><b>Definition:</b> complex.h:44</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a3c5dc10135c54b3b212c9e107ba1476a"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">cutlass::platform::sin</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; sin(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Computes the sin of complex z. </div><div class="ttdef"><b>Definition:</b> complex.h:450</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1complex_html_a71ee9d620f72fbcd54f6e3049707eb99"><div class="ttname"><a href="classcutlass_1_1platform_1_1complex.html#a71ee9d620f72fbcd54f6e3049707eb99">cutlass::platform::complex::complex</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex(cuFloatComplex const &amp;z)</div><div class="ttdoc">Conversion from cuFloatComplex. </div><div class="ttdef"><b>Definition:</b> complex.h:124</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_ae0ad2891ed2be526d97bc5665d5c0a92"><div class="ttname"><a href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">cutlass::platform::cos</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; cos(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Computes the cosine of complex z. </div><div class="ttdef"><b>Definition:</b> complex.h:442</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a93b0f0d73fa3cf11c5018460b257837c"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c">cutlass::platform::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; operator+(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Addition. </div><div class="ttdef"><b>Definition:</b> complex.h:240</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a6c9200b03868a5090027e5cfc8e27c62"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62">cutlass::platform::polar</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; polar(T const &amp;r, T const &amp;theta=T())</div><div class="ttdoc">Returns a complex number with magnitude r and phase theta. </div><div class="ttdef"><b>Definition:</b> complex.h:400</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1complex_html_ab06cbc1eefd47df3d3748d42d6d95974"><div class="ttname"><a href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">cutlass::platform::complex::real</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T const  &amp; real() const</div><div class="ttdoc">Accesses the real part of the complex number. </div><div class="ttdef"><b>Definition:</b> complex.h:136</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_ac594526ef64ecf364ae957753ce64b40"><div class="ttname"><a href="namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40">cutlass::platform::operator/=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; &amp; operator/=(complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Division. </div><div class="ttdef"><b>Definition:</b> complex.h:346</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a81308ccea406262e143e27193cbdf747"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">cutlass::platform::sqrt</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; sqrt(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Computes the square root of complex number z. </div><div class="ttdef"><b>Definition:</b> complex.h:432</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a34c5ca341da805d5d1bc703c53c96d9d"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d">cutlass::platform::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; &amp; operator+=(complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Addition. </div><div class="ttdef"><b>Definition:</b> complex.h:310</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a18bc43cfdc4d066a6c10ad2002196ee6"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">cutlass::platform::imag</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE float const  &amp; imag(cuFloatComplex const &amp;z)</div><div class="ttdoc">Returns the imaginary part of the complex number. </div><div class="ttdef"><b>Definition:</b> complex.h:68</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a1a6ab5742404272f76faeaf22f3ec11b"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">cutlass::platform::exp</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; exp(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Computes the complex exponential of z. </div><div class="ttdef"><b>Definition:</b> complex.h:408</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a62dd6ae0e1b4476fd62ac70c26f12a06"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06">cutlass::platform::log10</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; log10(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Computes the complex exponential of z. </div><div class="ttdef"><b>Definition:</b> complex.h:424</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a9d631b040eea94d9b5af04faa5c20bb1"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">cutlass::platform::norm</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T norm(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Returns the squared magnitude. </div><div class="ttdef"><b>Definition:</b> complex.h:375</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_aa8b8911c3529ee9d433b0c4d90bde50c"><div class="ttname"><a href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">cutlass::platform::operator!=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator!=(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Inequality operator. </div><div class="ttdef"><b>Definition:</b> complex.h:232</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a1fbf209c41242b3f605ac220c39e8fd5"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5">cutlass::platform::abs</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T abs(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Returns the magnitude of the complex number. </div><div class="ttdef"><b>Definition:</b> complex.h:359</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a9a4928ab582beee4e7ddd337529d45ac"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac">cutlass::platform::operator*=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; &amp; operator*=(complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Multiplication. </div><div class="ttdef"><b>Definition:</b> complex.h:328</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1complex_html_af40324ec4d1d35a0ceda676c8de968f8"><div class="ttname"><a href="classcutlass_1_1platform_1_1complex.html#af40324ec4d1d35a0ceda676c8de968f8">cutlass::platform::complex::complex</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex(cuDoubleComplex const &amp;z)</div><div class="ttdoc">Conversion from cuDoubleComplex. </div><div class="ttdef"><b>Definition:</b> complex.h:130</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a8a1a03766dbd2c2ce10b10498f281bf0"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0">cutlass::platform::arg</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T arg(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Returns the magnitude of the complex number. </div><div class="ttdef"><b>Definition:</b> complex.h:367</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1complex_html_a2e852c886e61a39e884026d6f4c32c1e"><div class="ttname"><a href="classcutlass_1_1platform_1_1complex.html#a2e852c886e61a39e884026d6f4c32c1e">cutlass::platform::complex::complex</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex(T r=T(0), T i=T(0))</div><div class="ttdoc">Constructor. </div><div class="ttdef"><b>Definition:</b> complex.h:118</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1complex_html"><div class="ttname"><a href="classcutlass_1_1platform_1_1complex.html">cutlass::platform::complex</a></div><div class="ttdef"><b>Definition:</b> complex.h:93</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_adc1afc18e182f42f72210e2203ba293c"><div class="ttname"><a href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">cutlass::platform::log</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; log(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Computes the complex exponential of z. </div><div class="ttdef"><b>Definition:</b> complex.h:416</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1complex_html_aa7c319b0c67f8ffeee3d1bb4b83ea0d6"><div class="ttname"><a href="classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">cutlass::platform::complex::value_type</a></div><div class="ttdeci">T value_type</div><div class="ttdoc">Type alias for scalar type. </div><div class="ttdef"><b>Definition:</b> complex.h:96</div></div>
+<div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a4fe79c19fb599cd9b85d08676a711f9f"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">cutlass::platform::operator/</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; operator/(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Division. </div><div class="ttdef"><b>Definition:</b> complex.h:281</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a7167baf0f7fcf52471c0413f084d98d4"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4">cutlass::platform::conj</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE complex&lt; T &gt; conj(complex&lt; T &gt; const &amp;z)</div><div class="ttdoc">Returns the complex conjugate. </div><div class="ttdef"><b>Definition:</b> complex.h:383</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/convert_8h.html b/docs/convert_8h.html
index 422c52017..cd3bf4bb8 100644
--- a/docs/convert_8h.html
+++ b/docs/convert_8h.html
@@ -82,7 +82,7 @@ $(function() {
 
 <p>Defines conversion operations among Fragments of different base type.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
 </div>
 <p><a href="convert_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -103,7 +103,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/convert_8h_source.html b/docs/convert_8h_source.html
index 6e877d293..22ec9d4b8 100644
--- a/docs/convert_8h_source.html
+++ b/docs/convert_8h_source.html
@@ -76,7 +76,7 @@ $(function() {
 <div class="title">convert.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="convert_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno"><a class="line" href="namespacecutlass.html">   33</a></span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputFragment_, <span class="keyword">typename</span> OutputFragment_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Convert.html">Convert</a> {};</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputScalar_, <span class="keyword">typename</span> OutputScalar_, <span class="keywordtype">int</span> kScalars_&gt;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html">   43</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Convert.html">Convert</a>&lt;<a class="code" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;InputScalar_, kScalars_&gt;, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;OutputScalar_, kScalars_&gt; &gt; {</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e">   45</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;InputScalar_, kScalars_&gt;</a> <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e">InputFragment</a>;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a">   47</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;OutputScalar_, kScalars_&gt;</a> <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a">OutputFragment</a>;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f">   50</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f">Convert</a>() {}</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685">   53</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685">transform</a>(<a class="code" href="structcutlass_1_1Fragment.html">InputFragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    transform(src, 0, dst);</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  }</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#aa9fe67c947bf461ba3e3ca48daa34815">   59</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#aa9fe67c947bf461ba3e3ca48daa34815">transform</a>(Fragment_ <span class="keyword">const</span>&amp; src, <span class="keywordtype">int</span> offset, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; kScalars_; ++i) {</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      dst[i] = <span class="keyword">static_cast&lt;</span>OutputScalar_<span class="keyword">&gt;</span>(src[i + offset]);</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;    }</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  }</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;};</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html">   69</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Copy.html">Copy</a> {</div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#aed254bbc1ad94ed9d335ab02f199ceb1">   71</a></span>&#160;  <span class="keyword">typedef</span> Fragment_ <a class="code" href="structcutlass_1_1Copy.html#aed254bbc1ad94ed9d335ab02f199ceb1">InputFragment</a>;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#a545be6c284d625b0841a10cc9126e14a">   73</a></span>&#160;  <span class="keyword">typedef</span> Fragment_ <a class="code" href="structcutlass_1_1Copy.html#a545be6c284d625b0841a10cc9126e14a">OutputFragment</a>;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1">   76</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1">Copy</a>() {}</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3">   79</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3">transform</a>(Fragment_ <span class="keyword">const</span>&amp; src, Fragment_&amp; dst) { <a class="code" href="structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3">transform</a>(src, 0, dst); }</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputFragment_&gt;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#a171f9a44c05b6fb432b0339979de4eb2">   83</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Copy.html#a171f9a44c05b6fb432b0339979de4eb2">transform</a>(InputFragment_ <span class="keyword">const</span>&amp; src, <span class="keywordtype">int</span> offset, Fragment_&amp; dst) {</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="keywordflow">if</span> (<span class="keyword">sizeof</span>(<span class="keyword">typename</span> Fragment_::Element) == 8) {</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      uint64_t <span class="keyword">const</span>* src_ptr = <span class="keyword">reinterpret_cast&lt;</span>uint64_t const*<span class="keyword">&gt;</span>(&amp;src[offset]);</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      uint64_t* dst_ptr = <span class="keyword">reinterpret_cast&lt;</span>uint64_t*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <span class="keyword">sizeof</span>(Fragment_) / 8; ++i) {</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;        dst_ptr[i] = src_ptr[i];</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;      }</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;      uint32_t <span class="keyword">const</span>* src_ptr = <span class="keyword">reinterpret_cast&lt;</span>uint32_t const*<span class="keyword">&gt;</span>(&amp;src[offset]);</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;      uint32_t* dst_ptr = <span class="keyword">reinterpret_cast&lt;</span>uint32_t*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <span class="keyword">sizeof</span>(Fragment_) / 4; ++i) {</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;        dst_ptr[i] = src_ptr[i];</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;      }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    }</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  }</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;};</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<a href="convert_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno"><a class="line" href="namespacecutlass.html">   33</a></span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputFragment_, <span class="keyword">typename</span> OutputFragment_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Convert.html">Convert</a> {};</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputScalar_, <span class="keyword">typename</span> OutputScalar_, <span class="keywordtype">int</span> kScalars_&gt;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html">   43</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Convert.html">Convert</a>&lt;<a class="code" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;InputScalar_, kScalars_&gt;, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;OutputScalar_, kScalars_&gt; &gt; {</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e">   45</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;InputScalar_, kScalars_&gt;</a> <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e">InputFragment</a>;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a">   47</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;OutputScalar_, kScalars_&gt;</a> <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a">OutputFragment</a>;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f">   50</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f">Convert</a>() {}</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685">   53</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685">transform</a>(<a class="code" href="structcutlass_1_1Fragment.html">InputFragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    transform(src, 0, dst);</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  }</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#aa9fe67c947bf461ba3e3ca48daa34815">   59</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#aa9fe67c947bf461ba3e3ca48daa34815">transform</a>(Fragment_ <span class="keyword">const</span>&amp; src, <span class="keywordtype">int</span> offset, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; kScalars_; ++i) {</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      dst[i] = <span class="keyword">static_cast&lt;</span>OutputScalar_<span class="keyword">&gt;</span>(src[i + offset]);</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;    }</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  }</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;};</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html">   69</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Copy.html">Copy</a> {</div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#aed254bbc1ad94ed9d335ab02f199ceb1">   71</a></span>&#160;  <span class="keyword">typedef</span> Fragment_ <a class="code" href="structcutlass_1_1Copy.html#aed254bbc1ad94ed9d335ab02f199ceb1">InputFragment</a>;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#a545be6c284d625b0841a10cc9126e14a">   73</a></span>&#160;  <span class="keyword">typedef</span> Fragment_ <a class="code" href="structcutlass_1_1Copy.html#a545be6c284d625b0841a10cc9126e14a">OutputFragment</a>;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1">   76</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1">Copy</a>() {}</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3">   79</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3">transform</a>(Fragment_ <span class="keyword">const</span>&amp; src, Fragment_&amp; dst) { <a class="code" href="structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3">transform</a>(src, 0, dst); }</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputFragment_&gt;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1Copy.html#a171f9a44c05b6fb432b0339979de4eb2">   83</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Copy.html#a171f9a44c05b6fb432b0339979de4eb2">transform</a>(InputFragment_ <span class="keyword">const</span>&amp; src, <span class="keywordtype">int</span> offset, Fragment_&amp; dst) {</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="keywordflow">if</span> (<span class="keyword">sizeof</span>(<span class="keyword">typename</span> Fragment_::Element) == 8) {</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      uint64_t <span class="keyword">const</span>* src_ptr = <span class="keyword">reinterpret_cast&lt;</span>uint64_t const*<span class="keyword">&gt;</span>(&amp;src[offset]);</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      uint64_t* dst_ptr = <span class="keyword">reinterpret_cast&lt;</span>uint64_t*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <span class="keyword">sizeof</span>(Fragment_) / 8; ++i) {</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;        dst_ptr[i] = src_ptr[i];</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;      }</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;      uint32_t <span class="keyword">const</span>* src_ptr = <span class="keyword">reinterpret_cast&lt;</span>uint32_t const*<span class="keyword">&gt;</span>(&amp;src[offset]);</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;      uint32_t* dst_ptr = <span class="keyword">reinterpret_cast&lt;</span>uint32_t*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <span class="keyword">sizeof</span>(Fragment_) / 4; ++i) {</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;        dst_ptr[i] = src_ptr[i];</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;      }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    }</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  }</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;};</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121_html_a8ef69ab595489e142911e8e240fb405a"><div class="ttname"><a href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::OutputFragment</a></div><div class="ttdeci">Fragment&lt; OutputScalar_, kScalars_ &gt; OutputFragment</div><div class="ttdoc">The output fragment. </div><div class="ttdef"><b>Definition:</b> convert.h:47</div></div>
 <div class="ttc" id="structcutlass_1_1Copy_html"><div class="ttname"><a href="structcutlass_1_1Copy.html">cutlass::Copy</a></div><div class="ttdef"><b>Definition:</b> convert.h:69</div></div>
 <div class="ttc" id="structcutlass_1_1Copy_html_ab356f0f473aa3fd8df8fb8ddd8e0e9f3"><div class="ttname"><a href="structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3">cutlass::Copy::transform</a></div><div class="ttdeci">CUTLASS_DEVICE void transform(Fragment_ const &amp;src, Fragment_ &amp;dst)</div><div class="ttdoc">Transform a fragment. </div><div class="ttdef"><b>Definition:</b> convert.h:79</div></div>
@@ -94,7 +94,7 @@ $(function() {
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/coord_8h.html b/docs/coord_8h.html
index 516503867..8bb9bea4d 100644
--- a/docs/coord_8h.html
+++ b/docs/coord_8h.html
@@ -83,7 +83,8 @@ $(function() {
 
 <p>A Coord is a coordinate of arbitrary rank into a tensor or matrix.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&quot;</code><br />
 </div>
 <p><a href="coord_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -92,7 +93,7 @@ Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Identity.html">cutlass::Identity</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Describes identity elements.  <a href="structcutlass_1_1Identity.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Statically-sized array specifying Coords within a tensor.  <a href="structcutlass_1_1Coord.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
@@ -115,23 +116,14 @@ Functions</h2></td></tr>
 <tr class="memitem:a9410b1f5956d3aaf4584e65d047428fc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> Coord&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a9410b1f5956d3aaf4584e65d047428fc">cutlass::make_Coord</a> (int _0, int _1, int _2, int _3)</td></tr>
 <tr class="memdesc:a9410b1f5956d3aaf4584e65d047428fc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to make a 4-element coordinate.  <a href="namespacecutlass.html#a9410b1f5956d3aaf4584e65d047428fc">More...</a><br /></td></tr>
 <tr class="separator:a9410b1f5956d3aaf4584e65d047428fc"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7d2ab683e29b47d245e183ad5aeb962e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> Coord&lt; 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e">cutlass::get_Coord_hw</a> (Coord&lt; 3 &gt; const &amp;coord)</td></tr>
-<tr class="memdesc:a7d2ab683e29b47d245e183ad5aeb962e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Getter.  <a href="namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e">More...</a><br /></td></tr>
-<tr class="separator:a7d2ab683e29b47d245e183ad5aeb962e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a082e7a2e4acc2879468243f5732ccf0b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> Coord&lt; 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a082e7a2e4acc2879468243f5732ccf0b">cutlass::get_Coord_hw</a> (Coord&lt; 4 &gt; const &amp;coord)</td></tr>
-<tr class="memdesc:a082e7a2e4acc2879468243f5732ccf0b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Getter.  <a href="namespacecutlass.html#a082e7a2e4acc2879468243f5732ccf0b">More...</a><br /></td></tr>
-<tr class="separator:a082e7a2e4acc2879468243f5732ccf0b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a71f3e2a12b9e98be1fba082610fa9d4f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> Coord&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f">cutlass::get_Coord_hwc</a> (Coord&lt; 4 &gt; const &amp;coord)</td></tr>
-<tr class="memdesc:a71f3e2a12b9e98be1fba082610fa9d4f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Getter.  <a href="namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f">More...</a><br /></td></tr>
-<tr class="separator:a71f3e2a12b9e98be1fba082610fa9d4f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4680709eeeb679ef0219938f85f7394e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> Coord&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e">cutlass::get_Coord_dhw</a> (Coord&lt; 4 &gt; const &amp;coord)</td></tr>
-<tr class="memdesc:a4680709eeeb679ef0219938f85f7394e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Getter.  <a href="namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e">More...</a><br /></td></tr>
-<tr class="separator:a4680709eeeb679ef0219938f85f7394e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a90028a415a05ce09073860e5c761aa6f"><td class="memTemplParams" colspan="2">template&lt;typename Shape_ &gt; </td></tr>
+<tr class="memitem:a90028a415a05ce09073860e5c761aa6f"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> Coord&lt; 3 &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a90028a415a05ce09073860e5c761aa6f">cutlass::make_Coord_from_shape</a> ()</td></tr>
+<tr class="separator:a90028a415a05ce09073860e5c761aa6f"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/coord_8h_source.html b/docs/coord_8h_source.html
index 71ec92e1a..b0e2162cc 100644
--- a/docs/coord_8h_source.html
+++ b/docs/coord_8h_source.html
@@ -76,50 +76,54 @@ $(function() {
 <div class="title">coord.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="coord_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1Identity.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Identity.html">Identity</a> {</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597">   41</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375">Kind</a> { <a class="code" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375a77d7cc80ec0c3ff42ca9b2aff98a1646">Additive</a> = 0, <a class="code" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597">Multiplicative</a> = 1 };</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;};</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N_&gt;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html">   48</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Coord.html">Coord</a> {</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="comment">// Type and constant definitions</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">   53</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> = N_;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">   60</a></span>&#160;  <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[<a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>];</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a9cbfff91f0b0d0a149534c97e3d6e69b">   68</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html#a9cbfff91f0b0d0a149534c97e3d6e69b">Coord</a>(<span class="keywordtype">int</span> value = 0) {</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] = value;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    }</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  }</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a53a3d88a884f6cb7fda8aedfe2cec2c5">   76</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html#a53a3d88a884f6cb7fda8aedfe2cec2c5">Coord</a>(<span class="keywordtype">int</span> _idx[]) {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] = _idx[i];</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    }</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  }</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a3dfc4ce4191097b6c3268696f2a45ef5">   84</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a> <a class="code" href="structcutlass_1_1Coord.html#a3dfc4ce4191097b6c3268696f2a45ef5">operator+</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord</a> c;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      c.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] = <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] + b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    }</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    <span class="keywordflow">return</span> c;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  }</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#acc510511ffb52bed7f6a52f14b99750d">   94</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a> <a class="code" href="structcutlass_1_1Coord.html#acc510511ffb52bed7f6a52f14b99750d">operator-</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord</a> c;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;      c.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] = <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] - b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    }</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <span class="keywordflow">return</span> c;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  }</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a8e4f7df55a75d040cf50cf9984c04c8a">  104</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a> <a class="code" href="structcutlass_1_1Coord.html#a8e4f7df55a75d040cf50cf9984c04c8a">operator*</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord</a> c;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      c.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] = <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] * b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    }</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keywordflow">return</span> c;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  }</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a87f485be079fa68bcf576da4d56f0ece">  114</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a> <a class="code" href="structcutlass_1_1Coord.html#a87f485be079fa68bcf576da4d56f0ece">operator/</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord</a> c;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;      c.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] = <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] / b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    }</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    <span class="keywordflow">return</span> c;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  }</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#aeb209486943fa9d42911325b16e49e09">  124</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#aeb209486943fa9d42911325b16e49e09">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] += b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    }</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  }</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ac1795ec2a5890d8a39840567a4bea88e">  133</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#ac1795ec2a5890d8a39840567a4bea88e">operator-=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] -= b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    }</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  }</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00142"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a282b6cc9ac8b2f72720c252791155aad">  142</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#a282b6cc9ac8b2f72720c252791155aad">operator*=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] *= b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    }</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  }</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00151"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#abe91e59962ef0d73aec9c14824f64ecc">  151</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#abe91e59962ef0d73aec9c14824f64ecc">operator/=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] /= b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    }</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;  }</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ab7fc89de3ccd7096ab275fb5dd40104c">  159</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span>&amp; <a class="code" href="structcutlass_1_1Coord.html#ab7fc89de3ccd7096ab275fb5dd40104c">operator[]</a>(<span class="keywordtype">int</span> dim) { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[dim]; }</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a6eeab0a1686ee25389e1bd017c5f03ae">  162</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1Coord.html#a6eeab0a1686ee25389e1bd017c5f03ae">operator[]</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[dim]; }</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ad4b3704d14057c043f972827671115cf">  166</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="code" href="structcutlass_1_1Coord.html#ad4b3704d14057c043f972827671115cf">dot</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b, T sum)<span class="keyword"> const </span>{</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      sum += <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] * b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    }</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    <span class="keywordflow">return</span> sum;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;  }</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00175"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ae023c0c664c22a978e9b9ce5e063aae4">  175</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="code" href="structcutlass_1_1Coord.html#ae023c0c664c22a978e9b9ce5e063aae4">dot</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    T sum = T(0);</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      sum += <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] * b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    }</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <span class="keywordflow">return</span> sum;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;  }</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Dim&gt;</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">  185</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span>&amp; <a class="code" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">at</a>() {</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[Dim];</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  }</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ab511a16210d1b94449f5bc6476f6a266">  191</a></span>&#160;  <span class="keywordtype">int</span>&amp; <a class="code" href="structcutlass_1_1Coord.html#ab511a16210d1b94449f5bc6476f6a266">at</a>(<span class="keywordtype">int</span> dim) { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[dim]; }</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Dim&gt;</div><div class="line"><a name="l00195"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#af9cc7ab2088544d1240ac51c4c6e685d">  195</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1Coord.html#af9cc7ab2088544d1240ac51c4c6e685d">at</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[Dim];</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;  }</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#aed4f4d1c7c0749fe72736d7a1213b6e9">  201</a></span>&#160;  <span class="keywordtype">int</span> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1Coord.html#aed4f4d1c7c0749fe72736d7a1213b6e9">at</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[dim]; }</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#acfa94aabd0c9a71ee994ca479d5f515f">  205</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1Coord.html#acfa94aabd0c9a71ee994ca479d5f515f">operator==</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;N&gt;</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;    <span class="keywordtype">bool</span> equal = <span class="keyword">true</span>;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; equal &amp;&amp; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      equal = (<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] == b.<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i]);</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;    }</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    <span class="keywordflow">return</span> equal;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  }</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00215"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a7fb46873e8f3cf38212703d35bd36995">  215</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1Coord.html#a7fb46873e8f3cf38212703d35bd36995">operator!=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;N&gt;</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> !(*<span class="keyword">this</span> == b); }</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e">  219</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e">clamp</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;N&gt;</a> <span class="keyword">const</span>&amp; <a class="code" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">max</a>, <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;N&gt;</a> <span class="keyword">const</span>&amp; <a class="code" href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">min</a> = <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;N&gt;</a>()) {</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i] = <a class="code" href="platform_8h.html#abd31f291635329bc15292954f1f01d38">__NV_STD_MAX</a>(<a class="code" href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">__NV_STD_MIN</a>(<a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i], <a class="code" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">max</a>.idx[i]), <a class="code" href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">min</a>.idx[i]);</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;    }</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;  }</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00228"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a40429a9154f7a142ad7e9eb35282d196">  228</a></span>&#160;  <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1Coord.html#a40429a9154f7a142ad7e9eb35282d196">count</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <span class="keywordtype">int</span> product = <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[0];</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 1; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>; ++i) {</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;      product *= <a class="code" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a>[i];</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    }</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;    <span class="keywordflow">return</span> product;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;  }</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;};</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00241"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">  241</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;1&gt;</a> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<span class="keywordtype">int</span> _0) {</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  <span class="keywordtype">int</span> values[1] = {_0};</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;1&gt;</a>(values);</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;}</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00248"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a61d81e5363bcb8a7f6dd70f053242564">  248</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<span class="keywordtype">int</span> _0, <span class="keywordtype">int</span> _1) {</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;  <span class="keywordtype">int</span> values[2] = {_0, _1};</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a>(values);</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;}</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00255"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a25acf680a7d2592c957a7ac603f4c361">  255</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<span class="keywordtype">int</span> _0, <span class="keywordtype">int</span> _1, <span class="keywordtype">int</span> _2) {</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;  <span class="keywordtype">int</span> values[3] = {_0, _1, _2};</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>(values);</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;}</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00262"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a9410b1f5956d3aaf4584e65d047428fc">  262</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<span class="keywordtype">int</span> _0, <span class="keywordtype">int</span> _1, <span class="keywordtype">int</span> _2, <span class="keywordtype">int</span> _3) {</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;  <span class="keywordtype">int</span> values[4] = {_0, _1, _2, _3};</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a>(values);</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;}</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00271"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e">  271</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a> <a class="code" href="namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e">get_Coord_hw</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; coord) { <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(coord[1], coord[2]); }</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00275"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a082e7a2e4acc2879468243f5732ccf0b">  275</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a> <a class="code" href="namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e">get_Coord_hw</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <span class="keyword">const</span>&amp; coord) { <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(coord[1], coord[2]); }</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00279"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f">  279</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f">get_Coord_hwc</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <span class="keyword">const</span>&amp; coord) { <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(coord[1], coord[2], coord[3]); }</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e">  283</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e">get_Coord_dhw</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <span class="keyword">const</span>&amp; coord) { <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(coord[0], coord[1], coord[2]); }</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1Coord_html_a6eeab0a1686ee25389e1bd017c5f03ae"><div class="ttname"><a href="structcutlass_1_1Coord.html#a6eeab0a1686ee25389e1bd017c5f03ae">cutlass::Coord::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int const  &amp; operator[](int dim) const</div><div class="ttdoc">Member access operator. </div><div class="ttdef"><b>Definition:</b> coord.h:162</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a40429a9154f7a142ad7e9eb35282d196"><div class="ttname"><a href="structcutlass_1_1Coord.html#a40429a9154f7a142ad7e9eb35282d196">cutlass::Coord::count</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int count() const</div><div class="ttdoc">Returns the product of all elements. </div><div class="ttdef"><b>Definition:</b> coord.h:228</div></div>
-<div class="ttc" id="structcutlass_1_1Identity_html"><div class="ttname"><a href="structcutlass_1_1Identity.html">cutlass::Identity</a></div><div class="ttdoc">Describes identity elements. </div><div class="ttdef"><b>Definition:</b> coord.h:38</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_af6a9a165e53d7e85ae121d5789aa03e0"><div class="ttname"><a href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">cutlass::platform::max</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr const T &amp; max(const T &amp;a, const T &amp;b)</div><div class="ttdoc">std::max </div><div class="ttdef"><b>Definition:</b> platform.h:207</div></div>
+<a href="coord_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="structcutlass_1_1Identity.html">   39</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Identity.html">Identity</a> {</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597">   42</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375">Kind</a> { <a class="code" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375a77d7cc80ec0c3ff42ca9b2aff98a1646">Additive</a> = 0, <a class="code" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597">Multiplicative</a> = 1 };</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;};</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Rank_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html">   49</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Coord.html">Coord</a> {</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="comment">// Type and constant definitions</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">   55</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> = Rank_;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">   58</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">N</a> = Rank_;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">   61</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">   68</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[<a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>];</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">   76</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">Coord</a>(<a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> value = 0) {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] = value;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    }</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  }</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">   84</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">Coord</a>(<a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> _idx[]) {</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] = _idx[i];</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    }</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  }</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">   92</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">Coord</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kRank&gt;</a> <span class="keyword">const</span> &amp;coord) {</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] = coord[i];</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  }</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Slice&gt;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">  102</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Slice&gt;</a> <a class="code" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a>(<span class="keywordtype">int</span> start = 0, <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> identity = 0)<span class="keyword"> const </span>{</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Slice&gt;</a> result;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Slice; ++i) {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;      <span class="keywordflow">if</span> (i + start &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>) {</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;        <a class="code" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a>[i] = <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i + start];</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      }</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;      <span class="keywordflow">else</span> {</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;        <a class="code" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a>[i] = identity;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;      }</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    }</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    <span class="keywordflow">return</span> result;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  }</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">  117</a></span>&#160;  <span class="keyword">operator</span> bool()<span class="keyword"> const </span>{</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i]) {</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;        <span class="keywordflow">return</span> <span class="keyword">true</span>;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;      }</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    }</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">false</span>;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  }</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">  128</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i]) {</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;        <span class="keywordflow">return</span> <span class="keyword">false</span>;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      }</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    }</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">true</span>;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00139"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">  139</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a> <a class="code" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">operator+</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord</a> c;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;      c.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] = <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] + b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    }</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="keywordflow">return</span> c;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  }</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">  149</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a> <a class="code" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">operator-</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord</a> c;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      c.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] = <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] - b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    }</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <span class="keywordflow">return</span> c;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  }</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">  159</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a> <a class="code" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">operator*</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord</a> c;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      c.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] = <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] * b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    }</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    <span class="keywordflow">return</span> c;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  }</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00169"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">  169</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a> <a class="code" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">operator/</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord</a> c;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;      c.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] = <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] / b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;    }</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <span class="keywordflow">return</span> c;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  }</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">  179</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] += b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    }</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;  }</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">  188</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">operator-=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] -= b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    }</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;  }</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">  197</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">operator*=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] *= b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    }</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;  }</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00206"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">  206</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">operator/=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] /= b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;    }</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  }</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;</div><div class="line"><a name="l00214"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">  214</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">operator[]</a>(<span class="keywordtype">int</span> dim) { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[dim]; }</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00217"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">  217</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">operator[]</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[dim]; }</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00221"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">  221</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="code" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">dot</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b, T sum)<span class="keyword"> const </span>{</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      sum += <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] * b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    }</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    <span class="keywordflow">return</span> sum;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;  }</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00230"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">  230</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="code" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">dot</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    T sum = T(0);</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;      sum += <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] * b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;    }</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;    <span class="keywordflow">return</span> sum;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  }</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Dim&gt;</div><div class="line"><a name="l00240"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">  240</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>() {</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[Dim];</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  }</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00246"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">  246</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">at</a>(<span class="keywordtype">int</span> dim) { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[dim]; }</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Dim&gt;</div><div class="line"><a name="l00250"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">  250</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">at</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[Dim];</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;  }</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00256"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">  256</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">at</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[dim]; }</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00260"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">  260</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">operator==</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kRank&gt;</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    <span class="keywordtype">bool</span> equal = <span class="keyword">true</span>;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; equal &amp;&amp; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;      equal = (<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] == b.<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i]);</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    }</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;    <span class="keywordflow">return</span> equal;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;  }</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00270"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">  270</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">operator!=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kRank&gt;</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> !(*<span class="keyword">this</span> == b); }</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">  274</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="code" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kRank&gt;</a> <span class="keyword">const</span>&amp; <a class="code" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">max</a>, <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kRank&gt;</a> <span class="keyword">const</span>&amp; <a class="code" href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">min</a> = <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kRank&gt;</a>()) {</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] = <a class="code" href="platform_8h.html#abd31f291635329bc15292954f1f01d38">__NV_STD_MAX</a>(<a class="code" href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">__NV_STD_MIN</a>(<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i], <a class="code" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">max</a>.idx[i]), <a class="code" href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">min</a>.idx[i]);</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;    }</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;  }</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">  283</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> <a class="code" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">count</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> product = <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[0];</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 1; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;      product *= <a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i];</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;    }</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;    <span class="keywordflow">return</span> product;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;  }</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00293"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">  293</a></span>&#160;  <span class="keywordtype">bool</span> operator&lt;(Coord&lt;kRank&gt; <span class="keyword">const</span> &amp;b) <span class="keyword">const</span> {</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;      <span class="keywordflow">if</span> (!(<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] &lt; b[i])) {</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;        <span class="keywordflow">return</span> <span class="keyword">false</span>;</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;      }</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;    }</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">true</span>;</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;  }</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00304"></a><span class="lineno"><a class="line" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">  304</a></span>&#160;  <span class="keywordtype">bool</span> operator&lt;=(Coord&lt;kRank&gt; <span class="keyword">const</span> &amp;b) <span class="keyword">const</span> {</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>; ++i) {</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;      <span class="keywordflow">if</span> (!(<a class="code" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a>[i] &lt;= b[i])) {</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;        <span class="keywordflow">return</span> <span class="keyword">false</span>;</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;      }</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;    }</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">true</span>;</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;  }</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;};</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00318"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">  318</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;1&gt;</a> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<span class="keywordtype">int</span> _0) {</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;  <span class="keywordtype">int</span> values[1] = {_0};</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;1&gt;</a>(values);</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;}</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00325"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a61d81e5363bcb8a7f6dd70f053242564">  325</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<span class="keywordtype">int</span> _0, <span class="keywordtype">int</span> _1) {</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;  <span class="keywordtype">int</span> values[2] = {_0, _1};</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a>(values);</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;}</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00332"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a25acf680a7d2592c957a7ac603f4c361">  332</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<span class="keywordtype">int</span> _0, <span class="keywordtype">int</span> _1, <span class="keywordtype">int</span> _2) {</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;  <span class="keywordtype">int</span> values[3] = {_0, _1, _2};</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>(values);</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;}</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00339"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a9410b1f5956d3aaf4584e65d047428fc">  339</a></span>&#160;<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<span class="keywordtype">int</span> _0, <span class="keywordtype">int</span> _1, <span class="keywordtype">int</span> _2, <span class="keywordtype">int</span> _3) {</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;  <span class="keywordtype">int</span> values[4] = {_0, _1, _2, _3};</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a>(values);</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;}</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Shape_&gt;</div><div class="line"><a name="l00347"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a90028a415a05ce09073860e5c761aa6f">  347</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="namespacecutlass.html#a90028a415a05ce09073860e5c761aa6f">make_Coord_from_shape</a>() {</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(Shape_::kD, Shape_::kH, Shape_::kW);</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;}</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1Identity_html"><div class="ttname"><a href="structcutlass_1_1Identity.html">cutlass::Identity</a></div><div class="ttdoc">Describes identity elements. </div><div class="ttdef"><b>Definition:</b> coord.h:39</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_af6a9a165e53d7e85ae121d5789aa03e0"><div class="ttname"><a href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">cutlass::platform::max</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr const T &amp; max(const T &amp;a, const T &amp;b)</div><div class="ttdoc">std::max </div><div class="ttdef"><b>Definition:</b> platform.h:215</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_acfa94aabd0c9a71ee994ca479d5f515f"><div class="ttname"><a href="structcutlass_1_1Coord.html#acfa94aabd0c9a71ee994ca479d5f515f">cutlass::Coord::operator==</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator==(Coord&lt; N &gt; const &amp;b) const</div><div class="ttdoc">Determines if two Coord&lt;&gt; objects are equal. </div><div class="ttdef"><b>Definition:</b> coord.h:205</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_aeb209486943fa9d42911325b16e49e09"><div class="ttname"><a href="structcutlass_1_1Coord.html#aeb209486943fa9d42911325b16e49e09">cutlass::Coord::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator+=(Coord const &amp;b)</div><div class="ttdoc">In-place addition. </div><div class="ttdef"><b>Definition:</b> coord.h:124</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a7fb46873e8f3cf38212703d35bd36995"><div class="ttname"><a href="structcutlass_1_1Coord.html#a7fb46873e8f3cf38212703d35bd36995">cutlass::Coord::operator!=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator!=(Coord&lt; N &gt; const &amp;b) const</div><div class="ttdoc">Not equal. </div><div class="ttdef"><b>Definition:</b> coord.h:215</div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="namespacecutlass_html_a71f3e2a12b9e98be1fba082610fa9d4f"><div class="ttname"><a href="namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f">cutlass::get_Coord_hwc</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; get_Coord_hwc(Coord&lt; 4 &gt; const &amp;coord)</div><div class="ttdoc">Getter. </div><div class="ttdef"><b>Definition:</b> coord.h:279</div></div>
-<div class="ttc" id="namespacecutlass_html_a4680709eeeb679ef0219938f85f7394e"><div class="ttname"><a href="namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e">cutlass::get_Coord_dhw</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; get_Coord_dhw(Coord&lt; 4 &gt; const &amp;coord)</div><div class="ttdoc">Getter. </div><div class="ttdef"><b>Definition:</b> coord.h:283</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a482ada6da62f427987c22098796fcf7e"><div class="ttname"><a href="structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e">cutlass::Coord::clamp</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; clamp(Coord&lt; N &gt; const &amp;max, Coord&lt; N &gt; const &amp;min=Coord&lt; N &gt;())</div><div class="ttdoc">Clamps a coordinate to a range specified by maximum and minimum values. </div><div class="ttdef"><b>Definition:</b> coord.h:219</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_af9cc7ab2088544d1240ac51c4c6e685d"><div class="ttname"><a href="structcutlass_1_1Coord.html#af9cc7ab2088544d1240ac51c4c6e685d">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int const  &amp; at() const</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:195</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a87f485be079fa68bcf576da4d56f0ece"><div class="ttname"><a href="structcutlass_1_1Coord.html#a87f485be079fa68bcf576da4d56f0ece">cutlass::Coord::operator/</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord operator/(Coord const &amp;b) const</div><div class="ttdoc">Element-wise division. </div><div class="ttdef"><b>Definition:</b> coord.h:114</div></div>
-<div class="ttc" id="structcutlass_1_1Identity_html_a37966282c824c6d0e32b432275ea8375"><div class="ttname"><a href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375">cutlass::Identity::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> coord.h:41</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_ad4b3704d14057c043f972827671115cf"><div class="ttname"><a href="structcutlass_1_1Coord.html#ad4b3704d14057c043f972827671115cf">cutlass::Coord::dot</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T dot(Coord const &amp;b, T sum) const</div><div class="ttdoc">Computes the dot product of two Coord instances. </div><div class="ttdef"><b>Definition:</b> coord.h:166</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a53a3d88a884f6cb7fda8aedfe2cec2c5"><div class="ttname"><a href="structcutlass_1_1Coord.html#a53a3d88a884f6cb7fda8aedfe2cec2c5">cutlass::Coord::Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord(int _idx[])</div><div class="ttdoc">Constructs from an array of integers. </div><div class="ttdef"><b>Definition:</b> coord.h:76</div></div>
-<div class="ttc" id="platform_8h_html_abd31f291635329bc15292954f1f01d38"><div class="ttname"><a href="platform_8h.html#abd31f291635329bc15292954f1f01d38">__NV_STD_MAX</a></div><div class="ttdeci">#define __NV_STD_MAX(a, b)</div><div class="ttdoc">Select maximum(a, b) </div><div class="ttdef"><b>Definition:</b> platform.h:155</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_ab511a16210d1b94449f5bc6476f6a266"><div class="ttname"><a href="structcutlass_1_1Coord.html#ab511a16210d1b94449f5bc6476f6a266">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int &amp; at(int dim)</div><div class="ttdoc">Access via index; may limit unrolling potential. </div><div class="ttdef"><b>Definition:</b> coord.h:191</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_ab7fc89de3ccd7096ab275fb5dd40104c"><div class="ttname"><a href="structcutlass_1_1Coord.html#ab7fc89de3ccd7096ab275fb5dd40104c">cutlass::Coord::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int &amp; operator[](int dim)</div><div class="ttdoc">Member access operator. </div><div class="ttdef"><b>Definition:</b> coord.h:159</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_ac1795ec2a5890d8a39840567a4bea88e"><div class="ttname"><a href="structcutlass_1_1Coord.html#ac1795ec2a5890d8a39840567a4bea88e">cutlass::Coord::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator-=(Coord const &amp;b)</div><div class="ttdoc">In-place subtraction. </div><div class="ttdef"><b>Definition:</b> coord.h:133</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a8e4f7df55a75d040cf50cf9984c04c8a"><div class="ttname"><a href="structcutlass_1_1Coord.html#a8e4f7df55a75d040cf50cf9984c04c8a">cutlass::Coord::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord operator*(Coord const &amp;b) const</div><div class="ttdoc">Element-wise multiplication. </div><div class="ttdef"><b>Definition:</b> coord.h:104</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a9cbfff91f0b0d0a149534c97e3d6e69b"><div class="ttname"><a href="structcutlass_1_1Coord.html#a9cbfff91f0b0d0a149534c97e3d6e69b">cutlass::Coord::Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord(int value=0)</div><div class="ttdoc">Default ctor initializes uniformly. </div><div class="ttdef"><b>Definition:</b> coord.h:68</div></div>
-<div class="ttc" id="namespacecutlass_html_a7d2ab683e29b47d245e183ad5aeb962e"><div class="ttname"><a href="namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e">cutlass::get_Coord_hw</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 2 &gt; get_Coord_hw(Coord&lt; 3 &gt; const &amp;coord)</div><div class="ttdoc">Getter. </div><div class="ttdef"><b>Definition:</b> coord.h:271</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a3f2f5a9d7ef2063456c4d9f7e57e71ca"><div class="ttname"><a href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">cutlass::Coord::N</a></div><div class="ttdeci">static int const N</div><div class="ttdef"><b>Definition:</b> coord.h:53</div></div>
-<div class="ttc" id="platform_8h_html_a39e234a3e3b0018b58df720bcb143420"><div class="ttname"><a href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">__NV_STD_MIN</a></div><div class="ttdeci">#define __NV_STD_MIN(a, b)</div><div class="ttdoc">Select minimum(a, b) </div><div class="ttdef"><b>Definition:</b> platform.h:160</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_ae023c0c664c22a978e9b9ce5e063aae4"><div class="ttname"><a href="structcutlass_1_1Coord.html#ae023c0c664c22a978e9b9ce5e063aae4">cutlass::Coord::dot</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T dot(Coord const &amp;b) const</div><div class="ttdoc">Computes the dot product of two Coord instances. </div><div class="ttdef"><b>Definition:</b> coord.h:175</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_acc510511ffb52bed7f6a52f14b99750d"><div class="ttname"><a href="structcutlass_1_1Coord.html#acc510511ffb52bed7f6a52f14b99750d">cutlass::Coord::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord operator-(Coord const &amp;b) const</div><div class="ttdoc">Element-wise subtraction. </div><div class="ttdef"><b>Definition:</b> coord.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a6b876f61a85a4a4ef3763b6742bfaa6b"><div class="ttname"><a href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">cutlass::Coord::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord operator-(Coord const &amp;b) const</div><div class="ttdoc">Element-wise subtraction. </div><div class="ttdef"><b>Definition:</b> coord.h:149</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a9b47b1521820c898b03868627c3f8e46"><div class="ttname"><a href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; at(int dim) const</div><div class="ttdoc">Access via index; may limit unrolling potential. </div><div class="ttdef"><b>Definition:</b> coord.h:256</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a882e7ac07bbd6983659ef2e574b46454"><div class="ttname"><a href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">cutlass::Coord::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; operator[](int dim) const</div><div class="ttdoc">Member access operator. </div><div class="ttdef"><b>Definition:</b> coord.h:217</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a9bb07631f09efc80219413ac8309f568"><div class="ttname"><a href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">cutlass::Coord::operator/</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord operator/(Coord const &amp;b) const</div><div class="ttdoc">Element-wise division. </div><div class="ttdef"><b>Definition:</b> coord.h:169</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a6e0967541a1d74edeb93897ea6069e24"><div class="ttname"><a href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">cutlass::Coord::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; operator[](int dim)</div><div class="ttdoc">Member access operator. </div><div class="ttdef"><b>Definition:</b> coord.h:214</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a23e1b9a7f5fa8fd4afeadfb85de7c5c3"><div class="ttname"><a href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">cutlass::Coord::kRank</a></div><div class="ttdeci">static int const kRank</div><div class="ttdoc">Number of elements in Coord. </div><div class="ttdef"><b>Definition:</b> coord.h:55</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a7c73966e94b4f45854f16e33683bc02c"><div class="ttname"><a href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">cutlass::Coord::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type used to store elements. </div><div class="ttdef"><b>Definition:</b> coord.h:61</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ad4303b578b72b5cb2a0198375290e168"><div class="ttname"><a href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">cutlass::Coord::operator*=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator*=(Coord const &amp;b)</div><div class="ttdoc">In-place multiplication. </div><div class="ttdef"><b>Definition:</b> coord.h:197</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_aa253bf69fc819876a7c7770305f1a694"><div class="ttname"><a href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; at(int dim)</div><div class="ttdoc">Access via index; may limit unrolling potential. </div><div class="ttdef"><b>Definition:</b> coord.h:246</div></div>
+<div class="ttc" id="platform_8h_html"><div class="ttname"><a href="platform_8h.html">platform.h</a></div><div class="ttdoc">C++ features that may be otherwise unimplemented for CUDA device functions. </div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ac0ac5f2aa2cbea3887d126645025e017"><div class="ttname"><a href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">cutlass::Coord::count</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index count() const</div><div class="ttdoc">Returns the product of all elements. </div><div class="ttdef"><b>Definition:</b> coord.h:283</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a2e94c093f82908ff3dba4f23b5d10033"><div class="ttname"><a href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">cutlass::Coord::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord operator*(Coord const &amp;b) const</div><div class="ttdoc">Element-wise multiplication. </div><div class="ttdef"><b>Definition:</b> coord.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1Identity_html_a37966282c824c6d0e32b432275ea8375"><div class="ttname"><a href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375">cutlass::Identity::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> coord.h:42</div></div>
+<div class="ttc" id="namespacecutlass_html_a90028a415a05ce09073860e5c761aa6f"><div class="ttname"><a href="namespacecutlass.html#a90028a415a05ce09073860e5c761aa6f">cutlass::make_Coord_from_shape</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; make_Coord_from_shape()</div><div class="ttdef"><b>Definition:</b> coord.h:347</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a7f919aeb2a895bc040599971400dec8d"><div class="ttname"><a href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">cutlass::Coord::operator==</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator==(Coord&lt; kRank &gt; const &amp;b) const</div><div class="ttdoc">Determines if two Coord&lt;&gt; objects are equal. </div><div class="ttdef"><b>Definition:</b> coord.h:260</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_acfd416eafec51e47b42b8b713ba76030"><div class="ttname"><a href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">cutlass::Coord::N</a></div><div class="ttdeci">static int const N</div><div class="ttdoc">Number of elements in Coord, aliased for compatibility. </div><div class="ttdef"><b>Definition:</b> coord.h:58</div></div>
+<div class="ttc" id="platform_8h_html_abd31f291635329bc15292954f1f01d38"><div class="ttname"><a href="platform_8h.html#abd31f291635329bc15292954f1f01d38">__NV_STD_MAX</a></div><div class="ttdeci">#define __NV_STD_MAX(a, b)</div><div class="ttdoc">Select maximum(a, b) </div><div class="ttdef"><b>Definition:</b> platform.h:163</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a872e1e0d9cc255fa438c04daaf10ad68"><div class="ttname"><a href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">cutlass::Coord::idx</a></div><div class="ttdeci">Index idx[kRank]</div><div class="ttdoc">Indices. </div><div class="ttdef"><b>Definition:</b> coord.h:68</div></div>
+<div class="ttc" id="platform_8h_html_a39e234a3e3b0018b58df720bcb143420"><div class="ttname"><a href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">__NV_STD_MIN</a></div><div class="ttdeci">#define __NV_STD_MIN(a, b)</div><div class="ttdoc">Select minimum(a, b) </div><div class="ttdef"><b>Definition:</b> platform.h:168</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a304334cbcad636d7b058fdc6310f0e6b"><div class="ttname"><a href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">cutlass::Coord::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator-=(Coord const &amp;b)</div><div class="ttdoc">In-place subtraction. </div><div class="ttdef"><b>Definition:</b> coord.h:188</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ae4f2cb12b84411118cb93e7c4cb88b20"><div class="ttname"><a href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">cutlass::Coord::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator+=(Coord const &amp;b)</div><div class="ttdoc">In-place addition. </div><div class="ttdef"><b>Definition:</b> coord.h:179</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_a57c071d2a7305dd4ec60542e66b0c81c"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">cutlass::platform::min</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr const T &amp; min(const T &amp;a, const T &amp;b)</div><div class="ttdoc">std::min </div><div class="ttdef"><b>Definition:</b> platform.h:201</div></div>
-<div class="ttc" id="structcutlass_1_1Identity_html_a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597"><div class="ttname"><a href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597">cutlass::Identity::Multiplicative</a></div><div class="ttdef"><b>Definition:</b> coord.h:41</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:48</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_ad10b59430927a354fcd874d2d32f1bd8"><div class="ttname"><a href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int &amp; at()</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:185</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a50de265129f1db7bdf2f0aefbc6a46bc"><div class="ttname"><a href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">cutlass::Coord::idx</a></div><div class="ttdeci">int idx[N]</div><div class="ttdoc">Indices. </div><div class="ttdef"><b>Definition:</b> coord.h:60</div></div>
-<div class="ttc" id="structcutlass_1_1Identity_html_a37966282c824c6d0e32b432275ea8375a77d7cc80ec0c3ff42ca9b2aff98a1646"><div class="ttname"><a href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375a77d7cc80ec0c3ff42ca9b2aff98a1646">cutlass::Identity::Additive</a></div><div class="ttdef"><b>Definition:</b> coord.h:41</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_aed4f4d1c7c0749fe72736d7a1213b6e9"><div class="ttname"><a href="structcutlass_1_1Coord.html#aed4f4d1c7c0749fe72736d7a1213b6e9">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int const  &amp; at(int dim) const</div><div class="ttdoc">Access via index; may limit unrolling potential. </div><div class="ttdef"><b>Definition:</b> coord.h:201</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a353d847675e5ba2402c407dcd4ae4de3"><div class="ttname"><a href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">cutlass::Coord::operator!=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator!=(Coord&lt; kRank &gt; const &amp;b) const</div><div class="ttdoc">Not equal. </div><div class="ttdef"><b>Definition:</b> coord.h:270</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a57c071d2a7305dd4ec60542e66b0c81c"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">cutlass::platform::min</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr const T &amp; min(const T &amp;a, const T &amp;b)</div><div class="ttdoc">std::min </div><div class="ttdef"><b>Definition:</b> platform.h:209</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a9eff24a3b74b68d11839b92324613c93"><div class="ttname"><a href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; at()</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:240</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ac87199c4c9a4e20aac4eb6e3b9a68f28"><div class="ttname"><a href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">cutlass::Coord::operator/=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator/=(Coord const &amp;b)</div><div class="ttdoc">In-place division. </div><div class="ttdef"><b>Definition:</b> coord.h:206</div></div>
+<div class="ttc" id="structcutlass_1_1Identity_html_a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597"><div class="ttname"><a href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597">cutlass::Identity::Multiplicative</a></div><div class="ttdef"><b>Definition:</b> coord.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ac8f7a9b0835efc34fd28894b2b45342c"><div class="ttname"><a href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">cutlass::Coord::slice</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; Slice &gt; slice(int start=0, Index identity=0) const</div><div class="ttdef"><b>Definition:</b> coord.h:102</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:49</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a177adcc2d0fb5e72ebcb523edd24e6fe"><div class="ttname"><a href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; at() const</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:250</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ac8ec94703830ab2c62ee055533ea2184"><div class="ttname"><a href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">cutlass::Coord::dot</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T dot(Coord const &amp;b, T sum) const</div><div class="ttdoc">Computes the dot product of two Coord instances. </div><div class="ttdef"><b>Definition:</b> coord.h:221</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a422aa7e2d2bf5dd3a60f65427bc0d7c0"><div class="ttname"><a href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">cutlass::Coord::Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord(Index value=0)</div><div class="ttdoc">Default ctor initializes uniformly. </div><div class="ttdef"><b>Definition:</b> coord.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1Identity_html_a37966282c824c6d0e32b432275ea8375a77d7cc80ec0c3ff42ca9b2aff98a1646"><div class="ttname"><a href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375a77d7cc80ec0c3ff42ca9b2aff98a1646">cutlass::Identity::Additive</a></div><div class="ttdef"><b>Definition:</b> coord.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a404a3b4e00f59cac71d41fb1bbba38ba"><div class="ttname"><a href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">cutlass::Coord::clamp</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; clamp(Coord&lt; kRank &gt; const &amp;max, Coord&lt; kRank &gt; const &amp;min=Coord&lt; kRank &gt;())</div><div class="ttdoc">Clamps a coordinate to a range specified by maximum and minimum values. </div><div class="ttdef"><b>Definition:</b> coord.h:274</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a63ad1225ab2c51a68add731e994526b4"><div class="ttname"><a href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">cutlass::Coord::Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord(Index _idx[])</div><div class="ttdoc">Constructs from an array of integers. </div><div class="ttdef"><b>Definition:</b> coord.h:84</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a0acc37908acb6b879c37f54ff7ffc93d"><div class="ttname"><a href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">cutlass::Coord::dot</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T dot(Coord const &amp;b) const</div><div class="ttdoc">Computes the dot product of two Coord instances. </div><div class="ttdef"><b>Definition:</b> coord.h:230</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ab37672637771a70910df9aa1a0cffddc"><div class="ttname"><a href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">cutlass::Coord::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord operator+(Coord const &amp;b) const</div><div class="ttdoc">Element-wise addition. </div><div class="ttdef"><b>Definition:</b> coord.h:139</div></div>
 <div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a282b6cc9ac8b2f72720c252791155aad"><div class="ttname"><a href="structcutlass_1_1Coord.html#a282b6cc9ac8b2f72720c252791155aad">cutlass::Coord::operator*=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator*=(Coord const &amp;b)</div><div class="ttdoc">In-place multiplication. </div><div class="ttdef"><b>Definition:</b> coord.h:142</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a3dfc4ce4191097b6c3268696f2a45ef5"><div class="ttname"><a href="structcutlass_1_1Coord.html#a3dfc4ce4191097b6c3268696f2a45ef5">cutlass::Coord::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord operator+(Coord const &amp;b) const</div><div class="ttdoc">Element-wise addition. </div><div class="ttdef"><b>Definition:</b> coord.h:84</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_abe91e59962ef0d73aec9c14824f64ecc"><div class="ttname"><a href="structcutlass_1_1Coord.html#abe91e59962ef0d73aec9c14824f64ecc">cutlass::Coord::operator/=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator/=(Coord const &amp;b)</div><div class="ttdoc">In-place division. </div><div class="ttdef"><b>Definition:</b> coord.h:151</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a6110e4cfd090561696a81a8a4068a573"><div class="ttname"><a href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">cutlass::Coord::Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord(Coord&lt; kRank &gt; const &amp;coord)</div><div class="ttdoc">Constructs from an array of integers. </div><div class="ttdef"><b>Definition:</b> coord.h:92</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a232095edae2f74c01a3c8abf68166e02"><div class="ttname"><a href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">cutlass::Coord::operator!</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator!() const</div><div class="ttdoc">Returns true if Coord is uniformly zero. </div><div class="ttdef"><b>Definition:</b> coord.h:128</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/core__io_8h.html b/docs/core__io_8h.html
index d71c39716..2f50d7851 100644
--- a/docs/core__io_8h.html
+++ b/docs/core__io_8h.html
@@ -73,6 +73,8 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a> &#124;
 <a href="#func-members">Functions</a>  </div>
   <div class="headertitle">
 <div class="title">core_io.h File Reference</div>  </div>
@@ -83,51 +85,56 @@ $(function() {
 <a href="#details">More...</a></p>
 <div class="textblock"><code>#include &lt;iosfwd&gt;</code><br />
 <code>#include &lt;typeinfo&gt;</code><br />
-<code>#include &lt;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&gt;</code><br />
+<code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&quot;</code><br />
 </div>
 <p><a href="core__io_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ScalarIO.html">cutlass::ScalarIO&lt; T &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to enable formatted printing of CUTLASS scalar types to an ostream.  <a href="structcutlass_1_1ScalarIO.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
 Functions</h2></td></tr>
-<tr class="memitem:a4a0d84a2a19a11549b87a2328d58690d"><td class="memTemplParams" colspan="2">template&lt;int Rank&gt; </td></tr>
-<tr class="memitem:a4a0d84a2a19a11549b87a2328d58690d"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="core__io_8h.html#a4a0d84a2a19a11549b87a2328d58690d">operator&lt;&lt;</a> (std::ostream &amp;out, <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank &gt; const &amp;coord)</td></tr>
-<tr class="separator:a4a0d84a2a19a11549b87a2328d58690d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afe231b125bbb1e9aa51307a8abdf9a60"><td class="memTemplParams" colspan="2">template&lt;int Rank&gt; </td></tr>
+<tr class="memitem:afe231b125bbb1e9aa51307a8abdf9a60"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#afe231b125bbb1e9aa51307a8abdf9a60">cutlass::operator&lt;&lt;</a> (std::ostream &amp;out, Coord&lt; Rank &gt; const &amp;coord)</td></tr>
+<tr class="separator:afe231b125bbb1e9aa51307a8abdf9a60"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30ddfc5e90b9103840cb30c9f9b96b49"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a30ddfc5e90b9103840cb30c9f9b96b49"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a30ddfc5e90b9103840cb30c9f9b96b49">cutlass::operator&lt;&lt;</a> (std::ostream &amp;out, ScalarIO&lt; T &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a30ddfc5e90b9103840cb30c9f9b96b49"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default printing to ostream.  <a href="namespacecutlass.html#a30ddfc5e90b9103840cb30c9f9b96b49">More...</a><br /></td></tr>
+<tr class="separator:a30ddfc5e90b9103840cb30c9f9b96b49"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a36690681ed19dc7e398fcdafdbfe9975"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a36690681ed19dc7e398fcdafdbfe9975"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a36690681ed19dc7e398fcdafdbfe9975">cutlass::operator&lt;&lt;</a> (std::ostream &amp;out, ScalarIO&lt; int8_t &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a36690681ed19dc7e398fcdafdbfe9975"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of int8_t as integer rather than character.  <a href="namespacecutlass.html#a36690681ed19dc7e398fcdafdbfe9975">More...</a><br /></td></tr>
+<tr class="separator:a36690681ed19dc7e398fcdafdbfe9975"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1a35d6b9b984a9c143957db733a93f51"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a1a35d6b9b984a9c143957db733a93f51"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a1a35d6b9b984a9c143957db733a93f51">cutlass::operator&lt;&lt;</a> (std::ostream &amp;out, ScalarIO&lt; uint8_t &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a1a35d6b9b984a9c143957db733a93f51"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of uint8_t as integer rather than character.  <a href="namespacecutlass.html#a1a35d6b9b984a9c143957db733a93f51">More...</a><br /></td></tr>
+<tr class="separator:a1a35d6b9b984a9c143957db733a93f51"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2fd306c63f71877f9231a7e1265752cf"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a2fd306c63f71877f9231a7e1265752cf"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a2fd306c63f71877f9231a7e1265752cf">cutlass::operator&lt;&lt;</a> (std::ostream &amp;out, ScalarIO&lt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">cutlass::bin1_t</a>, 32 &gt; &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a2fd306c63f71877f9231a7e1265752cf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of vector of 1b elements.  <a href="namespacecutlass.html#a2fd306c63f71877f9231a7e1265752cf">More...</a><br /></td></tr>
+<tr class="separator:a2fd306c63f71877f9231a7e1265752cf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aecf2cd62eee939946b7173a110ecf76e"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:aecf2cd62eee939946b7173a110ecf76e"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aecf2cd62eee939946b7173a110ecf76e">cutlass::operator&lt;&lt;</a> (std::ostream &amp;out, ScalarIO&lt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">cutlass::int4_t</a>, 8 &gt; &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:aecf2cd62eee939946b7173a110ecf76e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of vector of 4b signed integer elements.  <a href="namespacecutlass.html#aecf2cd62eee939946b7173a110ecf76e">More...</a><br /></td></tr>
+<tr class="separator:aecf2cd62eee939946b7173a110ecf76e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3ceda5ed2d923222662a37e8f355c9b8"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a3ceda5ed2d923222662a37e8f355c9b8"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a3ceda5ed2d923222662a37e8f355c9b8">cutlass::operator&lt;&lt;</a> (std::ostream &amp;out, ScalarIO&lt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">cutlass::uint4_t</a>, 8 &gt; &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a3ceda5ed2d923222662a37e8f355c9b8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of vector of 4b unsigned integer elements.  <a href="namespacecutlass.html#a3ceda5ed2d923222662a37e8f355c9b8">More...</a><br /></td></tr>
+<tr class="separator:a3ceda5ed2d923222662a37e8f355c9b8"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
-<h2 class="groupheader">Function Documentation</h2>
-<a id="a4a0d84a2a19a11549b87a2328d58690d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4a0d84a2a19a11549b87a2328d58690d">&#9670;&nbsp;</a></span>operator&lt;&lt;()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;int Rank&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">std::ostream&amp; operator&lt;&lt; </td>
-          <td>(</td>
-          <td class="paramtype">std::ostream &amp;&#160;</td>
-          <td class="paramname"><em>out</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/core__io_8h_source.html b/docs/core__io_8h_source.html
index 7c076c94d..21b790113 100644
--- a/docs/core__io_8h_source.html
+++ b/docs/core__io_8h_source.html
@@ -76,11 +76,19 @@ $(function() {
 <div class="title">core_io.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="core__io_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;iosfwd&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;typeinfo&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Rank&gt;</div><div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="core__io_8h.html#a4a0d84a2a19a11549b87a2328d58690d">   39</a></span>&#160;std::ostream&amp; operator&lt;&lt;(std::ostream&amp; out, cutlass::Coord&lt;Rank&gt; <span class="keyword">const</span>&amp; coord) {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Rank; ++i) {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;    out &lt;&lt; (i ? <span class="stringliteral">&quot;, &quot;</span> : <span class="stringliteral">&quot;&quot;</span>) &lt;&lt; coord.idx[i];</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  }</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  <span class="keywordflow">return</span> out;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;}</div><div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<a href="core__io_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;iosfwd&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;typeinfo&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Rank&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="namespacecutlass.html#afe231b125bbb1e9aa51307a8abdf9a60">   42</a></span>&#160;std::ostream&amp; operator&lt;&lt;(std::ostream&amp; out, Coord&lt;Rank&gt; <span class="keyword">const</span>&amp; coord) {</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Rank; ++i) {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;    out &lt;&lt; (i ? <span class="stringliteral">&quot;, &quot;</span> : <span class="stringliteral">&quot;&quot;</span>) &lt;&lt; coord.idx[i];</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  }</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  <span class="keywordflow">return</span> out;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;}</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1ScalarIO.html">   53</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ScalarIO.html">ScalarIO</a> {</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">   56</a></span>&#160;  T <a class="code" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">value</a>;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1ScalarIO.html#ad4166575521254088bf6c6300c351714">   59</a></span>&#160;  <a class="code" href="structcutlass_1_1ScalarIO.html#ad4166575521254088bf6c6300c351714">ScalarIO</a>() { }</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1ScalarIO.html#a5227e1e9ed24326ad4f8dc94d186186f">   62</a></span>&#160;  <a class="code" href="structcutlass_1_1ScalarIO.html#a5227e1e9ed24326ad4f8dc94d186186f">ScalarIO</a>(T <a class="code" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">value</a>): <a class="code" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">value</a>(<a class="code" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">value</a>) {}</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;};</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a30ddfc5e90b9103840cb30c9f9b96b49">   69</a></span>&#160;<span class="keyword">inline</span> std::ostream &amp;operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt;T&gt; <span class="keyword">const</span> &amp;scalar) {</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keywordflow">return</span> out &lt;&lt; scalar.value;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;}</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a36690681ed19dc7e398fcdafdbfe9975">   75</a></span>&#160;<span class="keyword">inline</span> std::ostream &amp;operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt;int8_t&gt; <span class="keyword">const</span> &amp;scalar) {</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <span class="keywordflow">return</span> out &lt;&lt; int(scalar.value);</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;}</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a1a35d6b9b984a9c143957db733a93f51">   81</a></span>&#160;<span class="keyword">inline</span> std::ostream &amp;operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt;uint8_t&gt; <span class="keyword">const</span> &amp;scalar) {</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  <span class="keywordflow">return</span> out &lt;&lt; unsigned(scalar.value);</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;}</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00087"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a2fd306c63f71877f9231a7e1265752cf">   87</a></span>&#160;<span class="keyword">inline</span> std::ostream &amp;<a class="code" href="namespacecutlass.html#afe231b125bbb1e9aa51307a8abdf9a60">operator&lt;&lt;</a>(</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  std::ostream &amp;out, </div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <a class="code" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt;cutlass::bin1_t, 32&gt;</a> &gt; <span class="keyword">const</span> &amp;scalar) {</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; 32; i++) {</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;    out &lt;&lt; int(scalar.value[i]);</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    out &lt;&lt; ((i != 31) ? <span class="stringliteral">&quot;, &quot;</span> : <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  }</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <span class="keywordflow">return</span> out;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;}</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="namespacecutlass.html#aecf2cd62eee939946b7173a110ecf76e">  100</a></span>&#160;<span class="keyword">inline</span> std::ostream &amp;<a class="code" href="namespacecutlass.html#afe231b125bbb1e9aa51307a8abdf9a60">operator&lt;&lt;</a>(</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  std::ostream &amp;out, </div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <a class="code" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt;cutlass::int4_t, 8&gt;</a> &gt; <span class="keyword">const</span> &amp;scalar) {</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; 8; i++) {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    out &lt;&lt; int(scalar.value[i]);</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    out &lt;&lt; ((i != 7) ? <span class="stringliteral">&quot;, &quot;</span> : <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  }</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  <span class="keywordflow">return</span> out;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;}</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a3ceda5ed2d923222662a37e8f355c9b8">  113</a></span>&#160;<span class="keyword">inline</span> std::ostream &amp;<a class="code" href="namespacecutlass.html#afe231b125bbb1e9aa51307a8abdf9a60">operator&lt;&lt;</a>(</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  std::ostream &amp;out, </div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  <a class="code" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt;cutlass::uint4_t, 8&gt;</a> &gt; <span class="keyword">const</span> &amp;scalar) {</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; 8; i++) {</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    out &lt;&lt; unsigned(scalar.value[i]);</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    out &lt;&lt; ((i != 7) ? <span class="stringliteral">&quot;, &quot;</span> : <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  }</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <span class="keywordflow">return</span> out;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;}</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<div class="ttc" id="structcutlass_1_1ScalarIO_html_a5227e1e9ed24326ad4f8dc94d186186f"><div class="ttname"><a href="structcutlass_1_1ScalarIO.html#a5227e1e9ed24326ad4f8dc94d186186f">cutlass::ScalarIO::ScalarIO</a></div><div class="ttdeci">ScalarIO(T value)</div><div class="ttdoc">Constructs from a value. </div><div class="ttdef"><b>Definition:</b> core_io.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1ScalarIO_html_ad4166575521254088bf6c6300c351714"><div class="ttname"><a href="structcutlass_1_1ScalarIO.html#ad4166575521254088bf6c6300c351714">cutlass::ScalarIO::ScalarIO</a></div><div class="ttdeci">ScalarIO()</div><div class="ttdoc">Default ctor. </div><div class="ttdef"><b>Definition:</b> core_io.h:59</div></div>
+<div class="ttc" id="namespacecutlass_html_afe231b125bbb1e9aa51307a8abdf9a60"><div class="ttname"><a href="namespacecutlass.html#afe231b125bbb1e9aa51307a8abdf9a60">cutlass::operator&lt;&lt;</a></div><div class="ttdeci">std::ostream &amp; operator&lt;&lt;(std::ostream &amp;out, Coord&lt; Rank &gt; const &amp;coord)</div><div class="ttdef"><b>Definition:</b> core_io.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1ScalarIO_html"><div class="ttname"><a href="structcutlass_1_1ScalarIO.html">cutlass::ScalarIO</a></div><div class="ttdoc">Helper to enable formatted printing of CUTLASS scalar types to an ostream. </div><div class="ttdef"><b>Definition:</b> core_io.h:53</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1ScalarIO_html_a76d2822161aef20f85c3798b855ca9dd"><div class="ttname"><a href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">cutlass::ScalarIO::value</a></div><div class="ttdeci">T value</div><div class="ttdoc">Value to print. </div><div class="ttdef"><b>Definition:</b> core_io.h:56</div></div>
+<div class="ttc" id="vector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div><div class="ttdoc">Defines a 1D vector of elements held in the registers of each thread. </div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/cutlass_8h.html b/docs/cutlass_8h.html
index bbb0463c9..419c9123f 100644
--- a/docs/cutlass_8h.html
+++ b/docs/cutlass_8h.html
@@ -73,8 +73,10 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
 <a href="#namespaces">Namespaces</a> &#124;
-<a href="#define-members">Macros</a>  </div>
+<a href="#define-members">Macros</a> &#124;
+<a href="#func-members">Functions</a>  </div>
   <div class="headertitle">
 <div class="title">cutlass.h File Reference</div>  </div>
 </div><!--header-->
@@ -85,6 +87,13 @@ $(function() {
 
 <p><a href="cutlass_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structDebugType.html">DebugType&lt; T &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structDebugValue.html">DebugValue&lt; Value &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
 Namespaces</h2></td></tr>
 <tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
@@ -96,18 +105,26 @@ Macros</h2></td></tr>
 <tr class="separator:a8ff3cda9323810c1c504793a0206d4b8"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:ad114a1ab01f73833ea00020ffb7bcea7"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#ad114a1ab01f73833ea00020ffb7bcea7">CUTLASS_MINOR</a>&#160;&#160;&#160;0</td></tr>
 <tr class="separator:ad114a1ab01f73833ea00020ffb7bcea7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1d4e5818a594bbfc472e54978955cb8b"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#a1d4e5818a594bbfc472e54978955cb8b">CUTLASS_PATCH</a>&#160;&#160;&#160;0</td></tr>
+<tr class="memitem:a1d4e5818a594bbfc472e54978955cb8b"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#a1d4e5818a594bbfc472e54978955cb8b">CUTLASS_PATCH</a>&#160;&#160;&#160;1</td></tr>
 <tr class="separator:a1d4e5818a594bbfc472e54978955cb8b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:aa3040eddf073214969f9445bfa925039"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#aa3040eddf073214969f9445bfa925039">CUTLASS_VERSION</a>&#160;&#160;&#160;((<a class="el" href="cutlass_8h.html#a8ff3cda9323810c1c504793a0206d4b8">CUTLASS_MAJOR</a>)*100 + (<a class="el" href="cutlass_8h.html#ad114a1ab01f73833ea00020ffb7bcea7">CUTLASS_MINOR</a>)*10 + <a class="el" href="cutlass_8h.html#a1d4e5818a594bbfc472e54978955cb8b">CUTLASS_PATCH</a>)</td></tr>
 <tr class="separator:aa3040eddf073214969f9445bfa925039"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a28c2443a142676d3d71effdae1a986b1"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></td></tr>
 <tr class="separator:a28c2443a142676d3d71effdae1a986b1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0159b8e4cd578881a1ccfd0921516af7"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a>(x)&#160;&#160;&#160;assert(x)</td></tr>
+<tr class="separator:a0159b8e4cd578881a1ccfd0921516af7"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></td></tr>
 <tr class="separator:a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:adb3bc73d74b4a4bf13099d5696db3352"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#adb3bc73d74b4a4bf13099d5696db3352">CUTLASS_PRAGMA_NO_UNROLL</a></td></tr>
 <tr class="separator:adb3bc73d74b4a4bf13099d5696db3352"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0159b8e4cd578881a1ccfd0921516af7"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a>(x)&#160;&#160;&#160;assert(x)</td></tr>
-<tr class="separator:a0159b8e4cd578881a1ccfd0921516af7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8e18ced39c05ab3304bb4fcdc0cc9f71"><td class="memItemLeft" align="right" valign="top">#define&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71">CUTLASS_GEMM_LOOP</a>&#160;&#160;&#160;<a class="el" href="cutlass_8h.html#adb3bc73d74b4a4bf13099d5696db3352">CUTLASS_PRAGMA_NO_UNROLL</a></td></tr>
+<tr class="separator:a8e18ced39c05ab3304bb4fcdc0cc9f71"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
+Functions</h2></td></tr>
+<tr class="memitem:ab7e23b523490567225b20e2c72649f20"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ab7e23b523490567225b20e2c72649f20"><td class="memTemplItemLeft" align="right" valign="top">void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="cutlass_8h.html#ab7e23b523490567225b20e2c72649f20">DebugTypeFunc</a> (T const &amp;t)</td></tr>
+<tr class="separator:ab7e23b523490567225b20e2c72649f20"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Macro Definition Documentation</h2>
 <a id="a0159b8e4cd578881a1ccfd0921516af7"></a>
@@ -126,6 +143,20 @@ Macros</h2></td></tr>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a8e18ced39c05ab3304bb4fcdc0cc9f71"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8e18ced39c05ab3304bb4fcdc0cc9f71">&#9670;&nbsp;</a></span>CUTLASS_GEMM_LOOP</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">#define CUTLASS_GEMM_LOOP&#160;&#160;&#160;<a class="el" href="cutlass_8h.html#adb3bc73d74b4a4bf13099d5696db3352">CUTLASS_PRAGMA_NO_UNROLL</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a28c2443a142676d3d71effdae1a986b1"></a>
@@ -177,7 +208,7 @@ Macros</h2></td></tr>
 <div class="memproto">
       <table class="memname">
         <tr>
-          <td class="memname">#define CUTLASS_PATCH&#160;&#160;&#160;0</td>
+          <td class="memname">#define CUTLASS_PATCH&#160;&#160;&#160;1</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -224,12 +255,33 @@ Macros</h2></td></tr>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<h2 class="groupheader">Function Documentation</h2>
+<a id="ab7e23b523490567225b20e2c72649f20"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab7e23b523490567225b20e2c72649f20">&#9670;&nbsp;</a></span>DebugTypeFunc()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">void DebugTypeFunc </td>
+          <td>(</td>
+          <td class="paramtype">T const &amp;&#160;</td>
+          <td class="paramname"><em>t</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/cutlass_8h_source.html b/docs/cutlass_8h_source.html
index d2f442295..9c9fb2b29 100644
--- a/docs/cutlass_8h_source.html
+++ b/docs/cutlass_8h_source.html
@@ -76,11 +76,14 @@ $(function() {
 <div class="title">cutlass.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="cutlass_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a8ff3cda9323810c1c504793a0206d4b8">   34</a></span>&#160;<span class="preprocessor">#define CUTLASS_MAJOR 1</span></div><div class="line"><a name="l00035"></a><span class="lineno"><a class="line" href="cutlass_8h.html#ad114a1ab01f73833ea00020ffb7bcea7">   35</a></span>&#160;<span class="preprocessor">#define CUTLASS_MINOR 0</span></div><div class="line"><a name="l00036"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a1d4e5818a594bbfc472e54978955cb8b">   36</a></span>&#160;<span class="preprocessor">#define CUTLASS_PATCH 0</span></div><div class="line"><a name="l00037"></a><span class="lineno"><a class="line" href="cutlass_8h.html#aa3040eddf073214969f9445bfa925039">   37</a></span>&#160;<span class="preprocessor">#define CUTLASS_VERSION ((CUTLASS_MAJOR)*100 + (CUTLASS_MINOR)*10 + CUTLASS_PATCH)</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#ifdef __NVCC__</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#define CUTLASS_HOST_DEVICE __forceinline__ __device__ __host__</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#define CUTLASS_DEVICE __forceinline__ __device__</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#elif defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#define CUTLASS_HOST_DEVICE __forceinline__ __device__</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#define CUTLASS_DEVICE __forceinline__ __device__</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">   46</a></span>&#160;<span class="preprocessor">#define CUTLASS_HOST_DEVICE</span></div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="comment">// CUTLASS_DEVICE is an error if not compiling device code</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="comment">// CUTLASS_PRAGMA_UNROLL inserts a CUTLASS_PRAGMA_UNROLL if supported by the compiler</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="preprocessor">#if defined(__CUDA_ARCH__)</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="preprocessor">#if defined(_MSC_VER)</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_UNROLL __pragma(&quot;unroll&quot;)</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_NO_UNROLL __pragma(&quot;unroll 1&quot;)</span></div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_UNROLL _Pragma(&quot;unroll&quot;)</span></div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_NO_UNROLL _Pragma(&quot;unroll 1&quot;)</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">   60</a></span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_UNROLL</span></div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="cutlass_8h.html#adb3bc73d74b4a4bf13099d5696db3352">   61</a></span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_NO_UNROLL</span></div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">   64</a></span>&#160;<span class="preprocessor">#define CUTLASS_ASSERT(x) assert(x)</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> kWarpSize = 32;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<a href="cutlass_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a8ff3cda9323810c1c504793a0206d4b8">   34</a></span>&#160;<span class="preprocessor">#define CUTLASS_MAJOR 1</span></div><div class="line"><a name="l00035"></a><span class="lineno"><a class="line" href="cutlass_8h.html#ad114a1ab01f73833ea00020ffb7bcea7">   35</a></span>&#160;<span class="preprocessor">#define CUTLASS_MINOR 0</span></div><div class="line"><a name="l00036"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a1d4e5818a594bbfc472e54978955cb8b">   36</a></span>&#160;<span class="preprocessor">#define CUTLASS_PATCH 1</span></div><div class="line"><a name="l00037"></a><span class="lineno"><a class="line" href="cutlass_8h.html#aa3040eddf073214969f9445bfa925039">   37</a></span>&#160;<span class="preprocessor">#define CUTLASS_VERSION ((CUTLASS_MAJOR)*100 + (CUTLASS_MINOR)*10 + CUTLASS_PATCH)</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#ifdef __NVCC__</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#define CUTLASS_HOST_DEVICE __forceinline__ __device__ __host__</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#define CUTLASS_DEVICE __forceinline__ __device__</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#elif defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#define CUTLASS_HOST_DEVICE __forceinline__ __device__</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#define CUTLASS_DEVICE __forceinline__ __device__</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">   46</a></span>&#160;<span class="preprocessor">#define CUTLASS_HOST_DEVICE</span></div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="comment">// CUTLASS_DEVICE is an error if not compiling device code</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">   50</a></span>&#160;<span class="preprocessor">#define CUTLASS_ASSERT(x) assert(x)</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="comment">// CUTLASS_PRAGMA_(UNROLL|NO_UNROLL) optimization directives for the CUDA compiler.</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="preprocessor">#if defined(__CUDA_ARCH__)</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="preprocessor">#if defined(_MSC_VER)</span></div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_UNROLL __pragma(&quot;unroll&quot;)</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_NO_UNROLL __pragma(&quot;unroll 1&quot;)</span></div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_UNROLL _Pragma(&quot;unroll&quot;)</span></div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_NO_UNROLL _Pragma(&quot;unroll 1&quot;)</span></div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">   62</a></span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_UNROLL</span></div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="cutlass_8h.html#adb3bc73d74b4a4bf13099d5696db3352">   63</a></span>&#160;<span class="preprocessor">#define CUTLASS_PRAGMA_NO_UNROLL</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71">   66</a></span>&#160;<span class="preprocessor">#define CUTLASS_GEMM_LOOP CUTLASS_PRAGMA_NO_UNROLL</span></div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="comment">// A small helper class to dump a type at compile time</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="comment">// Usage:: DumpType&lt;Class&gt;::Class</span></div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structDebugType.html">   71</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structDebugType.html">DebugType</a> {};</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="cutlass_8h.html#ab7e23b523490567225b20e2c72649f20">   74</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="cutlass_8h.html#ab7e23b523490567225b20e2c72649f20">DebugTypeFunc</a>(T <span class="keyword">const</span>&amp; t) {</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  T::t;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;}</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;<span class="comment">// A small helper class to dump a compile time constant at compile time</span></div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="comment">// Usage: DumpValue&lt;Class::kConstant&gt;::kConstant</span></div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Value&gt;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structDebugValue.html">   81</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structDebugValue.html">DebugValue</a> {};</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;<span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> kWarpSize = 32;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structDebugValue_html"><div class="ttname"><a href="structDebugValue.html">DebugValue</a></div><div class="ttdef"><b>Definition:</b> cutlass.h:81</div></div>
+<div class="ttc" id="structDebugType_html"><div class="ttname"><a href="structDebugType.html">DebugType</a></div><div class="ttdef"><b>Definition:</b> cutlass.h:71</div></div>
+<div class="ttc" id="cutlass_8h_html_ab7e23b523490567225b20e2c72649f20"><div class="ttname"><a href="cutlass_8h.html#ab7e23b523490567225b20e2c72649f20">DebugTypeFunc</a></div><div class="ttdeci">void DebugTypeFunc(T const &amp;t)</div><div class="ttdef"><b>Definition:</b> cutlass.h:74</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/cutlass__math_8h.html b/docs/cutlass__math_8h.html
index 953b0d4c7..c4dbc54b0 100644
--- a/docs/cutlass__math_8h.html
+++ b/docs/cutlass__math_8h.html
@@ -83,7 +83,7 @@ $(function() {
 
 <p>Math utilities.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&quot;</code><br />
 </div>
 <p><a href="cutlass__math_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -103,6 +103,10 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1divide__assert.html">cutlass::divide_assert&lt; Dividend, Divisor &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Min.html">cutlass::Min&lt; A, B &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Max.html">cutlass::Max&lt; A, B &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
 Namespaces</h2></td></tr>
@@ -120,11 +124,17 @@ Functions</h2></td></tr>
 <tr class="memitem:af07506fee11de882d926f4e8237eef09"><td class="memTemplParams" colspan="2">template&lt;typename value_t &gt; </td></tr>
 <tr class="memitem:af07506fee11de882d926f4e8237eef09"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#af07506fee11de882d926f4e8237eef09">cutlass::lcm</a> (value_t a, value_t b)</td></tr>
 <tr class="separator:af07506fee11de882d926f4e8237eef09"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6bc666acc9f0d7278a788975e226e005"><td class="memTemplParams" colspan="2">template&lt;typename value_t &gt; </td></tr>
+<tr class="memitem:a6bc666acc9f0d7278a788975e226e005"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005">cutlass::clz</a> (value_t x)</td></tr>
+<tr class="separator:a6bc666acc9f0d7278a788975e226e005"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a58a119c3f7b33d97c43ae8c114004d9e"><td class="memTemplParams" colspan="2">template&lt;typename value_t &gt; </td></tr>
+<tr class="memitem:a58a119c3f7b33d97c43ae8c114004d9e"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a58a119c3f7b33d97c43ae8c114004d9e">cutlass::find_log2</a> (value_t x)</td></tr>
+<tr class="separator:a58a119c3f7b33d97c43ae8c114004d9e"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/cutlass__math_8h_source.html b/docs/cutlass__math_8h_source.html
index 2809a8456..8381f641a 100644
--- a/docs/cutlass__math_8h_source.html
+++ b/docs/cutlass__math_8h_source.html
@@ -76,27 +76,33 @@ $(function() {
 <div class="title">cutlass_math.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="cutlass__math_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;</div><div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="comment"> * Static math utilities</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N&gt;</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1is__pow2.html">   45</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1is__pow2.html">is_pow2</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">platform::integral_constant</a>&lt;bool, (N &amp; (N - 1)) == 0&gt; {};</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> CurrentVal = N, <span class="keywordtype">int</span> Count = 0&gt;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__down.html">   51</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1log2__down.html">log2_down</a> {</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d">   53</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d">value</a> = <a class="code" href="structcutlass_1_1log2__down.html">log2_down&lt;N, (CurrentVal &gt;</a>&gt; 1), Count + 1&gt;::<a class="code" href="structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d">value</a> };</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;};</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment">// Base case</span></div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> Count&gt;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html">   58</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1log2__down.html">log2_down</a>&lt;N, 1, Count&gt; {</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html#ad7d3c2329ab708bd4af36ffaee8509cba282c4c5d8f66dc49544f34071f148b1f">   59</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d">value</a> = Count };</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;};</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> CurrentVal = N, <span class="keywordtype">int</span> Count = 0&gt;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__up.html">   66</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1log2__up.html">log2_up</a> {</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6">   68</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6">value</a> = <a class="code" href="structcutlass_1_1log2__up.html">log2_up&lt;N, (CurrentVal &gt;</a>&gt; 1), Count + 1&gt;::<a class="code" href="structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6">value</a> };</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;};</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;<span class="comment">// Base case</span></div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> Count&gt;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html">   73</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1log2__up.html">log2_up</a>&lt;N, 1, Count&gt; {</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html#ab001737f02df0a2c514334a1bfa6f1f9a6b6af5b6bf14ee5d3e3f1442e7f75117">   74</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6">value</a> = ((1 &lt;&lt; Count) &lt; N) ? Count + 1 : Count };</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;};</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N&gt;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1sqrt__est.html">   81</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1sqrt__est.html">sqrt_est</a> {</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964">   82</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964">value</a> = 1 &lt;&lt; (<a class="code" href="structcutlass_1_1log2__up.html">log2_up&lt;N&gt;::value</a> / 2) };</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;};</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Div<span class="keywordtype">id</span>end, <span class="keywordtype">int</span> Divisor&gt;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1divide__assert.html">   90</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1divide__assert.html">divide_assert</a> {</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc">   91</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc">value</a> = Dividend / Divisor };</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((Dividend % Divisor == 0), <span class="stringliteral">&quot;Not an even multiple&quot;</span>);</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;};</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="comment"> * Rounding</span></div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> div<span class="keywordtype">id</span>end_t, <span class="keyword">typename</span> divisor_t&gt;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e">  104</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dividend_t <a class="code" href="namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e">round_nearest</a>(dividend_t dividend, divisor_t divisor) {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="keywordflow">return</span> ((dividend + divisor - 1) / divisor) * divisor;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;}</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8">  112</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t <a class="code" href="namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8">gcd</a>(value_t a, value_t b) {</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <span class="keywordflow">for</span> (;;) {</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="keywordflow">if</span> (a == 0) <span class="keywordflow">return</span> b;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    b %= a;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keywordflow">if</span> (b == 0) <span class="keywordflow">return</span> a;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    a %= b;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  }</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;}</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="namespacecutlass.html#af07506fee11de882d926f4e8237eef09">  125</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t <a class="code" href="namespacecutlass.html#af07506fee11de882d926f4e8237eef09">lcm</a>(value_t a, value_t b) {</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;  value_t temp = <a class="code" href="namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8">gcd</a>(a, b);</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  <span class="keywordflow">return</span> temp ? (a / temp * b) : 0;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;}</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1divide__assert_html_a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc"><div class="ttname"><a href="structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc">cutlass::divide_assert::value</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:91</div></div>
+<a href="cutlass__math_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;</div><div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="comment"> * Static math utilities</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N&gt;</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1is__pow2.html">   45</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1is__pow2.html">is_pow2</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">platform::integral_constant</a>&lt;bool, (N &amp; (N - 1)) == 0&gt; {};</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> CurrentVal = N, <span class="keywordtype">int</span> Count = 0&gt;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__down.html">   51</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1log2__down.html">log2_down</a> {</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d">   53</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d">value</a> = <a class="code" href="structcutlass_1_1log2__down.html">log2_down&lt;N, (CurrentVal &gt;</a>&gt; 1), Count + 1&gt;::<a class="code" href="structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d">value</a> };</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;};</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment">// Base case</span></div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> Count&gt;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html">   58</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1log2__down.html">log2_down</a>&lt;N, 1, Count&gt; {</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html#ad7d3c2329ab708bd4af36ffaee8509cba282c4c5d8f66dc49544f34071f148b1f">   59</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d">value</a> = Count };</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;};</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> CurrentVal = N, <span class="keywordtype">int</span> Count = 0&gt;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__up.html">   66</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1log2__up.html">log2_up</a> {</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6">   68</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6">value</a> = <a class="code" href="structcutlass_1_1log2__up.html">log2_up&lt;N, (CurrentVal &gt;</a>&gt; 1), Count + 1&gt;::<a class="code" href="structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6">value</a> };</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;};</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;<span class="comment">// Base case</span></div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> Count&gt;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html">   73</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1log2__up.html">log2_up</a>&lt;N, 1, Count&gt; {</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html#ab001737f02df0a2c514334a1bfa6f1f9a6b6af5b6bf14ee5d3e3f1442e7f75117">   74</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6">value</a> = ((1 &lt;&lt; Count) &lt; N) ? Count + 1 : Count };</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;};</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N&gt;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1sqrt__est.html">   81</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1sqrt__est.html">sqrt_est</a> {</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964">   82</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964">value</a> = 1 &lt;&lt; (<a class="code" href="structcutlass_1_1log2__up.html">log2_up&lt;N&gt;::value</a> / 2) };</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;};</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Div<span class="keywordtype">id</span>end, <span class="keywordtype">int</span> Divisor&gt;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1divide__assert.html">   90</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1divide__assert.html">divide_assert</a> {</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc">   91</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc">value</a> = Dividend / Divisor };</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((Dividend % Divisor == 0), <span class="stringliteral">&quot;Not an even multiple&quot;</span>);</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;};</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="comment"> * Rounding</span></div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> div<span class="keywordtype">id</span>end_t, <span class="keyword">typename</span> divisor_t&gt;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e">  104</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dividend_t <a class="code" href="namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e">round_nearest</a>(dividend_t dividend, divisor_t divisor) {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="keywordflow">return</span> ((dividend + divisor - 1) / divisor) * divisor;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;}</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8">  112</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t <a class="code" href="namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8">gcd</a>(value_t a, value_t b) {</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <span class="keywordflow">for</span> (;;) {</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="keywordflow">if</span> (a == 0) <span class="keywordflow">return</span> b;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    b %= a;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keywordflow">if</span> (b == 0) <span class="keywordflow">return</span> a;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    a %= b;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  }</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;}</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="namespacecutlass.html#af07506fee11de882d926f4e8237eef09">  125</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t <a class="code" href="namespacecutlass.html#af07506fee11de882d926f4e8237eef09">lcm</a>(value_t a, value_t b) {</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;  value_t temp = <a class="code" href="namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8">gcd</a>(a, b);</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  <span class="keywordflow">return</span> temp ? (a / temp * b) : 0;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;}</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005">  137</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t <a class="code" href="namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005">clz</a>(value_t x) {</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 31; i &gt;= 0; --i) {</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="keywordflow">if</span> ((1 &lt;&lt; i) &amp; x) <span class="keywordflow">return</span> 31 - i;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  }</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  <span class="keywordflow">return</span> 32;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;}</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00145"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a58a119c3f7b33d97c43ae8c114004d9e">  145</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t <a class="code" href="namespacecutlass.html#a58a119c3f7b33d97c43ae8c114004d9e">find_log2</a>(value_t x) {</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  <span class="keywordtype">int</span> a = 31 - <a class="code" href="namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005">clz</a>(x);</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  a += (x &amp; (x - 1)) != 0;  <span class="comment">// Round up, add 1 if not a power of 2.</span></div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  <span class="keywordflow">return</span> a;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;}</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;<span class="comment"> * Min/Max</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> A, <span class="keywordtype">int</span> B&gt;</div><div class="line"><a name="l00156"></a><span class="lineno"><a class="line" href="structcutlass_1_1Min.html">  156</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Min.html">Min</a> {</div><div class="line"><a name="l00157"></a><span class="lineno"><a class="line" href="structcutlass_1_1Min.html#a97e6dd3ff6fb5404e8a6e6109f73f429">  157</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Min.html#a97e6dd3ff6fb5404e8a6e6109f73f429">kValue</a> = (A &lt; B) ? A : B;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;};</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> A, <span class="keywordtype">int</span> B&gt;</div><div class="line"><a name="l00161"></a><span class="lineno"><a class="line" href="structcutlass_1_1Max.html">  161</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Max.html">Max</a> {</div><div class="line"><a name="l00162"></a><span class="lineno"><a class="line" href="structcutlass_1_1Max.html#a6ed8be7ed855eea8f8d08921f7b5d763">  162</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Max.html#a6ed8be7ed855eea8f8d08921f7b5d763">kValue</a> = (A &gt; B) ? A : B;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;};</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1divide__assert_html_a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc"><div class="ttname"><a href="structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc">cutlass::divide_assert::value</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:91</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1Min_html_a97e6dd3ff6fb5404e8a6e6109f73f429"><div class="ttname"><a href="structcutlass_1_1Min.html#a97e6dd3ff6fb5404e8a6e6109f73f429">cutlass::Min::kValue</a></div><div class="ttdeci">static int const kValue</div><div class="ttdef"><b>Definition:</b> cutlass_math.h:157</div></div>
+<div class="ttc" id="namespacecutlass_html_a58a119c3f7b33d97c43ae8c114004d9e"><div class="ttname"><a href="namespacecutlass.html#a58a119c3f7b33d97c43ae8c114004d9e">cutlass::find_log2</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE value_t find_log2(value_t x)</div><div class="ttdef"><b>Definition:</b> cutlass_math.h:145</div></div>
 <div class="ttc" id="structcutlass_1_1log2__down_html"><div class="ttname"><a href="structcutlass_1_1log2__down.html">cutlass::log2_down</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:51</div></div>
 <div class="ttc" id="platform_8h_html"><div class="ttname"><a href="platform_8h.html">platform.h</a></div><div class="ttdoc">C++ features that may be otherwise unimplemented for CUDA device functions. </div></div>
+<div class="ttc" id="structcutlass_1_1Min_html"><div class="ttname"><a href="structcutlass_1_1Min.html">cutlass::Min</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:156</div></div>
 <div class="ttc" id="structcutlass_1_1log2__down_html_a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d"><div class="ttname"><a href="structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d">cutlass::log2_down::value</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:53</div></div>
 <div class="ttc" id="namespacecutlass_html_af07506fee11de882d926f4e8237eef09"><div class="ttname"><a href="namespacecutlass.html#af07506fee11de882d926f4e8237eef09">cutlass::lcm</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE value_t lcm(value_t a, value_t b)</div><div class="ttdef"><b>Definition:</b> cutlass_math.h:125</div></div>
 <div class="ttc" id="namespacecutlass_html_a17c8c408d672d26f1c70d2435f6ac83e"><div class="ttname"><a href="namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e">cutlass::round_nearest</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE dividend_t round_nearest(dividend_t dividend, divisor_t divisor)</div><div class="ttdef"><b>Definition:</b> cutlass_math.h:104</div></div>
 <div class="ttc" id="structcutlass_1_1log2__up_html_a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6"><div class="ttname"><a href="structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6">cutlass::log2_up::value</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:68</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html">cutlass::platform::integral_constant</a></div><div class="ttdoc">std::integral_constant </div><div class="ttdef"><b>Definition:</b> platform.h:274</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html">cutlass::platform::integral_constant</a></div><div class="ttdoc">std::integral_constant </div><div class="ttdef"><b>Definition:</b> platform.h:282</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1Max_html"><div class="ttname"><a href="structcutlass_1_1Max.html">cutlass::Max</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:161</div></div>
 <div class="ttc" id="structcutlass_1_1sqrt__est_html_abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964"><div class="ttname"><a href="structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964">cutlass::sqrt_est::value</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:82</div></div>
 <div class="ttc" id="namespacecutlass_html_a38481ebfe13bc199aa621ceecfa016b8"><div class="ttname"><a href="namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8">cutlass::gcd</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE value_t gcd(value_t a, value_t b)</div><div class="ttdef"><b>Definition:</b> cutlass_math.h:112</div></div>
 <div class="ttc" id="structcutlass_1_1divide__assert_html"><div class="ttname"><a href="structcutlass_1_1divide__assert.html">cutlass::divide_assert</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:90</div></div>
 <div class="ttc" id="structcutlass_1_1log2__up_html"><div class="ttname"><a href="structcutlass_1_1log2__up.html">cutlass::log2_up</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:66</div></div>
+<div class="ttc" id="namespacecutlass_html_a6bc666acc9f0d7278a788975e226e005"><div class="ttname"><a href="namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005">cutlass::clz</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE value_t clz(value_t x)</div><div class="ttdef"><b>Definition:</b> cutlass_math.h:137</div></div>
 <div class="ttc" id="structcutlass_1_1is__pow2_html"><div class="ttname"><a href="structcutlass_1_1is__pow2.html">cutlass::is_pow2</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:45</div></div>
+<div class="ttc" id="structcutlass_1_1Max_html_a6ed8be7ed855eea8f8d08921f7b5d763"><div class="ttname"><a href="structcutlass_1_1Max.html#a6ed8be7ed855eea8f8d08921f7b5d763">cutlass::Max::kValue</a></div><div class="ttdeci">static int const kValue</div><div class="ttdef"><b>Definition:</b> cutlass_math.h:162</div></div>
 <div class="ttc" id="structcutlass_1_1sqrt__est_html"><div class="ttname"><a href="structcutlass_1_1sqrt__est.html">cutlass::sqrt_est</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:81</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/debug_8h.html b/docs/debug_8h.html
index 1f88396ab..81ed9f3ca 100644
--- a/docs/debug_8h.html
+++ b/docs/debug_8h.html
@@ -231,7 +231,7 @@ Functions</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/debug_8h_source.html b/docs/debug_8h_source.html
index 881b4e3f0..c404b4110 100644
--- a/docs/debug_8h_source.html
+++ b/docs/debug_8h_source.html
@@ -81,7 +81,7 @@ $(function() {
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/dgemm__traits_8h.html b/docs/dgemm__traits_8h.html
index eebc2f364..ac6d33b0c 100644
--- a/docs/dgemm__traits_8h.html
+++ b/docs/dgemm__traits_8h.html
@@ -82,21 +82,21 @@ $(function() {
 
 <p>Defines structural traits of double-precision GEMM.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__epilogue_8h_source.html">cutlass/gemm/gemm_epilogue.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__epilogue__traits_8h_source.html">cutlass/gemm/gemm_epilogue_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__traits_8h_source.html">cutlass/gemm/gemm_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="thread__multiply__add_8h_source.html">cutlass/gemm/thread_multiply_add.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue_8h_source.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue__traits_8h_source.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__traits_8h_source.html">cutlass/gemm/gemm_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="thread__multiply__add_8h_source.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</code><br />
 </div>
 <p><a href="dgemm__traits_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html">cutlass::gemm::DgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html">cutlass::gemm::DgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -109,7 +109,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/dgemm__traits_8h_source.html b/docs/dgemm__traits_8h_source.html
index 9cf2c8738..d7cdbe529 100644
--- a/docs/dgemm__traits_8h_source.html
+++ b/docs/dgemm__traits_8h_source.html
@@ -76,26 +76,26 @@ $(function() {
 <div class="title">dgemm_traits.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="dgemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="thread__multiply__add_8h.html">cutlass/gemm/thread_multiply_add.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1&gt;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1DgemmConfig.html">   52</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1DgemmConfig.html">DgemmConfig</a></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;          double,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;          double,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;          double,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;          double,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;          OutputTile_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;          ThreadMultiplyAdd&lt;AccumulatorsPerThread_, Shape&lt;1, 4, 8&gt;, double, double, double&gt;,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;          kScalarsPerLdgA_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;          kScalarsPerLdgA_,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;          2,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;          kScalarsPerLdgB_,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;          kScalarsPerLdgB_,</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;          2,</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;          1,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;          2,</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;          1,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;          2&gt; {};</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 64, 128&gt;</a>,</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;double&gt;</a>,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 8, 8&gt;</a>,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1,</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="keyword">typename</span> GemmConfig_ =</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1DgemmConfig.html">DgemmConfig&lt;OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_&gt;</a>,</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="keyword">typename</span> GemmEpilogueTraits_ =</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits&lt;GemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1DgemmTraits.html">  112</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1DgemmTraits.html">DgemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a>&lt;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                         <span class="comment">// The layout for A.</span></div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;                         kLayoutA_,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                         <span class="comment">// The layout for B.</span></div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;                         kLayoutB_,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;                         GemmConfig_,</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;                         GemmEpilogue&lt;GemmEpilogueTraits_&gt;,</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;                         Index_&gt; {};</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<a href="dgemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__multiply__add_8h.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1&gt;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1DgemmConfig.html">   52</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1DgemmConfig.html">DgemmConfig</a></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;          double,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;          double,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;          double,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;          double,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;          OutputTile_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;          ThreadMultiplyAdd&lt;ThreadGemmShape_, Shape&lt;1, 4, 8&gt;, double, double, double&gt;,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;          kScalarsPerLdgA_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;          kScalarsPerLdgA_,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;          2,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;          kScalarsPerLdgB_,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;          kScalarsPerLdgB_,</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;          2,</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;          1,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;          2,</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;          1,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;          2,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;          false,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;          false,</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;          false</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;          &gt;{};</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 64, 128&gt;</a>,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;double&gt;</a>,</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 8, 8&gt;</a>,</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="keyword">typename</span> GemmConfig_ =</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1DgemmConfig.html">DgemmConfig&lt;OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_&gt;</a>,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keyword">typename</span> GemmEpilogueTraits_ =</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits&lt;GemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1DgemmTraits.html">  119</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1DgemmTraits.html">DgemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a>&lt;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;                         <span class="comment">// The layout for A.</span></div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;                         kLayoutA_,</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;                         <span class="comment">// The layout for B.</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;                         kLayoutB_,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;                         GemmConfig_,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;                         GemmEpilogue&lt;GemmEpilogueTraits_&gt;,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;                         Index_&gt; {};</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
 <div class="ttc" id="gemm__traits_8h_html"><div class="ttname"><a href="gemm__traits_8h.html">gemm_traits.h</a></div><div class="ttdoc">Defines structural properties of complete GEMM computation. </div></div>
 <div class="ttc" id="thread__multiply__add_8h_html"><div class="ttname"><a href="thread__multiply__add_8h.html">thread_multiply_add.h</a></div><div class="ttdoc">Template implementing matrix multiply-add operations on fragments. </div></div>
 <div class="ttc" id="gemm__epilogue_8h_html"><div class="ttname"><a href="gemm__epilogue_8h.html">gemm_epilogue.h</a></div><div class="ttdoc">Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the comp...</div></div>
 <div class="ttc" id="gemm__shared__tile_8h_html"><div class="ttname"><a href="gemm__shared__tile_8h.html">gemm_shared_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing tiles to and from shared memory. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:79</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1DgemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1DgemmTraits.html">cutlass::gemm::DgemmTraits</a></div><div class="ttdef"><b>Definition:</b> dgemm_traits.h:112</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_config.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1DgemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1DgemmTraits.html">cutlass::gemm::DgemmTraits</a></div><div class="ttdef"><b>Definition:</b> dgemm_traits.h:119</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1DgemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1DgemmConfig.html">cutlass::gemm::DgemmConfig</a></div><div class="ttdef"><b>Definition:</b> dgemm_traits.h:52</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:300</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:40</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:323</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:51</div></div>
 <div class="ttc" id="gemm_8h_html"><div class="ttname"><a href="gemm_8h.html">gemm.h</a></div><div class="ttdoc">Implements a software-pipelined efficient GEMM. </div></div>
 <div class="ttc" id="gemm__epilogue__traits_8h_html"><div class="ttname"><a href="gemm__epilogue__traits_8h.html">gemm_epilogue_traits.h</a></div><div class="ttdoc">Defines structural properties of the GEMM epilogue. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">cutlass::gemm::SimplifiedGemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:723</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">cutlass::gemm::SimplifiedGemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:650</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/dir_1417ee5ebebc309c36b7962f26a92c39.html b/docs/dir_1417ee5ebebc309c36b7962f26a92c39.html
index d7393ef13..6555e36cf 100644
--- a/docs/dir_1417ee5ebebc309c36b7962f26a92c39.html
+++ b/docs/dir_1417ee5ebebc309c36b7962f26a92c39.html
@@ -101,15 +101,15 @@ Files</h2></td></tr>
 <tr class="memitem:fragment_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="fragment_8h.html">fragment.h</a> <a href="fragment_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:fragment_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines Fragment, a statically-sized array for storing parts of matrices within a thread's registers. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:fragment__load__store_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="fragment__load__store_8h.html">fragment_load_store.h</a> <a href="fragment__load__store_8h_source.html">[code]</a></td></tr>
-<tr class="memdesc:fragment__load__store_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines accessors for loading and storing fragments to memory efficiently. <br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:fragment__multiply__add_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="fragment__multiply__add_8h.html">fragment_multiply_add.h</a> <a href="fragment__multiply__add_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:fragment__multiply__add_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines multiply-add operations on fragments within a thread. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:iterator__access_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="iterator__access_8h.html">iterator_access.h</a> <a href="iterator__access_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:iterator__access_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Free functions for loading and storing to implementations of tile iteartor concepts. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:kernel__launch_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="kernel__launch_8h.html">kernel_launch.h</a> <a href="kernel__launch_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:kernel__launch_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines structures and helpers to launch CUDA kernels within CUTLASS. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:load__store_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="load__store_8h.html">load_store.h</a> <a href="load__store_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:load__store_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines abstractions for efficiently loading and storing vectors to memory. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -128,12 +128,24 @@ Files</h2></td></tr>
 <tr class="memitem:tensor__ref_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="tensor__ref_8h.html">tensor_ref.h</a> <a href="tensor__ref_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:tensor__ref_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a structure containing strides, bounds, and a pointer to tensor data. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:tensor__ref__collection_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="tensor__ref__collection_8h.html">tensor_ref_collection.h</a> <a href="tensor__ref__collection_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:tensor__ref__collection_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Introduces TensorRefCollection concept and defines TensorRefBatch and TensorRefArray. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:tensor__view_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="tensor__view_8h.html">tensor_view.h</a> <a href="tensor__view_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:tensor__view_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a structure containing strides and a pointer to tensor data. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:tile__allocation_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="tile__allocation_8h.html">tile_allocation.h</a> <a href="tile__allocation_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:tile__allocation_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a fragment based on a Shape&lt;&gt; template. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:tile__coord_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="tile__coord_8h.html">tile_coord.h</a> <a href="tile__coord_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:tile__coord_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a coordinate used for the CUTLASS 4-D tile structure. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:tile__iterator_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="tile__iterator_8h.html">tile_iterator.h</a> <a href="tile__iterator_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:tile__iterator_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:tile__stream_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="tile__stream_8h.html">tile_stream.h</a> <a href="tile__stream_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:tile__stream_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Implements the tile stream concept, composing an iterator with a transformation. Offers split-phase semantics, separating the initiation of an asynchronous memory operation with a fence forcing it to complete. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:tile__traits__standard_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="tile__traits__standard_8h.html">tile_traits_standard.h</a> <a href="tile__traits__standard_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:tile__traits__standard_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines tile traits for several tile partitioning arrangements of threads expected to achieve efficient streaming performance. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -143,11 +155,20 @@ Files</h2></td></tr>
 <tr class="memitem:wmma__matrix_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="wmma__matrix_8h.html">wmma_matrix.h</a> <a href="wmma__matrix_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:wmma__matrix_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Abstractions for loading and storing matrices using the CUDA WMMA API. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:zip__fragment_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="zip__fragment_8h.html">zip_fragment.h</a> <a href="zip__fragment_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:zip__fragment_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Models a pair of fragments. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:zip__tensor__ref_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="zip__tensor__ref_8h.html">zip_tensor_ref.h</a> <a href="zip__tensor__ref_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:zip__tensor__ref_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a structure containing a pair of TensorRef-like objects. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:zip__tile__iterator_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="zip__tile__iterator_8h.html">zip_tile_iterator.h</a> <a href="zip__tile__iterator_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:zip__tile__iterator_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs an iterator that owns two tile iterator instances. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/dir_18d6a367a3982a494d65599933fc67a3.html b/docs/dir_18d6a367a3982a494d65599933fc67a3.html
index 161267475..b606ad3e0 100644
--- a/docs/dir_18d6a367a3982a494d65599933fc67a3.html
+++ b/docs/dir_18d6a367a3982a494d65599933fc67a3.html
@@ -85,9 +85,24 @@ Files</h2></td></tr>
 <tr class="memitem:dgemm__traits_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="dgemm__traits_8h.html">dgemm_traits.h</a> <a href="dgemm__traits_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:dgemm__traits_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines structural traits of double-precision GEMM. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:fp16__sgemm__multiply__add_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="fp16__sgemm__multiply__add_8h.html">fp16_sgemm_multiply_add.h</a> <a href="fp16__sgemm__multiply__add_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:fp16__sgemm__multiply__add_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template implementing matrix multiply-add operations on fragments. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:fp16__sgemm__traits_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="fp16__sgemm__traits_8h.html">fp16_sgemm_traits.h</a> <a href="fp16__sgemm__traits_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:fp16__sgemm__traits_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defies structural properties of single-precision GEMM where any number of the input/output could be fp16 or fp32. The accumulator type stays in fp32. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:gemm_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="gemm_8h.html">gemm.h</a> <a href="gemm_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:gemm_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Implements a software-pipelined efficient GEMM. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:gemm__config_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="gemm__config_8h.html">gemm_config.h</a> <a href="gemm__config_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:gemm__config_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines properties of GEMM computation that impose some constraints on caller. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:gemm__coord_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="gemm__coord_8h.html">gemm_coord.h</a> <a href="gemm__coord_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:gemm__coord_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">GemmCoord is a structure derived from <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> that specifies a location within the coordinate system of a GEMM problem. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:gemm__desc_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="gemm__desc_8h.html">gemm_desc.h</a> <a href="gemm__desc_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:gemm__desc_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Implements a software-pipelined efficient GEMM. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:gemm__epilogue_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="gemm__epilogue_8h.html">gemm_epilogue.h</a> <a href="gemm__epilogue_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:gemm__epilogue_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the computed matrix product. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -109,6 +124,9 @@ Files</h2></td></tr>
 <tr class="memitem:gemm__shared__tile_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="gemm__shared__tile_8h.html">gemm_shared_tile.h</a> <a href="gemm__shared__tile_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:gemm__shared__tile_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines iterators for efficiently loading and storing tiles to and from shared memory. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:gemm__stream__pair_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="gemm__stream__pair_8h.html">gemm_stream_pair.h</a> <a href="gemm__stream__pair_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:gemm__stream__pair_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a pair of GEMM tile streams. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:gemm__traits_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="gemm__traits_8h.html">gemm_traits.h</a> <a href="gemm__traits_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:gemm__traits_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines structural properties of complete GEMM computation. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -124,9 +142,6 @@ Files</h2></td></tr>
 <tr class="memitem:hgemm__traits_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="hgemm__traits_8h.html">hgemm_traits.h</a> <a href="hgemm__traits_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:hgemm__traits_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defies structural properties of half-precision GEMM computation. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:identity__block__swizzle_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="identity__block__swizzle_8h.html">identity_block_swizzle.h</a> <a href="identity__block__swizzle_8h_source.html">[code]</a></td></tr>
-<tr class="memdesc:identity__block__swizzle_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defies functors for mapping blockIdx to partitions of the GEMM computation. <br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:igemm__epilogue_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="igemm__epilogue_8h.html">igemm_epilogue.h</a> <a href="igemm__epilogue_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:igemm__epilogue_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines the epilogue phase of the GEMM computation for IGEMM, supporting integer and floating-point output matrix formats. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -145,12 +160,21 @@ Files</h2></td></tr>
 <tr class="memitem:linear__scaling_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="linear__scaling_8h.html">linear_scaling.h</a> <a href="linear__scaling_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:linear__scaling_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Implements the BLAS linear scaling function alpha*AB + beta*C. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:linear__scaling__device__ptr_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="linear__scaling__device__ptr_8h.html">linear_scaling_device_ptr.h</a> <a href="linear__scaling__device__ptr_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:linear__scaling__device__ptr_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Implements the BLAS linear scaling function alpha*AB + beta*C. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:scalar__or__pointer_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="scalar__or__pointer_8h.html">scalar_or_pointer.h</a> <a href="scalar__or__pointer_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:scalar__or__pointer_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Implements the BLAS linear scaling function alpha*AB + beta*C. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:sgemm__traits_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="sgemm__traits_8h.html">sgemm_traits.h</a> <a href="sgemm__traits_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:sgemm__traits_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defies structural properties of single-precision GEMM. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:thread__multiply__add_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="thread__multiply__add_8h.html">thread_multiply_add.h</a> <a href="thread__multiply__add_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:thread__multiply__add_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template implementing matrix multiply-add operations on fragments. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:threadblock__swizzle_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="threadblock__swizzle_8h.html">threadblock_swizzle.h</a> <a href="threadblock__swizzle_8h_source.html">[code]</a></td></tr>
+<tr class="memdesc:threadblock__swizzle_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defies functors for mapping blockIdx to partitions of the GEMM computation. <br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:wmma__gemm__epilogue__traits_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="wmma__gemm__epilogue__traits_8h.html">wmma_gemm_epilogue_traits.h</a> <a href="wmma__gemm__epilogue__traits_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:wmma__gemm__epilogue__traits_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines structural properties of WMMA GEMM's epilogue phase. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -170,7 +194,7 @@ Files</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/dir_c5917a9a879e9a6c73eaf5237444ab84.html b/docs/dir_c5917a9a879e9a6c73eaf5237444ab84.html
index a66eb22fa..9011cf40c 100644
--- a/docs/dir_c5917a9a879e9a6c73eaf5237444ab84.html
+++ b/docs/dir_c5917a9a879e9a6c73eaf5237444ab84.html
@@ -79,12 +79,16 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="files"></a>
 Files</h2></td></tr>
+<tr class="memitem:complex_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="complex_8h.html">complex.h</a> <a href="complex_8h_source.html">[code]</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:cutlass__math_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="cutlass__math_8h.html">cutlass_math.h</a> <a href="cutlass__math_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:cutlass__math_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Math utilities. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:debug_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="debug_8h.html">debug.h</a> <a href="debug_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:debug_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">Debugging and logging functionality. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:numeric__types_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="numeric__types_8h.html">numeric_types.h</a> <a href="numeric__types_8h_source.html">[code]</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:platform_8h"><td class="memItemLeft" align="right" valign="top">file &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="platform_8h.html">platform.h</a> <a href="platform_8h_source.html">[code]</a></td></tr>
 <tr class="memdesc:platform_8h"><td class="mdescLeft">&#160;</td><td class="mdescRight">C++ features that may be otherwise unimplemented for CUDA device functions. <br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -92,7 +96,7 @@ Files</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/files.html b/docs/files.html
index 2c06de5a8..101952090 100644
--- a/docs/files.html
+++ b/docs/files.html
@@ -75,62 +75,79 @@ $(function() {
 <div class="textblock">Here is a list of all files with brief descriptions:</div><div class="directory">
 <table class="directory">
 <tr id="row_0_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="clear__accumulators_8h_source.html"><span class="icondoc"></span></a><a class="el" href="clear__accumulators_8h.html" target="_self">clear_accumulators.h</a></td><td class="desc">Defines abstractions for efficiently clearing accumulator tiles </td></tr>
-<tr id="row_1_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="convert_8h_source.html"><span class="icondoc"></span></a><a class="el" href="convert_8h.html" target="_self">convert.h</a></td><td class="desc">Defines conversion operations among Fragments of different base type </td></tr>
-<tr id="row_2_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="coord_8h_source.html"><span class="icondoc"></span></a><a class="el" href="coord_8h.html" target="_self">coord.h</a></td><td class="desc">A Coord is a coordinate of arbitrary rank into a tensor or matrix </td></tr>
-<tr id="row_3_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="core__io_8h_source.html"><span class="icondoc"></span></a><a class="el" href="core__io_8h.html" target="_self">core_io.h</a></td><td class="desc">Helpers for printing cutlass/core objects </td></tr>
-<tr id="row_4_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="cutlass_8h_source.html"><span class="icondoc"></span></a><a class="el" href="cutlass_8h.html" target="_self">cutlass.h</a></td><td class="desc">Basic include for CUTLASS macros </td></tr>
-<tr id="row_5_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="cutlass__math_8h_source.html"><span class="icondoc"></span></a><a class="el" href="cutlass__math_8h.html" target="_self">cutlass_math.h</a></td><td class="desc">Math utilities </td></tr>
-<tr id="row_6_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="debug_8h_source.html"><span class="icondoc"></span></a><a class="el" href="debug_8h.html" target="_self">debug.h</a></td><td class="desc">Debugging and logging functionality </td></tr>
-<tr id="row_7_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="dgemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="dgemm__traits_8h.html" target="_self">dgemm_traits.h</a></td><td class="desc">Defines structural traits of double-precision GEMM </td></tr>
-<tr id="row_8_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="fragment_8h_source.html"><span class="icondoc"></span></a><a class="el" href="fragment_8h.html" target="_self">fragment.h</a></td><td class="desc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread's registers </td></tr>
-<tr id="row_9_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="fragment__load__store_8h_source.html"><span class="icondoc"></span></a><a class="el" href="fragment__load__store_8h.html" target="_self">fragment_load_store.h</a></td><td class="desc">Defines accessors for loading and storing fragments to memory efficiently </td></tr>
-<tr id="row_10_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="fragment__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="fragment__multiply__add_8h.html" target="_self">fragment_multiply_add.h</a></td><td class="desc">Defines multiply-add operations on fragments within a thread </td></tr>
-<tr id="row_11_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm_8h.html" target="_self">gemm.h</a></td><td class="desc">Implements a software-pipelined efficient GEMM </td></tr>
-<tr id="row_12_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__epilogue_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__epilogue_8h.html" target="_self">gemm_epilogue.h</a></td><td class="desc">Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the computed matrix product </td></tr>
-<tr id="row_13_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__epilogue__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__epilogue__traits_8h.html" target="_self">gemm_epilogue_traits.h</a></td><td class="desc">Defines structural properties of the GEMM epilogue </td></tr>
-<tr id="row_14_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__global__stream_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__global__stream_8h.html" target="_self">gemm_global_stream.h</a></td><td class="desc">Implements efficient loading of the thread block-level tile from global memory and storing to shared memory </td></tr>
-<tr id="row_15_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__global__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__global__tile_8h.html" target="_self">gemm_global_tile.h</a></td><td class="desc">Defines iterators for efficiently loading and storing to global memory </td></tr>
-<tr id="row_16_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__operand_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__operand_8h.html" target="_self">gemm_operand.h</a></td><td class="desc">Defines constant expressions for mapping GEMM problem size and strides onto pitch-linear memory </td></tr>
-<tr id="row_17_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__shared__stream_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__shared__stream_8h.html" target="_self">gemm_shared_stream.h</a></td><td class="desc">Defines abstractions for managing loading and storing fragments to shared memory in the efficient GEMM pipeline </td></tr>
-<tr id="row_18_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__shared__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__shared__tile_8h.html" target="_self">gemm_shared_tile.h</a></td><td class="desc">Defines iterators for efficiently loading and storing tiles to and from shared memory </td></tr>
-<tr id="row_19_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__traits_8h.html" target="_self">gemm_traits.h</a></td><td class="desc">Defines structural properties of complete GEMM computation </td></tr>
-<tr id="row_20_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="hgemm__global__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="hgemm__global__tile_8h.html" target="_self">hgemm_global_tile.h</a></td><td class="desc">Tile traits used to construct global tile iterator for HGEMM. This is intended to partition the thread block-level tile into 2D subtiles loaded by the threads and facilitate memory accesses larger than 16 bits </td></tr>
-<tr id="row_21_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="hgemm__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="hgemm__multiply__add_8h.html" target="_self">hgemm_multiply_add.h</a></td><td class="desc">Specialization implementing multiply-add operation on half-precision floating point fragments </td></tr>
-<tr id="row_22_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="hgemm__swizzle_8h_source.html"><span class="icondoc"></span></a><a class="el" href="hgemm__swizzle_8h.html" target="_self">hgemm_swizzle.h</a></td><td class="desc">Transposes a tile of 16b elements. Used by HGEMM to construct a K-strided layout in shared memory for multiplicands </td></tr>
-<tr id="row_23_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="hgemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="hgemm__traits_8h.html" target="_self">hgemm_traits.h</a></td><td class="desc">Defies structural properties of half-precision GEMM computation </td></tr>
-<tr id="row_24_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="identity__block__swizzle_8h_source.html"><span class="icondoc"></span></a><a class="el" href="identity__block__swizzle_8h.html" target="_self">identity_block_swizzle.h</a></td><td class="desc">Defies functors for mapping blockIdx to partitions of the GEMM computation </td></tr>
-<tr id="row_25_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__epilogue_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__epilogue_8h.html" target="_self">igemm_epilogue.h</a></td><td class="desc">Defines the epilogue phase of the GEMM computation for IGEMM, supporting integer and floating-point output matrix formats </td></tr>
-<tr id="row_26_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__global__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__global__tile_8h.html" target="_self">igemm_global_tile.h</a></td><td class="desc">Implements tile iterators to partition the thread block tile into 2D subtiles and efficiently load each. Applies permute transformation to construct 'interleaved K-strided' data layout in which 4-element dot products from the same K index are arranged in consecutive locations within shared memory </td></tr>
-<tr id="row_27_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__multiply__add_8h.html" target="_self">igemm_multiply_add.h</a></td><td class="desc">Implements matrix multiply accumulate operation of 8-bit integer data using DP4A instruction </td></tr>
-<tr id="row_28_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__swizzle_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__swizzle_8h.html" target="_self">igemm_swizzle.h</a></td><td class="desc">Transposes a fragment of data containing packed 8-bit integer elements </td></tr>
-<tr id="row_29_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__traits_8h.html" target="_self">igemm_traits.h</a></td><td class="desc">Defies structural properties of mixed-precision integer GEMM. Multiplicands are assumed to be packed 8bit integers, accumulators are assumed to be 32b signed integers, and output formats vary </td></tr>
-<tr id="row_30_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="iterator__access_8h_source.html"><span class="icondoc"></span></a><a class="el" href="iterator__access_8h.html" target="_self">iterator_access.h</a></td><td class="desc">Free functions for loading and storing to implementations of tile iteartor concepts </td></tr>
-<tr id="row_31_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="linear__scaling_8h_source.html"><span class="icondoc"></span></a><a class="el" href="linear__scaling_8h.html" target="_self">linear_scaling.h</a></td><td class="desc">Implements the BLAS linear scaling function alpha*AB + beta*C </td></tr>
-<tr id="row_32_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="load__store_8h_source.html"><span class="icondoc"></span></a><a class="el" href="load__store_8h.html" target="_self">load_store.h</a></td><td class="desc">Defines abstractions for efficiently loading and storing vectors to memory </td></tr>
-<tr id="row_33_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="matrix__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="matrix__traits_8h.html" target="_self">matrix_traits.h</a></td><td class="desc">Defines properties of matrices used to denote layout and operands to GEMM kernels </td></tr>
-<tr id="row_34_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="platform_8h_source.html"><span class="icondoc"></span></a><a class="el" href="platform_8h.html" target="_self">platform.h</a></td><td class="desc">C++ features that may be otherwise unimplemented for CUDA device functions </td></tr>
-<tr id="row_35_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="predicate__vector_8h_source.html"><span class="icondoc"></span></a><a class="el" href="predicate__vector_8h.html" target="_self">predicate_vector.h</a></td><td class="desc">Defines container classes and iterators for managing a statically sized vector of boolean predicates </td></tr>
-<tr id="row_36_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="reshape__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="reshape__tile_8h.html" target="_self">reshape_tile.h</a></td><td class="desc">Defines a type for restructuring a tile </td></tr>
-<tr id="row_37_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="sgemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="sgemm__traits_8h.html" target="_self">sgemm_traits.h</a></td><td class="desc">Defies structural properties of single-precision GEMM </td></tr>
-<tr id="row_38_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="shape_8h_source.html"><span class="icondoc"></span></a><a class="el" href="shape_8h.html" target="_self">shape.h</a></td><td class="desc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects </td></tr>
-<tr id="row_39_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tensor__ref_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tensor__ref_8h.html" target="_self">tensor_ref.h</a></td><td class="desc">Defines a structure containing strides, bounds, and a pointer to tensor data </td></tr>
-<tr id="row_40_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tensor__view_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tensor__view_8h.html" target="_self">tensor_view.h</a></td><td class="desc">Defines a structure containing strides and a pointer to tensor data </td></tr>
-<tr id="row_41_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="thread__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="thread__multiply__add_8h.html" target="_self">thread_multiply_add.h</a></td><td class="desc">Template implementing matrix multiply-add operations on fragments </td></tr>
-<tr id="row_42_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tile__iterator_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tile__iterator_8h.html" target="_self">tile_iterator.h</a></td><td class="desc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently </td></tr>
-<tr id="row_43_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tile__traits__standard_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tile__traits__standard_8h.html" target="_self">tile_traits_standard.h</a></td><td class="desc">Defines tile traits for several tile partitioning arrangements of threads expected to achieve efficient streaming performance </td></tr>
-<tr id="row_44_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="vector_8h_source.html"><span class="icondoc"></span></a><a class="el" href="vector_8h.html" target="_self">vector.h</a></td><td class="desc">Defines a 1D vector of elements held in the registers of each thread </td></tr>
-<tr id="row_45_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__epilogue__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__epilogue__traits_8h.html" target="_self">wmma_gemm_epilogue_traits.h</a></td><td class="desc">Defines structural properties of WMMA GEMM's epilogue phase </td></tr>
-<tr id="row_46_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__global__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__global__tile_8h.html" target="_self">wmma_gemm_global_tile.h</a></td><td class="desc">Defines tile iterator traits for loading thread block-level tile from global memory </td></tr>
-<tr id="row_47_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__multiply__add_8h.html" target="_self">wmma_gemm_multiply_add.h</a></td><td class="desc">Implements warp-level matrix multiply-accumulate operation using CUDA WMMA API </td></tr>
-<tr id="row_48_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__shared__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__shared__tile_8h.html" target="_self">wmma_gemm_shared_tile.h</a></td><td class="desc">Defines iterator traits for efficiently loading and storing fragment to and from shared memory, specialized for WMMA GEMM </td></tr>
-<tr id="row_49_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__traits_8h.html" target="_self">wmma_gemm_traits.h</a></td><td class="desc">Defies structural properties of GEMM targeting WMMA API in CUDA </td></tr>
-<tr id="row_50_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__matrix_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__matrix_8h.html" target="_self">wmma_matrix.h</a></td><td class="desc">Abstractions for loading and storing matrices using the CUDA WMMA API </td></tr>
+<tr id="row_1_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="complex_8h_source.html"><span class="icondoc"></span></a><a class="el" href="complex_8h.html" target="_self">complex.h</a></td><td class="desc"></td></tr>
+<tr id="row_2_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="convert_8h_source.html"><span class="icondoc"></span></a><a class="el" href="convert_8h.html" target="_self">convert.h</a></td><td class="desc">Defines conversion operations among Fragments of different base type </td></tr>
+<tr id="row_3_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="coord_8h_source.html"><span class="icondoc"></span></a><a class="el" href="coord_8h.html" target="_self">coord.h</a></td><td class="desc">A Coord is a coordinate of arbitrary rank into a tensor or matrix </td></tr>
+<tr id="row_4_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="core__io_8h_source.html"><span class="icondoc"></span></a><a class="el" href="core__io_8h.html" target="_self">core_io.h</a></td><td class="desc">Helpers for printing cutlass/core objects </td></tr>
+<tr id="row_5_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="cutlass_8h_source.html"><span class="icondoc"></span></a><a class="el" href="cutlass_8h.html" target="_self">cutlass.h</a></td><td class="desc">Basic include for CUTLASS macros </td></tr>
+<tr id="row_6_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="cutlass__math_8h_source.html"><span class="icondoc"></span></a><a class="el" href="cutlass__math_8h.html" target="_self">cutlass_math.h</a></td><td class="desc">Math utilities </td></tr>
+<tr id="row_7_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="debug_8h_source.html"><span class="icondoc"></span></a><a class="el" href="debug_8h.html" target="_self">debug.h</a></td><td class="desc">Debugging and logging functionality </td></tr>
+<tr id="row_8_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="dgemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="dgemm__traits_8h.html" target="_self">dgemm_traits.h</a></td><td class="desc">Defines structural traits of double-precision GEMM </td></tr>
+<tr id="row_9_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="fp16__sgemm__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="fp16__sgemm__multiply__add_8h.html" target="_self">fp16_sgemm_multiply_add.h</a></td><td class="desc">Template implementing matrix multiply-add operations on fragments </td></tr>
+<tr id="row_10_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="fp16__sgemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="fp16__sgemm__traits_8h.html" target="_self">fp16_sgemm_traits.h</a></td><td class="desc">Defies structural properties of single-precision GEMM where any number of the input/output could be fp16 or fp32. The accumulator type stays in fp32 </td></tr>
+<tr id="row_11_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="fragment_8h_source.html"><span class="icondoc"></span></a><a class="el" href="fragment_8h.html" target="_self">fragment.h</a></td><td class="desc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread's registers </td></tr>
+<tr id="row_12_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="fragment__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="fragment__multiply__add_8h.html" target="_self">fragment_multiply_add.h</a></td><td class="desc">Defines multiply-add operations on fragments within a thread </td></tr>
+<tr id="row_13_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm_8h.html" target="_self">gemm.h</a></td><td class="desc">Implements a software-pipelined efficient GEMM </td></tr>
+<tr id="row_14_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__config_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__config_8h.html" target="_self">gemm_config.h</a></td><td class="desc">Defines properties of GEMM computation that impose some constraints on caller </td></tr>
+<tr id="row_15_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__coord_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__coord_8h.html" target="_self">gemm_coord.h</a></td><td class="desc">GemmCoord is a structure derived from <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> that specifies a location within the coordinate system of a GEMM problem </td></tr>
+<tr id="row_16_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__desc_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__desc_8h.html" target="_self">gemm_desc.h</a></td><td class="desc">Implements a software-pipelined efficient GEMM </td></tr>
+<tr id="row_17_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__epilogue_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__epilogue_8h.html" target="_self">gemm_epilogue.h</a></td><td class="desc">Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the computed matrix product </td></tr>
+<tr id="row_18_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__epilogue__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__epilogue__traits_8h.html" target="_self">gemm_epilogue_traits.h</a></td><td class="desc">Defines structural properties of the GEMM epilogue </td></tr>
+<tr id="row_19_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__global__stream_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__global__stream_8h.html" target="_self">gemm_global_stream.h</a></td><td class="desc">Implements efficient loading of the thread block-level tile from global memory and storing to shared memory </td></tr>
+<tr id="row_20_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__global__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__global__tile_8h.html" target="_self">gemm_global_tile.h</a></td><td class="desc">Defines iterators for efficiently loading and storing to global memory </td></tr>
+<tr id="row_21_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__operand_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__operand_8h.html" target="_self">gemm_operand.h</a></td><td class="desc">Defines constant expressions for mapping GEMM problem size and strides onto pitch-linear memory </td></tr>
+<tr id="row_22_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__shared__stream_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__shared__stream_8h.html" target="_self">gemm_shared_stream.h</a></td><td class="desc">Defines abstractions for managing loading and storing fragments to shared memory in the efficient GEMM pipeline </td></tr>
+<tr id="row_23_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__shared__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__shared__tile_8h.html" target="_self">gemm_shared_tile.h</a></td><td class="desc">Defines iterators for efficiently loading and storing tiles to and from shared memory </td></tr>
+<tr id="row_24_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__stream__pair_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__stream__pair_8h.html" target="_self">gemm_stream_pair.h</a></td><td class="desc">Defines a pair of GEMM tile streams </td></tr>
+<tr id="row_25_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="gemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="gemm__traits_8h.html" target="_self">gemm_traits.h</a></td><td class="desc">Defines structural properties of complete GEMM computation </td></tr>
+<tr id="row_26_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="hgemm__global__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="hgemm__global__tile_8h.html" target="_self">hgemm_global_tile.h</a></td><td class="desc">Tile traits used to construct global tile iterator for HGEMM. This is intended to partition the thread block-level tile into 2D subtiles loaded by the threads and facilitate memory accesses larger than 16 bits </td></tr>
+<tr id="row_27_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="hgemm__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="hgemm__multiply__add_8h.html" target="_self">hgemm_multiply_add.h</a></td><td class="desc">Specialization implementing multiply-add operation on half-precision floating point fragments </td></tr>
+<tr id="row_28_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="hgemm__swizzle_8h_source.html"><span class="icondoc"></span></a><a class="el" href="hgemm__swizzle_8h.html" target="_self">hgemm_swizzle.h</a></td><td class="desc">Transposes a tile of 16b elements. Used by HGEMM to construct a K-strided layout in shared memory for multiplicands </td></tr>
+<tr id="row_29_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="hgemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="hgemm__traits_8h.html" target="_self">hgemm_traits.h</a></td><td class="desc">Defies structural properties of half-precision GEMM computation </td></tr>
+<tr id="row_30_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__epilogue_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__epilogue_8h.html" target="_self">igemm_epilogue.h</a></td><td class="desc">Defines the epilogue phase of the GEMM computation for IGEMM, supporting integer and floating-point output matrix formats </td></tr>
+<tr id="row_31_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__global__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__global__tile_8h.html" target="_self">igemm_global_tile.h</a></td><td class="desc">Implements tile iterators to partition the thread block tile into 2D subtiles and efficiently load each. Applies permute transformation to construct 'interleaved K-strided' data layout in which 4-element dot products from the same K index are arranged in consecutive locations within shared memory </td></tr>
+<tr id="row_32_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__multiply__add_8h.html" target="_self">igemm_multiply_add.h</a></td><td class="desc">Implements matrix multiply accumulate operation of 8-bit integer data using DP4A instruction </td></tr>
+<tr id="row_33_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__swizzle_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__swizzle_8h.html" target="_self">igemm_swizzle.h</a></td><td class="desc">Transposes a fragment of data containing packed 8-bit integer elements </td></tr>
+<tr id="row_34_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="igemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="igemm__traits_8h.html" target="_self">igemm_traits.h</a></td><td class="desc">Defies structural properties of mixed-precision integer GEMM. Multiplicands are assumed to be packed 8bit integers, accumulators are assumed to be 32b signed integers, and output formats vary </td></tr>
+<tr id="row_35_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="iterator__access_8h_source.html"><span class="icondoc"></span></a><a class="el" href="iterator__access_8h.html" target="_self">iterator_access.h</a></td><td class="desc">Free functions for loading and storing to implementations of tile iteartor concepts </td></tr>
+<tr id="row_36_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="kernel__launch_8h_source.html"><span class="icondoc"></span></a><a class="el" href="kernel__launch_8h.html" target="_self">kernel_launch.h</a></td><td class="desc">Defines structures and helpers to launch CUDA kernels within CUTLASS </td></tr>
+<tr id="row_37_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="linear__scaling_8h_source.html"><span class="icondoc"></span></a><a class="el" href="linear__scaling_8h.html" target="_self">linear_scaling.h</a></td><td class="desc">Implements the BLAS linear scaling function alpha*AB + beta*C </td></tr>
+<tr id="row_38_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="linear__scaling__device__ptr_8h_source.html"><span class="icondoc"></span></a><a class="el" href="linear__scaling__device__ptr_8h.html" target="_self">linear_scaling_device_ptr.h</a></td><td class="desc">Implements the BLAS linear scaling function alpha*AB + beta*C </td></tr>
+<tr id="row_39_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="load__store_8h_source.html"><span class="icondoc"></span></a><a class="el" href="load__store_8h.html" target="_self">load_store.h</a></td><td class="desc">Defines abstractions for efficiently loading and storing vectors to memory </td></tr>
+<tr id="row_40_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="matrix__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="matrix__traits_8h.html" target="_self">matrix_traits.h</a></td><td class="desc">Defines properties of matrices used to denote layout and operands to GEMM kernels </td></tr>
+<tr id="row_41_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="numeric__types_8h_source.html"><span class="icondoc"></span></a><a class="el" href="numeric__types_8h.html" target="_self">numeric_types.h</a></td><td class="desc"></td></tr>
+<tr id="row_42_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="platform_8h_source.html"><span class="icondoc"></span></a><a class="el" href="platform_8h.html" target="_self">platform.h</a></td><td class="desc">C++ features that may be otherwise unimplemented for CUDA device functions </td></tr>
+<tr id="row_43_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="predicate__vector_8h_source.html"><span class="icondoc"></span></a><a class="el" href="predicate__vector_8h.html" target="_self">predicate_vector.h</a></td><td class="desc">Defines container classes and iterators for managing a statically sized vector of boolean predicates </td></tr>
+<tr id="row_44_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="reshape__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="reshape__tile_8h.html" target="_self">reshape_tile.h</a></td><td class="desc">Defines a type for restructuring a tile </td></tr>
+<tr id="row_45_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="scalar__or__pointer_8h_source.html"><span class="icondoc"></span></a><a class="el" href="scalar__or__pointer_8h.html" target="_self">scalar_or_pointer.h</a></td><td class="desc">Implements the BLAS linear scaling function alpha*AB + beta*C </td></tr>
+<tr id="row_46_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="sgemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="sgemm__traits_8h.html" target="_self">sgemm_traits.h</a></td><td class="desc">Defies structural properties of single-precision GEMM </td></tr>
+<tr id="row_47_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="shape_8h_source.html"><span class="icondoc"></span></a><a class="el" href="shape_8h.html" target="_self">shape.h</a></td><td class="desc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects </td></tr>
+<tr id="row_48_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tensor__ref_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tensor__ref_8h.html" target="_self">tensor_ref.h</a></td><td class="desc">Defines a structure containing strides, bounds, and a pointer to tensor data </td></tr>
+<tr id="row_49_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tensor__ref__collection_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tensor__ref__collection_8h.html" target="_self">tensor_ref_collection.h</a></td><td class="desc">Introduces TensorRefCollection concept and defines TensorRefBatch and TensorRefArray </td></tr>
+<tr id="row_50_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tensor__view_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tensor__view_8h.html" target="_self">tensor_view.h</a></td><td class="desc">Defines a structure containing strides and a pointer to tensor data </td></tr>
+<tr id="row_51_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="thread__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="thread__multiply__add_8h.html" target="_self">thread_multiply_add.h</a></td><td class="desc">Template implementing matrix multiply-add operations on fragments </td></tr>
+<tr id="row_52_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="threadblock__swizzle_8h_source.html"><span class="icondoc"></span></a><a class="el" href="threadblock__swizzle_8h.html" target="_self">threadblock_swizzle.h</a></td><td class="desc">Defies functors for mapping blockIdx to partitions of the GEMM computation </td></tr>
+<tr id="row_53_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tile__allocation_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tile__allocation_8h.html" target="_self">tile_allocation.h</a></td><td class="desc">Defines a fragment based on a Shape&lt;&gt; template </td></tr>
+<tr id="row_54_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tile__coord_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tile__coord_8h.html" target="_self">tile_coord.h</a></td><td class="desc">Defines a coordinate used for the CUTLASS 4-D tile structure </td></tr>
+<tr id="row_55_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tile__iterator_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tile__iterator_8h.html" target="_self">tile_iterator.h</a></td><td class="desc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently </td></tr>
+<tr id="row_56_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tile__stream_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tile__stream_8h.html" target="_self">tile_stream.h</a></td><td class="desc">Implements the tile stream concept, composing an iterator with a transformation. Offers split-phase semantics, separating the initiation of an asynchronous memory operation with a fence forcing it to complete </td></tr>
+<tr id="row_57_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="tile__traits__standard_8h_source.html"><span class="icondoc"></span></a><a class="el" href="tile__traits__standard_8h.html" target="_self">tile_traits_standard.h</a></td><td class="desc">Defines tile traits for several tile partitioning arrangements of threads expected to achieve efficient streaming performance </td></tr>
+<tr id="row_58_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="vector_8h_source.html"><span class="icondoc"></span></a><a class="el" href="vector_8h.html" target="_self">vector.h</a></td><td class="desc">Defines a 1D vector of elements held in the registers of each thread </td></tr>
+<tr id="row_59_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__epilogue__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__epilogue__traits_8h.html" target="_self">wmma_gemm_epilogue_traits.h</a></td><td class="desc">Defines structural properties of WMMA GEMM's epilogue phase </td></tr>
+<tr id="row_60_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__global__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__global__tile_8h.html" target="_self">wmma_gemm_global_tile.h</a></td><td class="desc">Defines tile iterator traits for loading thread block-level tile from global memory </td></tr>
+<tr id="row_61_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__multiply__add_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__multiply__add_8h.html" target="_self">wmma_gemm_multiply_add.h</a></td><td class="desc">Implements warp-level matrix multiply-accumulate operation using CUDA WMMA API </td></tr>
+<tr id="row_62_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__shared__tile_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__shared__tile_8h.html" target="_self">wmma_gemm_shared_tile.h</a></td><td class="desc">Defines iterator traits for efficiently loading and storing fragment to and from shared memory, specialized for WMMA GEMM </td></tr>
+<tr id="row_63_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__gemm__traits_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__gemm__traits_8h.html" target="_self">wmma_gemm_traits.h</a></td><td class="desc">Defies structural properties of GEMM targeting WMMA API in CUDA </td></tr>
+<tr id="row_64_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="wmma__matrix_8h_source.html"><span class="icondoc"></span></a><a class="el" href="wmma__matrix_8h.html" target="_self">wmma_matrix.h</a></td><td class="desc">Abstractions for loading and storing matrices using the CUDA WMMA API </td></tr>
+<tr id="row_65_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="zip__fragment_8h_source.html"><span class="icondoc"></span></a><a class="el" href="zip__fragment_8h.html" target="_self">zip_fragment.h</a></td><td class="desc">Models a pair of fragments </td></tr>
+<tr id="row_66_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="zip__tensor__ref_8h_source.html"><span class="icondoc"></span></a><a class="el" href="zip__tensor__ref_8h.html" target="_self">zip_tensor_ref.h</a></td><td class="desc">Defines a structure containing a pair of TensorRef-like objects </td></tr>
+<tr id="row_67_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a href="zip__tile__iterator_8h_source.html"><span class="icondoc"></span></a><a class="el" href="zip__tile__iterator_8h.html" target="_self">zip_tile_iterator.h</a></td><td class="desc">Constructs an iterator that owns two tile iterator instances </td></tr>
 </table>
 </div><!-- directory -->
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/fp16__sgemm__multiply__add_8h.html b/docs/fp16__sgemm__multiply__add_8h.html
new file mode 100644
index 000000000..deff050ef
--- /dev/null
+++ b/docs/fp16__sgemm__multiply__add_8h.html
@@ -0,0 +1,111 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: fp16_sgemm_multiply_add.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">fp16_sgemm_multiply_add.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Template implementing matrix multiply-add operations on fragments.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="thread__multiply__add_8h_source.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</code><br />
+</div>
+<p><a href="fp16__sgemm__multiply__add_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/fp16__sgemm__multiply__add_8h_source.html b/docs/fp16__sgemm__multiply__add_8h_source.html
new file mode 100644
index 000000000..efac04637
--- /dev/null
+++ b/docs/fp16__sgemm__multiply__add_8h_source.html
@@ -0,0 +1,107 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: fp16_sgemm_multiply_add.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">fp16_sgemm_multiply_add.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="fp16__sgemm__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__multiply__add_8h.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ThreadGemmShape_,</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_&gt;</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">   40</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt;ThreadGemmShape_, ThreadsPerWarp_, half, half, float&gt; {</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7">   42</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7">InstructionShape</a>;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">   44</a></span>&#160;  <span class="keyword">typedef</span> ThreadGemmShape_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">ThreadGemmShape</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42">   46</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">ThreadGemmShape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42">AccumulatorsPerThread</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">   48</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">ThreadsPerWarp</a>;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2">   50</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">ShapeMul&lt;ThreadGemmShape, ThreadsPerWarp&gt;::Shape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2">AccumulatorsPerWarp</a>;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">   52</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">ScalarA</a>;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">   54</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarA, AccumulatorsPerThread::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">FragmentA</a>;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">   56</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">ScalarB</a>;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">   58</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarB, AccumulatorsPerThread::kH&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">FragmentB</a>;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">   60</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">float</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">ScalarC</a>;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">   62</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarC, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW, 16&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">Accumulators</a>;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a0ab850304c3c6e73bcba321426ba93f9">   65</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a0ab850304c3c6e73bcba321426ba93f9">ThreadMultiplyAdd</a>() {}</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#ae0ea662652907b60140598dad777c5ab">   68</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#ae0ea662652907b60140598dad777c5ab">multiply_add</a>(<a class="code" href="structcutlass_1_1Fragment.html">FragmentA</a> <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">FragmentB</a> <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a> <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a>&amp; d) {</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; AccumulatorsPerThread::kH; ++j) {</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; AccumulatorsPerThread::kW; ++i) {</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;        d[j * AccumulatorsPerThread::kW + i] = <span class="keyword">static_cast&lt;</span><a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">ScalarC</a><span class="keyword">&gt;</span>(a[i]) * static_cast&lt;ScalarC&gt;(b[j]) + c[j * AccumulatorsPerThread::kW + i];</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      }</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    }</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  }</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;};</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_a0ab850304c3c6e73bcba321426ba93f9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a0ab850304c3c6e73bcba321426ba93f9">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ThreadMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE ThreadMultiplyAdd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_a8d74401ef0bfa076caad70669fb8d100"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::FragmentB</a></div><div class="ttdeci">Fragment&lt; ScalarB, AccumulatorsPerThread::kH &gt; FragmentB</div><div class="ttdoc">The fragment for B. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:58</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeMul_html_a8875fc5e861339f981360ed774e8cc94"><div class="ttname"><a href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">cutlass::ShapeMul::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD *B_::kD, A_::kH *B_::kH, A_::kW *B_::kW, A_::kC *B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:119</div></div>
+<div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_a9a5632bb1891a33126d6170af72a3ae2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::AccumulatorsPerWarp</a></div><div class="ttdeci">ShapeMul&lt; ThreadGemmShape, ThreadsPerWarp &gt;::Shape AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:50</div></div>
+<div class="ttc" id="thread__multiply__add_8h_html"><div class="ttname"><a href="thread__multiply__add_8h.html">thread_multiply_add.h</a></div><div class="ttdoc">Template implementing matrix multiply-add operations on fragments. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_a8bbf1a5eac01585438c639da0e40e5c8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ThreadGemmShape</a></div><div class="ttdeci">ThreadGemmShape_ ThreadGemmShape</div><div class="ttdoc">The shape of a thread-leveel matrix multiply accumulate. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_ae0ea662652907b60140598dad777c5ab"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#ae0ea662652907b60140598dad777c5ab">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:68</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_a4f4a40f3e77a7c36425449fa97bf2324"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ScalarA</a></div><div class="ttdeci">half ScalarA</div><div class="ttdoc">The type for A. specialized to half. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_a3f4a2d052e6701f5d0ff950a850eabe3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ScalarB</a></div><div class="ttdeci">half ScalarB</div><div class="ttdoc">The type for B. specialized to half. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:56</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_aea4b928b0cfd4082e93851104838c5d7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The number of threads per warp. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_abe217e2e1a21b9f7cff5bb0a56bfa959"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::FragmentA</a></div><div class="ttdeci">Fragment&lt; ScalarA, AccumulatorsPerThread::kW &gt; FragmentA</div><div class="ttdoc">The fragment for A. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:54</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_a726556cb28d1515c89ac841f1140c781"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ScalarC</a></div><div class="ttdeci">float ScalarC</div><div class="ttdoc">The type for C and D. specialized to float. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_af197d64d806795a1d88d1833e5f3ac89"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::Accumulators</a></div><div class="ttdeci">Fragment&lt; ScalarC, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW, 16 &gt; Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_a70e8444060c36afb41e5064b2fb18b42"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::AccumulatorsPerThread</a></div><div class="ttdeci">ThreadGemmShape AccumulatorsPerThread</div><div class="ttdoc">Aliased to &quot;AccumulatorsPerThread&quot; for compatibility. Expect to be renamed in CUTLASS v2...</div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:44</div></div>
+<div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4_html_afc7858e849a2967631761986512dbfb7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::InstructionShape</a></div><div class="ttdeci">Shape&lt; 1, 1, 1, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> fp16_sgemm_multiply_add.h:42</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/fp16__sgemm__traits_8h.html b/docs/fp16__sgemm__traits_8h.html
new file mode 100644
index 000000000..0691fbbfc
--- /dev/null
+++ b/docs/fp16__sgemm__traits_8h.html
@@ -0,0 +1,117 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: fp16_sgemm_traits.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">fp16_sgemm_traits.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Defies structural properties of single-precision GEMM where any number of the input/output could be fp16 or fp32. The accumulator type stays in fp32.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue_8h_source.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue__traits_8h_source.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__traits_8h_source.html">cutlass/gemm/gemm_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="fp16__sgemm__multiply__add_8h_source.html">cutlass/gemm/fp16_sgemm_multiply_add.h</a>&quot;</code><br />
+</div>
+<p><a href="fp16__sgemm__traits_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">cutlass::gemm::Fp16SgemmConfig&lt; OutputTile_, ThreadGemmShape_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html">cutlass::gemm::Fp16SgemmSgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, Scalar_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/fp16__sgemm__traits_8h_source.html b/docs/fp16__sgemm__traits_8h_source.html
new file mode 100644
index 000000000..b5f94457f
--- /dev/null
+++ b/docs/fp16__sgemm__traits_8h_source.html
@@ -0,0 +1,104 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: fp16_sgemm_traits.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">fp16_sgemm_traits.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="fp16__sgemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fp16__sgemm__multiply__add_8h.html">cutlass/gemm/fp16_sgemm_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_,</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;    <span class="keyword">typename</span> ScalarA_,</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;    <span class="keyword">typename</span> ScalarB_,</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keyword">typename</span> ScalarD_,</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1&gt;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">   61</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">Fp16SgemmConfig</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;                         ScalarA_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;                         ScalarB_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;                         ScalarC_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;                         ScalarD_,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                         OutputTile_,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                         ThreadMultiplyAdd&lt;ThreadGemmShape_, Shape&lt;1, 4, 8&gt;, ScalarA_, ScalarB_, float <span class="comment">/*for sgemm accum is float*/</span>&gt;,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                         kScalarsPerLdgA_,</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;                         kScalarsPerLdgA_,</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;                         4,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;                         kScalarsPerLdgB_,</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;                         kScalarsPerLdgB_,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;                         4,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                         1,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;                         4,</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;                         1,</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;                         2&gt; {};</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 128, 128&gt;</a>,</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <span class="keyword">typename</span> ScalarA_ = half,</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="keyword">typename</span> ScalarB_ = half,</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keyword">typename</span> ScalarC_ = half,</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    <span class="keyword">typename</span> ScalarD_ = half,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keyword">typename</span> Scalar_ = half,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a>&lt;Scalar_, <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a>&lt;Scalar_, <span class="keywordtype">float</span><span class="comment">/*accumulator type*/</span>&gt; &gt;,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 8, 8&gt;</a>,</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1,</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <span class="keyword">typename</span> GemmConfig_ =</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">Fp16SgemmConfig</a>&lt;OutputTile_, </div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;                        ThreadGemmShape_, </div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                        ScalarA_,</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;                        ScalarB_,</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;                        ScalarC_,</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;                        ScalarD_,</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;                        kScalarsPerLdgA_, </div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;                        kScalarsPerLdgB_&gt;,</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    <span class="keyword">typename</span> GemmEpilogueTraits_ =</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits&lt;GemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html">  137</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html">Fp16SgemmSgemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a>&lt;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;                         <span class="comment">// The layout for A.</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;                         kLayoutA_,</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;                         <span class="comment">// The layout for B.</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;                         kLayoutB_,</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;                         GemmConfig_,</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;                         GemmEpilogue&lt;GemmEpilogueTraits_&gt;,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;                         Index_&gt; {};</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
+<div class="ttc" id="gemm__traits_8h_html"><div class="ttname"><a href="gemm__traits_8h.html">gemm_traits.h</a></div><div class="ttdoc">Defines structural properties of complete GEMM computation. </div></div>
+<div class="ttc" id="gemm__epilogue_8h_html"><div class="ttname"><a href="gemm__epilogue_8h.html">gemm_epilogue.h</a></div><div class="ttdoc">Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the comp...</div></div>
+<div class="ttc" id="gemm__shared__tile_8h_html"><div class="ttname"><a href="gemm__shared__tile_8h.html">gemm_shared_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing tiles to and from shared memory. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_config.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:323</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Fp16SgemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">cutlass::gemm::Fp16SgemmConfig</a></div><div class="ttdef"><b>Definition:</b> fp16_sgemm_traits.h:61</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="fp16__sgemm__multiply__add_8h_html"><div class="ttname"><a href="fp16__sgemm__multiply__add_8h.html">fp16_sgemm_multiply_add.h</a></div><div class="ttdoc">Template implementing matrix multiply-add operations on fragments. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:51</div></div>
+<div class="ttc" id="gemm_8h_html"><div class="ttname"><a href="gemm_8h.html">gemm.h</a></div><div class="ttdoc">Implements a software-pipelined efficient GEMM. </div></div>
+<div class="ttc" id="gemm__epilogue__traits_8h_html"><div class="ttname"><a href="gemm__epilogue__traits_8h.html">gemm_epilogue_traits.h</a></div><div class="ttdoc">Defines structural properties of the GEMM epilogue. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html">cutlass::gemm::Fp16SgemmSgemmTraits</a></div><div class="ttdef"><b>Definition:</b> fp16_sgemm_traits.h:137</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">cutlass::gemm::SimplifiedGemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:650</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a></div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:41</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/fragment_8h.html b/docs/fragment_8h.html
index d97ac7b5a..687dfdc86 100644
--- a/docs/fragment_8h.html
+++ b/docs/fragment_8h.html
@@ -83,15 +83,15 @@ $(function() {
 <p>Defines Fragment, a statically-sized array for storing parts of matrices within a thread's registers.  
 <a href="#details">More...</a></p>
 <div class="textblock"><code>#include &lt;assert.h&gt;</code><br />
-<code>#include &lt;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="cutlass__math_8h_source.html">cutlass/util/cutlass_math.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&gt;</code><br />
+<code>#include &quot;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="cutlass__math_8h_source.html">cutlass/util/cutlass_math.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&quot;</code><br />
 </div>
 <p><a href="fragment_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1StorageType.html">cutlass::StorageType&lt; kAlignment_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1StorageType.html">cutlass::StorageType&lt; alignment &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1StorageType_3_014_01_4.html">cutlass::StorageType&lt; 4 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -116,7 +116,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/fragment_8h_source.html b/docs/fragment_8h_source.html
index 8006bbbdf..f7d236565 100644
--- a/docs/fragment_8h_source.html
+++ b/docs/fragment_8h_source.html
@@ -76,64 +76,66 @@ $(function() {
 <div class="title">fragment.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="fragment_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;assert.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="cutlass__math_8h.html">cutlass/util/cutlass_math.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kAlignment_&gt;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType.html">   76</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1StorageType.html">StorageType</a> {</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06">   77</a></span>&#160;  <span class="keyword">typedef</span> uint64_t <a class="code" href="structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06">Type</a>;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;};</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_014_01_4.html">   80</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>&lt;4&gt; {</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807">   81</a></span>&#160;  <span class="keyword">typedef</span> uint32_t <a class="code" href="structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807">Type</a>;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;};</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_012_01_4.html">   84</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>&lt;2&gt; {</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4">   85</a></span>&#160;  <span class="keyword">typedef</span> uint16_t <a class="code" href="structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4">Type</a>;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;};</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_011_01_4.html">   88</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>&lt;1&gt; {</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4">   89</a></span>&#160;  <span class="keyword">typedef</span> uint8_t <a class="code" href="structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4">Type</a>;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;};</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Element_, <span class="keywordtype">int</span> kElements_, <span class="keywordtype">size_t</span> kAlignment_ = 16&gt;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html">   99</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;kAlignment_&gt; {</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">  101</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(kAlignment_ == 16 || kAlignment_ &gt;= <span class="keyword">sizeof</span>(Element_), <span class="stringliteral">&quot;Alignment is too small&quot;</span>);</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="structcutlass_1_1is__pow2.html">is_pow2&lt;kAlignment_&gt;::value</a>, <span class="stringliteral">&quot;Alignment must be a power of two&quot;</span>);</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;Element_, kElements_&gt;</a> <a class="code" href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">This_</a>;</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">  108</a></span>&#160;  <span class="keyword">typedef</span> Element_ <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">  110</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> = kElements_;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a29e7408fcde8cdf9de5e3a10eaa46391">  113</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Fragment.html#a29e7408fcde8cdf9de5e3a10eaa46391">clear</a>() {</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="comment">// Avoid element-wise access for sub 32b element type</span></div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <span class="keywordflow">if</span> (kAlignment_ &gt;= 8 &amp;&amp; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) % 8 == 0) {</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;      uint64_t* ptr = <span class="keyword">reinterpret_cast&lt;</span>uint64_t*<span class="keyword">&gt;</span>(storage);</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) / 8; ++i) {</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;        ptr[i] = uint64_t(0);</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      }</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (kAlignment_ &gt;= 4 &amp;&amp; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) % 4 == 0) {</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;      uint32_t* ptr = <span class="keyword">reinterpret_cast&lt;</span>uint32_t*<span class="keyword">&gt;</span>(storage);</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) / 4; ++i) {</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;        ptr[i] = uint32_t(0);</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;      }</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (kAlignment_ &gt;= 2 &amp;&amp; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) % 2 == 0) {</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;      uint16_t* ptr = <span class="keyword">reinterpret_cast&lt;</span>uint16_t*<span class="keyword">&gt;</span>(storage);</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) / 2; ++i) {</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;        ptr[i] = uint16_t(0);</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      }</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a>; ++i) {</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;        storage[i] = 0;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      }</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    }</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a99fef5f3093b2df50905ab13819b67a0">  138</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>&amp; <a class="code" href="structcutlass_1_1Fragment.html#a99fef5f3093b2df50905ab13819b67a0">operator[]</a>(<span class="keywordtype">int</span> i) {</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    assert(i &lt; kElements_);</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>*<span class="keyword">&gt;</span>(storage)[i];</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  }</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a75f51bb6ca84615076aab42ac9d42592">  144</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1Fragment.html#a75f51bb6ca84615076aab42ac9d42592">operator[]</a>(<span class="keywordtype">int</span> i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    assert(i &lt; kElements_);</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> const*<span class="keyword">&gt;</span>(storage)[i];</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  }</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06">StorageType&lt;kAlignment_&gt;::Type</a> <a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kStorageCount =</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      (<span class="keyword">sizeof</span>(Element_) * kElements_ + <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>) - 1) / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>);</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;  <a class="code" href="structcutlass_1_1StorageType.html">StorageType</a> storage[kStorageCount];</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>) &lt;= kAlignment_, <span class="stringliteral">&quot;StorageType is too big for given alignment&quot;</span>);</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;};</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_, <span class="keyword">typename</span> Iterations_, <span class="keyword">typename</span> AccessType_&gt;</div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html">  170</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a> {</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369">  172</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1FragmentIterator.html">FragmentIterator&lt;Fragment_, Iterations_, AccessType_&gt;</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369">This_</a>;</div><div class="line"><a name="l00174"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808">  174</a></span>&#160;  <span class="keyword">typedef</span> Fragment_ <a class="code" href="structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808">Fragment</a>;</div><div class="line"><a name="l00176"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">  176</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">Iterations</a>;</div><div class="line"><a name="l00178"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">  178</a></span>&#160;  <span class="keyword">typedef</span> AccessType_ <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div><div class="line"><a name="l00181"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">  181</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Fragment::Element</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">Element</a>;</div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">  183</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a> = (int)(<span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>) / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">Element</a>));</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">  185</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html">ShapeMul&lt;Iterations, Shape&lt;1, 1, 1, kElementsPerAccess&gt;</a> &gt;<a class="code" href="structcutlass_1_1Shape.html">::Shape</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentShape</a>;</div><div class="line"><a name="l00187"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1">  187</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">ShapeStrides&lt;FragmentShape&gt;::Shape</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1">Strides</a>;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> OtherFragment_&gt;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#ae1825fe3e138e2aa62d27dab2b5227b4">  191</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1FragmentIterator.html#ae1825fe3e138e2aa62d27dab2b5227b4">FragmentIterator</a>(OtherFragment_&amp; fragment, <span class="keywordtype">int</span> offset = 0)</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;      : <a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>(reinterpret_cast&lt;<a class="code" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">Element</a>*&gt;(&amp;fragment[offset])) {</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(OtherFragment_::kElements &gt;= <a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">Fragment::kElements</a>, <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  }</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div><div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a9cf31df06ff035705a1341810fcdcbf2">  197</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1FragmentIterator.html#a9cf31df06ff035705a1341810fcdcbf2">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c = 0)<span class="keyword"> const </span>{</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> imm = <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">ComputeOffsetFromStrides&lt;Strides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>[imm]);</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;  }</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a7bdc407aae8d7360e089af347b585a53">  203</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp; <a class="code" href="structcutlass_1_1FragmentIterator.html#a7bdc407aae8d7360e089af347b585a53">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c = 0) {</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> imm = <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">ComputeOffsetFromStrides&lt;Strides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>[imm]);</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  }</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;</div><div class="line"><a name="l00209"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a83bb6a3ed588e2d890bf986665d2b7bb">  209</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1FragmentIterator.html#a83bb6a3ed588e2d890bf986665d2b7bb">operator[]</a>(<span class="keywordtype">int</span> i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>[i * <a class="code" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a>]);</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  }</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;</div><div class="line"><a name="l00214"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a3bd2a9d8467f8db02ca3a01ae0c11ad7">  214</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp; <a class="code" href="structcutlass_1_1FragmentIterator.html#a3bd2a9d8467f8db02ca3a01ae0c11ad7">operator[]</a>(<span class="keywordtype">int</span> i) {</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>[i * <a class="code" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a>]);</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;  }</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#ab18f8ea676b45831f939715212167a99">  219</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1FragmentIterator.html#ab18f8ea676b45831f939715212167a99">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">  222</a></span>&#160;  <a class="code" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">Element</a>* <a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;};</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_, <span class="keyword">typename</span> Iterations_, <span class="keyword">typename</span> AccessType_&gt;</div><div class="line"><a name="l00228"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html">  228</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1FragmentConstIterator.html">FragmentConstIterator</a> {</div><div class="line"><a name="l00230"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f">  230</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1FragmentIterator.html">FragmentIterator&lt;Fragment_, Iterations_, AccessType_&gt;</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f">This_</a>;</div><div class="line"><a name="l00232"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05">  232</a></span>&#160;  <span class="keyword">typedef</span> Fragment_ <a class="code" href="structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05">Fragment</a>;</div><div class="line"><a name="l00234"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">  234</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">Iterations</a>;</div><div class="line"><a name="l00236"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">  236</a></span>&#160;  <span class="keyword">typedef</span> AccessType_ <a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a>;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div><div class="line"><a name="l00239"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">  239</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Fragment::Element</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a>;</div><div class="line"><a name="l00241"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">  241</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">kElementsPerAccess</a> = (int)(<span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a>) / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a>));</div><div class="line"><a name="l00243"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">  243</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html">ShapeMul&lt;Iterations, Shape&lt;1, 1, 1, kElementsPerAccess&gt;</a> &gt;<a class="code" href="structcutlass_1_1Shape.html">::Shape</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">FragmentShape</a>;</div><div class="line"><a name="l00245"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b">  245</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">ShapeStrides&lt;FragmentShape&gt;::Shape</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b">IterationsStrides</a>;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> OtherFragment_&gt;</div><div class="line"><a name="l00249"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#ac4b6f351e6e72bed37e425f02a10c81e">  249</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1FragmentConstIterator.html#ac4b6f351e6e72bed37e425f02a10c81e">FragmentConstIterator</a>(OtherFragment_&amp; fragment, <span class="keywordtype">int</span> offset = 0)</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      : <a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>(reinterpret_cast&lt;<a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a> const*&gt;(&amp;fragment[offset])) {</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;    <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(OtherFragment_::kElements &gt;= <a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">Fragment::kElements</a>, <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;  }</div><div class="line"><a name="l00254"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a3a8fd8f13c157ed13dc93fd78036c59e">  254</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a3a8fd8f13c157ed13dc93fd78036c59e">FragmentConstIterator</a>(</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;      <a class="code" href="structcutlass_1_1FragmentIterator.html">FragmentIterator&lt;Fragment_, Iterations_, AccessType_&gt;</a> <span class="keyword">const</span>&amp; rhs_)</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      : <a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>(reinterpret_cast&lt;<a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a> const*&gt;(rhs_.offset)) {}</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00259"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a8b957150545becacab1b8ead1be29424">  259</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a8b957150545becacab1b8ead1be29424">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c = 0)<span class="keyword"> const </span>{</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> imm = <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">ComputeOffsetFromStrides&lt;IterationsStrides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>[imm]);</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;  }</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00265"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#af16f2aa14ff424b038a393b683c4783e">  265</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1FragmentConstIterator.html#af16f2aa14ff424b038a393b683c4783e">operator[]</a>(<span class="keywordtype">int</span> i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>[i * <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">kElementsPerAccess</a>]);</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;  }</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div><div class="line"><a name="l00270"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a01571b2fc566793fd50a10fa82441951">  270</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a01571b2fc566793fd50a10fa82441951">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div><div class="line"><a name="l00273"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">  273</a></span>&#160;  <a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a> <span class="keyword">const</span>* <a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>;</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;};</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1Fragment_html_a29e7408fcde8cdf9de5e3a10eaa46391"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a29e7408fcde8cdf9de5e3a10eaa46391">cutlass::Fragment::clear</a></div><div class="ttdeci">CUTLASS_DEVICE void clear()</div><div class="ttdoc">Clear a fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:113</div></div>
+<a href="fragment_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;assert.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass__math_8h.html">cutlass/util/cutlass_math.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> alignment&gt;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType.html">   76</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1StorageType.html">StorageType</a> {</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b">   77</a></span>&#160;  <span class="keyword">typedef</span> uint64_t <a class="code" href="structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b">Type</a>;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;};</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_014_01_4.html">   80</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>&lt;4&gt; {</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807">   81</a></span>&#160;  <span class="keyword">typedef</span> uint32_t <a class="code" href="structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807">Type</a>;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;};</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_012_01_4.html">   84</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>&lt;2&gt; {</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4">   85</a></span>&#160;  <span class="keyword">typedef</span> uint16_t <a class="code" href="structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4">Type</a>;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;};</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_011_01_4.html">   88</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>&lt;1&gt; {</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4">   89</a></span>&#160;  <span class="keyword">typedef</span> uint8_t <a class="code" href="structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4">Type</a>;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;};</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Element_, <span class="keywordtype">int</span> kElements_, <span class="keywordtype">size_t</span> kAlignment_ = 16&gt;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html">   99</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;kAlignment_&gt; {</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">  101</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(kAlignment_ == 16 || kAlignment_ &gt;= <span class="keyword">sizeof</span>(Element_), <span class="stringliteral">&quot;Alignment is too small&quot;</span>);</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="structcutlass_1_1is__pow2.html">is_pow2&lt;kAlignment_&gt;::value</a>, <span class="stringliteral">&quot;Alignment must be a power of two&quot;</span>);</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;Element_, kElements_&gt;</a> <a class="code" href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">This_</a>;</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">  108</a></span>&#160;  <span class="keyword">typedef</span> Element_ <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">  110</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> = kElements_;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a84b6d68a5a24dbd04d842e0755b42bda">  112</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Fragment.html#a84b6d68a5a24dbd04d842e0755b42bda">kAlignment</a> = kAlignment_;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#acf28266500b87484530b2395925fca51">  115</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Fragment.html#acf28266500b87484530b2395925fca51">clear</a>() {</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="comment">// Avoid element-wise access for sub 32b element type</span></div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keywordflow">if</span> (kAlignment_ &gt;= 8 &amp;&amp; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) % 8 == 0) {</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;      uint64_t* ptr = <span class="keyword">reinterpret_cast&lt;</span>uint64_t*<span class="keyword">&gt;</span>(storage);</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) / 8; ++i) {</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;        ptr[i] = uint64_t(0);</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;      }</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (kAlignment_ &gt;= 4 &amp;&amp; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) % 4 == 0) {</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;      uint32_t* ptr = <span class="keyword">reinterpret_cast&lt;</span>uint32_t*<span class="keyword">&gt;</span>(storage);</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) / 4; ++i) {</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;        ptr[i] = uint32_t(0);</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;      }</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (kAlignment_ &gt;= 2 &amp;&amp; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) % 2 == 0) {</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;      uint16_t* ptr = <span class="keyword">reinterpret_cast&lt;</span>uint16_t*<span class="keyword">&gt;</span>(storage);</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; (<a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>)) / 2; ++i) {</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;        ptr[i] = uint16_t(0);</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      }</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a>; ++i) {</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;        storage[i] = 0;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    }</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  }</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a77ba7cddf7822d64534b019c4ad9732e">  140</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>&amp; <a class="code" href="structcutlass_1_1Fragment.html#a77ba7cddf7822d64534b019c4ad9732e">operator[]</a>(<span class="keywordtype">int</span> i) { <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>*<span class="keyword">&gt;</span>(storage)[i]; }</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="structcutlass_1_1Fragment.html#a7795c5cf4d5626ff125abd5e8f156e9b">  143</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1Fragment.html#a7795c5cf4d5626ff125abd5e8f156e9b">operator[]</a>(<span class="keywordtype">int</span> i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> const*<span class="keyword">&gt;</span>(storage)[i];</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  }</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1StorageType.html">StorageType&lt;kAlignment_&gt;::Type</a> <a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kStorageCount =</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      (<span class="keyword">sizeof</span>(Element_) * kElements_ + <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>) - 1) / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>);</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  <a class="code" href="structcutlass_1_1StorageType.html">StorageType</a> storage[kStorageCount];</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1StorageType.html">StorageType</a>) &lt;= kAlignment_, <span class="stringliteral">&quot;StorageType is too big for given alignment&quot;</span>);</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;};</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_, <span class="keyword">typename</span> Iterations_, <span class="keyword">typename</span> AccessType_&gt;</div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html">  168</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a> {</div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369">  170</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1FragmentIterator.html">FragmentIterator&lt;Fragment_, Iterations_, AccessType_&gt;</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369">This_</a>;</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808">  172</a></span>&#160;  <span class="keyword">typedef</span> Fragment_ <a class="code" href="structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808">Fragment</a>;</div><div class="line"><a name="l00174"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">  174</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">Iterations</a>;</div><div class="line"><a name="l00176"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">  176</a></span>&#160;  <span class="keyword">typedef</span> AccessType_ <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">  179</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Fragment::Element</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">Element</a>;</div><div class="line"><a name="l00181"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">  181</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a> = (int)(<span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>) / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">Element</a>));</div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">  183</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html">ShapeMul&lt;Iterations, Shape&lt;1, 1, 1, kElementsPerAccess&gt;</a> &gt;<a class="code" href="structcutlass_1_1Shape.html">::Shape</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentShape</a>;</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e">  185</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">ShapeStrides&lt;FragmentShape, kElementsPerAccess&gt;::Shape</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e">Strides</a>;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> OtherFragment_&gt;</div><div class="line"><a name="l00189"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a638e4e1d84b4ae84e758288c7f37548b">  189</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#a638e4e1d84b4ae84e758288c7f37548b">FragmentIterator</a>(OtherFragment_&amp; fragment, <span class="keywordtype">int</span> offset = 0)</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;      : <a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>(reinterpret_cast&lt;<a class="code" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">Element</a>*&gt;(&amp;fragment[offset])) {</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(OtherFragment_::kElements &gt;= <a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">Fragment::kElements</a>, <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;  }</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;</div><div class="line"><a name="l00195"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a35b721563536ab2c5dbab0f5de1c2b43">  195</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1FragmentIterator.html#a35b721563536ab2c5dbab0f5de1c2b43">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c = 0)<span class="keyword"> const </span>{</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> imm = <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;Strides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>[imm]);</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;  }</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#adb863b44dfbc1fa923625e767f6dd7cd">  201</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp; <a class="code" href="structcutlass_1_1FragmentIterator.html#adb863b44dfbc1fa923625e767f6dd7cd">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c = 0) {</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> imm = <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;Strides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>[imm]);</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;  }</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div><div class="line"><a name="l00207"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a21877944988f34eb69cb6eefb00c6575">  207</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1FragmentIterator.html#a21877944988f34eb69cb6eefb00c6575">operator[]</a>(<span class="keywordtype">int</span> i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>[i * <a class="code" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a>]);</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;  }</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#ad665745f3d6a3a88d7894fe0fc1bbd3e">  212</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp; <a class="code" href="structcutlass_1_1FragmentIterator.html#ad665745f3d6a3a88d7894fe0fc1bbd3e">operator[]</a>(<span class="keywordtype">int</span> i) {</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>[i * <a class="code" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a>]);</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;  }</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00217"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#a8608dd815ed4906d8c82c41a10df23e2">  217</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1FragmentIterator.html#a8608dd815ed4906d8c82c41a10df23e2">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;</div><div class="line"><a name="l00220"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">  220</a></span>&#160;  <a class="code" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">Element</a>* <a class="code" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a>;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;};</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_, <span class="keyword">typename</span> Iterations_, <span class="keyword">typename</span> AccessType_&gt;</div><div class="line"><a name="l00226"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html">  226</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1FragmentConstIterator.html">FragmentConstIterator</a> {</div><div class="line"><a name="l00228"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f">  228</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1FragmentIterator.html">FragmentIterator&lt;Fragment_, Iterations_, AccessType_&gt;</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f">This_</a>;</div><div class="line"><a name="l00230"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05">  230</a></span>&#160;  <span class="keyword">typedef</span> Fragment_ <a class="code" href="structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05">Fragment</a>;</div><div class="line"><a name="l00232"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">  232</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">Iterations</a>;</div><div class="line"><a name="l00234"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">  234</a></span>&#160;  <span class="keyword">typedef</span> AccessType_ <a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a>;</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">  237</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Fragment::Element</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a>;</div><div class="line"><a name="l00239"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">  239</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">kElementsPerAccess</a> = (int)(<span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a>) / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a>));</div><div class="line"><a name="l00241"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">  241</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html">ShapeMul&lt;Iterations, Shape&lt;1, 1, 1, kElementsPerAccess&gt;</a> &gt;<a class="code" href="structcutlass_1_1Shape.html">::Shape</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">FragmentShape</a>;</div><div class="line"><a name="l00243"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a">  243</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">ShapeStrides&lt;FragmentShape, kElementsPerAccess&gt;::Shape</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a">IterationsStrides</a>;</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> OtherFragment_&gt;</div><div class="line"><a name="l00247"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#ad3e99cd7f56d4aec0a28cfcbde66f5af">  247</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#ad3e99cd7f56d4aec0a28cfcbde66f5af">FragmentConstIterator</a>(OtherFragment_&amp; fragment, <span class="keywordtype">int</span> offset = 0)</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      : <a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>(reinterpret_cast&lt;<a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a> const*&gt;(&amp;fragment[offset])) {</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;    <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(OtherFragment_::kElements &gt;= <a class="code" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">Fragment::kElements</a>, <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;  }</div><div class="line"><a name="l00252"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a18f926c9c877e15a279f16637bd24e83">  252</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a18f926c9c877e15a279f16637bd24e83">FragmentConstIterator</a>(</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;      <a class="code" href="structcutlass_1_1FragmentIterator.html">FragmentIterator&lt;Fragment_, Iterations_, AccessType_&gt;</a> <span class="keyword">const</span>&amp; rhs_)</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;      : <a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>(reinterpret_cast&lt;<a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a> const*&gt;(rhs_.offset)) {}</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;</div><div class="line"><a name="l00257"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a14f2ad2f9b90aea092ff1836e8fb159d">  257</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a14f2ad2f9b90aea092ff1836e8fb159d">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c = 0)<span class="keyword"> const </span>{</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> imm = <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;IterationsStrides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>[imm]);</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;  }</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div><div class="line"><a name="l00263"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#a6216b58ffe6322f037f1e0a3ffa714c8">  263</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a6216b58ffe6322f037f1e0a3ffa714c8">operator[]</a>(<span class="keywordtype">int</span> i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>[i * <a class="code" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">kElementsPerAccess</a>]);</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;  }</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div><div class="line"><a name="l00268"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#ac4d601998a84a3eac23e3b7a7c8a935b">  268</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1FragmentConstIterator.html#ac4d601998a84a3eac23e3b7a7c8a935b">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div><div class="line"><a name="l00271"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">  271</a></span>&#160;  <a class="code" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a> <span class="keyword">const</span>* <a class="code" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a>;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;};</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1Fragment_html_acf28266500b87484530b2395925fca51"><div class="ttname"><a href="structcutlass_1_1Fragment.html#acf28266500b87484530b2395925fca51">cutlass::Fragment::clear</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void clear()</div><div class="ttdoc">Clear a fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:115</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a8608dd815ed4906d8c82c41a10df23e2"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a8608dd815ed4906d8c82c41a10df23e2">cutlass::FragmentIterator::valid</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Is the iterator valid? </div><div class="ttdef"><b>Definition:</b> fragment.h:217</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1Fragment_html_a99fef5f3093b2df50905ab13819b67a0"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a99fef5f3093b2df50905ab13819b67a0">cutlass::Fragment::operator[]</a></div><div class="ttdeci">CUTLASS_DEVICE Element &amp; operator[](int i)</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:138</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a7bdc407aae8d7360e089af347b585a53"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a7bdc407aae8d7360e089af347b585a53">cutlass::FragmentIterator::at</a></div><div class="ttdeci">CUTLASS_DEVICE AccessType &amp; at(int d, int h, int w, int c=0)</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:203</div></div>
-<div class="ttc" id="structcutlass_1_1AlignedStruct_html"><div class="ttname"><a href="structcutlass_1_1AlignedStruct.html">cutlass::AlignedStruct</a></div><div class="ttdef"><b>Definition:</b> vector.h:41</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a></div><div class="ttdef"><b>Definition:</b> fragment.h:228</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_af16f2aa14ff424b038a393b683c4783e"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#af16f2aa14ff424b038a393b683c4783e">cutlass::FragmentConstIterator::operator[]</a></div><div class="ttdeci">CUTLASS_DEVICE AccessType const  &amp; operator[](int i) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:265</div></div>
-<div class="ttc" id="structcutlass_1_1ShapeStrides_html_ac6fcda9b8e1782f24c1e6d67cd880a6a"><div class="ttname"><a href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">cutlass::ShapeStrides::Shape</a></div><div class="ttdeci">Shape&lt; Shape_::kH *Shape_::kW *Shape_::kC, Shape_::kW *Shape_::kC, Shape_::kC, 1 &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:155</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeStrides_html_a76cde4c3ebd1d191e0191826b2663be4"><div class="ttname"><a href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">cutlass::ShapeStrides::Shape</a></div><div class="ttdeci">Shape&lt; Shape_::kH *Shape_::kW *Shape_::kC, Shape_::kW *Shape_::kC, Shape_::kC, elementsPerAccess &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:170</div></div>
+<div class="ttc" id="structcutlass_1_1AlignedStruct_html"><div class="ttname"><a href="structcutlass_1_1AlignedStruct.html">cutlass::AlignedStruct</a></div><div class="ttdef"><b>Definition:</b> vector.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a></div><div class="ttdef"><b>Definition:</b> fragment.h:226</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a638e4e1d84b4ae84e758288c7f37548b"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a638e4e1d84b4ae84e758288c7f37548b">cutlass::FragmentIterator::FragmentIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE FragmentIterator(OtherFragment_ &amp;fragment, int offset=0)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> fragment.h:189</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_ab4ef3c5a6b5e13224e45bbbcb9f1bc5d"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">cutlass::FragmentIterator::Element</a></div><div class="ttdeci">Fragment::Element Element</div><div class="ttdoc">The element. </div><div class="ttdef"><b>Definition:</b> fragment.h:181</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a004fabc9caa6924f3fb4badcbb19e88f"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">cutlass::FragmentConstIterator::kElementsPerAccess</a></div><div class="ttdeci">static int const kElementsPerAccess</div><div class="ttdoc">The number of elements per access. </div><div class="ttdef"><b>Definition:</b> fragment.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_afd15cbe1c9a0fd7871b12f3f3042c808"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808">cutlass::FragmentIterator::Fragment</a></div><div class="ttdeci">Fragment_ Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:174</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_acac5b62b365f36f370adb0fee11cea05"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05">cutlass::FragmentConstIterator::Fragment</a></div><div class="ttdeci">Fragment_ Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:232</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a3bd2a9d8467f8db02ca3a01ae0c11ad7"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a3bd2a9d8467f8db02ca3a01ae0c11ad7">cutlass::FragmentIterator::operator[]</a></div><div class="ttdeci">CUTLASS_DEVICE AccessType &amp; operator[](int i)</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:214</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_ae98ab2a88342e7dbf9631cfb5cf5e706"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">cutlass::FragmentConstIterator::Element</a></div><div class="ttdeci">Fragment::Element Element</div><div class="ttdoc">The element. </div><div class="ttdef"><b>Definition:</b> fragment.h:239</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_ab683796885f3bae3765efd96883f311b"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b">cutlass::FragmentConstIterator::IterationsStrides</a></div><div class="ttdeci">ShapeStrides&lt; FragmentShape &gt;::Shape IterationsStrides</div><div class="ttdoc">The linear strides for iterations. </div><div class="ttdef"><b>Definition:</b> fragment.h:245</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a01571b2fc566793fd50a10fa82441951"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a01571b2fc566793fd50a10fa82441951">cutlass::FragmentConstIterator::valid</a></div><div class="ttdeci">CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Is the iterator valid? </div><div class="ttdef"><b>Definition:</b> fragment.h:270</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_ae1825fe3e138e2aa62d27dab2b5227b4"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#ae1825fe3e138e2aa62d27dab2b5227b4">cutlass::FragmentIterator::FragmentIterator</a></div><div class="ttdeci">CUTLASS_DEVICE FragmentIterator(OtherFragment_ &amp;fragment, int offset=0)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> fragment.h:191</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_ab4ef3c5a6b5e13224e45bbbcb9f1bc5d"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">cutlass::FragmentIterator::Element</a></div><div class="ttdeci">Fragment::Element Element</div><div class="ttdoc">The element. </div><div class="ttdef"><b>Definition:</b> fragment.h:179</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a004fabc9caa6924f3fb4badcbb19e88f"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">cutlass::FragmentConstIterator::kElementsPerAccess</a></div><div class="ttdeci">static int const kElementsPerAccess</div><div class="ttdoc">The number of elements per access. </div><div class="ttdef"><b>Definition:</b> fragment.h:239</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_afd15cbe1c9a0fd7871b12f3f3042c808"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808">cutlass::FragmentIterator::Fragment</a></div><div class="ttdeci">Fragment_ Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:172</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_acac5b62b365f36f370adb0fee11cea05"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05">cutlass::FragmentConstIterator::Fragment</a></div><div class="ttdeci">Fragment_ Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:230</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_ae98ab2a88342e7dbf9631cfb5cf5e706"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">cutlass::FragmentConstIterator::Element</a></div><div class="ttdeci">Fragment::Element Element</div><div class="ttdoc">The element. </div><div class="ttdef"><b>Definition:</b> fragment.h:237</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html_a32f7ff86b73576a15c5ddaa40c4e0a95"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">cutlass::Fragment::This_</a></div><div class="ttdeci">Fragment&lt; Element_, kElements_ &gt; This_</div><div class="ttdoc">Make sure the alignment makes sense wrt the size of elements. </div><div class="ttdef"><b>Definition:</b> fragment.h:101</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_ae320d9672450f5341abcdb24a8b09369"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369">cutlass::FragmentIterator::This_</a></div><div class="ttdeci">FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> fragment.h:172</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a880f12d0cd42cdae7ce6009d2233f577"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">cutlass::FragmentConstIterator::FragmentShape</a></div><div class="ttdeci">ShapeMul&lt; Iterations, Shape&lt; 1, 1, 1, kElementsPerAccess &gt; &gt;::Shape FragmentShape</div><div class="ttdoc">The shape of the the fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:243</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_ae320d9672450f5341abcdb24a8b09369"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369">cutlass::FragmentIterator::This_</a></div><div class="ttdeci">FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> fragment.h:170</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a880f12d0cd42cdae7ce6009d2233f577"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">cutlass::FragmentConstIterator::FragmentShape</a></div><div class="ttdeci">ShapeMul&lt; Iterations, Shape&lt; 1, 1, 1, kElementsPerAccess &gt; &gt;::Shape FragmentShape</div><div class="ttdoc">The shape of the the fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:241</div></div>
 <div class="ttc" id="cutlass__math_8h_html"><div class="ttname"><a href="cutlass__math_8h.html">cutlass_math.h</a></div><div class="ttdoc">Math utilities. </div></div>
 <div class="ttc" id="structcutlass_1_1StorageType_html"><div class="ttname"><a href="structcutlass_1_1StorageType.html">cutlass::StorageType</a></div><div class="ttdef"><b>Definition:</b> fragment.h:76</div></div>
 <div class="ttc" id="structcutlass_1_1StorageType_3_014_01_4_html_aa6754c0eb530544a1457afe1ae94a807"><div class="ttname"><a href="structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807">cutlass::StorageType&lt; 4 &gt;::Type</a></div><div class="ttdeci">uint32_t Type</div><div class="ttdef"><b>Definition:</b> fragment.h:81</div></div>
 <div class="ttc" id="structcutlass_1_1StorageType_3_011_01_4_html_a4a70002785c378c1f180800f2a65bcd4"><div class="ttname"><a href="structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4">cutlass::StorageType&lt; 1 &gt;::Type</a></div><div class="ttdeci">uint8_t Type</div><div class="ttdef"><b>Definition:</b> fragment.h:89</div></div>
-<div class="ttc" id="structcutlass_1_1ComputeOffsetFromStrides_html_af5e46bc2b325cb6952d2d68c8aca1409"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">cutlass::ComputeOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:211</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_af667793926cdb24d701eb75e0345bbd6"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">cutlass::FragmentIterator::pointer</a></div><div class="ttdeci">Element * pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> fragment.h:222</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_addf5c21444f129211eefe7cdca6dfa1b"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">cutlass::FragmentConstIterator::AccessType</a></div><div class="ttdeci">AccessType_ AccessType</div><div class="ttdoc">The access type. </div><div class="ttdef"><b>Definition:</b> fragment.h:236</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_af667793926cdb24d701eb75e0345bbd6"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">cutlass::FragmentIterator::pointer</a></div><div class="ttdeci">Element * pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> fragment.h:220</div></div>
+<div class="ttc" id="structcutlass_1_1Fragment_html_a7795c5cf4d5626ff125abd5e8f156e9b"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a7795c5cf4d5626ff125abd5e8f156e9b">cutlass::Fragment::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Element const  &amp; operator[](int i) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:143</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_addf5c21444f129211eefe7cdca6dfa1b"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">cutlass::FragmentConstIterator::AccessType</a></div><div class="ttdeci">AccessType_ AccessType</div><div class="ttdoc">The access type. </div><div class="ttdef"><b>Definition:</b> fragment.h:234</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a14ef0a0095e391503a19067e146c584a"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a">cutlass::FragmentConstIterator::IterationsStrides</a></div><div class="ttdeci">ShapeStrides&lt; FragmentShape, kElementsPerAccess &gt;::Shape IterationsStrides</div><div class="ttdoc">The linear strides for iterations. </div><div class="ttdef"><b>Definition:</b> fragment.h:243</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeMul_html"><div class="ttname"><a href="structcutlass_1_1ShapeMul.html">cutlass::ShapeMul</a></div><div class="ttdef"><b>Definition:</b> shape.h:118</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a63ff1767c4923b0a2b6b64487306ed76"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">cutlass::FragmentIterator::FragmentShape</a></div><div class="ttdeci">ShapeMul&lt; Iterations, Shape&lt; 1, 1, 1, kElementsPerAccess &gt; &gt;::Shape FragmentShape</div><div class="ttdoc">The shape of the the fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:185</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a></div><div class="ttdoc">A template defining Fragment Iterator Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:170</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a63ff1767c4923b0a2b6b64487306ed76"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">cutlass::FragmentIterator::FragmentShape</a></div><div class="ttdeci">ShapeMul&lt; Iterations, Shape&lt; 1, 1, 1, kElementsPerAccess &gt; &gt;::Shape FragmentShape</div><div class="ttdoc">The shape of the the fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:183</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_ad3e99cd7f56d4aec0a28cfcbde66f5af"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#ad3e99cd7f56d4aec0a28cfcbde66f5af">cutlass::FragmentConstIterator::FragmentConstIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE FragmentConstIterator(OtherFragment_ &amp;fragment, int offset=0)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> fragment.h:247</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a></div><div class="ttdoc">A template defining Fragment Iterator Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:168</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html_a2b9a64391d00ef23dd8d456c2337fa60"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">cutlass::Fragment::kElements</a></div><div class="ttdeci">static int const kElements</div><div class="ttdoc">The number of elements. </div><div class="ttdef"><b>Definition:</b> fragment.h:110</div></div>
-<div class="ttc" id="structcutlass_1_1Fragment_html_a75f51bb6ca84615076aab42ac9d42592"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a75f51bb6ca84615076aab42ac9d42592">cutlass::Fragment::operator[]</a></div><div class="ttdeci">CUTLASS_DEVICE Element const  &amp; operator[](int i) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:144</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a527100e34ed700787b1419157710dbb2"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">cutlass::FragmentConstIterator::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">The number of iterations. </div><div class="ttdef"><b>Definition:</b> fragment.h:234</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a4324ae522c6463e66a64f05d2e58b5f0"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">cutlass::FragmentIterator::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">The number of iterations. </div><div class="ttdef"><b>Definition:</b> fragment.h:176</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a527100e34ed700787b1419157710dbb2"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">cutlass::FragmentConstIterator::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">The number of iterations. </div><div class="ttdef"><b>Definition:</b> fragment.h:232</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a35b721563536ab2c5dbab0f5de1c2b43"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a35b721563536ab2c5dbab0f5de1c2b43">cutlass::FragmentIterator::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE AccessType const  &amp; at(int d, int h, int w, int c=0) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:195</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a4324ae522c6463e66a64f05d2e58b5f0"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">cutlass::FragmentIterator::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">The number of iterations. </div><div class="ttdef"><b>Definition:</b> fragment.h:174</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a18f926c9c877e15a279f16637bd24e83"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a18f926c9c877e15a279f16637bd24e83">cutlass::FragmentConstIterator::FragmentConstIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE FragmentConstIterator(FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)</div><div class="ttdoc">Create from non-constant FragmentIterator. </div><div class="ttdef"><b>Definition:</b> fragment.h:252</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a8b957150545becacab1b8ead1be29424"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a8b957150545becacab1b8ead1be29424">cutlass::FragmentConstIterator::at</a></div><div class="ttdeci">CUTLASS_DEVICE AccessType const  &amp; at(int d, int h, int w, int c=0) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:259</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html_a9c67fa5bbd0b8b49bd6ec002dee3cbab"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">cutlass::Fragment::Element</a></div><div class="ttdeci">Element_ Element</div><div class="ttdoc">The element. </div><div class="ttdef"><b>Definition:</b> fragment.h:108</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_add14f695231c2bdd6284bf22b1e66f8f"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f">cutlass::FragmentConstIterator::This_</a></div><div class="ttdeci">FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> fragment.h:230</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a83bb6a3ed588e2d890bf986665d2b7bb"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a83bb6a3ed588e2d890bf986665d2b7bb">cutlass::FragmentIterator::operator[]</a></div><div class="ttdeci">CUTLASS_DEVICE AccessType const  &amp; operator[](int i) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:209</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_add14f695231c2bdd6284bf22b1e66f8f"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f">cutlass::FragmentConstIterator::This_</a></div><div class="ttdeci">FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> fragment.h:228</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a6216b58ffe6322f037f1e0a3ffa714c8"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a6216b58ffe6322f037f1e0a3ffa714c8">cutlass::FragmentConstIterator::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE AccessType const  &amp; operator[](int i) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:263</div></div>
+<div class="ttc" id="structcutlass_1_1Fragment_html_a77ba7cddf7822d64534b019c4ad9732e"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a77ba7cddf7822d64534b019c4ad9732e">cutlass::Fragment::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Element &amp; operator[](int i)</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:140</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a21877944988f34eb69cb6eefb00c6575"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a21877944988f34eb69cb6eefb00c6575">cutlass::FragmentIterator::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE AccessType const  &amp; operator[](int i) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:207</div></div>
 <div class="ttc" id="structcutlass_1_1StorageType_3_012_01_4_html_a66c52fe770774ea01c511aea1af1f8d4"><div class="ttname"><a href="structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4">cutlass::StorageType&lt; 2 &gt;::Type</a></div><div class="ttdeci">uint16_t Type</div><div class="ttdef"><b>Definition:</b> fragment.h:85</div></div>
 <div class="ttc" id="vector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div><div class="ttdoc">Defines a 1D vector of elements held in the registers of each thread. </div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a3a8fd8f13c157ed13dc93fd78036c59e"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a3a8fd8f13c157ed13dc93fd78036c59e">cutlass::FragmentConstIterator::FragmentConstIterator</a></div><div class="ttdeci">CUTLASS_DEVICE FragmentConstIterator(FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)</div><div class="ttdoc">Create from non-constant FragmentIterator. </div><div class="ttdef"><b>Definition:</b> fragment.h:254</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_ad2c43e30e78e8799df7cb02ac08cee9a"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">cutlass::FragmentIterator::kElementsPerAccess</a></div><div class="ttdeci">static int const kElementsPerAccess</div><div class="ttdoc">The number of elements per access. </div><div class="ttdef"><b>Definition:</b> fragment.h:183</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a2858ba9a8a9bbaef1de73415cff9b3c1"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1">cutlass::FragmentIterator::Strides</a></div><div class="ttdeci">ShapeStrides&lt; FragmentShape &gt;::Shape Strides</div><div class="ttdoc">The linear strides for iterations. </div><div class="ttdef"><b>Definition:</b> fragment.h:187</div></div>
+<div class="ttc" id="structcutlass_1_1StorageType_html_abb0d270cdf38d46347261cac36dc619b"><div class="ttname"><a href="structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b">cutlass::StorageType::Type</a></div><div class="ttdeci">uint64_t Type</div><div class="ttdef"><b>Definition:</b> fragment.h:77</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_ac4d601998a84a3eac23e3b7a7c8a935b"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#ac4d601998a84a3eac23e3b7a7c8a935b">cutlass::FragmentConstIterator::valid</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Is the iterator valid? </div><div class="ttdef"><b>Definition:</b> fragment.h:268</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a2e93985d759d904ac858054eeaa9e50e"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e">cutlass::FragmentIterator::Strides</a></div><div class="ttdeci">ShapeStrides&lt; FragmentShape, kElementsPerAccess &gt;::Shape Strides</div><div class="ttdoc">The linear strides for iterations. </div><div class="ttdef"><b>Definition:</b> fragment.h:185</div></div>
+<div class="ttc" id="structcutlass_1_1ComputeOffsetFromStrides_html_aa28231590bfa0ced0f317e6a4d52dc1e"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">cutlass::ComputeOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:199</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_ad665745f3d6a3a88d7894fe0fc1bbd3e"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#ad665745f3d6a3a88d7894fe0fc1bbd3e">cutlass::FragmentIterator::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE AccessType &amp; operator[](int i)</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:212</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_adb863b44dfbc1fa923625e767f6dd7cd"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#adb863b44dfbc1fa923625e767f6dd7cd">cutlass::FragmentIterator::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE AccessType &amp; at(int d, int h, int w, int c=0)</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:201</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_ad2c43e30e78e8799df7cb02ac08cee9a"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">cutlass::FragmentIterator::kElementsPerAccess</a></div><div class="ttdeci">static int const kElementsPerAccess</div><div class="ttdoc">The number of elements per access. </div><div class="ttdef"><b>Definition:</b> fragment.h:181</div></div>
 <div class="ttc" id="shape_8h_html"><div class="ttname"><a href="shape_8h.html">shape.h</a></div><div class="ttdoc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects. </div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a012c5af3a8a40843c576c55ecbc663e7"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">cutlass::FragmentIterator::AccessType</a></div><div class="ttdeci">AccessType_ AccessType</div><div class="ttdoc">The access type. </div><div class="ttdef"><b>Definition:</b> fragment.h:178</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_ab18f8ea676b45831f939715212167a99"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#ab18f8ea676b45831f939715212167a99">cutlass::FragmentIterator::valid</a></div><div class="ttdeci">CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Is the iterator valid? </div><div class="ttdef"><b>Definition:</b> fragment.h:219</div></div>
-<div class="ttc" id="structcutlass_1_1StorageType_html_a2b9c99ae52eb4962428f776efc1e7f06"><div class="ttname"><a href="structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06">cutlass::StorageType::Type</a></div><div class="ttdeci">uint64_t Type</div><div class="ttdef"><b>Definition:</b> fragment.h:77</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a012c5af3a8a40843c576c55ecbc663e7"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">cutlass::FragmentIterator::AccessType</a></div><div class="ttdeci">AccessType_ AccessType</div><div class="ttdoc">The access type. </div><div class="ttdef"><b>Definition:</b> fragment.h:176</div></div>
+<div class="ttc" id="structcutlass_1_1Fragment_html_a84b6d68a5a24dbd04d842e0755b42bda"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a84b6d68a5a24dbd04d842e0755b42bda">cutlass::Fragment::kAlignment</a></div><div class="ttdeci">static int const kAlignment</div><div class="ttdoc">Alignment. </div><div class="ttdef"><b>Definition:</b> fragment.h:112</div></div>
 <div class="ttc" id="structcutlass_1_1is__pow2_html"><div class="ttname"><a href="structcutlass_1_1is__pow2.html">cutlass::is_pow2</a></div><div class="ttdef"><b>Definition:</b> cutlass_math.h:45</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_ac4b6f351e6e72bed37e425f02a10c81e"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#ac4b6f351e6e72bed37e425f02a10c81e">cutlass::FragmentConstIterator::FragmentConstIterator</a></div><div class="ttdeci">CUTLASS_DEVICE FragmentConstIterator(OtherFragment_ &amp;fragment, int offset=0)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> fragment.h:249</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a9cf31df06ff035705a1341810fcdcbf2"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a9cf31df06ff035705a1341810fcdcbf2">cutlass::FragmentIterator::at</a></div><div class="ttdeci">CUTLASS_DEVICE AccessType const  &amp; at(int d, int h, int w, int c=0) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:197</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_aee37f8ea06127b94a304bb776945509b"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">cutlass::FragmentConstIterator::pointer</a></div><div class="ttdeci">Element const  * pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> fragment.h:273</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_a14f2ad2f9b90aea092ff1836e8fb159d"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#a14f2ad2f9b90aea092ff1836e8fb159d">cutlass::FragmentConstIterator::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE AccessType const  &amp; at(int d, int h, int w, int c=0) const</div><div class="ttdoc">The accessor. </div><div class="ttdef"><b>Definition:</b> fragment.h:257</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentConstIterator_html_aee37f8ea06127b94a304bb776945509b"><div class="ttname"><a href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">cutlass::FragmentConstIterator::pointer</a></div><div class="ttdeci">Element const  * pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> fragment.h:271</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/fragment__multiply__add_8h.html b/docs/fragment__multiply__add_8h.html
index 59a94dfdf..107cfee79 100644
--- a/docs/fragment__multiply__add_8h.html
+++ b/docs/fragment__multiply__add_8h.html
@@ -82,15 +82,15 @@ $(function() {
 
 <p>Defines multiply-add operations on fragments within a thread.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
 </div>
 <p><a href="fragment__multiply__add_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -103,7 +103,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/fragment__multiply__add_8h_source.html b/docs/fragment__multiply__add_8h_source.html
index 9b453fd94..1d4c4f7f2 100644
--- a/docs/fragment__multiply__add_8h_source.html
+++ b/docs/fragment__multiply__add_8h_source.html
@@ -76,28 +76,26 @@ $(function() {
 <div class="title">fragment_multiply_add.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="fragment__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html">   33</a></span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13">   40</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13">InstructionShape</a>;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222">   42</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222">ScalarA</a>;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb">   44</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb">ScalarB</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3">   46</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3">ScalarC</a>;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af19e14a22aefd1124f7d31beec6f8c42">   49</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af19e14a22aefd1124f7d31beec6f8c42">FragmentMultiplyAdd</a>() {}</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a522301fbe3e276cb5ef9fbe75bb2ab50">   53</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a522301fbe3e276cb5ef9fbe75bb2ab50">multiply</a>(Scalar_ a, Fragment_ <span class="keyword">const</span>&amp; b, Fragment_&amp; d) {</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; Fragment_::kElements; ++j) {</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;      d[j] = a * b[j];</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    }</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  }</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a34bbf209967fef6181d3d46dd27fa0c0">   61</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a34bbf209967fef6181d3d46dd27fa0c0">multiply_add</a>(Scalar_ a,</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;                                   Fragment_ <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;                                   Fragment_ <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;                                   Fragment_&amp; d) {</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; Fragment_::kElements; ++j) {</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;      d[j] = a * b[j] + c[j];</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    }</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  }</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;};</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)</span></div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html">   75</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a>&lt;half&gt; {</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ab16a3d8adda89cc4f9765116ea75a4b7">   77</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ab16a3d8adda89cc4f9765116ea75a4b7">InstructionShape</a>;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a366083b229b28e7f44da38273b2ab263">   79</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a366083b229b28e7f44da38273b2ab263">ScalarA</a>;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af52ec4b92a3e788169764014aebb85a1">   81</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af52ec4b92a3e788169764014aebb85a1">ScalarB</a>;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af553be8ef0b4dc9bb593d98dfce8628d">   83</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af553be8ef0b4dc9bb593d98dfce8628d">ScalarC</a>;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a21f0965f6178917c7f5c6d79ed048059">   86</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a21f0965f6178917c7f5c6d79ed048059">FragmentMultiplyAdd</a>() {}</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ae62d61ec068ac958753d0a2f5a99d8e2">   90</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ae62d61ec068ac958753d0a2f5a99d8e2">multiply</a>(half a, Fragment_ <span class="keyword">const</span>&amp; b, Fragment_&amp; d) {</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; __CUDA_ARCH__ &gt;= 530</span></div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;    <span class="comment">// The input.</span></div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    __half2 <span class="keyword">const</span>* b_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;b[0]);</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    <span class="comment">// The output.</span></div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    __half2* d_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2*<span class="keyword">&gt;</span>(&amp;d[0]);</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    <span class="comment">// Assemble a half2 from a.</span></div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    __half2 <span class="keyword">const</span> a_half2 = __half2half2(a);</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Fragment_::kElements / 2; ++i) {</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;      d_half2[i] = __hmul2(a_half2, b_half2[i]);</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    }</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  }</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a89c8b663af69f13c2a02cb464b5172a5">  108</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a89c8b663af69f13c2a02cb464b5172a5">multiply_add</a>(half a, Fragment_ <span class="keyword">const</span>&amp; b, Fragment_ <span class="keyword">const</span>&amp; c, Fragment_&amp; d) {</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; __CUDA_ARCH__ &gt;= 530</span></div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    __half2 <span class="keyword">const</span>* b_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;b[0]);</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    __half2 <span class="keyword">const</span>* c_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;c[0]);</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="comment">// The output.</span></div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    __half2* d_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2*<span class="keyword">&gt;</span>(&amp;d[0]);</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="comment">// Assemble a half2 from a.</span></div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    __half2 <span class="keyword">const</span> a_half2 = __half2half2(a);</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Fragment_::kElements / 2; ++i) {</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;      d_half2[i] = __hfma2(a_half2, b_half2[i], c_half2[i]);</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    }</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  }</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;};</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_af4f5c4a79c447e5aaf313878eca022cb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb">cutlass::gemm::FragmentMultiplyAdd::ScalarB</a></div><div class="ttdeci">Scalar_ ScalarB</div><div class="ttdoc">The type for B. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:44</div></div>
+<a href="fragment__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html">   33</a></span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt; <span class="keyword">typename</span> ScalarAlphaBeta_, </div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;  <span class="keyword">typename</span> ScalarAccum_, </div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;  <span class="keywordtype">bool</span> fragMul2 = <span class="keyword">true</span> <span class="comment">/*number of element per fragment is multiple of 2*/</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;&gt;</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">   41</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a> {</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76">   43</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76">InstructionShape</a>;</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">   45</a></span>&#160;  <span class="keyword">typedef</span> ScalarAlphaBeta_ <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a>;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c">   47</a></span>&#160;  <span class="keyword">typedef</span> ScalarAccum_ <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c">ScalarAccum</a>;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ae1fbd0fd103deda51208102f15f896ed">   50</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ae1fbd0fd103deda51208102f15f896ed">FragmentMultiplyAdd</a>() {}</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> FragmentB_, <span class="keyword">typename</span> FragmentCd_&gt;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a934c0d74c70fc87796ecb5cde50fd516">   54</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a934c0d74c70fc87796ecb5cde50fd516">multiply</a>(<a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a> a, FragmentB_ <span class="keyword">const</span>&amp; b, FragmentCd_&amp; d) {</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; __CUDA_ARCH__ &gt;= 530</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> kReduction = FragmentB_::kElements / FragmentCd_::kElements;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; FragmentCd_::kElements; ++j) {</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;      d[j] = b[j * kReduction + 0];</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> k = 1; k &lt; kReduction; ++k) {</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;        d[j] += b[j * kReduction + k];</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      }</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;      d[j] = a * <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a>(d[j]);</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    }</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  }</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> FragmentB_, <span class="keyword">typename</span> FragmentCd_&gt;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aafa37c2e1ffd2f7d7031c24c732157d8">   69</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aafa37c2e1ffd2f7d7031c24c732157d8">multiply_add</a>(<a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a> a,</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;                                   FragmentB_ <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                                   FragmentCd_ <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                                   FragmentCd_&amp; d) {</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; __CUDA_ARCH__ &gt;= 530</span></div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> kReduction = FragmentB_::kElements / FragmentCd_::kElements;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; FragmentCd_::kElements; ++j) {</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      d[j] = b[j * kReduction + 0];</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> k = 1; k &lt; kReduction; ++k) {</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;        d[j] += b[j * kReduction + k];</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      }</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;      d[j] = a * <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a>(d[j]) + <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a>(c[j]);</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    }</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  }</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;};</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)</span></div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">   90</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a>&lt;half, half, true&gt; {</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff">   92</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff">InstructionShape</a>;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d">   94</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d">ScalarAlphaBeta</a>;</div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2">   96</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2">ScalarAccum</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ad35b57b3f0cf5a467a1b0e48cffc3061">   99</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ad35b57b3f0cf5a467a1b0e48cffc3061">FragmentMultiplyAdd</a>() {}</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> FragmentB_, <span class="keyword">typename</span> FragmentCd_&gt;</div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a6bed70e7074931419e9441688aee00ea">  103</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a6bed70e7074931419e9441688aee00ea">multiply</a>(half a, FragmentB_ <span class="keyword">const</span>&amp; b, FragmentCd_&amp; d) {</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; __CUDA_ARCH__ &gt;= 530</span></div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <span class="comment">// The input.</span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    __half2 <span class="keyword">const</span>* b_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;b[0]);</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="comment">// The output.</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    __half2* d_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2*<span class="keyword">&gt;</span>(&amp;d[0]);</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="comment">// Assemble a half2 from a.</span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    __half2 <span class="keyword">const</span> a_half2 = __half2half2(a);</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> kReduction = (FragmentB_::kElements / FragmentCd_::kElements);</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; FragmentCd_::kElements / 2; ++j) {</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;      d_half2[j] = __hmul2(a_half2, b_half2[j * kReduction + 0]);</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> k = 1; k &lt; kReduction; ++k) {</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;        d_half2[j] = __hfma2(a_half2, b_half2[j * kReduction + k], d_half2[j]);</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;      }</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    }</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  }</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> FragmentB_, <span class="keyword">typename</span> FragmentCd_&gt;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a92edee5611d25b60cdab6a1c8e32141f">  128</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a92edee5611d25b60cdab6a1c8e32141f">multiply_add</a>(half a,</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;                                   FragmentB_ <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;                                   FragmentCd_ <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;                                   FragmentCd_&amp; d) {</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; __CUDA_ARCH__ &gt;= 530</span></div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    __half2 <span class="keyword">const</span>* b_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;b[0]);</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    __half2 <span class="keyword">const</span>* c_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;c[0]);</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <span class="comment">// The output.</span></div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    __half2* d_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2*<span class="keyword">&gt;</span>(&amp;d[0]);</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="comment">// Assemble a half2 from a.</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    __half2 <span class="keyword">const</span> a_half2 = __half2half2(a);</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> kReduction = (FragmentB_::kElements / FragmentCd_::kElements);</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; FragmentCd_::kElements / 2; ++j) {</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;      d_half2[j] = __hfma2(a_half2, b_half2[j * kReduction + 0], c_half2[j]);</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> k = 1; k &lt; kReduction; ++k) {</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;        d_half2[j] = __hfma2(a_half2, b_half2[j * kReduction + k], d_half2[j]);</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;      }</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    }</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  }</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;};</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_a934c0d74c70fc87796ecb5cde50fd516"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a934c0d74c70fc87796ecb5cde50fd516">cutlass::gemm::FragmentMultiplyAdd::multiply</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply(ScalarAlphaBeta a, FragmentB_ const &amp;b, FragmentCd_ &amp;d)</div><div class="ttdoc">Multiply : d = a*b. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:54</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4_html_a7d83cf5bde360251a252c6e728ea80ff"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::InstructionShape</a></div><div class="ttdeci">Shape&lt; 1, 1, 1, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:92</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_a522301fbe3e276cb5ef9fbe75bb2ab50"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a522301fbe3e276cb5ef9fbe75bb2ab50">cutlass::gemm::FragmentMultiplyAdd::multiply</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply(Scalar_ a, Fragment_ const &amp;b, Fragment_ &amp;d)</div><div class="ttdoc">Multiply : d = a*b. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:53</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4_html_a366083b229b28e7f44da38273b2ab263"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a366083b229b28e7f44da38273b2ab263">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::ScalarA</a></div><div class="ttdeci">half ScalarA</div><div class="ttdoc">The type for A. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:79</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4_html_a21f0965f6178917c7f5c6d79ed048059"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a21f0965f6178917c7f5c6d79ed048059">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::FragmentMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE FragmentMultiplyAdd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:86</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_a34bbf209967fef6181d3d46dd27fa0c0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a34bbf209967fef6181d3d46dd27fa0c0">cutlass::gemm::FragmentMultiplyAdd::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(Scalar_ a, Fragment_ const &amp;b, Fragment_ const &amp;c, Fragment_ &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:61</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4_html_af553be8ef0b4dc9bb593d98dfce8628d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af553be8ef0b4dc9bb593d98dfce8628d">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::ScalarC</a></div><div class="ttdeci">half ScalarC</div><div class="ttdoc">The type for C and D. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:83</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4_html_a89c8b663af69f13c2a02cb464b5172a5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a89c8b663af69f13c2a02cb464b5172a5">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(half a, Fragment_ const &amp;b, Fragment_ const &amp;c, Fragment_ &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:108</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4_html_ae7a333f7aa3f52226c76cec9d2da042d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::ScalarAlphaBeta</a></div><div class="ttdeci">half ScalarAlphaBeta</div><div class="ttdoc">The type for alpha and beta. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_ae1fbd0fd103deda51208102f15f896ed"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ae1fbd0fd103deda51208102f15f896ed">cutlass::gemm::FragmentMultiplyAdd::FragmentMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE FragmentMultiplyAdd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4_html_ad35b57b3f0cf5a467a1b0e48cffc3061"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ad35b57b3f0cf5a467a1b0e48cffc3061">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::FragmentMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE FragmentMultiplyAdd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4_html_a6bed70e7074931419e9441688aee00ea"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a6bed70e7074931419e9441688aee00ea">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::multiply</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply(half a, FragmentB_ const &amp;b, FragmentCd_ &amp;d)</div><div class="ttdoc">Multiply : d = a*b. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:103</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_a1e854c281072db280ae90c2569b5f64c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c">cutlass::gemm::FragmentMultiplyAdd::ScalarAccum</a></div><div class="ttdeci">ScalarAccum_ ScalarAccum</div><div class="ttdoc">The type for accumlator. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:47</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_ac93ba536992debeae86087e638167a13"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13">cutlass::gemm::FragmentMultiplyAdd::InstructionShape</a></div><div class="ttdeci">Shape&lt; 1, 1, 1, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:40</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_a92c1ffbfb479cd9fa2c2632ef8e347d3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3">cutlass::gemm::FragmentMultiplyAdd::ScalarC</a></div><div class="ttdeci">Scalar_ ScalarC</div><div class="ttdoc">The type for C and D. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_a6fa76b3e7ac721d47df47eba4e9ef222"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222">cutlass::gemm::FragmentMultiplyAdd::ScalarA</a></div><div class="ttdeci">Scalar_ ScalarA</div><div class="ttdoc">The type for A. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:42</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_af19e14a22aefd1124f7d31beec6f8c42"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af19e14a22aefd1124f7d31beec6f8c42">cutlass::gemm::FragmentMultiplyAdd::FragmentMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE FragmentMultiplyAdd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:49</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_aea565efe23b7a5c17eeab5e8cd0d1322"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">cutlass::gemm::FragmentMultiplyAdd::ScalarAlphaBeta</a></div><div class="ttdeci">ScalarAlphaBeta_ ScalarAlphaBeta</div><div class="ttdoc">The type for alpha and beta. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:45</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4_html_a92edee5611d25b60cdab6a1c8e32141f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a92edee5611d25b60cdab6a1c8e32141f">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(half a, FragmentB_ const &amp;b, FragmentCd_ const &amp;c, FragmentCd_ &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:128</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_aa101be5d45e2be54bb4056517b6d5e76"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76">cutlass::gemm::FragmentMultiplyAdd::InstructionShape</a></div><div class="ttdeci">Shape&lt; 1, 1, 1, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:43</div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4_html_ae62d61ec068ac958753d0a2f5a99d8e2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ae62d61ec068ac958753d0a2f5a99d8e2">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::multiply</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply(half a, Fragment_ const &amp;b, Fragment_ &amp;d)</div><div class="ttdoc">Multiply : d = a*b. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:90</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4_html_ab16a3d8adda89cc4f9765116ea75a4b7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ab16a3d8adda89cc4f9765116ea75a4b7">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::InstructionShape</a></div><div class="ttdeci">Shape&lt; 1, 1, 1, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:77</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4_html_af52ec4b92a3e788169764014aebb85a1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af52ec4b92a3e788169764014aebb85a1">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::ScalarB</a></div><div class="ttdeci">half ScalarB</div><div class="ttdoc">The type for B. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:81</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a></div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:38</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4_html_ab3774e6aa28266b25e3822fc9e72edc2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::ScalarAccum</a></div><div class="ttdeci">half ScalarAccum</div><div class="ttdoc">The type for accumlator. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:96</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html_aafa37c2e1ffd2f7d7031c24c732157d8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aafa37c2e1ffd2f7d7031c24c732157d8">cutlass::gemm::FragmentMultiplyAdd::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(ScalarAlphaBeta a, FragmentB_ const &amp;b, FragmentCd_ const &amp;c, FragmentCd_ &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a></div><div class="ttdef"><b>Definition:</b> fragment_multiply_add.h:41</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions.html b/docs/functions.html
index e6b156fbc..bdde612a8 100644
--- a/docs/functions.html
+++ b/docs/functions.html
@@ -71,77 +71,101 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_a"></a>- a -</h3><ul>
+<li>A
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 <li>AccessType
 : <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html#a7eccab04c8d3968e74486d0525a3fa02">cutlass::FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html#a0b656c41b9fff6402f33e95204ce8860">cutlass::FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html#a87d46956aa317f06f2ba9a535fdfc5da">cutlass::FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html#abca5165caae7304f33fcad267c16b002">cutlass::FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a8611550c045d6def964d9dafb2be80c6">cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a942970f88e13c88f496a9da67ed47a6f">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a5d7ed0abaeea99ec3399f8eea930f761">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a2b9faed8d92f55a46e313d79d214316d">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ad073f5e8252ad24b086f14bd2a109cf9">cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aeb70e4859e2795b6af63ad5e203b4da9">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a89f329ba11f96ee3ce4428cbc792ac3d">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#ac0af6ae18137156abe24d6479232b955">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a0e79ed59263ebc3478c43f2f9a50cb5a">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a10431ed94c0dd66a8c1d01ba7c8b5aa2">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>Accumulators
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a505306c2af2059f6e84ba32d701d1602">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a4712650b46b6183ea60d79ef18f55b86">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>AccumulatorsPerThread
-: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a98d0f84730551eaabfe7404b36478b50">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a47807c9c9fb43e7f7b5f409a49986c30">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>AccumulatorsPerWarp
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af0c856abdd9f7f26f671493cc629bf0a">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a327ce1b7b6478c27c80baf5d9e26bdbc">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+</li>
+<li>add_pointer_offset()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a93ff0a9fda3e136a1674aeb82de050db">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa6977ded39ead005b3435f13f0e51116">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a0752af296e110d9104a45ae24bd0a104">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>Additive
 : <a class="el" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375a77d7cc80ec0c3ff42ca9b2aff98a1646">cutlass::Identity</a>
 </li>
-<li>advance()
-: <a class="el" href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-</li>
 <li>aligned_
 : <a class="el" href="unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1df3324868465331db13bd7775b55e87">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#acc698443a38fd0ad63f931bdf172ad99">cutlass::Vector&lt; half, 1 &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ad6784e347f068ad20af52379286337c0">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a4eab187b6f7650bd88ccd421c8330d3c">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 </li>
 <li>alpha
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a053c2b529be527f510ee317737fbf7e8">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
 </li>
 <li>at()
 : <a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd">cutlass::ConstPredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
-, <a class="el" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">cutlass::Coord&lt; N_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a8b957150545becacab1b8ead1be29424">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentIterator.html#a9cf31df06ff035705a1341810fcdcbf2">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a14f2ad2f9b90aea092ff1836e8fb159d">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentIterator.html#adb863b44dfbc1fa923625e767f6dd7cd">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#acc55581896fae8c0449b44b56d750155">cutlass::TensorView&lt; T &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a92371a586e756734522a853bef74324d">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a2a95fd42d48c550a45f340b04f9dfe3d">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aac4b013050925c1e2db4019140e82602">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 , <a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f">cutlass::TrivialPredicateTileAdapter</a>
 </li>
+<li>AType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_0x7e.html b/docs/functions_0x7e.html
index 41aa664c4..0cb0e3458 100644
--- a/docs/functions_0x7e.html
+++ b/docs/functions_0x7e.html
@@ -78,7 +78,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_b.html b/docs/functions_b.html
index 79038aa18..35c2018ba 100644
--- a/docs/functions_b.html
+++ b/docs/functions_b.html
@@ -71,42 +71,82 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_b"></a>- b -</h3><ul>
+<li>B
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 <li>Base
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#ab19f72d239f639f261fbb63f72f10acf">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#affd04d88a0bbef13c54f10000a5dc15d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aef7047c6a0d0c3db0bfb6bec08520aad">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a82a9cfc61ecc117592bdb30f57bd35c9">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aea87c73ae2d4e027014ebd4d8141c89e">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">cutlass::TensorView&lt; T &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">cutlass::TileCoord&lt; Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>BaseParams
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>batch()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#adaf31768b8239f497c0ec9b40bad1cb5">cutlass::gemm::GemmCoord</a>
+</li>
+<li>batch_stride_A
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>batch_stride_B
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>batch_stride_C
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>batch_stride_D
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
 <li>begin()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a6b0f0d9cef4a2f3f4a8bf6c192a282db">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a4f4a2f860cc10688ee27cc9ce1df1015">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>beta
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+</li>
+<li>block
+: <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">cutlass::KernelLaunchConfiguration</a>
 </li>
 <li>BlockSwizzle
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 </li>
+<li>bounds
+: <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a>
+</li>
+<li>Boustrophedon
+: <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa">cutlass::gemm::swizzleDirection</a>
+</li>
+<li>BType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 <li>byte
 : <a class="el" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4">cutlass::platform::alignment_of&lt; value_t &gt;::pad</a>
 </li>
@@ -114,7 +154,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_c.html b/docs/functions_c.html
index 9da7dd064..0c37a2294 100644
--- a/docs/functions_c.html
+++ b/docs/functions_c.html
@@ -71,28 +71,50 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_c"></a>- c -</h3><ul>
+<li>C
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>c()
+: <a class="el" href="structcutlass_1_1TileCoord.html#ad8281750f2978c6c1c91982f347a14cd">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
+<li>capacity()
+: <a class="el" href="classcutlass_1_1TensorView.html#ad870c366ffe904d3363df1dfb0d5f04c">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
 <li>check()
 : <a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;</a>
 </li>
 <li>clamp()
-: <a class="el" href="structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 <li>clear()
-: <a class="el" href="structcutlass_1_1Fragment.html#a29e7408fcde8cdf9de5e3a10eaa46391">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Fragment.html#acf28266500b87484530b2395925fca51">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
+, <a class="el" href="structcutlass_1_1ZipFragment.html#aa978dd7fca15ca20e9f52d15e6f8f9c1">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
 </li>
 <li>ClearAccumulators()
-: <a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#aef1832b62ae8caef5e6d34cb1d1564e3">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
+</li>
+<li>column()
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">cutlass::MatrixCoord</a>
+</li>
+<li>ColumnMajorBlockSwizzle()
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a6d0ee4e76371af26030ab4922e6c915a">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
 </li>
 <li>commit()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a6dc512be014b9d849057e2fd4c0b0485">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#ade2d85507dec77591e66276339a1eef5">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9cc435369c7fc76d0bb6233a8258e257">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab39c82ac1a8138c4b6d69dab9d48bdbc">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6699714c357f2714df011f58c1c48861">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa3aa987bf0fd6303e06f46e2f54e47e4">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a93cc2a7eb3215ce5bae343fb117f55c5">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a165a0d486f53fb2315d4e555c9f59891">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>complex()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#a2e852c886e61a39e884026d6f4c32c1e">cutlass::platform::complex&lt; T &gt;</a>
 </li>
 <li>Congruous
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html#abe4eb7f9a0ed7d48a81029e88849dcf2">cutlass::gemm::GemmOperandTraitsAb&lt; kOperand_, kLayout_ &gt;</a>
@@ -104,49 +126,72 @@ $(function() {
 : <a class="el" href="structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
 <li>const_ref()
-: <a class="el" href="classcutlass_1_1TensorView.html#a23564f1d333bb16343ed3a885f894285">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0a48de201c35cbc9d5e3b94fa597a617">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a559f7210b445c77a167ab1f41c8d0827">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>ConstIterator()
 : <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
 </li>
 <li>ConstPredicateTileAdapter()
 : <a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1">cutlass::ConstPredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 </li>
+<li>ConstTensorRef
+: <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+</li>
 <li>ConstTensorRef_t
-: <a class="el" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>ConstTensorView
+: <a class="el" href="classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>consume_tile()
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#af8bb78ae198af4dccb0241da44428053">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 </li>
 <li>contains()
-: <a class="el" href="classcutlass_1_1TensorView.html#aa94063d9a9c6e599d3f53e22433274be">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a3f448bcf6e664c244f472e2659215628">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>Convert()
 : <a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a>
 </li>
-<li>convert()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-</li>
 <li>Coord()
-: <a class="el" href="structcutlass_1_1Coord.html#a53a3d88a884f6cb7fda8aedfe2cec2c5">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 <li>Coord_t
-: <a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#ab16a0244199ca2800ea5460ed8ed6ae2">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>Copy()
 : <a class="el" href="structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1">cutlass::Copy&lt; Fragment_ &gt;</a>
 </li>
 <li>copy()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ae033f55779b45b4228f40a4d699062bb">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#af25495bb0bb35bd64246d3a80fe4806f">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7f6bf3b8d70bcd74d84519decd9f0d8e">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a3784dbb3efe0865ffa946419111c824a">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5c0efc259bb3bd1675f5d395dab71e95">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a99039d115a539fc99e2235c12ac57eed">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad46887abb2e3136b635c3ef5be29cf69">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a60a03c95452fe627477933d60815f7cb">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>count()
-: <a class="el" href="structcutlass_1_1Coord.html#a40429a9154f7a142ad7e9eb35282d196">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+</li>
+<li>CType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_d.html b/docs/functions_d.html
index ca73b9191..fe6d9c963 100644
--- a/docs/functions_d.html
+++ b/docs/functions_d.html
@@ -71,61 +71,65 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_d"></a>- d -</h3><ul>
-<li>d_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
+<li>D
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
-<li>d_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>d_c
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>d_d
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
+<li>d()
+: <a class="el" href="structcutlass_1_1TileCoord.html#aec4ffcdc8fbf57a8b649fff38af55007">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>data()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3af66b82b1a0cc5bf6141f940553e048">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a0d3c1a58f23957f9850d1b22992a981a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afe77778a126449e210c0bd6ec2dc6709">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8">cutlass::TensorView&lt; T &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a0e05007f939b27e6a17dce5c2a49e3e0">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a67b25cc51ce867b073feead7b94e6aa3">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#acc3f2c29fe21316091a1405613083000">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+</li>
+<li>decrement()
+: <a class="el" href="classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>deleter_type
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
 <li>Delta
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aede069e51e0732a9648c437261bd4d66">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a08dada072eefded4c859df4e5fc25ca6">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#adab639892c3586464e2ea5f947b9e0f0">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a1c433ba0eea5e6a46f36101d8de98ed0">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a>
+, <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#afdb38f790d9c7cf1ac238643103b45ce">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
+<li>dhw()
+: <a class="el" href="structcutlass_1_1TileCoord.html#abe65d1a0ff3798b662376032d51e9713">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
 <li>dot()
-: <a class="el" href="structcutlass_1_1Coord.html#ad4b3704d14057c043f972827671115cf">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+</li>
+<li>DType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>dynamic_smem
+: <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">cutlass::KernelLaunchConfiguration</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_e.html b/docs/functions_e.html
index ee616a11c..ea9d23f57 100644
--- a/docs/functions_e.html
+++ b/docs/functions_e.html
@@ -83,7 +83,7 @@ $(function() {
 : <a class="el" href="structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
 <li>epilogue()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 </li>
 <li>Epilogue
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
@@ -93,20 +93,20 @@ $(function() {
 , <a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#afdca9ac1d28e17efaa394f5831a60c04">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage</a>
 </li>
 <li>Epilogue
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 </li>
 <li>epilogue_with_or_without_beta()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 </li>
 <li>evaluate()
-: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a2e0d140aed388d2457dfb24d28fcd08a">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_enum.html b/docs/functions_enum.html
index b710de0fe..df8ae39f4 100644
--- a/docs/functions_enum.html
+++ b/docs/functions_enum.html
@@ -70,18 +70,20 @@ $(function() {
 <div class="contents">
 &#160;<ul>
 <li>Kind
-: <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand</a>
+: <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">cutlass::FragmentElementType</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8">cutlass::gemm::swizzleDirection</a>
+, <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand</a>
 , <a class="el" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375">cutlass::Identity</a>
 , <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">cutlass::IteratorAdvance</a>
-, <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">cutlass::IteratorFragment</a>
 , <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout</a>
+, <a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48">cutlass::MatrixTransform</a>
 , <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_eval.html b/docs/functions_eval.html
index 40c01ec85..b53129338 100644
--- a/docs/functions_eval.html
+++ b/docs/functions_eval.html
@@ -77,6 +77,13 @@ $(function() {
 </ul>
 
 
+<h3><a id="index_b"></a>- b -</h3><ul>
+<li>Boustrophedon
+: <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa">cutlass::gemm::swizzleDirection</a>
+</li>
+</ul>
+
+
 <h3><a id="index_k"></a>- k -</h3><ul>
 <li>kA
 : <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand</a>
@@ -90,6 +97,9 @@ $(function() {
 <li>kColumnMajor
 : <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout</a>
 </li>
+<li>kConjugate
+: <a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683">cutlass::MatrixTransform</a>
+</li>
 <li>kD
 : <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe">cutlass::GemmOperand</a>
 , <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5">cutlass::IteratorAdvance</a>
@@ -105,29 +115,40 @@ $(function() {
 </li>
 <li>kLanes
 : <a class="el" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
-, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a4020f25408022dbf20c26ed4fa8c7dffa14befaa9d739f1b754bc372f717b105b">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393">cutlass::Vector&lt; half, 1 &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a322ddd3ec1f47b76e21c24d3a3c44c5badeba151dbcb3c15e581bad7d767a93fa">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a9aacb7538f1b83762d68c768629c98eba17b71e816051646b567cf47334649a9b">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
+</li>
+<li>kNone
+: <a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5">cutlass::MatrixTransform</a>
 </li>
 <li>kRequiresLoadFence
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>kRowMajor
 : <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout</a>
 </li>
 <li>kScalar
-: <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954">cutlass::IteratorFragment</a>
+: <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">cutlass::FragmentElementType</a>
 </li>
 <li>kShared
 : <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace</a>
 </li>
 <li>kVectorSize
 : <a class="el" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
-, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d">cutlass::Vector&lt; half, 1 &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 </li>
 <li>kW
 : <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">cutlass::IteratorAdvance</a>
 </li>
 <li>kWmmaMatrix
-: <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">cutlass::IteratorFragment</a>
+: <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">cutlass::FragmentElementType</a>
 </li>
 </ul>
 
@@ -139,6 +160,13 @@ $(function() {
 </ul>
 
 
+<h3><a id="index_o"></a>- o -</h3><ul>
+<li>OneDirection
+: <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5">cutlass::gemm::swizzleDirection</a>
+</li>
+</ul>
+
+
 <h3><a id="index_v"></a>- v -</h3><ul>
 <li>value
 : <a class="el" href="structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc">cutlass::divide_assert&lt; Dividend, Divisor &gt;</a>
@@ -164,7 +192,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_f.html b/docs/functions_f.html
index e2a60d90a..2deb57d04 100644
--- a/docs/functions_f.html
+++ b/docs/functions_f.html
@@ -71,70 +71,121 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_f"></a>- f -</h3><ul>
-<li>fetched_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a3147da380e4c1e465aba0b965ac87ab5">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-</li>
-<li>fetched_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a837fbec1d47ae45480941de6290889c0">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+<li>fetched
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>fetched_fragment
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>FetchedFragment
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>fill()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
+<li>First
+: <a class="el" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+</li>
+<li>first
+: <a class="el" href="structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+</li>
+<li>First
+: <a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+</li>
+<li>first
+: <a class="el" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+</li>
+<li>First
+: <a class="el" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+</li>
+<li>first
+: <a class="el" href="structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+</li>
+<li>First
+: <a class="el" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+</li>
+<li>first
+: <a class="el" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>First
+: <a class="el" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>first
+: <a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a>
+</li>
 <li>Fragment
 : <a class="el" href="structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+</li>
+<li>fragment()
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad5cb076de46e841a165bd43924dab463">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>Fragment
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a7f802c4c733375d0a63f91c58196e6a0">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a6c9737f5b09e7eb1aa7daabb00ae2e69">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>fragment()
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>Fragment
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>fragment()
+: <a class="el" href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>Fragment
+: <a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>fragment_a()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a4a8c64d85aa012e3689dd024c486924b">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#af29f052dc0145abe3144dea1472d241a">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>fragment_b()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#aa28f34fb0c4bf739246d92c2fef80e0b">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a375e96bc2e35447682bd1dea3c4d87ad">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>FragmentA
-: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1daf96b6d152c5cf32f248bbfd605b74">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a71aadbb130d4b1a6532c45282b37354f">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>FragmentB
-: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae79e7fc5be2f4c8d30ca83edc151f63a">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a43e278686b493d0aef943f32a9f47b9e">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>FragmentConstIterator()
-: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#ac4b6f351e6e72bed37e425f02a10c81e">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a48de0db7ee2ee9699b946a9d5a0364c7">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#ad3e99cd7f56d4aec0a28cfcbde66f5af">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#adfcd8a2e63bd0c515ef03760cc1c4283">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>FragmentElement
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a2b13136a970fae187fcb377c9be28fac">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>FragmentIterator()
-: <a class="el" href="structcutlass_1_1FragmentIterator.html#ae1825fe3e138e2aa62d27dab2b5227b4">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a0843b2d82422e7178f324a8d3be9d705">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentIterator.html#a638e4e1d84b4ae84e758288c7f37548b">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ace8a65d90db264a0ee93a810be38918f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>FragmentMultiplyAdd()
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af19e14a22aefd1124f7d31beec6f8c42">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a21f0965f6178917c7f5c6d79ed048059">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ae1fbd0fd103deda51208102f15f896ed">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ad35b57b3f0cf5a467a1b0e48cffc3061">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
 </li>
 <li>FragmentShape
@@ -142,16 +193,19 @@ $(function() {
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a3b872e85844c9e009fa480a71a829136">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a82ceeea55603dbb0c6e5bf9c22ac692e">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>functor
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 </li>
 <li>Functor
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 </li>
 <li>functor
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 <li>Functor
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
@@ -160,7 +214,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func.html b/docs/functions_func.html
index 0a425c0a1..4791620ae 100644
--- a/docs/functions_func.html
+++ b/docs/functions_func.html
@@ -71,25 +71,36 @@ $(function() {
 &#160;
 
 <h3><a id="index_a"></a>- a -</h3><ul>
-<li>advance()
-: <a class="el" href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
+<li>add_pointer_offset()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a93ff0a9fda3e136a1674aeb82de050db">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa6977ded39ead005b3435f13f0e51116">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a0752af296e110d9104a45ae24bd0a104">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>alpha()
+: <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
 </li>
 <li>at()
 : <a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd">cutlass::ConstPredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
-, <a class="el" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">cutlass::Coord&lt; N_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a8b957150545becacab1b8ead1be29424">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentIterator.html#a9cf31df06ff035705a1341810fcdcbf2">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a14f2ad2f9b90aea092ff1836e8fb159d">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentIterator.html#a35b721563536ab2c5dbab0f5de1c2b43">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#ad894a8b373c413d308cb1b7c7ba545ce">cutlass::TensorView&lt; T &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a597bb02594c918c50f0bdb0cb4ce74c8">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a2a95fd42d48c550a45f340b04f9dfe3d">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aac4b013050925c1e2db4019140e82602">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 , <a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f">cutlass::TrivialPredicateTileAdapter</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_0x7e.html b/docs/functions_func_0x7e.html
index bf8de83a8..02cd656d3 100644
--- a/docs/functions_func_0x7e.html
+++ b/docs/functions_func_0x7e.html
@@ -78,7 +78,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_b.html b/docs/functions_func_b.html
index 5d533d802..80882b7aa 100644
--- a/docs/functions_func_b.html
+++ b/docs/functions_func_b.html
@@ -71,14 +71,22 @@ $(function() {
 &#160;
 
 <h3><a id="index_b"></a>- b -</h3><ul>
+<li>batch()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">cutlass::gemm::GemmCoord</a>
+</li>
 <li>begin()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a6b0f0d9cef4a2f3f4a8bf6c192a282db">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a4f4a2f860cc10688ee27cc9ce1df1015">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>beta()
+: <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_c.html b/docs/functions_func_c.html
index 19541d873..b8f85b2cd 100644
--- a/docs/functions_func_c.html
+++ b/docs/functions_func_c.html
@@ -71,24 +71,43 @@ $(function() {
 &#160;
 
 <h3><a id="index_c"></a>- c -</h3><ul>
+<li>c()
+: <a class="el" href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
+<li>capacity()
+: <a class="el" href="classcutlass_1_1TensorView.html#ad870c366ffe904d3363df1dfb0d5f04c">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
 <li>check()
 : <a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;</a>
 </li>
 <li>clamp()
-: <a class="el" href="structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 <li>clear()
-: <a class="el" href="structcutlass_1_1Fragment.html#a29e7408fcde8cdf9de5e3a10eaa46391">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Fragment.html#acf28266500b87484530b2395925fca51">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipFragment.html#aa978dd7fca15ca20e9f52d15e6f8f9c1">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
 </li>
 <li>ClearAccumulators()
 : <a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a>
 </li>
+<li>column()
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">cutlass::MatrixCoord</a>
+</li>
+<li>ColumnMajorBlockSwizzle()
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a6d0ee4e76371af26030ab4922e6c915a">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
+</li>
 <li>commit()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a6dc512be014b9d849057e2fd4c0b0485">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#ade2d85507dec77591e66276339a1eef5">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9cc435369c7fc76d0bb6233a8258e257">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab39c82ac1a8138c4b6d69dab9d48bdbc">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6699714c357f2714df011f58c1c48861">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa3aa987bf0fd6303e06f46e2f54e47e4">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a93cc2a7eb3215ce5bae343fb117f55c5">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a165a0d486f53fb2315d4e555c9f59891">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>complex()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#a2e852c886e61a39e884026d6f4c32c1e">cutlass::platform::complex&lt; T &gt;</a>
 </li>
 <li>const_begin()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#aeb7f9226a4fa49d06500c3c83958dc41">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
@@ -97,43 +116,51 @@ $(function() {
 : <a class="el" href="structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
 <li>const_ref()
-: <a class="el" href="classcutlass_1_1TensorView.html#a23564f1d333bb16343ed3a885f894285">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0a48de201c35cbc9d5e3b94fa597a617">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a559f7210b445c77a167ab1f41c8d0827">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>ConstIterator()
-: <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
+: <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
 </li>
 <li>ConstPredicateTileAdapter()
 : <a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1">cutlass::ConstPredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 </li>
+<li>consume_tile()
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#af8bb78ae198af4dccb0241da44428053">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+</li>
 <li>contains()
-: <a class="el" href="classcutlass_1_1TensorView.html#aa94063d9a9c6e599d3f53e22433274be">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a3f448bcf6e664c244f472e2659215628">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>Convert()
 : <a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a>
 </li>
-<li>convert()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-</li>
 <li>Coord()
-: <a class="el" href="structcutlass_1_1Coord.html#a9cbfff91f0b0d0a149534c97e3d6e69b">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 <li>Copy()
 : <a class="el" href="structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1">cutlass::Copy&lt; Fragment_ &gt;</a>
 </li>
 <li>copy()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ae033f55779b45b4228f40a4d699062bb">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#af25495bb0bb35bd64246d3a80fe4806f">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a279144e9722055d4b862e3fa25948762">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a3784dbb3efe0865ffa946419111c824a">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5c0efc259bb3bd1675f5d395dab71e95">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a99039d115a539fc99e2235c12ac57eed">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad46887abb2e3136b635c3ef5be29cf69">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a60a03c95452fe627477933d60815f7cb">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>count()
-: <a class="el" href="structcutlass_1_1Coord.html#a40429a9154f7a142ad7e9eb35282d196">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_d.html b/docs/functions_func_d.html
index 4c1c062a0..dbc7a90c0 100644
--- a/docs/functions_func_d.html
+++ b/docs/functions_func_d.html
@@ -71,23 +71,29 @@ $(function() {
 &#160;
 
 <h3><a id="index_d"></a>- d -</h3><ul>
+<li>d()
+: <a class="el" href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
 <li>data()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3af66b82b1a0cc5bf6141f940553e048">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a0d3c1a58f23957f9850d1b22992a981a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afe77778a126449e210c0bd6ec2dc6709">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8">cutlass::TensorView&lt; T &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a0e05007f939b27e6a17dce5c2a49e3e0">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a67b25cc51ce867b073feead7b94e6aa3">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#acc3f2c29fe21316091a1405613083000">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+</li>
+<li>decrement()
+: <a class="el" href="classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>dhw()
+: <a class="el" href="structcutlass_1_1TileCoord.html#abe65d1a0ff3798b662376032d51e9713">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>dot()
-: <a class="el" href="structcutlass_1_1Coord.html#ad4b3704d14057c043f972827671115cf">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_e.html b/docs/functions_func_e.html
index 89f2b82a2..10ff8b063 100644
--- a/docs/functions_func_e.html
+++ b/docs/functions_func_e.html
@@ -75,19 +75,19 @@ $(function() {
 : <a class="el" href="structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
 <li>epilogue()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 </li>
 <li>epilogue_with_or_without_beta()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 </li>
 <li>evaluate()
-: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a2e0d140aed388d2457dfb24d28fcd08a">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_f.html b/docs/functions_func_f.html
index a614ede1b..bfd045bde 100644
--- a/docs/functions_func_f.html
+++ b/docs/functions_func_f.html
@@ -74,27 +74,32 @@ $(function() {
 <li>fill()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
+<li>fragment()
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad5cb076de46e841a165bd43924dab463">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
 <li>fragment_a()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a4a8c64d85aa012e3689dd024c486924b">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#af29f052dc0145abe3144dea1472d241a">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>fragment_b()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#aa28f34fb0c4bf739246d92c2fef80e0b">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a375e96bc2e35447682bd1dea3c4d87ad">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>FragmentConstIterator()
-: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#ac4b6f351e6e72bed37e425f02a10c81e">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a18f926c9c877e15a279f16637bd24e83">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 </li>
 <li>FragmentIterator()
-: <a class="el" href="structcutlass_1_1FragmentIterator.html#ae1825fe3e138e2aa62d27dab2b5227b4">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentIterator.html#a638e4e1d84b4ae84e758288c7f37548b">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 </li>
 <li>FragmentMultiplyAdd()
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af19e14a22aefd1124f7d31beec6f8c42">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a21f0965f6178917c7f5c6d79ed048059">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ae1fbd0fd103deda51208102f15f896ed">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ad35b57b3f0cf5a467a1b0e48cffc3061">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_g.html b/docs/functions_func_g.html
index b30237366..b6258df4a 100644
--- a/docs/functions_func_g.html
+++ b/docs/functions_func_g.html
@@ -74,47 +74,73 @@ $(function() {
 <li>Gemm()
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 </li>
+<li>GemmCoord()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">cutlass::gemm::GemmCoord</a>
+</li>
+<li>GemmDesc()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a948af4a974f1aa74d3b6da9cd3e185de">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 <li>GemmEpilogue()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 </li>
 <li>GemmGlobalIteratorAb()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a34cb153d311377388e7819296a84d07e">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>GemmGlobalIteratorCd()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6dae81995ab94c0b7f28eeeeb84a6c8d">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>get()
-: <a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html#a11bf40abc57580db5ce4b0fd4c3e55ff">cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html#a5198e838e3892245fe7b10884555ec93">cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html#a512a9d46f6bea9d85641d7263bcfee36">cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html#acdbb9c7cdf9fc054656614f72396434e">cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a>
+: <a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">cutlass::ComputeThreadOffsetFromStrides&lt; Threads_, Strides_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html#a6e621f5fae2ba29277fde46be1cede24">cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html#a5d446b2663c01362361e09435a726996">cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a>
+, <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a1661baed19b4aa4eea725a6f6e6b26a3">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
 , <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a2e7c14b8a118f81c1df46ea5045e297b">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#af035589126434bd2dbef4000cd864b8b">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 </li>
+<li>get_batch_id()
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#abb21a72e2cef3217f446f70758c59c1e">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a8f84a2b830caecff3edd052dc24635e6">cutlass::gemm::IdentityBlockSwizzle</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a9be74716c0e3dc6a7f4cdd64cbb16211">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
+</li>
 <li>get_deleter()
-: <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
+: <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#aa427ab4ea4f2336ac6db28d53a4c11ac">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
+</li>
+<li>get_grid_layout()
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a927ce3eed4cd22554f9e6fe20a1ccc6e">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#afc20f302a5cc5b736cfc1c91dfcaa57c">cutlass::gemm::IdentityBlockSwizzle</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#aa9fc825e19404ff527cb3d2dcc55ae1c">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
+</li>
+<li>get_pointer_offset()
+: <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>get_ptr()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a6b066568947df37094e4125b0347faf1">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+</li>
+<li>get_scalar()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a81bd7b4f50b8d7c5effe5291ad920380">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+</li>
+<li>get_threadblock_offset()
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a380fb7f905548c52933ea411166424b4">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a386e5cf702b0dcc3d57f9fdb4ab5d236">cutlass::gemm::IdentityBlockSwizzle</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#af7c1b4e0afb08e893cd14a169a0b47cd">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
 </li>
 <li>GlobalLoadStream()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ab2961b4db0694cf128d55d38a98db575">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a4dd11a75375b6b9d7b8dcbd4d402d8d6">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aec86bdf5d7d4ad1f7b6ebebcf2da8395">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 </li>
-<li>GlobalLoadStreamBase()
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+<li>GlobalLoadStreamPair()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab97442e24a1d6d64727b6320ab901ad1">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
 </li>
 <li>good()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a837881bc82704491accf54aad2b9def9">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_h.html b/docs/functions_func_h.html
index 7eb85aac8..184c449e2 100644
--- a/docs/functions_func_h.html
+++ b/docs/functions_func_h.html
@@ -71,14 +71,23 @@ $(function() {
 &#160;
 
 <h3><a id="index_h"></a>- h -</h3><ul>
+<li>h()
+: <a class="el" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
 <li>HgemmSwizzle()
 : <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ac3c52e0fee9b37a3dfc39ca168a63d36">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 </li>
+<li>hw()
+: <a class="el" href="structcutlass_1_1TileCoord.html#a0927c4ba212d00f3687034afe6bb8daf">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
+<li>hwc()
+: <a class="el" href="structcutlass_1_1TileCoord.html#a11bb7593ce7bba2dcedd199322a8b42b">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_i.html b/docs/functions_func_i.html
index 16cfdc518..7c8680aba 100644
--- a/docs/functions_func_i.html
+++ b/docs/functions_func_i.html
@@ -72,90 +72,103 @@ $(function() {
 
 <h3><a id="index_i"></a>- i -</h3><ul>
 <li>IdentityBlockSwizzle()
-: <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#abfde9b316173b1c0b8622cf22ffb6d68">cutlass::gemm::IdentityBlockSwizzle</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a046a5dfd01164df2abd514e9a52987c3">cutlass::gemm::IdentityBlockSwizzle</a>
 </li>
 <li>IgemmEpilogue()
-: <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#ab7a51121d24250d6441ee538e6521dc2">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a49ac00bed1532707aacd3ff108c84623">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a599a50becefed561d063c1b834188aca">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a0a1be1aab827127161406871ca75cbe0">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a>
 </li>
 <li>IgemmFloatToInt8Converter()
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#ac65f020e93584b1bd3cdb849ff625026">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a>
 </li>
+<li>IgemmGlobalIteratorAb()
+: <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a489fe448cd7f7e1f3805d33504f9d336">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+</li>
 <li>IgemmInt8ToFloatConverter()
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a88a55a494d3a30d50477d50bf6a8804d">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
 </li>
 <li>IgemmSwizzle()
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac041d287c966cf568599d7e462e81d5a">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 </li>
+<li>imag()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">cutlass::platform::complex&lt; T &gt;</a>
+</li>
 <li>inc_advance()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a9dea455aa86bb59517b4a4d0309e424b">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab4b8150f19c9f8649d75c69ec0a76e1a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a174ae7d8aa0664eaf1d6f63c5606baa0">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>inc_c()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a12ead84ea9634e963d10c6df7b7792c9">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a44287250bf5631a490b514859fd101d1">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>inc_d()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1e42503e5a54cdc01308e9030aebdd35">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad26ab8d8010c9a1d7f3b91f60940b460">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab1ebbe54e4315ac07daf260a88f41d04">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>inc_h()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aa24336597f4a3316d94df6ab0c20f714">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ae07fa10a53d44471a04275145201299e">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa9a733f35e9be67663c9c8f80b0034d4">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>inc_stage()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8851150a49e4a9c135279c8c9dfdc592">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a187e0852ec4862f6d3cb6249bedc3bb3">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad4b9b1c1fe4b0c6961842d0eff6d7db7">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ad61206a742c8c5ab5bcd64b76ece9f74">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>inc_w()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a622a4dd27162854ec96efea93cdd4380">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aec2d692967d9be5d42673dfde21f5427">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>increment()
+: <a class="el" href="classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>initialize()
-: <a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html#ac00c9d78a187d9c7d53399f971c0e129">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a3e9d0fd2989fea776b0cab0e0f2813ce">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#a73091e07b6d4c99f6e0319fbf6bd1709">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#af5a496f1b6a46ea6a9894512029add6a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a13395bf81eabdc539c935e179c31d7ca">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#ad0602cf5d322e98e3e5990c84ae1e3f3">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a7c7e448384156c801ed362359a1a6a40">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a054aee5b4bf288cc1f5945f2521ef835">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ad4089906220d4656ba075fb9afd1012c">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ad1b2291b898091ee1966b73bd1ad56fa">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#ad6b65c5f3ed7cd9e7ffeb684cbf30d04">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ac1cfe92f1543ba445fa10f1859a0db98">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a98867f4fc4daf790e309f8365e71cc8f">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#aca14058b112b7d5105658457341726cb">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>initialize_predicates()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#af92ba20db048a9ec96976a1673f0f7c2">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#acb6bc889b93d25c9e483a0b7297d7c89">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#ab0f93878bbe5aac072450f9bf1dd8b64">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>intermediate_fragment()
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>is_pointer()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a95373f3d1b286c61cb204ba6a1282ce0">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
 </li>
 <li>is_zero()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
 <li>Iterator()
-: <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
+: <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_k.html b/docs/functions_func_k.html
new file mode 100644
index 000000000..ced1e9b63
--- /dev/null
+++ b/docs/functions_func_k.html
@@ -0,0 +1,98 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Class Members - Functions</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+&#160;
+
+<h3><a id="index_k"></a>- k -</h3><ul>
+<li>k()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">cutlass::gemm::GemmCoord</a>
+</li>
+<li>KernelLaunchConfiguration()
+: <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">cutlass::KernelLaunchConfiguration</a>
+</li>
+<li>km()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad6c884a5bb6e5edaf371e8af10df367d">cutlass::gemm::GemmCoord</a>
+</li>
+<li>kn()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a16501265d58ddaca0e2d9bb4e21d66ea">cutlass::gemm::GemmCoord</a>
+</li>
+<li>knm()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a4062c040208868c75dbc6ba18910bffb">cutlass::gemm::GemmCoord</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/functions_func_l.html b/docs/functions_func_l.html
index c76f9fc53..76d84a054 100644
--- a/docs/functions_func_l.html
+++ b/docs/functions_func_l.html
@@ -74,30 +74,56 @@ $(function() {
 <li>launch()
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 </li>
+<li>Launch()
+: <a class="el" href="structcutlass_1_1gemm_1_1Launch.html#a8552a524b9419f60bf8ef3c6b8528d27">cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#ab7a89806834a5fa8022daae4180e6180">cutlass::gemm::Launch&lt; Gemm, false &gt;</a>
+</li>
 <li>leading_dim()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6c580a451a36143d1eb0e409e7b13e33">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
 </li>
 <li>LinearScaling()
-: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a34df6970f033b3090ad8f4d40063b1b2">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+</li>
+<li>LinearScalingDevicePtr()
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a9dcb15bbcf3785280fd5cea0e0da5602">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
 </li>
 <li>load()
-: <a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html#a014682b143bce65667075ea15fad184d">cutlass::FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html#a01a847858cb330d7d109ddee228e96ce">cutlass::FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a7ba77016bee8e941f7831cc9fbfa994d">cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a4ee00178c441bdf4d4a1f8cf984bc03f">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#aa9d5e227ea20ad3c6952f296016ec167">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a0e58d26dd68aabb6cb9678f5656c7e6f">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a7d9027453aa78d4448d70dc44307791e">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a4bab8959d29ee868fb6b3e1f9abc04fc">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a7d3d3e156dc527f9c00acc7a66d21326">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#a2e906364a0631c2c9f97acd0ae4a1873">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#afee69b86f070e3badc75ab00bcc5996b">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a854c684b3f6c1a10b6e8fcf7967f6642">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#a619f643794f51b35f3c0a1011ba00bbd">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#abc4f879290c847a6e73dc9e68a340f74">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#af587adae1103b4242e0d56eb902f9302">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a9a3f2f913ee73f0c04e74ec89c6c5cbb">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>load_element()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a5cbda0dea8c87ca55499c97cc80b1ccf">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a109209936a9453e8f1f3f5eecfd6afca">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>load_post_increment()
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae2febd768cbbfb8aab3c2cb669c0505d">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#adfbd262dfb19fffd91e0712190d9712d">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a95b8db4af9228beed273669b3b0b12fe">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_m.html b/docs/functions_func_m.html
index 2c68ec4f3..97f286560 100644
--- a/docs/functions_func_m.html
+++ b/docs/functions_func_m.html
@@ -71,23 +71,38 @@ $(function() {
 &#160;
 
 <h3><a id="index_m"></a>- m -</h3><ul>
+<li>m()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">cutlass::gemm::GemmCoord</a>
+</li>
+<li>map()
+: <a class="el" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a215f63b5a1b3799654c5670ef108fcfb">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
+<li>MatrixCoord()
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">cutlass::MatrixCoord</a>
+</li>
+<li>move_to_residue()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac269a9280a55d3988ca60f571bdf7f29">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab94c0c95d6d4e019563ba8a142f9d410">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+</li>
 <li>multiply()
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a522301fbe3e276cb5ef9fbe75bb2ab50">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ae62d61ec068ac958753d0a2f5a99d8e2">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a934c0d74c70fc87796ecb5cde50fd516">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a6bed70e7074931419e9441688aee00ea">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
 </li>
 <li>multiply_add()
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a34bbf209967fef6181d3d46dd27fa0c0">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a89c8b663af69f13c2a02cb464b5172a5">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aafa37c2e1ffd2f7d7031c24c732157d8">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a92edee5611d25b60cdab6a1c8e32141f">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5dcf66c8126ec8adf8e66d4bf5b2f347">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a66486d38349fa20eb065ae9542eb43aa">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad22dd143c304c22c2630aedbfd3459af">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7989d48e4c2e16b7804b813630f347cb">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#ae0ea662652907b60140598dad777c5ab">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aaf8ea4aaf393488f03ba7fb7af264940">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ad9d8e47e8896d8d4eab538aa78b56e47">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_n.html b/docs/functions_func_n.html
new file mode 100644
index 000000000..3b16224a8
--- /dev/null
+++ b/docs/functions_func_n.html
@@ -0,0 +1,89 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Class Members - Functions</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+&#160;
+
+<h3><a id="index_n"></a>- n -</h3><ul>
+<li>n()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">cutlass::gemm::GemmCoord</a>
+</li>
+<li>nm()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac4550a7e80e1f0265eacecebe54794d9">cutlass::gemm::GemmCoord</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/functions_func_o.html b/docs/functions_func_o.html
index fb7b39f73..a7c0b04d3 100644
--- a/docs/functions_func_o.html
+++ b/docs/functions_func_o.html
@@ -72,8 +72,12 @@ $(function() {
 
 <h3><a id="index_o"></a>- o -</h3><ul>
 <li>offset()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a064f3630e69798e7915f910c4ee99ab7">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a07c7f56e724cfbc844777e8ee9f616b5">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
+<li>operator()
+: <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
 </li>
 <li>operator &amp;=()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
@@ -82,16 +86,29 @@ $(function() {
 : <a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8d100273203db9018dffbbe84e0b6c76">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;::dummy&lt; B, D &gt;</a>
 </li>
 <li>operator bool()
-: <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
+</li>
+<li>operator cuDoubleComplex()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#a3b92e54de1c4262c7e481218162be7ec">cutlass::platform::complex&lt; T &gt;</a>
+</li>
+<li>operator cuFloatComplex()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#ac5a3a0dc9815dadbe539312eb6fe36c4">cutlass::platform::complex&lt; T &gt;</a>
 </li>
 <li>operator D*()
 : <a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8aadc500baf1492b1a4d05cc8b35fc13">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;::dummy&lt; B, D &gt;</a>
 </li>
+<li>operator Scalar()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a896f35e776c1291ceda0f432cc3da654">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+</li>
 <li>operator value_type()
 : <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#a55d25116387f1c6d978462b1d245d675">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
 </li>
+<li>operator!()
+: <a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+</li>
 <li>operator!=()
-: <a class="el" href="structcutlass_1_1Coord.html#a7fb46873e8f3cf38212703d35bd36995">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 </li>
@@ -105,78 +122,154 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html#a1228edf6cc0f81af520dc77c8792b94c">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#a80562f5ceab2049c3b7834c2891a07ee">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a>
+, <a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html#a3922130841c34d3ce8c112ee6fae4ca1">cutlass::IdentityTensorMapFunc&lt; Rank &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#af51e07c6605524581e5d27d290c8b8d2">cutlass::MatrixLayout::ColumnMajor</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a24c06bb7e64a8015ac528b3ae954a689">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dbf79e5df5bcf52d54a699d2587319d">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a512248a443c5914fab6aeabc4a73978e">cutlass::MatrixLayout::ContiguousLayout</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a736620aef395e4224d7aae098573aa34">cutlass::MatrixLayout::RowMajor</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#abde0a4a7c487da0c78ea2519323c04af">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a5199cb7f7c10f6123c63703453b7937c">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15">cutlass::platform::default_delete&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87">cutlass::platform::default_delete&lt; T[]&gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978">cutlass::platform::greater&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5">cutlass::platform::less&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c">cutlass::platform::plus&lt; T &gt;</a>
+, <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#a084c0a2732827a74f7a30873c5883827">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a>
 , <a class="el" href="structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2">cutlass::TiledThreadOffset&lt; ThreadShape &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;::ThreadOffset</a>
 </li>
 <li>operator*()
-: <a class="el" href="structcutlass_1_1Coord.html#a8e4f7df55a75d040cf50cf9984c04c8a">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5a158b5f3c0b1779972b25aa52be1164">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#ac68a57c17811b0a04dc6fb21423ab226">cutlass::MatrixCoord</a>
 , <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 , <a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ab8fbb13cc5ea4f580a7fc32963de9553">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator*=()
-: <a class="el" href="structcutlass_1_1Coord.html#a282b6cc9ac8b2f72720c252791155aad">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a69fb0bb5e73f35d3c8df71a0174d6520">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a5fd3c3b58af1147a5c73657c05a16f5b">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ae946b3af6b795d26632da7ca66b3751c">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator+()
-: <a class="el" href="structcutlass_1_1Coord.html#a3dfc4ce4191097b6c3268696f2a45ef5">cutlass::Coord&lt; N_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a675efbb9ed360888faf3c333708ae4d5">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a25236953237f965965b1c9b7a04ba26e">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ad054f14b5580c9480d671b8fc8ef016a">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a9fcd43018e60f12cb328859c76ec7891">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a1d48f4fea3fa85a7bf1b26b421387afd">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#aa2390d8e127a51df239affd2ca36e97a">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a3bfa2daa0e63144c1e8510ba336f185b">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator++()
 : <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
-, <a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a>
+, <a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a8ce80124ab0f4ab9981f1a4d64d976a5">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a3481d6f41defd25ab574bb19ee5fe424">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a47d270fc4a119d7b95b2d5dd3ee5b87b">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>operator+=()
-: <a class="el" href="structcutlass_1_1Coord.html#aeb209486943fa9d42911325b16e49e09">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5465f7308778eac5d14d8020179a65e0">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a8e79a153de72eef10d90bfd02b5dd27e">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a769813dcffe1767aab49ac30b838a5f4">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#ad105615dbf7ede75caa0e778c873bd06">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0753aeb57365a976bc0a88481af504cb">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a22b87d281057c8e03b80db7046c54dd8">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab07a5d1a4ec6d96ec53e868b3a6d7cae">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a4fa8fa35d00eb4d0097da492c738cddc">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a812760c633ea813db8a2bc24826c68df">cutlass::TileCoord&lt; Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a57b284e6cbff892d45e5cfeb0ae1e3ed">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a60ba516d7382cb7788d5430023f7fc44">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>operator-()
-: <a class="el" href="structcutlass_1_1Coord.html#acc510511ffb52bed7f6a52f14b99750d">cutlass::Coord&lt; N_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a762fd45e61477d700c82bfd67443c6f9">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#aa462303d75a5d98b680b6e20080ce877">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#afde28cda18918d3e177d3e5024ed3dd4">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a143ec893406d930aa4c5aa860052197e">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab92bc090d6753ff5e17676ba85a1e478">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a1e4b2bb02c5843898f72f62787403add">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a9f274d8e93f9cd3e0a9699e11b85fa7c">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator--()
-: <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
-, <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
+: <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a0f395558e2c589ac48179447a23b59d8">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad5290f0e7814892cb4fff55e9518562b">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a3d22dab34b2abd0d05c00668f8591151">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>operator-=()
-: <a class="el" href="structcutlass_1_1Coord.html#ac1795ec2a5890d8a39840567a4bea88e">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a12ba250be3d5474b7c6fc4eddd4f58d5">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a6feef48cf24733d22ca53a27cbc33ac0">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a11964d045ac8e41c80026515adb03008">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ae3561f863072cd7be7dcdee2cb5cc1f0">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ac4018b51e78842fb252d6917738fa571">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#abc088fad6debb6a0ceb04c5d2767e81b">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a02da20e580962fe0754a772842045389">cutlass::TileCoord&lt; Index_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a7bae0f9b789e75bb154c5f37db50e14c">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>operator-&gt;()
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
 <li>operator/()
-: <a class="el" href="structcutlass_1_1Coord.html#a87f485be079fa68bcf576da4d56f0ece">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a41770bb99f02f4debbafe95e019ce02b">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#aa89b196410d25d8c9ed3746fb6833374">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a5d2cc915343a3b90fb530348ddd329d2">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator/=()
-: <a class="el" href="structcutlass_1_1Coord.html#abe91e59962ef0d73aec9c14824f64ecc">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#aac1e1bad751237fd76d32a1ea10f6c40">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#aab345c8ddb8048bfe3d667bc7ce6522f">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ac3207d8aa879c86a907cdcc93ccb2eb5">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
+<li>operator&lt;()
+: <a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+</li>
+<li>operator&lt;=()
+: <a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 <li>operator=()
-: <a class="el" href="classcutlass_1_1TensorView.html#aa9e9e19f35ce3111f64b763ca49b51ef">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a54357e2f1d52aa8355b2ae7796740ea3">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#acf0c156efb9197bc7538f7e9057d8a68">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>operator==()
-: <a class="el" href="structcutlass_1_1Coord.html#acfa94aabd0c9a71ee994ca479d5f515f">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 </li>
 <li>operator[]()
-: <a class="el" href="structcutlass_1_1Coord.html#ab7fc89de3ccd7096ab275fb5dd40104c">cutlass::Coord&lt; N_ &gt;</a>
-, <a class="el" href="structcutlass_1_1Fragment.html#a75f51bb6ca84615076aab42ac9d42592">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#af16f2aa14ff424b038a393b683c4783e">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentIterator.html#a3bd2a9d8467f8db02ca3a01ae0c11ad7">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Fragment.html#a7795c5cf4d5626ff125abd5e8f156e9b">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a6216b58ffe6322f037f1e0a3ffa714c8">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentIterator.html#ad665745f3d6a3a88d7894fe0fc1bbd3e">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a7fe7e44e15fd1ac58fb55edf72e8fb23">cutlass::TensorView&lt; T &gt;</a>
-, <a class="el" href="unioncutlass_1_1Vector.html#a44cc27bf8a7b789b4ae8538155a50156">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
-, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a8ade80e040264fbd669d3f15c249884e">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a64a5e91e01555b8bfd22875543573d22">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector.html#a69be4f85c1dac371fa6f1c6747724adc">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a8eda6e6181a5333ca8350977374708cb">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1e6568c0f3f958db739074ab6978ff10">cutlass::Vector&lt; half, 1 &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a3891ce1c321a3e57e938c8864de9baf0">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2d5ec0b76daa136dae0b4aec1edf9e0b">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#ae2215fe7c2c223175b4172d73a6c7a82">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 </li>
 <li>operator|=()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
@@ -185,7 +278,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_p.html b/docs/functions_func_p.html
index 8f1b5e8a8..d12a337a9 100644
--- a/docs/functions_func_p.html
+++ b/docs/functions_func_p.html
@@ -71,6 +71,23 @@ $(function() {
 &#160;
 
 <h3><a id="index_p"></a>- p -</h3><ul>
+<li>Params()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#afb39229d0ad334834cd2ba0c1fcc9412">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ae515cd98a75ff3eafffcc69692d6301a">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae28323819fc8950bc0fee3a34b2184ff">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a90772ac34f8c49f049eb62fada0a2165">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9cf4cd4ecb0a81cf3c03a70c7bfc4e09">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#adfa2399bf13cdff16b7bfe1cb0dd2bd9">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#ad38f6a2cc5800c0ec82b12d183040390">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a>
+</li>
+<li>PredicatedTileLoadStream()
+: <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a672a8883d16eff4ecc90dc79162084d3">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+</li>
+<li>PredicatedTileStoreStream()
+: <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ac4aafc6bcc6cf3bff5b31b9cd60fd667">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+</li>
 <li>PredicateTileAdapter()
 : <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 </li>
@@ -83,11 +100,14 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250">cutlass::gemm::ProjectOperand&lt; GemmOperand::kC, true &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1">cutlass::gemm::ProjectOperand&lt; GemmOperand::kD, true &gt;</a>
 </li>
+<li>project_coordinate()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_r.html b/docs/functions_func_r.html
index 96a335337..b7f89e829 100644
--- a/docs/functions_func_r.html
+++ b/docs/functions_func_r.html
@@ -71,27 +71,48 @@ $(function() {
 &#160;
 
 <h3><a id="index_r"></a>- r -</h3><ul>
+<li>real()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">cutlass::platform::complex&lt; T &gt;</a>
+</li>
 <li>ref()
-: <a class="el" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a7e2beb56a3bc2d58c9ec65467b78c4f3">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>reference()
+: <a class="el" href="structcutlass_1_1TileAllocation.html#a3466ef2b478e4617aa1ff261217cfd05">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a0d00001220df7f2bdb1f09ae3f37c585">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+</li>
+<li>RegularTilePredicateFunctor()
+: <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#a0e0b728d3685097a9280fbca6a47a2af">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a>
 </li>
 <li>release()
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
 <li>reset()
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a8b1785a1ea5d7aa7eba8e45297d539d3">cutlass::TensorView&lt; T &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a1043f0ef382179b8ecd9f4e710f6e106">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#ae142eb93cf91e000b635d32fcacf1db3">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>residue()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aab37ea6c47e34466371314ed3971dc7b">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a405b93680bb6e356369863244d0b56aa">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+</li>
+<li>rollback()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1e2eecdba1871fc11aa43a06edf6ed34">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6a9287a2cd87ca8a96cbf6b6d29199da">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+</li>
+<li>row()
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a67f3102e51abad1205e8a3450e7a6c7e">cutlass::MatrixCoord</a>
+</li>
+<li>RowMajorBlockSwizzle()
+: <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a4ed7847f8ddad11a6765d914b6f32fcd">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_s.html b/docs/functions_func_s.html
index 197958afa..68316b6ad 100644
--- a/docs/functions_func_s.html
+++ b/docs/functions_func_s.html
@@ -71,6 +71,12 @@ $(function() {
 &#160;
 
 <h3><a id="index_s"></a>- s -</h3><ul>
+<li>ScalarIO()
+: <a class="el" href="structcutlass_1_1ScalarIO.html#ad4166575521254088bf6c6300c351714">cutlass::ScalarIO&lt; T &gt;</a>
+</li>
+<li>ScalarOrPointer()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b85e1940149922942c7d495f9d12134">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+</li>
 <li>set()
 : <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#aeda47efdda0387f9c3c7b31f836afca5">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aadfd039b5622098c9e46706a27122575">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
@@ -85,43 +91,71 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 </li>
 <li>SharedLoadStream()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a49315aea1c54d84ff19b0ac215128b95">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>SharedStreamPair()
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a0b69ca0b37dad32ba25c7f7e71a3dcc1">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>size()
-: <a class="el" href="classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>slice()
+: <a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+</li>
+<li>source_required()
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
 </li>
 <li>store()
-: <a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html#a45319520b7d341c66bd54d3e8fec48f8">cutlass::FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html#a118c78aa6b0ae0f0c78889689b6878c8">cutlass::FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ab70d04589637f285f861902f649f834e">cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aa130564bb2eba7b07e1f183c98f1d9e2">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a00f6bb93d318bf4cff35c9dabc630167">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a027980b8456243974b0c442866a66e3a">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a53820de506cecb1f5fb07b3385d8272a">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Store.html#a187b63f682f7f00f8bf9ed3ee59d602f">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a174ed368f1c702b4c958887f0b895eee">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#a535b4356c9bc21352fc2459b3c2246d1">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#ae16a5d6d7a42ffeba0f0ebe2d252ec28">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a453a2eed81a86d6637778a50bed06b59">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a1fcdc328d4b2deb1c50be5d31ef9e55f">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a298a08c8c4c1ea871e92e2491b2cb549">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#aa617653e75535fe13aafa80bc4cc9cc4">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>store_element()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a051eb2a8637601cf9c1f52999117151b">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>store_post_increment()
-: <a class="el" href="structcutlass_1_1TileStoreIterator.html#ae63949f58c1b32959bbfa5b64d521f0f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a018d5be34cdbb263d7f133197b2921ca">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a3a2cae47533c1122eb8ec404473a0d9e">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>stride()
-: <a class="el" href="classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a522630bb0df977282a9bff17e6fee843">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#abb88bd43e5493682d1132c550b734a36">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dab2c5aee6958c9d99109183401f41f">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#aa3c5b8d44216fdeeee9cce5e38ce418b">cutlass::MatrixLayout::ContiguousLayout</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a1b25b4a7061d81041a8e2a548128ca71">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a56f728be8b1a3e71f4f322e1dbfb3495">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
+<li>stride_advance()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>subview()
-: <a class="el" href="classcutlass_1_1TensorView.html#aee43c516397d7c06eb8012711d8d7c15">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#ad4b3faa318699b786f94cf8735a11dbb">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>swap()
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
 <li>swizzle()
-: <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">cutlass::gemm::IdentityBlockSwizzle</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">cutlass::gemm::IdentityBlockSwizzle</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_t.html b/docs/functions_func_t.html
index 13b5b7ab2..8521d2da2 100644
--- a/docs/functions_func_t.html
+++ b/docs/functions_func_t.html
@@ -71,33 +71,51 @@ $(function() {
 &#160;
 
 <h3><a id="index_t"></a>- t -</h3><ul>
+<li>TensorArrayRef()
+: <a class="el" href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
 <li>TensorRef()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa091e497277d0ba8a98c4ebf73c0cdba">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
+<li>TensorRefBatchStrided()
+: <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa5d7e9a4589d7dacc5d69ca3c70ecc2b">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>TensorView()
-: <a class="el" href="classcutlass_1_1TensorView.html#a80480aa986a488a106a9b0aea331c317">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a73f049694ca1ea4825b5a651852827f5">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>ThreadMultiplyAdd()
-: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ab271a3f11ccde4b629ddb11b78c0d555">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#acec155117a56c942c5e695984b0f072d">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a9b75e499f4c14369b5c86051dceeb81d">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac087f0b397599221b74d220fcb1c7121">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a0ab850304c3c6e73bcba321426ba93f9">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a32b234c873ffe44090a12e12d871024c">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aad8a642f46c88e407a1150ee1d42b8dd">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+</li>
+<li>TileCoord()
+: <a class="el" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>TileLoadIterator()
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>TileLoadStream()
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>TileStoreIterator()
-: <a class="el" href="structcutlass_1_1TileStoreIterator.html#aac4d49854d63f632627b6974f9b59dbb">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileStoreIterator.html#a9f4501c6e8ba0f4511919c1b63c14e69">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>TileStoreStream()
+: <a class="el" href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>transform()
-: <a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a>
+: <a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#aa9fe67c947bf461ba3e3ca48daa34815">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3">cutlass::Copy&lt; Fragment_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipConvert.html#a7e6398ad8ecd8757744a42f3ab8ef955">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
 </li>
 <li>TrivialIterator()
-: <a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a>
+: <a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a>
 </li>
 <li>TrivialPredicateTileAdapter()
 : <a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7">cutlass::TrivialPredicateTileAdapter</a>
@@ -106,7 +124,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_u.html b/docs/functions_func_u.html
index 2ca7d7a11..ae9323632 100644
--- a/docs/functions_func_u.html
+++ b/docs/functions_func_u.html
@@ -78,7 +78,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_v.html b/docs/functions_func_v.html
index ee4e6108b..8c869d438 100644
--- a/docs/functions_func_v.html
+++ b/docs/functions_func_v.html
@@ -72,18 +72,22 @@ $(function() {
 
 <h3><a id="index_v"></a>- v -</h3><ul>
 <li>valid()
-: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a01571b2fc566793fd50a10fa82441951">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentIterator.html#ab18f8ea676b45831f939715212167a99">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ac4d2c293f9312b673ea29bf79b2882fd">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6594acc213fc8d4289c6c73631f60120">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a468f8f503777e4a2b0089ee2bd6c471a">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#ac4d601998a84a3eac23e3b7a7c8a935b">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentIterator.html#a8608dd815ed4906d8c82c41a10df23e2">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>Vector()
+: <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a50ae62579267952a648d4b6a6be3c663">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a5feb070268f85bd73c3095eaf2d0e2bb">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a48e193a0b636934ea553c6e60ffef563">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_w.html b/docs/functions_func_w.html
index ef637faa0..8cac2ddbd 100644
--- a/docs/functions_func_w.html
+++ b/docs/functions_func_w.html
@@ -71,14 +71,17 @@ $(function() {
 &#160;
 
 <h3><a id="index_w"></a>- w -</h3><ul>
+<li>w()
+: <a class="el" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
 <li>WmmaGemmGlobalIteratorCd()
-: <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a505f124fa3f47c6d57b7275e81be6dd3">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_func_z.html b/docs/functions_func_z.html
new file mode 100644
index 000000000..858d93ffa
--- /dev/null
+++ b/docs/functions_func_z.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Class Members - Functions</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+&#160;
+
+<h3><a id="index_z"></a>- z -</h3><ul>
+<li>ZipConvert()
+: <a class="el" href="structcutlass_1_1ZipConvert.html#a7aa56d3ea300ebc58493c4d66339fff5">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+</li>
+<li>ZipFragment()
+: <a class="el" href="structcutlass_1_1ZipFragment.html#a520318d060123c5870c4153b99cf0427">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+</li>
+<li>ZipTensorRef()
+: <a class="el" href="structcutlass_1_1ZipTensorRef.html#a9b4e616da5b0a71ac2d9bd03b4e07b86">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+</li>
+<li>ZipTileIterator()
+: <a class="el" href="classcutlass_1_1ZipTileIterator.html#a31553842afd1cfd5a18a2fd6c39e17b5">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/functions_g.html b/docs/functions_g.html
index 9493c5ce4..bb564d1f5 100644
--- a/docs/functions_g.html
+++ b/docs/functions_g.html
@@ -76,53 +76,75 @@ $(function() {
 </li>
 <li>GemmConfig
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
+</li>
+<li>GemmCoord()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a17da9936dbad99f2402c42b1bd6ea5ea">cutlass::gemm::GemmCoord</a>
+</li>
+<li>GemmDesc()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ae2708b731cbb99d3e638382ecf599425">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
 <li>GemmEpilogue()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 </li>
 <li>GemmEpilogueTraits
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
 </li>
 <li>GemmGlobalIteratorAb()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a34cb153d311377388e7819296a84d07e">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>GemmGlobalIteratorCd()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6dae81995ab94c0b7f28eeeeb84a6c8d">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>GemmTileTraitsHelperA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 </li>
 <li>GemmTileTraitsHelperB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 </li>
 <li>get()
-: <a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html#a11bf40abc57580db5ce4b0fd4c3e55ff">cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html#a5198e838e3892245fe7b10884555ec93">cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html#a512a9d46f6bea9d85641d7263bcfee36">cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a>
-, <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html#acdbb9c7cdf9fc054656614f72396434e">cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a>
+: <a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">cutlass::ComputeThreadOffsetFromStrides&lt; Threads_, Strides_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html#a6e621f5fae2ba29277fde46be1cede24">cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html#a5d446b2663c01362361e09435a726996">cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a>
+, <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a1661baed19b4aa4eea725a6f6e6b26a3">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
 , <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a2e7c14b8a118f81c1df46ea5045e297b">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#af035589126434bd2dbef4000cd864b8b">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 </li>
+<li>get_batch_id()
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#abb21a72e2cef3217f446f70758c59c1e">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a8f84a2b830caecff3edd052dc24635e6">cutlass::gemm::IdentityBlockSwizzle</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a9be74716c0e3dc6a7f4cdd64cbb16211">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
+</li>
 <li>get_deleter()
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
-<li>global
-: <a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#a3c2980547310ec4307f3a5f9817dfc51">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStream_, SharedLoadStream_ &gt;</a>
+<li>get_grid_layout()
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a927ce3eed4cd22554f9e6fe20a1ccc6e">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#afc20f302a5cc5b736cfc1c91dfcaa57c">cutlass::gemm::IdentityBlockSwizzle</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#aa9fc825e19404ff527cb3d2dcc55ae1c">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
 </li>
-<li>global_stream_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
+<li>get_pointer_offset()
+: <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
-<li>global_stream_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
+<li>get_ptr()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a6b066568947df37094e4125b0347faf1">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+</li>
+<li>get_scalar()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a81bd7b4f50b8d7c5effe5291ad920380">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+</li>
+<li>get_threadblock_offset()
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a380fb7f905548c52933ea411166424b4">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a386e5cf702b0dcc3d57f9fdb4ab5d236">cutlass::gemm::IdentityBlockSwizzle</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#af7c1b4e0afb08e893cd14a169a0b47cd">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
+</li>
+<li>global_to_shared_stream
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a61fcc63cb0df6754eef16f5cf138f3a2">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
 </li>
 <li>GlobalFragmentC
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
@@ -134,40 +156,46 @@ $(function() {
 : <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a880878914c25db44a1781725c24af514">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 </li>
+<li>GlobalLoadIterator
+: <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+</li>
 <li>GlobalLoadIteratorA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalLoadIteratorB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalLoadIteratorC
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
-<li>GlobalLoadStream()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ab2961b4db0694cf128d55d38a98db575">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a4dd11a75375b6b9d7b8dcbd4d402d8d6">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+<li>GlobalLoadStream
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aec86bdf5d7d4ad1f7b6ebebcf2da8395">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 </li>
 <li>GlobalLoadStreamA
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalLoadStreamB
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
-<li>GlobalLoadStreamBase()
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+<li>GlobalLoadStreamPair()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab97442e24a1d6d64727b6320ab901ad1">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
 </li>
 <li>GlobalLoadTileTraits
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
@@ -175,7 +203,7 @@ $(function() {
 </li>
 <li>GlobalStoreIteratorD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
@@ -190,40 +218,45 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a738774d1eb79de7e29c372ddfd48258d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a24f38105e3c331c733cb672c3a9be588">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a66f11407e9f5bf0d6123c81dfee6b330">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a125c9a43da3bcdc00d5194a1376f613c">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>GlobalTransformerA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalTransformerB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalTransformerC
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
 <li>GlobalTransformerD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
 <li>good()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a837881bc82704491accf54aad2b9def9">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
+<li>grid
+: <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">cutlass::KernelLaunchConfiguration</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_h.html b/docs/functions_h.html
index 4c7693dbf..1185e3320 100644
--- a/docs/functions_h.html
+++ b/docs/functions_h.html
@@ -71,14 +71,23 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_h"></a>- h -</h3><ul>
+<li>h()
+: <a class="el" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
 <li>HgemmSwizzle()
 : <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ac3c52e0fee9b37a3dfc39ca168a63d36">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 </li>
+<li>hw()
+: <a class="el" href="structcutlass_1_1TileCoord.html#a0927c4ba212d00f3687034afe6bb8daf">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
+<li>hwc()
+: <a class="el" href="structcutlass_1_1TileCoord.html#a11bb7593ce7bba2dcedd199322a8b42b">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_i.html b/docs/functions_i.html
index a91cf4c4e..3167390cd 100644
--- a/docs/functions_i.html
+++ b/docs/functions_i.html
@@ -72,117 +72,136 @@ $(function() {
 
 <h3><a id="index_i"></a>- i -</h3><ul>
 <li>IdentityBlockSwizzle()
-: <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#abfde9b316173b1c0b8622cf22ffb6d68">cutlass::gemm::IdentityBlockSwizzle</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a046a5dfd01164df2abd514e9a52987c3">cutlass::gemm::IdentityBlockSwizzle</a>
 </li>
 <li>idx
-: <a class="el" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 <li>IgemmConfig
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5a52727bb9b5d5f8afa7d0384f564036">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
 <li>IgemmEpilogue()
-: <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#ab7a51121d24250d6441ee538e6521dc2">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a49ac00bed1532707aacd3ff108c84623">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a599a50becefed561d063c1b834188aca">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a0a1be1aab827127161406871ca75cbe0">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a>
 </li>
 <li>IgemmFloatToInt8Converter()
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#ac65f020e93584b1bd3cdb849ff625026">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a>
 </li>
+<li>IgemmGlobalIteratorAb()
+: <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a489fe448cd7f7e1f3805d33504f9d336">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+</li>
 <li>IgemmInt8ToFloatConverter()
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a88a55a494d3a30d50477d50bf6a8804d">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
 </li>
 <li>IgemmSwizzle()
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac041d287c966cf568599d7e462e81d5a">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 </li>
+<li>imag()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801">cutlass::platform::complex&lt; T &gt;</a>
+</li>
 <li>ImmediateOffsetStrides
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 </li>
 <li>inc_advance()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a9dea455aa86bb59517b4a4d0309e424b">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab4b8150f19c9f8649d75c69ec0a76e1a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a174ae7d8aa0664eaf1d6f63c5606baa0">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>inc_c()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a12ead84ea9634e963d10c6df7b7792c9">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a44287250bf5631a490b514859fd101d1">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>inc_d()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1e42503e5a54cdc01308e9030aebdd35">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad26ab8d8010c9a1d7f3b91f60940b460">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab1ebbe54e4315ac07daf260a88f41d04">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>inc_h()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aa24336597f4a3316d94df6ab0c20f714">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ae07fa10a53d44471a04275145201299e">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa9a733f35e9be67663c9c8f80b0034d4">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>inc_stage()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8851150a49e4a9c135279c8c9dfdc592">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a187e0852ec4862f6d3cb6249bedc3bb3">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad4b9b1c1fe4b0c6961842d0eff6d7db7">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ad61206a742c8c5ab5bcd64b76ece9f74">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>inc_w()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a622a4dd27162854ec96efea93cdd4380">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aec2d692967d9be5d42673dfde21f5427">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>increment()
+: <a class="el" href="classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>Index
-: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5ac2280dfcac08cec17b8c0db1c4593e">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ab12d9d196122dc3075185ab239a27fb4">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a5a3f096a01e6a2dfe984d7e605380599">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">cutlass::TileCoord&lt; Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aae07fdedeef68abd4e6c099924c70910">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>initialize()
-: <a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html#ac00c9d78a187d9c7d53399f971c0e129">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a3e9d0fd2989fea776b0cab0e0f2813ce">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#a73091e07b6d4c99f6e0319fbf6bd1709">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#af5a496f1b6a46ea6a9894512029add6a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a13395bf81eabdc539c935e179c31d7ca">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#ad0602cf5d322e98e3e5990c84ae1e3f3">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a7c7e448384156c801ed362359a1a6a40">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a054aee5b4bf288cc1f5945f2521ef835">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ad4089906220d4656ba075fb9afd1012c">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ad1b2291b898091ee1966b73bd1ad56fa">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#ad6b65c5f3ed7cd9e7ffeb684cbf30d04">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a71f5238a712f7b2f377fb58938ac829b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a98867f4fc4daf790e309f8365e71cc8f">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a23c9e9d1d2bed7e5d8579df9cc42dda3">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>initialize_predicates()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#af92ba20db048a9ec96976a1673f0f7c2">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a890a7239a89679662aeaea797ba32d32">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a8f334010614b50d962e4769904d7b76f">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>InputFragment
 : <a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a>
@@ -191,14 +210,23 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
 </li>
 <li>InstructionShape
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ab16a3d8adda89cc4f9765116ea75a4b7">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa56cdefa659af5ce4efd493b94bafdfd">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad73372a37315b0c17a8db21e40a78574">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+</li>
+<li>intermediate_fragment()
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>is_pointer()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a95373f3d1b286c61cb204ba6a1282ce0">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
 </li>
 <li>is_zero()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
@@ -213,54 +241,70 @@ $(function() {
 , <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#aa9b46937bea47d071d277aa212dd610b">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a9fb4b56091d4458ebd82130bc3951e5b">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a2dc8573498bcda33273b86db76dbd511">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ae1d930fa295d8ddfaa10bda5978258de">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a552a67fb03c28e985d143f6193f88308">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a8628ea7116f736b59c644fc0d85d395f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
 <li>IterationsStrides
-: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-</li>
-<li>iterator
-: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 </li>
 <li>Iterator
 : <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>iterator
-: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>
 </li>
-<li>Iterator()
-: <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
+<li>Iterator
+: <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a1f2314aa062360b249b7c57c39af5430">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a0ba9097d54f3ba7b7dab12012631fa76">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
+</li>
+<li>iterator
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>Iterator
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>iterator
+: <a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>Iterator
+: <a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>iterator
+: <a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a>
 </li>
 <li>iterator_c
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 <li>iterator_d
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_k.html b/docs/functions_k.html
index 1aab81d80..6dc0fcc70 100644
--- a/docs/functions_k.html
+++ b/docs/functions_k.html
@@ -71,9 +71,8 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_k"></a>- k -</h3><ul>
-<li>k
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ac789a7e5d2db65d006f1e8e3df542a6f">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aae3a008b39f9678a03192f6ff54152d8">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
+<li>k()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">cutlass::gemm::GemmCoord</a>
 </li>
 <li>kA
 : <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand</a>
@@ -86,33 +85,59 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a0a494c2eacb51b65487f8405908a0214">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraitsStandard.html#a5e04777205c7a292602880c59d6b43c8">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a>
 </li>
 <li>kAccumulatorsPerLdsA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kAccumulatorsPerLdsB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kAdvance
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a8059c57030df99b73309e9210ec5f624">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a44200854ad5b35c1863f73c435b8750b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>kAlignment
+: <a class="el" href="structcutlass_1_1Fragment.html#a84b6d68a5a24dbd04d842e0755b42bda">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
 </li>
 <li>kB
 : <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand</a>
 </li>
+<li>kBatch
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad7b490ce2150e54fccad6b0f11932382">cutlass::gemm::GemmCoord</a>
+</li>
+<li>kBlockColumns
+: <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+</li>
+<li>kBlockRows
+: <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+</li>
 <li>kBytes
 : <a class="el" href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
 <li>kC
 : <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand</a>
 , <a class="el" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a8236879e1670072033983b7ec4b7ae32">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
+<li>kColumn
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a1e096b25138e027c31ea8624729ec433">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#adb3b8cccf1ac91265fff998a3d48f5e7">cutlass::MatrixLayout::ContiguousLayout</a>
 </li>
 <li>kColumnMajor
 : <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout</a>
 </li>
+<li>kConjugate
+: <a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683">cutlass::MatrixTransform</a>
+</li>
 <li>kCount
 : <a class="el" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">cutlass::ShapeCount&lt; Shape &gt;</a>
 </li>
@@ -120,6 +145,7 @@ $(function() {
 : <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe">cutlass::GemmOperand</a>
 , <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5">cutlass::IteratorAdvance</a>
 , <a class="el" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ab5ebf352327baadcc740175d6b39adcb">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>kDhw
 : <a class="el" href="structcutlass_1_1ShapeCount.html#af7d7ccd42de2c49fe57f03cf0e657fe8">cutlass::ShapeCount&lt; Shape &gt;</a>
@@ -134,12 +160,23 @@ $(function() {
 : <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 </li>
+<li>KernelClass
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
+</li>
+<li>KernelLaunchConfiguration()
+: <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">cutlass::KernelLaunchConfiguration</a>
+</li>
 <li>kExtent
 : <a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html#a881f84951bc9e47ab2be9ef3f2c1e423">cutlass::gemm::GetExtent&lt; GemmOperand::kA, Tile_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html#a82ff9b447e4a58164b5f7d53d2602930">cutlass::gemm::GetExtent&lt; GemmOperand::kB, Tile_ &gt;</a>
 </li>
+<li>kFragmentElementType
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
 <li>kFragmentSize
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>kGeneric
 : <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">cutlass::MemorySpace</a>
@@ -150,6 +187,7 @@ $(function() {
 <li>kH
 : <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance</a>
 , <a class="el" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a24d32587359493bb965745f5551e1624">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>kHw
 : <a class="el" href="structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f">cutlass::ShapeCount&lt; Shape &gt;</a>
@@ -158,16 +196,22 @@ $(function() {
 : <a class="el" href="structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742">cutlass::ShapeCount&lt; Shape &gt;</a>
 </li>
 <li>Kind
-: <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand</a>
+: <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">cutlass::FragmentElementType</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8">cutlass::gemm::swizzleDirection</a>
+, <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand</a>
 , <a class="el" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375">cutlass::Identity</a>
 , <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">cutlass::IteratorAdvance</a>
-, <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">cutlass::IteratorFragment</a>
 , <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout</a>
+, <a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48">cutlass::MatrixTransform</a>
 , <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace</a>
 </li>
 <li>kInt8Output
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4">cutlass::gemm::IgemmEpilogueTraits&lt; IgemmConfig_, EpilogueFunctor_, Index_, Helper_ &gt;</a>
 </li>
+<li>kInterleave
+: <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a>
+</li>
 <li>kIterationsD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 </li>
@@ -177,21 +221,26 @@ $(function() {
 <li>kIterationsInHPerWarp
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 </li>
-<li>kIteratorFragment
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a94c0567316118abfb84fc28560a5a46a">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+<li>kK
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a521d4b8e720d2261c825e05397c92a5e">cutlass::gemm::GemmCoord</a>
 </li>
 <li>kKstrided
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">cutlass::gemm::GemmMultiplicandTraits&lt; ThreadBlockTile_, Usage, Layout &gt;</a>
 </li>
 <li>kLanes
 : <a class="el" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
-, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a4020f25408022dbf20c26ed4fa8c7dffa14befaa9d739f1b754bc372f717b105b">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393">cutlass::Vector&lt; half, 1 &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a322ddd3ec1f47b76e21c24d3a3c44c5badeba151dbcb3c15e581bad7d767a93fa">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a9aacb7538f1b83762d68c768629c98eba17b71e816051646b567cf47334649a9b">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">cutlass::VectorTraits&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aca745b59c6c21292f119943e5a480f39">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a43ac200035052a2c352c8c4b84aac73c">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a>
 </li>
+<li>kLaunchBounds
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+</li>
 <li>kLayout
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
@@ -201,7 +250,9 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a32729d0fad10fcbbcf2643a2fa5671d6">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a11026d05b2b32f1373020c049f2cfa66">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>kLayoutA
@@ -210,6 +261,12 @@ $(function() {
 <li>kLayoutB
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 </li>
+<li>km()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad6c884a5bb6e5edaf371e8af10df367d">cutlass::gemm::GemmCoord</a>
+</li>
+<li>kM
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#af1f5c03c35eaa406c6a63082da26bec3">cutlass::gemm::GemmCoord</a>
+</li>
 <li>kMemorySpace
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
@@ -218,14 +275,27 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#adaebec9eacf767f63f048033de73ea5b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>kn()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a16501265d58ddaca0e2d9bb4e21d66ea">cutlass::gemm::GemmCoord</a>
+</li>
+<li>kN
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a67f08a03dabee497fa5547cff0f1faea">cutlass::gemm::GemmCoord</a>
+</li>
+<li>knm()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a4062c040208868c75dbc6ba18910bffb">cutlass::gemm::GemmCoord</a>
+</li>
+<li>kNone
+: <a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5">cutlass::MatrixTransform</a>
 </li>
 <li>kOperand
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 </li>
 <li>kPredicates
 : <a class="el" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
@@ -236,54 +306,71 @@ $(function() {
 <li>kPredicateStart
 : <a class="el" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
+<li>kRank
+: <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
 <li>kRequiresLoadFence
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>kResidueInProlog
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+</li>
+<li>kResidueSeparate
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+</li>
+<li>kRow
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a5149f4a37407746407251efc0779bb53">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#ae97a9ba9d5045bef258d8994eb732256">cutlass::MatrixLayout::ContiguousLayout</a>
 </li>
 <li>kRowMajor
 : <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout</a>
 </li>
 <li>kScalar
-: <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954">cutlass::IteratorFragment</a>
+: <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">cutlass::FragmentElementType</a>
 </li>
 <li>kScalarsIn4B
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 </li>
 <li>kScalarsPerLdgA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdgB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdgC
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdsA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdsB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdsD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerRow
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 </li>
 <li>kScalarsPerStgD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerStsA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ae396f7301f934c179e054f68f0420edf">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a69775031f651795f697b628677b8e4eb">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aedb61c43d8fb9c4ba18ae72601b9f6e1">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>kScalarsPerStsB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a47d99d98c783cf1d317698bd465ffa9a">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aaa3228d45ff4428bba0f88a7a6e8b31b">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a8a6cef5e733eab9c0ead20b1e345ad6f">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>kScalarsPerStsD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerThread
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
@@ -300,15 +387,39 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aba6decf87d770becaadd610d9fc27491">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 </li>
+<li>kSkewA
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9c296924f9a6c6908f09830bbbf6a775">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac8da30393042cf6e785bdd54b11d9408">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+</li>
+<li>kSkewB
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab35a6b3ff04e4128e4ca4a8cc0459b16">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a6d0f50e83067373b249b38444eb7fe65">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
+</li>
+<li>kSplitK
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
+</li>
 <li>kStages
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+</li>
+<li>kStorageRank
+: <a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html#ac609498e7fe858b4fb3791d1039438f4">cutlass::IdentityTensorMapFunc&lt; Rank &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70">cutlass::MatrixLayout::ColumnMajor</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">cutlass::MatrixLayout::ContiguousLayout</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30">cutlass::MatrixLayout::RowMajor</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>kStrideH
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
 </li>
 <li>kThreads
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
@@ -327,19 +438,29 @@ $(function() {
 : <a class="el" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">cutlass::Extent&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a10f7184a9a50de0268efa45dab5dc304">cutlass::Extent&lt; Vector&lt; T, Lanes &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a87917a6dfbb1662416c4ea4831669aaf">cutlass::Extent&lt; Vector&lt; T, Lanes &gt; const &gt;</a>
+, <a class="el" href="structcutlass_1_1Max.html#a6ed8be7ed855eea8f8d08921f7b5d763">cutlass::Max&lt; A, B &gt;</a>
+, <a class="el" href="structcutlass_1_1Min.html#a97e6dd3ff6fb5404e8a6e6109f73f429">cutlass::Min&lt; A, B &gt;</a>
 </li>
 <li>kVectorSize
 : <a class="el" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
-, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d">cutlass::Vector&lt; half, 1 &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 </li>
 <li>kW
 : <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">cutlass::IteratorAdvance</a>
 , <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ac2c14af3ceffd5ef8f17c9e0efb4e5ec">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>kWarpCount
 : <a class="el" href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
+<li>kWarpGemmSteps
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+</li>
 <li>kWarps
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
@@ -348,7 +469,7 @@ $(function() {
 : <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
 <li>kWarpSize
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
@@ -359,7 +480,7 @@ $(function() {
 : <a class="el" href="structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276">cutlass::ShapeCount&lt; Shape &gt;</a>
 </li>
 <li>kWmmaMatrix
-: <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">cutlass::IteratorFragment</a>
+: <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">cutlass::FragmentElementType</a>
 </li>
 <li>kWordCount
 : <a class="el" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
@@ -368,7 +489,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_l.html b/docs/functions_l.html
index 441d9d32e..3731f4576 100644
--- a/docs/functions_l.html
+++ b/docs/functions_l.html
@@ -74,51 +74,70 @@ $(function() {
 <li>launch()
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 </li>
-<li>lda
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>ldb
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>ldc
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>ldd
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
+<li>Launch()
+: <a class="el" href="structcutlass_1_1gemm_1_1Launch.html#a8552a524b9419f60bf8ef3c6b8528d27">cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#ab7a89806834a5fa8022daae4180e6180">cutlass::gemm::Launch&lt; Gemm, false &gt;</a>
 </li>
 <li>leading_dim()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6c580a451a36143d1eb0e409e7b13e33">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
 </li>
 <li>LinearScaling()
-: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a34df6970f033b3090ad8f4d40063b1b2">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
 </li>
-<li>load()
-: <a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html#a014682b143bce65667075ea15fad184d">cutlass::FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html#a01a847858cb330d7d109ddee228e96ce">cutlass::FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#aea5ed35a44624684ffa9ada9d09a8893">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>
-, <a class="el" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a7ba77016bee8e941f7831cc9fbfa994d">cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a4ee00178c441bdf4d4a1f8cf984bc03f">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#aa9d5e227ea20ad3c6952f296016ec167">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a0e58d26dd68aabb6cb9678f5656c7e6f">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+<li>LinearScalingDevicePtr()
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a9dcb15bbcf3785280fd5cea0e0da5602">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+</li>
+<li>load
+: <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>
+, <a class="el" href="structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a7d9027453aa78d4448d70dc44307791e">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a4bab8959d29ee868fb6b3e1f9abc04fc">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a7d3d3e156dc527f9c00acc7a66d21326">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#a2e906364a0631c2c9f97acd0ae4a1873">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#afee69b86f070e3badc75ab00bcc5996b">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a854c684b3f6c1a10b6e8fcf7967f6642">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#a619f643794f51b35f3c0a1011ba00bbd">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#abc4f879290c847a6e73dc9e68a340f74">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#af587adae1103b4242e0d56eb902f9302">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a23b72b086f350dfe07cff22ac010c45c">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>load_element()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a5cbda0dea8c87ca55499c97cc80b1ccf">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a109209936a9453e8f1f3f5eecfd6afca">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>load_iterator
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a42ffcba6af2b5ddfb1f4825a34d43532">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
-, <a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a3be938f8661f9cd10966866b7b80b471">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
 </li>
 <li>load_post_increment()
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae2febd768cbbfb8aab3c2cb669c0505d">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a53045f40d203a805af9c92fa0b5bc684">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>LoadIterator
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+</li>
+<li>LongIndex
+: <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa3df5b7337d41d8f96717ea73bf3e24e">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_m.html b/docs/functions_m.html
index 1a9fe8095..32e299e61 100644
--- a/docs/functions_m.html
+++ b/docs/functions_m.html
@@ -71,14 +71,33 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_m"></a>- m -</h3><ul>
-<li>m
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a5c2b3e75cb6873762ba3f85487b78579">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aaf27c0f2f4ab730ed5c865e9f7d2373b">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
+<li>m()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">cutlass::gemm::GemmCoord</a>
 </li>
 <li>main_loop
 : <a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage</a>
 </li>
+<li>map()
+: <a class="el" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a215f63b5a1b3799654c5670ef108fcfb">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
+<li>MapFunc
+: <a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
+<li>mask_
+: <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+</li>
+<li>MatrixCoord()
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">cutlass::MatrixCoord</a>
+</li>
+<li>move_to_residue()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac269a9280a55d3988ca60f571bdf7f29">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab94c0c95d6d4e019563ba8a142f9d410">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+</li>
+<li>multiplicand_bounds
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+</li>
 <li>MultiplicandTraits
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 </li>
@@ -86,34 +105,38 @@ $(function() {
 : <a class="el" href="structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597">cutlass::Identity</a>
 </li>
 <li>multiply()
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a522301fbe3e276cb5ef9fbe75bb2ab50">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ae62d61ec068ac958753d0a2f5a99d8e2">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a934c0d74c70fc87796ecb5cde50fd516">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a6bed70e7074931419e9441688aee00ea">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
 </li>
 <li>multiply_add()
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a34bbf209967fef6181d3d46dd27fa0c0">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a89c8b663af69f13c2a02cb464b5172a5">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aafa37c2e1ffd2f7d7031c24c732157d8">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a92edee5611d25b60cdab6a1c8e32141f">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5dcf66c8126ec8adf8e66d4bf5b2f347">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a66486d38349fa20eb065ae9542eb43aa">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad22dd143c304c22c2630aedbfd3459af">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7989d48e4c2e16b7804b813630f347cb">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#ae0ea662652907b60140598dad777c5ab">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aaf8ea4aaf393488f03ba7fb7af264940">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ad9d8e47e8896d8d4eab538aa78b56e47">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>MultiplyAdd
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 </li>
 <li>MultiplyAddScalar
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_n.html b/docs/functions_n.html
index bff5fbb32..73a3906dc 100644
--- a/docs/functions_n.html
+++ b/docs/functions_n.html
@@ -72,12 +72,13 @@ $(function() {
 
 <h3><a id="index_n"></a>- n -</h3><ul>
 <li>N
-: <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
-<li>n
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a437d4b6f1f149849c5ae635a5993e7ac">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
+<li>n()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">cutlass::gemm::GemmCoord</a>
+</li>
+<li>nm()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac4550a7e80e1f0265eacecebe54794d9">cutlass::gemm::GemmCoord</a>
 </li>
 <li>no
 : <a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;</a>
@@ -86,7 +87,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_o.html b/docs/functions_o.html
index b79e0bd1b..589b20ce5 100644
--- a/docs/functions_o.html
+++ b/docs/functions_o.html
@@ -72,11 +72,21 @@ $(function() {
 
 <h3><a id="index_o"></a>- o -</h3><ul>
 <li>offset()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a064f3630e69798e7915f910c4ee99ab7">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a07c7f56e724cfbc844777e8ee9f616b5">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
 </li>
 <li>Offset_t
-: <a class="el" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>offset_to_residue
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
+</li>
+<li>OneDirection
+: <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5">cutlass::gemm::swizzleDirection</a>
+</li>
+<li>operator()
+: <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
 </li>
 <li>operator &amp;=()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
@@ -85,16 +95,29 @@ $(function() {
 : <a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8d100273203db9018dffbbe84e0b6c76">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;::dummy&lt; B, D &gt;</a>
 </li>
 <li>operator bool()
-: <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
+</li>
+<li>operator cuDoubleComplex()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#a3b92e54de1c4262c7e481218162be7ec">cutlass::platform::complex&lt; T &gt;</a>
+</li>
+<li>operator cuFloatComplex()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#ac5a3a0dc9815dadbe539312eb6fe36c4">cutlass::platform::complex&lt; T &gt;</a>
 </li>
 <li>operator D*()
 : <a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8aadc500baf1492b1a4d05cc8b35fc13">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;::dummy&lt; B, D &gt;</a>
 </li>
+<li>operator Scalar()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a896f35e776c1291ceda0f432cc3da654">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+</li>
 <li>operator value_type()
 : <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#a55d25116387f1c6d978462b1d245d675">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
 </li>
+<li>operator!()
+: <a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+</li>
 <li>operator!=()
-: <a class="el" href="structcutlass_1_1Coord.html#a7fb46873e8f3cf38212703d35bd36995">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 </li>
@@ -108,78 +131,154 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html#a1228edf6cc0f81af520dc77c8792b94c">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#a80562f5ceab2049c3b7834c2891a07ee">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a>
+, <a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html#a3922130841c34d3ce8c112ee6fae4ca1">cutlass::IdentityTensorMapFunc&lt; Rank &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#af51e07c6605524581e5d27d290c8b8d2">cutlass::MatrixLayout::ColumnMajor</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a24c06bb7e64a8015ac528b3ae954a689">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dbf79e5df5bcf52d54a699d2587319d">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a512248a443c5914fab6aeabc4a73978e">cutlass::MatrixLayout::ContiguousLayout</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a736620aef395e4224d7aae098573aa34">cutlass::MatrixLayout::RowMajor</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#abde0a4a7c487da0c78ea2519323c04af">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a5199cb7f7c10f6123c63703453b7937c">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15">cutlass::platform::default_delete&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87">cutlass::platform::default_delete&lt; T[]&gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978">cutlass::platform::greater&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5">cutlass::platform::less&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c">cutlass::platform::plus&lt; T &gt;</a>
+, <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#a084c0a2732827a74f7a30873c5883827">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a>
 , <a class="el" href="structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2">cutlass::TiledThreadOffset&lt; ThreadShape &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;::ThreadOffset</a>
 </li>
 <li>operator*()
-: <a class="el" href="structcutlass_1_1Coord.html#a8e4f7df55a75d040cf50cf9984c04c8a">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5a158b5f3c0b1779972b25aa52be1164">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#ac68a57c17811b0a04dc6fb21423ab226">cutlass::MatrixCoord</a>
 , <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 , <a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ab8fbb13cc5ea4f580a7fc32963de9553">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator*=()
-: <a class="el" href="structcutlass_1_1Coord.html#a282b6cc9ac8b2f72720c252791155aad">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a69fb0bb5e73f35d3c8df71a0174d6520">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a5fd3c3b58af1147a5c73657c05a16f5b">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ae946b3af6b795d26632da7ca66b3751c">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator+()
-: <a class="el" href="structcutlass_1_1Coord.html#a3dfc4ce4191097b6c3268696f2a45ef5">cutlass::Coord&lt; N_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a675efbb9ed360888faf3c333708ae4d5">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a25236953237f965965b1c9b7a04ba26e">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ad054f14b5580c9480d671b8fc8ef016a">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a9fcd43018e60f12cb328859c76ec7891">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a1d48f4fea3fa85a7bf1b26b421387afd">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#aa2390d8e127a51df239affd2ca36e97a">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a3bfa2daa0e63144c1e8510ba336f185b">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator++()
 : <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 , <a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a8ce80124ab0f4ab9981f1a4d64d976a5">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a3481d6f41defd25ab574bb19ee5fe424">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a47d270fc4a119d7b95b2d5dd3ee5b87b">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>operator+=()
-: <a class="el" href="structcutlass_1_1Coord.html#aeb209486943fa9d42911325b16e49e09">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5465f7308778eac5d14d8020179a65e0">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a8e79a153de72eef10d90bfd02b5dd27e">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a769813dcffe1767aab49ac30b838a5f4">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#ad105615dbf7ede75caa0e778c873bd06">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0753aeb57365a976bc0a88481af504cb">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a22b87d281057c8e03b80db7046c54dd8">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab07a5d1a4ec6d96ec53e868b3a6d7cae">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a4fa8fa35d00eb4d0097da492c738cddc">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a812760c633ea813db8a2bc24826c68df">cutlass::TileCoord&lt; Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a57b284e6cbff892d45e5cfeb0ae1e3ed">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a60ba516d7382cb7788d5430023f7fc44">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>operator-()
-: <a class="el" href="structcutlass_1_1Coord.html#acc510511ffb52bed7f6a52f14b99750d">cutlass::Coord&lt; N_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a762fd45e61477d700c82bfd67443c6f9">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#aa462303d75a5d98b680b6e20080ce877">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#afde28cda18918d3e177d3e5024ed3dd4">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a143ec893406d930aa4c5aa860052197e">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad1d8099e8d63b6d88c53738ec68a7589">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a1e4b2bb02c5843898f72f62787403add">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a9f274d8e93f9cd3e0a9699e11b85fa7c">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator--()
 : <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
-, <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
+, <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a0f395558e2c589ac48179447a23b59d8">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad5290f0e7814892cb4fff55e9518562b">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a3d22dab34b2abd0d05c00668f8591151">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>operator-=()
-: <a class="el" href="structcutlass_1_1Coord.html#ac1795ec2a5890d8a39840567a4bea88e">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a12ba250be3d5474b7c6fc4eddd4f58d5">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a6feef48cf24733d22ca53a27cbc33ac0">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a11964d045ac8e41c80026515adb03008">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ae3561f863072cd7be7dcdee2cb5cc1f0">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ac4018b51e78842fb252d6917738fa571">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#abc088fad6debb6a0ceb04c5d2767e81b">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a02da20e580962fe0754a772842045389">cutlass::TileCoord&lt; Index_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a7bae0f9b789e75bb154c5f37db50e14c">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>operator-&gt;()
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
 <li>operator/()
-: <a class="el" href="structcutlass_1_1Coord.html#a87f485be079fa68bcf576da4d56f0ece">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a41770bb99f02f4debbafe95e019ce02b">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#aa89b196410d25d8c9ed3746fb6833374">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a5d2cc915343a3b90fb530348ddd329d2">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>operator/=()
-: <a class="el" href="structcutlass_1_1Coord.html#abe91e59962ef0d73aec9c14824f64ecc">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#aac1e1bad751237fd76d32a1ea10f6c40">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#aab345c8ddb8048bfe3d667bc7ce6522f">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ac3207d8aa879c86a907cdcc93ccb2eb5">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
+<li>operator&lt;()
+: <a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+</li>
+<li>operator&lt;=()
+: <a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 <li>operator=()
-: <a class="el" href="classcutlass_1_1TensorView.html#aa9e9e19f35ce3111f64b763ca49b51ef">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b29491782c3a129355fa4ef159cb970">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#acf0c156efb9197bc7538f7e9057d8a68">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>operator==()
-: <a class="el" href="structcutlass_1_1Coord.html#acfa94aabd0c9a71ee994ca479d5f515f">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
 </li>
 <li>operator[]()
-: <a class="el" href="structcutlass_1_1Coord.html#ab7fc89de3ccd7096ab275fb5dd40104c">cutlass::Coord&lt; N_ &gt;</a>
-, <a class="el" href="structcutlass_1_1Fragment.html#a75f51bb6ca84615076aab42ac9d42592">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#af16f2aa14ff424b038a393b683c4783e">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentIterator.html#a83bb6a3ed588e2d890bf986665d2b7bb">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Fragment.html#a77ba7cddf7822d64534b019c4ad9732e">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a6216b58ffe6322f037f1e0a3ffa714c8">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentIterator.html#ad665745f3d6a3a88d7894fe0fc1bbd3e">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a7fe7e44e15fd1ac58fb55edf72e8fb23">cutlass::TensorView&lt; T &gt;</a>
-, <a class="el" href="unioncutlass_1_1Vector.html#a250860c921c94a6077344f9e11bf5b02">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
-, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a8ade80e040264fbd669d3f15c249884e">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a57f132816e51bbdb4c807d57c067b619">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector.html#a69be4f85c1dac371fa6f1c6747724adc">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a8eda6e6181a5333ca8350977374708cb">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1e6568c0f3f958db739074ab6978ff10">cutlass::Vector&lt; half, 1 &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ad50b5d4acbd7ead82c128091c9db9113">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2d5ec0b76daa136dae0b4aec1edf9e0b">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#ae2215fe7c2c223175b4172d73a6c7a82">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 </li>
 <li>operator|=()
 : <a class="el" href="structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
@@ -191,11 +290,12 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
 </li>
 <li>OutputTile
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
@@ -205,7 +305,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_p.html b/docs/functions_p.html
index 9131d0117..775292246 100644
--- a/docs/functions_p.html
+++ b/docs/functions_p.html
@@ -71,6 +71,9 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_p"></a>- p -</h3><ul>
+<li>Params
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+</li>
 <li>params
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 </li>
@@ -81,9 +84,35 @@ $(function() {
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+</li>
+<li>Params()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#afb39229d0ad334834cd2ba0c1fcc9412">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a>
+</li>
+<li>params
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+</li>
+<li>Params()
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ae515cd98a75ff3eafffcc69692d6301a">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae28323819fc8950bc0fee3a34b2184ff">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+</li>
+<li>params
+: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>Params()
+: <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a90772ac34f8c49f049eb62fada0a2165">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>
+</li>
+<li>params
+: <a class="el" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>Params()
+: <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a79304c022d2466c97cd671a98128815a">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#adfa2399bf13cdff16b7bfe1cb0dd2bd9">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a4ed93b5319fe96457caf53e9384722d4">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a>
 </li>
 <li>pointer
 : <a class="el" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
@@ -99,40 +128,49 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
-</li>
-<li>pointer
-: <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-</li>
-<li>Pointer
-: <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>pointer
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>Pointer
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>pointer
-: <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+</li>
+<li>Pointer
+: <a class="el" href="structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>pointers
+: <a class="el" href="structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>predicate_inc_advance
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
 </li>
 <li>predicate_inc_h
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
 </li>
 <li>predicate_offset
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
+</li>
+<li>PredicatedTileLoadStream()
+: <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a672a8883d16eff4ecc90dc79162084d3">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+</li>
+<li>PredicatedTileStoreStream()
+: <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ac4aafc6bcc6cf3bff5b31b9cd60fd667">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+</li>
+<li>PredicateFunctor
+: <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
 </li>
 <li>predicates
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
 </li>
 <li>PredicateTileAdapter()
 : <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
@@ -142,9 +180,15 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5aa507eaeb63951f8e69fb223ec41809">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a6157fe8a2ffefd45eba6f3953f0e2994">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>problem_size
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
 </li>
 <li>project()
 : <a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html#ae91b2350374f1734a30cbed45e14b8e3">cutlass::gemm::ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;</a>
@@ -152,11 +196,14 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250">cutlass::gemm::ProjectOperand&lt; GemmOperand::kC, true &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1">cutlass::gemm::ProjectOperand&lt; GemmOperand::kD, true &gt;</a>
 </li>
+<li>project_coordinate()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_r.html b/docs/functions_r.html
index 79d3a2e97..335de8ee2 100644
--- a/docs/functions_r.html
+++ b/docs/functions_r.html
@@ -72,34 +72,59 @@ $(function() {
 
 <h3><a id="index_r"></a>- r -</h3><ul>
 <li>Rank
-: <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a233fba9abdbbd0fe3a2cc7465ea76a41">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a8dbb7043546fae133547d2c3e46dddab">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>real()
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974">cutlass::platform::complex&lt; T &gt;</a>
 </li>
 <li>ref()
-: <a class="el" href="classcutlass_1_1TensorView.html#a5cbff89d3d8dc71d27a4d6c1d7abb58a">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a7e2beb56a3bc2d58c9ec65467b78c4f3">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>reference()
+: <a class="el" href="structcutlass_1_1TileAllocation.html#afcdc0be82acf0b4ae66468e2170c5a0d">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a0d00001220df7f2bdb1f09ae3f37c585">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
 </li>
 <li>registers
 : <a class="el" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#af27a36f604513f05aebe0624a9c539ab">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ace5e03860b434b2d2a4590bd2bc8c147">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a15d5103e46d53e030100dedaecb0220a">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
+</li>
+<li>RegularTilePredicateFunctor()
+: <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#a0e0b728d3685097a9280fbca6a47a2af">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a>
 </li>
 <li>release()
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
 <li>reset()
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a8b1785a1ea5d7aa7eba8e45297d539d3">cutlass::TensorView&lt; T &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a1043f0ef382179b8ecd9f4e710f6e106">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#ae142eb93cf91e000b635d32fcacf1db3">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>residue()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aab37ea6c47e34466371314ed3971dc7b">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a405b93680bb6e356369863244d0b56aa">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+</li>
+<li>rollback()
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1e2eecdba1871fc11aa43a06edf6ed34">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6a9287a2cd87ca8a96cbf6b6d29199da">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+</li>
+<li>row()
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">cutlass::MatrixCoord</a>
+</li>
+<li>RowMajorBlockSwizzle()
+: <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a4ed7847f8ddad11a6765d914b6f32fcd">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_s.html b/docs/functions_s.html
index 0f0af76a3..749e7c4f8 100644
--- a/docs/functions_s.html
+++ b/docs/functions_s.html
@@ -72,8 +72,9 @@ $(function() {
 
 <h3><a id="index_s"></a>- s -</h3><ul>
 <li>Scalar
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
@@ -88,67 +89,120 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317">cutlass::gemm::IgemmEpilogueScalar&lt; ScalarD_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650">cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">cutlass::Vector&lt; half, 1 &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599">cutlass::VectorTraits&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a>
 </li>
 <li>ScalarA
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a366083b229b28e7f44da38273b2ab263">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a236a408791a38358cbadf19dd0e8ed9f">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aeef5fa0437b4ce1c2e8ac4bc7e062b65">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+</li>
+<li>ScalarAccum
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+</li>
+<li>ScalarAlphaBeta
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
 </li>
 <li>ScalarB
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af52ec4b92a3e788169764014aebb85a1">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac7557562de1108bf1abc10829c83e88f">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aaf9e4b8b16150a6ad826c228af2bf103">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>ScalarC
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af553be8ef0b4dc9bb593d98dfce8628d">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af1a6d91d4734683ea791bf57f3c3bbb0">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#acdd554e996a712ff62eb70d6ecf8e116">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>ScalarD
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 </li>
 <li>ScalarEpilogue
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 </li>
+<li>ScalarIO()
+: <a class="el" href="structcutlass_1_1ScalarIO.html#ad4166575521254088bf6c6300c351714">cutlass::ScalarIO&lt; T &gt;</a>
+</li>
+<li>ScalarOrPointer()
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a45cf72b3f0e3408a4b51990b648b71ee">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+</li>
 <li>scalars
 : <a class="el" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a81709dacea12d6bd3bb328a3f0a519b0">cutlass::Vector&lt; half, 1 &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3">cutlass::Vector&lt; half, kLanes_ &gt;</a>
 </li>
+<li>second
+: <a class="el" href="structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+</li>
+<li>Second
+: <a class="el" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+</li>
+<li>second
+: <a class="el" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+</li>
+<li>Second
+: <a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+</li>
+<li>second
+: <a class="el" href="structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+</li>
+<li>Second
+: <a class="el" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+</li>
+<li>second
+: <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+</li>
+<li>Second
+: <a class="el" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+</li>
+<li>second
+: <a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>Second
+: <a class="el" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
 <li>set()
 : <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#aeda47efdda0387f9c3c7b31f836afca5">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 , <a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aadfd039b5622098c9e46706a27122575">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a>
@@ -158,22 +212,21 @@ $(function() {
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e">cutlass::gemm::GemmMultiplicandTraits&lt; ThreadBlockTile_, Usage, Layout &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71">cutlass::ShapeAdd&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">cutlass::ShapeDiv&lt; A_, B_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">cutlass::ShapeDivCeiling&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">cutlass::ShapeMax&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">cutlass::ShapeMin&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">cutlass::ShapeMul&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29">cutlass::ShapeScale&lt; A_, kScale_ &gt;</a>
-, <a class="el" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">cutlass::ShapeStrides&lt; Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">cutlass::ShapeStrides&lt; Shape_, elementsPerAccess &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9">cutlass::ShapeSub&lt; A_, B_ &gt;</a>
-</li>
-<li>shared
-: <a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#afabd328b106d45b156200f73942d211e">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStream_, SharedLoadStream_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
 </li>
 <li>shared_load_fence()
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 </li>
-<li>shared_load_iterator_d
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a1742e43c128665f0ca39cb578291df81">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+<li>shared_load_stream_d
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a5d3d1abd85f18476a74bcf616a717f9d">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 <li>shared_storage
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
@@ -184,198 +237,253 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 </li>
 <li>shared_store_iterator_d
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#af79a0c74a4c30ccec59b393721b5dfc1">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adfdf3eca06ea4061fbfe016336a3f276">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 <li>shared_stream
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#ae63b5a52106dbd37ea304196335ec210">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a>
-</li>
-<li>shared_stream_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
-</li>
-<li>shared_stream_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a50e9cc382a32abd5beab299a79b30b27">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
 </li>
 <li>SharedLoadIteratorA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedLoadIteratorB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedLoadIteratorD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
 <li>SharedLoadStream()
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a49315aea1c54d84ff19b0ac215128b95">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>SharedLoadStreamA
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedLoadStreamB
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
-<li>SharedLoadTileTraits
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a458cbcc16fc296d024f2a1a95fb926c1">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af1bc7f7c26db3399201cd95f35a56790">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+<li>SharedLoadStreamD
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
-<li>SharedLoadTransformerD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+<li>SharedLoadTileTraits
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>SharedStorage
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>SharedStoreFragmentD
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
 <li>SharedStoreIteratorA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedStoreIteratorB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedStoreIteratorD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
-<li>SharedStoreStorage
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
-</li>
-<li>SharedStoreStorageA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-</li>
-<li>SharedStoreStorageB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-</li>
 <li>SharedStoreTileTraits
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a2aad3b2454d956f20dac1bb0ad75a2f8">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab1ae3d51f65f7af60147da1c51a7a0c2">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a7624585480f83a46725c92b5dee20ebc">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aca6118b5bbe6f667f05c53bd52543045">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aa21c231aa56c9e5f2705cac62b17bbbe">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a872dc2d0b8ed6c75c41d258a23183861">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>SharedStoreTransformerD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
+<li>SharedStream
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
+</li>
+<li>SharedStreamPair()
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a0b69ca0b37dad32ba25c7f7e71a3dcc1">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+</li>
 <li>size()
-: <a class="el" href="classcutlass_1_1TensorView.html#a6218d8555679966eab784a6bb1fa4ed1">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a3778dc1c62a27ed811f1bb82a420096e">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>Skew
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a57348779bb004ed1ea0fd9cc252e895d">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a18248da35dc9a0ae2411121bee323085">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>slice()
+: <a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+</li>
+<li>source_fragment
+: <a class="el" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>source_required()
+: <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
 </li>
 <li>stage
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>Storage
 : <a class="el" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa86a59779c0830e8cf82066853dc1089">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a52fb77744c7c7ecf0f8a3a725556293d">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
-<li>store()
-: <a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html#a45319520b7d341c66bd54d3e8fec48f8">cutlass::FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html#a118c78aa6b0ae0f0c78889689b6878c8">cutlass::FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a1f31090613c4e6f0895f598880d6c4e5">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>
-, <a class="el" href="structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ab70d04589637f285f861902f649f834e">cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aa130564bb2eba7b07e1f183c98f1d9e2">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a00f6bb93d318bf4cff35c9dabc630167">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a027980b8456243974b0c442866a66e3a">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a60258b7c1a1708f97e28f8f6c292bfe4">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+<li>storage
+: <a class="el" href="structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+</li>
+<li>Storage
+: <a class="el" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>StorageCoord
+: <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#abaf7ec0e96bc99cf0ce243e703b8711c">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>store
+: <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a673ddeb91e89c9a39c0a4dbaaa97dd8f">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>
+, <a class="el" href="structcutlass_1_1Store.html#a187b63f682f7f00f8bf9ed3ee59d602f">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a174ed368f1c702b4c958887f0b895eee">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#a535b4356c9bc21352fc2459b3c2246d1">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#ae16a5d6d7a42ffeba0f0ebe2d252ec28">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a453a2eed81a86d6637778a50bed06b59">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a1fcdc328d4b2deb1c50be5d31ef9e55f">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a298a08c8c4c1ea871e92e2491b2cb549">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa27a456bf12d0e44adc89a1c2ca7bc3b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a425b4a4f2e66f3ff5960742d19d06bc2">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+<li>store_element()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a051eb2a8637601cf9c1f52999117151b">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>store_iterator
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a3e5167fa3f2dc0d8b4b903bd4e936969">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
-, <a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a939e9ddecc5ee97882a54211a61f5586">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 </li>
 <li>store_post_increment()
-: <a class="el" href="structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a018d5be34cdbb263d7f133197b2921ca">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a35ab2595b09912d31a60c2a4e5847c88">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a18ed76e6be1a02d0229cdf1d6528e34f">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>StoreIterator
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 </li>
 <li>stream_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a87d507b703a0eb654265f4529ed18f66">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#afb56016927b59b8d5447c3656f0b634e">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>stream_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a6d9444ed13ed544febe196e3e835ea16">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#a4a8f9207ffb3bbcdb000af62808371f5">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+</li>
+<li>StreamA
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+</li>
+<li>StreamB
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>stride()
-: <a class="el" href="classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a522630bb0df977282a9bff17e6fee843">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#abb88bd43e5493682d1132c550b734a36">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dab2c5aee6958c9d99109183401f41f">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#aa3c5b8d44216fdeeee9cce5e38ce418b">cutlass::MatrixLayout::ContiguousLayout</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a1b25b4a7061d81041a8e2a548128ca71">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a56f728be8b1a3e71f4f322e1dbfb3495">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af83380ffc0e5949d40d1a5039a5ddc00">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
+<li>stride_advance()
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>stride_d
-: <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>stride_h
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae0fdc7426b22ff2c20f077e251ebc823">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a497b91e93d0eb29ca54553f8de4c694f">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>stride_w
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>Strides
-: <a class="el" href="structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+</li>
+<li>strides
+: <a class="el" href="structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>Strides
+: <a class="el" href="structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+</li>
+<li>StrideVector
+: <a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a625892aa9063eebf769bb2ed0cba7684">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>SType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
 <li>subview()
-: <a class="el" href="classcutlass_1_1TensorView.html#aee43c516397d7c06eb8012711d8d7c15">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#ad4b3faa318699b786f94cf8735a11dbb">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>swap()
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
 <li>swizzle()
-: <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">cutlass::gemm::IdentityBlockSwizzle</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">cutlass::gemm::IdentityBlockSwizzle</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_t.html b/docs/functions_t.html
index 1b83a0919..8665a408d 100644
--- a/docs/functions_t.html
+++ b/docs/functions_t.html
@@ -71,14 +71,55 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_t"></a>- t -</h3><ul>
-<li>TensorRef()
-: <a class="el" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
+<li>tensor_stride
+: <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>TensorArrayRef()
+: <a class="el" href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>TensorCoord
+: <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a9d07d96c2eccba10c3a9e4bef58d4e01">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>TensorRef
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa091e497277d0ba8a98c4ebf73c0cdba">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>TensorRef_t
-: <a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>TensorRefA
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>TensorRefB
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>TensorRefBatchStrided()
+: <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa5d7e9a4589d7dacc5d69ca3c70ecc2b">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>TensorRefC
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>TensorRefD
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
 <li>TensorView()
-: <a class="el" href="classcutlass_1_1TensorView.html#a22401348796d603546e44d6c196018dc">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a36d48227f65ad482a7bded99d6a3d0c1">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>This_
 : <a class="el" href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
@@ -87,31 +128,56 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
 </li>
 <li>thread_offset
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>threadblock_offset
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+</li>
+<li>threadblock_tile
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#af8f0050e818b788402526857afc7c919">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
 </li>
 <li>ThreadBlockTile
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc">cutlass::gemm::GemmMultiplicandTraits&lt; ThreadBlockTile_, Usage, Layout &gt;</a>
 </li>
+<li>ThreadblockTileRef
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+</li>
+<li>ThreadblockTileStorage
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+</li>
+<li>ThreadGemmShape
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+</li>
 <li>ThreadMultiplyAdd()
-: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ab271a3f11ccde4b629ddb11b78c0d555">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#acec155117a56c942c5e695984b0f072d">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a9b75e499f4c14369b5c86051dceeb81d">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac087f0b397599221b74d220fcb1c7121">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a0ab850304c3c6e73bcba321426ba93f9">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a32b234c873ffe44090a12e12d871024c">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aad8a642f46c88e407a1150ee1d42b8dd">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>ThreadOffset
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a>
 </li>
@@ -119,20 +185,20 @@ $(function() {
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a5fd1a9f132c7aa0f68e129553f519d1e">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, bool &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>ThreadsDelta
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a6eee97f03dcea1c441116e143cf58018">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a2bb0f0820e52417ff77e7a2bdb9ed434">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a61907b1afa07c12de74545d2e23a4281">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a160d1ecd86de4742f550d11bc281786b">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 </li>
 <li>ThreadShape
 : <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a33116b67e580292d4e354ca17ecd4167">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
@@ -144,38 +210,50 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa784f29ff453c1656fdea8270454fa55">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a5bc98fd196c1f1e4e3f1bfc621df4f50">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>ThreadsStrides
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 </li>
 <li>Tile
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, bool &gt;</a>
 , <a class="el" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a8a87c8ef986e110a01a9226012594a61">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ad18ee6f519b03e1dbf711339b63e16d6">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#adcd658d9daf286368a9d51c8c1647f89">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
+<li>TileCoord()
+: <a class="el" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
 <li>TileLoadIterator()
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>TileLoadStream()
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>TileStoreIterator()
-: <a class="el" href="structcutlass_1_1TileStoreIterator.html#a037ccd942359e6bc8640a240b13cd330">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileStoreIterator.html#a9f4501c6e8ba0f4511919c1b63c14e69">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>TileStoreStream()
+: <a class="el" href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>TileWithoutSkew
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
@@ -194,36 +272,40 @@ $(function() {
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a6f50a8aec2d7045e9057b93df08172a8">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5016bd7b24938026a2879ec0054eb3b6">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>transform()
 : <a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3">cutlass::Copy&lt; Fragment_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipConvert.html#a7e6398ad8ecd8757744a42f3ab8ef955">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
 </li>
-<li>transformed_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a883b28ca237b1ec076856232cfee0c6f">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-</li>
-<li>transformed_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a9369a5f819d2a42997491e0df96f47ef">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+<li>transformed
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>transformed_fragment
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>TransformedFragment
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#adeb35451885c1c4fb930ae8c914ceb20">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#af349831b19bb91d414a83c67d14f6927">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>transformer
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 </li>
 <li>Transformer
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a>
@@ -237,11 +319,27 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197">cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>transformer
 : <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
+<li>Transformer
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a9f79fd30231825b38694bf7c1d12ec2a">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a0f91f328ed2b6bd65ef4eeafe18f9afd">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+</li>
+<li>transformer
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>Transformer
+: <a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>transformer
+: <a class="el" href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>Transformer
+: <a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
 <li>TrivialIterator()
 : <a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a>
 </li>
@@ -261,18 +359,20 @@ $(function() {
 , <a class="el" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3">cutlass::platform::remove_volatile&lt; volatile T &gt;</a>
 </li>
 <li>Type
-: <a class="el" href="structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06">cutlass::StorageType&lt; kAlignment_ &gt;</a>
+: <a class="el" href="structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b">cutlass::StorageType&lt; alignment &gt;</a>
 , <a class="el" href="structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4">cutlass::StorageType&lt; 1 &gt;</a>
 , <a class="el" href="structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4">cutlass::StorageType&lt; 2 &gt;</a>
 , <a class="el" href="structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807">cutlass::StorageType&lt; 4 &gt;</a>
 , <a class="el" href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">cutlass::Vectorize&lt; Element_, kLanes_ &gt;</a>
-, <a class="el" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html#a79f147933e3f520145aee94ae18da3c5">cutlass::Vectorize&lt; Element_, 1 &gt;</a>
+, <a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186">cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06">cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca">cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type.html b/docs/functions_type.html
index 2241f00f3..2e6491fb8 100644
--- a/docs/functions_type.html
+++ b/docs/functions_type.html
@@ -74,48 +74,57 @@ $(function() {
 <li>AccessType
 : <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html#a7eccab04c8d3968e74486d0525a3fa02">cutlass::FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html#a0b656c41b9fff6402f33e95204ce8860">cutlass::FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html#a87d46956aa317f06f2ba9a535fdfc5da">cutlass::FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html#abca5165caae7304f33fcad267c16b002">cutlass::FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a>
-, <a class="el" href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a8611550c045d6def964d9dafb2be80c6">cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a942970f88e13c88f496a9da67ed47a6f">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a5d7ed0abaeea99ec3399f8eea930f761">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a>
-, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a2b9faed8d92f55a46e313d79d214316d">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ad073f5e8252ad24b086f14bd2a109cf9">cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aeb70e4859e2795b6af63ad5e203b4da9">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a89f329ba11f96ee3ce4428cbc792ac3d">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a>
-, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#ac0af6ae18137156abe24d6479232b955">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a0e79ed59263ebc3478c43f2f9a50cb5a">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>
+, <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a10431ed94c0dd66a8c1d01ba7c8b5aa2">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>Accumulators
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a505306c2af2059f6e84ba32d701d1602">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a4712650b46b6183ea60d79ef18f55b86">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>AccumulatorsPerThread
-: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a98d0f84730551eaabfe7404b36478b50">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a47807c9c9fb43e7f7b5f409a49986c30">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>AccumulatorsPerWarp
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af0c856abdd9f7f26f671493cc629bf0a">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a327ce1b7b6478c27c80baf5d9e26bdbc">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+</li>
+<li>AType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_b.html b/docs/functions_type_b.html
index e092b1a8f..1770402dd 100644
--- a/docs/functions_type_b.html
+++ b/docs/functions_type_b.html
@@ -72,38 +72,49 @@ $(function() {
 
 <h3><a id="index_b"></a>- b -</h3><ul>
 <li>Base
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#ab19f72d239f639f261fbb63f72f10acf">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#affd04d88a0bbef13c54f10000a5dc15d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aef7047c6a0d0c3db0bfb6bec08520aad">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a82a9cfc61ecc117592bdb30f57bd35c9">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aea87c73ae2d4e027014ebd4d8141c89e">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">cutlass::TensorView&lt; T &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">cutlass::TileCoord&lt; Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>BaseParams
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>BlockSwizzle
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 </li>
+<li>BType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_c.html b/docs/functions_type_c.html
index e797657a5..c209e7612 100644
--- a/docs/functions_type_c.html
+++ b/docs/functions_type_c.html
@@ -73,20 +73,35 @@ $(function() {
 <h3><a id="index_c"></a>- c -</h3><ul>
 <li>ClearAccumulators
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
+</li>
+<li>ConstTensorRef
+: <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
 </li>
 <li>ConstTensorRef_t
-: <a class="el" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>ConstTensorView
+: <a class="el" href="classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>Coord_t
-: <a class="el" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#ab16a0244199ca2800ea5460ed8ed6ae2">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>CType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_d.html b/docs/functions_type_d.html
index 827859c22..45e91ea28 100644
--- a/docs/functions_type_d.html
+++ b/docs/functions_type_d.html
@@ -75,33 +75,37 @@ $(function() {
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
 <li>Delta
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aede069e51e0732a9648c437261bd4d66">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a08dada072eefded4c859df4e5fc25ca6">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#adab639892c3586464e2ea5f947b9e0f0">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a1c433ba0eea5e6a46f36101d8de98ed0">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a>
+, <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#afdb38f790d9c7cf1ac238643103b45ce">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
+<li>DType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_e.html b/docs/functions_type_e.html
index cac932d07..a88263588 100644
--- a/docs/functions_type_e.html
+++ b/docs/functions_type_e.html
@@ -81,14 +81,14 @@ $(function() {
 </li>
 <li>Epilogue
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_f.html b/docs/functions_type_f.html
index a71defeb3..8ba4932b8 100644
--- a/docs/functions_type_f.html
+++ b/docs/functions_type_f.html
@@ -72,45 +72,59 @@ $(function() {
 
 <h3><a id="index_f"></a>- f -</h3><ul>
 <li>FetchedFragment
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
+<li>First
+: <a class="el" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
 <li>Fragment
 : <a class="el" href="structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a7f802c4c733375d0a63f91c58196e6a0">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a6c9737f5b09e7eb1aa7daabb00ae2e69">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>FragmentA
-: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1daf96b6d152c5cf32f248bbfd605b74">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a71aadbb130d4b1a6532c45282b37354f">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>FragmentB
-: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae79e7fc5be2f4c8d30ca83edc151f63a">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a43e278686b493d0aef943f32a9f47b9e">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>FragmentConstIterator
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a48de0db7ee2ee9699b946a9d5a0364c7">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#adfcd8a2e63bd0c515ef03760cc1c4283">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>FragmentElement
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a2b13136a970fae187fcb377c9be28fac">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>FragmentIterator
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a0843b2d82422e7178f324a8d3be9d705">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ace8a65d90db264a0ee93a810be38918f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>FragmentMultiplyAdd
 : <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
@@ -120,20 +134,20 @@ $(function() {
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a3b872e85844c9e009fa480a71a829136">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a82ceeea55603dbb0c6e5bf9c22ac692e">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>Functor
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_g.html b/docs/functions_type_g.html
index 4ae366f31..05c838d38 100644
--- a/docs/functions_type_g.html
+++ b/docs/functions_type_g.html
@@ -73,19 +73,19 @@ $(function() {
 <h3><a id="index_g"></a>- g -</h3><ul>
 <li>GemmConfig
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 </li>
 <li>GemmEpilogueTraits
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
 </li>
 <li>GemmTileTraitsHelperA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 </li>
 <li>GemmTileTraitsHelperB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 </li>
 <li>GlobalFragmentC
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
@@ -97,33 +97,42 @@ $(function() {
 : <a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a880878914c25db44a1781725c24af514">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
 </li>
+<li>GlobalLoadIterator
+: <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+</li>
 <li>GlobalLoadIteratorA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalLoadIteratorB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalLoadIteratorC
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
+<li>GlobalLoadStream
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
+</li>
 <li>GlobalLoadStreamA
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalLoadStreamB
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalLoadTileTraits
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
@@ -131,7 +140,7 @@ $(function() {
 </li>
 <li>GlobalStoreIteratorD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
@@ -146,28 +155,30 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a738774d1eb79de7e29c372ddfd48258d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a24f38105e3c331c733cb672c3a9be588">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a66f11407e9f5bf0d6123c81dfee6b330">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a125c9a43da3bcdc00d5194a1376f613c">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>GlobalTransformerA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalTransformerB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>GlobalTransformerC
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
 <li>GlobalTransformerD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
@@ -175,7 +186,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_i.html b/docs/functions_type_i.html
index 6be0ee90e..0039f880d 100644
--- a/docs/functions_type_i.html
+++ b/docs/functions_type_i.html
@@ -77,27 +77,42 @@ $(function() {
 <li>ImmediateOffsetStrides
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 </li>
 <li>Index
-: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">cutlass::gemm::GemmCoord</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5ac2280dfcac08cec17b8c0db1c4593e">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">cutlass::MatrixCoord</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ab12d9d196122dc3075185ab239a27fb4">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a5a3f096a01e6a2dfe984d7e605380599">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">cutlass::TileCoord&lt; Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aae07fdedeef68abd4e6c099924c70910">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 <li>InputFragment
 : <a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a>
@@ -106,53 +121,59 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
 </li>
 <li>InstructionShape
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ab16a3d8adda89cc4f9765116ea75a4b7">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa56cdefa659af5ce4efd493b94bafdfd">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad73372a37315b0c17a8db21e40a78574">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>Iterations
 : <a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058">cutlass::ConstPredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 , <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#aa9b46937bea47d071d277aa212dd610b">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a9fb4b56091d4458ebd82130bc3951e5b">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a2dc8573498bcda33273b86db76dbd511">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ae1d930fa295d8ddfaa10bda5978258de">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a552a67fb03c28e985d143f6193f88308">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a8628ea7116f736b59c644fc0d85d395f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
 <li>IterationsStrides
-: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 </li>
 <li>Iterator
 : <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a1f2314aa062360b249b7c57c39af5430">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a0ba9097d54f3ba7b7dab12012631fa76">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_k.html b/docs/functions_type_k.html
new file mode 100644
index 000000000..b5e5add55
--- /dev/null
+++ b/docs/functions_type_k.html
@@ -0,0 +1,86 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Class Members - Typedefs</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+&#160;
+
+<h3><a id="index_k"></a>- k -</h3><ul>
+<li>KernelClass
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/functions_type_l.html b/docs/functions_type_l.html
index 2e7334f0d..abda026b1 100644
--- a/docs/functions_type_l.html
+++ b/docs/functions_type_l.html
@@ -72,13 +72,19 @@ $(function() {
 
 <h3><a id="index_l"></a>- l -</h3><ul>
 <li>LoadIterator
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+</li>
+<li>LongIndex
+: <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa3df5b7337d41d8f96717ea73bf3e24e">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_m.html b/docs/functions_type_m.html
index 043340a51..c76395492 100644
--- a/docs/functions_type_m.html
+++ b/docs/functions_type_m.html
@@ -71,26 +71,33 @@ $(function() {
 &#160;
 
 <h3><a id="index_m"></a>- m -</h3><ul>
+<li>MapFunc
+: <a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
 <li>MultiplicandTraits
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 </li>
 <li>MultiplyAdd
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 </li>
 <li>MultiplyAddScalar
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_n.html b/docs/functions_type_n.html
index bb5ad36c7..187630cfd 100644
--- a/docs/functions_type_n.html
+++ b/docs/functions_type_n.html
@@ -78,7 +78,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_o.html b/docs/functions_type_o.html
index 42ed28139..d3d71d551 100644
--- a/docs/functions_type_o.html
+++ b/docs/functions_type_o.html
@@ -72,7 +72,7 @@ $(function() {
 
 <h3><a id="index_o"></a>- o -</h3><ul>
 <li>Offset_t
-: <a class="el" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>OutputFragment
 : <a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a>
@@ -81,11 +81,12 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
 </li>
 <li>OutputTile
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
@@ -95,7 +96,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_p.html b/docs/functions_type_p.html
index 4e124be92..9fe8de42e 100644
--- a/docs/functions_type_p.html
+++ b/docs/functions_type_p.html
@@ -72,7 +72,10 @@ $(function() {
 
 <h3><a id="index_p"></a>- p -</h3><ul>
 <li>Params
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
 </li>
 <li>Pointer
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
@@ -83,28 +86,34 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>pointer
 : <a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a>
 </li>
 <li>Pointer
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>PredicateFunctor
+: <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
 </li>
 <li>PredicateVector
 : <a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">cutlass::ConstPredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5aa507eaeb63951f8e69fb223ec41809">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a6157fe8a2ffefd45eba6f3953f0e2994">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_s.html b/docs/functions_type_s.html
index 2d67bf448..159cb8c74 100644
--- a/docs/functions_type_s.html
+++ b/docs/functions_type_s.html
@@ -72,8 +72,9 @@ $(function() {
 
 <h3><a id="index_s"></a>- s -</h3><ul>
 <li>Scalar
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+: <a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
@@ -88,189 +89,229 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317">cutlass::gemm::IgemmEpilogueScalar&lt; ScalarD_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650">cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">cutlass::Vector&lt; half, 1 &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599">cutlass::VectorTraits&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a>
 </li>
 <li>ScalarA
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a366083b229b28e7f44da38273b2ab263">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a236a408791a38358cbadf19dd0e8ed9f">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aeef5fa0437b4ce1c2e8ac4bc7e062b65">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+</li>
+<li>ScalarAccum
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+</li>
+<li>ScalarAlphaBeta
+: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>
 </li>
 <li>ScalarB
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af52ec4b92a3e788169764014aebb85a1">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac7557562de1108bf1abc10829c83e88f">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aaf9e4b8b16150a6ad826c228af2bf103">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>ScalarC
-: <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af553be8ef0b4dc9bb593d98dfce8628d">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af1a6d91d4734683ea791bf57f3c3bbb0">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#acdd554e996a712ff62eb70d6ecf8e116">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>ScalarD
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 </li>
 <li>ScalarEpilogue
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 </li>
+<li>Second
+: <a class="el" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
 <li>Shape
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e">cutlass::gemm::GemmMultiplicandTraits&lt; ThreadBlockTile_, Usage, Layout &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71">cutlass::ShapeAdd&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">cutlass::ShapeDiv&lt; A_, B_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">cutlass::ShapeDivCeiling&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">cutlass::ShapeMax&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">cutlass::ShapeMin&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">cutlass::ShapeMul&lt; A_, B_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29">cutlass::ShapeScale&lt; A_, kScale_ &gt;</a>
-, <a class="el" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">cutlass::ShapeStrides&lt; Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">cutlass::ShapeStrides&lt; Shape_, elementsPerAccess &gt;</a>
 , <a class="el" href="structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9">cutlass::ShapeSub&lt; A_, B_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
 </li>
 <li>SharedLoadIteratorA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedLoadIteratorB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedLoadIteratorD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
 <li>SharedLoadStreamA
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedLoadStreamB
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
-<li>SharedLoadTileTraits
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a458cbcc16fc296d024f2a1a95fb926c1">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af1bc7f7c26db3399201cd95f35a56790">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+<li>SharedLoadStreamD
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
-<li>SharedLoadTransformerD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+<li>SharedLoadTileTraits
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>SharedStorage
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>SharedStoreFragmentD
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
 <li>SharedStoreIteratorA
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedStoreIteratorB
-: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a>
 </li>
 <li>SharedStoreIteratorD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
-<li>SharedStoreStorage
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
-</li>
-<li>SharedStoreStorageA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-</li>
-<li>SharedStoreStorageB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
-</li>
 <li>SharedStoreTileTraits
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a2aad3b2454d956f20dac1bb0ad75a2f8">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab1ae3d51f65f7af60147da1c51a7a0c2">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a7624585480f83a46725c92b5dee20ebc">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aca6118b5bbe6f667f05c53bd52543045">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aa21c231aa56c9e5f2705cac62b17bbbe">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a872dc2d0b8ed6c75c41d258a23183861">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>SharedStoreTransformerD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a>
 </li>
+<li>SharedStream
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
+</li>
 <li>Skew
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a57348779bb004ed1ea0fd9cc252e895d">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a18248da35dc9a0ae2411121bee323085">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>Storage
 : <a class="el" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa86a59779c0830e8cf82066853dc1089">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a52fb77744c7c7ecf0f8a3a725556293d">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>StorageCoord
+: <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#abaf7ec0e96bc99cf0ce243e703b8711c">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>StoreIterator
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+</li>
+<li>StreamA
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+</li>
+<li>StreamB
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>Strides
-: <a class="el" href="structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+</li>
+<li>StrideVector
+: <a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a625892aa9063eebf769bb2ed0cba7684">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>SType
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_t.html b/docs/functions_type_t.html
index 54dffcad2..9d29b5bc6 100644
--- a/docs/functions_type_t.html
+++ b/docs/functions_type_t.html
@@ -71,8 +71,41 @@ $(function() {
 &#160;
 
 <h3><a id="index_t"></a>- t -</h3><ul>
+<li>TensorCoord
+: <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a9d07d96c2eccba10c3a9e4bef58d4e01">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>TensorRef
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a>
+, <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
 <li>TensorRef_t
-: <a class="el" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
+<li>TensorRefA
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>TensorRefB
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>TensorRefC
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>TensorRefD
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
 <li>This_
 : <a class="el" href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
@@ -81,19 +114,38 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
 </li>
 <li>ThreadBlockTile
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc">cutlass::gemm::GemmMultiplicandTraits&lt; ThreadBlockTile_, Usage, Layout &gt;</a>
 </li>
+<li>ThreadblockTileRef
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
+</li>
+<li>ThreadblockTileStorage
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+</li>
+<li>ThreadGemmShape
+: <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+</li>
 <li>ThreadOffset
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a>
 </li>
@@ -101,20 +153,20 @@ $(function() {
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a5fd1a9f132c7aa0f68e129553f519d1e">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, bool &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>ThreadsDelta
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a6eee97f03dcea1c441116e143cf58018">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a2bb0f0820e52417ff77e7a2bdb9ed434">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a61907b1afa07c12de74545d2e23a4281">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a160d1ecd86de4742f550d11bc281786b">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 </li>
 <li>ThreadShape
 : <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a33116b67e580292d4e354ca17ecd4167">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
@@ -126,28 +178,31 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa784f29ff453c1656fdea8270454fa55">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a5bc98fd196c1f1e4e3f1bfc621df4f50">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>
 </li>
 <li>ThreadsStrides
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 </li>
 <li>Tile
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, bool &gt;</a>
 , <a class="el" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a8a87c8ef986e110a01a9226012594a61">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ad18ee6f519b03e1dbf711339b63e16d6">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a>
@@ -170,16 +225,20 @@ $(function() {
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a6f50a8aec2d7045e9057b93df08172a8">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5016bd7b24938026a2879ec0054eb3b6">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>TransformedFragment
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#adeb35451885c1c4fb930ae8c914ceb20">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#af349831b19bb91d414a83c67d14f6927">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>Transformer
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a>
@@ -194,6 +253,10 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a9f79fd30231825b38694bf7c1d12ec2a">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a0f91f328ed2b6bd65ef4eeafe18f9afd">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>type
 : <a class="el" href="structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1">cutlass::platform::aligned_storage&lt; Len, Align &gt;</a>
@@ -208,18 +271,20 @@ $(function() {
 , <a class="el" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3">cutlass::platform::remove_volatile&lt; volatile T &gt;</a>
 </li>
 <li>Type
-: <a class="el" href="structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06">cutlass::StorageType&lt; kAlignment_ &gt;</a>
+: <a class="el" href="structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b">cutlass::StorageType&lt; alignment &gt;</a>
 , <a class="el" href="structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4">cutlass::StorageType&lt; 1 &gt;</a>
 , <a class="el" href="structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4">cutlass::StorageType&lt; 2 &gt;</a>
 , <a class="el" href="structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807">cutlass::StorageType&lt; 4 &gt;</a>
 , <a class="el" href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">cutlass::Vectorize&lt; Element_, kLanes_ &gt;</a>
-, <a class="el" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html#a79f147933e3f520145aee94ae18da3c5">cutlass::Vectorize&lt; Element_, 1 &gt;</a>
+, <a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186">cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06">cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a>
+, <a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca">cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_v.html b/docs/functions_type_v.html
index 60177eeed..392148b35 100644
--- a/docs/functions_type_v.html
+++ b/docs/functions_type_v.html
@@ -72,18 +72,22 @@ $(function() {
 
 <h3><a id="index_v"></a>- v -</h3><ul>
 <li>value_type
-: <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">cutlass::platform::complex&lt; T &gt;</a>
+, <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
 </li>
 <li>Vector
 : <a class="el" href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">cutlass::VectorTraits&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a>
 </li>
+<li>VectorizedTile
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_w.html b/docs/functions_type_w.html
index ba510b56a..2806ad020 100644
--- a/docs/functions_type_w.html
+++ b/docs/functions_type_w.html
@@ -72,7 +72,7 @@ $(function() {
 
 <h3><a id="index_w"></a>- w -</h3><ul>
 <li>Warps
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
@@ -82,7 +82,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_type_y.html b/docs/functions_type_y.html
index e20abf82a..1793ec480 100644
--- a/docs/functions_type_y.html
+++ b/docs/functions_type_y.html
@@ -78,7 +78,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_u.html b/docs/functions_u.html
index fc2ce25cc..d3ac4dab1 100644
--- a/docs/functions_u.html
+++ b/docs/functions_u.html
@@ -78,7 +78,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_v.html b/docs/functions_v.html
index ebea1a15a..72381435e 100644
--- a/docs/functions_v.html
+++ b/docs/functions_v.html
@@ -75,12 +75,11 @@ $(function() {
 : <a class="el" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4">cutlass::platform::alignment_of&lt; value_t &gt;::pad</a>
 </li>
 <li>valid()
-: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a01571b2fc566793fd50a10fa82441951">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1FragmentIterator.html#ab18f8ea676b45831f939715212167a99">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ac4d2c293f9312b673ea29bf79b2882fd">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6594acc213fc8d4289c6c73631f60120">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a468f8f503777e4a2b0089ee2bd6c471a">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1FragmentConstIterator.html#ac4d601998a84a3eac23e3b7a7c8a935b">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1FragmentIterator.html#a8608dd815ed4906d8c82c41a10df23e2">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>value
 : <a class="el" href="structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc">cutlass::divide_assert&lt; Dividend, Divisor &gt;</a>
@@ -102,21 +101,29 @@ $(function() {
 , <a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html#a2568c1ab218cab6505bd20e3c2c420ffa54f6e1afec0ed30b18ab79fd6faf81b5">cutlass::platform::alignment_of&lt; ulonglong4 &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;</a>
+, <a class="el" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">cutlass::ScalarIO&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964">cutlass::sqrt_est&lt; N &gt;</a>
 </li>
 <li>value_type
-: <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
+: <a class="el" href="classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6">cutlass::platform::complex&lt; T &gt;</a>
+, <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
 </li>
-<li>Vector
-: <a class="el" href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">cutlass::VectorTraits&lt; T &gt;</a>
+<li>Vector()
+: <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1310cf2e92e260cf55cfda1cb2cb7280">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a5feb070268f85bd73c3095eaf2d0e2bb">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a48e193a0b636934ea553c6e60ffef563">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
+, <a class="el" href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">cutlass::VectorTraits&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a>
 </li>
+<li>VectorizedTile
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars.html b/docs/functions_vars.html
index 43affc319..ffc55d8ed 100644
--- a/docs/functions_vars.html
+++ b/docs/functions_vars.html
@@ -71,20 +71,26 @@ $(function() {
 &#160;
 
 <h3><a id="index_a"></a>- a -</h3><ul>
+<li>A
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 <li>aligned_
 : <a class="el" href="unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1df3324868465331db13bd7775b55e87">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#acc698443a38fd0ad63f931bdf172ad99">cutlass::Vector&lt; half, 1 &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ad6784e347f068ad20af52379286337c0">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a4eab187b6f7650bd88ccd421c8330d3c">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 </li>
 <li>alpha
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a053c2b529be527f510ee317737fbf7e8">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_b.html b/docs/functions_vars_b.html
index 4b145d14e..5a07b0302 100644
--- a/docs/functions_vars_b.html
+++ b/docs/functions_vars_b.html
@@ -71,11 +71,31 @@ $(function() {
 &#160;
 
 <h3><a id="index_b"></a>- b -</h3><ul>
+<li>B
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>batch_stride_A
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>batch_stride_B
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>batch_stride_C
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
+<li>batch_stride_D
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 <li>beta
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a>
 </li>
+<li>block
+: <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">cutlass::KernelLaunchConfiguration</a>
+</li>
+<li>bounds
+: <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a>
+</li>
 <li>byte
 : <a class="el" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4">cutlass::platform::alignment_of&lt; value_t &gt;::pad</a>
 </li>
@@ -83,7 +103,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_c.html b/docs/functions_vars_c.html
index 5e5a2251e..271a2dbec 100644
--- a/docs/functions_vars_c.html
+++ b/docs/functions_vars_c.html
@@ -71,6 +71,9 @@ $(function() {
 &#160;
 
 <h3><a id="index_c"></a>- c -</h3><ul>
+<li>C
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+</li>
 <li>clear
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
 </li>
@@ -81,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_d.html b/docs/functions_vars_d.html
index df6d2e3e9..dc633e8dc 100644
--- a/docs/functions_vars_d.html
+++ b/docs/functions_vars_d.html
@@ -71,23 +71,17 @@ $(function() {
 &#160;
 
 <h3><a id="index_d"></a>- d -</h3><ul>
-<li>d_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
+<li>D
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
 </li>
-<li>d_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>d_c
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>d_d
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
+<li>dynamic_smem
+: <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">cutlass::KernelLaunchConfiguration</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_e.html b/docs/functions_vars_e.html
index f98d4a1b6..413436f68 100644
--- a/docs/functions_vars_e.html
+++ b/docs/functions_vars_e.html
@@ -79,7 +79,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_f.html b/docs/functions_vars_f.html
index 71f57760c..f959f78d1 100644
--- a/docs/functions_vars_f.html
+++ b/docs/functions_vars_f.html
@@ -71,23 +71,30 @@ $(function() {
 &#160;
 
 <h3><a id="index_f"></a>- f -</h3><ul>
-<li>fetched_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a3147da380e4c1e465aba0b965ac87ab5">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
-</li>
-<li>fetched_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a837fbec1d47ae45480941de6290889c0">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+<li>fetched
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>fetched_fragment
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+</li>
+<li>first
+: <a class="el" href="structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a>
 </li>
 <li>functor
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_g.html b/docs/functions_vars_g.html
index 712c6b5da..13c8f617b 100644
--- a/docs/functions_vars_g.html
+++ b/docs/functions_vars_g.html
@@ -71,20 +71,18 @@ $(function() {
 &#160;
 
 <h3><a id="index_g"></a>- g -</h3><ul>
-<li>global
-: <a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#a3c2980547310ec4307f3a5f9817dfc51">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStream_, SharedLoadStream_ &gt;</a>
+<li>global_to_shared_stream
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a61fcc63cb0df6754eef16f5cf138f3a2">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
 </li>
-<li>global_stream_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
-</li>
-<li>global_stream_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
+<li>grid
+: <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">cutlass::KernelLaunchConfiguration</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_i.html b/docs/functions_vars_i.html
index e0bfcd784..dde35cf40 100644
--- a/docs/functions_vars_i.html
+++ b/docs/functions_vars_i.html
@@ -72,23 +72,21 @@ $(function() {
 
 <h3><a id="index_i"></a>- i -</h3><ul>
 <li>idx
-: <a class="el" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">cutlass::Coord&lt; N_ &gt;</a>
+: <a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 <li>inc_advance
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>inc_d
-: <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>inc_h
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>inc_w
-: <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>IsVector
 : <a class="el" href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">cutlass::VectorTraits&lt; T &gt;</a>
@@ -98,18 +96,22 @@ $(function() {
 <li>iterator
 : <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a>
 </li>
 <li>iterator_c
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 <li>iterator_d
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_k.html b/docs/functions_vars_k.html
index 04e3c5d99..189c2ab14 100644
--- a/docs/functions_vars_k.html
+++ b/docs/functions_vars_k.html
@@ -71,10 +71,6 @@ $(function() {
 &#160;
 
 <h3><a id="index_k"></a>- k -</h3><ul>
-<li>k
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ac789a7e5d2db65d006f1e8e3df542a6f">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aae3a008b39f9678a03192f6ff54152d8">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
-</li>
 <li>kAccessSize
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
@@ -83,31 +79,55 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraits.html#a0a494c2eacb51b65487f8405908a0214">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>
+, <a class="el" href="structcutlass_1_1TileTraitsStandard.html#a5e04777205c7a292602880c59d6b43c8">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a>
 </li>
 <li>kAccumulatorsPerLdsA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kAccumulatorsPerLdsB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kAdvance
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a8059c57030df99b73309e9210ec5f624">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a44200854ad5b35c1863f73c435b8750b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>kAlignment
+: <a class="el" href="structcutlass_1_1Fragment.html#a84b6d68a5a24dbd04d842e0755b42bda">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>
+</li>
+<li>kBatch
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad7b490ce2150e54fccad6b0f11932382">cutlass::gemm::GemmCoord</a>
+</li>
+<li>kBlockColumns
+: <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+</li>
+<li>kBlockRows
+: <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
 </li>
 <li>kBytes
 : <a class="el" href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
 <li>kC
 : <a class="el" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a8236879e1670072033983b7ec4b7ae32">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
+<li>kColumn
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a1e096b25138e027c31ea8624729ec433">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#adb3b8cccf1ac91265fff998a3d48f5e7">cutlass::MatrixLayout::ContiguousLayout</a>
 </li>
 <li>kCount
 : <a class="el" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">cutlass::ShapeCount&lt; Shape &gt;</a>
 </li>
 <li>kD
 : <a class="el" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ab5ebf352327baadcc740175d6b39adcb">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>kDhw
 : <a class="el" href="structcutlass_1_1ShapeCount.html#af7d7ccd42de2c49fe57f03cf0e657fe8">cutlass::ShapeCount&lt; Shape &gt;</a>
@@ -126,11 +146,17 @@ $(function() {
 : <a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html#a881f84951bc9e47ab2be9ef3f2c1e423">cutlass::gemm::GetExtent&lt; GemmOperand::kA, Tile_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html#a82ff9b447e4a58164b5f7d53d2602930">cutlass::gemm::GetExtent&lt; GemmOperand::kB, Tile_ &gt;</a>
 </li>
+<li>kFragmentElementType
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
 <li>kFragmentSize
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>kH
 : <a class="el" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#a24d32587359493bb965745f5551e1624">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>kHw
 : <a class="el" href="structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f">cutlass::ShapeCount&lt; Shape &gt;</a>
@@ -141,6 +167,10 @@ $(function() {
 <li>kInt8Output
 : <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4">cutlass::gemm::IgemmEpilogueTraits&lt; IgemmConfig_, EpilogueFunctor_, Index_, Helper_ &gt;</a>
 </li>
+<li>kInterleave
+: <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a>
+</li>
 <li>kIterationsD
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 </li>
@@ -150,10 +180,8 @@ $(function() {
 <li>kIterationsInHPerWarp
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 </li>
-<li>kIteratorFragment
-: <a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a94c0567316118abfb84fc28560a5a46a">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+<li>kK
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a521d4b8e720d2261c825e05397c92a5e">cutlass::gemm::GemmCoord</a>
 </li>
 <li>kKstrided
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">cutlass::gemm::GemmMultiplicandTraits&lt; ThreadBlockTile_, Usage, Layout &gt;</a>
@@ -163,6 +191,9 @@ $(function() {
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aca745b59c6c21292f119943e5a480f39">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a43ac200035052a2c352c8c4b84aac73c">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a>
 </li>
+<li>kLaunchBounds
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+</li>
 <li>kLayout
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
@@ -172,7 +203,9 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a32729d0fad10fcbbcf2643a2fa5671d6">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a11026d05b2b32f1373020c049f2cfa66">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 <li>kLayoutA
@@ -181,6 +214,9 @@ $(function() {
 <li>kLayoutB
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a>
 </li>
+<li>kM
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#af1f5c03c35eaa406c6a63082da26bec3">cutlass::gemm::GemmCoord</a>
+</li>
 <li>kMemorySpace
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
@@ -189,14 +225,18 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#adaebec9eacf767f63f048033de73ea5b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>kN
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a67f08a03dabee497fa5547cff0f1faea">cutlass::gemm::GemmCoord</a>
 </li>
 <li>kOperand
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 </li>
 <li>kPredicates
 : <a class="el" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
@@ -207,45 +247,62 @@ $(function() {
 <li>kPredicateStart
 : <a class="el" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a>
 </li>
+<li>kRank
+: <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+</li>
+<li>kResidueInProlog
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+</li>
+<li>kResidueSeparate
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+</li>
+<li>kRow
+: <a class="el" href="structcutlass_1_1MatrixCoord.html#a5149f4a37407746407251efc0779bb53">cutlass::MatrixCoord</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#ae97a9ba9d5045bef258d8994eb732256">cutlass::MatrixLayout::ContiguousLayout</a>
+</li>
 <li>kScalarsIn4B
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
 </li>
 <li>kScalarsPerLdgA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdgB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdgC
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdsA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdsB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerLdsD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerRow
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 </li>
 <li>kScalarsPerStgD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerStsA
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ae396f7301f934c179e054f68f0420edf">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a69775031f651795f697b628677b8e4eb">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aedb61c43d8fb9c4ba18ae72601b9f6e1">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>kScalarsPerStsB
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a47d99d98c783cf1d317698bd465ffa9a">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aaa3228d45ff4428bba0f88a7a6e8b31b">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a8a6cef5e733eab9c0ead20b1e345ad6f">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>
 </li>
 <li>kScalarsPerStsD
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 </li>
 <li>kScalarsPerThread
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
@@ -259,15 +316,39 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aba6decf87d770becaadd610d9fc27491">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a>
 </li>
+<li>kSkewA
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9c296924f9a6c6908f09830bbbf6a775">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac8da30393042cf6e785bdd54b11d9408">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a>
+</li>
+<li>kSkewB
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab35a6b3ff04e4128e4ca4a8cc0459b16">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a6d0f50e83067373b249b38444eb7fe65">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a>
+</li>
+<li>kSplitK
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
+</li>
 <li>kStages
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
+</li>
+<li>kStorageRank
+: <a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html#ac609498e7fe858b4fb3791d1039438f4">cutlass::IdentityTensorMapFunc&lt; Rank &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70">cutlass::MatrixLayout::ColumnMajor</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">cutlass::MatrixLayout::ContiguousLayout</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30">cutlass::MatrixLayout::RowMajor</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>
+, <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>kStrideH
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a>
 </li>
 <li>kThreads
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a>
@@ -286,14 +367,20 @@ $(function() {
 : <a class="el" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">cutlass::Extent&lt; T &gt;</a>
 , <a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a10f7184a9a50de0268efa45dab5dc304">cutlass::Extent&lt; Vector&lt; T, Lanes &gt; &gt;</a>
 , <a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a87917a6dfbb1662416c4ea4831669aaf">cutlass::Extent&lt; Vector&lt; T, Lanes &gt; const &gt;</a>
+, <a class="el" href="structcutlass_1_1Max.html#a6ed8be7ed855eea8f8d08921f7b5d763">cutlass::Max&lt; A, B &gt;</a>
+, <a class="el" href="structcutlass_1_1Min.html#a97e6dd3ff6fb5404e8a6e6109f73f429">cutlass::Min&lt; A, B &gt;</a>
 </li>
 <li>kW
 : <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileCoord.html#ac2c14af3ceffd5ef8f17c9e0efb4e5ec">cutlass::TileCoord&lt; Index_ &gt;</a>
 </li>
 <li>kWarpCount
 : <a class="el" href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
+<li>kWarpGemmSteps
+: <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
+</li>
 <li>kWarps
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
@@ -302,7 +389,7 @@ $(function() {
 : <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
 <li>kWarpSize
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a>
 , <a class="el" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a>
 </li>
@@ -319,7 +406,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_l.html b/docs/functions_vars_l.html
index 78a99ee37..3e59f2c44 100644
--- a/docs/functions_vars_l.html
+++ b/docs/functions_vars_l.html
@@ -71,31 +71,18 @@ $(function() {
 &#160;
 
 <h3><a id="index_l"></a>- l -</h3><ul>
-<li>lda
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>ldb
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>ldc
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
-<li>ldd
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-</li>
 <li>load
-: <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#aea5ed35a44624684ffa9ada9d09a8893">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>
+: <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>
 </li>
 <li>load_iterator
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a42ffcba6af2b5ddfb1f4825a34d43532">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
-, <a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a3be938f8661f9cd10966866b7b80b471">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_m.html b/docs/functions_vars_m.html
index d97d3377e..c80c0a945 100644
--- a/docs/functions_vars_m.html
+++ b/docs/functions_vars_m.html
@@ -71,19 +71,20 @@ $(function() {
 &#160;
 
 <h3><a id="index_m"></a>- m -</h3><ul>
-<li>m
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a5c2b3e75cb6873762ba3f85487b78579">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aaf27c0f2f4ab730ed5c865e9f7d2373b">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
-</li>
 <li>main_loop
 : <a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage</a>
 </li>
+<li>mask_
+: <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
+</li>
+<li>multiplicand_bounds
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+</li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_n.html b/docs/functions_vars_n.html
index 60139fe65..db6ea4f41 100644
--- a/docs/functions_vars_n.html
+++ b/docs/functions_vars_n.html
@@ -72,18 +72,13 @@ $(function() {
 
 <h3><a id="index_n"></a>- n -</h3><ul>
 <li>N
-: <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">cutlass::Coord&lt; N_ &gt;</a>
-</li>
-<li>n
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a437d4b6f1f149849c5ae635a5993e7ac">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">cutlass::Coord&lt; Rank_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_o.html b/docs/functions_vars_o.html
new file mode 100644
index 000000000..7e29cdc8a
--- /dev/null
+++ b/docs/functions_vars_o.html
@@ -0,0 +1,86 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Class Members - Variables</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+&#160;
+
+<h3><a id="index_o"></a>- o -</h3><ul>
+<li>offset_to_residue
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/functions_vars_p.html b/docs/functions_vars_p.html
index 41f8498f9..bd28154fc 100644
--- a/docs/functions_vars_p.html
+++ b/docs/functions_vars_p.html
@@ -76,40 +76,46 @@ $(function() {
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
 <li>pointer
 : <a class="el" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+</li>
+<li>pointers
+: <a class="el" href="structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>predicate_inc_advance
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
 </li>
 <li>predicate_inc_h
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
 </li>
 <li>predicate_offset
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
 </li>
 <li>predicates
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>
+</li>
+<li>problem_size
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_r.html b/docs/functions_vars_r.html
index 034ca3db1..51923e773 100644
--- a/docs/functions_vars_r.html
+++ b/docs/functions_vars_r.html
@@ -72,18 +72,22 @@ $(function() {
 
 <h3><a id="index_r"></a>- r -</h3><ul>
 <li>Rank
-: <a class="el" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a>
-, <a class="el" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">cutlass::TensorView&lt; T &gt;</a>
+: <a class="el" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a233fba9abdbbd0fe3a2cc7465ea76a41">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a>
+, <a class="el" href="classcutlass_1_1TensorView.html#a8dbb7043546fae133547d2c3e46dddab">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 <li>registers
 : <a class="el" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#af27a36f604513f05aebe0624a9c539ab">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f">cutlass::Vector&lt; half, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ace5e03860b434b2d2a4590bd2bc8c147">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a15d5103e46d53e030100dedaecb0220a">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_s.html b/docs/functions_vars_s.html
index 52934eee7..54da9c678 100644
--- a/docs/functions_vars_s.html
+++ b/docs/functions_vars_s.html
@@ -73,70 +73,83 @@ $(function() {
 <h3><a id="index_s"></a>- s -</h3><ul>
 <li>scalars
 : <a class="el" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a>
+, <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a81709dacea12d6bd3bb328a3f0a519b0">cutlass::Vector&lt; half, 1 &gt;</a>
 , <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3">cutlass::Vector&lt; half, kLanes_ &gt;</a>
 </li>
-<li>shared
-: <a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#afabd328b106d45b156200f73942d211e">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStream_, SharedLoadStream_ &gt;</a>
+<li>second
+: <a class="el" href="structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>
+, <a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a>
+, <a class="el" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
 </li>
-<li>shared_load_iterator_d
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a1742e43c128665f0ca39cb578291df81">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+<li>shared_load_stream_d
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a5d3d1abd85f18476a74bcf616a717f9d">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 <li>shared_storage
 : <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>
 </li>
 <li>shared_store_iterator_d
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#af79a0c74a4c30ccec59b393721b5dfc1">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adfdf3eca06ea4061fbfe016336a3f276">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 </li>
 <li>shared_stream
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#ae63b5a52106dbd37ea304196335ec210">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a50e9cc382a32abd5beab299a79b30b27">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
 </li>
-<li>shared_stream_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
-</li>
-<li>shared_stream_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>
+<li>source_fragment
+: <a class="el" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>stage
-: <a class="el" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+: <a class="el" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+</li>
+<li>storage
+: <a class="el" href="structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>
 </li>
 <li>store
-: <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a1f31090613c4e6f0895f598880d6c4e5">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>
+: <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a673ddeb91e89c9a39c0a4dbaaa97dd8f">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>
 </li>
 <li>store_iterator
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a3e5167fa3f2dc0d8b4b903bd4e936969">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
-, <a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a939e9ddecc5ee97882a54211a61f5586">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 </li>
 <li>stream_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a87d507b703a0eb654265f4529ed18f66">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#afb56016927b59b8d5447c3656f0b634e">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>stream_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a6d9444ed13ed544febe196e3e835ea16">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#a4a8f9207ffb3bbcdb000af62808371f5">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>
 </li>
 <li>stride_d
-: <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>stride_h
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae0fdc7426b22ff2c20f077e251ebc823">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a497b91e93d0eb29ca54553f8de4c694f">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
 </li>
 <li>stride_w
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
-, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>
+, <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>
+</li>
+<li>strides
+: <a class="el" href="structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_t.html b/docs/functions_vars_t.html
index 4fdfb3033..60a3c45e2 100644
--- a/docs/functions_vars_t.html
+++ b/docs/functions_vars_t.html
@@ -71,31 +71,40 @@ $(function() {
 &#160;
 
 <h3><a id="index_t"></a>- t -</h3><ul>
+<li>tensor_stride
+: <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>
+</li>
 <li>thread_offset
 : <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
-, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>
 </li>
-<li>transformed_a
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a883b28ca237b1ec076856232cfee0c6f">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+<li>threadblock_offset
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 </li>
-<li>transformed_b
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a9369a5f819d2a42997491e0df96f47ef">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a>
+<li>threadblock_tile
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#af8f0050e818b788402526857afc7c919">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>
+</li>
+<li>transformed
+: <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>transformed_fragment
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 <li>transformer
-: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>
+, <a class="el" href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_vars_v.html b/docs/functions_vars_v.html
index f773cd011..98e30b731 100644
--- a/docs/functions_vars_v.html
+++ b/docs/functions_vars_v.html
@@ -77,12 +77,13 @@ $(function() {
 <li>value
 : <a class="el" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">cutlass::platform::integral_constant&lt; value_t, V &gt;</a>
 , <a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;</a>
+, <a class="el" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">cutlass::ScalarIO&lt; T &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_w.html b/docs/functions_w.html
index 9ef19c96f..a4c7cfbc0 100644
--- a/docs/functions_w.html
+++ b/docs/functions_w.html
@@ -71,21 +71,24 @@ $(function() {
 <div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
 
 <h3><a id="index_w"></a>- w -</h3><ul>
+<li>w()
+: <a class="el" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">cutlass::TileCoord&lt; Index_ &gt;</a>
+</li>
 <li>Warps
-: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>
 , <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a>
 </li>
 <li>WmmaGemmGlobalIteratorCd()
-: <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a505f124fa3f47c6d57b7275e81be6dd3">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
+: <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_y.html b/docs/functions_y.html
index a97be07e0..5e56a9ab2 100644
--- a/docs/functions_y.html
+++ b/docs/functions_y.html
@@ -78,7 +78,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/functions_z.html b/docs/functions_z.html
new file mode 100644
index 000000000..36fbd3236
--- /dev/null
+++ b/docs/functions_z.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all class members with links to the classes they belong to:</div>
+
+<h3><a id="index_z"></a>- z -</h3><ul>
+<li>ZipConvert()
+: <a class="el" href="structcutlass_1_1ZipConvert.html#a7aa56d3ea300ebc58493c4d66339fff5">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>
+</li>
+<li>ZipFragment()
+: <a class="el" href="structcutlass_1_1ZipFragment.html#a520318d060123c5870c4153b99cf0427">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>
+</li>
+<li>ZipTensorRef()
+: <a class="el" href="structcutlass_1_1ZipTensorRef.html#a9b4e616da5b0a71ac2d9bd03b4e07b86">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>
+</li>
+<li>ZipTileIterator()
+: <a class="el" href="classcutlass_1_1ZipTileIterator.html#a31553842afd1cfd5a18a2fd6c39e17b5">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/gemm_8h.html b/docs/gemm_8h.html
index 9996508bc..8ca7c7a32 100644
--- a/docs/gemm_8h.html
+++ b/docs/gemm_8h.html
@@ -84,20 +84,21 @@ $(function() {
 <p>Implements a software-pipelined efficient GEMM.  
 <a href="#details">More...</a></p>
 <div class="textblock"><code>#include &lt;cuda.h&gt;</code><br />
-<code>#include &lt;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&gt;</code><br />
+<code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&quot;</code><br />
 </div>
 <p><a href="gemm_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html">cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Partial specialization for launching the GEMM kernel with or without launch bounds.  <a href="structcutlass_1_1gemm_1_1Launch.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html">cutlass::gemm::Launch&lt; Gemm, false &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Partial specialization for launching the GEMM kernel with or without launch bounds.  <a href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;::Params</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params.  <a href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
 Namespaces</h2></td></tr>
@@ -108,14 +109,19 @@ Namespaces</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
 Functions</h2></td></tr>
-<tr class="memitem:ad9577c9086b0f7fd1202d7f8109e4439"><td class="memTemplParams" colspan="2">template&lt;typename Gemm_ &gt; </td></tr>
-<tr class="memitem:ad9577c9086b0f7fd1202d7f8109e4439"><td class="memTemplItemLeft" align="right" valign="top">__global__ void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#ad9577c9086b0f7fd1202d7f8109e4439">cutlass::gemm::gemm_kernel</a> (typename Gemm_::Params params)</td></tr>
-<tr class="separator:ad9577c9086b0f7fd1202d7f8109e4439"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a01dd61085e2b3f578a7fc266b94fac55"><td class="memTemplParams" colspan="2">template&lt;typename Gemm_ &gt; </td></tr>
+<tr class="memitem:a01dd61085e2b3f578a7fc266b94fac55"><td class="memTemplItemLeft" align="right" valign="top">__global__&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55">cutlass::gemm::__launch_bounds__</a> (Gemm_::kThreads) void gemm_kernel(typename Gemm_</td></tr>
+<tr class="memdesc:a01dd61085e2b3f578a7fc266b94fac55"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM kernel with launch bounds specified.  <a href="namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55">More...</a><br /></td></tr>
+<tr class="separator:a01dd61085e2b3f578a7fc266b94fac55"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae23b870e60261e2322f3c6edb3d2bcb9"><td class="memTemplParams" colspan="2">template&lt;typename Gemm_ &gt; </td></tr>
+<tr class="memitem:ae23b870e60261e2322f3c6edb3d2bcb9"><td class="memTemplItemLeft" align="right" valign="top">__global__ void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9">cutlass::gemm::gemm_kernel_nolb</a> (typename Gemm_::Params params)</td></tr>
+<tr class="memdesc:ae23b870e60261e2322f3c6edb3d2bcb9"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM kernel without launch bounds specified.  <a href="namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9">More...</a><br /></td></tr>
+<tr class="separator:ae23b870e60261e2322f3c6edb3d2bcb9"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm_8h_source.html b/docs/gemm_8h_source.html
index 216e9b5ab..f946c39ad 100644
--- a/docs/gemm_8h_source.html
+++ b/docs/gemm_8h_source.html
@@ -76,53 +76,45 @@ $(function() {
 <div class="title">gemm.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="gemm_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;cuda.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Gemm_&gt;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html#ad9577c9086b0f7fd1202d7f8109e4439">   43</a></span>&#160;__global__ <span class="keywordtype">void</span> <a class="code" href="namespacecutlass_1_1gemm.html#ad9577c9086b0f7fd1202d7f8109e4439">gemm_kernel</a>(<span class="keyword">typename</span> Gemm_::Params params) {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  <span class="comment">// Declare shared memory.</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  __shared__ <span class="keyword">typename</span> Gemm_::SharedStorage shared_storage;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  <span class="comment">// Construct the GEMM object.</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  Gemm_ gemm(params, shared_storage);</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="comment">// Run GEMM.</span></div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  gemm.multiply_add();</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;}</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html">   56</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc</a> {</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a">   58</a></span>&#160;  Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a5c2b3e75cb6873762ba3f85487b78579">m</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a">n</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#ac789a7e5d2db65d006f1e8e3df542a6f">k</a>;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332">   60</a></span>&#160;  Scalar_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a053c2b529be527f510ee317737fbf7e8">alpha</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332">beta</a>;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447">   62</a></span>&#160;  <span class="keywordtype">void</span> <span class="keyword">const</span>* <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447">d_a</a>;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789">   64</a></span>&#160;  Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789">lda</a>;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b">   66</a></span>&#160;  <span class="keywordtype">void</span> <span class="keyword">const</span>* <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b">d_b</a>;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe">   68</a></span>&#160;  Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe">ldb</a>;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5">   70</a></span>&#160;  <span class="keywordtype">void</span> <span class="keyword">const</span>* <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5">d_c</a>;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db">   72</a></span>&#160;  Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db">ldc</a>;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216">   74</a></span>&#160;  <span class="keywordtype">void</span>* <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216">d_d</a>;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9">   76</a></span>&#160;  Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9">ldd</a>;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;};</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmTraits_&gt;</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html">   82</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a> {</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317">   84</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm&lt;GemmTraits_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317">This_</a>;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff">   86</a></span>&#160;  <span class="keyword">typedef</span> GemmTraits_ <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff">Traits</a>;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">   88</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedStorage <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">SharedStorage</a>;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">   91</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">ScalarA</a>;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">   93</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">ScalarB</a>;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">   95</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Epilogue::Scalar <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">ScalarEpilogue</a>;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">   97</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Epilogue::ScalarC <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">ScalarC</a>;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694">   99</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Epilogue::ScalarD <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694">ScalarD</a>;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">  101</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Index <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a>;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">  104</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">kThreads</a> = Traits::GemmConfig::kThreads;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">  107</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> : <span class="keyword">public</span> Traits::Params {</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html#ac00c9d78a187d9c7d53399f971c0e129">  108</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html#ac00c9d78a187d9c7d53399f971c0e129">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> m,</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> n,</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> k,</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">ScalarEpilogue</a> alpha,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">ScalarA</a> <span class="keyword">const</span>* d_a,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> lda,</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">ScalarB</a> <span class="keyword">const</span>* d_b,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> ldb,</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">ScalarEpilogue</a> beta,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">ScalarC</a> <span class="keyword">const</span>* d_c,</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> ldc,</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694">ScalarD</a>* d_d,</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> ldd) {</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc&lt;ScalarEpilogue, Index&gt;</a> desc;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a5c2b3e75cb6873762ba3f85487b78579">m</a> = m;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a">n</a> = n;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#ac789a7e5d2db65d006f1e8e3df542a6f">k</a> = k;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a053c2b529be527f510ee317737fbf7e8">alpha</a> = alpha;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332">beta</a> = beta;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447">d_a</a> = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">void</span> const*<span class="keyword">&gt;</span>(d_a);</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789">lda</a> = lda;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b">d_b</a> = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">void</span> const*<span class="keyword">&gt;</span>(d_b);</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe">ldb</a> = ldb;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5">d_c</a> = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">void</span> const*<span class="keyword">&gt;</span>(d_c);</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db">ldc</a> = ldc;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216">d_d</a> = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">void</span>*<span class="keyword">&gt;</span>(d_d);</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;      desc.<a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9">ldd</a> = ldd;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      <span class="keywordflow">return</span> Traits::Params::initialize(desc);</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    }</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  };</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  <span class="keyword">static</span> __host__ cudaError_t <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c">launch</a>(Params <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>,</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;                                     cudaStream_t stream = cudaStreamDefault) {</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <span class="comment">// Setup the grid.</span></div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    dim3 grid;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    grid.x = (<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.m + Traits::OutputTile::kW - 1) / Traits::OutputTile::kW;</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    grid.y = (<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.n + Traits::OutputTile::kH - 1) / Traits::OutputTile::kH;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <span class="comment">// The number of threads.</span></div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    dim3 block;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    block.x = <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">kThreads</a>;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    <span class="comment">// Launch the kernel.</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    <span class="keywordtype">void</span> <span class="keyword">const</span>* params_ = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">void</span> const*<span class="keyword">&gt;</span>(&amp;<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>);</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <span class="keywordflow">return</span> cudaLaunchKernel(reinterpret_cast&lt;void*&gt;(&amp;gemm_kernel&lt;This_&gt;),</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;                            grid,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;                            block,</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;                            const_cast&lt;void**&gt;(&amp;params_),</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;                            0,</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;                            stream);</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  }</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906">  164</a></span>&#160;  <span class="keyword">static</span> __host__ cudaError_t <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906">launch</a>(CUfunction kernel,</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>,</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;                                     CUstream stream = CU_STREAM_LEGACY) {</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    <span class="comment">// Setup the grid.</span></div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    dim3 grid;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    grid.x = (<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.m + Traits::OutputTile::kW - 1) / Traits::OutputTile::kW;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    grid.y = (<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.n + Traits::OutputTile::kH - 1) / Traits::OutputTile::kH;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    <span class="comment">// The number of threads.</span></div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;    dim3 block;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    block.x = <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">kThreads</a>;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    <span class="comment">// Launch the kernel.</span></div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    <span class="keywordtype">void</span>* params_[] = {<span class="keyword">const_cast&lt;</span><span class="keywordtype">void</span>*<span class="keyword">&gt;</span>(<span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">void</span> const*<span class="keyword">&gt;</span>(&amp;<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>))};</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    <span class="comment">// return cudaLaunchKernel(reinterpret_cast&lt;void*&gt;(&amp;gemm_kernel&lt;This_&gt;), grid, block,</span></div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <span class="comment">//  const_cast&lt;void**&gt;(&amp;params_), 0, stream);</span></div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    CUresult result = cuLaunchKernel(</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;        kernel, grid.x, grid.y, grid.z, block.x, block.y, block.z, 0, stream, params_, 0);</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    <span class="keywordflow">if</span> (result != CUDA_SUCCESS) {</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      <span class="keywordflow">return</span> cudaErrorLaunchFailure;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    }</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <span class="keywordflow">return</span> cudaSuccess;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  }</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">  193</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">Gemm</a>(<a class="code" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; params_, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">SharedStorage</a>&amp; shared_storage_)</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>(params_), <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>(shared_storage_) {}</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div><div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">  197</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>() {</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    <span class="comment">// Swizzle the IDs of the block (to enable better cache behavior).</span></div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    <span class="keyword">typename</span> Traits::BlockSwizzle block_swizzle;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    dim3 block = block_swizzle.swizzle();</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;    <span class="comment">// Scale the id.</span></div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;    block.x *= Traits::OutputTile::kW;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;    block.y *= Traits::OutputTile::kH;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;    <span class="comment">// We may want to use shared memory to clear the registers.</span></div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ClearAccumulators <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a>;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;    <span class="comment">// The streams to read A/B from global memory to shared memory.</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    <span class="keyword">typename</span> Traits::GlobalLoadStream global_stream(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>, block);</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    <span class="comment">// Create the accumulator clear.</span></div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a> clear(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>.main_loop.clear);</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::MultiplyAdd MultiplyAdd;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    <span class="comment">// By how much we unroll the main loop.</span></div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> <span class="keyword">const</span> kUnroll = <span class="keyword">static_cast&lt;</span><a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a><span class="keyword">&gt;</span>(MultiplyAdd::AccumulatorsPerWarp::kD);</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <span class="comment">// If we do not have enough steps in the main loop, trigger the residue code.</span></div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.k &lt; kUnroll) {</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      global_stream.residue(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.k, <span class="keyword">true</span>);</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    }</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    <span class="comment">// Fetch the fragments for A and B from global memory.</span></div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    global_stream.copy();</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <span class="comment">// Copy the elements to shared memory (after transformation if needed).</span></div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    global_stream.commit();</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    <span class="comment">// Make sure the data is in shared memory.</span></div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;    Traits::shared_store_fence(<span class="keyword">false</span>);</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;    <span class="comment">// The unrolling steps for the main loop.</span></div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> kUnrollingSteps =</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;        MultiplyAdd::AccumulatorsPerWarp::kD / MultiplyAdd::InstructionShape::kD;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    <span class="comment">// Make sure we have at least 2 unrolling steps or our pipeling is not going to work.</span></div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;    <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(kUnrollingSteps &gt;= 2, <span class="stringliteral">&quot;The pipelining assumes at least two steps&quot;</span>);</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;    <span class="comment">// The stream of data from shared memory to fragments.</span></div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;    <span class="keyword">typename</span> Traits::SharedLoadStream shared_load_stream(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>);</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;    <span class="comment">// Trigger the copy from shared memory for the 1st stream.</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;    shared_load_stream.copy(0);</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    <span class="comment">// Allocate the accumulators.</span></div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;    <span class="keyword">typename</span> MultiplyAdd::Accumulators accumulators;</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;    <span class="comment">// Clear the accumulators.</span></div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;    clear.<a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">clear</a>(accumulators);</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    <span class="comment">// Enter the main loop and iterate.</span></div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Index <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a>;</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;    <span class="keywordflow">for</span> (<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> outer_k = <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.k - kUnroll; outer_k &gt; -kUnroll; outer_k -= kUnroll) {</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      <span class="comment">// If that&#39;s the last &quot;load iteration&quot; update the predicates.</span></div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> is_residue = outer_k &lt;= kUnroll;</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;      <span class="keywordflow">if</span> (is_residue) {</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;        global_stream.residue(outer_k);</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;      }</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;      <span class="comment">// Load data for the next iteration of the main loop.</span></div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;      global_stream.copy();</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;      <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> step = 0; step &lt; kUnrollingSteps - 1; ++step) {</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;        <span class="comment">// Trigger the copy from shared memory for the next A/B values.</span></div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;        shared_load_stream.copy(step + 1);</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;        <span class="comment">// Make sure the values are available for the current iteration to do the multiply-add.</span></div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;        shared_load_stream.commit(step);</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;        <span class="comment">// Do the math on the fragments of the current iteration.</span></div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;        MultiplyAdd <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>;</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>.multiply_add(shared_load_stream.fragment_a(step),</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;                                  shared_load_stream.fragment_b(step),</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;                                  accumulators,</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;                                  accumulators);</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;      }</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;      <span class="comment">// Make sure the data from shared memory has been entirely consumed.</span></div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;      Traits::shared_load_fence(<span class="keyword">true</span>);</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      <span class="comment">// Commit the data in shared memory for A/B.</span></div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      global_stream.commit();</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;      <span class="comment">// Make sure the data is in shared memory.</span></div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;      Traits::shared_store_fence(<span class="keyword">true</span>);</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;      <span class="comment">// Move to the next stage for the load (if it makes sense).</span></div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;      shared_load_stream.inc_stage();</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;      <span class="comment">// Trigger the copy from shared memory for the next loop iteration.</span></div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;      shared_load_stream.copy(0);</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;      <span class="comment">// Make sure the values are available for the current iteration to do the multiply-add.</span></div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;      shared_load_stream.commit(kUnrollingSteps - 1);</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;      <span class="comment">// Do the math on the fragments of the current iteration.</span></div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;      MultiplyAdd <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>;</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>.multiply_add(shared_load_stream.fragment_a(kUnrollingSteps - 1),</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;                                shared_load_stream.fragment_b(kUnrollingSteps - 1),</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;                                accumulators,</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;                                accumulators);</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;    }</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;    <span class="comment">// Epilogue.</span></div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Epilogue Epilogue;</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;    Epilogue epilogue(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.epilogue, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>.epilogue, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.m, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.n);</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;    epilogue.epilogue(<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a>(0, block.y, block.x), accumulators);</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;  }</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;</div><div class="line"><a name="l00311"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">  311</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>;</div><div class="line"><a name="l00313"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">  313</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">SharedStorage</a>&amp; <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>;</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;};</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a></div><div class="ttdef"><b>Definition:</b> gemm.h:56</div></div>
-<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a6b0119ed8d92698dab4de68987c8cc1b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">cutlass::gemm::Gemm::shared_storage</a></div><div class="ttdeci">SharedStorage &amp; shared_storage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm.h:313</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_ae2aa3663f9f6f5708e816dcf7cd66694"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694">cutlass::gemm::Gemm::ScalarD</a></div><div class="ttdeci">Traits::Epilogue::ScalarD ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_ab91b702a9932144b388fad3159130332"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332">cutlass::gemm::GemmDesc::beta</a></div><div class="ttdeci">Scalar_ beta</div><div class="ttdef"><b>Definition:</b> gemm.h:60</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_ac789a7e5d2db65d006f1e8e3df542a6f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#ac789a7e5d2db65d006f1e8e3df542a6f">cutlass::gemm::GemmDesc::k</a></div><div class="ttdeci">Index_ k</div><div class="ttdef"><b>Definition:</b> gemm.h:58</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_ad10627d508fad0efae1fb91b26d7a6b7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">cutlass::gemm::Gemm::SharedStorage</a></div><div class="ttdeci">Traits::SharedStorage SharedStorage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm.h:88</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">cutlass::gemm::Gemm::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm.h:107</div></div>
+<a href="gemm_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;cuda.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Gemm_&gt;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55">   43</a></span>&#160;__global__  <a class="code" href="namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55">__launch_bounds__</a>(Gemm_::kThreads)</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keywordtype">void</span> gemm_kernel(<span class="keyword">typename</span> Gemm_::Params params) {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  <span class="comment">// Declare shared memory.</span></div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  __shared__ <span class="keyword">typename</span> Gemm_::SharedStorage shared_storage;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  <span class="comment">// Construct the GEMM object.</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  Gemm_ gemm(params, shared_storage);</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="comment">// Run GEMM.</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  gemm.multiply_add();</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;}</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Gemm_&gt;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;__global__ <span class="comment">/* __launch_bounds__(Gemm_::kThreads) */</span></div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9">   59</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9">gemm_kernel_nolb</a>(<span class="keyword">typename</span> Gemm_::Params params) {</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="comment">// Declare shared memory.</span></div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  __shared__ <span class="keyword">typename</span> Gemm_::SharedStorage shared_storage;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="comment">// Construct the GEMM object.</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  Gemm_ gemm(params, shared_storage);</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="comment">// Run GEMM.</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  gemm.multiply_add();</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;}</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Gemm, <span class="keywordtype">bool</span> WithLaunchBounds&gt;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Launch.html">   73</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1Launch.html">Launch</a> {</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Launch.html#a8552a524b9419f60bf8ef3c6b8528d27">   74</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1Launch.html#a8552a524b9419f60bf8ef3c6b8528d27">Launch</a>(<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Gemm::Params</a> params, dim3 grid, dim3 block, cudaStream_t stream = 0) {</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    gemm_kernel&lt;Gemm&gt;&lt;&lt;&lt; grid, block, 0, stream &gt;&gt;&gt;(params);</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  }</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;};</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Gemm&gt;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html">   83</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1Launch.html">Launch</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a>, false&gt; {</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#ab7a89806834a5fa8022daae4180e6180">   84</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#ab7a89806834a5fa8022daae4180e6180">Launch</a>(<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Gemm::Params</a> params, dim3 grid, dim3 block, cudaStream_t stream = 0) {</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    gemm_kernel_nolb&lt;Gemm&gt;&lt;&lt;&lt; grid, block, 0, stream &gt;&gt;&gt;(params);</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  }</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;};</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmTraits_&gt;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html">   92</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a> {</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317">   94</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm&lt;GemmTraits_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317">This_</a>;</div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff">   96</a></span>&#160;  <span class="keyword">typedef</span> GemmTraits_ <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff">Traits</a>;</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">   98</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedStorage <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">SharedStorage</a>;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">  101</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">ScalarA</a>;</div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">  103</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">ScalarB</a>;</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">  105</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Epilogue::Scalar <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">ScalarEpilogue</a>;</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">  107</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Epilogue::ScalarC <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">ScalarC</a>;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694">  109</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Epilogue::ScalarD <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694">ScalarD</a>;</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">  111</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Index <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a>;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">  114</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::MultiplyAdd <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">MultiplyAdd</a>;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">  117</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">kThreads</a> = Traits::GemmConfig::kThreads;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="comment">// Number of warp-level multiply-accumulate steps executed by each warp.</span></div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">  120</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">kWarpGemmSteps</a> =</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;      Traits::GemmConfig::AccumulatorsPerWarp::kD / MultiplyAdd::InstructionShape::kD;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="comment">// Make sure we have at least 2 unrolling steps or our pipeling is not going to work.</span></div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">  124</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">kWarpGemmSteps</a> &gt;= 2, <span class="stringliteral">&quot;The pipelining assumes at least two steps&quot;</span>);</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Params <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a>;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;<span class="comment">// Static function members</span></div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="keyword">static</span> __host__ cudaError_t <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c">launch</a>(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>,</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;                                     cudaStream_t stream = cudaStreamDefault) {</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="comment">// Launch the kernel.</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1Launch.html">Launch&lt;This_, GemmTraits_::GemmConfig::kLaunchBounds&gt;</a>(</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.grid, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.block, stream);</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <span class="keywordflow">return</span> cudaGetLastError();</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  }</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906">  147</a></span>&#160;  <span class="keyword">static</span> __host__ cudaError_t <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906">launch</a>(CUfunction kernel,</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>,</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;                                     CUstream stream = CU_STREAM_LEGACY) {</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    <span class="comment">// Launch the kernel.</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    <span class="keywordtype">void</span>* params_[] = {<span class="keyword">const_cast&lt;</span><span class="keywordtype">void</span>*<span class="keyword">&gt;</span>(<span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">void</span> const*<span class="keyword">&gt;</span>(&amp;<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>))};</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    CUresult result = cuLaunchKernel(</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;        kernel,</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.grid.x, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.grid.y, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.grid.z,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.block.x, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.block.y, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.block.z,</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;        0, stream, params_, 0);</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    <span class="keywordflow">if</span> (result != CUDA_SUCCESS) {</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      <span class="keywordflow">return</span> cudaErrorLaunchFailure;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    }</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <span class="keywordflow">return</span> cudaSuccess;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  }</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">  173</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">Gemm</a>(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> <span class="keyword">const</span>&amp; params_, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">SharedStorage</a>&amp; shared_storage_)</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>(params_), <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>(shared_storage_) {}</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> Res<span class="keywordtype">id</span>ue, <span class="keywordtype">bool</span> LastIteration&gt;</div><div class="line"><a name="l00178"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#af8bb78ae198af4dccb0241da44428053">  178</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#af8bb78ae198af4dccb0241da44428053">consume_tile</a>(<span class="keyword">typename</span> Traits::GlobalLoadStream&amp; global_to_shared_stream,</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;                                   <span class="keyword">typename</span> Traits::SharedStream&amp; shared_load_stream,</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;                                   <span class="keyword">typename</span> MultiplyAdd::Accumulators&amp; accumulators,</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;                                   <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> outer_k) {</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="comment">// If residue portion and not calculating residue in prolog, update residue predicates now.</span></div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keywordflow">if</span> (Residue &amp;&amp; outer_k &lt;= Traits::OutputTile::kD) {</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;      global_to_shared_stream.residue(outer_k);</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    }</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <span class="comment">// Load data for the next iteration of the main loop (unless it&#39;s the last iteration).</span></div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    <span class="keywordflow">if</span> (!LastIteration) {</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;      global_to_shared_stream.copy();</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    }</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> step = 0; step &lt; <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">kWarpGemmSteps</a> - 1; ++step) {</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;      <span class="comment">// Trigger the copy from shared memory for the next A/B values.</span></div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      shared_load_stream.copy(step + 1);</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;      <span class="comment">// Make sure the values are available for the current iteration to do the multiply-add.</span></div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;      shared_load_stream.commit(step);</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">MultiplyAdd</a> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      <span class="comment">// Do the math on the fragments of the current iteration.</span></div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>.multiply_add(shared_load_stream.fragment_a(step),</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;                                shared_load_stream.fragment_b(step),</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;                                accumulators,</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;                                accumulators);</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    }</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;    <span class="comment">// Make sure the data from shared memory has been entirely consumed.</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    Traits::shared_load_fence(<span class="keyword">true</span>);</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    <span class="comment">// Commit the data in shared memory for A/B.</span></div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <span class="keywordflow">if</span> (!LastIteration) {</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      global_to_shared_stream.commit();</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    }</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    <span class="comment">// Make sure the data is in shared memory.</span></div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;    Traits::shared_store_fence(<span class="keyword">true</span>);</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <span class="keywordflow">if</span> (!LastIteration) {</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      <span class="comment">// Move to the next stage for the load (if it makes sense).</span></div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;      shared_load_stream.inc_stage();</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;      <span class="comment">// Trigger the copy from shared memory for the next loop iteration.</span></div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      shared_load_stream.copy(0);</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    }</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    <span class="comment">// Make sure the values are available for the current iteration to do the multiply-add.</span></div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    shared_load_stream.commit(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">kWarpGemmSteps</a> - 1);</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;    <span class="comment">// Do the math on the fragments of the current iteration.</span></div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">MultiplyAdd</a> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>.multiply_add(shared_load_stream.fragment_a(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">kWarpGemmSteps</a> - 1),</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;                              shared_load_stream.fragment_b(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">kWarpGemmSteps</a> - 1),</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;                              accumulators,</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;                              accumulators);</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;  }</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">  237</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>() {</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    <span class="comment">// Swizzle the IDs of the block (to enable better cache behavior).</span></div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    <span class="keyword">typename</span> Traits::BlockSwizzle block_swizzle;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> threadblock_offset =</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;        block_swizzle.get_threadblock_offset(make_Coord_from_shape&lt;Traits::OutputTile&gt;());</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;    <span class="comment">// We may want to use shared memory to clear the registers.</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ClearAccumulators <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a>;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;    <span class="comment">// The streams to read A/B from global memory to shared memory.</span></div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;    <span class="keyword">typename</span> Traits::GlobalLoadStream global_to_shared_stream(</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.global_to_shared_stream,</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>.main_loop.global_to_shared_stream,</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>.main_loop.threadblock_tile.reference(),</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.problem_size.knm(),</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;        threadblock_offset);</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    <span class="comment">// update A and B pointer offset based on batch_id and batch_stride_offset</span></div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;    <span class="comment">//global_to_shared_stream.add_pointer_offset(block_swizzle.get_batch_id(), params.batch_stride_A, params.batch_stride_B);</span></div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    global_to_shared_stream += <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(block_swizzle.get_batch_id(), 0, 0);</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    <span class="comment">// Create the accumulator clear.</span></div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a> clear;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    <span class="comment">// Deal with residue in prolog.</span></div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    global_to_shared_stream.move_to_residue(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.problem_size[0], Traits::OutputTile::kD);</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    <span class="comment">// Fetch the fragments for A and B from global memory.</span></div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;    global_to_shared_stream.copy();</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;    <span class="comment">// Copy the elements to shared memory (after transformation if needed).</span></div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    global_to_shared_stream.commit();</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;    <span class="comment">// Make sure the data is in shared memory.</span></div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;    Traits::shared_store_fence(<span class="keyword">false</span>);</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;    <span class="comment">// Rollback to the beginning of the first tile (if residue exists).</span></div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;    global_to_shared_stream.rollback(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.problem_size[0] % Traits::OutputTile::kD);</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;    <span class="comment">// The stream of data from shared memory to fragments.</span></div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;    <span class="keyword">typename</span> Traits::SharedStream shared_load_stream(</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.shared_stream,</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>.main_loop.threadblock_tile.reference());</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;    <span class="comment">// Trigger the copy from shared memory for the 1st stream.</span></div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;    shared_load_stream.copy(0);</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;    <span class="comment">// Allocate the accumulators.</span></div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;    <span class="keyword">typename</span> MultiplyAdd::Accumulators accumulators;</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;    <span class="comment">// Clear the accumulators.</span></div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;    clear.clear(accumulators);</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;    <span class="comment">// Initial index</span></div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> outer_k = <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.problem_size[0] - Traits::OutputTile::kD;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;    <span class="comment">// Check if we are computing residue in prolog or not.</span></div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;    <span class="keywordflow">if</span> (Traits::GemmConfig::kResidueInProlog) {</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;      <span class="comment">// Execute all mainloop iterations but the last one.</span></div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;      <a class="code" href="cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71">CUTLASS_GEMM_LOOP</a></div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;      <span class="keywordflow">for</span> (; outer_k &gt; 0; outer_k -= Traits::OutputTile::kD) {</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;        consume_tile&lt;false, false&gt;(</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;            global_to_shared_stream, shared_load_stream, accumulators, outer_k);</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;      }</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;      <span class="comment">// Don&#39;t load data for the last &quot;residue&quot; portion since we&#39;ve already computed the residue.</span></div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;      <a class="code" href="cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71">CUTLASS_GEMM_LOOP</a></div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;      <span class="keywordflow">for</span> (; outer_k &gt; -Traits::OutputTile::kD; outer_k -= Traits::OutputTile::kD) {</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;        consume_tile&lt;false, true&gt;(</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;            global_to_shared_stream, shared_load_stream, accumulators, outer_k);</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;      }</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;      <span class="comment">// When kResidueSeparate = true, execute all mainloop iterations but the last two without any</span></div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      <span class="comment">// consideration for K-residue or predicate updates. This improves the steady state of some</span></div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;      <span class="comment">// kernels.</span></div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;      <span class="keywordflow">if</span> (Traits::GemmConfig::kResidueSeparate) {</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;        <a class="code" href="cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71">CUTLASS_GEMM_LOOP</a></div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;        <span class="keywordflow">for</span> (; outer_k &gt; Traits::OutputTile::kD; outer_k -= Traits::OutputTile::kD) {</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;          consume_tile&lt;false, false&gt;(</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;              global_to_shared_stream, shared_load_stream, accumulators, outer_k);</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;        }</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;      }</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;      <span class="comment">// Execute remaining tiles with K-residue predicate updates enabled.</span></div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;      <a class="code" href="cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71">CUTLASS_GEMM_LOOP</a></div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;      <span class="keywordflow">for</span> (; outer_k &gt; -Traits::OutputTile::kD; outer_k -= Traits::OutputTile::kD) {</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;        consume_tile&lt;true, false&gt;(</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;            global_to_shared_stream, shared_load_stream, accumulators, outer_k);</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;      }</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;    }</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;    <span class="comment">// Epilogue.</span></div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Epilogue Epilogue;</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    Epilogue epilogue(<a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.epilogue, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>.epilogue, <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>.problem_size.knm());</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;    epilogue.epilogue(accumulators, threadblock_offset, block_swizzle.get_batch_id());</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;  }</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;</div><div class="line"><a name="l00347"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">  347</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>;</div><div class="line"><a name="l00349"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">  349</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">SharedStorage</a>&amp; <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a>;</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;};</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a6b0119ed8d92698dab4de68987c8cc1b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">cutlass::gemm::Gemm::shared_storage</a></div><div class="ttdeci">SharedStorage &amp; shared_storage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm.h:349</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_ae2aa3663f9f6f5708e816dcf7cd66694"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694">cutlass::gemm::Gemm::ScalarD</a></div><div class="ttdeci">Traits::Epilogue::ScalarD ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm.h:109</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_ad10627d508fad0efae1fb91b26d7a6b7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">cutlass::gemm::Gemm::SharedStorage</a></div><div class="ttdeci">Traits::SharedStorage SharedStorage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm.h:98</div></div>
 <div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a3c292637ab0ec8e73856d0cf6efb6da2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">cutlass::gemm::Gemm::params</a></div><div class="ttdeci">Params const  &amp; params</div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm.h:311</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a5c2b3e75cb6873762ba3f85487b78579"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a5c2b3e75cb6873762ba3f85487b78579">cutlass::gemm::GemmDesc::m</a></div><div class="ttdeci">Index_ m</div><div class="ttdoc">The dimensions of the GEMM. </div><div class="ttdef"><b>Definition:</b> gemm.h:58</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a71f0c91768a1a87e94030c8c2db51e55"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">cutlass::gemm::Gemm::ScalarC</a></div><div class="ttdeci">Traits::Epilogue::ScalarC ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm.h:97</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a7591ce0223b0d05c4d6fca6c67b98bfe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe">cutlass::gemm::GemmDesc::ldb</a></div><div class="ttdeci">Index_ ldb</div><div class="ttdoc">The stride for B. </div><div class="ttdef"><b>Definition:</b> gemm.h:68</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Launch_html_a8552a524b9419f60bf8ef3c6b8528d27"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Launch.html#a8552a524b9419f60bf8ef3c6b8528d27">cutlass::gemm::Launch::Launch</a></div><div class="ttdeci">Launch(typename Gemm::Params params, dim3 grid, dim3 block, cudaStream_t stream=0)</div><div class="ttdef"><b>Definition:</b> gemm.h:74</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a3c292637ab0ec8e73856d0cf6efb6da2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">cutlass::gemm::Gemm::params</a></div><div class="ttdeci">Params const  &amp; params</div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm.h:347</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a71f0c91768a1a87e94030c8c2db51e55"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55">cutlass::gemm::Gemm::ScalarC</a></div><div class="ttdeci">Traits::Epilogue::ScalarC ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm.h:107</div></div>
 <div class="ttc" id="platform_8h_html"><div class="ttname"><a href="platform_8h.html">platform.h</a></div><div class="ttdoc">C++ features that may be otherwise unimplemented for CUDA device functions. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a2e844037d2527b842de3590cb783a49f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">cutlass::gemm::Gemm::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add()</div><div class="ttdoc">Do the GEMM. </div><div class="ttdef"><b>Definition:</b> gemm.h:197</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a29f52e33e1f1cf150f5062d9ad2590ff"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff">cutlass::gemm::Gemm::Traits</a></div><div class="ttdeci">GemmTraits_ Traits</div><div class="ttdoc">The traits. </div><div class="ttdef"><b>Definition:</b> gemm.h:86</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a9349fc5f20215c1c6508e250b0b4e936"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">cutlass::gemm::Gemm::ScalarEpilogue</a></div><div class="ttdeci">Traits::Epilogue::Scalar ScalarEpilogue</div><div class="ttdoc">The scalar in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm.h:95</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_acee9727aa6cb612a25cd6ced4829061a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a">cutlass::gemm::GemmDesc::n</a></div><div class="ttdeci">Index_ n</div><div class="ttdef"><b>Definition:</b> gemm.h:58</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_ae6f11bb666c2c8510e99200a2c0fc2f4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">cutlass::gemm::Gemm::ScalarB</a></div><div class="ttdeci">Traits::ScalarB ScalarB</div><div class="ttdoc">The scalar for B. </div><div class="ttdef"><b>Definition:</b> gemm.h:93</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4_html_ab7a89806834a5fa8022daae4180e6180"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#ab7a89806834a5fa8022daae4180e6180">cutlass::gemm::Launch&lt; Gemm, false &gt;::Launch</a></div><div class="ttdeci">Launch(typename Gemm::Params params, dim3 grid, dim3 block, cudaStream_t stream=0)</div><div class="ttdef"><b>Definition:</b> gemm.h:84</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a2e844037d2527b842de3590cb783a49f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">cutlass::gemm::Gemm::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add()</div><div class="ttdoc">Do the GEMM. </div><div class="ttdef"><b>Definition:</b> gemm.h:237</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a29f52e33e1f1cf150f5062d9ad2590ff"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff">cutlass::gemm::Gemm::Traits</a></div><div class="ttdeci">GemmTraits_ Traits</div><div class="ttdoc">The traits. </div><div class="ttdef"><b>Definition:</b> gemm.h:96</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a9349fc5f20215c1c6508e250b0b4e936"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936">cutlass::gemm::Gemm::ScalarEpilogue</a></div><div class="ttdeci">Traits::Epilogue::Scalar ScalarEpilogue</div><div class="ttdoc">The scalar in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm.h:105</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_af8bb78ae198af4dccb0241da44428053"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#af8bb78ae198af4dccb0241da44428053">cutlass::gemm::Gemm::consume_tile</a></div><div class="ttdeci">CUTLASS_DEVICE void consume_tile(typename Traits::GlobalLoadStream &amp;global_to_shared_stream, typename Traits::SharedStream &amp;shared_load_stream, typename MultiplyAdd::Accumulators &amp;accumulators, Index outer_k)</div><div class="ttdoc">Computes a warp-level GEMM on data held in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm.h:178</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_ae6f11bb666c2c8510e99200a2c0fc2f4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">cutlass::gemm::Gemm::ScalarB</a></div><div class="ttdeci">Traits::ScalarB ScalarB</div><div class="ttdoc">The scalar for B. </div><div class="ttdef"><b>Definition:</b> gemm.h:103</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators.html">cutlass::gemm::ClearAccumulators</a></div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:38</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a30326e2d81c8e154d749f35837903216"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216">cutlass::gemm::GemmDesc::d_d</a></div><div class="ttdeci">void * d_d</div><div class="ttdoc">The destination matrix D. </div><div class="ttdef"><b>Definition:</b> gemm.h:74</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a></div><div class="ttdef"><b>Definition:</b> gemm.h:82</div></div>
-<div class="ttc" id="cutlass_8h_html_a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><div class="ttname"><a href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="ttdeci">#define CUTLASS_PRAGMA_UNROLL</div><div class="ttdef"><b>Definition:</b> cutlass.h:60</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a4f4122a2ae8b9b09a9660e5c2ca9e906"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906">cutlass::gemm::Gemm::launch</a></div><div class="ttdeci">static __host__ cudaError_t launch(CUfunction kernel, Params const &amp;params, CUstream stream=CU_STREAM_LEGACY)</div><div class="ttdoc">Launch the kernel. </div><div class="ttdef"><b>Definition:</b> gemm.h:164</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_aae63781de41962f496da469684919447"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447">cutlass::gemm::GemmDesc::d_a</a></div><div class="ttdeci">void const  * d_a</div><div class="ttdoc">The source matrix A. </div><div class="ttdef"><b>Definition:</b> gemm.h:62</div></div>
-<div class="ttc" id="namespacecutlass_1_1gemm_html_ad9577c9086b0f7fd1202d7f8109e4439"><div class="ttname"><a href="namespacecutlass_1_1gemm.html#ad9577c9086b0f7fd1202d7f8109e4439">cutlass::gemm::gemm_kernel</a></div><div class="ttdeci">__global__ void gemm_kernel(typename Gemm_::Params params)</div><div class="ttdef"><b>Definition:</b> gemm.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_1_1Params_html_ac00c9d78a187d9c7d53399f971c0e129"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html#ac00c9d78a187d9c7d53399f971c0e129">cutlass::gemm::Gemm::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Index m, Index n, Index k, ScalarEpilogue alpha, ScalarA const *d_a, Index lda, ScalarB const *d_b, Index ldb, ScalarEpilogue beta, ScalarC const *d_c, Index ldc, ScalarD *d_d, Index ldd)</div><div class="ttdef"><b>Definition:</b> gemm.h:108</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a62ad30ba419ccb661e6700da98221789"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789">cutlass::gemm::GemmDesc::lda</a></div><div class="ttdeci">Index_ lda</div><div class="ttdoc">The stride for A. </div><div class="ttdef"><b>Definition:</b> gemm.h:64</div></div>
-<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a26c13e8bbad805760443ef6df475e317"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317">cutlass::gemm::Gemm::This_</a></div><div class="ttdeci">Gemm&lt; GemmTraits_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> gemm.h:84</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a0f492560cabc45cd492da65b819d09db"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db">cutlass::gemm::GemmDesc::ldc</a></div><div class="ttdeci">Index_ ldc</div><div class="ttdoc">The stride for C. </div><div class="ttdef"><b>Definition:</b> gemm.h:72</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a8bff0bd32aec05f8c1e282024be0bcfd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">cutlass::gemm::Gemm::Gemm</a></div><div class="ttdeci">CUTLASS_DEVICE Gemm(Params const &amp;params_, SharedStorage &amp;shared_storage_)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm.h:193</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a3280e5c5484f5c10d1412bcb70eb77e9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9">cutlass::gemm::GemmDesc::ldd</a></div><div class="ttdeci">Index_ ldd</div><div class="ttdoc">The stride for D. </div><div class="ttdef"><b>Definition:</b> gemm.h:76</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a6fcf9daef57558e1bb932c6eba99721b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">cutlass::gemm::Gemm::ScalarA</a></div><div class="ttdeci">Traits::ScalarA ScalarA</div><div class="ttdoc">The scalar for A. </div><div class="ttdef"><b>Definition:</b> gemm.h:91</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_html_adb8026a19b09e9a581ec767c2c2da4ab"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">cutlass::gemm::ClearAccumulators::clear</a></div><div class="ttdeci">CUTLASS_DEVICE void clear(Fragment_ &amp;fragment)</div><div class="ttdoc">Clear the fragment. </div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:47</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a41239809be4ebc730dd8ff28c9efc58b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">cutlass::gemm::Gemm::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">The number of threads. </div><div class="ttdef"><b>Definition:</b> gemm.h:104</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a053c2b529be527f510ee317737fbf7e8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a053c2b529be527f510ee317737fbf7e8">cutlass::gemm::GemmDesc::alpha</a></div><div class="ttdeci">Scalar_ alpha</div><div class="ttdoc">The alpha/beta scaling values. </div><div class="ttdef"><b>Definition:</b> gemm.h:60</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_aa2b3126c082d04fd31521cb0e84cf4d5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5">cutlass::gemm::GemmDesc::d_c</a></div><div class="ttdeci">void const  * d_c</div><div class="ttdoc">The source matrix C. </div><div class="ttdef"><b>Definition:</b> gemm.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a77ae137aec79b4061a9ffa09aabf641c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c">cutlass::gemm::Gemm::launch</a></div><div class="ttdeci">static __host__ cudaError_t launch(Params const &amp;params, cudaStream_t stream=cudaStreamDefault)</div><div class="ttdoc">Launch the kernel. </div><div class="ttdef"><b>Definition:</b> gemm.h:141</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a0aca711d07245f3071adeb1111fedd34"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">cutlass::gemm::Gemm::Index</a></div><div class="ttdeci">Traits::Index Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm.h:101</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a05915032eba39bc9b085bec5ff17257b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b">cutlass::gemm::GemmDesc::d_b</a></div><div class="ttdeci">void const  * d_b</div><div class="ttdoc">The source matrix B. </div><div class="ttdef"><b>Definition:</b> gemm.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a></div><div class="ttdef"><b>Definition:</b> gemm.h:92</div></div>
+<div class="ttc" id="cutlass_8h_html_a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><div class="ttname"><a href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="ttdeci">#define CUTLASS_PRAGMA_UNROLL</div><div class="ttdef"><b>Definition:</b> cutlass.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_ab806302d059fc7cd113ec0b5ab5a9835"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">cutlass::gemm::Gemm::MultiplyAdd</a></div><div class="ttdeci">Traits::MultiplyAdd MultiplyAdd</div><div class="ttdoc">Define the mainloop iteration size. </div><div class="ttdef"><b>Definition:</b> gemm.h:114</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a4f4122a2ae8b9b09a9660e5c2ca9e906"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906">cutlass::gemm::Gemm::launch</a></div><div class="ttdeci">static __host__ cudaError_t launch(CUfunction kernel, Params const &amp;params, CUstream stream=CU_STREAM_LEGACY)</div><div class="ttdoc">Launch the kernel. </div><div class="ttdef"><b>Definition:</b> gemm.h:147</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_ada54b3bc2005ed919dbdda9d500a2356"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">cutlass::gemm::Gemm::kWarpGemmSteps</a></div><div class="ttdeci">static Index const kWarpGemmSteps</div><div class="ttdef"><b>Definition:</b> gemm.h:120</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Launch_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Launch.html">cutlass::gemm::Launch</a></div><div class="ttdoc">Partial specialization for launching the GEMM kernel with or without launch bounds. </div><div class="ttdef"><b>Definition:</b> gemm.h:73</div></div>
+<div class="ttc" id="namespacecutlass_1_1gemm_html_a01dd61085e2b3f578a7fc266b94fac55"><div class="ttname"><a href="namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55">cutlass::gemm::__launch_bounds__</a></div><div class="ttdeci">__global__ __launch_bounds__(Gemm_::kThreads) void gemm_kernel(typename Gemm_</div><div class="ttdoc">GEMM kernel with launch bounds specified. </div><div class="ttdef"><b>Definition:</b> gemm.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a26c13e8bbad805760443ef6df475e317"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317">cutlass::gemm::Gemm::This_</a></div><div class="ttdeci">Gemm&lt; GemmTraits_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> gemm.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a8bff0bd32aec05f8c1e282024be0bcfd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">cutlass::gemm::Gemm::Gemm</a></div><div class="ttdeci">CUTLASS_DEVICE Gemm(Params const &amp;params_, SharedStorage &amp;shared_storage_)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm.h:173</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a6fcf9daef57558e1bb932c6eba99721b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">cutlass::gemm::Gemm::ScalarA</a></div><div class="ttdeci">Traits::ScalarA ScalarA</div><div class="ttdoc">The scalar for A. </div><div class="ttdef"><b>Definition:</b> gemm.h:101</div></div>
+<div class="ttc" id="namespacecutlass_1_1gemm_html_ae23b870e60261e2322f3c6edb3d2bcb9"><div class="ttname"><a href="namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9">cutlass::gemm::gemm_kernel_nolb</a></div><div class="ttdeci">__global__ void gemm_kernel_nolb(typename Gemm_::Params params)</div><div class="ttdoc">GEMM kernel without launch bounds specified. </div><div class="ttdef"><b>Definition:</b> gemm.h:59</div></div>
+<div class="ttc" id="cutlass_8h_html_a8e18ced39c05ab3304bb4fcdc0cc9f71"><div class="ttname"><a href="cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71">CUTLASS_GEMM_LOOP</a></div><div class="ttdeci">#define CUTLASS_GEMM_LOOP</div><div class="ttdef"><b>Definition:</b> cutlass.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a41239809be4ebc730dd8ff28c9efc58b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">cutlass::gemm::Gemm::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">The number of threads. </div><div class="ttdef"><b>Definition:</b> gemm.h:117</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a054d5e87f1985ae7e53fc07f4c16d916"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">cutlass::gemm::Gemm::Params</a></div><div class="ttdeci">Traits::Params Params</div><div class="ttdoc">Use the params object defined in traits. </div><div class="ttdef"><b>Definition:</b> gemm.h:124</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a77ae137aec79b4061a9ffa09aabf641c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c">cutlass::gemm::Gemm::launch</a></div><div class="ttdeci">static __host__ cudaError_t launch(Params const &amp;params, cudaStream_t stream=cudaStreamDefault)</div><div class="ttdoc">Support for NVRTC. </div><div class="ttdef"><b>Definition:</b> gemm.h:136</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html_a0aca711d07245f3071adeb1111fedd34"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">cutlass::gemm::Gemm::Index</a></div><div class="ttdeci">Traits::Index Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm.h:111</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__config_8h.html b/docs/gemm__config_8h.html
new file mode 100644
index 000000000..62f36540b
--- /dev/null
+++ b/docs/gemm__config_8h.html
@@ -0,0 +1,109 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: gemm_config.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">gemm_config.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Defines properties of GEMM computation that impose some constraints on caller.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&quot;</code><br />
+</div>
+<p><a href="gemm__config_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/gemm__config_8h_source.html b/docs/gemm__config_8h_source.html
new file mode 100644
index 000000000..847e6f7b4
--- /dev/null
+++ b/docs/gemm__config_8h_source.html
@@ -0,0 +1,123 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: gemm_config.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">gemm_config.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="gemm__config_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *   * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *   * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *     provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *   * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *     permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;    <span class="keyword">typename</span> ScalarA_,</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;    <span class="keyword">typename</span> ScalarB_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;    <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keyword">typename</span> ScalarD_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keyword">typename</span> MultiplyAdd_,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <span class="keywordtype">int</span> kScalarsPerStsA_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdsA_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <span class="keywordtype">int</span> kScalarsPerStsB_,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdsB_,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgCAndStgD_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keywordtype">int</span> kScalarsPerStsD_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdsD_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keywordtype">int</span> kStages_,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <span class="keywordtype">bool</span> kResidueSeparate_ = <span class="keyword">false</span>,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <span class="keywordtype">bool</span> kResidueInProlog_ = <span class="keyword">false</span>,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keywordtype">bool</span> kLaunchBounds_ = <span class="keyword">true</span>&gt;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html">   76</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a> {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">   79</a></span>&#160;<span class="comment"></span>  <span class="keyword">typedef</span> ScalarA_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a>;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">   81</a></span>&#160;  <span class="keyword">typedef</span> ScalarB_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a>;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">   83</a></span>&#160;  <span class="keyword">typedef</span> ScalarC_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a>;</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">   85</a></span>&#160;  <span class="keyword">typedef</span> ScalarD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a>;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">   88</a></span>&#160;  <span class="keyword">typedef</span> OutputTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a>;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">   90</a></span>&#160;  <span class="keyword">typedef</span> MultiplyAdd_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a>;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">   92</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">MultiplyAdd::InstructionShape</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a>;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">   94</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">MultiplyAdd::AccumulatorsPerWarp</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a>;</div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">   96</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html">MultiplyAdd::Accumulators</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">   99</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">ShapeDiv&lt;OutputTile, AccumulatorsPerWarp&gt;::Shape</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a>;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">  101</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a> = cutlass::kWarpSize;</div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">  103</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a> = <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Warps&gt;::kCount</a> * <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a>;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">  106</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a> = kScalarsPerLdgA_;</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">  107</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a> = kScalarsPerStsA_;</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">  108</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a> = kScalarsPerLdsA_;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">  111</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a> = kScalarsPerLdgB_;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">  112</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a> = kScalarsPerStsB_;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">  113</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a> = kScalarsPerLdsB_;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">  116</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a> = kScalarsPerLdgCAndStgD_;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">  119</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a> = kScalarsPerLdgCAndStgD_;</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">  120</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a> = kScalarsPerStsD_;</div><div class="line"><a name="l00121"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">  121</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a> = kScalarsPerLdsD_;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">  124</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a> / InstructionShape::kD;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">  125</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a> / InstructionShape::kD;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">  128</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a> = kStages_;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <span class="comment">// updates and is more efficient for some kernels. If false, only a single mainloop is</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  <span class="comment">// instantaited.</span></div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">  133</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a> = kResidueSeparate_;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">  136</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a> = kResidueInProlog_;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">  139</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a> = kLaunchBounds_;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;};</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_acf461f0ba3067cc5d66a04f0a176308f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">cutlass::gemm::GemmConfig::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">The numnber of threads. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:103</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a9b987cfb25a32e671a47cb6376a361f3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">cutlass::gemm::GemmConfig::Warps</a></div><div class="ttdeci">ShapeDiv&lt; OutputTile, AccumulatorsPerWarp &gt;::Shape Warps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_ad83132bd03f8bd844487d1a9da908c8b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">cutlass::gemm::GemmConfig::InstructionShape</a></div><div class="ttdeci">MultiplyAdd::InstructionShape InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:92</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aa549183981095a3e604974e909a7d396"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">cutlass::gemm::GemmConfig::kWarpSize</a></div><div class="ttdeci">static int const kWarpSize</div><div class="ttdoc">The default warp size (32 threads per warp). </div><div class="ttdef"><b>Definition:</b> gemm_config.h:101</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a26942561aa111089b3ba0f12cf233951"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">cutlass::gemm::GemmConfig::kScalarsPerLdsD</a></div><div class="ttdeci">static int const kScalarsPerLdsD</div><div class="ttdef"><b>Definition:</b> gemm_config.h:121</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_ade9d3c2aeb0e4d73e04a5e9a06ce5203"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">cutlass::gemm::GemmConfig::kScalarsPerStgD</a></div><div class="ttdeci">static int const kScalarsPerStgD</div><div class="ttdoc">The number of scalars per STS/LDS/STG for D. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:119</div></div>
+<div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aff7409a9d2666159435d3b9db16443bc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">cutlass::gemm::GemmConfig::kScalarsPerLdgB</a></div><div class="ttdeci">static int const kScalarsPerLdgB</div><div class="ttdoc">The number of scalars per LDG/STS/LDS for B. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:111</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a30d9cfbbede42166e4e1964145dfe05d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">cutlass::gemm::GemmConfig::ScalarC</a></div><div class="ttdeci">ScalarC_ ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:83</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a9f90f91f9e5e40496e8a88eb657fd591"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">cutlass::gemm::GemmConfig::Accumulators</a></div><div class="ttdeci">MultiplyAdd::Accumulators Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:96</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_ab26d76515e394118bfc530d6a81b9508"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">cutlass::gemm::GemmConfig::kStages</a></div><div class="ttdeci">static int const kStages</div><div class="ttdoc">The number of stages in shared memory to implement double, triple, more-buffering. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:128</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a9f706e141ec3bc880fa17a5731d8370e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerWarp</a></div><div class="ttdeci">ShapeMul&lt; ThreadGemmShape, ThreadsPerWarp &gt;::Shape AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:54</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a600746def904eeca46d7f92a4b223b46"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">cutlass::gemm::GemmConfig::kResidueInProlog</a></div><div class="ttdeci">static bool const kResidueInProlog</div><div class="ttdoc">If true, residue is computed in the prologue. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:136</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a54e252cedbfee75e7c4ac2f7fe5ce45b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">cutlass::gemm::GemmConfig::kLaunchBounds</a></div><div class="ttdeci">static bool const kLaunchBounds</div><div class="ttdoc">If true, kernel is launched with launch bounds specified. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:139</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aedb95febe4a0b2943e233c95c36a22cd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">cutlass::gemm::GemmConfig::MultiplyAdd</a></div><div class="ttdeci">MultiplyAdd_ MultiplyAdd</div><div class="ttdoc">The functor to do D = A*B + C. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aeb740e4ab9f93f29f1b8ab43ebef68eb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">cutlass::gemm::GemmConfig::kAccumulatorsPerLdsB</a></div><div class="ttdeci">static int const kAccumulatorsPerLdsB</div><div class="ttdef"><b>Definition:</b> gemm_config.h:125</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeDiv_html_a108ded386ef6708afc6fe769a77a234b"><div class="ttname"><a href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">cutlass::ShapeDiv::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD/B_::kD, A_::kH/B_::kH, A_::kW/B_::kW, A_::kC/B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:126</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aa97b0e7f369f927c4db6d683dbb7f53b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">cutlass::gemm::GemmConfig::ScalarA</a></div><div class="ttdeci">ScalarA_ ScalarA</div><div class="ttdoc">The scalar for A. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:79</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a64c1e0d794c1bdfa8b2f3a53e387155c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">cutlass::gemm::GemmConfig::kResidueSeparate</a></div><div class="ttdeci">static bool const kResidueSeparate</div><div class="ttdoc">If true, mainloop is instantiated twice. The first instantiation contains no predicate. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:133</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_config.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a32a8979ff618f069665708c7771c3cc3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">cutlass::gemm::GemmConfig::AccumulatorsPerWarp</a></div><div class="ttdeci">MultiplyAdd::AccumulatorsPerWarp AccumulatorsPerWarp</div><div class="ttdoc">The shape of warp-level GEMM. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a9ccd14b44a22dfdfeefabe1e643da65e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">cutlass::gemm::GemmConfig::kScalarsPerLdsB</a></div><div class="ttdeci">static int const kScalarsPerLdsB</div><div class="ttdef"><b>Definition:</b> gemm_config.h:113</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a9c3985d8de485d76a5d72c91c3e3aaff"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">cutlass::gemm::GemmConfig::kScalarsPerLdgC</a></div><div class="ttdeci">static int const kScalarsPerLdgC</div><div class="ttdoc">The number of scalars per LDG for C. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:116</div></div>
+<div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a82295105d7ccbcce057b4c57632a644b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">cutlass::gemm::GemmConfig::kScalarsPerLdsA</a></div><div class="ttdeci">static int const kScalarsPerLdsA</div><div class="ttdef"><b>Definition:</b> gemm_config.h:108</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a60ab48db1b87fb6063d194247bc055f5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">cutlass::gemm::GemmConfig::kAccumulatorsPerLdsA</a></div><div class="ttdeci">static int const kAccumulatorsPerLdsA</div><div class="ttdoc">The number of accumulators that are going to be fed from one LDS A/B. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:124</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_ab2b6167b0165ed544254dc87c2a7db8f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">cutlass::gemm::GemmConfig::kScalarsPerStsA</a></div><div class="ttdeci">static int const kScalarsPerStsA</div><div class="ttdef"><b>Definition:</b> gemm_config.h:107</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a2a424063136c56c5ca6345496485afce"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">cutlass::gemm::GemmConfig::kScalarsPerStsB</a></div><div class="ttdeci">static int const kScalarsPerStsB</div><div class="ttdef"><b>Definition:</b> gemm_config.h:112</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a64e7d66e0646c7044e754b3b6b91e761"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">cutlass::gemm::GemmConfig::kScalarsPerLdgA</a></div><div class="ttdeci">static int const kScalarsPerLdgA</div><div class="ttdoc">The number of scalars per LDG/STS/LDS for A. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:106</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a1e93d0163c0d150d33f4093b4a1ec87f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">cutlass::gemm::GemmConfig::kScalarsPerStsD</a></div><div class="ttdeci">static int const kScalarsPerStsD</div><div class="ttdef"><b>Definition:</b> gemm_config.h:120</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a7ad231b16f05a58900dca8ff0e0e7bfa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">cutlass::gemm::GemmConfig::ScalarD</a></div><div class="ttdeci">ScalarD_ ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:85</div></div>
+<div class="ttc" id="shape_8h_html"><div class="ttname"><a href="shape_8h.html">shape.h</a></div><div class="ttdoc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects. </div></div>
+<div class="ttc" id="structcutlass_1_1ShapeCount_html"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html">cutlass::ShapeCount</a></div><div class="ttdoc">Compute derived counted of a Layout Concept based class. </div><div class="ttdef"><b>Definition:</b> shape.h:79</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a389c0980e978463d3cc126342d8413c6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">cutlass::gemm::GemmConfig::ScalarB</a></div><div class="ttdeci">ScalarB_ ScalarB</div><div class="ttdoc">The scalar for B. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:81</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a9dd9c3efc3dfd9b5c6acd12236697399"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">cutlass::gemm::GemmConfig::OutputTile</a></div><div class="ttdeci">OutputTile_ OutputTile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:88</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/gemm__coord_8h.html b/docs/gemm__coord_8h.html
new file mode 100644
index 000000000..a464c7335
--- /dev/null
+++ b/docs/gemm__coord_8h.html
@@ -0,0 +1,111 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: gemm_coord.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">gemm_coord.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>GemmCoord is a structure derived from <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> that specifies a location within the coordinate system of a GEMM problem.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&quot;</code><br />
+</div>
+<p><a href="gemm__coord_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/gemm__coord_8h_source.html b/docs/gemm__coord_8h_source.html
new file mode 100644
index 000000000..4930501b6
--- /dev/null
+++ b/docs/gemm__coord_8h_source.html
@@ -0,0 +1,131 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: gemm_coord.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">gemm_coord.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="gemm__coord_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html">   43</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&lt;4, int&gt; {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">   46</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">   49</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4, Index&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a>;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a521d4b8e720d2261c825e05397c92a5e">   52</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a521d4b8e720d2261c825e05397c92a5e">kK</a> = 0;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a67f08a03dabee497fa5547cff0f1faea">   55</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a67f08a03dabee497fa5547cff0f1faea">kN</a> = 1;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#af1f5c03c35eaa406c6a63082da26bec3">   58</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#af1f5c03c35eaa406c6a63082da26bec3">kM</a> = 2;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad7b490ce2150e54fccad6b0f11932382">   61</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad7b490ce2150e54fccad6b0f11932382">kBatch</a> = 3;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">   69</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">GemmCoord</a>() { }</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a03e6bfa95156962be51e190d381c8b5e">   73</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a03e6bfa95156962be51e190d381c8b5e">GemmCoord</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3, Index&gt;</a> <span class="keyword">const</span> &amp;coord, <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> _batch = 0): <a class="code" href="structcutlass_1_1Coord.html">Base</a>(<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(coord[0], coord[1], coord[2], _batch)) { }</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a65d1ca12c0f27984920cf1700322a746">   77</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a65d1ca12c0f27984920cf1700322a746">GemmCoord</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4, Index&gt;</a> <span class="keyword">const</span> &amp;coord): <a class="code" href="structcutlass_1_1Coord.html">Base</a>(coord) { }</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a17da9936dbad99f2402c42b1bd6ea5ea">   81</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a17da9936dbad99f2402c42b1bd6ea5ea">GemmCoord</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> coord[4]): <a class="code" href="structcutlass_1_1Coord.html">Base</a>(coord) { }</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac3b1cbdf86bd36d6b4b5e295ef846dfe">   85</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac3b1cbdf86bd36d6b4b5e295ef846dfe">GemmCoord</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">k</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a> = 0): <a class="code" href="structcutlass_1_1Coord.html">Base</a>(<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">k</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a>)) { }</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">   89</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kM); }</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8199f5e336a20c31e54d68b11e9fa3d3">   93</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8199f5e336a20c31e54d68b11e9fa3d3">m</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kM); }</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">   97</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kN); }</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a1327b9b4b9379df24df3d4b716952d11">  101</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a1327b9b4b9379df24df3d4b716952d11">n</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kN); }</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">  105</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">k</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kK); }</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#ae12eb84ec47ddf01b4d459c7aabc22ad">  109</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ae12eb84ec47ddf01b4d459c7aabc22ad">k</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kK); }</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">  113</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kBatch); }</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#adaf31768b8239f497c0ec9b40bad1cb5">  117</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#adaf31768b8239f497c0ec9b40bad1cb5">batch</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kBatch); }</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00121"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a4062c040208868c75dbc6ba18910bffb">  121</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a4062c040208868c75dbc6ba18910bffb">knm</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">k</a>(), <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>(), <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>());</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  }</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00127"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac4550a7e80e1f0265eacecebe54794d9">  127</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac4550a7e80e1f0265eacecebe54794d9">nm</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>(), <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>());</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  }</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad6c884a5bb6e5edaf371e8af10df367d">  133</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad6c884a5bb6e5edaf371e8af10df367d">km</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">k</a>(), <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>());</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00139"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a16501265d58ddaca0e2d9bb4e21d66ea">  139</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a16501265d58ddaca0e2d9bb4e21d66ea">kn</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">k</a>(), <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>());</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  }</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  <span class="comment">// Coord operators</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a675efbb9ed360888faf3c333708ae4d5">  149</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a675efbb9ed360888faf3c333708ae4d5">operator+</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">GemmCoord</a>(Base::operator+(b));</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  }</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00155"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a762fd45e61477d700c82bfd67443c6f9">  155</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a762fd45e61477d700c82bfd67443c6f9">operator-</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">GemmCoord</a>(Base::operator-(b));</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;  }</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00161"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5a158b5f3c0b1779972b25aa52be1164">  161</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5a158b5f3c0b1779972b25aa52be1164">operator*</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">GemmCoord</a>(Base::operator*(b));</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  }</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a41770bb99f02f4debbafe95e019ce02b">  167</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a41770bb99f02f4debbafe95e019ce02b">operator/</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">GemmCoord</a>(Base::operator/(b));</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  }</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5465f7308778eac5d14d8020179a65e0">  173</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5465f7308778eac5d14d8020179a65e0">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">Base::operator+=</a>(b);</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  }</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00180"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a12ba250be3d5474b7c6fc4eddd4f58d5">  180</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a12ba250be3d5474b7c6fc4eddd4f58d5">operator-=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">Base::operator-=</a>(b);</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;  }</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00187"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#a69fb0bb5e73f35d3c8df71a0174d6520">  187</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a69fb0bb5e73f35d3c8df71a0174d6520">operator*=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">Base::operator*=</a>(b);</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;  }</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmCoord.html#aac1e1bad751237fd76d32a1ea10f6c40">  194</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#aac1e1bad751237fd76d32a1ea10f6c40">operator/=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">Base::operator/=</a>(b);</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;  }</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;};</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;} <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_aac1e1bad751237fd76d32a1ea10f6c40"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#aac1e1bad751237fd76d32a1ea10f6c40">cutlass::gemm::GemmCoord::operator/=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord &amp; operator/=(Base const &amp;b)</div><div class="ttdoc">In-place division. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:194</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a8e3f0250e2265503862354c729dca892"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">cutlass::gemm::GemmCoord::Index</a></div><div class="ttdeci">int Index</div><div class="ttdoc">Integer-valued index. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a4062c040208868c75dbc6ba18910bffb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a4062c040208868c75dbc6ba18910bffb">cutlass::gemm::GemmCoord::knm</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; knm() const</div><div class="ttdoc">Obtains a Coord&lt;3&gt; from GemmCoord. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:121</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_ad6c884a5bb6e5edaf371e8af10df367d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#ad6c884a5bb6e5edaf371e8af10df367d">cutlass::gemm::GemmCoord::km</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 2 &gt; km() const</div><div class="ttdoc">Obtains a Coord&lt;2&gt; from GemmCoord. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:133</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a790f6552ad26964fa808b51f4aba433b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">cutlass::gemm::GemmCoord::Base</a></div><div class="ttdeci">Coord&lt; 4, Index &gt; Base</div><div class="ttdoc">Base type is a Coord of rank=4. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:49</div></div>
+<div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a7c582518db6860e19286361b162c4fcd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">cutlass::gemm::GemmCoord::n</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; n() const</div><div class="ttdoc">Returns the GEMM N coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:97</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a41770bb99f02f4debbafe95e019ce02b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a41770bb99f02f4debbafe95e019ce02b">cutlass::gemm::GemmCoord::operator/</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord operator/(Base const &amp;b) const</div><div class="ttdoc">Element-wise division. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:167</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a8199f5e336a20c31e54d68b11e9fa3d3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a8199f5e336a20c31e54d68b11e9fa3d3">cutlass::gemm::GemmCoord::m</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; m()</div><div class="ttdoc">Returns reference to the GEMM M coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:93</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></div><div class="ttdef"><b>Definition:</b> gemm_coord.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_ad7b490ce2150e54fccad6b0f11932382"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#ad7b490ce2150e54fccad6b0f11932382">cutlass::gemm::GemmCoord::kBatch</a></div><div class="ttdeci">static int const kBatch</div><div class="ttdoc">Batch dimension - for generalizing to larger problems. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:61</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a762fd45e61477d700c82bfd67443c6f9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a762fd45e61477d700c82bfd67443c6f9">cutlass::gemm::GemmCoord::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord operator-(Base const &amp;b) const</div><div class="ttdoc">Element-wise subtraction. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:155</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ad4303b578b72b5cb2a0198375290e168"><div class="ttname"><a href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">cutlass::Coord::operator*=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator*=(Coord const &amp;b)</div><div class="ttdoc">In-place multiplication. </div><div class="ttdef"><b>Definition:</b> coord.h:197</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a65d1ca12c0f27984920cf1700322a746"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a65d1ca12c0f27984920cf1700322a746">cutlass::gemm::GemmCoord::GemmCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord(Coord&lt; 4, Index &gt; const &amp;coord)</div><div class="ttdoc">Constructs from Coord&lt;4&gt; </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:77</div></div>
+<div class="ttc" id="platform_8h_html"><div class="ttname"><a href="platform_8h.html">platform.h</a></div><div class="ttdoc">C++ features that may be otherwise unimplemented for CUDA device functions. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_ae12eb84ec47ddf01b4d459c7aabc22ad"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#ae12eb84ec47ddf01b4d459c7aabc22ad">cutlass::gemm::GemmCoord::k</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; k()</div><div class="ttdoc">Returns reference to the GEMM K coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:109</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a03e6bfa95156962be51e190d381c8b5e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a03e6bfa95156962be51e190d381c8b5e">cutlass::gemm::GemmCoord::GemmCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord(Coord&lt; 3, Index &gt; const &amp;coord, Index _batch=0)</div><div class="ttdoc">Constructs from Coord&lt;3&gt; and a batch. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:73</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a675efbb9ed360888faf3c333708ae4d5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a675efbb9ed360888faf3c333708ae4d5">cutlass::gemm::GemmCoord::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord operator+(Base const &amp;b) const</div><div class="ttdoc">Element-wise addition. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:149</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a304334cbcad636d7b058fdc6310f0e6b"><div class="ttname"><a href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">cutlass::Coord::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator-=(Coord const &amp;b)</div><div class="ttdoc">In-place subtraction. </div><div class="ttdef"><b>Definition:</b> coord.h:188</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a521d4b8e720d2261c825e05397c92a5e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a521d4b8e720d2261c825e05397c92a5e">cutlass::gemm::GemmCoord::kK</a></div><div class="ttdeci">static int const kK</div><div class="ttdoc">GEMM K dimension - inner dimension of the GEMM problem. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a67f08a03dabee497fa5547cff0f1faea"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a67f08a03dabee497fa5547cff0f1faea">cutlass::gemm::GemmCoord::kN</a></div><div class="ttdeci">static int const kN</div><div class="ttdoc">GEMM N dimension - columns of the output C matrix. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:55</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ae4f2cb12b84411118cb93e7c4cb88b20"><div class="ttname"><a href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">cutlass::Coord::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator+=(Coord const &amp;b)</div><div class="ttdoc">In-place addition. </div><div class="ttdef"><b>Definition:</b> coord.h:179</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a16501265d58ddaca0e2d9bb4e21d66ea"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a16501265d58ddaca0e2d9bb4e21d66ea">cutlass::gemm::GemmCoord::kn</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 2 &gt; kn() const</div><div class="ttdoc">Obtains a Coord&lt;2&gt; from GemmCoord. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:139</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a9eff24a3b74b68d11839b92324613c93"><div class="ttname"><a href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">cutlass::Coord&lt; 4, int &gt;::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; at()</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:240</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ac87199c4c9a4e20aac4eb6e3b9a68f28"><div class="ttname"><a href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">cutlass::Coord::operator/=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator/=(Coord const &amp;b)</div><div class="ttdoc">In-place division. </div><div class="ttdef"><b>Definition:</b> coord.h:206</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a5465f7308778eac5d14d8020179a65e0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a5465f7308778eac5d14d8020179a65e0">cutlass::gemm::GemmCoord::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord &amp; operator+=(Base const &amp;b)</div><div class="ttdoc">In-place addition. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:173</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_af1f5c03c35eaa406c6a63082da26bec3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#af1f5c03c35eaa406c6a63082da26bec3">cutlass::gemm::GemmCoord::kM</a></div><div class="ttdeci">static int const kM</div><div class="ttdoc">GEMM M dimension - rows of the output C matrix. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:58</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:49</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_abaa87475d518a2e5cdf44c62122b9e01"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">cutlass::gemm::GemmCoord::GemmCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord()</div><div class="ttdoc">Default ctor. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a12ba250be3d5474b7c6fc4eddd4f58d5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a12ba250be3d5474b7c6fc4eddd4f58d5">cutlass::gemm::GemmCoord::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord &amp; operator-=(Base const &amp;b)</div><div class="ttdoc">In-place subtraction. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:180</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a9167769a2b915eb92fb4ca37b9212793"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">cutlass::gemm::GemmCoord::m</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; m() const</div><div class="ttdoc">Returns the GEMM M coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:89</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a5a158b5f3c0b1779972b25aa52be1164"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a5a158b5f3c0b1779972b25aa52be1164">cutlass::gemm::GemmCoord::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord operator*(Base const &amp;b) const</div><div class="ttdoc">Element-wise multiplication. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:161</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a646c71e97ef007bde8c101479c528da7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">cutlass::gemm::GemmCoord::k</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; k() const</div><div class="ttdoc">Returns the GEMM K coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:105</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a69fb0bb5e73f35d3c8df71a0174d6520"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a69fb0bb5e73f35d3c8df71a0174d6520">cutlass::gemm::GemmCoord::operator*=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord &amp; operator*=(Base const &amp;b)</div><div class="ttdoc">In-place multiplication. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:187</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_ac441e93411ed6954a93ab36f0c747d26"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">cutlass::gemm::GemmCoord::batch</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; batch() const</div><div class="ttdoc">Returns the GEMM batch coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:113</div></div>
+<div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a1327b9b4b9379df24df3d4b716952d11"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a1327b9b4b9379df24df3d4b716952d11">cutlass::gemm::GemmCoord::n</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; n()</div><div class="ttdoc">Returns reference to the GEMM N coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:101</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_ac4550a7e80e1f0265eacecebe54794d9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#ac4550a7e80e1f0265eacecebe54794d9">cutlass::gemm::GemmCoord::nm</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 2 &gt; nm() const</div><div class="ttdoc">Obtains a Coord&lt;2&gt; from GemmCoord. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:127</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_ac3b1cbdf86bd36d6b4b5e295ef846dfe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#ac3b1cbdf86bd36d6b4b5e295ef846dfe">cutlass::gemm::GemmCoord::GemmCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord(Index k, Index n, Index m, Index batch=0)</div><div class="ttdoc">Helper to construct from a K, N, M, batch variables. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:85</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_adaf31768b8239f497c0ec9b40bad1cb5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#adaf31768b8239f497c0ec9b40bad1cb5">cutlass::gemm::GemmCoord::batch</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; batch()</div><div class="ttdoc">Returns reference to the GEMM batch coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:117</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a17da9936dbad99f2402c42b1bd6ea5ea"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a17da9936dbad99f2402c42b1bd6ea5ea">cutlass::gemm::GemmCoord::GemmCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmCoord(Index coord[4])</div><div class="ttdoc">Constructs from an array of coordinate elements. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:81</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/gemm__desc_8h.html b/docs/gemm__desc_8h.html
new file mode 100644
index 000000000..deb246cbb
--- /dev/null
+++ b/docs/gemm__desc_8h.html
@@ -0,0 +1,111 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: gemm_desc.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">gemm_desc.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Implements a software-pipelined efficient GEMM.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="tensor__ref_8h_source.html">cutlass/tensor_ref.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__coord_8h_source.html">cutlass/gemm/gemm_coord.h</a>&quot;</code><br />
+</div>
+<p><a href="gemm__desc_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM problem description.  <a href="structcutlass_1_1gemm_1_1GemmDesc.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/gemm__desc_8h_source.html b/docs/gemm__desc_8h_source.html
new file mode 100644
index 000000000..76f0d0725
--- /dev/null
+++ b/docs/gemm__desc_8h_source.html
@@ -0,0 +1,121 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: gemm_desc.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">gemm_desc.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="gemm__desc_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tensor__ref_8h.html">cutlass/tensor_ref.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__coord_8h.html">cutlass/gemm/gemm_coord.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;    <span class="keyword">typename</span> AType_,</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;    <span class="keyword">typename</span> BType_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;    <span class="keyword">typename</span> CType_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keyword">typename</span> DType_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> SType_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span></div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html">   50</a></span>&#160;&gt; <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc</a> {</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171">   56</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171">Index</a>;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">   59</a></span>&#160;  <span class="keyword">typedef</span> AType_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">AType</a>;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">   62</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;AType const, 2&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a>;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">   65</a></span>&#160;  <span class="keyword">typedef</span> BType_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">BType</a>;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">   68</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;BType const, 2&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a>;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">   71</a></span>&#160;  <span class="keyword">typedef</span> CType_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">CType</a>;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">   74</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;CType const, 2&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a>;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">   77</a></span>&#160;  <span class="keyword">typedef</span> DType_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">DType</a>;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">   80</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;DType, 2&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">   83</a></span>&#160;  <span class="keyword">typedef</span> SType_ <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a>;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">   90</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">problem_size</a>;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">   93</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">alpha</a>;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">   96</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefA</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">A</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">   99</a></span>&#160;  <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">batch_stride_A</a>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">  102</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefB</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">B</a>;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">  105</a></span>&#160;  <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">batch_stride_B</a>;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">  108</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">beta</a>;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">  111</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefC</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">C</a>;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">  114</a></span>&#160;  <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">batch_stride_C</a>;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">  117</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefD</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">D</a>;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">  120</a></span>&#160;  <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">batch_stride_D</a>;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#ae2708b731cbb99d3e638382ecf599425">  128</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#ae2708b731cbb99d3e638382ecf599425">GemmDesc</a>(): <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">problem_size</a>(0, 0, 0, 1), <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">alpha</a>(1), <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">beta</a>(0) {}</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00132"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a948af4a974f1aa74d3b6da9cd3e185de">  132</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a948af4a974f1aa74d3b6da9cd3e185de">GemmDesc</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> _problem_size,</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;           <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _alpha,</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefA</a> <span class="keyword">const</span> &amp;_A,</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefB</a> <span class="keyword">const</span> &amp;_B,</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;           <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _beta,</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefC</a> <span class="keyword">const</span> &amp;_C,</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefD</a> <span class="keyword">const</span> &amp;_D</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  ):</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">problem_size</a>(_problem_size[0], _problem_size[1], _problem_size[2], 1),</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">alpha</a>(_alpha),</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">A</a>(_A),</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">batch_stride_A</a>(0),</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">B</a>(_B),</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">batch_stride_B</a>(0),</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">beta</a>(_beta),</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">C</a>(_C),</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">batch_stride_C</a>(0),</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">D</a>(_D),</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">batch_stride_D</a>(0) {}</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7292ac0196f22525b13f223a02271bc3">  154</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7292ac0196f22525b13f223a02271bc3">GemmDesc</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> _problem_size,</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;           <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _alpha,</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefA</a> <span class="keyword">const</span> &amp;_A,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefB</a> <span class="keyword">const</span> &amp;_B,</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;           <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _beta,</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefC</a> <span class="keyword">const</span> &amp;_C,</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefD</a> <span class="keyword">const</span> &amp;_D</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  ):</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">problem_size</a>(_problem_size.k(), _problem_size.n(), _problem_size.m(), 1),</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">alpha</a>(_alpha),</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">A</a>(_A),</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">batch_stride_A</a>(0),</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">B</a>(_B),</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">batch_stride_B</a>(0),</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">beta</a>(_beta),</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">C</a>(_C),</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">batch_stride_C</a>(0),</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">D</a>(_D),</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">batch_stride_D</a>(0) {</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    assert(_problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a>() == 1);</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  }</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmDesc.html#af96cd9c8f2454ea118dfa7358dd24824">  179</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#af96cd9c8f2454ea118dfa7358dd24824">GemmDesc</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> _problem_size,</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;           <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _alpha,</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefA</a> <span class="keyword">const</span> &amp;_A,</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _batch_stride_A,</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefB</a> <span class="keyword">const</span> &amp;_B,</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _batch_stride_B,</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;           <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _beta,</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefC</a> <span class="keyword">const</span> &amp;_C,</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _batch_stride_C,</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;           <a class="code" href="classcutlass_1_1TensorRef.html">TensorRefD</a> <span class="keyword">const</span> &amp;_D,</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _batch_stride_D</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;  ):</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">problem_size</a>(_problem_size),</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">alpha</a>(_alpha),</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">A</a>(_A),</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">batch_stride_A</a>(_batch_stride_A),</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">B</a>(_B),</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">batch_stride_B</a>(_batch_stride_B),</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">beta</a>(_beta),</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">C</a>(_C),</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">batch_stride_C</a>(_batch_stride_C),</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">D</a>(_D),</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">batch_stride_D</a>(_batch_stride_D) {}</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;};</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a></div><div class="ttdoc">GEMM problem description. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a51f77118d545308068b0dc287abf4e8b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">cutlass::gemm::GemmDesc::TensorRefC</a></div><div class="ttdeci">TensorRef&lt; CType const, 2 &gt; TensorRefC</div><div class="ttdoc">Tensor reference to C operand. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:74</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="tensor__ref_8h_html"><div class="ttname"><a href="tensor__ref_8h.html">tensor_ref.h</a></div><div class="ttdoc">Defines a structure containing strides, bounds, and a pointer to tensor data. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_af96cd9c8f2454ea118dfa7358dd24824"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#af96cd9c8f2454ea118dfa7358dd24824">cutlass::gemm::GemmDesc::GemmDesc</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmDesc(GemmCoord _problem_size, SType _alpha, TensorRefA const &amp;_A, long long _batch_stride_A, TensorRefB const &amp;_B, long long _batch_stride_B, SType _beta, TensorRefC const &amp;_C, long long _batch_stride_C, TensorRefD const &amp;_D, long long _batch_stride_D)</div><div class="ttdoc">Constructor for strided batch GEMM GEMM. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:179</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_ab384a226ab370fa5e25468fb99c63e30"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">cutlass::gemm::GemmDesc::C</a></div><div class="ttdeci">TensorRefC C</div><div class="ttdoc">The source matrix C. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:111</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_aa82600c82e17ea1233f2f74be4aa3785"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">cutlass::gemm::GemmDesc::alpha</a></div><div class="ttdeci">SType alpha</div><div class="ttdoc">The alpha scaling values. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:93</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a80b0aae6e67b733ae5bf289d979a7c9b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">cutlass::gemm::GemmDesc::A</a></div><div class="ttdeci">TensorRefA A</div><div class="ttdoc">The source matrix A. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:96</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a52a5538b1b5208090417cf98d8735e3f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">cutlass::gemm::GemmDesc::problem_size</a></div><div class="ttdeci">GemmCoord problem_size</div><div class="ttdoc">The dimensions of the GEMM. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></div><div class="ttdef"><b>Definition:</b> gemm_coord.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a7b9afcc7e3105da1d002b1baa68d83de"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">cutlass::gemm::GemmDesc::batch_stride_D</a></div><div class="ttdeci">long long batch_stride_D</div><div class="ttdoc">batch stride for D operand </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:120</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_af0ac89b161f9cad96307f1ff3c80a774"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">cutlass::gemm::GemmDesc::B</a></div><div class="ttdeci">TensorRefB B</div><div class="ttdoc">The source matrix B. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:102</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_aea3a523662dc801bf9abf205a8e400fe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">cutlass::gemm::GemmDesc::TensorRefA</a></div><div class="ttdeci">TensorRef&lt; AType const, 2 &gt; TensorRefA</div><div class="ttdoc">Tensor reference to A operand. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a7292ac0196f22525b13f223a02271bc3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a7292ac0196f22525b13f223a02271bc3">cutlass::gemm::GemmDesc::GemmDesc</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmDesc(GemmCoord _problem_size, SType _alpha, TensorRefA const &amp;_A, TensorRefB const &amp;_B, SType _beta, TensorRefC const &amp;_C, TensorRefD const &amp;_D)</div><div class="ttdoc">Constructor for basic GEMM with batch count = 1. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:154</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a837a1c513f71ddb2729f8d2e6320b8cd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">cutlass::gemm::GemmDesc::DType</a></div><div class="ttdeci">DType_ DType</div><div class="ttdoc">Destination accumulator type. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:77</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a8b5a86d14eba0d3c5173753212d62599"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">cutlass::gemm::GemmDesc::batch_stride_A</a></div><div class="ttdeci">long long batch_stride_A</div><div class="ttdoc">batch stride for A operand </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_adac41a0baad9e65aa4a6fe12d249a02b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">cutlass::gemm::GemmDesc::beta</a></div><div class="ttdeci">SType beta</div><div class="ttdoc">The beta scaling values. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:108</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html"><div class="ttname"><a href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; AType const, 2 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a258e8c008db365b88654f46df3017ec2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">cutlass::gemm::GemmDesc::SType</a></div><div class="ttdeci">SType_ SType</div><div class="ttdoc">Scalar type for alpha and beta. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:83</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a22642bd88ccb24fec3df87230537c037"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">cutlass::gemm::GemmDesc::AType</a></div><div class="ttdeci">AType_ AType</div><div class="ttdoc">Source accumulator matrix type. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:59</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_aa46907b69a3b1d0db5c3db1709867704"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">cutlass::gemm::GemmDesc::CType</a></div><div class="ttdeci">CType_ CType</div><div class="ttdoc">Source accumulator matrix type. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:71</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a7de7de97d237d9dcc0d89de7b04342ab"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">cutlass::gemm::GemmDesc::TensorRefB</a></div><div class="ttdeci">TensorRef&lt; BType const, 2 &gt; TensorRefB</div><div class="ttdoc">Tensor reference to B operand. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:68</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a95e3fe05e4ca0d4019cbef2b1a54419a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">cutlass::gemm::GemmDesc::batch_stride_B</a></div><div class="ttdeci">long long batch_stride_B</div><div class="ttdoc">batch stride for B operand </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:105</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_adf95451422c529587d55aac0fecf0d9f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">cutlass::gemm::GemmDesc::D</a></div><div class="ttdeci">TensorRefD D</div><div class="ttdoc">The destination matrix D. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:117</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a1f59ad60a529aa1db6e66ade3cb65052"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">cutlass::gemm::GemmDesc::TensorRefD</a></div><div class="ttdeci">TensorRef&lt; DType, 2 &gt; TensorRefD</div><div class="ttdoc">Tensor reference to D operand. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:80</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a23317c22122ea2721a7a3e0c12e07a49"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">cutlass::gemm::GemmDesc::BType</a></div><div class="ttdeci">BType_ BType</div><div class="ttdoc">Destination accumulator type. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_ac441e93411ed6954a93ab36f0c747d26"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">cutlass::gemm::GemmCoord::batch</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; batch() const</div><div class="ttdoc">Returns the GEMM batch coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:113</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_ae2708b731cbb99d3e638382ecf599425"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#ae2708b731cbb99d3e638382ecf599425">cutlass::gemm::GemmDesc::GemmDesc</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmDesc()</div><div class="ttdoc">Default ctor. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:128</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_a948af4a974f1aa74d3b6da9cd3e185de"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#a948af4a974f1aa74d3b6da9cd3e185de">cutlass::gemm::GemmDesc::GemmDesc</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmDesc(Coord&lt; 3 &gt; _problem_size, SType _alpha, TensorRefA const &amp;_A, TensorRefB const &amp;_B, SType _beta, TensorRefC const &amp;_C, TensorRefD const &amp;_D)</div><div class="ttdoc">Constructor for basic GEMM with batch count = 1. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:132</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_aad3590dffa2e1ba82c834efae6b35ad2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">cutlass::gemm::GemmDesc::batch_stride_C</a></div><div class="ttdeci">long long batch_stride_C</div><div class="ttdoc">batch stride for C operand </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:114</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html_abd12fea9779ada02c0f2266909602171"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171">cutlass::gemm::GemmDesc::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type for dimensions and strides. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:56</div></div>
+<div class="ttc" id="gemm__coord_8h_html"><div class="ttname"><a href="gemm__coord_8h.html">gemm_coord.h</a></div><div class="ttdoc">GemmCoord is a structure derived from Coord&lt;4&gt; that specifies a location within the coordinate system...</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/gemm__epilogue_8h.html b/docs/gemm__epilogue_8h.html
index ad65bf56a..7c4213e47 100644
--- a/docs/gemm__epilogue_8h.html
+++ b/docs/gemm__epilogue_8h.html
@@ -74,8 +74,7 @@ $(function() {
 <div class="header">
   <div class="summary">
 <a href="#nested-classes">Classes</a> &#124;
-<a href="#namespaces">Namespaces</a> &#124;
-<a href="#func-members">Functions</a>  </div>
+<a href="#namespaces">Namespaces</a>  </div>
   <div class="headertitle">
 <div class="title">gemm_epilogue.h File Reference</div>  </div>
 </div><!--header-->
@@ -83,9 +82,9 @@ $(function() {
 
 <p>Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the computed matrix product.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
 </div>
 <p><a href="gemm__epilogue_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -100,19 +99,11 @@ Namespaces</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
-Functions</h2></td></tr>
-<tr class="memitem:a3e30ae89e6f7501725028144cd2d88cb"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
-<tr class="memitem:a3e30ae89e6f7501725028144cd2d88cb"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">cutlass::gemm::is_zero</a> (T x)</td></tr>
-<tr class="separator:a3e30ae89e6f7501725028144cd2d88cb"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4a12fcfae60f26efa47bf0a79483d8ac"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a4a12fcfae60f26efa47bf0a79483d8ac">cutlass::gemm::is_zero</a> (half x)</td></tr>
-<tr class="separator:a4a12fcfae60f26efa47bf0a79483d8ac"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__epilogue_8h_source.html b/docs/gemm__epilogue_8h_source.html
index c7be2683b..87add8a9d 100644
--- a/docs/gemm__epilogue_8h_source.html
+++ b/docs/gemm__epilogue_8h_source.html
@@ -76,53 +76,46 @@ $(function() {
 <div class="title">gemm_epilogue.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="gemm__epilogue_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">   42</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">is_zero</a>(T x) {</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  <span class="keywordflow">return</span> x == T(0);</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;}</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)</span></div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html#a4a12fcfae60f26efa47bf0a79483d8ac">   47</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">is_zero</a>(half x) { <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span>int16_t&amp;<span class="keyword">&gt;</span>(x) == int16_t(0); }</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmEpilogueTraits_&gt;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">   53</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a> {</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">   55</a></span>&#160;  <span class="keyword">typedef</span> GemmEpilogueTraits_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">Traits</a>;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">   57</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a>;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">   59</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedStorage <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a>;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">   62</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::OutputTile <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">OutputTile</a>;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">   64</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Iterations <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">Iterations</a>;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">   66</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Accumulators <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a>;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">   68</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">Scalar</a>;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">   70</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Functor <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a>;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">   73</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Iterations::kD == 1 &amp;&amp; Iterations::kC == 1, <span class="stringliteral">&quot;Unsupported 3D/4D shapes&quot;</span>);</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::GlobalLoadIteratorC <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a>;</div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">   78</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::GlobalTransformerC <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a>;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">   80</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::GlobalTransformerD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a>;</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">   82</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::GlobalStoreIteratorD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a>;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">   84</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedStoreIteratorD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a>;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">   86</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedStoreTransformerD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a>;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">   88</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedLoadIteratorD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">SharedLoadIteratorD</a>;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">   90</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename SharedLoadIteratorD::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">SharedLoadTransformerD</a>;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">   93</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Index <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">   96</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadIteratorC::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">ScalarC</a>;</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">   98</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalStoreIteratorD::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">ScalarD</a>;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">  101</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">GemmEpilogue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> <span class="keyword">const</span>&amp; params_,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a>&amp; shared_storage_,</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> m_,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> n_)</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>(params_), <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a>(shared_storage_), <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">m</a>(m_), <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">n</a>(n_) {}</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">  108</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">epilogue</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; block, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a>&amp; accumulators) {</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">is_zero</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.functor.beta)) {</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;      epilogue_with_or_without_beta&lt;true&gt;(block, accumulators);</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;      epilogue_with_or_without_beta&lt;false&gt;(block, accumulators);</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    }</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  }</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> kBetaIsZero_&gt;</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">  117</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">epilogue_with_or_without_beta</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; block,</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;                                                    <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a>&amp; accumulators) {</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> bounds = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a>(0, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">n</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">m</a>);</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    <span class="comment">// The functor.</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a> functor(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.functor);</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    <span class="comment">// The C fragment.</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <span class="keyword">typename</span> GlobalLoadIteratorC::Fragment fragment_c;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    <span class="comment">// The transformed C fragment.</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <span class="keyword">typename</span> GlobalTransformerC::OutputFragment transformed_c;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="comment">// Compute pointer and predicate offsets for C and D global iterators.</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> pointer_offset =</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;          ((<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d.inc_h * (GlobalStoreIteratorD::Iterations::kH - 1) +</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d.inc_advance) *</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;               Iterations::kW +</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;           <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.stride_h) *</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;          h;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> predicate_offset =</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;          ((<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d.predicate_inc_h * (GlobalStoreIteratorD::Iterations::kH - 1) +</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d.predicate_inc_advance) *</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;               Iterations::kW +</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;           Traits::Delta::kH) *</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;          h;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      <span class="comment">// The iterator to load the elements of the C matrix.</span></div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a> global_load_iterator(</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_c, bounds, block, pointer_offset, predicate_offset);</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;      <span class="comment">// The transformer for C.</span></div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a> transformer_c;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;      <span class="comment">// The transformer for D.</span></div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a> transformer_d;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="comment">// The iterator to store into the D matrix.</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a> global_store_iterator(</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d, bounds, block, pointer_offset, predicate_offset);</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w) {</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;        <span class="comment">// Load the C matrix into fragment.</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;        <span class="keywordflow">if</span> (!kBetaIsZero_) {</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;          <a class="code" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a>(global_load_iterator, fragment_c);</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;        }</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;        <span class="comment">// Make sure we can write to shared memory.</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a>();</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;        <span class="comment">// Copy the accumulators to shared memory.</span></div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> offset = (h * Iterations::kW + w) * SharedStoreIteratorD::Fragment::kElements;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a> shared_store_transformer;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;        <span class="keyword">typename</span> SharedStoreTransformerD::OutputFragment shared_store_transformed_d;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;        shared_store_transformer.transform(accumulators, offset, shared_store_transformed_d);</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a> shared_store_iterator(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.shared_store_iterator_d,</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;                                                   <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a>.shared_stream.store);</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;        <a class="code" href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">shared_iterator_store</a>(shared_store_iterator, shared_store_transformed_d);</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;        <span class="comment">// Make sure the data is in shared memory.</span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">shared_store_fence</a>();</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;        <span class="comment">// Copy the accumulators back to registers from shared memory.</span></div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">SharedLoadIteratorD</a> shared_load_iterator(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.shared_load_iterator_d,</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;                                                 <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a>.shared_stream.load);</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;        <span class="keyword">typename</span> SharedLoadIteratorD::Fragment fetched_d;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;        <a class="code" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">shared_iterator_load</a>(shared_load_iterator, fetched_d);</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;        <span class="comment">// Do the math.</span></div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;        <span class="keyword">typename</span> GlobalTransformerD::InputFragment fragment_d;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;        <span class="keywordflow">if</span> (kBetaIsZero_) {</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;          functor.evaluate(fetched_d, fragment_d);</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;        } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;          <span class="comment">// Transform C fragment.</span></div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;          transformer_c.transform(fragment_c, transformed_c);</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;          <span class="comment">// Do the math.</span></div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;          functor.evaluate(fetched_d, transformed_c, fragment_d);</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;        }</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;        <span class="comment">// Transform D fragment.</span></div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;        <span class="keyword">typename</span> GlobalTransformerD::OutputFragment transformed_d;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;        transformer_d.transform(fragment_d, transformed_d);</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;        <span class="comment">// Copy the results to global memory.</span></div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;        <a class="code" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a>(global_store_iterator, transformed_d);</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;      }</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;    }</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  }</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;</div><div class="line"><a name="l00209"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">  209</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a>() { __syncthreads(); }</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">  212</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">shared_store_fence</a>() { __syncthreads(); }</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;</div><div class="line"><a name="l00215"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">  215</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>;</div><div class="line"><a name="l00217"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">  217</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a>;</div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">  219</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">m</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">n</a>;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;};</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a4887b56a96694ce6350db77f78bb505f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">cutlass::gemm::GemmEpilogue::ScalarD</a></div><div class="ttdeci">GlobalStoreIteratorD::Scalar ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:98</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_aab0a964efe223c5c29bc816c393b5a9a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">cutlass::gemm::GemmEpilogue::SharedStoreIteratorD</a></div><div class="ttdeci">Traits::SharedStoreIteratorD SharedStoreIteratorD</div><div class="ttdoc">The iterator to store D in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:84</div></div>
+<a href="gemm__epilogue_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmEpilogueTraits_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">   42</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a> {</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">   44</a></span>&#160;  <span class="keyword">typedef</span> GemmEpilogueTraits_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">Traits</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">   46</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">   48</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedStorage <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a>;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">   51</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::OutputTile <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">OutputTile</a>;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">   53</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Iterations <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">Iterations</a>;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">   55</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Accumulators <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a>;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">   57</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">Scalar</a>;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">   59</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Functor <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a>;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">   62</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Iterations::kD == 1 &amp;&amp; Iterations::kC == 1, <span class="stringliteral">&quot;Unsupported 3D/4D shapes&quot;</span>);</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::GlobalLoadIteratorC <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a>;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">   67</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::GlobalTransformerC <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a>;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">   69</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::GlobalTransformerD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a>;</div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">   71</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::GlobalStoreIteratorD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a>;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">   73</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedStoreIteratorD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a>;</div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">   75</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedStoreTransformerD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a>;</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">   77</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::SharedLoadStreamD <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">SharedLoadStreamD</a>;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">   80</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Index <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">   83</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadIteratorC::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">ScalarC</a>;</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">   85</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalStoreIteratorD::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">ScalarD</a>;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">   88</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">GemmEpilogue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> <span class="keyword">const</span>&amp; params_,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a>&amp; shared_storage_,</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;                              <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; _problem_size)</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>(params_), <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a>(shared_storage_), <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a>(_problem_size), <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a>(params_.<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a>) {}</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">   94</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">epilogue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a>&amp; accumulators,</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;                               <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; block = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0),</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;                               <span class="keywordtype">int</span> batch_id = 0) {</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a>.source_required()) {</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;      epilogue_with_or_without_beta&lt;true&gt;(accumulators, block, batch_id);</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;      epilogue_with_or_without_beta&lt;false&gt;(accumulators, block, batch_id);</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    }</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  }</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> kSourceRequired&gt;</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">  105</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">epilogue_with_or_without_beta</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a>&amp; accumulators,</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;                                                    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; block,</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;                                                    <span class="keywordtype">int</span> batch_id) {</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="comment">// The C fragment.</span></div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keyword">typename</span> GlobalLoadIteratorC::Fragment fragment_c;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="comment">// The transformed C fragment.</span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    <span class="keyword">typename</span> GlobalTransformerC::OutputFragment transformed_c;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;      <span class="comment">// Compute pointer and predicate offsets for C and D global iterators.</span></div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> pointer_offset =</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;          ((<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d.inc_h * (GlobalStoreIteratorD::Iterations::kH - 1) +</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d.inc_advance) *</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;               Iterations::kW +</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;           <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.stride_h) *</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;          h;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> predicate_offset =</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;          ((<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d.predicate_inc_h * (GlobalStoreIteratorD::Iterations::kH - 1) +</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d.predicate_inc_advance) *</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;               Iterations::kW +</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;           Traits::Delta::kH) *</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;          h;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      <span class="comment">// The iterator to load the elements of the C matrix.</span></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a> global_load_iterator(</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_c, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a>, block, pointer_offset, predicate_offset);</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      <span class="comment">// update C pointer offset based on batch_id and batch_stride_offset</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;      <span class="comment">//global_load_iterator.add_pointer_offset(batch_id * params.batch_stride_offset_c);</span></div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      global_load_iterator += <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(batch_id, 0, 0);</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;      <span class="comment">// The transformer for C.</span></div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a> transformer_c;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      <span class="comment">// The transformer for D.</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a> transformer_d;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      <span class="comment">// The iterator to store into the D matrix.</span></div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a> global_store_iterator(</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.iterator_d, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a>, block, pointer_offset, predicate_offset);</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      <span class="comment">// update D pointer offset based on batch_id and batch_stride_offset</span></div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <span class="comment">//global_store_iterator.add_pointer_offset(batch_id * params.batch_stride_offset_d);</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      global_store_iterator += <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(batch_id, 0, 0);</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a> shared_store_transformer;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;      <span class="keyword">typename</span> SharedStoreTransformerD::OutputFragment shared_store_transformed_d;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a> shared_store_iterator(</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.shared_store_iterator_d,</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;          reinterpret_cast&lt;typename SharedStoreIteratorD::Scalar*&gt;(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a>.data()));</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">SharedLoadStreamD</a> shared_load_stream(</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>.shared_load_stream_d,</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;          reinterpret_cast&lt;typename SharedLoadStreamD::Scalar*&gt;(<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a>.data()));</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w) {</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;        <span class="comment">// Load the C matrix into fragment.</span></div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;        <span class="keywordflow">if</span> (kSourceRequired) {</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;          global_load_iterator.load_post_increment(fragment_c);</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;        }</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;        <span class="comment">// Make sure we can write to shared memory.</span></div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a>();</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;        <span class="comment">// Copy the accumulators to shared memory.</span></div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> offset = (h * Iterations::kW + w) * SharedStoreIteratorD::Fragment::kElements;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;        shared_store_transformer.transform(accumulators, offset, shared_store_transformed_d);</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;        shared_store_iterator.store_post_increment(shared_store_transformed_d);</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;        <span class="comment">// Make sure the data is in shared memory.</span></div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">shared_store_fence</a>();</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;        <span class="comment">// Copy the accumulators back to registers from shared memory.</span></div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;        shared_load_stream.copy();</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;        shared_load_stream.commit();</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;        <span class="comment">// Do the math.</span></div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;        <span class="keyword">typename</span> GlobalTransformerD::InputFragment fragment_d;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;        <span class="keywordflow">if</span> (kSourceRequired) {</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;          <span class="comment">// Transform C fragment.</span></div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;          transformer_c.transform(fragment_c, transformed_c);</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;          <span class="comment">// Do the math.</span></div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a>.evaluate(shared_load_stream.fragment(), transformed_c, fragment_d);</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;        } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a>.evaluate(shared_load_stream.fragment(), fragment_d);</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        }</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;        <span class="comment">// Transform D fragment.</span></div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;        <span class="keyword">typename</span> GlobalTransformerD::OutputFragment global_transformed_d;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;        transformer_d.transform(fragment_d, global_transformed_d);</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;        <span class="comment">// Copy the results to global memory.</span></div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;        global_store_iterator.store_post_increment(global_transformed_d);</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;      }</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;    }</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;  }</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">  206</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a>() { __syncthreads(); }</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;</div><div class="line"><a name="l00209"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">  209</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">shared_store_fence</a>() { __syncthreads(); }</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">  212</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a>;</div><div class="line"><a name="l00214"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">  214</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a>;</div><div class="line"><a name="l00216"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">  216</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a>;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;  <span class="comment">// The functor.</span></div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">  218</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a>;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;};</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a4887b56a96694ce6350db77f78bb505f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">cutlass::gemm::GemmEpilogue::ScalarD</a></div><div class="ttdeci">GlobalStoreIteratorD::Scalar ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:85</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a6bea57249e3645a4b08a11619cb1687e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">cutlass::gemm::GemmEpilogue::problem_size</a></div><div class="ttdeci">Coord&lt; 3 &gt; problem_size</div><div class="ttdoc">The dimensions of the GEMM. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:216</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_aab0a964efe223c5c29bc816c393b5a9a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">cutlass::gemm::GemmEpilogue::SharedStoreIteratorD</a></div><div class="ttdeci">Traits::SharedStoreIteratorD SharedStoreIteratorD</div><div class="ttdoc">The iterator to store D in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:73</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="namespacecutlass_html_abcec976c59cab75ca55b338d125154a3"><div class="ttname"><a href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">cutlass::shared_iterator_load</a></div><div class="ttdeci">CUTLASS_DEVICE void shared_iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment from a shared memory input iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:75</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ae5209fa80705442693833c63d535161e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">cutlass::gemm::GemmEpilogue::Params</a></div><div class="ttdeci">Traits::Params Params</div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:57</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:53</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a0c24dce365565f75e7edc1de1cb50ea4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">cutlass::gemm::GemmEpilogue::epilogue_with_or_without_beta</a></div><div class="ttdeci">CUTLASS_DEVICE void epilogue_with_or_without_beta(Coord&lt; 3 &gt; const &amp;block, Accumulators &amp;accumulators)</div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:117</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ab10147070c3a38fca75397f55dc51925"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">cutlass::gemm::GemmEpilogue::GemmEpilogue</a></div><div class="ttdeci">CUTLASS_DEVICE GemmEpilogue(Params const &amp;params_, SharedStorage &amp;shared_storage_, Index m_, Index n_)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:101</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ae5209fa80705442693833c63d535161e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">cutlass::gemm::GemmEpilogue::Params</a></div><div class="ttdeci">Traits::Params Params</div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a7af2eb421840e037263e6a144cca5c32"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">cutlass::gemm::GemmEpilogue::epilogue_with_or_without_beta</a></div><div class="ttdeci">CUTLASS_DEVICE void epilogue_with_or_without_beta(Accumulators &amp;accumulators, Coord&lt; 3 &gt; const &amp;block, int batch_id)</div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:105</div></div>
 <div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1Copy_html"><div class="ttname"><a href="structcutlass_1_1Copy.html">cutlass::Copy</a></div><div class="ttdef"><b>Definition:</b> convert.h:69</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ac36dad8a7b6bc7fc6ef88e44068468dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">cutlass::gemm::GemmEpilogue::SharedStorage</a></div><div class="ttdeci">Traits::SharedStorage SharedStorage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:59</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a32f618ff19d984447fba7355d46a69a7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">cutlass::gemm::GemmEpilogue::GlobalTransformerD</a></div><div class="ttdeci">Traits::GlobalTransformerD GlobalTransformerD</div><div class="ttdoc">The transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:80</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a92a135fac401d43a8d2f14982d90274b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">cutlass::gemm::GemmEpilogue::OutputTile</a></div><div class="ttdeci">Traits::OutputTile OutputTile</div><div class="ttdoc">The output tile. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_afe6bebd94e3379c94054d04c5196edce"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">cutlass::gemm::GemmEpilogue::Accumulators</a></div><div class="ttdeci">Traits::Accumulators Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:66</div></div>
-<div class="ttc" id="cutlass_8h_html_a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><div class="ttname"><a href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="ttdeci">#define CUTLASS_PRAGMA_UNROLL</div><div class="ttdef"><b>Definition:</b> cutlass.h:60</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a9b5e42f222fec98ff479bc1650221b84"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">cutlass::gemm::GemmEpilogue::shared_load_fence</a></div><div class="ttdeci">CUTLASS_DEVICE void shared_load_fence()</div><div class="ttdoc">The memory fence for shared loads. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:209</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a442b5b5688cd658c3b3476650c00281e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">cutlass::gemm::GemmEpilogue::shared_storage</a></div><div class="ttdeci">SharedStorage &amp; shared_storage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:217</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a645ab6e9e63163ee6bf536717a30fb1b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">cutlass::gemm::GemmEpilogue::Traits</a></div><div class="ttdeci">GemmEpilogueTraits_ Traits</div><div class="ttdoc">The traits class. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:55</div></div>
-<div class="ttc" id="namespacecutlass_1_1gemm_html_a3e30ae89e6f7501725028144cd2d88cb"><div class="ttname"><a href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">cutlass::gemm::is_zero</a></div><div class="ttdeci">CUTLASS_DEVICE bool is_zero(T x)</div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:42</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a81b028a18df51d3caa1b0ba0c990e362"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">cutlass::gemm::GemmEpilogue::params</a></div><div class="ttdeci">Params const  &amp; params</div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:215</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a4a0b439f8a57d8e67174ecbd96183070"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">cutlass::gemm::GemmEpilogue::SharedLoadIteratorD</a></div><div class="ttdeci">Traits::SharedLoadIteratorD SharedLoadIteratorD</div><div class="ttdoc">The iterator to load D in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:88</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a07c93d583bfddd8f916fba6ef809832e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">cutlass::gemm::GemmEpilogue::Index</a></div><div class="ttdeci">Traits::Index Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:93</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a9063e7fc044a679652d5a3a31aa77e7c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">cutlass::gemm::GemmEpilogue::SharedStoreTransformerD</a></div><div class="ttdeci">Traits::SharedStoreTransformerD SharedStoreTransformerD</div><div class="ttdoc">The shared store transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:86</div></div>
-<div class="ttc" id="namespacecutlass_html_a705c6d75513e112d2731d1c40f4cf109"><div class="ttname"><a href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">cutlass::shared_iterator_store</a></div><div class="ttdeci">CUTLASS_DEVICE void shared_iterator_store(OutputIterator &amp;iterator, Fragment const &amp;fragment)</div><div class="ttdoc">Stores a fragment to a shared memory output iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:228</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a1c766374d900535c944cf2a2de6925f4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">cutlass::gemm::GemmEpilogue::GlobalStoreIteratorD</a></div><div class="ttdeci">Traits::GlobalStoreIteratorD GlobalStoreIteratorD</div><div class="ttdoc">The iterator for D in global memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:82</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:48</div></div>
-<div class="ttc" id="namespacecutlass_html_a0cb5bdf7bef498705c51a9cdcbef71f9"><div class="ttname"><a href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">cutlass::iterator_store</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_store(OutputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdoc">Stores a fragment to an output iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:193</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_abb0741601652df8fdf927d49c2c0e4d0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">cutlass::gemm::GemmEpilogue::ScalarC</a></div><div class="ttdeci">GlobalLoadIteratorC::Scalar ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:96</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a9cc371cd2f1a9485583afdacbb7403ea"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">cutlass::gemm::GemmEpilogue::n</a></div><div class="ttdeci">Index n</div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:219</div></div>
-<div class="ttc" id="namespacecutlass_html_a45dd7add04736cb5c3e69991d2f210be"><div class="ttname"><a href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">cutlass::iterator_load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment from an input iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:41</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a6c30bea1b2a1bd2e981025851d5b12d1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">cutlass::gemm::GemmEpilogue::Functor</a></div><div class="ttdeci">Traits::Functor Functor</div><div class="ttdoc">The functor in charge of the math. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a8e3c978da6ed56239783bf4db0a936ae"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">cutlass::gemm::GemmEpilogue::Iterations</a></div><div class="ttdeci">Traits::Iterations Iterations</div><div class="ttdoc">The number of iterations. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ae1983e37454ed14272b23b964614c54c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">cutlass::gemm::GemmEpilogue::epilogue</a></div><div class="ttdeci">CUTLASS_DEVICE void epilogue(Coord&lt; 3 &gt; const &amp;block, Accumulators &amp;accumulators)</div><div class="ttdoc">Execute the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:108</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a5aa254702fcf24630e04ceb174aa3d57"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">cutlass::gemm::GemmEpilogue::functor</a></div><div class="ttdeci">Functor functor</div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:218</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ac36dad8a7b6bc7fc6ef88e44068468dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">cutlass::gemm::GemmEpilogue::SharedStorage</a></div><div class="ttdeci">Traits::SharedStorage SharedStorage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a32f618ff19d984447fba7355d46a69a7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">cutlass::gemm::GemmEpilogue::GlobalTransformerD</a></div><div class="ttdeci">Traits::GlobalTransformerD GlobalTransformerD</div><div class="ttdoc">The transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_af91ebe8d2ed73808b9ea8846c140d3f8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">cutlass::gemm::GemmEpilogue::GemmEpilogue</a></div><div class="ttdeci">CUTLASS_DEVICE GemmEpilogue(Params const &amp;params_, SharedStorage &amp;shared_storage_, Coord&lt; 3 &gt; const &amp;_problem_size)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a92a135fac401d43a8d2f14982d90274b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">cutlass::gemm::GemmEpilogue::OutputTile</a></div><div class="ttdeci">Traits::OutputTile OutputTile</div><div class="ttdoc">The output tile. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:51</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_afe6bebd94e3379c94054d04c5196edce"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">cutlass::gemm::GemmEpilogue::Accumulators</a></div><div class="ttdeci">Traits::Accumulators Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:55</div></div>
+<div class="ttc" id="cutlass_8h_html_a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><div class="ttname"><a href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="ttdeci">#define CUTLASS_PRAGMA_UNROLL</div><div class="ttdef"><b>Definition:</b> cutlass.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a9b5e42f222fec98ff479bc1650221b84"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">cutlass::gemm::GemmEpilogue::shared_load_fence</a></div><div class="ttdeci">CUTLASS_DEVICE void shared_load_fence()</div><div class="ttdoc">The memory fence for shared loads. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:206</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a442b5b5688cd658c3b3476650c00281e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">cutlass::gemm::GemmEpilogue::shared_storage</a></div><div class="ttdeci">SharedStorage &amp; shared_storage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:214</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a645ab6e9e63163ee6bf536717a30fb1b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">cutlass::gemm::GemmEpilogue::Traits</a></div><div class="ttdeci">GemmEpilogueTraits_ Traits</div><div class="ttdoc">The traits class. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a81b028a18df51d3caa1b0ba0c990e362"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">cutlass::gemm::GemmEpilogue::params</a></div><div class="ttdeci">Params const  &amp; params</div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:212</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a07c93d583bfddd8f916fba6ef809832e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">cutlass::gemm::GemmEpilogue::Index</a></div><div class="ttdeci">Traits::Index Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:80</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a9063e7fc044a679652d5a3a31aa77e7c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">cutlass::gemm::GemmEpilogue::SharedStoreTransformerD</a></div><div class="ttdeci">Traits::SharedStoreTransformerD SharedStoreTransformerD</div><div class="ttdoc">The shared store transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:75</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a1c766374d900535c944cf2a2de6925f4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">cutlass::gemm::GemmEpilogue::GlobalStoreIteratorD</a></div><div class="ttdeci">Traits::GlobalStoreIteratorD GlobalStoreIteratorD</div><div class="ttdoc">The iterator for D in global memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:71</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_abb0741601652df8fdf927d49c2c0e4d0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">cutlass::gemm::GemmEpilogue::ScalarC</a></div><div class="ttdeci">GlobalLoadIteratorC::Scalar ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:83</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a8e5d38a7795b50a021fc43dc7424288b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">cutlass::gemm::GemmEpilogue::SharedLoadStreamD</a></div><div class="ttdeci">Traits::SharedLoadStreamD SharedLoadStreamD</div><div class="ttdoc">The iterator to load D in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:77</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a6c30bea1b2a1bd2e981025851d5b12d1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">cutlass::gemm::GemmEpilogue::Functor</a></div><div class="ttdeci">Traits::Functor Functor</div><div class="ttdoc">The functor in charge of the math. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:59</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a6f1f96715425b7196e960907676a7db3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">cutlass::gemm::GemmEpilogue::epilogue</a></div><div class="ttdeci">CUTLASS_DEVICE void epilogue(Accumulators &amp;accumulators, Coord&lt; 3 &gt; const &amp;block=make_Coord(0, 0, 0), int batch_id=0)</div><div class="ttdoc">Execute the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a8e3c978da6ed56239783bf4db0a936ae"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">cutlass::gemm::GemmEpilogue::Iterations</a></div><div class="ttdeci">Traits::Iterations Iterations</div><div class="ttdoc">The number of iterations. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:53</div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a132cabbc1402c87c7b35dea427001a13"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">cutlass::gemm::GemmEpilogue::SharedLoadTransformerD</a></div><div class="ttdeci">Copy&lt; typename SharedLoadIteratorD::Fragment &gt; SharedLoadTransformerD</div><div class="ttdoc">The shared load transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:90</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a0d38914bf97084e04102e7897aee4295"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">cutlass::gemm::GemmEpilogue::Scalar</a></div><div class="ttdeci">Traits::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:68</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a0d38914bf97084e04102e7897aee4295"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">cutlass::gemm::GemmEpilogue::Scalar</a></div><div class="ttdeci">Traits::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:57</div></div>
 <div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ac344bf5ca318dc343bd6fa6bf52d2e22"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">cutlass::gemm::GemmEpilogue::m</a></div><div class="ttdeci">Index m</div><div class="ttdoc">The dimensions of the GEMM. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:219</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ac1b2a16b4ccf3e9617faf4d8a2c43691"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">cutlass::gemm::GemmEpilogue::shared_store_fence</a></div><div class="ttdeci">CUTLASS_DEVICE void shared_store_fence()</div><div class="ttdoc">The memory fence for shared stores. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:212</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a41edfd24b7dd2759f8b72ae8534182a9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">cutlass::gemm::GemmEpilogue::GlobalTransformerC</a></div><div class="ttdeci">Traits::GlobalTransformerC GlobalTransformerC</div><div class="ttdoc">The transformer for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:78</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_aecb5429363c7156ee3ad596fe250120a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">cutlass::gemm::GemmEpilogue::GlobalLoadIteratorC</a></div><div class="ttdeci">Traits::GlobalLoadIteratorC GlobalLoadIteratorC</div><div class="ttdoc">We do not support 3D or 4D shapes. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:73</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ac1b2a16b4ccf3e9617faf4d8a2c43691"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">cutlass::gemm::GemmEpilogue::shared_store_fence</a></div><div class="ttdeci">CUTLASS_DEVICE void shared_store_fence()</div><div class="ttdoc">The memory fence for shared stores. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:209</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a41edfd24b7dd2759f8b72ae8534182a9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">cutlass::gemm::GemmEpilogue::GlobalTransformerC</a></div><div class="ttdeci">Traits::GlobalTransformerC GlobalTransformerC</div><div class="ttdoc">The transformer for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:67</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_aecb5429363c7156ee3ad596fe250120a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">cutlass::gemm::GemmEpilogue::GlobalLoadIteratorC</a></div><div class="ttdeci">Traits::GlobalLoadIteratorC GlobalLoadIteratorC</div><div class="ttdoc">We do not support 3D or 4D shapes. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:62</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__epilogue__traits_8h.html b/docs/gemm__epilogue__traits_8h.html
index cdb986363..3dceb7442 100644
--- a/docs/gemm__epilogue__traits_8h.html
+++ b/docs/gemm__epilogue__traits_8h.html
@@ -82,27 +82,27 @@ $(function() {
 
 <p>Defines structural properties of the GEMM epilogue.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__stream_8h_source.html">cutlass/gemm/gemm_global_stream.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__shared__stream_8h_source.html">cutlass/gemm/gemm_shared_stream.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="linear__scaling_8h_source.html">cutlass/gemm/linear_scaling.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__stream_8h_source.html">cutlass/gemm/gemm_global_stream.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__stream_8h_source.html">cutlass/gemm/gemm_shared_stream.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="linear__scaling_8h_source.html">cutlass/gemm/linear_scaling.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&quot;</code><br />
 </div>
 <p><a href="gemm__epilogue__traits_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared memory storage to exchange data.  <a href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared memory to swizzle the data in the epilogue.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td></tr>
@@ -120,7 +120,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__epilogue__traits_8h_source.html b/docs/gemm__epilogue__traits_8h_source.html
index 3e10e801b..2471d16ad 100644
--- a/docs/gemm__epilogue__traits_8h_source.html
+++ b/docs/gemm__epilogue__traits_8h_source.html
@@ -76,83 +76,86 @@ $(function() {
 <div class="title">gemm_epilogue_traits.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="gemm__epilogue__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__stream_8h.html">cutlass/gemm/gemm_global_stream.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__stream_8h.html">cutlass/gemm/gemm_shared_stream.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="linear__scaling_8h.html">cutlass/gemm/linear_scaling.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> Accumulators_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keyword">typename</span> GlobalLoadIteratorC_,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keyword">typename</span> GlobalTransformerC_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <span class="keyword">typename</span> GlobalTransformerD_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;    <span class="keyword">typename</span> GlobalStoreIteratorD_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keyword">typename</span> SharedStoreIteratorD_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <span class="keyword">typename</span> SharedStoreTransformerD_,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keyword">typename</span> SharedLoadIteratorD_,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keyword">typename</span> Iterations_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keyword">typename</span> Delta_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="keyword">typename</span> Functor_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">   70</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">GemmEpilogueTraits</a> {</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">   73</a></span>&#160;<span class="comment"></span>  <span class="keyword">typedef</span> OutputTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">OutputTile</a>;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">   76</a></span>&#160;  <span class="keyword">typedef</span> Accumulators_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">Accumulators</a>;</div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">   78</a></span>&#160;  <span class="keyword">typedef</span> GlobalLoadIteratorC_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">GlobalLoadIteratorC</a>;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">   80</a></span>&#160;  <span class="keyword">typedef</span> GlobalTransformerC_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">GlobalTransformerC</a>;</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">   82</a></span>&#160;  <span class="keyword">typedef</span> GlobalTransformerD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">GlobalTransformerD</a>;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">   84</a></span>&#160;  <span class="keyword">typedef</span> GlobalStoreIteratorD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">GlobalStoreIteratorD</a>;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">   86</a></span>&#160;  <span class="keyword">typedef</span> SharedStoreIteratorD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">SharedStoreIteratorD</a>;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">   88</a></span>&#160;  <span class="keyword">typedef</span> SharedStoreTransformerD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">SharedStoreTransformerD</a>;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">   90</a></span>&#160;  <span class="keyword">typedef</span> SharedLoadIteratorD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">SharedLoadIteratorD</a>;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">   92</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">Iterations</a>;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">   94</a></span>&#160;  <span class="keyword">typedef</span> Delta_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">Delta</a>;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">   97</a></span>&#160;  <span class="keyword">typedef</span> Functor_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">Functor</a>;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">   99</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">  102</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Iterations::kD == 1 &amp;&amp; Iterations::kC == 1, <span class="stringliteral">&quot;Unsupported 3D/4D shapes&quot;</span>);</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Functor::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">Scalar</a>;</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">  107</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadIteratorC::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">ScalarC</a>;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">  109</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalStoreIteratorD::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">ScalarD</a>;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">  112</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">Params</a> {</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2">  114</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae0fdc7426b22ff2c20f077e251ebc823">stride_h</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2">stride_w</a>;</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce">  116</a></span>&#160;    <span class="keyword">typename</span> GlobalLoadIteratorC::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce">iterator_c</a>;</div><div class="line"><a name="l00118"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7">  118</a></span>&#160;    <span class="keyword">typename</span> GlobalStoreIteratorD::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7">iterator_d</a>;</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#af79a0c74a4c30ccec59b393721b5dfc1">  120</a></span>&#160;    <span class="keyword">typename</span> SharedStoreIteratorD::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#af79a0c74a4c30ccec59b393721b5dfc1">shared_store_iterator_d</a>;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a1742e43c128665f0ca39cb578291df81">  122</a></span>&#160;    <span class="keyword">typename</span> SharedLoadIteratorD::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a1742e43c128665f0ca39cb578291df81">shared_load_iterator_d</a>;</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06">  124</a></span>&#160;    <span class="keyword">typename</span> Functor::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06">functor</a>;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmDesc_&gt;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a3e9d0fd2989fea776b0cab0e0f2813ce">  128</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a3e9d0fd2989fea776b0cab0e0f2813ce">initialize</a>(GemmDesc_ <span class="keyword">const</span>&amp; desc) {</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      <span class="comment">// The parameters for the functor.</span></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;      <span class="keywordtype">int</span> error_code = <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06">functor</a>.initialize(desc);</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      }</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      <span class="comment">// At the end of the H iteration, we jump over a number of columns.</span></div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;      this-&gt;stride_h = desc.ldd * Delta::kH;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;      <span class="comment">// Nothing to do here.</span></div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      this-&gt;stride_w = 0;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <span class="comment">// Setup the params for the global memory iterator for C.</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      error_code = <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce">iterator_c</a>.initialize(</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;          reinterpret_cast&lt;ScalarC const*&gt;(desc.d_c), desc.ldc, desc.n, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2">stride_w</a>, Delta::kW);</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      }</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      <span class="comment">// Setup the params for the global memory iterator for D.</span></div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7">iterator_d</a>.initialize(</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;          reinterpret_cast&lt;ScalarD*&gt;(desc.d_d), desc.ldd, desc.n, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2">stride_w</a>, Delta::kW);</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    }</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  };</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">  154</a></span>&#160;  <span class="keyword">union </span><a class="code" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a> {</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <span class="comment">// The storage for the store iterator.</span></div><div class="line"><a name="l00156"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a1f31090613c4e6f0895f598880d6c4e5">  156</a></span>&#160;    <span class="keyword">typename</span> SharedStoreIteratorD::SharedStorage <a class="code" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a1f31090613c4e6f0895f598880d6c4e5">store</a>;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="comment">// The storage for the store iterator.</span></div><div class="line"><a name="l00158"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#aea5ed35a44624684ffa9ada9d09a8893">  158</a></span>&#160;    <span class="keyword">typename</span> SharedLoadIteratorD::SharedStorage <a class="code" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#aea5ed35a44624684ffa9ada9d09a8893">load</a>;</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;  };</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">  162</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">SharedStorage</a> {</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <span class="comment">// The storage for the shared stream D.</span></div><div class="line"><a name="l00164"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#ae63b5a52106dbd37ea304196335ec210">  164</a></span>&#160;    <a class="code" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#ae63b5a52106dbd37ea304196335ec210">shared_stream</a>;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  };</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;};</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> EpilogueFunctor_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00171"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">  171</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper</a> {</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">  173</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> EpilogueFunctor_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">Scalar</a>;</div><div class="line"><a name="l00175"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">  175</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::OutputTile <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">OutputTile</a>;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1,</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;                GemmConfig_::MultiplyAdd::AccumulatorsPerThread::kH /</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;                    GemmConfig_::kAccumulatorsPerLdsB,</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;                GemmConfig_::kAccumulatorsPerLdsB&gt;</div><div class="line"><a name="l00182"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">  182</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a>;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;  <span class="comment">// The iteration strides in the H/W dimension.</span></div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;0,</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;                GemmConfig_::kAccumulatorsPerLdsB*(</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;                    GemmConfig_::Warps::kH* GemmConfig_::MultiplyAdd::ThreadsPerWarp::kH - 1),</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;                0&gt;</div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aede069e51e0732a9648c437261bd4d66">  188</a></span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Delta</a>;</div><div class="line"><a name="l00190"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">  190</a></span>&#160;  <span class="keyword">typedef</span> EpilogueFunctor_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">Functor</a>;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a>&lt;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      <span class="keyword">typename</span> Functor::Scalar,</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      <span class="comment">// The number of scalars per STS.</span></div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;      GemmConfig_::kScalarsPerStsD,</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;      <span class="comment">// The skew -- 128 / sizeof(ScalarD) / kScalarsPerStsD is the number of threads involved in</span></div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;      <span class="comment">// a single STS. We divide by 2 as our objective is to add a skew to the odd threads to</span></div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;      <span class="comment">// avoid bank conflicts between odd and even threads.</span></div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      128 / <span class="keyword">sizeof</span>(<span class="keyword">typename</span> GemmConfig_::ScalarD) / GemmConfig_::kScalarsPerStsD / 2 *</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;          GemmConfig_::kScalarsPerStsD&gt;</div><div class="line"><a name="l00209"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">  209</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">SharedStoreTileTraits</a>,</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;                            <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>,</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00216"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">  216</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a>;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">  219</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename SharedStoreIteratorD::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a>;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a>&lt;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;      <span class="keyword">typename</span> Functor::Scalar,</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;      <span class="comment">// The number of columns of the output tile written by iteration.</span></div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;      GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;      GemmConfig_::kScalarsPerLdsD,</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">SharedStoreTileTraits::kSkew</a>&gt;</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">  237</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">SharedLoadTileTraits</a>,</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;                           <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>,</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00244"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">  244</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a>;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a>&lt;</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="keyword">typename</span> GemmConfig_::ScalarC <span class="keyword">const</span>,</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      <span class="comment">// The tile has size (N / Iterations)xM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1,</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;            GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;            GemmConfig_::OutputTile::kW&gt;,</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      <span class="comment">// How many elements do we jump over at each iteration?</span></div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Iterations::kW</a>,</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;      GemmConfig_::kScalarsPerLdgC&gt;</div><div class="line"><a name="l00260"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">  260</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">GlobalLoadTileTraits</a>;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div><div class="line"><a name="l00263"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">  263</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;GlobalLoadTileTraits, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">GlobalLoadIteratorC</a>;</div><div class="line"><a name="l00265"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">  265</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename GlobalLoadIteratorC::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">GlobalTransformerC</a>;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a>&lt;</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;      <span class="keyword">typename</span> GemmConfig_::ScalarD,</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;      <span class="comment">// The tile has size (N / Iterations)xM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1,</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;            GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;            GemmConfig_::OutputTile::kW&gt;,</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;      <span class="comment">// How many elements do we jump over at each iteration?</span></div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Iterations::kW</a>,</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;      GemmConfig_::kScalarsPerStgD&gt;</div><div class="line"><a name="l00281"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">  281</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">GlobalStoreTileTraits</a>;</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div><div class="line"><a name="l00284"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">  284</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;GlobalStoreTileTraits, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">GlobalStoreIteratorD</a>;</div><div class="line"><a name="l00286"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">  286</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename GlobalStoreIteratorD::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">GlobalTransformerD</a>;</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;};</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;    <span class="keyword">typename</span> GemmConfig_,</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;    <span class="keyword">typename</span> Helper_ = <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper&lt;GemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">  300</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">GemmEpilogueTraits</a>&lt;</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;                                          <span class="comment">// The output tile.</span></div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;                                          typename GemmConfig_::OutputTile,</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;                                          <span class="comment">// The accumulators.</span></div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;                                          typename GemmConfig_::Accumulators,</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;                                          <span class="comment">// The global iterator for C.</span></div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;                                          typename Helper_::GlobalLoadIteratorC,</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;                                          <span class="comment">// The transformer for C.</span></div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;                                          typename Helper_::GlobalTransformerC,</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;                                          <span class="comment">// The transformer for D.</span></div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;                                          typename Helper_::GlobalTransformerD,</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;                                          <span class="comment">// The global iterator for D.</span></div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;                                          typename Helper_::GlobalStoreIteratorD,</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;                                          <span class="comment">// The iterator to store D to shared memory.</span></div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;                                          typename Helper_::SharedStoreIteratorD,</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;                                          <span class="comment">// The shared store transformer for D.</span></div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;                                          typename Helper_::SharedStoreTransformerD,</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;                                          <span class="comment">// The iterator to load D from shared memory.</span></div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                                          typename Helper_::SharedLoadIteratorD,</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;                                          <span class="comment">// The number of iterations.</span></div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;                                          typename Helper_::Iterations,</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;                                          <span class="comment">// The strides between iterations.</span></div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;                                          typename Helper_::Delta,</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;                                          <span class="comment">// The functor to be used in the epilogue.</span></div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;                                          EpilogueFunctor_,</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;                                          <span class="comment">// The index.</span></div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;                                          Index_&gt; {};</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:116</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage_html_aea5ed35a44624684ffa9ada9d09a8893"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#aea5ed35a44624684ffa9ada9d09a8893">cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage::load</a></div><div class="ttdeci">SharedLoadIteratorD::SharedStorage load</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:158</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_af1f105d4712f01880b0944666e2f81ae"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">cutlass::gemm::GemmEpilogueTraits::Delta</a></div><div class="ttdeci">Delta_ Delta</div><div class="ttdoc">The iterations strides. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:94</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
+<a href="gemm__epilogue__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__stream_8h.html">cutlass/gemm/gemm_global_stream.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__stream_8h.html">cutlass/gemm/gemm_shared_stream.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="linear__scaling_8h.html">cutlass/gemm/linear_scaling.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> Accumulators_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keyword">typename</span> GlobalLoadIteratorC_,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keyword">typename</span> GlobalTransformerC_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <span class="keyword">typename</span> GlobalTransformerD_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;    <span class="keyword">typename</span> GlobalStoreIteratorD_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keyword">typename</span> SharedStoreIteratorD_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <span class="keyword">typename</span> SharedStoreTransformerD_,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keyword">typename</span> SharedLoadStreamD_,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keyword">typename</span> Iterations_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keyword">typename</span> Delta_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="keyword">typename</span> Functor_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">   70</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">GemmEpilogueTraits</a> {</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">   73</a></span>&#160;<span class="comment"></span>  <span class="keyword">typedef</span> OutputTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">OutputTile</a>;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">   76</a></span>&#160;  <span class="keyword">typedef</span> Accumulators_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">Accumulators</a>;</div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">   78</a></span>&#160;  <span class="keyword">typedef</span> GlobalLoadIteratorC_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">GlobalLoadIteratorC</a>;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">   80</a></span>&#160;  <span class="keyword">typedef</span> GlobalTransformerC_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">GlobalTransformerC</a>;</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">   82</a></span>&#160;  <span class="keyword">typedef</span> GlobalTransformerD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">GlobalTransformerD</a>;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">   84</a></span>&#160;  <span class="keyword">typedef</span> GlobalStoreIteratorD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">GlobalStoreIteratorD</a>;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">   86</a></span>&#160;  <span class="keyword">typedef</span> SharedStoreIteratorD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">SharedStoreIteratorD</a>;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">   88</a></span>&#160;  <span class="keyword">typedef</span> SharedStoreTransformerD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">SharedStoreTransformerD</a>;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">   90</a></span>&#160;  <span class="keyword">typedef</span> SharedLoadStreamD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">SharedLoadStreamD</a>;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">   92</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">Iterations</a>;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">   94</a></span>&#160;  <span class="keyword">typedef</span> Delta_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">Delta</a>;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">   97</a></span>&#160;  <span class="keyword">typedef</span> Functor_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">Functor</a>;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">   99</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">  102</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Iterations::kD == 1 &amp;&amp; Iterations::kC == 1, <span class="stringliteral">&quot;Unsupported 3D/4D shapes&quot;</span>);</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Functor::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">Scalar</a>;</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">  107</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadIteratorC::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">ScalarC</a>;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">  109</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalStoreIteratorD::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a>;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">  112</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">Params</a> {</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68">  114</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a497b91e93d0eb29ca54553f8de4c694f">stride_h</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68">stride_w</a>;</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8">  116</a></span>&#160;    <span class="keyword">typename</span> GlobalLoadIteratorC::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8">iterator_c</a>;</div><div class="line"><a name="l00118"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346">  118</a></span>&#160;    <span class="keyword">typename</span> GlobalStoreIteratorD::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346">iterator_d</a>;</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adfdf3eca06ea4061fbfe016336a3f276">  120</a></span>&#160;    <span class="keyword">typename</span> SharedStoreIteratorD::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adfdf3eca06ea4061fbfe016336a3f276">shared_store_iterator_d</a>;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a5d3d1abd85f18476a74bcf616a717f9d">  122</a></span>&#160;    <span class="keyword">typename</span> SharedLoadStreamD::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a5d3d1abd85f18476a74bcf616a717f9d">shared_load_stream_d</a>;</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee">  124</a></span>&#160;    <span class="keyword">typename</span> Functor::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee">functor</a>;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmDesc_&gt;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a13395bf81eabdc539c935e179c31d7ca">  128</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a13395bf81eabdc539c935e179c31d7ca">initialize</a>(GemmDesc_ <span class="keyword">const</span>&amp; desc) {</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;      <span class="comment">// The parameters for the functor.</span></div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="keywordtype">int</span> error_code = <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee">functor</a>.initialize(desc);</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;      }</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;      <span class="comment">// At the end of the H iteration, we jump over a number of columns.</span></div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;      this-&gt;stride_h = desc.D.leading_dim() * Delta::kH;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      <span class="comment">// Nothing to do here.</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      this-&gt;stride_w = 0;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <span class="comment">// Setup the params for the global memory iterator for C.</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      error_code = <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8">iterator_c</a>.initialize(desc.C.data(),</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;                                         desc.batch_stride_C,</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;                                         desc.C.leading_dim(),</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;                                         desc.problem_size[1],</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;                                         <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68">stride_w</a>,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;                                         Delta::kW);</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      }</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      <span class="comment">// Setup the params for the global memory iterator for D.</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346">iterator_d</a>.initialize(desc.D.data(),</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;                                   desc.batch_stride_D,</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;                                   desc.D.leading_dim(),</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;                                   desc.problem_size[1],</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;                                   <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68">stride_w</a>,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;                                   Delta::kW);</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    }</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;  };</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">  162</a></span>&#160;  <span class="keyword">union </span><a class="code" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a> {</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <span class="comment">// The storage for the store iterator.</span></div><div class="line"><a name="l00164"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a673ddeb91e89c9a39c0a4dbaaa97dd8f">  164</a></span>&#160;    <span class="keyword">typename</span> SharedStoreIteratorD::SharedStorage <a class="code" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a673ddeb91e89c9a39c0a4dbaaa97dd8f">store</a>;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    <span class="comment">// The storage for the store iterator.</span></div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af">  166</a></span>&#160;    <span class="keyword">typename</span> SharedLoadStreamD::SharedStorage <a class="code" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af">load</a>;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  };</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">  170</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">SharedStorage</a> {</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    <span class="comment">// The storage for the shared stream D.</span></div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e">  172</a></span>&#160;    <a class="code" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e">shared_stream</a>;</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    CUTLASS_DEVICE</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a0e05007f939b27e6a17dce5c2a49e3e0">  179</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a>* <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a0e05007f939b27e6a17dce5c2a49e3e0">data</a>() { <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a>*<span class="keyword">&gt;</span>(&amp;<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e">shared_stream</a>.<a class="code" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af">load</a>); }</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;  };</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;};</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> EpilogueFunctor_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">  186</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper</a> {</div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">  188</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> EpilogueFunctor_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">Scalar</a>;</div><div class="line"><a name="l00190"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">  190</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::OutputTile <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">OutputTile</a>;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1,</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;                GemmConfig_::MultiplyAdd::AccumulatorsPerThread::kH /</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;                    GemmConfig_::kAccumulatorsPerLdsB,</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;                GemmConfig_::kAccumulatorsPerLdsB&gt;</div><div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">  197</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a>;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;  <span class="comment">// The iteration strides in the H/W dimension.</span></div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;0,</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;                GemmConfig_::kAccumulatorsPerLdsB*(</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;                    GemmConfig_::Warps::kH* GemmConfig_::MultiplyAdd::ThreadsPerWarp::kH - 1),</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;                0&gt;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aede069e51e0732a9648c437261bd4d66">  203</a></span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Delta</a>;</div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">  205</a></span>&#160;  <span class="keyword">typedef</span> EpilogueFunctor_ <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">Functor</a>;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a>&lt;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      <span class="comment">// typename Functor::Scalar,</span></div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="comment">// Functor::Scalar is alpha, beta type, in mixed precision, alpha and beta may not be the same with accumulation.</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      <span class="comment">// In this case Functor::ScalarAccum is needed</span></div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      <span class="keyword">typename</span> Functor::ScalarAccum,</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      <span class="comment">// The number of scalars per STS.</span></div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;      GemmConfig_::kScalarsPerStsD,</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;      <span class="comment">// The skew -- 128 / sizeof(ScalarD) / kScalarsPerStsD is the number of threads involved in</span></div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      <span class="comment">// a single STS. We divide by 2 as our objective is to add a skew to the odd threads to</span></div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;      <span class="comment">// avoid bank conflicts between odd and even threads.</span></div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      128 / <span class="keyword">sizeof</span>(<span class="keyword">typename</span> GemmConfig_::ScalarD) / GemmConfig_::kScalarsPerStsD / 2 *</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;          GemmConfig_::kScalarsPerStsD&gt;</div><div class="line"><a name="l00227"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">  227</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">SharedStoreTileTraits</a>,</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;                            <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>,</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00234"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">  234</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a>;</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">  237</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename SharedStoreIteratorD::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a>;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a>&lt;</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;      <span class="comment">// typename Functor::Scalar,</span></div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;      <span class="comment">// Functor::Scalar is alpha, beta type, in mixed precision, alpha and beta may not be the same with accumulation.</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;      <span class="comment">// In this case Functor::ScalarAccum is needed</span></div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      <span class="keyword">typename</span> Functor::ScalarAccum,</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      <span class="comment">// The number of columns of the output tile written by iteration.</span></div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;      GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;      GemmConfig_::kScalarsPerLdsD,</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">SharedStoreTileTraits::kSkew</a>&gt;</div><div class="line"><a name="l00258"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">  258</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">SharedLoadTileTraits</a>,</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;                           <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>,</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00265"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">  265</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a>;</div><div class="line"><a name="l00267"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">  267</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorD&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">SharedLoadStreamD</a>;</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a>&lt;</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;      <span class="keyword">typename</span> GemmConfig_::ScalarC <span class="keyword">const</span>,</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;      <span class="comment">// The tile has size (N / Iterations)xM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1,</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;            GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;            GemmConfig_::OutputTile::kW&gt;,</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;      <span class="comment">// How many elements do we jump over at each iteration?</span></div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Iterations::kW</a>,</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;      GemmConfig_::kScalarsPerLdgC&gt;</div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">  283</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">GlobalLoadTileTraits</a>;</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;</div><div class="line"><a name="l00286"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">  286</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;GlobalLoadTileTraits, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">GlobalLoadIteratorC</a>;</div><div class="line"><a name="l00288"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">  288</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename GlobalLoadIteratorC::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">GlobalTransformerC</a>;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a>&lt;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;      <span class="keyword">typename</span> GemmConfig_::ScalarD,</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;      <span class="comment">// The tile has size (N / Iterations)xM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1,</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;            GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;            GemmConfig_::OutputTile::kW&gt;,</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;      <span class="comment">// How many elements do we jump over at each iteration?</span></div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Iterations::kW</a>,</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;      GemmConfig_::kScalarsPerStgD&gt;</div><div class="line"><a name="l00304"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">  304</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">GlobalStoreTileTraits</a>;</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div><div class="line"><a name="l00307"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">  307</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;GlobalStoreTileTraits, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">GlobalStoreIteratorD</a>;</div><div class="line"><a name="l00309"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">  309</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename GlobalStoreIteratorD::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">GlobalTransformerD</a>;</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;};</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;    <span class="keyword">typename</span> GemmConfig_,</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;    <span class="keyword">typename</span> Helper_ = <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper&lt;GemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00323"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">  323</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">GemmEpilogueTraits</a>&lt;</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;                                          <span class="comment">// The output tile.</span></div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;                                          typename GemmConfig_::OutputTile,</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;                                          <span class="comment">// The accumulators.</span></div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;                                          typename GemmConfig_::Accumulators,</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;                                          <span class="comment">// The global iterator for C.</span></div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;                                          typename Helper_::GlobalLoadIteratorC,</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;                                          <span class="comment">// The transformer for C.</span></div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;                                          typename Helper_::GlobalTransformerC,</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;                                          <span class="comment">// The transformer for D.</span></div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;                                          typename Helper_::GlobalTransformerD,</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;                                          <span class="comment">// The global iterator for D.</span></div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;                                          typename Helper_::GlobalStoreIteratorD,</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;                                          <span class="comment">// The iterator to store D to shared memory.</span></div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;                                          typename Helper_::SharedStoreIteratorD,</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;                                          <span class="comment">// The shared store transformer for D.</span></div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;                                          typename Helper_::SharedStoreTransformerD,</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;                                          <span class="comment">// The stream to load D from shared memory.</span></div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;                                          typename Helper_::SharedLoadStreamD,</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;                                          <span class="comment">// The number of iterations.</span></div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;                                          typename Helper_::Iterations,</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;                                          <span class="comment">// The strides between iterations.</span></div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;                                          typename Helper_::Delta,</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;                                          <span class="comment">// The functor to be used in the epilogue.</span></div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;                                          EpilogueFunctor_,</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;                                          <span class="comment">// The index.</span></div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;                                          Index_&gt; {};</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:120</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a685d59ee03a226e62660e83c4c60ca69"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">cutlass::gemm::GemmEpilogueTraits::SharedStoreTransformerD</a></div><div class="ttdeci">SharedStoreTransformerD_ SharedStoreTransformerD</div><div class="ttdoc">The shared store transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a7cf2e703f78b877ad551d0516982da10"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">cutlass::gemm::GemmEpilogueTraits::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">typedef typename GemmConfig::EpilogueIterations Iterations; </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:92</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage_html_a0e05007f939b27e6a17dce5c2a49e3e0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a0e05007f939b27e6a17dce5c2a49e3e0">cutlass::gemm::GemmEpilogueTraits::SharedStorage::data</a></div><div class="ttdeci">CUTLASS_DEVICE ScalarD * data()</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:179</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a94f00f94a88588522ca3f9f0197a5a9b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadTileTraits</a></div><div class="ttdeci">GemmGlobalTileCdTraits&lt; typename GemmConfig_::ScalarC const, Shape&lt; 1, GemmConfig_::OutputTile::kH/ShapeCount&lt; Iterations &gt;::kCount, GemmConfig_::OutputTile::kW &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, Iterations::kW, GemmConfig_::kScalarsPerLdgC &gt; GlobalLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for C^N. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:260</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:171</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a94f00f94a88588522ca3f9f0197a5a9b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadTileTraits</a></div><div class="ttdeci">GemmGlobalTileCdTraits&lt; typename GemmConfig_::ScalarC const, Shape&lt; 1, GemmConfig_::OutputTile::kH/ShapeCount&lt; Iterations &gt;::kCount, GemmConfig_::OutputTile::kW &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, Iterations::kW, GemmConfig_::kScalarsPerLdgC &gt; GlobalLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for C^N. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:283</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a4de6207ce3843d6c4325abc7d7abcf24"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">cutlass::gemm::GemmEpilogueTraits::GlobalLoadIteratorC</a></div><div class="ttdeci">GlobalLoadIteratorC_ GlobalLoadIteratorC</div><div class="ttdoc">The iterator for C in global memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:78</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:186</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_adb04e5990ab7faae9e8c0b110d2e3bee"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee">cutlass::gemm::GemmEpilogueTraits::Params::functor</a></div><div class="ttdeci">Functor::Params functor</div><div class="ttdoc">The functor params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:124</div></div>
 <div class="ttc" id="tile__iterator_8h_html"><div class="ttname"><a href="tile__iterator_8h.html">tile_iterator.h</a></div><div class="ttdoc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a051f25a4aa3ea71ff400582228adbdaa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">cutlass::gemm::GemmEpilogueTraits::GlobalTransformerC</a></div><div class="ttdeci">GlobalTransformerC_ GlobalTransformerC</div><div class="ttdoc">The transformer for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:80</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_a987c179a7e73c2572fe8aef3255668f7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7">cutlass::gemm::GemmEpilogueTraits::Params::iterator_d</a></div><div class="ttdeci">GlobalStoreIteratorD::Params iterator_d</div><div class="ttdoc">The params for the D global iterator. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:118</div></div>
+<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage_html_ae7bc498e4976814111114091de4e43af"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af">cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage::load</a></div><div class="ttdeci">SharedLoadStreamD::SharedStorage load</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:166</div></div>
 <div class="ttc" id="linear__scaling_8h_html"><div class="ttname"><a href="linear__scaling_8h.html">linear_scaling.h</a></div><div class="ttdoc">Implements the BLAS linear scaling function alpha*AB + beta*C. </div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage_html"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage</a></div><div class="ttdoc">The shared memory storage to exchange data. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:154</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_abf97949c238d72854225c1c6131b5cbc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">cutlass::gemm::GemmEpilogueTraits::ScalarC</a></div><div class="ttdeci">GlobalLoadIteratorC::Scalar ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:107</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ae2b82b9b62aefa15005091bb84ac20e8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">cutlass::gemm::GemmEpilogueTraitsHelper::Scalar</a></div><div class="ttdeci">EpilogueFunctor_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:173</div></div>
+<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage_html"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage</a></div><div class="ttdoc">The shared memory storage to exchange data. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:162</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ae2b82b9b62aefa15005091bb84ac20e8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">cutlass::gemm::GemmEpilogueTraitsHelper::Scalar</a></div><div class="ttdeci">EpilogueFunctor_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:188</div></div>
 <div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_ae0fdc7426b22ff2c20f077e251ebc823"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae0fdc7426b22ff2c20f077e251ebc823">cutlass::gemm::GemmEpilogueTraits::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdoc">The strides for H and W in the different iterations of the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:114</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_ab430d05bd17efd60c28077c87b5ca331"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">cutlass::gemm::GemmEpilogueTraits::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_aeef5745d149770c9f79e12f6d97ffce1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">cutlass::gemm::GemmEpilogueTraits::GlobalStoreIteratorD</a></div><div class="ttdeci">GlobalStoreIteratorD_ GlobalStoreIteratorD</div><div class="ttdoc">The iterator for D in global memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:84</div></div>
 <div class="ttc" id="structcutlass_1_1Copy_html"><div class="ttname"><a href="structcutlass_1_1Copy.html">cutlass::Copy</a></div><div class="ttdef"><b>Definition:</b> convert.h:69</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_aed1bd9df5ff579ba3e36ae5ba781c075"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">cutlass::gemm::GemmEpilogueTraits::OutputTile</a></div><div class="ttdeci">OutputTile_ OutputTile</div><div class="ttdoc">The output tile. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:73</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_aeea13630bb281834b717f8d9d13a9319"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadIteratorC</a></div><div class="ttdeci">GemmGlobalIteratorCd&lt; GlobalLoadTileTraits, Index_ &gt; GlobalLoadIteratorC</div><div class="ttdoc">The iterator to load C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:263</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a1ee74d6f89b044578e1cd6dd210ce5fe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">cutlass::gemm::GemmEpilogueTraits::ScalarD</a></div><div class="ttdeci">GlobalStoreIteratorD::Scalar ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:109</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a02a517fd246fb961727d3bd1b4f954be"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreIteratorD</a></div><div class="ttdeci">TileStoreIterator&lt; SharedStoreTileTraits, typename SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorD</div><div class="ttdoc">The iterator to store D to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:216</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a23be7b4b498c17f9235a2b4896f1bffb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreIteratorD</a></div><div class="ttdeci">GemmGlobalIteratorCd&lt; GlobalStoreTileTraits, Index_ &gt; GlobalStoreIteratorD</div><div class="ttdoc">The iterator to store D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:284</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_aa5cea8dbebda9a12a503ae1416c4da33"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTransformerD</a></div><div class="ttdeci">Copy&lt; typename SharedStoreIteratorD::Fragment &gt; SharedStoreTransformerD</div><div class="ttdoc">The shared store transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:219</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ad7b23352072b1509d3383ee775756d2a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">cutlass::gemm::GemmEpilogueTraitsHelper::Iterations</a></div><div class="ttdeci">Shape&lt; 1, GemmConfig_::MultiplyAdd::AccumulatorsPerThread::kH/GemmConfig_::kAccumulatorsPerLdsB, GemmConfig_::kAccumulatorsPerLdsB &gt; Iterations</div><div class="ttdoc">The number of iterations in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:182</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_a7350ceefcd09a9e3662ca30b780cc2ce"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce">cutlass::gemm::GemmEpilogueTraits::Params::iterator_c</a></div><div class="ttdeci">GlobalLoadIteratorC::Params iterator_c</div><div class="ttdoc">The params for the C iterator. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:116</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a0b8ac1972b2f2cff48070f8b862ed25c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">cutlass::gemm::GemmEpilogueTraits::SharedStoreTransformerD</a></div><div class="ttdeci">SharedStoreTransformerD_ SharedStoreTransformerD</div><div class="ttdoc">The shared store transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:88</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_a3e9d0fd2989fea776b0cab0e0f2813ce"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a3e9d0fd2989fea776b0cab0e0f2813ce">cutlass::gemm::GemmEpilogueTraits::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const &amp;desc)</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:128</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a16d7df2934c3c59d9b8f36f7a2137aee"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreTileTraits</a></div><div class="ttdeci">GemmGlobalTileCdTraits&lt; typename GemmConfig_::ScalarD, Shape&lt; 1, GemmConfig_::OutputTile::kH/ShapeCount&lt; Iterations &gt;::kCount, GemmConfig_::OutputTile::kW &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, Iterations::kW, GemmConfig_::kScalarsPerStgD &gt; GlobalStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to global memory for D^N. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:281</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:302</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a74f4beb86447f6b613e9b60234cb27bc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">cutlass::gemm::GemmEpilogueTraits::SharedStoreIteratorD</a></div><div class="ttdeci">SharedStoreIteratorD_ SharedStoreIteratorD</div><div class="ttdoc">The iterator to store D in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:86</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage_html_a1f31090613c4e6f0895f598880d6c4e5"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a1f31090613c4e6f0895f598880d6c4e5">cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage::store</a></div><div class="ttdeci">SharedStoreIteratorD::SharedStorage store</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:156</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a3a0fb3a914bfd009ff2e3918bcd231a9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileDTraits&lt; typename Functor::Scalar, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::kScalarsPerStsD, 128/sizeof(typename GemmConfig_::ScalarD)/GemmConfig_::kScalarsPerStsD/2 *GemmConfig_::kScalarsPerStsD &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store to shared memory for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:209</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a48baee6541e6359753f1bae5bd864029"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">cutlass::gemm::GemmSharedStoreTileDTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:278</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a853b7ad3afb06fd720afc4559df2198d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">cutlass::gemm::GemmEpilogueTraits::GlobalTransformerC</a></div><div class="ttdeci">GlobalTransformerC_ GlobalTransformerC</div><div class="ttdoc">The transformer for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:80</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_aeea13630bb281834b717f8d9d13a9319"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadIteratorC</a></div><div class="ttdeci">GemmGlobalIteratorCd&lt; GlobalLoadTileTraits, Index_ &gt; GlobalLoadIteratorC</div><div class="ttdoc">The iterator to load C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:286</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_adb4eb47c84dc1c6df2556e72ff5800e6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">cutlass::gemm::GemmEpilogueTraits::GlobalTransformerD</a></div><div class="ttdeci">GlobalTransformerD_ GlobalTransformerD</div><div class="ttdoc">The transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:82</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a02a517fd246fb961727d3bd1b4f954be"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreIteratorD</a></div><div class="ttdeci">TileStoreIterator&lt; SharedStoreTileTraits, typename SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorD</div><div class="ttdoc">The iterator to store D to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:234</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a9e511e1852668e0a242315c24888dee3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadStreamD</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorD &gt; SharedLoadStreamD</div><div class="ttdoc">The stream to load D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:267</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_ad9a81c3ff36a4f3aa376e2cff94cbb50"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">cutlass::gemm::GemmEpilogueTraits::ScalarD</a></div><div class="ttdeci">GlobalStoreIteratorD::Scalar ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:109</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a23be7b4b498c17f9235a2b4896f1bffb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreIteratorD</a></div><div class="ttdeci">GemmGlobalIteratorCd&lt; GlobalStoreTileTraits, Index_ &gt; GlobalStoreIteratorD</div><div class="ttdoc">The iterator to store D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:307</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_abbcccb203f9823e621caa4475aa3d346"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346">cutlass::gemm::GemmEpilogueTraits::Params::iterator_d</a></div><div class="ttdeci">GlobalStoreIteratorD::Params iterator_d</div><div class="ttdoc">The params for the D global iterator. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:118</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_a5d3d1abd85f18476a74bcf616a717f9d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a5d3d1abd85f18476a74bcf616a717f9d">cutlass::gemm::GemmEpilogueTraits::Params::shared_load_stream_d</a></div><div class="ttdeci">SharedLoadStreamD::Params shared_load_stream_d</div><div class="ttdoc">The params for the D shared load stream. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:122</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_aa5cea8dbebda9a12a503ae1416c4da33"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTransformerD</a></div><div class="ttdeci">Copy&lt; typename SharedStoreIteratorD::Fragment &gt; SharedStoreTransformerD</div><div class="ttdoc">The shared store transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:237</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ad7b23352072b1509d3383ee775756d2a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">cutlass::gemm::GemmEpilogueTraitsHelper::Iterations</a></div><div class="ttdeci">Shape&lt; 1, GemmConfig_::MultiplyAdd::AccumulatorsPerThread::kH/GemmConfig_::kAccumulatorsPerLdsB, GemmConfig_::kAccumulatorsPerLdsB &gt; Iterations</div><div class="ttdoc">The number of iterations in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:197</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a16d7df2934c3c59d9b8f36f7a2137aee"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreTileTraits</a></div><div class="ttdeci">GemmGlobalTileCdTraits&lt; typename GemmConfig_::ScalarD, Shape&lt; 1, GemmConfig_::OutputTile::kH/ShapeCount&lt; Iterations &gt;::kCount, GemmConfig_::OutputTile::kW &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, Iterations::kW, GemmConfig_::kScalarsPerStgD &gt; GlobalStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to global memory for D^N. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:304</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:399</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_a497b91e93d0eb29ca54553f8de4c694f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a497b91e93d0eb29ca54553f8de4c694f">cutlass::gemm::GemmEpilogueTraits::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdoc">The strides for H and W in the different iterations of the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:114</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a8acbe7bfa905258a964ef56e634d4c99"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">cutlass::gemm::GemmEpilogueTraits::Functor</a></div><div class="ttdeci">Functor_ Functor</div><div class="ttdoc">The functor in charge of the math. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:97</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:45</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_af27cfae15beafcfbaf6d660781cbe5c4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">cutlass::gemm::GemmEpilogueTraits::Accumulators</a></div><div class="ttdeci">Accumulators_ Accumulators</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a48baee6541e6359753f1bae5bd864029"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">cutlass::gemm::GemmSharedStoreTileDTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:284</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_ab00969bdda930eeb7b82985c476adf7d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">cutlass::gemm::GemmEpilogueTraits::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">typedef typename GemmConfig::EpilogueIterations Iterations; </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:92</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:335</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_a0745d33dd881f6ca78b168e05b133ff8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8">cutlass::gemm::GemmEpilogueTraits::Params::iterator_c</a></div><div class="ttdeci">GlobalLoadIteratorC::Params iterator_c</div><div class="ttdoc">The params for the C iterator. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:116</div></div>
+<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage_html_a673ddeb91e89c9a39c0a4dbaaa97dd8f"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a673ddeb91e89c9a39c0a4dbaaa97dd8f">cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage::store</a></div><div class="ttdeci">SharedStoreIteratorD::SharedStorage store</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:164</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_ae814ac640d05358a3ce0ea70ed13ea68"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68">cutlass::gemm::GemmEpilogueTraits::Params::stride_w</a></div><div class="ttdeci">Index stride_w</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:114</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a5bb3232a2f15d8263d058c69b0839e2f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">cutlass::gemm::GemmEpilogueTraits::SharedLoadStreamD</a></div><div class="ttdeci">SharedLoadStreamD_ SharedLoadStreamD</div><div class="ttdoc">The stream to store D in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_af4d17d3774382fc0ba63d329bd12772c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">cutlass::gemm::GemmEpilogueTraits::OutputTile</a></div><div class="ttdeci">OutputTile_ OutputTile</div><div class="ttdoc">The output tile. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:73</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:339</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:300</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage_html_ae63b5a52106dbd37ea304196335ec210"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#ae63b5a52106dbd37ea304196335ec210">cutlass::gemm::GemmEpilogueTraits::SharedStorage::shared_stream</a></div><div class="ttdeci">StreamSharedStorage shared_stream</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:164</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a981134cf87d85aa28570a62d9e878b10"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">cutlass::gemm::GemmEpilogueTraitsHelper::Functor</a></div><div class="ttdeci">EpilogueFunctor_ Functor</div><div class="ttdoc">The functor to do the math in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:190</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_adbff60de6f90ef4d5ae0c7096692e2c0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadIteratorD</a></div><div class="ttdeci">TileLoadIterator&lt; SharedLoadTileTraits, typename SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorD</div><div class="ttdoc">The iterator to load D from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:244</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ac30a062bed1a65e45961c4f301b69101"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">cutlass::gemm::GemmEpilogueTraitsHelper::OutputTile</a></div><div class="ttdeci">GemmConfig_::OutputTile OutputTile</div><div class="ttdoc">The output tile. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:175</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a8409d84ee282a4d6953bd41149d8b9c2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">cutlass::gemm::GemmEpilogueTraits::GlobalLoadIteratorC</a></div><div class="ttdeci">GlobalLoadIteratorC_ GlobalLoadIteratorC</div><div class="ttdoc">The iterator for C in global memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:78</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a261e526c6a8e832bc483bf4e486cc9d7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">cutlass::gemm::GemmEpilogueTraits::GlobalTransformerD</a></div><div class="ttdeci">GlobalTransformerD_ GlobalTransformerD</div><div class="ttdoc">The transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:82</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:323</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a981134cf87d85aa28570a62d9e878b10"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">cutlass::gemm::GemmEpilogueTraitsHelper::Functor</a></div><div class="ttdeci">EpilogueFunctor_ Functor</div><div class="ttdoc">The functor to do the math in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:205</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_adbff60de6f90ef4d5ae0c7096692e2c0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadIteratorD</a></div><div class="ttdeci">TileLoadIterator&lt; SharedLoadTileTraits, typename SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorD</div><div class="ttdoc">The iterator to load D from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:265</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ac30a062bed1a65e45961c4f301b69101"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">cutlass::gemm::GemmEpilogueTraitsHelper::OutputTile</a></div><div class="ttdeci">GemmConfig_::OutputTile OutputTile</div><div class="ttdoc">The output tile. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:190</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_a13395bf81eabdc539c935e179c31d7ca"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a13395bf81eabdc539c935e179c31d7ca">cutlass::gemm::GemmEpilogueTraits::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const &amp;desc)</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:128</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage_html_a64ecac7d5843c38e55df78dcf609d33e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e">cutlass::gemm::GemmEpilogueTraits::SharedStorage::shared_stream</a></div><div class="ttdeci">StreamSharedStorage shared_stream</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:172</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a23b0e6a448e51f2e0837af95802c23b0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">cutlass::gemm::GemmEpilogueTraits::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:99</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:348</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_a565f6cab8925d632dcf24bd1974caca2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2">cutlass::gemm::GemmEpilogueTraits::Params::stride_w</a></div><div class="ttdeci">Index stride_w</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:114</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a076ea17d901d22d3b69bf9c621858235"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileDTraits&lt; typename Functor::ScalarAccum, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::OutputTile::kH/ShapeCount&lt; Iterations &gt;::kCount, GemmConfig_::kScalarsPerLdsD, SharedStoreTileTraits::kSkew &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:258</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:396</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a78836a20250ff24c25a6622ad818b421"><div class="ttname"><a href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">cutlass::Shape::kW</a></div><div class="ttdeci">static int const kW</div><div class="ttdoc">The width of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a006e50cf5fb67407d41c60d6d08b8b66"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">cutlass::gemm::GemmEpilogueTraits::Scalar</a></div><div class="ttdeci">Functor::Scalar Scalar</div><div class="ttdoc">We do not support 3D or 4D shapes. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:102</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ae96c5a3d58dc7a95543f8749f762ca43"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerD</a></div><div class="ttdeci">Copy&lt; typename GlobalStoreIteratorD::Fragment &gt; GlobalTransformerD</div><div class="ttdoc">The transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:286</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a84b89d856f548a26fa1dc15bfd2940da"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">cutlass::gemm::GemmEpilogueTraits::Delta</a></div><div class="ttdeci">Delta_ Delta</div><div class="ttdoc">The iterations strides. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_ada036c0457773a42fb18bc0463071d02"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">cutlass::gemm::GemmEpilogueTraits::GlobalStoreIteratorD</a></div><div class="ttdeci">GlobalStoreIteratorD_ GlobalStoreIteratorD</div><div class="ttdoc">The iterator for D in global memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:84</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ae96c5a3d58dc7a95543f8749f762ca43"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerD</a></div><div class="ttdeci">Copy&lt; typename GlobalStoreIteratorD::Fragment &gt; GlobalTransformerD</div><div class="ttdoc">The transformer for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:309</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_aa794b5f04ce736cdba0d778861ce3a9c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">cutlass::gemm::GemmEpilogueTraits::ScalarC</a></div><div class="ttdeci">GlobalLoadIteratorC::Scalar ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:107</div></div>
 <div class="ttc" id="gemm__global__stream_8h_html"><div class="ttname"><a href="gemm__global__stream_8h.html">gemm_global_stream.h</a></div><div class="ttdoc">Implements efficient loading of the thread block-level tile from global memory and storing to shared ...</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:112</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">cutlass::gemm::GemmEpilogueTraits::SharedStorage</a></div><div class="ttdoc">The shared memory to swizzle the data in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:162</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a9822fa405b32cc2f471c9fdd37585cb5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">cutlass::gemm::GemmEpilogueTraits::SharedLoadIteratorD</a></div><div class="ttdeci">SharedLoadIteratorD_ SharedLoadIteratorD</div><div class="ttdoc">The iterator to store D in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:90</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_afa888d993b86ed88950a9e5ab7edeb06"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06">cutlass::gemm::GemmEpilogueTraits::Params::functor</a></div><div class="ttdeci">Functor::Params functor</div><div class="ttdoc">The functor params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:124</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a0682b61d1a1a951026ff026bff9361bb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerC</a></div><div class="ttdeci">Copy&lt; typename GlobalLoadIteratorC::Fragment &gt; GlobalTransformerC</div><div class="ttdoc">The transformer for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:265</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_a1742e43c128665f0ca39cb578291df81"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a1742e43c128665f0ca39cb578291df81">cutlass::gemm::GemmEpilogueTraits::Params::shared_load_iterator_d</a></div><div class="ttdeci">SharedLoadIteratorD::Params shared_load_iterator_d</div><div class="ttdoc">The params for the D shared load iterator. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:122</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ab8ba28fd1da48fcabbafc0de91281b46"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileDTraits&lt; typename Functor::Scalar, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::OutputTile::kH/ShapeCount&lt; Iterations &gt;::kCount, GemmConfig_::kScalarsPerLdsD, SharedStoreTileTraits::kSkew &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:237</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_af7ff579ccb4269bfa5e9ae297260f7a2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">cutlass::gemm::GemmEpilogueTraits::Accumulators</a></div><div class="ttdeci">Accumulators_ Accumulators</div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:76</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a9a2218b570dada2f1e3ccd8004c47856"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">cutlass::gemm::GemmSharedStoreTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:266</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">cutlass::gemm::GemmEpilogueTraits::SharedStorage</a></div><div class="ttdoc">The shared memory to swizzle the data in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:170</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_a0682b61d1a1a951026ff026bff9361bb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerC</a></div><div class="ttdeci">Copy&lt; typename GlobalLoadIteratorC::Fragment &gt; GlobalTransformerC</div><div class="ttdoc">The transformer for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:288</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_adfdf3eca06ea4061fbfe016336a3f276"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adfdf3eca06ea4061fbfe016336a3f276">cutlass::gemm::GemmEpilogueTraits::Params::shared_store_iterator_d</a></div><div class="ttdeci">SharedStoreIteratorD::Params shared_store_iterator_d</div><div class="ttdoc">The params for the D shared store iterator. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:120</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a9a2218b570dada2f1e3ccd8004c47856"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">cutlass::gemm::GemmSharedStoreTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:272</div></div>
 <div class="ttc" id="gemm__shared__stream_8h_html"><div class="ttname"><a href="gemm__shared__stream_8h.html">gemm_shared_stream.h</a></div><div class="ttdoc">Defines abstractions for managing loading and storing fragments to shared memory in the efficient GEM...</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html">cutlass::ShapeCount</a></div><div class="ttdoc">Compute derived counted of a Layout Concept based class. </div><div class="ttdef"><b>Definition:</b> shape.h:79</div></div>
 <div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a1b025cb056729706f36469e74a9799dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">cutlass::gemm::GemmSharedLoadTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:337</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params_html_af79a0c74a4c30ccec59b393721b5dfc1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#af79a0c74a4c30ccec59b393721b5dfc1">cutlass::gemm::GemmEpilogueTraits::Params::shared_store_iterator_d</a></div><div class="ttdeci">SharedStoreIteratorD::Params shared_store_iterator_d</div><div class="ttdoc">The params for the D shared store iterator. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:120</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a7cdb30f17692e8fdb3dd4cf4c0b8e9ee"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">cutlass::gemm::GemmEpilogueTraits::Functor</a></div><div class="ttdeci">Functor_ Functor</div><div class="ttdoc">The functor in charge of the math. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:97</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">cutlass::gemm::GemmSharedStoreTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:264</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:620</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a8f15d59a7571d406d5ef593c342f0d4a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">cutlass::gemm::GemmEpilogueTraits::Scalar</a></div><div class="ttdeci">Functor::Scalar Scalar</div><div class="ttdoc">We do not support 3D or 4D shapes. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:102</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a1b025cb056729706f36469e74a9799dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">cutlass::gemm::GemmSharedLoadTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:341</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html_a48dee5c2aafb86e999732a1347c9f668"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">cutlass::gemm::GemmEpilogueTraits::SharedStoreIteratorD</a></div><div class="ttdeci">SharedStoreIteratorD_ SharedStoreIteratorD</div><div class="ttdoc">The iterator to store D in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:86</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_aad9a6190cccbc5c23a86f09c45c0e507"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileDTraits&lt; typename Functor::ScalarAccum, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::kScalarsPerStsD, 128/sizeof(typename GemmConfig_::ScalarD)/GemmConfig_::kScalarsPerStsD/2 *GemmConfig_::kScalarsPerStsD &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store to shared memory for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:227</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">cutlass::gemm::GemmSharedStoreTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:270</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:836</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__global__stream_8h.html b/docs/gemm__global__stream_8h.html
index 544d0f8b3..5be9d29d9 100644
--- a/docs/gemm__global__stream_8h.html
+++ b/docs/gemm__global__stream_8h.html
@@ -82,23 +82,21 @@ $(function() {
 
 <p>Implements efficient loading of the thread block-level tile from global memory and storing to shared memory.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="iterator__access_8h_source.html">cutlass/iterator_access.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tile__allocation_8h_source.html">cutlass/tile_allocation.h</a>&quot;</code><br />
 </div>
 <p><a href="gemm__global__stream_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage in shared memory needed by that stream.  <a href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -111,7 +109,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__global__stream_8h_source.html b/docs/gemm__global__stream_8h_source.html
index 4eff93c20..d028554c3 100644
--- a/docs/gemm__global__stream_8h_source.html
+++ b/docs/gemm__global__stream_8h_source.html
@@ -76,53 +76,66 @@ $(function() {
 <div class="title">gemm_global_stream.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="gemm__global__stream_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="iterator__access_8h.html">cutlass/iterator_access.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;    <span class="keyword">typename</span> LoadIterator_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keyword">typename</span> StoreIterator_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> Transformer_&gt;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">   49</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">GlobalLoadStreamBase</a> {</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">   51</a></span>&#160;  <span class="keyword">typedef</span> LoadIterator_ <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">LoadIterator</a>;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">   53</a></span>&#160;  <span class="keyword">typedef</span> Transformer_ <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">Transformer</a>;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">   55</a></span>&#160;  <span class="keyword">typedef</span> StoreIterator_ <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">StoreIterator</a>;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">   58</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> LoadIterator::Fragment <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">FetchedFragment</a>;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">   60</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Transformer::OutputFragment <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">TransformedFragment</a>;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;FetchedFragment, typename Transformer::InputFragment&gt;::value</a>),</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be">   63</a></span>&#160;                <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">TransformedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be">Fragment</a>;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;TransformedFragment, typename StoreIterator::Fragment&gt;::value</a>),</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;                <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c">   71</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c">kLayout</a> = LoadIterator::kLayout;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6">   73</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> LoadIterator::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6">Scalar</a>;</div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1">   75</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> LoadIterator::Pointer <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1">Pointer</a>;</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">   77</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> LoadIterator::Index <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">Index</a>;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">   80</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">Params</a> {</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <span class="comment">// The load iterator.</span></div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a42ffcba6af2b5ddfb1f4825a34d43532">   82</a></span>&#160;    <span class="keyword">typename</span> LoadIterator::Params <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a42ffcba6af2b5ddfb1f4825a34d43532">load_iterator</a>;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    <span class="comment">// The store iterator.</span></div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a3e5167fa3f2dc0d8b4b903bd4e936969">   84</a></span>&#160;    <span class="keyword">typename</span> StoreIterator::Params <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a3e5167fa3f2dc0d8b4b903bd4e936969">store_iterator</a>;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a7c7e448384156c801ed362359a1a6a40">   87</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a7c7e448384156c801ed362359a1a6a40">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1">Pointer</a> pointer, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">Index</a> ld) {</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      <span class="keywordtype">int</span> error_code = <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a42ffcba6af2b5ddfb1f4825a34d43532">load_iterator</a>.initialize(pointer, ld);</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;      }</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a3e5167fa3f2dc0d8b4b903bd4e936969">store_iterator</a>.initialize();</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    }</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  };</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa">   98</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> StoreIterator::SharedStorage <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa">SharedStoreStorage</a>;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">  101</a></span>&#160;  <span class="keyword">union </span><a class="code" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">SharedStorage</a> {</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    <span class="comment">// The load iterator.</span></div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a3be938f8661f9cd10966866b7b80b471">  103</a></span>&#160;    <span class="keyword">typename</span> LoadIterator::SharedStorage <a class="code" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a3be938f8661f9cd10966866b7b80b471">load_iterator</a>;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="comment">// The store iterator.</span></div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a939e9ddecc5ee97882a54211a61f5586">  105</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa">SharedStoreStorage</a> <a class="code" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a939e9ddecc5ee97882a54211a61f5586">store_iterator</a>;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  };</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278">  109</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278">GlobalLoadStreamBase</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; params,</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;                                      <a class="code" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">SharedStorage</a>&amp; shared_storage,</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;                                      <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> bounds,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;                                      <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; block)</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">load_iterator</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">load_iterator</a>, bounds, block),</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">transformer</a>(),</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">store_iterator</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">store_iterator</a>, shared_storage.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">store_iterator</a>)</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  {</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">fetched_fragment</a>.clear();</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  }</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e">  122</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e">copy</a>() { <a class="code" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">load_iterator</a>, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">fetched_fragment</a>); }</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae">  125</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae">commit</a>() {</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">transformer</a>.transform(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">fetched_fragment</a>, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">transformed_fragment</a>);</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <a class="code" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">store_iterator</a>, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">transformed_fragment</a>);</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">store_iterator</a>.inc_stage();</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  }</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9">  132</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9">residue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">Index</a> k, <span class="keywordtype">bool</span> skip_clear = <span class="keyword">false</span>) {</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">load_iterator</a>.residue(k);</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <span class="keywordflow">if</span> (!skip_clear) {</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">fetched_fragment</a>.clear();</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    }</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  }</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">  140</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">LoadIterator</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">load_iterator</a>;</div><div class="line"><a name="l00142"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">  142</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">FetchedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">fetched_fragment</a>;</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">  144</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">Transformer</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">transformer</a>;</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">  146</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">TransformedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">transformed_fragment</a>;</div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">  148</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">StoreIterator</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">store_iterator</a>;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;};</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <span class="keyword">typename</span> LoadIterator_,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="keyword">typename</span> StoreIterator_,</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    <span class="keyword">typename</span> Transformer_ = <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename LoadIterator_::Fragment&gt;</a> &gt;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00161"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">  161</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">GlobalLoadStreamBase</a>&lt;LoadIterator_, StoreIterator_, Transformer_&gt; {</div><div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160">  163</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">GlobalLoadStreamBase&lt;LoadIterator_, StoreIterator_, Transformer_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160">Base</a>;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a4dd11a75375b6b9d7b8dcbd4d402d8d6">  166</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a4dd11a75375b6b9d7b8dcbd4d402d8d6">GlobalLoadStream</a>(<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">Base::Params</a> <span class="keyword">const</span>&amp; params,</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;                                  <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">Base::SharedStorage</a>&amp; shared_storage,</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;                                  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; bounds,</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;                                  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; block)</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">Base</a>(params, shared_storage, bounds, block) {}</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;};</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a807cffc6f69f8d30a2fc94cf49fb904c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c">cutlass::gemm::GlobalLoadStreamBase::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">Make sure the transformed fragment is the same as the store fragment. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:71</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params_html_a3e5167fa3f2dc0d8b4b903bd4e936969"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a3e5167fa3f2dc0d8b4b903bd4e936969">cutlass::gemm::GlobalLoadStreamBase::Params::store_iterator</a></div><div class="ttdeci">StoreIterator::Params store_iterator</div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:84</div></div>
+<a href="gemm__global__stream_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__allocation_8h.html">cutlass/tile_allocation.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;    <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> Operand,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;    <span class="keyword">typename</span> LoadIterator_,</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;    <span class="keyword">typename</span> StoreIterator_,</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;    <span class="keyword">typename</span> Transformer_&gt;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">   52</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a> {</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700">   54</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700">kOperand</a> = Operand;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">   56</a></span>&#160;  <span class="keyword">typedef</span> LoadIterator_ <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">LoadIterator</a>;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">   58</a></span>&#160;  <span class="keyword">typedef</span> Transformer_ <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">Transformer</a>;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">   60</a></span>&#160;  <span class="keyword">typedef</span> StoreIterator_ <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">StoreIterator</a>;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">   63</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> LoadIterator::Fragment <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">FetchedFragment</a>;</div><div class="line"><a name="l00065"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">   65</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Transformer::OutputFragment <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a>;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;FetchedFragment, typename Transformer::InputFragment&gt;::value</a>),</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106">   68</a></span>&#160;                <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106">Fragment</a>;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;TransformedFragment, typename StoreIterator::Fragment&gt;::value</a>),</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db">   76</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db">kLayout</a> = LoadIterator::kLayout;</div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c">   78</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> LoadIterator::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c">Scalar</a>;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">   80</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> LoadIterator::Pointer <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">Pointer</a>;</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">   82</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> LoadIterator::Index <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a>;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec">   84</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> LoadIterator::Tile <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec">Tile</a>;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileAllocation.html">TileAllocation&lt;typename StoreIterator::Scalar, typename StoreIterator::Tile&gt;</a></div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8">   88</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8">ThreadblockTileStorage</a>;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">   91</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">ThreadblockTileStorage::TensorRef</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">ThreadblockTileRef</a>;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">   94</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a> {</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    <span class="comment">// The load iterator.</span></div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065">   96</a></span>&#160;    <span class="keyword">typename</span> LoadIterator::Params <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065">load_iterator</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    <span class="comment">// The store iterator.</span></div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f">   98</a></span>&#160;    <span class="keyword">typename</span> StoreIterator::Params <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f">store_iterator</a>;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <span class="comment">// Offset to residue.</span></div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">  100</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">offset_to_residue</a>;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a054aee5b4bf288cc1f5945f2521ef835">  103</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a054aee5b4bf288cc1f5945f2521ef835">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">Pointer</a> pointer,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;                                       <span class="keywordtype">long</span> <span class="keywordtype">long</span> batch_stride,</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> ldm,</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> _offset_to_residue) {</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">offset_to_residue</a> = _offset_to_residue;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;      <span class="keywordtype">int</span> error_code = <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065">load_iterator</a>.initialize(pointer, batch_stride, ldm);</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;      }</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f">store_iterator</a>.initialize();</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    }</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  };</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">  120</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">SharedStorage</a> {};</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="comment">// Static member functions</span></div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">  127</a></span>&#160;  CUTLASS_DEVICE <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">project_coordinate</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; coord, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> d_offset = 0) {</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    <span class="keywordtype">bool</span> <span class="keyword">const</span> kKstrided =</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits&lt;typename LoadIterator::Tile, kOperand, kLayout&gt;::kKstrided</a>;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> tile_coord = <a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand&lt;kOperand, kKstrided&gt;::project</a>(coord);</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;        tile_coord[0] + d_offset, tile_coord[1], tile_coord[2] / LoadIterator::Tile::kC);</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  }</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aec86bdf5d7d4ad1f7b6ebebcf2da8395">  136</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aec86bdf5d7d4ad1f7b6ebebcf2da8395">GlobalLoadStream</a>(</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; _params,</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">SharedStorage</a>&amp; shared_storage,</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">ThreadblockTileRef</a> <span class="keyword">const</span>&amp; threadblock_tile_ref,</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> bounds,</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; _threadblock_offset)</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">params</a>(_params),</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">multiplicand_bounds</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">project_coordinate</a>(bounds, 1)),</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">threadblock_offset</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">project_coordinate</a>(_threadblock_offset)),</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">project_coordinate</a>(bounds, 1), <span class="comment">/*multiplicant_bounds*/</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">project_coordinate</a>(_threadblock_offset) <span class="comment">/*threablock_offset*/</span>),</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4">transformer</a>(),</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">store_iterator</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">store_iterator</a>, threadblock_tile_ref.data())</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  {</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>.initialize_predicates(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">multiplicand_bounds</a>, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">threadblock_offset</a>);</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">fetched_fragment</a>.clear();</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  }</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a3784dbb3efe0865ffa946419111c824a">  157</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a3784dbb3efe0865ffa946419111c824a">copy</a>() { <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>.load_post_increment(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">fetched_fragment</a>); }</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab39c82ac1a8138c4b6d69dab9d48bdbc">  160</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab39c82ac1a8138c4b6d69dab9d48bdbc">commit</a>() {</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4">transformer</a>.transform(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">fetched_fragment</a>, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1">transformed_fragment</a>);</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">store_iterator</a>.store_post_increment(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1">transformed_fragment</a>);</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">store_iterator</a>.inc_stage();</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  }</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17">  167</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17">residue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> k, <span class="keywordtype">bool</span> skip_clear = <span class="keyword">false</span>) {</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>.residue(k);</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    <span class="keywordflow">if</span> (!skip_clear) {</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">fetched_fragment</a>.clear();</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    }</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;  }</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div><div class="line"><a name="l00175"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac269a9280a55d3988ca60f571bdf7f29">  175</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac269a9280a55d3988ca60f571bdf7f29">move_to_residue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> k, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> kTileK) {</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> kResidue = k % kTileK;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    <span class="keywordflow">if</span> (kResidue) {</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17">residue</a>(kResidue);</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    }</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>.add_pointer_offset(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">offset_to_residue</a> * <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>.stride_advance());</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;  }</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div><div class="line"><a name="l00184"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1e2eecdba1871fc11aa43a06edf6ed34">  184</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1e2eecdba1871fc11aa43a06edf6ed34">rollback</a>(<span class="keywordtype">void</span>) {</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>.initialize_predicates(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">multiplicand_bounds</a>, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">threadblock_offset</a>);</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> kBlock = <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700">kOperand</a> == <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a></div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;                           ? (<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db">kLayout</a> == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a> ? Tile::kH : Tile::kW)</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;                           : (<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db">kLayout</a> == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a> ? Tile::kH : Tile::kW);</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>.add_pointer_offset(-(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">offset_to_residue</a> + kBlock) *</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>.stride_advance());</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;  }</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a8e79a153de72eef10d90bfd02b5dd27e">  196</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a> &amp;<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a8e79a153de72eef10d90bfd02b5dd27e">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;offset) {</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a> += offset;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;  }</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">  206</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">params</a>;</div><div class="line"><a name="l00208"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">  208</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">multiplicand_bounds</a>;</div><div class="line"><a name="l00210"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">  210</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">threadblock_offset</a>;</div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">  212</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">LoadIterator</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a>;</div><div class="line"><a name="l00214"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">  214</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">FetchedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">fetched_fragment</a>;</div><div class="line"><a name="l00216"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4">  216</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">Transformer</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4">transformer</a>;</div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1">  218</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1">transformed_fragment</a>;</div><div class="line"><a name="l00220"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">  220</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">StoreIterator</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">store_iterator</a>;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;};</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a011287c8289b7b026f9993da663abd77"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">cutlass::gemm::GlobalLoadStream::ThreadblockTileRef</a></div><div class="ttdeci">ThreadblockTileStorage::TensorRef ThreadblockTileRef</div><div class="ttdoc">Tensor reference to threadblock tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:91</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_ac4452df991f57f9bb0b86dfd380179b2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">cutlass::gemm::GlobalLoadStream::Pointer</a></div><div class="ttdeci">LoadIterator::Pointer Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:80</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a5ef4cc42c7cec73523550e5ea56df88c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">cutlass::gemm::GlobalLoadStream::load_iterator</a></div><div class="ttdeci">LoadIterator load_iterator</div><div class="ttdoc">The iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:212</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a45a4bceb72fcb856e32eaa20eec11e9d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">cutlass::gemm::GlobalLoadStream::store_iterator</a></div><div class="ttdeci">StoreIterator store_iterator</div><div class="ttdoc">The store iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:220</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_ac8ff1a3e10b25c212cd3cf5ed997fc0e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">cutlass::gemm::GlobalLoadStream::params</a></div><div class="ttdeci">Params params</div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:206</div></div>
 <div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_aa24bd9f94bea04a148b49b2a97b63fbe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">cutlass::gemm::GlobalLoadStreamBase::Transformer</a></div><div class="ttdeci">Transformer_ Transformer</div><div class="ttdoc">The transformer. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:53</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a15eee5bf6367a36a5b5c8024437f4834"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">cutlass::gemm::GlobalLoadStreamBase::StoreIterator</a></div><div class="ttdeci">StoreIterator_ StoreIterator</div><div class="ttdoc">The store iterator to write to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:55</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:412</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a69092e298d5723028fc24235d72f87fa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa">cutlass::gemm::GlobalLoadStreamBase::SharedStoreStorage</a></div><div class="ttdeci">StoreIterator::SharedStorage SharedStoreStorage</div><div class="ttdoc">The amount of storage in shared memory needed to store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:98</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a32687e2aa49dfa251eab14d5cd2036be"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be">cutlass::gemm::GlobalLoadStreamBase::Fragment</a></div><div class="ttdeci">TransformedFragment Fragment</div><div class="ttdoc">Make sure the fragments match. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:63</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_afa97cb1cfebca0d6977b1c8318bedddf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">cutlass::gemm::GlobalLoadStreamBase::transformed_fragment</a></div><div class="ttdeci">TransformedFragment transformed_fragment</div><div class="ttdoc">The fragment to convert the data after it has been fetched from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:146</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_aae1adef6312e069e59a83d38c03116f9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9">cutlass::gemm::GlobalLoadStreamBase::residue</a></div><div class="ttdeci">CUTLASS_DEVICE void residue(Index k, bool skip_clear=false)</div><div class="ttdoc">Execute the residue code. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:132</div></div>
-<div class="ttc" id="structcutlass_1_1Copy_html"><div class="ttname"><a href="structcutlass_1_1Copy.html">cutlass::Copy</a></div><div class="ttdef"><b>Definition:</b> convert.h:69</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params_html_a7c7e448384156c801ed362359a1a6a40"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a7c7e448384156c801ed362359a1a6a40">cutlass::gemm::GlobalLoadStreamBase::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Pointer pointer, Index ld)</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:87</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_ad2381f2311ee8400a2dc57c19084ef5e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">cutlass::gemm::GlobalLoadStreamBase::load_iterator</a></div><div class="ttdeci">LoadIterator load_iterator</div><div class="ttdoc">The iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:140</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params_html_a42ffcba6af2b5ddfb1f4825a34d43532"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a42ffcba6af2b5ddfb1f4825a34d43532">cutlass::gemm::GlobalLoadStreamBase::Params::load_iterator</a></div><div class="ttdeci">LoadIterator::Params load_iterator</div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:82</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:161</div></div>
-<div class="ttc" id="iterator__access_8h_html"><div class="ttname"><a href="iterator__access_8h.html">iterator_access.h</a></div><div class="ttdoc">Free functions for loading and storing to implementations of tile iteartor concepts. </div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage_html_a3be938f8661f9cd10966866b7b80b471"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a3be938f8661f9cd10966866b7b80b471">cutlass::gemm::GlobalLoadStreamBase::SharedStorage::load_iterator</a></div><div class="ttdeci">LoadIterator::SharedStorage load_iterator</div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:103</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a4dd11a75375b6b9d7b8dcbd4d402d8d6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a4dd11a75375b6b9d7b8dcbd4d402d8d6">cutlass::gemm::GlobalLoadStream::GlobalLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE GlobalLoadStream(typename Base::Params const &amp;params, typename Base::SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:166</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:49</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a0eafd1e245946bd1b9d228ad7d2d0dae"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">cutlass::gemm::GlobalLoadStreamBase::store_iterator</a></div><div class="ttdeci">StoreIterator store_iterator</div><div class="ttdoc">The store iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:148</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_adcbf24c1b7f45ab5fe8f3ad94154b4d1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1">cutlass::gemm::GlobalLoadStreamBase::Pointer</a></div><div class="ttdeci">LoadIterator::Pointer Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:75</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage_html_a939e9ddecc5ee97882a54211a61f5586"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a939e9ddecc5ee97882a54211a61f5586">cutlass::gemm::GlobalLoadStreamBase::SharedStorage::store_iterator</a></div><div class="ttdeci">SharedStoreStorage store_iterator</div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:105</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_afe7503a3304eefd633581d6bc73a0108"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">cutlass::gemm::GlobalLoadStreamBase::TransformedFragment</a></div><div class="ttdeci">Transformer::OutputFragment TransformedFragment</div><div class="ttdoc">The fragment that is obtained after the transformation by the transformer. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:60</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_afbbf15a7b5e4c38e59bf1debf67f04d6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6">cutlass::gemm::GlobalLoadStreamBase::Scalar</a></div><div class="ttdeci">LoadIterator::Scalar Scalar</div><div class="ttdoc">The scalar type of the iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:73</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:420</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_aa0bf6caeab13dc004350c6c0cfe0df80"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">cutlass::TileAllocation::TensorRef</a></div><div class="ttdeci">TensorRef&lt; Scalar, 4 &gt; TensorRef</div><div class="ttdoc">Defines the tensor reference for this allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a30113b850dfd3de60f8778bc7a66f700"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700">cutlass::gemm::GlobalLoadStream::kOperand</a></div><div class="ttdeci">static GemmOperand::Kind const kOperand</div><div class="ttdoc">Indicates the type of GEMM operand. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:54</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a8e79a153de72eef10d90bfd02b5dd27e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a8e79a153de72eef10d90bfd02b5dd27e">cutlass::gemm::GlobalLoadStream::operator+=</a></div><div class="ttdeci">CUTLASS_DEVICE GlobalLoadStream &amp; operator+=(Coord&lt; 3 &gt; const &amp;offset)</div><div class="ttdoc">Adds a Coord&lt;3&gt; to the underlying global load iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a3784dbb3efe0865ffa946419111c824a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a3784dbb3efe0865ffa946419111c824a">cutlass::gemm::GlobalLoadStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy()</div><div class="ttdoc">Load the data from shared memory to the fetch fragment. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:157</div></div>
+<div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a386f2f4d2e239075f0fe1489ed7788c1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">cutlass::gemm::GlobalLoadStream::multiplicand_bounds</a></div><div class="ttdeci">Coord&lt; 3 &gt; multiplicand_bounds</div><div class="ttdoc">Multiplicand bounds. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:208</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_ac29cd1ba94e802762d665c300e22e7db"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db">cutlass::gemm::GlobalLoadStream::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">Make sure the transformed fragment is the same as the store fragment. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params_html_a289ac736c0c098ae6da6a21c9abfe63f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f">cutlass::gemm::GlobalLoadStream::Params::store_iterator</a></div><div class="ttdeci">StoreIterator::Params store_iterator</div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:98</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a1c117b87024937f1dc3da128795b6e03"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">cutlass::gemm::GlobalLoadStream::fetched_fragment</a></div><div class="ttdeci">FetchedFragment fetched_fragment</div><div class="ttdoc">The fragment to fetch from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:214</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params_html_a054aee5b4bf288cc1f5945f2521ef835"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a054aee5b4bf288cc1f5945f2521ef835">cutlass::gemm::GlobalLoadStream::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Pointer pointer, long long batch_stride, Index ldm, Index _offset_to_residue)</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:103</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStream::SharedStorage</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:120</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a7073b32c2cc62ffcad70a9ca46995c4c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c">cutlass::gemm::GlobalLoadStream::Scalar</a></div><div class="ttdeci">LoadIterator::Scalar Scalar</div><div class="ttdoc">The scalar type of the iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:78</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a235adaea5d4f01232c79cb6109dc6d17"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17">cutlass::gemm::GlobalLoadStream::residue</a></div><div class="ttdeci">CUTLASS_DEVICE void residue(Index k, bool skip_clear=false)</div><div class="ttdoc">Execute the residue code. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:167</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a7d7042e60aaab0dd00772b239e1f1db1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1">cutlass::gemm::GlobalLoadStream::transformed_fragment</a></div><div class="ttdeci">TransformedFragment transformed_fragment</div><div class="ttdoc">The fragment to convert the data after it has been fetched from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:218</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="tile__allocation_8h_html"><div class="ttname"><a href="tile__allocation_8h.html">tile_allocation.h</a></div><div class="ttdoc">Defines a fragment based on a Shape&lt;&gt; template. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params_html_a73bb518f85aee62310b3c886a1fba3f1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">cutlass::gemm::GlobalLoadStream::Params::offset_to_residue</a></div><div class="ttdeci">Index offset_to_residue</div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:100</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_ab7e315253b3301c191581bce05644106"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106">cutlass::gemm::GlobalLoadStream::Fragment</a></div><div class="ttdeci">TransformedFragment Fragment</div><div class="ttdoc">Make sure the fragments match. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:68</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a905c219287a7342b2ddb58b84e413d64"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">cutlass::gemm::GlobalLoadStream::LoadIterator</a></div><div class="ttdeci">LoadIterator_ LoadIterator</div><div class="ttdoc">The load iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:56</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmMultiplicandTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">cutlass::gemm::GemmMultiplicandTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_operand.h:67</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_ab39c82ac1a8138c4b6d69dab9d48bdbc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab39c82ac1a8138c4b6d69dab9d48bdbc">cutlass::gemm::GlobalLoadStream::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit()</div><div class="ttdoc">Commit the data. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:160</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a6a6e38022606dd8d41cf7264fb059cc2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">cutlass::gemm::GlobalLoadStreamBase::Index</a></div><div class="ttdeci">LoadIterator::Index Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:77</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a868f82ee87aba37b05721fe8210221c9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">cutlass::gemm::GlobalLoadStreamBase::transformer</a></div><div class="ttdeci">Transformer transformer</div><div class="ttdoc">The transformer. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:144</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a507f825824e624d80a34ea9395934160"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160">cutlass::gemm::GlobalLoadStream::Base</a></div><div class="ttdeci">GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:163</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:48</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a0a7f6ae85cfb162b1facf24dff8bab36"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">cutlass::gemm::GlobalLoadStreamBase::FetchedFragment</a></div><div class="ttdeci">LoadIterator::Fragment FetchedFragment</div><div class="ttdoc">The fragment that is copied from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:58</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage_html"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStreamBase::SharedStorage</a></div><div class="ttdoc">The storage in shared memory needed by that stream. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:101</div></div>
-<div class="ttc" id="namespacecutlass_html_a0cb5bdf7bef498705c51a9cdcbef71f9"><div class="ttname"><a href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">cutlass::iterator_store</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_store(OutputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdoc">Stores a fragment to an output iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:193</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a26aa580a2697ad02c27f868e7779348d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">cutlass::gemm::GlobalLoadStreamBase::fetched_fragment</a></div><div class="ttdeci">FetchedFragment fetched_fragment</div><div class="ttdoc">The fragment to fetch from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:142</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_acff2a1ab180eec672714cd587a28f9fe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">cutlass::gemm::GlobalLoadStreamBase::LoadIterator</a></div><div class="ttdeci">LoadIterator_ LoadIterator</div><div class="ttdoc">The load iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:51</div></div>
-<div class="ttc" id="namespacecutlass_html_a45dd7add04736cb5c3e69991d2f210be"><div class="ttname"><a href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">cutlass::iterator_load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment from an input iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:41</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a6ce2c6e81d159d8e9ab736cb263f44ae"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae">cutlass::gemm::GlobalLoadStreamBase::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit()</div><div class="ttdoc">Commit the data. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:125</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_af7a15b4456cda01c1ffbb2fdc532e87e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e">cutlass::gemm::GlobalLoadStreamBase::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy()</div><div class="ttdoc">Load the data from shared memory to the fetch fragment. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:122</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_html_a0fdc0f56d1352b5ad41fd4985edd3278"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278">cutlass::gemm::GlobalLoadStreamBase::GlobalLoadStreamBase</a></div><div class="ttdeci">CUTLASS_DEVICE GlobalLoadStreamBase(Params const &amp;params, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const bounds, Coord&lt; 3 &gt; const &amp;block)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:109</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a></div><div class="ttdoc">Class for storing a tile in memory and accessing it through a tensor ref. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:41</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_ab68ba57fe69430c557379b3457faebc4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4">cutlass::gemm::GlobalLoadStream::transformer</a></div><div class="ttdeci">Transformer transformer</div><div class="ttdoc">The transformer. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:216</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ProjectOperand_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ProjectOperand.html">cutlass::gemm::ProjectOperand</a></div><div class="ttdef"><b>Definition:</b> gemm_operand.h:96</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_ac16e31930c346068d7522dd8de9d93d2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">cutlass::gemm::GlobalLoadStream::StoreIterator</a></div><div class="ttdeci">StoreIterator_ StoreIterator</div><div class="ttdoc">The store iterator to write to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a17804b01904a9a4ee7a857905833f7a8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8">cutlass::gemm::GlobalLoadStream::ThreadblockTileStorage</a></div><div class="ttdeci">TileAllocation&lt; typename StoreIterator::Scalar, typename StoreIterator::Tile &gt; ThreadblockTileStorage</div><div class="ttdoc">Shared memory allocation for the tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params_html_a46f2546f9b88f4fc87f1396d0f08b065"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065">cutlass::gemm::GlobalLoadStream::Params::load_iterator</a></div><div class="ttdeci">LoadIterator::Params load_iterator</div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:96</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">cutlass::gemm::GlobalLoadStream::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_aa79a27cbe2420882fbaca55e42803f02"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">cutlass::gemm::GlobalLoadStream::Transformer</a></div><div class="ttdeci">Transformer_ Transformer</div><div class="ttdoc">The transformer. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:58</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a563961c326d2e55f5b8682a30b64a24a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">cutlass::gemm::GlobalLoadStream::threadblock_offset</a></div><div class="ttdeci">Coord&lt; 3 &gt; threadblock_offset</div><div class="ttdoc">Threadblock offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:210</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a7c46d6eb83b43e099d53784bb2a09f02"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">cutlass::gemm::GlobalLoadStream::Index</a></div><div class="ttdeci">LoadIterator::Index Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:82</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_aa634e3f786d5bf5707b94e522a10a001"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">cutlass::gemm::GlobalLoadStream::project_coordinate</a></div><div class="ttdeci">static CUTLASS_DEVICE Coord&lt; 3 &gt; project_coordinate(Coord&lt; 3 &gt; const &amp;coord, Index d_offset=0)</div><div class="ttdoc">Maps a coordinate in the GEMM&amp;#39;s (K, N, M) coordinate system to global memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:127</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_ac269a9280a55d3988ca60f571bdf7f29"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac269a9280a55d3988ca60f571bdf7f29">cutlass::gemm::GlobalLoadStream::move_to_residue</a></div><div class="ttdeci">CUTLASS_DEVICE void move_to_residue(Index k, Index kTileK)</div><div class="ttdoc">Move to the residue portion. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:175</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a7d9b4339129c1ab4f21f1df1144faddf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">cutlass::gemm::GlobalLoadStream::FetchedFragment</a></div><div class="ttdeci">LoadIterator::Fragment FetchedFragment</div><div class="ttdoc">The fragment that is copied from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:63</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a9eb2fb49698d0d018c04e7712e239ce9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">cutlass::gemm::GlobalLoadStream::TransformedFragment</a></div><div class="ttdeci">Transformer::OutputFragment TransformedFragment</div><div class="ttdoc">The fragment that is obtained after the transformation by the transformer. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_aec86bdf5d7d4ad1f7b6ebebcf2da8395"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aec86bdf5d7d4ad1f7b6ebebcf2da8395">cutlass::gemm::GlobalLoadStream::GlobalLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE GlobalLoadStream(Params const &amp;_params, SharedStorage &amp;shared_storage, ThreadblockTileRef const &amp;threadblock_tile_ref, Coord&lt; 3 &gt; const bounds, Coord&lt; 3 &gt; const &amp;_threadblock_offset)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:136</div></div>
 <div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">cutlass::gemm::GlobalLoadStreamBase::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:80</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a260543a618fb187c2da40c9f630925ec"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec">cutlass::gemm::GlobalLoadStream::Tile</a></div><div class="ttdeci">LoadIterator::Tile Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:84</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html_a1e2eecdba1871fc11aa43a06edf6ed34"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1e2eecdba1871fc11aa43a06edf6ed34">cutlass::gemm::GlobalLoadStream::rollback</a></div><div class="ttdeci">CUTLASS_DEVICE void rollback(void)</div><div class="ttdoc">Rollback to the beginning of the first tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:184</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__global__tile_8h.html b/docs/gemm__global__tile_8h.html
index 39d4a3612..2618ca58b 100644
--- a/docs/gemm__global__tile_8h.html
+++ b/docs/gemm__global__tile_8h.html
@@ -82,13 +82,13 @@ $(function() {
 
 <p>Defines iterators for efficiently loading and storing to global memory.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__operand_8h_source.html">cutlass/gemm/gemm_operand.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="predicate__vector_8h_source.html">cutlass/predicate_vector.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__operand_8h_source.html">cutlass/gemm/gemm_operand.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="predicate__vector_8h_source.html">cutlass/predicate_vector.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&quot;</code><br />
 </div>
 <p><a href="gemm__global__tile_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -128,7 +128,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__global__tile_8h_source.html b/docs/gemm__global__tile_8h_source.html
index d44c18ec4..8aac5bbce 100644
--- a/docs/gemm__global__tile_8h_source.html
+++ b/docs/gemm__global__tile_8h_source.html
@@ -76,138 +76,169 @@ $(function() {
 <div class="title">gemm_global_tile.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="gemm__global__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__operand_8h.html">cutlass/gemm/gemm_operand.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="predicate__vector_8h.html">cutlass/predicate_vector.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&gt;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="comment">// The following functor reshapes a tile of threads to match a tile of data. The idea is that when</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="comment">// the user wants to build the iterator traits, he/she may want to specify the tile independently</span></div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="comment">// from the number of scalars loaded/stored per instruction. For example, in the row-major version</span></div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="comment">// with a tile of size 128x8 - the user may want to that the iterator works with 32x8 threads if</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="comment">// each thread loads 1 scalar per LDG. If the user changes to 4 scalars per LDG, then the tile of</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="comment">// threads has to change. The code below detects that and correct the code automatically - it is</span></div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="comment">// a helper when the user does not specify the right configuration.</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">bool</span> = (Tile_::kW &lt; Threads_::kW)&gt;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">   53</a></span>&#160;struct ReshapeThreads {</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">   54</a></span>&#160;  typedef Threads_ Threads;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;};</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_&gt;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html">   58</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html">ReshapeThreads&lt;Tile_, Threads_, true&gt;</a> {</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c">   59</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;Threads_::kD, Threads_::kH * Threads_::kW / Tile_::kW, Tile_::kW, 1&gt; <a class="code" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c">Threads</a>;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;};</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> kOperand_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;          <span class="keyword">typename</span> Threads_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;          <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">   70</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a> {</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">   72</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a> = kOperand_;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">   74</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> = kLayout_;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">   76</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">Scalar</a>;</div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">   78</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a>;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">   80</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> = kAccessSize_;</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">   82</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">   85</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;Tile_, kAccessSize_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>;</div><div class="line"><a name="l00087"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">   87</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">ReshapeThreads&lt;Tile, Threads_&gt;::Threads</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a>;</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">   89</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, Tile::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">ThreadsDelta</a>;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">   92</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, Threads::kH, Threads::kW * kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">Delta</a>;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">   94</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Threads::kW * ThreadsDelta::kW, kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, Tile::kH / Threads::kH, Tile::kW / Threads::kW, Tile::kC / <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a>&gt;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">   97</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Iterations</a>;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">   99</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits&lt;Tile, kOperand, kLayout&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html">  102</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be">  104</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">ThreadsDelta::kH</a>;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    }</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  };</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;};</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>eH_, <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">  116</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;GemmOperand::kC,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                                                            MatrixLayout::kColumnMajor,</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;                                                            Scalar_,</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;                                                            Tile_,</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;                                                            Threads_,</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;                                                            kAccessSize_&gt; {</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;                               <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;                               Scalar_,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;                               Tile_,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;                               Threads_,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                               kAccessSize_&gt;</div><div class="line"><a name="l00129"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a">  129</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a">Base</a>;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">  132</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">kStrideH</a> = kStrideH_;</div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4">  134</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Base::Delta::kW, Base::Delta::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4">Delta</a>;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">  136</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::Iterations</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">Iterations</a>;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">  138</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Base::Threads</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">Threads</a>;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">  140</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::ThreadsDelta</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">ThreadsDelta</a>;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c">  142</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::ImmediateOffsetStrides</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div><div class="line"><a name="l00145"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html">  145</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00147"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52">  147</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Threads::kW * <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">kStrideH</a> * <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Iterations::kH</a>;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    }</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  };</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;};</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> TileTraits_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">  159</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a></div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;TileTraits_,</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;                              typename TileTraits_::Scalar,</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;                              TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;                                                                         : IteratorAdvance::kW,</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;                              MemorySpace::kGlobal,</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;                              Index_&gt; {</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">  167</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;TileTraits_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">This_</a>;  </div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;TileTraits_,</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;                           <span class="keyword">typename</span> TileTraits_::Scalar,</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;                           TileTraits_::MultiplicandTraits::kKstrided ? <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a></div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;                                                                      : <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">IteratorAdvance::kW</a>,</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>,</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;                           Index_&gt;</div><div class="line"><a name="l00175"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">  175</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">Base</a>;</div><div class="line"><a name="l00177"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">  177</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">kLayout</a> = TileTraits_::kLayout;</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">  179</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">Base::Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a>;</div><div class="line"><a name="l00181"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">  181</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a>;</div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">  183</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Threads <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">Threads</a>;</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">  185</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a>;</div><div class="line"><a name="l00187"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">  187</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::ThreadOffset <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>;</div><div class="line"><a name="l00189"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">  189</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> = <a class="code" href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">Base::kAdvance</a>;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">  191</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector&lt;ShapeCount&lt;typename Base::Iterations&gt;::kCount</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a>;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">  194</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Base::Params</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">BaseParams</a>;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">  196</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html">BaseParams</a> {</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#a73091e07b6d4c99f6e0319fbf6bd1709">  198</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#a73091e07b6d4c99f6e0319fbf6bd1709">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> <span class="keyword">const</span>* ptr, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>) {</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a> = 0;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a> = 0;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;      <span class="comment">// Move by some columns for each iteration in the H dimension.</span></div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a> = Base::Delta::kH * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;      <span class="comment">// Move by some more columns in the number of iterations if the D dimension is &gt; 1.</span></div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;      <span class="keywordflow">if</span> (Base::Delta::kD &gt; 0) {</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a> = Base::Delta::kD * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a> - (Base::Iterations::kH - 1) * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a>;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      }</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <span class="comment">// Move to the beginning of the next iteration.</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a> &amp;&amp; Base::Delta::kD &gt; 0) {</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a>;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a>;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (Base::Delta::kD &gt; 0) {</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a> = (Base::Iterations::kW + 0) * <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;typename Base::Delta&gt;::kWc</a> -</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;                      (Base::Iterations::kH - 1) * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a> -</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;                      (Base::Iterations::kD - 1) * Base::Delta::kD * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a> = (Base::Iterations::kW + 0) * <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;typename Base::Delta&gt;::kWc</a> -</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;                      (Base::Iterations::kH - 1) * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a>;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;      }</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8">Base::Params::initialize</a>(ptr, 0, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>, 0, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a>, 0, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a>);</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    }</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;  };</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">  229</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>;</div><div class="line"><a name="l00231"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">  231</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div><div class="line"><a name="l00233"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff">  233</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff">initialize_predicates</a>(<span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds, <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; block) {</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;    <span class="comment">// Setup the masks to control loads.</span></div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">fill</a>(0);</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;    <span class="keywordtype">int</span> bounds_h, bounds_w;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;      bounds_w = bounds[2] - block[2];</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;      bounds_h = bounds[1];</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;      bounds_w = bounds[1];</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;      bounds_h = bounds[2] - block[1];</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;    }</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;    <span class="comment">// Fill in the bits of the predicate vector.</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Base::Iterations::kD; ++d) {</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Base::Iterations::kH; ++h) {</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Base::Iterations::kW; ++w) {</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Base::Iterations::kC; ++c) {</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;            <span class="keywordtype">bool</span> flag = w * Base::Delta::kW &lt; bounds_w;</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;              flag = flag &amp;&amp; (h * Base::Delta::kH + d * Base::Delta::kD) &lt; bounds_h;</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;            } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;              flag = flag &amp;&amp; (h * Base::Delta::kH) &lt; bounds_h;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;            }</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;            <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">ComputeOffsetFromShape&lt;typename Base::Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(bit, flag);</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;          }</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;        }</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;      }</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;    }</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;  }</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div><div class="line"><a name="l00267"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a34cb153d311377388e7819296a84d07e">  267</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a34cb153d311377388e7819296a84d07e">GemmGlobalIteratorAb</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; _params,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;                                      <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds,</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;                                      <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; block,</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;                                      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>())</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>(_params) {</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;    <span class="comment">// The column.</span></div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> block_h = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[1];</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    <span class="comment">// The contiguous dimension.</span></div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> block_w = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[2];</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    <span class="comment">// Add the blocks indices.</span></div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;      block_h += block[1];</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;      block_w += block[2];</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      block_h += block[2];</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;      block_w += block[1];</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;    }</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;    <span class="comment">// Setup the pointer.</span></div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += (block_h * <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a> + block_w);</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    <span class="comment">// Initialize predicates</span></div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff">initialize_predicates</a>(bounds, <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, block_h, block_w));</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;  }</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;</div><div class="line"><a name="l00296"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aa24336597f4a3316d94df6ab0c20f714">  296</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aa24336597f4a3316d94df6ab0c20f714">inc_h</a>() { <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a>; }</div><div class="line"><a name="l00298"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1e42503e5a54cdc01308e9030aebdd35">  298</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1e42503e5a54cdc01308e9030aebdd35">inc_d</a>() { <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a>; }</div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a9dea455aa86bb59517b4a4d0309e424b">  300</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a9dea455aa86bb59517b4a4d0309e424b">inc_advance</a>() { <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a>; }</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00304"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3af66b82b1a0cc5bf6141f940553e048">  304</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> <span class="keyword">const</span>* <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3af66b82b1a0cc5bf6141f940553e048">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a>; }</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div><div class="line"><a name="l00307"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aab37ea6c47e34466371314ed3971dc7b">  307</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aab37ea6c47e34466371314ed3971dc7b">residue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> k) {</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;    <span class="comment">// The coordinates of the thread.</span></div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> block_h = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[1];</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;    <span class="comment">// The contiguous dimension.</span></div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> block_w = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[2];</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;    <span class="comment">// Update the predicate vector.</span></div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Base::Iterations::kD; ++d) {</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Base::Iterations::kH; ++h) {</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Base::Iterations::kW; ++w) {</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Base::Iterations::kC; ++c) {</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> offset = 0;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;              offset += block_h + h * Base::Delta::kH + d * Base::Delta::kD;</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;            } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;              offset += block_w + w * Base::Delta::kW;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;            }</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;            <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">ComputeOffsetFromShape&lt;typename Base::Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;            <span class="keywordflow">if</span> (offset &gt;= k) {</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;              <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(bit, <span class="keyword">false</span>);</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;            }</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;          }</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;        }</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;      }</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;    }</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;  }</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;</div><div class="line"><a name="l00336"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ac4d2c293f9312b673ea29bf79b2882fd">  336</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ac4d2c293f9312b673ea29bf79b2882fd">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">ComputeOffsetFromShape&lt;typename Base::Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>[bit];</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;  }</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;</div><div class="line"><a name="l00342"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">  342</a></span>&#160;  <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>;</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;};</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> TileTraits_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00348"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">  348</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;TileTraits_,</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;                                                      typename TileTraits_::Scalar,</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;                                                      IteratorAdvance::kH,</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;                                                      MemorySpace::kGlobal,</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;                                                      Index_&gt; {</div><div class="line"><a name="l00354"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">  354</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;TileTraits_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">This_</a>;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;TileTraits_,</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;                           <span class="keyword">typename</span> TileTraits_::Scalar,</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>,</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;                           Index_&gt;</div><div class="line"><a name="l00361"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">  361</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">Base</a>;</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;</div><div class="line"><a name="l00364"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">  364</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">kLayout</a> = TileTraits_::kLayout;</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;</div><div class="line"><a name="l00367"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">  367</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">Scalar</a>;</div><div class="line"><a name="l00369"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">  369</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Pointer <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a>;</div><div class="line"><a name="l00371"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">  371</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Threads <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">Threads</a>;</div><div class="line"><a name="l00373"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">  373</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>;</div><div class="line"><a name="l00375"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">  375</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::ThreadOffset <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>;</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div><div class="line"><a name="l00378"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">  378</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> {</div><div class="line"><a name="l00380"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">  380</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>;</div><div class="line"><a name="l00382"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">  382</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a>;</div><div class="line"><a name="l00384"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">  384</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">inc_advance</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">inc_h</a>;</div><div class="line"><a name="l00386"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">  386</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">predicate_inc_advance</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">predicate_inc_h</a>;</div><div class="line"><a name="l00388"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">  388</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a>;</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;</div><div class="line"><a name="l00391"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#af5a496f1b6a46ea6a9894512029add6a">  391</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#af5a496f1b6a46ea6a9894512029add6a">initialize</a>(</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> ld, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> bound, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_stride_w, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_delta_w) {</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;      this-&gt;pointer = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>;</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;      <span class="comment">// Each column of the matrix.</span></div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a> = TileTraits_::ThreadsDelta::kH * ld;</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;      <span class="comment">// Each thread output 1 column per iteration. The stride between columns is given by the</span></div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;      <span class="comment">// number of scalars that are loaded per LDS for B.</span></div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">inc_h</a> = ld * TileTraits_::kStrideH;</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">inc_advance</a> =</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;          (ld - ld * TileTraits_::kStrideH * (Base::Iterations::kH - 1)) + epilogue_stride_w;</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> = bound;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">predicate_inc_h</a> = TileTraits_::kStrideH;</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">predicate_inc_advance</a> =</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;          -((TileTraits_::kStrideH * (Base::Iterations::kH - 1) - 1) + epilogue_delta_w);</div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;    }</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;  };</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;</div><div class="line"><a name="l00412"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">  412</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>;</div><div class="line"><a name="l00414"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">  414</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a>;</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;</div><div class="line"><a name="l00417"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6dae81995ab94c0b7f28eeeeb84a6c8d">  417</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6dae81995ab94c0b7f28eeeeb84a6c8d">GemmGlobalIteratorCd</a>() {}</div><div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;</div><div class="line"><a name="l00420"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a64f1df43acb37a1901f0b55becaa9557">  420</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a64f1df43acb37a1901f0b55becaa9557">GemmGlobalIteratorCd</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>,</div><div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;                                      <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds,</div><div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;                                      <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; block,</div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;                                      <span class="keywordtype">int</span> offset = 0,</div><div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;                                      <span class="keywordtype">int</span> pred_offset = 0,</div><div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;                                      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>())</div><div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>) {</div><div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;    <span class="comment">// Each warp works on a different column of the tile.</span></div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> h = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a>[1] + block[1];</div><div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;    <span class="comment">// Each lane writes a different element.</span></div><div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> w = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a>[2] + block[2];</div><div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;    <span class="comment">// Setup the pointer.</span></div><div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;    this-&gt;params.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a> += ((h * <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a> + w) + offset);</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;</div><div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;    <span class="comment">// Prepare the vector of predicates.</span></div><div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Base::Iterations::kW; ++i) {</div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(i, w + i * Base::Delta::kW &lt; bounds[2]);</div><div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;    }</div><div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;    this-&gt;params.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> -= (h + pred_offset);</div><div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;  }</div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;</div><div class="line"><a name="l00443"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a12ead84ea9634e963d10c6df7b7792c9">  443</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a12ead84ea9634e963d10c6df7b7792c9">inc_c</a>() {}</div><div class="line"><a name="l00445"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a622a4dd27162854ec96efea93cdd4380">  445</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a622a4dd27162854ec96efea93cdd4380">inc_w</a>() {}</div><div class="line"><a name="l00447"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ae07fa10a53d44471a04275145201299e">  447</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ae07fa10a53d44471a04275145201299e">inc_h</a>() {</div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">inc_h</a>;</div><div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> -= <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">predicate_inc_h</a>;</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;  }</div><div class="line"><a name="l00452"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad26ab8d8010c9a1d7f3b91f60940b460">  452</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad26ab8d8010c9a1d7f3b91f60940b460">inc_d</a>() {}</div><div class="line"><a name="l00454"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab4b8150f19c9f8649d75c69ec0a76e1a">  454</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab4b8150f19c9f8649d75c69ec0a76e1a">inc_advance</a>() {</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">inc_advance</a>;</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;    this-&gt;params.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> -= <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">predicate_inc_advance</a>;</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;  }</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;</div><div class="line"><a name="l00460"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6594acc213fc8d4289c6c73631f60120">  460</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6594acc213fc8d4289c6c73631f60120">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">at</a>(w) &amp;&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> &gt; 0;</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;  }</div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00466"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a0d3c1a58f23957f9850d1b22992a981a">  466</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a0d3c1a58f23957f9850d1b22992a981a">data</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>; }</div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;</div><div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00469"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6fd4e62eb280a5b8c17eb79141414581">  469</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6fd4e62eb280a5b8c17eb79141414581">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>; }</div><div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;</div><div class="line"><a name="l00472"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">  472</a></span>&#160;  <a class="code" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector&lt;Base::Iterations::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a>;</div><div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;};</div><div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;</div><div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;</div><div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:116</div></div>
+<a href="gemm__global__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__operand_8h.html">cutlass/gemm/gemm_operand.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="predicate__vector_8h.html">cutlass/predicate_vector.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="comment">// The following functor reshapes a tile of threads to match a tile of data. The idea is that when</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="comment">// the user wants to build the iterator traits, he/she may want to specify the tile independently</span></div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="comment">// from the number of scalars loaded/stored per instruction. For example, in the row-major version</span></div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="comment">// with a tile of size 128x8 - the user may want to that the iterator works with 32x8 threads if</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="comment">// each thread loads 1 scalar per LDG. If the user changes to 4 scalars per LDG, then the tile of</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="comment">// threads has to change. The code below detects that and correct the code automatically - it is</span></div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="comment">// a helper when the user does not specify the right configuration.</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">bool</span> = (Tile_::kW &lt; Threads_::kW)&gt;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">   53</a></span>&#160;struct ReshapeThreads {</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">   54</a></span>&#160;  typedef Threads_ Threads;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;};</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_&gt;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html">   58</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html">ReshapeThreads&lt;Tile_, Threads_, true&gt;</a> {</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c">   59</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;Threads_::kD, Threads_::kH * Threads_::kW / Tile_::kW, Tile_::kW, 1&gt; <a class="code" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c">Threads</a>;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;};</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> kOperand_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;          <span class="keyword">typename</span> Threads_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;          <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">   70</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a> {</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">   72</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a> = kOperand_;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">   74</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> = kLayout_;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">   76</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">Scalar</a>;</div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">   78</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a>;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">   80</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> = kAccessSize_;</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">   82</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">   84</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">   86</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;Tile_, kAccessSize_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a>;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">   88</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">ReshapeThreads&lt;VectorizedTile, Threads_&gt;::Threads</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a>;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">   90</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, VectorizedTile::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a>;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">   92</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, Threads::kH, Threads::kW * kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">Delta</a>;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">   95</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Threads::kW * ThreadsDelta::kW, kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1,</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;                VectorizedTile::kH / Threads::kH,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;                VectorizedTile::kW / Threads::kW,</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;                VectorizedTile::kC / <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a>&gt;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">  101</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a>;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">  103</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits&lt;Tile, kOperand, kLayout&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a>;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html">  106</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be">  108</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">ThreadsDelta::kH</a>;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    }</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  };</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;};</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>eH_, <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">  120</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;GemmOperand::kC,</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;                                                            MatrixLayout::kColumnMajor,</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;                                                            Scalar_,</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;                                                            Tile_,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;                                                            Threads_,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;                                                            kAccessSize_&gt; {</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                               <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;                               Scalar_,</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;                               Tile_,</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;                               Threads_,</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;                               kAccessSize_&gt;</div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a">  133</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a">Base</a>;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">  136</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">kStrideH</a> = kStrideH_;</div><div class="line"><a name="l00138"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4">  138</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Base::Delta::kW, Base::Delta::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4">Delta</a>;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">  140</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::Iterations</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">Iterations</a>;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">  142</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Base::Threads</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">Threads</a>;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">  144</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::ThreadsDelta</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">ThreadsDelta</a>;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c">  146</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::ImmediateOffsetStrides</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html">  149</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00151"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52">  151</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Threads::kW * <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">kStrideH</a> * <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Iterations::kH</a>;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    }</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;  };</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;};</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> TileTraits_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">  163</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;TileTraits_,</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;                              typename TileTraits_::Scalar,</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;                              TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;                                                                         : IteratorAdvance::kW,</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;                              MemorySpace::kGlobal,</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;                              Index_&gt; {</div><div class="line"><a name="l00171"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">  171</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;TileTraits_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">This_</a>;  </div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;TileTraits_,</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;                           <span class="keyword">typename</span> TileTraits_::Scalar,</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;                           TileTraits_::MultiplicandTraits::kKstrided ? <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a></div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;                                                                      : <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">IteratorAdvance::kW</a>,</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>,</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;                           Index_&gt;</div><div class="line"><a name="l00178"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">  178</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">Base</a>;</div><div class="line"><a name="l00180"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">  180</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">kLayout</a> = TileTraits_::kLayout;</div><div class="line"><a name="l00182"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">  182</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Tile <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">Tile</a>;</div><div class="line"><a name="l00184"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">  184</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">Base::Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a>;</div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">  186</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a>;</div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">  188</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Threads <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">Threads</a>;</div><div class="line"><a name="l00190"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">  190</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a>;</div><div class="line"><a name="l00192"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">  192</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::ThreadOffset <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>;</div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">  194</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> = <a class="code" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">Base::kAdvance</a>;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">  196</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector&lt;ShapeCount&lt;typename Base::Iterations&gt;::kCount</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">  199</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Base::Params</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">BaseParams</a>;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">  201</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html">BaseParams</a> {</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#ad0602cf5d322e98e3e5990c84ae1e3f3">  203</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#ad0602cf5d322e98e3e5990c84ae1e3f3">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> <span class="keyword">const</span>* ptr,</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;                                       <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>,</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>) {</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a> = 0;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = 0;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      <span class="comment">// Move by some columns for each iteration in the H dimension.</span></div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a> = Base::Delta::kH * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="comment">// Move by some more columns in the number of iterations if the D dimension is &gt; 1.</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      <span class="keywordflow">if</span> (Base::Delta::kD &gt; 0) {</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a> = Base::Delta::kD * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> - (Base::Iterations::kH - 1) * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      }</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;      <span class="comment">// Move to the beginning of the next iteration.</span></div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a> &amp;&amp; Base::Delta::kD &gt; 0) {</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a>;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;      } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (Base::Delta::kD &gt; 0) {</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = (Base::Iterations::kW + 0) * <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;typename Base::Delta&gt;::kWc</a> -</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;                      (Base::Iterations::kH - 1) * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a> -</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;                      (Base::Iterations::kD - 1) * Base::Delta::kD * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>;</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = (Base::Iterations::kW + 0) * <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;typename Base::Delta&gt;::kWc</a> -</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;                      (Base::Iterations::kH - 1) * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;      }</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d">Base::Params::initialize</a>(</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;          ptr, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, 1, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>, 0, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a>);</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;    }</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;  };</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">  237</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>;</div><div class="line"><a name="l00239"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">  239</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>;</div><div class="line"><a name="l00241"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">  241</a></span>&#160;  <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div><div class="line"><a name="l00243"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018">  243</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018">initialize_predicates</a>(<span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds, <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; block_offset) {</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;    <span class="comment">// Setup the masks to control loads.</span></div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">fill</a>(0);</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;    <span class="comment">// Fill in the bits of the predicate vector.</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Base::Iterations::kD; ++d) {</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Base::Iterations::kH; ++h) {</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Base::Iterations::kW; ++w) {</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Base::Iterations::kC; ++c) {</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;            <span class="keywordtype">bool</span> flag = w * Base::Delta::kW + <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[2] + block_offset[2] &lt; bounds[2];</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;              flag =</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;                  flag &amp;&amp;</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;                  (h * Base::Delta::kH + d * Base::Delta::kD) + <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[1] + block_offset[1] &lt;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;                      bounds[1];</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;            } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;              flag = flag &amp;&amp; (h * Base::Delta::kH) + <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[1] + block_offset[1] &lt; bounds[1];</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;            }</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;            <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">ComputeOffsetFromShape&lt;typename Base::Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(bit, flag);</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;          }</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;        }</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;      }</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    }</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;  }</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div><div class="line"><a name="l00270"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">  270</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">GemmGlobalIteratorAb</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; _params,</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;                                           <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds,</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;                                           <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; threadblock_offset,</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;                                           <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>())</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>(_params) {</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;    <span class="comment">// Setup the pointer.</span></div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += ((threadblock_offset[1] + <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[1]) * <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> +</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;                       (threadblock_offset[2] + <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[2]));</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;  }</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">  283</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">inc_w</a>() { <a class="code" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">Base::inc_w</a>(); }</div><div class="line"><a name="l00285"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">  285</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">inc_h</a>() { <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>; }</div><div class="line"><a name="l00287"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">  287</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">inc_d</a>() { <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a>; }</div><div class="line"><a name="l00289"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">  289</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">inc_advance</a>() { <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a>; }</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div><div class="line"><a name="l00292"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">  292</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">load_element</a>(</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;      <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a>&amp; value, <span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;        <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;typename Base::ImmediateOffsetStrides&gt;::get</a>(0, 0, w, c);</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;    <a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a>,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;         <a class="code" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">Base::kAccessSize</a>,</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;         <a class="code" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">Base::kMemorySpace</a>,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;         <a class="code" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">Base::kFragmentElementType</a>,</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;         <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">Base::FragmentElement</a>,</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;         Base::Tile::kW,</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;         <a class="code" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">Base::kAccessSize</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a>)&gt;::<a class="code" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a>(value, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a>, offset);</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;  }</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;</div><div class="line"><a name="l00306"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">  306</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">residue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> k) {</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;    <span class="comment">// The coordinates of the thread.</span></div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> block_h = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[1];</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;    <span class="comment">// The contiguous dimension.</span></div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> block_w = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a>[2];</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;    <span class="comment">// Update the predicate vector.</span></div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Base::Iterations::kD; ++d) {</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Base::Iterations::kH; ++h) {</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Base::Iterations::kW; ++w) {</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Base::Iterations::kC; ++c) {</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> offset = 0;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;              offset += block_h + h * Base::Delta::kH + d * Base::Delta::kD;</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;            } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;              offset += block_w + w * Base::Delta::kW;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;            }</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;            <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">ComputeOffsetFromShape&lt;typename Base::Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;            <span class="keywordflow">if</span> (offset &gt;= k) {</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;              <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(bit, <span class="keyword">false</span>);</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;            }</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;          }</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;        }</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;      }</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;    }</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;  }</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;</div><div class="line"><a name="l00335"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">  335</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">ComputeOffsetFromShape&lt;typename Base::Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a>[bit];</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;  }</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;</div><div class="line"><a name="l00341"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">  341</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;offset) {</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;    <span class="keywordtype">long</span> <span class="keywordtype">long</span> _offset = offset.template dot&lt;long long&gt;(</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;      <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;    );</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += _offset;</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;  }</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div><div class="line"><a name="l00351"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6">  351</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6">add_pointer_offset</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> offset) { <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += offset; }</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div><div class="line"><a name="l00353"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7">  353</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7">stride_advance</a>(<span class="keywordtype">void</span>) {</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> stride = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>;</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">IteratorAdvance::kW</a>) {</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;      stride = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>;</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    }</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    <span class="keywordflow">return</span> stride;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;  }</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00362"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7">  362</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7">load_post_increment</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a>&amp; fragment) {</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">Base::FragmentIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Base::Iterations::kD; ++d) {</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Base::Iterations::kH; ++h) {</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Base::Iterations::kW; ++w) {</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Base::Iterations::kC; ++c) {</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">valid</a>(d, h, w, c)) {</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;              <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">load_element</a>(</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;                  reinterpret_cast&lt;typename Base::AccessType&amp;&gt;(frag_iterator.at(d, h, w, c)),</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;                  d,</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;                  h,</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;                  w,</div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;                  c);</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;            }</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;          }</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;          <span class="keywordflow">if</span> (w &lt; Base::Iterations::kW - 1) {</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">inc_w</a>();</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;          }</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;        }</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;        <span class="keywordflow">if</span> (h &lt; Base::Iterations::kH - 1) {</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">inc_h</a>();</div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;        }</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;      }</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;      <span class="keywordflow">if</span> (d &lt; Base::Iterations::kD - 1) {</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">inc_d</a>();</div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;      }</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;    }</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">inc_advance</a>();</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;  }</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;};</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> TileTraits_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00396"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">  396</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;TileTraits_,</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;                                                      typename TileTraits_::Scalar,</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;                                                      IteratorAdvance::kH,</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;                                                      MemorySpace::kGlobal,</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;                                                      Index_&gt; {</div><div class="line"><a name="l00402"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">  402</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;TileTraits_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">This_</a>;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;TileTraits_,</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;                           <span class="keyword">typename</span> TileTraits_::Scalar,</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>,</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;                           Index_&gt;</div><div class="line"><a name="l00409"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">  409</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">Base</a>;</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;</div><div class="line"><a name="l00412"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">  412</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">kLayout</a> = TileTraits_::kLayout;</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;</div><div class="line"><a name="l00415"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">  415</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">Scalar</a>;</div><div class="line"><a name="l00417"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">  417</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Pointer <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a>;</div><div class="line"><a name="l00419"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">  419</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Threads <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">Threads</a>;</div><div class="line"><a name="l00421"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">  421</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>;</div><div class="line"><a name="l00423"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">  423</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::ThreadOffset <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>;</div><div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;</div><div class="line"><a name="l00426"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">  426</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> {</div><div class="line"><a name="l00428"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">  428</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>;</div><div class="line"><a name="l00430"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">  430</a></span>&#160;    <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">stride_d</a>;</div><div class="line"><a name="l00432"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">  432</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a>;</div><div class="line"><a name="l00434"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">  434</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">inc_advance</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">inc_h</a>;</div><div class="line"><a name="l00436"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">  436</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">predicate_inc_advance</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">predicate_inc_h</a>;</div><div class="line"><a name="l00438"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">  438</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a>;</div><div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;</div><div class="line"><a name="l00441"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5">  441</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>,</div><div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;                                       <span class="keywordtype">long</span> <span class="keywordtype">long</span> batch_stride,</div><div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> ldm,</div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> bound,</div><div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_stride_w,</div><div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_delta_w) {</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;      this-&gt;pointer = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>;</div><div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;      <span class="comment">// Stride per batch</span></div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">stride_d</a> = batch_stride;</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;      <span class="comment">// Each column of the matrix.</span></div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a> = TileTraits_::ThreadsDelta::kH * ldm;</div><div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;      <span class="comment">// Each thread output 1 column per iteration. The stride between columns is given by the</span></div><div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;      <span class="comment">// number of scalars that are loaded per LDS for B.</span></div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">inc_h</a> = ldm * TileTraits_::kStrideH;</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">inc_advance</a> =</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;          (ldm - ldm * TileTraits_::kStrideH * (Base::Iterations::kH - 1)) + epilogue_stride_w;</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;</div><div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> = bound;</div><div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">predicate_inc_h</a> = TileTraits_::kStrideH;</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">predicate_inc_advance</a> =</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;          -((TileTraits_::kStrideH * (Base::Iterations::kH - 1) - 1) + epilogue_delta_w);</div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;</div><div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;    }</div><div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;  };</div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;</div><div class="line"><a name="l00469"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">  469</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>;</div><div class="line"><a name="l00471"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">  471</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a>;</div><div class="line"><a name="l00473"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">  473</a></span>&#160;  <a class="code" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector&lt;Base::Iterations::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a>;</div><div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;</div><div class="line"><a name="l00476"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">  476</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">GemmGlobalIteratorCd</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; _params,</div><div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;                                           <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds,</div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;                                           <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; block_offset,</div><div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;                                           <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>())</div><div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>(_params) {</div><div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;    <span class="comment">// Prepare the vector of predicates.</span></div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Base::Iterations::kW; ++i) {</div><div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(i, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a>[2] + i * Base::Delta::kW &lt; bounds[2]);</div><div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;    }</div><div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;  }</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;</div><div class="line"><a name="l00489"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6">  489</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6">GemmGlobalIteratorCd</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; _params,</div><div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;                                           <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds,</div><div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;                                           <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; block,</div><div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;                                           <span class="keywordtype">int</span> offset = 0,</div><div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;                                           <span class="keywordtype">int</span> pred_offset = 0,</div><div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;                                           <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>())</div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>(_params) {</div><div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;    <span class="comment">// Each warp works on a different column of the tile.</span></div><div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> h = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a>[1] + block[1];</div><div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;    <span class="comment">// Each lane writes a different element.</span></div><div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> w = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a>[2] + block[2];</div><div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;    <span class="comment">// Setup the pointer.</span></div><div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a> += ((h * <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a> + w) + offset);</div><div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;</div><div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;    <span class="comment">// Prepare the vector of predicates.</span></div><div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Base::Iterations::kW; ++i) {</div><div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(i, w + i * Base::Delta::kW &lt; bounds[2]);</div><div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;    }</div><div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> -= (h + pred_offset);</div><div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;  }</div><div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;</div><div class="line"><a name="l00512"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">  512</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">inc_c</a>() {}</div><div class="line"><a name="l00514"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">  514</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">inc_w</a>() {}</div><div class="line"><a name="l00516"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">  516</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">inc_h</a>() {</div><div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">inc_h</a>;</div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> -= <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">predicate_inc_h</a>;</div><div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;  }</div><div class="line"><a name="l00521"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">  521</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">inc_d</a>() {}</div><div class="line"><a name="l00523"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">  523</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">inc_advance</a>() {</div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">inc_advance</a>;</div><div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> -= <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">predicate_inc_advance</a>;</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;  }</div><div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;</div><div class="line"><a name="l00529"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">  529</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;offset) {</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;    <span class="keywordtype">long</span> <span class="keywordtype">long</span> _offset = offset.template dot&lt;long long&gt;(</div><div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;      <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">stride_d</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a>, 1)</div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;    );</div><div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a> += _offset;</div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;  }</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;</div><div class="line"><a name="l00538"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">  538</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">load_element</a>(</div><div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;      <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a>&amp; value, <span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;        <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;typename Base::ImmediateOffsetStrides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;    <a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">Scalar</a>,</div><div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;         <a class="code" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">Base::kAccessSize</a>,</div><div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;         <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">Base::kMemorySpace</a>,</div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;         <a class="code" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">Base::kFragmentElementType</a>,</div><div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;         <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">Base::FragmentElement</a>,</div><div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;         Base::Tile::kW,</div><div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;         <a class="code" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">Base::kAccessSize</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">Scalar</a>)&gt;::load(value, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>, offset);</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;  }</div><div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;</div><div class="line"><a name="l00552"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">  552</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">store_element</a>(</div><div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;      <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a> <span class="keyword">const</span>&amp; value, <span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) {</div><div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;typename Base::ImmediateOffsetStrides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;    <a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">Scalar</a>,</div><div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">Base::kAccessSize</a>,</div><div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">Base::kMemorySpace</a>,</div><div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">Base::kFragmentElementType</a>,</div><div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;          <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">Base::FragmentElement</a>,</div><div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;          Base::Tile::kW,</div><div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">Base::kAccessSize</a> * <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">Scalar</a>)&gt;::store(value, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>, offset);</div><div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;  }</div><div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;</div><div class="line"><a name="l00566"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">  566</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">at</a>(w) &amp;&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a> &gt; 0;</div><div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;  }</div><div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;</div><div class="line"><a name="l00571"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">  571</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">add_pointer_offset</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> offset) { <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a> += offset; }</div><div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;</div><div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00575"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">  575</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">load_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&amp; fragment) {</div><div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Base::Iterations::kD; ++d) {</div><div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Base::Iterations::kH; ++h) {</div><div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Base::Iterations::kW; ++w) {</div><div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Base::Iterations::kC; ++c) {</div><div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">valid</a>(d, h, w, c)) {</div><div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;              <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">load_element</a>(</div><div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;                  reinterpret_cast&lt;typename Base::AccessType&amp;&gt;(frag_iterator.at(d, h, w, c)),</div><div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;                  d,</div><div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;                  h,</div><div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;                  w,</div><div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;                  c);</div><div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;            }</div><div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;          }</div><div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;          <span class="keywordflow">if</span> (w &lt; Base::Iterations::kW - 1) {</div><div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">inc_w</a>();</div><div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;          }</div><div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;        }</div><div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;        <span class="keywordflow">if</span> (h &lt; Base::Iterations::kH - 1) {</div><div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">inc_h</a>();</div><div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;        }</div><div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;      }</div><div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;      <span class="keywordflow">if</span> (d &lt; Base::Iterations::kD - 1) {</div><div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">inc_d</a>();</div><div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;      }</div><div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;    }</div><div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">inc_advance</a>();</div><div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;  }</div><div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;</div><div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00606"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">  606</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">store_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&amp; fragment) {</div><div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Base::Iterations::kD; ++d) {</div><div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Base::Iterations::kH; ++h) {</div><div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Base::Iterations::kW; ++w) {</div><div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Base::Iterations::kC; ++c) {</div><div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">valid</a>(d, h, w, c)) {</div><div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;              <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">store_element</a>(</div><div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;                  reinterpret_cast&lt;typename Base::AccessType&amp;&gt;(frag_iterator.at(d, h, w, c)),</div><div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;                  d,</div><div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;                  h,</div><div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;                  w,</div><div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;                  c);</div><div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;            }</div><div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;          }</div><div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;          <span class="keywordflow">if</span> (w &lt; Base::Iterations::kW - 1) {</div><div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;            <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">inc_w</a>();</div><div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;          }</div><div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;        }</div><div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;        <span class="keywordflow">if</span> (h &lt; Base::Iterations::kH - 1) {</div><div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">inc_h</a>();</div><div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;        }</div><div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;      }</div><div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;      <span class="keywordflow">if</span> (d &lt; Base::Iterations::kD - 1) {</div><div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">inc_d</a>();</div><div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;      }</div><div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;    }</div><div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">inc_advance</a>();</div><div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;  }</div><div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;};</div><div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;</div><div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;</div><div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:120</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a07bb48f99000256f04f00564a4371c2f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">cutlass::gemm::GemmGlobalTileTraits::Delta</a></div><div class="ttdeci">Shape&lt; 0, Threads::kH, Threads::kW *kAccessSize &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:92</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a8c2618ac16362a8362dcddeed71c41d4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">cutlass::gemm::GemmGlobalIteratorCd::Params::inc_advance</a></div><div class="ttdeci">Index inc_advance</div><div class="ttdoc">The strides to increment the pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:384</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ad26ab8d8010c9a1d7f3b91f60940b460"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad26ab8d8010c9a1d7f3b91f60940b460">cutlass::gemm::GemmGlobalIteratorCd::inc_d</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_d()</div><div class="ttdoc">Increment the pointer in the D dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:452</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_aa6845b5a0fa36eb185caafea791e53ec"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">cutlass::gemm::GemmGlobalIteratorCd::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmGlobalIteratorCd &amp; operator+=(Coord&lt; 3 &gt; const &amp;offset)</div><div class="ttdoc">Adds a vector offset to the iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:529</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a07989416829cbe7efecb56456c99adf7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7">cutlass::gemm::GemmGlobalIteratorAb::load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_post_increment(Fragment &amp;fragment)</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:362</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a8c2618ac16362a8362dcddeed71c41d4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">cutlass::gemm::GemmGlobalIteratorCd::Params::inc_advance</a></div><div class="ttdeci">Index inc_advance</div><div class="ttdoc">The strides to increment the pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:434</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a3dd74f6e12339a87c0eb8f75fbdc7b9c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">cutlass::gemm::GemmGlobalIteratorAb::PredicateVector</a></div><div class="ttdeci">cutlass::PredicateVector&lt; ShapeCount&lt; typename Base::Iterations &gt;::kCount &gt; PredicateVector</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:191</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_afe016e0c6234075a8d69ba7341555ece"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">cutlass::gemm::GemmGlobalIteratorAb::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">The layout. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:177</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html_ac3662947fa50251daf58240a9c798085"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">cutlass::platform::remove_const::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:369</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a09268125f1e323874f6c12b50185c517"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">cutlass::gemm::GemmGlobalIteratorAb::BaseParams</a></div><div class="ttdeci">Base::Params BaseParams</div><div class="ttdoc">Iterator parameters type. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:194</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aaf6410f99d7f995792d0ac34efd3a82f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">cutlass::gemm::GemmGlobalTileTraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, Tile::kH/Threads::kH, Tile::kW/Threads::kW, Tile::kC/kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:97</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a56847e834b31b88544093c3df54d299f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">cutlass::gemm::GemmGlobalIteratorCd::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:373</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a3dd74f6e12339a87c0eb8f75fbdc7b9c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">cutlass::gemm::GemmGlobalIteratorAb::PredicateVector</a></div><div class="ttdeci">cutlass::PredicateVector&lt; ShapeCount&lt; typename Base::Iterations &gt;::kCount &gt; PredicateVector</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_afe016e0c6234075a8d69ba7341555ece"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">cutlass::gemm::GemmGlobalIteratorAb::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">The layout. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:180</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_ab61ce6b04d72d2652ee3bffca3885fe5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">cutlass::gemm::GemmGlobalIteratorAb::GemmGlobalIteratorAb</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmGlobalIteratorAb(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;threadblock_offset, ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:270</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html_ac3662947fa50251daf58240a9c798085"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">cutlass::platform::remove_const::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:377</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a84f2f19069c3b003b1fcad438f690bc8"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">cutlass::TileLoadIterator::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars accessed per load/store. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:461</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a09268125f1e323874f6c12b50185c517"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">cutlass::gemm::GemmGlobalIteratorAb::BaseParams</a></div><div class="ttdeci">Base::Params BaseParams</div><div class="ttdoc">Iterator parameters type. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:199</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a365eb7c90a79c9ab32f603c6985a0316"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">cutlass::gemm::GemmGlobalIteratorCd::inc_c</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_c()</div><div class="ttdoc">Increment the pointer in the C dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:512</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a56847e834b31b88544093c3df54d299f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">cutlass::gemm::GemmGlobalIteratorCd::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:421</div></div>
 <div class="ttc" id="tile__iterator_8h_html"><div class="ttname"><a href="tile__iterator_8h.html">tile_iterator.h</a></div><div class="ttdoc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6a745d66c4c7de352041f779e54e6b2b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">cutlass::gemm::GemmGlobalIteratorCd::This_</a></div><div class="ttdeci">GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:354</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a27b88818f5b094372bf2c6e090c9148a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">cutlass::gemm::GemmGlobalIteratorCd::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">The layout. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:364</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a6cb3196f1fe3958d1656ba8b493c82ac"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">cutlass::gemm::GemmGlobalTileTraits::VectorizedTile</a></div><div class="ttdeci">ReshapeTile&lt; Tile_, kAccessSize_ &gt;::Tile VectorizedTile</div><div class="ttdoc">The vectorized tile shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:86</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6a745d66c4c7de352041f779e54e6b2b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">cutlass::gemm::GemmGlobalIteratorCd::This_</a></div><div class="ttdeci">GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:402</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a27b88818f5b094372bf2c6e090c9148a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">cutlass::gemm::GemmGlobalIteratorCd::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">The layout. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:412</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:70</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a3ff6f630b6b317ace1cf6e13fdf3a0cd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">cutlass::gemm::GemmGlobalTileTraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:78</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a59d40c5bd544fdabf42787b9f11cce51"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">cutlass::TileIteratorBase::FragmentIterator</a></div><div class="ttdeci">FragmentIterator&lt; Fragment, Iterations, AccessType &gt; FragmentIterator</div><div class="ttdoc">The fragment iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:199</div></div>
 <div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738dda"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">cutlass::IteratorAdvance::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_ac8eca7087d1f7575b0c6beeb5f907bfd"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">cutlass::PredicateVector::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool at(int idx) const</div><div class="ttdoc">Accesses a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:356</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">cutlass::MemorySpace::kGlobal</a></div><div class="ttdef"><b>Definition:</b> load_store.h:43</div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a21a3524edaf002b5e5878df3c7eae7e7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">cutlass::gemm::GemmGlobalTileTraits::MultiplicandTraits</a></div><div class="ttdeci">GemmMultiplicandTraits&lt; Tile, kOperand, kLayout &gt; MultiplicandTraits</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738dda"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">cutlass::IteratorAdvance::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_ac8eca7087d1f7575b0c6beeb5f907bfd"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">cutlass::PredicateVector::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool at(int idx) const</div><div class="ttdoc">Accesses a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">cutlass::MemorySpace::kGlobal</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a428750e54eabd15b2a3f7ac2a96af0a9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">cutlass::gemm::GemmGlobalTileTraits::ThreadsDelta</a></div><div class="ttdeci">Shape&lt; 1, 1, VectorizedTile::kC &gt; ThreadsDelta</div><div class="ttdoc">The relative offset between two elements in the H/W dimension in adjacent threads. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a21a3524edaf002b5e5878df3c7eae7e7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">cutlass::gemm::GemmGlobalTileTraits::MultiplicandTraits</a></div><div class="ttdeci">GemmMultiplicandTraits&lt; Tile, kOperand, kLayout &gt; MultiplicandTraits</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:103</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a70dfd0b62feb082d8da34af09d9524a6"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">cutlass::TileLoadIterator::FragmentElement</a></div><div class="ttdeci">FragmentElement_ FragmentElement</div><div class="ttdoc">Fragment element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:425</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_af219ece6e66e2866169e06e15cc4472d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">cutlass::gemm::GemmGlobalTileTraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:82</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a8f8fbb65070589769468c6b1ac6ba7a5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">cutlass::gemm::GemmGlobalIteratorCd::Base</a></div><div class="ttdeci">TileIteratorBase&lt; TileTraits_, typename TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:361</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a65f9ccd630dde0c9db5358cfc951583d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">cutlass::gemm::GemmGlobalTileTraits::ThreadsDelta</a></div><div class="ttdeci">Shape&lt; 1, 1, Tile::kC &gt; ThreadsDelta</div><div class="ttdoc">The relative offset between two elements in the H/W dimension in adjacent threads. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:89</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_aba61fb6e93a6423ab72c082c280f5db4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4">cutlass::gemm::GemmGlobalTileCdTraits::Delta</a></div><div class="ttdeci">Shape&lt; 0, 0, Base::Delta::kW, Base::Delta::kC &gt; Delta</div><div class="ttdoc">Override the strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:134</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a36afe18f94aacd0746c8946866371d3c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_h</a></div><div class="ttdeci">Index predicate_inc_h</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:386</div></div>
-<div class="ttc" id="structcutlass_1_1ComputeOffsetFromShape_html_a3c6f60a59178ffb84899aa449bd51d38"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">cutlass::ComputeOffsetFromShape::get</a></div><div class="ttdeci">static CUTLASS_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:166</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6fd4e62eb280a5b8c17eb79141414581"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6fd4e62eb280a5b8c17eb79141414581">cutlass::gemm::GemmGlobalIteratorCd::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Pointer const data() const</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:469</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_ab9375d9e779dcda79a5cd561bb3762ff"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff">cutlass::gemm::GemmGlobalIteratorAb::initialize_predicates</a></div><div class="ttdeci">CUTLASS_DEVICE void initialize_predicates(const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block)</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:233</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a69d2f21c8188fb3229af8c2dbe0a23b6"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">cutlass::TileLoadIterator::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies in which dimension post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:331</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_ae13e0d30a941e16875f196b4844b03ed"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">cutlass::gemm::GemmGlobalIteratorAb::Base</a></div><div class="ttdeci">TileLoadIterator&lt; TileTraits_, typename TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:175</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_ac4d2c293f9312b673ea29bf79b2882fd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ac4d2c293f9312b673ea29bf79b2882fd">cutlass::gemm::GemmGlobalIteratorAb::valid</a></div><div class="ttdeci">CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Is the iterator valid? </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:336</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">cutlass::gemm::GemmGlobalIteratorAb::Params</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:196</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a85afb31647e5cac591b76959a102cd06"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">cutlass::gemm::GemmGlobalIteratorAb::load_element</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_element(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</div><div class="ttdoc">Loads a single fragment element from memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:292</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a8f8fbb65070589769468c6b1ac6ba7a5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">cutlass::gemm::GemmGlobalIteratorCd::Base</a></div><div class="ttdeci">TileIteratorBase&lt; TileTraits_, typename TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:409</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a9ffa12dcd7ed1e96845e1cd273d9f219"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::Fragment</a></div><div class="ttdeci">Fragment&lt; FragmentElement, ShapeCount&lt; Iterations &gt;::kCount *kAccessSize &gt; Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_aba61fb6e93a6423ab72c082c280f5db4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4">cutlass::gemm::GemmGlobalTileCdTraits::Delta</a></div><div class="ttdeci">Shape&lt; 0, 0, Base::Delta::kW, Base::Delta::kC &gt; Delta</div><div class="ttdoc">Override the strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:138</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a36afe18f94aacd0746c8946866371d3c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_h</a></div><div class="ttdeci">Index predicate_inc_h</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:436</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a3175746438646453e93e6e08e954bc8d"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:584</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a44424164c9347f9916b2b86858706043"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">cutlass::TileLoadIterator::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">Source or destination memory space. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:434</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a7b4293bf8291b0383dee695a60f2e0fd"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">cutlass::TileIteratorBase::Params::inc_d</a></div><div class="ttdeci">long long inc_d</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:223</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a52ba72984ea8ce84eda28d07c6c8ec19"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">cutlass::gemm::GemmGlobalTileTraits::Tile</a></div><div class="ttdeci">Tile_ Tile</div><div class="ttdoc">The tile shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:84</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a4604b230174b11bc7ddf5f3e9a922139"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">cutlass::TileLoadIterator::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:464</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a6d8f1e07f286ed8d5761e2a878b807d3"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">cutlass::TileIteratorBase::Params::inc_advance</a></div><div class="ttdeci">long long inc_advance</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:227</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a1a587af6edd528a02679c0decc31cdd1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">cutlass::gemm::GemmGlobalIteratorCd::load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_post_increment(Fragment &amp;fragment)</div><div class="ttdoc">Loads and increments iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:575</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_ae13e0d30a941e16875f196b4844b03ed"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">cutlass::gemm::GemmGlobalIteratorAb::Base</a></div><div class="ttdeci">TileLoadIterator&lt; TileTraits_, typename TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:178</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">cutlass::gemm::GemmGlobalIteratorAb::Params</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:201</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a15d3244546d1c8f4727e84b27a8b7fc6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6">cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmGlobalIteratorCd(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:489</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1ComputeOffsetFromShape_html_a7bc0bc7e03cd974a05d00e98a72ee78b"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">cutlass::ComputeOffsetFromShape::get</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:181</div></div>
 <div class="ttc" id="platform_8h_html"><div class="ttname"><a href="platform_8h.html">platform.h</a></div><div class="ttdoc">C++ features that may be otherwise unimplemented for CUDA device functions. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:159</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ab4b8150f19c9f8649d75c69ec0a76e1a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab4b8150f19c9f8649d75c69ec0a76e1a">cutlass::gemm::GemmGlobalIteratorCd::inc_advance</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_advance()</div><div class="ttdoc">Increment the pointer to move to the next iteration. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:454</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a581b7cdeef3e620f246923fa07f9db5a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a">cutlass::gemm::GemmGlobalTileCdTraits::Base</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:129</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:40</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a58e8c883aea4cfdfa5a84c25a4704ebc"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">cutlass::TileIteratorBase::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:172</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a8c1e871f17685b16a7a41fcc888f0125"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">cutlass::gemm::GemmGlobalIteratorAb::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies in which dimension post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:189</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a33e4dcd4449f324fed5ceaa2cde01b50"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">cutlass::gemm::GemmGlobalIteratorAb::Threads</a></div><div class="ttdeci">TileTraits_::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:183</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params_html_a73091e07b6d4c99f6e0319fbf6bd1709"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#a73091e07b6d4c99f6e0319fbf6bd1709">cutlass::gemm::GemmGlobalIteratorAb::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar const *ptr, Index stride_h)</div><div class="ttdoc">Initializes params to load a strip-mined tile, given pointer and stride_h. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:198</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_aebaecd0f971245ffc5a50fe5f7a9b4e8"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:425</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a87918f4d67a9c1e19dcd3c6bfc243e97"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">cutlass::gemm::GemmGlobalTileCdTraits::kStrideH</a></div><div class="ttdeci">static int const kStrideH</div><div class="ttdoc">The stride in the H dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:132</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:163</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a581b7cdeef3e620f246923fa07f9db5a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a">cutlass::gemm::GemmGlobalTileCdTraits::Base</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:133</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:39</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a2ad473e8f2fa2694617ee39ead5c41b3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">cutlass::gemm::GemmGlobalIteratorAb::inc_d</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_d()</div><div class="ttdoc">Increment the pointer in the D dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:287</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a8c1e871f17685b16a7a41fcc888f0125"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">cutlass::gemm::GemmGlobalIteratorAb::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies in which dimension post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:194</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a33e4dcd4449f324fed5ceaa2cde01b50"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">cutlass::gemm::GemmGlobalIteratorAb::Threads</a></div><div class="ttdeci">TileTraits_::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:188</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a87918f4d67a9c1e19dcd3c6bfc243e97"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97">cutlass::gemm::GemmGlobalTileCdTraits::kStrideH</a></div><div class="ttdeci">static int const kStrideH</div><div class="ttdoc">The stride in the H dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:136</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a3a20d9062bba613c160bb2cd14f80a5e"><div class="ttname"><a href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">cutlass::Shape::kH</a></div><div class="ttdeci">static int const kH</div><div class="ttdoc">The height of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:68</div></div>
+<div class="ttc" id="structcutlass_1_1Store_html"><div class="ttname"><a href="structcutlass_1_1Store.html">cutlass::Store</a></div><div class="ttdef"><b>Definition:</b> load_store.h:178</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4_html_a894932ad04fae3aea06eb6d259e01c1c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;::Threads</a></div><div class="ttdeci">Shape&lt; Threads_::kD, Threads_::kH *Threads_::kW/Tile_::kW, Tile_::kW, 1 &gt; Threads</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:59</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a2b5d2b02d241e89677c41eb658ace129"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_advance</a></div><div class="ttdeci">Index predicate_inc_advance</div><div class="ttdoc">The strides to increment the predicate offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:386</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a2b5d2b02d241e89677c41eb658ace129"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_advance</a></div><div class="ttdeci">Index predicate_inc_advance</div><div class="ttdoc">The strides to increment the predicate offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:436</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_ae0bca976b7cfba8561db4cccc16e99e1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">cutlass::gemm::GemmGlobalTileTraits::kOperand</a></div><div class="ttdeci">static GemmOperand::Kind const kOperand</div><div class="ttdoc">Identity of the operand. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:72</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_aea591d4278a8338ae8b50fa0b8f3a366"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">cutlass::TileIteratorBase::Params::inc_h</a></div><div class="ttdeci">Index inc_h</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:176</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a4f029a268387bd63112d9074c185c623"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">cutlass::TileIteratorBase::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:220</div></div>
 <div class="ttc" id="predicate__vector_8h_html"><div class="ttname"><a href="predicate__vector_8h.html">predicate_vector.h</a></div><div class="ttdoc">Defines container classes and iterators for managing a statically sized vector of boolean predicates...</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:302</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ab224a0a6ab8ce7fc4e76b06fb7679fa0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">cutlass::gemm::GemmGlobalIteratorCd::valid</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Test the validity of the. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:566</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_af405f6c5f0bd8f04487d8a7f41dc1826"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">cutlass::TileIteratorBase::kFragmentElementType</a></div><div class="ttdeci">static FragmentElementType::Kind const kFragmentElementType</div><div class="ttdoc">Specifies iterator storage fragment type (Scalar or WmmaMatrix) </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:158</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a49d7db2dab7a6d1e496ebff0e67039bc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">cutlass::gemm::GemmGlobalIteratorCd::inc_d</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_d()</div><div class="ttdoc">Increment the pointer in the D dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:521</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:399</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:58</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_af323c9db74f0de3376edd35eb377bc9c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">cutlass::gemm::GemmGlobalIteratorAb::predicates</a></div><div class="ttdeci">PredicateVector predicates</div><div class="ttdoc">The predicates. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:342</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_ae24453fcdf9f21385b2637476746bbe5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5">cutlass::gemm::GemmGlobalIteratorCd::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Pointer pointer, long long batch_stride, Index ldm, Index bound, Index epilogue_stride_w, Index epilogue_delta_w)</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:441</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_af323c9db74f0de3376edd35eb377bc9c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">cutlass::gemm::GemmGlobalIteratorAb::predicates</a></div><div class="ttdeci">PredicateVector predicates</div><div class="ttdoc">The predicates. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:241</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a6894b653fffa59bcb847bc3295643d6b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">cutlass::gemm::GemmGlobalTileTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:76</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a3af66b82b1a0cc5bf6141f940553e048"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3af66b82b1a0cc5bf6141f940553e048">cutlass::gemm::GemmGlobalIteratorAb::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar const  * data() const</div><div class="ttdoc">Returns the current pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:304</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
 <div class="ttc" id="gemm__operand_8h_html"><div class="ttname"><a href="gemm__operand_8h.html">gemm_operand.h</a></div><div class="ttdoc">Defines constant expressions for mapping GEMM problem size and strides onto pitch-linear memory...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a2180cfbb482d300472ad2993e4b555d4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">cutlass::gemm::GemmGlobalIteratorAb::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment type loaded by the iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:179</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_afdd08b4f4c1feaa426f997d15cd28c02"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">cutlass::gemm::GemmGlobalIteratorCd::Threads</a></div><div class="ttdeci">TileTraits_::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:371</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset_html_abaf0d4459a64b3e9533758b59600bd52"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52">cutlass::gemm::GemmGlobalTileCdTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:147</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ae07fa10a53d44471a04275145201299e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ae07fa10a53d44471a04275145201299e">cutlass::gemm::GemmGlobalIteratorCd::inc_h</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_h()</div><div class="ttdoc">Increment the pointer in the H dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:447</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a64f1df43acb37a1901f0b55becaa9557"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a64f1df43acb37a1901f0b55becaa9557">cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd</a></div><div class="ttdeci">CUTLASS_DEVICE GemmGlobalIteratorCd(Params const &amp;params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:420</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a1d86f7e16bd11e10c94b0c14111c8c14"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">cutlass::gemm::GemmGlobalIteratorAb::inc_h</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_h()</div><div class="ttdoc">Increment the pointer in the H dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:285</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a32cd0a03868f52b172d031f23e2c08af"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">cutlass::gemm::GemmGlobalIteratorAb::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmGlobalIteratorAb &amp; operator+=(Coord&lt; 3 &gt; const &amp;offset)</div><div class="ttdoc">Adds a vector offset to the iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:341</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a2180cfbb482d300472ad2993e4b555d4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">cutlass::gemm::GemmGlobalIteratorAb::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment type loaded by the iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:184</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_afdd08b4f4c1feaa426f997d15cd28c02"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">cutlass::gemm::GemmGlobalIteratorCd::Threads</a></div><div class="ttdeci">TileTraits_::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:419</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset_html_abaf0d4459a64b3e9533758b59600bd52"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52">cutlass::gemm::GemmGlobalTileCdTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:151</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmMultiplicandTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">cutlass::gemm::GemmMultiplicandTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_operand.h:67</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html">cutlass::gemm::GemmGlobalTileTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:102</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a1187258cd4068a627e73bee0302f1fc2"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">cutlass::TileIteratorBase::Params::inc_advance</a></div><div class="ttdeci">Index inc_advance</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:179</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_aab37ea6c47e34466371314ed3971dc7b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aab37ea6c47e34466371314ed3971dc7b">cutlass::gemm::GemmGlobalIteratorAb::residue</a></div><div class="ttdeci">CUTLASS_DEVICE void residue(Index k)</div><div class="ttdoc">That&amp;#39;s the residue! Update the predicates. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:307</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a236bd1a822479750a809452fd58dd917"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">cutlass::PredicateVector::fill</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void fill(bool value=true)</div><div class="ttdoc">Fills all predicates with a given value. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:343</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a34cb153d311377388e7819296a84d07e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a34cb153d311377388e7819296a84d07e">cutlass::gemm::GemmGlobalIteratorAb::GemmGlobalIteratorAb</a></div><div class="ttdeci">CUTLASS_DEVICE GemmGlobalIteratorAb(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:267</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_af5a496f1b6a46ea6a9894512029add6a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#af5a496f1b6a46ea6a9894512029add6a">cutlass::gemm::GemmGlobalIteratorCd::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Pointer pointer, Index ld, Index bound, Index epilogue_stride_w, Index epilogue_delta_w)</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:391</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a12ead84ea9634e963d10c6df7b7792c9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a12ead84ea9634e963d10c6df7b7792c9">cutlass::gemm::GemmGlobalIteratorCd::inc_c</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_c()</div><div class="ttdoc">Increment the pointer in the C dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:443</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a0d3c1a58f23957f9850d1b22992a981a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a0d3c1a58f23957f9850d1b22992a981a">cutlass::gemm::GemmGlobalIteratorCd::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Pointer data()</div><div class="ttdoc">Returns the raw pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:466</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a6608f7027994aaebdefd004fe94153d9"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">cutlass::TileLoadIterator::Params::pointer</a></div><div class="ttdeci">Scalar const  * pointer</div><div class="ttdoc">Pointer to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:390</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a9aff3e2ff0db5a5169257e964e5895c6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">cutlass::gemm::GemmGlobalTileCdTraits::Threads</a></div><div class="ttdeci">Base::Threads Threads</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:138</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a0c6b03c635e14ad4424a83f8c7f8025e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">cutlass::gemm::GemmGlobalIteratorCd::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdoc">The stride in the H dimension to setup the thread in the block. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:382</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html">cutlass::gemm::GemmGlobalTileTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:106</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a760404b7879a38364d7eef47fc1fe209"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">cutlass::gemm::GemmGlobalIteratorAb::inc_w</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_w()</div><div class="ttdoc">Increment the pointer in the W dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:283</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aa856180123f8d50a00222542fa6345cf"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load(Fragment &amp;fragment, PredicateIterator pred_it) const</div><div class="ttdoc">Loads a fragment without advancing the iterator.. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:771</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a236bd1a822479750a809452fd58dd917"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">cutlass::PredicateVector::fill</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void fill(bool value=true)</div><div class="ttdoc">Fills all predicates with a given value. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:344</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_aafa962f7e63da77c9904d438ab94347a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">cutlass::gemm::GemmGlobalIteratorCd::store_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store_post_increment(Fragment &amp;fragment)</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:606</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a9aff3e2ff0db5a5169257e964e5895c6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">cutlass::gemm::GemmGlobalTileCdTraits::Threads</a></div><div class="ttdeci">Base::Threads Threads</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:142</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a0c6b03c635e14ad4424a83f8c7f8025e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">cutlass::gemm::GemmGlobalIteratorCd::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdoc">The stride in the H dimension to setup the thread in the block. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:432</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset_html_ab8adb983c0573a0015469f40a75287be"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be">cutlass::gemm::GemmGlobalTileTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:104</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_abc47717230ddde3edc88d2770f6841bf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">cutlass::gemm::GemmGlobalTileTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; 0, 0, Threads::kW *ThreadsDelta::kW, kAccessSize &gt; ImmediateOffsetStrides</div><div class="ttdoc">Strides for immediate offset computation. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:94</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a></div><div class="ttdoc">Statically sized array of bits implementing. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:104</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_aa24336597f4a3316d94df6ab0c20f714"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aa24336597f4a3316d94df6ab0c20f714">cutlass::gemm::GemmGlobalIteratorAb::inc_h</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_h()</div><div class="ttdoc">Increment the pointer in the H dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:296</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6d985f8e93be21e56f72ec1400d73df1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">cutlass::gemm::GemmGlobalIteratorCd::ThreadOffset</a></div><div class="ttdeci">TileTraits_::ThreadOffset ThreadOffset</div><div class="ttdoc">The thread offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:375</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_ae3ecef6501f0761051f298eb7cefcacf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">cutlass::gemm::GemmGlobalIteratorAb::inc_advance</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_advance()</div><div class="ttdoc">Increment the pointer to move to the next iteration. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:289</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset_html_ab8adb983c0573a0015469f40a75287be"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be">cutlass::gemm::GemmGlobalTileTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:108</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6034b7229e4aca05f63c39560f219433"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">cutlass::gemm::GemmGlobalIteratorCd::load_element</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_element(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</div><div class="ttdoc">Loads a single fragment element from memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:538</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a15227102466522445261b6ea65c89c06"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">cutlass::TileIteratorBase::Params::inc_h</a></div><div class="ttdeci">Index inc_h</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:224</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_abc47717230ddde3edc88d2770f6841bf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">cutlass::gemm::GemmGlobalTileTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; 0, 0, Threads::kW *ThreadsDelta::kW, kAccessSize &gt; ImmediateOffsetStrides</div><div class="ttdoc">Strides for immediate offset computation. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:95</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a></div><div class="ttdoc">Statically sized array of bits implementing. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:105</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1Load_html"><div class="ttname"><a href="structcutlass_1_1Load.html">cutlass::Load</a></div><div class="ttdef"><b>Definition:</b> load_store.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6d985f8e93be21e56f72ec1400d73df1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">cutlass::gemm::GemmGlobalIteratorCd::ThreadOffset</a></div><div class="ttdeci">TileTraits_::ThreadOffset ThreadOffset</div><div class="ttdoc">The thread offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:423</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a14e9713b0cd34af433c3cae9b283b54c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c">cutlass::gemm::GemmGlobalTileCdTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Base::ImmediateOffsetStrides ImmediateOffsetStrides</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:142</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6b5b207eb1147e9669215e192901df9e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">cutlass::gemm::GemmGlobalIteratorCd::Scalar</a></div><div class="ttdeci">TileTraits_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:367</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_aed94505e5a269d5f33499e71284104f5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">cutlass::gemm::GemmGlobalIteratorCd::Params::inc_h</a></div><div class="ttdeci">Index inc_h</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:384</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ad23e6224e37ec1d13dc237ce8ec6e977"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">cutlass::gemm::GemmGlobalIteratorCd::predicates</a></div><div class="ttdeci">cutlass::PredicateVector&lt; Base::Iterations::kW &gt; predicates</div><div class="ttdoc">The predicates for the row. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:472</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a1e42503e5a54cdc01308e9030aebdd35"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1e42503e5a54cdc01308e9030aebdd35">cutlass::gemm::GemmGlobalIteratorAb::inc_d</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_d()</div><div class="ttdoc">Increment the pointer in the D dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:298</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_ad764f98e770d4685006e6888214dcd4d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">cutlass::gemm::GemmGlobalIteratorCd::Params::pointer</a></div><div class="ttdeci">Pointer pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:380</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a2892be253a3de5bffc3edcef2890d3a8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">cutlass::gemm::GemmGlobalIteratorAb::This_</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:167</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a14e9713b0cd34af433c3cae9b283b54c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c">cutlass::gemm::GemmGlobalTileCdTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Base::ImmediateOffsetStrides ImmediateOffsetStrides</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:146</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a235647baff946e483dd61a2069aa01d2"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">cutlass::TileIteratorBase::Params::stride_d</a></div><div class="ttdeci">long long stride_d</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:219</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6b5b207eb1147e9669215e192901df9e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">cutlass::gemm::GemmGlobalIteratorCd::Scalar</a></div><div class="ttdeci">TileTraits_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:415</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_aed94505e5a269d5f33499e71284104f5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">cutlass::gemm::GemmGlobalIteratorCd::Params::inc_h</a></div><div class="ttdeci">Index inc_h</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:434</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ad23e6224e37ec1d13dc237ce8ec6e977"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">cutlass::gemm::GemmGlobalIteratorCd::predicates</a></div><div class="ttdeci">cutlass::PredicateVector&lt; Base::Iterations::kW &gt; predicates</div><div class="ttdoc">The predicates for the row. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:473</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ab8bfa9914c4ba49a583d1cfaa8a62d56"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">cutlass::TileIteratorBase::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">Source or destination memory space. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:161</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_ad764f98e770d4685006e6888214dcd4d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">cutlass::gemm::GemmGlobalIteratorCd::Params::pointer</a></div><div class="ttdeci">Pointer pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:428</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a2892be253a3de5bffc3edcef2890d3a8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">cutlass::gemm::GemmGlobalIteratorAb::This_</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:171</div></div>
 <div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4 &gt;</a></div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aebbf8834d0d88f0e5b3e1926db5e6758"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">cutlass::gemm::GemmGlobalTileTraits::Tile</a></div><div class="ttdeci">ReshapeTile&lt; Tile_, kAccessSize_ &gt;::Tile Tile</div><div class="ttdoc">The tile shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:85</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aaf72c4897641080b1d84c0bbd8d813cc"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">cutlass::TileLoadIterator::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:364</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a></div><div class="ttdoc">Iterator for accessing a stripmined tile in memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:102</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a622a4dd27162854ec96efea93cdd4380"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a622a4dd27162854ec96efea93cdd4380">cutlass::gemm::GemmGlobalIteratorCd::inc_w</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_w()</div><div class="ttdoc">Increment the pointer in the W dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:445</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ac368b1ea1c5ad2209a6ac6bec597600f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">cutlass::gemm::GemmGlobalIteratorCd::params</a></div><div class="ttdeci">Params params</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:412</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:348</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a56601dc34e8f9a070db5dc48c37d55a0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">cutlass::gemm::GemmGlobalIteratorCd::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdoc">Offset of an individual lane from the start of the tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:414</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_afd09d3b8e5ca04eab7edc2e5723816e5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">cutlass::gemm::GemmGlobalIteratorAb::ThreadOffset</a></div><div class="ttdeci">TileTraits_::ThreadOffset ThreadOffset</div><div class="ttdoc">The thread offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:187</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a646bd38ab95cdf0379ecb372839a9111"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">cutlass::gemm::GemmGlobalIteratorAb::Tile</a></div><div class="ttdeci">TileTraits_::Tile Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:182</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aae7128f5522383c857d2639031b64c30"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; VectorizedTile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a893cb2cc67676b44c1f3ad5908a4ab0c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">cutlass::gemm::GemmGlobalTileTraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, VectorizedTile::kH/Threads::kH, VectorizedTile::kW/Threads::kW, VectorizedTile::kC/kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:101</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_aeeed9a3582a879d9da77191df88e83ff"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE GemmGlobalIteratorCd(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block_offset, ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:476</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_aeac77cdc31ce151634b7c27ccdaf5552"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">cutlass::gemm::GemmGlobalIteratorCd::inc_advance</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_advance()</div><div class="ttdoc">Increment the pointer to move to the next iteration. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:523</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a40144d869b56b46cf1dd8f9941e61e77"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">cutlass::gemm::GemmGlobalIteratorCd::inc_h</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_h()</div><div class="ttdoc">Increment the pointer in the H dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:516</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ab1d9e606a89d3dd315df3d3efa48bcc2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">cutlass::gemm::GemmGlobalIteratorCd::inc_w</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_w()</div><div class="ttdoc">Increment the pointer in the W dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:514</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a></div><div class="ttdoc">Iterator for accessing a stripmined tile in memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:144</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a388d464c35cc1bcd509d22937f38dcf6"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">cutlass::TileLoadIterator::Params::pointer</a></div><div class="ttdeci">Scalar const  * pointer</div><div class="ttdoc">Pointer to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:493</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ac368b1ea1c5ad2209a6ac6bec597600f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">cutlass::gemm::GemmGlobalIteratorCd::params</a></div><div class="ttdeci">Params params</div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:469</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:396</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aea9fbc738003a7424cfa9b0527d4a352"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">cutlass::TileLoadIterator::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies in which dimension post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:428</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a56601dc34e8f9a070db5dc48c37d55a0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">cutlass::gemm::GemmGlobalIteratorCd::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdoc">Offset of an individual lane from the start of the tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:471</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a7f2fe3fa2eb764bf664817097d22fe45"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">cutlass::TileIteratorBase::FragmentElement</a></div><div class="ttdeci">FragmentElement_ FragmentElement</div><div class="ttdoc">Fragment element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:152</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_afd09d3b8e5ca04eab7edc2e5723816e5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">cutlass::gemm::GemmGlobalIteratorAb::ThreadOffset</a></div><div class="ttdeci">TileTraits_::ThreadOffset ThreadOffset</div><div class="ttdoc">The thread offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:192</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a78836a20250ff24c25a6622ad818b421"><div class="ttname"><a href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">cutlass::Shape::kW</a></div><div class="ttdeci">static int const kW</div><div class="ttdoc">The width of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a062fa8a8df725ef08ced2ffcca8336af"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">cutlass::PredicateVector::set</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void set(int idx, bool value=true)</div><div class="ttdoc">Set a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:364</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator::Params</a></div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:388</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html">cutlass::gemm::GemmGlobalTileCdTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a062fa8a8df725ef08ced2ffcca8336af"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">cutlass::PredicateVector::set</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void set(int idx, bool value=true)</div><div class="ttdoc">Set a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:365</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a5940e491967e265630dc0a4b448791d6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6">cutlass::gemm::GemmGlobalIteratorAb::add_pointer_offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void add_pointer_offset(Index offset)</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:351</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a8a4edd46b8cad3eeafc2a3dc3a344499"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">cutlass::TileIteratorBase::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars accessed per load/store. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:185</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator::Params</a></div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:491</div></div>
+<div class="ttc" id="structcutlass_1_1ComputeOffsetFromStrides_html_aa28231590bfa0ced0f317e6a4d52dc1e"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">cutlass::ComputeOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:199</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html">cutlass::gemm::GemmGlobalTileCdTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:149</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a1a53695ce7f3cb267225d3ab86a0d5aa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">cutlass::gemm::GemmGlobalIteratorCd::Params::stride_d</a></div><div class="ttdeci">long long stride_d</div><div class="ttdoc">The stride in the D dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:430</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_adfb9a7df1b900e4f6ee59c72aabdebd7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7">cutlass::gemm::GemmGlobalIteratorAb::stride_advance</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index stride_advance(void)</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:353</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_af4f964364fc54a2b9a431fa529f6c44c"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">cutlass::TileLoadIterator::inc_w</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_w()</div><div class="ttdoc">Increment in the W dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:680</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aa001e09b246fdd8259cbda6a500cad5f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">cutlass::gemm::GemmGlobalTileTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:80</div></div>
 <div class="ttc" id="structcutlass_1_1ReshapeTile_html_a8d57fe6422aa920d9815a66e5a85b5f5"><div class="ttname"><a href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">cutlass::ReshapeTile::Tile</a></div><div class="ttdeci">Tile_ Tile</div><div class="ttdef"><b>Definition:</b> reshape_tile.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">cutlass::IteratorAdvance::kW</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a72eebc18d31900db57fa77508016f64a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">cutlass::gemm::GemmGlobalTileCdTraits::Iterations</a></div><div class="ttdeci">Base::Iterations Iterations</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:136</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a7ff9cae930c8a6bb9c8ee6d81cb1953f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">cutlass::gemm::GemmGlobalIteratorAb::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:185</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a3abcfa68ae9904a13195d32d6e6c4bc6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">cutlass::gemm::GemmGlobalIteratorCd::Pointer</a></div><div class="ttdeci">TileTraits_::Pointer Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:369</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a5817b81c7013db9a3f7394ad4b1db79a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">cutlass::gemm::GemmGlobalIteratorAb::Scalar</a></div><div class="ttdeci">TileTraits_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:181</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">cutlass::IteratorAdvance::kW</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_a72eebc18d31900db57fa77508016f64a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">cutlass::gemm::GemmGlobalTileCdTraits::Iterations</a></div><div class="ttdeci">Base::Iterations Iterations</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:140</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a7ff9cae930c8a6bb9c8ee6d81cb1953f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">cutlass::gemm::GemmGlobalIteratorAb::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:190</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a3abcfa68ae9904a13195d32d6e6c4bc6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">cutlass::gemm::GemmGlobalIteratorCd::Pointer</a></div><div class="ttdeci">TileTraits_::Pointer Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:417</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a6ebdbdce88f040fffd3eb60622c6d7e0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">cutlass::gemm::GemmGlobalIteratorAb::valid</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Is the valid? </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:335</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a2af872794b35a631f9c1a97df0c6d177"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">cutlass::TileLoadIterator::kFragmentElementType</a></div><div class="ttdeci">static FragmentElementType::Kind const kFragmentElementType</div><div class="ttdoc">Specifies type of iterator fragment storage (Salar or WmmaMatrix) </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:431</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a5817b81c7013db9a3f7394ad4b1db79a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">cutlass::gemm::GemmGlobalIteratorAb::Scalar</a></div><div class="ttdeci">TileTraits_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:186</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ReshapeThreads_html_afd3614ff45f0fc77ad4967951cb5ab57"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">cutlass::gemm::ReshapeThreads::Threads</a></div><div class="ttdeci">Threads_ Threads</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:54</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a29bd05960cc541bb67098f5483c84cf6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; Tile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:87</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a9dea455aa86bb59517b4a4d0309e424b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a9dea455aa86bb59517b4a4d0309e424b">cutlass::gemm::GemmGlobalIteratorAb::inc_advance</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_advance()</div><div class="ttdoc">Increment the pointer to move to the next iteration. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:300</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6dae81995ab94c0b7f28eeeeb84a6c8d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6dae81995ab94c0b7f28eeeeb84a6c8d">cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd</a></div><div class="ttdeci">CUTLASS_DEVICE GemmGlobalIteratorCd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:417</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_ab8c79cb1a8157dd00429c93cb4a41322"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">cutlass::gemm::GemmGlobalIteratorAb::params</a></div><div class="ttdeci">Params params</div><div class="ttdoc">The parameters. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:231</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params_html_ad0602cf5d322e98e3e5990c84ae1e3f3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#ad0602cf5d322e98e3e5990c84ae1e3f3">cutlass::gemm::GemmGlobalIteratorAb::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar const *ptr, long long stride_d, Index stride_h)</div><div class="ttdoc">Initializes params to load a strip-mined tile, given pointer and stride_h. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:203</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a8fd617565db6eb9c6fb99de868c389db"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">cutlass::gemm::GemmGlobalIteratorCd::add_pointer_offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void add_pointer_offset(Index offset)</div><div class="ttdoc">add pointer offset </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:571</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_ab8c79cb1a8157dd00429c93cb4a41322"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">cutlass::gemm::GemmGlobalIteratorAb::params</a></div><div class="ttdeci">Params params</div><div class="ttdoc">The parameters. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:239</div></div>
 <div class="ttc" id="matrix__traits_8h_html"><div class="ttname"><a href="matrix__traits_8h.html">matrix_traits.h</a></div><div class="ttdoc">Defines properties of matrices used to denote layout and operands to GEMM kernels. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:378</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_ae2f8331619e735e620f8a8cf2cdde077"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">cutlass::gemm::GemmGlobalTileCdTraits::ThreadsDelta</a></div><div class="ttdeci">Base::ThreadsDelta ThreadsDelta</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:140</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6594acc213fc8d4289c6c73631f60120"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6594acc213fc8d4289c6c73631f60120">cutlass::gemm::GemmGlobalIteratorCd::valid</a></div><div class="ttdeci">CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Test the validity of the iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:460</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a1864c5556529afdc8445021cad780b04"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">cutlass::gemm::GemmGlobalIteratorAb::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdoc">Offset of an individual lane from the start of the tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:229</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_aba8142a7a3b43da97f7968d98f3ba018"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018">cutlass::gemm::GemmGlobalIteratorAb::initialize_predicates</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void initialize_predicates(const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block_offset)</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:243</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:426</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html_ae2f8331619e735e620f8a8cf2cdde077"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">cutlass::gemm::GemmGlobalTileCdTraits::ThreadsDelta</a></div><div class="ttdeci">Base::ThreadsDelta ThreadsDelta</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:144</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a1864c5556529afdc8445021cad780b04"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">cutlass::gemm::GemmGlobalIteratorAb::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdoc">Offset of an individual lane from the start of the tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:237</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ad9c77ca0521d18a90dd3542a3941f016"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">cutlass::TileLoadIterator::FragmentIterator</a></div><div class="ttdeci">Base::FragmentIterator FragmentIterator</div><div class="ttdoc">Fragment iterator definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:467</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html">cutlass::ShapeCount</a></div><div class="ttdoc">Compute derived counted of a Layout Concept based class. </div><div class="ttdef"><b>Definition:</b> shape.h:79</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a3e8f6cf08d23318f3e3263b55cf3b84a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_offset</a></div><div class="ttdeci">Index predicate_offset</div><div class="ttdoc">The column offset to compute the predicate for the columns. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:388</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_af95fa1b5102176a0fa9b17713fd48150"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">cutlass::TileIteratorBase::Params::inc_d</a></div><div class="ttdeci">Index inc_d</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:175</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_ab2bad39cd9e9d27382cf8fb9e05ed593"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">cutlass::gemm::GemmGlobalIteratorAb::residue</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void residue(Index k)</div><div class="ttdoc">That&amp;#39;s the residue! Update the predicates. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:306</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a3e8f6cf08d23318f3e3263b55cf3b84a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_offset</a></div><div class="ttdeci">Index predicate_offset</div><div class="ttdoc">The column offset to compute the predicate for the columns. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:438</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a74bc07cb021a73513ab2fbacd572be90"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">cutlass::gemm::GemmGlobalTileTraits::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">The layout. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:74</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a5de982aed44932da3b265f8bb520249d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">cutlass::gemm::GemmGlobalIteratorCd::store_element</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store_element(typename Base::AccessType const &amp;value, int d, int h, int w, int c)</div><div class="ttdoc">Stores a single fragment element into memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:552</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_af7e7a71a9fa41cc3f6d0e5963963339d"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">cutlass::TileIteratorBase::Params::stride_w</a></div><div class="ttdeci">Index stride_w</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:221</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__operand_8h.html b/docs/gemm__operand_8h.html
index 17d7ebd30..07eefb28d 100644
--- a/docs/gemm__operand_8h.html
+++ b/docs/gemm__operand_8h.html
@@ -82,9 +82,9 @@ $(function() {
 
 <p>Defines constant expressions for mapping GEMM problem size and strides onto pitch-linear memory.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&quot;</code><br />
 </div>
 <p><a href="gemm__operand_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -126,7 +126,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__operand_8h_source.html b/docs/gemm__operand_8h_source.html
index 83b58f2b6..a53c3f114 100644
--- a/docs/gemm__operand_8h_source.html
+++ b/docs/gemm__operand_8h_source.html
@@ -76,40 +76,40 @@ $(function() {
 <div class="title">gemm_operand.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="gemm__operand_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html">   42</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html">GemmOperandTraitsAb</a> {</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html#abe4eb7f9a0ed7d48a81029e88849dcf2">   43</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html#abe4eb7f9a0ed7d48a81029e88849dcf2">Congruous</a> =</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;      (kOperand_ == <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a> ^ kLayout_ == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>);</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;};</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmOperand::Kind kOperand_, <span class="keyword">typename</span> Tile_&gt;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent.html">   50</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent</a>;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_&gt;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html">   53</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kA, Tile_&gt; {</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html#a881f84951bc9e47ab2be9ef3f2c1e423">   54</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> kExtent = Tile_::kW;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;};</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_&gt;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html">   58</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kB, Tile_&gt; {</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html#a82ff9b447e4a58164b5f7d53d2602930">   59</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> kExtent = Tile_::kH;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;};</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ThreadBlockTile_, GemmOperand::Kind Usage, MatrixLayout::Kind Layout&gt;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">   67</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a> {</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="comment">// Only defined for A or B</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Usage == <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a> || Usage == <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc">   70</a></span>&#160;                <span class="stringliteral">&quot;MultiplicandTileShape defined only for A or B operands.&quot;</span>);</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keyword">typedef</span> ThreadBlockTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc">ThreadBlockTile</a>;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a962ffde3b3db78792b67dd1f57ab0a05">   76</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a962ffde3b3db78792b67dd1f57ab0a05">kUsage</a> = Usage;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd">   79</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd">kLayout</a> = Layout;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  <span class="comment">// True if K is the strided dimension</span></div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">   82</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">kKstrided</a> = (<a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a962ffde3b3db78792b67dd1f57ab0a05">kUsage</a> == <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a> ^ <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd">kLayout</a> == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>);</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1conditional.html">platform::conditional</a>&lt;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">kKstrided</a>,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ThreadBlockTile::kD, GetExtent&lt;Usage, ThreadBlockTile&gt;::kExtent</a>&gt;,</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e">   88</a></span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GetExtent&lt;Usage, ThreadBlockTile&gt;::kExtent</a>, ThreadBlockTile::kD&gt; &gt;::type <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e">Shape</a>;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;};</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;<span class="keyword">template</span> &lt;GemmOperand::Kind operand, <span class="keywordtype">bool</span> Kstr<span class="keywordtype">id</span>ed = true&gt;</div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand.html">   96</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> Kstr<span class="keywordtype">id</span>ed&gt;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html">  100</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kA, Kstrided&gt; {</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html#ae91b2350374f1734a30cbed45e14b8e3">  102</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html#ae91b2350374f1734a30cbed45e14b8e3">project</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;coord) {</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keywordflow">if</span> (Kstrided) {</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[0], coord[2]);</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[2], coord[0]);</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    }</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  }</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;};</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> Kstr<span class="keywordtype">id</span>ed&gt;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html">  113</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kB, Kstrided&gt; {</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html#a0f1579013f56fe16ebc147271f163c3c">  115</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html#a0f1579013f56fe16ebc147271f163c3c">project</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;coord) {</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keywordflow">if</span> (Kstrided) {</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[0], coord[1]);</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[1], coord[0]);</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    }</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  }</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;};</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html">  126</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kC, true&gt; {</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250">  128</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250">project</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;coord) { <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[1], coord[2]); }</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;};</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html">  133</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kD, true&gt; {</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00135"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1">  135</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1">project</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;coord) { <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[1], coord[2]); }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;};</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmMultiplicandTraits_html_a1984c9ef6abfd029acbc3f702593ab85"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">cutlass::gemm::GemmMultiplicandTraits::kKstrided</a></div><div class="ttdeci">static bool const kKstrided</div><div class="ttdef"><b>Definition:</b> gemm_operand.h:82</div></div>
+<a href="gemm__operand_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html">   42</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html">GemmOperandTraitsAb</a> {</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html#abe4eb7f9a0ed7d48a81029e88849dcf2">   43</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html#abe4eb7f9a0ed7d48a81029e88849dcf2">Congruous</a> =</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;      (kOperand_ == <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a> ^ kLayout_ == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>);</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;};</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmOperand::Kind kOperand_, <span class="keyword">typename</span> Tile_&gt;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent.html">   50</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent</a>;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_&gt;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html">   53</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kA, Tile_&gt; {</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html#a881f84951bc9e47ab2be9ef3f2c1e423">   54</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> kExtent = Tile_::kW;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;};</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_&gt;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html">   58</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kB, Tile_&gt; {</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html#a82ff9b447e4a58164b5f7d53d2602930">   59</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> kExtent = Tile_::kH;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;};</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ThreadBlockTile_, GemmOperand::Kind Usage, MatrixLayout::Kind Layout&gt;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">   67</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a> {</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="comment">// Only defined for A or B</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Usage == <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a> || Usage == <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc">   70</a></span>&#160;                <span class="stringliteral">&quot;MultiplicandTileShape defined only for A or B operands.&quot;</span>);</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keyword">typedef</span> ThreadBlockTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc">ThreadBlockTile</a>;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a962ffde3b3db78792b67dd1f57ab0a05">   76</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a962ffde3b3db78792b67dd1f57ab0a05">kUsage</a> = Usage;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd">   79</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd">kLayout</a> = Layout;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  <span class="comment">// True if K is the strided dimension</span></div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">   82</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">kKstrided</a> = (<a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a962ffde3b3db78792b67dd1f57ab0a05">kUsage</a> == <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a> ^ <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd">kLayout</a> == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>);</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1conditional.html">platform::conditional</a>&lt;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">kKstrided</a>,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ThreadBlockTile::kD, GetExtent&lt;Usage, ThreadBlockTile&gt;::kExtent</a>&gt;,</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e">   88</a></span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GetExtent&lt;Usage, ThreadBlockTile&gt;::kExtent</a>, ThreadBlockTile::kD&gt; &gt;::type <a class="code" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e">Shape</a>;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;};</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;<span class="keyword">template</span> &lt;GemmOperand::Kind operand, <span class="keywordtype">bool</span> Kstr<span class="keywordtype">id</span>ed = true&gt;</div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand.html">   96</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> Kstr<span class="keywordtype">id</span>ed&gt;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html">  100</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kA, Kstrided&gt; {</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html#ae91b2350374f1734a30cbed45e14b8e3">  102</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html#ae91b2350374f1734a30cbed45e14b8e3">project</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;coord) {</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keywordflow">if</span> (Kstrided) {</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[0], coord[2]);</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[2], coord[0]);</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    }</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  }</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;};</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> Kstr<span class="keywordtype">id</span>ed&gt;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html">  113</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kB, Kstrided&gt; {</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html#a0f1579013f56fe16ebc147271f163c3c">  115</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html#a0f1579013f56fe16ebc147271f163c3c">project</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;coord) {</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keywordflow">if</span> (Kstrided) {</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[0], coord[1]);</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[1], coord[0]);</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    }</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  }</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;};</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html">  126</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kC, true&gt; {</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250">  128</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250">project</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;coord) { <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[1], coord[2]); }</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;};</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html">  133</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a>::kD, true&gt; {</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00135"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1">  135</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1">project</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;coord) { <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, coord[1], coord[2]); }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;};</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmMultiplicandTraits_html_a1984c9ef6abfd029acbc3f702593ab85"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85">cutlass::gemm::GemmMultiplicandTraits::kKstrided</a></div><div class="ttdeci">static bool const kKstrided</div><div class="ttdef"><b>Definition:</b> gemm_operand.h:82</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4_html_a0f1579013f56fe16ebc147271f163c3c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html#a0f1579013f56fe16ebc147271f163c3c">cutlass::gemm::ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;::project</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; project(Coord&lt; 3 &gt; const &amp;coord)</div><div class="ttdef"><b>Definition:</b> gemm_operand.h:115</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4_html_af2a323461334a6b55b95074a1973d250"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250">cutlass::gemm::ProjectOperand&lt; GemmOperand::kC, true &gt;::project</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; project(Coord&lt; 3 &gt; const &amp;coord)</div><div class="ttdef"><b>Definition:</b> gemm_operand.h:128</div></div>
 <div class="ttc" id="platform_8h_html"><div class="ttname"><a href="platform_8h.html">platform.h</a></div><div class="ttdoc">C++ features that may be otherwise unimplemented for CUDA device functions. </div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmMultiplicandTraits_html_a5e43f3c9aa8d7dc5f01dfc63b1ea97dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc">cutlass::gemm::GemmMultiplicandTraits::ThreadBlockTile</a></div><div class="ttdeci">ThreadBlockTile_ ThreadBlockTile</div><div class="ttdoc">Shape of GEMM thread block tile (K, N, M) </div><div class="ttdef"><b>Definition:</b> gemm_operand.h:70</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmMultiplicandTraits_html_a89f1d9599b418c8bb81c104ca86cf00e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e">cutlass::gemm::GemmMultiplicandTraits::Shape</a></div><div class="ttdeci">platform::conditional&lt; kKstrided, Shape&lt; 1, ThreadBlockTile::kD, GetExtent&lt; Usage, ThreadBlockTile &gt;::kExtent &gt;, Shape&lt; 1, GetExtent&lt; Usage, ThreadBlockTile &gt;::kExtent, ThreadBlockTile::kD &gt; &gt;::type Shape</div><div class="ttdoc">Map the ThreadBlockShape onto (kH, kW) dimensions for A and B operand. </div><div class="ttdef"><b>Definition:</b> gemm_operand.h:88</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmMultiplicandTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">cutlass::gemm::GemmMultiplicandTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_operand.h:67</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmOperandTraitsAb_html_abe4eb7f9a0ed7d48a81029e88849dcf2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html#abe4eb7f9a0ed7d48a81029e88849dcf2">cutlass::gemm::GemmOperandTraitsAb::Congruous</a></div><div class="ttdeci">static const bool Congruous</div><div class="ttdef"><b>Definition:</b> gemm_operand.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1conditional_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional.html">cutlass::platform::conditional</a></div><div class="ttdoc">std::conditional (true specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:343</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1conditional_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional.html">cutlass::platform::conditional</a></div><div class="ttdoc">std::conditional (true specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:351</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmMultiplicandTraits_html_a19076e58e60d296da74cf504e2a473fd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd">cutlass::gemm::GemmMultiplicandTraits::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">Layout of tile. </div><div class="ttdef"><b>Definition:</b> gemm_operand.h:79</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4_html_ae91b2350374f1734a30cbed45e14b8e3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html#ae91b2350374f1734a30cbed45e14b8e3">cutlass::gemm::ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;::project</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; project(Coord&lt; 3 &gt; const &amp;coord)</div><div class="ttdef"><b>Definition:</b> gemm_operand.h:102</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ProjectOperand_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ProjectOperand.html">cutlass::gemm::ProjectOperand</a></div><div class="ttdef"><b>Definition:</b> gemm_operand.h:96</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GetExtent_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GetExtent.html">cutlass::gemm::GetExtent</a></div><div class="ttdef"><b>Definition:</b> gemm_operand.h:50</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:48</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html">cutlass::GemmOperand</a></div><div class="ttdoc">Gemm operand - D = A * B + C. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:42</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html">cutlass::GemmOperand</a></div><div class="ttdoc">Gemm operand - D = A * B + C. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:356</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4_html_ace04040ccb13af5f9a283ca80ffe93d1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1">cutlass::gemm::ProjectOperand&lt; GemmOperand::kD, true &gt;::project</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; project(Coord&lt; 3 &gt; const &amp;coord)</div><div class="ttdef"><b>Definition:</b> gemm_operand.h:135</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmMultiplicandTraits_html_a962ffde3b3db78792b67dd1f57ab0a05"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a962ffde3b3db78792b67dd1f57ab0a05">cutlass::gemm::GemmMultiplicandTraits::kUsage</a></div><div class="ttdeci">static GemmOperand::Kind const kUsage</div><div class="ttdoc">Identifies multiplicand. </div><div class="ttdef"><b>Definition:</b> gemm_operand.h:76</div></div>
 <div class="ttc" id="matrix__traits_8h_html"><div class="ttname"><a href="matrix__traits_8h.html">matrix_traits.h</a></div><div class="ttdoc">Defines properties of matrices used to denote layout and operands to GEMM kernels. </div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmOperandTraitsAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html">cutlass::gemm::GemmOperandTraitsAb</a></div><div class="ttdoc">Helper to describe attributes of GEMM matrix operands. </div><div class="ttdef"><b>Definition:</b> gemm_operand.h:42</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__shared__stream_8h.html b/docs/gemm__shared__stream_8h.html
index 314df24b7..55312ff8e 100644
--- a/docs/gemm__shared__stream_8h.html
+++ b/docs/gemm__shared__stream_8h.html
@@ -82,7 +82,8 @@ $(function() {
 
 <p>Defines abstractions for managing loading and storing fragments to shared memory in the efficient GEMM pipeline.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="tensor__ref_8h_source.html">cutlass/tensor_ref.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</code><br />
 </div>
 <p><a href="gemm__shared__stream_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -104,7 +105,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__shared__stream_8h_source.html b/docs/gemm__shared__stream_8h_source.html
index 8a0ec9da8..eadc63d24 100644
--- a/docs/gemm__shared__stream_8h_source.html
+++ b/docs/gemm__shared__stream_8h_source.html
@@ -76,35 +76,42 @@ $(function() {
 <div class="title">gemm_shared_stream.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="gemm__shared__stream_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;    <span class="keyword">typename</span> Iterator_,</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;    <span class="keyword">typename</span> Transformer_ = Copy&lt;typename Iterator_::Fragment&gt; &gt;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">   44</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a> {</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">   46</a></span>&#160;  <span class="keyword">typedef</span> Iterator_ <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">Iterator</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">   48</a></span>&#160;  <span class="keyword">typedef</span> Transformer_ <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">Transformer</a>;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">   51</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::Fragment <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a>;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">   53</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Transformer::OutputFragment <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a>;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;FetchedFragment, typename Transformer::InputFragment&gt;::value</a>),</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">   56</a></span>&#160;                <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">Fragment</a>;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">   61</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> {</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">   63</a></span>&#160;    <span class="keyword">typename</span> Iterator::Params <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">iterator</a>;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a">   66</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a">initialize</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">iterator</a>.initialize(); }</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  };</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">   70</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::Storage <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a>;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">   73</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">SharedLoadStream</a>() {}</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a93e9bcdca4ceb68754fb1f73e2b25d25">   76</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a93e9bcdca4ceb68754fb1f73e2b25d25">SharedLoadStream</a>(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;params, <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a> &amp;shared_storage) {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    this-&gt;<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf">initialize</a>(params, shared_storage);</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  }</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf">   81</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;params, <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a> &amp;shared_storage) {</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    <span class="comment">// The iterator.</span></div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a> = <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">Iterator</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">iterator</a>, shared_storage);</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="comment">// The transformer.</span></div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">transformer</a> = <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">Transformer</a>();</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  }</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7f6bf3b8d70bcd74d84519decd9f0d8e">   89</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7f6bf3b8d70bcd74d84519decd9f0d8e">copy</a>(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> &amp;fetched) { <a class="code" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">shared_iterator_load</a>(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a>, fetched); }</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a279144e9722055d4b862e3fa25948762">   92</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a279144e9722055d4b862e3fa25948762">copy</a>(<span class="keywordtype">int</span> d, <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> &amp;fetched) {</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    <a class="code" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">shared_iterator_load</a>(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a>, fetched, d);</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  }</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9cc435369c7fc76d0bb6233a8258e257">   97</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9cc435369c7fc76d0bb6233a8258e257">commit</a>(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> &amp;fetched, <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> &amp;transformed) {</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">transformer</a>.transform(fetched, transformed);</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  }</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">  102</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">inc_stage</a>() { <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a>.inc_stage(); }</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">  105</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">Iterator</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a>;</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">  107</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">Transformer</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">transformer</a>;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;};</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a7f6bf3b8d70bcd74d84519decd9f0d8e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7f6bf3b8d70bcd74d84519decd9f0d8e">cutlass::gemm::SharedLoadStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy(FetchedFragment &amp;fetched)</div><div class="ttdoc">Load the data from shared memory to the fetch fragment. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:89</div></div>
+<a href="gemm__shared__stream_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tensor__ref_8h.html">cutlass/tensor_ref.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;    <span class="keyword">typename</span> Iterator_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;    <span class="keyword">typename</span> Transformer_ = Copy&lt;typename Iterator_::Fragment&gt; &gt;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">   45</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a> {</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">   47</a></span>&#160;  <span class="keyword">typedef</span> Iterator_ <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">Iterator</a>;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">   49</a></span>&#160;  <span class="keyword">typedef</span> Transformer_ <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">Transformer</a>;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">   52</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::Fragment <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a>;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">   54</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Transformer::OutputFragment <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a>;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;FetchedFragment, typename Transformer::InputFragment&gt;::value</a>),</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">   57</a></span>&#160;                <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">Fragment</a>;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">   61</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::Scalar <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">Scalar</a>;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">   64</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef&lt;Scalar, 4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a>;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">   67</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> {</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">   69</a></span>&#160;    <span class="keyword">typename</span> Iterator::Params <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">iterator</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a">   72</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a">initialize</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">iterator</a>.initialize(); }</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  };</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">   76</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::Storage <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a>;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">   79</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">SharedLoadStream</a>() {}</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad2f619712c817f91d62a13db0476a627">   82</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad2f619712c817f91d62a13db0476a627">SharedLoadStream</a>(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;params, <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a> <span class="keyword">const</span> &amp;ref) {</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    this-&gt;<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0">initialize</a>(params, ref);</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  }</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0">   87</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;params, <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a> <span class="keyword">const</span> &amp;ref) {</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    <span class="comment">// The iterator.</span></div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a> = <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">Iterator</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">iterator</a>, ref.data());</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    <span class="comment">// The transformer.</span></div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">transformer</a> = <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">Transformer</a>();</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  }</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a4b919d229e259909efbf994ff2c09339">   95</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a4b919d229e259909efbf994ff2c09339">copy</a>() { <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a>.load_post_increment(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">fetched</a>[0]); }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a99039d115a539fc99e2235c12ac57eed">   98</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a99039d115a539fc99e2235c12ac57eed">copy</a>(<span class="keywordtype">int</span> step) { <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a>.load(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">fetched</a>[step % 2], step); }</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa3aa987bf0fd6303e06f46e2f54e47e4">  101</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa3aa987bf0fd6303e06f46e2f54e47e4">commit</a>() { <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">transformer</a>.transform(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">fetched</a>[0], <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">transformed</a>[0]); }</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6be479189765a1803ceced424561466b">  104</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6be479189765a1803ceced424561466b">commit</a>(<span class="keywordtype">int</span> step) {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">transformer</a>.transform(<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">fetched</a>[step % 2], <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">transformed</a>[step % 2]);</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  }</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad5cb076de46e841a165bd43924dab463">  109</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> &amp;<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad5cb076de46e841a165bd43924dab463">fragment</a>(<span class="keywordtype">int</span> step = 0) { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">transformed</a>[step % 2]; }</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a30e815fcee63b5a99b2797464b6a3192">  112</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> <span class="keyword">const</span> &amp;<a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a30e815fcee63b5a99b2797464b6a3192">fragment</a>(<span class="keywordtype">int</span> step = 0)<span class="keyword"> const </span>{</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">transformed</a>[step % 2];</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  }</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">  117</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">inc_stage</a>() { <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a>.inc_stage(); }</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">  120</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">Iterator</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a>;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">  122</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">fetched</a>[2];</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">  124</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">Transformer</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">transformer</a>;</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">  126</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">transformed</a>[2];</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;};</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_aa3aa987bf0fd6303e06f46e2f54e47e4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa3aa987bf0fd6303e06f46e2f54e47e4">cutlass::gemm::SharedLoadStream::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit()</div><div class="ttdoc">Commit the data. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:101</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="namespacecutlass_html_abcec976c59cab75ca55b338d125154a3"><div class="ttname"><a href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">cutlass::shared_iterator_load</a></div><div class="ttdeci">CUTLASS_DEVICE void shared_iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment from a shared memory input iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:75</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a8e4d277325bb5e56c718a2298b60d3cf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf">cutlass::gemm::SharedLoadStream::initialize</a></div><div class="ttdeci">CUTLASS_DEVICE void initialize(Params const &amp;params, SharedStorage &amp;shared_storage)</div><div class="ttdoc">Initialize the stream. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:81</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:412</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a22c671494d487511c71f2b0f26fdb404"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">cutlass::gemm::SharedLoadStream::SharedStorage</a></div><div class="ttdeci">Iterator::Storage SharedStorage</div><div class="ttdoc">The storage in shared memory needed by that stream. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a9cc435369c7fc76d0bb6233a8258e257"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9cc435369c7fc76d0bb6233a8258e257">cutlass::gemm::SharedLoadStream::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit(FetchedFragment &amp;fetched, TransformedFragment &amp;transformed)</div><div class="ttdoc">Commit the data. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:97</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_acf22fd09aa537943c16b900d66f1ec6f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">cutlass::gemm::SharedLoadStream::inc_stage</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_stage()</div><div class="ttdoc">Increment the stage. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:102</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a6e097738679436d580e8dc6ac70efaad"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">cutlass::gemm::SharedLoadStream::SharedLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE SharedLoadStream()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:73</div></div>
+<div class="ttc" id="tensor__ref_8h_html"><div class="ttname"><a href="tensor__ref_8h.html">tensor_ref.h</a></div><div class="ttdoc">Defines a structure containing strides, bounds, and a pointer to tensor data. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a8ae6f60b5fb3642542a6cb833d83c8e4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">cutlass::gemm::SharedLoadStream::fetched</a></div><div class="ttdeci">FetchedFragment fetched[2]</div><div class="ttdoc">Fetched fragment. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:122</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:420</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a6be479189765a1803ceced424561466b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6be479189765a1803ceced424561466b">cutlass::gemm::SharedLoadStream::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit(int step)</div><div class="ttdoc">Commit the data. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:104</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a22c671494d487511c71f2b0f26fdb404"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">cutlass::gemm::SharedLoadStream::SharedStorage</a></div><div class="ttdeci">Iterator::Storage SharedStorage</div><div class="ttdoc">The storage in shared memory needed by that stream. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_acf22fd09aa537943c16b900d66f1ec6f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">cutlass::gemm::SharedLoadStream::inc_stage</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_stage()</div><div class="ttdoc">Increment the stage. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:117</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_aff5202428b0e7207456c97204d4d219a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">cutlass::gemm::SharedLoadStream::TensorRef</a></div><div class="ttdeci">TensorRef&lt; Scalar, 4 &gt; TensorRef</div><div class="ttdoc">Reference type to a tensor. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a6e097738679436d580e8dc6ac70efaad"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">cutlass::gemm::SharedLoadStream::SharedLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE SharedLoadStream()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:79</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a7583af38ca0fb446882b28c0e2dcae88"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">cutlass::gemm::SharedLoadStream::transformed</a></div><div class="ttdeci">TransformedFragment transformed[2]</div><div class="ttdoc">Transformed fragment. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:126</div></div>
 <div class="ttc" id="gemm__shared__tile_8h_html"><div class="ttname"><a href="gemm__shared__tile_8h.html">gemm_shared_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing tiles to and from shared memory. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:44</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_af846390ad0e5b80ccb4e8b95c5fe64a7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">cutlass::gemm::SharedLoadStream::transformer</a></div><div class="ttdeci">Transformer transformer</div><div class="ttdoc">The transformer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:107</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a9f025ed2609bf33230f6a390c22b11b7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">cutlass::gemm::SharedLoadStream::Fragment</a></div><div class="ttdeci">TransformedFragment Fragment</div><div class="ttdoc">Make sure the fragments match. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:56</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:45</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a30e815fcee63b5a99b2797464b6a3192"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a30e815fcee63b5a99b2797464b6a3192">cutlass::gemm::SharedLoadStream::fragment</a></div><div class="ttdeci">CUTLASS_DEVICE TransformedFragment const  &amp; fragment(int step=0) const</div><div class="ttdoc">Returns the fragment for the given step. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:112</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_af846390ad0e5b80ccb4e8b95c5fe64a7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">cutlass::gemm::SharedLoadStream::transformer</a></div><div class="ttdeci">Transformer transformer</div><div class="ttdoc">The transformer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:124</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a9f025ed2609bf33230f6a390c22b11b7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">cutlass::gemm::SharedLoadStream::Fragment</a></div><div class="ttdeci">TransformedFragment Fragment</div><div class="ttdoc">Make sure the fragments match. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:57</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a279144e9722055d4b862e3fa25948762"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a279144e9722055d4b862e3fa25948762">cutlass::gemm::SharedLoadStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy(int d, FetchedFragment &amp;fetched)</div><div class="ttdoc">Load the data from shared memory to the fetch fragment. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:92</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params_html_ae59f871c06a0ac7b9224f0de923082d7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">cutlass::gemm::SharedLoadStream::Params::iterator</a></div><div class="ttdeci">Iterator::Params iterator</div><div class="ttdoc">The iterator params. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:63</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a54481a42d4125e3693a086269d9a7b10"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">cutlass::gemm::SharedLoadStream::iterator</a></div><div class="ttdeci">Iterator iterator</div><div class="ttdoc">The iterator. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:105</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params_html_adb66103b905b35a1594c6f0bab65758a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a">cutlass::gemm::SharedLoadStream::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:66</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_aa2227d7fa1edef3f6730c7db41b132b4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">cutlass::gemm::SharedLoadStream::TransformedFragment</a></div><div class="ttdeci">Transformer::OutputFragment TransformedFragment</div><div class="ttdoc">The fragment that is obtained after the transformation by the transformer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:53</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">cutlass::gemm::SharedLoadStream::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:61</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a41b45085f17532a6394de3f5ccf201e7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">cutlass::gemm::SharedLoadStream::FetchedFragment</a></div><div class="ttdeci">Iterator::Fragment FetchedFragment</div><div class="ttdoc">The fragment that is copied from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:51</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_ad1f70f0dd1027da1353ff7a38f524904"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">cutlass::gemm::SharedLoadStream::Transformer</a></div><div class="ttdeci">Transformer_ Transformer</div><div class="ttdoc">The transformer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:48</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a6925270c4ad157554ab155cddc7b46e6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">cutlass::gemm::SharedLoadStream::Iterator</a></div><div class="ttdeci">Iterator_ Iterator</div><div class="ttdoc">The load iterator. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a93e9bcdca4ceb68754fb1f73e2b25d25"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a93e9bcdca4ceb68754fb1f73e2b25d25">cutlass::gemm::SharedLoadStream::SharedLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE SharedLoadStream(Params const &amp;params, SharedStorage &amp;shared_storage)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:76</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params_html_ae59f871c06a0ac7b9224f0de923082d7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7">cutlass::gemm::SharedLoadStream::Params::iterator</a></div><div class="ttdeci">Iterator::Params iterator</div><div class="ttdoc">The iterator params. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a54481a42d4125e3693a086269d9a7b10"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">cutlass::gemm::SharedLoadStream::iterator</a></div><div class="ttdeci">Iterator iterator</div><div class="ttdoc">The iterator. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:120</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params_html_adb66103b905b35a1594c6f0bab65758a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a">cutlass::gemm::SharedLoadStream::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:72</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_aa2227d7fa1edef3f6730c7db41b132b4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">cutlass::gemm::SharedLoadStream::TransformedFragment</a></div><div class="ttdeci">Transformer::OutputFragment TransformedFragment</div><div class="ttdoc">The fragment that is obtained after the transformation by the transformer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:54</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_ad2f619712c817f91d62a13db0476a627"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad2f619712c817f91d62a13db0476a627">cutlass::gemm::SharedLoadStream::SharedLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE SharedLoadStream(Params const &amp;params, TensorRef const &amp;ref)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:82</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_ad5cb076de46e841a165bd43924dab463"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad5cb076de46e841a165bd43924dab463">cutlass::gemm::SharedLoadStream::fragment</a></div><div class="ttdeci">CUTLASS_DEVICE TransformedFragment &amp; fragment(int step=0)</div><div class="ttdoc">Returns the fragment for the given step. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:109</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a99039d115a539fc99e2235c12ac57eed"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a99039d115a539fc99e2235c12ac57eed">cutlass::gemm::SharedLoadStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy(int step)</div><div class="ttdoc">Load the data from shared memory to the fetch fragment. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:98</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">cutlass::gemm::SharedLoadStream::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:67</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a9b62788c187fff49b0250c0070a41fa0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0">cutlass::gemm::SharedLoadStream::initialize</a></div><div class="ttdeci">CUTLASS_DEVICE void initialize(Params const &amp;params, TensorRef const &amp;ref)</div><div class="ttdoc">Initialize the stream. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:87</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a5da116ae7e3f8ac2168bcf9bb964a429"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">cutlass::gemm::SharedLoadStream::Scalar</a></div><div class="ttdeci">Iterator::Scalar Scalar</div><div class="ttdoc">Scalar data type. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:61</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a41b45085f17532a6394de3f5ccf201e7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">cutlass::gemm::SharedLoadStream::FetchedFragment</a></div><div class="ttdeci">Iterator::Fragment FetchedFragment</div><div class="ttdoc">The fragment that is copied from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_ad1f70f0dd1027da1353ff7a38f524904"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">cutlass::gemm::SharedLoadStream::Transformer</a></div><div class="ttdeci">Transformer_ Transformer</div><div class="ttdoc">The transformer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:49</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a6925270c4ad157554ab155cddc7b46e6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">cutlass::gemm::SharedLoadStream::Iterator</a></div><div class="ttdeci">Iterator_ Iterator</div><div class="ttdoc">The load iterator. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:47</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html_a4b919d229e259909efbf994ff2c09339"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a4b919d229e259909efbf994ff2c09339">cutlass::gemm::SharedLoadStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy()</div><div class="ttdoc">Load the data from shared memory to the fetch fragment. </div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:95</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__shared__tile_8h.html b/docs/gemm__shared__tile_8h.html
index cf63242a3..bb3cd6876 100644
--- a/docs/gemm__shared__tile_8h.html
+++ b/docs/gemm__shared__tile_8h.html
@@ -82,7 +82,7 @@ $(function() {
 
 <p>Defines iterators for efficiently loading and storing tiles to and from shared memory.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="gemm__operand_8h_source.html">cutlass/gemm/gemm_operand.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="gemm__operand_8h_source.html">cutlass/gemm/gemm_operand.h</a>&quot;</code><br />
 </div>
 <p><a href="gemm__shared__tile_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -127,7 +127,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__shared__tile_8h_source.html b/docs/gemm__shared__tile_8h_source.html
index 7fe9d1fff..7f572ff54 100644
--- a/docs/gemm__shared__tile_8h_source.html
+++ b/docs/gemm__shared__tile_8h_source.html
@@ -76,137 +76,138 @@ $(function() {
 <div class="title">gemm_shared_tile.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="gemm__shared__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__operand_8h.html">cutlass/gemm/gemm_operand.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kScalarsPerSts_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a8b04fd003fc2db46d749360e8838438b">   40</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a8b04fd003fc2db46d749360e8838438b">Scalar</a>;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00">   42</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00">Pointer</a>;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7">   44</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;Tile_, kScalarsPerSts_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7">Tile</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2">   46</a></span>&#160;  <span class="keyword">typedef</span> Threads_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2">Threads</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1">   48</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, ShapeCount&lt;Tile&gt;::kWc</a>, Tile::kC, kScalarsPerSts_&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1">ThreadsStrides</a>;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ace14ca9ad11e2cdafcd4a4b63c0df591">   50</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ace14ca9ad11e2cdafcd4a4b63c0df591">kSkew</a> = 0;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">   52</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">kAccessSize</a> = kScalarsPerSts_;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab">   54</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1,</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;                Tile::kH / Threads::kH,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                Tile::kW / Threads::kW,</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                Tile::kC / Threads::kC / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">kAccessSize</a>&gt;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b">   61</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b">Iterations</a>;</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224">   63</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, Threads::kH * ShapeCount&lt;Tile&gt;::kWc</a>, Threads::kW * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224">Delta</a>;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, Threads::kH * ShapeCount&lt;Tile&gt;::kWc</a>, Threads::kW * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">kAccessSize</a>&gt;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7">   66</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html">   68</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html#a1e357fe5bc1daef333e6be776a21a2ca">   70</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html#a1e357fe5bc1daef333e6be776a21a2ca">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;      <span class="keywordtype">int</span> offset = <a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">ComputeThreadOffsetFromStrides&lt;Threads, ThreadsStrides&gt;::get</a>();</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    }</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  };</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;};</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kScalarsPerSts_, <span class="keywordtype">int</span> kSkew_&gt;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">   80</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a> {</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aaa439a0bb6b9de5e2722ea7b011effea">   82</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aaa439a0bb6b9de5e2722ea7b011effea">Scalar</a>;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4">   84</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4">Pointer</a>;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a050cf5964a2d3683491bc4313ead5450">   86</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;Tile_, kScalarsPerSts_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a050cf5964a2d3683491bc4313ead5450">TileWithoutSkew</a>;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html">ReshapeTile&lt;Shape&lt;Tile_::kD, Tile_::kH, Tile_::kW + kSkew_&gt;</a>,</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471">   89</a></span>&#160;                               kScalarsPerSts_&gt;<a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471">::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471">Tile</a>;</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06">   91</a></span>&#160;  <span class="keyword">typedef</span> Threads_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06">Threads</a>;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aba6decf87d770becaadd610d9fc27491">   93</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aba6decf87d770becaadd610d9fc27491">kSkew</a> = kSkew_;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">   95</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">kAccessSize</a> = kScalarsPerSts_;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20">   97</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea">  100</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, TileWithoutSkew::kH / Threads::kW, TileWithoutSkew::kW / Threads::kH&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea">Iterations</a>;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71">  102</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, ShapeCount&lt;Tile&gt;::kWc</a>, Threads::kH * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71">Delta</a>;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614">  104</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, ShapeCount&lt;Tile&gt;::kWc</a>, Threads::kH * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html">  106</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726">  108</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;      <span class="keywordtype">int</span> offset = <a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">ComputeThreadOffsetFromStrides&lt;Threads, ThreadsStrides&gt;::get</a>();</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    }</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  };</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160; <span class="keyword">protected</span>:</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29">  116</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, kScalarsPerSts_, ShapeCount&lt;Tile&gt;::kHwc</a> / Threads::kW&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29">ThreadsStrides</a>;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;};</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;          <span class="keyword">typename</span> InstructionShape_,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;          <span class="keywordtype">int</span> kStages_,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;          <span class="keywordtype">int</span> kScalarsPerLds_,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00129"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">  129</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a> {</div><div class="line"><a name="l00130"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851">  130</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851">kOperand</a> = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>;</div><div class="line"><a name="l00132"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14">  132</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14">Scalar</a>;</div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864">  134</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864">Pointer</a>;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;kStages_,</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;                OutputTile_::kD / InstructionShape_::kD,</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;                <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, OutputTile_&gt;::kExtent</a> * InstructionShape_::kD&gt;</div><div class="line"><a name="l00139"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a93ae99460695718babaef6d1ef597e38">  139</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a93ae99460695718babaef6d1ef597e38">TileWithoutSkew_</a>;</div><div class="line"><a name="l00141"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a72e0214f86cf8b3711d006dcd69d7a17">  141</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;kStages_, TileWithoutSkew_::kH, TileWithoutSkew_::kW + kSkew_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a72e0214f86cf8b3711d006dcd69d7a17">TileWithSkew</a>;</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213">  143</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;TileWithoutSkew_, kScalarsPerLds_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213">TileWithoutSkew</a>;</div><div class="line"><a name="l00145"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc">  145</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;TileWithSkew, kScalarsPerLds_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc">Tile</a>;</div><div class="line"><a name="l00147"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4">  147</a></span>&#160;  <span class="keyword">typedef</span> Warps_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4">Warps</a>;</div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f">  149</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f">ThreadsPerWarp</a>;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  <span class="comment">// static int const kScalarsPerLds = kScalarsPerLds_;</span></div><div class="line"><a name="l00152"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">  152</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a> = kScalarsPerLds_;</div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaffe67e519e919bf561142e05da6e6c8">  154</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaffe67e519e919bf561142e05da6e6c8">kSkew</a> = kSkew_;</div><div class="line"><a name="l00156"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5">  156</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">  159</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> = <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, Warps&gt;::kExtent</a>;</div><div class="line"><a name="l00161"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">  161</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> = <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, ThreadsPerWarp&gt;::kExtent</a>;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, TileWithoutSkew::kW / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> <span class="comment">/* / kScalarsPerLds*/</span>&gt;</div><div class="line"><a name="l00165"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">  165</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">Iterations</a>;</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea">  167</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;TileWithSkew::kW, 0, kWarps * kThreadsPerWarp * kAccessSize, 0&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea">Delta</a>;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;TileWithSkew::kW, 0, kWarps * kThreadsPerWarp * kAccessSize, 0&gt;</a></div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368">  170</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html">  173</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00175"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410">  175</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;      <span class="comment">// Extract the warp.</span></div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize % Warps::kW;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      <span class="comment">// Compute the row offset for each thread</span></div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> lane = (threadIdx.x &amp; 0x0e) / 2;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = (warp * ThreadsPerWarp::kW + lane) * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    }</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;  };</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;};</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;          <span class="keyword">typename</span> InstructionShape_,</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;          <span class="keywordtype">int</span> kStages_,</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;          <span class="keywordtype">int</span> kScalarsPerLds_,</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">  198</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a> {</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4">  199</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4">kOperand</a> = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73">  201</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73">Scalar</a>;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182">  203</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182">Pointer</a>;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;kStages_,</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;                OutputTile_::kD / InstructionShape_::kD,</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;                <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, OutputTile_&gt;::kExtent</a> * InstructionShape_::kD&gt;</div><div class="line"><a name="l00208"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a3d8be9ddea1cab53d1b4b3d508f9eab8">  208</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a3d8be9ddea1cab53d1b4b3d508f9eab8">TileWithoutSkew_</a>;</div><div class="line"><a name="l00210"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a69c7ec2a779718556e6d9119588e791c">  210</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;kStages_, TileWithoutSkew_::kH, TileWithoutSkew_::kW + kSkew_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a69c7ec2a779718556e6d9119588e791c">TileWithSkew</a>;</div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a1f35981a6d661635dfbcf7c7a76056a2">  212</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;TileWithoutSkew_, kScalarsPerLds_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a1f35981a6d661635dfbcf7c7a76056a2">TileWithoutSkew</a>;</div><div class="line"><a name="l00214"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4">  214</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;TileWithSkew, kScalarsPerLds_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4">Tile</a>;</div><div class="line"><a name="l00216"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b">  216</a></span>&#160;  <span class="keyword">typedef</span> Warps_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b">Warps</a>;</div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66">  218</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66">ThreadsPerWarp</a>;</div><div class="line"><a name="l00220"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">  220</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a> = kScalarsPerLds_;</div><div class="line"><a name="l00222"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac9cd90ecd02809060a2fe6e2da4210f9">  222</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac9cd90ecd02809060a2fe6e2da4210f9">kSkew</a> = kSkew_;</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620">  224</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">  227</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> = <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, Warps&gt;::kExtent</a>;</div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">  229</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> = <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, ThreadsPerWarp&gt;::kExtent</a>;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">  232</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, TileWithoutSkew::kW / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> <span class="comment">/* / kAccessSize*/</span>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">Iterations</a>;</div><div class="line"><a name="l00234"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d">  234</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;TileWithSkew::kW, 0, kWarps * kThreadsPerWarp * kAccessSize, 0&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d">Delta</a>;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;TileWithSkew::kW, 0, kWarps * kThreadsPerWarp * kAccessSize, 0&gt;</a></div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03">  237</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;</div><div class="line"><a name="l00240"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html">  240</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00242"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html#a5b4a635a521364357386259b0f84c0ba">  242</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html#a5b4a635a521364357386259b0f84c0ba">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;      <span class="comment">// The position of the warp.</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / (Warps::kW * kWarpSize);</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      <span class="comment">// Compute the column offset for each thread</span></div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> lane = (threadIdx.x &amp; 0x10) / 8 + (threadIdx.x &amp; 0x01);</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = (warp * ThreadsPerWarp::kH + lane) * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>;</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    }</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;  };</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;};</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;          <span class="keywordtype">int</span> kScalarsPerSts_,</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00264"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">  264</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a> {</div><div class="line"><a name="l00266"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">  266</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">Scalar</a>;</div><div class="line"><a name="l00268"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624">  268</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624">Pointer</a>;</div><div class="line"><a name="l00270"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d">  270</a></span>&#160;  <span class="keyword">typedef</span> OutputTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d">OutputTile</a>;</div><div class="line"><a name="l00272"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703">  272</a></span>&#160;  <span class="keyword">typedef</span> Warps_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703">Warps</a>;</div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543">  274</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543">ThreadsPerWarp</a>;</div><div class="line"><a name="l00276"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">  276</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a> = kScalarsPerSts_;</div><div class="line"><a name="l00278"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">  278</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">kSkew</a> = kSkew_;</div><div class="line"><a name="l00280"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39">  280</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">  283</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">kScalarsPerThread</a> = OutputTile_::kW / Warps::kW / ThreadsPerWarp::kW;</div><div class="line"><a name="l00285"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">  285</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">kThreads</a> = <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Warps&gt;::kCount</a> * kWarpSize;</div><div class="line"><a name="l00287"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">  287</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">kScalarsPerRow</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">kThreads</a> / 2 * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">kScalarsPerThread</a> + <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">kSkew</a>;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc">  290</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 2, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">kScalarsPerRow</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc">Tile</a>;</div><div class="line"><a name="l00292"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336">  292</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">kScalarsPerThread</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336">Iterations</a>;</div><div class="line"><a name="l00294"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57">  294</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Warps::kW * ThreadsPerWarp::kW * kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57">Delta</a>;</div><div class="line"><a name="l00296"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4">  296</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Warps::kW * ThreadsPerWarp::kW * kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;</div><div class="line"><a name="l00299"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html">  299</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00301"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6">  301</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;      <span class="comment">// We issue STS.128 in the epilogue to store the accumulators to shared memory. When we use</span></div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;      <span class="comment">// STS.128, we have to guarantee that threads in groups of 8 do not have bank conflicts (i.e</span></div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;      <span class="comment">// they write to different banks).</span></div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;      <span class="comment">// Odd threads go to the second half of shared memory.</span></div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> row = threadIdx.x &amp; 0x01;</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp_id = (threadIdx.x &gt;&gt; 5);</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp_row = (warp_id % Warps::kW);</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp_col = (warp_id / Warps::kW);</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      <span class="keywordtype">int</span> hi_halfwarp_offset = OutputTile::kW * ((threadIdx.x &gt;&gt; 4) &amp; 1);</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;      <span class="keywordtype">int</span> lo_halfwarp_offset = (((threadIdx.x &gt;&gt; 1) &amp; 0x7) + warp_row * ThreadsPerWarp::kW);</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;      <span class="keywordtype">int</span> col = <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a> * lo_halfwarp_offset +</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                warp_col * (ThreadsPerWarp::kH / 2) * OutputTile::kW + hi_halfwarp_offset;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;      <span class="keywordtype">int</span> offset = row * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">kScalarsPerRow</a> + col;</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;    }</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;  };</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;};</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;          <span class="keywordtype">int</span> kTileH_,</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;          <span class="keywordtype">int</span> kScalarsPerLds_,</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00335"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">  335</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a> {</div><div class="line"><a name="l00337"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">  337</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">Scalar</a>;</div><div class="line"><a name="l00339"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920">  339</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920">Pointer</a>;</div><div class="line"><a name="l00341"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">  341</a></span>&#160;  <span class="keyword">typedef</span> OutputTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">OutputTile</a>;</div><div class="line"><a name="l00343"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">  343</a></span>&#160;  <span class="keyword">typedef</span> Warps_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">Warps</a>;</div><div class="line"><a name="l00345"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">  345</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">ThreadsPerWarp</a>;</div><div class="line"><a name="l00347"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">  347</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a> = kScalarsPerLds_;</div><div class="line"><a name="l00349"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf">  349</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf">kSkew</a> = kSkew_;</div><div class="line"><a name="l00351"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8">  351</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div><div class="line"><a name="l00354"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">  354</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">kScalarsPerThread</a> = OutputTile_::kW / Warps::kW / ThreadsPerWarp::kW;</div><div class="line"><a name="l00356"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">  356</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">kThreads</a> = <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Warps&gt;::kCount</a> * kWarpSize;</div><div class="line"><a name="l00358"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">  358</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">kThreads</a> / 2 * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">kScalarsPerThread</a> + <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf">kSkew</a>;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;</div><div class="line"><a name="l00361"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">  361</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 2, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">Tile</a>;</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;  <span class="comment">// Compute the number of iterations per warp in the Tile::kH dimension.</span></div><div class="line"><a name="l00364"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">  364</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">kIterationsInHPerWarp</a> = kTileH_ / <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Warps&gt;::kCount</a>;</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;  <span class="comment">// As shown above, the shared memory tile is composed of 2 rows and each rows is made of</span></div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;  <span class="comment">// kScalarsPerRow. A warp is expected to read from the 1st row, then move to the 2nd row and go</span></div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;  <span class="comment">// back to the 1st row. To model that scheme we define the Iterations shape as Shape&lt;X, 2, ...&gt;.</span></div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;  <span class="comment">// However, in some cases, we have only 1 iteration per warp. In that case, we must define the</span></div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;  <span class="comment">// shape as Shape&lt;1, 1, ...&gt;. The following code does that.</span></div><div class="line"><a name="l00371"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">  371</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">kIterationsInHPerWarp</a> == 1 ? 1 : 2;</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;  <span class="comment">// As soon as we know kIterationsH, it is trivial to compute kIterationsD:</span></div><div class="line"><a name="l00373"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">  373</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">kIterationsInHPerWarp</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a>;</div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;</div><div class="line"><a name="l00376"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47">  376</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a>, OutputTile::kW / kWarpSize / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47">Iterations</a>;</div><div class="line"><a name="l00378"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644">  378</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;OutputTile::kW, kScalarsPerRow, kWarpSize * kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644">Delta</a>;</div><div class="line"><a name="l00380"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8">  380</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;OutputTile::kW, kScalarsPerRow, kWarpSize * kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;</div><div class="line"><a name="l00383"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html">  383</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00385"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422">  385</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;      <span class="comment">// Each warp works on a different column.</span></div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> h = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;      <span class="comment">// Compute the row.</span></div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> w = (threadIdx.x &amp; (kWarpSize - 1)) * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>;</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;      <span class="keywordtype">int</span> offset = 0;</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Iterations::kH</a> == 1) {</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> row = h &amp; 0x1;</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> col = h / 2;</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;        offset = row * <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kWc</a> + col * OutputTile::kW * <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Iterations::kD</a> + w;</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;        offset = h * OutputTile::kW * <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Iterations::kD</a> + w;</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;      }</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;    }</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;  };</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;};</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_a846e6d8d06be0ba6fa41b1431c8ec061"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per STS. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:95</div></div>
-<div class="ttc" id="structcutlass_1_1ComputeThreadOffsetFromStrides_html_a1744bfe277cbe0c642cce4a48c1dd9ad"><div class="ttname"><a href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">cutlass::ComputeThreadOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_DEVICE int get()</div><div class="ttdef"><b>Definition:</b> shape.h:253</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_ac242508ec46db0493a69a589dbfc19e4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4">cutlass::gemm::GemmSharedLoadTileBTraits::Tile</a></div><div class="ttdeci">ReshapeTile&lt; TileWithSkew, kScalarsPerLds_ &gt;::Tile Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:214</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a9a00be672617162c4c7ac94c7d8980cc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc">cutlass::gemm::GemmSharedLoadTileATraits::Tile</a></div><div class="ttdeci">ReshapeTile&lt; TileWithSkew, kScalarsPerLds_ &gt;::Tile Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a1f35981a6d661635dfbcf7c7a76056a2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a1f35981a6d661635dfbcf7c7a76056a2">cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew</a></div><div class="ttdeci">ReshapeTile&lt; TileWithoutSkew_, kScalarsPerLds_ &gt;::Tile TileWithoutSkew</div><div class="ttdoc">The tile without skew after reshaping. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:212</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_afb4687520eff9c6a21c35a5e04f69de8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8">cutlass::gemm::GemmSharedLoadTileDTraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:351</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_abb5fdb164b09c8f74f92278f3d68b95f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">cutlass::gemm::GemmSharedLoadTileDTraits::kScalarsPerThread</a></div><div class="ttdeci">static int const kScalarsPerThread</div><div class="ttdoc">The number of scalars per thread. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:354</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
+<a href="gemm__shared__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__operand_8h.html">cutlass/gemm/gemm_operand.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kScalarsPerSts_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a8b04fd003fc2db46d749360e8838438b">   40</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a8b04fd003fc2db46d749360e8838438b">Scalar</a>;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00">   42</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00">Pointer</a>;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7">   44</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;Tile_, kScalarsPerSts_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7">Tile</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2">   46</a></span>&#160;  <span class="keyword">typedef</span> Threads_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2">Threads</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1">   48</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, ShapeCount&lt;Tile&gt;::kWc</a>, Tile::kC, kScalarsPerSts_&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1">ThreadsStrides</a>;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ace14ca9ad11e2cdafcd4a4b63c0df591">   50</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ace14ca9ad11e2cdafcd4a4b63c0df591">kSkew</a> = 0;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">   52</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">kAccessSize</a> = kScalarsPerSts_;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab">   54</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1,</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;                Tile::kH / Threads::kH,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                Tile::kW / Threads::kW,</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                Tile::kC / Threads::kC / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">kAccessSize</a>&gt;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b">   61</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b">Iterations</a>;</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224">   63</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, Threads::kH * ShapeCount&lt;Tile&gt;::kWc</a>, Threads::kW * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224">Delta</a>;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, Threads::kH * ShapeCount&lt;Tile&gt;::kWc</a>, Threads::kW * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">kAccessSize</a>&gt;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7">   66</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html">   68</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html#a1e357fe5bc1daef333e6be776a21a2ca">   70</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html#a1e357fe5bc1daef333e6be776a21a2ca">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;      <span class="keywordtype">int</span> offset = <a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">ComputeThreadOffsetFromStrides&lt;Threads, ThreadsStrides&gt;::get</a>();</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    }</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  };</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;};</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kScalarsPerSts_, <span class="keywordtype">int</span> kSkew_&gt;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">   80</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a> {</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aaa439a0bb6b9de5e2722ea7b011effea">   82</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aaa439a0bb6b9de5e2722ea7b011effea">Scalar</a>;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4">   84</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4">Pointer</a>;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a050cf5964a2d3683491bc4313ead5450">   86</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;Tile_, kScalarsPerSts_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a050cf5964a2d3683491bc4313ead5450">TileWithoutSkew</a>;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html">ReshapeTile&lt;Shape&lt;Tile_::kD, Tile_::kH, Tile_::kW + kSkew_&gt;</a>,</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471">   89</a></span>&#160;                               kScalarsPerSts_&gt;<a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471">::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471">Tile</a>;</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06">   91</a></span>&#160;  <span class="keyword">typedef</span> Threads_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06">Threads</a>;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aba6decf87d770becaadd610d9fc27491">   93</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aba6decf87d770becaadd610d9fc27491">kSkew</a> = kSkew_;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">   95</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">kAccessSize</a> = kScalarsPerSts_;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20">   97</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea">  100</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, TileWithoutSkew::kH / Threads::kW, TileWithoutSkew::kW / Threads::kH&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea">Iterations</a>;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71">  102</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, ShapeCount&lt;Tile&gt;::kWc</a>, Threads::kH * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71">Delta</a>;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614">  104</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, ShapeCount&lt;Tile&gt;::kWc</a>, Threads::kH * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html">  106</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726">  107</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;      <span class="keywordtype">int</span> offset = <a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">ComputeThreadOffsetFromStrides&lt;Threads, ThreadsStrides&gt;::get</a>();</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    }</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  };</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160; <span class="keyword">protected</span>:</div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29">  115</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, kScalarsPerSts_, ShapeCount&lt;Tile&gt;::kHwc</a> / Threads::kW&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29">ThreadsStrides</a>;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;};</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;          <span class="keyword">typename</span> InstructionShape_,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;          <span class="keywordtype">int</span> kStages_,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;          <span class="keywordtype">int</span> kScalarsPerLds_,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">  128</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a> {</div><div class="line"><a name="l00129"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851">  129</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851">kOperand</a> = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>;</div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14">  131</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14">Scalar</a>;</div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864">  133</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864">Pointer</a>;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;kStages_,</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;                OutputTile_::kD / InstructionShape_::kD,</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;                <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, OutputTile_&gt;::kExtent</a> * InstructionShape_::kD&gt;</div><div class="line"><a name="l00138"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a93ae99460695718babaef6d1ef597e38">  138</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a93ae99460695718babaef6d1ef597e38">TileWithoutSkew_</a>;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a72e0214f86cf8b3711d006dcd69d7a17">  140</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;kStages_, TileWithoutSkew_::kH, TileWithoutSkew_::kW + kSkew_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a72e0214f86cf8b3711d006dcd69d7a17">TileWithSkew</a>;</div><div class="line"><a name="l00142"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213">  142</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;TileWithoutSkew_, kScalarsPerLds_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213">TileWithoutSkew</a>;</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc">  144</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;TileWithSkew, kScalarsPerLds_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc">Tile</a>;</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4">  146</a></span>&#160;  <span class="keyword">typedef</span> Warps_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4">Warps</a>;</div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f">  148</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f">ThreadsPerWarp</a>;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  <span class="comment">// static int const kScalarsPerLds = kScalarsPerLds_;</span></div><div class="line"><a name="l00151"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">  151</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a> = kScalarsPerLds_;</div><div class="line"><a name="l00153"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaffe67e519e919bf561142e05da6e6c8">  153</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaffe67e519e919bf561142e05da6e6c8">kSkew</a> = kSkew_;</div><div class="line"><a name="l00155"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5">  155</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">  158</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> = <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, Warps&gt;::kExtent</a>;</div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">  160</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> = <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, ThreadsPerWarp&gt;::kExtent</a>;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, TileWithoutSkew::kW / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> <span class="comment">/* / kScalarsPerLds*/</span>&gt;</div><div class="line"><a name="l00164"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">  164</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">Iterations</a>;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;TileWithSkew::kW * Warps::kD, 0, kWarps * kThreadsPerWarp * kAccessSize, 0&gt;</a></div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121">  167</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024">  168</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;TileWithSkew::kW * Warps::kD, 0, kWarps * kThreadsPerWarp * kAccessSize, 0&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024">Delta</a>;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html">  171</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410">  172</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;      <span class="comment">// Extract the warp.</span></div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;      <span class="comment">// Extract the slice.</span></div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> slice = warp / (Warps::kH * Warps::kW);</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      <span class="comment">// Compute the row offset for each warp.</span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp_row = warp % Warps::kW;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;      <span class="comment">// Compute the row offset for each thread.</span></div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> lane_row = (threadIdx.x &amp; 0x0e) / 2;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;          slice * Tile::kW * Tile::kC + (warp_row * ThreadsPerWarp::kW + lane_row) * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;      <span class="comment">// Embed the offset in a 4D coordinate vector.</span></div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    }</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  };</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;};</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;          <span class="keyword">typename</span> InstructionShape_,</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;          <span class="keywordtype">int</span> kStages_,</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;          <span class="keywordtype">int</span> kScalarsPerLds_,</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00200"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">  200</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a> {</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4">  201</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4">kOperand</a> = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73">  203</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73">Scalar</a>;</div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182">  205</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182">Pointer</a>;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;kStages_,</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;                OutputTile_::kD / InstructionShape_::kD,</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;                <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, OutputTile_&gt;::kExtent</a> * InstructionShape_::kD&gt;</div><div class="line"><a name="l00210"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a3d8be9ddea1cab53d1b4b3d508f9eab8">  210</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a3d8be9ddea1cab53d1b4b3d508f9eab8">TileWithoutSkew_</a>;</div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a69c7ec2a779718556e6d9119588e791c">  212</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;kStages_, TileWithoutSkew_::kH, TileWithoutSkew_::kW + kSkew_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a69c7ec2a779718556e6d9119588e791c">TileWithSkew</a>;</div><div class="line"><a name="l00214"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a1f35981a6d661635dfbcf7c7a76056a2">  214</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;TileWithoutSkew_, kScalarsPerLds_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a1f35981a6d661635dfbcf7c7a76056a2">TileWithoutSkew</a>;</div><div class="line"><a name="l00216"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4">  216</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;TileWithSkew, kScalarsPerLds_&gt;::Tile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4">Tile</a>;</div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b">  218</a></span>&#160;  <span class="keyword">typedef</span> Warps_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b">Warps</a>;</div><div class="line"><a name="l00220"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66">  220</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66">ThreadsPerWarp</a>;</div><div class="line"><a name="l00222"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">  222</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a> = kScalarsPerLds_;</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac9cd90ecd02809060a2fe6e2da4210f9">  224</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac9cd90ecd02809060a2fe6e2da4210f9">kSkew</a> = kSkew_;</div><div class="line"><a name="l00226"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620">  226</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">  229</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> = <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, Warps&gt;::kExtent</a>;</div><div class="line"><a name="l00231"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">  231</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> = <a class="code" href="structcutlass_1_1gemm_1_1GetExtent.html">GetExtent&lt;kOperand, ThreadsPerWarp&gt;::kExtent</a>;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div><div class="line"><a name="l00234"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">  234</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, TileWithoutSkew::kW / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> <span class="comment">/* / kAccessSize*/</span>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">Iterations</a>;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;TileWithSkew::kW * Warps::kD, 0, kWarps * kThreadsPerWarp * kAccessSize, 0&gt;</a></div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f">  237</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00238"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1">  238</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;TileWithSkew::kW * Warps::kD, 0, kWarps * kThreadsPerWarp * kAccessSize, 0&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1">Delta</a>;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;</div><div class="line"><a name="l00241"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html">  241</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00242"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html#a5b4a635a521364357386259b0f84c0ba">  242</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html#a5b4a635a521364357386259b0f84c0ba">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;      <span class="comment">// Extract the warp.</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      <span class="comment">// Extract the slice.</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> slice = warp / (Warps::kH * Warps::kW);</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="comment">// The warp in the slice.</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp_in_slice = warp % (Warps::kH * Warps::kW);</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="comment">// Compute the row offset for each warp.</span></div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp_col = warp_in_slice / Warps::kW;</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <span class="comment">// Compute the row offset for each thread.</span></div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> lane_col = (threadIdx.x &amp; 0x10) / 8 + (threadIdx.x &amp; 0x01);</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;          slice * Tile::kW * Tile::kC + (warp_col * ThreadsPerWarp::kH + lane_col) * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>;</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      <span class="comment">// Embed the offset in a 4D coordinate.</span></div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    }</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;  };</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;};</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;          <span class="keywordtype">int</span> kScalarsPerSts_,</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00270"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">  270</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a> {</div><div class="line"><a name="l00272"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">  272</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">Scalar</a>;</div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624">  274</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624">Pointer</a>;</div><div class="line"><a name="l00276"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d">  276</a></span>&#160;  <span class="keyword">typedef</span> OutputTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d">OutputTile</a>;</div><div class="line"><a name="l00278"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703">  278</a></span>&#160;  <span class="keyword">typedef</span> Warps_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703">Warps</a>;</div><div class="line"><a name="l00280"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543">  280</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543">ThreadsPerWarp</a>;</div><div class="line"><a name="l00282"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">  282</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a> = kScalarsPerSts_;</div><div class="line"><a name="l00284"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">  284</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">kSkew</a> = kSkew_;</div><div class="line"><a name="l00286"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39">  286</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">  289</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">kScalarsPerThread</a> = OutputTile_::kW / Warps::kW / ThreadsPerWarp::kW;</div><div class="line"><a name="l00291"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">  291</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">kThreads</a> = <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Warps&gt;::kCount</a> * kWarpSize;</div><div class="line"><a name="l00293"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">  293</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">kScalarsPerRow</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">kThreads</a> / 2 * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">kScalarsPerThread</a> + <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">kSkew</a>;</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;</div><div class="line"><a name="l00296"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc">  296</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 2, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">kScalarsPerRow</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc">Tile</a>;</div><div class="line"><a name="l00298"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336">  298</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">kScalarsPerThread</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336">Iterations</a>;</div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57">  300</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Warps::kW * ThreadsPerWarp::kW * kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57">Delta</a>;</div><div class="line"><a name="l00302"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4">  302</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Warps::kW * ThreadsPerWarp::kW * kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;</div><div class="line"><a name="l00305"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html">  305</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00306"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6">  306</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;      <span class="comment">// The warp.</span></div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;      <span class="comment">// The position of the warp in the 2D tile.</span></div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp_row = warp % Warps::kW;</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp_col = warp / Warps::kW;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      <span class="comment">// We assume that the elements are distributed in a warps as 4 columns of 8 elements. The</span></div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;      <span class="comment">// columns are stored in threads col0=[0, 2, 4, 6, 8, 10, 12, 14], col1=[1, 3, 5, 7, .., 15],</span></div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;      <span class="comment">// col2=[16, 18, 20, ..., 30] and col3=[17, 19, ..., 31].</span></div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;      <span class="keywordtype">int</span> hi_halfwarp_offset = ((threadIdx.x &gt;&gt; 4) &amp; 0x1) * OutputTile::kW;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;      <span class="keywordtype">int</span> lo_halfwarp_offset = ((threadIdx.x &gt;&gt; 1) &amp; 0x7) + ThreadsPerWarp::kW * warp_row;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;      <span class="comment">// Odd threads go to the second half of shared memory.</span></div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> row = threadIdx.x &amp; 0x01;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;      <span class="keywordtype">int</span> col = warp_col * (ThreadsPerWarp::kH / 2) * OutputTile::kW +</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;                lo_halfwarp_offset * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">kAccessSize</a> + hi_halfwarp_offset;</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;      <span class="comment">// Embed the offset in a 4D coords.</span></div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, row * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">kScalarsPerRow</a> + col, 0);</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;    }</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;  };</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;};</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;          <span class="keywordtype">int</span> kTileH_,</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;          <span class="keywordtype">int</span> kScalarsPerLds_,</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00339"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">  339</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a> {</div><div class="line"><a name="l00341"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">  341</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Scalar_&gt;::type</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">Scalar</a>;</div><div class="line"><a name="l00343"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920">  343</a></span>&#160;  <span class="keyword">typedef</span> Scalar_* <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920">Pointer</a>;</div><div class="line"><a name="l00345"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">  345</a></span>&#160;  <span class="keyword">typedef</span> OutputTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">OutputTile</a>;</div><div class="line"><a name="l00347"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">  347</a></span>&#160;  <span class="keyword">typedef</span> Warps_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">Warps</a>;</div><div class="line"><a name="l00349"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">  349</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">ThreadsPerWarp</a>;</div><div class="line"><a name="l00351"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">  351</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a> = kScalarsPerLds_;</div><div class="line"><a name="l00353"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf">  353</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf">kSkew</a> = kSkew_;</div><div class="line"><a name="l00355"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8">  355</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;</div><div class="line"><a name="l00358"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">  358</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">kScalarsPerThread</a> = OutputTile_::kW / Warps::kW / ThreadsPerWarp::kW;</div><div class="line"><a name="l00360"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">  360</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">kThreads</a> = <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Warps&gt;::kCount</a> * kWarpSize;</div><div class="line"><a name="l00362"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">  362</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">kThreads</a> / 2 * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">kScalarsPerThread</a> + <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf">kSkew</a>;</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;</div><div class="line"><a name="l00366"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">  366</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 2, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">Tile</a>;</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;  <span class="comment">// Compute the number of iterations per warp in the Tile::kH dimension.</span></div><div class="line"><a name="l00369"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">  369</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">kIterationsInHPerWarp</a> = kTileH_ / <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Warps&gt;::kCount</a>;</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;  <span class="comment">// As explained above, the shared memory tile is composed of 2 rows and each rows is made of</span></div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;  <span class="comment">// kScalarsPerRow. A warp is expected to read from the 1st row, then move to the 2nd row and go</span></div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;  <span class="comment">// back to the 1st row. To model that scheme we define the Iterations shape as Shape&lt;X, 2, ...&gt;.</span></div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;  <span class="comment">// However, in some cases, we have only 1 iteration per warp. In that case, we must define the</span></div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;  <span class="comment">// shape as Shape&lt;1, 1, ...&gt;. The following code does that except that we hijack the kH dimension</span></div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;  <span class="comment">// to keep the number of elements to reduce for split-K.</span></div><div class="line"><a name="l00377"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">  377</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">kIterationsInHPerWarp</a> == 1 ? 1 : 2;</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;  <span class="comment">// As soon as we know kIterationsH, it is trivial to compute kIterationsD:</span></div><div class="line"><a name="l00379"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">  379</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">kIterationsInHPerWarp</a> / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a>;</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;  <span class="comment">// If we have split-K enabled, we have to jump over the elements from the &quot;odd/even&quot; column of</span></div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;  <span class="comment">// threads to grab the other elements.</span></div><div class="line"><a name="l00383"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">  383</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">kSplitK</a> = OutputTile::kW * ThreadsPerWarp::kH / 2 * Warps::kH;</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a>, OutputTile::kW / kWarpSize / <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, Warps::kD&gt;</div><div class="line"><a name="l00387"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd">  387</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd">Iterations</a>;</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;OutputTile::kW, kScalarsPerRow, kWarpSize * kAccessSize, kSplitK&gt;</a></div><div class="line"><a name="l00390"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b">  390</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00392"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">  392</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;OutputTile::kW, kScalarsPerRow, kWarpSize * kAccessSize, kSplitK&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">Delta</a>;</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;</div><div class="line"><a name="l00395"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html">  395</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00396"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422">  396</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;      <span class="comment">// Each warp works on a different column.</span></div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> h = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;      <span class="comment">// Compute the row.</span></div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> w = (threadIdx.x &amp; (kWarpSize - 1)) * <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>;</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;      <span class="keywordtype">int</span> offset = 0;</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Iterations::kH</a> == 1) {</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> row = h &amp; 0x1;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> col = h / 2;</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;        offset = row * <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kWc</a> + col * OutputTile::kW * <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Iterations::kD</a> + w;</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;        offset = h * OutputTile::kW * <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Iterations::kD</a> + w;</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;      }</div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;    }</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;  };</div><div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;};</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;</div><div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_a846e6d8d06be0ba6fa41b1431c8ec061"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per STS. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:95</div></div>
+<div class="ttc" id="structcutlass_1_1ComputeThreadOffsetFromStrides_html_a1744bfe277cbe0c642cce4a48c1dd9ad"><div class="ttname"><a href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">cutlass::ComputeThreadOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_DEVICE int get()</div><div class="ttdef"><b>Definition:</b> shape.h:214</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_ac242508ec46db0493a69a589dbfc19e4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4">cutlass::gemm::GemmSharedLoadTileBTraits::Tile</a></div><div class="ttdeci">ReshapeTile&lt; TileWithSkew, kScalarsPerLds_ &gt;::Tile Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:216</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a9a00be672617162c4c7ac94c7d8980cc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc">cutlass::gemm::GemmSharedLoadTileATraits::Tile</a></div><div class="ttdeci">ReshapeTile&lt; TileWithSkew, kScalarsPerLds_ &gt;::Tile Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:144</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a1f35981a6d661635dfbcf7c7a76056a2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a1f35981a6d661635dfbcf7c7a76056a2">cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew</a></div><div class="ttdeci">ReshapeTile&lt; TileWithoutSkew_, kScalarsPerLds_ &gt;::Tile TileWithoutSkew</div><div class="ttdoc">The tile without skew after reshaping. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:214</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_afb4687520eff9c6a21c35a5e04f69de8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8">cutlass::gemm::GemmSharedLoadTileDTraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:355</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_abb5fdb164b09c8f74f92278f3d68b95f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">cutlass::gemm::GemmSharedLoadTileDTraits::kScalarsPerThread</a></div><div class="ttdeci">static int const kScalarsPerThread</div><div class="ttdoc">The number of scalars per thread. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:358</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset_html_a5b4a635a521364357386259b0f84c0ba"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html#a5b4a635a521364357386259b0f84c0ba">cutlass::gemm::GemmSharedLoadTileBTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:242</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a27bc06b72a94e34d5da6fbfb950459b5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">cutlass::gemm::GemmSharedLoadTileBTraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, 1, TileWithoutSkew::kW/kWarps/kThreadsPerWarp &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:232</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a27bc06b72a94e34d5da6fbfb950459b5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">cutlass::gemm::GemmSharedLoadTileBTraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, 1, TileWithoutSkew::kW/kWarps/kThreadsPerWarp &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:234</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a8b8d6a26a29d5477f526d9ce8c27e3e2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">cutlass::gemm::GemmSharedLoadTileBTraits::kWarps</a></div><div class="ttdeci">static int const kWarps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:227</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:129</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a8b8d6a26a29d5477f526d9ce8c27e3e2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">cutlass::gemm::GemmSharedLoadTileBTraits::kWarps</a></div><div class="ttdeci">static int const kWarps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:229</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:128</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_a5be0c995c57faafaad7ae55ae015fc00"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00">cutlass::gemm::GemmSharedStoreTileAbTraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:42</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:80</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_af1c981ec89a9cabaf5d34231d51a029c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">cutlass::gemm::GemmSharedStoreTileDTraits::kScalarsPerRow</a></div><div class="ttdeci">static int const kScalarsPerRow</div><div class="ttdoc">The number of scalars per row. We build a tile with 2 rows (to avoid bank conflicts). </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:287</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html_ac3662947fa50251daf58240a9c798085"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">cutlass::platform::remove_const::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:369</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a1b6956adc65254202864520b668edd14"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14">cutlass::gemm::GemmSharedLoadTileATraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:132</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_af1c981ec89a9cabaf5d34231d51a029c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c">cutlass::gemm::GemmSharedStoreTileDTraits::kScalarsPerRow</a></div><div class="ttdeci">static int const kScalarsPerRow</div><div class="ttdoc">The number of scalars per row. We build a tile with 2 rows (to avoid bank conflicts). </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:293</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html_ac3662947fa50251daf58240a9c798085"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">cutlass::platform::remove_const::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:377</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a1b6956adc65254202864520b668edd14"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14">cutlass::gemm::GemmSharedLoadTileATraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:131</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadOffset</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:106</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a6bacc866485330f80596f634e6d14336"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336">cutlass::gemm::GemmSharedStoreTileDTraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, 1, kScalarsPerThread/kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:292</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a8d308d593b59624abe3e228d588be61d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">cutlass::gemm::GemmSharedLoadTileDTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:347</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a0761c497c41a45652368fc0d54def98f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f">cutlass::gemm::GemmSharedLoadTileATraits::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The threads in a warp. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:149</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a6bacc866485330f80596f634e6d14336"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336">cutlass::gemm::GemmSharedStoreTileDTraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, 1, kScalarsPerThread/kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:298</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_adcede218eec980903221feb664cad3a1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1">cutlass::gemm::GemmSharedLoadTileBTraits::Delta</a></div><div class="ttdeci">Shape&lt; TileWithSkew::kW *Warps::kD, 0, kWarps *kThreadsPerWarp *kAccessSize, 0 &gt; Delta</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:238</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a8d308d593b59624abe3e228d588be61d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">cutlass::gemm::GemmSharedLoadTileDTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:351</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a0761c497c41a45652368fc0d54def98f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f">cutlass::gemm::GemmSharedLoadTileATraits::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The threads in a warp. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:148</div></div>
 <div class="ttc" id="structcutlass_1_1ReshapeTile_html"><div class="ttname"><a href="structcutlass_1_1ReshapeTile.html">cutlass::ReshapeTile</a></div><div class="ttdef"><b>Definition:</b> reshape_tile.h:42</div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_ae540e7ea7106552682aa4c97b833b3b1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1">cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadsStrides</a></div><div class="ttdeci">Shape&lt; 0, ShapeCount&lt; Tile &gt;::kWc, Tile::kC, kScalarsPerSts_ &gt; ThreadsStrides</div><div class="ttdoc">The strides to compute the base position of the thread. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:48</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a9521c4017e227b2511891a7fb18513e1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">cutlass::gemm::GemmSharedStoreTileDTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:276</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a81ca35e0c5d9553d1dccc981cbd89d47"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47">cutlass::gemm::GemmSharedLoadTileDTraits::Iterations</a></div><div class="ttdeci">Shape&lt; kIterationsD, kIterationsH, OutputTile::kW/kWarpSize/kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:376</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a7e9ce187e12575f0ecd39b2bfe13dddf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf">cutlass::gemm::GemmSharedLoadTileDTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:349</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a7ad7a4e33ed43926e165e66162eb620b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b">cutlass::gemm::GemmSharedLoadTileBTraits::Warps</a></div><div class="ttdeci">Warps_ Warps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:216</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_ac9cd90ecd02809060a2fe6e2da4210f9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac9cd90ecd02809060a2fe6e2da4210f9">cutlass::gemm::GemmSharedLoadTileBTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:222</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a9521c4017e227b2511891a7fb18513e1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1">cutlass::gemm::GemmSharedStoreTileDTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:282</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a7e9ce187e12575f0ecd39b2bfe13dddf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf">cutlass::gemm::GemmSharedLoadTileDTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:353</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a7ad7a4e33ed43926e165e66162eb620b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b">cutlass::gemm::GemmSharedLoadTileBTraits::Warps</a></div><div class="ttdeci">Warps_ Warps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:218</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_ac9cd90ecd02809060a2fe6e2da4210f9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac9cd90ecd02809060a2fe6e2da4210f9">cutlass::gemm::GemmSharedLoadTileBTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:224</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">cutlass::gemm::GemmSharedStoreTileAbTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:38</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a2a6065e583155b3e389253d3bfb64d73"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73">cutlass::gemm::GemmSharedLoadTileBTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:201</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedLoadTileDTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:383</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:198</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a4456e4c8048bfb378e5b80833a0d19e5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5">cutlass::gemm::GemmSharedLoadTileATraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:156</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a2a6065e583155b3e389253d3bfb64d73"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73">cutlass::gemm::GemmSharedLoadTileBTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:203</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedLoadTileDTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:395</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:200</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a4456e4c8048bfb378e5b80833a0d19e5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5">cutlass::gemm::GemmSharedLoadTileATraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:155</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_a8b04fd003fc2db46d749360e8838438b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a8b04fd003fc2db46d749360e8838438b">cutlass::gemm::GemmSharedStoreTileAbTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:40</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_af511bba9fc2125516eb1442b1c88d851"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851">cutlass::gemm::GemmSharedLoadTileATraits::kOperand</a></div><div class="ttdeci">static GemmOperand::Kind const kOperand</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:130</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a8914bc5154f21fa5fd182b0009c44c39"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39">cutlass::gemm::GemmSharedStoreTileDTraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:280</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:40</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a69c7ec2a779718556e6d9119588e791c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a69c7ec2a779718556e6d9119588e791c">cutlass::gemm::GemmSharedLoadTileBTraits::TileWithSkew</a></div><div class="ttdeci">Shape&lt; kStages_, TileWithoutSkew_::kH, TileWithoutSkew_::kW+kSkew_ &gt; TileWithSkew</div><div class="ttdoc">The tile with skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:210</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a0a33d4289ed45e988d560b5f73ac997e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">cutlass::gemm::GemmSharedLoadTileATraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:152</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_af511bba9fc2125516eb1442b1c88d851"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851">cutlass::gemm::GemmSharedLoadTileATraits::kOperand</a></div><div class="ttdeci">static GemmOperand::Kind const kOperand</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:129</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a8914bc5154f21fa5fd182b0009c44c39"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39">cutlass::gemm::GemmSharedStoreTileDTraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:286</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:39</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a69c7ec2a779718556e6d9119588e791c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a69c7ec2a779718556e6d9119588e791c">cutlass::gemm::GemmSharedLoadTileBTraits::TileWithSkew</a></div><div class="ttdeci">Shape&lt; kStages_, TileWithoutSkew_::kH, TileWithoutSkew_::kW+kSkew_ &gt; TileWithSkew</div><div class="ttdoc">The tile with skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:212</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a0a33d4289ed45e988d560b5f73ac997e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">cutlass::gemm::GemmSharedLoadTileATraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:151</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a3a20d9062bba613c160bb2cd14f80a5e"><div class="ttname"><a href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">cutlass::Shape::kH</a></div><div class="ttdeci">static int const kH</div><div class="ttdoc">The height of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:68</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_a6125e052e47296c3ef53c8a149ffd31b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b">cutlass::gemm::GemmSharedStoreTileAbTraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, Tile::kH/Threads::kH, Tile::kW/Threads::kW, Tile::kC/Threads::kC/kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:61</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_aba6decf87d770becaadd610d9fc27491"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aba6decf87d770becaadd610d9fc27491">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:93</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_ae96e490d38ade6db4d853fb6c8f3378b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">cutlass::gemm::GemmSharedLoadTileATraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, 1, TileWithoutSkew::kW/kWarps/kThreadsPerWarp &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:165</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_ad52b81080731ee1f0d3c2c7eaba6f60d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d">cutlass::gemm::GemmSharedStoreTileDTraits::OutputTile</a></div><div class="ttdeci">OutputTile_ OutputTile</div><div class="ttdoc">The dimension of the output tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:270</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_aa3e378cabce9ed7f199c179c15a12ca4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">cutlass::gemm::GemmSharedLoadTileDTraits::kScalarsPerRow</a></div><div class="ttdeci">static int const kScalarsPerRow</div><div class="ttdoc">The number of scalars per row. We build a tile with 2 rows (to avoid bank conflicts). </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:358</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_afafb3d9ae470c8ef56ec4ca5e66e2182"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182">cutlass::gemm::GemmSharedLoadTileBTraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:203</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_adc4946dfbe914140c6852d0c05b30864"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864">cutlass::gemm::GemmSharedLoadTileATraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:134</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a20471c2f569c28538dad8a220ab25624"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624">cutlass::gemm::GemmSharedStoreTileDTraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:268</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_ae0b53d76096f9d34df6e16280565c7b1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">cutlass::gemm::GemmSharedStoreTileDTraits::kScalarsPerThread</a></div><div class="ttdeci">static int const kScalarsPerThread</div><div class="ttdoc">The number of scalars per thread. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:283</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a9cfb32f902593e7dc018ee802c3520b8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8">cutlass::gemm::GemmSharedLoadTileDTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; OutputTile::kW, kScalarsPerRow, kWarpSize *kAccessSize &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:380</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset_html_a4f9cca16303ac9ae29a0eaa11dcc23b6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6">cutlass::gemm::GemmSharedStoreTileDTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:301</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_ae96e490d38ade6db4d853fb6c8f3378b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">cutlass::gemm::GemmSharedLoadTileATraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, 1, TileWithoutSkew::kW/kWarps/kThreadsPerWarp &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:164</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_ad52b81080731ee1f0d3c2c7eaba6f60d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d">cutlass::gemm::GemmSharedStoreTileDTraits::OutputTile</a></div><div class="ttdeci">OutputTile_ OutputTile</div><div class="ttdoc">The dimension of the output tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:276</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_aa3e378cabce9ed7f199c179c15a12ca4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">cutlass::gemm::GemmSharedLoadTileDTraits::kScalarsPerRow</a></div><div class="ttdeci">static int const kScalarsPerRow</div><div class="ttdoc">The number of scalars per row. We build a tile with 2 rows (to avoid bank conflicts). </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:362</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_afafb3d9ae470c8ef56ec4ca5e66e2182"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182">cutlass::gemm::GemmSharedLoadTileBTraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:205</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_adc4946dfbe914140c6852d0c05b30864"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864">cutlass::gemm::GemmSharedLoadTileATraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:133</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a20471c2f569c28538dad8a220ab25624"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624">cutlass::gemm::GemmSharedStoreTileDTraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:274</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_ae0b53d76096f9d34df6e16280565c7b1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1">cutlass::gemm::GemmSharedStoreTileDTraits::kScalarsPerThread</a></div><div class="ttdeci">static int const kScalarsPerThread</div><div class="ttdoc">The number of scalars per thread. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:289</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset_html_a4f9cca16303ac9ae29a0eaa11dcc23b6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6">cutlass::gemm::GemmSharedStoreTileDTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:306</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a1b33700f904dd15e3533fec15d9d71bd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd">cutlass::gemm::GemmSharedLoadTileDTraits::Iterations</a></div><div class="ttdeci">Shape&lt; kIterationsD, kIterationsH, OutputTile::kW/kWarpSize/kAccessSize, Warps::kD &gt; Iterations</div><div class="ttdoc">The number of iterations needed to store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:387</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_a59c981aa720f983b846bed7c3e4a7cab"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab">cutlass::gemm::GemmSharedStoreTileAbTraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:54</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_ace14ca9ad11e2cdafcd4a4b63c0df591"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ace14ca9ad11e2cdafcd4a4b63c0df591">cutlass::gemm::GemmSharedStoreTileAbTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:50</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a049b0bcdf8c5318ee84edeb1e42eaf78"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">cutlass::gemm::GemmSharedLoadTileBTraits::kThreadsPerWarp</a></div><div class="ttdeci">static int const kThreadsPerWarp</div><div class="ttdoc">The number of threads in one dimension of the warp. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:229</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedLoadTileBTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:240</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a049b0bcdf8c5318ee84edeb1e42eaf78"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">cutlass::gemm::GemmSharedLoadTileBTraits::kThreadsPerWarp</a></div><div class="ttdeci">static int const kThreadsPerWarp</div><div class="ttdoc">The number of threads in one dimension of the warp. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:231</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedLoadTileBTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:241</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_a39414f484da7f993bc96d61c97273614"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; 0, ShapeCount&lt; Tile &gt;::kWc, Threads::kH *kAccessSize &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:104</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a2bc41b907417b47f3dca9c3dd358f8bc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc">cutlass::gemm::GemmSharedStoreTileDTraits::Tile</a></div><div class="ttdeci">Shape&lt; 1, 2, kScalarsPerRow/kAccessSize, kAccessSize &gt; Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:290</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a2bc41b907417b47f3dca9c3dd358f8bc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc">cutlass::gemm::GemmSharedStoreTileDTraits::Tile</a></div><div class="ttdeci">Shape&lt; 1, 2, kScalarsPerRow/kAccessSize, kAccessSize &gt; Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:296</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_ae852c89da0455025c0c41af258e47047"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047">cutlass::gemm::GemmSharedStoreTileAbTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:52</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_ab96f324083e51ce4c2b73c18803c69a7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7">cutlass::gemm::GemmSharedStoreTileAbTraits::Tile</a></div><div class="ttdeci">ReshapeTile&lt; Tile_, kScalarsPerSts_ &gt;::Tile Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:44</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadOffset</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:68</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a4b8d66df02ba1653aa6d1f23b967f237"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">cutlass::gemm::GemmSharedLoadTileDTraits::kIterationsInHPerWarp</a></div><div class="ttdeci">static int const kIterationsInHPerWarp</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:364</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a48baee6541e6359753f1bae5bd864029"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">cutlass::gemm::GemmSharedStoreTileDTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:278</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a5a5a36fc570e1225b20ce0a48c89d213"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213">cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew</a></div><div class="ttdeci">ReshapeTile&lt; TileWithoutSkew_, kScalarsPerLds_ &gt;::Tile TileWithoutSkew</div><div class="ttdoc">The tile without skew after reshaping. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:143</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a4b8d66df02ba1653aa6d1f23b967f237"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">cutlass::gemm::GemmSharedLoadTileDTraits::kIterationsInHPerWarp</a></div><div class="ttdeci">static int const kIterationsInHPerWarp</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:369</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a57b065abb737bee1c17398c90b5bc39b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b">cutlass::gemm::GemmSharedLoadTileDTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; OutputTile::kW, kScalarsPerRow, kWarpSize *kAccessSize, kSplitK &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:390</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a48baee6541e6359753f1bae5bd864029"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">cutlass::gemm::GemmSharedStoreTileDTraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:284</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a5a5a36fc570e1225b20ce0a48c89d213"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213">cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew</a></div><div class="ttdeci">ReshapeTile&lt; TileWithoutSkew_, kScalarsPerLds_ &gt;::Tile TileWithoutSkew</div><div class="ttdoc">The tile without skew after reshaping. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:142</div></div>
 <div class="ttc" id="gemm__operand_8h_html"><div class="ttname"><a href="gemm__operand_8h.html">gemm_operand.h</a></div><div class="ttdoc">Defines constant expressions for mapping GEMM problem size and strides onto pitch-linear memory...</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_a027bebceeda2287b40915ffd95d494a7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7">cutlass::gemm::GemmSharedStoreTileAbTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; 0, Threads::kH *ShapeCount&lt; Tile &gt;::kWc, Threads::kW *kAccessSize &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:66</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a8e767b5e2fb95b0b02a0ea3e8ea58368"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368">cutlass::gemm::GemmSharedLoadTileATraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; TileWithSkew::kW, 0, kWarps *kThreadsPerWarp *kAccessSize, 0 &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:170</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_a74196946c28e98ee60346b0eeede1471"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Tile</a></div><div class="ttdeci">ReshapeTile&lt; Shape&lt; Tile_::kD, Tile_::kH, Tile_::kW+kSkew_ &gt;, kScalarsPerSts_ &gt;::Tile Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:89</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_a2053e4b9cb3ed2727c89960354ea0b29"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadsStrides</a></div><div class="ttdeci">Shape&lt; 0, kScalarsPerSts_, ShapeCount&lt; Tile &gt;::kHwc/Threads::kW &gt; ThreadsStrides</div><div class="ttdoc">The strides to compute the base position of the thread. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:116</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_a2053e4b9cb3ed2727c89960354ea0b29"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadsStrides</a></div><div class="ttdeci">Shape&lt; 0, kScalarsPerSts_, ShapeCount&lt; Tile &gt;::kHwc/Threads::kW &gt; ThreadsStrides</div><div class="ttdoc">The strides to compute the base position of the thread. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:115</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_a050cf5964a2d3683491bc4313ead5450"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a050cf5964a2d3683491bc4313ead5450">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::TileWithoutSkew</a></div><div class="ttdeci">ReshapeTile&lt; Tile_, kScalarsPerSts_ &gt;::Tile TileWithoutSkew</div><div class="ttdoc">The tile without skews. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:86</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a8663311646210b690bb0c2a1012e82f0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">cutlass::gemm::GemmSharedLoadTileDTraits::kIterationsD</a></div><div class="ttdeci">static int const kIterationsD</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:373</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_af78a275086a297bd93aed920f57a17be"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">cutlass::gemm::GemmSharedLoadTileATraits::kWarps</a></div><div class="ttdeci">static int const kWarps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:159</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_adf72ea773b8d4d3eb184f59c8cdf9543"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543">cutlass::gemm::GemmSharedStoreTileDTraits::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The threads in the warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:274</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedLoadTileATraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:173</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a93ae99460695718babaef6d1ef597e38"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a93ae99460695718babaef6d1ef597e38">cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew_</a></div><div class="ttdeci">Shape&lt; kStages_, OutputTile_::kD/InstructionShape_::kD, GetExtent&lt; kOperand, OutputTile_ &gt;::kExtent *InstructionShape_::kD &gt; TileWithoutSkew_</div><div class="ttdoc">The tile without skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:139</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:335</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a8663311646210b690bb0c2a1012e82f0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">cutlass::gemm::GemmSharedLoadTileDTraits::kIterationsD</a></div><div class="ttdeci">static int const kIterationsD</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:379</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a134a02091bf4360d2cbca56624e52024"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024">cutlass::gemm::GemmSharedLoadTileATraits::Delta</a></div><div class="ttdeci">Shape&lt; TileWithSkew::kW *Warps::kD, 0, kWarps *kThreadsPerWarp *kAccessSize, 0 &gt; Delta</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:168</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_af78a275086a297bd93aed920f57a17be"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">cutlass::gemm::GemmSharedLoadTileATraits::kWarps</a></div><div class="ttdeci">static int const kWarps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:158</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_adf72ea773b8d4d3eb184f59c8cdf9543"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543">cutlass::gemm::GemmSharedStoreTileDTraits::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The threads in the warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:280</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedLoadTileATraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:171</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a93ae99460695718babaef6d1ef597e38"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a93ae99460695718babaef6d1ef597e38">cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew_</a></div><div class="ttdeci">Shape&lt; kStages_, OutputTile_::kD/InstructionShape_::kD, GetExtent&lt; kOperand, OutputTile_ &gt;::kExtent *InstructionShape_::kD &gt; TileWithoutSkew_</div><div class="ttdoc">The tile without skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:138</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:339</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_a9bef06b59f27c6e673066a7f0280aa06"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Threads</a></div><div class="ttdeci">Threads_ Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:91</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_acb16feebdcad5bbebe9d4d3383c37899"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">cutlass::gemm::GemmSharedLoadTileDTraits::OutputTile</a></div><div class="ttdeci">OutputTile_ OutputTile</div><div class="ttdoc">The dimension of the output tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:341</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_acb16feebdcad5bbebe9d4d3383c37899"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">cutlass::gemm::GemmSharedLoadTileDTraits::OutputTile</a></div><div class="ttdeci">OutputTile_ OutputTile</div><div class="ttdoc">The dimension of the output tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:345</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_aaa439a0bb6b9de5e2722ea7b011effea"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aaa439a0bb6b9de5e2722ea7b011effea">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:82</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a2ee87510d2deccf8b9633aaa4f6340ea"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea">cutlass::gemm::GemmSharedLoadTileATraits::Delta</a></div><div class="ttdeci">Shape&lt; TileWithSkew::kW, 0, kWarps *kThreadsPerWarp *kAccessSize, 0 &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:167</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_ac585815d08290d9a5a9cdbd611ffdac4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4">cutlass::gemm::GemmSharedStoreTileDTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; 0, 0, Warps::kW *ThreadsPerWarp::kW *kAccessSize &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:296</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_afd4881aae69c8041d3931982d85f44e4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4">cutlass::gemm::GemmSharedLoadTileBTraits::kOperand</a></div><div class="ttdeci">static GemmOperand::Kind const kOperand</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:199</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a63f980fea1ff3dd83ac276cfd83a4ce5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">cutlass::gemm::GemmSharedLoadTileDTraits::Tile</a></div><div class="ttdeci">Shape&lt; 1, 2, kScalarsPerRow/kAccessSize, kAccessSize &gt; Tile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:361</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a4246185b8279f245ef5d0650c1eec14f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">cutlass::gemm::GemmSharedLoadTileATraits::kThreadsPerWarp</a></div><div class="ttdeci">static int const kThreadsPerWarp</div><div class="ttdoc">The number of threads in one dimension of the warp. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:161</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_ac585815d08290d9a5a9cdbd611ffdac4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4">cutlass::gemm::GemmSharedStoreTileDTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; 0, 0, Warps::kW *ThreadsPerWarp::kW *kAccessSize &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:302</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_afd4881aae69c8041d3931982d85f44e4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4">cutlass::gemm::GemmSharedLoadTileBTraits::kOperand</a></div><div class="ttdeci">static GemmOperand::Kind const kOperand</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:201</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a63f980fea1ff3dd83ac276cfd83a4ce5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">cutlass::gemm::GemmSharedLoadTileDTraits::Tile</a></div><div class="ttdeci">Shape&lt; 1, 2, kScalarsPerRow/kAccessSize, kAccessSize &gt; Tile</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:366</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a2cd23d3b5e2cb64c6d5e9b1d6a78fbce"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">cutlass::gemm::GemmSharedLoadTileDTraits::Delta</a></div><div class="ttdeci">Shape&lt; OutputTile::kW, kScalarsPerRow, kWarpSize *kAccessSize, kSplitK &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:392</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a4246185b8279f245ef5d0650c1eec14f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">cutlass::gemm::GemmSharedLoadTileATraits::kThreadsPerWarp</a></div><div class="ttdeci">static int const kThreadsPerWarp</div><div class="ttdoc">The number of threads in one dimension of the warp. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:160</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_ab883c2a8b90262152faca9cabe515dc4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:84</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_ac5578da2577cddd5a38cb628f894f644"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644">cutlass::gemm::GemmSharedLoadTileDTraits::Delta</a></div><div class="ttdeci">Shape&lt; OutputTile::kW, kScalarsPerRow, kWarpSize *kAccessSize &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:378</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a15438a44b588dc4cfd4b47c18af79cd2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">cutlass::gemm::GemmSharedLoadTileDTraits::kSplitK</a></div><div class="ttdeci">static int const kSplitK</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:383</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_a025445699c5c86237d8c3e48f01081ea"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Iterations</a></div><div class="ttdeci">Shape&lt; 1, TileWithoutSkew::kH/Threads::kW, TileWithoutSkew::kW/Threads::kH &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:100</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a3d8be9ddea1cab53d1b4b3d508f9eab8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a3d8be9ddea1cab53d1b4b3d508f9eab8">cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew_</a></div><div class="ttdeci">Shape&lt; kStages_, OutputTile_::kD/InstructionShape_::kD, GetExtent&lt; kOperand, OutputTile_ &gt;::kExtent *InstructionShape_::kD &gt; TileWithoutSkew_</div><div class="ttdoc">The tile without skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:208</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a3d8be9ddea1cab53d1b4b3d508f9eab8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a3d8be9ddea1cab53d1b4b3d508f9eab8">cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew_</a></div><div class="ttdeci">Shape&lt; kStages_, OutputTile_::kD/InstructionShape_::kD, GetExtent&lt; kOperand, OutputTile_ &gt;::kExtent *InstructionShape_::kD &gt; TileWithoutSkew_</div><div class="ttdoc">The tile without skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:210</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_a1acf2a1d8bf73fda142e7d82e05f00a2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2">cutlass::gemm::GemmSharedStoreTileAbTraits::Threads</a></div><div class="ttdeci">Threads_ Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:46</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GetExtent_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GetExtent.html">cutlass::gemm::GetExtent</a></div><div class="ttdef"><b>Definition:</b> gemm_operand.h:50</div></div>
 <div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a99017ecc737060f53fd9804ea6f9583f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f">cutlass::gemm::GemmSharedLoadTileBTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; TileWithSkew::kW *Warps::kD, 0, kWarps *kThreadsPerWarp *kAccessSize, 0 &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:237</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html_a645f65f7d8f123936b286521df470224"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224">cutlass::gemm::GemmSharedStoreTileAbTraits::Delta</a></div><div class="ttdeci">Shape&lt; 0, Threads::kH *ShapeCount&lt; Tile &gt;::kWc, Threads::kW *kAccessSize &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:63</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a8325bc9d56155ecb6f2ddbd56f4ed23d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">cutlass::gemm::GemmSharedLoadTileDTraits::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">The number of threads. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:356</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_aaff4a5e0f9e4256f184a22cad0ce8cf4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4">cutlass::gemm::GemmSharedLoadTileATraits::Warps</a></div><div class="ttdeci">Warps_ Warps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:147</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a8325bc9d56155ecb6f2ddbd56f4ed23d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">cutlass::gemm::GemmSharedLoadTileDTraits::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">The number of threads. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:360</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_aaff4a5e0f9e4256f184a22cad0ce8cf4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4">cutlass::gemm::GemmSharedLoadTileATraits::Warps</a></div><div class="ttdeci">Warps_ Warps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:146</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_ae5a07814b9cfe9a64f69bac0f0772f20"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:97</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a7007093a4abf79a0b4bfb3fc85a02620"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620">cutlass::gemm::GemmSharedLoadTileBTraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:224</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a7007093a4abf79a0b4bfb3fc85a02620"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620">cutlass::gemm::GemmSharedLoadTileBTraits::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">The memory space. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:226</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset_html_a1e357fe5bc1daef333e6be776a21a2ca"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html#a1e357fe5bc1daef333e6be776a21a2ca">cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset_html_a51a325b435b9a53effaa003b3670e410"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410">cutlass::gemm::GemmSharedLoadTileATraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:175</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset_html_a51a325b435b9a53effaa003b3670e410"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410">cutlass::gemm::GemmSharedLoadTileATraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:172</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a19086a5567d6c710ec853e35a7f29c25"><div class="ttname"><a href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">cutlass::Shape::kD</a></div><div class="ttdeci">static int const kD</div><div class="ttdoc">The depth of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:66</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedStoreTileDTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:299</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a4764f70691cb3fee91ce47653363aa4f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">cutlass::gemm::GemmSharedLoadTileDTraits::Warps</a></div><div class="ttdeci">Warps_ Warps</div><div class="ttdoc">The warps in the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:343</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html">cutlass::gemm::GemmSharedStoreTileDTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:305</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a4764f70691cb3fee91ce47653363aa4f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">cutlass::gemm::GemmSharedLoadTileDTraits::Warps</a></div><div class="ttdeci">Warps_ Warps</div><div class="ttdoc">The warps in the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:347</div></div>
 <div class="ttc" id="structcutlass_1_1ReshapeTile_html_a8d57fe6422aa920d9815a66e5a85b5f5"><div class="ttname"><a href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">cutlass::ReshapeTile::Tile</a></div><div class="ttdeci">Tile_ Tile</div><div class="ttdef"><b>Definition:</b> reshape_tile.h:43</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html_afd691b764b7d105a1ed41dada6049e71"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Delta</a></div><div class="ttdeci">Shape&lt; 0, ShapeCount&lt; Tile &gt;::kWc, Threads::kH *kAccessSize &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:102</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a3b1a461c1dfbcd3817ab2d57bd0da9f1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">cutlass::gemm::GemmSharedLoadTileDTraits::kIterationsH</a></div><div class="ttdeci">static int const kIterationsH</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:371</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a5587ef22f419ab9a7c6117917cc99c57"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57">cutlass::gemm::GemmSharedStoreTileDTraits::Delta</a></div><div class="ttdeci">Shape&lt; 0, 0, Warps::kW *ThreadsPerWarp::kW *kAccessSize &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:294</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_aaffe67e519e919bf561142e05da6e6c8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaffe67e519e919bf561142e05da6e6c8">cutlass::gemm::GemmSharedLoadTileATraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:154</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a9022ffc49b32503fd3639341e7e291a3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">cutlass::gemm::GemmSharedLoadTileDTraits::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The threads in the warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:345</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a1e72b69cf2147e4d194893a64417b920"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920">cutlass::gemm::GemmSharedLoadTileDTraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:339</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a05039ba8b7d9890903064b1a834dcd3e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">cutlass::gemm::GemmSharedStoreTileDTraits::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">The number of threads. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:285</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_ad029d098ba13543bf99c728e6b93006d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d">cutlass::gemm::GemmSharedLoadTileBTraits::Delta</a></div><div class="ttdeci">Shape&lt; TileWithSkew::kW, 0, kWarps *kThreadsPerWarp *kAccessSize, 0 &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:234</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_aed92656a074e915d97a1b6a990aeba66"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66">cutlass::gemm::GemmSharedLoadTileBTraits::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The threads in a warp. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:218</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a9a2218b570dada2f1e3ccd8004c47856"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">cutlass::gemm::GemmSharedStoreTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:266</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a3b1a461c1dfbcd3817ab2d57bd0da9f1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">cutlass::gemm::GemmSharedLoadTileDTraits::kIterationsH</a></div><div class="ttdeci">static int const kIterationsH</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:377</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a5587ef22f419ab9a7c6117917cc99c57"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57">cutlass::gemm::GemmSharedStoreTileDTraits::Delta</a></div><div class="ttdeci">Shape&lt; 0, 0, Warps::kW *ThreadsPerWarp::kW *kAccessSize &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:300</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_aaffe67e519e919bf561142e05da6e6c8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaffe67e519e919bf561142e05da6e6c8">cutlass::gemm::GemmSharedLoadTileATraits::kSkew</a></div><div class="ttdeci">static int const kSkew</div><div class="ttdoc">The skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a9022ffc49b32503fd3639341e7e291a3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">cutlass::gemm::GemmSharedLoadTileDTraits::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The threads in the warps. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:349</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a1e72b69cf2147e4d194893a64417b920"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920">cutlass::gemm::GemmSharedLoadTileDTraits::Pointer</a></div><div class="ttdeci">Scalar_ * Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:343</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a05039ba8b7d9890903064b1a834dcd3e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e">cutlass::gemm::GemmSharedStoreTileDTraits::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">The number of threads. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:291</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_ad012add21d9393d136720f609467e121"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121">cutlass::gemm::GemmSharedLoadTileATraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; TileWithSkew::kW *Warps::kD, 0, kWarps *kThreadsPerWarp *kAccessSize, 0 &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:167</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_aed92656a074e915d97a1b6a990aeba66"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66">cutlass::gemm::GemmSharedLoadTileBTraits::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The threads in a warp. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:220</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a9a2218b570dada2f1e3ccd8004c47856"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">cutlass::gemm::GemmSharedStoreTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:272</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html">cutlass::ShapeCount</a></div><div class="ttdoc">Compute derived counted of a Layout Concept based class. </div><div class="ttdef"><b>Definition:</b> shape.h:79</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a72e0214f86cf8b3711d006dcd69d7a17"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a72e0214f86cf8b3711d006dcd69d7a17">cutlass::gemm::GemmSharedLoadTileATraits::TileWithSkew</a></div><div class="ttdeci">Shape&lt; kStages_, TileWithoutSkew_::kH, TileWithoutSkew_::kW+kSkew_ &gt; TileWithSkew</div><div class="ttdoc">The tile with skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:141</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_af4597927405d8bb1ad2c464fad064703"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703">cutlass::gemm::GemmSharedStoreTileDTraits::Warps</a></div><div class="ttdeci">Warps_ Warps</div><div class="ttdoc">The warps in the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:272</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset_html_a4e35f0b2ca63a6b981230b73f843f726"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:108</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a1b025cb056729706f36469e74a9799dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">cutlass::gemm::GemmSharedLoadTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:337</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset_html_ace1b936cab289c6884e673312283d422"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422">cutlass::gemm::GemmSharedLoadTileDTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:385</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_a5e4204b52ee081a37e824ca71c291c03"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03">cutlass::gemm::GemmSharedLoadTileBTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; TileWithSkew::kW, 0, kWarps *kThreadsPerWarp *kAccessSize, 0 &gt; ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:237</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">cutlass::gemm::GemmSharedStoreTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:264</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_aa41cc5dc82fe08457d103545f8f63081"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">cutlass::gemm::GemmSharedLoadTileBTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:220</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html_a72e0214f86cf8b3711d006dcd69d7a17"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a72e0214f86cf8b3711d006dcd69d7a17">cutlass::gemm::GemmSharedLoadTileATraits::TileWithSkew</a></div><div class="ttdeci">Shape&lt; kStages_, TileWithoutSkew_::kH, TileWithoutSkew_::kW+kSkew_ &gt; TileWithSkew</div><div class="ttdoc">The tile with skew. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:140</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_af4597927405d8bb1ad2c464fad064703"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703">cutlass::gemm::GemmSharedStoreTileDTraits::Warps</a></div><div class="ttdeci">Warps_ Warps</div><div class="ttdoc">The warps in the tile. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:278</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset_html_a4e35f0b2ca63a6b981230b73f843f726"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:107</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a1b025cb056729706f36469e74a9799dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">cutlass::gemm::GemmSharedLoadTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:341</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset_html_ace1b936cab289c6884e673312283d422"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422">cutlass::gemm::GemmSharedLoadTileDTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:396</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">cutlass::gemm::GemmSharedStoreTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:270</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html_aa41cc5dc82fe08457d103545f8f63081"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">cutlass::gemm::GemmSharedLoadTileBTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:222</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__stream__pair_8h.html b/docs/gemm__stream__pair_8h.html
new file mode 100644
index 000000000..9b7a01d57
--- /dev/null
+++ b/docs/gemm__stream__pair_8h.html
@@ -0,0 +1,132 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: gemm_stream_pair.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">gemm_stream_pair.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Defines a pair of GEMM tile streams.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tile__allocation_8h_source.html">cutlass/tile_allocation.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="clear__accumulators_8h_source.html">cutlass/gemm/clear_accumulators.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__config_8h_source.html">cutlass/gemm/gemm_config.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__stream_8h_source.html">cutlass/gemm/gemm_global_stream.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__operand_8h_source.html">cutlass/gemm/gemm_operand.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__stream_8h_source.html">cutlass/gemm/gemm_shared_stream.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="threadblock__swizzle_8h_source.html">cutlass/gemm/threadblock_swizzle.h</a>&quot;</code><br />
+</div>
+<p><a href="gemm__stream__pair_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Collect the global load streams for multiplicands.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a structure containing shared storage for each pair.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Collect the global load streams for multiplicands.  <a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object passed to load iterators.  <a href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/gemm__stream__pair_8h_source.html b/docs/gemm__stream__pair_8h_source.html
new file mode 100644
index 000000000..42c1447ac
--- /dev/null
+++ b/docs/gemm__stream__pair_8h_source.html
@@ -0,0 +1,142 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: gemm_stream_pair.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">gemm_stream_pair.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="gemm__stream__pair_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__allocation_8h.html">cutlass/tile_allocation.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="clear__accumulators_8h.html">cutlass/gemm/clear_accumulators.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__config_8h.html">cutlass/gemm/gemm_config.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__stream_8h.html">cutlass/gemm/gemm_global_stream.h</a>&quot;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__operand_8h.html">cutlass/gemm/gemm_operand.h</a>&quot;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__stream_8h.html">cutlass/gemm/gemm_shared_stream.h</a>&quot;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="threadblock__swizzle_8h.html">cutlass/gemm/threadblock_swizzle.h</a>&quot;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> StreamA_, <span class="keyword">typename</span> StreamB_, <span class="keywordtype">bool</span> kRes<span class="keywordtype">id</span>ueInProlog_&gt;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">   50</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a> {</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">   56</a></span>&#160;  <span class="keyword">typedef</span> StreamA_ <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">StreamA</a>;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">   59</a></span>&#160;  <span class="keyword">typedef</span> StreamB_ <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">StreamB</a>;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">   62</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">Params</a> {</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">   64</a></span>&#160;    <span class="keyword">typename</span> StreamA::Params <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">stream_a</a>;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">   67</a></span>&#160;    <span class="keyword">typename</span> StreamB::Params <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">stream_b</a>;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#afb39229d0ad334834cd2ba0c1fcc9412">   71</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#afb39229d0ad334834cd2ba0c1fcc9412">Params</a>() {}</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#ab26c1aaa2b7709c32bab39801d6c7772">   75</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#ab26c1aaa2b7709c32bab39801d6c7772">Params</a>(<span class="keyword">typename</span> StreamA::Params <span class="keyword">const</span> &amp;_params_A, <span class="keyword">typename</span> StreamB::Params <span class="keyword">const</span> &amp;_params_B)</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;        : <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">stream_a</a>(_params_A), <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">stream_b</a>(_params_B) {}</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  };</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">   80</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> StreamA::Index <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ZipTileAllocation.html">ZipTileAllocation</a>&lt;<span class="keyword">typename</span> StreamA::ThreadblockTileStorage,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;                              <span class="keyword">typename</span> StreamB::ThreadblockTileStorage&gt;</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">   85</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">ThreadblockTileStorage</a>;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">   88</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ZipTensorRef.html">ThreadblockTileStorage::TensorRef</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">ThreadblockTileRef</a>;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">   91</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">SharedStorage</a> {</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a87d507b703a0eb654265f4529ed18f66">   92</a></span>&#160;    <span class="keyword">typename</span> StreamA::SharedStorage <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a87d507b703a0eb654265f4529ed18f66">stream_a</a>;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a6d9444ed13ed544febe196e3e835ea16">   93</a></span>&#160;    <span class="keyword">typename</span> StreamB::SharedStorage <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a6d9444ed13ed544febe196e3e835ea16">stream_b</a>;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  };</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">  101</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">StreamA</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a>;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">  104</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">StreamB</a> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a>;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab97442e24a1d6d64727b6320ab901ad1">  111</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab97442e24a1d6d64727b6320ab901ad1">GlobalLoadStreamPair</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;params,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;                                      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">SharedStorage</a> &amp;shared_storage,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                                      <a class="code" href="structcutlass_1_1ZipTensorRef.html">ThreadblockTileRef</a> <span class="keyword">const</span> &amp;threadblock_tile_ref,</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;                                      <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;bounds,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                                      <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a>,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                 shared_storage.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a>,</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;                 threadblock_tile_ref.first,</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;                 bounds,</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;                 block_offset),</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a>,</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;                 shared_storage.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a>,</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;                 threadblock_tile_ref.second,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;                 bounds,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;                 block_offset) {}</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a769813dcffe1767aab49ac30b838a5f4">  128</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a> &amp; <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a769813dcffe1767aab49ac30b838a5f4">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> offset) {</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a> += offset;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a> += offset;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  }</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5c0efc259bb3bd1675f5d395dab71e95">  135</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5c0efc259bb3bd1675f5d395dab71e95">copy</a>() {</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a>.copy();</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a>.copy();</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  }</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6699714c357f2714df011f58c1c48861">  141</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6699714c357f2714df011f58c1c48861">commit</a>() {</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a>.commit();</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a>.commit();</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  }</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a">  147</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a">residue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a> k, <span class="keywordtype">bool</span> skip_clear = <span class="keyword">false</span>) {</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a>.residue(k, skip_clear);</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a>.residue(k, skip_clear);</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  }</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00153"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab94c0c95d6d4e019563ba8a142f9d410">  153</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab94c0c95d6d4e019563ba8a142f9d410">move_to_residue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a> k, <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a> kTileK) {</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <span class="keywordflow">if</span> (kResidueInProlog_) {</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a>.move_to_residue(k, kTileK);</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a>.move_to_residue(k, kTileK);</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (k &lt; kTileK) {</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a">residue</a>(k, <span class="keyword">true</span>);</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    }</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  }</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6a9287a2cd87ca8a96cbf6b6d29199da">  163</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6a9287a2cd87ca8a96cbf6b6d29199da">rollback</a>(<span class="keywordtype">bool</span> kRollback) {</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    <span class="keywordflow">if</span> (kResidueInProlog_ &amp;&amp; kRollback) {</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a>.rollback();</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a>.rollback();</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    }</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  }</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;};</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> StreamA_, <span class="keyword">typename</span> StreamB_&gt;</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">  173</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a> {</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">  179</a></span>&#160;  <span class="keyword">typedef</span> StreamA_ <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">StreamA</a>;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">  182</a></span>&#160;  <span class="keyword">typedef</span> StreamB_ <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">StreamB</a>;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">  185</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">Params</a> {</div><div class="line"><a name="l00187"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#afb56016927b59b8d5447c3656f0b634e">  187</a></span>&#160;    <span class="keyword">typename</span> StreamA::Params <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#afb56016927b59b8d5447c3656f0b634e">stream_a</a>;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#a4a8f9207ffb3bbcdb000af62808371f5">  190</a></span>&#160;    <span class="keyword">typename</span> StreamB::Params <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#a4a8f9207ffb3bbcdb000af62808371f5">stream_b</a>;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;  };</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt;<span class="keyword">typename</span> StreamA::TensorRef,</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;                       <span class="keyword">typename</span> StreamB::TensorRef &gt;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">  196</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">ThreadblockTileRef</a>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">  203</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">StreamA</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">stream_a</a>;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">  206</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">StreamB</a> <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">stream_b</a>;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;</div><div class="line"><a name="l00213"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a0b69ca0b37dad32ba25c7f7e71a3dcc1">  213</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a0b69ca0b37dad32ba25c7f7e71a3dcc1">SharedStreamPair</a>(<a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;params, <a class="code" href="structcutlass_1_1ZipTensorRef.html">ThreadblockTileRef</a> <span class="keyword">const</span> &amp;threadblock_tile_ref)</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">stream_a</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">stream_a</a>, threadblock_tile_ref.first),</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">stream_b</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">stream_b</a>, threadblock_tile_ref.second) {}</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;</div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad46887abb2e3136b635c3ef5be29cf69">  218</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad46887abb2e3136b635c3ef5be29cf69">copy</a>(<span class="keywordtype">int</span> step) {</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">stream_a</a>.copy(step);</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">stream_b</a>.copy(step);</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;  }</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a93cc2a7eb3215ce5bae343fb117f55c5">  224</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a93cc2a7eb3215ce5bae343fb117f55c5">commit</a>(<span class="keywordtype">int</span> step) {</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">stream_a</a>.commit(step);</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">stream_b</a>.commit(step);</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;  }</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00231"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#af29f052dc0145abe3144dea1472d241a">  231</a></span>&#160;  <span class="keyword">typename</span> StreamA::TransformedFragment <span class="keyword">const</span> &amp;<a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#af29f052dc0145abe3144dea1472d241a">fragment_a</a>(<span class="keywordtype">int</span> step)<span class="keyword"> const </span>{</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">stream_a</a>.fragment(step);</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;  }</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a375e96bc2e35447682bd1dea3c4d87ad">  237</a></span>&#160;  <span class="keyword">typename</span> StreamB::TransformedFragment <span class="keyword">const</span> &amp;<a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a375e96bc2e35447682bd1dea3c4d87ad">fragment_b</a>(<span class="keywordtype">int</span> step)<span class="keyword"> const </span>{</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">stream_b</a>.fragment(step);</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;  }</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div><div class="line"><a name="l00242"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad4b9b1c1fe4b0c6961842d0eff6d7db7">  242</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad4b9b1c1fe4b0c6961842d0eff6d7db7">inc_stage</a>() {</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">stream_a</a>.inc_stage();</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">stream_b</a>.inc_stage();</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;  }</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;};</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params_html_ab26c1aaa2b7709c32bab39801d6c7772"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#ab26c1aaa2b7709c32bab39801d6c7772">cutlass::gemm::GlobalLoadStreamPair::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(typename StreamA::Params const &amp;_params_A, typename StreamB::Params const &amp;_params_B)</div><div class="ttdoc">Constructs a global load stream pair Params object. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:75</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a769813dcffe1767aab49ac30b838a5f4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a769813dcffe1767aab49ac30b838a5f4">cutlass::gemm::GlobalLoadStreamPair::operator+=</a></div><div class="ttdeci">CUTLASS_DEVICE GlobalLoadStreamPair &amp; operator+=(Coord&lt; 3 &gt; const offset)</div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:128</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_aa1e8da4d8a313881d5e6509cf6e852d4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">cutlass::gemm::SharedStreamPair::StreamA</a></div><div class="ttdeci">StreamA_ StreamA</div><div class="ttdoc">Stream for A multiplicand. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:179</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_ab94c0c95d6d4e019563ba8a142f9d410"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab94c0c95d6d4e019563ba8a142f9d410">cutlass::gemm::GlobalLoadStreamPair::move_to_residue</a></div><div class="ttdeci">CUTLASS_DEVICE void move_to_residue(Index k, Index kTileK)</div><div class="ttdoc">Move to residue. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:153</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage_html_a6d9444ed13ed544febe196e3e835ea16"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a6d9444ed13ed544febe196e3e835ea16">cutlass::gemm::GlobalLoadStreamPair::SharedStorage::stream_b</a></div><div class="ttdeci">StreamB::SharedStorage stream_b</div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:93</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a></div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:38</div></div>
+<div class="ttc" id="tile__iterator_8h_html"><div class="ttname"><a href="tile__iterator_8h.html">tile_iterator.h</a></div><div class="ttdoc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params_html_afb56016927b59b8d5447c3656f0b634e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#afb56016927b59b8d5447c3656f0b634e">cutlass::gemm::SharedStreamPair::Params::stream_a</a></div><div class="ttdeci">StreamA::Params stream_a</div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:187</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStreamPair::SharedStorage</a></div><div class="ttdoc">Defines a structure containing shared storage for each pair. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:91</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a5eef540f82acea5d9cb12965707ba158"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">cutlass::gemm::GlobalLoadStreamPair::ThreadblockTileStorage</a></div><div class="ttdeci">ZipTileAllocation&lt; typename StreamA::ThreadblockTileStorage, typename StreamB::ThreadblockTileStorage &gt; ThreadblockTileStorage</div><div class="ttdoc">Shared memory allocation for threadblock-scoped GEMM tile. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:85</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a1b1ec121cbd17ee61d58ea843b900e9a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a">cutlass::gemm::GlobalLoadStreamPair::residue</a></div><div class="ttdeci">CUTLASS_DEVICE void residue(Index k, bool skip_clear=false)</div><div class="ttdoc">Execute the residue code. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:147</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_ab97442e24a1d6d64727b6320ab901ad1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab97442e24a1d6d64727b6320ab901ad1">cutlass::gemm::GlobalLoadStreamPair::GlobalLoadStreamPair</a></div><div class="ttdeci">CUTLASS_DEVICE GlobalLoadStreamPair(Params const &amp;params, SharedStorage &amp;shared_storage, ThreadblockTileRef const &amp;threadblock_tile_ref, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:111</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a79b783f02eaa4cf8fc8f929448e121be"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">cutlass::gemm::GlobalLoadStreamPair::ThreadblockTileRef</a></div><div class="ttdeci">ThreadblockTileStorage::TensorRef ThreadblockTileRef</div><div class="ttdoc">ZipTensorRef to threadblock tiles. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_a0b69ca0b37dad32ba25c7f7e71a3dcc1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a0b69ca0b37dad32ba25c7f7e71a3dcc1">cutlass::gemm::SharedStreamPair::SharedStreamPair</a></div><div class="ttdeci">CUTLASS_DEVICE SharedStreamPair(Params const &amp;params, ThreadblockTileRef const &amp;threadblock_tile_ref)</div><div class="ttdoc">Construct with the composable structure. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:213</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a08171f4eae2442c98f81acc88e8bd55c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">cutlass::gemm::GlobalLoadStreamPair::StreamB</a></div><div class="ttdeci">StreamB_ StreamB</div><div class="ttdoc">Stream for B multiplicand. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:59</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a></div><div class="ttdoc">Collect the global load streams for multiplicands. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:173</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_a375e96bc2e35447682bd1dea3c4d87ad"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a375e96bc2e35447682bd1dea3c4d87ad">cutlass::gemm::SharedStreamPair::fragment_b</a></div><div class="ttdeci">CUTLASS_DEVICE StreamB::TransformedFragment const  &amp; fragment_b(int step) const</div><div class="ttdoc">The fragment B. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:237</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params_html_a12b5e3e21137480047b8b0f55cbf7258"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">cutlass::gemm::GlobalLoadStreamPair::Params::stream_b</a></div><div class="ttdeci">StreamB::Params stream_b</div><div class="ttdoc">Parameters object for StreamB. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:67</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a6a9287a2cd87ca8a96cbf6b6d29199da"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6a9287a2cd87ca8a96cbf6b6d29199da">cutlass::gemm::GlobalLoadStreamPair::rollback</a></div><div class="ttdeci">CUTLASS_DEVICE void rollback(bool kRollback)</div><div class="ttdoc">Rollback to beginning of first tile. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:163</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_a157cec4ae2881fd37e0244614bc4ab7a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">cutlass::gemm::SharedStreamPair::stream_a</a></div><div class="ttdeci">StreamA stream_a</div><div class="ttdoc">The stream for A. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:203</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_af29f052dc0145abe3144dea1472d241a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#af29f052dc0145abe3144dea1472d241a">cutlass::gemm::SharedStreamPair::fragment_a</a></div><div class="ttdeci">CUTLASS_DEVICE StreamA::TransformedFragment const  &amp; fragment_a(int step) const</div><div class="ttdoc">The fragment A. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:231</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a></div><div class="ttdoc">Collect the global load streams for multiplicands. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_ad46887abb2e3136b635c3ef5be29cf69"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad46887abb2e3136b635c3ef5be29cf69">cutlass::gemm::SharedStreamPair::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy(int step)</div><div class="ttdoc">Trigger the copies from shared memory to registers. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:218</div></div>
+<div class="ttc" id="tile__allocation_8h_html"><div class="ttname"><a href="tile__allocation_8h.html">tile_allocation.h</a></div><div class="ttdoc">Defines a fragment based on a Shape&lt;&gt; template. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">cutlass::gemm::GlobalLoadStreamPair::Params</a></div><div class="ttdoc">Parameters object. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:62</div></div>
+<div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
+<div class="ttc" id="gemm__operand_8h_html"><div class="ttname"><a href="gemm__operand_8h.html">gemm_operand.h</a></div><div class="ttdoc">Defines constant expressions for mapping GEMM problem size and strides onto pitch-linear memory...</div></div>
+<div class="ttc" id="clear__accumulators_8h_html"><div class="ttname"><a href="clear__accumulators_8h.html">clear_accumulators.h</a></div><div class="ttdoc">Defines abstractions for efficiently clearing accumulator tiles. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_ae2c4829f874ef9e83aaa52c412fa1227"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">cutlass::gemm::GlobalLoadStreamPair::StreamA</a></div><div class="ttdeci">StreamA_ StreamA</div><div class="ttdoc">Stream for A multiplicand. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:56</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a93cde16f4aef554603fcf27fa23d5127"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">cutlass::gemm::GlobalLoadStreamPair::stream_a</a></div><div class="ttdeci">StreamA stream_a</div><div class="ttdoc">Stream for A multiplicand. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:101</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_ae2c64823a7a5af01187bd3dda6bc309d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">cutlass::gemm::SharedStreamPair::ThreadblockTileRef</a></div><div class="ttdeci">ZipTensorRef&lt; typename StreamA::TensorRef, typename StreamB::TensorRef &gt; ThreadblockTileRef</div><div class="ttdoc">Shared memory allocation for threadblock-scoped GEMM tile. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a3e22454d24cadb7d335f2a0152caae2a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">cutlass::gemm::GlobalLoadStreamPair::Index</a></div><div class="ttdeci">StreamA::Index Index</div><div class="ttdoc">Assumes the A stream defines the index type. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:80</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a></div><div class="ttdoc">Manages a pair of tile allocations as if they are one allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:100</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="gemm__config_8h_html"><div class="ttname"><a href="gemm__config_8h.html">gemm_config.h</a></div><div class="ttdoc">Defines properties of GEMM computation that impose some constraints on caller. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params_html_afb39229d0ad334834cd2ba0c1fcc9412"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#afb39229d0ad334834cd2ba0c1fcc9412">cutlass::gemm::GlobalLoadStreamPair::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:71</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_a8be3e50ce5b65b777972720c77b51529"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">cutlass::gemm::SharedStreamPair::StreamB</a></div><div class="ttdeci">StreamB_ StreamB</div><div class="ttdoc">Stream for B multiplicand. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:182</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage_html_a87d507b703a0eb654265f4529ed18f66"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a87d507b703a0eb654265f4529ed18f66">cutlass::gemm::GlobalLoadStreamPair::SharedStorage::stream_a</a></div><div class="ttdeci">StreamA::SharedStorage stream_a</div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:92</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_a93cc2a7eb3215ce5bae343fb117f55c5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a93cc2a7eb3215ce5bae343fb117f55c5">cutlass::gemm::SharedStreamPair::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit(int step)</div><div class="ttdoc">Commit the data. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:224</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a6699714c357f2714df011f58c1c48861"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6699714c357f2714df011f58c1c48861">cutlass::gemm::GlobalLoadStreamPair::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit()</div><div class="ttdoc">Commit the data. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:141</div></div>
+<div class="ttc" id="gemm__global__stream_8h_html"><div class="ttname"><a href="gemm__global__stream_8h.html">gemm_global_stream.h</a></div><div class="ttdoc">Implements efficient loading of the thread block-level tile from global memory and storing to shared ...</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_a698586bcc25212e8cd65ab6a4e5c42a9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">cutlass::gemm::SharedStreamPair::stream_b</a></div><div class="ttdeci">StreamB stream_b</div><div class="ttdoc">The stream for B. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:206</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html_ad4b9b1c1fe4b0c6961842d0eff6d7db7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad4b9b1c1fe4b0c6961842d0eff6d7db7">cutlass::gemm::SharedStreamPair::inc_stage</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_stage()</div><div class="ttdoc">Increment the stage. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:242</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">cutlass::gemm::SharedStreamPair::Params</a></div><div class="ttdoc">Parameters object passed to load iterators. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:185</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params_html_a4a8f9207ffb3bbcdb000af62808371f5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#a4a8f9207ffb3bbcdb000af62808371f5">cutlass::gemm::SharedStreamPair::Params::stream_b</a></div><div class="ttdeci">StreamB::Params stream_b</div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:190</div></div>
+<div class="ttc" id="threadblock__swizzle_8h_html"><div class="ttname"><a href="threadblock__swizzle_8h.html">threadblock_swizzle.h</a></div><div class="ttdoc">Defies functors for mapping blockIdx to partitions of the GEMM computation. </div></div>
+<div class="ttc" id="matrix__traits_8h_html"><div class="ttname"><a href="matrix__traits_8h.html">matrix_traits.h</a></div><div class="ttdoc">Defines properties of matrices used to denote layout and operands to GEMM kernels. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a5c0efc259bb3bd1675f5d395dab71e95"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5c0efc259bb3bd1675f5d395dab71e95">cutlass::gemm::GlobalLoadStreamPair::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy()</div><div class="ttdoc">Trigger the copies from shared memory to registers. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:135</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params_html_a235c77b257b93dace812d2f7b9340705"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">cutlass::gemm::GlobalLoadStreamPair::Params::stream_a</a></div><div class="ttdeci">StreamA::Params stream_a</div><div class="ttdoc">Parameters object for StreamA. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:64</div></div>
+<div class="ttc" id="gemm__shared__stream_8h_html"><div class="ttname"><a href="gemm__shared__stream_8h.html">gemm_shared_stream.h</a></div><div class="ttdoc">Defines abstractions for managing loading and storing fragments to shared memory in the efficient GEM...</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html_a9aeaeabd4f8af2d864f28c76c6a301d9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">cutlass::gemm::GlobalLoadStreamPair::stream_b</a></div><div class="ttdeci">StreamB stream_b</div><div class="ttdoc">Stream for B multiplicand. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:104</div></div>
+<div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/gemm__traits_8h.html b/docs/gemm__traits_8h.html
index d782b3780..26a1c6ba3 100644
--- a/docs/gemm__traits_8h.html
+++ b/docs/gemm__traits_8h.html
@@ -82,22 +82,26 @@ $(function() {
 
 <p>Defines structural properties of complete GEMM computation.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="clear__accumulators_8h_source.html">cutlass/gemm/clear_accumulators.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__stream_8h_source.html">cutlass/gemm/gemm_global_stream.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__operand_8h_source.html">cutlass/gemm/gemm_operand.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__shared__stream_8h_source.html">cutlass/gemm/gemm_shared_stream.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="identity__block__swizzle_8h_source.html">cutlass/gemm/identity_block_swizzle.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tile__allocation_8h_source.html">cutlass/tile_allocation.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="kernel__launch_8h_source.html">cutlass/kernel_launch.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="clear__accumulators_8h_source.html">cutlass/gemm/clear_accumulators.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__config_8h_source.html">cutlass/gemm/gemm_config.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__desc_8h_source.html">cutlass/gemm/gemm_desc.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__stream__pair_8h_source.html">cutlass/gemm/gemm_stream_pair.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__stream_8h_source.html">cutlass/gemm/gemm_global_stream.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__operand_8h_source.html">cutlass/gemm/gemm_operand.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__stream_8h_source.html">cutlass/gemm/gemm_shared_stream.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="threadblock__swizzle_8h_source.html">cutlass/gemm/threadblock_swizzle.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&quot;</code><br />
 </div>
 <p><a href="gemm__traits_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA&lt; Kind, GemmConfig_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td></tr>
@@ -113,21 +117,13 @@ Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params.  <a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStream_, SharedLoadStream_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object constructable on the host.  <a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage in shared memory.  <a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load stream for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, Epilogue_, Index_, GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Helper_ &gt;</a></td></tr>
@@ -143,7 +139,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/gemm__traits_8h_source.html b/docs/gemm__traits_8h_source.html
index 7ca9f4b8d..274bc086f 100644
--- a/docs/gemm__traits_8h_source.html
+++ b/docs/gemm__traits_8h_source.html
@@ -76,175 +76,144 @@ $(function() {
 <div class="title">gemm_traits.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="gemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="clear__accumulators_8h.html">cutlass/gemm/clear_accumulators.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__stream_8h.html">cutlass/gemm/gemm_global_stream.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__operand_8h.html">cutlass/gemm/gemm_operand.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__stream_8h.html">cutlass/gemm/gemm_shared_stream.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="identity__block__swizzle_8h.html">cutlass/gemm/identity_block_swizzle.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&gt;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> ScalarA_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keyword">typename</span> ScalarB_,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <span class="keyword">typename</span> ScalarD_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keyword">typename</span> MultiplyAdd_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keywordtype">int</span> kScalarsPerStsA_,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdsA_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="keywordtype">int</span> kScalarsPerStsB_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdsB_,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgCAndStgD_,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <span class="keywordtype">int</span> kScalarsPerStsD_,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdsD_,</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="keywordtype">int</span> kStages_&gt;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html">   79</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a> {</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">   82</a></span>&#160;<span class="comment"></span>  <span class="keyword">typedef</span> ScalarA_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a>;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">   84</a></span>&#160;  <span class="keyword">typedef</span> ScalarB_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a>;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">   86</a></span>&#160;  <span class="keyword">typedef</span> ScalarC_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a>;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">   88</a></span>&#160;  <span class="keyword">typedef</span> ScalarD_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a>;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">   91</a></span>&#160;  <span class="keyword">typedef</span> OutputTile_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a>;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">   93</a></span>&#160;  <span class="keyword">typedef</span> MultiplyAdd_ <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a>;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">   95</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">MultiplyAdd::InstructionShape</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a>;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">   97</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">MultiplyAdd::AccumulatorsPerWarp</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a>;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">   99</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html">MultiplyAdd::Accumulators</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">  102</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">ShapeDiv&lt;OutputTile, AccumulatorsPerWarp&gt;::Shape</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a>;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">  104</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a> = cutlass::kWarpSize;</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">  106</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a> = <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Warps&gt;::kCount</a> * <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a>;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">  109</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a> = kScalarsPerLdgA_;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">  110</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a> = kScalarsPerStsA_;</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">  111</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a> = kScalarsPerLdsA_;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">  114</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a> = kScalarsPerLdgB_;</div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">  115</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a> = kScalarsPerStsB_;</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">  116</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a> = kScalarsPerLdsB_;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">  119</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a> = kScalarsPerLdgCAndStgD_;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">  122</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a> = kScalarsPerLdgCAndStgD_;</div><div class="line"><a name="l00123"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">  123</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a> = kScalarsPerStsD_;</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">  124</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a> = kScalarsPerLdsD_;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">  127</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a> / InstructionShape::kD;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">  128</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a> / InstructionShape::kD;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">  131</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a> = kStages_;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;};</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">  137</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a> {};</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00142"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">  142</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ad2010686bceb21aec9a1924ae379edc1">  144</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">  147</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">Scalar</a>;</div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">  149</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a>;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <span class="comment">// That&#39;s A.</span></div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="comment">// A is column-major.</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">Scalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW&gt;</a>,</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00165"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">  165</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">GlobalTileTraits</a>;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a>,</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;            GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      GemmConfig_::kScalarsPerStsA&gt;</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">  179</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;      GemmConfig_::kScalarsPerLdsA,</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;      0&gt;</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">  199</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;};</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">  205</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00207"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c">  207</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div><div class="line"><a name="l00210"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">  210</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a>;</div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">  212</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>;</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;      <span class="comment">// That&#39;s A.</span></div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;      <span class="comment">// The tile has size MxK in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00228"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">  228</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">GlobalTileTraits</a>;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;</div><div class="line"><a name="l00231"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">  231</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsIn4B = <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>) &gt; 4 ? 1 : 4 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>);</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>,</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;            GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;      <span class="comment">// The number of scalars per STS.</span></div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;      GemmConfig_::kScalarsPerStsA,</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      128 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>) / GemmConfig_::kScalarsPerStsA /</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;          GlobalTileTraits::Threads::kW * kScalarsIn4B&gt;</div><div class="line"><a name="l00247"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f">  247</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt;</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;      GemmConfig_::kScalarsPerLdsA,</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00267"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">  267</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;};</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00273"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">  273</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a> {};</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00278"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">  278</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00280"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13">  280</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">  283</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a>;</div><div class="line"><a name="l00285"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">  285</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>;</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;      <span class="comment">// That&#39;s B.</span></div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;      <span class="comment">// B is column-major.</span></div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;      <span class="comment">// The tile has size MxK in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00301"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">  301</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">GlobalTileTraits</a>;</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div><div class="line"><a name="l00304"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">  304</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsIn4B = <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>) &gt; 4 ? 1 : 4 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>);</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>,</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;            GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;      <span class="comment">// The number of scalars per STS.</span></div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;      GemmConfig_::kScalarsPerStsB,</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;      128 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>) / GemmConfig_::kScalarsPerStsB /</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;          GlobalTileTraits::Threads::kW * kScalarsIn4B&gt;</div><div class="line"><a name="l00320"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06">  320</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt;</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;      GemmConfig_::kScalarsPerLdsB,</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00340"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">  340</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;};</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00346"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">  346</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00348"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab">  348</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;</div><div class="line"><a name="l00351"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">  351</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">Scalar</a>;</div><div class="line"><a name="l00353"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">  353</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a>;</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;      <span class="comment">// That&#39;s B.</span></div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;      <span class="comment">// B is row-major.</span></div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">Scalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH&gt;</a>,</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00369"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">  369</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">GlobalTileTraits</a>;</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt;</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a>,</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;            GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;      GemmConfig_::kScalarsPerStsB&gt;</div><div class="line"><a name="l00383"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">  383</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt;</div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;      GemmConfig_::kScalarsPerLdsB,</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;      0&gt;</div><div class="line"><a name="l00403"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">  403</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;};</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;</div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;    <span class="keyword">typename</span> GemmConfig_,</div><div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;    <span class="keyword">typename</span> GlobalLoadStreamA_,</div><div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;    <span class="keyword">typename</span> GlobalLoadStreamB_,</div><div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;    <span class="keyword">typename</span> SharedLoadStreamA_,</div><div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;    <span class="keyword">typename</span> SharedLoadStreamB_,</div><div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;    <span class="keyword">typename</span> Epilogue_,</div><div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;    <span class="keyword">typename</span> BlockSwizzle_ = <a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>,</div><div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;    <span class="keyword">typename</span> ClearAccumulators_ = <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;</a> &gt;</div><div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;</div><div class="line"><a name="l00428"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html">  428</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a> {</div><div class="line"><a name="l00430"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">  430</a></span>&#160;  <span class="keyword">typedef</span> GemmConfig_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a>;</div><div class="line"><a name="l00432"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">  432</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">GemmConfig::OutputTile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a>;</div><div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;</div><div class="line"><a name="l00435"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">  435</a></span>&#160;  <span class="keyword">typedef</span> GlobalLoadStreamA_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>;</div><div class="line"><a name="l00437"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">  437</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a> = GlobalLoadStreamA::kLayout;</div><div class="line"><a name="l00439"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">  439</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadStreamA_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a>;</div><div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;</div><div class="line"><a name="l00442"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">  442</a></span>&#160;  <span class="keyword">typedef</span> GlobalLoadStreamB_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>;</div><div class="line"><a name="l00444"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">  444</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a> = GlobalLoadStreamB::kLayout;</div><div class="line"><a name="l00446"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">  446</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadStreamB_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a>;</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;</div><div class="line"><a name="l00449"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">  449</a></span>&#160;  <span class="keyword">typedef</span> SharedLoadStreamA_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>;</div><div class="line"><a name="l00451"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">  451</a></span>&#160;  <span class="keyword">typedef</span> SharedLoadStreamB_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>;</div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;</div><div class="line"><a name="l00454"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">  454</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadStreamA::SharedStoreStorage <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a>;</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;  <span class="comment">// Btw, make sure we did not messed up with the size of the storage.</span></div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a>) == <span class="keyword">sizeof</span>(<span class="keyword">typename</span> SharedLoadStreamA::SharedStorage),</div><div class="line"><a name="l00457"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">  457</a></span>&#160;                <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;</div><div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadStreamB::SharedStoreStorage <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a>;</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;  <span class="comment">// Btw, make sure we did not messed up with the size of the storage.</span></div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a>) == <span class="keyword">sizeof</span>(<span class="keyword">typename</span> SharedLoadStreamB::SharedStorage),</div><div class="line"><a name="l00463"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">  463</a></span>&#160;                <span class="stringliteral">&quot;&quot;</span>);</div><div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;</div><div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a>;</div><div class="line"><a name="l00468"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">  468</a></span>&#160;  <span class="keyword">typedef</span> Epilogue_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a>;</div><div class="line"><a name="l00470"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">  470</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">Epilogue::ScalarC</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a>;</div><div class="line"><a name="l00471"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">  471</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">Epilogue::ScalarD</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a>;</div><div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;</div><div class="line"><a name="l00474"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">  474</a></span>&#160;  <span class="keyword">typedef</span> BlockSwizzle_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a>;</div><div class="line"><a name="l00476"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">  476</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>;</div><div class="line"><a name="l00478"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">  478</a></span>&#160;  <span class="keyword">typedef</span> ClearAccumulators_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>;</div><div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;</div><div class="line"><a name="l00481"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">  481</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">Params</a> {</div><div class="line"><a name="l00483"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a437d4b6f1f149849c5ae635a5993e7ac">  483</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aaf27c0f2f4ab730ed5c865e9f7d2373b">m</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a437d4b6f1f149849c5ae635a5993e7ac">n</a>, <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aae3a008b39f9678a03192f6ff54152d8">k</a>;</div><div class="line"><a name="l00485"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64">  485</a></span>&#160;    <span class="keyword">typename</span> GlobalLoadStreamA::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64">global_stream_a</a>;</div><div class="line"><a name="l00487"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596">  487</a></span>&#160;    <span class="keyword">typename</span> GlobalLoadStreamB::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596">global_stream_b</a>;</div><div class="line"><a name="l00489"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978">  489</a></span>&#160;    <span class="keyword">typename</span> SharedLoadStreamA::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978">shared_stream_a</a>;</div><div class="line"><a name="l00491"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d">  491</a></span>&#160;    <span class="keyword">typename</span> SharedLoadStreamB::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d">shared_stream_b</a>;</div><div class="line"><a name="l00493"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">  493</a></span>&#160;    <span class="keyword">typename</span> Epilogue::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">epilogue</a>;</div><div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;</div><div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmDesc_&gt;</div><div class="line"><a name="l00497"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">  497</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">initialize</a>(GemmDesc_ <span class="keyword">const</span>&amp; desc) {</div><div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;      <span class="comment">// Set the problem size.</span></div><div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;      this-&gt;m = desc.m;</div><div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;      this-&gt;n = desc.n;</div><div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;      this-&gt;k = desc.k;</div><div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;</div><div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;      <span class="comment">// Initialize the iterator for A.</span></div><div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;      <span class="keywordtype">int</span> error_code =</div><div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64">global_stream_a</a>.initialize(reinterpret_cast&lt;ScalarA const*&gt;(desc.d_a), desc.lda);</div><div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;</div><div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;      }</div><div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;</div><div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;      <span class="comment">// Initialize the iterator for B.</span></div><div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;      error_code = <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596">global_stream_b</a>.initialize(reinterpret_cast&lt;ScalarB const*&gt;(desc.d_b), desc.ldb);</div><div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;</div><div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;      }</div><div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;</div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;      <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">epilogue</a>.initialize(desc);</div><div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;    }</div><div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;  };</div><div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;</div><div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;  <span class="comment">// The storage for A.</span></div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> GlobalLoadStream_, <span class="keyword">typename</span> SharedLoadStream_&gt;</div><div class="line"><a name="l00525"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">  525</a></span>&#160;  <span class="keyword">union </span><a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a> {</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;    <span class="comment">// The storage needed by the global stream.</span></div><div class="line"><a name="l00527"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#a3c2980547310ec4307f3a5f9817dfc51">  527</a></span>&#160;    <span class="keyword">typename</span> GlobalLoadStream_::SharedStorage <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#a3c2980547310ec4307f3a5f9817dfc51">global</a>;</div><div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;    <span class="comment">// The storage needed by the shared stream.</span></div><div class="line"><a name="l00529"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#afabd328b106d45b156200f73942d211e">  529</a></span>&#160;    <span class="keyword">typename</span> SharedLoadStream_::SharedStorage <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#afabd328b106d45b156200f73942d211e">shared</a>;</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;  };</div><div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;</div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;  <span class="comment">// The storage for the main loop + prologue.</span></div><div class="line"><a name="l00533"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">  533</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">MainLoopSharedStorage</a> {</div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;    <span class="comment">// The storage to shuffle the A matrix in shared memory.</span></div><div class="line"><a name="l00535"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811">  535</a></span>&#160;    <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">StreamSharedStorage&lt;GlobalLoadStreamA, SharedLoadStreamA&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811">stream_a</a>;</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;    <span class="comment">// The storage to shuffle the B matrix in shared memory.</span></div><div class="line"><a name="l00537"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa">  537</a></span>&#160;    <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">StreamSharedStorage&lt;GlobalLoadStreamB, SharedLoadStreamB&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa">stream_b</a>;</div><div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;    <span class="comment">// The storage to clear the accumulators if needed.</span></div><div class="line"><a name="l00539"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">  539</a></span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">ClearAccumulators::SharedStorage</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">clear</a>;</div><div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;  };</div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;</div><div class="line"><a name="l00543"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">  543</a></span>&#160;  <span class="keyword">union </span><a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">SharedStorage</a> {</div><div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;    <span class="comment">// The storage for the main loop.</span></div><div class="line"><a name="l00545"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">  545</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">MainLoopSharedStorage</a> <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">main_loop</a>;</div><div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;    <span class="comment">// The storage for the epilogue.</span></div><div class="line"><a name="l00547"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#afdca9ac1d28e17efaa394f5831a60c04">  547</a></span>&#160;    <span class="keyword">typename</span> Epilogue::SharedStorage <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#afdca9ac1d28e17efaa394f5831a60c04">epilogue</a>;</div><div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;  };</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;</div><div class="line"><a name="l00551"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html">  551</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html">GlobalLoadStream</a> {</div><div class="line"><a name="l00553"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ab2961b4db0694cf128d55d38a98db575">  553</a></span>&#160;    CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ab2961b4db0694cf128d55d38a98db575">GlobalLoadStream</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; params,</div><div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;                                    <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">SharedStorage</a>&amp; shared_storage,</div><div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;                                    dim3 <span class="keyword">const</span>&amp; block)</div><div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;        : <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">stream_a</a>(params.global_stream_a,</div><div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;                   shared_storage.main_loop.<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">stream_a</a>.global,</div><div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;                   <a class="code" href="namespacecutlass.html">cutlass</a>::<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, params.k, params.m),</div><div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;                   <a class="code" href="namespacecutlass.html">cutlass</a>::<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, block.x)),</div><div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;          <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">stream_b</a>(params.global_stream_b,</div><div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;                   shared_storage.main_loop.<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">stream_b</a>.global,</div><div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;                   <a class="code" href="namespacecutlass.html">cutlass</a>::<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, params.k, params.n),</div><div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;                   <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, block.y)) {}</div><div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;</div><div class="line"><a name="l00566"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ae033f55779b45b4228f40a4d699062bb">  566</a></span>&#160;    CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ae033f55779b45b4228f40a4d699062bb">copy</a>() {</div><div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">stream_a</a>.copy();</div><div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">stream_b</a>.copy();</div><div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;    }</div><div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;</div><div class="line"><a name="l00572"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a6dc512be014b9d849057e2fd4c0b0485">  572</a></span>&#160;    CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a6dc512be014b9d849057e2fd4c0b0485">commit</a>() {</div><div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">stream_a</a>.commit();</div><div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">stream_b</a>.commit();</div><div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;    }</div><div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;</div><div class="line"><a name="l00578"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a405b93680bb6e356369863244d0b56aa">  578</a></span>&#160;    CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a405b93680bb6e356369863244d0b56aa">residue</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> k, <span class="keywordtype">bool</span> skip_clear = <span class="keyword">false</span>) {</div><div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">stream_a</a>.residue(k, skip_clear);</div><div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">stream_b</a>.residue(k, skip_clear);</div><div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;    }</div><div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;</div><div class="line"><a name="l00584"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">  584</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">stream_a</a>;</div><div class="line"><a name="l00586"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">  586</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">stream_b</a>;</div><div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;  };</div><div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;</div><div class="line"><a name="l00590"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html">  590</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html">SharedLoadStream</a> {</div><div class="line"><a name="l00592"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a49315aea1c54d84ff19b0ac215128b95">  592</a></span>&#160;    CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a49315aea1c54d84ff19b0ac215128b95">SharedLoadStream</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; params, <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">SharedStorage</a>&amp; shared_storage) {</div><div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8">stream_a</a>.initialize(params.<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978">shared_stream_a</a>, shared_storage.<a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">main_loop</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811">stream_a</a>.<a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#afabd328b106d45b156200f73942d211e">shared</a>);</div><div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d">stream_b</a>.initialize(params.<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d">shared_stream_b</a>, shared_storage.<a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">main_loop</a>.<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa">stream_b</a>.<a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#afabd328b106d45b156200f73942d211e">shared</a>);</div><div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;    }</div><div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;</div><div class="line"><a name="l00598"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#af25495bb0bb35bd64246d3a80fe4806f">  598</a></span>&#160;    CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#af25495bb0bb35bd64246d3a80fe4806f">copy</a>(<span class="keywordtype">int</span> step) {</div><div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8">stream_a</a>.copy(step, <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a3147da380e4c1e465aba0b965ac87ab5">fetched_a</a>[step % 2]);</div><div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d">stream_b</a>.copy(step, <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a837fbec1d47ae45480941de6290889c0">fetched_b</a>[step % 2]);</div><div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;    }</div><div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;</div><div class="line"><a name="l00604"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#ade2d85507dec77591e66276339a1eef5">  604</a></span>&#160;    CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#ade2d85507dec77591e66276339a1eef5">commit</a>(<span class="keywordtype">int</span> step) {</div><div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8">stream_a</a>.commit(<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a3147da380e4c1e465aba0b965ac87ab5">fetched_a</a>[step % 2], <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a883b28ca237b1ec076856232cfee0c6f">transformed_a</a>[step % 2]);</div><div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d">stream_b</a>.commit(<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a837fbec1d47ae45480941de6290889c0">fetched_b</a>[step % 2], <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a9369a5f819d2a42997491e0df96f47ef">transformed_b</a>[step % 2]);</div><div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;    }</div><div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;</div><div class="line"><a name="l00610"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a4a8c64d85aa012e3689dd024c486924b">  610</a></span>&#160;    CUTLASS_DEVICE <span class="keyword">typename</span> SharedLoadStreamA::Fragment <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a4a8c64d85aa012e3689dd024c486924b">fragment_a</a>(<span class="keywordtype">int</span> step)<span class="keyword"> const </span>{</div><div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a883b28ca237b1ec076856232cfee0c6f">transformed_a</a>[step % 2];</div><div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;    }</div><div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;</div><div class="line"><a name="l00615"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#aa28f34fb0c4bf739246d92c2fef80e0b">  615</a></span>&#160;    CUTLASS_DEVICE <span class="keyword">typename</span> SharedLoadStreamB::Fragment <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#aa28f34fb0c4bf739246d92c2fef80e0b">fragment_b</a>(<span class="keywordtype">int</span> step)<span class="keyword"> const </span>{</div><div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a9369a5f819d2a42997491e0df96f47ef">transformed_b</a>[step % 2];</div><div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;    }</div><div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;</div><div class="line"><a name="l00620"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8851150a49e4a9c135279c8c9dfdc592">  620</a></span>&#160;    CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8851150a49e4a9c135279c8c9dfdc592">inc_stage</a>() {</div><div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8">stream_a</a>.inc_stage();</div><div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d">stream_b</a>.inc_stage();</div><div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;    }</div><div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;</div><div class="line"><a name="l00626"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8">  626</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8">stream_a</a>;</div><div class="line"><a name="l00628"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a3147da380e4c1e465aba0b965ac87ab5">  628</a></span>&#160;    <span class="keyword">typename</span> SharedLoadStreamA::FetchedFragment <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a3147da380e4c1e465aba0b965ac87ab5">fetched_a</a>[2];</div><div class="line"><a name="l00630"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a883b28ca237b1ec076856232cfee0c6f">  630</a></span>&#160;    <span class="keyword">typename</span> SharedLoadStreamA::TransformedFragment <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a883b28ca237b1ec076856232cfee0c6f">transformed_a</a>[2];</div><div class="line"><a name="l00632"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d">  632</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d">stream_b</a>;</div><div class="line"><a name="l00634"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a837fbec1d47ae45480941de6290889c0">  634</a></span>&#160;    <span class="keyword">typename</span> SharedLoadStreamB::FetchedFragment <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a837fbec1d47ae45480941de6290889c0">fetched_b</a>[2];</div><div class="line"><a name="l00636"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a9369a5f819d2a42997491e0df96f47ef">  636</a></span>&#160;    <span class="keyword">typename</span> SharedLoadStreamB::TransformedFragment <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a9369a5f819d2a42997491e0df96f47ef">transformed_b</a>[2];</div><div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;  };</div><div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;</div><div class="line"><a name="l00640"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">  640</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a>(<span class="keywordtype">bool</span> in_loop) {</div><div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;    <span class="keywordflow">if</span> (SharedLoadStreamA::Iterator::kRequiresLoadFence ||</div><div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;        SharedLoadStreamB::Iterator::kRequiresLoadFence) {</div><div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;      __syncthreads();</div><div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;    }</div><div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;  }</div><div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;</div><div class="line"><a name="l00648"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">  648</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(<span class="keywordtype">bool</span> in_loop) { __syncthreads(); }</div><div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;};</div><div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;</div><div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;</div><div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmTileTraitsHelperA_, <span class="keyword">typename</span> GemmTileTraitsHelperB_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00654"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">  654</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a> {</div><div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperA_::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00657"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">  657</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">GlobalLoadIteratorA</a>;</div><div class="line"><a name="l00659"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">  659</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename GlobalLoadIteratorA::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">GlobalTransformerA</a>;</div><div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA_::SharedStoreTileTraits,</div><div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperA_::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00665"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">  665</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">SharedStoreIteratorA</a>;</div><div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream&lt;GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA&gt;</a></div><div class="line"><a name="l00668"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec">  668</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec">GlobalLoadStreamA</a>;</div><div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;</div><div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperB_::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00672"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">  672</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">GlobalLoadIteratorB</a>;</div><div class="line"><a name="l00674"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">  674</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename GlobalLoadIteratorB::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">GlobalTransformerB</a>;</div><div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB_::SharedStoreTileTraits,</div><div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperB_::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00680"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">  680</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">SharedStoreIteratorB</a>;</div><div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream&lt;GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB&gt;</a></div><div class="line"><a name="l00683"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89">  683</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89">GlobalLoadStreamB</a>;</div><div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;</div><div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA_::SharedLoadTileTraits,</div><div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA_::Scalar,</div><div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00690"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">  690</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">SharedLoadIteratorA</a>;</div><div class="line"><a name="l00692"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8">  692</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorA&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8">SharedLoadStreamA</a>;</div><div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB_::SharedLoadTileTraits,</div><div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB_::Scalar,</div><div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00698"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e">  698</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e">SharedLoadIteratorB</a>;</div><div class="line"><a name="l00700"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8">  700</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorB&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8">SharedLoadStreamB</a>;</div><div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;};</div><div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;</div><div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;</div><div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;    <span class="keyword">typename</span> GemmConfig_,</div><div class="line"><a name="l00713"></a><span class="lineno">  713</span>&#160;    <span class="keyword">typename</span> Epilogue_,</div><div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;    <span class="comment">// The configuration for the A matrix.</span></div><div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;    <span class="keyword">typename</span> GemmTileTraitsHelperA_ = <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA&lt;kLayoutA_, GemmConfig_&gt;</a>,</div><div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;    <span class="comment">// The configuration for the B matrix.</span></div><div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;    <span class="keyword">typename</span> GemmTileTraitsHelperB_ = <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB&lt;kLayoutB_, GemmConfig_&gt;</a>,</div><div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;    <span class="comment">// The helper class to create the streams and iterators.</span></div><div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;    <span class="keyword">typename</span> Helper_ =</div><div class="line"><a name="l00722"></a><span class="lineno">  722</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper&lt;GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00723"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">  723</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt;</div><div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;                                  <span class="comment">// The config.</span></div><div class="line"><a name="l00725"></a><span class="lineno">  725</span>&#160;                                  GemmConfig_,</div><div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;                                  <span class="comment">// The stream to load A from global memory to shared memory.</span></div><div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;                                  typename Helper_::GlobalLoadStreamA,</div><div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;                                  <span class="comment">// The stream to load B from global memory to shared memory.</span></div><div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;                                  typename Helper_::GlobalLoadStreamB,</div><div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;                                  <span class="comment">// The stream to load A from shared memory.</span></div><div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;                                  typename Helper_::SharedLoadStreamA,</div><div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;                                  <span class="comment">// The stream to load B from shared memory.</span></div><div class="line"><a name="l00733"></a><span class="lineno">  733</span>&#160;                                  typename Helper_::SharedLoadStreamB,</div><div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;                                  <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;                                  Epilogue_,</div><div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;                                  <span class="comment">// The block swizzle to reorganize the grid.</span></div><div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;                                  IdentityBlockSwizzle,</div><div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;                                  <span class="comment">// The index.</span></div><div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;                                  Index_,</div><div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;                                  <span class="comment">// The tool used to clear accumulators.</span></div><div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;                                  ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt; &gt; {</div><div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;};</div><div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;</div><div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;</div><div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a437d4b6f1f149849c5ae635a5993e7ac"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a437d4b6f1f149849c5ae635a5993e7ac">cutlass::gemm::GemmTraits::Params::n</a></div><div class="ttdeci">Index n</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:483</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a677d6a1711cc756b817095b7437cce0e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">cutlass::gemm::GemmConfig::kWarpSize</a></div><div class="ttdeci">static int const kWarpSize</div><div class="ttdoc">The default warp size (32 threads per warp). </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:104</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage_html_afdca9ac1d28e17efaa394f5831a60c04"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#afdca9ac1d28e17efaa394f5831a60c04">cutlass::gemm::GemmTraits::SharedStorage::epilogue</a></div><div class="ttdeci">Epilogue::SharedStorage epilogue</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:547</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_accc95abc55880abdab92253367b4b186"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">cutlass::gemm::GemmConfig::kScalarsPerStsA</a></div><div class="ttdeci">static int const kScalarsPerStsA</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:110</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a118bb34a6f58c3e5a989773b4b597d8c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileBTraits&lt; MultiplyAddScalar const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsB, SharedStoreTileTraits::kSkew &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for B^N. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:340</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a9d1e4e364be8fd9de5e1199d93ad76aa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">cutlass::gemm::GemmConfig::ScalarA</a></div><div class="ttdeci">ScalarA_ ScalarA</div><div class="ttdoc">The scalar for A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:82</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a9cd6c3fddfb4315eb52b672900462c47"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">cutlass::gemm::GemmTraits::GlobalLoadStreamA</a></div><div class="ttdeci">GlobalLoadStreamA_ GlobalLoadStreamA</div><div class="ttdoc">The stream to load A from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:435</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a4887b56a96694ce6350db77f78bb505f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">cutlass::gemm::GemmEpilogue::ScalarD</a></div><div class="ttdeci">GlobalStoreIteratorD::Scalar ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:98</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a8669096ddbb8c810fb8d2313d62e6ee7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">cutlass::gemm::GemmConfig::MultiplyAdd</a></div><div class="ttdeci">MultiplyAdd_ MultiplyAdd</div><div class="ttdoc">The functor to do D = A*B + C. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:93</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_abbdd356f280099269867e614684645cf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">cutlass::gemm::GemmConfig::kAccumulatorsPerLdsA</a></div><div class="ttdeci">static int const kAccumulatorsPerLdsA</div><div class="ttdoc">The number of accumulators that are going to be fed from one LDS A/B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:127</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aa1b75484138923a52b32888fef608d9b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">cutlass::gemm::GemmConfig::kScalarsPerLdsA</a></div><div class="ttdeci">static int const kScalarsPerLdsA</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:111</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ae01371eb31b88fa83c4926564cecafdc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">cutlass::gemm::GemmTraits::SharedLoadStreamA</a></div><div class="ttdeci">SharedLoadStreamA_ SharedLoadStreamA</div><div class="ttdoc">The iterator for A to load from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:449</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a3a57d05f50932d718538f0d1ededa95b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">cutlass::gemm::GemmConfig::InstructionShape</a></div><div class="ttdeci">MultiplyAdd::InstructionShape InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:95</div></div>
+<a href="gemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__allocation_8h.html">cutlass/tile_allocation.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="kernel__launch_8h.html">cutlass/kernel_launch.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="clear__accumulators_8h.html">cutlass/gemm/clear_accumulators.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__config_8h.html">cutlass/gemm/gemm_config.h</a>&quot;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__desc_8h.html">cutlass/gemm/gemm_desc.h</a>&quot;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__stream__pair_8h.html">cutlass/gemm/gemm_stream_pair.h</a>&quot;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__stream_8h.html">cutlass/gemm/gemm_global_stream.h</a>&quot;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__operand_8h.html">cutlass/gemm/gemm_operand.h</a>&quot;</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__stream_8h.html">cutlass/gemm/gemm_shared_stream.h</a>&quot;</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="threadblock__swizzle_8h.html">cutlass/gemm/threadblock_swizzle.h</a>&quot;</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&quot;</span></div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">   52</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a> {};</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">   57</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ad2010686bceb21aec9a1924ae379edc1">   59</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">   62</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">Scalar</a>;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">   64</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a>;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;      <span class="comment">// That&#39;s A.</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;      <span class="comment">// A is column-major.</span></div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">Scalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW&gt;</a>,</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">   80</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">GlobalTileTraits</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a>,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;            GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      GemmConfig_::kScalarsPerStsA&gt;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">   94</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;      GemmConfig_::kScalarsPerLdsA,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;      0&gt;</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">  114</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;};</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">  120</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c">  122</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">  125</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a>;</div><div class="line"><a name="l00127"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">  127</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarA <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="comment">// That&#39;s A.</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;      <span class="comment">// The tile has size MxK in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">  143</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">GlobalTileTraits</a>;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">  146</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsIn4B = <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>) &gt; 4 ? 1 : 4 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>);</div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9c296924f9a6c6908f09830bbbf6a775">  148</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkewA = 128 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>) / GemmConfig_::kScalarsPerStsA /</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;                            GlobalTileTraits::Threads::kW * kScalarsIn4B;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a> &lt;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>,</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;            GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      <span class="comment">// The number of scalars per STS.</span></div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      GemmConfig_::kScalarsPerStsA,</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;      kSkewA&lt;GemmConfig_::kScalarsPerLdsA ? GemmConfig_::kScalarsPerLdsA : kSkewA&gt;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;          SharedStoreTileTraits;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      GemmConfig_::kScalarsPerLdsA,</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;};</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">  191</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a> {};</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">  196</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13">  198</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">  201</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a>;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">  203</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      <span class="comment">// That&#39;s B.</span></div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <span class="comment">// B is column-major.</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      <span class="comment">// The tile has size MxK in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">  219</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">GlobalTileTraits</a>;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">  222</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsIn4B = <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>) &gt; 4 ? 1 : 4 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>);</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab35a6b3ff04e4128e4ca4a8cc0459b16">  224</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkewB = 128 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>) / GemmConfig_::kScalarsPerStsB /</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;                            GlobalTileTraits::Threads::kW * kScalarsIn4B;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a> &lt;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>,</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;            GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;      <span class="comment">// The number of scalars per STS.</span></div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;      GemmConfig_::kScalarsPerStsB,</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;      kSkewB&lt;GemmConfig_::kScalarsPerLdsB ? GemmConfig_::kScalarsPerLdsB : kSkewB&gt;</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;          SharedStoreTileTraits;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;      GemmConfig_::kScalarsPerLdsB,</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;};</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00267"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">  267</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00269"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab">  269</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;</div><div class="line"><a name="l00272"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">  272</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">Scalar</a>;</div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">  274</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarB <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a>;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;      <span class="comment">// That&#39;s B.</span></div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;      <span class="comment">// B is row-major.</span></div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">Scalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH&gt;</a>,</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">  290</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">GlobalTileTraits</a>;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt;</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a>,</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;            GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;      GemmConfig_::kScalarsPerStsB&gt;</div><div class="line"><a name="l00304"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">  304</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt;</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;      GemmConfig_::kScalarsPerLdsB,</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;      0&gt;</div><div class="line"><a name="l00324"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">  324</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;};</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;    <span class="keyword">typename</span> GemmConfig_,</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;    <span class="keyword">typename</span> GlobalLoadStreamA_,</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;    <span class="keyword">typename</span> GlobalLoadStreamB_,</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    <span class="keyword">typename</span> SharedLoadStreamA_,</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;    <span class="keyword">typename</span> SharedLoadStreamB_,</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <span class="keyword">typename</span> Epilogue_,</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;    <span class="keyword">typename</span> BlockSwizzle_ = <a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>,</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    <span class="keyword">typename</span> ClearAccumulators_ = <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;</a> &gt;</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;</div><div class="line"><a name="l00349"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html">  349</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a> {</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt;GemmConfig_,</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;    GlobalLoadStreamA_,</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;    GlobalLoadStreamB_,</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;    SharedLoadStreamA_,</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;    SharedLoadStreamB_,</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;    Epilogue_,</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    BlockSwizzle_,</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    Index_,</div><div class="line"><a name="l00359"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">  359</a></span>&#160;    ClearAccumulators_&gt; <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a>;</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;</div><div class="line"><a name="l00362"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">  362</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt;This_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a>;</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;</div><div class="line"><a name="l00365"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">  365</a></span>&#160;  <span class="keyword">typedef</span> GemmConfig_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a>;</div><div class="line"><a name="l00367"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">  367</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a>;</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;</div><div class="line"><a name="l00370"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">  370</a></span>&#160;  <span class="keyword">typedef</span> GlobalLoadStreamA_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>;</div><div class="line"><a name="l00372"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">  372</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a> = GlobalLoadStreamA::kLayout;</div><div class="line"><a name="l00374"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">  374</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadStreamA_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a>;</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;</div><div class="line"><a name="l00377"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">  377</a></span>&#160;  <span class="keyword">typedef</span> GlobalLoadStreamB_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>;</div><div class="line"><a name="l00379"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">  379</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a> = GlobalLoadStreamB::kLayout;</div><div class="line"><a name="l00381"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">  381</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalLoadStreamB_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a>;</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;</div><div class="line"><a name="l00384"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">  384</a></span>&#160;  <span class="keyword">typedef</span> SharedLoadStreamA_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>;</div><div class="line"><a name="l00386"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">  386</a></span>&#160;  <span class="keyword">typedef</span> SharedLoadStreamB_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>;</div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;</div><div class="line"><a name="l00389"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">  389</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a>;</div><div class="line"><a name="l00391"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">  391</a></span>&#160;  <span class="keyword">typedef</span> Epilogue_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a>;</div><div class="line"><a name="l00393"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">  393</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">Epilogue::ScalarC</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a>;</div><div class="line"><a name="l00394"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">  394</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">Epilogue::ScalarD</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a>;</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;</div><div class="line"><a name="l00397"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">  397</a></span>&#160;  <span class="keyword">typedef</span> BlockSwizzle_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a>;</div><div class="line"><a name="l00399"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">  399</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>;</div><div class="line"><a name="l00401"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">  401</a></span>&#160;  <span class="keyword">typedef</span> ClearAccumulators_ <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>;</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>,</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;                               <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>,</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;                               <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">GemmConfig::kResidueInProlog</a>&gt;</div><div class="line"><a name="l00407"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">  407</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a>;</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;</div><div class="line"><a name="l00410"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">  410</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ZipTileAllocation.html">GlobalLoadStream::ThreadblockTileStorage</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a>;</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;</div><div class="line"><a name="l00413"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">  413</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair&lt;SharedLoadStreamA, SharedLoadStreamB&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a>;</div><div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;</div><div class="line"><a name="l00416"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">  416</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">Params</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html">KernelLaunchConfiguration</a> {</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;</div><div class="line"><a name="l00419"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">  419</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">problem_size</a>;</div><div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;</div><div class="line"><a name="l00422"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3">  422</a></span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">GlobalLoadStream::Params</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3">global_to_shared_stream</a>;</div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;</div><div class="line"><a name="l00425"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a50e9cc382a32abd5beab299a79b30b27">  425</a></span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">SharedStream::Params</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a50e9cc382a32abd5beab299a79b30b27">shared_stream</a>;</div><div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;</div><div class="line"><a name="l00428"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">  428</a></span>&#160;    <span class="keyword">typename</span> Epilogue::Params <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">epilogue</a>;</div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;</div><div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmDesc_&gt;</div><div class="line"><a name="l00432"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">  432</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">initialize</a>(GemmDesc_ <span class="keyword">const</span>&amp; desc) {</div><div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;      <span class="comment">// Set the problem size.</span></div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">problem_size</a> = desc.problem_size;</div><div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;</div><div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;      <span class="comment">// Compute grid dimensions</span></div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a> block_swizzle;</div><div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;      this-&gt;<a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">block</a> = dim3(<a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">GemmConfig::kThreads</a>);</div><div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;      this-&gt;<a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">grid</a> = block_swizzle.get_grid_layout(</div><div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">problem_size</a>,</div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;        make_Coord_from_shape&lt;OutputTile&gt;());</div><div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;</div><div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;      <span class="comment">// Compute offset to residue.</span></div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> gemm_k = <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">problem_size</a>[0];</div><div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> offset_to_residue = (gemm_k % OutputTile::kD) ? gemm_k - (gemm_k % OutputTile::kD) : 0;</div><div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;      <span class="comment">// Initialize parameters objects for</span></div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;      <span class="keywordtype">int</span> error_code = <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3">global_to_shared_stream</a>.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">stream_a</a>.initialize(</div><div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;        desc.A.data(),</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;        desc.batch_stride_A,</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;        desc.A.leading_dim(),</div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;        offset_to_residue</div><div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;      );</div><div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;      }</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;      error_code = <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3">global_to_shared_stream</a>.<a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">stream_b</a>.initialize(</div><div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;        desc.B.data(),</div><div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;        desc.batch_stride_B,</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;        desc.B.leading_dim(),</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;        offset_to_residue</div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;      );</div><div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;      <span class="keywordflow">if</span> (error_code) {</div><div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;        <span class="keywordflow">return</span> error_code;</div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;      }</div><div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;</div><div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;      <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">epilogue</a>.initialize(desc);</div><div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;    }</div><div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;</div><div class="line"><a name="l00474"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#ac4cd0b74130ffc09e4ccb7b0acba87f8">  474</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#ac4cd0b74130ffc09e4ccb7b0acba87f8">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> m,</div><div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> n,</div><div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> k,</div><div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;                                       <span class="keyword">typename</span> Epilogue::Scalar alpha,</div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a> <span class="keyword">const</span>* d_a,</div><div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> lda,</div><div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a> <span class="keyword">const</span>* d_b,</div><div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldb,</div><div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;                                       <span class="keyword">typename</span> Epilogue::Scalar beta,</div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a> <span class="keyword">const</span>* d_c,</div><div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldc,</div><div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a>* d_d,</div><div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldd) {</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc&lt;ScalarA, ScalarB, ScalarC, ScalarD, typename Epilogue::Scalar&gt;</a> desc(</div><div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>(k, n, m, 1),</div><div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;        alpha,</div><div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;        <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;ScalarA const, 2&gt;</a>(d_a, lda),</div><div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;        <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;ScalarB const, 2&gt;</a>(d_b, ldb),</div><div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;        beta,</div><div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;        <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;ScalarC const, 2&gt;</a>(d_c, ldc),</div><div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;        <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;ScalarD, 2&gt;</a>(d_d, ldd)</div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;      );</div><div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;</div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;      <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">initialize</a>(desc);</div><div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;    }</div><div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;</div><div class="line"><a name="l00501"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a95314e9a9279c4870f37f68a2357e064">  501</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a95314e9a9279c4870f37f68a2357e064">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> m,</div><div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> n,</div><div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> k,</div><div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;                                       <span class="keyword">typename</span> Epilogue::Scalar alpha,</div><div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a> <span class="keyword">const</span>* d_a,</div><div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> lda,</div><div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;                                       <span class="keywordtype">long</span> <span class="keywordtype">long</span> <span class="keywordtype">int</span> batch_stride_A,</div><div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a> <span class="keyword">const</span>* d_b,</div><div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldb,</div><div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;                                       <span class="keywordtype">long</span> <span class="keywordtype">long</span> <span class="keywordtype">int</span> batch_stride_B,</div><div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;                                       <span class="keyword">typename</span> Epilogue::Scalar beta,</div><div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a> <span class="keyword">const</span>* d_c,</div><div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldc,</div><div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;                                       <span class="keywordtype">long</span> <span class="keywordtype">long</span> <span class="keywordtype">int</span> batch_stride_C,</div><div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a>* d_d,</div><div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldd,</div><div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;                                       <span class="keywordtype">long</span> <span class="keywordtype">long</span> <span class="keywordtype">int</span> batch_stride_D,</div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> batch_count) {</div><div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;</div><div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc&lt;ScalarA, ScalarB, ScalarC, ScalarD, typename Epilogue::Scalar&gt;</a> desc(</div><div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>(k, n, m, batch_count),</div><div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;        alpha,</div><div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;        <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;ScalarA const, 2&gt;</a>(d_a, lda),</div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;        batch_stride_A,</div><div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;        <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;ScalarB const, 2&gt;</a>(d_b, ldb),</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;        batch_stride_B,</div><div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;        beta,</div><div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;        <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;ScalarC const, 2&gt;</a>(d_c, ldc),</div><div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;        batch_stride_C,</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;        <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;ScalarD, 2&gt;</a>(d_d, ldd),</div><div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;        batch_stride_D</div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;      );</div><div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;</div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;      <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">initialize</a>(desc);</div><div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;    }</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;  };</div><div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;</div><div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;  <span class="comment">// The storage for the main loop + prologue.</span></div><div class="line"><a name="l00539"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">  539</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">MainLoopSharedStorage</a> {</div><div class="line"><a name="l00541"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#af8f0050e818b788402526857afc7c919">  541</a></span>&#160;    <a class="code" href="structcutlass_1_1ZipTileAllocation.html">ThreadblockTileStorage</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#af8f0050e818b788402526857afc7c919">threadblock_tile</a>;</div><div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;</div><div class="line"><a name="l00544"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a61fcc63cb0df6754eef16f5cf138f3a2">  544</a></span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">GlobalLoadStream::SharedStorage</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a61fcc63cb0df6754eef16f5cf138f3a2">global_to_shared_stream</a>;</div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;</div><div class="line"><a name="l00547"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">  547</a></span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">ClearAccumulators::SharedStorage</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">clear</a>;</div><div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;  };</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;</div><div class="line"><a name="l00551"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">  551</a></span>&#160;  <span class="keyword">union </span><a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">SharedStorage</a> {</div><div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;    <span class="comment">// The storage for the main loop.</span></div><div class="line"><a name="l00553"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">  553</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">MainLoopSharedStorage</a> <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">main_loop</a>;</div><div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;    <span class="comment">// The storage for the epilogue.</span></div><div class="line"><a name="l00555"></a><span class="lineno"><a class="line" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#afdca9ac1d28e17efaa394f5831a60c04">  555</a></span>&#160;    <span class="keyword">typename</span> Epilogue::SharedStorage <a class="code" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#afdca9ac1d28e17efaa394f5831a60c04">epilogue</a>;</div><div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;  };</div><div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;</div><div class="line"><a name="l00559"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">  559</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a>(<span class="keywordtype">bool</span> in_loop) {</div><div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;    <span class="keywordflow">if</span> (SharedLoadStreamA::Iterator::kRequiresLoadFence ||</div><div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;        SharedLoadStreamB::Iterator::kRequiresLoadFence) {</div><div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;        __syncthreads();</div><div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;    }</div><div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;  }</div><div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;</div><div class="line"><a name="l00567"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">  567</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(<span class="keywordtype">bool</span> in_loop) {</div><div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;      __syncthreads();</div><div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;  }</div><div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;};</div><div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;</div><div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;</div><div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmTileTraitsHelperA_, <span class="keyword">typename</span> GemmTileTraitsHelperB_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00575"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">  575</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a> {</div><div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperA_::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00578"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">  578</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">GlobalLoadIteratorA</a>;</div><div class="line"><a name="l00580"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">  580</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename GlobalLoadIteratorA::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">GlobalTransformerA</a>;</div><div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA_::SharedStoreTileTraits,</div><div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperA_::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00586"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">  586</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">SharedStoreIteratorA</a>;</div><div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">GlobalLoadIteratorA</a>,</div><div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">SharedStoreIteratorA</a>,</div><div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;                              <a class="code" href="structcutlass_1_1Copy.html">GlobalTransformerA</a>&gt;</div><div class="line"><a name="l00592"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266">  592</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266">GlobalLoadStreamA</a>;</div><div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;</div><div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperB_::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00596"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">  596</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">GlobalLoadIteratorB</a>;</div><div class="line"><a name="l00598"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">  598</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename GlobalLoadIteratorB::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">GlobalTransformerB</a>;</div><div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB_::SharedStoreTileTraits,</div><div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperB_::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00604"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">  604</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">SharedStoreIteratorB</a>;</div><div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">GlobalLoadIteratorB</a>,</div><div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">SharedStoreIteratorB</a>,</div><div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;                              <a class="code" href="structcutlass_1_1Copy.html">GlobalTransformerB</a>&gt;</div><div class="line"><a name="l00610"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83">  610</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83">GlobalLoadStreamB</a>;</div><div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;</div><div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA_::SharedLoadTileTraits,</div><div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA_::Scalar,</div><div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00617"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">  617</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">SharedLoadIteratorA</a>;</div><div class="line"><a name="l00619"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8">  619</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorA&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8">SharedLoadStreamA</a>;</div><div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB_::SharedLoadTileTraits,</div><div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB_::Scalar,</div><div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00625"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e">  625</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e">SharedLoadIteratorB</a>;</div><div class="line"><a name="l00627"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8">  627</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorB&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8">SharedLoadStreamB</a>;</div><div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;};</div><div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;</div><div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;</div><div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;    <span class="keyword">typename</span> GemmConfig_,</div><div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;    <span class="keyword">typename</span> Epilogue_,</div><div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;    <span class="comment">// The configuration for the A matrix.</span></div><div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;    <span class="keyword">typename</span> GemmTileTraitsHelperA_ = <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA&lt;kLayoutA_, GemmConfig_&gt;</a>,</div><div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;    <span class="comment">// The configuration for the B matrix.</span></div><div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;    <span class="keyword">typename</span> GemmTileTraitsHelperB_ = <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB&lt;kLayoutB_, GemmConfig_&gt;</a>,</div><div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;    <span class="comment">// The helper class to create the streams and iterators.</span></div><div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;    <span class="keyword">typename</span> Helper_ =</div><div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper&lt;GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00650"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">  650</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt;</div><div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;                                  <span class="comment">// The config.</span></div><div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;                                  GemmConfig_,</div><div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;                                  <span class="comment">// The stream to load A from global memory to shared memory.</span></div><div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;                                  typename Helper_::GlobalLoadStreamA,</div><div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;                                  <span class="comment">// The stream to load B from global memory to shared memory.</span></div><div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;                                  typename Helper_::GlobalLoadStreamB,</div><div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;                                  <span class="comment">// The stream to load A from shared memory.</span></div><div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;                                  typename Helper_::SharedLoadStreamA,</div><div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;                                  <span class="comment">// The stream to load B from shared memory.</span></div><div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;                                  typename Helper_::SharedLoadStreamB,</div><div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;                                  <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;                                  Epilogue_,</div><div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;                                  <span class="comment">// The block swizzle to reorganize the grid.</span></div><div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;                                  IdentityBlockSwizzle,</div><div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;                                  <span class="comment">// The index.</span></div><div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;                                  Index_,</div><div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;                                  <span class="comment">// The tool used to clear accumulators.</span></div><div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;                                  ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt; &gt; {</div><div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;};</div><div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;</div><div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;</div><div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage_html_afdca9ac1d28e17efaa394f5831a60c04"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#afdca9ac1d28e17efaa394f5831a60c04">cutlass::gemm::GemmTraits::SharedStorage::epilogue</a></div><div class="ttdeci">Epilogue::SharedStorage epilogue</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:555</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmDesc_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a></div><div class="ttdoc">GEMM problem description. </div><div class="ttdef"><b>Definition:</b> gemm_desc.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a9cd6c3fddfb4315eb52b672900462c47"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">cutlass::gemm::GemmTraits::GlobalLoadStreamA</a></div><div class="ttdeci">GlobalLoadStreamA_ GlobalLoadStreamA</div><div class="ttdoc">The stream to load A from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:370</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a4887b56a96694ce6350db77f78bb505f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">cutlass::gemm::GemmEpilogue::ScalarD</a></div><div class="ttdeci">GlobalStoreIteratorD::Scalar ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:85</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a50121da13661e9fa50e5ea3a87c06266"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamA</a></div><div class="ttdeci">GlobalLoadStream&lt; GemmOperand::kA, GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA &gt; GlobalLoadStreamA</div><div class="ttdoc">The stream to load A from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:592</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ae01371eb31b88fa83c4926564cecafdc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">cutlass::gemm::GemmTraits::SharedLoadStreamA</a></div><div class="ttdeci">SharedLoadStreamA_ SharedLoadStreamA</div><div class="ttdoc">The iterator for A to load from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:384</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_aa9937ec51d18aad02398d95095117978"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978">cutlass::gemm::GemmTraits::Params::shared_stream_a</a></div><div class="ttdeci">SharedLoadStreamA::Params shared_stream_a</div><div class="ttdoc">The params for the A stream from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:489</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:129</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ac393b07e780629fc8254fc22cc6f815b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">cutlass::gemm::GemmTraits::GlobalLoadStreamB</a></div><div class="ttdeci">GlobalLoadStreamB_ GlobalLoadStreamB</div><div class="ttdoc">The stream to load B from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:442</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:128</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ac393b07e780629fc8254fc22cc6f815b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">cutlass::gemm::GemmTraits::GlobalLoadStreamB</a></div><div class="ttdeci">GlobalLoadStreamB_ GlobalLoadStreamB</div><div class="ttdoc">The stream to load B from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:377</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:80</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_a8851150a49e4a9c135279c8c9dfdc592"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8851150a49e4a9c135279c8c9dfdc592">cutlass::gemm::GemmTraits::SharedLoadStream::inc_stage</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_stage()</div><div class="ttdoc">Increment the stage. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:620</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a3a20852daeb46c625b2391d078b30d73"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorA</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperA_::SharedStoreTileTraits, typename GemmTileTraitsHelperA_::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorA</div><div class="ttdoc">The iterator to store A to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:665</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a86470d3a44e2b50ee31ec3c9f79927ef"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">cutlass::gemm::GemmConfig::kScalarsPerLdsB</a></div><div class="ttdeci">static int const kScalarsPerLdsB</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:116</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_acf461f0ba3067cc5d66a04f0a176308f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">cutlass::gemm::GemmConfig::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">The numnber of threads. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:103</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a3a20852daeb46c625b2391d078b30d73"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorA</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperA_::SharedStoreTileTraits, typename GemmTileTraitsHelperA_::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorA</div><div class="ttdoc">The iterator to store A to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:586</div></div>
 <div class="ttc" id="tile__iterator_8h_html"><div class="ttname"><a href="tile__iterator_8h.html">tile_iterator.h</a></div><div class="ttdoc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a3129be75ee087603170f8367e10e070e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">cutlass::gemm::GemmTraits::ScalarD</a></div><div class="ttdeci">Epilogue::ScalarD ScalarD</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:471</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage_html"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">cutlass::gemm::GemmTraits::SharedStorage</a></div><div class="ttdoc">The storage in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:543</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a12447ce4d11601a625662f9d177cc3d8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamB</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorB &gt; SharedLoadStreamB</div><div class="ttdoc">The stream to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:700</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_aae3a008b39f9678a03192f6ff54152d8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aae3a008b39f9678a03192f6ff54152d8">cutlass::gemm::GemmTraits::Params::k</a></div><div class="ttdeci">Index k</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:483</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage_html"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmTraits::StreamSharedStorage</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:525</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a3129be75ee087603170f8367e10e070e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">cutlass::gemm::GemmTraits::ScalarD</a></div><div class="ttdeci">Epilogue::ScalarD ScalarD</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:394</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_ac4cd0b74130ffc09e4ccb7b0acba87f8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#ac4cd0b74130ffc09e4ccb7b0acba87f8">cutlass::gemm::GemmTraits::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Index m, Index n, Index k, typename Epilogue::Scalar alpha, ScalarA const *d_a, Index lda, ScalarB const *d_b, Index ldb, typename Epilogue::Scalar beta, ScalarC const *d_c, Index ldc, ScalarD *d_d, Index ldd)</div><div class="ttdoc">Helper to construct a GEMM params using a BLAS-like API. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:474</div></div>
+<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage_html"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">cutlass::gemm::GemmTraits::SharedStorage</a></div><div class="ttdoc">The storage in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:551</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a12447ce4d11601a625662f9d177cc3d8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamB</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorB &gt; SharedLoadStreamB</div><div class="ttdoc">The stream to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:627</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_a3147da380e4c1e465aba0b965ac87ab5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a3147da380e4c1e465aba0b965ac87ab5">cutlass::gemm::GemmTraits::SharedLoadStream::fetched_a</a></div><div class="ttdeci">SharedLoadStreamA::FetchedFragment fetched_a[2]</div><div class="ttdoc">The fragments to fetch A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:628</div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a8ae7db3f2f0c57779729d500386c004c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar</a></div><div class="ttdeci">GemmConfig_::ScalarB Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:283</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_acbeea56f0ce95ddd632db3482c1021e5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileAbTraits&lt; MultiplyAddScalar, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH *GemmConfig_::InstructionShape::kD &gt;, typename GlobalTileTraits::Threads, GemmConfig_::kScalarsPerStsB &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for B^T. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:383</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_acaeb27063a444e2a3b93f3cb70e3c290"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">cutlass::gemm::GemmTraits::SharedLoadStreamB</a></div><div class="ttdeci">SharedLoadStreamB_ SharedLoadStreamB</div><div class="ttdoc">The iterator for B to load from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:451</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a3633083f4f778215543e376c092745d7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">cutlass::gemm::GemmConfig::kScalarsPerStgD</a></div><div class="ttdeci">static int const kScalarsPerStgD</div><div class="ttdoc">The number of scalars per STS/LDS/STG for D. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:122</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_af25495bb0bb35bd64246d3a80fe4806f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#af25495bb0bb35bd64246d3a80fe4806f">cutlass::gemm::GemmTraits::SharedLoadStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy(int step)</div><div class="ttdoc">Trigger the copies from shared memory to registers. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:598</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a5fee0ed52326c0685e8d8295e40ce064"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kB, MatrixLayout::kColumnMajor, Scalar const, Shape&lt; 1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgB &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for B^N. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:301</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStreamPair::SharedStorage</a></div><div class="ttdoc">Defines a structure containing shared storage for each pair. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:91</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a2fcf34dcf8d89424aa15da709aed4a83"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamB</a></div><div class="ttdeci">GlobalLoadStream&lt; GemmOperand::kB, GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB &gt; GlobalLoadStreamB</div><div class="ttdoc">The stream to load B from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:610</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a8ae7db3f2f0c57779729d500386c004c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar</a></div><div class="ttdeci">GemmConfig_::ScalarB Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:201</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_acbeea56f0ce95ddd632db3482c1021e5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileAbTraits&lt; MultiplyAddScalar, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH *GemmConfig_::InstructionShape::kD &gt;, typename GlobalTileTraits::Threads, GemmConfig_::kScalarsPerStsB &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for B^T. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:304</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></div><div class="ttdef"><b>Definition:</b> gemm_coord.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_aa6214a0ad09d155ed79feadc6647b989"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">cutlass::gemm::GemmTraits::This_</a></div><div class="ttdeci">GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt; This_</div><div class="ttdoc">This traits. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:359</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_acaeb27063a444e2a3b93f3cb70e3c290"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">cutlass::gemm::GemmTraits::SharedLoadStreamB</a></div><div class="ttdeci">SharedLoadStreamB_ SharedLoadStreamB</div><div class="ttdoc">The iterator for B to load from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:386</div></div>
+<div class="ttc" id="kernel__launch_8h_html"><div class="ttname"><a href="kernel__launch_8h.html">kernel_launch.h</a></div><div class="ttdoc">Defines structures and helpers to launch CUDA kernels within CUTLASS. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a367aa0bd4be33d90ffe752274c728ef8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">cutlass::gemm::GemmTraits::GlobalLoadStream</a></div><div class="ttdeci">GlobalLoadStreamPair&lt; GlobalLoadStreamA, GlobalLoadStreamB, GemmConfig::kResidueInProlog &gt; GlobalLoadStream</div><div class="ttdoc">Assemble the global load streams for A/B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:407</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a5fee0ed52326c0685e8d8295e40ce064"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kB, MatrixLayout::kColumnMajor, Scalar const, Shape&lt; 1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgB &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for B^N. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:219</div></div>
 <div class="ttc" id="structcutlass_1_1Copy_html"><div class="ttname"><a href="structcutlass_1_1Copy.html">cutlass::Copy</a></div><div class="ttdef"><b>Definition:</b> convert.h:69</div></div>
-<div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_a8e68561561ac6b08efbfd116903198c8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8">cutlass::gemm::GemmTraits::SharedLoadStream::stream_a</a></div><div class="ttdeci">SharedLoadStreamA stream_a</div><div class="ttdoc">The stream for A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:626</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_aa5ebe3a857b55412a86ec65ad1c55dd8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamA</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorA &gt; SharedLoadStreamA</div><div class="ttdoc">The stream to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:692</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage_html_af8f0050e818b788402526857afc7c919"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#af8f0050e818b788402526857afc7c919">cutlass::gemm::GemmTraits::MainLoopSharedStorage::threadblock_tile</a></div><div class="ttdeci">ThreadblockTileStorage threadblock_tile</div><div class="ttdoc">Stores the threadblock tile. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:541</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_aa5ebe3a857b55412a86ec65ad1c55dd8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamA</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorA &gt; SharedLoadStreamA</div><div class="ttdoc">The stream to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:619</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">cutlass::gemm::GemmSharedStoreTileAbTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:38</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_ad8f262d7da093d07cdd5c6a4fd9aceea"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">cutlass::gemm::GemmConfig::ScalarC</a></div><div class="ttdeci">ScalarC_ ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:86</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream_html_ae033f55779b45b4228f40a4d699062bb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ae033f55779b45b4228f40a4d699062bb">cutlass::gemm::GemmTraits::GlobalLoadStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy()</div><div class="ttdoc">Trigger the copies from shared memory to registers. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:566</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_af534fc5698513af3c6724b68ae03316d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileATraits&lt; MultiplyAddScalar const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsA, 0 &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for A^N. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:199</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a424f1ac14e1e7ad37428edd0cf13e7fe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">cutlass::gemm::GemmTraits::Epilogue</a></div><div class="ttdeci">Epilogue_ Epilogue</div><div class="ttdoc">The epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:468</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a96d64bdc48db4971798b620d6b49b3f6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">cutlass::gemm::GemmTraits::ScalarA</a></div><div class="ttdeci">GlobalLoadStreamA_::Scalar ScalarA</div><div class="ttdoc">The scalar for A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:439</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_adc95f4a8617cdf28e5b5d7d2d1aefec2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kA, MatrixLayout::kColumnMajor, Scalar const, Shape&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgA &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for A^N. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:165</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_abb6ba58a2f2d80db0b2c9c1d88454efd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">cutlass::gemm::GemmConfig::Warps</a></div><div class="ttdeci">ShapeDiv&lt; OutputTile, AccumulatorsPerWarp &gt;::Shape Warps</div><div class="ttdoc">The number of warps. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:102</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_af511f0ff83166b2a77d4cad4150c8e8f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar</a></div><div class="ttdeci">GemmConfig_::ScalarA Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:147</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:198</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a438b80cd8d8df0e74014ae47a162f7ed"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">cutlass::gemm::GemmTraits::SharedStoreStorageB</a></div><div class="ttdeci">GlobalLoadStreamB::SharedStoreStorage SharedStoreStorageB</div><div class="ttdoc">The shared storage for B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:457</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:159</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a8f78d4a68817760099081523aa7fd443"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">cutlass::gemm::GemmTraits::ScalarC</a></div><div class="ttdeci">Epilogue::ScalarC ScalarC</div><div class="ttdoc">The scalars in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:470</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_aad467ed9a680b4d77acecb096799cd89"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamB</a></div><div class="ttdeci">GlobalLoadStream&lt; GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB &gt; GlobalLoadStreamB</div><div class="ttdoc">The stream to load B from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:683</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_a1fdc6af44c14c88a94529d187fda176d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d">cutlass::gemm::GemmTraits::SharedLoadStream::stream_b</a></div><div class="ttdeci">SharedLoadStreamB stream_b</div><div class="ttdoc">The stream for B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:632</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html">cutlass::gemm::GemmTraits::SharedLoadStream</a></div><div class="ttdoc">Assemble the shared load stream for A/B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:590</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream_html_acc287ce5e2f3635d9d55d91914d2d04c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c">cutlass::gemm::GemmTraits::GlobalLoadStream::stream_b</a></div><div class="ttdeci">GlobalLoadStreamB stream_b</div><div class="ttdoc">The stream for B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:586</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_af810544e956b04830c5be7ce41d3b45c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">cutlass::gemm::GemmTraits::MultiplyAdd</a></div><div class="ttdeci">GemmConfig::MultiplyAdd MultiplyAdd</div><div class="ttdoc">The multiply-add functor. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:463</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a475463c1e3af71598e22da8956900ebe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">cutlass::gemm::GemmTraits::shared_load_fence</a></div><div class="ttdeci">static CUTLASS_DEVICE void shared_load_fence(bool in_loop)</div><div class="ttdoc">The memory fence for shared loads. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:640</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a4efe5d156abca056ef8b5334fb574dd5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">cutlass::gemm::GemmTraits::GemmConfig</a></div><div class="ttdeci">GemmConfig_ GemmConfig</div><div class="ttdoc">The configuration. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:430</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:161</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_a9369a5f819d2a42997491e0df96f47ef"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a9369a5f819d2a42997491e0df96f47ef">cutlass::gemm::GemmTraits::SharedLoadStream::transformed_b</a></div><div class="ttdeci">SharedLoadStreamB::TransformedFragment transformed_b[2]</div><div class="ttdoc">The fragments to transform B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:636</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:273</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream_html_a82a59524b5d3134eb609d280193a5c47"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47">cutlass::gemm::GemmTraits::GlobalLoadStream::stream_a</a></div><div class="ttdeci">GlobalLoadStreamA stream_a</div><div class="ttdoc">The stream for A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:584</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a1125408805bc697755f2b16594c6c8e1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileATraits&lt; MultiplyAddScalar const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsA, SharedStoreTileTraits::kSkew &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for A^T. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:267</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_af534fc5698513af3c6724b68ae03316d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileATraits&lt; MultiplyAddScalar const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsA, 0 &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for A^N. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:114</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a424f1ac14e1e7ad37428edd0cf13e7fe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">cutlass::gemm::GemmTraits::Epilogue</a></div><div class="ttdeci">Epilogue_ Epilogue</div><div class="ttdoc">The epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:391</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a96d64bdc48db4971798b620d6b49b3f6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">cutlass::gemm::GemmTraits::ScalarA</a></div><div class="ttdeci">GlobalLoadStreamA_::Scalar ScalarA</div><div class="ttdoc">The scalar for A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:374</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_adc95f4a8617cdf28e5b5d7d2d1aefec2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kA, MatrixLayout::kColumnMajor, Scalar const, Shape&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgA &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for A^N. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:80</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a8dba1bcd9ddab830bc121afc728296c3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3">cutlass::gemm::GemmTraits::Params::global_to_shared_stream</a></div><div class="ttdeci">GlobalLoadStream::Params global_to_shared_stream</div><div class="ttdoc">Parameters object for the global load stream. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:422</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_af511f0ff83166b2a77d4cad4150c8e8f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar</a></div><div class="ttdeci">GemmConfig_::ScalarA Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:200</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:163</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a8f78d4a68817760099081523aa7fd443"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">cutlass::gemm::GemmTraits::ScalarC</a></div><div class="ttdeci">Epilogue::ScalarC ScalarC</div><div class="ttdoc">The scalars in the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:393</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_af810544e956b04830c5be7ce41d3b45c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">cutlass::gemm::GemmTraits::MultiplyAdd</a></div><div class="ttdeci">GemmConfig::MultiplyAdd MultiplyAdd</div><div class="ttdoc">The multiply-add functor. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:389</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a475463c1e3af71598e22da8956900ebe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">cutlass::gemm::GemmTraits::shared_load_fence</a></div><div class="ttdeci">static CUTLASS_DEVICE void shared_load_fence(bool in_loop)</div><div class="ttdoc">The memory fence for shared loads. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:559</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a4efe5d156abca056ef8b5334fb574dd5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">cutlass::gemm::GemmTraits::GemmConfig</a></div><div class="ttdeci">GemmConfig_ GemmConfig</div><div class="ttdoc">The configuration. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:365</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:191</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators.html">cutlass::gemm::ClearAccumulators</a></div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:38</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage_html_a0173fcc8856b17a52cc5eee845f101fa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa">cutlass::gemm::GemmTraits::MainLoopSharedStorage::stream_b</a></div><div class="ttdeci">StreamSharedStorage&lt; GlobalLoadStreamB, SharedLoadStreamB &gt; stream_b</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:537</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:481</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a2e0a043c5d4d7959ec1a2214c3ac39ac"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">cutlass::gemm::GemmConfig::kScalarsPerLdgA</a></div><div class="ttdeci">static int const kScalarsPerLdgA</div><div class="ttdoc">The number of scalars per LDG/STS/LDS for A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:109</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_aa28f34fb0c4bf739246d92c2fef80e0b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#aa28f34fb0c4bf739246d92c2fef80e0b">cutlass::gemm::GemmTraits::SharedLoadStream::fragment_b</a></div><div class="ttdeci">CUTLASS_DEVICE SharedLoadStreamB::Fragment const  &amp; fragment_b(int step) const</div><div class="ttdoc">The fragment B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:615</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a437070ba4a214aee363315d6019e450c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerB</a></div><div class="ttdeci">Copy&lt; typename GlobalLoadIteratorB::Fragment &gt; GlobalTransformerB</div><div class="ttdoc">The data converter for B before storing to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:674</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a7639ccd7f6419a9f232db173a228e756"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar</a></div><div class="ttdeci">GemmConfig_::ScalarB Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:351</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html">cutlass::MatrixLayout</a></div><div class="ttdoc">Describes layouts of matrices. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:35</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a362794738bc14b283a91558bcadbbfd5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorB</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperB_::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorB</div><div class="ttdoc">The global iterator to load B from global memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:672</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:302</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">cutlass::gemm::GemmTraits::MainLoopSharedStorage</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:533</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream_html_a405b93680bb6e356369863244d0b56aa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a405b93680bb6e356369863244d0b56aa">cutlass::gemm::GemmTraits::GlobalLoadStream::residue</a></div><div class="ttdeci">CUTLASS_DEVICE void residue(Index k, bool skip_clear=false)</div><div class="ttdoc">Execute the residue code. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:578</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a2fadb0ad2e28109ccfa9195e817a4d54"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">cutlass::gemm::GemmConfig::Accumulators</a></div><div class="ttdeci">MultiplyAdd::Accumulators Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ae1cf7988c9cff79a2c3252aaf91fc165"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">cutlass::gemm::GemmTraits::ClearAccumulators</a></div><div class="ttdeci">ClearAccumulators_ ClearAccumulators</div><div class="ttdoc">Clear the accumulators. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:478</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:44</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a8160a260acce2362e90d43bce733c69d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kA, MatrixLayout::kRowMajor, Scalar const, Shape&lt; 1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgA &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for A^T. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:228</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits::Params</a></div><div class="ttdoc">Parameters object constructable on the host. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:416</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a></div><div class="ttdoc">Collect the global load streams for multiplicands. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:173</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a437070ba4a214aee363315d6019e450c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerB</a></div><div class="ttdeci">Copy&lt; typename GlobalLoadIteratorB::Fragment &gt; GlobalTransformerB</div><div class="ttdoc">The data converter for B before storing to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:598</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a7639ccd7f6419a9f232db173a228e756"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar</a></div><div class="ttdeci">GemmConfig_::ScalarB Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:272</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params_html_a12b5e3e21137480047b8b0f55cbf7258"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">cutlass::gemm::GlobalLoadStreamPair::Params::stream_b</a></div><div class="ttdeci">StreamB::Params stream_b</div><div class="ttdoc">Parameters object for StreamB. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:67</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1Gemm_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a></div><div class="ttdef"><b>Definition:</b> gemm.h:92</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html">cutlass::MatrixLayout</a></div><div class="ttdoc">Defines data layouts of various matrix formats usable by TensorRef and other classes. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:156</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a362794738bc14b283a91558bcadbbfd5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorB</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperB_::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorB</div><div class="ttdoc">The global iterator to load B from global memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:596</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a600746def904eeca46d7f92a4b223b46"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">cutlass::gemm::GemmConfig::kResidueInProlog</a></div><div class="ttdeci">static bool const kResidueInProlog</div><div class="ttdoc">If true, residue is computed in the prologue. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:136</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:399</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">cutlass::gemm::GemmTraits::MainLoopSharedStorage</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:539</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a></div><div class="ttdoc">Collect the global load streams for multiplicands. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aedb95febe4a0b2943e233c95c36a22cd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">cutlass::gemm::GemmConfig::MultiplyAdd</a></div><div class="ttdeci">MultiplyAdd_ MultiplyAdd</div><div class="ttdoc">The functor to do D = A*B + C. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="tile__allocation_8h_html"><div class="ttname"><a href="tile__allocation_8h.html">tile_allocation.h</a></div><div class="ttdoc">Defines a fragment based on a Shape&lt;&gt; template. </div></div>
+<div class="ttc" id="structcutlass_1_1KernelLaunchConfiguration_html"><div class="ttname"><a href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></div><div class="ttdoc">Structure containing the basic launch configuration of a CUDA kernel. </div><div class="ttdef"><b>Definition:</b> kernel_launch.h:38</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ae1cf7988c9cff79a2c3252aaf91fc165"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">cutlass::gemm::GemmTraits::ClearAccumulators</a></div><div class="ttdeci">ClearAccumulators_ ClearAccumulators</div><div class="ttdoc">Clear the accumulators. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:401</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:45</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a8160a260acce2362e90d43bce733c69d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kA, MatrixLayout::kRowMajor, Scalar const, Shape&lt; 1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgA &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for A^T. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:143</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">cutlass::gemm::GlobalLoadStreamPair::Params</a></div><div class="ttdoc">Parameters object. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:62</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
 <div class="ttc" id="gemm__operand_8h_html"><div class="ttname"><a href="gemm__operand_8h.html">gemm_operand.h</a></div><div class="ttdoc">Defines constant expressions for mapping GEMM problem size and strides onto pitch-linear memory...</div></div>
-<div class="ttc" id="structcutlass_1_1ShapeDiv_html_a108ded386ef6708afc6fe769a77a234b"><div class="ttname"><a href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">cutlass::ShapeDiv::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD/B_::kD, A_::kH/B_::kH, A_::kW/B_::kW, A_::kC/B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:126</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_ac0c8c027e3ede14b62d7c7d519551f21"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">cutlass::gemm::GemmConfig::kScalarsPerStsB</a></div><div class="ttdeci">static int const kScalarsPerStsB</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:115</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_af2233a6ebf39788e27f051f8c614ab90"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">cutlass::gemm::GemmTraits::Params::problem_size</a></div><div class="ttdeci">GemmCoord problem_size</div><div class="ttdoc">GEMM problem size. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:419</div></div>
+<div class="ttc" id="gemm__desc_8h_html"><div class="ttname"><a href="gemm__desc_8h.html">gemm_desc.h</a></div><div class="ttdoc">Implements a software-pipelined efficient GEMM. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a95314e9a9279c4870f37f68a2357e064"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a95314e9a9279c4870f37f68a2357e064">cutlass::gemm::GemmTraits::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Index m, Index n, Index k, typename Epilogue::Scalar alpha, ScalarA const *d_a, Index lda, long long int batch_stride_A, ScalarB const *d_b, Index ldb, long long int batch_stride_B, typename Epilogue::Scalar beta, ScalarC const *d_c, Index ldc, long long int batch_stride_C, ScalarD *d_d, Index ldd, long long int batch_stride_D, Index batch_count)</div><div class="ttdoc">Helper to construct a batched GEMM params. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:501</div></div>
 <div class="ttc" id="clear__accumulators_8h_html"><div class="ttname"><a href="clear__accumulators_8h.html">clear_accumulators.h</a></div><div class="ttdoc">Defines abstractions for efficiently clearing accumulator tiles. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:79</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html">cutlass::gemm::GemmTraits::GlobalLoadStream</a></div><div class="ttdoc">Assemble the global load streams for A/B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:551</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a3087cdd38e2c65ad0dffdd0587d2cce0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">cutlass::gemm::GemmConfig::kScalarsPerStsD</a></div><div class="ttdeci">static int const kScalarsPerStsD</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:123</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ac3c840a3d90c0da43301761af83c2c9f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">cutlass::gemm::GemmTraits::shared_store_fence</a></div><div class="ttdeci">static CUTLASS_DEVICE void shared_store_fence(bool in_loop)</div><div class="ttdoc">The memory fence for shared stores. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:648</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_ac618881d66790e4c280dc5692e5ddf95"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar</a></div><div class="ttdeci">GemmConfig_::ScalarA Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:210</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:137</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a40023f0ffdd8bee4ccbcaac28222e983"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">cutlass::gemm::GemmTraits::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const &amp;desc)</div><div class="ttdoc">Initialize the parameters. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:497</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage_html_a3c2980547310ec4307f3a5f9817dfc51"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#a3c2980547310ec4307f3a5f9817dfc51">cutlass::gemm::GemmTraits::StreamSharedStorage::global</a></div><div class="ttdeci">GlobalLoadStream_::SharedStorage global</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:527</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IdentityBlockSwizzle_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></div><div class="ttdef"><b>Definition:</b> identity_block_swizzle.h:37</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_aaa198fed841af6bf26bf2e9544d0a877"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileAbTraits&lt; MultiplyAddScalar, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW *GemmConfig_::InstructionShape::kD &gt;, typename GlobalTileTraits::Threads, GemmConfig_::kScalarsPerStsA &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for A^N. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:179</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aa13d6f5e5ad907ef09c88ae49e6e8e9b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">cutlass::gemm::GemmConfig::ScalarB</a></div><div class="ttdeci">ScalarB_ ScalarB</div><div class="ttdoc">The scalar for B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:84</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_aad14588b1515e37ede24915f589d32ab"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:353</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a42dd312d4cf5bb53b472389897f9deeb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:285</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_aa0e8fd28f5247764dfb7843f7670c698"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">cutlass::gemm::GemmTraits::ScalarB</a></div><div class="ttdeci">GlobalLoadStreamB_::Scalar ScalarB</div><div class="ttdoc">The scalar for B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:446</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html"><div class="ttname"><a href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a></div><div class="ttdef"><b>Definition:</b> tensor_ref.h:131</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a7864969e774c0f7155951e1ab599ed17"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">cutlass::gemm::GemmTraits::SharedStream</a></div><div class="ttdeci">SharedStreamPair&lt; SharedLoadStreamA, SharedLoadStreamB &gt; SharedStream</div><div class="ttdoc">Assemble the shared load streams for A/B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:413</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ac3c840a3d90c0da43301761af83c2c9f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">cutlass::gemm::GemmTraits::shared_store_fence</a></div><div class="ttdeci">static CUTLASS_DEVICE void shared_store_fence(bool in_loop)</div><div class="ttdoc">The memory fence for shared stores. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:567</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_ac618881d66790e4c280dc5692e5ddf95"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar</a></div><div class="ttdeci">GemmConfig_::ScalarA Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:125</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a></div><div class="ttdoc">Manages a pair of tile allocations as if they are one allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:100</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a40023f0ffdd8bee4ccbcaac28222e983"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">cutlass::gemm::GemmTraits::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const &amp;desc)</div><div class="ttdoc">Initialize the parameters. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:432</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IdentityBlockSwizzle_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_aaa198fed841af6bf26bf2e9544d0a877"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileAbTraits&lt; MultiplyAddScalar, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW *GemmConfig_::InstructionShape::kD &gt;, typename GlobalTileTraits::Threads, GemmConfig_::kScalarsPerStsA &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for A^N. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_aad14588b1515e37ede24915f589d32ab"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:274</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a42dd312d4cf5bb53b472389897f9deeb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:203</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_aa0e8fd28f5247764dfb7843f7670c698"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">cutlass::gemm::GemmTraits::ScalarB</a></div><div class="ttdeci">GlobalLoadStreamB_::Scalar ScalarB</div><div class="ttdoc">The scalar for B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:381</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a8d49ad32fc9d8c14f6141690962c3f9c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">cutlass::gemm::GemmTraits::SharedStoreStorageA</a></div><div class="ttdeci">GlobalLoadStreamA::SharedStoreStorage SharedStoreStorageA</div><div class="ttdoc">The shared storage for A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:454</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a448c242880183e006b70d839d210a2ec"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamA</a></div><div class="ttdeci">GlobalLoadStream&lt; GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA &gt; GlobalLoadStreamA</div><div class="ttdoc">The stream to load A from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:668</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:428</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a51d583dfcd645ad0ecfc23b87b3c5108"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">cutlass::gemm::GemmConfig::AccumulatorsPerWarp</a></div><div class="ttdeci">MultiplyAdd::AccumulatorsPerWarp AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:97</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_a883b28ca237b1ec076856232cfee0c6f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a883b28ca237b1ec076856232cfee0c6f">cutlass::gemm::GemmTraits::SharedLoadStream::transformed_a</a></div><div class="ttdeci">SharedLoadStreamA::TransformedFragment transformed_a[2]</div><div class="ttdoc">The fragments to transform A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:630</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage_html_afabd328b106d45b156200f73942d211e"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#afabd328b106d45b156200f73942d211e">cutlass::gemm::GemmTraits::StreamSharedStorage::shared</a></div><div class="ttdeci">SharedLoadStream_::SharedStorage shared</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:529</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a46affe35cb16874de5a2b9777aedf596"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596">cutlass::gemm::GemmTraits::Params::global_stream_b</a></div><div class="ttdeci">GlobalLoadStreamB::Params global_stream_b</div><div class="ttdoc">The params for the B stream. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:487</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_a837fbec1d47ae45480941de6290889c0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a837fbec1d47ae45480941de6290889c0">cutlass::gemm::GemmTraits::SharedLoadStream::fetched_b</a></div><div class="ttdeci">SharedLoadStreamB::FetchedFragment fetched_b[2]</div><div class="ttdoc">The fragments to fetch B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:634</div></div>
+<div class="ttc" id="gemm__config_8h_html"><div class="ttname"><a href="gemm__config_8h.html">gemm_config.h</a></div><div class="ttdoc">Defines properties of GEMM computation that impose some constraints on caller. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:349</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aad47c635a73e83bd4b19494864832d31"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">cutlass::gemm::GemmConfig::kScalarsPerLdgC</a></div><div class="ttdeci">static int const kScalarsPerLdgC</div><div class="ttdoc">The number of scalars per LDG for C. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:119</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a188ef7f4c49ff2830753218343a1b8f8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">cutlass::gemm::GemmConfig::ScalarD</a></div><div class="ttdeci">ScalarD_ ScalarD</div><div class="ttdoc">The scalar for D. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:88</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a0b2be601de08848afc4418adb97255bf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">cutlass::gemm::GemmConfig::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">The numnber of threads. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:106</div></div>
-<div class="ttc" id="identity__block__swizzle_8h_html"><div class="ttname"><a href="identity__block__swizzle_8h.html">identity_block_swizzle.h</a></div><div class="ttdoc">Defies functors for mapping blockIdx to partitions of the GEMM computation. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_aaf27c0f2f4ab730ed5c865e9f7d2373b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aaf27c0f2f4ab730ed5c865e9f7d2373b">cutlass::gemm::GemmTraits::Params::m</a></div><div class="ttdeci">Index m</div><div class="ttdoc">The dimensions of the GEMM. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:483</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a50672b5fa67d858aeff8f254cf28e941"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">cutlass::gemm::GemmTraits::BlockSwizzle</a></div><div class="ttdeci">BlockSwizzle_ BlockSwizzle</div><div class="ttdoc">The block swizzle to reorganize the grid. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:474</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a365aed4c0e2ad1bffea517ee36998557"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorA</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperA_::SharedLoadTileTraits, typename GemmTileTraitsHelperA_::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorA</div><div class="ttdoc">The iterator to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:690</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a4de905aadc734df69fd0db83f01be56e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorB</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperB_::SharedLoadTileTraits, typename GemmTileTraitsHelperB_::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorB</div><div class="ttdoc">The iterator to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:698</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_a49315aea1c54d84ff19b0ac215128b95"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a49315aea1c54d84ff19b0ac215128b95">cutlass::gemm::GemmTraits::SharedLoadStream::SharedLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE SharedLoadStream(Params const &amp;params, SharedStorage &amp;shared_storage)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:592</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream_html_ab2961b4db0694cf128d55d38a98db575"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ab2961b4db0694cf128d55d38a98db575">cutlass::gemm::GemmTraits::GlobalLoadStream::GlobalLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE GlobalLoadStream(Params const &amp;params, SharedStorage &amp;shared_storage, dim3 const &amp;block)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:553</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_abb0741601652df8fdf927d49c2c0e4d0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">cutlass::gemm::GemmEpilogue::ScalarC</a></div><div class="ttdeci">GlobalLoadIteratorC::Scalar ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:96</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ae67227cecbe84f5c8497d9a7ff82b367"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">cutlass::gemm::GemmTraits::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:476</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a19fb8c9b9a77aebec507635de7da6f21"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:149</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a43713f534798b1e27c4ba38b72e63c08"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorB</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperB_::SharedStoreTileTraits, typename GemmTileTraitsHelperB_::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorB</div><div class="ttdoc">The iterator to store B to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:680</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a073430a1e8b124aec8a1f1e00f262bc8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">cutlass::gemm::GemmTraits::Params::epilogue</a></div><div class="ttdeci">Epilogue::Params epilogue</div><div class="ttdoc">The params for the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:493</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a575bcff901d69ae3f46987222f23ab64"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64">cutlass::gemm::GemmTraits::Params::global_stream_a</a></div><div class="ttdeci">GlobalLoadStreamA::Params global_stream_a</div><div class="ttdoc">The params for the A stream. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:485</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a28c32832f0353f00e93e867373cf6cae"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">cutlass::gemm::GemmTraits::KernelClass</a></div><div class="ttdeci">cutlass::gemm::Gemm&lt; This_ &gt; KernelClass</div><div class="ttdoc">The struct that consumes this Traits. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:362</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a50e9cc382a32abd5beab299a79b30b27"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a50e9cc382a32abd5beab299a79b30b27">cutlass::gemm::GemmTraits::Params::shared_stream</a></div><div class="ttdeci">SharedStream::Params shared_stream</div><div class="ttdoc">Parameters object for the shared load stream. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:425</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aae7128f5522383c857d2639031b64c30"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; VectorizedTile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a50672b5fa67d858aeff8f254cf28e941"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">cutlass::gemm::GemmTraits::BlockSwizzle</a></div><div class="ttdeci">BlockSwizzle_ BlockSwizzle</div><div class="ttdoc">The block swizzle to reorganize the grid. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:397</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a365aed4c0e2ad1bffea517ee36998557"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorA</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperA_::SharedLoadTileTraits, typename GemmTileTraitsHelperA_::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorA</div><div class="ttdoc">The iterator to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:617</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a4de905aadc734df69fd0db83f01be56e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorB</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperB_::SharedLoadTileTraits, typename GemmTileTraitsHelperB_::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorB</div><div class="ttdoc">The iterator to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:625</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_abfecd4a57dfbf82e8fa74a50e01fc4ee"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">cutlass::gemm::GemmTraits::ThreadblockTileStorage</a></div><div class="ttdeci">GlobalLoadStream::ThreadblockTileStorage ThreadblockTileStorage</div><div class="ttdoc">Memory needed to store the threadblock-scoped GEMM tile. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:410</div></div>
+<div class="ttc" id="structcutlass_1_1KernelLaunchConfiguration_html_a09535026bf08f94c6940c358d95d1edd"><div class="ttname"><a href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">cutlass::KernelLaunchConfiguration::block</a></div><div class="ttdeci">dim3 block</div><div class="ttdoc">CUDA threablock dimensions. </div><div class="ttdef"><b>Definition:</b> kernel_launch.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_abb0741601652df8fdf927d49c2c0e4d0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">cutlass::gemm::GemmEpilogue::ScalarC</a></div><div class="ttdeci">GlobalLoadIteratorC::Scalar ScalarC</div><div class="ttdoc">The scalar for C. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:83</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ae67227cecbe84f5c8497d9a7ff82b367"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">cutlass::gemm::GemmTraits::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:399</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a19fb8c9b9a77aebec507635de7da6f21"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a43713f534798b1e27c4ba38b72e63c08"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorB</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperB_::SharedStoreTileTraits, typename GemmTileTraitsHelperB_::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorB</div><div class="ttdoc">The iterator to store B to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:604</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a073430a1e8b124aec8a1f1e00f262bc8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">cutlass::gemm::GemmTraits::Params::epilogue</a></div><div class="ttdeci">Epilogue::Params epilogue</div><div class="ttdoc">The params for the epilogue. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:428</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="gemm__stream__pair_8h_html"><div class="ttname"><a href="gemm__stream__pair_8h.html">gemm_stream_pair.h</a></div><div class="ttdoc">Defines a pair of GEMM tile streams. </div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">cutlass::gemm::ClearAccumulators::SharedStorage</a></div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> clear_accumulators.h:40</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_ade2d85507dec77591e66276339a1eef5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#ade2d85507dec77591e66276339a1eef5">cutlass::gemm::GemmTraits::SharedLoadStream::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit(int step)</div><div class="ttdoc">Commit the data. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:604</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_adaf2ee5b8e6f7bdb9939cd45a186ca56"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">cutlass::gemm::GemmConfig::kScalarsPerLdsD</a></div><div class="ttdeci">static int const kScalarsPerLdsD</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:124</div></div>
 <div class="ttc" id="gemm__global__stream_8h_html"><div class="ttname"><a href="gemm__global__stream_8h.html">gemm_global_stream.h</a></div><div class="ttdoc">Implements efficient loading of the thread block-level tile from global memory and storing to shared ...</div></div>
-<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage_html_aa5dd7edc3cffa785eb1e5b62c18c74c4"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">cutlass::gemm::GemmTraits::SharedStorage::main_loop</a></div><div class="ttdeci">MainLoopSharedStorage main_loop</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:545</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ac5bb5931a707ed7672f69267753ba41b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">cutlass::gemm::GemmTraits::kLayoutA</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayoutA</div><div class="ttdoc">The layout of A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:437</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a53450f4d7444d6a4c0d2353496c0a4fd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">cutlass::gemm::GemmConfig::OutputTile</a></div><div class="ttdeci">OutputTile_ OutputTile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:91</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a849b21fed39aaac1cdd546334739be97"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">cutlass::gemm::GemmConfig::kScalarsPerLdgB</a></div><div class="ttdeci">static int const kScalarsPerLdgB</div><div class="ttdoc">The number of scalars per LDG/STS/LDS for B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:114</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:654</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a29bd05960cc541bb67098f5483c84cf6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; Tile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:87</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a5687850f235d644a4820851880740d27"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorA</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperA_::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorA</div><div class="ttdoc">The global iterator to load A from global memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:657</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a97d7ee63e5d180410b370f095648f367"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">cutlass::gemm::GemmTraits::OutputTile</a></div><div class="ttdeci">GemmConfig::OutputTile OutputTile</div><div class="ttdoc">The output tile. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:432</div></div>
+<div class="ttc" id="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage_html_aa5dd7edc3cffa785eb1e5b62c18c74c4"><div class="ttname"><a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4">cutlass::gemm::GemmTraits::SharedStorage::main_loop</a></div><div class="ttdeci">MainLoopSharedStorage main_loop</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:553</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_ac5bb5931a707ed7672f69267753ba41b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">cutlass::gemm::GemmTraits::kLayoutA</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayoutA</div><div class="ttdoc">The layout of A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:372</div></div>
+<div class="ttc" id="structcutlass_1_1KernelLaunchConfiguration_html_ab86ba1464dd9c6cd15ae0de4a552201b"><div class="ttname"><a href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">cutlass::KernelLaunchConfiguration::grid</a></div><div class="ttdeci">dim3 grid</div><div class="ttdoc">CUDA grid dimensions. </div><div class="ttdef"><b>Definition:</b> kernel_launch.h:41</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage_html_a61fcc63cb0df6754eef16f5cf138f3a2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a61fcc63cb0df6754eef16f5cf138f3a2">cutlass::gemm::GemmTraits::MainLoopSharedStorage::global_to_shared_stream</a></div><div class="ttdeci">GlobalLoadStream::SharedStorage global_to_shared_stream</div><div class="ttdoc">Storage for GEMM global stream. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:544</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">cutlass::gemm::SharedStreamPair::Params</a></div><div class="ttdoc">Parameters object passed to load iterators. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:185</div></div>
+<div class="ttc" id="threadblock__swizzle_8h_html"><div class="ttname"><a href="threadblock__swizzle_8h.html">threadblock_swizzle.h</a></div><div class="ttdoc">Defies functors for mapping blockIdx to partitions of the GEMM computation. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:575</div></div>
+<div class="ttc" id="gemm_8h_html"><div class="ttname"><a href="gemm_8h.html">gemm.h</a></div><div class="ttdoc">Implements a software-pipelined efficient GEMM. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_a5687850f235d644a4820851880740d27"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorA</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperA_::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorA</div><div class="ttdoc">The global iterator to load A from global memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:578</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a97d7ee63e5d180410b370f095648f367"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">cutlass::gemm::GemmTraits::OutputTile</a></div><div class="ttdeci">GemmConfig::OutputTile OutputTile</div><div class="ttdoc">The output tile. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:367</div></div>
 <div class="ttc" id="matrix__traits_8h_html"><div class="ttname"><a href="matrix__traits_8h.html">matrix_traits.h</a></div><div class="ttdoc">Defines properties of matrices used to denote layout and operands to GEMM kernels. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_af9a98d39d6959a9641f7c3c90df2f98e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerA</a></div><div class="ttdeci">Copy&lt; typename GlobalLoadIteratorA::Fragment &gt; GlobalTransformerA</div><div class="ttdoc">The data converter for A before storing to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:659</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream_html_a6dc512be014b9d849057e2fd4c0b0485"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a6dc512be014b9d849057e2fd4c0b0485">cutlass::gemm::GemmTraits::GlobalLoadStream::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit()</div><div class="ttdoc">Commit the data. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:572</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a9335aca8b152ff1167763de8ff8fb882"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileBTraits&lt; MultiplyAddScalar const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsB, 0 &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for B^T. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:403</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage_html_a5513254af1f9979b6d0b9f236c3e7325"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">cutlass::gemm::GemmTraits::MainLoopSharedStorage::clear</a></div><div class="ttdeci">ClearAccumulators::SharedStorage clear</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:539</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage_html_a62d3dcf5d97a0a896b2033e55dfb0811"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811">cutlass::gemm::GemmTraits::MainLoopSharedStorage::stream_a</a></div><div class="ttdeci">StreamSharedStorage&lt; GlobalLoadStreamA, SharedLoadStreamA &gt; stream_a</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:535</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_afbc41e7b98097b153fd27a48f073a877"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kB, MatrixLayout::kRowMajor, Scalar const, Shape&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgB &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for B^T. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:369</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper_html_af9a98d39d6959a9641f7c3c90df2f98e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerA</a></div><div class="ttdeci">Copy&lt; typename GlobalLoadIteratorA::Fragment &gt; GlobalTransformerA</div><div class="ttdoc">The data converter for A before storing to shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:580</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a9335aca8b152ff1167763de8ff8fb882"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileBTraits&lt; MultiplyAddScalar const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsB, 0 &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for B^T. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:324</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage_html_a5513254af1f9979b6d0b9f236c3e7325"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">cutlass::gemm::GemmTraits::MainLoopSharedStorage::clear</a></div><div class="ttdeci">ClearAccumulators::SharedStorage clear</div><div class="ttdoc">Storage for clearing accumulators. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:547</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params_html_a235c77b257b93dace812d2f7b9340705"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">cutlass::gemm::GlobalLoadStreamPair::Params::stream_a</a></div><div class="ttdeci">StreamA::Params stream_a</div><div class="ttdoc">Parameters object for StreamA. </div><div class="ttdef"><b>Definition:</b> gemm_stream_pair.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_afbc41e7b98097b153fd27a48f073a877"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kB, MatrixLayout::kRowMajor, Scalar const, Shape&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgB &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for B^T. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:290</div></div>
 <div class="ttc" id="gemm__shared__stream_8h_html"><div class="ttname"><a href="gemm__shared__stream_8h.html">gemm_shared_stream.h</a></div><div class="ttdoc">Defines abstractions for managing loading and storing fragments to shared memory in the efficient GEM...</div></div>
-<div class="ttc" id="structcutlass_1_1ShapeCount_html"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html">cutlass::ShapeCount</a></div><div class="ttdoc">Compute derived counted of a Layout Concept based class. </div><div class="ttdef"><b>Definition:</b> shape.h:79</div></div>
 <div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1Params_html_a78f22007632937bbd5f3dab7b097477d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d">cutlass::gemm::GemmTraits::Params::shared_stream_b</a></div><div class="ttdeci">SharedLoadStreamB::Params shared_stream_b</div><div class="ttdoc">The params for the B stream from shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:491</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">cutlass::gemm::SimplifiedGemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:723</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream_html_a4a8c64d85aa012e3689dd024c486924b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a4a8c64d85aa012e3689dd024c486924b">cutlass::gemm::GemmTraits::SharedLoadStream::fragment_a</a></div><div class="ttdeci">CUTLASS_DEVICE SharedLoadStreamA::Fragment const  &amp; fragment_a(int step) const</div><div class="ttdoc">The fragment A. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:610</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a078e8d9cfa1b182e1b96a2cc8c54b684"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">cutlass::gemm::GemmTraits::kLayoutB</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayoutB</div><div class="ttdoc">The layout of B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:444</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a9dd092bca2f1f2c039f367b23bafa9c1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">cutlass::gemm::GemmConfig::kAccumulatorsPerLdsB</a></div><div class="ttdeci">static int const kAccumulatorsPerLdsB</div><div class="ttdef"><b>Definition:</b> gemm_traits.h:128</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a221949c289057e39d439ce03a5b01c52"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">cutlass::gemm::GemmConfig::kStages</a></div><div class="ttdeci">static int const kStages</div><div class="ttdoc">The number of stages in shared memory to implement double, triple, more-buffering. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:131</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:620</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_aa83190df3c1639b6dd632cd4b9278d77"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerWarp</a></div><div class="ttdeci">ShapeMul&lt; AccumulatorsPerThread, ThreadsPerWarp &gt;::Shape AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:51</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_afac6f7a62b24396ea6861e6fd10779cc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:212</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">cutlass::gemm::SimplifiedGemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:650</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a9dd9c3efc3dfd9b5c6acd12236697399"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">cutlass::gemm::GemmConfig::OutputTile</a></div><div class="ttdeci">OutputTile_ OutputTile</div><div class="ttdoc">The tile. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html_a078e8d9cfa1b182e1b96a2cc8c54b684"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">cutlass::gemm::GemmTraits::kLayoutB</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayoutB</div><div class="ttdoc">The layout of B. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:379</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:836</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_afac6f7a62b24396ea6861e6fd10779cc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:127</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/globals.html b/docs/globals.html
index ddd387b2f..9cc3adf29 100644
--- a/docs/globals.html
+++ b/docs/globals.html
@@ -102,6 +102,9 @@ $(function() {
 <li>CUTLASS_ASSERT
 : <a class="el" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">cutlass.h</a>
 </li>
+<li>CUTLASS_GEMM_LOOP
+: <a class="el" href="cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71">cutlass.h</a>
+</li>
 <li>CUTLASS_HOST_DEVICE
 : <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">cutlass.h</a>
 </li>
@@ -123,15 +126,15 @@ $(function() {
 <li>CUTLASS_VERSION
 : <a class="el" href="cutlass_8h.html#aa3040eddf073214969f9445bfa925039">cutlass.h</a>
 </li>
+<li>DebugTypeFunc()
+: <a class="el" href="cutlass_8h.html#ab7e23b523490567225b20e2c72649f20">cutlass.h</a>
+</li>
 <li>noexcept
 : <a class="el" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">platform.h</a>
 </li>
 <li>nullptr
 : <a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">platform.h</a>
 </li>
-<li>operator&lt;&lt;()
-: <a class="el" href="core__io_8h.html#a4a0d84a2a19a11549b87a2328d58690d">core_io.h</a>
-</li>
 <li>static_assert
 : <a class="el" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">platform.h</a>
 </li>
@@ -139,7 +142,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/globals_defs.html b/docs/globals_defs.html
index d1df12cbe..383021401 100644
--- a/docs/globals_defs.html
+++ b/docs/globals_defs.html
@@ -102,6 +102,9 @@ $(function() {
 <li>CUTLASS_ASSERT
 : <a class="el" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">cutlass.h</a>
 </li>
+<li>CUTLASS_GEMM_LOOP
+: <a class="el" href="cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71">cutlass.h</a>
+</li>
 <li>CUTLASS_HOST_DEVICE
 : <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">cutlass.h</a>
 </li>
@@ -136,7 +139,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/globals_func.html b/docs/globals_func.html
index 6f910b764..5a2824395 100644
--- a/docs/globals_func.html
+++ b/docs/globals_func.html
@@ -69,14 +69,14 @@ $(function() {
 
 <div class="contents">
 &#160;<ul>
-<li>operator&lt;&lt;()
-: <a class="el" href="core__io_8h.html#a4a0d84a2a19a11549b87a2328d58690d">core_io.h</a>
+<li>DebugTypeFunc()
+: <a class="el" href="cutlass_8h.html#ab7e23b523490567225b20e2c72649f20">cutlass.h</a>
 </li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/group__IdentityBlockSwizzle.html b/docs/group__IdentityBlockSwizzle.html
new file mode 100644
index 000000000..e201fdccd
--- /dev/null
+++ b/docs/group__IdentityBlockSwizzle.html
@@ -0,0 +1,84 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Identity Block Swizzle</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="header">
+  <div class="headertitle">
+<div class="title">Identity Block Swizzle</div>  </div>
+</div><!--header-->
+<div class="contents">
+<p>Block Swizzle provides the mapping logic between a block in the physical memory of Matrix C and Thread Block Identiy Block Swizzle effective maps blocks in leading dimension order (column major) with thread block in leading dimension order (blockIdx.x) blockIdx.z is mapped with batch_count for batched GEMM </p>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/group__fragment__concept.html b/docs/group__fragment__concept.html
index 85e357276..11f0b2100 100644
--- a/docs/group__fragment__concept.html
+++ b/docs/group__fragment__concept.html
@@ -80,6 +80,9 @@ Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">A template defining <a class="el" href="group__fragment__concept.html">Fragment Concept</a>.  <a href="structcutlass_1_1Fragment.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">A template defining <a class="el" href="group__fragment__concept.html">Fragment Concept</a>.  <a href="structcutlass_1_1ZipFragment.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
 <p><a class="el" href="group__fragment__concept.html">Fragment Concept</a> is a statically sized array for storing parts of tiles held by individual CUDA threads.</p>
@@ -94,7 +97,7 @@ Classes</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/group__fragment__iterator__concept.html b/docs/group__fragment__iterator__concept.html
index dc89e72e5..e08d36e44 100644
--- a/docs/group__fragment__iterator__concept.html
+++ b/docs/group__fragment__iterator__concept.html
@@ -91,7 +91,7 @@ Classes</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/group__layout__concept.html b/docs/group__layout__concept.html
index 3fe8532c8..66a828819 100644
--- a/docs/group__layout__concept.html
+++ b/docs/group__layout__concept.html
@@ -100,7 +100,7 @@ Classes</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/group__predicate__iterator__concept.html b/docs/group__predicate__iterator__concept.html
index 95c1ef2ef..9c3b71084 100644
--- a/docs/group__predicate__iterator__concept.html
+++ b/docs/group__predicate__iterator__concept.html
@@ -98,7 +98,7 @@ Classes</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/group__predicate__tile__adapter.html b/docs/group__predicate__tile__adapter.html
index a4b809922..8ab28fed9 100644
--- a/docs/group__predicate__tile__adapter.html
+++ b/docs/group__predicate__tile__adapter.html
@@ -80,7 +80,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/group__predicate__vector__concept.html b/docs/group__predicate__vector__concept.html
index 5147870e6..cf4fd5b2a 100644
--- a/docs/group__predicate__vector__concept.html
+++ b/docs/group__predicate__vector__concept.html
@@ -92,7 +92,7 @@ Classes</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/group__tile__load__iterator__concept.html b/docs/group__tile__load__iterator__concept.html
index 2bc4b4e34..edc492818 100644
--- a/docs/group__tile__load__iterator__concept.html
+++ b/docs/group__tile__load__iterator__concept.html
@@ -77,7 +77,7 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">An iterator implementing <a class="el" href="group__tile__load__iterator__concept.html">Tile Load Iterator Concept</a> for loading a tile from memory.  <a href="structcutlass_1_1TileLoadIterator.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
@@ -96,7 +96,7 @@ Classes</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/group__tile__store__iterator__concept.html b/docs/group__tile__store__iterator__concept.html
index bde540531..992a7ca39 100644
--- a/docs/group__tile__store__iterator__concept.html
+++ b/docs/group__tile__store__iterator__concept.html
@@ -77,7 +77,7 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">An iterator implementing <a class="el" href="group__tile__store__iterator__concept.html">Tile Store Iterator Concept</a> for storing a tile to memory.  <a href="structcutlass_1_1TileStoreIterator.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
@@ -96,7 +96,7 @@ Classes</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/group__tile__traits__concept.html b/docs/group__tile__traits__concept.html
index 16e4bd8ae..6c0516967 100644
--- a/docs/group__tile__traits__concept.html
+++ b/docs/group__tile__traits__concept.html
@@ -77,7 +77,7 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">A template defining <a class="el" href="group__tile__traits__concept.html">Tile Traits Concept</a>.  <a href="structcutlass_1_1TileTraits.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
@@ -93,7 +93,7 @@ Classes</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/hgemm__global__tile_8h.html b/docs/hgemm__global__tile_8h.html
index b62b8c143..0b2e247f5 100644
--- a/docs/hgemm__global__tile_8h.html
+++ b/docs/hgemm__global__tile_8h.html
@@ -82,10 +82,10 @@ $(function() {
 
 <p>Tile traits used to construct global tile iterator for HGEMM. This is intended to partition the thread block-level tile into 2D subtiles loaded by the threads and facilitate memory accesses larger than 16 bits.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&quot;</code><br />
 </div>
 <p><a href="hgemm__global__tile_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -107,7 +107,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/hgemm__global__tile_8h_source.html b/docs/hgemm__global__tile_8h_source.html
index bdd647d1a..8d7e02f65 100644
--- a/docs/hgemm__global__tile_8h_source.html
+++ b/docs/hgemm__global__tile_8h_source.html
@@ -76,34 +76,34 @@ $(function() {
 <div class="title">hgemm_global_tile.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="hgemm__global__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> kOperand_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;          <span class="keyword">typename</span> Threads_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;          <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">   48</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;                                            <span class="comment">// Which GEMM operand?</span></div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;                                            kOperand_,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;                                            <span class="comment">// The layout.</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;                                            kLayout_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;                                            <span class="comment">// The scalar.</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;                                            Scalar_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;                                            <span class="comment">// The tile.</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;                                            Tile_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;                                            <span class="comment">// The threads.</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;                                            Threads_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                                            <span class="comment">// The number of scalars per LDG/STG.</span></div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                                            kAccessSize_&gt; {</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741">   62</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits&lt;kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741">Base</a>;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">   64</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Base::Threads</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">Threads</a>;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a6eee97f03dcea1c441116e143cf58018">   66</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 2, Base::Tile::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a6eee97f03dcea1c441116e143cf58018">ThreadsDelta</a>;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e">   68</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;Base::Threads::kH * 2, 1, Base::Threads::kW, Base::kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e">Delta</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;Base::Tile::kH / Base::Threads::kH / 2,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                2,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                Base::Tile::kW / Base::Threads::kW,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                Base::Tile::kC / <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a>&gt;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#aa9b46937bea47d071d277aa212dd610b">   74</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#aa9b46937bea47d071d277aa212dd610b">Iterations</a>;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html">   76</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81">   78</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">ThreadsDelta::kH</a>;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    }</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  };</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;};</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<a href="hgemm__global__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> kOperand_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;          <span class="keyword">typename</span> Threads_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;          <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">   48</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;                                            <span class="comment">// Which GEMM operand?</span></div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;                                            kOperand_,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;                                            <span class="comment">// The layout.</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;                                            kLayout_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;                                            <span class="comment">// The scalar.</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;                                            Scalar_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;                                            <span class="comment">// The tile.</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;                                            Tile_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;                                            <span class="comment">// The threads.</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;                                            Threads_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                                            <span class="comment">// The number of scalars per LDG/STG.</span></div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                                            kAccessSize_&gt; {</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741">   62</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits&lt;kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741">Base</a>;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">   64</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Base::Threads</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">Threads</a>;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a61907b1afa07c12de74545d2e23a4281">   66</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 2, Base::VectorizedTile::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a61907b1afa07c12de74545d2e23a4281">ThreadsDelta</a>;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e">   68</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;Base::Threads::kH * 2, 1, Base::Threads::kW, Base::kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e">Delta</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;Base::VectorizedTile::kH / Base::Threads::kH / 2,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                2,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                Base::VectorizedTile::kW / Base::Threads::kW,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                Base::VectorizedTile::kC / <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a>&gt;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a2dc8573498bcda33273b86db76dbd511">   74</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a2dc8573498bcda33273b86db76dbd511">Iterations</a>;</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html">   76</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81">   78</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">ThreadsDelta::kH</a>;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    }</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  };</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;};</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_html_a2dc8573498bcda33273b86db76dbd511"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a2dc8573498bcda33273b86db76dbd511">cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Iterations</a></div><div class="ttdeci">Shape&lt; Base::VectorizedTile::kH/Base::Threads::kH/2, 2, Base::VectorizedTile::kW/Base::Threads::kW, Base::VectorizedTile::kC/Base::kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:74</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:70</div></div>
 <div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_html_aa9b46937bea47d071d277aa212dd610b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#aa9b46937bea47d071d277aa212dd610b">cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Iterations</a></div><div class="ttdeci">Shape&lt; Base::Tile::kH/Base::Threads::kH/2, 2, Base::Tile::kW/Base::Threads::kW, Base::Tile::kC/Base::kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:74</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_html_a61907b1afa07c12de74545d2e23a4281"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a61907b1afa07c12de74545d2e23a4281">cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadsDelta</a></div><div class="ttdeci">Shape&lt; 1, 2, Base::VectorizedTile::kC &gt; ThreadsDelta</div><div class="ttdoc">The threads strides. </div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:66</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_html_ae7a4f120805421ac0712604723612b7e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Threads</a></div><div class="ttdeci">Base::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:64</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a3a20d9062bba613c160bb2cd14f80a5e"><div class="ttname"><a href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">cutlass::Shape::kH</a></div><div class="ttdeci">static int const kH</div><div class="ttdoc">The height of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:68</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset_html_a9fc1ca09733113f80fe5fe45db3d9b81"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81">cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:78</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_html_a8f8de5a6811b77f0c721cd78a237223e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e">cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Delta</a></div><div class="ttdeci">Shape&lt; Base::Threads::kH *2, 1, Base::Threads::kW, Base::kAccessSize &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:68</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_html_a6eee97f03dcea1c441116e143cf58018"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a6eee97f03dcea1c441116e143cf58018">cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadsDelta</a></div><div class="ttdeci">Shape&lt; 1, 2, Base::Tile::kC &gt; ThreadsDelta</div><div class="ttdoc">The threads strides. </div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:66</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_html_ac0c372c24c4c5340153b11edab874741"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741">cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Base</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:62</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:48</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
 <div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aae7128f5522383c857d2639031b64c30"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; VectorizedTile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:88</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a78836a20250ff24c25a6622ad818b421"><div class="ttname"><a href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">cutlass::Shape::kW</a></div><div class="ttdeci">static int const kW</div><div class="ttdoc">The width of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aa001e09b246fdd8259cbda6a500cad5f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">cutlass::gemm::GemmGlobalTileTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:80</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:76</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a29bd05960cc541bb67098f5483c84cf6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; Tile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:87</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="matrix__traits_8h_html"><div class="ttname"><a href="matrix__traits_8h.html">matrix_traits.h</a></div><div class="ttdoc">Defines properties of matrices used to denote layout and operands to GEMM kernels. </div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/hgemm__multiply__add_8h.html b/docs/hgemm__multiply__add_8h.html
index 3c6c609e8..41ba8db9e 100644
--- a/docs/hgemm__multiply__add_8h.html
+++ b/docs/hgemm__multiply__add_8h.html
@@ -82,15 +82,15 @@ $(function() {
 
 <p>Specialization implementing multiply-add operation on half-precision floating point fragments.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="thread__multiply__add_8h_source.html">cutlass/gemm/thread_multiply_add.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="thread__multiply__add_8h_source.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</code><br />
 </div>
 <p><a href="hgemm__multiply__add_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#details">More...</a><br /></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -103,7 +103,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/hgemm__multiply__add_8h_source.html b/docs/hgemm__multiply__add_8h_source.html
index 73ef90409..40e849bfb 100644
--- a/docs/hgemm__multiply__add_8h_source.html
+++ b/docs/hgemm__multiply__add_8h_source.html
@@ -76,30 +76,31 @@ $(function() {
 <div class="title">hgemm_multiply_add.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="hgemm__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="thread__multiply__add_8h.html">cutlass/gemm/thread_multiply_add.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> AccumulatorsPerThread_, <span class="keyword">typename</span> ThreadsPerWarp_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">   42</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt;AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half&gt; {</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa56cdefa659af5ce4efd493b94bafdfd">   44</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, 2, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa56cdefa659af5ce4efd493b94bafdfd">InstructionShape</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a98d0f84730551eaabfe7404b36478b50">   46</a></span>&#160;  <span class="keyword">typedef</span> AccumulatorsPerThread_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a98d0f84730551eaabfe7404b36478b50">AccumulatorsPerThread</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa784f29ff453c1656fdea8270454fa55">   48</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa784f29ff453c1656fdea8270454fa55">ThreadsPerWarp</a>;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af0c856abdd9f7f26f671493cc629bf0a">   50</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">ShapeMul&lt;AccumulatorsPerThread, ThreadsPerWarp&gt;::Shape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af0c856abdd9f7f26f671493cc629bf0a">AccumulatorsPerWarp</a>;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a236a408791a38358cbadf19dd0e8ed9f">   52</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a236a408791a38358cbadf19dd0e8ed9f">ScalarA</a>;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1daf96b6d152c5cf32f248bbfd605b74">   54</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarA, AccumulatorsPerThread::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1daf96b6d152c5cf32f248bbfd605b74">FragmentA</a>;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac7557562de1108bf1abc10829c83e88f">   56</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac7557562de1108bf1abc10829c83e88f">ScalarB</a>;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae79e7fc5be2f4c8d30ca83edc151f63a">   58</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarB, AccumulatorsPerThread::kH&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae79e7fc5be2f4c8d30ca83edc151f63a">FragmentB</a>;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af1a6d91d4734683ea791bf57f3c3bbb0">   60</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af1a6d91d4734683ea791bf57f3c3bbb0">ScalarC</a>;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a505306c2af2059f6e84ba32d701d1602">   62</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;half, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a505306c2af2059f6e84ba32d701d1602">Accumulators</a>;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(AccumulatorsPerThread::kH % 2 == 0, <span class="stringliteral">&quot;Invalid size&quot;</span>);</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(AccumulatorsPerThread::kW % 2 == 0, <span class="stringliteral">&quot;Invalid size&quot;</span>);</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#acec155117a56c942c5e695984b0f072d">   69</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#acec155117a56c942c5e695984b0f072d">ThreadMultiplyAdd</a>() {}</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a66486d38349fa20eb065ae9542eb43aa">   72</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a66486d38349fa20eb065ae9542eb43aa">multiply_add</a>(<a class="code" href="structcutlass_1_1Fragment.html">FragmentA</a> <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">FragmentB</a> <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a> <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a>&amp; d) {</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; __CUDA_ARCH__ &gt;= 530</span></div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    __half2 <span class="keyword">const</span>* a_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;a[0]);</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    __half2 <span class="keyword">const</span>* b_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;b[0]);</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    __half2 <span class="keyword">const</span>* c_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;c[0]);</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    <span class="comment">// The output.</span></div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    __half2* d_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2*<span class="keyword">&gt;</span>(&amp;d[0]);</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; AccumulatorsPerThread::kH / 2; ++j) {</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; AccumulatorsPerThread::kW / 2; ++i) {</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;        <span class="comment">// The offsets in the output fragment.</span></div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> k0 = (2 * j + 0) * (AccumulatorsPerThread::kW / 2) + i;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> k1 = (2 * j + 1) * (AccumulatorsPerThread::kW / 2) + i;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;        <span class="comment">// Compute the product a[i] * b[j].H0_H0.</span></div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;        d_half2[k0] = __hfma2(a_half2[i], __low2half2(b_half2[j]), c_half2[k0]);</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;        <span class="comment">// Compute the product a[i] * b[j].H1_H1.</span></div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;        d_half2[k1] = __hfma2(a_half2[i], __high2half2(b_half2[j]), c_half2[k1]);</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;      }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    }</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  }</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;};</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a236a408791a38358cbadf19dd0e8ed9f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a236a408791a38358cbadf19dd0e8ed9f">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ScalarA</a></div><div class="ttdeci">half ScalarA</div><div class="ttdoc">The type for A. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:52</div></div>
+<a href="hgemm__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__multiply__add_8h.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ThreadGemmShape_, <span class="keyword">typename</span> ThreadsPerWarp_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">   42</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt;ThreadGemmShape_, ThreadsPerWarp_, half, half, half&gt; {</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e">   44</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, 2, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e">InstructionShape</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">   46</a></span>&#160;  <span class="keyword">typedef</span> ThreadGemmShape_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">ThreadGemmShape</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a">   48</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">ThreadGemmShape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a">AccumulatorsPerThread</a>;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">   50</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">ThreadsPerWarp</a>;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7">   52</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">ShapeMul&lt;ThreadGemmShape, ThreadsPerWarp&gt;::Shape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7">AccumulatorsPerWarp</a>;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">   54</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">ScalarA</a>;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">   56</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarA, AccumulatorsPerThread::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">FragmentA</a>;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">   58</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">ScalarB</a>;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">   60</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarB, AccumulatorsPerThread::kH&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">FragmentB</a>;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d">   62</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d">ScalarC</a>;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">   64</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;half, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">Accumulators</a>;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(AccumulatorsPerThread::kH % 2 == 0, <span class="stringliteral">&quot;Invalid size&quot;</span>);</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(AccumulatorsPerThread::kW % 2 == 0, <span class="stringliteral">&quot;Invalid size&quot;</span>);</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a32b234c873ffe44090a12e12d871024c">   71</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a32b234c873ffe44090a12e12d871024c">ThreadMultiplyAdd</a>() {}</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aaf8ea4aaf393488f03ba7fb7af264940">   74</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aaf8ea4aaf393488f03ba7fb7af264940">multiply_add</a>(<a class="code" href="structcutlass_1_1Fragment.html">FragmentA</a> <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">FragmentB</a> <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a> <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a>&amp; d) {</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; __CUDA_ARCH__ &gt;= 530</span></div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    __half2 <span class="keyword">const</span>* a_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;a[0]);</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    __half2 <span class="keyword">const</span>* b_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;b[0]);</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    __half2 <span class="keyword">const</span>* c_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2 const*<span class="keyword">&gt;</span>(&amp;c[0]);</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="comment">// The output.</span></div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    __half2* d_half2 = <span class="keyword">reinterpret_cast&lt;</span>__half2*<span class="keyword">&gt;</span>(&amp;d[0]);</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; AccumulatorsPerThread::kH / 2; ++j) {</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; AccumulatorsPerThread::kW / 2; ++i) {</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;        <span class="comment">// The offsets in the output fragment.</span></div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> k0 = (2 * j + 0) * (AccumulatorsPerThread::kW / 2) + i;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> k1 = (2 * j + 1) * (AccumulatorsPerThread::kW / 2) + i;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;        <span class="comment">// Compute the product a[i] * b[j].low.</span></div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;        d_half2[k0] = __hfma2(a_half2[i], __low2half2(b_half2[j]), c_half2[k0]);</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;        <span class="comment">// Compute the product a[i] * b[j].high.</span></div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;        d_half2[k1] = __hfma2(a_half2[i], __high2half2(b_half2[j]), c_half2[k1]);</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;      }</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    }</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  }</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;};</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a32b234c873ffe44090a12e12d871024c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a32b234c873ffe44090a12e12d871024c">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ThreadMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE ThreadMultiplyAdd()</div><div class="ttdoc">Make sure there&amp;#39;s an even number of elements in both dimensions. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:71</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a48a641d601c88d95aa542b636f94d60d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ScalarC</a></div><div class="ttdeci">half ScalarC</div><div class="ttdoc">The type for C and D. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:62</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a505306c2af2059f6e84ba32d701d1602"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a505306c2af2059f6e84ba32d701d1602">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::Accumulators</a></div><div class="ttdeci">Fragment&lt; half, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW &gt; Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_af0c856abdd9f7f26f671493cc629bf0a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af0c856abdd9f7f26f671493cc629bf0a">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerWarp</a></div><div class="ttdeci">ShapeMul&lt; AccumulatorsPerThread, ThreadsPerWarp &gt;::Shape AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:50</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_af1a6d91d4734683ea791bf57f3c3bbb0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af1a6d91d4734683ea791bf57f3c3bbb0">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ScalarC</a></div><div class="ttdeci">half ScalarC</div><div class="ttdoc">The type for C and D. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:60</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_acec155117a56c942c5e695984b0f072d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#acec155117a56c942c5e695984b0f072d">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ThreadMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE ThreadMultiplyAdd()</div><div class="ttdoc">Make sure there&amp;#39;s an even number of elements in both dimensions. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_ae8f4db1465f5e082c6855bf13a4751c7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::FragmentB</a></div><div class="ttdeci">Fragment&lt; ScalarB, AccumulatorsPerThread::kH &gt; FragmentB</div><div class="ttdoc">The fragment for B. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_ac095b403212e23cb95e70cee9013099e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ThreadGemmShape</a></div><div class="ttdeci">ThreadGemmShape_ ThreadGemmShape</div><div class="ttdoc">The number of accumulators per thread. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a70dfd2f33548dbd104d798f728526fbc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ScalarB</a></div><div class="ttdeci">half ScalarB</div><div class="ttdoc">The type for B. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:58</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeMul_html_a8875fc5e861339f981360ed774e8cc94"><div class="ttname"><a href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">cutlass::ShapeMul::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD *B_::kD, A_::kH *B_::kH, A_::kW *B_::kW, A_::kC *B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:119</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
 <div class="ttc" id="thread__multiply__add_8h_html"><div class="ttname"><a href="thread__multiply__add_8h.html">thread_multiply_add.h</a></div><div class="ttdoc">Template implementing matrix multiply-add operations on fragments. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_aa56cdefa659af5ce4efd493b94bafdfd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa56cdefa659af5ce4efd493b94bafdfd">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::InstructionShape</a></div><div class="ttdeci">Shape&lt; 1, 1, 2, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:44</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_ac7557562de1108bf1abc10829c83e88f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac7557562de1108bf1abc10829c83e88f">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ScalarB</a></div><div class="ttdeci">half ScalarB</div><div class="ttdoc">The type for B. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:56</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_aa784f29ff453c1656fdea8270454fa55"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa784f29ff453c1656fdea8270454fa55">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The number of threads per warp. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:48</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a98d0f84730551eaabfe7404b36478b50"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a98d0f84730551eaabfe7404b36478b50">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerThread</a></div><div class="ttdeci">AccumulatorsPerThread_ AccumulatorsPerThread</div><div class="ttdoc">The number of accumulators per thread. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:46</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a66486d38349fa20eb065ae9542eb43aa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a66486d38349fa20eb065ae9542eb43aa">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:72</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a245bdf059794144d04d2823d2b39588e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::InstructionShape</a></div><div class="ttdeci">Shape&lt; 1, 1, 2, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_aacb9a5a1d8f3b6e21bc449b0b97949b7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerWarp</a></div><div class="ttdeci">ShapeMul&lt; ThreadGemmShape, ThreadsPerWarp &gt;::Shape AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a1889bdc9e88265a8afdaeeca217a3372"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::FragmentA</a></div><div class="ttdeci">Fragment&lt; ScalarA, AccumulatorsPerThread::kW &gt; FragmentA</div><div class="ttdoc">The fragment for A. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:56</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_af8124acb485709dba1c5378faa24516c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::Accumulators</a></div><div class="ttdeci">Fragment&lt; half, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW &gt; Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_aaf8ea4aaf393488f03ba7fb7af264940"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aaf8ea4aaf393488f03ba7fb7af264940">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:74</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a1a8f6feed85c7e88b36bc1a2637c716f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ScalarA</a></div><div class="ttdeci">half ScalarA</div><div class="ttdoc">The type for A. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:54</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a24dd9fdc54b001840e8b82664b3bfe3a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerThread</a></div><div class="ttdeci">ThreadGemmShape AccumulatorsPerThread</div><div class="ttdoc">Aliased for compatibility. Will be removed for CUTLASS v2.0. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a61ed3d8bb4ca6db39d16b632f58d75dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The number of threads per warp. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:50</div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_a1daf96b6d152c5cf32f248bbfd605b74"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1daf96b6d152c5cf32f248bbfd605b74">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::FragmentA</a></div><div class="ttdeci">Fragment&lt; ScalarA, AccumulatorsPerThread::kW &gt; FragmentA</div><div class="ttdoc">The fragment for A. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:54</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4_html_ae79e7fc5be2f4c8d30ca83edc151f63a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae79e7fc5be2f4c8d30ca83edc151f63a">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::FragmentB</a></div><div class="ttdeci">Fragment&lt; ScalarB, AccumulatorsPerThread::kH &gt; FragmentB</div><div class="ttdoc">The fragment for B. </div><div class="ttdef"><b>Definition:</b> hgemm_multiply_add.h:58</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/hgemm__swizzle_8h.html b/docs/hgemm__swizzle_8h.html
index aef7ac75e..93938799b 100644
--- a/docs/hgemm__swizzle_8h.html
+++ b/docs/hgemm__swizzle_8h.html
@@ -83,7 +83,7 @@ $(function() {
 <p>Transposes a tile of 16b elements. Used by HGEMM to construct a K-strided layout in shared memory for multiplicands.  
 <a href="#details">More...</a></p>
 <div class="textblock"><code>#include &lt;cuda_fp16.h&gt;</code><br />
-<code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
+<code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
 </div>
 <p><a href="hgemm__swizzle_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -102,7 +102,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/hgemm__swizzle_8h_source.html b/docs/hgemm__swizzle_8h_source.html
index bb76b510c..d882c10f3 100644
--- a/docs/hgemm__swizzle_8h_source.html
+++ b/docs/hgemm__swizzle_8h_source.html
@@ -76,14 +76,14 @@ $(function() {
 <div class="title">hgemm_swizzle.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="hgemm__swizzle_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;cuda_fp16.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GlobalIterator_&gt;</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">   40</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">HgemmSwizzle</a> {</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642">   42</a></span>&#160;  <span class="keyword">typedef</span> GlobalIterator_ <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642">GlobalIterator</a>;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">   44</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalIterator::Fragment <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4">   46</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalIterator::FragmentShape <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4">FragmentShape</a>;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ab5fab63d83eb0444c08bda16491d2627">   49</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ab5fab63d83eb0444c08bda16491d2627">InputFragment</a>;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a9c04f0b0eb0293325f661b72168d4fa8">   51</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a9c04f0b0eb0293325f661b72168d4fa8">OutputFragment</a>;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;typename Fragment::Element, half&gt;::value</a>), <span class="stringliteral">&quot;Works on half&quot;</span>);</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(FragmentShape::kH == 2 &amp;&amp; <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> == 2, <span class="stringliteral">&quot;Not multiple of 2&quot;</span>);</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ac3c52e0fee9b37a3dfc39ca168a63d36">   60</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ac3c52e0fee9b37a3dfc39ca168a63d36">HgemmSwizzle</a>() {}</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26">   63</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26">transform</a>(<a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a>&amp; dst) {</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="comment">// Expose src/dst as int arrays.</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* src_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;src[0]);</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    <span class="keywordtype">int</span>* dst_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span>*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="comment">// Transpose the data.</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; FragmentShape::kD; ++d) {</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;      <span class="comment">// The indices to read two consecutive &quot;rows&quot;.</span></div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> i0 = 2 * d + 0;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> i1 = 2 * d + 1;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <span class="keywordtype">int</span> a0 = src_int[i0];</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <span class="keywordtype">int</span> a1 = src_int[i1];</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordtype">int</span> b0, b1;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b0) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x7632;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b1) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;      <span class="comment">// The indices to store with &quot;strides&quot;.</span></div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> j0 = 0 * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kDhw</a> / 2) + d;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> j1 = 1 * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kDhw</a> / 2) + d;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      dst_int[j0] = b0;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      dst_int[j1] = b1;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    }</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  }</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;};</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1HgemmSwizzle_html_a56d3f2606f9464ec57aa61aae378c642"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642">cutlass::gemm::HgemmSwizzle::GlobalIterator</a></div><div class="ttdeci">GlobalIterator_ GlobalIterator</div><div class="ttdoc">The global iterator. </div><div class="ttdef"><b>Definition:</b> hgemm_swizzle.h:42</div></div>
+<a href="hgemm__swizzle_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;cuda_fp16.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GlobalIterator_&gt;</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">   40</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">HgemmSwizzle</a> {</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642">   42</a></span>&#160;  <span class="keyword">typedef</span> GlobalIterator_ <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642">GlobalIterator</a>;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">   44</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalIterator::Fragment <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4">   46</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalIterator::FragmentShape <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4">FragmentShape</a>;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ab5fab63d83eb0444c08bda16491d2627">   49</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ab5fab63d83eb0444c08bda16491d2627">InputFragment</a>;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a9c04f0b0eb0293325f661b72168d4fa8">   51</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a9c04f0b0eb0293325f661b72168d4fa8">OutputFragment</a>;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;typename Fragment::Element, half&gt;::value</a>), <span class="stringliteral">&quot;Works on half&quot;</span>);</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(FragmentShape::kH == 2 &amp;&amp; <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> == 2, <span class="stringliteral">&quot;Not multiple of 2&quot;</span>);</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ac3c52e0fee9b37a3dfc39ca168a63d36">   60</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ac3c52e0fee9b37a3dfc39ca168a63d36">HgemmSwizzle</a>() {}</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26">   63</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26">transform</a>(<a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">Fragment</a>&amp; dst) {</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="comment">// Expose src/dst as int arrays.</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* src_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;src[0]);</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    <span class="keywordtype">int</span>* dst_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span>*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="comment">// Transpose the data.</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; FragmentShape::kD; ++d) {</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;      <span class="comment">// The indices to read two consecutive &quot;rows&quot;.</span></div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> i0 = 2 * d + 0;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> i1 = 2 * d + 1;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <span class="keywordtype">int</span> a0 = src_int[i0];</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <span class="keywordtype">int</span> a1 = src_int[i1];</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordtype">int</span> b0, b1;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b0) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x7632;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b1) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;      <span class="comment">// The indices to store with &quot;strides&quot;.</span></div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> j0 = 0 * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kDhw</a> / 2) + d;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> j1 = 1 * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kDhw</a> / 2) + d;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      dst_int[j0] = b0;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      dst_int[j1] = b1;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    }</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  }</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;};</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1HgemmSwizzle_html_a56d3f2606f9464ec57aa61aae378c642"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642">cutlass::gemm::HgemmSwizzle::GlobalIterator</a></div><div class="ttdeci">GlobalIterator_ GlobalIterator</div><div class="ttdoc">The global iterator. </div><div class="ttdef"><b>Definition:</b> hgemm_swizzle.h:42</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:412</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:420</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmSwizzle_html_ac3c52e0fee9b37a3dfc39ca168a63d36"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ac3c52e0fee9b37a3dfc39ca168a63d36">cutlass::gemm::HgemmSwizzle::HgemmSwizzle</a></div><div class="ttdeci">CUTLASS_DEVICE HgemmSwizzle()</div><div class="ttdoc">The src/dst must be half fragments. </div><div class="ttdef"><b>Definition:</b> hgemm_swizzle.h:60</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmSwizzle_html_ad467ce744bf9d478900fb2661d7a1c26"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26">cutlass::gemm::HgemmSwizzle::transform</a></div><div class="ttdeci">CUTLASS_DEVICE void transform(Fragment const &amp;src, Fragment &amp;dst)</div><div class="ttdoc">Transform a fragment. </div><div class="ttdef"><b>Definition:</b> hgemm_swizzle.h:63</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmSwizzle_html_ab5fab63d83eb0444c08bda16491d2627"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#ab5fab63d83eb0444c08bda16491d2627">cutlass::gemm::HgemmSwizzle::InputFragment</a></div><div class="ttdeci">Fragment InputFragment</div><div class="ttdoc">The input fragment. </div><div class="ttdef"><b>Definition:</b> hgemm_swizzle.h:49</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmSwizzle_html_a9c04f0b0eb0293325f661b72168d4fa8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a9c04f0b0eb0293325f661b72168d4fa8">cutlass::gemm::HgemmSwizzle::OutputFragment</a></div><div class="ttdeci">Fragment OutputFragment</div><div class="ttdoc">The output fragment. </div><div class="ttdef"><b>Definition:</b> hgemm_swizzle.h:51</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmSwizzle_html_a82dc6d9a10de7aba9a69e6025b2cc2b7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7">cutlass::gemm::HgemmSwizzle::Fragment</a></div><div class="ttdeci">GlobalIterator::Fragment Fragment</div><div class="ttdoc">The source fragment. </div><div class="ttdef"><b>Definition:</b> hgemm_swizzle.h:44</div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmSwizzle_html_afe44fedcf24b90c0cf6ac7d1495b89e4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4">cutlass::gemm::HgemmSwizzle::FragmentShape</a></div><div class="ttdeci">GlobalIterator::FragmentShape FragmentShape</div><div class="ttdoc">The shape of the source fragment. </div><div class="ttdef"><b>Definition:</b> hgemm_swizzle.h:46</div></div>
@@ -92,7 +92,7 @@ $(function() {
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/hgemm__traits_8h.html b/docs/hgemm__traits_8h.html
index 283ceb750..bb8e72d99 100644
--- a/docs/hgemm__traits_8h.html
+++ b/docs/hgemm__traits_8h.html
@@ -82,23 +82,23 @@ $(function() {
 
 <p>Defies structural properties of half-precision GEMM computation.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__epilogue_8h_source.html">cutlass/gemm/gemm_epilogue.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__epilogue__traits_8h_source.html">cutlass/gemm/gemm_epilogue_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__traits_8h_source.html">cutlass/gemm/gemm_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="hgemm__global__tile_8h_source.html">cutlass/gemm/hgemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="hgemm__multiply__add_8h_source.html">cutlass/gemm/hgemm_multiply_add.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="hgemm__swizzle_8h_source.html">cutlass/gemm/hgemm_swizzle.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue_8h_source.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue__traits_8h_source.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__traits_8h_source.html">cutlass/gemm/gemm_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="hgemm__global__tile_8h_source.html">cutlass/gemm/hgemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="hgemm__multiply__add_8h_source.html">cutlass/gemm/hgemm_multiply_add.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="hgemm__swizzle_8h_source.html">cutlass/gemm/hgemm_swizzle.h</a>&quot;</code><br />
 </div>
 <p><a href="hgemm__traits_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">cutlass::gemm::HgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">cutlass::gemm::HgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">cutlass::gemm::HgemmTransformerA&lt; kLayout_, Iterator_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -120,9 +120,9 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -135,7 +135,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/hgemm__traits_8h_source.html b/docs/hgemm__traits_8h_source.html
index 0d12493ec..db1554c86 100644
--- a/docs/hgemm__traits_8h_source.html
+++ b/docs/hgemm__traits_8h_source.html
@@ -76,89 +76,87 @@ $(function() {
 <div class="title">hgemm_traits.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="hgemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&gt;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="hgemm__global__tile_8h.html">cutlass/gemm/hgemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="hgemm__multiply__add_8h.html">cutlass/gemm/hgemm_multiply_add.h</a>&gt;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="hgemm__swizzle_8h.html">cutlass/gemm/hgemm_swizzle.h</a>&gt;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_,</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 2,</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 2&gt;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmConfig.html">   57</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig</a></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;          half,</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;          half,</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;          half,</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;          half,</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;          OutputTile_,</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;          ThreadMultiplyAdd&lt;AccumulatorsPerThread_, Shape&lt;1, 4, 8&gt;, half, half, half&gt;,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;          kScalarsPerLdgA_,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;          kScalarsPerLdgA_,</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;          8,</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;          kScalarsPerLdgB_,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;          kScalarsPerLdgB_,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;          8,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;          2,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;          8,</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;          2,</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;          2&gt; {};</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">   95</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a> {};</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">   98</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, Iterator_&gt; {</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296">   99</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;typename Iterator_::Fragment, typename Iterator_::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296">Transformer</a>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;};</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">  103</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, Iterator_&gt; {</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b">  104</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">HgemmSwizzle&lt;Iterator_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b">Transformer</a>;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;};</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">  110</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a> {};</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">  113</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, Iterator_&gt; {</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7">  114</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;typename Iterator_::Fragment, typename Iterator_::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7">Transformer</a>;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;};</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00118"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">  118</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, Iterator_&gt; {</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85">  119</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">HgemmSwizzle&lt;Iterator_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85">Transformer</a>;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;};</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">  125</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;kLayout_, GemmConfig_&gt; {};</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00130"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">  130</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, GemmConfig_&gt;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;MatrixLayout::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495">  133</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperA&lt;MatrixLayout::kRowMajor, GemmConfig_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495">Base</a>;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      half <span class="keyword">const</span>,</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;      <span class="comment">// The tile has size MxK in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;      <span class="comment">// The threads are distributed as (threads / K ) x K (the traits may reorganize).</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc)</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">  148</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">GlobalTileTraits</a>;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      half,</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;            GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      <span class="comment">// The threads are distributed as warps x 32(the traits may reorganize).</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      2,</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      128 / <span class="keyword">sizeof</span>(half) / GlobalTileTraits::Threads::kW / 2&gt;</div><div class="line"><a name="l00164"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a2aad3b2454d956f20dac1bb0ad75a2f8">  164</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;      half <span class="keyword">const</span>,</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      8,</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00184"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a458cbcc16fc296d024f2a1a95fb926c1">  184</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a458cbcc16fc296d024f2a1a95fb926c1">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;};</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00190"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">  190</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;kLayout_, GemmConfig_&gt; {};</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00195"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">  195</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, GemmConfig_&gt;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded">  198</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperB&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded">Base</a>;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;      half <span class="keyword">const</span>,</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc)</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00213"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">  213</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">GlobalTileTraits</a>;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      half,</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;            GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;      2,</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;      128 / <span class="keyword">sizeof</span>(half) / GlobalTileTraits::Threads::kW / 2&gt;</div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab1ae3d51f65f7af60147da1c51a7a0c2">  229</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;      half <span class="keyword">const</span>,</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      8,</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00249"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af1bc7f7c26db3399201cd95f35a56790">  249</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af1bc7f7c26db3399201cd95f35a56790">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;};</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;32, 8, 8&gt;</a>,</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 2,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 2,</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;    <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00271"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">  271</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">HgemmTraitsHelper</a> {</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig&lt;OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_&gt;</a></div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">  274</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a>;</div><div class="line"><a name="l00276"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417">  276</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA&lt;kLayoutA_, GemmConfig&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417">GemmTileTraitsHelperA</a>;</div><div class="line"><a name="l00278"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89">  278</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB&lt;kLayoutB_, GemmConfig&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89">GemmTileTraitsHelperB</a>;</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperA::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00282"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">  282</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">GlobalLoadIteratorA</a>;</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt;GemmTileTraitsHelperA::kLayout,</div><div class="line"><a name="l00285"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">  285</a></span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GlobalLoadIteratorA</a>&gt;::Transformer <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">GlobalTransformerA</a>;</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits,</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00291"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">  291</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">SharedStoreIteratorA</a>;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream&lt;GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA&gt;</a></div><div class="line"><a name="l00294"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb">  294</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb">GlobalLoadStreamA</a>;</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperB::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00298"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">  298</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">GlobalLoadIteratorB</a>;</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;  <span class="comment">// The default transformer for B.</span></div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt;GemmTileTraitsHelperB::kLayout,</div><div class="line"><a name="l00301"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">  301</a></span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GlobalLoadIteratorB</a>&gt;::Transformer <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">GlobalTransformerB</a>;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits,</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00307"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">  307</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">SharedStoreIteratorB</a>;</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream&lt;GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB&gt;</a></div><div class="line"><a name="l00310"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394">  310</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394">GlobalLoadStreamB</a>;</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits,</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00317"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">  317</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">SharedLoadIteratorA</a>;</div><div class="line"><a name="l00319"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b">  319</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorA&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b">SharedLoadStreamA</a>;</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits,</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00325"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">  325</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">SharedLoadIteratorB</a>;</div><div class="line"><a name="l00327"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215">  327</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorB&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215">SharedLoadStreamB</a>;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00330"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8">  330</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">GemmConfig::MultiplyAdd</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8">MultiplyAdd</a>;</div><div class="line"><a name="l00332"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">  332</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">ClearAccumulators&lt;typename MultiplyAdd::ScalarC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">ClearAccumulators</a>;</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;</div><div class="line"><a name="l00335"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">  335</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits&lt;GemmConfig, EpilogueFunctor_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">GemmEpilogueTraits</a>;</div><div class="line"><a name="l00337"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98">  337</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue&lt;GemmEpilogueTraits&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98">Epilogue</a>;</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;};</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 128, 128&gt;</a>,</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;half&gt;</a>,</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 8, 16&gt;</a>,</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 2,</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 2,</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;    <span class="keyword">typename</span> Helper_ = <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">HgemmTraitsHelper</a>&lt;kLayoutA_,</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;                                         kLayoutB_,</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;                                         OutputTile_,</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;                                         EpilogueFunctor_,</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;                                         AccumulatorsPerThread_,</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;                                         kScalarsPerLdgA_,</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;                                         kScalarsPerLdgB_,</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;                                         Index_&gt; &gt;</div><div class="line"><a name="l00368"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraits.html">  368</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTraits.html">HgemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt;</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;                         typename Helper_::GemmConfig,</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;                         <span class="comment">// The stream to load A from global memory to shared memory.</span></div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;                         typename Helper_::GlobalLoadStreamA,</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;                         <span class="comment">// The stream to load B from global memory to shared memory.</span></div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;                         typename Helper_::GlobalLoadStreamB,</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;                         <span class="comment">// The stream to load A from shared memory.</span></div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;                         typename Helper_::SharedLoadStreamA,</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;                         <span class="comment">// The stream to load B from shared memory.</span></div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;                         typename Helper_::SharedLoadStreamB,</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;                         typename Helper_::Epilogue,</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;                         <span class="comment">// The block swizzle to reorganize the grid.</span></div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;                         IdentityBlockSwizzle,</div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;                         Index_,</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;                         <span class="comment">// The tool used to clear accumulators.</span></div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;                         typename Helper_::ClearAccumulators&gt; {};</div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_ab8a3def34300afb5745453d0b33204aa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorA</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperA::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorA</div><div class="ttdoc">The iterator to load A from global memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:282</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4_html_ae66bb2c1f87e19278ff471c32e71ea85"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">HgemmSwizzle&lt; Iterator_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:119</div></div>
+<a href="hgemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&quot;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="hgemm__global__tile_8h.html">cutlass/gemm/hgemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="hgemm__multiply__add_8h.html">cutlass/gemm/hgemm_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="hgemm__swizzle_8h.html">cutlass/gemm/hgemm_swizzle.h</a>&quot;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_,</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 2,</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 2&gt;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmConfig.html">   57</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                         half,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;                         half,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;                         half,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;                         half,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;                         OutputTile_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;                         ThreadMultiplyAdd&lt;ThreadGemmShape_, Shape&lt;1, 4, 8&gt;, half, half, half&gt;,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                         kScalarsPerLdgA_,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                         kScalarsPerLdgA_,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                         8,</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;                         kScalarsPerLdgB_,</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;                         kScalarsPerLdgB_,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;                         8,</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;                         2,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;                         8,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                         2,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;                         2,</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;                         false,</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;                         true,</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;                         false</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;                         &gt; {};</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">  101</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a> {};</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">  104</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, Iterator_&gt; {</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296">  105</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;typename Iterator_::Fragment, typename Iterator_::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296">Transformer</a>;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;};</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">  109</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, Iterator_&gt; {</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b">  110</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">HgemmSwizzle&lt;Iterator_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b">Transformer</a>;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;};</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">  116</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a> {};</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">  119</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, Iterator_&gt; {</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7">  120</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;typename Iterator_::Fragment, typename Iterator_::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7">Transformer</a>;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;};</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">  124</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, Iterator_&gt; {</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85">  125</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">HgemmSwizzle&lt;Iterator_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85">Transformer</a>;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;};</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">  131</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;kLayout_, GemmConfig_&gt; {};</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">  136</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, GemmConfig_&gt;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;MatrixLayout::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00139"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495">  139</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperA&lt;MatrixLayout::kRowMajor, GemmConfig_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495">Base</a>;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      half <span class="keyword">const</span>,</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;      <span class="comment">// The tile has size MxK in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;      <span class="comment">// The threads are distributed as (threads / K ) x K (the traits may reorganize).</span></div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc)</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">  154</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">GlobalTileTraits</a>;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00156"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac8da30393042cf6e785bdd54b11d9408">  156</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkewA = 128 / <span class="keyword">sizeof</span>(half) / GlobalTileTraits::Threads::kW / 2;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a> &lt;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      half,</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;            GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;      <span class="comment">// The threads are distributed as warps x 32(the traits may reorganize).</span></div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;      2,</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;      kSkewA&lt;GemmConfig_::kScalarsPerLdsA ? GemmConfig_::kScalarsPerLdsA : kSkewA&gt;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;          SharedStoreTileTraits;</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      half <span class="keyword">const</span>,</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;      8,</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;};</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">  198</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;kLayout_, GemmConfig_&gt; {};</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">  203</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, GemmConfig_&gt;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00206"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded">  206</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperB&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded">Base</a>;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      half <span class="keyword">const</span>,</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc)</span></div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00221"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">  221</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">GlobalTileTraits</a>;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a6d0f50e83067373b249b38444eb7fe65">  223</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkewB = 128 / <span class="keyword">sizeof</span>(half) / GlobalTileTraits::Threads::kW / 2;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a> &lt;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;      half,</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;            GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD,</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;            GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;,</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;      2,</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;      kSkewB&lt;GemmConfig_::kScalarsPerLdsB ? GemmConfig_::kScalarsPerLdsB : kSkewB&gt;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;          SharedStoreTileTraits;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt;</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;      half <span class="keyword">const</span>,</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      8,</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;};</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_,</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 2,</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 2,</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;    <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00281"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">  281</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">HgemmTraitsHelper</a> {</div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">  283</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig&lt;OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a>;</div><div class="line"><a name="l00285"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02">  285</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA&lt;kLayoutA_, GemmConfig&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02">GemmTileTraitsHelperA</a>;</div><div class="line"><a name="l00287"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d">  287</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB&lt;kLayoutB_, GemmConfig&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d">GemmTileTraitsHelperB</a>;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperA::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00291"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">  291</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">GlobalLoadIteratorA</a>;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt;GemmTileTraitsHelperA::kLayout,</div><div class="line"><a name="l00294"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">  294</a></span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GlobalLoadIteratorA</a>&gt;::Transformer <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">GlobalTransformerA</a>;</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">  300</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">SharedStoreIteratorA</a>;</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">GlobalLoadIteratorA</a>,</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">SharedStoreIteratorA</a>,</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">GlobalTransformerA</a>&gt;</div><div class="line"><a name="l00306"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca">  306</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca">GlobalLoadStreamA</a>;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperB::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00310"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">  310</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">GlobalLoadIteratorB</a>;</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;  <span class="comment">// The default transformer for B.</span></div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt;GemmTileTraitsHelperB::kLayout,</div><div class="line"><a name="l00313"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">  313</a></span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GlobalLoadIteratorB</a>&gt;::Transformer <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">GlobalTransformerB</a>;</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits,</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00319"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">  319</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">SharedStoreIteratorB</a>;</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">GlobalLoadIteratorB</a>,</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">SharedStoreIteratorB</a>,</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">GlobalTransformerB</a>&gt;</div><div class="line"><a name="l00325"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba">  325</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba">GlobalLoadStreamB</a>;</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits,</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00332"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">  332</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">SharedLoadIteratorA</a>;</div><div class="line"><a name="l00334"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c">  334</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorA&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c">SharedLoadStreamA</a>;</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits,</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00340"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">  340</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">SharedLoadIteratorB</a>;</div><div class="line"><a name="l00342"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b">  342</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorB&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b">SharedLoadStreamB</a>;</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;</div><div class="line"><a name="l00345"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef">  345</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">GemmConfig::MultiplyAdd</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef">MultiplyAdd</a>;</div><div class="line"><a name="l00347"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">  347</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">ClearAccumulators&lt;typename MultiplyAdd::ScalarC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">ClearAccumulators</a>;</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;</div><div class="line"><a name="l00350"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">  350</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits&lt;GemmConfig, EpilogueFunctor_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">GemmEpilogueTraits</a>;</div><div class="line"><a name="l00352"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae">  352</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue&lt;GemmEpilogueTraits&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae">Epilogue</a>;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;};</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 128, 128&gt;</a>,</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;half&gt;</a>,</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 8, 16&gt;</a>,</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 2,</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 2,</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;    <span class="keyword">typename</span> Helper_ = <a class="code" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">HgemmTraitsHelper</a>&lt;kLayoutA_,</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;                                         kLayoutB_,</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;                                         OutputTile_,</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;                                         EpilogueFunctor_,</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;                                         ThreadGemmShape_,</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;                                         kScalarsPerLdgA_,</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;                                         kScalarsPerLdgB_,</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;                                         Index_&gt; &gt;</div><div class="line"><a name="l00383"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1HgemmTraits.html">  383</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1HgemmTraits.html">HgemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt;</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;                         typename Helper_::GemmConfig,</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;                         <span class="comment">// The stream to load A from global memory to shared memory.</span></div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;                         typename Helper_::GlobalLoadStreamA,</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;                         <span class="comment">// The stream to load B from global memory to shared memory.</span></div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;                         typename Helper_::GlobalLoadStreamB,</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;                         <span class="comment">// The stream to load A from shared memory.</span></div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;                         typename Helper_::SharedLoadStreamA,</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;                         <span class="comment">// The stream to load B from shared memory.</span></div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;                         typename Helper_::SharedLoadStreamB,</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;                         typename Helper_::Epilogue,</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;                         <span class="comment">// The block swizzle to reorganize the grid.</span></div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;                         IdentityBlockSwizzle,</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;                         Index_,</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;                         <span class="comment">// The tool used to clear accumulators.</span></div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;                         typename Helper_::ClearAccumulators&gt; {};</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a1d458fe1e416ddc4565f2b802592268b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b">cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamB</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorB &gt; SharedLoadStreamB</div><div class="ttdoc">The stream to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:342</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_aa190538ab678c82e379db4038af665ee"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorB</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperB::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorB</div><div class="ttdoc">The iterator to load B from global memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:310</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4_html_ae66bb2c1f87e19278ff471c32e71ea85"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">HgemmSwizzle&lt; Iterator_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:125</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:129</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a0cb18b7857c88f600c6977a1bdb3f4e4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">cutlass::gemm::HgemmTraitsHelper::GemmConfig</a></div><div class="ttdeci">HgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; GemmConfig</div><div class="ttdoc">The HGEMM config. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:283</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:128</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:80</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:53</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:42</div></div>
 <div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a95559f28cab076da723e4cb24351116e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorB</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperB::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorB</div><div class="ttdoc">The iterator to load B from global memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:298</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_aba2366bec386c74df47dfd0426b07041"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">cutlass::gemm::HgemmTraitsHelper::ClearAccumulators</a></div><div class="ttdeci">ClearAccumulators&lt; typename MultiplyAdd::ScalarC &gt; ClearAccumulators</div><div class="ttdoc">The object to clear accumulators. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:332</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_aeb825b6575955a714ff24df2e142c047"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">cutlass::gemm::HgemmTraitsHelper::GemmEpilogueTraits</a></div><div class="ttdeci">SimplifiedGemmEpilogueTraits&lt; GemmConfig, EpilogueFunctor_, Index_ &gt; GemmEpilogueTraits</div><div class="ttdoc">The traits class for the epilogue. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:350</div></div>
 <div class="ttc" id="gemm__traits_8h_html"><div class="ttname"><a href="gemm__traits_8h.html">gemm_traits.h</a></div><div class="ttdoc">Defines structural properties of complete GEMM computation. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a7f022d423d42d4081cefa7eb26b4d5b4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorA</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorA</div><div class="ttdoc">The iterator to store A to shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:291</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a2aaece6093100c71c4d587994200e3bb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb">cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamA</a></div><div class="ttdeci">GlobalLoadStream&lt; GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA &gt; GlobalLoadStreamA</div><div class="ttdoc">The stream to load A from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:294</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a1e6356bf5c87271ab9794fcc79edc145"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">HgemmCrosswiseGlobalTileTraits&lt; GemmOperand::kB, MatrixLayout::kColumnMajor, half const, Shape&lt; 1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgB &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for B^N. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:213</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">cutlass::gemm::HgemmTransformerA</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:95</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_aca63ec1099444c555299dc144282dded"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Base</a></div><div class="ttdeci">GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt; Base</div><div class="ttdoc">The base config. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:198</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a21c860cc877df13d22dd30eeb5e2b06b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b">cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamA</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorA &gt; SharedLoadStreamA</div><div class="ttdoc">The stream to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:319</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4_html_a882c10bed18f62ece97f5f20f9de3296"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">Convert&lt; typename Iterator_::Fragment, typename Iterator_::Fragment &gt; Transformer</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraits.html">cutlass::gemm::HgemmTraits</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:368</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4_html_a42c5bafcb226623b3326dbd01fc72f3b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">HgemmSwizzle&lt; Iterator_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:104</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:198</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a8d09409973094ca2a17633776a64a303"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorB</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorB</div><div class="ttdoc">The iterator to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:325</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:159</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a234ae6065d5ab56135e10119d3ad2d98"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98">cutlass::gemm::HgemmTraitsHelper::Epilogue</a></div><div class="ttdeci">GemmEpilogue&lt; GemmEpilogueTraits &gt; Epilogue</div><div class="ttdoc">The epilogue. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:337</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a3fb86b6d3e353df6b752510d64c5e647"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">cutlass::gemm::HgemmTraitsHelper::GlobalTransformerA</a></div><div class="ttdeci">HgemmTransformerA&lt; GemmTileTraitsHelperA::kLayout, GlobalLoadIteratorA &gt;::Transformer GlobalTransformerA</div><div class="ttdoc">The default transformer for A. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:285</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a1e6356bf5c87271ab9794fcc79edc145"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">HgemmCrosswiseGlobalTileTraits&lt; GemmOperand::kB, MatrixLayout::kColumnMajor, half const, Shape&lt; 1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgB &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for B^N. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:221</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">cutlass::gemm::HgemmTransformerA</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:101</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_aca63ec1099444c555299dc144282dded"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Base</a></div><div class="ttdeci">GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt; Base</div><div class="ttdoc">The base config. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:206</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_ada2812153440cf1e678ca4c795a6e8ae"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae">cutlass::gemm::HgemmTraitsHelper::Epilogue</a></div><div class="ttdeci">GemmEpilogue&lt; GemmEpilogueTraits &gt; Epilogue</div><div class="ttdoc">The epilogue. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:352</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4_html_a882c10bed18f62ece97f5f20f9de3296"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">Convert&lt; typename Iterator_::Fragment, typename Iterator_::Fragment &gt; Transformer</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:105</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a80e36b583ccd9aa9b37d52faa090cbca"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca">cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamA</a></div><div class="ttdeci">GlobalLoadStream&lt; GemmOperand::kA, GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA &gt; GlobalLoadStreamA</div><div class="ttdoc">The stream to load A from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:306</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraits.html">cutlass::gemm::HgemmTraits</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:383</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4_html_a42c5bafcb226623b3326dbd01fc72f3b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">HgemmSwizzle&lt; Iterator_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:110</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a14b4720b7522684a98b653d70353233a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorB</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorB</div><div class="ttdoc">The iterator to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:340</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_ae324b03601b97a22f2ac6db077280c60"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">cutlass::gemm::HgemmTraitsHelper::GlobalTransformerA</a></div><div class="ttdeci">HgemmTransformerA&lt; GemmTileTraitsHelperA::kLayout, GlobalLoadIteratorA &gt;::Transformer GlobalTransformerA</div><div class="ttdoc">The default transformer for A. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:294</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:200</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:163</div></div>
 <div class="ttc" id="gemm__epilogue_8h_html"><div class="ttname"><a href="gemm__epilogue_8h.html">gemm_epilogue.h</a></div><div class="ttdoc">Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the comp...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:161</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:273</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">cutlass::gemm::HgemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:125</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html">cutlass::MatrixLayout</a></div><div class="ttdoc">Describes layouts of matrices. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:35</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_ac5eeca1e91f0e0d4dd48d432d5213215"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215">cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamB</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorB &gt; SharedLoadStreamB</div><div class="ttdoc">The stream to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:327</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">cutlass::gemm::HgemmTransformerB</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:110</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a7ec19bf90207a7f598f2ec5166649495"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Base</a></div><div class="ttdeci">GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt; Base</div><div class="ttdoc">The base config. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:133</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a1bbb198a50b5f01a0502df44bb678620"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorA</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorA</div><div class="ttdoc">The iterator to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:317</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:302</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a4a0f361b5c47d0ab5f3308cd3b3b6ef6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">cutlass::gemm::HgemmTraitsHelper::GemmEpilogueTraits</a></div><div class="ttdeci">SimplifiedGemmEpilogueTraits&lt; GemmConfig, EpilogueFunctor_, Index_ &gt; GemmEpilogueTraits</div><div class="ttdoc">The traits class for the epilogue. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:335</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:191</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">cutlass::gemm::HgemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:131</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a4f3afb4b1f37a2c43a1935a3000b2a02"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02">cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperA</a></div><div class="ttdeci">HgemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig &gt; GemmTileTraitsHelperA</div><div class="ttdoc">The GEMM config for A. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:285</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html">cutlass::MatrixLayout</a></div><div class="ttdoc">Defines data layouts of various matrix formats usable by TensorRef and other classes. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:156</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">cutlass::gemm::HgemmTransformerB</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:116</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a7ec19bf90207a7f598f2ec5166649495"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Base</a></div><div class="ttdeci">GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt; Base</div><div class="ttdoc">The base config. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:139</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:399</div></div>
 <div class="ttc" id="gemm__shared__tile_8h_html"><div class="ttname"><a href="gemm__shared__tile_8h.html">gemm_shared_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing tiles to and from shared memory. </div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:205</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:120</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:45</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a2ca7dcd4b5157db9b9c2f92740e44184"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">cutlass::gemm::HgemmTraitsHelper::GlobalTransformerB</a></div><div class="ttdeci">HgemmTransformerB&lt; GemmTileTraitsHelperB::kLayout, GlobalLoadIteratorB &gt;::Transformer GlobalTransformerB</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:313</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a8574faffd18e4aa8420a4e32e07b62d6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">cutlass::gemm::HgemmTraitsHelper::ClearAccumulators</a></div><div class="ttdeci">ClearAccumulators&lt; typename MultiplyAdd::ScalarC &gt; ClearAccumulators</div><div class="ttdoc">The object to clear accumulators. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:347</div></div>
 <div class="ttc" id="hgemm__multiply__add_8h_html"><div class="ttname"><a href="hgemm__multiply__add_8h.html">hgemm_multiply_add.h</a></div><div class="ttdoc">Specialization implementing multiply-add operation on half-precision floating point fragments...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:79</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_config.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a8978603203221020113ec79e3f2c0d64"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorA</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorA</div><div class="ttdoc">The iterator to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:332</div></div>
 <div class="ttc" id="hgemm__swizzle_8h_html"><div class="ttname"><a href="hgemm__swizzle_8h.html">hgemm_swizzle.h</a></div><div class="ttdoc">Transposes a tile of 16b elements. Used by HGEMM to construct a K-strided layout in shared memory for...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:137</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_af1bc7f7c26db3399201cd95f35a56790"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af1bc7f7c26db3399201cd95f35a56790">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileBTraits&lt; half const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 8, SharedStoreTileTraits::kSkew &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for B^N. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:249</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a1597c776238f35bcb1acc0a8f8f9c118"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">cutlass::gemm::HgemmTraitsHelper::GemmConfig</a></div><div class="ttdeci">HgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; GemmConfig</div><div class="ttdoc">The HGEMM config. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:274</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">cutlass::gemm::HgemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:190</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_abaf5f16ab0b215b406766ecadab29394"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394">cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamB</a></div><div class="ttdeci">GlobalLoadStream&lt; GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB &gt; GlobalLoadStreamB</div><div class="ttdoc">The stream to load B from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:310</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_ae9facf63912d98e597883bf7efb56cc8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8">cutlass::gemm::HgemmTraitsHelper::MultiplyAdd</a></div><div class="ttdeci">GemmConfig::MultiplyAdd MultiplyAdd</div><div class="ttdoc">The functor to do the multiply-add in the main loop. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:330</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a8768c2b03bea0c3601c47dde2bc7ca89"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89">cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperB</a></div><div class="ttdeci">HgemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig &gt; GemmTileTraitsHelperB</div><div class="ttdoc">The GEMM config for B. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:278</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:428</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">cutlass::gemm::HgemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:198</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_ae82826fde376748cf67ff2e1bcaa8cef"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef">cutlass::gemm::HgemmTraitsHelper::MultiplyAdd</a></div><div class="ttdeci">GemmConfig::MultiplyAdd MultiplyAdd</div><div class="ttdoc">The functor to do the multiply-add in the main loop. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:345</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:349</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_ada910ee63493bc3c70f7395127268a1d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d">cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperB</a></div><div class="ttdeci">HgemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig &gt; GemmTileTraitsHelperB</div><div class="ttdoc">The GEMM config for B. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:287</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> hgemm_global_tile.h:48</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:300</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a458cbcc16fc296d024f2a1a95fb926c1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a458cbcc16fc296d024f2a1a95fb926c1">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileATraits&lt; half const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 8, SharedStoreTileTraits::kSkew &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for A^T. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:184</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a5557c86a530f5d20a35d3fa620adf417"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417">cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperA</a></div><div class="ttdeci">HgemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig &gt; GemmTileTraitsHelperA</div><div class="ttdoc">The GEMM config for A. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:276</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a7b4de712868095200a338802c1fbb3de"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">cutlass::gemm::HgemmTraitsHelper::GlobalTransformerB</a></div><div class="ttdeci">HgemmTransformerB&lt; GemmTileTraitsHelperB::kLayout, GlobalLoadIteratorB &gt;::Transformer GlobalTransformerB</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:301</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:278</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:271</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a36e082b2da22d17eeb73af6bd0632314"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">HgemmCrosswiseGlobalTileTraits&lt; GemmOperand::kA, MatrixLayout::kRowMajor, half const, Shape&lt; 1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgA &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for A^T. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:148</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:323</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aae7128f5522383c857d2639031b64c30"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; VectorizedTile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_ac6eac542d9d994509f931804b8b85ff5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorA</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperA::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorA</div><div class="ttdoc">The iterator to load A from global memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:291</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:281</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a36e082b2da22d17eeb73af6bd0632314"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">HgemmCrosswiseGlobalTileTraits&lt; GemmOperand::kA, MatrixLayout::kRowMajor, half const, Shape&lt; 1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgA &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for A^T. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:154</div></div>
 <div class="ttc" id="hgemm__global__tile_8h_html"><div class="ttname"><a href="hgemm__global__tile_8h.html">hgemm_global_tile.h</a></div><div class="ttdoc">Tile traits used to construct global tile iterator for HGEMM. This is intended to partition the threa...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:40</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:51</div></div>
 <div class="ttc" id="structcutlass_1_1Convert_html"><div class="ttname"><a href="structcutlass_1_1Convert.html">cutlass::Convert</a></div><div class="ttdef"><b>Definition:</b> convert.h:38</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="gemm_8h_html"><div class="ttname"><a href="gemm_8h.html">gemm.h</a></div><div class="ttdoc">Implements a software-pipelined efficient GEMM. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a29bd05960cc541bb67098f5483c84cf6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; Tile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:87</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a2c46c11f5fddb865645f555547c823ba"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba">cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamB</a></div><div class="ttdeci">GlobalLoadStream&lt; GemmOperand::kB, GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB &gt; GlobalLoadStreamB</div><div class="ttdoc">The stream to load B from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:325</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_aaa35c4d2a90f137f50c9ccd24d5c4f5c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c">cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamA</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorA &gt; SharedLoadStreamA</div><div class="ttdoc">The stream to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:334</div></div>
 <div class="ttc" id="gemm__epilogue__traits_8h_html"><div class="ttname"><a href="gemm__epilogue__traits_8h.html">gemm_epilogue_traits.h</a></div><div class="ttdoc">Defines structural properties of the GEMM epilogue. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a463dddee069606fd4ecf7c386ff23fce"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorB</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorB</div><div class="ttdoc">The iterator to store B to shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:319</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_a366c89f8ecfbf0aef894cfb6fae25be9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorA</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorA</div><div class="ttdoc">The iterator to store A to shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:300</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmSwizzle_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmSwizzle.html">cutlass::gemm::HgemmSwizzle</a></div><div class="ttdef"><b>Definition:</b> hgemm_swizzle.h:40</div></div>
 <div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4_html_aaaccb3f02a857e0c80d2891c6c6dcdb7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">Convert&lt; typename Iterator_::Fragment, typename Iterator_::Fragment &gt; Transformer</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:114</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4_html_aaaccb3f02a857e0c80d2891c6c6dcdb7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">Convert&lt; typename Iterator_::Fragment, typename Iterator_::Fragment &gt; Transformer</div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:120</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1HgemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmConfig.html">cutlass::gemm::HgemmConfig</a></div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:57</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:620</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1HgemmTraitsHelper_html_abe3383e7338c08841fd8f0bfb1090448"><div class="ttname"><a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorB</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorB</div><div class="ttdoc">The iterator to store B to shared memory. </div><div class="ttdef"><b>Definition:</b> hgemm_traits.h:307</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:836</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/hierarchy.html b/docs/hierarchy.html
index 25ba6bdab..865698e5a 100644
--- a/docs/hierarchy.html
+++ b/docs/hierarchy.html
@@ -73,7 +73,7 @@ $(function() {
 </div><!--header-->
 <div class="contents">
 <div class="textblock">This inheritance list is sorted roughly, but not completely, alphabetically:</div><div class="directory">
-<div class="levels">[detail level <span onclick="javascript:toggleLevel(1);">1</span><span onclick="javascript:toggleLevel(2);">2</span><span onclick="javascript:toggleLevel(3);">3</span>]</div><table class="directory">
+<div class="levels">[detail level <span onclick="javascript:toggleLevel(1);">1</span><span onclick="javascript:toggleLevel(2);">2</span><span onclick="javascript:toggleLevel(3);">3</span><span onclick="javascript:toggleLevel(4);">4</span>]</div><table class="directory">
 <tr id="row_0_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1aligned__chunk.html" target="_self">cutlass::platform::aligned_chunk&lt; Align &gt;</a></td><td class="desc"></td></tr>
 <tr id="row_1_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1aligned__storage.html" target="_self">cutlass::platform::aligned_storage&lt; Len, Align &gt;</a></td><td class="desc">Std::aligned_storage </td></tr>
 <tr id="row_2_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_2_" class="arrow" onclick="toggleFolder('2_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1AlignedStruct.html" target="_self">cutlass::AlignedStruct&lt; kAlignment_ &gt;</a></td><td class="desc"></td></tr>
@@ -94,316 +94,389 @@ $(function() {
 <tr id="row_13_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html" target="_self">cutlass::platform::alignment_of&lt; ulong4 &gt;</a></td><td class="desc"></td></tr>
 <tr id="row_14_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html" target="_self">cutlass::platform::alignment_of&lt; ulonglong2 &gt;</a></td><td class="desc"></td></tr>
 <tr id="row_15_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html" target="_self">cutlass::platform::alignment_of&lt; ulonglong4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_16_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html" target="_self">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_17_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html" target="_self">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube </td></tr>
-<tr id="row_18_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html" target="_self">cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube with one channel and a depth of 1 </td></tr>
-<tr id="row_19_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html" target="_self">cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube with a depth of 1 </td></tr>
-<tr id="row_20_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html" target="_self">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube </td></tr>
-<tr id="row_21_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html" target="_self">cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube with one channel and a depth of 1 </td></tr>
-<tr id="row_22_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html" target="_self">cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube with a depth of 1 </td></tr>
-<tr id="row_23_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html" target="_self">cutlass::ComputeThreadOffsetFromStrides&lt; Threads_, Strides_ &gt;</a></td><td class="desc">Decompose threadId.x into coordinate of a cube whose dimensions are specified by Threads_. Afterwards compute the offset of those coordinates using Strides_ </td></tr>
-<tr id="row_24_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html" target="_self">cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a></td><td class="desc">Specialization for D=1 and C=1 </td></tr>
-<tr id="row_25_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html" target="_self">cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a></td><td class="desc">Specialization for D=1 </td></tr>
-<tr id="row_26_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1conditional.html" target="_self">cutlass::platform::conditional&lt; B, T, F &gt;</a></td><td class="desc">Std::conditional (true specialization) </td></tr>
-<tr id="row_27_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html" target="_self">cutlass::platform::conditional&lt; false, T, F &gt;</a></td><td class="desc">Std::conditional (false specialization) </td></tr>
-<tr id="row_28_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html" target="_self">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a></td><td class="desc">A const iterator implementing <a class="el" href="group__predicate__iterator__concept.html">Predicate Iterator Concept</a> enabling sequential read-only access to prediactes </td></tr>
-<tr id="row_29_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html" target="_self">cutlass::ConstPredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a></td><td class="desc">Adapter to enable random access to predicates via logical coordinate within a tile </td></tr>
-<tr id="row_30_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Convert.html" target="_self">cutlass::Convert&lt; InputFragment_, OutputFragment_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_31_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html" target="_self">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_32_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; N_ &gt;</a></td><td class="desc">Statically-sized array specifying Coords within a tensor </td></tr>
-<tr id="row_33_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; 4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_34_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; Rank &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_35_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Copy.html" target="_self">cutlass::Copy&lt; Fragment_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_36_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1default__delete.html" target="_self">cutlass::platform::default_delete&lt; T &gt;</a></td><td class="desc">Default deleter </td></tr>
-<tr id="row_37_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html" target="_self">cutlass::platform::default_delete&lt; T[]&gt;</a></td><td class="desc">Partial specialization for deleting array types </td></tr>
-<tr id="row_38_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1divide__assert.html" target="_self">cutlass::divide_assert&lt; Dividend, Divisor &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_39_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html" target="_self">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;::dummy&lt; B, D &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_40_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1enable__if.html" target="_self">cutlass::platform::enable_if&lt; C, T &gt;</a></td><td class="desc">Std::enable_if (true specialization) </td></tr>
-<tr id="row_41_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html" target="_self">cutlass::platform::enable_if&lt; false, T &gt;</a></td><td class="desc">Std::enable_if (false specialization) </td></tr>
-<tr id="row_42_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent.html" target="_self">cutlass::Extent&lt; T &gt;</a></td><td class="desc">Returns the extent of a scalar or vector </td></tr>
-<tr id="row_43_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html" target="_self">cutlass::Extent&lt; Vector&lt; T, Lanes &gt; &gt;</a></td><td class="desc">Returns the number of lanes of a vector if need be </td></tr>
-<tr id="row_44_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html" target="_self">cutlass::Extent&lt; Vector&lt; T, Lanes &gt; const &gt;</a></td><td class="desc">Returns the number of lanes of a vector if need be </td></tr>
-<tr id="row_45_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentConstIterator.html" target="_self">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_46_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentIterator.html" target="_self">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="desc">A template defining <a class="el" href="group__fragment__iterator__concept.html">Fragment Iterator Concept</a> </td></tr>
-<tr id="row_47_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentLoad.html" target="_self">cutlass::FragmentLoad&lt; kIteratorFragment, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_48_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html" target="_self">cutlass::FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_49_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html" target="_self">cutlass::FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_50_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html" target="_self">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_51_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html" target="_self">cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_52_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentStore.html" target="_self">cutlass::FragmentStore&lt; kIteratorFragment, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_53_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html" target="_self">cutlass::FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_54_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html" target="_self">cutlass::FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_55_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html" target="_self">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_56_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_57_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_57_" class="arrow" onclick="toggleFolder('57_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_57_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html" target="_self">cutlass::gemm::DgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_58_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_58_" class="arrow" onclick="toggleFolder('58_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_58_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html" target="_self">cutlass::gemm::SgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_59_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_59_" class="arrow" onclick="toggleFolder('59_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_59_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html" target="_self">cutlass::gemm::HgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_60_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_60_" class="arrow" onclick="toggleFolder('60_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_60_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01AccumulatorsPerThread___01_4.html" target="_self">cutlass::gemm::IgemmConfig&lt; OutputTile_, int8_t, AccumulatorsPerThread_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_61_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_61_" class="arrow" onclick="toggleFolder('61_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_61_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html" target="_self">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_62_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html" target="_self">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_63_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_63_" class="arrow" onclick="toggleFolder('63_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html" target="_self">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_63_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html" target="_self">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_63_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html" target="_self">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_64_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_65_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_65_" class="arrow" onclick="toggleFolder('65_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_65_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html" target="_self">cutlass::gemm::SimplifiedGemmEpilogueTraits&lt; GemmConfig_, EpilogueFunctor_, Index_, Helper_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_66_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_66_" class="arrow" onclick="toggleFolder('66_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_66_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html" target="_self">cutlass::gemm::IgemmEpilogueTraits&lt; IgemmConfig_, EpilogueFunctor_, Index_, Helper_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_67_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html" target="_self">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_68_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_68_" class="arrow" onclick="toggleFolder('68_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html" target="_self">cutlass::gemm::GemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_68_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html" target="_self">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_69_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_69_" class="arrow" onclick="toggleFolder('69_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html" target="_self">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_69_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html" target="_self">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_69_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html" target="_self">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_70_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_70_" class="arrow" onclick="toggleFolder('70_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html" target="_self">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_70_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html" target="_self">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_70_1_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html" target="_self">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_71_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html" target="_self">cutlass::gemm::GemmMultiplicandTraits&lt; ThreadBlockTile_, Usage, Layout &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_72_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1GemmOperand.html" target="_self">cutlass::GemmOperand</a></td><td class="desc">Gemm operand - D = A * B + C </td></tr>
-<tr id="row_73_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html" target="_self">cutlass::gemm::GemmOperandTraitsAb&lt; kOperand_, kLayout_ &gt;</a></td><td class="desc">Helper to describe attributes of GEMM matrix operands </td></tr>
-<tr id="row_74_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html" target="_self">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_75_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html" target="_self">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_76_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html" target="_self">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_77_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html" target="_self">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_78_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html" target="_self">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_79_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html" target="_self">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_80_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html" target="_self">cutlass::gemm::GemmTileTraitsHelperA&lt; Kind, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_81_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_81_" class="arrow" onclick="toggleFolder('81_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html" target="_self">cutlass::gemm::GemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_81_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html" target="_self">cutlass::gemm::HgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_81_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_82_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_82_" class="arrow" onclick="toggleFolder('82_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_82_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_83_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_83_" class="arrow" onclick="toggleFolder('83_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_83_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_84_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html" target="_self">cutlass::gemm::GemmTileTraitsHelperB&lt; Kind, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_85_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_85_" class="arrow" onclick="toggleFolder('85_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html" target="_self">cutlass::gemm::GemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_85_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html" target="_self">cutlass::gemm::HgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_85_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_86_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_86_" class="arrow" onclick="toggleFolder('86_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_86_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_87_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_87_" class="arrow" onclick="toggleFolder('87_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_87_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_88_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_89_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_89_" class="arrow" onclick="toggleFolder('89_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_89_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" target="_self">cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, Epilogue_, Index_, GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Helper_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_90_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_90_" class="arrow" onclick="toggleFolder('90_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_90_0_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_90_0_" class="arrow" onclick="toggleFolder('90_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" target="_self">cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_90_0_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html" target="_self">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_90_0_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html" target="_self">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_91_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_91_" class="arrow" onclick="toggleFolder('91_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_91_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html" target="_self">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_91_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html" target="_self">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_, Helper_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_92_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent.html" target="_self">cutlass::gemm::GetExtent&lt; kOperand_, Tile_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_93_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html" target="_self">cutlass::gemm::GetExtent&lt; GemmOperand::kA, Tile_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_94_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html" target="_self">cutlass::gemm::GetExtent&lt; GemmOperand::kB, Tile_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_95_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream</a></td><td class="desc">Assemble the global load streams for A/B </td></tr>
-<tr id="row_96_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_96_" class="arrow" onclick="toggleFolder('96_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html" target="_self">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_96_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html" target="_self">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_97_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1greater.html" target="_self">cutlass::platform::greater&lt; T &gt;</a></td><td class="desc">Std::greater </td></tr>
-<tr id="row_98_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html" target="_self">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_99_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html" target="_self">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_100_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html" target="_self">cutlass::gemm::HgemmTransformerA&lt; kLayout_, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_101_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_102_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_103_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html" target="_self">cutlass::gemm::HgemmTransformerB&lt; kLayout_, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_104_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_105_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_106_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Identity.html" target="_self">cutlass::Identity</a></td><td class="desc">Describes identity elements </td></tr>
-<tr id="row_107_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html" target="_self">cutlass::gemm::IdentityBlockSwizzle</a></td><td class="desc"></td></tr>
-<tr id="row_108_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html" target="_self">cutlass::gemm::IgemmEpilogueScalar&lt; ScalarD_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_109_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html" target="_self">cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_110_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html" target="_self">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_111_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html" target="_self">cutlass::gemm::IgemmGlobalLoadTransformer&lt; InputFragment_, OutputScalar_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_112_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html" target="_self">cutlass::gemm::IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_113_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html" target="_self">cutlass::gemm::IgemmGlobalStoreTransformer&lt; InputScalar_, OutputFragment_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_114_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html" target="_self">cutlass::gemm::IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_115_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html" target="_self">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_116_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html" target="_self">cutlass::gemm::IgemmSharedStoreTransformer&lt; InputScalar_, OutputFragment_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_117_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html" target="_self">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_118_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html" target="_self">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_119_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html" target="_self">cutlass::gemm::IgemmTransformerA&lt; kLayout_, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_120_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_121_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_122_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html" target="_self">cutlass::gemm::IgemmTransformerB&lt; kLayout_, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_123_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_124_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_125_" class="arrow" onclick="toggleFolder('125_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; value_t, V &gt;</a></td><td class="desc">Std::integral_constant </td></tr>
-<tr id="row_125_0_" class="even" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_125_0_" class="arrow" onclick="toggleFolder('125_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral.html" target="_self">cutlass::platform::is_integral&lt; T &gt;</a></td><td class="desc">Std::is_integral </td></tr>
-<tr id="row_125_0_0_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html" target="_self">cutlass::platform::is_integral&lt; const T &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_0_1_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html" target="_self">cutlass::platform::is_integral&lt; const volatile T &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_0_2_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html" target="_self">cutlass::platform::is_integral&lt; volatile T &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html" target="_self">cutlass::platform::is_integral&lt; char &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_2_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html" target="_self">cutlass::platform::is_integral&lt; int &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_3_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html" target="_self">cutlass::platform::is_integral&lt; long &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_4_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html" target="_self">cutlass::platform::is_integral&lt; long long &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_5_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html" target="_self">cutlass::platform::is_integral&lt; short &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_6_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html" target="_self">cutlass::platform::is_integral&lt; signed char &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_7_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned char &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_8_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned int &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_9_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned long &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_10_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned long long &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_11_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned short &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_12_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper.html" target="_self">cutlass::platform::is_pointer_helper&lt; T &gt;</a></td><td class="desc">Helper for std::is_pointer (false specialization) </td></tr>
-<tr id="row_125_13_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html" target="_self">cutlass::platform::is_pointer_helper&lt; T * &gt;</a></td><td class="desc">Helper for std::is_pointer (true specialization) </td></tr>
-<tr id="row_125_14_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same.html" target="_self">cutlass::platform::is_same&lt; A, B &gt;</a></td><td class="desc">Std::is_same (false specialization) </td></tr>
-<tr id="row_125_15_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html" target="_self">cutlass::platform::is_same&lt; A, A &gt;</a></td><td class="desc">Std::is_same (true specialization) </td></tr>
-<tr id="row_125_16_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__volatile.html" target="_self">cutlass::platform::is_volatile&lt; T &gt;</a></td><td class="desc">Std::is_volatile </td></tr>
-<tr id="row_125_17_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html" target="_self">cutlass::platform::is_volatile&lt; volatile T &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_18_" class="even" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_125_18_" class="arrow" onclick="toggleFolder('125_18_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper.html" target="_self">cutlass::platform::is_pointer_helper&lt; remove_cv&lt; T &gt;::type &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_18_0_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer.html" target="_self">cutlass::platform::is_pointer&lt; T &gt;</a></td><td class="desc">Std::is_pointer </td></tr>
-<tr id="row_125_19_" class="even" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_125_19_" class="arrow" onclick="toggleFolder('125_19_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same.html" target="_self">cutlass::platform::is_same&lt; void, remove_cv&lt; T &gt;::type &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_125_19_0_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__void.html" target="_self">cutlass::platform::is_void&lt; T &gt;</a></td><td class="desc">Std::is_void </td></tr>
-<tr id="row_126_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_126_" class="arrow" onclick="toggleFolder('126_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool, V &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_126_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1bool__constant.html" target="_self">cutlass::platform::bool_constant&lt; V &gt;</a></td><td class="desc">Std::bool_constant </td></tr>
-<tr id="row_127_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_127_" class="arrow" onclick="toggleFolder('127_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_arithmetic&lt; T &gt;::value||is_void&lt; T &gt;::value||is_same&lt; nullptr_t, remove_cv&lt; T &gt;::type &gt;::value)&gt;</a></td><td class="desc"></td></tr>
-<tr id="row_127_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__fundamental.html" target="_self">cutlass::platform::is_fundamental&lt; T &gt;</a></td><td class="desc">Std::is_fundamental </td></tr>
-<tr id="row_128_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_128_" class="arrow" onclick="toggleFolder('128_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_base_of_helper&lt; remove_cv&lt; BaseT &gt;::type, remove_cv&lt; DerivedT &gt;::type &gt;::value)||(is_same&lt; remove_cv&lt; BaseT &gt;::type, remove_cv&lt; DerivedT &gt;::type &gt;::value)&gt;</a></td><td class="desc"></td></tr>
-<tr id="row_128_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of.html" target="_self">cutlass::platform::is_base_of&lt; BaseT, DerivedT &gt;</a></td><td class="desc">Std::is_base_of </td></tr>
-<tr id="row_129_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_129_" class="arrow" onclick="toggleFolder('129_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_fundamental&lt; T &gt;::value||is_pointer&lt; T &gt;::value)&gt;</a></td><td class="desc"></td></tr>
-<tr id="row_129_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__trivially__copyable.html" target="_self">cutlass::platform::is_trivially_copyable&lt; T &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_130_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_130_" class="arrow" onclick="toggleFolder('130_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_integral&lt; T &gt;::value||is_floating_point&lt; T &gt;::value)&gt;</a></td><td class="desc"></td></tr>
-<tr id="row_130_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__arithmetic.html" target="_self">cutlass::platform::is_arithmetic&lt; T &gt;</a></td><td class="desc">Std::is_arithmetic </td></tr>
-<tr id="row_131_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_131_" class="arrow" onclick="toggleFolder('131_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_same&lt; float, remove_cv&lt; T &gt;::type &gt;::value||is_same&lt; double, remove_cv&lt; T &gt;::type &gt;::value)&gt;</a></td><td class="desc"></td></tr>
-<tr id="row_131_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__floating__point.html" target="_self">cutlass::platform::is_floating_point&lt; T &gt;</a></td><td class="desc">Std::is_floating_point </td></tr>
-<tr id="row_132_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_132_" class="arrow" onclick="toggleFolder('132_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(N &amp;(N - 1))==0 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_132_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1is__pow2.html" target="_self">cutlass::is_pow2&lt; N &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_133_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html" target="_self">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;</a></td><td class="desc">Helper for std::is_base_of </td></tr>
-<tr id="row_134_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html" target="_self">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a></td><td class="desc">An iterator implementing <a class="el" href="group__predicate__iterator__concept.html">Predicate Iterator Concept</a> enabling sequential read and write access to predicates </td></tr>
-<tr id="row_135_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1IteratorAdvance.html" target="_self">cutlass::IteratorAdvance</a></td><td class="desc">Specifies dimension in which post-increment accesses advance </td></tr>
-<tr id="row_136_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1IteratorFragment.html" target="_self">cutlass::IteratorFragment</a></td><td class="desc">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix </td></tr>
-<tr id="row_137_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1less.html" target="_self">cutlass::platform::less&lt; T &gt;</a></td><td class="desc">Std::less </td></tr>
-<tr id="row_138_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html" target="_self">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="desc">Functor to compute linear combination of fragments </td></tr>
-<tr id="row_139_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load.html" target="_self">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_140_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html" target="_self">cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_141_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html" target="_self">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_142_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html" target="_self">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_143_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html" target="_self">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_144_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__down.html" target="_self">cutlass::log2_down&lt; N, CurrentVal, Count &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_145_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html" target="_self">cutlass::log2_down&lt; N, 1, Count &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_146_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__up.html" target="_self">cutlass::log2_up&lt; N, CurrentVal, Count &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_147_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html" target="_self">cutlass::log2_up&lt; N, 1, Count &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_148_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a></td><td class="desc"></td></tr>
-<tr id="row_149_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout.html" target="_self">cutlass::MatrixLayout</a></td><td class="desc">Describes layouts of matrices </td></tr>
-<tr id="row_150_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MemorySpace.html" target="_self">cutlass::MemorySpace</a></td><td class="desc">Enum to specify which memory space data resides in </td></tr>
-<tr id="row_151_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1nullptr__t.html" target="_self">cutlass::platform::nullptr_t</a></td><td class="desc">Std::nullptr_t </td></tr>
-<tr id="row_152_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html" target="_self">cutlass::platform::alignment_of&lt; value_t &gt;::pad</a></td><td class="desc"></td></tr>
-<tr id="row_153_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html" target="_self">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_154_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_154_" class="arrow" onclick="toggleFolder('154_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><b>Params</b></td><td class="desc"></td></tr>
-<tr id="row_154_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html" target="_self">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;::Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_155_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_156_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html" target="_self">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_157_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_157_" class="arrow" onclick="toggleFolder('157_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html" target="_self">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="desc">Parameters to the iterator </td></tr>
-<tr id="row_157_0_" class="even" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_157_0_" class="arrow" onclick="toggleFolder('157_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html" target="_self">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="desc">Parameters </td></tr>
-<tr id="row_157_0_0_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html" target="_self">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="desc"></td></tr>
-<tr id="row_157_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html" target="_self">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="desc">Parameters </td></tr>
-<tr id="row_158_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html" target="_self">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_159_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_160_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html" target="_self">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="desc">The params </td></tr>
-<tr id="row_161_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html" target="_self">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="desc">The parameters </td></tr>
-<tr id="row_162_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1plus.html" target="_self">cutlass::platform::plus&lt; T &gt;</a></td><td class="desc">Platform::plus </td></tr>
-<tr id="row_163_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateTileAdapter.html" target="_self">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a></td><td class="desc">Adapter to enable random access to predicates via logical coordinate within a tile </td></tr>
-<tr id="row_164_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector.html" target="_self">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a></td><td class="desc">Statically sized array of bits implementing </td></tr>
-<tr id="row_165_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector.html" target="_self">cutlass::PredicateVector&lt; Base::Iterations::kW &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_166_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector.html" target="_self">cutlass::PredicateVector&lt; ShapeCount&lt; typename Base::Iterations &gt;::kCount &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_167_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand.html" target="_self">cutlass::gemm::ProjectOperand&lt; operand, Kstrided &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_168_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html" target="_self">cutlass::gemm::ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;</a></td><td class="desc">Project A operand - (0, K, M) </td></tr>
-<tr id="row_169_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html" target="_self">cutlass::gemm::ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;</a></td><td class="desc">Project B operand - (0, K, N) </td></tr>
-<tr id="row_170_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html" target="_self">cutlass::gemm::ProjectOperand&lt; GemmOperand::kC, true &gt;</a></td><td class="desc">Project C operand - (0, N, M) </td></tr>
-<tr id="row_171_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html" target="_self">cutlass::gemm::ProjectOperand&lt; GemmOperand::kD, true &gt;</a></td><td class="desc">Project D operand - (0, N, M) </td></tr>
-<tr id="row_172_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__const.html" target="_self">cutlass::platform::remove_const&lt; T &gt;</a></td><td class="desc">Std::remove_const (non-const specialization) </td></tr>
-<tr id="row_173_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html" target="_self">cutlass::platform::remove_const&lt; const T &gt;</a></td><td class="desc">Std::remove_const (const specialization) </td></tr>
-<tr id="row_174_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__cv.html" target="_self">cutlass::platform::remove_cv&lt; T &gt;</a></td><td class="desc">Std::remove_cv </td></tr>
-<tr id="row_175_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__volatile.html" target="_self">cutlass::platform::remove_volatile&lt; T &gt;</a></td><td class="desc">Std::remove_volatile (non-volatile specialization) </td></tr>
-<tr id="row_176_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html" target="_self">cutlass::platform::remove_volatile&lt; volatile T &gt;</a></td><td class="desc">Std::remove_volatile (volatile specialization) </td></tr>
-<tr id="row_177_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html" target="_self">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, bool &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_178_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html" target="_self">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_179_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ReshapeTile.html" target="_self">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, bool &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_180_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html" target="_self">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_181_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Shape.html" target="_self">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a></td><td class="desc">A <a class="el" href="structcutlass_1_1Shape.html" title="A Shape implementing Layout Concept describing the dimensions of a cube. ">Shape</a> implementing <a class="el" href="group__layout__concept.html">Layout Concept</a> describing the dimensions of a cube </td></tr>
-<tr id="row_182_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeAdd.html" target="_self">cutlass::ShapeAdd&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_183_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeCount.html" target="_self">cutlass::ShapeCount&lt; Shape &gt;</a></td><td class="desc">Compute derived counted of a <a class="el" href="group__layout__concept.html">Layout Concept</a> based class </td></tr>
-<tr id="row_184_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeDiv.html" target="_self">cutlass::ShapeDiv&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_185_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMax.html" target="_self">cutlass::ShapeMax&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_186_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMin.html" target="_self">cutlass::ShapeMin&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_187_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMul.html" target="_self">cutlass::ShapeMul&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_188_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeScale.html" target="_self">cutlass::ShapeScale&lt; A_, kScale_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_189_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeStrides.html" target="_self">cutlass::ShapeStrides&lt; Shape_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_190_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeSub.html" target="_self">cutlass::ShapeSub&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_191_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream</a></td><td class="desc">Assemble the shared load stream for A/B </td></tr>
-<tr id="row_192_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html" target="_self">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_193_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html" target="_self">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;::SharedStorage</a></td><td class="desc">The shared storage </td></tr>
-<tr id="row_194_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a></td><td class="desc">The shared memory to swizzle the data in the epilogue </td></tr>
-<tr id="row_195_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage</a></td><td class="desc">The storage in shared memory </td></tr>
-<tr id="row_196_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html" target="_self">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage</a></td><td class="desc">The storage in shared memory needed by that stream </td></tr>
-<tr id="row_197_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html" target="_self">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_198_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1sqrt__est.html" target="_self">cutlass::sqrt_est&lt; N &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_199_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType.html" target="_self">cutlass::StorageType&lt; kAlignment_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_200_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_011_01_4.html" target="_self">cutlass::StorageType&lt; 1 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_201_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_012_01_4.html" target="_self">cutlass::StorageType&lt; 2 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_202_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_014_01_4.html" target="_self">cutlass::StorageType&lt; 4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_203_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store.html" target="_self">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_204_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html" target="_self">cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_205_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html" target="_self">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_206_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html" target="_self">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_207_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html" target="_self">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_208_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStream_, SharedLoadStream_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_209_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a></td><td class="desc">The shared memory storage to exchange data </td></tr>
-<tr id="row_210_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStreamA, SharedLoadStreamA &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_211_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStreamB, SharedLoadStreamB &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_212_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef.html" target="_self">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td><td class="desc">Structure modeling a pointer and stride into a tensor </td></tr>
-<tr id="row_213_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_213_" class="arrow" onclick="toggleFolder('213_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef.html" target="_self">cutlass::TensorRef&lt; T, 4 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_213_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorView.html" target="_self">cutlass::TensorView&lt; T &gt;</a></td><td class="desc">Host-side reference implementation of tensor operations </td></tr>
-<tr id="row_214_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html" target="_self">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
-<tr id="row_215_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html" target="_self">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
-<tr id="row_216_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html" target="_self">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
-<tr id="row_217_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_218_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_219_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_220_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_221_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_222_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_223_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_224_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_225_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;::ThreadOffset</a></td><td class="desc"></td></tr>
-<tr id="row_226_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html" target="_self">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_227_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc"></td></tr>
-<tr id="row_228_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
-<tr id="row_229_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TiledThreadOffset.html" target="_self">cutlass::TiledThreadOffset&lt; ThreadShape &gt;</a></td><td class="desc">Basic thread offset function computed from a thread shape </td></tr>
-<tr id="row_230_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_230_" class="arrow" onclick="toggleFolder('230_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase.html" target="_self">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="desc">Iterator for accessing a stripmined tile in memory </td></tr>
-<tr id="row_230_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator.html" target="_self">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="desc">An iterator implementing <a class="el" href="group__tile__load__iterator__concept.html">Tile Load Iterator Concept</a> for loading a tile from memory </td></tr>
-<tr id="row_230_1_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreIterator.html" target="_self">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="desc">An iterator implementing <a class="el" href="group__tile__store__iterator__concept.html">Tile Store Iterator Concept</a> for storing a tile to memory </td></tr>
-<tr id="row_231_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_231_" class="arrow" onclick="toggleFolder('231_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase.html" target="_self">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_231_0_" class="even" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_231_0_" class="arrow" onclick="toggleFolder('231_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator.html" target="_self">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_231_0_0_" class="even" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html" target="_self">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_232_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_232_" class="arrow" onclick="toggleFolder('232_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase.html" target="_self">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_232_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html" target="_self">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_232_1_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html" target="_self">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_233_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraits.html" target="_self">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a></td><td class="desc">A template defining <a class="el" href="group__tile__traits__concept.html">Tile Traits Concept</a> </td></tr>
-<tr id="row_234_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html" target="_self">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_235_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsStandard.html" target="_self">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="desc">Chooses 'best' shape to enable warp raking along contiguous dimension if possible </td></tr>
-<tr id="row_236_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html" target="_self">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_237_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsWarpRake.html" target="_self">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a></td><td class="desc">Tiling in which warps rake across the contiguous dimension </td></tr>
-<tr id="row_238_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html" target="_self">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a></td><td class="desc"><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html" title="An iterator implementing Predicate Iterator Concept enabling sequential read and write access to pred...">Iterator</a> that always returns true </td></tr>
-<tr id="row_239_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html" target="_self">cutlass::TrivialPredicateTileAdapter</a></td><td class="desc">Always returns true predicate </td></tr>
-<tr id="row_240_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html" target="_self">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a></td><td class="desc">Std::unique_ptr </td></tr>
-<tr id="row_241_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector.html" target="_self">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_242_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html" target="_self">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_243_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize.html" target="_self">cutlass::Vectorize&lt; Element_, kLanes_ &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_244_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html" target="_self">cutlass::Vectorize&lt; Element_, 1 &gt;</a></td><td class="desc"></td></tr>
-<tr id="row_245_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits.html" target="_self">cutlass::VectorTraits&lt; T &gt;</a></td><td class="desc">Traits describing properties of vectors and scalar-as-vectors </td></tr>
-<tr id="row_246_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html" target="_self">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a></td><td class="desc">Partial specialization for actual <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a> </td></tr>
-<tr id="row_247_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html" target="_self">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a></td><td class="desc">Partial specialization for actual <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a> </td></tr>
+<tr id="row_16_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1bin1__t.html" target="_self">cutlass::bin1_t</a></td><td class="desc"></td></tr>
+<tr id="row_17_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html" target="_self">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_18_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html" target="_self">cutlass::MatrixLayout::ColumnMajor</a></td><td class="desc">Mapping function for column-major matrices </td></tr>
+<tr id="row_19_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html" target="_self">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_20_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html" target="_self">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_21_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html" target="_self">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_22_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1platform_1_1complex.html" target="_self">cutlass::platform::complex&lt; T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_23_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html" target="_self">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube </td></tr>
+<tr id="row_24_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html" target="_self">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a></td><td class="desc">Compute the offset for the given coordinates in a cube </td></tr>
+<tr id="row_25_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html" target="_self">cutlass::ComputeThreadOffsetFromStrides&lt; Threads_, Strides_ &gt;</a></td><td class="desc">Decompose threadId.x into coordinate of a cube whose dimensions are specified by Threads_. Afterwards compute the offset of those coordinates using Strides_ </td></tr>
+<tr id="row_26_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html" target="_self">cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a></td><td class="desc">Specialization for D=1 and C=1 </td></tr>
+<tr id="row_27_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html" target="_self">cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a></td><td class="desc">Specialization for D=1 </td></tr>
+<tr id="row_28_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1conditional.html" target="_self">cutlass::platform::conditional&lt; B, T, F &gt;</a></td><td class="desc">Std::conditional (true specialization) </td></tr>
+<tr id="row_29_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html" target="_self">cutlass::platform::conditional&lt; false, T, F &gt;</a></td><td class="desc">Std::conditional (false specialization) </td></tr>
+<tr id="row_30_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html" target="_self">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator</a></td><td class="desc">A const iterator implementing <a class="el" href="group__predicate__iterator__concept.html">Predicate Iterator Concept</a> enabling sequential read-only access to prediactes </td></tr>
+<tr id="row_31_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html" target="_self">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="desc">Constant iterator over tensors implied by <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a> </td></tr>
+<tr id="row_32_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html" target="_self">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td><td class="desc">TensorRefIterator over <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects in <a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a> </td></tr>
+<tr id="row_33_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ConstPredicateTileAdapter.html" target="_self">cutlass::ConstPredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a></td><td class="desc">Adapter to enable random access to predicates via logical coordinate within a tile </td></tr>
+<tr id="row_34_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html" target="_self">cutlass::MatrixLayout::ContiguousLayout</a></td><td class="desc"></td></tr>
+<tr id="row_35_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Convert.html" target="_self">cutlass::Convert&lt; InputFragment_, OutputFragment_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_36_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html" target="_self">cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_37_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="desc">Statically-sized array specifying Coords within a tensor </td></tr>
+<tr id="row_38_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_38_" class="arrow" onclick="toggleFolder('38_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; 2, int &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_38_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixCoord.html" target="_self">cutlass::MatrixCoord</a></td><td class="desc"></td></tr>
+<tr id="row_39_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; 3 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_40_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; 4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_41_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_41_" class="arrow" onclick="toggleFolder('41_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_41_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileCoord.html" target="_self">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_42_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_42_" class="arrow" onclick="toggleFolder('42_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; 4, int &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_42_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html" target="_self">cutlass::gemm::GemmCoord</a></td><td class="desc"></td></tr>
+<tr id="row_43_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Coord.html" target="_self">cutlass::Coord&lt; kStorageRank - 1 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_44_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Copy.html" target="_self">cutlass::Copy&lt; Fragment_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_45_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structDebugType.html" target="_self">DebugType&lt; T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_46_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structDebugValue.html" target="_self">DebugValue&lt; Value &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_47_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1default__delete.html" target="_self">cutlass::platform::default_delete&lt; T &gt;</a></td><td class="desc">Default deleter </td></tr>
+<tr id="row_48_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html" target="_self">cutlass::platform::default_delete&lt; T[]&gt;</a></td><td class="desc">Partial specialization for deleting array types </td></tr>
+<tr id="row_49_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1divide__assert.html" target="_self">cutlass::divide_assert&lt; Dividend, Divisor &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_50_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html" target="_self">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;::dummy&lt; B, D &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_51_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1DumpType.html" target="_self">cutlass::DumpType&lt; T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_52_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1enable__if.html" target="_self">cutlass::platform::enable_if&lt; C, T &gt;</a></td><td class="desc">Std::enable_if (true specialization) </td></tr>
+<tr id="row_53_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html" target="_self">cutlass::platform::enable_if&lt; false, T &gt;</a></td><td class="desc">Std::enable_if (false specialization) </td></tr>
+<tr id="row_54_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent.html" target="_self">cutlass::Extent&lt; T &gt;</a></td><td class="desc">Returns the extent of a scalar or vector </td></tr>
+<tr id="row_55_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html" target="_self">cutlass::Extent&lt; Vector&lt; T, Lanes &gt; &gt;</a></td><td class="desc">Returns the number of lanes of a vector if need be </td></tr>
+<tr id="row_56_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html" target="_self">cutlass::Extent&lt; Vector&lt; T, Lanes &gt; const &gt;</a></td><td class="desc">Returns the number of lanes of a vector if need be </td></tr>
+<tr id="row_57_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentConstIterator.html" target="_self">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_58_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentElementType.html" target="_self">cutlass::FragmentElementType</a></td><td class="desc">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix </td></tr>
+<tr id="row_59_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1FragmentIterator.html" target="_self">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="desc">A template defining <a class="el" href="group__fragment__iterator__concept.html">Fragment Iterator Concept</a> </td></tr>
+<tr id="row_60_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html" target="_self">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_61_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html" target="_self">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_62_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html" target="_self">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_63_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_64_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_64_" class="arrow" onclick="toggleFolder('64_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_64_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html" target="_self">cutlass::gemm::DgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_65_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_65_" class="arrow" onclick="toggleFolder('65_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_65_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html" target="_self">cutlass::gemm::SgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, kLaunchBounds &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_66_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_66_" class="arrow" onclick="toggleFolder('66_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_66_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html" target="_self">cutlass::gemm::HgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_67_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_67_" class="arrow" onclick="toggleFolder('67_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_67_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html" target="_self">cutlass::gemm::IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_68_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_68_" class="arrow" onclick="toggleFolder('68_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_68_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html" target="_self">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_69_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_69_" class="arrow" onclick="toggleFolder('69_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html" target="_self">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_69_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html" target="_self">cutlass::gemm::Fp16SgemmConfig&lt; OutputTile_, ThreadGemmShape_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_70_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html" target="_self">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="desc">GEMM problem description </td></tr>
+<tr id="row_71_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_71_" class="arrow" onclick="toggleFolder('71_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html" target="_self">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_71_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html" target="_self">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_71_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html" target="_self">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_72_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_73_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_73_" class="arrow" onclick="toggleFolder('73_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_73_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html" target="_self">cutlass::gemm::SimplifiedGemmEpilogueTraits&lt; GemmConfig_, EpilogueFunctor_, Index_, Helper_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_74_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_74_" class="arrow" onclick="toggleFolder('74_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_74_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html" target="_self">cutlass::gemm::IgemmEpilogueTraits&lt; IgemmConfig_, EpilogueFunctor_, Index_, Helper_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_75_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html" target="_self">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_76_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_76_" class="arrow" onclick="toggleFolder('76_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html" target="_self">cutlass::gemm::GemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_76_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html" target="_self">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_77_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_77_" class="arrow" onclick="toggleFolder('77_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html" target="_self">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_77_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html" target="_self">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_77_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html" target="_self">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_78_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_78_" class="arrow" onclick="toggleFolder('78_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html" target="_self">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_78_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html" target="_self">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_78_1_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html" target="_self">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_79_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html" target="_self">cutlass::gemm::GemmMultiplicandTraits&lt; ThreadBlockTile_, Usage, Layout &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_80_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1GemmOperand.html" target="_self">cutlass::GemmOperand</a></td><td class="desc">Gemm operand - D = A * B + C </td></tr>
+<tr id="row_81_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html" target="_self">cutlass::gemm::GemmOperandTraitsAb&lt; kOperand_, kLayout_ &gt;</a></td><td class="desc">Helper to describe attributes of GEMM matrix operands </td></tr>
+<tr id="row_82_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html" target="_self">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_83_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html" target="_self">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_84_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html" target="_self">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_85_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html" target="_self">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_86_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html" target="_self">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_87_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html" target="_self">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_88_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html" target="_self">cutlass::gemm::GemmTileTraitsHelperA&lt; Kind, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_89_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_89_" class="arrow" onclick="toggleFolder('89_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html" target="_self">cutlass::gemm::GemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_89_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html" target="_self">cutlass::gemm::HgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_89_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_90_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_90_" class="arrow" onclick="toggleFolder('90_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_90_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_91_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_91_" class="arrow" onclick="toggleFolder('91_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_91_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_92_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html" target="_self">cutlass::gemm::GemmTileTraitsHelperB&lt; Kind, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_93_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_93_" class="arrow" onclick="toggleFolder('93_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html" target="_self">cutlass::gemm::GemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_93_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html" target="_self">cutlass::gemm::HgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_93_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_94_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_94_" class="arrow" onclick="toggleFolder('94_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_94_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_95_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_95_" class="arrow" onclick="toggleFolder('95_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" target="_self">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_95_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_96_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_97_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_97_" class="arrow" onclick="toggleFolder('97_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_97_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" target="_self">cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, Epilogue_, Index_, GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Helper_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_98_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_98_" class="arrow" onclick="toggleFolder('98_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_98_0_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_98_0_" class="arrow" onclick="toggleFolder('98_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" target="_self">cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_98_0_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html" target="_self">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_98_0_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html" target="_self">cutlass::gemm::Fp16SgemmSgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, Scalar_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_98_0_2_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html" target="_self">cutlass::gemm::SgemmLBTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td><td class="desc">Helper to define SGEMM traits using <a class="el" href="structcutlass_1_1gemm_1_1Launch.html" title="Partial specialization for launching the GEMM kernel with or without launch bounds. ">Launch</a> Bounds </td></tr>
+<tr id="row_98_0_3_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html" target="_self">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_99_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_99_" class="arrow" onclick="toggleFolder('99_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html" target="_self">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_99_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html" target="_self">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_99_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html" target="_self">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_, Helper_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_100_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent.html" target="_self">cutlass::gemm::GetExtent&lt; kOperand_, Tile_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_101_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html" target="_self">cutlass::gemm::GetExtent&lt; GemmOperand::kA, Tile_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_102_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html" target="_self">cutlass::gemm::GetExtent&lt; GemmOperand::kB, Tile_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_103_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html" target="_self">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_104_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html" target="_self">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="desc">Collect the global load streams for multiplicands </td></tr>
+<tr id="row_105_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1greater.html" target="_self">cutlass::platform::greater&lt; T &gt;</a></td><td class="desc">Std::greater </td></tr>
+<tr id="row_106_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmSwizzle.html" target="_self">cutlass::gemm::HgemmSwizzle&lt; GlobalIterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_107_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html" target="_self">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_108_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html" target="_self">cutlass::gemm::HgemmTransformerA&lt; kLayout_, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_109_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_110_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_111_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html" target="_self">cutlass::gemm::HgemmTransformerB&lt; kLayout_, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_112_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_113_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_114_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Identity.html" target="_self">cutlass::Identity</a></td><td class="desc">Describes identity elements </td></tr>
+<tr id="row_115_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html" target="_self">cutlass::gemm::IdentityBlockSwizzle</a></td><td class="desc"></td></tr>
+<tr id="row_116_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html" target="_self">cutlass::IdentityTensorMapFunc&lt; Rank &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_117_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html" target="_self">cutlass::IdentityTensorMapFunc&lt; Rank_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_118_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html" target="_self">cutlass::gemm::IgemmEpilogueScalar&lt; ScalarD_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_119_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html" target="_self">cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_120_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html" target="_self">cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_121_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html" target="_self">cutlass::gemm::IgemmGlobalLoadTransformer&lt; InputFragment_, OutputScalar_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_122_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html" target="_self">cutlass::gemm::IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_123_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html" target="_self">cutlass::gemm::IgemmGlobalStoreTransformer&lt; InputScalar_, OutputFragment_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_124_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html" target="_self">cutlass::gemm::IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_125_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html" target="_self">cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_126_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html" target="_self">cutlass::gemm::IgemmSharedStoreTransformer&lt; InputScalar_, OutputFragment_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_127_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html" target="_self">cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_128_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_129_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html" target="_self">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_130_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html" target="_self">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_131_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html" target="_self">cutlass::gemm::IgemmTransformerA&lt; kLayout_, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_132_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_133_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_134_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html" target="_self">cutlass::gemm::IgemmTransformerB&lt; kLayout_, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_135_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_136_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html" target="_self">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_137_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1int4__t.html" target="_self">cutlass::int4_t</a></td><td class="desc"></td></tr>
+<tr id="row_138_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_138_" class="arrow" onclick="toggleFolder('138_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; value_t, V &gt;</a></td><td class="desc">Std::integral_constant </td></tr>
+<tr id="row_138_0_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_138_0_" class="arrow" onclick="toggleFolder('138_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral.html" target="_self">cutlass::platform::is_integral&lt; T &gt;</a></td><td class="desc">Std::is_integral </td></tr>
+<tr id="row_138_0_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html" target="_self">cutlass::platform::is_integral&lt; const T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_0_1_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html" target="_self">cutlass::platform::is_integral&lt; const volatile T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_0_2_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html" target="_self">cutlass::platform::is_integral&lt; volatile T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_1_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html" target="_self">cutlass::platform::is_integral&lt; char &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_2_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html" target="_self">cutlass::platform::is_integral&lt; int &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_3_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html" target="_self">cutlass::platform::is_integral&lt; long &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_4_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html" target="_self">cutlass::platform::is_integral&lt; long long &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_5_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html" target="_self">cutlass::platform::is_integral&lt; short &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_6_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html" target="_self">cutlass::platform::is_integral&lt; signed char &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_7_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned char &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_8_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned int &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_9_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned long &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_10_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned long long &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_11_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html" target="_self">cutlass::platform::is_integral&lt; unsigned short &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_12_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper.html" target="_self">cutlass::platform::is_pointer_helper&lt; T &gt;</a></td><td class="desc">Helper for std::is_pointer (false specialization) </td></tr>
+<tr id="row_138_13_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html" target="_self">cutlass::platform::is_pointer_helper&lt; T * &gt;</a></td><td class="desc">Helper for std::is_pointer (true specialization) </td></tr>
+<tr id="row_138_14_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same.html" target="_self">cutlass::platform::is_same&lt; A, B &gt;</a></td><td class="desc">Std::is_same (false specialization) </td></tr>
+<tr id="row_138_15_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html" target="_self">cutlass::platform::is_same&lt; A, A &gt;</a></td><td class="desc">Std::is_same (true specialization) </td></tr>
+<tr id="row_138_16_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__volatile.html" target="_self">cutlass::platform::is_volatile&lt; T &gt;</a></td><td class="desc">Std::is_volatile </td></tr>
+<tr id="row_138_17_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html" target="_self">cutlass::platform::is_volatile&lt; volatile T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_18_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_138_18_" class="arrow" onclick="toggleFolder('138_18_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer__helper.html" target="_self">cutlass::platform::is_pointer_helper&lt; remove_cv&lt; T &gt;::type &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_18_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__pointer.html" target="_self">cutlass::platform::is_pointer&lt; T &gt;</a></td><td class="desc">Std::is_pointer </td></tr>
+<tr id="row_138_19_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_138_19_" class="arrow" onclick="toggleFolder('138_19_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__same.html" target="_self">cutlass::platform::is_same&lt; void, remove_cv&lt; T &gt;::type &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_138_19_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__void.html" target="_self">cutlass::platform::is_void&lt; T &gt;</a></td><td class="desc">Std::is_void </td></tr>
+<tr id="row_139_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_139_" class="arrow" onclick="toggleFolder('139_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool, V &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_139_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1bool__constant.html" target="_self">cutlass::platform::bool_constant&lt; V &gt;</a></td><td class="desc">Std::bool_constant </td></tr>
+<tr id="row_140_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_140_" class="arrow" onclick="toggleFolder('140_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_arithmetic&lt; T &gt;::value||is_void&lt; T &gt;::value||is_same&lt; nullptr_t, remove_cv&lt; T &gt;::type &gt;::value)&gt;</a></td><td class="desc"></td></tr>
+<tr id="row_140_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__fundamental.html" target="_self">cutlass::platform::is_fundamental&lt; T &gt;</a></td><td class="desc">Std::is_fundamental </td></tr>
+<tr id="row_141_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_141_" class="arrow" onclick="toggleFolder('141_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_base_of_helper&lt; remove_cv&lt; BaseT &gt;::type, remove_cv&lt; DerivedT &gt;::type &gt;::value)||(is_same&lt; remove_cv&lt; BaseT &gt;::type, remove_cv&lt; DerivedT &gt;::type &gt;::value)&gt;</a></td><td class="desc"></td></tr>
+<tr id="row_141_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of.html" target="_self">cutlass::platform::is_base_of&lt; BaseT, DerivedT &gt;</a></td><td class="desc">Std::is_base_of </td></tr>
+<tr id="row_142_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_142_" class="arrow" onclick="toggleFolder('142_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_fundamental&lt; T &gt;::value||is_pointer&lt; T &gt;::value)&gt;</a></td><td class="desc"></td></tr>
+<tr id="row_142_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__trivially__copyable.html" target="_self">cutlass::platform::is_trivially_copyable&lt; T &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_143_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_143_" class="arrow" onclick="toggleFolder('143_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_integral&lt; T &gt;::value||is_floating_point&lt; T &gt;::value)&gt;</a></td><td class="desc"></td></tr>
+<tr id="row_143_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__arithmetic.html" target="_self">cutlass::platform::is_arithmetic&lt; T &gt;</a></td><td class="desc">Std::is_arithmetic </td></tr>
+<tr id="row_144_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_144_" class="arrow" onclick="toggleFolder('144_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(is_same&lt; float, remove_cv&lt; T &gt;::type &gt;::value||is_same&lt; double, remove_cv&lt; T &gt;::type &gt;::value)&gt;</a></td><td class="desc"></td></tr>
+<tr id="row_144_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__floating__point.html" target="_self">cutlass::platform::is_floating_point&lt; T &gt;</a></td><td class="desc">Std::is_floating_point </td></tr>
+<tr id="row_145_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_145_" class="arrow" onclick="toggleFolder('145_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1integral__constant.html" target="_self">cutlass::platform::integral_constant&lt; bool,(N &amp;(N - 1))==0 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_145_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1is__pow2.html" target="_self">cutlass::is_pow2&lt; N &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_146_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1is__base__of__helper.html" target="_self">cutlass::platform::is_base_of_helper&lt; BaseT, DerivedT &gt;</a></td><td class="desc">Helper for std::is_base_of </td></tr>
+<tr id="row_147_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html" target="_self">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator</a></td><td class="desc">An iterator implementing <a class="el" href="group__predicate__iterator__concept.html">Predicate Iterator Concept</a> enabling sequential read and write access to predicates </td></tr>
+<tr id="row_148_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1IteratorAdvance.html" target="_self">cutlass::IteratorAdvance</a></td><td class="desc">Specifies dimension in which post-increment accesses advance </td></tr>
+<tr id="row_149_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_149_" class="arrow" onclick="toggleFolder('149_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html" target="_self">cutlass::KernelLaunchConfiguration</a></td><td class="desc">Structure containing the basic launch configuration of a CUDA kernel </td></tr>
+<tr id="row_149_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="desc">Parameters object constructable on the host </td></tr>
+<tr id="row_150_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Launch.html" target="_self">cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt;</a></td><td class="desc">Partial specialization for launching the GEMM kernel with or without launch bounds </td></tr>
+<tr id="row_151_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html" target="_self">cutlass::gemm::Launch&lt; Gemm, false &gt;</a></td><td class="desc">Partial specialization for launching the GEMM kernel with or without launch bounds </td></tr>
+<tr id="row_152_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1less.html" target="_self">cutlass::platform::less&lt; T &gt;</a></td><td class="desc">Std::less </td></tr>
+<tr id="row_153_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_153_" class="arrow" onclick="toggleFolder('153_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html" target="_self">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="desc">Functor to compute linear combination of fragments </td></tr>
+<tr id="row_153_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html" target="_self">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_154_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load.html" target="_self">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_155_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html" target="_self">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_156_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html" target="_self">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td><td class="desc">Partial specialization for 16b loads </td></tr>
+<tr id="row_157_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html" target="_self">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_158_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html" target="_self">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_159_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html" target="_self">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_160_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html" target="_self">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_161_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html" target="_self">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_162_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html" target="_self">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_163_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html" target="_self">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_164_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__down.html" target="_self">cutlass::log2_down&lt; N, CurrentVal, Count &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_165_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html" target="_self">cutlass::log2_down&lt; N, 1, Count &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_166_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__up.html" target="_self">cutlass::log2_up&lt; N, CurrentVal, Count &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_167_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html" target="_self">cutlass::log2_up&lt; N, 1, Count &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_168_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a></td><td class="desc"></td></tr>
+<tr id="row_169_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout.html" target="_self">cutlass::MatrixLayout</a></td><td class="desc">Defines data layouts of various matrix formats usable by <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> and other classes </td></tr>
+<tr id="row_170_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixTransform.html" target="_self">cutlass::MatrixTransform</a></td><td class="desc">Transformation applied to matrix operands </td></tr>
+<tr id="row_171_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Max.html" target="_self">cutlass::Max&lt; A, B &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_172_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MemorySpace.html" target="_self">cutlass::MemorySpace</a></td><td class="desc">Enum to specify which memory space data resides in </td></tr>
+<tr id="row_173_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Min.html" target="_self">cutlass::Min&lt; A, B &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_174_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1nullptr__t.html" target="_self">cutlass::platform::nullptr_t</a></td><td class="desc">Std::nullptr_t </td></tr>
+<tr id="row_175_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html" target="_self">cutlass::platform::alignment_of&lt; value_t &gt;::pad</a></td><td class="desc"></td></tr>
+<tr id="row_176_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html" target="_self">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="desc">The parameters </td></tr>
+<tr id="row_177_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html" target="_self">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_178_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html" target="_self">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params</a></td><td class="desc">Parameters object passed to load iterators </td></tr>
+<tr id="row_179_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html" target="_self">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a></td><td class="desc"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html" title="Params object. ">Params</a> object </td></tr>
+<tr id="row_180_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html" target="_self">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="desc">The parameters </td></tr>
+<tr id="row_181_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html" target="_self">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a></td><td class="desc">Parameters object </td></tr>
+<tr id="row_182_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_182_" class="arrow" onclick="toggleFolder('182_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html" target="_self">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_182_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html" target="_self">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_183_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_184_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_184_" class="arrow" onclick="toggleFolder('184_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html" target="_self">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="desc">Parameters to the iterator </td></tr>
+<tr id="row_184_0_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_184_0_" class="arrow" onclick="toggleFolder('184_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html" target="_self">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="desc">Parameters </td></tr>
+<tr id="row_184_0_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html" target="_self">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="desc"></td></tr>
+<tr id="row_184_1_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html" target="_self">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="desc">Parameters </td></tr>
+<tr id="row_185_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html" target="_self">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="desc">Parameters object used to construct generic load stream </td></tr>
+<tr id="row_186_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html" target="_self">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="desc">Parameters used to construct the stream </td></tr>
+<tr id="row_187_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html" target="_self">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="desc">The params </td></tr>
+<tr id="row_188_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1plus.html" target="_self">cutlass::platform::plus&lt; T &gt;</a></td><td class="desc">Platform::plus </td></tr>
+<tr id="row_189_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateTileAdapter.html" target="_self">cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;</a></td><td class="desc">Adapter to enable random access to predicates via logical coordinate within a tile </td></tr>
+<tr id="row_190_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html" target="_self">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::PredicateVector</a></td><td class="desc">Empty predicate vector struct </td></tr>
+<tr id="row_191_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector.html" target="_self">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;</a></td><td class="desc">Statically sized array of bits implementing </td></tr>
+<tr id="row_192_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html" target="_self">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::PredicateVector</a></td><td class="desc">Empty predicate vector struct </td></tr>
+<tr id="row_193_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector.html" target="_self">cutlass::PredicateVector&lt; Base::Iterations::kW &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_194_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector.html" target="_self">cutlass::PredicateVector&lt; ShapeCount&lt; typename Base::Iterations &gt;::kCount &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_195_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand.html" target="_self">cutlass::gemm::ProjectOperand&lt; operand, Kstrided &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_196_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html" target="_self">cutlass::gemm::ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;</a></td><td class="desc">Project A operand - (0, K, M) </td></tr>
+<tr id="row_197_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html" target="_self">cutlass::gemm::ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;</a></td><td class="desc">Project B operand - (0, K, N) </td></tr>
+<tr id="row_198_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html" target="_self">cutlass::gemm::ProjectOperand&lt; GemmOperand::kC, true &gt;</a></td><td class="desc">Project C operand - (0, N, M) </td></tr>
+<tr id="row_199_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html" target="_self">cutlass::gemm::ProjectOperand&lt; GemmOperand::kD, true &gt;</a></td><td class="desc">Project D operand - (0, N, M) </td></tr>
+<tr id="row_200_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html" target="_self">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a></td><td class="desc">Functor computing a predicate given the logical position of an access </td></tr>
+<tr id="row_201_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__const.html" target="_self">cutlass::platform::remove_const&lt; T &gt;</a></td><td class="desc">Std::remove_const (non-const specialization) </td></tr>
+<tr id="row_202_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html" target="_self">cutlass::platform::remove_const&lt; const T &gt;</a></td><td class="desc">Std::remove_const (const specialization) </td></tr>
+<tr id="row_203_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__cv.html" target="_self">cutlass::platform::remove_cv&lt; T &gt;</a></td><td class="desc">Std::remove_cv </td></tr>
+<tr id="row_204_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__volatile.html" target="_self">cutlass::platform::remove_volatile&lt; T &gt;</a></td><td class="desc">Std::remove_volatile (non-volatile specialization) </td></tr>
+<tr id="row_205_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html" target="_self">cutlass::platform::remove_volatile&lt; volatile T &gt;</a></td><td class="desc">Std::remove_volatile (volatile specialization) </td></tr>
+<tr id="row_206_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html" target="_self">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, bool &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_207_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html" target="_self">cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_208_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ReshapeTile.html" target="_self">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, bool &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_209_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html" target="_self">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_210_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html" target="_self">cutlass::MatrixLayout::RowMajor</a></td><td class="desc">Mapping function for row-major matrices </td></tr>
+<tr id="row_211_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html" target="_self">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_212_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html" target="_self">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_213_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html" target="_self">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_214_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ScalarIO.html" target="_self">cutlass::ScalarIO&lt; T &gt;</a></td><td class="desc">Helper to enable formatted printing of CUTLASS scalar types to an ostream </td></tr>
+<tr id="row_215_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html" target="_self">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_216_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html" target="_self">cutlass::detail::ScalarOrPointer&lt; Scalar &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_217_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Shape.html" target="_self">cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;</a></td><td class="desc">A <a class="el" href="structcutlass_1_1Shape.html" title="A Shape implementing Layout Concept describing the dimensions of a cube. ">Shape</a> implementing <a class="el" href="group__layout__concept.html">Layout Concept</a> describing the dimensions of a cube </td></tr>
+<tr id="row_218_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeAdd.html" target="_self">cutlass::ShapeAdd&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_219_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeCount.html" target="_self">cutlass::ShapeCount&lt; Shape &gt;</a></td><td class="desc">Compute derived counted of a <a class="el" href="group__layout__concept.html">Layout Concept</a> based class </td></tr>
+<tr id="row_220_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeDiv.html" target="_self">cutlass::ShapeDiv&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_221_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeDivCeiling.html" target="_self">cutlass::ShapeDivCeiling&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_222_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMax.html" target="_self">cutlass::ShapeMax&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_223_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMin.html" target="_self">cutlass::ShapeMin&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_224_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeMul.html" target="_self">cutlass::ShapeMul&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_225_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeScale.html" target="_self">cutlass::ShapeScale&lt; A_, kScale_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_226_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeStrides.html" target="_self">cutlass::ShapeStrides&lt; Shape_, elementsPerAccess &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_227_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ShapeSub.html" target="_self">cutlass::ShapeSub&lt; A_, B_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_228_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html" target="_self">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_229_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a></td><td class="desc">The shared memory to swizzle the data in the epilogue </td></tr>
+<tr id="row_230_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html" target="_self">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage</a></td><td class="desc">Defines a structure containing shared storage for each pair </td></tr>
+<tr id="row_231_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html" target="_self">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage</a></td><td class="desc">The storage in shared memory </td></tr>
+<tr id="row_232_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html" target="_self">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage</a></td><td class="desc"></td></tr>
+<tr id="row_233_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html" target="_self">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;::SharedStorage</a></td><td class="desc">The shared storage </td></tr>
+<tr id="row_234_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html" target="_self">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="desc">Collect the global load streams for multiplicands </td></tr>
+<tr id="row_235_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html" target="_self">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_236_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1sqrt__est.html" target="_self">cutlass::sqrt_est&lt; N &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_237_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType.html" target="_self">cutlass::StorageType&lt; alignment &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_238_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_011_01_4.html" target="_self">cutlass::StorageType&lt; 1 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_239_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_012_01_4.html" target="_self">cutlass::StorageType&lt; 2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_240_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType_3_014_01_4.html" target="_self">cutlass::StorageType&lt; 4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_241_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType.html" target="_self">cutlass::StorageType&lt; kAlignment_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_242_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1StorageType.html" target="_self">cutlass::StorageType&lt; sizeof(Scalar)&gt;</a></td><td class="desc"></td></tr>
+<tr id="row_243_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store.html" target="_self">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_244_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html" target="_self">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_245_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html" target="_self">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_246_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html" target="_self">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_247_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html" target="_self">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_248_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html" target="_self">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_249_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html" target="_self">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_250_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html" target="_self">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a></td><td class="desc">The shared memory storage to exchange data </td></tr>
+<tr id="row_251_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html" target="_self">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StrideVector</a></td><td class="desc"></td></tr>
+<tr id="row_252_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html" target="_self">cutlass::gemm::swizzleDirection</a></td><td class="desc"></td></tr>
+<tr id="row_253_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_253_" class="arrow" onclick="toggleFolder('253_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef.html" target="_self">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_253_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html" target="_self">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_253_1_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorView.html" target="_self">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="desc">Defines a view into a logical tensor </td></tr>
+<tr id="row_254_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef.html" target="_self">cutlass::TensorRef&lt; AType const, 2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_255_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef.html" target="_self">cutlass::TensorRef&lt; BType const, 2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_256_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef.html" target="_self">cutlass::TensorRef&lt; CType const, 2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_257_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef.html" target="_self">cutlass::TensorRef&lt; DType, 2 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_258_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html" target="_self">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td><td class="desc">Specialization for rank=1 case with no internal <a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">StrideVector</a> </td></tr>
+<tr id="row_259_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TensorRefArray.html" target="_self">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_260_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html" target="_self">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
+<tr id="row_261_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html" target="_self">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
+<tr id="row_262_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html" target="_self">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
+<tr id="row_263_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html" target="_self">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="desc">Template performing matrix multiply-add operation within a thread </td></tr>
+<tr id="row_264_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;::ThreadOffset</a></td><td class="desc"></td></tr>
+<tr id="row_265_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_266_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_267_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_268_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc"></td></tr>
+<tr id="row_269_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_270_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_271_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_272_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_273_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html" target="_self">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_274_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_275_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html" target="_self">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="desc">Computes the thread offset in (H, W) based on thread ID </td></tr>
+<tr id="row_276_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileAllocation.html" target="_self">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="desc">Class for storing a tile in memory and accessing it through a tensor ref </td></tr>
+<tr id="row_277_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TiledThreadOffset.html" target="_self">cutlass::TiledThreadOffset&lt; ThreadShape &gt;</a></td><td class="desc">Basic thread offset function computed from a thread shape </td></tr>
+<tr id="row_278_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_278_" class="arrow" onclick="toggleFolder('278_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase.html" target="_self">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="desc">Iterator for accessing a stripmined tile in memory </td></tr>
+<tr id="row_278_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator.html" target="_self">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="desc">An iterator implementing <a class="el" href="group__tile__load__iterator__concept.html">Tile Load Iterator Concept</a> for loading a tile from memory </td></tr>
+<tr id="row_278_1_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreIterator.html" target="_self">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="desc">An iterator implementing <a class="el" href="group__tile__store__iterator__concept.html">Tile Store Iterator Concept</a> for storing a tile to memory </td></tr>
+<tr id="row_279_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_279_" class="arrow" onclick="toggleFolder('279_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase.html" target="_self">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_279_0_" class="even" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_279_0_" class="arrow" onclick="toggleFolder('279_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadIterator.html" target="_self">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_279_0_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span id="arr_279_0_0_" class="arrow" onclick="toggleFolder('279_0_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html" target="_self">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_279_0_0_0_" class="even" style="display:none;"><td class="entry"><span style="width:64px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html" target="_self">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_280_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_280_" class="arrow" onclick="toggleFolder('280_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileIteratorBase.html" target="_self">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_280_0_" style="display:none;"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span id="arr_280_0_" class="arrow" onclick="toggleFolder('280_0_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html" target="_self">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_280_0_0_" style="display:none;"><td class="entry"><span style="width:48px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html" target="_self">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_281_"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_281_" class="arrow" onclick="toggleFolder('281_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileLoadStream.html" target="_self">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="desc">Generic stream for loading and transforming fragments </td></tr>
+<tr id="row_281_0_" class="even" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html" target="_self">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="desc">Generic stream for loading and transforming fragments </td></tr>
+<tr id="row_282_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_282_" class="arrow" onclick="toggleFolder('282_')">&#9654;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileStoreStream.html" target="_self">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="desc">Generic stream for transforming and storing fragments </td></tr>
+<tr id="row_282_0_" style="display:none;"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html" target="_self">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="desc">Generic stream for transforming and storing fragments </td></tr>
+<tr id="row_283_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraits.html" target="_self">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a></td><td class="desc">A template defining <a class="el" href="group__tile__traits__concept.html">Tile Traits Concept</a> </td></tr>
+<tr id="row_284_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsContiguousMajor.html" target="_self">cutlass::TileTraitsContiguousMajor&lt; Tile_, Threads &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_285_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsStandard.html" target="_self">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="desc">Chooses 'best' shape to enable warp raking along contiguous dimension if possible </td></tr>
+<tr id="row_286_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsStrideMajor.html" target="_self">cutlass::TileTraitsStrideMajor&lt; Tile_, Threads &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_287_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TileTraitsWarpRake.html" target="_self">cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;</a></td><td class="desc">Tiling in which warps rake across the contiguous dimension </td></tr>
+<tr id="row_288_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html" target="_self">cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator</a></td><td class="desc"><a class="el" href="classcutlass_1_1PredicateVector_1_1Iterator.html" title="An iterator implementing Predicate Iterator Concept enabling sequential read and write access to pred...">Iterator</a> that always returns true </td></tr>
+<tr id="row_289_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html" target="_self">cutlass::TrivialPredicateTileAdapter</a></td><td class="desc">Always returns true predicate </td></tr>
+<tr id="row_290_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1uint4__t.html" target="_self">cutlass::uint4_t</a></td><td class="desc"></td></tr>
+<tr id="row_291_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1platform_1_1unique__ptr.html" target="_self">cutlass::platform::unique_ptr&lt; T, Deleter &gt;</a></td><td class="desc">Std::unique_ptr </td></tr>
+<tr id="row_292_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector.html" target="_self">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_293_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html" target="_self">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="desc"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 1-bit binary datatype </td></tr>
+<tr id="row_294_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html" target="_self">cutlass::Vector&lt; half, 1 &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_295_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html" target="_self">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_296_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html" target="_self">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="desc"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit signed integer datatype </td></tr>
+<tr id="row_297_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html" target="_self">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="desc"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit unsigned integer datatype </td></tr>
+<tr id="row_298_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize.html" target="_self">cutlass::Vectorize&lt; Element_, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_299_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html" target="_self">cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_300_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html" target="_self">cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_301_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html" target="_self">cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_302_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits.html" target="_self">cutlass::VectorTraits&lt; T &gt;</a></td><td class="desc">Traits describing properties of vectors and scalar-as-vectors </td></tr>
+<tr id="row_303_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html" target="_self">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;</a></td><td class="desc">Partial specialization for actual <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a> </td></tr>
+<tr id="row_304_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html" target="_self">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a></td><td class="desc">Partial specialization for actual <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a> </td></tr>
+<tr id="row_305_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipConvert.html" target="_self">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="desc">Zips two convert operations </td></tr>
+<tr id="row_306_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipFragment.html" target="_self">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td><td class="desc">A template defining <a class="el" href="group__fragment__concept.html">Fragment Concept</a> </td></tr>
+<tr id="row_307_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipTensorRef.html" target="_self">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a></td><td class="desc"></td></tr>
+<tr id="row_308_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="structcutlass_1_1ZipTileAllocation.html" target="_self">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td><td class="desc">Manages a pair of tile allocations as if they are one allocation </td></tr>
+<tr id="row_309_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">C</span></span><a class="el" href="classcutlass_1_1ZipTileIterator.html" target="_self">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td><td class="desc">Constructs an iterator from a pair of iterators </td></tr>
 </table>
 </div><!-- directory -->
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__epilogue_8h.html b/docs/igemm__epilogue_8h.html
index 9b5e5ccf0..f7332de21 100644
--- a/docs/igemm__epilogue_8h.html
+++ b/docs/igemm__epilogue_8h.html
@@ -82,13 +82,13 @@ $(function() {
 
 <p>Defines the epilogue phase of the GEMM computation for IGEMM, supporting integer and floating-point output matrix formats.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__stream_8h_source.html">cutlass/gemm/gemm_global_stream.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__shared__stream_8h_source.html">cutlass/gemm/gemm_shared_stream.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="igemm__global__tile_8h_source.html">cutlass/gemm/igemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__stream_8h_source.html">cutlass/gemm/gemm_global_stream.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__stream_8h_source.html">cutlass/gemm/gemm_shared_stream.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="igemm__global__tile_8h_source.html">cutlass/gemm/igemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&quot;</code><br />
 </div>
 <p><a href="igemm__epilogue_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -127,7 +127,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__epilogue_8h_source.html b/docs/igemm__epilogue_8h_source.html
index bfef820ae..43f9f1583 100644
--- a/docs/igemm__epilogue_8h_source.html
+++ b/docs/igemm__epilogue_8h_source.html
@@ -76,67 +76,66 @@ $(function() {
 <div class="title">igemm_epilogue.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="igemm__epilogue_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__stream_8h.html">cutlass/gemm/gemm_global_stream.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__stream_8h.html">cutlass/gemm/gemm_shared_stream.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="igemm__global__tile_8h.html">cutlass/gemm/igemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&gt;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kElements_&gt;</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">   45</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">IgemmFloatToInt8Converter</a> {</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c">   47</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;float, kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c">InputFragment</a>;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553">   49</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;int8_t, kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553">OutputFragment</a>;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="comment">// We are packing 4 floats into int32 registers so we need kElements to be multiple of 4.</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(kElements_ % 4 == 0, <span class="stringliteral">&quot;kElements must be multiple of 4&quot;</span>);</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#ac65f020e93584b1bd3cdb849ff625026">   55</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#ac65f020e93584b1bd3cdb849ff625026">IgemmFloatToInt8Converter</a>() {}</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b">   58</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b">transform</a>(<a class="code" href="structcutlass_1_1Fragment.html">InputFragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b">transform</a>(src, 0, dst);</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  }</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd">   64</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd">transform</a>(Fragment_ <span class="keyword">const</span>&amp; src, <span class="keywordtype">int</span> offset, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    float4 <span class="keyword">const</span>* src_f4 = <span class="keyword">reinterpret_cast&lt;</span>float4 const*<span class="keyword">&gt;</span>(&amp;src[0]);</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="comment">// The outputs.</span></div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="keywordtype">int</span>* dst_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span>*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    <span class="comment">// Iterate over the floats and pack them together to produce ints.</span></div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; kElements_ / 4; ++i) {</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;      <span class="comment">// Read the float4.</span></div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;      float4 f4 = src_f4[i];</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <span class="comment">// Clamp the 4 elements of the floats to the [-128, +127] range.</span></div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      <span class="keywordtype">float</span> x = fmaxf(-128.f, fminf(127.f, f4.x));</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordtype">float</span> y = fmaxf(-128.f, fminf(127.f, f4.y));</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      <span class="keywordtype">float</span> z = fmaxf(-128.f, fminf(127.f, f4.z));</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      <span class="keywordtype">float</span> w = fmaxf(-128.f, fminf(127.f, f4.w));</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;      <span class="comment">// Convert to integers.</span></div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <span class="keywordtype">int</span> ix = (int)x;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      <span class="keywordtype">int</span> iy = (int)y;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      <span class="keywordtype">int</span> iz = (int)z;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <span class="keywordtype">int</span> iw = (int)w;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <span class="comment">// Extract the lower bytes to build an int32 with 4 int8.</span></div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %0, %1, 0x1140;&quot;</span> : <span class="stringliteral">&quot;+r&quot;</span>(ix) : <span class="stringliteral">&quot;r&quot;</span>(iy));</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %0, %1, 0x1140;&quot;</span> : <span class="stringliteral">&quot;+r&quot;</span>(iz) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %0, %1, 0x5410;&quot;</span> : <span class="stringliteral">&quot;+r&quot;</span>(ix) : <span class="stringliteral">&quot;r&quot;</span>(iz));</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;      <span class="comment">// Store the int.</span></div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      dst_int[i] = ix;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    }</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;};</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputScalar_, <span class="keyword">typename</span> OutputFragment_&gt;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html">  101</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html">IgemmGlobalStoreTransformer</a> {</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html#a98aefa95117dbfdf2e577890318a6c13">  102</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;Fragment&lt;InputScalar_, OutputFragment_::kElements&gt;</a>, OutputFragment_&gt; <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html#a98aefa95117dbfdf2e577890318a6c13">Transformer</a>;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;};</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kElements_&gt;</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html">  106</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html">IgemmGlobalStoreTransformer</a>&lt;float, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;int8_t, kElements_&gt; &gt; {</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html#a52ecdfd8b94d8d7f4881048e11a33aba">  107</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">IgemmFloatToInt8Converter&lt;kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html#a52ecdfd8b94d8d7f4881048e11a33aba">Transformer</a>;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;};</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kElements_&gt;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">  113</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">IgemmInt8ToFloatConverter</a> {</div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb">  115</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;int8_t, kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb">InputFragment</a>;</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7">  117</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;float, kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7">OutputFragment</a>;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="comment">// We are unpacking 4 int8s from int32.</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(kElements_ % 4 == 0, <span class="stringliteral">&quot;kElements must be multiple of 4&quot;</span>);</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a88a55a494d3a30d50477d50bf6a8804d">  123</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a88a55a494d3a30d50477d50bf6a8804d">IgemmInt8ToFloatConverter</a>() {}</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d">  126</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d">transform</a>(<a class="code" href="structcutlass_1_1Fragment.html">InputFragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d">transform</a>(src, 0, dst);</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  }</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00132"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3">  132</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3">transform</a>(Fragment_ <span class="keyword">const</span>&amp; src, <span class="keywordtype">int</span> offset, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* src_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;src[0]);</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    <span class="comment">// The outputs.</span></div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    float4* dst_f4 = <span class="keyword">reinterpret_cast&lt;</span>float4*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    <span class="comment">// Iterate over the int8 and unpack them together to produce floats.</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; kElements_ / 4; ++i) {</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <span class="comment">// Read the int.</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      <span class="keywordtype">int</span> ix, iy, iz, iw = src_int[i];</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;      <span class="comment">// Extract the 4 bytes.</span></div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, 0x0, %1, 0x4440;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(ix) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, 0x0, %1, 0x4441;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(iy) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, 0x0, %1, 0x4442;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(iz) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, 0x0, %1, 0x4443;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(iw) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <span class="comment">// The floats.</span></div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;      <span class="keywordtype">float</span> fx, fy, fz, fw;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="comment">// Convert to floats (make sure we generate I2F.F32.S8).</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;cvt.rn.f32.s8 %0, %1;&quot;</span> : <span class="stringliteral">&quot;=f&quot;</span>(fx) : <span class="stringliteral">&quot;r&quot;</span>(ix));</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;cvt.rn.f32.s8 %0, %1;&quot;</span> : <span class="stringliteral">&quot;=f&quot;</span>(fy) : <span class="stringliteral">&quot;r&quot;</span>(iy));</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;cvt.rn.f32.s8 %0, %1;&quot;</span> : <span class="stringliteral">&quot;=f&quot;</span>(fz) : <span class="stringliteral">&quot;r&quot;</span>(iz));</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;cvt.rn.f32.s8 %0, %1;&quot;</span> : <span class="stringliteral">&quot;=f&quot;</span>(fw) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      <span class="comment">// Store the float4.</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      dst_f4[i] = make_float4(fx, fy, fz, fw);</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    }</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  }</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;};</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputFragment_, <span class="keyword">typename</span> OutputScalar_&gt;</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">  167</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">IgemmGlobalLoadTransformer</a> {</div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html#ad3190650741cef20c1aca919eddd9d72">  168</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;InputFragment_, Fragment&lt;OutputScalar_, InputFragment_::kElements&gt;</a> &gt; <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html#ad3190650741cef20c1aca919eddd9d72">Transformer</a>;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;};</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kElements_&gt;</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html">  172</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">IgemmGlobalLoadTransformer</a>&lt;<a class="code" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;int8_t, kElements_&gt;, float&gt; {</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html#a49c249026be24ec8a66f5eda99cb855c">  173</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">IgemmInt8ToFloatConverter&lt;kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html#a49c249026be24ec8a66f5eda99cb855c">Transformer</a>;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;};</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputScalar_, <span class="keyword">typename</span> OutputFragment_&gt;</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">  179</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">IgemmSharedStoreTransformer</a> {</div><div class="line"><a name="l00180"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html#a9edd08d595327a8cc3b8da50622b3bd2">  180</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;Fragment&lt;InputScalar_, OutputFragment_::kElements&gt;</a>, OutputFragment_&gt; <a class="code" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html#a9edd08d595327a8cc3b8da50622b3bd2">Transformer</a>;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;};</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> IgemmConfig_, <span class="keyword">typename</span> EpilogueFunctor_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">  186</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">IgemmEpilogueTraitsHelper</a></div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper</a>&lt;IgemmConfig_, EpilogueFunctor_, Index_&gt; {</div><div class="line"><a name="l00189"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2">  189</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper&lt;IgemmConfig_, EpilogueFunctor_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2">Base</a>;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5a52727bb9b5d5f8afa7d0384f564036">  191</a></span>&#160;  <span class="keyword">typedef</span> IgemmConfig_ <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5a52727bb9b5d5f8afa7d0384f564036">IgemmConfig</a>;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">  194</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">Base::Scalar</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">Scalar</a>;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51">  196</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::Iterations</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51">Iterations</a>;</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9">  198</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::Delta</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9">Delta</a>;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aaa009025dcd6360ead1dc18005688821">  201</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">Base::GlobalLoadTileTraits</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aaa009025dcd6360ead1dc18005688821">GlobalLoadTileTraits</a>;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9">  203</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;GlobalLoadTileTraits&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9">GlobalLoadIteratorC</a>;</div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">  205</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalLoadIteratorC::Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">GlobalFragmentC</a>;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;  <span class="keyword">typedef</span></div><div class="line"><a name="l00208"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f">  208</a></span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Convert.html">IgemmGlobalLoadTransformer&lt;GlobalFragmentC, Scalar&gt;::Transformer</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f">GlobalTransformerC</a>;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div><div class="line"><a name="l00211"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a16b06a1611dbd22adaa0c9ee5e1b15bd">  211</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">Base::GlobalStoreTileTraits</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a16b06a1611dbd22adaa0c9ee5e1b15bd">GlobalStoreTileTraits</a>;</div><div class="line"><a name="l00213"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2">  213</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;GlobalStoreTileTraits&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2">GlobalStoreIteratorD</a>;</div><div class="line"><a name="l00215"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">  215</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalStoreIteratorD::Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">GlobalFragmentD</a>;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;  <span class="keyword">typedef</span></div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591">  218</a></span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Convert.html">IgemmGlobalStoreTransformer&lt;Scalar, GlobalFragmentD&gt;::Transformer</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591">GlobalTransformerD</a>;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">  221</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">Base::SharedStoreTileTraits</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a>,</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;                            <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>,</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>&gt;</div><div class="line"><a name="l00227"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d">  227</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d">SharedStoreIteratorD</a>;</div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">  229</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">SharedStoreIteratorD::Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a>;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">IgemmSharedStoreTransformer</a>&lt;<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">IgemmConfig::Accumulators::Element</a>,</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;                                               <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a>&gt;::Transformer</div><div class="line"><a name="l00233"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">  233</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">SharedStoreTransformerD</a>;</div><div class="line"><a name="l00235"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">  235</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">Base::SharedLoadTileTraits</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a>,</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;                           <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>,</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00241"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa">  241</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa">SharedLoadIteratorD</a>;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;};</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    <span class="keyword">typename</span> IgemmConfig_,</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    <span class="keyword">typename</span> Helper_ = <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">IgemmEpilogueTraitsHelper&lt;IgemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00255"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">  255</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">IgemmEpilogueTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">GemmEpilogueTraits</a>&lt;</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;                                 <span class="comment">// The output tile.</span></div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;                                 typename IgemmConfig_::OutputTile,</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;                                 <span class="comment">// The accumulators.</span></div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;                                 typename IgemmConfig_::Accumulators,</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;                                 <span class="comment">// The global iterator for C.</span></div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;                                 typename Helper_::GlobalLoadIteratorC,</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;                                 <span class="comment">// The transformer for C.</span></div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;                                 typename Helper_::GlobalTransformerC,</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;                                 <span class="comment">// The transformer for D.</span></div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;                                 typename Helper_::GlobalTransformerD,</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;                                 <span class="comment">// The global iterator for D.</span></div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;                                 typename Helper_::GlobalStoreIteratorD,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;                                 <span class="comment">// The iterator to store D to shared memory.</span></div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;                                 typename Helper_::SharedStoreIteratorD,</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;                                 <span class="comment">// The shared store transformer for D.</span></div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;                                 typename Helper_::SharedStoreTransformerD,</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;                                 <span class="comment">// The iterator to load D from shared memory.</span></div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;                                 typename Helper_::SharedLoadIteratorD,</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;                                 <span class="comment">// The iterations.</span></div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;                                 typename Helper_::Iterations,</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;                                 <span class="comment">// The strides between iterations.</span></div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;                                 typename Helper_::Delta,</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;                                 <span class="comment">// The functor to be used in the epilogue.</span></div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;                                 EpilogueFunctor_,</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;                                 <span class="comment">// The index.</span></div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;                                 Index_&gt; {</div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4">  283</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4">kInt8Output</a> =</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      <a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;typename IgemmConfig_::ScalarC, int8_t&gt;::value</a> != 0;</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;};</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmEpilogueTraits_, <span class="keywordtype">bool</span> = GemmEpilogueTraits_::kInt8Output&gt;</div><div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">  290</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt;GemmEpilogueTraits_&gt; {</div><div class="line"><a name="l00292"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04">  292</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue&lt;GemmEpilogueTraits_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04">Base</a>;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div><div class="line"><a name="l00295"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#ab7a51121d24250d6441ee538e6521dc2">  295</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#ab7a51121d24250d6441ee538e6521dc2">IgemmEpilogue</a>(<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Base::Params</a> <span class="keyword">const</span>&amp; params_,</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;                               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">Base::SharedStorage</a>&amp; shared_storage_,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;                               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a> m_,</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;                               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a> n_)</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">Base</a>(params_, shared_storage_, m_, n_) {}</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;};</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmEpilogueTraits_&gt;</div><div class="line"><a name="l00305"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html">  305</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a>&lt;GemmEpilogueTraits_, true&gt; : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt;GemmEpilogueTraits_&gt; {</div><div class="line"><a name="l00307"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf">  307</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue&lt;GemmEpilogueTraits_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf">Base</a>;</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;</div><div class="line"><a name="l00310"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a49ac00bed1532707aacd3ff108c84623">  310</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a49ac00bed1532707aacd3ff108c84623">IgemmEpilogue</a>(<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Base::Params</a> <span class="keyword">const</span>&amp; params_,</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;                               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">Base::SharedStorage</a>&amp; shared_storage_,</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;                               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a> m_,</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;                               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a> n_)</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">Base</a>(params_, shared_storage_, m_, n_) {}</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;};</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:116</div></div>
+<a href="igemm__epilogue_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__stream_8h.html">cutlass/gemm/gemm_global_stream.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__stream_8h.html">cutlass/gemm/gemm_shared_stream.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="igemm__global__tile_8h.html">cutlass/gemm/igemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kElements_&gt;</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">   45</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">IgemmFloatToInt8Converter</a> {</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c">   47</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;float, kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c">InputFragment</a>;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553">   49</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;int8_t, kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553">OutputFragment</a>;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="comment">// We are packing 4 floats into int32 registers so we need kElements to be multiple of 4.</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(kElements_ % 4 == 0, <span class="stringliteral">&quot;kElements must be multiple of 4&quot;</span>);</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#ac65f020e93584b1bd3cdb849ff625026">   55</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#ac65f020e93584b1bd3cdb849ff625026">IgemmFloatToInt8Converter</a>() {}</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b">   58</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b">transform</a>(<a class="code" href="structcutlass_1_1Fragment.html">InputFragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b">transform</a>(src, 0, dst);</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  }</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd">   64</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd">transform</a>(Fragment_ <span class="keyword">const</span>&amp; src, <span class="keywordtype">int</span> offset, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    float4 <span class="keyword">const</span>* src_f4 = <span class="keyword">reinterpret_cast&lt;</span>float4 const*<span class="keyword">&gt;</span>(&amp;src[0]);</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="comment">// The outputs.</span></div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="keywordtype">int</span>* dst_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span>*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    <span class="comment">// Iterate over the floats and pack them together to produce ints.</span></div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; kElements_ / 4; ++i) {</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;      <span class="comment">// Read the float4.</span></div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;      float4 f4 = src_f4[i];</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <span class="comment">// Clamp the 4 elements of the floats to the [-128, +127] range.</span></div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      <span class="keywordtype">float</span> x = fmaxf(-128.f, fminf(127.f, f4.x));</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordtype">float</span> y = fmaxf(-128.f, fminf(127.f, f4.y));</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      <span class="keywordtype">float</span> z = fmaxf(-128.f, fminf(127.f, f4.z));</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      <span class="keywordtype">float</span> w = fmaxf(-128.f, fminf(127.f, f4.w));</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;      <span class="comment">// Convert to integers.</span></div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <span class="keywordtype">int</span> ix = (int)x;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      <span class="keywordtype">int</span> iy = (int)y;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      <span class="keywordtype">int</span> iz = (int)z;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <span class="keywordtype">int</span> iw = (int)w;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <span class="comment">// Extract the lower bytes to build an int32 with 4 int8.</span></div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %0, %1, 0x1140;&quot;</span> : <span class="stringliteral">&quot;+r&quot;</span>(ix) : <span class="stringliteral">&quot;r&quot;</span>(iy));</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %0, %1, 0x1140;&quot;</span> : <span class="stringliteral">&quot;+r&quot;</span>(iz) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %0, %1, 0x5410;&quot;</span> : <span class="stringliteral">&quot;+r&quot;</span>(ix) : <span class="stringliteral">&quot;r&quot;</span>(iz));</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;      <span class="comment">// Store the int.</span></div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      dst_int[i] = ix;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    }</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;};</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputScalar_, <span class="keyword">typename</span> OutputFragment_&gt;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html">  101</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html">IgemmGlobalStoreTransformer</a> {</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html#a98aefa95117dbfdf2e577890318a6c13">  102</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;Fragment&lt;InputScalar_, OutputFragment_::kElements&gt;</a>, OutputFragment_&gt; <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html#a98aefa95117dbfdf2e577890318a6c13">Transformer</a>;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;};</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kElements_&gt;</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html">  106</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html">IgemmGlobalStoreTransformer</a>&lt;float, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;int8_t, kElements_&gt; &gt; {</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html#a52ecdfd8b94d8d7f4881048e11a33aba">  107</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">IgemmFloatToInt8Converter&lt;kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html#a52ecdfd8b94d8d7f4881048e11a33aba">Transformer</a>;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;};</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kElements_&gt;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">  113</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">IgemmInt8ToFloatConverter</a> {</div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb">  115</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;int8_t, kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb">InputFragment</a>;</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7">  117</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;float, kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7">OutputFragment</a>;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="comment">// We are unpacking 4 int8s from int32.</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(kElements_ % 4 == 0, <span class="stringliteral">&quot;kElements must be multiple of 4&quot;</span>);</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a88a55a494d3a30d50477d50bf6a8804d">  123</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a88a55a494d3a30d50477d50bf6a8804d">IgemmInt8ToFloatConverter</a>() {}</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d">  126</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d">transform</a>(<a class="code" href="structcutlass_1_1Fragment.html">InputFragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d">transform</a>(src, 0, dst);</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  }</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00132"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3">  132</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3">transform</a>(Fragment_ <span class="keyword">const</span>&amp; src, <span class="keywordtype">int</span> offset, <a class="code" href="structcutlass_1_1Fragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* src_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;src[0]);</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    <span class="comment">// The outputs.</span></div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    float4* dst_f4 = <span class="keyword">reinterpret_cast&lt;</span>float4*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    <span class="comment">// Iterate over the int8 and unpack them together to produce floats.</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; kElements_ / 4; ++i) {</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <span class="comment">// Read the int.</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      <span class="keywordtype">int</span> ix, iy, iz, iw = src_int[i];</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;      <span class="comment">// Extract the 4 bytes.</span></div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, 0x0, %1, 0x4440;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(ix) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, 0x0, %1, 0x4441;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(iy) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, 0x0, %1, 0x4442;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(iz) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, 0x0, %1, 0x4443;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(iw) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <span class="comment">// The floats.</span></div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;      <span class="keywordtype">float</span> fx, fy, fz, fw;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="comment">// Convert to floats (make sure we generate I2F.F32.S8).</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;cvt.rn.f32.s8 %0, %1;&quot;</span> : <span class="stringliteral">&quot;=f&quot;</span>(fx) : <span class="stringliteral">&quot;r&quot;</span>(ix));</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;cvt.rn.f32.s8 %0, %1;&quot;</span> : <span class="stringliteral">&quot;=f&quot;</span>(fy) : <span class="stringliteral">&quot;r&quot;</span>(iy));</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;cvt.rn.f32.s8 %0, %1;&quot;</span> : <span class="stringliteral">&quot;=f&quot;</span>(fz) : <span class="stringliteral">&quot;r&quot;</span>(iz));</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;cvt.rn.f32.s8 %0, %1;&quot;</span> : <span class="stringliteral">&quot;=f&quot;</span>(fw) : <span class="stringliteral">&quot;r&quot;</span>(iw));</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      <span class="comment">// Store the float4.</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      dst_f4[i] = make_float4(fx, fy, fz, fw);</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    }</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  }</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;};</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputFragment_, <span class="keyword">typename</span> OutputScalar_&gt;</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">  167</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">IgemmGlobalLoadTransformer</a> {</div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html#ad3190650741cef20c1aca919eddd9d72">  168</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;InputFragment_, Fragment&lt;OutputScalar_, InputFragment_::kElements&gt;</a> &gt; <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html#ad3190650741cef20c1aca919eddd9d72">Transformer</a>;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;};</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kElements_&gt;</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html">  172</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">IgemmGlobalLoadTransformer</a>&lt;<a class="code" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;int8_t, kElements_&gt;, float&gt; {</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html#a49c249026be24ec8a66f5eda99cb855c">  173</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">IgemmInt8ToFloatConverter&lt;kElements_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html#a49c249026be24ec8a66f5eda99cb855c">Transformer</a>;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;};</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputScalar_, <span class="keyword">typename</span> OutputFragment_&gt;</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">  179</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">IgemmSharedStoreTransformer</a> {</div><div class="line"><a name="l00180"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html#a9edd08d595327a8cc3b8da50622b3bd2">  180</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Convert.html">Convert&lt;Fragment&lt;InputScalar_, OutputFragment_::kElements&gt;</a>, OutputFragment_&gt; <a class="code" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html#a9edd08d595327a8cc3b8da50622b3bd2">Transformer</a>;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;};</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> IgemmConfig_, <span class="keyword">typename</span> EpilogueFunctor_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">  186</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">IgemmEpilogueTraitsHelper</a></div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper</a>&lt;IgemmConfig_, EpilogueFunctor_, Index_&gt; {</div><div class="line"><a name="l00189"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2">  189</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">GemmEpilogueTraitsHelper&lt;IgemmConfig_, EpilogueFunctor_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2">Base</a>;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5a52727bb9b5d5f8afa7d0384f564036">  191</a></span>&#160;  <span class="keyword">typedef</span> IgemmConfig_ <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5a52727bb9b5d5f8afa7d0384f564036">IgemmConfig</a>;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">  194</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">Base::Scalar</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">Scalar</a>;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51">  196</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::Iterations</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51">Iterations</a>;</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9">  198</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::Delta</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9">Delta</a>;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aaa009025dcd6360ead1dc18005688821">  201</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">Base::GlobalLoadTileTraits</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aaa009025dcd6360ead1dc18005688821">GlobalLoadTileTraits</a>;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9">  203</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;GlobalLoadTileTraits&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9">GlobalLoadIteratorC</a>;</div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">  205</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalLoadIteratorC::Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">GlobalFragmentC</a>;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;  <span class="keyword">typedef</span></div><div class="line"><a name="l00208"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f">  208</a></span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Convert.html">IgemmGlobalLoadTransformer&lt;GlobalFragmentC, Scalar&gt;::Transformer</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f">GlobalTransformerC</a>;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div><div class="line"><a name="l00211"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a16b06a1611dbd22adaa0c9ee5e1b15bd">  211</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">Base::GlobalStoreTileTraits</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a16b06a1611dbd22adaa0c9ee5e1b15bd">GlobalStoreTileTraits</a>;</div><div class="line"><a name="l00213"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2">  213</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;GlobalStoreTileTraits&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2">GlobalStoreIteratorD</a>;</div><div class="line"><a name="l00215"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">  215</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalStoreIteratorD::Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">GlobalFragmentD</a>;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;  <span class="keyword">typedef</span></div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591">  218</a></span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Convert.html">IgemmGlobalStoreTransformer&lt;Scalar, GlobalFragmentD&gt;::Transformer</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591">GlobalTransformerD</a>;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">  221</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">Base::SharedStoreTileTraits</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a>,</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;                            <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>,</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>&gt;</div><div class="line"><a name="l00227"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d">  227</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d">SharedStoreIteratorD</a>;</div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">  229</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">SharedStoreIteratorD::Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a>;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">IgemmSharedStoreTransformer</a>&lt;<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">IgemmConfig::Accumulators::Element</a>,</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;                                               <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a>&gt;::Transformer</div><div class="line"><a name="l00233"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">  233</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">SharedStoreTransformerD</a>;</div><div class="line"><a name="l00235"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">  235</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">Base::SharedLoadTileTraits</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a>,</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;                           <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>,</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00241"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa">  241</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa">SharedLoadIteratorD</a>;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;};</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    <span class="keyword">typename</span> IgemmConfig_,</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    <span class="keyword">typename</span> Helper_ = <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">IgemmEpilogueTraitsHelper&lt;IgemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00255"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">  255</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">IgemmEpilogueTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">GemmEpilogueTraits</a>&lt;</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;                                 <span class="comment">// The output tile.</span></div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;                                 typename IgemmConfig_::OutputTile,</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;                                 <span class="comment">// The accumulators.</span></div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;                                 typename IgemmConfig_::Accumulators,</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;                                 <span class="comment">// The global iterator for C.</span></div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;                                 typename Helper_::GlobalLoadIteratorC,</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;                                 <span class="comment">// The transformer for C.</span></div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;                                 typename Helper_::GlobalTransformerC,</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;                                 <span class="comment">// The transformer for D.</span></div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;                                 typename Helper_::GlobalTransformerD,</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;                                 <span class="comment">// The global iterator for D.</span></div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;                                 typename Helper_::GlobalStoreIteratorD,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;                                 <span class="comment">// The iterator to store D to shared memory.</span></div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;                                 typename Helper_::SharedStoreIteratorD,</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;                                 <span class="comment">// The shared store transformer for D.</span></div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;                                 typename Helper_::SharedStoreTransformerD,</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;                                 <span class="comment">// The stream to load D from shared memory.</span></div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;                                 typename Helper_::SharedLoadStreamD,</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;                                 <span class="comment">// The iterations.</span></div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;                                 typename Helper_::Iterations,</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;                                 <span class="comment">// The strides between iterations.</span></div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;                                 typename Helper_::Delta,</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;                                 <span class="comment">// The functor to be used in the epilogue.</span></div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;                                 EpilogueFunctor_,</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;                                 <span class="comment">// The index.</span></div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;                                 Index_&gt; {</div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4">  283</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4">kInt8Output</a> =</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      <a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;typename IgemmConfig_::ScalarC, int8_t&gt;::value</a> != 0;</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;};</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmEpilogueTraits_, <span class="keywordtype">bool</span> = GemmEpilogueTraits_::kInt8Output&gt;</div><div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">  290</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt;GemmEpilogueTraits_&gt; {</div><div class="line"><a name="l00292"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04">  292</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue&lt;GemmEpilogueTraits_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04">Base</a>;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div><div class="line"><a name="l00295"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a599a50becefed561d063c1b834188aca">  295</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a599a50becefed561d063c1b834188aca">IgemmEpilogue</a>(<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Base::Params</a> <span class="keyword">const</span>&amp; params_,</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;                               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">Base::SharedStorage</a>&amp; shared_storage_,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;                               <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; _problem_size)</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">Base</a>(params_, shared_storage_, _problem_size) {}</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;};</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmEpilogueTraits_&gt;</div><div class="line"><a name="l00304"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html">  304</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a>&lt;GemmEpilogueTraits_, true&gt; : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt;GemmEpilogueTraits_&gt; {</div><div class="line"><a name="l00306"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf">  306</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue&lt;GemmEpilogueTraits_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf">Base</a>;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div><div class="line"><a name="l00309"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a0a1be1aab827127161406871ca75cbe0">  309</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a0a1be1aab827127161406871ca75cbe0">IgemmEpilogue</a>(<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Base::Params</a> <span class="keyword">const</span>&amp; params_,</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;                               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">Base::SharedStorage</a>&amp; shared_storage_,</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;                               <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span>&amp; _problem_size)</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">Base</a>(params_, shared_storage_, _problem_size) {}</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;};</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:120</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">cutlass::gemm::IgemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:255</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_aed055504ec5f09657e059416150188a9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9">cutlass::gemm::IgemmEpilogueTraitsHelper::Delta</a></div><div class="ttdeci">Base::Delta Delta</div><div class="ttdoc">The iterations strides. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:198</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a95da23108b74ad085024ab45e84083e1"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">cutlass::TileStoreIterator::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:682</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_ad7659dc0eaa491447ad127ef7098924f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTileTraits</a></div><div class="ttdeci">Base::SharedStoreTileTraits SharedStoreTileTraits</div><div class="ttdoc">The traits class for the shared iterator to store D to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:221</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a880293ef6a48a0f4941c8f984c36f591"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591">cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalTransformerD</a></div><div class="ttdeci">IgemmGlobalStoreTransformer&lt; Scalar, GlobalFragmentD &gt;::Transformer GlobalTransformerD</div><div class="ttdoc">The transformer from accumulators to shared memory fragments. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:218</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a851113bffb5b656c5c649845852b3b8d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadTileTraits</a></div><div class="ttdeci">Base::SharedLoadTileTraits SharedLoadTileTraits</div><div class="ttdoc">The traits class for the shared iterator to load D from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:235</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_ad33ee44527a7fcfd41b4e677927fd4fa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa">cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadIteratorD</a></div><div class="ttdeci">TileLoadIterator&lt; SharedLoadTileTraits, typename SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorD</div><div class="ttdoc">The shared iterator to load D from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:171</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:186</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogue_html_a07f9a934f04610db41aa1aac2f4cdf04"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04">cutlass::gemm::IgemmEpilogue::Base</a></div><div class="ttdeci">GemmEpilogue&lt; GemmEpilogueTraits_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:292</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ae5209fa80705442693833c63d535161e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">cutlass::gemm::GemmEpilogue::Params</a></div><div class="ttdeci">Traits::Params Params</div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:57</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:53</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ae5209fa80705442693833c63d535161e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">cutlass::gemm::GemmEpilogue::Params</a></div><div class="ttdeci">Traits::Params Params</div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:42</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">cutlass::gemm::IgemmGlobalLoadTransformer</a></div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:167</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:412</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:420</div></div>
 <div class="ttc" id="tile__iterator_8h_html"><div class="ttname"><a href="tile__iterator_8h.html">tile_iterator.h</a></div><div class="ttdoc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently. </div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter_html_a88a55a494d3a30d50477d50bf6a8804d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a88a55a494d3a30d50477d50bf6a8804d">cutlass::gemm::IgemmInt8ToFloatConverter::IgemmInt8ToFloatConverter</a></div><div class="ttdeci">CUTLASS_DEVICE IgemmInt8ToFloatConverter()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:123</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a5e64440830b36899f9c0ed8b369665c8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreFragmentD</a></div><div class="ttdeci">SharedStoreIteratorD::Fragment SharedStoreFragmentD</div><div class="ttdoc">The fragment that needs to be passed to that store iterator. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:229</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ae2b82b9b62aefa15005091bb84ac20e8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">cutlass::gemm::GemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::Scalar</a></div><div class="ttdeci">EpilogueFunctor_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:173</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper_html_ae2b82b9b62aefa15005091bb84ac20e8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">cutlass::gemm::GemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::Scalar</a></div><div class="ttdeci">EpilogueFunctor_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:188</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:186</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">cutlass::MemorySpace::kGlobal</a></div><div class="ttdef"><b>Definition:</b> load_store.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">cutlass::MemorySpace::kGlobal</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter_html_a702ca51abc077355a2d7343976a0cfdb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb">cutlass::gemm::IgemmInt8ToFloatConverter::InputFragment</a></div><div class="ttdeci">Fragment&lt; int8_t, kElements_ &gt; InputFragment</div><div class="ttdoc">The input fragment. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:115</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a9ffa12dcd7ed1e96845e1cd273d9f219"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::Fragment</a></div><div class="ttdeci">Fragment&lt; FragmentElement, ShapeCount&lt; Iterations &gt;::kCount *kAccessSize &gt; Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:196</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogue_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">cutlass::gemm::IgemmEpilogue</a></div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:290</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">cutlass::gemm::IgemmFloatToInt8Converter</a></div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:45</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter_html_a819fd33db88a68521108bab2641d73fd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd">cutlass::gemm::IgemmFloatToInt8Converter::transform</a></div><div class="ttdeci">CUTLASS_DEVICE void transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)</div><div class="ttdoc">Transform a fragment. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ac36dad8a7b6bc7fc6ef88e44068468dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">cutlass::gemm::GemmEpilogue::SharedStorage</a></div><div class="ttdeci">Traits::SharedStorage SharedStorage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:59</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_ac36dad8a7b6bc7fc6ef88e44068468dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">cutlass::gemm::GemmEpilogue::SharedStorage</a></div><div class="ttdeci">Traits::SharedStorage SharedStorage</div><div class="ttdoc">The shared storage. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:48</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter_html_aca8a61e8eb1ab33b9c61e2e7d342379d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d">cutlass::gemm::IgemmInt8ToFloatConverter::transform</a></div><div class="ttdeci">CUTLASS_DEVICE void transform(InputFragment const &amp;src, OutputFragment &amp;dst)</div><div class="ttdoc">Transform a fragment. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:126</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_ae4128bba3f1df6ef7824e2db79745b00"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">cutlass::gemm::IgemmEpilogueTraitsHelper::Scalar</a></div><div class="ttdeci">Base::Scalar Scalar</div><div class="ttdoc">The scalar type of the epilogue. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:194</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogue_html_a599a50becefed561d063c1b834188aca"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a599a50becefed561d063c1b834188aca">cutlass::gemm::IgemmEpilogue::IgemmEpilogue</a></div><div class="ttdeci">CUTLASS_DEVICE IgemmEpilogue(typename Base::Params const &amp;params_, typename Base::SharedStorage &amp;shared_storage_, Coord&lt; 3 &gt; const &amp;_problem_size)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:295</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_ad8e5337f3d19437e9c4cafcfcc3e3d3e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalFragmentC</a></div><div class="ttdeci">GlobalLoadIteratorC::Fragment GlobalFragmentC</div><div class="ttdoc">The fragment that needs to be produced by the load iterator. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:205</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aa5386367e805cdaf47a5e7564bedc2fb"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">cutlass::TileStoreIterator::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:901</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter_html_a91ad48362b99a5f96ac1e92e95104f7b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b">cutlass::gemm::IgemmFloatToInt8Converter::transform</a></div><div class="ttdeci">CUTLASS_DEVICE void transform(InputFragment const &amp;src, OutputFragment &amp;dst)</div><div class="ttdoc">Transform a fragment. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:58</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter_html_a3d89bfc0d94cd695cbe4a61859e5e553"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553">cutlass::gemm::IgemmFloatToInt8Converter::OutputFragment</a></div><div class="ttdeci">Fragment&lt; int8_t, kElements_ &gt; OutputFragment</div><div class="ttdoc">The output fragment. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:49</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_ad3e937c15bfac443b0e3b94d702f46b2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2">cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalStoreIteratorD</a></div><div class="ttdeci">GemmGlobalIteratorCd&lt; GlobalStoreTileTraits &gt; GlobalStoreIteratorD</div><div class="ttdoc">The iterator to store to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:213</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a00000e0cd14b9e6e242eafb5133af8cf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTransformerD</a></div><div class="ttdeci">IgemmSharedStoreTransformer&lt; typename IgemmConfig::Accumulators::Element, SharedStoreFragmentD &gt;::Transformer SharedStoreTransformerD</div><div class="ttdoc">The transformer from accumulators to shared memory fragments. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:233</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraits_html_a8609af98d1e43cd25688bae6f33feed4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4">cutlass::gemm::IgemmEpilogueTraits::kInt8Output</a></div><div class="ttdeci">static bool const kInt8Output</div><div class="ttdoc">Do we output in int8? </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:283</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:302</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:399</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer_html_a9edd08d595327a8cc3b8da50622b3bd2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html#a9edd08d595327a8cc3b8da50622b3bd2">cutlass::gemm::IgemmSharedStoreTransformer::Transformer</a></div><div class="ttdeci">Convert&lt; Fragment&lt; InputScalar_, OutputFragment_::kElements &gt;, OutputFragment_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:180</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4_html_a98b415dbe6f7b6cb0c41a4e6b3ad5abf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::Base</a></div><div class="ttdeci">GemmEpilogue&lt; GemmEpilogueTraits_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:307</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4_html_a98b415dbe6f7b6cb0c41a4e6b3ad5abf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::Base</a></div><div class="ttdeci">GemmEpilogue&lt; GemmEpilogueTraits_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:306</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_aaa009025dcd6360ead1dc18005688821"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aaa009025dcd6360ead1dc18005688821">cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalLoadTileTraits</a></div><div class="ttdeci">Base::GlobalLoadTileTraits GlobalLoadTileTraits</div><div class="ttdoc">The traits class for the iterator. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:201</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter_html_a66ac385a1cd771b95f70ee36cd74e8f7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7">cutlass::gemm::IgemmInt8ToFloatConverter::OutputFragment</a></div><div class="ttdeci">Fragment&lt; float, kElements_ &gt; OutputFragment</div><div class="ttdoc">The output fragment. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:117</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a4b23ba8c14e26672a516aa43063250c2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2">cutlass::gemm::IgemmEpilogueTraitsHelper::Base</a></div><div class="ttdeci">GemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:189</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogue_html_ab7a51121d24250d6441ee538e6521dc2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#ab7a51121d24250d6441ee538e6521dc2">cutlass::gemm::IgemmEpilogue::IgemmEpilogue</a></div><div class="ttdeci">CUTLASS_DEVICE IgemmEpilogue(typename Base::Params const &amp;params_, typename Base::SharedStorage &amp;shared_storage_, typename Base::Index m_, typename Base::Index n_)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:295</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:335</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogue_html_a07c93d583bfddd8f916fba6ef809832e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">cutlass::gemm::GemmEpilogue::Index</a></div><div class="ttdeci">Traits::Index Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_epilogue.h:93</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:339</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a723cd69ee4d5c26579b36e02c531ea88"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalFragmentD</a></div><div class="ttdeci">GlobalStoreIteratorD::Fragment GlobalFragmentD</div><div class="ttdoc">The fragment that needs to be passed to that store iterator. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:215</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a24826f99d097eea0298e6be12a6327b9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9">cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalLoadIteratorC</a></div><div class="ttdeci">GemmGlobalIteratorCd&lt; GlobalLoadTileTraits &gt; GlobalLoadIteratorC</div><div class="ttdoc">The iterator to store to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:203</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a5a52727bb9b5d5f8afa7d0384f564036"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5a52727bb9b5d5f8afa7d0384f564036">cutlass::gemm::IgemmEpilogueTraitsHelper::IgemmConfig</a></div><div class="ttdeci">IgemmConfig_ IgemmConfig</div><div class="ttdoc">The config. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:191</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4_html_a49ac00bed1532707aacd3ff108c84623"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a49ac00bed1532707aacd3ff108c84623">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::IgemmEpilogue</a></div><div class="ttdeci">CUTLASS_DEVICE IgemmEpilogue(typename Base::Params const &amp;params_, typename Base::SharedStorage &amp;shared_storage_, typename Base::Index m_, typename Base::Index n_)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:310</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter_html_ac65f020e93584b1bd3cdb849ff625026"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#ac65f020e93584b1bd3cdb849ff625026">cutlass::gemm::IgemmFloatToInt8Converter::IgemmFloatToInt8Converter</a></div><div class="ttdeci">CUTLASS_DEVICE IgemmFloatToInt8Converter()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:55</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html_a9c67fa5bbd0b8b49bd6ec002dee3cbab"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">cutlass::Fragment::Element</a></div><div class="ttdeci">Element_ Element</div><div class="ttdoc">The element. </div><div class="ttdef"><b>Definition:</b> fragment.h:108</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter_html_aa9a4b05f9fc28b80a4ae4aabb2ce1e8c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c">cutlass::gemm::IgemmFloatToInt8Converter::InputFragment</a></div><div class="ttdeci">Fragment&lt; float, kElements_ &gt; InputFragment</div><div class="ttdoc">The input fragment. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:47</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:348</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:396</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">cutlass::gemm::IgemmSharedStoreTransformer</a></div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:179</div></div>
 <div class="ttc" id="gemm__global__stream_8h_html"><div class="ttname"><a href="gemm__global__stream_8h.html">gemm_global_stream.h</a></div><div class="ttdoc">Implements efficient loading of the thread block-level tile from global memory and storing to shared ...</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a0d7b595d7959cc1680fc07c2e02e1c8e"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::Fragment</a></div><div class="ttdeci">Fragment&lt; FragmentElement, ShapeCount&lt; Iterations &gt;::kCount *kAccessSize &gt; Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:154</div></div>
 <div class="ttc" id="structcutlass_1_1Convert_html"><div class="ttname"><a href="structcutlass_1_1Convert.html">cutlass::Convert</a></div><div class="ttdef"><b>Definition:</b> convert.h:38</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4_html_a52ecdfd8b94d8d7f4881048e11a33aba"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html#a52ecdfd8b94d8d7f4881048e11a33aba">cutlass::gemm::IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;::Transformer</a></div><div class="ttdeci">IgemmFloatToInt8Converter&lt; kElements_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:107</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a0b9b2b7838cb13a61a16501a2662fa51"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51">cutlass::gemm::IgemmEpilogueTraitsHelper::Iterations</a></div><div class="ttdeci">Base::Iterations Iterations</div><div class="ttdoc">The iterations. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:196</div></div>
@@ -144,7 +143,7 @@ $(function() {
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper_html_a16b06a1611dbd22adaa0c9ee5e1b15bd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a16b06a1611dbd22adaa0c9ee5e1b15bd">cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalStoreTileTraits</a></div><div class="ttdeci">Base::GlobalStoreTileTraits GlobalStoreTileTraits</div><div class="ttdoc">The traits class for the iterator. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:211</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_html_ad3190650741cef20c1aca919eddd9d72"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html#ad3190650741cef20c1aca919eddd9d72">cutlass::gemm::IgemmGlobalLoadTransformer::Transformer</a></div><div class="ttdeci">Convert&lt; InputFragment_, Fragment&lt; OutputScalar_, InputFragment_::kElements &gt; &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:168</div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a9a2218b570dada2f1e3ccd8004c47856"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">cutlass::gemm::GemmSharedStoreTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:266</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html_a9a2218b570dada2f1e3ccd8004c47856"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">cutlass::gemm::GemmSharedStoreTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:272</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter_html_a89e078dbf376da872c3993ccbaf744d3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3">cutlass::gemm::IgemmInt8ToFloatConverter::transform</a></div><div class="ttdeci">CUTLASS_DEVICE void transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)</div><div class="ttdoc">Transform a fragment. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:132</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_html_a98aefa95117dbfdf2e577890318a6c13"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html#a98aefa95117dbfdf2e577890318a6c13">cutlass::gemm::IgemmGlobalStoreTransformer::Transformer</a></div><div class="ttdeci">Convert&lt; Fragment&lt; InputScalar_, OutputFragment_::kElements &gt;, OutputFragment_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:102</div></div>
 <div class="ttc" id="gemm__shared__stream_8h_html"><div class="ttname"><a href="gemm__shared__stream_8h.html">gemm_shared_stream.h</a></div><div class="ttdoc">Defines abstractions for managing loading and storing fragments to shared memory in the efficient GEM...</div></div>
@@ -153,14 +152,15 @@ $(function() {
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4_html_a49c249026be24ec8a66f5eda99cb855c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html#a49c249026be24ec8a66f5eda99cb855c">cutlass::gemm::IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;::Transformer</a></div><div class="ttdeci">IgemmInt8ToFloatConverter&lt; kElements_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:173</div></div>
 <div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">cutlass::gemm::IgemmInt8ToFloatConverter</a></div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:113</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a1b025cb056729706f36469e74a9799dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">cutlass::gemm::GemmSharedLoadTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:337</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_html_a1b025cb056729706f36469e74a9799dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">cutlass::gemm::GemmSharedLoadTileDTraits::Scalar</a></div><div class="ttdeci">platform::remove_const&lt; Scalar_ &gt;::type Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:341</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4_html_a0a1be1aab827127161406871ca75cbe0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a0a1be1aab827127161406871ca75cbe0">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::IgemmEpilogue</a></div><div class="ttdeci">CUTLASS_DEVICE IgemmEpilogue(typename Base::Params const &amp;params_, typename Base::SharedStorage &amp;shared_storage_, Coord&lt; 3 &gt; const &amp;_problem_size)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:309</div></div>
 <div class="ttc" id="igemm__global__tile_8h_html"><div class="ttname"><a href="igemm__global__tile_8h.html">igemm_global_tile.h</a></div><div class="ttdoc">Implements tile iterators to partition the thread block tile into 2D subtiles and efficiently load ea...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">cutlass::gemm::GemmSharedStoreTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:264</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:620</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">cutlass::gemm::GemmSharedStoreTileDTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:270</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:836</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__global__tile_8h.html b/docs/igemm__global__tile_8h.html
index d6a680168..4b5ee6d7c 100644
--- a/docs/igemm__global__tile_8h.html
+++ b/docs/igemm__global__tile_8h.html
@@ -82,18 +82,20 @@ $(function() {
 
 <p>Implements tile iterators to partition the thread block tile into 2D subtiles and efficiently load each. Applies permute transformation to construct 'interleaved K-strided' data layout in which 4-element dot products from the same K index are arranged in consecutive locations within shared memory.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="matrix__traits_8h_source.html">cutlass/matrix_traits.h</a>&quot;</code><br />
 </div>
 <p><a href="igemm__global__tile_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html">cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the thread offset in (H, W) based on thread ID.  <a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html#details">More...</a><br /></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the thread offset in (H, W) based on thread ID.  <a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -108,7 +110,7 @@ Namespaces</h2></td></tr>
 </div></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__global__tile_8h_source.html b/docs/igemm__global__tile_8h_source.html
index df086169d..04428a68e 100644
--- a/docs/igemm__global__tile_8h_source.html
+++ b/docs/igemm__global__tile_8h_source.html
@@ -76,33 +76,46 @@ $(function() {
 <div class="title">igemm_global_tile.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="igemm__global__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&gt;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> kOperand_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;          <span class="keyword">typename</span> Threads_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;          <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html">   50</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html">IgemmContiguousGlobalTileTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;                                             <span class="comment">// Which GEMM operand?</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;                                             kOperand_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;                                             <span class="comment">// The layout.</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;                                             kLayout_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;                                             <span class="comment">// The scalar.</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;                                             Scalar_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;                                             <span class="comment">// The tile.</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;                                             Tile_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                                             <span class="comment">// The threads.</span></div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                                             Threads_,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;                                             <span class="comment">// The number of scalars per LDG/STG.</span></div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;                                             kAccessSize_&gt; {</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#ab19f72d239f639f261fbb63f72f10acf">   64</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits&lt;kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#ab19f72d239f639f261fbb63f72f10acf">Base</a>;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a5fd1a9f132c7aa0f68e129553f519d1e">   66</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Base::Threads</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a5fd1a9f132c7aa0f68e129553f519d1e">Threads</a>;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a08dada072eefded4c859df4e5fc25ca6">   68</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;Base::Threads::kH * 4, 1, Base::Threads::kW, Base::kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a08dada072eefded4c859df4e5fc25ca6">Delta</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;Base::Tile::kH / Base::Threads::kH / 4,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                4,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                Base::Tile::kW / Base::Threads::kW,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                Base::Tile::kC / <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a>&gt;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a9fb4b56091d4458ebd82130bc3951e5b">   74</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a9fb4b56091d4458ebd82130bc3951e5b">Iterations</a>;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html">   77</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html#a1228edf6cc0f81af520dc77c8792b94c">   79</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html#a1228edf6cc0f81af520dc77c8792b94c">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">ThreadsDelta::kH</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    }</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  };</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a2bb0f0820e52417ff77e7a2bdb9ed434">   89</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 4, Base::Tile::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a2bb0f0820e52417ff77e7a2bdb9ed434">ThreadsDelta</a>;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;};</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html">cutlass::gemm::IgemmContiguousGlobalTileTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:77</div></div>
-<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<a href="igemm__global__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> kOperand_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;          <span class="keyword">typename</span> Threads_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;          <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">   50</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;                                   <span class="comment">// Which GEMM operand?</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;                                   kOperand_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;                                   <span class="comment">// The layout.</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;                                   kLayout_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;                                   <span class="comment">// The scalar.</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;                                   Scalar_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;                                   <span class="comment">// The tile.</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;                                   Tile_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                                   <span class="comment">// The threads.</span></div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                                   Threads_,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;                                   <span class="comment">// The number of scalars per LDG/STG.</span></div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;                                   kAccessSize_&gt; {</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c">   64</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits&lt;kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c">Base</a>;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">   66</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Base::Threads</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">Threads</a>;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#adab639892c3586464e2ea5f947b9e0f0">   68</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;Base::Threads::kH * 4, 1, Base::Threads::kW, Base::kAccessSize&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#adab639892c3586464e2ea5f947b9e0f0">Delta</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;Base::VectorizedTile::kH / Base::Threads::kH / 4,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                4,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                Base::VectorizedTile::kW / Base::Threads::kW,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                Base::VectorizedTile::kC / <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a>&gt;</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ae1d930fa295d8ddfaa10bda5978258de">   74</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ae1d930fa295d8ddfaa10bda5978258de">Iterations</a>;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">   77</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#a80562f5ceab2049c3b7834c2891a07ee">   79</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#a80562f5ceab2049c3b7834c2891a07ee">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">ThreadsDelta::kH</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    }</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  };</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a160d1ecd86de4742f550d11bc281786b">   89</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 4, Base::VectorizedTile::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a160d1ecd86de4742f550d11bc281786b">ThreadsDelta</a>;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;};</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> TileTraits_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">   95</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;TileTraits_, Index_&gt; {</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a82a9cfc61ecc117592bdb30f57bd35c9">   97</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;TileTraits_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a82a9cfc61ecc117592bdb30f57bd35c9">Base</a>;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30">   99</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::ThreadOffset <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30">ThreadOffset</a>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a489fe448cd7f7e1f3805d33504f9d336">  102</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a489fe448cd7f7e1f3805d33504f9d336">IgemmGlobalIteratorAb</a>(<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Base::Params</a> <span class="keyword">const</span>&amp; _params,</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;                                       <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;                                       <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; threadblock_offset,</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30">ThreadOffset</a>())</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;      : <a class="code" href="structcutlass_1_1TileLoadIterator.html">Base</a>(_params, bounds, threadblock_offset, thread_offset_func), <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">mask_</a>(0xffffffff) {</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="comment">// The number of elements read in a single iteration.</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> kBlock = TileTraits_::Tile::kW;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="comment">// The residue.</span></div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> kResidue = (int)(bounds[1] % kBlock);</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    <span class="comment">// Compute the number of elements that are valid.</span></div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> left = kResidue - <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">Base::thread_offset</a>[2];</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="keywordflow">if</span> (left &gt; 0 &amp;&amp; left &lt; 4) {</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">mask_</a> = (1u &lt;&lt; (8 * left)) - 1u;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    }</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  }</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a5cbda0dea8c87ca55499c97cc80b1ccf">  119</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a5cbda0dea8c87ca55499c97cc80b1ccf">load_element</a>(</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;      <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a>&amp; value, <span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">Base::load_element</a>(value, d, h, w, c);</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    <span class="keyword">reinterpret_cast&lt;</span>uint32_t&amp;<span class="keyword">&gt;</span>(value) &amp;= <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">mask_</a>;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  }</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">  126</a></span>&#160;  uint32_t <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">mask_</a>;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;};</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_html_a72fe2fb9077d072f8266f07374624a1f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">cutlass::gemm::IgemmGlobalTileTraits::Threads</a></div><div class="ttdeci">Base::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">cutlass::gemm::IgemmGlobalTileTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:77</div></div>
 <div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:70</div></div>
 <div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_html_a08dada072eefded4c859df4e5fc25ca6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a08dada072eefded4c859df4e5fc25ca6">cutlass::gemm::IgemmContiguousGlobalTileTraits::Delta</a></div><div class="ttdeci">Shape&lt; Base::Threads::kH *4, 1, Base::Threads::kW, Base::kAccessSize &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:68</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_html_ae1d930fa295d8ddfaa10bda5978258de"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ae1d930fa295d8ddfaa10bda5978258de">cutlass::gemm::IgemmGlobalTileTraits::Iterations</a></div><div class="ttdeci">Shape&lt; Base::VectorizedTile::kH/Base::Threads::kH/4, 4, Base::VectorizedTile::kW/Base::Threads::kW, Base::VectorizedTile::kC/Base::kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:74</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a85afb31647e5cac591b76959a102cd06"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">cutlass::gemm::GemmGlobalIteratorAb::load_element</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_element(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</div><div class="ttdoc">Loads a single fragment element from memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:292</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset_html_a80562f5ceab2049c3b7834c2891a07ee"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#a80562f5ceab2049c3b7834c2891a07ee">cutlass::gemm::IgemmGlobalTileTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:79</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:163</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a3a20d9062bba613c160bb2cd14f80a5e"><div class="ttname"><a href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">cutlass::Shape::kH</a></div><div class="ttdeci">static int const kH</div><div class="ttdoc">The height of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:68</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_html_ab19f72d239f639f261fbb63f72f10acf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#ab19f72d239f639f261fbb63f72f10acf">cutlass::gemm::IgemmContiguousGlobalTileTraits::Base</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_html_a9fb4b56091d4458ebd82130bc3951e5b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a9fb4b56091d4458ebd82130bc3951e5b">cutlass::gemm::IgemmContiguousGlobalTileTraits::Iterations</a></div><div class="ttdeci">Shape&lt; Base::Tile::kH/Base::Threads::kH/4, 4, Base::Tile::kW/Base::Threads::kW, Base::Tile::kC/Base::kAccessSize &gt; Iterations</div><div class="ttdoc">The number of iterations needed to load/store the tile. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:74</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:399</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb_html_a5cbda0dea8c87ca55499c97cc80b1ccf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a5cbda0dea8c87ca55499c97cc80b1ccf">cutlass::gemm::IgemmGlobalIteratorAb::load_element</a></div><div class="ttdeci">CUTLASS_DEVICE void load_element(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:119</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb_html_a82a9cfc61ecc117592bdb30f57bd35c9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a82a9cfc61ecc117592bdb30f57bd35c9">cutlass::gemm::IgemmGlobalIteratorAb::Base</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:97</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:95</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html">cutlass::gemm::IgemmContiguousGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:50</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:62</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb_html_a07ff2f97fdd57c4df05ef8e817265b30"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30">cutlass::gemm::IgemmGlobalIteratorAb::ThreadOffset</a></div><div class="ttdeci">TileTraits_::ThreadOffset ThreadOffset</div><div class="ttdoc">The functor to compute the thread offset. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb_html_aa6e76073303f5f5a95053a781ec8b762"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">cutlass::gemm::IgemmGlobalIteratorAb::mask_</a></div><div class="ttdeci">uint32_t mask_</div><div class="ttdoc">The mask to clean up the values. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:126</div></div>
 <div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aae7128f5522383c857d2639031b64c30"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; VectorizedTile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb_html_a489fe448cd7f7e1f3805d33504f9d336"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a489fe448cd7f7e1f3805d33504f9d336">cutlass::gemm::IgemmGlobalIteratorAb::IgemmGlobalIteratorAb</a></div><div class="ttdeci">CUTLASS_DEVICE IgemmGlobalIteratorAb(typename Base::Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;threadblock_offset, ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Constructor. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:102</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_html_a160d1ecd86de4742f550d11bc281786b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a160d1ecd86de4742f550d11bc281786b">cutlass::gemm::IgemmGlobalTileTraits::ThreadsDelta</a></div><div class="ttdeci">Shape&lt; 1, 4, Base::VectorizedTile::kC &gt; ThreadsDelta</div><div class="ttdoc">The threads strides. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:89</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_afd09d3b8e5ca04eab7edc2e5723816e5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">cutlass::gemm::GemmGlobalIteratorAb::ThreadOffset</a></div><div class="ttdeci">TileTraits_::ThreadOffset ThreadOffset</div><div class="ttdoc">The thread offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:192</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a78836a20250ff24c25a6622ad818b421"><div class="ttname"><a href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">cutlass::Shape::kW</a></div><div class="ttdeci">static int const kW</div><div class="ttdoc">The width of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator::Params</a></div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:491</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aa001e09b246fdd8259cbda6a500cad5f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">cutlass::gemm::GemmGlobalTileTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars per LDG/STG. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:80</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a29bd05960cc541bb67098f5483c84cf6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; Tile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:87</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_html_adab639892c3586464e2ea5f947b9e0f0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#adab639892c3586464e2ea5f947b9e0f0">cutlass::gemm::IgemmGlobalTileTraits::Delta</a></div><div class="ttdeci">Shape&lt; Base::Threads::kH *4, 1, Base::Threads::kW, Base::kAccessSize &gt; Delta</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:68</div></div>
 <div class="ttc" id="matrix__traits_8h_html"><div class="ttname"><a href="matrix__traits_8h.html">matrix_traits.h</a></div><div class="ttdoc">Defines properties of matrices used to denote layout and operands to GEMM kernels. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_html_a2bb0f0820e52417ff77e7a2bdb9ed434"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a2bb0f0820e52417ff77e7a2bdb9ed434">cutlass::gemm::IgemmContiguousGlobalTileTraits::ThreadsDelta</a></div><div class="ttdeci">Shape&lt; 1, 4, Base::Tile::kC &gt; ThreadsDelta</div><div class="ttdoc">The threads strides. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:89</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset_html_a1228edf6cc0f81af520dc77c8792b94c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html#a1228edf6cc0f81af520dc77c8792b94c">cutlass::gemm::IgemmContiguousGlobalTileTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:79</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_html_a5fd1a9f132c7aa0f68e129553f519d1e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a5fd1a9f132c7aa0f68e129553f519d1e">cutlass::gemm::IgemmContiguousGlobalTileTraits::Threads</a></div><div class="ttdeci">Base::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html_a1864c5556529afdc8445021cad780b04"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">cutlass::gemm::GemmGlobalIteratorAb::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdoc">Offset of an individual lane from the start of the tile. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:237</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_html_ac14f4ef560bd8068d16c0471af6df82c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c">cutlass::gemm::IgemmGlobalTileTraits::Base</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:64</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__multiply__add_8h.html b/docs/igemm__multiply__add_8h.html
index 266cb5f16..d67e57b8d 100644
--- a/docs/igemm__multiply__add_8h.html
+++ b/docs/igemm__multiply__add_8h.html
@@ -82,15 +82,15 @@ $(function() {
 
 <p>Implements matrix multiply accumulate operation of 8-bit integer data using DP4A instruction.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="thread__multiply__add_8h_source.html">cutlass/gemm/thread_multiply_add.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="thread__multiply__add_8h_source.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</code><br />
 </div>
 <p><a href="igemm__multiply__add_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#details">More...</a><br /></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -103,7 +103,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__multiply__add_8h_source.html b/docs/igemm__multiply__add_8h_source.html
index 414c2ce17..b67129ef4 100644
--- a/docs/igemm__multiply__add_8h_source.html
+++ b/docs/igemm__multiply__add_8h_source.html
@@ -76,29 +76,30 @@ $(function() {
 <div class="title">igemm_multiply_add.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="igemm__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="thread__multiply__add_8h.html">cutlass/gemm/thread_multiply_add.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> AccumulatorsPerThread_, <span class="keyword">typename</span> ThreadsPerWarp_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html">   42</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt;AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int&gt; {</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad73372a37315b0c17a8db21e40a78574">   44</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;4, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad73372a37315b0c17a8db21e40a78574">InstructionShape</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a47807c9c9fb43e7f7b5f409a49986c30">   46</a></span>&#160;  <span class="keyword">typedef</span> AccumulatorsPerThread_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a47807c9c9fb43e7f7b5f409a49986c30">AccumulatorsPerThread</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a5bc98fd196c1f1e4e3f1bfc621df4f50">   48</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a5bc98fd196c1f1e4e3f1bfc621df4f50">ThreadsPerWarp</a>;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a327ce1b7b6478c27c80baf5d9e26bdbc">   50</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">ShapeMul&lt;AccumulatorsPerThread, ThreadsPerWarp&gt;::Shape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a327ce1b7b6478c27c80baf5d9e26bdbc">AccumulatorsPerWarp</a>;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aeef5fa0437b4ce1c2e8ac4bc7e062b65">   52</a></span>&#160;  <span class="keyword">typedef</span> int8_t <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aeef5fa0437b4ce1c2e8ac4bc7e062b65">ScalarA</a>;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a71aadbb130d4b1a6532c45282b37354f">   54</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarA, AccumulatorsPerThread::kW * 4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a71aadbb130d4b1a6532c45282b37354f">FragmentA</a>;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aaf9e4b8b16150a6ad826c228af2bf103">   56</a></span>&#160;  <span class="keyword">typedef</span> int8_t <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aaf9e4b8b16150a6ad826c228af2bf103">ScalarB</a>;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a43e278686b493d0aef943f32a9f47b9e">   58</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarB, AccumulatorsPerThread::kH * 4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a43e278686b493d0aef943f32a9f47b9e">FragmentB</a>;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#acdd554e996a712ff62eb70d6ecf8e116">   60</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#acdd554e996a712ff62eb70d6ecf8e116">ScalarC</a>;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a4712650b46b6183ea60d79ef18f55b86">   62</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarC, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a4712650b46b6183ea60d79ef18f55b86">Accumulators</a>;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a9b75e499f4c14369b5c86051dceeb81d">   65</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a9b75e499f4c14369b5c86051dceeb81d">ThreadMultiplyAdd</a>() {}</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad22dd143c304c22c2630aedbfd3459af">   68</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad22dd143c304c22c2630aedbfd3459af">multiply_add</a>(<a class="code" href="structcutlass_1_1Fragment.html">FragmentA</a> <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">FragmentB</a> <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a> <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a>&amp; d) {</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* a_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;a[0]);</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* b_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;b[0]);</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; AccumulatorsPerThread::kH; ++j) {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; AccumulatorsPerThread::kW; ++i) {</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;        <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;dp4a.s32.s32 %0, %1, %2, %3;&quot;</span></div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;                     : <span class="stringliteral">&quot;=r&quot;</span>(d[j * AccumulatorsPerThread::kW + i])</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                     : <span class="stringliteral">&quot;r&quot;</span>(a_int[i]), <span class="stringliteral">&quot;r&quot;</span>(b_int[j]), <span class="stringliteral">&quot;r&quot;</span>(c[j * AccumulatorsPerThread::kW + i]));</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;      }</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    }</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  }</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;};</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_aeef5fa0437b4ce1c2e8ac4bc7e062b65"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aeef5fa0437b4ce1c2e8ac4bc7e062b65">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarA</a></div><div class="ttdeci">int8_t ScalarA</div><div class="ttdoc">The type for A. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:52</div></div>
-<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<a href="igemm__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__multiply__add_8h.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ThreadGemmShape_, <span class="keyword">typename</span> ThreadsPerWarp_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">   42</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt;ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int&gt; {</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd">   44</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;4, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd">InstructionShape</a>;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">   46</a></span>&#160;  <span class="keyword">typedef</span> ThreadGemmShape_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">ThreadGemmShape</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947">   48</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">ThreadGemmShape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947">AccumulatorsPerThread</a>;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">   50</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">ThreadsPerWarp</a>;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027">   52</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">ShapeMul&lt;ThreadGemmShape, ThreadsPerWarp&gt;::Shape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027">AccumulatorsPerWarp</a>;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">   54</a></span>&#160;  <span class="keyword">typedef</span> int8_t <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">ScalarA</a>;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">   56</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarA, AccumulatorsPerThread::kW * 4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">FragmentA</a>;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">   58</a></span>&#160;  <span class="keyword">typedef</span> int8_t <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">ScalarB</a>;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">   60</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarB, AccumulatorsPerThread::kH * 4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">FragmentB</a>;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">   62</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">ScalarC</a>;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">   64</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarC, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">Accumulators</a>;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aad8a642f46c88e407a1150ee1d42b8dd">   67</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aad8a642f46c88e407a1150ee1d42b8dd">ThreadMultiplyAdd</a>() {}</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ad9d8e47e8896d8d4eab538aa78b56e47">   70</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ad9d8e47e8896d8d4eab538aa78b56e47">multiply_add</a>(<a class="code" href="structcutlass_1_1Fragment.html">FragmentA</a> <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">FragmentB</a> <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a> <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a>&amp; d) {</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <span class="comment">// The inputs.</span></div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* a_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;a[0]);</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* b_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;b[0]);</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; AccumulatorsPerThread::kH; ++j) {</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; AccumulatorsPerThread::kW; ++i) {</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;        <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;dp4a.s32.s32 %0, %1, %2, %3;&quot;</span></div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;                     : <span class="stringliteral">&quot;=r&quot;</span>(d[j * AccumulatorsPerThread::kW + i])</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;                     : <span class="stringliteral">&quot;r&quot;</span>(a_int[i]), <span class="stringliteral">&quot;r&quot;</span>(b_int[j]), <span class="stringliteral">&quot;r&quot;</span>(c[j * AccumulatorsPerThread::kW + i]));</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      }</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    }</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  }</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;};</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_a8d0734b8e797576adcf89f70c62160d4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentA</a></div><div class="ttdeci">Fragment&lt; ScalarA, AccumulatorsPerThread::kW *4 &gt; FragmentA</div><div class="ttdoc">The fragment for A. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:56</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeMul_html_a8875fc5e861339f981360ed774e8cc94"><div class="ttname"><a href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">cutlass::ShapeMul::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD *B_::kD, A_::kH *B_::kH, A_::kW *B_::kW, A_::kC *B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:119</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
 <div class="ttc" id="thread__multiply__add_8h_html"><div class="ttname"><a href="thread__multiply__add_8h.html">thread_multiply_add.h</a></div><div class="ttdoc">Template implementing matrix multiply-add operations on fragments. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_a4712650b46b6183ea60d79ef18f55b86"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a4712650b46b6183ea60d79ef18f55b86">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::Accumulators</a></div><div class="ttdeci">Fragment&lt; ScalarC, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW &gt; Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_a327ce1b7b6478c27c80baf5d9e26bdbc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a327ce1b7b6478c27c80baf5d9e26bdbc">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerWarp</a></div><div class="ttdeci">ShapeMul&lt; AccumulatorsPerThread, ThreadsPerWarp &gt;::Shape AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:50</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_a43e278686b493d0aef943f32a9f47b9e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a43e278686b493d0aef943f32a9f47b9e">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentB</a></div><div class="ttdeci">Fragment&lt; ScalarB, AccumulatorsPerThread::kH *4 &gt; FragmentB</div><div class="ttdoc">The fragment for B. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:58</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_a9b75e499f4c14369b5c86051dceeb81d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a9b75e499f4c14369b5c86051dceeb81d">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE ThreadMultiplyAdd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:65</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_ad73372a37315b0c17a8db21e40a78574"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad73372a37315b0c17a8db21e40a78574">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::InstructionShape</a></div><div class="ttdeci">Shape&lt; 4, 1, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:44</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_a5bc98fd196c1f1e4e3f1bfc621df4f50"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a5bc98fd196c1f1e4e3f1bfc621df4f50">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The number of threads per warp. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:48</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_a47807c9c9fb43e7f7b5f409a49986c30"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a47807c9c9fb43e7f7b5f409a49986c30">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerThread</a></div><div class="ttdeci">AccumulatorsPerThread_ AccumulatorsPerThread</div><div class="ttdoc">The number of accumulators per thread. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_aad8a642f46c88e407a1150ee1d42b8dd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aad8a642f46c88e407a1150ee1d42b8dd">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE ThreadMultiplyAdd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:67</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_ad9d8e47e8896d8d4eab538aa78b56e47"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ad9d8e47e8896d8d4eab538aa78b56e47">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:70</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_a703b329ebf14d78f576e83c5e6fe23a7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarC</a></div><div class="ttdeci">int ScalarC</div><div class="ttdoc">The type for C and D. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_aa84c3d4efc7947d6efb75536c88043bd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::InstructionShape</a></div><div class="ttdeci">Shape&lt; 4, 1, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_a6bb1afd96da05370e61b38f2a93e40df"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The number of threads per warp. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_ac5cde71eb825b0a4311bd0ce982f47aa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadGemmShape</a></div><div class="ttdeci">ThreadGemmShape_ ThreadGemmShape</div><div class="ttdoc">Shape of the thread-level GEMM (K-by-N-by-M) </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_a1ae57ab39203313cfd20208947750786"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::Accumulators</a></div><div class="ttdeci">Fragment&lt; ScalarC, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW &gt; Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:64</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_a71aadbb130d4b1a6532c45282b37354f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a71aadbb130d4b1a6532c45282b37354f">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentA</a></div><div class="ttdeci">Fragment&lt; ScalarA, AccumulatorsPerThread::kW *4 &gt; FragmentA</div><div class="ttdoc">The fragment for A. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:54</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_acdd554e996a712ff62eb70d6ecf8e116"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#acdd554e996a712ff62eb70d6ecf8e116">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarC</a></div><div class="ttdeci">int ScalarC</div><div class="ttdoc">The type for C and D. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:60</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_aaf9e4b8b16150a6ad826c228af2bf103"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aaf9e4b8b16150a6ad826c228af2bf103">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarB</a></div><div class="ttdeci">int8_t ScalarB</div><div class="ttdoc">The type for B. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:56</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6_html_ad22dd143c304c22c2630aedbfd3459af"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad22dd143c304c22c2630aedbfd3459af">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:68</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_ae3152470cbbba2310d9c83b9d5d43027"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerWarp</a></div><div class="ttdeci">ShapeMul&lt; ThreadGemmShape, ThreadsPerWarp &gt;::Shape AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_aa88edf2e89062be00181f5dc4f4a0947"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerThread</a></div><div class="ttdeci">ThreadGemmShape AccumulatorsPerThread</div><div class="ttdoc">Aliased for compatibility. Will be removed in CUTLASS v2.0. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_a6439d8fc71727cc6d50f87eae549157e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentB</a></div><div class="ttdeci">Fragment&lt; ScalarB, AccumulatorsPerThread::kH *4 &gt; FragmentB</div><div class="ttdoc">The fragment for B. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_a11be198f90afb859be51ec5feb5dcd2b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarA</a></div><div class="ttdeci">int8_t ScalarA</div><div class="ttdoc">The type for A. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:54</div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4_html_a6a9c4f906a4930f4fc415009ead2e05d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarB</a></div><div class="ttdeci">int8_t ScalarB</div><div class="ttdoc">The type for B. </div><div class="ttdef"><b>Definition:</b> igemm_multiply_add.h:58</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__swizzle_8h.html b/docs/igemm__swizzle_8h.html
index a631d215c..c87855219 100644
--- a/docs/igemm__swizzle_8h.html
+++ b/docs/igemm__swizzle_8h.html
@@ -82,7 +82,7 @@ $(function() {
 
 <p>Transposes a fragment of data containing packed 8-bit integer elements.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
 </div>
 <p><a href="igemm__swizzle_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -101,7 +101,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__swizzle_8h_source.html b/docs/igemm__swizzle_8h_source.html
index 939908301..015b5f9af 100644
--- a/docs/igemm__swizzle_8h_source.html
+++ b/docs/igemm__swizzle_8h_source.html
@@ -76,14 +76,14 @@ $(function() {
 <div class="title">igemm_swizzle.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="igemm__swizzle_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GlobalIterator_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">IgemmSwizzle</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a880878914c25db44a1781725c24af514">   40</a></span>&#160;  <span class="keyword">typedef</span> GlobalIterator_ <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a880878914c25db44a1781725c24af514">GlobalIterator</a>;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">   42</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalIterator::Fragment <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a>;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004">   44</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalIterator::FragmentShape <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004">FragmentShape</a>;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727">   47</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727">InputFragment</a>;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8">   49</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8">OutputFragment</a>;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;typename Fragment::Element, int8_t&gt;::value</a>), <span class="stringliteral">&quot;Works on int8&quot;</span>);</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(FragmentShape::kH % 4 == 0 &amp;&amp; <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> % 4 == 0,</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;                <span class="stringliteral">&quot;Not multiple of 4&quot;</span>);</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac041d287c966cf568599d7e462e81d5a">   59</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac041d287c966cf568599d7e462e81d5a">IgemmSwizzle</a>() {}</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811">   62</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811">transform</a>(<a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a>&amp; dst) {</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="comment">// Expose src/dst as int arrays.</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* src_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;src[0]);</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keywordtype">int</span>* dst_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span>*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="comment">// Transpose the data.</span></div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; FragmentShape::kD; ++d) {</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; FragmentShape::kH / 4; ++h) {</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; ShapeCount&lt;FragmentShape&gt;::kWc / 4; ++w) {</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> i0 = d * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kHwc</a> / 4) +</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                         (4 * h + 0) * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> / 4) + w;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> i1 = d * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kHwc</a> / 4) +</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                         (4 * h + 1) * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> / 4) + w;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> i2 = d * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kHwc</a> / 4) +</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;                         (4 * h + 2) * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> / 4) + w;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> i3 = d * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kHwc</a> / 4) +</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;                         (4 * h + 3) * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> / 4) + w;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;          <span class="keywordtype">int</span> a0 = src_int[i0];</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;          <span class="keywordtype">int</span> a1 = src_int[i1];</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;          <span class="keywordtype">int</span> a2 = src_int[i2];</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;          <span class="keywordtype">int</span> a3 = src_int[i3];</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;          <span class="keywordtype">int</span> b0, b1, b2, b3, c0;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0040;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b0) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0040;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(c0) : <span class="stringliteral">&quot;r&quot;</span>(a2), <span class="stringliteral">&quot;r&quot;</span>(a3));</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b0) : <span class="stringliteral">&quot;r&quot;</span>(b0), <span class="stringliteral">&quot;r&quot;</span>(c0));</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0051;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b1) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0051;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(c0) : <span class="stringliteral">&quot;r&quot;</span>(a2), <span class="stringliteral">&quot;r&quot;</span>(a3));</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b1) : <span class="stringliteral">&quot;r&quot;</span>(b1), <span class="stringliteral">&quot;r&quot;</span>(c0));</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0062;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b2) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0062;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(c0) : <span class="stringliteral">&quot;r&quot;</span>(a2), <span class="stringliteral">&quot;r&quot;</span>(a3));</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b2) : <span class="stringliteral">&quot;r&quot;</span>(b2), <span class="stringliteral">&quot;r&quot;</span>(c0));</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0073;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b3) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0073;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(c0) : <span class="stringliteral">&quot;r&quot;</span>(a2), <span class="stringliteral">&quot;r&quot;</span>(a3));</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b3) : <span class="stringliteral">&quot;r&quot;</span>(b3), <span class="stringliteral">&quot;r&quot;</span>(c0));</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;          dst_int[i0] = b0;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;          dst_int[i1] = b1;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;          dst_int[i2] = b2;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;          dst_int[i3] = b3;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;        }</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      }</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    }</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  }</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;};</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:412</div></div>
+<a href="igemm__swizzle_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GlobalIterator_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">IgemmSwizzle</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a880878914c25db44a1781725c24af514">   40</a></span>&#160;  <span class="keyword">typedef</span> GlobalIterator_ <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a880878914c25db44a1781725c24af514">GlobalIterator</a>;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">   42</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalIterator::Fragment <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a>;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004">   44</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GlobalIterator::FragmentShape <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004">FragmentShape</a>;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727">   47</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727">InputFragment</a>;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8">   49</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8">OutputFragment</a>;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="structcutlass_1_1platform_1_1is__same.html">platform::is_same&lt;typename Fragment::Element, int8_t&gt;::value</a>), <span class="stringliteral">&quot;Works on int8&quot;</span>);</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(FragmentShape::kH % 4 == 0 &amp;&amp; <a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> % 4 == 0,</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;                <span class="stringliteral">&quot;Not multiple of 4&quot;</span>);</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac041d287c966cf568599d7e462e81d5a">   59</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac041d287c966cf568599d7e462e81d5a">IgemmSwizzle</a>() {}</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811">   62</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811">transform</a>(<a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">Fragment</a>&amp; dst) {</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="comment">// Expose src/dst as int arrays.</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span>* src_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span> const*<span class="keyword">&gt;</span>(&amp;src[0]);</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keywordtype">int</span>* dst_int = <span class="keyword">reinterpret_cast&lt;</span><span class="keywordtype">int</span>*<span class="keyword">&gt;</span>(&amp;dst[0]);</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="comment">// Transpose the data.</span></div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; FragmentShape::kD; ++d) {</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; FragmentShape::kH / 4; ++h) {</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; ShapeCount&lt;FragmentShape&gt;::kWc / 4; ++w) {</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> i0 = d * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kHwc</a> / 4) +</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                         (4 * h + 0) * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> / 4) + w;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> i1 = d * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kHwc</a> / 4) +</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                         (4 * h + 1) * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> / 4) + w;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> i2 = d * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kHwc</a> / 4) +</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;                         (4 * h + 2) * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> / 4) + w;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> i3 = d * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kHwc</a> / 4) +</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;                         (4 * h + 3) * (<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;FragmentShape&gt;::kWc</a> / 4) + w;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;          <span class="keywordtype">int</span> a0 = src_int[i0];</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;          <span class="keywordtype">int</span> a1 = src_int[i1];</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;          <span class="keywordtype">int</span> a2 = src_int[i2];</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;          <span class="keywordtype">int</span> a3 = src_int[i3];</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;          <span class="comment">// // DEBUG.</span></div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;          <span class="comment">// if (threadIdx.x == 0) {</span></div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;          <span class="comment">//     printf(&quot;a=0x%08x 0x%08x 0x%08x 0x%08x\n&quot;, a0, a1, a2, a3);</span></div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;          <span class="comment">// }</span></div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;          <span class="keywordtype">int</span> b0, b1, b2, b3, c0;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0040;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b0) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0040;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(c0) : <span class="stringliteral">&quot;r&quot;</span>(a2), <span class="stringliteral">&quot;r&quot;</span>(a3));</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b0) : <span class="stringliteral">&quot;r&quot;</span>(b0), <span class="stringliteral">&quot;r&quot;</span>(c0));</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0051;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b1) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0051;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(c0) : <span class="stringliteral">&quot;r&quot;</span>(a2), <span class="stringliteral">&quot;r&quot;</span>(a3));</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b1) : <span class="stringliteral">&quot;r&quot;</span>(b1), <span class="stringliteral">&quot;r&quot;</span>(c0));</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0062;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b2) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0062;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(c0) : <span class="stringliteral">&quot;r&quot;</span>(a2), <span class="stringliteral">&quot;r&quot;</span>(a3));</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b2) : <span class="stringliteral">&quot;r&quot;</span>(b2), <span class="stringliteral">&quot;r&quot;</span>(c0));</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0073;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b3) : <span class="stringliteral">&quot;r&quot;</span>(a0), <span class="stringliteral">&quot;r&quot;</span>(a1));</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x0073;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(c0) : <span class="stringliteral">&quot;r&quot;</span>(a2), <span class="stringliteral">&quot;r&quot;</span>(a3));</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;          <span class="keyword">asm</span> <span class="keyword">volatile</span>(<span class="stringliteral">&quot;prmt.b32 %0, %1, %2, 0x5410;&quot;</span> : <span class="stringliteral">&quot;=r&quot;</span>(b3) : <span class="stringliteral">&quot;r&quot;</span>(b3), <span class="stringliteral">&quot;r&quot;</span>(c0));</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;          <span class="comment">// // DEBUG.</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;          <span class="comment">// if (threadIdx.x == 0) {</span></div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;          <span class="comment">//     printf(&quot;b=0x%08x 0x%08x 0x%08x 0x%08x\n&quot;, b0, b1, b2, b3);</span></div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;          <span class="comment">// }</span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;          dst_int[i0] = b0;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;          dst_int[i1] = b1;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;          dst_int[i2] = b2;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;          dst_int[i3] = b3;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;        }</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;      }</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    }</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  }</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;};</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:420</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSwizzle_html_a13a3b052cd8b714471489a9cc4dc7004"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004">cutlass::gemm::IgemmSwizzle::FragmentShape</a></div><div class="ttdeci">GlobalIterator::FragmentShape FragmentShape</div><div class="ttdoc">The shape of the source fragment. </div><div class="ttdef"><b>Definition:</b> igemm_swizzle.h:44</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSwizzle_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">cutlass::gemm::IgemmSwizzle</a></div><div class="ttdef"><b>Definition:</b> igemm_swizzle.h:38</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSwizzle_html_a880878914c25db44a1781725c24af514"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a880878914c25db44a1781725c24af514">cutlass::gemm::IgemmSwizzle::GlobalIterator</a></div><div class="ttdeci">GlobalIterator_ GlobalIterator</div><div class="ttdoc">The global iterator. </div><div class="ttdef"><b>Definition:</b> igemm_swizzle.h:40</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSwizzle_html_a084917a512c7a411b76a69f86b906811"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811">cutlass::gemm::IgemmSwizzle::transform</a></div><div class="ttdeci">CUTLASS_DEVICE void transform(Fragment const &amp;src, Fragment &amp;dst)</div><div class="ttdoc">Transform a fragment. </div><div class="ttdef"><b>Definition:</b> igemm_swizzle.h:62</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSwizzle_html_ac0a4e31e95f8e0c77ae087284bb02ff8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8">cutlass::gemm::IgemmSwizzle::OutputFragment</a></div><div class="ttdeci">Fragment OutputFragment</div><div class="ttdoc">The destination fragment. </div><div class="ttdef"><b>Definition:</b> igemm_swizzle.h:49</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSwizzle_html_a24a0bd5a9251ba5204b35eb4c4ac7727"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727">cutlass::gemm::IgemmSwizzle::InputFragment</a></div><div class="ttdeci">Fragment InputFragment</div><div class="ttdoc">The source fragment. </div><div class="ttdef"><b>Definition:</b> igemm_swizzle.h:47</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSwizzle_html_a67693ee79f93cb61fc37f2e632eaea8d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d">cutlass::gemm::IgemmSwizzle::Fragment</a></div><div class="ttdeci">GlobalIterator::Fragment Fragment</div><div class="ttdoc">The source fragment. </div><div class="ttdef"><b>Definition:</b> igemm_swizzle.h:42</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSwizzle_html_ac041d287c966cf568599d7e462e81d5a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac041d287c966cf568599d7e462e81d5a">cutlass::gemm::IgemmSwizzle::IgemmSwizzle</a></div><div class="ttdeci">CUTLASS_DEVICE IgemmSwizzle()</div><div class="ttdoc">The src/dst must be int8 fragments. </div><div class="ttdef"><b>Definition:</b> igemm_swizzle.h:59</div></div>
@@ -92,7 +92,7 @@ $(function() {
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__traits_8h.html b/docs/igemm__traits_8h.html
index 32d14d876..897687ee2 100644
--- a/docs/igemm__traits_8h.html
+++ b/docs/igemm__traits_8h.html
@@ -82,34 +82,38 @@ $(function() {
 
 <p>Defies structural properties of mixed-precision integer GEMM. Multiplicands are assumed to be packed 8bit integers, accumulators are assumed to be 32b signed integers, and output formats vary.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__epilogue_8h_source.html">cutlass/gemm/gemm_epilogue.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__epilogue__traits_8h_source.html">cutlass/gemm/gemm_epilogue_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__traits_8h_source.html">cutlass/gemm/gemm_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="igemm__epilogue_8h_source.html">cutlass/gemm/igemm_epilogue.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="igemm__global__tile_8h_source.html">cutlass/gemm/igemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="igemm__multiply__add_8h_source.html">cutlass/gemm/igemm_multiply_add.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="igemm__swizzle_8h_source.html">cutlass/gemm/igemm_swizzle.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue_8h_source.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue__traits_8h_source.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__traits_8h_source.html">cutlass/gemm/gemm_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="igemm__epilogue_8h_source.html">cutlass/gemm/igemm_epilogue.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="igemm__global__tile_8h_source.html">cutlass/gemm/igemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="igemm__multiply__add_8h_source.html">cutlass/gemm/igemm_multiply_add.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="igemm__swizzle_8h_source.html">cutlass/gemm/igemm_swizzle.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="reshape__tile_8h_source.html">cutlass/reshape_tile.h</a>&quot;</code><br />
 </div>
 <p><a href="igemm__traits_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01AccumulatorsPerThread___01_4.html">cutlass::gemm::IgemmConfig&lt; OutputTile_, int8_t, AccumulatorsPerThread_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html">cutlass::gemm::IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_, Index_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">cutlass::gemm::IgemmTransformerA&lt; kLayout_, Iterator_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -123,13 +127,13 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">cutlass::gemm::IgemmEpilogueScalar&lt; ScalarD_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html">cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_, Helper_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_, Helper_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -142,7 +146,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/igemm__traits_8h_source.html b/docs/igemm__traits_8h_source.html
index ecdd4f1df..e1fa87e40 100644
--- a/docs/igemm__traits_8h_source.html
+++ b/docs/igemm__traits_8h_source.html
@@ -76,89 +76,108 @@ $(function() {
 <div class="title">igemm_traits.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="igemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&gt;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="igemm__epilogue_8h.html">cutlass/gemm/igemm_epilogue.h</a>&gt;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="igemm__global__tile_8h.html">cutlass/gemm/igemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="igemm__multiply__add_8h.html">cutlass/gemm/igemm_multiply_add.h</a>&gt;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="igemm__swizzle_8h.html">cutlass/gemm/igemm_swizzle.h</a>&gt;</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keyword">typename</span> ScalarD_,</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_&gt;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmConfig.html">   57</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;          int8_t,</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;          int8_t,</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;          ScalarD_,</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;          ScalarD_,</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;          OutputTile_,</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;          ThreadMultiplyAdd&lt;AccumulatorsPerThread_, Shape&lt;1, 4, 8&gt;, int8_t, int8_t, int&gt;,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;          4,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;          4,</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;          16,</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;          4,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;          4,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;          16,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;          1,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;          4,</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;          1,</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;          2&gt; {};</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputTile_, <span class="keyword">typename</span> AccumulatorsPerThread_&gt;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01AccumulatorsPerThread___01_4.html">   95</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a>&lt;OutputTile_, int8_t, AccumulatorsPerThread_&gt;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;          int8_t,</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;          int8_t,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;          int8_t,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;          int8_t,</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;          OutputTile_,</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;          ThreadMultiplyAdd&lt;AccumulatorsPerThread_, Shape&lt;1, 4, 8&gt;, int8_t, int8_t, int&gt;,</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;          4,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;          4,</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;          16,</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;          4,</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;          4,</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;          16,</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;          4,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;          4,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;          4,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;          2&gt; {};</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">  133</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;kLayout_, GemmConfig_&gt; {};</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00138"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">  138</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, GemmConfig_&gt;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00141"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#affd04d88a0bbef13c54f10000a5dc15d">  141</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperA&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#affd04d88a0bbef13c54f10000a5dc15d">Base</a>;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ae396f7301f934c179e054f68f0420edf">  144</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerStsA = 16;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html">IgemmContiguousGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      int8_t <span class="keyword">const</span>,</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW&gt;</a>,</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      4&gt;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a738774d1eb79de7e29c372ddfd48258d">  159</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a738774d1eb79de7e29c372ddfd48258d">GlobalTileTraits</a>;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;      int8_t,</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kW * 4&gt;,</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      kScalarsPerStsA&gt;</div><div class="line"><a name="l00171"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a7624585480f83a46725c92b5dee20ebc">  171</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a7624585480f83a46725c92b5dee20ebc">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;};</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00177"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">  177</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;kLayout_, GemmConfig_&gt; {};</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00182"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">  182</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, GemmConfig_&gt;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;MatrixLayout::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aef7047c6a0d0c3db0bfb6bec08520aad">  185</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperB&lt;MatrixLayout::kRowMajor, GemmConfig_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aef7047c6a0d0c3db0bfb6bec08520aad">Base</a>;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a47d99d98c783cf1d317698bd465ffa9a">  188</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerStsB = 16;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html">IgemmContiguousGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;      int8_t <span class="keyword">const</span>,</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH&gt;</a>,</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      4&gt;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a24f38105e3c331c733cb672c3a9be588">  203</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a24f38105e3c331c733cb672c3a9be588">GlobalTileTraits</a>;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      int8_t,</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kH * 4&gt;,</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      kScalarsPerStsB&gt;</div><div class="line"><a name="l00215"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aca6118b5bbe6f667f05c53bd52543045">  215</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aca6118b5bbe6f667f05c53bd52543045">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;};</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00221"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">  221</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a> {};</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">  224</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, Iterator_&gt; {</div><div class="line"><a name="l00225"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197">  225</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename Iterator_::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197">Transformer</a>;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;};</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">  229</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, Iterator_&gt; {</div><div class="line"><a name="l00230"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f">  230</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">IgemmSwizzle&lt;Iterator_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f">Transformer</a>;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;};</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00236"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">  236</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a> {};</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00239"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">  239</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, Iterator_&gt; {</div><div class="line"><a name="l00240"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49">  240</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename Iterator_::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49">Transformer</a>;</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;};</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00244"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">  244</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, Iterator_&gt; {</div><div class="line"><a name="l00245"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a">  245</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">IgemmSwizzle&lt;Iterator_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a">Transformer</a>;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;};</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    <span class="keyword">typename</span> ScalarD_,</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;32, 8, 8&gt;</a>,</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00265"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">  265</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">IgemmTraitsHelper</a> {</div><div class="line"><a name="l00267"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">  267</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig&lt;OutputTile_, ScalarD_, AccumulatorsPerThread_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a>;</div><div class="line"><a name="l00269"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf">  269</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA&lt;kLayoutA_, GemmConfig&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf">GemmTileTraitsHelperA</a>;</div><div class="line"><a name="l00271"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8">  271</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB&lt;kLayoutB_, GemmConfig&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8">GemmTileTraitsHelperB</a>;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperA::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00275"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">  275</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">GlobalLoadIteratorA</a>;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt;GemmTileTraitsHelperA::kLayout,</div><div class="line"><a name="l00278"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">  278</a></span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GlobalLoadIteratorA</a>&gt;::Transformer <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">GlobalTransformerA</a>;</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits,</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00284"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">  284</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">SharedStoreIteratorA</a>;</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream&lt;GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA&gt;</a></div><div class="line"><a name="l00287"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846">  287</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846">GlobalLoadStreamA</a>;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperB::GlobalTileTraits, Index_&gt;</a></div><div class="line"><a name="l00291"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">  291</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">GlobalLoadIteratorB</a>;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;  <span class="comment">// The default transformer for B.</span></div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt;GemmTileTraitsHelperB::kLayout,</div><div class="line"><a name="l00294"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">  294</a></span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GlobalLoadIteratorB</a>&gt;::Transformer <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">GlobalTransformerB</a>;</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">  300</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">SharedStoreIteratorB</a>;</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream&lt;GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB&gt;</a></div><div class="line"><a name="l00303"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b">  303</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b">GlobalLoadStreamB</a>;</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits,</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00310"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">  310</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">SharedLoadIteratorA</a>;</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorA, Copy&lt;typename SharedLoadIteratorA::Fragment&gt;</a> &gt;</div><div class="line"><a name="l00313"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f">  313</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f">SharedLoadStreamA</a>;</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits,</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00319"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">  319</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">SharedLoadIteratorB</a>;</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorB, Copy&lt;typename SharedLoadIteratorB::Fragment&gt;</a> &gt;</div><div class="line"><a name="l00322"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96">  322</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96">SharedLoadStreamB</a>;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;</div><div class="line"><a name="l00325"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8">  325</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">GemmConfig::MultiplyAdd</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8">MultiplyAdd</a>;</div><div class="line"><a name="l00327"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">  327</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">ClearAccumulators&lt;typename MultiplyAdd::ScalarC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">ClearAccumulators</a>;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00330"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651">  330</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue&lt;IgemmEpilogueTraits&lt;GemmConfig, EpilogueFunctor_&gt;</a> &gt; <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651">Epilogue</a>;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;};</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScalarD_&gt;</div><div class="line"><a name="l00336"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">  336</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">IgemmEpilogueScalar</a> {</div><div class="line"><a name="l00337"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317">  337</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">float</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317">Scalar</a>;</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;};</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00341"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html">  341</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">IgemmEpilogueScalar</a>&lt;int&gt; {</div><div class="line"><a name="l00342"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650">  342</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650">Scalar</a>;</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;};</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;32, 128, 128&gt;</a>,</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;    <span class="keyword">typename</span> ScalarD_ = int,</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;typename IgemmEpilogueScalar&lt;ScalarD_&gt;::Scalar</a>&gt;,</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;32, 8, 8&gt;</a>,</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;    <span class="keyword">typename</span> Helper_ = <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">IgemmTraitsHelper</a>&lt;kLayoutA_,</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;                                         kLayoutB_,</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;                                         OutputTile_,</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;                                         ScalarD_,</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;                                         EpilogueFunctor_,</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;                                         AccumulatorsPerThread_,</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;                                         Index_&gt; &gt;</div><div class="line"><a name="l00370"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraits.html">  370</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTraits.html">IgemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt;</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;                         typename Helper_::GemmConfig,</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;                         <span class="comment">// The stream to load A from global memory to shared memory.</span></div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;                         typename Helper_::GlobalLoadStreamA,</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;                         <span class="comment">// The stream to load B from global memory to shared memory.</span></div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;                         typename Helper_::GlobalLoadStreamB,</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;                         <span class="comment">// The stream to load A from shared memory.</span></div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;                         typename Helper_::SharedLoadStreamA,</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;                         <span class="comment">// The stream to load B from shared memory.</span></div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;                         typename Helper_::SharedLoadStreamB,</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;                         typename Helper_::Epilogue,</div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;                         <span class="comment">// The block swizzle to reorganize the grid.</span></div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;                         IdentityBlockSwizzle,</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;                         Index_,</div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;                         <span class="comment">// The tool used to clear accumulators.</span></div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;                         typename Helper_::ClearAccumulators&gt; {};</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a42322b9b10e894fe157e527b378c59f8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorB</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorB</div><div class="ttdoc">The iterator to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:319</div></div>
+<a href="igemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&quot;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="igemm__epilogue_8h.html">cutlass/gemm/igemm_epilogue.h</a>&quot;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="igemm__global__tile_8h.html">cutlass/gemm/igemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="igemm__multiply__add_8h.html">cutlass/gemm/igemm_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="igemm__swizzle_8h.html">cutlass/gemm/igemm_swizzle.h</a>&quot;</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    <span class="keyword">typename</span> ScalarD_,</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_&gt;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmConfig.html">   57</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;                         int8_t,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;                         int8_t,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;                         ScalarD_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;                         ScalarD_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;                         OutputTile_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;                         ThreadMultiplyAdd&lt;ThreadGemmShape_, Shape&lt;1, 4, 8&gt;, int8_t, int8_t, int&gt;,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                         4,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                         4,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                         16,</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;                         4,</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;                         4,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;                         16,</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;                         1,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;                         4,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                         1,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;                         2,</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;                         false,</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;                         false,</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;                         false&gt; {};</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputTile_, <span class="keyword">typename</span> ThreadGemmShape_&gt;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html">  100</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a>&lt;OutputTile_, int8_t, ThreadGemmShape_&gt;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;          int8_t,</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;          int8_t,</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;          int8_t,</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;          int8_t,</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;          OutputTile_,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;          ThreadMultiplyAdd&lt;ThreadGemmShape_, Shape&lt;1, 4, 8&gt;, int8_t, int8_t, int&gt;,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;          4,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;          4,</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;          16,</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;          4,</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;          4,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;          16,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;          4,</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;          4,</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;          4,</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;          2,</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;          false,</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;          true,</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;          false&gt; {};</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">  144</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;kLayout_, GemmConfig_&gt; {};</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">  149</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, GemmConfig_, Index_&gt;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00152"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae">  152</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperA&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae">Base</a>;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a69775031f651795f697b628677b8e4eb">  155</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerStsA = 16;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      int8_t <span class="keyword">const</span>,</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW&gt;</a>,</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a66f11407e9f5bf0d6123c81dfee6b330">  170</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a66f11407e9f5bf0d6123c81dfee6b330">GlobalTileTraits</a>;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504">  173</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;GlobalTileTraits, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504">GlobalLoadIterator</a>;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      int8_t,</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kW * 4&gt;,</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;      kScalarsPerStsA&gt;</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aa21c231aa56c9e5f2705cac62b17bbbe">  185</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aa21c231aa56c9e5f2705cac62b17bbbe">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;};</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">  191</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, GemmConfig_, Index_&gt; {</div><div class="line"><a name="l00193"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a32729d0fad10fcbbcf2643a2fa5671d6">  193</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41">  196</a></span>&#160;  <span class="keyword">typedef</span> int8_t <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41">Scalar</a>;</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf">  198</a></span>&#160;  <span class="keyword">typedef</span> int8_t <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf">MultiplyAddScalar</a>;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aedb61c43d8fb9c4ba18ae72601b9f6e1">  201</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerStsA = 16;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      int8_t <span class="keyword">const</span>,</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      <span class="comment">// The tile has size NxK in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00216"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">  216</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">GlobalTileTraits</a>;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e">  219</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb&lt;GlobalTileTraits, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e">GlobalLoadIterator</a>;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      <span class="comment">// The pointer is int8.</span></div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;      int8_t,</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kW * 4&gt;,</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;      <span class="comment">// The number of scalars per STS.</span></div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;      kScalarsPerStsA,</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;      16&gt;</div><div class="line"><a name="l00233"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">  233</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;      int8_t <span class="keyword">const</span>,</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      16,</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00253"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d">  253</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;};</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00259"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">  259</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;kLayout_, GemmConfig_&gt; {};</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00264"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">  264</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, GemmConfig_, Index_&gt; {</div><div class="line"><a name="l00266"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a11026d05b2b32f1373020c049f2cfa66">  266</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;</div><div class="line"><a name="l00269"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53">  269</a></span>&#160;  <span class="keyword">typedef</span> int8_t <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53">Scalar</a>;</div><div class="line"><a name="l00271"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194">  271</a></span>&#160;  <span class="keyword">typedef</span> int8_t <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194">MultiplyAddScalar</a>;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;</div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aaa3228d45ff4428bba0f88a7a6e8b31b">  274</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerStsB = 16;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;      int8_t <span class="keyword">const</span>,</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      <span class="comment">// The tile has size NxK in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD&gt;</a>,</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00289"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">  289</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">GlobalTileTraits</a>;</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div><div class="line"><a name="l00292"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327">  292</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb&lt;GlobalTileTraits, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327">GlobalLoadIterator</a>;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt;</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;      <span class="comment">// The pointer is int8.</span></div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;      int8_t,</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;      <span class="comment">// The tile has size KxN in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kH * 4&gt;,</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;      <span class="comment">// The threads are distributed as (threads / K) x K (the traits may reorganize).</span></div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;      <span class="comment">// The number of scalars per STS.</span></div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;      kScalarsPerStsB,</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;      <span class="comment">// The skew to avoid bank conflicts added in the tile W dimension.</span></div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;      16&gt;</div><div class="line"><a name="l00306"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb">  306</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt;</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;      int8_t <span class="keyword">const</span>,</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;      <span class="comment">// The number of threads per warp.</span></div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;      <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ThreadsPerWarp,</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;      <span class="comment">// The shape of the FMA instruction.</span></div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape,</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;      <span class="comment">// The number of stages.</span></div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;      GemmConfig_::kStages,</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;      16,</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;      <span class="comment">// The skew.</span></div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;      SharedStoreTileTraits::kSkew&gt;</div><div class="line"><a name="l00326"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe">  326</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe">SharedLoadTileTraits</a>;</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;};</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00332"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">  332</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, GemmConfig_, Index_&gt;</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;MatrixLayout::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00335"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9">  335</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">GemmTileTraitsHelperB&lt;MatrixLayout::kRowMajor, GemmConfig_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9">Base</a>;</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;</div><div class="line"><a name="l00338"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a8a6cef5e733eab9c0ead20b1e345ad6f">  338</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerStsB = 16;</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt;</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;      <span class="comment">// The layout.</span></div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;      int8_t <span class="keyword">const</span>,</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH&gt;</a>,</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount</a>, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00353"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a125c9a43da3bcdc00d5194a1376f613c">  353</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a125c9a43da3bcdc00d5194a1376f613c">GlobalTileTraits</a>;</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d">  356</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb&lt;GlobalTileTraits, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d">GlobalLoadIterator</a>;</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt;</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;      int8_t,</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;      <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kH * 4&gt;,</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>,</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;      kScalarsPerStsB&gt;</div><div class="line"><a name="l00368"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a872dc2d0b8ed6c75c41d258a23183861">  368</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a872dc2d0b8ed6c75c41d258a23183861">SharedStoreTileTraits</a>;</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;};</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00374"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">  374</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a> {};</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00377"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">  377</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, Iterator_&gt; {</div><div class="line"><a name="l00378"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197">  378</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename Iterator_::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197">Transformer</a>;</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;};</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00382"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">  382</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, Iterator_&gt; {</div><div class="line"><a name="l00383"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f">  383</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">IgemmSwizzle&lt;Iterator_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f">Transformer</a>;</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;};</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;</div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00389"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">  389</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a> {};</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00392"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html">  392</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kColumnMajor, Iterator_&gt; {</div><div class="line"><a name="l00393"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49">  393</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Copy.html">Copy&lt;typename Iterator_::Fragment&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49">Transformer</a>;</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;};</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_&gt;</div><div class="line"><a name="l00397"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">  397</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt;<a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a>::kRowMajor, Iterator_&gt; {</div><div class="line"><a name="l00398"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a">  398</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">IgemmSwizzle&lt;Iterator_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a">Transformer</a>;</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;};</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;    <span class="keyword">typename</span> ScalarD_,</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;32, 8, 8&gt;</a>,</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;    <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00418"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">  418</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">IgemmTraitsHelper</a> {</div><div class="line"><a name="l00420"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">  420</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig&lt;OutputTile_, ScalarD_, ThreadGemmShape_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a>;</div><div class="line"><a name="l00422"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3">  422</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA&lt;kLayoutA_, GemmConfig, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3">GemmTileTraitsHelperA</a>;</div><div class="line"><a name="l00424"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685">  424</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB&lt;kLayoutB_, GemmConfig, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685">GemmTileTraitsHelperB</a>;</div><div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;</div><div class="line"><a name="l00427"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">  427</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmTileTraitsHelperA::GlobalLoadIterator <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a>;</div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt;GemmTileTraitsHelperA::kLayout,</div><div class="line"><a name="l00430"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">  430</a></span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a>&gt;::Transformer <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">GlobalTransformerA</a>;</div><div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits,</div><div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00436"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">  436</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">SharedStoreIteratorA</a>;</div><div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a>,</div><div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">SharedStoreIteratorA</a>,</div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">GlobalTransformerA</a>&gt;</div><div class="line"><a name="l00442"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845">  442</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845">GlobalLoadStreamA</a>;</div><div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;</div><div class="line"><a name="l00445"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">  445</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmTileTraitsHelperB::GlobalLoadIterator <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a>;</div><div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;  <span class="comment">// The default transformer for B.</span></div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt;GemmTileTraitsHelperB::kLayout,</div><div class="line"><a name="l00448"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">  448</a></span>&#160;                                     <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a>&gt;::Transformer <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">GlobalTransformerB</a>;</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits,</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00454"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">  454</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">SharedStoreIteratorB</a>;</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a>,</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">SharedStoreIteratorB</a>,</div><div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;                              <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">GlobalTransformerB</a>&gt;</div><div class="line"><a name="l00460"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8">  460</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8">GlobalLoadStreamB</a>;</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;</div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits,</div><div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00467"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">  467</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">SharedLoadIteratorA</a>;</div><div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorA, Copy&lt;typename SharedLoadIteratorA::Fragment&gt;</a> &gt;</div><div class="line"><a name="l00470"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476">  470</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476">SharedLoadStreamA</a>;</div><div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits,</div><div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00476"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">  476</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">SharedLoadIteratorB</a>;</div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream&lt;SharedLoadIteratorB, Copy&lt;typename SharedLoadIteratorB::Fragment&gt;</a> &gt;</div><div class="line"><a name="l00479"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d">  479</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d">SharedLoadStreamB</a>;</div><div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;</div><div class="line"><a name="l00482"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e">  482</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">GemmConfig::MultiplyAdd</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e">MultiplyAdd</a>;</div><div class="line"><a name="l00484"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">  484</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">ClearAccumulators&lt;typename MultiplyAdd::ScalarC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">ClearAccumulators</a>;</div><div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;</div><div class="line"><a name="l00487"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915">  487</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue&lt;IgemmEpilogueTraits&lt;GemmConfig, EpilogueFunctor_&gt;</a> &gt; <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915">Epilogue</a>;</div><div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;};</div><div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;</div><div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;</div><div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScalarD_&gt;</div><div class="line"><a name="l00493"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">  493</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">IgemmEpilogueScalar</a> {</div><div class="line"><a name="l00494"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317">  494</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">float</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317">Scalar</a>;</div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;};</div><div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;</div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00498"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html">  498</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">IgemmEpilogueScalar</a>&lt;int&gt; {</div><div class="line"><a name="l00499"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650">  499</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650">Scalar</a>;</div><div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;};</div><div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;</div><div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;</div><div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;32, 128, 128&gt;</a>,</div><div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;    <span class="keyword">typename</span> ScalarD_ = int,</div><div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;typename IgemmEpilogueScalar&lt;ScalarD_&gt;::Scalar</a>&gt;,</div><div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;32, 8, 8&gt;</a>,</div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;    <span class="keyword">typename</span> Helper_ = <a class="code" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">IgemmTraitsHelper</a>&lt;kLayoutA_,</div><div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;                                         kLayoutB_,</div><div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;                                         OutputTile_,</div><div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;                                         ScalarD_,</div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;                                         EpilogueFunctor_,</div><div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;                                         ThreadGemmShape_,</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;                                         Index_&gt; &gt;</div><div class="line"><a name="l00527"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IgemmTraits.html">  527</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IgemmTraits.html">IgemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt;</div><div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;                         typename Helper_::GemmConfig,</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;                         <span class="comment">// The stream to load A from global memory to shared memory.</span></div><div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;                         typename Helper_::GlobalLoadStreamA,</div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;                         <span class="comment">// The stream to load B from global memory to shared memory.</span></div><div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;                         typename Helper_::GlobalLoadStreamB,</div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;                         <span class="comment">// The stream to load A from shared memory.</span></div><div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;                         typename Helper_::SharedLoadStreamA,</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;                         <span class="comment">// The stream to load B from shared memory.</span></div><div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;                         typename Helper_::SharedLoadStreamB,</div><div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;                         typename Helper_::Epilogue,</div><div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;                         <span class="comment">// The block swizzle to reorganize the grid.</span></div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;                         IdentityBlockSwizzle,</div><div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;                         Index_,</div><div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;                         <span class="comment">// The tool used to clear accumulators.</span></div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;                         typename Helper_::ClearAccumulators&gt; {};</div><div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;</div><div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a7b25e0203997662a537b21674c3d0cd2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">cutlass::gemm::IgemmTraitsHelper::GlobalTransformerB</a></div><div class="ttdeci">IgemmTransformerB&lt; GemmTileTraitsHelperB::kLayout, GlobalLoadIteratorB &gt;::Transformer GlobalTransformerB</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:448</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_a4f7dfa33f6b6e52aac05ad5072710aa9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::Base</a></div><div class="ttdeci">GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt; Base</div><div class="ttdoc">The base config. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:335</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4_html_a8a4e3ce1174789e2b695bda7b863079f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f">cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">IgemmSwizzle&lt; Iterator_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:230</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:128</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_html_a72fe2fb9077d072f8266f07374624a1f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">cutlass::gemm::IgemmGlobalTileTraits::Threads</a></div><div class="ttdeci">Base::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a7f175193ac6bcdccba012f5d80324685"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685">cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperB</a></div><div class="ttdeci">IgemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig, Index_ &gt; GemmTileTraitsHelperB</div><div class="ttdoc">The GEMM config for B. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:424</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:80</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4_html_a8a4e3ce1174789e2b695bda7b863079f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f">cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">IgemmSwizzle&lt; Iterator_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:383</div></div>
 <div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_ac7ee33e683e48511a1a220df6c9d4758"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorA</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperA::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorA</div><div class="ttdoc">The iterator to load A from global memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:275</div></div>
 <div class="ttc" id="igemm__swizzle_8h_html"><div class="ttname"><a href="igemm__swizzle_8h.html">igemm_swizzle.h</a></div><div class="ttdoc">Transposes a fragment of data containing packed 8-bit integer elements. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4_html_a92320b7224a77a8af61e55beef30ad49"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">Copy&lt; typename Iterator_::Fragment &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:240</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4_html_a92320b7224a77a8af61e55beef30ad49"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">Copy&lt; typename Iterator_::Fragment &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:393</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_a11d02ea6e4ab68a0f4dff1eb8ecf4f9d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreWithSkewTileAbTraits&lt; int8_t, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kW *4 &gt;, typename GlobalTileTraits::Threads, kScalarsPerStsA, 16 &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for A^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:233</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_af6f6d293f058666f9f0da53f34c712aa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">IgemmGlobalTileTraits&lt; GemmOperand::kB, MatrixLayout::kColumnMajor, int8_t const, Shape&lt; 1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgB &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for B^T. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:289</div></div>
 <div class="ttc" id="gemm__traits_8h_html"><div class="ttname"><a href="gemm__traits_8h.html">gemm_traits.h</a></div><div class="ttdoc">Defines structural properties of complete GEMM computation. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a88e66ee760aea03687e7b3ccc6ea535b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b">cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamB</a></div><div class="ttdeci">GlobalLoadStream&lt; GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB &gt; GlobalLoadStreamB</div><div class="ttdoc">The stream to load B from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:303</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:133</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a4d6658f3a3b53760b10a3da9c807b81f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorB</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorB</div><div class="ttdoc">The iterator to store B to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:300</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a600bcc571ea5e04a98663c134d4664b9"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">cutlass::gemm::IgemmTraitsHelper::GlobalTransformerB</a></div><div class="ttdeci">IgemmTransformerB&lt; GemmTileTraitsHelperB::kLayout, GlobalLoadIteratorB &gt;::Transformer GlobalTransformerB</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:294</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_aed9492775f012986a7c158156bf4e01e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator</a></div><div class="ttdeci">IgemmGlobalIteratorAb&lt; GlobalTileTraits, Index_ &gt; GlobalLoadIterator</div><div class="ttdoc">The global load iterator. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:219</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:144</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogue_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">cutlass::gemm::IgemmEpilogue</a></div><div class="ttdef"><b>Definition:</b> igemm_epilogue.h:290</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_a24f38105e3c331c733cb672c3a9be588"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a24f38105e3c331c733cb672c3a9be588">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">IgemmContiguousGlobalTileTraits&lt; GemmOperand::kB, MatrixLayout::kRowMajor, int8_t const, Shape&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, 4 &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for B^T. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:203</div></div>
 <div class="ttc" id="structcutlass_1_1Copy_html"><div class="ttname"><a href="structcutlass_1_1Copy.html">cutlass::Copy</a></div><div class="ttdef"><b>Definition:</b> convert.h:69</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_affd04d88a0bbef13c54f10000a5dc15d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#affd04d88a0bbef13c54f10000a5dc15d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Base</a></div><div class="ttdeci">GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt; Base</div><div class="ttdoc">The base config. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:141</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_af10aebe7ca4e24cce435ac4cd60e7bac"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">cutlass::gemm::IgemmTraitsHelper::GemmConfig</a></div><div class="ttdeci">IgemmConfig&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt; GemmConfig</div><div class="ttdoc">The IGEMM config. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:267</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_a125c9a43da3bcdc00d5194a1376f613c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a125c9a43da3bcdc00d5194a1376f613c">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">IgemmGlobalTileTraits&lt; GemmOperand::kB, MatrixLayout::kRowMajor, int8_t const, Shape&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgB &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for B^T. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:353</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">cutlass::gemm::GemmSharedStoreTileAbTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:38</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_a29c3a5e4ea1fb6d0ea8b234849684daf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">int8_t MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:198</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_ad1a34cb78f88fe2fcbf13239e89f6137"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorB</a></div><div class="ttdeci">GemmTileTraitsHelperB::GlobalLoadIterator GlobalLoadIteratorB</div><div class="ttdoc">The iterator to load B from global memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:445</div></div>
 <div class="ttc" id="igemm__multiply__add_8h_html"><div class="ttname"><a href="igemm__multiply__add_8h.html">igemm_multiply_add.h</a></div><div class="ttdoc">Implements matrix multiply accumulate operation of 8-bit integer data using DP4A instruction. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:159</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_aca6118b5bbe6f667f05c53bd52543045"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aca6118b5bbe6f667f05c53bd52543045">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileAbTraits&lt; int8_t, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kH *4 &gt;, typename GlobalTileTraits::Threads, kScalarsPerStsB &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for B^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:215</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_tile.h:200</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a2953ae145fdb2eadf871aee8219e92d1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorB</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorB</div><div class="ttdoc">The iterator to store B to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:454</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_ad8f1b0fda40f1fb7dc598cc841f38afe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileBTraits&lt; int8_t const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 16, SharedStoreTileTraits::kSkew &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for B^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:326</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:163</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_aac06796d174a2d54103903e7dbe7b194"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::MultiplyAddScalar</a></div><div class="ttdeci">int8_t MultiplyAddScalar</div><div class="ttdoc">The scalar stored in shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:271</div></div>
 <div class="ttc" id="gemm__epilogue_8h_html"><div class="ttname"><a href="gemm__epilogue_8h.html">gemm_epilogue.h</a></div><div class="ttdoc">Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the comp...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:161</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:273</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a3a6d816852cca926afa08103f754477b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorB</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; typename GemmTileTraitsHelperB::GlobalTileTraits, Index_ &gt; GlobalLoadIteratorB</div><div class="ttdoc">The iterator to load B from global memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:291</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a738774d1eb79de7e29c372ddfd48258d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a738774d1eb79de7e29c372ddfd48258d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">IgemmContiguousGlobalTileTraits&lt; GemmOperand::kA, MatrixLayout::kColumnMajor, int8_t const, Shape&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, 4 &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for A^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:159</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4_html_a0983fd25494f6a7ed5af37a02e99f650"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650">cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;::Scalar</a></div><div class="ttdeci">int Scalar</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:342</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4_html_a9728f71c2e7a6a649bd28d8c11241b0a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">IgemmSwizzle&lt; Iterator_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:245</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html">cutlass::MatrixLayout</a></div><div class="ttdoc">Describes layouts of matrices. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:35</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a095505bfcea6791accd06bf4d37b9df8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8">cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperB</a></div><div class="ttdeci">IgemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig &gt; GemmTileTraitsHelperB</div><div class="ttdoc">The GEMM config for B. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:271</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_a4241971b8a82af2c1f5f930be3cdd5c4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">IgemmGlobalTileTraits&lt; GemmOperand::kA, MatrixLayout::kRowMajor, int8_t const, Shape&lt; 1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgA &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for A^T. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:216</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GlobalLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_global_stream.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:191</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a36c8b17c98723934d9d75228dd9c2915"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915">cutlass::gemm::IgemmTraitsHelper::Epilogue</a></div><div class="ttdeci">IgemmEpilogue&lt; IgemmEpilogueTraits&lt; GemmConfig, EpilogueFunctor_ &gt; &gt; Epilogue</div><div class="ttdoc">The epilogue. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:487</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4_html_a0983fd25494f6a7ed5af37a02e99f650"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650">cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;::Scalar</a></div><div class="ttdeci">int Scalar</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:499</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4_html_a9728f71c2e7a6a649bd28d8c11241b0a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a">cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">IgemmSwizzle&lt; Iterator_ &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:398</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html">cutlass::MatrixLayout</a></div><div class="ttdoc">Defines data layouts of various matrix formats usable by TensorRef and other classes. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:156</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_aa21c231aa56c9e5f2705cac62b17bbbe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aa21c231aa56c9e5f2705cac62b17bbbe">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileAbTraits&lt; int8_t, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kW *4 &gt;, typename GlobalTileTraits::Threads, kScalarsPerStsA &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for A^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:185</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmSwizzle_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmSwizzle.html">cutlass::gemm::IgemmSwizzle</a></div><div class="ttdef"><b>Definition:</b> igemm_swizzle.h:38</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:177</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:265</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:302</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a7fb1354154f303642da72e6fd157d846"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846">cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamA</a></div><div class="ttdeci">GlobalLoadStream&lt; GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA &gt; GlobalLoadStreamA</div><div class="ttdoc">The stream to load A from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:287</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a54e8ad5874306a3764951a9791f02c96"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96">cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamB</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorB, Copy&lt; typename SharedLoadIteratorB::Fragment &gt; &gt; SharedLoadStreamB</div><div class="ttdoc">The stream to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:322</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:259</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:418</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:399</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_af394532cb8e7b088f950122b42eaa2fb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">cutlass::gemm::IgemmTraitsHelper::GlobalTransformerA</a></div><div class="ttdeci">IgemmTransformerA&lt; GemmTileTraitsHelperA::kLayout, GlobalLoadIteratorA &gt;::Transformer GlobalTransformerA</div><div class="ttdoc">The default transformer for A. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:430</div></div>
 <div class="ttc" id="gemm__shared__tile_8h_html"><div class="ttname"><a href="gemm__shared__tile_8h.html">gemm_shared_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing tiles to and from shared memory. </div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_ab9e10d54c81a359db0eba58a11b9a0cf"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf">cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperA</a></div><div class="ttdeci">IgemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig &gt; GemmTileTraitsHelperA</div><div class="ttdoc">The GEMM config for A. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:269</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_ae59454c1b3862522c8ea293bacb194a8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8">cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamB</a></div><div class="ttdeci">GlobalLoadStream&lt; GemmOperand::kB, GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB &gt; GlobalLoadStreamB</div><div class="ttdoc">The stream to load B from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:460</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SharedLoadStream_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a></div><div class="ttdef"><b>Definition:</b> gemm_shared_stream.h:45</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:50</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_aa93043ac87d89ce7fb991c9195c3bf99"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorA</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorA</div><div class="ttdoc">The iterator to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:310</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a5645e18de29a84c9a9b3f3105966f0c5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">cutlass::gemm::IgemmTraitsHelper::ClearAccumulators</a></div><div class="ttdeci">ClearAccumulators&lt; typename MultiplyAdd::ScalarC &gt; ClearAccumulators</div><div class="ttdoc">The object to clear accumulators. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:327</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:79</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:137</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a48f6b161acb181aee1e5bdb3bc909b04"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorA</a></div><div class="ttdeci">GemmTileTraitsHelperA::GlobalLoadIterator GlobalLoadIteratorA</div><div class="ttdoc">The iterator to load A from global memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:427</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_config.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a3d2b39cacb975afbfeae9e368f0656ae"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorA</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorA</div><div class="ttdoc">The iterator to store A to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:436</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1IgemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmConfig.html">cutlass::gemm::IgemmConfig</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:57</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">cutlass::gemm::IgemmTransformerA</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:221</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html">cutlass::gemm::IgemmContiguousGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:50</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_html_ab1068ba72468f9ede1d05ba41ea31317"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317">cutlass::gemm::IgemmEpilogueScalar::Scalar</a></div><div class="ttdeci">float Scalar</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:337</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:428</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4_html_a0b53e18f109ac0fd116e0d01ed6ec197"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197">cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">Copy&lt; typename Iterator_::Fragment &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:225</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraits.html">cutlass::gemm::IgemmTraits</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:370</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_a66f11407e9f5bf0d6123c81dfee6b330"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a66f11407e9f5bf0d6123c81dfee6b330">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits</a></div><div class="ttdeci">IgemmGlobalTileTraits&lt; GemmOperand::kA, MatrixLayout::kColumnMajor, int8_t const, Shape&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW &gt;, Shape&lt; 1, ShapeCount&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgA &gt; GlobalTileTraits</div><div class="ttdoc">The traits class to build the iterator to load data from global memory for A^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:170</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb</a></div><div class="ttdef"><b>Definition:</b> igemm_global_tile.h:95</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerA_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">cutlass::gemm::IgemmTransformerA</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:374</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_html_ab1068ba72468f9ede1d05ba41ea31317"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317">cutlass::gemm::IgemmEpilogueScalar::Scalar</a></div><div class="ttdeci">float Scalar</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:494</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:349</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4_html_a0b53e18f109ac0fd116e0d01ed6ec197"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197">cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer</a></div><div class="ttdeci">Copy&lt; typename Iterator_::Fragment &gt; Transformer</div><div class="ttdef"><b>Definition:</b> igemm_traits.h:378</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraits.html">cutlass::gemm::IgemmTraits</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:527</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html_a7624585480f83a46725c92b5dee20ebc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a7624585480f83a46725c92b5dee20ebc">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileAbTraits&lt; int8_t, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kW *4 &gt;, typename GlobalTileTraits::Threads, kScalarsPerStsA &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for A^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:171</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:346</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:142</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a5e2ed697a9091a1ca8b19855b5a2c651"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651">cutlass::gemm::IgemmTraitsHelper::Epilogue</a></div><div class="ttdeci">IgemmEpilogue&lt; IgemmEpilogueTraits&lt; GemmConfig, EpilogueFunctor_ &gt; &gt; Epilogue</div><div class="ttdoc">The epilogue. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:330</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a23bb732b7237bcabe3667408f288844d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">cutlass::gemm::IgemmTraitsHelper::GlobalTransformerA</a></div><div class="ttdeci">IgemmTransformerA&lt; GemmTileTraitsHelperA::kLayout, GlobalLoadIteratorA &gt;::Transformer GlobalTransformerA</div><div class="ttdoc">The default transformer for A. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:278</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">cutlass::gemm::IgemmTransformerB</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:236</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_ae187303a8da63f36960687a4730f4c46"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorA</a></div><div class="ttdeci">TileStoreIterator&lt; typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedStoreIteratorA</div><div class="ttdoc">The iterator to store A to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:284</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:40</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a94111367763890341e88450f43b59312"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorB</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorB</div><div class="ttdoc">The iterator to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:476</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_a872dc2d0b8ed6c75c41d258a23183861"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a872dc2d0b8ed6c75c41d258a23183861">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreTileAbTraits&lt; int8_t, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kH *4 &gt;, typename GlobalTileTraits::Threads, kScalarsPerStsB &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for B^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:368</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_aae7128f5522383c857d2639031b64c30"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; VectorizedTile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:267</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:57</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_aa37f285c74bb63c8bb8cbfc767378c41"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::Scalar</a></div><div class="ttdeci">int8_t Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a52c2c7b45156e53d9bc66ed185fc3d71"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">cutlass::gemm::IgemmTraitsHelper::GemmConfig</a></div><div class="ttdeci">IgemmConfig&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt; GemmConfig</div><div class="ttdoc">The IGEMM config. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:420</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_acd7e5d5b940f410275ebbcd6c27e4327"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator</a></div><div class="ttdeci">IgemmGlobalIteratorAb&lt; GlobalTileTraits, Index_ &gt; GlobalLoadIterator</div><div class="ttdoc">The global load iterator. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:292</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_a4237c6c9e33397bc1633182e9c3b6504"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; GlobalTileTraits, Index_ &gt; GlobalLoadIterator</div><div class="ttdoc">The global load iterator. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:173</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_a57670718427808a241005f5e27acce5d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator</a></div><div class="ttdeci">GemmGlobalIteratorAb&lt; GlobalTileTraits, Index_ &gt; GlobalLoadIterator</div><div class="ttdoc">The global load iterator. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:356</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_ae84c7fd1567580dc3da15a520c47ff6e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e">cutlass::gemm::IgemmTraitsHelper::MultiplyAdd</a></div><div class="ttdeci">GemmConfig::MultiplyAdd MultiplyAdd</div><div class="ttdoc">The multiply-add functor. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:482</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTransformerB_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">cutlass::gemm::IgemmTransformerB</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:389</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:51</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a7e035ceab26dc904726ddbf14371f476"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476">cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamA</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorA, Copy&lt; typename SharedLoadIteratorA::Fragment &gt; &gt; SharedLoadStreamA</div><div class="ttdoc">The stream to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:470</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a2aceaceb30287e909c254f01f1716845"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845">cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamA</a></div><div class="ttdeci">GlobalLoadStream&lt; GemmOperand::kA, GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA &gt; GlobalLoadStreamA</div><div class="ttdoc">The stream to load A from global memory to shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:442</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_aee1dfb15e1b63f838a712af93777e5d3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3">cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperA</a></div><div class="ttdeci">IgemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig, Index_ &gt; GemmTileTraitsHelperA</div><div class="ttdoc">The GEMM config for A. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:422</div></div>
 <div class="ttc" id="gemm_8h_html"><div class="ttname"><a href="gemm_8h.html">gemm.h</a></div><div class="ttdoc">Implements a software-pipelined efficient GEMM. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html_a29bd05960cc541bb67098f5483c84cf6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">cutlass::gemm::GemmGlobalTileTraits::Threads</a></div><div class="ttdeci">ReshapeThreads&lt; Tile, Threads_ &gt;::Threads Threads</div><div class="ttdoc">The threads shape. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:87</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4_html_a53dd72126a43a1c5811ed92a2313d19d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::SharedLoadTileTraits</a></div><div class="ttdeci">GemmSharedLoadTileATraits&lt; int8_t const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 16, SharedStoreTileTraits::kSkew &gt; SharedLoadTileTraits</div><div class="ttdoc">The traits class to build the iterator to load from shared memory for A^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:253</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_aff287e2ca10a437a82736baab2d7c28d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d">cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamB</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorB, Copy&lt; typename SharedLoadIteratorB::Fragment &gt; &gt; SharedLoadStreamB</div><div class="ttdoc">The stream to load B from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:479</div></div>
 <div class="ttc" id="gemm__epilogue__traits_8h_html"><div class="ttname"><a href="gemm__epilogue__traits_8h.html">gemm_epilogue_traits.h</a></div><div class="ttdoc">Defines structural properties of the GEMM epilogue. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">cutlass::gemm::IgemmEpilogueScalar</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:336</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmEpilogueScalar_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html">cutlass::gemm::IgemmEpilogueScalar</a></div><div class="ttdef"><b>Definition:</b> igemm_traits.h:493</div></div>
 <div class="ttc" id="igemm__epilogue_8h_html"><div class="ttname"><a href="igemm__epilogue_8h.html">igemm_epilogue.h</a></div><div class="ttdoc">Defines the epilogue phase of the GEMM computation for IGEMM, supporting integer and floating-point o...</div></div>
 <div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4_html_aef7047c6a0d0c3db0bfb6bec08520aad"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aef7047c6a0d0c3db0bfb6bec08520aad">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Base</a></div><div class="ttdeci">GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt; Base</div><div class="ttdoc">The base config. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:185</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a70063eb7e19921efef55a6f32562773f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f">cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamA</a></div><div class="ttdeci">SharedLoadStream&lt; SharedLoadIteratorA, Copy&lt; typename SharedLoadIteratorA::Fragment &gt; &gt; SharedLoadStreamA</div><div class="ttdoc">The stream to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:313</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_a86ed2ebc5b6e4426ab35a1f30a3e47bb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits</a></div><div class="ttdeci">GemmSharedStoreWithSkewTileAbTraits&lt; int8_t, Shape&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kH *4 &gt;, typename GlobalTileTraits::Threads, kScalarsPerStsB, 16 &gt; SharedStoreTileTraits</div><div class="ttdoc">The traits class to build the iterator to store data to shared memory for B^N. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:306</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_a1ebf24984863d0422356031615b74c53"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::Scalar</a></div><div class="ttdeci">int8_t Scalar</div><div class="ttdoc">The input scalar. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:269</div></div>
 <div class="ttc" id="igemm__global__tile_8h_html"><div class="ttname"><a href="igemm__global__tile_8h.html">igemm_global_tile.h</a></div><div class="ttdoc">Implements tile iterators to partition the thread block tile into 2D subtiles and efficiently load ea...</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:620</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a87e34d56fa955670331749724bee9fd8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8">cutlass::gemm::IgemmTraitsHelper::MultiplyAdd</a></div><div class="ttdeci">GemmConfig::MultiplyAdd MultiplyAdd</div><div class="ttdoc">The multiply-add functor. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:325</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_a03d7378c46b517438fce25e0f1e4d98c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorA</a></div><div class="ttdeci">TileLoadIterator&lt; typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, IteratorAdvance::kH, MemorySpace::kShared &gt; SharedLoadIteratorA</div><div class="ttdoc">The iterator to load A from shared memory. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:467</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4_html_adbbf19c2f86c198bbe4cc596c63e65ae"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::Base</a></div><div class="ttdeci">GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt; Base</div><div class="ttdoc">The base config. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:152</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:836</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IgemmTraitsHelper_html_af6c45c949a8dee887924bba4de92e760"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">cutlass::gemm::IgemmTraitsHelper::ClearAccumulators</a></div><div class="ttdeci">ClearAccumulators&lt; typename MultiplyAdd::ScalarC &gt; ClearAccumulators</div><div class="ttdoc">The object to clear accumulators. </div><div class="ttdef"><b>Definition:</b> igemm_traits.h:484</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/index.html b/docs/index.html
index f2ba68993..6fab15e10 100644
--- a/docs/index.html
+++ b/docs/index.html
@@ -75,7 +75,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/iterator__access_8h.html b/docs/iterator__access_8h.html
index cc41cd5af..06fd90ad6 100644
--- a/docs/iterator__access_8h.html
+++ b/docs/iterator__access_8h.html
@@ -82,10 +82,9 @@ $(function() {
 
 <p>Free functions for loading and storing to implementations of tile iteartor concepts.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="fragment__load__store_8h_source.html">cutlass/fragment_load_store.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="load__store_8h_source.html">cutlass/load_store.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="predicate__vector_8h_source.html">cutlass/predicate_vector.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="load__store_8h_source.html">cutlass/load_store.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="predicate__vector_8h_source.html">cutlass/predicate_vector.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&quot;</code><br />
 </div>
 <p><a href="iterator__access_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -98,76 +97,15 @@ Namespaces</h2></td></tr>
 Functions</h2></td></tr>
 <tr class="memitem:a45dd7add04736cb5c3e69991d2f210be"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
 <tr class="memitem:a45dd7add04736cb5c3e69991d2f210be"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">cutlass::iterator_load</a> (InputIterator &amp;iterator, Fragment &amp;fragment)</td></tr>
-<tr class="memdesc:a45dd7add04736cb5c3e69991d2f210be"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">More...</a><br /></td></tr>
 <tr class="separator:a45dd7add04736cb5c3e69991d2f210be"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abcec976c59cab75ca55b338d125154a3"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:abcec976c59cab75ca55b338d125154a3"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">cutlass::shared_iterator_load</a> (InputIterator &amp;iterator, Fragment &amp;fragment)</td></tr>
-<tr class="memdesc:abcec976c59cab75ca55b338d125154a3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from a shared memory input iterator.  <a href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">More...</a><br /></td></tr>
-<tr class="separator:abcec976c59cab75ca55b338d125154a3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa9416026c6db08d92a34c2ac08fea8c3"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:aa9416026c6db08d92a34c2ac08fea8c3"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aa9416026c6db08d92a34c2ac08fea8c3">cutlass::shared_iterator_load</a> (InputIterator &amp;iterator, Fragment &amp;fragment, int d)</td></tr>
-<tr class="memdesc:aa9416026c6db08d92a34c2ac08fea8c3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from a shared memory input iterator.  <a href="namespacecutlass.html#aa9416026c6db08d92a34c2ac08fea8c3">More...</a><br /></td></tr>
-<tr class="separator:aa9416026c6db08d92a34c2ac08fea8c3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3965068d8a4fdfe5e05782930fb4fe6b"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a3965068d8a4fdfe5e05782930fb4fe6b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">cutlass::iterator_load_post_increment</a> (InputIterator &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</td></tr>
-<tr class="memdesc:a3965068d8a4fdfe5e05782930fb4fe6b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator, masked by a predicate iterator.  <a href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">More...</a><br /></td></tr>
-<tr class="separator:a3965068d8a4fdfe5e05782930fb4fe6b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af5abe551df7461eab66aa43907063d6b"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:af5abe551df7461eab66aa43907063d6b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#af5abe551df7461eab66aa43907063d6b">cutlass::iterator_load_post_increment</a> (InputIterator &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset=0)</td></tr>
-<tr class="memdesc:af5abe551df7461eab66aa43907063d6b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="namespacecutlass.html#af5abe551df7461eab66aa43907063d6b">More...</a><br /></td></tr>
-<tr class="separator:af5abe551df7461eab66aa43907063d6b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afb8e7a4e611e8b5ae7ca19d02f791d37"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:afb8e7a4e611e8b5ae7ca19d02f791d37"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#afb8e7a4e611e8b5ae7ca19d02f791d37">cutlass::iterator_load_post_increment</a> (InputIterator &amp;iterator, Fragment &amp;fragment, ConstPredicateAdapter pred_it)</td></tr>
-<tr class="memdesc:afb8e7a4e611e8b5ae7ca19d02f791d37"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="namespacecutlass.html#afb8e7a4e611e8b5ae7ca19d02f791d37">More...</a><br /></td></tr>
-<tr class="separator:afb8e7a4e611e8b5ae7ca19d02f791d37"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a50f08aa93d7fe6825599d17e3c977031"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a50f08aa93d7fe6825599d17e3c977031"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a50f08aa93d7fe6825599d17e3c977031">cutlass::iterator_load</a> (InputIterator const &amp;_iterator, Fragment &amp;fragment, typename InputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</td></tr>
-<tr class="separator:a50f08aa93d7fe6825599d17e3c977031"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aca491136bdb966638a7ae57c47f86d1e"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:aca491136bdb966638a7ae57c47f86d1e"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aca491136bdb966638a7ae57c47f86d1e">cutlass::iterator_load</a> (InputIterator const &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset=0)</td></tr>
-<tr class="memdesc:aca491136bdb966638a7ae57c47f86d1e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="namespacecutlass.html#aca491136bdb966638a7ae57c47f86d1e">More...</a><br /></td></tr>
-<tr class="separator:aca491136bdb966638a7ae57c47f86d1e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af25d56f7391322d9a3b9aa3c507f90dc"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:af25d56f7391322d9a3b9aa3c507f90dc"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#af25d56f7391322d9a3b9aa3c507f90dc">cutlass::iterator_load</a> (InputIterator const &amp;iterator, Fragment &amp;fragment, ConstPredicateAdapter pred_it)</td></tr>
-<tr class="memdesc:af25d56f7391322d9a3b9aa3c507f90dc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="namespacecutlass.html#af25d56f7391322d9a3b9aa3c507f90dc">More...</a><br /></td></tr>
-<tr class="separator:af25d56f7391322d9a3b9aa3c507f90dc"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a0cb5bdf7bef498705c51a9cdcbef71f9"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment &gt; </td></tr>
 <tr class="memitem:a0cb5bdf7bef498705c51a9cdcbef71f9"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">cutlass::iterator_store</a> (OutputIterator &amp;iterator, Fragment &amp;fragment)</td></tr>
-<tr class="memdesc:a0cb5bdf7bef498705c51a9cdcbef71f9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">More...</a><br /></td></tr>
 <tr class="separator:a0cb5bdf7bef498705c51a9cdcbef71f9"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a705c6d75513e112d2731d1c40f4cf109"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:a705c6d75513e112d2731d1c40f4cf109"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">cutlass::shared_iterator_store</a> (OutputIterator &amp;iterator, Fragment const &amp;fragment)</td></tr>
-<tr class="memdesc:a705c6d75513e112d2731d1c40f4cf109"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to a shared memory output iterator.  <a href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">More...</a><br /></td></tr>
-<tr class="separator:a705c6d75513e112d2731d1c40f4cf109"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5bf15cbf4cf4649d895fcbc2edf6a2de"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a5bf15cbf4cf4649d895fcbc2edf6a2de"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">cutlass::iterator_store_post_increment</a> (OutputIterator &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</td></tr>
-<tr class="memdesc:a5bf15cbf4cf4649d895fcbc2edf6a2de"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator, masked by a predicate iterator.  <a href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">More...</a><br /></td></tr>
-<tr class="separator:a5bf15cbf4cf4649d895fcbc2edf6a2de"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab8efb0edefca7a59acc5a14b7311130c"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:ab8efb0edefca7a59acc5a14b7311130c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#ab8efb0edefca7a59acc5a14b7311130c">cutlass::iterator_store_post_increment</a> (OutputIterator &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset=0)</td></tr>
-<tr class="memdesc:ab8efb0edefca7a59acc5a14b7311130c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="namespacecutlass.html#ab8efb0edefca7a59acc5a14b7311130c">More...</a><br /></td></tr>
-<tr class="separator:ab8efb0edefca7a59acc5a14b7311130c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a96fdb65e922f6a3d46aa5de9ea78d460"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a96fdb65e922f6a3d46aa5de9ea78d460"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a96fdb65e922f6a3d46aa5de9ea78d460">cutlass::iterator_store_post_increment</a> (OutputIterator &amp;iterator, Fragment const &amp;fragment, ConstPredicateAdapter pred_it)</td></tr>
-<tr class="memdesc:a96fdb65e922f6a3d46aa5de9ea78d460"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="namespacecutlass.html#a96fdb65e922f6a3d46aa5de9ea78d460">More...</a><br /></td></tr>
-<tr class="separator:a96fdb65e922f6a3d46aa5de9ea78d460"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a88dce4b124a294cc123f7cf5fd2d6472"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a88dce4b124a294cc123f7cf5fd2d6472"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a88dce4b124a294cc123f7cf5fd2d6472">cutlass::iterator_store</a> (OutputIterator const &amp;_iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</td></tr>
-<tr class="memdesc:a88dce4b124a294cc123f7cf5fd2d6472"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator, masked by a predicate iterator.  <a href="namespacecutlass.html#a88dce4b124a294cc123f7cf5fd2d6472">More...</a><br /></td></tr>
-<tr class="separator:a88dce4b124a294cc123f7cf5fd2d6472"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a410ed4d45ccafc2db842967740b6211f"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:a410ed4d45ccafc2db842967740b6211f"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a410ed4d45ccafc2db842967740b6211f">cutlass::iterator_store</a> (OutputIterator const &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset=0)</td></tr>
-<tr class="memdesc:a410ed4d45ccafc2db842967740b6211f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="namespacecutlass.html#a410ed4d45ccafc2db842967740b6211f">More...</a><br /></td></tr>
-<tr class="separator:a410ed4d45ccafc2db842967740b6211f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad804b804ac19360b293046f9cbfd8dd5"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:ad804b804ac19360b293046f9cbfd8dd5"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#ad804b804ac19360b293046f9cbfd8dd5">cutlass::iterator_store</a> (OutputIterator const &amp;iterator, Fragment const &amp;fragment, ConstPredicateAdapter pred_it)</td></tr>
-<tr class="memdesc:ad804b804ac19360b293046f9cbfd8dd5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="namespacecutlass.html#ad804b804ac19360b293046f9cbfd8dd5">More...</a><br /></td></tr>
-<tr class="separator:ad804b804ac19360b293046f9cbfd8dd5"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/iterator__access_8h_source.html b/docs/iterator__access_8h_source.html
index 11289a933..fac9ea1e5 100644
--- a/docs/iterator__access_8h_source.html
+++ b/docs/iterator__access_8h_source.html
@@ -76,30 +76,18 @@ $(function() {
 <div class="title">iterator_access.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="iterator__access_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment__load__store_8h.html">cutlass/fragment_load_store.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="load__store_8h.html">cutlass/load_store.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="predicate__vector_8h.html">cutlass/predicate_vector.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">   41</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a>(InputIterator &amp;iterator, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  <span class="keyword">typename</span> InputIterator::FragmentIterator frag_iterator(fragment);</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; InputIterator::Iterations::kD; ++d) {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; InputIterator::Iterations::kH; ++h) {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; InputIterator::Iterations::kW; ++w) {</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; InputIterator::Iterations::kC; ++c) {</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;          <span class="keywordflow">if</span> (iterator.valid(d, h, w, c)) {</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;            <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;                <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">ComputeOffsetFromStrides&lt;typename InputIterator::ImmediateOffsetStrides&gt;::get</a>(</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;                    0, 0, w, c);</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;            <a class="code" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">Load&lt;typename Fragment::Element, InputIterator::Tile::kC, InputIterator::kMemorySpace&gt;::</a></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<a class="code" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">                load</a>(reinterpret_cast&lt;typename InputIterator::AccessType &amp;&gt;(</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;                         frag_iterator.at(d, h, w, c)),</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;                     iterator.data(),</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;                     offset);</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;          }</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;        }</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;        <span class="keywordflow">if</span> (w &lt; InputIterator::Iterations::kW - 1) {</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;          iterator.inc_w();</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;        }</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      }</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;      <span class="keywordflow">if</span> (h &lt; InputIterator::Iterations::kH - 1) {</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;        iterator.inc_h();</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;      }</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    }</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    <span class="keywordflow">if</span> (d &lt; InputIterator::Iterations::kD - 1) {</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;      iterator.inc_d();</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    }</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  }</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  iterator.inc_advance();</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;}</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">   75</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">shared_iterator_load</a>(InputIterator &amp;iterator, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <span class="keyword">typename</span> InputIterator::FragmentIterator frag_iterator(fragment);</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; InputIterator::Iterations::kD; ++d) {</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; InputIterator::Iterations::kH; ++h) {</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; InputIterator::Iterations::kW; ++w) {</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; InputIterator::Iterations::kC; ++c) {</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;              <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">ComputeOffsetFromStrides&lt;typename InputIterator::ImmediateOffsetStrides&gt;::get</a>(</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;                  d, h, w, c);</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;          <a class="code" href="structcutlass_1_1FragmentLoad.html">FragmentLoad</a>&lt;InputIterator::kIteratorFragment,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;                       InputIterator::Tile::kC,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                       <span class="keyword">typename</span> InputIterator::Scalar,</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;                       InputIterator::kMemorySpace,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;                       <span class="keyword">typename</span> InputIterator::FragmentElement,</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;                       InputIterator::Tile::kW&gt;::load(frag_iterator.at(d, h, w, c),</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;                                                      iterator.data(),</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;                                                      offset);</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;        }</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;      }</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  }</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;}</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="namespacecutlass.html#aa9416026c6db08d92a34c2ac08fea8c3">  101</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">shared_iterator_load</a>(InputIterator &amp;iterator, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment, <span class="keywordtype">int</span> d) {</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <span class="keyword">typename</span> InputIterator::FragmentIterator frag_iterator(fragment);</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; InputIterator::Iterations::kH; ++h) {</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; InputIterator::Iterations::kW; ++w) {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; InputIterator::Iterations::kC; ++c) {</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;        <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;            <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">ComputeOffsetFromStrides&lt;typename InputIterator::ImmediateOffsetStrides&gt;::get</a>(</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;                d, h, w, c);</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;        <a class="code" href="structcutlass_1_1FragmentLoad.html">FragmentLoad</a>&lt;InputIterator::kIteratorFragment,</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;                     InputIterator::Tile::kC,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;                     <span class="keyword">typename</span> InputIterator::Scalar,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                     InputIterator::kMemorySpace,</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;                     <span class="keyword">typename</span> InputIterator::FragmentElement,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                     InputIterator::Tile::kW&gt;::load(frag_iterator.at(0, h, w, c),</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;                                                    iterator.data(),</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                                                    offset);</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;      }</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    }</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  }</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;}</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> ConstPredicateAdapter&gt;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">  125</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">iterator_load_post_increment</a>(InputIterator &amp;iterator,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;                                                      <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;                                                      <span class="keyword">typename</span> InputIterator::Index offset,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                                                      ConstPredicateAdapter predicate_adapter) {</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; InputIterator::Iterations::kD; ++d, iterator.inc_d()) {</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; InputIterator::Iterations::kH; ++h, iterator.inc_h()) {</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; InputIterator::Iterations::kW; ++w, iterator.inc_w()) {</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;        <span class="keywordflow">if</span> (predicate_adapter.at(d, h, w, 0)) {</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;          <span class="keywordtype">int</span> idx = InputIterator::Tile::kC *</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;                    (w + InputIterator::Iterations::kW * (h + InputIterator::Iterations::kH * d));</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;          <a class="code" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">Load&lt;typename Fragment::Element, InputIterator::Tile::kC, InputIterator::kMemorySpace&gt;::</a></div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<a class="code" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">              load</a>(reinterpret_cast&lt;typename InputIterator::AccessType &amp;&gt;(fragment[idx]),</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;                   iterator.data(),</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;                   offset);</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;        }</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      }</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    }</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  }</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;}</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="namespacecutlass.html#af5abe551df7461eab66aa43907063d6b">  148</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">iterator_load_post_increment</a>(InputIterator &amp;iterator,</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;                                                      <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment,</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;                                                      <span class="keyword">typename</span> InputIterator::Index offset = 0) {</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  <a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html">TrivialPredicateTileAdapter</a> pred;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <a class="code" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">iterator_load_post_increment</a>(iterator, fragment, offset, pred);</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;}</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> ConstPredicateAdapter&gt;</div><div class="line"><a name="l00157"></a><span class="lineno"><a class="line" href="namespacecutlass.html#afb8e7a4e611e8b5ae7ca19d02f791d37">  157</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">iterator_load_post_increment</a>(InputIterator &amp;iterator,</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;                                                      <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment,</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;                                                      ConstPredicateAdapter pred_it) {</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  <a class="code" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">iterator_load_post_increment</a>(iterator, fragment, 0, pred_it);</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;}</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> ConstPredicateAdapter&gt;</div><div class="line"><a name="l00164"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a50f08aa93d7fe6825599d17e3c977031">  164</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a>(InputIterator <span class="keyword">const</span> &amp;_iterator,</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;                                       <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment,</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;                                       <span class="keyword">typename</span> InputIterator::Index offset,</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;                                       ConstPredicateAdapter predicate_adapter) {</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  InputIterator iterator(_iterator);</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  <a class="code" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">iterator_load_post_increment</a>(iterator, fragment, offset, predicate_adapter);</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;}</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00174"></a><span class="lineno"><a class="line" href="namespacecutlass.html#aca491136bdb966638a7ae57c47f86d1e">  174</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a>(InputIterator <span class="keyword">const</span> &amp;iterator,</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;                                       <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment,</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;                                       <span class="keyword">typename</span> InputIterator::Index offset = 0) {</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;  <a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html">TrivialPredicateTileAdapter</a> pred;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  <a class="code" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a>(iterator, fragment, offset, pred);</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;}</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> ConstPredicateAdapter&gt;</div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="namespacecutlass.html#af25d56f7391322d9a3b9aa3c507f90dc">  183</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a>(InputIterator <span class="keyword">const</span> &amp;iterator,</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;                                       <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment,</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;                                       ConstPredicateAdapter pred_it) {</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;  <a class="code" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a>(iterator, fragment, 0, pred_it);</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;}</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00193"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">  193</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a>(OutputIterator &amp;iterator, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  <span class="keyword">typename</span> OutputIterator::FragmentIterator frag_iterator(fragment);</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; OutputIterator::Iterations::kD; ++d) {</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; OutputIterator::Iterations::kH; ++h) {</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; OutputIterator::Iterations::kW; ++w) {</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;        <span class="keywordflow">if</span> (iterator.valid(d, h, w, 0)) {</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;              <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">ComputeOffsetFromStrides&lt;typename OutputIterator::ImmediateOffsetStrides&gt;::get</a>(</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;                  d, h, w, 0);</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;          <a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Fragment::Element</a>,</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;                OutputIterator::Tile::kC,</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;                OutputIterator::kMemorySpace&gt;::</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;              store(reinterpret_cast&lt;typename OutputIterator::AccessType &amp;&gt;(</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;                        frag_iterator.at(d, h, w, 0)),</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;                    iterator.data(),</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;                    offset);</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;        }</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;        <span class="keywordflow">if</span> (w &lt; OutputIterator::Iterations::kW - 1) {</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;          iterator.inc_w();</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        }</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      }</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      <span class="keywordflow">if</span> (h &lt; OutputIterator::Iterations::kH - 1) {</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        iterator.inc_h();</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      }</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    }</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <span class="keywordflow">if</span> (d &lt; OutputIterator::Iterations::kD - 1) {</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      iterator.inc_d();</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    }</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  }</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;  iterator.inc_advance();</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;}</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00228"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">  228</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">shared_iterator_store</a>(OutputIterator &amp;iterator, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment) {</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;  <span class="keyword">typename</span> OutputIterator::FragmentConstIterator frag_iterator(fragment);</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; OutputIterator::Iterations::kD; ++d) {</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; OutputIterator::Iterations::kH; ++h) {</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; OutputIterator::Iterations::kW; ++w) {</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; OutputIterator::Iterations::kC; ++c) {</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;          <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;              <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">ComputeOffsetFromStrides&lt;typename OutputIterator::ImmediateOffsetStrides&gt;::get</a>(</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;                  d, h, w, c);</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;          <a class="code" href="structcutlass_1_1FragmentStore.html">FragmentStore</a>&lt;OutputIterator::kIteratorFragment,</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;                        OutputIterator::Tile::kC,</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;                        <span class="keyword">typename</span> OutputIterator::Scalar,</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;                        OutputIterator::kMemorySpace,</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;                        <span class="keyword">typename</span> OutputIterator::FragmentElement,</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;                        OutputIterator::Tile::kW&gt;::store(frag_iterator.at(d, h, w, c),</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;                                                         iterator.data(),</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;                                                         offset);</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;        }</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      }</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    }</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;  }</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;}</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIterator, <span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> ConstPredicateAdapter&gt;</div><div class="line"><a name="l00256"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">  256</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">iterator_store_post_increment</a>(OutputIterator &amp;iterator,</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;                                                       <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment,</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;                                                       <span class="keyword">typename</span> OutputIterator::Index offset,</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;                                                       ConstPredicateAdapter predicate_adapter) {</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; OutputIterator::Iterations::kD; ++d, iterator.inc_d()) {</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; OutputIterator::Iterations::kH; ++h, iterator.inc_h()) {</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; OutputIterator::Iterations::kW; ++w, iterator.inc_w()) {</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;        <span class="keywordflow">if</span> (predicate_adapter.at(d, h, w, 0)) {</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;          <span class="keywordtype">int</span> idx = OutputIterator::Tile::kC *</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;                    (w + OutputIterator::Iterations::kW * (h + OutputIterator::Iterations::kH * d));</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;          <a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;<span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Fragment::Element</a>,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;                OutputIterator::Tile::kC,</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;                OutputIterator::kMemorySpace&gt;::</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;              store(reinterpret_cast&lt;typename OutputIterator::AccessType const &amp;&gt;(fragment[idx]),</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;                    iterator.data(),</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;                    offset);</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;        }</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;      }</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    }</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;  }</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;}</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00281"></a><span class="lineno"><a class="line" href="namespacecutlass.html#ab8efb0edefca7a59acc5a14b7311130c">  281</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">iterator_store_post_increment</a>(OutputIterator &amp;iterator,</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;                                                       <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment,</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;                                                       <span class="keyword">typename</span> OutputIterator::Index offset = 0) {</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;  <a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html">TrivialPredicateTileAdapter</a> pred;</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;  <a class="code" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">iterator_store_post_increment</a>(iterator, fragment, offset, pred);</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;}</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIterator, <span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> ConstPredicateAdapter&gt;</div><div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a96fdb65e922f6a3d46aa5de9ea78d460">  290</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">iterator_store_post_increment</a>(OutputIterator &amp;iterator,</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;                                                       <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment,</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;                                                       ConstPredicateAdapter pred_it) {</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;  <a class="code" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">iterator_store_post_increment</a>(iterator, fragment, 0, pred_it);</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;}</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIterator, <span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> ConstPredicateAdapter&gt;</div><div class="line"><a name="l00298"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a88dce4b124a294cc123f7cf5fd2d6472">  298</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a>(OutputIterator <span class="keyword">const</span> &amp;_iterator,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;                                        <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment,</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;                                        <span class="keyword">typename</span> OutputIterator::Index offset,</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;                                        ConstPredicateAdapter predicate_adapter) {</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;  OutputIterator iterator(_iterator);</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;  <a class="code" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">iterator_store_post_increment</a>(iterator, fragment, offset, predicate_adapter);</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;}</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00308"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a410ed4d45ccafc2db842967740b6211f">  308</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a>(OutputIterator <span class="keyword">const</span> &amp;iterator,</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;                                        <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment,</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;                                        <span class="keyword">typename</span> OutputIterator::Index offset = 0) {</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;  <a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html">TrivialPredicateTileAdapter</a> pred;</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;  <a class="code" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a>(iterator, fragment, offset, pred);</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;}</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIterator, <span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> ConstPredicateAdapter&gt;</div><div class="line"><a name="l00317"></a><span class="lineno"><a class="line" href="namespacecutlass.html#ad804b804ac19360b293046f9cbfd8dd5">  317</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a>(OutputIterator <span class="keyword">const</span> &amp;iterator,</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                                        <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment,</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;                                        ConstPredicateAdapter pred_it) {</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;  <a class="code" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a>(iterator, fragment, 0, pred_it);</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;}</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1FragmentLoad_html"><div class="ttname"><a href="structcutlass_1_1FragmentLoad.html">cutlass::FragmentLoad</a></div><div class="ttdef"><b>Definition:</b> fragment_load_store.h:43</div></div>
-<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="namespacecutlass_html_abcec976c59cab75ca55b338d125154a3"><div class="ttname"><a href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">cutlass::shared_iterator_load</a></div><div class="ttdeci">CUTLASS_DEVICE void shared_iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment from a shared memory input iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:75</div></div>
-<div class="ttc" id="namespacecutlass_html_a5bf15cbf4cf4649d895fcbc2edf6a2de"><div class="ttname"><a href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">cutlass::iterator_store_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_store_post_increment(OutputIterator &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</div><div class="ttdoc">Stores a fragment to an output iterator, masked by a predicate iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:256</div></div>
-<div class="ttc" id="fragment__load__store_8h_html"><div class="ttname"><a href="fragment__load__store_8h.html">fragment_load_store.h</a></div><div class="ttdoc">Defines accessors for loading and storing fragments to memory efficiently. </div></div>
-<div class="ttc" id="structcutlass_1_1Load_html_ad033ebc1452d96b18913333bf7068140"><div class="ttname"><a href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">cutlass::Load::load</a></div><div class="ttdeci">static CUTLASS_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:59</div></div>
+<a href="iterator__access_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="load__store_8h.html">cutlass/load_store.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="predicate__vector_8h.html">cutlass/predicate_vector.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment">// Used by convolution</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">   39</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a>(InputIterator &amp;iterator, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;  <span class="keyword">typename</span> InputIterator::FragmentIterator frag_iterator(fragment);</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; InputIterator::Iterations::kD; ++d) {</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; InputIterator::Iterations::kH; ++h) {</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; InputIterator::Iterations::kW; ++w) {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; InputIterator::Iterations::kC; ++c) {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;          <span class="keywordflow">if</span> (iterator.valid(d, h, w, c)) {</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;            iterator.load_element(reinterpret_cast&lt;typename InputIterator::AccessType &amp;&gt;(</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;                                      frag_iterator.at(d, h, w, c)),</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;                                  d,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;                                  h,</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;                                  w,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;                                  c);</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;          }</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;        }</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;        <span class="keywordflow">if</span> (w &lt; InputIterator::Iterations::kW - 1) {</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;          iterator.inc_w();</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;        }</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;      }</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;      <span class="keywordflow">if</span> (h &lt; InputIterator::Iterations::kH - 1) {</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;        iterator.inc_h();</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;      }</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    }</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;    <span class="keywordflow">if</span> (d &lt; InputIterator::Iterations::kD - 1) {</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;      iterator.inc_d();</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    }</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  }</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  iterator.inc_advance();</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;}</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIterator, <span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">   70</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a>(OutputIterator &amp;iterator, <a class="code" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="keyword">typename</span> OutputIterator::FragmentIterator frag_iterator(fragment);</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; OutputIterator::Iterations::kD; ++d) {</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; OutputIterator::Iterations::kH; ++h) {</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; OutputIterator::Iterations::kW; ++w) {</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; OutputIterator::Iterations::kC; ++c) {</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;          <span class="keywordflow">if</span> (iterator.valid(d, h, w, c)) {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;            iterator.store_element(reinterpret_cast&lt;typename OutputIterator::AccessType &amp;&gt;(</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;                                       frag_iterator.at(d, h, w, c)),</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;                                   d,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                                   h,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;                                   w,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;                                   c);</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;          }</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;        }</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;        <span class="keywordflow">if</span> (w &lt; OutputIterator::Iterations::kW - 1) {</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;          iterator.inc_w();</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;        }</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      }</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;      <span class="keywordflow">if</span> (h &lt; OutputIterator::Iterations::kH - 1) {</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;        iterator.inc_h();</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;      }</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;    }</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    <span class="keywordflow">if</span> (d &lt; OutputIterator::Iterations::kD - 1) {</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;      iterator.inc_d();</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  }</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  iterator.inc_advance();</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;}</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1Store_html"><div class="ttname"><a href="structcutlass_1_1Store.html">cutlass::Store</a></div><div class="ttdef"><b>Definition:</b> load_store.h:131</div></div>
 <div class="ttc" id="predicate__vector_8h_html"><div class="ttname"><a href="predicate__vector_8h.html">predicate_vector.h</a></div><div class="ttdoc">Defines container classes and iterators for managing a statically sized vector of boolean predicates...</div></div>
-<div class="ttc" id="structcutlass_1_1ComputeOffsetFromStrides_html_af5e46bc2b325cb6952d2d68c8aca1409"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">cutlass::ComputeOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:211</div></div>
-<div class="ttc" id="namespacecutlass_html_a3965068d8a4fdfe5e05782930fb4fe6b"><div class="ttname"><a href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">cutlass::iterator_load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_load_post_increment(InputIterator &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</div><div class="ttdoc">Loads a fragment from an input iterator, masked by a predicate iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:125</div></div>
 <div class="ttc" id="load__store_8h_html"><div class="ttname"><a href="load__store_8h.html">load_store.h</a></div><div class="ttdoc">Defines abstractions for efficiently loading and storing vectors to memory. </div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="namespacecutlass_html_a705c6d75513e112d2731d1c40f4cf109"><div class="ttname"><a href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">cutlass::shared_iterator_store</a></div><div class="ttdeci">CUTLASS_DEVICE void shared_iterator_store(OutputIterator &amp;iterator, Fragment const &amp;fragment)</div><div class="ttdoc">Stores a fragment to a shared memory output iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:228</div></div>
-<div class="ttc" id="structcutlass_1_1Fragment_html_a9c67fa5bbd0b8b49bd6ec002dee3cbab"><div class="ttname"><a href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">cutlass::Fragment::Element</a></div><div class="ttdeci">Element_ Element</div><div class="ttdoc">The element. </div><div class="ttdef"><b>Definition:</b> fragment.h:108</div></div>
-<div class="ttc" id="structcutlass_1_1TrivialPredicateTileAdapter_html"><div class="ttname"><a href="structcutlass_1_1TrivialPredicateTileAdapter.html">cutlass::TrivialPredicateTileAdapter</a></div><div class="ttdoc">Always returns true predicate. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:426</div></div>
-<div class="ttc" id="namespacecutlass_html_a0cb5bdf7bef498705c51a9cdcbef71f9"><div class="ttname"><a href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">cutlass::iterator_store</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_store(OutputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdoc">Stores a fragment to an output iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:193</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentStore_html"><div class="ttname"><a href="structcutlass_1_1FragmentStore.html">cutlass::FragmentStore</a></div><div class="ttdef"><b>Definition:</b> fragment_load_store.h:91</div></div>
-<div class="ttc" id="namespacecutlass_html_a45dd7add04736cb5c3e69991d2f210be"><div class="ttname"><a href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">cutlass::iterator_load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment from an input iterator. </div><div class="ttdef"><b>Definition:</b> iterator_access.h:41</div></div>
+<div class="ttc" id="namespacecutlass_html_a0cb5bdf7bef498705c51a9cdcbef71f9"><div class="ttname"><a href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">cutlass::iterator_store</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_store(OutputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdef"><b>Definition:</b> iterator_access.h:70</div></div>
+<div class="ttc" id="namespacecutlass_html_a45dd7add04736cb5c3e69991d2f210be"><div class="ttname"><a href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">cutlass::iterator_load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)</div><div class="ttdef"><b>Definition:</b> iterator_access.h:39</div></div>
 <div class="ttc" id="shape_8h_html"><div class="ttname"><a href="shape_8h.html">shape.h</a></div><div class="ttdoc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects. </div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/kernel__launch_8h.html b/docs/kernel__launch_8h.html
new file mode 100644
index 000000000..192d541b3
--- /dev/null
+++ b/docs/kernel__launch_8h.html
@@ -0,0 +1,108 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: kernel_launch.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">kernel_launch.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Defines structures and helpers to launch CUDA kernels within CUTLASS.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+</div>
+<p><a href="kernel__launch_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Structure containing the basic launch configuration of a CUDA kernel.  <a href="structcutlass_1_1KernelLaunchConfiguration.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/kernel__launch_8h_source.html b/docs/kernel__launch_8h_source.html
new file mode 100644
index 000000000..52c7a5e07
--- /dev/null
+++ b/docs/kernel__launch_8h_source.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: kernel_launch.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">kernel_launch.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="kernel__launch_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *   * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *   * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *     provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *   * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *     permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1KernelLaunchConfiguration.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html">KernelLaunchConfiguration</a> {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">   41</a></span>&#160;  dim3 <a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">grid</a>;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">   44</a></span>&#160;  dim3 <a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">block</a>;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">   47</a></span>&#160;  <span class="keywordtype">size_t</span> <a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">dynamic_smem</a>;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">   55</a></span>&#160;  <a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">KernelLaunchConfiguration</a>(</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    dim3 _grid = dim3(1,1,1),</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    dim3 _block = dim3(1,1,1),</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    <span class="keywordtype">size_t</span> _dynamic_smem = 0</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  ):</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    <a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">grid</a>(_grid),</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">block</a>(_block),</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;    <a class="code" href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">dynamic_smem</a>(_dynamic_smem) { }</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;};</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1KernelLaunchConfiguration_html_a726db328ccc8f5e186ff8e7cef568eaa"><div class="ttname"><a href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">cutlass::KernelLaunchConfiguration::KernelLaunchConfiguration</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE KernelLaunchConfiguration(dim3 _grid=dim3(1, 1, 1), dim3 _block=dim3(1, 1, 1), size_t _dynamic_smem=0)</div><div class="ttdoc">Constructs a KernellaunchConfiguration object. </div><div class="ttdef"><b>Definition:</b> kernel_launch.h:55</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1KernelLaunchConfiguration_html"><div class="ttname"><a href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></div><div class="ttdoc">Structure containing the basic launch configuration of a CUDA kernel. </div><div class="ttdef"><b>Definition:</b> kernel_launch.h:38</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1KernelLaunchConfiguration_html_a4a6ac693d4284c84301279219623e2bc"><div class="ttname"><a href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">cutlass::KernelLaunchConfiguration::dynamic_smem</a></div><div class="ttdeci">size_t dynamic_smem</div><div class="ttdoc">Bytes of dynamically allocated SMEM in addition to static SMEM. </div><div class="ttdef"><b>Definition:</b> kernel_launch.h:47</div></div>
+<div class="ttc" id="structcutlass_1_1KernelLaunchConfiguration_html_a09535026bf08f94c6940c358d95d1edd"><div class="ttname"><a href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">cutlass::KernelLaunchConfiguration::block</a></div><div class="ttdeci">dim3 block</div><div class="ttdoc">CUDA threablock dimensions. </div><div class="ttdef"><b>Definition:</b> kernel_launch.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1KernelLaunchConfiguration_html_ab86ba1464dd9c6cd15ae0de4a552201b"><div class="ttname"><a href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">cutlass::KernelLaunchConfiguration::grid</a></div><div class="ttdeci">dim3 grid</div><div class="ttdoc">CUDA grid dimensions. </div><div class="ttdef"><b>Definition:</b> kernel_launch.h:41</div></div>
+<div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/linear__scaling_8h.html b/docs/linear__scaling_8h.html
index 060be3aa3..132c09d48 100644
--- a/docs/linear__scaling_8h.html
+++ b/docs/linear__scaling_8h.html
@@ -74,7 +74,8 @@ $(function() {
 <div class="header">
   <div class="summary">
 <a href="#nested-classes">Classes</a> &#124;
-<a href="#namespaces">Namespaces</a>  </div>
+<a href="#namespaces">Namespaces</a> &#124;
+<a href="#func-members">Functions</a>  </div>
   <div class="headertitle">
 <div class="title">linear_scaling.h File Reference</div>  </div>
 </div><!--header-->
@@ -82,7 +83,7 @@ $(function() {
 
 <p>Implements the BLAS linear scaling function alpha*AB + beta*C.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="fragment__multiply__add_8h_source.html">cutlass/fragment_multiply_add.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="fragment__multiply__add_8h_source.html">cutlass/fragment_multiply_add.h</a>&quot;</code><br />
 </div>
 <p><a href="linear__scaling_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -101,11 +102,19 @@ Namespaces</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
+Functions</h2></td></tr>
+<tr class="memitem:a3e30ae89e6f7501725028144cd2d88cb"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a3e30ae89e6f7501725028144cd2d88cb"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">cutlass::gemm::is_zero</a> (T x)</td></tr>
+<tr class="separator:a3e30ae89e6f7501725028144cd2d88cb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4a12fcfae60f26efa47bf0a79483d8ac"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a4a12fcfae60f26efa47bf0a79483d8ac">cutlass::gemm::is_zero</a> (half x)</td></tr>
+<tr class="separator:a4a12fcfae60f26efa47bf0a79483d8ac"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/linear__scaling_8h_source.html b/docs/linear__scaling_8h_source.html
index d9817ed09..b00e58598 100644
--- a/docs/linear__scaling_8h_source.html
+++ b/docs/linear__scaling_8h_source.html
@@ -76,25 +76,33 @@ $(function() {
 <div class="title">linear_scaling.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="linear__scaling_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;</div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment__multiply__add_8h.html">cutlass/fragment_multiply_add.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt; &gt;</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html">   40</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a> {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  <span class="comment">// The scalar.</span></div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">   42</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a>;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  <span class="comment">// The adapater.</span></div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">   44</a></span>&#160;  <span class="keyword">typedef</span> FragmentMultiplyAdd_ <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a>;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">   47</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> {</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">   49</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">alpha</a>, <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a>;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmDesc_&gt;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">   53</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">initialize</a>(GemmDesc_ <span class="keyword">const</span>&amp; desc) {</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">alpha</a> = desc.alpha;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a> = desc.beta;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    }</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  };</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#a34df6970f033b3090ad8f4d40063b1b2">   61</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a34df6970f033b3090ad8f4d40063b1b2">LinearScaling</a>(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; params) : <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">alpha</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">alpha</a>), <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">beta</a>(params.<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">beta</a>) {}</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00065"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#a2e0d140aed388d2457dfb24d28fcd08a">   65</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a2e0d140aed388d2457dfb24d28fcd08a">evaluate</a>(Fragment_ <span class="keyword">const</span>&amp; accum, Fragment_&amp; output) {</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a> mad;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    mad.multiply(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">alpha</a>, accum, output);</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  }</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment_&gt;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#a47a53e5b67b2207fb3ba38a8b9cef448">   72</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a47a53e5b67b2207fb3ba38a8b9cef448">evaluate</a>(Fragment_ <span class="keyword">const</span>&amp; accum, Fragment_ <span class="keyword">const</span>&amp; old, Fragment_&amp; output) {</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a> mad;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    Fragment_ tmp;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    mad.multiply(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">beta</a>, old, tmp);</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    mad.multiply_add(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">alpha</a>, accum, tmp, output);</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  }</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">   80</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">alpha</a>, <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">beta</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;};</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html_a3248d6b3d9bcc59365d582b879292a70"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">cutlass::gemm::LinearScaling::Params::alpha</a></div><div class="ttdeci">Scalar alpha</div><div class="ttdoc">The alpha/beta scaling params. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:49</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_ab9c51c8b1f06e935a353ac5b1c22cee6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">cutlass::gemm::LinearScaling::alpha</a></div><div class="ttdeci">Scalar alpha</div><div class="ttdoc">The alpha/beta scaling factors. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:80</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a34df6970f033b3090ad8f4d40063b1b2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a34df6970f033b3090ad8f4d40063b1b2">cutlass::gemm::LinearScaling::LinearScaling</a></div><div class="ttdeci">CUTLASS_DEVICE LinearScaling(Params const &amp;params)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:61</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a47a53e5b67b2207fb3ba38a8b9cef448"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a47a53e5b67b2207fb3ba38a8b9cef448">cutlass::gemm::LinearScaling::evaluate</a></div><div class="ttdeci">CUTLASS_DEVICE void evaluate(Fragment_ const &amp;accum, Fragment_ const &amp;old, Fragment_ &amp;output)</div><div class="ttdoc">Evaluate the functor. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:72</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html_a0e455ad2e4eba67259867f9123ca817b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">cutlass::gemm::LinearScaling::Params::beta</a></div><div class="ttdeci">Scalar beta</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:49</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html_a4946e45e10661307f562b27bad5cb72d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">cutlass::gemm::LinearScaling::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const &amp;desc)</div><div class="ttdoc">Initialize the parameters. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:53</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a8af4e58c4988838f2dd0a2172c47e12e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">cutlass::gemm::LinearScaling::beta</a></div><div class="ttdeci">Scalar beta</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:80</div></div>
+<a href="linear__scaling_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;</div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment__multiply__add_8h.html">cutlass/fragment_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">   39</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">is_zero</a>(T x) {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;  <span class="keywordflow">return</span> x == T(0);</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;}</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)</span></div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html#a4a12fcfae60f26efa47bf0a79483d8ac">   44</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">is_zero</a>(half x) { <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span>int16_t&amp;<span class="keyword">&gt;</span>(x) == int16_t(0); }</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt; &gt;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html">   51</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a> {</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="comment">// The scalar.</span></div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">   53</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a>;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  <span class="comment">// The accumulator Type</span></div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">   55</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> FragmentMultiplyAdd_::ScalarAccum <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a>;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="comment">// The adapater.</span></div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">   57</a></span>&#160;  <span class="keyword">typedef</span> FragmentMultiplyAdd_ <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a>;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">   60</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> {</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">   62</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">alpha</a>, <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a>;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="comment">// Methods</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="comment">// Constructor</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ae515cd98a75ff3eafffcc69692d6301a">   70</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ae515cd98a75ff3eafffcc69692d6301a">Params</a>(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> _alpha = 0, <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> _beta = 0) : <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">alpha</a>(_alpha), <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a>(_beta) {}</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ad4089906220d4656ba075fb9afd1012c">   73</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ad4089906220d4656ba075fb9afd1012c">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> _alpha, <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> _beta) {</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">alpha</a> = _alpha;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a> = _beta;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    }</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmDesc_&gt;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">   81</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">initialize</a>(GemmDesc_ <span class="keyword">const</span>&amp; desc) {</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">alpha</a> = desc.alpha;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a> = desc.beta;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    }</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  };</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">   92</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a>;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe">   99</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe">LinearScaling</a>() { }</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">  102</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">LinearScaling</a>(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; _params) : <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a>(_params) {}</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54">  108</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54">source_required</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keywordflow">return</span> !<a class="code" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">is_zero</a>(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a>);</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  }</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> FragmentA_, <span class="keyword">typename</span> FragmentB_&gt;</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">  114</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">evaluate</a>(FragmentA_ <span class="keyword">const</span>&amp; accum, FragmentB_&amp; output) {</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a> mad;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    mad.multiply(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">alpha</a>, accum, output);</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  }</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScalarAccum, <span class="keyword">typename</span> ScalarOutput, <span class="keywordtype">int</span> size&gt;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02">  122</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02">evaluate</a>(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> <span class="keyword">const</span> *accum, ScalarOutput *output) {</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarAccum, size&gt;</a> FragAccum;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarOutput, size&gt;</a> FragOutput;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="preprocessor">#pragma unroll</span></div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; size; i++) {</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;      FragAccum[i] = accum[i];</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;      FragOutput[i] = output[i];</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    }</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">evaluate</a>(FragAccum, FragOutput);</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="preprocessor">#pragma unroll</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; size; i++) {</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      output[i] = FragOutput[i];</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    }</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> FragmentA_, <span class="keyword">typename</span> FragmentB_&gt;</div><div class="line"><a name="l00139"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1">  139</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1">evaluate</a>(FragmentA_ <span class="keyword">const</span>&amp; accum, FragmentB_ <span class="keyword">const</span>&amp; old, FragmentB_&amp; output) {</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a> mad;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;    FragmentB_ tmp;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    mad.multiply(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a>, old, tmp);</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    mad.multiply_add(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">alpha</a>, accum, tmp, output);</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  }</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScalarAccum, <span class="keyword">typename</span> ScalarOutput, <span class="keywordtype">int</span> size&gt;</div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947">  148</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947">evaluate</a>(<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> <span class="keyword">const</span> *accum, ScalarOutput <span class="keyword">const</span> *old, ScalarOutput *output) {</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarAccum, size&gt;</a> FragAccum;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarOutput, size&gt;</a> FragOutput;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarOutput, size&gt;</a> FragOld;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;<span class="preprocessor">#pragma unroll</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; size; i++) {</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      FragAccum[i] = accum[i];</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      FragOutput[i] = output[i];</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      FragOld[i] = old[i];</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    }</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">evaluate</a>(FragAccum, FragOld, FragOutput);</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;<span class="preprocessor">#pragma unroll</span></div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; size; i++) {</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      output[i] = FragOutput[i];</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    }</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  }</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;};</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html_ad4089906220d4656ba075fb9afd1012c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ad4089906220d4656ba075fb9afd1012c">cutlass::gemm::LinearScaling::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar _alpha, Scalar _beta)</div><div class="ttdoc">Initialize the parameters. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:73</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html_a3248d6b3d9bcc59365d582b879292a70"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">cutlass::gemm::LinearScaling::Params::alpha</a></div><div class="ttdeci">Scalar alpha</div><div class="ttdoc">The alpha/beta scaling params. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_aae313f3e691334f80d1316ac4cd30d54"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54">cutlass::gemm::LinearScaling::source_required</a></div><div class="ttdeci">CUTLASS_DEVICE bool source_required() const</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:108</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a0159214b89d7648f1e8f3b5dd228df02"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02">cutlass::gemm::LinearScaling::evaluate</a></div><div class="ttdeci">CUTLASS_DEVICE void evaluate(ScalarAccum const *accum, ScalarOutput *output)</div><div class="ttdoc">Evaluate the functor, without using fragment in the API. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:122</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a429d78c47d55929903ee02733ad881c1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1">cutlass::gemm::LinearScaling::evaluate</a></div><div class="ttdeci">CUTLASS_DEVICE void evaluate(FragmentA_ const &amp;accum, FragmentB_ const &amp;old, FragmentB_ &amp;output)</div><div class="ttdoc">Evaluate the functor. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:139</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a303c8dd75a31c01aa4e1de5097aca8eb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">cutlass::gemm::LinearScaling::evaluate</a></div><div class="ttdeci">CUTLASS_DEVICE void evaluate(FragmentA_ const &amp;accum, FragmentB_ &amp;output)</div><div class="ttdoc">Evaluate the functor. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:114</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html_a0e455ad2e4eba67259867f9123ca817b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">cutlass::gemm::LinearScaling::Params::beta</a></div><div class="ttdeci">Scalar beta</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a7bbf90dc0938698a0fa22468f9df315d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">cutlass::gemm::LinearScaling::params</a></div><div class="ttdeci">Params params</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:92</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_ae80882255b71c1ec94c6caeded2d0309"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">cutlass::gemm::LinearScaling::ScalarAccum</a></div><div class="ttdeci">FragmentMultiplyAdd_::ScalarAccum ScalarAccum</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:55</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html_a4946e45e10661307f562b27bad5cb72d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">cutlass::gemm::LinearScaling::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const &amp;desc)</div><div class="ttdoc">Initialize the parameters. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:81</div></div>
 <div class="ttc" id="fragment__multiply__add_8h_html"><div class="ttname"><a href="fragment__multiply__add_8h.html">fragment_multiply_add.h</a></div><div class="ttdoc">Defines multiply-add operations on fragments within a thread. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_aa697d4eaced1ef08247aeb1fcc0f0ea8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">cutlass::gemm::LinearScaling::FragmentMultiplyAdd</a></div><div class="ttdeci">FragmentMultiplyAdd_ FragmentMultiplyAdd</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_aa697d4eaced1ef08247aeb1fcc0f0ea8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">cutlass::gemm::LinearScaling::FragmentMultiplyAdd</a></div><div class="ttdeci">FragmentMultiplyAdd_ FragmentMultiplyAdd</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:57</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_ae5ed200fe8c45b6478d3893e67da0ebe"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe">cutlass::gemm::LinearScaling::LinearScaling</a></div><div class="ttdeci">CUTLASS_DEVICE LinearScaling()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:99</div></div>
+<div class="ttc" id="namespacecutlass_1_1gemm_html_a3e30ae89e6f7501725028144cd2d88cb"><div class="ttname"><a href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">cutlass::gemm::is_zero</a></div><div class="ttdeci">CUTLASS_DEVICE bool is_zero(T x)</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:39</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a2e0d140aed388d2457dfb24d28fcd08a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a2e0d140aed388d2457dfb24d28fcd08a">cutlass::gemm::LinearScaling::evaluate</a></div><div class="ttdeci">CUTLASS_DEVICE void evaluate(Fragment_ const &amp;accum, Fragment_ &amp;output)</div><div class="ttdoc">Evaluate the functor. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:65</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">cutlass::gemm::LinearScaling::Params</a></div><div class="ttdoc">The parameters. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:47</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:40</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_ae6b053ca059932f7c0d3c99243854183"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">cutlass::gemm::LinearScaling::Scalar</a></div><div class="ttdeci">Scalar_ Scalar</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a46965529bd1384465c6f2b8c2a244889"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">cutlass::gemm::LinearScaling::LinearScaling</a></div><div class="ttdeci">CUTLASS_DEVICE LinearScaling(Params const &amp;_params)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:102</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">cutlass::gemm::LinearScaling::Params</a></div><div class="ttdoc">The parameters. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:51</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_ae6b053ca059932f7c0d3c99243854183"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">cutlass::gemm::LinearScaling::Scalar</a></div><div class="ttdeci">Scalar_ Scalar</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:53</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_aad0708f7681b16e6d6b4ca8d1f59a947"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947">cutlass::gemm::LinearScaling::evaluate</a></div><div class="ttdeci">CUTLASS_DEVICE void evaluate(ScalarAccum const *accum, ScalarOutput const *old, ScalarOutput *output)</div><div class="ttdoc">Evaluate the functor, without using fragment in the API. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:148</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_1_1Params_html_ae515cd98a75ff3eafffcc69692d6301a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ae515cd98a75ff3eafffcc69692d6301a">cutlass::gemm::LinearScaling::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Scalar _alpha=0, Scalar _beta=0)</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:70</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/linear__scaling__device__ptr_8h.html b/docs/linear__scaling__device__ptr_8h.html
new file mode 100644
index 000000000..ad2add1db
--- /dev/null
+++ b/docs/linear__scaling__device__ptr_8h.html
@@ -0,0 +1,114 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: linear_scaling_device_ptr.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">linear_scaling_device_ptr.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Implements the BLAS linear scaling function alpha*AB + beta*C.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="scalar__or__pointer_8h_source.html">cutlass/gemm/scalar_or_pointer.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="linear__scaling_8h_source.html">cutlass/gemm/linear_scaling.h</a>&quot;</code><br />
+</div>
+<p><a href="linear__scaling__device__ptr_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The parameters.  <a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/linear__scaling__device__ptr_8h_source.html b/docs/linear__scaling__device__ptr_8h_source.html
new file mode 100644
index 000000000..2fae588f7
--- /dev/null
+++ b/docs/linear__scaling__device__ptr_8h_source.html
@@ -0,0 +1,109 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: linear_scaling_device_ptr.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">linear_scaling_device_ptr.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="linear__scaling__device__ptr_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="scalar__or__pointer_8h.html">cutlass/gemm/scalar_or_pointer.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="linear__scaling_8h.html">cutlass/gemm/linear_scaling.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt; &gt;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">   46</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">LinearScalingDevicePtr</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a>&lt;Scalar_, FragmentMultiplyAdd_&gt; {</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85">   49</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;Scalar_, FragmentMultiplyAdd_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85">Base</a>;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="comment">// The scalar.</span></div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">   52</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Base::Scalar</a> <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a>;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">   55</a></span>&#160;  <span class="keyword">class </span><a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">Params</a>  {</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="keyword">private</span>:</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">detail::ScalarOrPointer&lt;Scalar&gt;</a> alpha_;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">detail::ScalarOrPointer&lt;Scalar&gt;</a> beta_;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="keyword">public</span>:</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="comment">// Methods</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="comment">// Constructor</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae28323819fc8950bc0fee3a34b2184ff">   70</a></span>&#160;    <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae28323819fc8950bc0fee3a34b2184ff">Params</a>() {}</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    <span class="comment">// Constructor</span></div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a26b04702140a550f3ab598132a74cd93">   74</a></span>&#160;    <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a26b04702140a550f3ab598132a74cd93">Params</a>(</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>,</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a></div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    ):</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;      alpha_(<a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>),</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;      beta_(<a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>) {}</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <span class="comment">// Constructor</span></div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a38aa3e6beb09c7c4bea952094a2ea682">   83</a></span>&#160;    <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a38aa3e6beb09c7c4bea952094a2ea682">Params</a>(</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <span class="keyword">const</span> *alpha_ptr,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <span class="keyword">const</span> *beta_ptr</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    ):</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      alpha_(alpha_ptr),</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      beta_(alpha_ptr) {}</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ad1b2291b898091ee1966b73bd1ad56fa">   91</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ad1b2291b898091ee1966b73bd1ad56fa">initialize</a>(</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>,</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>) {</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;      alpha_ = <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;      beta_ = <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    }</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ab4dbffb32daffb64d2033e3091963507">  102</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ab4dbffb32daffb64d2033e3091963507">initialize</a>(</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <span class="keyword">const</span> *<a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <span class="keyword">const</span> *<a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>) {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;      alpha_ = <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      beta_= <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    }</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmDesc_&gt;</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a491496037bf6613e128e667f87fda696">  114</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a491496037bf6613e128e667f87fda696">initialize</a>(GemmDesc_ <span class="keyword">const</span>&amp; desc) {</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;      alpha_ = desc.alpha;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;      beta_ = desc.beta;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    }</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">  124</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;      <span class="keywordflow">return</span> alpha_;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    }</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00130"></a><span class="lineno"><a class="line" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">  130</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> <a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="keywordflow">return</span> beta_;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    }</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  };</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a9dcb15bbcf3785280fd5cea0e0da5602">  140</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a9dcb15bbcf3785280fd5cea0e0da5602">LinearScalingDevicePtr</a>(<a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; _params) {</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;    this-&gt;<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a>.<a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a> = _params.<a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">alpha</a>();</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    this-&gt;<a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a>.<a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a> = _params.<a class="code" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">beta</a>();</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  }</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;};</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;} <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params_html_ab4dbffb32daffb64d2033e3091963507"><div class="ttname"><a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ab4dbffb32daffb64d2033e3091963507">cutlass::gemm::LinearScalingDevicePtr::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar const *alpha, Scalar const *beta)</div><div class="ttdoc">Initialize the parameters. </div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:102</div></div>
+<div class="ttc" id="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params_html"><div class="ttname"><a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">cutlass::gemm::LinearScalingDevicePtr::Params</a></div><div class="ttdoc">The parameters. </div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:55</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params_html_a38aa3e6beb09c7c4bea952094a2ea682"><div class="ttname"><a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a38aa3e6beb09c7c4bea952094a2ea682">cutlass::gemm::LinearScalingDevicePtr::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Scalar const *alpha_ptr, Scalar const *beta_ptr)</div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:83</div></div>
+<div class="ttc" id="linear__scaling_8h_html"><div class="ttname"><a href="linear__scaling_8h.html">linear_scaling.h</a></div><div class="ttdoc">Implements the BLAS linear scaling function alpha*AB + beta*C. </div></div>
+<div class="ttc" id="scalar__or__pointer_8h_html"><div class="ttname"><a href="scalar__or__pointer_8h.html">scalar_or_pointer.h</a></div><div class="ttdoc">Implements the BLAS linear scaling function alpha*AB + beta*C. </div></div>
+<div class="ttc" id="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params_html_ad1b2291b898091ee1966b73bd1ad56fa"><div class="ttname"><a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ad1b2291b898091ee1966b73bd1ad56fa">cutlass::gemm::LinearScalingDevicePtr::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar alpha, Scalar beta)</div><div class="ttdoc">Initialize the parameters. </div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:91</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_a7bbf90dc0938698a0fa22468f9df315d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">cutlass::gemm::LinearScaling::params</a></div><div class="ttdeci">Params params</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:92</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScalingDevicePtr_html_ad10463da3f5a421f9b87638775ef0a85"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85">cutlass::gemm::LinearScalingDevicePtr::Base</a></div><div class="ttdeci">LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt; Base</div><div class="ttdoc">Linear Scaling class used. </div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:49</div></div>
+<div class="ttc" id="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params_html_ae28323819fc8950bc0fee3a34b2184ff"><div class="ttname"><a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae28323819fc8950bc0fee3a34b2184ff">cutlass::gemm::LinearScalingDevicePtr::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params()</div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:70</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params_html_a26b04702140a550f3ab598132a74cd93"><div class="ttname"><a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a26b04702140a550f3ab598132a74cd93">cutlass::gemm::LinearScalingDevicePtr::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Scalar alpha, Scalar beta)</div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:74</div></div>
+<div class="ttc" id="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params_html_a0938bcb61d2572d5cf6cf2de95d11816"><div class="ttname"><a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816">cutlass::gemm::LinearScalingDevicePtr::Params::beta</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar beta() const</div><div class="ttdoc">Gets the beta scalar. </div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:130</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScalingDevicePtr_html_a9dcb15bbcf3785280fd5cea0e0da5602"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a9dcb15bbcf3785280fd5cea0e0da5602">cutlass::gemm::LinearScalingDevicePtr::LinearScalingDevicePtr</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE LinearScalingDevicePtr(Params const &amp;_params)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:140</div></div>
+<div class="ttc" id="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params_html_ae4038a59658c87d52cee3330bee59662"><div class="ttname"><a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662">cutlass::gemm::LinearScalingDevicePtr::Params::alpha</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar alpha() const</div><div class="ttdoc">Gets the alpha scalar. </div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:124</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScalingDevicePtr_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a></div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:51</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html_ae6b053ca059932f7c0d3c99243854183"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">cutlass::gemm::LinearScaling::Scalar</a></div><div class="ttdeci">Scalar_ Scalar</div><div class="ttdef"><b>Definition:</b> linear_scaling.h:53</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScalingDevicePtr_html_a0599650f5cc68b430782d2db74e73d2e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">cutlass::gemm::LinearScalingDevicePtr::Scalar</a></div><div class="ttdeci">Base::Scalar Scalar</div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:52</div></div>
+<div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
+<div class="ttc" id="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params_html_a491496037bf6613e128e667f87fda696"><div class="ttname"><a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a491496037bf6613e128e667f87fda696">cutlass::gemm::LinearScalingDevicePtr::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(GemmDesc_ const &amp;desc)</div><div class="ttdoc">Initialize the parameters. </div><div class="ttdef"><b>Definition:</b> linear_scaling_device_ptr.h:114</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar &gt;</a></div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/load__store_8h.html b/docs/load__store_8h.html
index b23ec3cbf..30a4e7334 100644
--- a/docs/load__store_8h.html
+++ b/docs/load__store_8h.html
@@ -82,7 +82,7 @@ $(function() {
 
 <p>Defines abstractions for efficiently loading and storing vectors to memory.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&quot;</code><br />
 </div>
 <p><a href="load__store_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -91,25 +91,43 @@ Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MemorySpace.html">cutlass::MemorySpace</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Enum to specify which memory space data resides in.  <a href="structcutlass_1_1MemorySpace.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load.html">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentElementType.html">cutlass::FragmentElementType</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix.  <a href="structcutlass_1_1FragmentElementType.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Partial specialization for 16b loads.  <a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html">cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store.html">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html">cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -120,7 +138,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/load__store_8h_source.html b/docs/load__store_8h_source.html
index e421cbf27..9fc9c8668 100644
--- a/docs/load__store_8h_source.html
+++ b/docs/load__store_8h_source.html
@@ -76,41 +76,64 @@ $(function() {
 <div class="title">load_store.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="load__store_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html">   39</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">   40</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">Kind</a> {</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">   41</a></span>&#160;    <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">kGeneric</a>,  <span class="comment">// Data accessed through pointer dereferencing</span></div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">   42</a></span>&#160;    <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">kShared</a>,   <span class="comment">// Data resides in shared memory</span></div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">   43</a></span>&#160;    <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">kGlobal</a>    <span class="comment">// Data resides in global memory</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  };</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;};</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;          <span class="keywordtype">int</span> Lanes_,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> Memory_,</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;          <span class="keywordtype">bool</span> = (Lanes_ &gt; 1),</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;          <span class="keywordtype">size_t</span> = (<span class="keyword">sizeof</span>(Scalar_) * Lanes_)&gt;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load.html">   54</a></span>&#160;<span class="keyword">struct</span> <a class="code" href="structcutlass_1_1Load.html">Load</a> {</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">   56</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, Lanes_&gt;::Type</a> <a class="code" href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">AccessType</a>;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">   59</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;    dst = <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  }</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;};</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> Lanes_, MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html">   67</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;Scalar_, Lanes_, Memory_, true, 4&gt; {</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a5d7ed0abaeea99ec3399f8eea930f761">   69</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, Lanes_&gt;::Type</a> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a5d7ed0abaeea99ec3399f8eea930f761">AccessType</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#aa9d5e227ea20ad3c6952f296016ec167">   72</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#aa9d5e227ea20ad3c6952f296016ec167">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0] = <span class="keyword">reinterpret_cast&lt;</span>uint32_t const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  }</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;};</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> Lanes_, MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html">   80</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;Scalar_, Lanes_, Memory_, true, 8&gt; {</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a2b9faed8d92f55a46e313d79d214316d">   82</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, Lanes_&gt;::Type</a> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a2b9faed8d92f55a46e313d79d214316d">AccessType</a>;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a0e58d26dd68aabb6cb9678f5656c7e6f">   85</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a0e58d26dd68aabb6cb9678f5656c7e6f">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    uint2 tmp = <span class="keyword">reinterpret_cast&lt;</span>uint2 const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0] = tmp.x;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[1] = tmp.y;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  }</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;};</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="keyword">template</span> &lt;MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html">   95</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;double, 2, Memory_, true, 16&gt; {</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a8611550c045d6def964d9dafb2be80c6">   97</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;double, 2&gt;::Type</a> <a class="code" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a8611550c045d6def964d9dafb2be80c6">AccessType</a>;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a7ba77016bee8e941f7831cc9fbfa994d">  100</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a7ba77016bee8e941f7831cc9fbfa994d">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, <span class="keywordtype">double</span> <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    double2 tmp = <span class="keyword">reinterpret_cast&lt;</span>double2 const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    dst[0] = tmp.x;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    dst[1] = tmp.y;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  }</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;};</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> Lanes_, MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html">  110</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;Scalar_, Lanes_, Memory_, true, 16&gt; {</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a942970f88e13c88f496a9da67ed47a6f">  112</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, Lanes_&gt;::Type</a> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a942970f88e13c88f496a9da67ed47a6f">AccessType</a>;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a4ee00178c441bdf4d4a1f8cf984bc03f">  115</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a4ee00178c441bdf4d4a1f8cf984bc03f">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    uint4 tmp = <span class="keyword">reinterpret_cast&lt;</span>uint4 const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0] = tmp.x;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[1] = tmp.y;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[2] = tmp.z;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[3] = tmp.w;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  }</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;};</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;          <span class="keywordtype">int</span> Lanes_,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> Memory_,</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;          <span class="keywordtype">bool</span> = (Lanes_ &gt; 1),</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;          <span class="keywordtype">size_t</span> = (<span class="keyword">sizeof</span>(Scalar_) * Lanes_)&gt;</div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store.html">  131</a></span>&#160;<span class="keyword">struct</span> <a class="code" href="structcutlass_1_1Store.html">Store</a> {</div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">  133</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, Lanes_&gt;::Type</a> <a class="code" href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">AccessType</a>;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf">  136</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    pointer[offset] = src;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  }</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;};</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> Lanes_, MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html">  144</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;Scalar_, Lanes_, Memory_, true, 4&gt; {</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a89f329ba11f96ee3ce4428cbc792ac3d">  146</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, Lanes_&gt;::Type</a> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a89f329ba11f96ee3ce4428cbc792ac3d">AccessType</a>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a00f6bb93d318bf4cff35c9dabc630167">  149</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a00f6bb93d318bf4cff35c9dabc630167">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    uint32_t* addr = <span class="keyword">reinterpret_cast&lt;</span>uint32_t*<span class="keyword">&gt;</span>(&amp;pointer[offset]);</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    addr[0] = src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0];</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  }</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;};</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> Lanes_, MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00158"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html">  158</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;Scalar_, Lanes_, Memory_, true, 8&gt; {</div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#ac0af6ae18137156abe24d6479232b955">  160</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, Lanes_&gt;::Type</a> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#ac0af6ae18137156abe24d6479232b955">AccessType</a>;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a027980b8456243974b0c442866a66e3a">  163</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a027980b8456243974b0c442866a66e3a">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    uint2* addr = <span class="keyword">reinterpret_cast&lt;</span>uint2*<span class="keyword">&gt;</span>(&amp;pointer[offset]);</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    addr[0] = make_uint2(src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0], src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[1]);</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  }</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;};</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="keyword">template</span> &lt;MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html">  172</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;double, 2, Memory_, true, 16&gt; {</div><div class="line"><a name="l00174"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ad073f5e8252ad24b086f14bd2a109cf9">  174</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;double, 2&gt;::Type</a> <a class="code" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ad073f5e8252ad24b086f14bd2a109cf9">AccessType</a>;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ab70d04589637f285f861902f649f834e">  177</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ab70d04589637f285f861902f649f834e">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, <span class="keywordtype">double</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    double2* addr = <span class="keyword">reinterpret_cast&lt;</span>double2*<span class="keyword">&gt;</span>(&amp;pointer[offset]);</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    addr[0] = make_double2(src[0], src[1]);</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;  }</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;};</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> Lanes_, MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html">  186</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;Scalar_, Lanes_, Memory_, true, 16&gt; {</div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aeb70e4859e2795b6af63ad5e203b4da9">  188</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, Lanes_&gt;::Type</a> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aeb70e4859e2795b6af63ad5e203b4da9">AccessType</a>;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aa130564bb2eba7b07e1f183c98f1d9e2">  191</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aa130564bb2eba7b07e1f183c98f1d9e2">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    uint4* addr = <span class="keyword">reinterpret_cast&lt;</span>uint4*<span class="keyword">&gt;</span>(&amp;pointer[offset]);</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    addr[0] = make_uint4(src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0], src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[1], src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[2], src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[3]);</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  }</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;};</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4_html_aeb70e4859e2795b6af63ad5e203b4da9"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aeb70e4859e2795b6af63ad5e203b4da9">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, Lanes_ &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:188</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
+<a href="load__store_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a> {</div><div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">   39</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">Kind</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">   40</a></span>&#160;    <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">kGeneric</a>,  <span class="comment">// Data accessed through pointer dereferencing</span></div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">   41</a></span>&#160;    <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">kShared</a>,   <span class="comment">// Data resides in shared memory</span></div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">   42</a></span>&#160;    <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">kGlobal</a>    <span class="comment">// Data resides in global memory</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  };</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;};</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentElementType.html">   47</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a> {</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">   48</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">Kind</a> { <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">kScalar</a>, <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">kWmmaMatrix</a> };</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;};</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;          <span class="keywordtype">int</span> kAccessSize,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> Memory_,</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;          <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> kFragmentElementType = <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;          <span class="keyword">typename</span> FragmentElement_ = Scalar_,</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;          <span class="keywordtype">int</span> kStride = 1,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;          <span class="keywordtype">size_t</span> size = (<span class="keyword">sizeof</span>(Scalar_) * kAccessSize)&gt;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load.html">   60</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a> {</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">   62</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">AccessType</a>;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7">   65</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    dst = *<span class="keyword">reinterpret_cast&lt;</span><a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> const*<span class="keyword">&gt;</span>(pointer + offset);</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  }</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;};</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kAccessSize, MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html">   75</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;Scalar_, kAccessSize, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, Scalar_, 1, 2&gt; {</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">   77</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">AccessType</a>;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a4bab8959d29ee868fb6b3e1f9abc04fc">   80</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a4bab8959d29ee868fb6b3e1f9abc04fc">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <span class="keyword">reinterpret_cast&lt;</span>uint16_t&amp;<span class="keyword">&gt;</span>(dst) = reinterpret_cast&lt;uint16_t const*&gt;(&amp;pointer[offset])[0];</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  }</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;};</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kAccessSize, MemorySpace::Kind Memory_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>e&gt;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html">   88</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;Scalar_, kAccessSize, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, Scalar_, kStride, 4&gt; {</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">   90</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">AccessType</a>;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#a2e906364a0631c2c9f97acd0ae4a1873">   93</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#a2e906364a0631c2c9f97acd0ae4a1873">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0] = <span class="keyword">reinterpret_cast&lt;</span>uint32_t const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;};</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kAccessSize, MemorySpace::Kind Memory_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>e&gt;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html">  102</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;Scalar_, kAccessSize, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, Scalar_, kStride, 8&gt; {</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">  104</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">AccessType</a>;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#afee69b86f070e3badc75ab00bcc5996b">  107</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#afee69b86f070e3badc75ab00bcc5996b">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    uint2 tmp = <span class="keyword">reinterpret_cast&lt;</span>uint2 const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0] = tmp.x;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[1] = tmp.y;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  }</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;};</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;<span class="keyword">template</span> &lt;MemorySpace::Kind Memory_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>e&gt;</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html">  117</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;double, 2, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, double, kStride, 16&gt; {</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">  119</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;double, 2&gt;::Type</a> <a class="code" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">AccessType</a>;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a7d9027453aa78d4448d70dc44307791e">  122</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a7d9027453aa78d4448d70dc44307791e">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, <span class="keywordtype">double</span> <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    double2 tmp = <span class="keyword">reinterpret_cast&lt;</span>double2 const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    dst[0] = tmp.x;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    dst[1] = tmp.y;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;  }</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;};</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="preprocessor">#if defined(__CUDACC_VERSION_MAJOR) &amp;&amp; __CUDACC_VERSION_MAJOR &lt; 10</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="comment">// WAR bug in NVCC where the upper and lower half of the register end up being the same</span></div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="keyword">template</span> &lt;MemorySpace::Kind Memory_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>e&gt;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="keyword">struct </span>Load&lt;half, 8, Memory_, FragmentElementType::kScalar, half, kStride, 16&gt; {</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">Vectorize&lt;half, 8&gt;::Type</a> <a class="code" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">AccessType</a>;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7">load</a>(<a class="code" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">AccessType</a>&amp; dst, half <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    int2 tmp = <span class="keyword">reinterpret_cast&lt;</span>int2 const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;    dst.registers[0] = tmp.x;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    dst.registers[1] = tmp.y;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    tmp = <span class="keyword">reinterpret_cast&lt;</span>int2 const*<span class="keyword">&gt;</span>(&amp;pointer[offset + 4])[0];</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    dst.registers[2] = tmp.x;</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    dst.registers[3] = tmp.y;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  }</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;};</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kAccessSize, MemorySpace::Kind Memory_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>e&gt;</div><div class="line"><a name="l00155"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html">  155</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;Scalar_, kAccessSize, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, Scalar_, kStride, 16&gt; {</div><div class="line"><a name="l00157"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">  157</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">AccessType</a>;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a7d3d3e156dc527f9c00acc7a66d21326">  160</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a7d3d3e156dc527f9c00acc7a66d21326">load</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a>&amp; dst, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    uint4 tmp = <span class="keyword">reinterpret_cast&lt;</span>uint4 const*<span class="keyword">&gt;</span>(&amp;pointer[offset])[0];</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0] = tmp.x;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[1] = tmp.y;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[2] = tmp.z;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    dst.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[3] = tmp.w;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  }</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;};</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;          <span class="keywordtype">int</span> kAccessSize,</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> Memory_,</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;          <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> kFragmentElementType = <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>,</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;          <span class="keyword">typename</span> FragmentElement_ = Scalar_,</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;          <span class="keywordtype">int</span> kStride = 1,</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;          <span class="keywordtype">size_t</span> size = (<span class="keyword">sizeof</span>(Scalar_) * kAccessSize)&gt;</div><div class="line"><a name="l00178"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store.html">  178</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a> {</div><div class="line"><a name="l00180"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">  180</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;FragmentElement_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">AccessType</a>;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;</div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store.html#a187b63f682f7f00f8bf9ed3ee59d602f">  183</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store.html#a187b63f682f7f00f8bf9ed3ee59d602f">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    pointer[offset] = *<span class="keyword">reinterpret_cast&lt;</span>Scalar_ const*<span class="keyword">&gt;</span>(&amp;src);</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;  }</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;};</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kAccessSize, MemorySpace::Kind Memory_&gt;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html">  191</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;Scalar_, kAccessSize, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, Scalar_, 1, 2&gt; {</div><div class="line"><a name="l00193"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">  193</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">AccessType</a>;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#a535b4356c9bc21352fc2459b3c2246d1">  196</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#a535b4356c9bc21352fc2459b3c2246d1">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    uint16_t* addr = <span class="keyword">reinterpret_cast&lt;</span>uint16_t*<span class="keyword">&gt;</span>(&amp;pointer[offset]);</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    addr[0] = <span class="keyword">reinterpret_cast&lt;</span>uint16_t const&amp;<span class="keyword">&gt;</span>(src);</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;  }</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;};</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kAccessSize, MemorySpace::Kind Memory_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>e&gt;</div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html">  205</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;Scalar_, kAccessSize, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, Scalar_, kStride, 4&gt; {</div><div class="line"><a name="l00207"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">  207</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">AccessType</a>;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div><div class="line"><a name="l00210"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a453a2eed81a86d6637778a50bed06b59">  210</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a453a2eed81a86d6637778a50bed06b59">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;    uint32_t* addr = <span class="keyword">reinterpret_cast&lt;</span>uint32_t*<span class="keyword">&gt;</span>(&amp;pointer[offset]);</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    addr[0] = src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0];</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;  }</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;};</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kAccessSize, MemorySpace::Kind Memory_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>e&gt;</div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html">  219</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;Scalar_, kAccessSize, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, Scalar_, kStride, 8&gt; {</div><div class="line"><a name="l00221"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">  221</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">AccessType</a>;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a1fcdc328d4b2deb1c50be5d31ef9e55f">  224</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a1fcdc328d4b2deb1c50be5d31ef9e55f">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    uint2* addr = <span class="keyword">reinterpret_cast&lt;</span>uint2*<span class="keyword">&gt;</span>(&amp;pointer[offset]);</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    addr[0] = make_uint2(src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0], src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[1]);</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;  }</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;};</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;<span class="keyword">template</span> &lt;MemorySpace::Kind Memory_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>e&gt;</div><div class="line"><a name="l00233"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html">  233</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;double, 2, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, double, kStride, 16&gt; {</div><div class="line"><a name="l00235"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">  235</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;double, 2&gt;::Type</a> <a class="code" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">AccessType</a>;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;</div><div class="line"><a name="l00238"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a174ed368f1c702b4c958887f0b895eee">  238</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a174ed368f1c702b4c958887f0b895eee">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, <span class="keywordtype">double</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    double2* addr = <span class="keyword">reinterpret_cast&lt;</span>double2*<span class="keyword">&gt;</span>(&amp;pointer[offset]);</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;    addr[0] = make_double2(src[0], src[1]);</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;  }</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;};</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kAccessSize, MemorySpace::Kind Memory_, <span class="keywordtype">int</span> kStr<span class="keywordtype">id</span>e&gt;</div><div class="line"><a name="l00247"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html">  247</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;Scalar_, kAccessSize, Memory_, <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kScalar, Scalar_, kStride, 16&gt; {</div><div class="line"><a name="l00249"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">  249</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;Scalar_, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">AccessType</a>;</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;</div><div class="line"><a name="l00252"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#ae16a5d6d7a42ffeba0f0ebe2d252ec28">  252</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#ae16a5d6d7a42ffeba0f0ebe2d252ec28">store</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span>&amp; src, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    uint4* addr = <span class="keyword">reinterpret_cast&lt;</span>uint4*<span class="keyword">&gt;</span>(&amp;pointer[offset]);</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    addr[0] = make_uint4(src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0], src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[1], src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[2], src.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[3]);</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;  }</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;};</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;          <span class="keywordtype">int</span> kAccessSize,</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> Memory_,</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;          <span class="keyword">typename</span> FragmentElement_,</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;          <span class="keywordtype">int</span> kStride,</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;          <span class="keywordtype">size_t</span> size&gt;</div><div class="line"><a name="l00266"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html">  266</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;Scalar_,</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;            kAccessSize,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;            Memory_,</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;            <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kWmmaMatrix,</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;            FragmentElement_,</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;            kStride,</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;            size&gt; {</div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">  274</a></span>&#160;  <span class="keyword">typedef</span> FragmentElement_ <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">AccessType</a>;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div><div class="line"><a name="l00277"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a854c684b3f6c1a10b6e8fcf7967f6642">  277</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a854c684b3f6c1a10b6e8fcf7967f6642">load</a>(<a class="code" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">AccessType</a>&amp; value, Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    value.load(&amp;pointer[offset], kStride);</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;  }</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;};</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kAccessSize,</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> Memory_,</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;          <span class="keyword">typename</span> FragmentElement_,</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;          <span class="keywordtype">int</span> kStride,</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;          <span class="keywordtype">size_t</span> size&gt;</div><div class="line"><a name="l00289"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html">  289</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="code" href="structcutlass_1_1bin1__t.html">bin1_t</a>, 32&gt;,</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;            kAccessSize,</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;            Memory_,</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;            <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kWmmaMatrix,</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;            FragmentElement_,</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;            kStride,</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;            size&gt; {</div><div class="line"><a name="l00297"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">  297</a></span>&#160;  <span class="keyword">typedef</span> FragmentElement_ <a class="code" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">AccessType</a>;</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;</div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#a619f643794f51b35f3c0a1011ba00bbd">  300</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#a619f643794f51b35f3c0a1011ba00bbd">load</a>(<a class="code" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">AccessType</a>&amp; value, <a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;bin1_t, 32&gt;</a> <span class="keyword">const</span>* pointer,</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;                                       <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;    value.load(&amp;pointer[offset], kStride * 32);</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;  }</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;};</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kAccessSize,</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> Memory_,</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;          <span class="keyword">typename</span> FragmentElement_,</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;          <span class="keywordtype">int</span> kStride,</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;          <span class="keywordtype">size_t</span> size&gt;</div><div class="line"><a name="l00313"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html">  313</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="code" href="structcutlass_1_1int4__t.html">int4_t</a>, 8&gt;,</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;            kAccessSize,</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;            Memory_,</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;            <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kWmmaMatrix,</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;            FragmentElement_,</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;            kStride,</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;            size&gt; {</div><div class="line"><a name="l00321"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">  321</a></span>&#160;  <span class="keyword">typedef</span> FragmentElement_ <a class="code" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">AccessType</a>;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;</div><div class="line"><a name="l00324"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#abc4f879290c847a6e73dc9e68a340f74">  324</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#abc4f879290c847a6e73dc9e68a340f74">load</a>(<a class="code" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">AccessType</a>&amp; value, <a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;int4_t, 8&gt;</a> <span class="keyword">const</span>* pointer,</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;                                       <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;    value.load(&amp;pointer[offset], kStride * 8);</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;  }</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;};</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kAccessSize,</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> Memory_,</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;          <span class="keyword">typename</span> FragmentElement_,</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;          <span class="keywordtype">int</span> kStride,</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;          <span class="keywordtype">size_t</span> size&gt;</div><div class="line"><a name="l00337"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html">  337</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="code" href="structcutlass_1_1uint4__t.html">uint4_t</a>, 8&gt;,</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;            kAccessSize,</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;            Memory_,</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;            <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kWmmaMatrix,</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;            FragmentElement_,</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;            kStride,</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;            size&gt; {</div><div class="line"><a name="l00345"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">  345</a></span>&#160;  <span class="keyword">typedef</span> FragmentElement_ <a class="code" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">AccessType</a>;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div><div class="line"><a name="l00348"></a><span class="lineno"><a class="line" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#af587adae1103b4242e0d56eb902f9302">  348</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#af587adae1103b4242e0d56eb902f9302">load</a>(<a class="code" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">AccessType</a>&amp; value, <a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;uint4_t, 8&gt;</a> <span class="keyword">const</span>* pointer,</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;                                       <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;    value.load(&amp;pointer[offset], kStride * 8);</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;  }</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;};</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;          <span class="keywordtype">int</span> kAccessSize,</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> Memory_,</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;          <span class="keyword">typename</span> FragmentElement_,</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;          <span class="keywordtype">int</span> kStride,</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;          <span class="keywordtype">size_t</span> size&gt;</div><div class="line"><a name="l00361"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html">  361</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;Scalar_,</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;             kAccessSize,</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;             Memory_,</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;             <a class="code" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a>::kWmmaMatrix,</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;             FragmentElement_,</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;             kStride,</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;             size&gt; {</div><div class="line"><a name="l00369"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">  369</a></span>&#160;  <span class="keyword">typedef</span> FragmentElement_ <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">AccessType</a>;</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;</div><div class="line"><a name="l00372"></a><span class="lineno"><a class="line" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a298a08c8c4c1ea871e92e2491b2cb549">  372</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a298a08c8c4c1ea871e92e2491b2cb549">store</a>(<a class="code" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">AccessType</a> <span class="keyword">const</span>&amp; value, Scalar_* pointer, <span class="keywordtype">int</span> offset) {</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;    value.store(&amp;pointer[offset], kStride);</div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;  }</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;};</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538_html_a619f643794f51b35f3c0a1011ba00bbd"><div class="ttname"><a href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#a619f643794f51b35f3c0a1011ba00bbd">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;value, Vector&lt; bin1_t, 32 &gt; const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:300</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5_html_a379269fb6baf7f5e5a1c3173ed048064"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:157</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad_html_a33f5160c8c038680ba2fe4c98cf036b0"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:77</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d_html_a174ed368f1c702b4c958887f0b895eee"><div class="ttname"><a href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a174ed368f1c702b4c958887f0b895eee">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::store</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void store(AccessType const &amp;src, double *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:238</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26_html_abc4f879290c847a6e73dc9e68a340f74"><div class="ttname"><a href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#abc4f879290c847a6e73dc9e68a340f74">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;value, Vector&lt; int4_t, 8 &gt; const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:324</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4_html_a027980b8456243974b0c442866a66e3a"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a027980b8456243974b0c442866a66e3a">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::store</a></div><div class="ttdeci">static CUTLASS_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:163</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html">cutlass::MemorySpace</a></div><div class="ttdoc">Enum to specify which memory space data resides in. </div><div class="ttdef"><b>Definition:</b> load_store.h:39</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">cutlass::MemorySpace::kGlobal</a></div><div class="ttdef"><b>Definition:</b> load_store.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1Load_html_ad033ebc1452d96b18913333bf7068140"><div class="ttname"><a href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">cutlass::Load::load</a></div><div class="ttdeci">static CUTLASS_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:59</div></div>
-<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4_html_a942970f88e13c88f496a9da67ed47a6f"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a942970f88e13c88f496a9da67ed47a6f">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, Lanes_ &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:112</div></div>
-<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4_html_a89f329ba11f96ee3ce4428cbc792ac3d"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a89f329ba11f96ee3ce4428cbc792ac3d">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, Lanes_ &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:146</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:40</div></div>
-<div class="ttc" id="structcutlass_1_1Store_html"><div class="ttname"><a href="structcutlass_1_1Store.html">cutlass::Store</a></div><div class="ttdef"><b>Definition:</b> load_store.h:131</div></div>
-<div class="ttc" id="structcutlass_1_1Store_html_a1117fa7b7bdeeb3a7f2d647a1d340aaf"><div class="ttname"><a href="structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf">cutlass::Store::store</a></div><div class="ttdeci">static CUTLASS_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:136</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html_a29dab07949206cc1609543ffcefd1e5a"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">cutlass::Vector::registers</a></div><div class="ttdeci">uint32_t registers[kRegisters]</div><div class="ttdoc">The data in registers. </div><div class="ttdef"><b>Definition:</b> vector.h:80</div></div>
-<div class="ttc" id="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4_html_ad073f5e8252ad24b086f14bd2a109cf9"><div class="ttname"><a href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ad073f5e8252ad24b086f14bd2a109cf9">cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; double, 2 &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:174</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">cutlass::MemorySpace::kGeneric</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
-<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4_html_aa9d5e227ea20ad3c6952f296016ec167"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#aa9d5e227ea20ad3c6952f296016ec167">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::load</a></div><div class="ttdeci">static CUTLASS_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:72</div></div>
-<div class="ttc" id="structcutlass_1_1Store_html_a8d2f927b2b61987dcea40e84f4575942"><div class="ttname"><a href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">cutlass::Store::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, Lanes_ &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:133</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:61</div></div>
-<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4_html_a0e58d26dd68aabb6cb9678f5656c7e6f"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a0e58d26dd68aabb6cb9678f5656c7e6f">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::load</a></div><div class="ttdeci">static CUTLASS_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:85</div></div>
-<div class="ttc" id="structcutlass_1_1Load_html"><div class="ttname"><a href="structcutlass_1_1Load.html">cutlass::Load</a></div><div class="ttdef"><b>Definition:</b> load_store.h:54</div></div>
-<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4_html_a2b9faed8d92f55a46e313d79d214316d"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a2b9faed8d92f55a46e313d79d214316d">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, Lanes_ &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:82</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26_html_a2265e1ad87bc6fd227f0a83e7043c87a"><div class="ttname"><a href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType</a></div><div class="ttdeci">FragmentElement_ AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:321</div></div>
+<div class="ttc" id="structcutlass_1_1bin1__t_html"><div class="ttname"><a href="structcutlass_1_1bin1__t.html">cutlass::bin1_t</a></div><div class="ttdef"><b>Definition:</b> numeric_types.h:39</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html">cutlass::MemorySpace</a></div><div class="ttdoc">Enum to specify which memory space data resides in. </div><div class="ttdef"><b>Definition:</b> load_store.h:38</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e_html_a535b4356c9bc21352fc2459b3c2246d1"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#a535b4356c9bc21352fc2459b3c2246d1">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::store</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac_html_ae16a5d6d7a42ffeba0f0ebe2d252ec28"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#ae16a5d6d7a42ffeba0f0ebe2d252ec28">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::store</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:252</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538_html_ae5df4a17f7f946534cfe7cdbd325e301"><div class="ttname"><a href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType</a></div><div class="ttdeci">FragmentElement_ AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:297</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentElementType_html"><div class="ttname"><a href="structcutlass_1_1FragmentElementType.html">cutlass::FragmentElementType</a></div><div class="ttdoc">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix. </div><div class="ttdef"><b>Definition:</b> load_store.h:47</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">cutlass::MemorySpace::kGlobal</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentElementType_html_a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd"><div class="ttname"><a href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">cutlass::FragmentElementType::kWmmaMatrix</a></div><div class="ttdef"><b>Definition:</b> load_store.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f_html_ae82bca88b6dcca352bfb45d5789d9ce9"><div class="ttname"><a href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType</a></div><div class="ttdeci">FragmentElement_ AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:345</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4_html_a925ca73bca88c8a1835061cc1391ae57"><div class="ttname"><a href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; double, 2 &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:119</div></div>
+<div class="ttc" id="structcutlass_1_1Store_html_a82acff2a97f8e08d040b4e603419c2c7"><div class="ttname"><a href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">cutlass::Store::AccessType</a></div><div class="ttdeci">Vectorize&lt; FragmentElement_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:180</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:39</div></div>
+<div class="ttc" id="structcutlass_1_1Store_html"><div class="ttname"><a href="structcutlass_1_1Store.html">cutlass::Store</a></div><div class="ttdef"><b>Definition:</b> load_store.h:178</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5_html_a7d3d3e156dc527f9c00acc7a66d21326"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a7d3d3e156dc527f9c00acc7a66d21326">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:160</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html_a29dab07949206cc1609543ffcefd1e5a"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">cutlass::Vector::registers</a></div><div class="ttdeci">uint32_t registers[kRegisters]</div><div class="ttdoc">The data in registers. </div><div class="ttdef"><b>Definition:</b> vector.h:81</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2_html_a854c684b3f6c1a10b6e8fcf7967f6642"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a854c684b3f6c1a10b6e8fcf7967f6642">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;value, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:277</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e_html_ab4e4ac8a34b08fe38676f9fe7efe4c4f"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:193</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99_html_a7eab78b09f87ca0ee3646eec4fd91b78"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:104</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentElementType_html_a62883b0695dc3a7ff82916ff9d75df0b"><div class="ttname"><a href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">cutlass::FragmentElementType::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">cutlass::MemorySpace::kGeneric</a></div><div class="ttdef"><b>Definition:</b> load_store.h:40</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1Load_html_ad34e83ea01c482100c0557e23bc688f8"><div class="ttname"><a href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">cutlass::Load::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99_html_afee69b86f070e3badc75ab00bcc5996b"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#afee69b86f070e3badc75ab00bcc5996b">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:107</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1Load_html"><div class="ttname"><a href="structcutlass_1_1Load.html">cutlass::Load</a></div><div class="ttdef"><b>Definition:</b> load_store.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417_html_a5ca5fcd2d6d2ca350d4470b4a3e65385"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType</a></div><div class="ttdeci">FragmentElement_ AccessType</div><div class="ttdoc">The input type. </div><div class="ttdef"><b>Definition:</b> load_store.h:369</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce_html_a2e906364a0631c2c9f97acd0ae4a1873"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#a2e906364a0631c2c9f97acd0ae4a1873">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:93</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentElementType_html_a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b"><div class="ttname"><a href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">cutlass::FragmentElementType::kScalar</a></div><div class="ttdef"><b>Definition:</b> load_store.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1Vectorize_html_a070ec95f4297d769ee53a4d8a650c05e"><div class="ttname"><a href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">cutlass::Vectorize::Type</a></div><div class="ttdeci">Vector&lt; Element_, kLanes_ &gt; Type</div><div class="ttdef"><b>Definition:</b> vector.h:271</div></div>
 <div class="ttc" id="vector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div><div class="ttdoc">Defines a 1D vector of elements held in the registers of each thread. </div></div>
-<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4_html_ac0af6ae18137156abe24d6479232b955"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#ac0af6ae18137156abe24d6479232b955">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, Lanes_ &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:160</div></div>
-<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4_html_a4ee00178c441bdf4d4a1f8cf984bc03f"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a4ee00178c441bdf4d4a1f8cf984bc03f">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::load</a></div><div class="ttdeci">static CUTLASS_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:115</div></div>
-<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4_html_a5d7ed0abaeea99ec3399f8eea930f761"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a5d7ed0abaeea99ec3399f8eea930f761">cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, Lanes_ &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:69</div></div>
-<div class="ttc" id="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4_html_a7ba77016bee8e941f7831cc9fbfa994d"><div class="ttname"><a href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a7ba77016bee8e941f7831cc9fbfa994d">cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;::load</a></div><div class="ttdeci">static CUTLASS_DEVICE void load(AccessType &amp;dst, double const *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:100</div></div>
-<div class="ttc" id="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4_html_a8611550c045d6def964d9dafb2be80c6"><div class="ttname"><a href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a8611550c045d6def964d9dafb2be80c6">cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; double, 2 &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:97</div></div>
-<div class="ttc" id="structcutlass_1_1Load_html_ad0bf2da0c240f3a2a3f4c92162d347ae"><div class="ttname"><a href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">cutlass::Load::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, Lanes_ &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:56</div></div>
-<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4_html_aa130564bb2eba7b07e1f183c98f1d9e2"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aa130564bb2eba7b07e1f183c98f1d9e2">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::store</a></div><div class="ttdeci">static CUTLASS_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:191</div></div>
-<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4_html_a00f6bb93d318bf4cff35c9dabc630167"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a00f6bb93d318bf4cff35c9dabc630167">cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::store</a></div><div class="ttdeci">static CUTLASS_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:149</div></div>
-<div class="ttc" id="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4_html_ab70d04589637f285f861902f649f834e"><div class="ttname"><a href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ab70d04589637f285f861902f649f834e">cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;::store</a></div><div class="ttdeci">static CUTLASS_DEVICE void store(AccessType const &amp;src, double *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:177</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac_html_affe0bee9dcc3d88c169472b421449900"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:249</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f_html_af587adae1103b4242e0d56eb902f9302"><div class="ttname"><a href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#af587adae1103b4242e0d56eb902f9302">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;value, Vector&lt; uint4_t, 8 &gt; const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:348</div></div>
+<div class="ttc" id="structcutlass_1_1uint4__t_html"><div class="ttname"><a href="structcutlass_1_1uint4__t.html">cutlass::uint4_t</a></div><div class="ttdef"><b>Definition:</b> numeric_types.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce_html_ab3f1d2f24c3aaec7690aae184b57bc59"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1Store_html_a187b63f682f7f00f8bf9ed3ee59d602f"><div class="ttname"><a href="structcutlass_1_1Store.html#a187b63f682f7f00f8bf9ed3ee59d602f">cutlass::Store::store</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:183</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1_html_a1fcdc328d4b2deb1c50be5d31ef9e55f"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a1fcdc328d4b2deb1c50be5d31ef9e55f">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::store</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:224</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1_html_a3fe2c0be6113ecb0ae4535cccb87680b"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:221</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011_html_a996c9a38e018d250ce8f0a7a474bc6e6"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; Scalar_, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:207</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417_html_a298a08c8c4c1ea871e92e2491b2cb549"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a298a08c8c4c1ea871e92e2491b2cb549">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::store</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void store(AccessType const &amp;value, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:372</div></div>
+<div class="ttc" id="structcutlass_1_1int4__t_html"><div class="ttname"><a href="structcutlass_1_1int4__t.html">cutlass::int4_t</a></div><div class="ttdef"><b>Definition:</b> numeric_types.h:41</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2_html_a1aa08c9c7424ba4f998d7445ba83eaab"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType</a></div><div class="ttdeci">FragmentElement_ AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:274</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011_html_a453a2eed81a86d6637778a50bed06b59"><div class="ttname"><a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a453a2eed81a86d6637778a50bed06b59">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::store</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:210</div></div>
+<div class="ttc" id="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d_html_a6c7ee589e65cf77578402a5ae01afe44"><div class="ttname"><a href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::AccessType</a></div><div class="ttdeci">Vectorize&lt; double, 2 &gt;::Type AccessType</div><div class="ttdoc">The output type. </div><div class="ttdef"><b>Definition:</b> load_store.h:235</div></div>
+<div class="ttc" id="structcutlass_1_1Load_html_a0d13c39fdb813c3f043cdfaf0f1221a7"><div class="ttname"><a href="structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7">cutlass::Load::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad_html_a4bab8959d29ee868fb6b3e1f9abc04fc"><div class="ttname"><a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a4bab8959d29ee868fb6b3e1f9abc04fc">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:80</div></div>
+<div class="ttc" id="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4_html_a7d9027453aa78d4448d70dc44307791e"><div class="ttname"><a href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a7d9027453aa78d4448d70dc44307791e">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::load</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void load(AccessType &amp;dst, double const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:122</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/matrix__traits_8h.html b/docs/matrix__traits_8h.html
index f83c89f0d..097d5f4ae 100644
--- a/docs/matrix__traits_8h.html
+++ b/docs/matrix__traits_8h.html
@@ -82,17 +82,39 @@ $(function() {
 
 <p>Defines properties of matrices used to denote layout and operands to GEMM kernels.  
 <a href="#details">More...</a></p>
-
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+</div>
 <p><a href="matrix__traits_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout.html">cutlass::MatrixLayout</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Describes layouts of matrices.  <a href="structcutlass_1_1MatrixLayout.html#details">More...</a><br /></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines data layouts of various matrix formats usable by <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> and other classes.  <a href="structcutlass_1_1MatrixLayout.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">cutlass::MatrixLayout::RowMajor</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Mapping function for row-major matrices.  <a href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">cutlass::MatrixLayout::ColumnMajor</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Mapping function for column-major matrices.  <a href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">cutlass::MatrixLayout::ContiguousLayout</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1GemmOperand.html">cutlass::GemmOperand</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gemm operand - D = A * B + C.  <a href="structcutlass_1_1GemmOperand.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixTransform.html">cutlass::MatrixTransform</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformation applied to matrix operands.  <a href="structcutlass_1_1MatrixTransform.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
 Namespaces</h2></td></tr>
@@ -102,7 +124,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/matrix__traits_8h_source.html b/docs/matrix__traits_8h_source.html
index 9f8de2dc6..2e78c5a2b 100644
--- a/docs/matrix__traits_8h_source.html
+++ b/docs/matrix__traits_8h_source.html
@@ -76,21 +76,88 @@ $(function() {
 <div class="title">matrix_traits.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="matrix__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout.html">   35</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a> {</div><div class="line"><a name="l00036"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">   36</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">Kind</a> { <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">kRowMajor</a>, <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">kColumnMajor</a> };</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;};</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1GemmOperand.html">   42</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a> {</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">   43</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">Kind</a> { <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">kA</a>, <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">kB</a>, <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">kC</a>, <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe">kD</a> };</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;};</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html">cutlass::MatrixLayout</a></div><div class="ttdoc">Describes layouts of matrices. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:35</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html">cutlass::GemmOperand</a></div><div class="ttdoc">Gemm operand - D = A * B + C. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:42</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe">cutlass::GemmOperand::kD</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<a href="matrix__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&lt;2, int&gt; {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">   41</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a>;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">   44</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2, Index&gt;</a> <a class="code" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a>;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a5149f4a37407746407251efc0779bb53">   47</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixCoord.html#a5149f4a37407746407251efc0779bb53">kRow</a> = 0;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a1e096b25138e027c31ea8624729ec433">   50</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixCoord.html#a1e096b25138e027c31ea8624729ec433">kColumn</a> = 1;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">   58</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">MatrixCoord</a>() { }</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a64bddbf8238dc937a01a140722f7f39c">   62</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html#a64bddbf8238dc937a01a140722f7f39c">MatrixCoord</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2, Index&gt;</a> <span class="keyword">const</span> &amp;coord): <a class="code" href="structcutlass_1_1Coord.html">Base</a>(coord) { }</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#ac77b18e67be18cfdfe1935939e7f2017">   66</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html#ac77b18e67be18cfdfe1935939e7f2017">MatrixCoord</a>(<a class="code" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> <a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>, <a class="code" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> <a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>): <a class="code" href="structcutlass_1_1Coord.html">Base</a>(<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>, <a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>)) { }</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">   70</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kRow); }</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a67f3102e51abad1205e8a3450e7a6c7e">   74</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> &amp; <a class="code" href="structcutlass_1_1MatrixCoord.html#a67f3102e51abad1205e8a3450e7a6c7e">row</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kRow); }</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">   78</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kColumn); }</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a093f5e568a81c6464dbf4aef996c32ba">   82</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> &amp; <a class="code" href="structcutlass_1_1MatrixCoord.html#a093f5e568a81c6464dbf4aef996c32ba">column</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kColumn); }</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;  <span class="comment">// Coord operators</span></div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a25236953237f965965b1c9b7a04ba26e">   90</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <a class="code" href="structcutlass_1_1MatrixCoord.html#a25236953237f965965b1c9b7a04ba26e">operator+</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">MatrixCoord</a>(Base::operator+(b));</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  }</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#aa462303d75a5d98b680b6e20080ce877">   96</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <a class="code" href="structcutlass_1_1MatrixCoord.html#aa462303d75a5d98b680b6e20080ce877">operator-</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">MatrixCoord</a>(Base::operator-(b));</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  }</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#ac68a57c17811b0a04dc6fb21423ab226">  102</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <a class="code" href="structcutlass_1_1MatrixCoord.html#ac68a57c17811b0a04dc6fb21423ab226">operator*</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">MatrixCoord</a>(Base::operator*(b));</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  }</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#aa89b196410d25d8c9ed3746fb6833374">  108</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <a class="code" href="structcutlass_1_1MatrixCoord.html#aa89b196410d25d8c9ed3746fb6833374">operator/</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">MatrixCoord</a>(Base::operator/(b));</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  }</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#ad105615dbf7ede75caa0e778c873bd06">  114</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&amp; <a class="code" href="structcutlass_1_1MatrixCoord.html#ad105615dbf7ede75caa0e778c873bd06">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">Base::operator+=</a>(b);</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  }</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00121"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a6feef48cf24733d22ca53a27cbc33ac0">  121</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&amp; <a class="code" href="structcutlass_1_1MatrixCoord.html#a6feef48cf24733d22ca53a27cbc33ac0">operator-=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">Base::operator-=</a>(b);</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  }</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#a5fd3c3b58af1147a5c73657c05a16f5b">  128</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&amp; <a class="code" href="structcutlass_1_1MatrixCoord.html#a5fd3c3b58af1147a5c73657c05a16f5b">operator*=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">Base::operator*=</a>(b);</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  }</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00135"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixCoord.html#aab345c8ddb8048bfe3d667bc7ce6522f">  135</a></span>&#160;  <a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&amp; <a class="code" href="structcutlass_1_1MatrixCoord.html#aab345c8ddb8048bfe3d667bc7ce6522f">operator/=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">Base::operator/=</a>(b);</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  }</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;};</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="comment">// The following define classes satisfying the TensorRefMapFunc concept. These must support the</span></div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;<span class="comment">// following operations, where func is an instance of type TensorRefMapFunc.</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;<span class="comment">//   Coord&lt;TensorRefMapFunc::kStorageRank&gt; = func(Coord&lt;kRank&gt;);</span></div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="comment">// Though not required to be usable by TensorRef, each of the following also define a helper</span></div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="comment">// function to map the &quot;leading dimension&quot; to an appropriate stride vector. Implementations</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;<span class="comment">// following this convention should also implement the following static method:</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="comment">//   Coord&lt;TensorRefMapFunc::kStorageRank&gt; stride = TensorRefMapFunc::stride(leading_dim);</span></div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00156"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout.html">  156</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a> {</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">  159</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">Kind</a> { <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">kRowMajor</a>, <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">kColumnMajor</a> };</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;  <span class="comment">// TensorRefMapFunc definitions for common layouts</span></div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">  166</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">RowMajor</a> {</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30">  167</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30">kStorageRank</a> = 2;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a736620aef395e4224d7aae098573aa34">  170</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a736620aef395e4224d7aae098573aa34">operator()</a>(<a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;      <span class="keywordflow">return</span> coord;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    }</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;  };</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;</div><div class="line"><a name="l00176"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">  176</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">ColumnMajor</a> {</div><div class="line"><a name="l00177"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70">  177</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70">kStorageRank</a> = 2;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00180"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#af51e07c6605524581e5d27d290c8b8d2">  180</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#af51e07c6605524581e5d27d290c8b8d2">operator()</a>(<a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>(), coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>());</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    }</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;  };</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Interleave&gt;</div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">  188</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">RowMajorInterleaved</a> {</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">  191</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">kStorageRank</a> = 3;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">  194</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">kInterleave</a> = Interleave;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a5199cb7f7c10f6123c63703453b7937c">  198</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a5199cb7f7c10f6123c63703453b7937c">operator()</a>(<a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>() / <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">kInterleave</a>,</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>(),</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>() % <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">kInterleave</a></div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;      );</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;    }</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00208"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a56f728be8b1a3e71f4f322e1dbfb3495">  208</a></span>&#160;    <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a56f728be8b1a3e71f4f322e1dbfb3495">stride</a>(<span class="keywordtype">int</span> ldm) {</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;        ldm * <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">kInterleave</a>,</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;        <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">kInterleave</a>,</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;        1</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      );</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;    }</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;  };</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Interleave&gt;</div><div class="line"><a name="l00220"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">  220</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">ColumnMajorInterleaved</a> {</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">  223</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">kStorageRank</a> = 3;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div><div class="line"><a name="l00226"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">  226</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">kInterleave</a> = Interleave;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00230"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dbf79e5df5bcf52d54a699d2587319d">  230</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dbf79e5df5bcf52d54a699d2587319d">operator()</a>(<a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>() / <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">kInterleave</a>,</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>(),</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>() % <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">kInterleave</a></div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;      );</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;    }</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00240"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dab2c5aee6958c9d99109183401f41f">  240</a></span>&#160;    <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dab2c5aee6958c9d99109183401f41f">stride</a>(<span class="keywordtype">int</span> ldm) {</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;        ldm * <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">kInterleave</a>,</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;        <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">kInterleave</a>,</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;        1</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      );</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;    }</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;  };</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;</div><div class="line"><a name="l00251"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">  251</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">ContiguousLayout</a> {</div><div class="line"><a name="l00253"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">  253</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">kStorageRank</a> = 3;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;</div><div class="line"><a name="l00256"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#ae97a9ba9d5045bef258d8994eb732256">  256</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#ae97a9ba9d5045bef258d8994eb732256">kRow</a> = 0;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00259"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#adb3b8cccf1ac91265fff998a3d48f5e7">  259</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#adb3b8cccf1ac91265fff998a3d48f5e7">kColumn</a> = 1;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00264"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a512248a443c5914fab6aeabc4a73978e">  264</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a512248a443c5914fab6aeabc4a73978e">operator()</a>(<a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>(), coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>(), 0);</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    }</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00270"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#aa3c5b8d44216fdeeee9cce5e38ce418b">  270</a></span>&#160;    <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#aa3c5b8d44216fdeeee9cce5e38ce418b">stride</a>(<a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> layout, <span class="keywordtype">int</span> ldm) {</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;      <span class="keywordflow">if</span> (layout == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>) {</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(ldm, 1, 1);</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;      }</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(1, ldm, 1);</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    }</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;  };</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> BlockRows, <span class="keywordtype">int</span> BlockColumns&gt;</div><div class="line"><a name="l00281"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">  281</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">ColumnMajorBlockLinear</a> {</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div><div class="line"><a name="l00284"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">  284</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">kStorageRank</a> = 4;</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;</div><div class="line"><a name="l00287"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">  287</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">kBlockRows</a> = BlockRows;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">  290</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">kBlockColumns</a> = BlockColumns;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00294"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a24c06bb7e64a8015ac528b3ae954a689">  294</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a24c06bb7e64a8015ac528b3ae954a689">operator()</a>(<a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>() / <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">kBlockColumns</a>,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>() / <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">kBlockRows</a>,</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>() % <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">kBlockColumns</a>,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>() % <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">kBlockRows</a></div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;      );</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;    }</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00305"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#abb88bd43e5493682d1132c550b734a36">  305</a></span>&#160;    <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#abb88bd43e5493682d1132c550b734a36">stride</a>(<span class="keywordtype">int</span> ldm) {</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;        ldm * <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">kBlockRows</a> * <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">kBlockColumns</a>,</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;        <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">kBlockRows</a> * <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">kBlockColumns</a>,</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;        <a class="code" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">kBlockRows</a>,</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        1</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;      );</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;    }</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;  };</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;  <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> BlockRows, <span class="keywordtype">int</span> BlockColumns&gt;</div><div class="line"><a name="l00318"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">  318</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">RowMajorBlockLinear</a> {</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;</div><div class="line"><a name="l00321"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">  321</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">kStorageRank</a> = 4;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;</div><div class="line"><a name="l00324"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">  324</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">kBlockRows</a> = BlockRows;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;</div><div class="line"><a name="l00327"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">  327</a></span>&#160;    <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">kBlockColumns</a> = BlockColumns;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00331"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#abde0a4a7c487da0c78ea2519323c04af">  331</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#abde0a4a7c487da0c78ea2519323c04af">operator()</a>(<a class="code" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>() / <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">kBlockRows</a>,</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>() / <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">kBlockColumns</a>,</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>() % <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">kBlockRows</a>,</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;        coord.<a class="code" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>() % <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">kBlockColumns</a></div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;      );</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    }</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00342"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a1b25b4a7061d81041a8e2a548128ca71">  342</a></span>&#160;    <span class="keyword">static</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a1b25b4a7061d81041a8e2a548128ca71">stride</a>(<span class="keywordtype">int</span> ldm) {</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;        ldm * <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">kBlockRows</a> * <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">kBlockColumns</a>,</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;        <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">kBlockRows</a> * <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">kBlockColumns</a>,</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;        <a class="code" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">kBlockColumns</a>,</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;        1</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;      );</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    }</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;  };</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;};</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno"><a class="line" href="structcutlass_1_1GemmOperand.html">  356</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1GemmOperand.html">GemmOperand</a> {</div><div class="line"><a name="l00357"></a><span class="lineno"><a class="line" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">  357</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">Kind</a> { <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">kA</a>, <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">kB</a>, <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">kC</a>, <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe">kD</a> };</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;};</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;</div><div class="line"><a name="l00363"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixTransform.html">  363</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1MatrixTransform.html">MatrixTransform</a> {</div><div class="line"><a name="l00364"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48">  364</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48">Kind</a> {</div><div class="line"><a name="l00365"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5">  365</a></span>&#160;    <a class="code" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5">kNone</a>,       </div><div class="line"><a name="l00366"></a><span class="lineno"><a class="line" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683">  366</a></span>&#160;    <a class="code" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683">kConjugate</a>,  </div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;  };</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;};</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1MatrixCoord_html_a33eea222c3dcaf22cf62502e41afb24f"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">cutlass::MatrixCoord::Index</a></div><div class="ttdeci">int Index</div><div class="ttdoc">Integer-valued index. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:41</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajor_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">cutlass::MatrixLayout::ColumnMajor</a></div><div class="ttdoc">Mapping function for column-major matrices. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:176</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear_html_a8ee57a9b5364f20890c5d3ace21c4b4e"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">cutlass::MatrixLayout::RowMajorBlockLinear::kBlockColumns</a></div><div class="ttdeci">static int const kBlockColumns</div><div class="ttdoc">Interleaving size in columns dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:327</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved_html_a9dbf79e5df5bcf52d54a699d2587319d"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dbf79e5df5bcf52d54a699d2587319d">cutlass::MatrixLayout::ColumnMajorInterleaved::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; operator()(MatrixCoord const &amp;coord) const</div><div class="ttdoc">Maps (row, col) to (col, row, col) </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:230</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajor_html_a736620aef395e4224d7aae098573aa34"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a736620aef395e4224d7aae098573aa34">cutlass::MatrixLayout::RowMajor::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; operator()(MatrixCoord const &amp;coord) const</div><div class="ttdoc">Maps (i, j) to (i, j) </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:170</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixTransform_html"><div class="ttname"><a href="structcutlass_1_1MatrixTransform.html">cutlass::MatrixTransform</a></div><div class="ttdoc">Transformation applied to matrix operands. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:363</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:188</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear_html_a0c2fe4bc9ffbc347f14dad8ffb4f7b21"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">cutlass::MatrixLayout::ColumnMajorBlockLinear::kBlockColumns</a></div><div class="ttdeci">static int const kBlockColumns</div><div class="ttdoc">Interleaving size in columns dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:290</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixTransform_html_abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5"><div class="ttname"><a href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5">cutlass::MatrixTransform::kNone</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:365</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:281</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:220</div></div>
+<div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixTransform_html_abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683"><div class="ttname"><a href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683">cutlass::MatrixTransform::kConjugate</a></div><div class="ttdoc">no operation </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:366</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_aab345c8ddb8048bfe3d667bc7ce6522f"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#aab345c8ddb8048bfe3d667bc7ce6522f">cutlass::MatrixCoord::operator/=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord &amp; operator/=(Base const &amp;b)</div><div class="ttdoc">In-place division. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:135</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajor_html_a87fe43681c95afc9ef46818fd84d9f30"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30">cutlass::MatrixLayout::RowMajor::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:167</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ContiguousLayout_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">cutlass::MatrixLayout::ContiguousLayout</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:251</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajor_html_af51e07c6605524581e5d27d290c8b8d2"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#af51e07c6605524581e5d27d290c8b8d2">cutlass::MatrixLayout::ColumnMajor::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; operator()(MatrixCoord const &amp;coord) const</div><div class="ttdoc">Maps (i, j) to (j, i) </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:180</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixTransform_html_abf79785f7ae47385d0bbc38d0c431f48"><div class="ttname"><a href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48">cutlass::MatrixTransform::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:364</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a07f7e0ff4347aa6d75a5b3a63676d51d"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">cutlass::MatrixCoord::Base</a></div><div class="ttdeci">Coord&lt; 2, Index &gt; Base</div><div class="ttdoc">Base type is a Coord of rank=2. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a25236953237f965965b1c9b7a04ba26e"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a25236953237f965965b1c9b7a04ba26e">cutlass::MatrixCoord::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord operator+(Base const &amp;b) const</div><div class="ttdoc">Element-wise addition. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ad4303b578b72b5cb2a0198375290e168"><div class="ttname"><a href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">cutlass::Coord::operator*=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator*=(Coord const &amp;b)</div><div class="ttdoc">In-place multiplication. </div><div class="ttdef"><b>Definition:</b> coord.h:197</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ContiguousLayout_html_ae97a9ba9d5045bef258d8994eb732256"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#ae97a9ba9d5045bef258d8994eb732256">cutlass::MatrixLayout::ContiguousLayout::kRow</a></div><div class="ttdeci">static int const kRow</div><div class="ttdoc">Dimension of rows. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:256</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajor_html_ab6be000553d79c0a6e39ccabe1f38c70"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70">cutlass::MatrixLayout::ColumnMajor::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:177</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear_html_ada7a9316475bb6b2f4e7a70bc654ef5b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">cutlass::MatrixLayout::ColumnMajorBlockLinear::kBlockRows</a></div><div class="ttdeci">static int const kBlockRows</div><div class="ttdoc">Interleaving size in rows dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:287</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html">cutlass::MatrixLayout</a></div><div class="ttdoc">Defines data layouts of various matrix formats usable by TensorRef and other classes. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:156</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved_html_aea33a554c0b02e455fba76c945527143"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">cutlass::MatrixLayout::RowMajorInterleaved::kInterleave</a></div><div class="ttdeci">static int const kInterleave</div><div class="ttdoc">Interleaving size. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:194</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a6a34cc85c9816263982e6253fe02abf9"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">cutlass::MatrixCoord::column</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; column() const</div><div class="ttdoc">Returns the column of the coordinate. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:78</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_ac77b18e67be18cfdfe1935939e7f2017"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#ac77b18e67be18cfdfe1935939e7f2017">cutlass::MatrixCoord::MatrixCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord(Index row, Index column)</div><div class="ttdoc">Helper to construct from a row and column. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved_html_a56f728be8b1a3e71f4f322e1dbfb3495"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a56f728be8b1a3e71f4f322e1dbfb3495">cutlass::MatrixLayout::RowMajorInterleaved::stride</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; stride(int ldm)</div><div class="ttdoc">Helper to compute stride vector from leading dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:208</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ContiguousLayout_html_adb3b8cccf1ac91265fff998a3d48f5e7"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#adb3b8cccf1ac91265fff998a3d48f5e7">cutlass::MatrixLayout::ContiguousLayout::kColumn</a></div><div class="ttdeci">static int const kColumn</div><div class="ttdoc">Dimension of columns. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:259</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved_html_a7be6d445e879f042a0b8aa2c9a378800"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">cutlass::MatrixLayout::RowMajorInterleaved::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdoc">Rank of storage n-D array. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:191</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a304334cbcad636d7b058fdc6310f0e6b"><div class="ttname"><a href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">cutlass::Coord::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator-=(Coord const &amp;b)</div><div class="ttdoc">In-place subtraction. </div><div class="ttdef"><b>Definition:</b> coord.h:188</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ContiguousLayout_html_a68bde445429b6b3a5156460eaff6a8a7"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">cutlass::MatrixLayout::ContiguousLayout::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdoc">Arbitrary storage rank. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:253</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ae4f2cb12b84411118cb93e7c4cb88b20"><div class="ttname"><a href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">cutlass::Coord::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator+=(Coord const &amp;b)</div><div class="ttdoc">In-place addition. </div><div class="ttdef"><b>Definition:</b> coord.h:179</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved_html_a5199cb7f7c10f6123c63703453b7937c"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a5199cb7f7c10f6123c63703453b7937c">cutlass::MatrixLayout::RowMajorInterleaved::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; operator()(MatrixCoord const &amp;coord) const</div><div class="ttdoc">Maps (row, col) to (row, col, row) </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:198</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear_html_a64cf7313c507bb13e010850d6a2ff922"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">cutlass::MatrixLayout::RowMajorBlockLinear::kBlockRows</a></div><div class="ttdeci">static int const kBlockRows</div><div class="ttdoc">Interleaving size in rows dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:324</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a525949dd8a6b631e755511764848e546"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">cutlass::MatrixCoord::row</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; row() const</div><div class="ttdoc">Returns the row of the coordinate. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:70</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a9eff24a3b74b68d11839b92324613c93"><div class="ttname"><a href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">cutlass::Coord&lt; 2, int &gt;::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; at()</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:240</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ac87199c4c9a4e20aac4eb6e3b9a68f28"><div class="ttname"><a href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">cutlass::Coord::operator/=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator/=(Coord const &amp;b)</div><div class="ttdoc">In-place division. </div><div class="ttdef"><b>Definition:</b> coord.h:206</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_aa462303d75a5d98b680b6e20080ce877"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#aa462303d75a5d98b680b6e20080ce877">cutlass::MatrixCoord::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord operator-(Base const &amp;b) const</div><div class="ttdoc">Element-wise subtraction. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:96</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a64bddbf8238dc937a01a140722f7f39c"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a64bddbf8238dc937a01a140722f7f39c">cutlass::MatrixCoord::MatrixCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord(Coord&lt; 2, Index &gt; const &amp;coord)</div><div class="ttdoc">Constructs from Coord&lt;2&gt; </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear_html_ab1ef1db408fd1e4bda8d6ef203d50c3d"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">cutlass::MatrixLayout::RowMajorBlockLinear::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdoc">Rank of storage n-D array. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:321</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:49</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html">cutlass::GemmOperand</a></div><div class="ttdoc">Gemm operand - D = A * B + C. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:356</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear_html_a1b25b4a7061d81041a8e2a548128ca71"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a1b25b4a7061d81041a8e2a548128ca71">cutlass::MatrixLayout::RowMajorBlockLinear::stride</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; stride(int ldm)</div><div class="ttdoc">Helper to compute stride vector from leading dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:342</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a5149f4a37407746407251efc0779bb53"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a5149f4a37407746407251efc0779bb53">cutlass::MatrixCoord::kRow</a></div><div class="ttdeci">static int const kRow</div><div class="ttdoc">Rows dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:47</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a6feef48cf24733d22ca53a27cbc33ac0"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a6feef48cf24733d22ca53a27cbc33ac0">cutlass::MatrixCoord::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord &amp; operator-=(Base const &amp;b)</div><div class="ttdoc">In-place subtraction. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:121</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_ac68a57c17811b0a04dc6fb21423ab226"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#ac68a57c17811b0a04dc6fb21423ab226">cutlass::MatrixCoord::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord operator*(Base const &amp;b) const</div><div class="ttdoc">Element-wise multiplication. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:102</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved_html_a9dab2c5aee6958c9d99109183401f41f"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dab2c5aee6958c9d99109183401f41f">cutlass::MatrixLayout::ColumnMajorInterleaved::stride</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; stride(int ldm)</div><div class="ttdoc">Helper to compute stride vector from leading dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:240</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ContiguousLayout_html_a512248a443c5914fab6aeabc4a73978e"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a512248a443c5914fab6aeabc4a73978e">cutlass::MatrixLayout::ContiguousLayout::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; operator()(MatrixCoord const &amp;coord) const</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:264</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a67f3102e51abad1205e8a3450e7a6c7e"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a67f3102e51abad1205e8a3450e7a6c7e">cutlass::MatrixCoord::row</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; row()</div><div class="ttdoc">Returns the row of the coordinate. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:74</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear_html_a626305f3e11ad87e8185e028095a91d3"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">cutlass::MatrixLayout::ColumnMajorBlockLinear::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdoc">Rank of storage n-D array. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:284</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved_html_ae0ff392e62f2af6614ab502df0cdbab7"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">cutlass::MatrixLayout::ColumnMajorInterleaved::kInterleave</a></div><div class="ttdeci">static int const kInterleave</div><div class="ttdoc">Interleaving size. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:226</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear_html_abde0a4a7c487da0c78ea2519323c04af"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#abde0a4a7c487da0c78ea2519323c04af">cutlass::MatrixLayout::RowMajorBlockLinear::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; operator()(MatrixCoord const &amp;coord) const</div><div class="ttdoc">Maps (row, col) to (row, col, row, col) </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:331</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a093f5e568a81c6464dbf4aef996c32ba"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a093f5e568a81c6464dbf4aef996c32ba">cutlass::MatrixCoord::column</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; column()</div><div class="ttdoc">Returns the column of the coordinate. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:82</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a5fd3c3b58af1147a5c73657c05a16f5b"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a5fd3c3b58af1147a5c73657c05a16f5b">cutlass::MatrixCoord::operator*=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord &amp; operator*=(Base const &amp;b)</div><div class="ttdoc">In-place multiplication. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:128</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved_html_af32144a5875e5db43cf395307a4ab00f"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">cutlass::MatrixLayout::ColumnMajorInterleaved::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdoc">Rank of storage n-D array. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:223</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_ad105615dbf7ede75caa0e778c873bd06"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#ad105615dbf7ede75caa0e778c873bd06">cutlass::MatrixCoord::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord &amp; operator+=(Base const &amp;b)</div><div class="ttdoc">In-place addition. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:114</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear_html_abb88bd43e5493682d1132c550b734a36"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#abb88bd43e5493682d1132c550b734a36">cutlass::MatrixLayout::ColumnMajorBlockLinear::stride</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; stride(int ldm)</div><div class="ttdoc">Helper to compute stride vector from leading dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:305</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear_html_a24c06bb7e64a8015ac528b3ae954a689"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a24c06bb7e64a8015ac528b3ae954a689">cutlass::MatrixLayout::ColumnMajorBlockLinear::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; operator()(MatrixCoord const &amp;coord) const</div><div class="ttdoc">Maps (row, col) to (col, row, col, row) </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:294</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1ContiguousLayout_html_aa3c5b8d44216fdeeee9cce5e38ce418b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#aa3c5b8d44216fdeeee9cce5e38ce418b">cutlass::MatrixLayout::ContiguousLayout::stride</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE Coord&lt; kStorageRank &gt; stride(MatrixLayout::Kind layout, int ldm)</div><div class="ttdoc">Helper to construct a stride vector based on contiguous matrix layout and leading dimension...</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:270</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:38</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_aa89b196410d25d8c9ed3746fb6833374"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#aa89b196410d25d8c9ed3746fb6833374">cutlass::MatrixCoord::operator/</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord operator/(Base const &amp;b) const</div><div class="ttdoc">Element-wise division. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:108</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a1e096b25138e027c31ea8624729ec433"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a1e096b25138e027c31ea8624729ec433">cutlass::MatrixCoord::kColumn</a></div><div class="ttdeci">static int const kColumn</div><div class="ttdoc">Columns dimension. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixCoord_html_a36a8a680a466b55325eb0c0cb9fc29c6"><div class="ttname"><a href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">cutlass::MatrixCoord::MatrixCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE MatrixCoord()</div><div class="ttdoc">Default ctor. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:58</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe">cutlass::GemmOperand::kD</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_1_1RowMajor_html"><div class="ttname"><a href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">cutlass::MatrixLayout::RowMajor</a></div><div class="ttdoc">Mapping function for row-major matrices. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:166</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/menudata.js b/docs/menudata.js
index 725988aa8..dde1bbfea 100644
--- a/docs/menudata.js
+++ b/docs/menudata.js
@@ -29,24 +29,33 @@ var menudata={children:[
 {text:"Namespace Members",url:"namespacemembers.html",children:[
 {text:"All",url:"namespacemembers.html",children:[
 {text:"_",url:"namespacemembers.html#index__"},
+{text:"a",url:"namespacemembers.html#index_a"},
 {text:"c",url:"namespacemembers.html#index_c"},
+{text:"e",url:"namespacemembers.html#index_e"},
 {text:"f",url:"namespacemembers.html#index_f"},
 {text:"g",url:"namespacemembers.html#index_g"},
 {text:"i",url:"namespacemembers.html#index_i"},
 {text:"l",url:"namespacemembers.html#index_l"},
 {text:"m",url:"namespacemembers.html#index_m"},
+{text:"n",url:"namespacemembers.html#index_n"},
 {text:"o",url:"namespacemembers.html#index_o"},
+{text:"p",url:"namespacemembers.html#index_p"},
 {text:"r",url:"namespacemembers.html#index_r"},
 {text:"s",url:"namespacemembers.html#index_s"},
 {text:"t",url:"namespacemembers.html#index_t"}]},
 {text:"Functions",url:"namespacemembers_func.html",children:[
 {text:"_",url:"namespacemembers_func.html#index__"},
+{text:"a",url:"namespacemembers_func.html#index_a"},
 {text:"c",url:"namespacemembers_func.html#index_c"},
+{text:"e",url:"namespacemembers_func.html#index_e"},
+{text:"f",url:"namespacemembers_func.html#index_f"},
 {text:"g",url:"namespacemembers_func.html#index_g"},
 {text:"i",url:"namespacemembers_func.html#index_i"},
 {text:"l",url:"namespacemembers_func.html#index_l"},
 {text:"m",url:"namespacemembers_func.html#index_m"},
+{text:"n",url:"namespacemembers_func.html#index_n"},
 {text:"o",url:"namespacemembers_func.html#index_o"},
+{text:"p",url:"namespacemembers_func.html#index_p"},
 {text:"r",url:"namespacemembers_func.html#index_r"},
 {text:"s",url:"namespacemembers_func.html#index_s"}]},
 {text:"Typedefs",url:"namespacemembers_type.html"}]}]},
@@ -78,6 +87,7 @@ var menudata={children:[
 {text:"v",url:"functions_v.html#index_v"},
 {text:"w",url:"functions_w.html#index_w"},
 {text:"y",url:"functions_y.html#index_y"},
+{text:"z",url:"functions_z.html#index_z"},
 {text:"~",url:"functions_0x7e.html#index_0x7e"}]},
 {text:"Functions",url:"functions_func.html",children:[
 {text:"a",url:"functions_func.html#index_a"},
@@ -89,8 +99,10 @@ var menudata={children:[
 {text:"g",url:"functions_func_g.html#index_g"},
 {text:"h",url:"functions_func_h.html#index_h"},
 {text:"i",url:"functions_func_i.html#index_i"},
+{text:"k",url:"functions_func_k.html#index_k"},
 {text:"l",url:"functions_func_l.html#index_l"},
 {text:"m",url:"functions_func_m.html#index_m"},
+{text:"n",url:"functions_func_n.html#index_n"},
 {text:"o",url:"functions_func_o.html#index_o"},
 {text:"p",url:"functions_func_p.html#index_p"},
 {text:"r",url:"functions_func_r.html#index_r"},
@@ -99,6 +111,7 @@ var menudata={children:[
 {text:"u",url:"functions_func_u.html#index_u"},
 {text:"v",url:"functions_func_v.html#index_v"},
 {text:"w",url:"functions_func_w.html#index_w"},
+{text:"z",url:"functions_func_z.html#index_z"},
 {text:"~",url:"functions_func_0x7e.html#index_0x7e"}]},
 {text:"Variables",url:"functions_vars.html",children:[
 {text:"a",url:"functions_vars.html#index_a"},
@@ -113,6 +126,7 @@ var menudata={children:[
 {text:"l",url:"functions_vars_l.html#index_l"},
 {text:"m",url:"functions_vars_m.html#index_m"},
 {text:"n",url:"functions_vars_n.html#index_n"},
+{text:"o",url:"functions_vars_o.html#index_o"},
 {text:"p",url:"functions_vars_p.html#index_p"},
 {text:"r",url:"functions_vars_r.html#index_r"},
 {text:"s",url:"functions_vars_s.html#index_s"},
@@ -127,6 +141,7 @@ var menudata={children:[
 {text:"f",url:"functions_type_f.html#index_f"},
 {text:"g",url:"functions_type_g.html#index_g"},
 {text:"i",url:"functions_type_i.html#index_i"},
+{text:"k",url:"functions_type_k.html#index_k"},
 {text:"l",url:"functions_type_l.html#index_l"},
 {text:"m",url:"functions_type_m.html#index_m"},
 {text:"n",url:"functions_type_n.html#index_n"},
@@ -140,8 +155,10 @@ var menudata={children:[
 {text:"Enumerations",url:"functions_enum.html"},
 {text:"Enumerator",url:"functions_eval.html",children:[
 {text:"a",url:"functions_eval.html#index_a"},
+{text:"b",url:"functions_eval.html#index_b"},
 {text:"k",url:"functions_eval.html#index_k"},
 {text:"m",url:"functions_eval.html#index_m"},
+{text:"o",url:"functions_eval.html#index_o"},
 {text:"v",url:"functions_eval.html#index_v"}]}]}]},
 {text:"Files",url:"files.html",children:[
 {text:"File List",url:"files.html"},
diff --git a/docs/modules.html b/docs/modules.html
index c42247bd4..8fc908440 100644
--- a/docs/modules.html
+++ b/docs/modules.html
@@ -76,19 +76,20 @@ $(function() {
 <table class="directory">
 <tr id="row_0_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__fragment__concept.html" target="_self">Fragment Concept</a></td><td class="desc"></td></tr>
 <tr id="row_1_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__fragment__iterator__concept.html" target="_self">Fragment Iterator Concept</a></td><td class="desc"></td></tr>
-<tr id="row_2_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__predicate__vector__concept.html" target="_self">Predicate Vector Concept</a></td><td class="desc"></td></tr>
-<tr id="row_3_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__predicate__iterator__concept.html" target="_self">Predicate Iterator Concept</a></td><td class="desc"></td></tr>
-<tr id="row_4_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__predicate__tile__adapter.html" target="_self">Predicate Tile Adapter Concept</a></td><td class="desc"></td></tr>
-<tr id="row_5_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__layout__concept.html" target="_self">Layout Concept</a></td><td class="desc"></td></tr>
-<tr id="row_6_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__tile__traits__concept.html" target="_self">Tile Traits Concept</a></td><td class="desc"></td></tr>
-<tr id="row_7_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__tile__load__iterator__concept.html" target="_self">Tile Load Iterator Concept</a></td><td class="desc"></td></tr>
-<tr id="row_8_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__tile__store__iterator__concept.html" target="_self">Tile Store Iterator Concept</a></td><td class="desc"></td></tr>
+<tr id="row_2_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__IdentityBlockSwizzle.html" target="_self">Identity Block Swizzle</a></td><td class="desc"></td></tr>
+<tr id="row_3_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__predicate__vector__concept.html" target="_self">Predicate Vector Concept</a></td><td class="desc"></td></tr>
+<tr id="row_4_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__predicate__iterator__concept.html" target="_self">Predicate Iterator Concept</a></td><td class="desc"></td></tr>
+<tr id="row_5_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__predicate__tile__adapter.html" target="_self">Predicate Tile Adapter Concept</a></td><td class="desc"></td></tr>
+<tr id="row_6_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__layout__concept.html" target="_self">Layout Concept</a></td><td class="desc"></td></tr>
+<tr id="row_7_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__tile__traits__concept.html" target="_self">Tile Traits Concept</a></td><td class="desc"></td></tr>
+<tr id="row_8_" class="even"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__tile__load__iterator__concept.html" target="_self">Tile Load Iterator Concept</a></td><td class="desc"></td></tr>
+<tr id="row_9_"><td class="entry"><span style="width:16px;display:inline-block;">&#160;</span><a class="el" href="group__tile__store__iterator__concept.html" target="_self">Tile Store Iterator Concept</a></td><td class="desc"></td></tr>
 </table>
 </div><!-- directory -->
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/namespacecutlass.html b/docs/namespacecutlass.html
index 989135cba..4fb1ce9a2 100644
--- a/docs/namespacecutlass.html
+++ b/docs/namespacecutlass.html
@@ -79,6 +79,8 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
 Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass_1_1detail"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1detail.html">detail</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:namespacecutlass_1_1platform"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html">platform</a></td></tr>
@@ -88,24 +90,14 @@ Namespaces</h2></td></tr>
 Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html">ComputeOffsetFromShape</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube.  <a href="structcutlass_1_1ComputeOffsetFromShape.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html">ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube with one channel and a depth of 1.  <a href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html">ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube with a depth of 1.  <a href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html">ComputeOffsetFromStrides</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube.  <a href="structcutlass_1_1ComputeOffsetFromStrides.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html">ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube with one channel and a depth of 1.  <a href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html">ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube with a depth of 1.  <a href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">ComputeThreadOffsetFromStrides</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Decompose threadId.x into coordinate of a cube whose dimensions are specified by Threads_. Afterwards compute the offset of those coordinates using Strides_.  <a href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -129,6 +121,8 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1divide__assert.html">divide_assert</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1DumpType.html">DumpType</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Extent.html">Extent</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the extent of a scalar or vector.  <a href="structcutlass_1_1Extent.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -143,44 +137,50 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">FragmentConstIterator</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix.  <a href="structcutlass_1_1FragmentElementType.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">A template defining <a class="el" href="group__fragment__iterator__concept.html">Fragment Iterator Concept</a>.  <a href="structcutlass_1_1FragmentIterator.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentLoad.html">FragmentLoad</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html">FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html">FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentStore.html">FragmentStore</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html">FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html">FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1GemmOperand.html">GemmOperand</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gemm operand - D = A * B + C.  <a href="structcutlass_1_1GemmOperand.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Identity.html">Identity</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Describes identity elements.  <a href="structcutlass_1_1Identity.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">IdentityTensorMapFunc</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1int4__t.html">int4_t</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1is__pow2.html">is_pow2</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1IteratorAdvance.html">IteratorAdvance</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1IteratorAdvance.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1IteratorFragment.html">IteratorFragment</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix.  <a href="structcutlass_1_1IteratorFragment.html#details">More...</a><br /></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">KernelLaunchConfiguration</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Structure containing the basic launch configuration of a CUDA kernel.  <a href="structcutlass_1_1KernelLaunchConfiguration.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load.html">Load</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html">Load&lt; double, 2, Memory_, true, 16 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html">Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html">Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Partial specialization for 16b loads.  <a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html">Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html">Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html">Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html">Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html">Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1log2__down.html">log2_down</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -190,22 +190,43 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html">log2_up&lt; N, 1, Count &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Describes layouts of matrices.  <a href="structcutlass_1_1MatrixLayout.html#details">More...</a><br /></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines data layouts of various matrix formats usable by <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> and other classes.  <a href="structcutlass_1_1MatrixLayout.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixTransform.html">MatrixTransform</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformation applied to matrix operands.  <a href="structcutlass_1_1MatrixTransform.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Max.html">Max</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Enum to specify which memory space data resides in.  <a href="structcutlass_1_1MemorySpace.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Min.html">Min</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">PredicatedTileLoadStream</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Generic stream for loading and transforming fragments.  <a href="structcutlass_1_1PredicatedTileLoadStream.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">PredicatedTileStoreStream</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Generic stream for transforming and storing fragments.  <a href="structcutlass_1_1PredicatedTileStoreStream.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicateTileAdapter.html">PredicateTileAdapter</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adapter to enable random access to predicates via logical coordinate within a tile.  <a href="structcutlass_1_1PredicateTileAdapter.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicateVector.html">PredicateVector</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Statically sized array of bits implementing.  <a href="structcutlass_1_1PredicateVector.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">RegularTilePredicateFunctor</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Functor computing a predicate given the logical position of an access.  <a href="structcutlass_1_1RegularTilePredicateFunctor.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html">ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to enable formatted printing of CUTLASS scalar types to an ostream.  <a href="structcutlass_1_1ScalarIO.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Shape.html">Shape</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">A <a class="el" href="structcutlass_1_1Shape.html" title="A Shape implementing Layout Concept describing the dimensions of a cube. ">Shape</a> implementing <a class="el" href="group__layout__concept.html">Layout Concept</a> describing the dimensions of a cube.  <a href="structcutlass_1_1Shape.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -216,6 +237,8 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeDivCeiling.html">ShapeDivCeiling</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeMax.html">ShapeMax</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeMin.html">ShapeMin</a></td></tr>
@@ -240,19 +263,34 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store.html">Store</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html">Store&lt; double, 2, Memory_, true, 16 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html">Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html">Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html">Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html">Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Structure modeling a pointer and stride into a tensor.  <a href="classcutlass_1_1TensorRef.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specialization for rank=1 case with no internal <a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">StrideVector</a>.  <a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html">TensorView</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Host-side reference implementation of tensor operations.  <a href="classcutlass_1_1TensorView.html#details">More...</a><br /></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a view into a logical tensor.  <a href="classcutlass_1_1TensorView.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html">TileAllocation</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Class for storing a tile in memory and accessing it through a tensor ref.  <a href="structcutlass_1_1TileAllocation.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TiledThreadOffset.html">TiledThreadOffset</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Basic thread offset function computed from a thread shape.  <a href="structcutlass_1_1TiledThreadOffset.html#details">More...</a><br /></td></tr>
@@ -263,9 +301,15 @@ Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">An iterator implementing <a class="el" href="group__tile__load__iterator__concept.html">Tile Load Iterator Concept</a> for loading a tile from memory.  <a href="structcutlass_1_1TileLoadIterator.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Generic stream for loading and transforming fragments.  <a href="structcutlass_1_1TileLoadStream.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">An iterator implementing <a class="el" href="group__tile__store__iterator__concept.html">Tile Store Iterator Concept</a> for storing a tile to memory.  <a href="structcutlass_1_1TileStoreIterator.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Generic stream for transforming and storing fragments.  <a href="structcutlass_1_1TileStoreStream.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html">TileTraits</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">A template defining <a class="el" href="group__tile__traits__concept.html">Tile Traits Concept</a>.  <a href="structcutlass_1_1TileTraits.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -282,13 +326,30 @@ Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TrivialPredicateTileAdapter.html">TrivialPredicateTileAdapter</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Always returns true predicate.  <a href="structcutlass_1_1TrivialPredicateTileAdapter.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">Vector&lt; bin1_t, kLanes_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 1-bit binary datatype.  <a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">Vector&lt; half, 1 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">Vector&lt; half, kLanes_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">Vector&lt; int4_t, kLanes_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit signed integer datatype.  <a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">Vector&lt; uint4_t, kLanes_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit unsigned integer datatype.  <a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html">Vectorize&lt; Element_, 1 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1VectorTraits.html">VectorTraits</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Traits describing properties of vectors and scalar-as-vectors.  <a href="structcutlass_1_1VectorTraits.html#details">More...</a><br /></td></tr>
@@ -299,6 +360,20 @@ Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html">VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Partial specialization for actual <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>.  <a href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html">ZipConvert</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Zips two convert operations.  <a href="structcutlass_1_1ZipConvert.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">A template defining <a class="el" href="group__fragment__concept.html">Fragment Concept</a>.  <a href="structcutlass_1_1ZipFragment.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">ZipTileAllocation</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Manages a pair of tile allocations as if they are one allocation.  <a href="structcutlass_1_1ZipTileAllocation.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs an iterator from a pair of iterators.  <a href="classcutlass_1_1ZipTileIterator.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
 Functions</h2></td></tr>
@@ -314,85 +389,42 @@ Functions</h2></td></tr>
 <tr class="memitem:a9410b1f5956d3aaf4584e65d047428fc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a9410b1f5956d3aaf4584e65d047428fc">make_Coord</a> (int _0, int _1, int _2, int _3)</td></tr>
 <tr class="memdesc:a9410b1f5956d3aaf4584e65d047428fc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to make a 4-element coordinate.  <a href="#a9410b1f5956d3aaf4584e65d047428fc">More...</a><br /></td></tr>
 <tr class="separator:a9410b1f5956d3aaf4584e65d047428fc"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7d2ab683e29b47d245e183ad5aeb962e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e">get_Coord_hw</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;coord)</td></tr>
-<tr class="memdesc:a7d2ab683e29b47d245e183ad5aeb962e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Getter.  <a href="#a7d2ab683e29b47d245e183ad5aeb962e">More...</a><br /></td></tr>
-<tr class="separator:a7d2ab683e29b47d245e183ad5aeb962e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a082e7a2e4acc2879468243f5732ccf0b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a082e7a2e4acc2879468243f5732ccf0b">get_Coord_hw</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;coord)</td></tr>
-<tr class="memdesc:a082e7a2e4acc2879468243f5732ccf0b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Getter.  <a href="#a082e7a2e4acc2879468243f5732ccf0b">More...</a><br /></td></tr>
-<tr class="separator:a082e7a2e4acc2879468243f5732ccf0b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a71f3e2a12b9e98be1fba082610fa9d4f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f">get_Coord_hwc</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;coord)</td></tr>
-<tr class="memdesc:a71f3e2a12b9e98be1fba082610fa9d4f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Getter.  <a href="#a71f3e2a12b9e98be1fba082610fa9d4f">More...</a><br /></td></tr>
-<tr class="separator:a71f3e2a12b9e98be1fba082610fa9d4f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4680709eeeb679ef0219938f85f7394e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e">get_Coord_dhw</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;coord)</td></tr>
-<tr class="memdesc:a4680709eeeb679ef0219938f85f7394e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Getter.  <a href="#a4680709eeeb679ef0219938f85f7394e">More...</a><br /></td></tr>
-<tr class="separator:a4680709eeeb679ef0219938f85f7394e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a90028a415a05ce09073860e5c761aa6f"><td class="memTemplParams" colspan="2">template&lt;typename Shape_ &gt; </td></tr>
+<tr class="memitem:a90028a415a05ce09073860e5c761aa6f"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a90028a415a05ce09073860e5c761aa6f">make_Coord_from_shape</a> ()</td></tr>
+<tr class="separator:a90028a415a05ce09073860e5c761aa6f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afe231b125bbb1e9aa51307a8abdf9a60"><td class="memTemplParams" colspan="2">template&lt;int Rank&gt; </td></tr>
+<tr class="memitem:afe231b125bbb1e9aa51307a8abdf9a60"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#afe231b125bbb1e9aa51307a8abdf9a60">operator&lt;&lt;</a> (std::ostream &amp;out, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank &gt; const &amp;coord)</td></tr>
+<tr class="separator:afe231b125bbb1e9aa51307a8abdf9a60"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30ddfc5e90b9103840cb30c9f9b96b49"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a30ddfc5e90b9103840cb30c9f9b96b49"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a30ddfc5e90b9103840cb30c9f9b96b49">operator&lt;&lt;</a> (std::ostream &amp;out, <a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; T &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a30ddfc5e90b9103840cb30c9f9b96b49"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default printing to ostream.  <a href="#a30ddfc5e90b9103840cb30c9f9b96b49">More...</a><br /></td></tr>
+<tr class="separator:a30ddfc5e90b9103840cb30c9f9b96b49"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a36690681ed19dc7e398fcdafdbfe9975"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a36690681ed19dc7e398fcdafdbfe9975"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a36690681ed19dc7e398fcdafdbfe9975">operator&lt;&lt;</a> (std::ostream &amp;out, <a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; int8_t &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a36690681ed19dc7e398fcdafdbfe9975"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of int8_t as integer rather than character.  <a href="#a36690681ed19dc7e398fcdafdbfe9975">More...</a><br /></td></tr>
+<tr class="separator:a36690681ed19dc7e398fcdafdbfe9975"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1a35d6b9b984a9c143957db733a93f51"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a1a35d6b9b984a9c143957db733a93f51"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a1a35d6b9b984a9c143957db733a93f51">operator&lt;&lt;</a> (std::ostream &amp;out, <a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; uint8_t &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a1a35d6b9b984a9c143957db733a93f51"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of uint8_t as integer rather than character.  <a href="#a1a35d6b9b984a9c143957db733a93f51">More...</a><br /></td></tr>
+<tr class="separator:a1a35d6b9b984a9c143957db733a93f51"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2fd306c63f71877f9231a7e1265752cf"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a2fd306c63f71877f9231a7e1265752cf"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a2fd306c63f71877f9231a7e1265752cf">operator&lt;&lt;</a> (std::ostream &amp;out, <a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">cutlass::bin1_t</a>, 32 &gt; &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a2fd306c63f71877f9231a7e1265752cf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of vector of 1b elements.  <a href="#a2fd306c63f71877f9231a7e1265752cf">More...</a><br /></td></tr>
+<tr class="separator:a2fd306c63f71877f9231a7e1265752cf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aecf2cd62eee939946b7173a110ecf76e"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:aecf2cd62eee939946b7173a110ecf76e"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aecf2cd62eee939946b7173a110ecf76e">operator&lt;&lt;</a> (std::ostream &amp;out, <a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">cutlass::int4_t</a>, 8 &gt; &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:aecf2cd62eee939946b7173a110ecf76e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of vector of 4b signed integer elements.  <a href="#aecf2cd62eee939946b7173a110ecf76e">More...</a><br /></td></tr>
+<tr class="separator:aecf2cd62eee939946b7173a110ecf76e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3ceda5ed2d923222662a37e8f355c9b8"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a3ceda5ed2d923222662a37e8f355c9b8"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a3ceda5ed2d923222662a37e8f355c9b8">operator&lt;&lt;</a> (std::ostream &amp;out, <a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">cutlass::uint4_t</a>, 8 &gt; &gt; const &amp;scalar)</td></tr>
+<tr class="memdesc:a3ceda5ed2d923222662a37e8f355c9b8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Printing to ostream of vector of 4b unsigned integer elements.  <a href="#a3ceda5ed2d923222662a37e8f355c9b8">More...</a><br /></td></tr>
+<tr class="separator:a3ceda5ed2d923222662a37e8f355c9b8"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a45dd7add04736cb5c3e69991d2f210be"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
 <tr class="memitem:a45dd7add04736cb5c3e69991d2f210be"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">iterator_load</a> (InputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment)</td></tr>
-<tr class="memdesc:a45dd7add04736cb5c3e69991d2f210be"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="#a45dd7add04736cb5c3e69991d2f210be">More...</a><br /></td></tr>
 <tr class="separator:a45dd7add04736cb5c3e69991d2f210be"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abcec976c59cab75ca55b338d125154a3"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:abcec976c59cab75ca55b338d125154a3"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">shared_iterator_load</a> (InputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment)</td></tr>
-<tr class="memdesc:abcec976c59cab75ca55b338d125154a3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from a shared memory input iterator.  <a href="#abcec976c59cab75ca55b338d125154a3">More...</a><br /></td></tr>
-<tr class="separator:abcec976c59cab75ca55b338d125154a3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa9416026c6db08d92a34c2ac08fea8c3"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:aa9416026c6db08d92a34c2ac08fea8c3"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aa9416026c6db08d92a34c2ac08fea8c3">shared_iterator_load</a> (InputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment, int d)</td></tr>
-<tr class="memdesc:aa9416026c6db08d92a34c2ac08fea8c3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from a shared memory input iterator.  <a href="#aa9416026c6db08d92a34c2ac08fea8c3">More...</a><br /></td></tr>
-<tr class="separator:aa9416026c6db08d92a34c2ac08fea8c3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3965068d8a4fdfe5e05782930fb4fe6b"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a3965068d8a4fdfe5e05782930fb4fe6b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">iterator_load_post_increment</a> (InputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment, typename InputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</td></tr>
-<tr class="memdesc:a3965068d8a4fdfe5e05782930fb4fe6b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator, masked by a predicate iterator.  <a href="#a3965068d8a4fdfe5e05782930fb4fe6b">More...</a><br /></td></tr>
-<tr class="separator:a3965068d8a4fdfe5e05782930fb4fe6b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af5abe551df7461eab66aa43907063d6b"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:af5abe551df7461eab66aa43907063d6b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#af5abe551df7461eab66aa43907063d6b">iterator_load_post_increment</a> (InputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment, typename InputIterator::Index offset=0)</td></tr>
-<tr class="memdesc:af5abe551df7461eab66aa43907063d6b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="#af5abe551df7461eab66aa43907063d6b">More...</a><br /></td></tr>
-<tr class="separator:af5abe551df7461eab66aa43907063d6b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afb8e7a4e611e8b5ae7ca19d02f791d37"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:afb8e7a4e611e8b5ae7ca19d02f791d37"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#afb8e7a4e611e8b5ae7ca19d02f791d37">iterator_load_post_increment</a> (InputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment, ConstPredicateAdapter pred_it)</td></tr>
-<tr class="memdesc:afb8e7a4e611e8b5ae7ca19d02f791d37"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="#afb8e7a4e611e8b5ae7ca19d02f791d37">More...</a><br /></td></tr>
-<tr class="separator:afb8e7a4e611e8b5ae7ca19d02f791d37"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a50f08aa93d7fe6825599d17e3c977031"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a50f08aa93d7fe6825599d17e3c977031"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a50f08aa93d7fe6825599d17e3c977031">iterator_load</a> (InputIterator const &amp;_iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment, typename InputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</td></tr>
-<tr class="separator:a50f08aa93d7fe6825599d17e3c977031"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aca491136bdb966638a7ae57c47f86d1e"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:aca491136bdb966638a7ae57c47f86d1e"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aca491136bdb966638a7ae57c47f86d1e">iterator_load</a> (InputIterator const &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment, typename InputIterator::Index offset=0)</td></tr>
-<tr class="memdesc:aca491136bdb966638a7ae57c47f86d1e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="#aca491136bdb966638a7ae57c47f86d1e">More...</a><br /></td></tr>
-<tr class="separator:aca491136bdb966638a7ae57c47f86d1e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af25d56f7391322d9a3b9aa3c507f90dc"><td class="memTemplParams" colspan="2">template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:af25d56f7391322d9a3b9aa3c507f90dc"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#af25d56f7391322d9a3b9aa3c507f90dc">iterator_load</a> (InputIterator const &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment, ConstPredicateAdapter pred_it)</td></tr>
-<tr class="memdesc:af25d56f7391322d9a3b9aa3c507f90dc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment from an input iterator.  <a href="#af25d56f7391322d9a3b9aa3c507f90dc">More...</a><br /></td></tr>
-<tr class="separator:af25d56f7391322d9a3b9aa3c507f90dc"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a0cb5bdf7bef498705c51a9cdcbef71f9"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment &gt; </td></tr>
 <tr class="memitem:a0cb5bdf7bef498705c51a9cdcbef71f9"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">iterator_store</a> (OutputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;fragment)</td></tr>
-<tr class="memdesc:a0cb5bdf7bef498705c51a9cdcbef71f9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="#a0cb5bdf7bef498705c51a9cdcbef71f9">More...</a><br /></td></tr>
 <tr class="separator:a0cb5bdf7bef498705c51a9cdcbef71f9"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a705c6d75513e112d2731d1c40f4cf109"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:a705c6d75513e112d2731d1c40f4cf109"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">shared_iterator_store</a> (OutputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;fragment)</td></tr>
-<tr class="memdesc:a705c6d75513e112d2731d1c40f4cf109"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to a shared memory output iterator.  <a href="#a705c6d75513e112d2731d1c40f4cf109">More...</a><br /></td></tr>
-<tr class="separator:a705c6d75513e112d2731d1c40f4cf109"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5bf15cbf4cf4649d895fcbc2edf6a2de"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a5bf15cbf4cf4649d895fcbc2edf6a2de"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">iterator_store_post_increment</a> (OutputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;fragment, typename OutputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</td></tr>
-<tr class="memdesc:a5bf15cbf4cf4649d895fcbc2edf6a2de"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator, masked by a predicate iterator.  <a href="#a5bf15cbf4cf4649d895fcbc2edf6a2de">More...</a><br /></td></tr>
-<tr class="separator:a5bf15cbf4cf4649d895fcbc2edf6a2de"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab8efb0edefca7a59acc5a14b7311130c"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:ab8efb0edefca7a59acc5a14b7311130c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#ab8efb0edefca7a59acc5a14b7311130c">iterator_store_post_increment</a> (OutputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;fragment, typename OutputIterator::Index offset=0)</td></tr>
-<tr class="memdesc:ab8efb0edefca7a59acc5a14b7311130c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="#ab8efb0edefca7a59acc5a14b7311130c">More...</a><br /></td></tr>
-<tr class="separator:ab8efb0edefca7a59acc5a14b7311130c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a96fdb65e922f6a3d46aa5de9ea78d460"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a96fdb65e922f6a3d46aa5de9ea78d460"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a96fdb65e922f6a3d46aa5de9ea78d460">iterator_store_post_increment</a> (OutputIterator &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;fragment, ConstPredicateAdapter pred_it)</td></tr>
-<tr class="memdesc:a96fdb65e922f6a3d46aa5de9ea78d460"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="#a96fdb65e922f6a3d46aa5de9ea78d460">More...</a><br /></td></tr>
-<tr class="separator:a96fdb65e922f6a3d46aa5de9ea78d460"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a88dce4b124a294cc123f7cf5fd2d6472"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:a88dce4b124a294cc123f7cf5fd2d6472"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a88dce4b124a294cc123f7cf5fd2d6472">iterator_store</a> (OutputIterator const &amp;_iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;fragment, typename OutputIterator::Index offset, ConstPredicateAdapter predicate_adapter)</td></tr>
-<tr class="memdesc:a88dce4b124a294cc123f7cf5fd2d6472"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator, masked by a predicate iterator.  <a href="#a88dce4b124a294cc123f7cf5fd2d6472">More...</a><br /></td></tr>
-<tr class="separator:a88dce4b124a294cc123f7cf5fd2d6472"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a410ed4d45ccafc2db842967740b6211f"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment &gt; </td></tr>
-<tr class="memitem:a410ed4d45ccafc2db842967740b6211f"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a410ed4d45ccafc2db842967740b6211f">iterator_store</a> (OutputIterator const &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;fragment, typename OutputIterator::Index offset=0)</td></tr>
-<tr class="memdesc:a410ed4d45ccafc2db842967740b6211f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="#a410ed4d45ccafc2db842967740b6211f">More...</a><br /></td></tr>
-<tr class="separator:a410ed4d45ccafc2db842967740b6211f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad804b804ac19360b293046f9cbfd8dd5"><td class="memTemplParams" colspan="2">template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </td></tr>
-<tr class="memitem:ad804b804ac19360b293046f9cbfd8dd5"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#ad804b804ac19360b293046f9cbfd8dd5">iterator_store</a> (OutputIterator const &amp;iterator, <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;fragment, ConstPredicateAdapter pred_it)</td></tr>
-<tr class="memdesc:ad804b804ac19360b293046f9cbfd8dd5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment to an output iterator.  <a href="#ad804b804ac19360b293046f9cbfd8dd5">More...</a><br /></td></tr>
-<tr class="separator:ad804b804ac19360b293046f9cbfd8dd5"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a17c8c408d672d26f1c70d2435f6ac83e"><td class="memTemplParams" colspan="2">template&lt;typename dividend_t , typename divisor_t &gt; </td></tr>
 <tr class="memitem:a17c8c408d672d26f1c70d2435f6ac83e"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dividend_t&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e">round_nearest</a> (dividend_t dividend, divisor_t divisor)</td></tr>
 <tr class="separator:a17c8c408d672d26f1c70d2435f6ac83e"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -402,6 +434,12 @@ Functions</h2></td></tr>
 <tr class="memitem:af07506fee11de882d926f4e8237eef09"><td class="memTemplParams" colspan="2">template&lt;typename value_t &gt; </td></tr>
 <tr class="memitem:af07506fee11de882d926f4e8237eef09"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#af07506fee11de882d926f4e8237eef09">lcm</a> (value_t a, value_t b)</td></tr>
 <tr class="separator:af07506fee11de882d926f4e8237eef09"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6bc666acc9f0d7278a788975e226e005"><td class="memTemplParams" colspan="2">template&lt;typename value_t &gt; </td></tr>
+<tr class="memitem:a6bc666acc9f0d7278a788975e226e005"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005">clz</a> (value_t x)</td></tr>
+<tr class="separator:a6bc666acc9f0d7278a788975e226e005"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a58a119c3f7b33d97c43ae8c114004d9e"><td class="memTemplParams" colspan="2">template&lt;typename value_t &gt; </td></tr>
+<tr class="memitem:a58a119c3f7b33d97c43ae8c114004d9e"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a58a119c3f7b33d97c43ae8c114004d9e">find_log2</a> (value_t x)</td></tr>
+<tr class="separator:a58a119c3f7b33d97c43ae8c114004d9e"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a6d3dfeb642a2ce3d5f52243fe48f89cc"><td class="memItemLeft" align="right" valign="top">__host__ CUTLASS_DEVICE cudaError_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a6d3dfeb642a2ce3d5f52243fe48f89cc">cuda_perror_impl</a> (cudaError_t error, const char *filename, int line)</td></tr>
 <tr class="memdesc:a6d3dfeb642a2ce3d5f52243fe48f89cc"><td class="mdescLeft">&#160;</td><td class="mdescRight">The corresponding error message is printed to <code>stderr</code> (or <code>stdout</code> in device code) along with the supplied source context.  <a href="#a6d3dfeb642a2ce3d5f52243fe48f89cc">More...</a><br /></td></tr>
 <tr class="separator:a6d3dfeb642a2ce3d5f52243fe48f89cc"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -426,12 +464,24 @@ Functions</h2></td></tr>
 <tr class="memitem:aa80a7cb3febd19b96f2ecbcb610b1b9e"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
 <tr class="memitem:aa80a7cb3febd19b96f2ecbcb610b1b9e"><td class="memTemplItemLeft" align="right" valign="top">struct&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aa80a7cb3febd19b96f2ecbcb610b1b9e">__align__</a> (64) <a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt; 64 &gt;</td></tr>
 <tr class="separator:aa80a7cb3febd19b96f2ecbcb610b1b9e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:acdb62db582cf90cfd437fc56f4ca7bbf"><td class="memTemplParams" colspan="2">template&lt;typename Scalar_ &gt; </td></tr>
-<tr class="memitem:acdb62db582cf90cfd437fc56f4ca7bbf"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf">make_zero</a> (Scalar_ &amp;x)</td></tr>
-<tr class="separator:acdb62db582cf90cfd437fc56f4ca7bbf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abc5c00b4986db5a114e774cee9999717"><td class="memTemplParams" colspan="2">template&lt;typename Scalar_ , int kLanes_&gt; </td></tr>
-<tr class="memitem:abc5c00b4986db5a114e774cee9999717"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#abc5c00b4986db5a114e774cee9999717">make_zero</a> (<a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; Scalar_, kLanes_ &gt; &amp;vec)</td></tr>
-<tr class="separator:abc5c00b4986db5a114e774cee9999717"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa03883e612d292e1b53eedd46e08ccd1"><td class="memTemplParams" colspan="2">template&lt;typename Scalar_ &gt; </td></tr>
+<tr class="memitem:aa03883e612d292e1b53eedd46e08ccd1"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aa03883e612d292e1b53eedd46e08ccd1">make_zero</a> (Scalar_ &amp;x)</td></tr>
+<tr class="separator:aa03883e612d292e1b53eedd46e08ccd1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a55b5b15eadf125d5ddddee1ea22191ee"><td class="memTemplParams" colspan="2">template&lt;typename Scalar_ , int kLanes_&gt; </td></tr>
+<tr class="memitem:a55b5b15eadf125d5ddddee1ea22191ee"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a55b5b15eadf125d5ddddee1ea22191ee">make_zero</a> (<a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; Scalar_, kLanes_ &gt; &amp;vec)</td></tr>
+<tr class="separator:a55b5b15eadf125d5ddddee1ea22191ee"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07b0da6c47bbd827779aa871249ff4b6"><td class="memTemplParams" colspan="2">template&lt;typename First , typename Second &gt; </td></tr>
+<tr class="memitem:a07b0da6c47bbd827779aa871249ff4b6"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt; First, Second &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6">make_ZipFragment</a> (First const &amp;first, Second const &amp;second)</td></tr>
+<tr class="memdesc:a07b0da6c47bbd827779aa871249ff4b6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct a <a class="el" href="structcutlass_1_1ZipFragment.html" title="A template defining Fragment Concept. ">ZipFragment</a> object.  <a href="#a07b0da6c47bbd827779aa871249ff4b6">More...</a><br /></td></tr>
+<tr class="separator:a07b0da6c47bbd827779aa871249ff4b6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adad916101ca58fc9714362c611a0cad8"><td class="memTemplParams" colspan="2">template&lt;typename First , typename Second &gt; </td></tr>
+<tr class="memitem:adad916101ca58fc9714362c611a0cad8"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1ZipConvert.html">ZipConvert</a>&lt; First, Second &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#adad916101ca58fc9714362c611a0cad8">make_ZipConvert</a> (First const &amp;first, Second const &amp;second)</td></tr>
+<tr class="memdesc:adad916101ca58fc9714362c611a0cad8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct a <a class="el" href="structcutlass_1_1ZipConvert.html" title="Zips two convert operations. ">ZipConvert</a> object.  <a href="#adad916101ca58fc9714362c611a0cad8">More...</a><br /></td></tr>
+<tr class="separator:adad916101ca58fc9714362c611a0cad8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64869d4ab18d70dc8604098ec03e1a5a"><td class="memTemplParams" colspan="2">template&lt;typename First , typename Second &gt; </td></tr>
+<tr class="memitem:a64869d4ab18d70dc8604098ec03e1a5a"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt; First, Second &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a">make_ZipTensorRef</a> (First const &amp;first, Second const &amp;second)</td></tr>
+<tr class="memdesc:a64869d4ab18d70dc8604098ec03e1a5a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>.  <a href="#a64869d4ab18d70dc8604098ec03e1a5a">More...</a><br /></td></tr>
+<tr class="separator:a64869d4ab18d70dc8604098ec03e1a5a"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Function Documentation</h2>
 <a id="ae6ee3d9361526f859d737d9c68c13706"></a>
@@ -452,10 +502,30 @@ template&lt;&gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a602227fad962270da185209ecc6012f2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a602227fad962270da185209ecc6012f2">&#9670;&nbsp;</a></span>__align__() <span class="overload">[2/7]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">struct cutlass::__align__ </td>
+          <td>(</td>
+          <td class="paramtype">2&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a266d7d2ae6e79537e46ee37b4fdface7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a266d7d2ae6e79537e46ee37b4fdface7">&#9670;&nbsp;</a></span>__align__() <span class="overload">[2/7]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#a266d7d2ae6e79537e46ee37b4fdface7">&#9670;&nbsp;</a></span>__align__() <span class="overload">[3/7]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -475,7 +545,7 @@ template&lt;&gt; </div>
 </div>
 </div>
 <a id="a1101e01215ddb0e5a7b120a4541a3c4e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1101e01215ddb0e5a7b120a4541a3c4e">&#9670;&nbsp;</a></span>__align__() <span class="overload">[3/7]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#a1101e01215ddb0e5a7b120a4541a3c4e">&#9670;&nbsp;</a></span>__align__() <span class="overload">[4/7]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -495,7 +565,7 @@ template&lt;&gt; </div>
 </div>
 </div>
 <a id="aa4071cf5103f352a5100d9b4bba895e2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa4071cf5103f352a5100d9b4bba895e2">&#9670;&nbsp;</a></span>__align__() <span class="overload">[4/7]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#aa4071cf5103f352a5100d9b4bba895e2">&#9670;&nbsp;</a></span>__align__() <span class="overload">[5/7]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -515,7 +585,7 @@ template&lt;&gt; </div>
 </div>
 </div>
 <a id="ada65694bdd4b70d4c9d769a536275a47"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ada65694bdd4b70d4c9d769a536275a47">&#9670;&nbsp;</a></span>__align__() <span class="overload">[5/7]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#ada65694bdd4b70d4c9d769a536275a47">&#9670;&nbsp;</a></span>__align__() <span class="overload">[6/7]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -535,7 +605,7 @@ template&lt;&gt; </div>
 </div>
 </div>
 <a id="aa80a7cb3febd19b96f2ecbcb610b1b9e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa80a7cb3febd19b96f2ecbcb610b1b9e">&#9670;&nbsp;</a></span>__align__() <span class="overload">[6/7]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#aa80a7cb3febd19b96f2ecbcb610b1b9e">&#9670;&nbsp;</a></span>__align__() <span class="overload">[7/7]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -554,23 +624,24 @@ template&lt;&gt; </div>
 
 </div>
 </div>
-<a id="a602227fad962270da185209ecc6012f2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a602227fad962270da185209ecc6012f2">&#9670;&nbsp;</a></span>__align__() <span class="overload">[7/7]</span></h2>
+<a id="a6bc666acc9f0d7278a788975e226e005"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6bc666acc9f0d7278a788975e226e005">&#9670;&nbsp;</a></span>clz()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;&gt; </div>
+template&lt;typename value_t &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">struct cutlass::__align__ </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t cutlass::clz </td>
           <td>(</td>
-          <td class="paramtype">2&#160;</td>
-          <td class="paramname"></td><td>)</td>
+          <td class="paramtype">value_t&#160;</td>
+          <td class="paramname"><em>x</em></td><td>)</td>
           <td></td>
         </tr>
       </table>
 </div><div class="memdoc">
+<p>log2 computation, what's the difference between the below codes and log2_up/down codes? </p>
 
 </div>
 </div>
@@ -607,6 +678,26 @@ template&lt;&gt; </div>
 </div><div class="memdoc">
 <dl class="section return"><dt>Returns</dt><dd>The CUDA error. </dd></dl>
 
+</div>
+</div>
+<a id="a58a119c3f7b33d97c43ae8c114004d9e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a58a119c3f7b33d97c43ae8c114004d9e">&#9670;&nbsp;</a></span>find_log2()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename value_t &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> value_t cutlass::find_log2 </td>
+          <td>(</td>
+          <td class="paramtype">value_t&#160;</td>
+          <td class="paramname"><em>x</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a38481ebfe13bc199aa621ceecfa016b8"></a>
@@ -638,82 +729,10 @@ template&lt;typename value_t &gt; </div>
 </div><div class="memdoc">
 <p>Greatest common divisor </p>
 
-</div>
-</div>
-<a id="a4680709eeeb679ef0219938f85f7394e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4680709eeeb679ef0219938f85f7394e">&#9670;&nbsp;</a></span>get_Coord_dhw()</h2>
-
-<div class="memitem">
-<div class="memproto">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; cutlass::get_Coord_dhw </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a7d2ab683e29b47d245e183ad5aeb962e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7d2ab683e29b47d245e183ad5aeb962e">&#9670;&nbsp;</a></span>get_Coord_hw() <span class="overload">[1/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;2&gt; cutlass::get_Coord_hw </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a082e7a2e4acc2879468243f5732ccf0b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a082e7a2e4acc2879468243f5732ccf0b">&#9670;&nbsp;</a></span>get_Coord_hw() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;2&gt; cutlass::get_Coord_hw </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a71f3e2a12b9e98be1fba082610fa9d4f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a71f3e2a12b9e98be1fba082610fa9d4f">&#9670;&nbsp;</a></span>get_Coord_hwc()</h2>
-
-<div class="memitem">
-<div class="memproto">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; cutlass::get_Coord_hwc </td>
-          <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>coord</em></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
 </div>
 </div>
 <a id="a45dd7add04736cb5c3e69991d2f210be"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a45dd7add04736cb5c3e69991d2f210be">&#9670;&nbsp;</a></span>iterator_load() <span class="overload">[1/4]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#a45dd7add04736cb5c3e69991d2f210be">&#9670;&nbsp;</a></span>iterator_load()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -740,238 +759,10 @@ template&lt;typename InputIterator , typename Fragment &gt; </div>
       </table>
 </div><div class="memdoc">
 
-</div>
-</div>
-<a id="a50f08aa93d7fe6825599d17e3c977031"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a50f08aa93d7fe6825599d17e3c977031">&#9670;&nbsp;</a></span>iterator_load() <span class="overload">[2/4]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_load </td>
-          <td>(</td>
-          <td class="paramtype">InputIterator const &amp;&#160;</td>
-          <td class="paramname"><em>_iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename InputIterator::Index&#160;</td>
-          <td class="paramname"><em>offset</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">ConstPredicateAdapter&#160;</td>
-          <td class="paramname"><em>predicate_adapter</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aca491136bdb966638a7ae57c47f86d1e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aca491136bdb966638a7ae57c47f86d1e">&#9670;&nbsp;</a></span>iterator_load() <span class="overload">[3/4]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename InputIterator , typename Fragment &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_load </td>
-          <td>(</td>
-          <td class="paramtype">InputIterator const &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename InputIterator::Index&#160;</td>
-          <td class="paramname"><em>offset</em> = <code>0</code>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="af25d56f7391322d9a3b9aa3c507f90dc"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af25d56f7391322d9a3b9aa3c507f90dc">&#9670;&nbsp;</a></span>iterator_load() <span class="overload">[4/4]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_load </td>
-          <td>(</td>
-          <td class="paramtype">InputIterator const &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">ConstPredicateAdapter&#160;</td>
-          <td class="paramname"><em>pred_it</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a3965068d8a4fdfe5e05782930fb4fe6b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3965068d8a4fdfe5e05782930fb4fe6b">&#9670;&nbsp;</a></span>iterator_load_post_increment() <span class="overload">[1/3]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_load_post_increment </td>
-          <td>(</td>
-          <td class="paramtype">InputIterator &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename InputIterator::Index&#160;</td>
-          <td class="paramname"><em>offset</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">ConstPredicateAdapter&#160;</td>
-          <td class="paramname"><em>predicate_adapter</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="af5abe551df7461eab66aa43907063d6b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af5abe551df7461eab66aa43907063d6b">&#9670;&nbsp;</a></span>iterator_load_post_increment() <span class="overload">[2/3]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename InputIterator , typename Fragment &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_load_post_increment </td>
-          <td>(</td>
-          <td class="paramtype">InputIterator &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename InputIterator::Index&#160;</td>
-          <td class="paramname"><em>offset</em> = <code>0</code>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="afb8e7a4e611e8b5ae7ca19d02f791d37"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#afb8e7a4e611e8b5ae7ca19d02f791d37">&#9670;&nbsp;</a></span>iterator_load_post_increment() <span class="overload">[3/3]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename InputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_load_post_increment </td>
-          <td>(</td>
-          <td class="paramtype">InputIterator &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">ConstPredicateAdapter&#160;</td>
-          <td class="paramname"><em>pred_it</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
 </div>
 </div>
 <a id="a0cb5bdf7bef498705c51a9cdcbef71f9"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0cb5bdf7bef498705c51a9cdcbef71f9">&#9670;&nbsp;</a></span>iterator_store() <span class="overload">[1/4]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#a0cb5bdf7bef498705c51a9cdcbef71f9">&#9670;&nbsp;</a></span>iterator_store()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -998,234 +789,6 @@ template&lt;typename OutputIterator , typename Fragment &gt; </div>
       </table>
 </div><div class="memdoc">
 
-</div>
-</div>
-<a id="a88dce4b124a294cc123f7cf5fd2d6472"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a88dce4b124a294cc123f7cf5fd2d6472">&#9670;&nbsp;</a></span>iterator_store() <span class="overload">[2/4]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_store </td>
-          <td>(</td>
-          <td class="paramtype">OutputIterator const &amp;&#160;</td>
-          <td class="paramname"><em>_iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename OutputIterator::Index&#160;</td>
-          <td class="paramname"><em>offset</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">ConstPredicateAdapter&#160;</td>
-          <td class="paramname"><em>predicate_adapter</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a410ed4d45ccafc2db842967740b6211f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a410ed4d45ccafc2db842967740b6211f">&#9670;&nbsp;</a></span>iterator_store() <span class="overload">[3/4]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename OutputIterator , typename Fragment &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_store </td>
-          <td>(</td>
-          <td class="paramtype">OutputIterator const &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename OutputIterator::Index&#160;</td>
-          <td class="paramname"><em>offset</em> = <code>0</code>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="ad804b804ac19360b293046f9cbfd8dd5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad804b804ac19360b293046f9cbfd8dd5">&#9670;&nbsp;</a></span>iterator_store() <span class="overload">[4/4]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_store </td>
-          <td>(</td>
-          <td class="paramtype">OutputIterator const &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">ConstPredicateAdapter&#160;</td>
-          <td class="paramname"><em>pred_it</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a5bf15cbf4cf4649d895fcbc2edf6a2de"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5bf15cbf4cf4649d895fcbc2edf6a2de">&#9670;&nbsp;</a></span>iterator_store_post_increment() <span class="overload">[1/3]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_store_post_increment </td>
-          <td>(</td>
-          <td class="paramtype">OutputIterator &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename OutputIterator::Index&#160;</td>
-          <td class="paramname"><em>offset</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">ConstPredicateAdapter&#160;</td>
-          <td class="paramname"><em>predicate_adapter</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="ab8efb0edefca7a59acc5a14b7311130c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab8efb0edefca7a59acc5a14b7311130c">&#9670;&nbsp;</a></span>iterator_store_post_increment() <span class="overload">[2/3]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename OutputIterator , typename Fragment &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_store_post_increment </td>
-          <td>(</td>
-          <td class="paramtype">OutputIterator &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename OutputIterator::Index&#160;</td>
-          <td class="paramname"><em>offset</em> = <code>0</code>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a96fdb65e922f6a3d46aa5de9ea78d460"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a96fdb65e922f6a3d46aa5de9ea78d460">&#9670;&nbsp;</a></span>iterator_store_post_increment() <span class="overload">[3/3]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename OutputIterator , typename Fragment , typename ConstPredicateAdapter &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::iterator_store_post_increment </td>
-          <td>(</td>
-          <td class="paramtype">OutputIterator &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">ConstPredicateAdapter&#160;</td>
-          <td class="paramname"><em>pred_it</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
 </div>
 </div>
 <a id="af07506fee11de882d926f4e8237eef09"></a>
@@ -1379,8 +942,27 @@ template&lt;typename value_t &gt; </div>
 
 </div>
 </div>
-<a id="acdb62db582cf90cfd437fc56f4ca7bbf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#acdb62db582cf90cfd437fc56f4ca7bbf">&#9670;&nbsp;</a></span>make_zero() <span class="overload">[1/2]</span></h2>
+<a id="a90028a415a05ce09073860e5c761aa6f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a90028a415a05ce09073860e5c761aa6f">&#9670;&nbsp;</a></span>make_Coord_from_shape()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Shape_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; cutlass::make_Coord_from_shape </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa03883e612d292e1b53eedd46e08ccd1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa03883e612d292e1b53eedd46e08ccd1">&#9670;&nbsp;</a></span>make_zero() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -1388,7 +970,7 @@ template&lt;typename value_t &gt; </div>
 template&lt;typename Scalar_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void cutlass::make_zero </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::make_zero </td>
           <td>(</td>
           <td class="paramtype">Scalar_ &amp;&#160;</td>
           <td class="paramname"><em>x</em></td><td>)</td>
@@ -1399,8 +981,8 @@ template&lt;typename Scalar_ &gt; </div>
 
 </div>
 </div>
-<a id="abc5c00b4986db5a114e774cee9999717"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abc5c00b4986db5a114e774cee9999717">&#9670;&nbsp;</a></span>make_zero() <span class="overload">[2/2]</span></h2>
+<a id="a55b5b15eadf125d5ddddee1ea22191ee"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a55b5b15eadf125d5ddddee1ea22191ee">&#9670;&nbsp;</a></span>make_zero() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -1408,7 +990,7 @@ template&lt;typename Scalar_ &gt; </div>
 template&lt;typename Scalar_ , int kLanes_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void cutlass::make_zero </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void cutlass::make_zero </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; Scalar_, kLanes_ &gt; &amp;&#160;</td>
           <td class="paramname"><em>vec</em></td><td>)</td>
@@ -1417,6 +999,354 @@ template&lt;typename Scalar_ , int kLanes_&gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="adad916101ca58fc9714362c611a0cad8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adad916101ca58fc9714362c611a0cad8">&#9670;&nbsp;</a></span>make_ZipConvert()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First , typename Second &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1ZipConvert.html">ZipConvert</a>&lt;First, Second&gt; cutlass::make_ZipConvert </td>
+          <td>(</td>
+          <td class="paramtype">First const &amp;&#160;</td>
+          <td class="paramname"><em>first</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Second const &amp;&#160;</td>
+          <td class="paramname"><em>second</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a07b0da6c47bbd827779aa871249ff4b6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a07b0da6c47bbd827779aa871249ff4b6">&#9670;&nbsp;</a></span>make_ZipFragment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First , typename Second &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt;First, Second&gt; cutlass::make_ZipFragment </td>
+          <td>(</td>
+          <td class="paramtype">First const &amp;&#160;</td>
+          <td class="paramname"><em>first</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Second const &amp;&#160;</td>
+          <td class="paramname"><em>second</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a64869d4ab18d70dc8604098ec03e1a5a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a64869d4ab18d70dc8604098ec03e1a5a">&#9670;&nbsp;</a></span>make_ZipTensorRef()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First , typename Second &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt;First, Second&gt; cutlass::make_ZipTensorRef </td>
+          <td>(</td>
+          <td class="paramtype">First const &amp;&#160;</td>
+          <td class="paramname"><em>first</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Second const &amp;&#160;</td>
+          <td class="paramname"><em>second</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="afe231b125bbb1e9aa51307a8abdf9a60"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afe231b125bbb1e9aa51307a8abdf9a60">&#9670;&nbsp;</a></span>operator&lt;&lt;() <span class="overload">[1/7]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">std::ostream&amp; cutlass::operator&lt;&lt; </td>
+          <td>(</td>
+          <td class="paramtype">std::ostream &amp;&#160;</td>
+          <td class="paramname"><em>out</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a30ddfc5e90b9103840cb30c9f9b96b49"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a30ddfc5e90b9103840cb30c9f9b96b49">&#9670;&nbsp;</a></span>operator&lt;&lt;() <span class="overload">[2/7]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">std::ostream&amp; cutlass::operator&lt;&lt; </td>
+          <td>(</td>
+          <td class="paramtype">std::ostream &amp;&#160;</td>
+          <td class="paramname"><em>out</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>scalar</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a36690681ed19dc7e398fcdafdbfe9975"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a36690681ed19dc7e398fcdafdbfe9975">&#9670;&nbsp;</a></span>operator&lt;&lt;() <span class="overload">[3/7]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">std::ostream&amp; cutlass::operator&lt;&lt; </td>
+          <td>(</td>
+          <td class="paramtype">std::ostream &amp;&#160;</td>
+          <td class="paramname"><em>out</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; int8_t &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>scalar</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1a35d6b9b984a9c143957db733a93f51"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1a35d6b9b984a9c143957db733a93f51">&#9670;&nbsp;</a></span>operator&lt;&lt;() <span class="overload">[4/7]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">std::ostream&amp; cutlass::operator&lt;&lt; </td>
+          <td>(</td>
+          <td class="paramtype">std::ostream &amp;&#160;</td>
+          <td class="paramname"><em>out</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; uint8_t &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>scalar</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a2fd306c63f71877f9231a7e1265752cf"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2fd306c63f71877f9231a7e1265752cf">&#9670;&nbsp;</a></span>operator&lt;&lt;() <span class="overload">[5/7]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">std::ostream&amp; cutlass::operator&lt;&lt; </td>
+          <td>(</td>
+          <td class="paramtype">std::ostream &amp;&#160;</td>
+          <td class="paramname"><em>out</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">cutlass::bin1_t</a>, 32 &gt; &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>scalar</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aecf2cd62eee939946b7173a110ecf76e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aecf2cd62eee939946b7173a110ecf76e">&#9670;&nbsp;</a></span>operator&lt;&lt;() <span class="overload">[6/7]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">std::ostream&amp; cutlass::operator&lt;&lt; </td>
+          <td>(</td>
+          <td class="paramtype">std::ostream &amp;&#160;</td>
+          <td class="paramname"><em>out</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">cutlass::int4_t</a>, 8 &gt; &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>scalar</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3ceda5ed2d923222662a37e8f355c9b8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3ceda5ed2d923222662a37e8f355c9b8">&#9670;&nbsp;</a></span>operator&lt;&lt;() <span class="overload">[7/7]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">std::ostream&amp; cutlass::operator&lt;&lt; </td>
+          <td>(</td>
+          <td class="paramtype">std::ostream &amp;&#160;</td>
+          <td class="paramname"><em>out</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">cutlass::uint4_t</a>, 8 &gt; &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>scalar</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a17c8c408d672d26f1c70d2435f6ac83e"></a>
@@ -1448,108 +1378,12 @@ template&lt;typename dividend_t , typename divisor_t &gt; </div>
 </div><div class="memdoc">
 <p>Round dividend up to the nearest multiple of divisor </p>
 
-</div>
-</div>
-<a id="abcec976c59cab75ca55b338d125154a3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abcec976c59cab75ca55b338d125154a3">&#9670;&nbsp;</a></span>shared_iterator_load() <span class="overload">[1/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename InputIterator , typename Fragment &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE void cutlass::shared_iterator_load </td>
-          <td>(</td>
-          <td class="paramtype">InputIterator &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aa9416026c6db08d92a34c2ac08fea8c3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa9416026c6db08d92a34c2ac08fea8c3">&#9670;&nbsp;</a></span>shared_iterator_load() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename InputIterator , typename Fragment &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE void cutlass::shared_iterator_load </td>
-          <td>(</td>
-          <td class="paramtype">InputIterator &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">int&#160;</td>
-          <td class="paramname"><em>d</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a705c6d75513e112d2731d1c40f4cf109"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a705c6d75513e112d2731d1c40f4cf109">&#9670;&nbsp;</a></span>shared_iterator_store()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename OutputIterator , typename Fragment &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE void cutlass::shared_iterator_store </td>
-          <td>(</td>
-          <td class="paramtype">OutputIterator &amp;&#160;</td>
-          <td class="paramname"><em>iterator</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Fragment.html">Fragment</a> const &amp;&#160;</td>
-          <td class="paramname"><em>fragment</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
 </div>
 </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/namespacecutlass_1_1detail.html b/docs/namespacecutlass_1_1detail.html
new file mode 100644
index 000000000..154ce5c45
--- /dev/null
+++ b/docs/namespacecutlass_1_1detail.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::detail Namespace Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1detail.html">detail</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::detail Namespace Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/namespacecutlass_1_1gemm.html b/docs/namespacecutlass_1_1gemm.html
index 1c84e4480..1545f43f4 100644
--- a/docs/namespacecutlass_1_1gemm.html
+++ b/docs/namespacecutlass_1_1gemm.html
@@ -84,19 +84,28 @@ $(function() {
 Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">ColumnMajorBlockSwizzle</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html">DgemmConfig</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html">DgemmTraits</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">Fp16SgemmConfig</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html">Fp16SgemmSgemmTraits</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html">FragmentMultiplyAdd&lt; half &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">FragmentMultiplyAdd&lt; half, half, true &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM problem description.  <a href="structcutlass_1_1gemm_1_1GemmDesc.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -151,7 +160,8 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">GlobalLoadStreamBase</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Collect the global load streams for multiplicands.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -187,9 +197,7 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01AccumulatorsPerThread___01_4.html">IgemmConfig&lt; OutputTile_, int8_t, AccumulatorsPerThread_ &gt;</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html">IgemmContiguousGlobalTileTraits</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html">IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -205,6 +213,8 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html">IgemmFloatToInt8Converter</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">IgemmGlobalLoadTransformer</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html">IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;</a></td></tr>
@@ -213,6 +223,8 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html">IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html">IgemmInt8ToFloatConverter</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">IgemmSharedStoreTransformer</a></td></tr>
@@ -221,11 +233,15 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html">IgemmTraits</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -243,9 +259,17 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html">IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html">Launch</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Partial specialization for launching the GEMM kernel with or without launch bounds.  <a href="structcutlass_1_1gemm_1_1Launch.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html">Launch&lt; Gemm, false &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Partial specialization for launching the GEMM kernel with or without launch bounds.  <a href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Functor to compute linear combination of fragments.  <a href="structcutlass_1_1gemm_1_1LinearScaling.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">LinearScalingDevicePtr</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand.html">ProjectOperand</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html">ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;</a></td></tr>
@@ -264,26 +288,39 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html">ReshapeThreads&lt; Tile_, Threads_, true &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">RowMajorBlockSwizzle</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html">SgemmConfig</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html">SgemmLBTraits</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to define SGEMM traits using <a class="el" href="structcutlass_1_1gemm_1_1Launch.html" title="Partial specialization for launching the GEMM kernel with or without launch bounds. ">Launch</a> Bounds.  <a href="structcutlass_1_1gemm_1_1SgemmLBTraits.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html">SgemmTraits</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Collect the global load streams for multiplicands.  <a href="structcutlass_1_1gemm_1_1SharedStreamPair.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html">swizzleDirection</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#details">More...</a><br /></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html">ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#details">More...</a><br /></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -292,18 +329,29 @@ Classes</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
 Functions</h2></td></tr>
-<tr class="memitem:ad9577c9086b0f7fd1202d7f8109e4439"><td class="memTemplParams" colspan="2">template&lt;typename Gemm_ &gt; </td></tr>
-<tr class="memitem:ad9577c9086b0f7fd1202d7f8109e4439"><td class="memTemplItemLeft" align="right" valign="top">__global__ void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#ad9577c9086b0f7fd1202d7f8109e4439">gemm_kernel</a> (typename Gemm_::Params params)</td></tr>
-<tr class="separator:ad9577c9086b0f7fd1202d7f8109e4439"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a01dd61085e2b3f578a7fc266b94fac55"><td class="memTemplParams" colspan="2">template&lt;typename Gemm_ &gt; </td></tr>
+<tr class="memitem:a01dd61085e2b3f578a7fc266b94fac55"><td class="memTemplItemLeft" align="right" valign="top">__global__&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55">__launch_bounds__</a> (Gemm_::kThreads) void gemm_kernel(typename Gemm_</td></tr>
+<tr class="memdesc:a01dd61085e2b3f578a7fc266b94fac55"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM kernel with launch bounds specified.  <a href="#a01dd61085e2b3f578a7fc266b94fac55">More...</a><br /></td></tr>
+<tr class="separator:a01dd61085e2b3f578a7fc266b94fac55"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae23b870e60261e2322f3c6edb3d2bcb9"><td class="memTemplParams" colspan="2">template&lt;typename Gemm_ &gt; </td></tr>
+<tr class="memitem:ae23b870e60261e2322f3c6edb3d2bcb9"><td class="memTemplItemLeft" align="right" valign="top">__global__ void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9">gemm_kernel_nolb</a> (typename Gemm_::Params params)</td></tr>
+<tr class="memdesc:ae23b870e60261e2322f3c6edb3d2bcb9"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM kernel without launch bounds specified.  <a href="#ae23b870e60261e2322f3c6edb3d2bcb9">More...</a><br /></td></tr>
+<tr class="separator:ae23b870e60261e2322f3c6edb3d2bcb9"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a3e30ae89e6f7501725028144cd2d88cb"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
 <tr class="memitem:a3e30ae89e6f7501725028144cd2d88cb"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">is_zero</a> (T x)</td></tr>
 <tr class="separator:a3e30ae89e6f7501725028144cd2d88cb"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a4a12fcfae60f26efa47bf0a79483d8ac"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a4a12fcfae60f26efa47bf0a79483d8ac">is_zero</a> (half x)</td></tr>
 <tr class="separator:a4a12fcfae60f26efa47bf0a79483d8ac"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2336880c866ef4e73bbe0c3dbcb6c40e"><td class="memTemplParams" colspan="2">template&lt;enum swizzleDirection::Kind &gt; </td></tr>
+<tr class="memitem:a2336880c866ef4e73bbe0c3dbcb6c40e"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE int&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e">getLinearIdx</a> (int groups)</td></tr>
+<tr class="separator:a2336880c866ef4e73bbe0c3dbcb6c40e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a37c566ad59d61647374f215c3d33f088"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a37c566ad59d61647374f215c3d33f088"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE int&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a37c566ad59d61647374f215c3d33f088">getLinearIdx&lt; swizzleDirection::Boustrophedon &gt;</a> (int groups)</td></tr>
+<tr class="separator:a37c566ad59d61647374f215c3d33f088"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Function Documentation</h2>
-<a id="ad9577c9086b0f7fd1202d7f8109e4439"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad9577c9086b0f7fd1202d7f8109e4439">&#9670;&nbsp;</a></span>gemm_kernel()</h2>
+<a id="a01dd61085e2b3f578a7fc266b94fac55"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a01dd61085e2b3f578a7fc266b94fac55">&#9670;&nbsp;</a></span>__launch_bounds__()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -311,7 +359,27 @@ Functions</h2></td></tr>
 template&lt;typename Gemm_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">__global__ void cutlass::gemm::gemm_kernel </td>
+          <td class="memname">__global__ cutlass::gemm::__launch_bounds__ </td>
+          <td>(</td>
+          <td class="paramtype">Gemm_::kThreads&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae23b870e60261e2322f3c6edb3d2bcb9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae23b870e60261e2322f3c6edb3d2bcb9">&#9670;&nbsp;</a></span>gemm_kernel_nolb()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Gemm_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">__global__ void cutlass::gemm::gemm_kernel_nolb </td>
           <td>(</td>
           <td class="paramtype">typename Gemm_::Params&#160;</td>
           <td class="paramname"><em>params</em></td><td>)</td>
@@ -320,6 +388,46 @@ template&lt;typename Gemm_ &gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a2336880c866ef4e73bbe0c3dbcb6c40e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2336880c866ef4e73bbe0c3dbcb6c40e">&#9670;&nbsp;</a></span>getLinearIdx()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;enum swizzleDirection::Kind &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE int cutlass::gemm::getLinearIdx </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>groups</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a37c566ad59d61647374f215c3d33f088"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a37c566ad59d61647374f215c3d33f088">&#9670;&nbsp;</a></span>getLinearIdx&lt; swizzleDirection::Boustrophedon &gt;()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE int <a class="el" href="namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e">cutlass::gemm::getLinearIdx</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa">swizzleDirection::Boustrophedon</a> &gt; </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>groups</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a3e30ae89e6f7501725028144cd2d88cb"></a>
@@ -363,7 +471,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/namespacecutlass_1_1platform.html b/docs/namespacecutlass_1_1platform.html
index 2bf30c0df..b62a896a7 100644
--- a/docs/namespacecutlass_1_1platform.html
+++ b/docs/namespacecutlass_1_1platform.html
@@ -122,6 +122,8 @@ Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1platform_1_1bool__constant.html">bool_constant</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">std::bool_constant  <a href="structcutlass_1_1platform_1_1bool__constant.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1platform_1_1conditional.html">conditional</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">std::conditional (true specialization)  <a href="structcutlass_1_1platform_1_1conditional.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -256,6 +258,157 @@ Typedefs</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
 Functions</h2></td></tr>
+<tr class="memitem:a25a36d44c7b9f182eb404a3251cd4f39"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">real</a> (cuFloatComplex const &amp;z)</td></tr>
+<tr class="memdesc:a25a36d44c7b9f182eb404a3251cd4f39"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="#a25a36d44c7b9f182eb404a3251cd4f39">More...</a><br /></td></tr>
+<tr class="separator:a25a36d44c7b9f182eb404a3251cd4f39"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa9b17e4705337452761c0d3bd5edfc67"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa9b17e4705337452761c0d3bd5edfc67">real</a> (cuFloatComplex &amp;z)</td></tr>
+<tr class="memdesc:aa9b17e4705337452761c0d3bd5edfc67"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="#aa9b17e4705337452761c0d3bd5edfc67">More...</a><br /></td></tr>
+<tr class="separator:aa9b17e4705337452761c0d3bd5edfc67"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1f13c0049c5f94b0480c619612608f7b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a1f13c0049c5f94b0480c619612608f7b">real</a> (cuDoubleComplex const &amp;z)</td></tr>
+<tr class="memdesc:a1f13c0049c5f94b0480c619612608f7b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="#a1f13c0049c5f94b0480c619612608f7b">More...</a><br /></td></tr>
+<tr class="separator:a1f13c0049c5f94b0480c619612608f7b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3365c0200a034973b7baecede9728239"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a3365c0200a034973b7baecede9728239">real</a> (cuDoubleComplex &amp;z)</td></tr>
+<tr class="memdesc:a3365c0200a034973b7baecede9728239"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="#a3365c0200a034973b7baecede9728239">More...</a><br /></td></tr>
+<tr class="separator:a3365c0200a034973b7baecede9728239"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a18bc43cfdc4d066a6c10ad2002196ee6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">imag</a> (cuFloatComplex const &amp;z)</td></tr>
+<tr class="memdesc:a18bc43cfdc4d066a6c10ad2002196ee6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="#a18bc43cfdc4d066a6c10ad2002196ee6">More...</a><br /></td></tr>
+<tr class="separator:a18bc43cfdc4d066a6c10ad2002196ee6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af127cab494309510051d6b45914faf33"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#af127cab494309510051d6b45914faf33">imag</a> (cuFloatComplex &amp;z)</td></tr>
+<tr class="memdesc:af127cab494309510051d6b45914faf33"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="#af127cab494309510051d6b45914faf33">More...</a><br /></td></tr>
+<tr class="separator:af127cab494309510051d6b45914faf33"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1739f880ca8398f808ee57a3f0c3c30b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a1739f880ca8398f808ee57a3f0c3c30b">imag</a> (cuDoubleComplex const &amp;z)</td></tr>
+<tr class="memdesc:a1739f880ca8398f808ee57a3f0c3c30b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="#a1739f880ca8398f808ee57a3f0c3c30b">More...</a><br /></td></tr>
+<tr class="separator:a1739f880ca8398f808ee57a3f0c3c30b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f356af3c5828b7d31279a5d075c5bc9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a8f356af3c5828b7d31279a5d075c5bc9">imag</a> (cuDoubleComplex &amp;z)</td></tr>
+<tr class="memdesc:a8f356af3c5828b7d31279a5d075c5bc9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="#a8f356af3c5828b7d31279a5d075c5bc9">More...</a><br /></td></tr>
+<tr class="separator:a8f356af3c5828b7d31279a5d075c5bc9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a01e98d1c13ac9384f2bdc407fce6131b"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a01e98d1c13ac9384f2bdc407fce6131b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const  &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a01e98d1c13ac9384f2bdc407fce6131b">real</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a01e98d1c13ac9384f2bdc407fce6131b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="#a01e98d1c13ac9384f2bdc407fce6131b">More...</a><br /></td></tr>
+<tr class="separator:a01e98d1c13ac9384f2bdc407fce6131b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa5cfa5849e12b745236485dd2db5f854"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aa5cfa5849e12b745236485dd2db5f854"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa5cfa5849e12b745236485dd2db5f854">real</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;z)</td></tr>
+<tr class="memdesc:aa5cfa5849e12b745236485dd2db5f854"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the real part of the complex number.  <a href="#aa5cfa5849e12b745236485dd2db5f854">More...</a><br /></td></tr>
+<tr class="separator:aa5cfa5849e12b745236485dd2db5f854"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a714db927a811c86cda26fc12ca830356"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a714db927a811c86cda26fc12ca830356"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const  &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a714db927a811c86cda26fc12ca830356">imag</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a714db927a811c86cda26fc12ca830356"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="#a714db927a811c86cda26fc12ca830356">More...</a><br /></td></tr>
+<tr class="separator:a714db927a811c86cda26fc12ca830356"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa35ea4f804f9ed39578b595ba2620c1d"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aa35ea4f804f9ed39578b595ba2620c1d"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa35ea4f804f9ed39578b595ba2620c1d">imag</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;z)</td></tr>
+<tr class="memdesc:aa35ea4f804f9ed39578b595ba2620c1d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the imaginary part of the complex number.  <a href="#aa35ea4f804f9ed39578b595ba2620c1d">More...</a><br /></td></tr>
+<tr class="separator:aa35ea4f804f9ed39578b595ba2620c1d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab4c3e4eabba020d7a9faf86ee6cf437a"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ab4c3e4eabba020d7a9faf86ee6cf437a"><td class="memTemplItemLeft" align="right" valign="top">std::ostream &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#ab4c3e4eabba020d7a9faf86ee6cf437a">operator&lt;&lt;</a> (std::ostream &amp;out, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="separator:ab4c3e4eabba020d7a9faf86ee6cf437a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a043e8559161ee0fcaf943a1dfe1a9cbb"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a043e8559161ee0fcaf943a1dfe1a9cbb"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">operator==</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a043e8559161ee0fcaf943a1dfe1a9cbb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Equality operator.  <a href="#a043e8559161ee0fcaf943a1dfe1a9cbb">More...</a><br /></td></tr>
+<tr class="separator:a043e8559161ee0fcaf943a1dfe1a9cbb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa8b8911c3529ee9d433b0c4d90bde50c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aa8b8911c3529ee9d433b0c4d90bde50c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">operator!=</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:aa8b8911c3529ee9d433b0c4d90bde50c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Inequality operator.  <a href="#aa8b8911c3529ee9d433b0c4d90bde50c">More...</a><br /></td></tr>
+<tr class="separator:aa8b8911c3529ee9d433b0c4d90bde50c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a93b0f0d73fa3cf11c5018460b257837c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a93b0f0d73fa3cf11c5018460b257837c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c">operator+</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a93b0f0d73fa3cf11c5018460b257837c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Addition.  <a href="#a93b0f0d73fa3cf11c5018460b257837c">More...</a><br /></td></tr>
+<tr class="separator:a93b0f0d73fa3cf11c5018460b257837c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa486433971cdd6b7648c1e5459c42763"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aa486433971cdd6b7648c1e5459c42763"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763">operator-</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:aa486433971cdd6b7648c1e5459c42763"><td class="mdescLeft">&#160;</td><td class="mdescRight">Subtraction.  <a href="#aa486433971cdd6b7648c1e5459c42763">More...</a><br /></td></tr>
+<tr class="separator:aa486433971cdd6b7648c1e5459c42763"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a34950f01ed89108b1d79c651aa58ecba"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a34950f01ed89108b1d79c651aa58ecba"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba">operator*</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a34950f01ed89108b1d79c651aa58ecba"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiplication.  <a href="#a34950f01ed89108b1d79c651aa58ecba">More...</a><br /></td></tr>
+<tr class="separator:a34950f01ed89108b1d79c651aa58ecba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aef5da2c88431ab40b58fdd6afea13dba"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:aef5da2c88431ab40b58fdd6afea13dba"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#aef5da2c88431ab40b58fdd6afea13dba">operator*</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;lhs, T const &amp;s)</td></tr>
+<tr class="memdesc:aef5da2c88431ab40b58fdd6afea13dba"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar Multiplication.  <a href="#aef5da2c88431ab40b58fdd6afea13dba">More...</a><br /></td></tr>
+<tr class="separator:aef5da2c88431ab40b58fdd6afea13dba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a289b6e31bdc0be1302b8dbab55eb568c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a289b6e31bdc0be1302b8dbab55eb568c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a289b6e31bdc0be1302b8dbab55eb568c">operator*</a> (T const &amp;s, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a289b6e31bdc0be1302b8dbab55eb568c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar Multiplication.  <a href="#a289b6e31bdc0be1302b8dbab55eb568c">More...</a><br /></td></tr>
+<tr class="separator:a289b6e31bdc0be1302b8dbab55eb568c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4fe79c19fb599cd9b85d08676a711f9f"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a4fe79c19fb599cd9b85d08676a711f9f"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">operator/</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a4fe79c19fb599cd9b85d08676a711f9f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Division.  <a href="#a4fe79c19fb599cd9b85d08676a711f9f">More...</a><br /></td></tr>
+<tr class="separator:a4fe79c19fb599cd9b85d08676a711f9f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a33f75d77ff629335c9666128837c4581"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a33f75d77ff629335c9666128837c4581"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a33f75d77ff629335c9666128837c4581">operator/</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;lhs, T const &amp;s)</td></tr>
+<tr class="memdesc:a33f75d77ff629335c9666128837c4581"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar Division.  <a href="#a33f75d77ff629335c9666128837c4581">More...</a><br /></td></tr>
+<tr class="separator:a33f75d77ff629335c9666128837c4581"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae302b414576ecb5afb0cdfdda6b30ad3"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ae302b414576ecb5afb0cdfdda6b30ad3"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#ae302b414576ecb5afb0cdfdda6b30ad3">operator/</a> (T const &amp;s, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:ae302b414576ecb5afb0cdfdda6b30ad3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar divided by complex.  <a href="#ae302b414576ecb5afb0cdfdda6b30ad3">More...</a><br /></td></tr>
+<tr class="separator:ae302b414576ecb5afb0cdfdda6b30ad3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a34c5ca341da805d5d1bc703c53c96d9d"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a34c5ca341da805d5d1bc703c53c96d9d"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d">operator+=</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a34c5ca341da805d5d1bc703c53c96d9d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Addition.  <a href="#a34c5ca341da805d5d1bc703c53c96d9d">More...</a><br /></td></tr>
+<tr class="separator:a34c5ca341da805d5d1bc703c53c96d9d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abff9e10130849ea46f6245f4e8cc2cc9"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:abff9e10130849ea46f6245f4e8cc2cc9"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9">operator-=</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:abff9e10130849ea46f6245f4e8cc2cc9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Subtraction.  <a href="#abff9e10130849ea46f6245f4e8cc2cc9">More...</a><br /></td></tr>
+<tr class="separator:abff9e10130849ea46f6245f4e8cc2cc9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9a4928ab582beee4e7ddd337529d45ac"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a9a4928ab582beee4e7ddd337529d45ac"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac">operator*=</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:a9a4928ab582beee4e7ddd337529d45ac"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiplication.  <a href="#a9a4928ab582beee4e7ddd337529d45ac">More...</a><br /></td></tr>
+<tr class="separator:a9a4928ab582beee4e7ddd337529d45ac"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a21adde191e48e604908ce886690c6d6b"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a21adde191e48e604908ce886690c6d6b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a21adde191e48e604908ce886690c6d6b">operator*=</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;lhs, T s)</td></tr>
+<tr class="memdesc:a21adde191e48e604908ce886690c6d6b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar multiplication.  <a href="#a21adde191e48e604908ce886690c6d6b">More...</a><br /></td></tr>
+<tr class="separator:a21adde191e48e604908ce886690c6d6b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac594526ef64ecf364ae957753ce64b40"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ac594526ef64ecf364ae957753ce64b40"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40">operator/=</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;lhs, <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;rhs)</td></tr>
+<tr class="memdesc:ac594526ef64ecf364ae957753ce64b40"><td class="mdescLeft">&#160;</td><td class="mdescRight">Division.  <a href="#ac594526ef64ecf364ae957753ce64b40">More...</a><br /></td></tr>
+<tr class="separator:ac594526ef64ecf364ae957753ce64b40"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1fbf209c41242b3f605ac220c39e8fd5"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a1fbf209c41242b3f605ac220c39e8fd5"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5">abs</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a1fbf209c41242b3f605ac220c39e8fd5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the magnitude of the complex number.  <a href="#a1fbf209c41242b3f605ac220c39e8fd5">More...</a><br /></td></tr>
+<tr class="separator:a1fbf209c41242b3f605ac220c39e8fd5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8a1a03766dbd2c2ce10b10498f281bf0"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a8a1a03766dbd2c2ce10b10498f281bf0"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0">arg</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a8a1a03766dbd2c2ce10b10498f281bf0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the magnitude of the complex number.  <a href="#a8a1a03766dbd2c2ce10b10498f281bf0">More...</a><br /></td></tr>
+<tr class="separator:a8a1a03766dbd2c2ce10b10498f281bf0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9d631b040eea94d9b5af04faa5c20bb1"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a9d631b040eea94d9b5af04faa5c20bb1"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">norm</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a9d631b040eea94d9b5af04faa5c20bb1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the squared magnitude.  <a href="#a9d631b040eea94d9b5af04faa5c20bb1">More...</a><br /></td></tr>
+<tr class="separator:a9d631b040eea94d9b5af04faa5c20bb1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7167baf0f7fcf52471c0413f084d98d4"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a7167baf0f7fcf52471c0413f084d98d4"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4">conj</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a7167baf0f7fcf52471c0413f084d98d4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the complex conjugate.  <a href="#a7167baf0f7fcf52471c0413f084d98d4">More...</a><br /></td></tr>
+<tr class="separator:a7167baf0f7fcf52471c0413f084d98d4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4e57cfad9bf0b78e338d536ff1bdda39"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a4e57cfad9bf0b78e338d536ff1bdda39"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39">proj</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a4e57cfad9bf0b78e338d536ff1bdda39"><td class="mdescLeft">&#160;</td><td class="mdescRight">Projects the complex number z onto the Riemann sphere.  <a href="#a4e57cfad9bf0b78e338d536ff1bdda39">More...</a><br /></td></tr>
+<tr class="separator:a4e57cfad9bf0b78e338d536ff1bdda39"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6c9200b03868a5090027e5cfc8e27c62"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a6c9200b03868a5090027e5cfc8e27c62"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62">polar</a> (T const &amp;r, T const &amp;theta=T())</td></tr>
+<tr class="memdesc:a6c9200b03868a5090027e5cfc8e27c62"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a complex number with magnitude r and phase theta.  <a href="#a6c9200b03868a5090027e5cfc8e27c62">More...</a><br /></td></tr>
+<tr class="separator:a6c9200b03868a5090027e5cfc8e27c62"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1a6ab5742404272f76faeaf22f3ec11b"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a1a6ab5742404272f76faeaf22f3ec11b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">exp</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a1a6ab5742404272f76faeaf22f3ec11b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the complex exponential of z.  <a href="#a1a6ab5742404272f76faeaf22f3ec11b">More...</a><br /></td></tr>
+<tr class="separator:a1a6ab5742404272f76faeaf22f3ec11b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adc1afc18e182f42f72210e2203ba293c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:adc1afc18e182f42f72210e2203ba293c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">log</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:adc1afc18e182f42f72210e2203ba293c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the complex exponential of z.  <a href="#adc1afc18e182f42f72210e2203ba293c">More...</a><br /></td></tr>
+<tr class="separator:adc1afc18e182f42f72210e2203ba293c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a62dd6ae0e1b4476fd62ac70c26f12a06"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a62dd6ae0e1b4476fd62ac70c26f12a06"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06">log10</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a62dd6ae0e1b4476fd62ac70c26f12a06"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the complex exponential of z.  <a href="#a62dd6ae0e1b4476fd62ac70c26f12a06">More...</a><br /></td></tr>
+<tr class="separator:a62dd6ae0e1b4476fd62ac70c26f12a06"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a81308ccea406262e143e27193cbdf747"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a81308ccea406262e143e27193cbdf747"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">sqrt</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a81308ccea406262e143e27193cbdf747"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the square root of complex number z.  <a href="#a81308ccea406262e143e27193cbdf747">More...</a><br /></td></tr>
+<tr class="separator:a81308ccea406262e143e27193cbdf747"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae0ad2891ed2be526d97bc5665d5c0a92"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ae0ad2891ed2be526d97bc5665d5c0a92"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">cos</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:ae0ad2891ed2be526d97bc5665d5c0a92"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the cosine of complex z.  <a href="#ae0ad2891ed2be526d97bc5665d5c0a92">More...</a><br /></td></tr>
+<tr class="separator:ae0ad2891ed2be526d97bc5665d5c0a92"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3c5dc10135c54b3b212c9e107ba1476a"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a3c5dc10135c54b3b212c9e107ba1476a"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">sin</a> (<a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;z)</td></tr>
+<tr class="memdesc:a3c5dc10135c54b3b212c9e107ba1476a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the sin of complex z.  <a href="#a3c5dc10135c54b3b212c9e107ba1476a">More...</a><br /></td></tr>
+<tr class="separator:a3c5dc10135c54b3b212c9e107ba1476a"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a57c071d2a7305dd4ec60542e66b0c81c"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
 <tr class="memitem:a57c071d2a7305dd4ec60542e66b0c81c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> const T &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">min</a> (const T &amp;a, const T &amp;b)</td></tr>
 <tr class="memdesc:a57c071d2a7305dd4ec60542e66b0c81c"><td class="mdescLeft">&#160;</td><td class="mdescRight">std::min  <a href="#a57c071d2a7305dd4ec60542e66b0c81c">More...</a><br /></td></tr>
@@ -399,8 +552,8 @@ template&lt;&gt; </div>
 
 </div>
 </div>
-<a id="ae792b1c7ada1a33e306cd552f583bdce"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae792b1c7ada1a33e306cd552f583bdce">&#9670;&nbsp;</a></span>__align__() <span class="overload">[3/13]</span></h2>
+<a id="a71be5af25eeffa4077777f919e67d8da"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a71be5af25eeffa4077777f919e67d8da">&#9670;&nbsp;</a></span>__align__() <span class="overload">[3/13]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -410,7 +563,7 @@ template&lt;&gt; </div>
         <tr>
           <td class="memname">struct cutlass::platform::__align__ </td>
           <td>(</td>
-          <td class="paramtype">64&#160;</td>
+          <td class="paramtype">4&#160;</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
         </tr>
@@ -419,8 +572,8 @@ template&lt;&gt; </div>
 
 </div>
 </div>
-<a id="a5712ec4fed335a9b7f863fb3abe3c5eb"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5712ec4fed335a9b7f863fb3abe3c5eb">&#9670;&nbsp;</a></span>__align__() <span class="overload">[4/13]</span></h2>
+<a id="a42440254a16d4b6b95b95cc3360ee372"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a42440254a16d4b6b95b95cc3360ee372">&#9670;&nbsp;</a></span>__align__() <span class="overload">[4/13]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -430,7 +583,7 @@ template&lt;&gt; </div>
         <tr>
           <td class="memname">struct cutlass::platform::__align__ </td>
           <td>(</td>
-          <td class="paramtype">128&#160;</td>
+          <td class="paramtype">8&#160;</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
         </tr>
@@ -439,8 +592,8 @@ template&lt;&gt; </div>
 
 </div>
 </div>
-<a id="a595cc98db29fb4d59772d2e2f52e347a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a595cc98db29fb4d59772d2e2f52e347a">&#9670;&nbsp;</a></span>__align__() <span class="overload">[5/13]</span></h2>
+<a id="a91d5e970d6ebe619914f40a9510bdb1e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a91d5e970d6ebe619914f40a9510bdb1e">&#9670;&nbsp;</a></span>__align__() <span class="overload">[5/13]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -450,7 +603,7 @@ template&lt;&gt; </div>
         <tr>
           <td class="memname">struct cutlass::platform::__align__ </td>
           <td>(</td>
-          <td class="paramtype">256&#160;</td>
+          <td class="paramtype">16&#160;</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
         </tr>
@@ -477,10 +630,90 @@ template&lt;&gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a210f4d360b1f9c3d074e71129fe4c0d9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a210f4d360b1f9c3d074e71129fe4c0d9">&#9670;&nbsp;</a></span>__align__() <span class="overload">[7/13]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">struct cutlass::platform::__align__ </td>
+          <td>(</td>
+          <td class="paramtype">32&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae792b1c7ada1a33e306cd552f583bdce"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae792b1c7ada1a33e306cd552f583bdce">&#9670;&nbsp;</a></span>__align__() <span class="overload">[8/13]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">struct cutlass::platform::__align__ </td>
+          <td>(</td>
+          <td class="paramtype">64&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5712ec4fed335a9b7f863fb3abe3c5eb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5712ec4fed335a9b7f863fb3abe3c5eb">&#9670;&nbsp;</a></span>__align__() <span class="overload">[9/13]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">struct cutlass::platform::__align__ </td>
+          <td>(</td>
+          <td class="paramtype">128&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a595cc98db29fb4d59772d2e2f52e347a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a595cc98db29fb4d59772d2e2f52e347a">&#9670;&nbsp;</a></span>__align__() <span class="overload">[10/13]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">struct cutlass::platform::__align__ </td>
+          <td>(</td>
+          <td class="paramtype">256&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a181e44e9c66f704175590727aaa9e5a1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a181e44e9c66f704175590727aaa9e5a1">&#9670;&nbsp;</a></span>__align__() <span class="overload">[7/13]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#a181e44e9c66f704175590727aaa9e5a1">&#9670;&nbsp;</a></span>__align__() <span class="overload">[11/13]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -500,7 +733,7 @@ template&lt;&gt; </div>
 </div>
 </div>
 <a id="ae72c8fa997bb251d4140dceb03147154"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae72c8fa997bb251d4140dceb03147154">&#9670;&nbsp;</a></span>__align__() <span class="overload">[8/13]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#ae72c8fa997bb251d4140dceb03147154">&#9670;&nbsp;</a></span>__align__() <span class="overload">[12/13]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -520,7 +753,7 @@ template&lt;&gt; </div>
 </div>
 </div>
 <a id="ada29683f1b408ae7b73cc8fbe2108628"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ada29683f1b408ae7b73cc8fbe2108628">&#9670;&nbsp;</a></span>__align__() <span class="overload">[9/13]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#ada29683f1b408ae7b73cc8fbe2108628">&#9670;&nbsp;</a></span>__align__() <span class="overload">[13/13]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -539,19 +772,19 @@ template&lt;&gt; </div>
 
 </div>
 </div>
-<a id="a210f4d360b1f9c3d074e71129fe4c0d9"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a210f4d360b1f9c3d074e71129fe4c0d9">&#9670;&nbsp;</a></span>__align__() <span class="overload">[10/13]</span></h2>
+<a id="a1fbf209c41242b3f605ac220c39e8fd5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1fbf209c41242b3f605ac220c39e8fd5">&#9670;&nbsp;</a></span>abs()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;&gt; </div>
+template&lt;typename T &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">struct cutlass::platform::__align__ </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T cutlass::platform::abs </td>
           <td>(</td>
-          <td class="paramtype">32&#160;</td>
-          <td class="paramname"></td><td>)</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -559,19 +792,19 @@ template&lt;&gt; </div>
 
 </div>
 </div>
-<a id="a71be5af25eeffa4077777f919e67d8da"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a71be5af25eeffa4077777f919e67d8da">&#9670;&nbsp;</a></span>__align__() <span class="overload">[11/13]</span></h2>
+<a id="a8a1a03766dbd2c2ce10b10498f281bf0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8a1a03766dbd2c2ce10b10498f281bf0">&#9670;&nbsp;</a></span>arg()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;&gt; </div>
+template&lt;typename T &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">struct cutlass::platform::__align__ </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T cutlass::platform::arg </td>
           <td>(</td>
-          <td class="paramtype">4&#160;</td>
-          <td class="paramname"></td><td>)</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -579,19 +812,19 @@ template&lt;&gt; </div>
 
 </div>
 </div>
-<a id="a42440254a16d4b6b95b95cc3360ee372"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a42440254a16d4b6b95b95cc3360ee372">&#9670;&nbsp;</a></span>__align__() <span class="overload">[12/13]</span></h2>
+<a id="a7167baf0f7fcf52471c0413f084d98d4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7167baf0f7fcf52471c0413f084d98d4">&#9670;&nbsp;</a></span>conj()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;&gt; </div>
+template&lt;typename T &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">struct cutlass::platform::__align__ </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::conj </td>
           <td>(</td>
-          <td class="paramtype">8&#160;</td>
-          <td class="paramname"></td><td>)</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -599,19 +832,191 @@ template&lt;&gt; </div>
 
 </div>
 </div>
-<a id="a91d5e970d6ebe619914f40a9510bdb1e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a91d5e970d6ebe619914f40a9510bdb1e">&#9670;&nbsp;</a></span>__align__() <span class="overload">[13/13]</span></h2>
+<a id="ae0ad2891ed2be526d97bc5665d5c0a92"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae0ad2891ed2be526d97bc5665d5c0a92">&#9670;&nbsp;</a></span>cos()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;&gt; </div>
+template&lt;typename T &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">struct cutlass::platform::__align__ </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::cos </td>
           <td>(</td>
-          <td class="paramtype">16&#160;</td>
-          <td class="paramname"></td><td>)</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1a6ab5742404272f76faeaf22f3ec11b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1a6ab5742404272f76faeaf22f3ec11b">&#9670;&nbsp;</a></span>exp()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::exp </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a18bc43cfdc4d066a6c10ad2002196ee6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a18bc43cfdc4d066a6c10ad2002196ee6">&#9670;&nbsp;</a></span>imag() <span class="overload">[1/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float const&amp; cutlass::platform::imag </td>
+          <td>(</td>
+          <td class="paramtype">cuFloatComplex const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af127cab494309510051d6b45914faf33"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af127cab494309510051d6b45914faf33">&#9670;&nbsp;</a></span>imag() <span class="overload">[2/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float&amp; cutlass::platform::imag </td>
+          <td>(</td>
+          <td class="paramtype">cuFloatComplex &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1739f880ca8398f808ee57a3f0c3c30b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1739f880ca8398f808ee57a3f0c3c30b">&#9670;&nbsp;</a></span>imag() <span class="overload">[3/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double const&amp; cutlass::platform::imag </td>
+          <td>(</td>
+          <td class="paramtype">cuDoubleComplex const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8f356af3c5828b7d31279a5d075c5bc9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8f356af3c5828b7d31279a5d075c5bc9">&#9670;&nbsp;</a></span>imag() <span class="overload">[4/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double&amp; cutlass::platform::imag </td>
+          <td>(</td>
+          <td class="paramtype">cuDoubleComplex &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a714db927a811c86cda26fc12ca830356"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a714db927a811c86cda26fc12ca830356">&#9670;&nbsp;</a></span>imag() <span class="overload">[5/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const&amp; cutlass::platform::imag </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa35ea4f804f9ed39578b595ba2620c1d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa35ea4f804f9ed39578b595ba2620c1d">&#9670;&nbsp;</a></span>imag() <span class="overload">[6/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&amp; cutlass::platform::imag </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="adc1afc18e182f42f72210e2203ba293c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adc1afc18e182f42f72210e2203ba293c">&#9670;&nbsp;</a></span>log()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::log </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a62dd6ae0e1b4476fd62ac70c26f12a06"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a62dd6ae0e1b4476fd62ac70c26f12a06">&#9670;&nbsp;</a></span>log10()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::log10 </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -707,10 +1112,30 @@ template&lt;typename T &gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a9d631b040eea94d9b5af04faa5c20bb1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9d631b040eea94d9b5af04faa5c20bb1">&#9670;&nbsp;</a></span>norm()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T cutlass::platform::norm </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a248f49adf09654d2cd04bd2760ab2566"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a248f49adf09654d2cd04bd2760ab2566">&#9670;&nbsp;</a></span>operator!=()</h2>
+<h2 class="memtitle"><span class="permalink"><a href="#a248f49adf09654d2cd04bd2760ab2566">&#9670;&nbsp;</a></span>operator!=() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -737,6 +1162,426 @@ template&lt;class T1 , class T2 &gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="aa8b8911c3529ee9d433b0c4d90bde50c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa8b8911c3529ee9d433b0c4d90bde50c">&#9670;&nbsp;</a></span>operator!=() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool cutlass::platform::operator!= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a34950f01ed89108b1d79c651aa58ecba"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a34950f01ed89108b1d79c651aa58ecba">&#9670;&nbsp;</a></span>operator*() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::operator* </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aef5da2c88431ab40b58fdd6afea13dba"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aef5da2c88431ab40b58fdd6afea13dba">&#9670;&nbsp;</a></span>operator*() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::operator* </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">T const &amp;&#160;</td>
+          <td class="paramname"><em>s</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a289b6e31bdc0be1302b8dbab55eb568c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a289b6e31bdc0be1302b8dbab55eb568c">&#9670;&nbsp;</a></span>operator*() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::operator* </td>
+          <td>(</td>
+          <td class="paramtype">T const &amp;&#160;</td>
+          <td class="paramname"><em>s</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9a4928ab582beee4e7ddd337529d45ac"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9a4928ab582beee4e7ddd337529d45ac">&#9670;&nbsp;</a></span>operator*=() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt;&amp; cutlass::platform::operator*= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a21adde191e48e604908ce886690c6d6b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a21adde191e48e604908ce886690c6d6b">&#9670;&nbsp;</a></span>operator*=() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt;&amp; cutlass::platform::operator*= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">T&#160;</td>
+          <td class="paramname"><em>s</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a93b0f0d73fa3cf11c5018460b257837c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a93b0f0d73fa3cf11c5018460b257837c">&#9670;&nbsp;</a></span>operator+()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::operator+ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a34c5ca341da805d5d1bc703c53c96d9d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a34c5ca341da805d5d1bc703c53c96d9d">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt;&amp; cutlass::platform::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa486433971cdd6b7648c1e5459c42763"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa486433971cdd6b7648c1e5459c42763">&#9670;&nbsp;</a></span>operator-()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::operator- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="abff9e10130849ea46f6245f4e8cc2cc9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abff9e10130849ea46f6245f4e8cc2cc9">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt;&amp; cutlass::platform::operator-= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4fe79c19fb599cd9b85d08676a711f9f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4fe79c19fb599cd9b85d08676a711f9f">&#9670;&nbsp;</a></span>operator/() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::operator/ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a33f75d77ff629335c9666128837c4581"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a33f75d77ff629335c9666128837c4581">&#9670;&nbsp;</a></span>operator/() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::operator/ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">T const &amp;&#160;</td>
+          <td class="paramname"><em>s</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae302b414576ecb5afb0cdfdda6b30ad3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae302b414576ecb5afb0cdfdda6b30ad3">&#9670;&nbsp;</a></span>operator/() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::operator/ </td>
+          <td>(</td>
+          <td class="paramtype">T const &amp;&#160;</td>
+          <td class="paramname"><em>s</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac594526ef64ecf364ae957753ce64b40"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac594526ef64ecf364ae957753ce64b40">&#9670;&nbsp;</a></span>operator/=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt;&amp; cutlass::platform::operator/= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a412dbdbc678ecd12b55fcad4ef4155bd"></a>
@@ -767,6 +1612,36 @@ template&lt;class T1 , class T2 &gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="ab4c3e4eabba020d7a9faf86ee6cf437a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab4c3e4eabba020d7a9faf86ee6cf437a">&#9670;&nbsp;</a></span>operator&lt;&lt;()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">std::ostream&amp; cutlass::platform::operator&lt;&lt; </td>
+          <td>(</td>
+          <td class="paramtype">std::ostream &amp;&#160;</td>
+          <td class="paramname"><em>out</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a41d573133357bd555f78d33afc1152d3"></a>
@@ -797,10 +1672,40 @@ template&lt;class T1 , class T2 &gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a043e8559161ee0fcaf943a1dfe1a9cbb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a043e8559161ee0fcaf943a1dfe1a9cbb">&#9670;&nbsp;</a></span>operator==() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool cutlass::platform::operator== </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>lhs</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>rhs</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="ab9b8306ae9dc21fa646c49b68fa8e197"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab9b8306ae9dc21fa646c49b68fa8e197">&#9670;&nbsp;</a></span>operator==()</h2>
+<h2 class="memtitle"><span class="permalink"><a href="#ab9b8306ae9dc21fa646c49b68fa8e197">&#9670;&nbsp;</a></span>operator==() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -887,6 +1792,208 @@ template&lt;class T1 , class T2 &gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a6c9200b03868a5090027e5cfc8e27c62"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6c9200b03868a5090027e5cfc8e27c62">&#9670;&nbsp;</a></span>polar()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::polar </td>
+          <td>(</td>
+          <td class="paramtype">T const &amp;&#160;</td>
+          <td class="paramname"><em>r</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">T const &amp;&#160;</td>
+          <td class="paramname"><em>theta</em> = <code>T()</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4e57cfad9bf0b78e338d536ff1bdda39"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4e57cfad9bf0b78e338d536ff1bdda39">&#9670;&nbsp;</a></span>proj()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::proj </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a25a36d44c7b9f182eb404a3251cd4f39"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a25a36d44c7b9f182eb404a3251cd4f39">&#9670;&nbsp;</a></span>real() <span class="overload">[1/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float const&amp; cutlass::platform::real </td>
+          <td>(</td>
+          <td class="paramtype">cuFloatComplex const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa9b17e4705337452761c0d3bd5edfc67"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa9b17e4705337452761c0d3bd5edfc67">&#9670;&nbsp;</a></span>real() <span class="overload">[2/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> float&amp; cutlass::platform::real </td>
+          <td>(</td>
+          <td class="paramtype">cuFloatComplex &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1f13c0049c5f94b0480c619612608f7b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1f13c0049c5f94b0480c619612608f7b">&#9670;&nbsp;</a></span>real() <span class="overload">[3/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double const&amp; cutlass::platform::real </td>
+          <td>(</td>
+          <td class="paramtype">cuDoubleComplex const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3365c0200a034973b7baecede9728239"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3365c0200a034973b7baecede9728239">&#9670;&nbsp;</a></span>real() <span class="overload">[4/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> double&amp; cutlass::platform::real </td>
+          <td>(</td>
+          <td class="paramtype">cuDoubleComplex &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a01e98d1c13ac9384f2bdc407fce6131b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a01e98d1c13ac9384f2bdc407fce6131b">&#9670;&nbsp;</a></span>real() <span class="overload">[5/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T const&amp; cutlass::platform::real </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa5cfa5849e12b745236485dd2db5f854"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa5cfa5849e12b745236485dd2db5f854">&#9670;&nbsp;</a></span>real() <span class="overload">[6/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&amp; cutlass::platform::real </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3c5dc10135c54b3b212c9e107ba1476a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3c5dc10135c54b3b212c9e107ba1476a">&#9670;&nbsp;</a></span>sin()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::sin </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a81308ccea406262e143e27193cbdf747"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a81308ccea406262e143e27193cbdf747">&#9670;&nbsp;</a></span>sqrt()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt;T&gt; cutlass::platform::sqrt </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1platform_1_1complex.html">complex</a>&lt; T &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>z</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a3e83320a39137d92042eb0bf93be9678"></a>
@@ -930,7 +2037,7 @@ template&lt;typename T , typename Deleter &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/namespacemembers.html b/docs/namespacemembers.html
index 9566721d1..a522eab71 100644
--- a/docs/namespacemembers.html
+++ b/docs/namespacemembers.html
@@ -73,22 +73,54 @@ $(function() {
 <h3><a id="index__"></a>- _ -</h3><ul>
 <li>__align__()
 : <a class="el" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">cutlass</a>
-, <a class="el" href="namespacecutlass_1_1platform.html#ae792b1c7ada1a33e306cd552f583bdce">cutlass::platform</a>
+, <a class="el" href="namespacecutlass_1_1platform.html#a71be5af25eeffa4077777f919e67d8da">cutlass::platform</a>
+</li>
+<li>__launch_bounds__()
+: <a class="el" href="namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55">cutlass::gemm</a>
+</li>
+</ul>
+
+
+<h3><a id="index_a"></a>- a -</h3><ul>
+<li>abs()
+: <a class="el" href="namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5">cutlass::platform</a>
+</li>
+<li>arg()
+: <a class="el" href="namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0">cutlass::platform</a>
 </li>
 </ul>
 
 
 <h3><a id="index_c"></a>- c -</h3><ul>
+<li>clz()
+: <a class="el" href="namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005">cutlass</a>
+</li>
+<li>conj()
+: <a class="el" href="namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4">cutlass::platform</a>
+</li>
+<li>cos()
+: <a class="el" href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">cutlass::platform</a>
+</li>
 <li>cuda_perror_impl()
 : <a class="el" href="namespacecutlass.html#a6d3dfeb642a2ce3d5f52243fe48f89cc">cutlass</a>
 </li>
 </ul>
 
 
+<h3><a id="index_e"></a>- e -</h3><ul>
+<li>exp()
+: <a class="el" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">cutlass::platform</a>
+</li>
+</ul>
+
+
 <h3><a id="index_f"></a>- f -</h3><ul>
 <li>false_type
 : <a class="el" href="namespacecutlass_1_1platform.html#ad8c95b2109070847b13d355120344380">cutlass::platform</a>
 </li>
+<li>find_log2()
+: <a class="el" href="namespacecutlass.html#a58a119c3f7b33d97c43ae8c114004d9e">cutlass</a>
+</li>
 </ul>
 
 
@@ -96,36 +128,30 @@ $(function() {
 <li>gcd()
 : <a class="el" href="namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8">cutlass</a>
 </li>
-<li>gemm_kernel()
-: <a class="el" href="namespacecutlass_1_1gemm.html#ad9577c9086b0f7fd1202d7f8109e4439">cutlass::gemm</a>
+<li>gemm_kernel_nolb()
+: <a class="el" href="namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9">cutlass::gemm</a>
 </li>
-<li>get_Coord_dhw()
-: <a class="el" href="namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e">cutlass</a>
+<li>getLinearIdx()
+: <a class="el" href="namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e">cutlass::gemm</a>
 </li>
-<li>get_Coord_hw()
-: <a class="el" href="namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e">cutlass</a>
-</li>
-<li>get_Coord_hwc()
-: <a class="el" href="namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f">cutlass</a>
+<li>getLinearIdx&lt; swizzleDirection::Boustrophedon &gt;()
+: <a class="el" href="namespacecutlass_1_1gemm.html#a37c566ad59d61647374f215c3d33f088">cutlass::gemm</a>
 </li>
 </ul>
 
 
 <h3><a id="index_i"></a>- i -</h3><ul>
+<li>imag()
+: <a class="el" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">cutlass::platform</a>
+</li>
 <li>is_zero()
-: <a class="el" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">cutlass::gemm</a>
+: <a class="el" href="namespacecutlass_1_1gemm.html#a4a12fcfae60f26efa47bf0a79483d8ac">cutlass::gemm</a>
 </li>
 <li>iterator_load()
-: <a class="el" href="namespacecutlass.html#aca491136bdb966638a7ae57c47f86d1e">cutlass</a>
-</li>
-<li>iterator_load_post_increment()
-: <a class="el" href="namespacecutlass.html#afb8e7a4e611e8b5ae7ca19d02f791d37">cutlass</a>
+: <a class="el" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">cutlass</a>
 </li>
 <li>iterator_store()
-: <a class="el" href="namespacecutlass.html#a410ed4d45ccafc2db842967740b6211f">cutlass</a>
-</li>
-<li>iterator_store_post_increment()
-: <a class="el" href="namespacecutlass.html#a96fdb65e922f6a3d46aa5de9ea78d460">cutlass</a>
+: <a class="el" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">cutlass</a>
 </li>
 </ul>
 
@@ -134,6 +160,12 @@ $(function() {
 <li>lcm()
 : <a class="el" href="namespacecutlass.html#af07506fee11de882d926f4e8237eef09">cutlass</a>
 </li>
+<li>log()
+: <a class="el" href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">cutlass::platform</a>
+</li>
+<li>log10()
+: <a class="el" href="namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06">cutlass::platform</a>
+</li>
 </ul>
 
 
@@ -141,11 +173,23 @@ $(function() {
 <li>make_Coord()
 : <a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass</a>
 </li>
+<li>make_Coord_from_shape()
+: <a class="el" href="namespacecutlass.html#a90028a415a05ce09073860e5c761aa6f">cutlass</a>
+</li>
 <li>make_pair()
 : <a class="el" href="namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5">cutlass::platform</a>
 </li>
 <li>make_zero()
-: <a class="el" href="namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf">cutlass</a>
+: <a class="el" href="namespacecutlass.html#a55b5b15eadf125d5ddddee1ea22191ee">cutlass</a>
+</li>
+<li>make_ZipConvert()
+: <a class="el" href="namespacecutlass.html#adad916101ca58fc9714362c611a0cad8">cutlass</a>
+</li>
+<li>make_ZipFragment()
+: <a class="el" href="namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6">cutlass</a>
+</li>
+<li>make_ZipTensorRef()
+: <a class="el" href="namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a">cutlass</a>
 </li>
 <li>max()
 : <a class="el" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">cutlass::platform</a>
@@ -156,18 +200,53 @@ $(function() {
 </ul>
 
 
+<h3><a id="index_n"></a>- n -</h3><ul>
+<li>norm()
+: <a class="el" href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">cutlass::platform</a>
+</li>
+</ul>
+
+
 <h3><a id="index_o"></a>- o -</h3><ul>
 <li>operator!=()
-: <a class="el" href="namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566">cutlass::platform</a>
+: <a class="el" href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">cutlass::platform</a>
+</li>
+<li>operator*()
+: <a class="el" href="namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba">cutlass::platform</a>
+</li>
+<li>operator*=()
+: <a class="el" href="namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac">cutlass::platform</a>
+</li>
+<li>operator+()
+: <a class="el" href="namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c">cutlass::platform</a>
+</li>
+<li>operator+=()
+: <a class="el" href="namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d">cutlass::platform</a>
+</li>
+<li>operator-()
+: <a class="el" href="namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763">cutlass::platform</a>
+</li>
+<li>operator-=()
+: <a class="el" href="namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9">cutlass::platform</a>
+</li>
+<li>operator/()
+: <a class="el" href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">cutlass::platform</a>
+</li>
+<li>operator/=()
+: <a class="el" href="namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40">cutlass::platform</a>
 </li>
 <li>operator&lt;()
 : <a class="el" href="namespacecutlass_1_1platform.html#a412dbdbc678ecd12b55fcad4ef4155bd">cutlass::platform</a>
 </li>
+<li>operator&lt;&lt;()
+: <a class="el" href="namespacecutlass.html#a30ddfc5e90b9103840cb30c9f9b96b49">cutlass</a>
+, <a class="el" href="namespacecutlass_1_1platform.html#ab4c3e4eabba020d7a9faf86ee6cf437a">cutlass::platform</a>
+</li>
 <li>operator&lt;=()
 : <a class="el" href="namespacecutlass_1_1platform.html#a41d573133357bd555f78d33afc1152d3">cutlass::platform</a>
 </li>
 <li>operator==()
-: <a class="el" href="namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197">cutlass::platform</a>
+: <a class="el" href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">cutlass::platform</a>
 </li>
 <li>operator&gt;()
 : <a class="el" href="namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12">cutlass::platform</a>
@@ -178,7 +257,20 @@ $(function() {
 </ul>
 
 
+<h3><a id="index_p"></a>- p -</h3><ul>
+<li>polar()
+: <a class="el" href="namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62">cutlass::platform</a>
+</li>
+<li>proj()
+: <a class="el" href="namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39">cutlass::platform</a>
+</li>
+</ul>
+
+
 <h3><a id="index_r"></a>- r -</h3><ul>
+<li>real()
+: <a class="el" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">cutlass::platform</a>
+</li>
 <li>round_nearest()
 : <a class="el" href="namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e">cutlass</a>
 </li>
@@ -186,11 +278,11 @@ $(function() {
 
 
 <h3><a id="index_s"></a>- s -</h3><ul>
-<li>shared_iterator_load()
-: <a class="el" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">cutlass</a>
+<li>sin()
+: <a class="el" href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">cutlass::platform</a>
 </li>
-<li>shared_iterator_store()
-: <a class="el" href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">cutlass</a>
+<li>sqrt()
+: <a class="el" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">cutlass::platform</a>
 </li>
 <li>swap()
 : <a class="el" href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">cutlass::platform</a>
@@ -206,7 +298,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/namespacemembers_func.html b/docs/namespacemembers_func.html
index 2ba52b0ef..4fa93a9d6 100644
--- a/docs/namespacemembers_func.html
+++ b/docs/namespacemembers_func.html
@@ -73,53 +73,83 @@ $(function() {
 <h3><a id="index__"></a>- _ -</h3><ul>
 <li>__align__()
 : <a class="el" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">cutlass</a>
-, <a class="el" href="namespacecutlass_1_1platform.html#ae792b1c7ada1a33e306cd552f583bdce">cutlass::platform</a>
+, <a class="el" href="namespacecutlass_1_1platform.html#a0bcb016704ec57f9499e662ba6156f98">cutlass::platform</a>
+</li>
+<li>__launch_bounds__()
+: <a class="el" href="namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55">cutlass::gemm</a>
+</li>
+</ul>
+
+
+<h3><a id="index_a"></a>- a -</h3><ul>
+<li>abs()
+: <a class="el" href="namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5">cutlass::platform</a>
+</li>
+<li>arg()
+: <a class="el" href="namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0">cutlass::platform</a>
 </li>
 </ul>
 
 
 <h3><a id="index_c"></a>- c -</h3><ul>
+<li>clz()
+: <a class="el" href="namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005">cutlass</a>
+</li>
+<li>conj()
+: <a class="el" href="namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4">cutlass::platform</a>
+</li>
+<li>cos()
+: <a class="el" href="namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92">cutlass::platform</a>
+</li>
 <li>cuda_perror_impl()
 : <a class="el" href="namespacecutlass.html#a6d3dfeb642a2ce3d5f52243fe48f89cc">cutlass</a>
 </li>
 </ul>
 
 
+<h3><a id="index_e"></a>- e -</h3><ul>
+<li>exp()
+: <a class="el" href="namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b">cutlass::platform</a>
+</li>
+</ul>
+
+
+<h3><a id="index_f"></a>- f -</h3><ul>
+<li>find_log2()
+: <a class="el" href="namespacecutlass.html#a58a119c3f7b33d97c43ae8c114004d9e">cutlass</a>
+</li>
+</ul>
+
+
 <h3><a id="index_g"></a>- g -</h3><ul>
 <li>gcd()
 : <a class="el" href="namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8">cutlass</a>
 </li>
-<li>gemm_kernel()
-: <a class="el" href="namespacecutlass_1_1gemm.html#ad9577c9086b0f7fd1202d7f8109e4439">cutlass::gemm</a>
+<li>gemm_kernel_nolb()
+: <a class="el" href="namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9">cutlass::gemm</a>
 </li>
-<li>get_Coord_dhw()
-: <a class="el" href="namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e">cutlass</a>
+<li>getLinearIdx()
+: <a class="el" href="namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e">cutlass::gemm</a>
 </li>
-<li>get_Coord_hw()
-: <a class="el" href="namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e">cutlass</a>
-</li>
-<li>get_Coord_hwc()
-: <a class="el" href="namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f">cutlass</a>
+<li>getLinearIdx&lt; swizzleDirection::Boustrophedon &gt;()
+: <a class="el" href="namespacecutlass_1_1gemm.html#a37c566ad59d61647374f215c3d33f088">cutlass::gemm</a>
 </li>
 </ul>
 
 
 <h3><a id="index_i"></a>- i -</h3><ul>
+<li>imag()
+: <a class="el" href="namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6">cutlass::platform</a>
+</li>
 <li>is_zero()
 : <a class="el" href="namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb">cutlass::gemm</a>
 </li>
 <li>iterator_load()
 : <a class="el" href="namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be">cutlass</a>
 </li>
-<li>iterator_load_post_increment()
-: <a class="el" href="namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b">cutlass</a>
-</li>
 <li>iterator_store()
 : <a class="el" href="namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9">cutlass</a>
 </li>
-<li>iterator_store_post_increment()
-: <a class="el" href="namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de">cutlass</a>
-</li>
 </ul>
 
 
@@ -127,6 +157,12 @@ $(function() {
 <li>lcm()
 : <a class="el" href="namespacecutlass.html#af07506fee11de882d926f4e8237eef09">cutlass</a>
 </li>
+<li>log()
+: <a class="el" href="namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c">cutlass::platform</a>
+</li>
+<li>log10()
+: <a class="el" href="namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06">cutlass::platform</a>
+</li>
 </ul>
 
 
@@ -134,11 +170,23 @@ $(function() {
 <li>make_Coord()
 : <a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass</a>
 </li>
+<li>make_Coord_from_shape()
+: <a class="el" href="namespacecutlass.html#a90028a415a05ce09073860e5c761aa6f">cutlass</a>
+</li>
 <li>make_pair()
 : <a class="el" href="namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5">cutlass::platform</a>
 </li>
 <li>make_zero()
-: <a class="el" href="namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf">cutlass</a>
+: <a class="el" href="namespacecutlass.html#aa03883e612d292e1b53eedd46e08ccd1">cutlass</a>
+</li>
+<li>make_ZipConvert()
+: <a class="el" href="namespacecutlass.html#adad916101ca58fc9714362c611a0cad8">cutlass</a>
+</li>
+<li>make_ZipFragment()
+: <a class="el" href="namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6">cutlass</a>
+</li>
+<li>make_ZipTensorRef()
+: <a class="el" href="namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a">cutlass</a>
 </li>
 <li>max()
 : <a class="el" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">cutlass::platform</a>
@@ -149,18 +197,53 @@ $(function() {
 </ul>
 
 
+<h3><a id="index_n"></a>- n -</h3><ul>
+<li>norm()
+: <a class="el" href="namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1">cutlass::platform</a>
+</li>
+</ul>
+
+
 <h3><a id="index_o"></a>- o -</h3><ul>
 <li>operator!=()
-: <a class="el" href="namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566">cutlass::platform</a>
+: <a class="el" href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">cutlass::platform</a>
+</li>
+<li>operator*()
+: <a class="el" href="namespacecutlass_1_1platform.html#a289b6e31bdc0be1302b8dbab55eb568c">cutlass::platform</a>
+</li>
+<li>operator*=()
+: <a class="el" href="namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac">cutlass::platform</a>
+</li>
+<li>operator+()
+: <a class="el" href="namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c">cutlass::platform</a>
+</li>
+<li>operator+=()
+: <a class="el" href="namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d">cutlass::platform</a>
+</li>
+<li>operator-()
+: <a class="el" href="namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763">cutlass::platform</a>
+</li>
+<li>operator-=()
+: <a class="el" href="namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9">cutlass::platform</a>
+</li>
+<li>operator/()
+: <a class="el" href="namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f">cutlass::platform</a>
+</li>
+<li>operator/=()
+: <a class="el" href="namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40">cutlass::platform</a>
 </li>
 <li>operator&lt;()
 : <a class="el" href="namespacecutlass_1_1platform.html#a412dbdbc678ecd12b55fcad4ef4155bd">cutlass::platform</a>
 </li>
+<li>operator&lt;&lt;()
+: <a class="el" href="namespacecutlass.html#a36690681ed19dc7e398fcdafdbfe9975">cutlass</a>
+, <a class="el" href="namespacecutlass_1_1platform.html#ab4c3e4eabba020d7a9faf86ee6cf437a">cutlass::platform</a>
+</li>
 <li>operator&lt;=()
 : <a class="el" href="namespacecutlass_1_1platform.html#a41d573133357bd555f78d33afc1152d3">cutlass::platform</a>
 </li>
 <li>operator==()
-: <a class="el" href="namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197">cutlass::platform</a>
+: <a class="el" href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">cutlass::platform</a>
 </li>
 <li>operator&gt;()
 : <a class="el" href="namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12">cutlass::platform</a>
@@ -171,7 +254,20 @@ $(function() {
 </ul>
 
 
+<h3><a id="index_p"></a>- p -</h3><ul>
+<li>polar()
+: <a class="el" href="namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62">cutlass::platform</a>
+</li>
+<li>proj()
+: <a class="el" href="namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39">cutlass::platform</a>
+</li>
+</ul>
+
+
 <h3><a id="index_r"></a>- r -</h3><ul>
+<li>real()
+: <a class="el" href="namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39">cutlass::platform</a>
+</li>
 <li>round_nearest()
 : <a class="el" href="namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e">cutlass</a>
 </li>
@@ -179,11 +275,11 @@ $(function() {
 
 
 <h3><a id="index_s"></a>- s -</h3><ul>
-<li>shared_iterator_load()
-: <a class="el" href="namespacecutlass.html#abcec976c59cab75ca55b338d125154a3">cutlass</a>
+<li>sin()
+: <a class="el" href="namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a">cutlass::platform</a>
 </li>
-<li>shared_iterator_store()
-: <a class="el" href="namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109">cutlass</a>
+<li>sqrt()
+: <a class="el" href="namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747">cutlass::platform</a>
 </li>
 <li>swap()
 : <a class="el" href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">cutlass::platform</a>
@@ -192,7 +288,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/namespacemembers_type.html b/docs/namespacemembers_type.html
index 37618fba1..29d99bfe5 100644
--- a/docs/namespacemembers_type.html
+++ b/docs/namespacemembers_type.html
@@ -79,7 +79,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/namespaces.html b/docs/namespaces.html
index b12cce12b..cc8745506 100644
--- a/docs/namespaces.html
+++ b/docs/namespaces.html
@@ -75,14 +75,15 @@ $(function() {
 <div class="textblock">Here is a list of all namespaces with brief descriptions:</div><div class="directory">
 <div class="levels">[detail level <span onclick="javascript:toggleLevel(1);">1</span><span onclick="javascript:toggleLevel(2);">2</span>]</div><table class="directory">
 <tr id="row_0_" class="even"><td class="entry"><span style="width:0px;display:inline-block;">&#160;</span><span id="arr_0_" class="arrow" onclick="toggleFolder('0_')">&#9660;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass.html" target="_self">cutlass</a></td><td class="desc"></td></tr>
-<tr id="row_0_0_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1gemm.html" target="_self">gemm</a></td><td class="desc"></td></tr>
-<tr id="row_0_1_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1platform.html" target="_self">platform</a></td><td class="desc"></td></tr>
+<tr id="row_0_0_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1detail.html" target="_self">detail</a></td><td class="desc"></td></tr>
+<tr id="row_0_1_" class="even"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1gemm.html" target="_self">gemm</a></td><td class="desc"></td></tr>
+<tr id="row_0_2_"><td class="entry"><span style="width:32px;display:inline-block;">&#160;</span><span class="icona"><span class="icon">N</span></span><a class="el" href="namespacecutlass_1_1platform.html" target="_self">platform</a></td><td class="desc"></td></tr>
 </table>
 </div><!-- directory -->
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/numeric__types_8h.html b/docs/numeric__types_8h.html
new file mode 100644
index 000000000..eacdfc9a0
--- /dev/null
+++ b/docs/numeric__types_8h.html
@@ -0,0 +1,107 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: numeric_types.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_c5917a9a879e9a6c73eaf5237444ab84.html">util</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">numeric_types.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><a href="numeric__types_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1bin1__t.html">cutlass::bin1_t</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1int4__t.html">cutlass::int4_t</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1uint4__t.html">cutlass::uint4_t</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/numeric__types_8h_source.html b/docs/numeric__types_8h_source.html
new file mode 100644
index 000000000..1d6bc27b3
--- /dev/null
+++ b/docs/numeric__types_8h_source.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: numeric_types.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_c5917a9a879e9a6c73eaf5237444ab84.html">util</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">numeric_types.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="numeric__types_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="comment">// Definitions for 1-bit binary and 4-bit integer types</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="structcutlass_1_1bin1__t.html">   39</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1bin1__t.html">bin1_t</a> {};  <span class="comment">// 1-bit binary type</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1int4__t.html">   41</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1int4__t.html">int4_t</a> {};  <span class="comment">// 4-bit signed integer type</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1uint4__t.html">   43</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1uint4__t.html">uint4_t</a> {};  <span class="comment">// 4-bit unsigned integer type</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1bin1__t_html"><div class="ttname"><a href="structcutlass_1_1bin1__t.html">cutlass::bin1_t</a></div><div class="ttdef"><b>Definition:</b> numeric_types.h:39</div></div>
+<div class="ttc" id="structcutlass_1_1uint4__t_html"><div class="ttname"><a href="structcutlass_1_1uint4__t.html">cutlass::uint4_t</a></div><div class="ttdef"><b>Definition:</b> numeric_types.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1int4__t_html"><div class="ttname"><a href="structcutlass_1_1int4__t.html">cutlass::int4_t</a></div><div class="ttdef"><b>Definition:</b> numeric_types.h:41</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/platform_8h.html b/docs/platform_8h.html
index 8513f5b34..a45532dd0 100644
--- a/docs/platform_8h.html
+++ b/docs/platform_8h.html
@@ -90,7 +90,7 @@ $(function() {
 <code>#include &lt;cstddef&gt;</code><br />
 <code>#include &lt;functional&gt;</code><br />
 <code>#include &lt;utility&gt;</code><br />
-<code>#include &lt;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&gt;</code><br />
+<code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
 </div>
 <p><a href="platform_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -624,7 +624,7 @@ Functions</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/platform_8h_source.html b/docs/platform_8h_source.html
index 9dcbacf27..a3d6f5365 100644
--- a/docs/platform_8h_source.html
+++ b/docs/platform_8h_source.html
@@ -76,96 +76,96 @@ $(function() {
 <div class="title">platform.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="platform_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;</div><div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;<span class="comment">// Dependencies</span></div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="preprocessor">#include &lt;stdint.h&gt;</span></div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="comment">// Include STL files that platform provides functionality for</span></div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="preprocessor">#include &lt;algorithm&gt;</span>   <span class="comment">// Minimum/maximum operations</span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;<span class="preprocessor">#include &lt;cstddef&gt;</span>     <span class="comment">// nullptr_t</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;<span class="preprocessor">#include &lt;functional&gt;</span>  <span class="comment">// Arithmetic operations</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="preprocessor">#include &lt;utility&gt;</span>     <span class="comment">// For methods on std::pair</span></div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &gt;= 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MS_VER &gt;= 1500))</span></div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="preprocessor">#include &lt;type_traits&gt;</span>  <span class="comment">// For integral constants, conditional metaprogramming, and type traits</span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&gt;</span></div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="comment"> * Macros</span></div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;<span class="comment">// Keywords</span></div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1900))</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="preprocessor">#ifndef noexcept</span></div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">  126</a></span>&#160;<span class="preprocessor">#define noexcept</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;<span class="preprocessor">#ifndef constexpr</span></div><div class="line"><a name="l00129"></a><span class="lineno"><a class="line" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">  129</a></span>&#160;<span class="preprocessor">#define constexpr</span></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1310))</span></div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="preprocessor">#ifndef nullptr</span></div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">  136</a></span>&#160;<span class="preprocessor">#define nullptr 0</span></div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1600))</span></div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="preprocessor">#ifndef static_assert</span></div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="platform_8h.html#acd148999a5caeba8f6fd52e7e288e659">  143</a></span>&#160;<span class="preprocessor">#define __platform_cat_(a, b) a##b</span></div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="platform_8h.html#aece7fe71be5aaf8d12dc9e2372f97de4">  144</a></span>&#160;<span class="preprocessor">#define __platform_cat(a, b) __platform_cat_(a, b)</span></div><div class="line"><a name="l00145"></a><span class="lineno"><a class="line" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">  145</a></span>&#160;<span class="preprocessor">#define static_assert(__e, __m) typedef int __platform_cat(AsSeRt, __LINE__)[(__e) ? 1 : -1]</span></div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="comment">// Functions</span></div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="preprocessor">#ifndef __NV_STD_MAX</span></div><div class="line"><a name="l00155"></a><span class="lineno"><a class="line" href="platform_8h.html#abd31f291635329bc15292954f1f01d38">  155</a></span>&#160;<span class="preprocessor">#define __NV_STD_MAX(a, b) (((b) &gt; (a)) ? (b) : (a))</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;<span class="preprocessor">#ifndef __NV_STD_MIN</span></div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">  160</a></span>&#160;<span class="preprocessor">#define __NV_STD_MIN(a, b) (((b) &lt; (a)) ? (b) : (a))</span></div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;<span class="comment"> * Re-implementations</span></div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html">  167</a></span>&#160;<span class="keyword">namespace </span>platform {</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;<span class="comment">// Arithmetic operations, comparisons &lt;functional&gt;</span></div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00175"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1plus.html">  175</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1plus.html">plus</a> {</div><div class="line"><a name="l00176"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c">  176</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> T <a class="code" href="structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c">operator()</a>(<span class="keyword">const</span> T&amp; lhs, <span class="keyword">const</span> T&amp; rhs)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> lhs + rhs; }</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;};</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00181"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1less.html">  181</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1less.html">less</a> {</div><div class="line"><a name="l00182"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5">  182</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5">operator()</a>(<span class="keyword">const</span> T&amp; lhs, <span class="keyword">const</span> T&amp; rhs)<span class="keyword"> const </span>{</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keywordflow">return</span> lhs &lt; rhs;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;  }</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;};</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00189"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1greater.html">  189</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1greater.html">greater</a> {</div><div class="line"><a name="l00190"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978">  190</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978">operator()</a>(<span class="keyword">const</span> T&amp; lhs, <span class="keyword">const</span> T&amp; rhs)<span class="keyword"> const </span>{</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <span class="keywordflow">return</span> lhs &gt; rhs;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;  }</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;};</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;<span class="comment">// Minimum/maximum operations &lt;algorithm&gt;</span></div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">  201</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keyword">const</span> T&amp; <a class="code" href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">min</a>(<span class="keyword">const</span> T&amp; a, <span class="keyword">const</span> T&amp; b) {</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;  <span class="keywordflow">return</span> (b &lt; a) ? b : a;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;}</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00207"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">  207</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keyword">const</span> T&amp; <a class="code" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">max</a>(<span class="keyword">const</span> T&amp; a, <span class="keyword">const</span> T&amp; b) {</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  <span class="keywordflow">return</span> (a &lt; b) ? b : a;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;}</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;<span class="comment">// Methods on std::pair</span></div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;<span class="keyword">using</span> std::pair;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197">  219</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197">operator==</a>(<span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;  <span class="keywordflow">return</span> (lhs.first == rhs.first) &amp;&amp; (lhs.second == rhs.second);</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;}</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566">  224</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566">operator!=</a>(<span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;  <span class="keywordflow">return</span> (lhs.first != rhs.first) &amp;&amp; (lhs.second != rhs.second);</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;}</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a412dbdbc678ecd12b55fcad4ef4155bd">  229</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> operator&lt;(const pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;  <span class="keywordflow">return</span> (lhs.first &lt; rhs.first) ? true : (rhs.first &lt; lhs.first) ? <span class="keyword">false</span></div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;                                                                  : (lhs.second &lt; rhs.second);</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;}</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00235"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a41d573133357bd555f78d33afc1152d3">  235</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> operator&lt;=(const pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  <span class="keywordflow">return</span> !(rhs &lt; lhs);</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;}</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00240"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12">  240</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12">operator&gt;</a>(<span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;  <span class="keywordflow">return</span> (rhs &lt; lhs);</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;}</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00245"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ab0f21e67c0a4b5c6952042b502c6816f">  245</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#ab0f21e67c0a4b5c6952042b502c6816f">operator&gt;=</a>(<span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;  <span class="keywordflow">return</span> !(lhs &lt; rhs);</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;}</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00250"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5">  250</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> std::pair&lt;T1, T2&gt; <a class="code" href="namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5">make_pair</a>(T1 t, T2 u) {</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;  std::pair&lt;T1, T2&gt; retval;</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;  retval.first = t;</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;  retval.second = u;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;  <span class="keywordflow">return</span> retval;</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;}</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;}  <span class="comment">// namespace platform</span></div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<span class="comment"> * Implementations of C++ 11/14/17/... STL features</span></div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;<span class="keyword">namespace </span>platform {</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;<span class="comment">// Integral constant helper types &lt;type_traits&gt;</span></div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t, value_t V&gt;</div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html">  274</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t, value_t V&gt;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a> {</div><div class="line"><a name="l00279"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">  279</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> value_t <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">value</a> = V;</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div><div class="line"><a name="l00281"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">  281</a></span>&#160;  <span class="keyword">typedef</span> value_t <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">value_type</a>;</div><div class="line"><a name="l00282"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52">  282</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant&lt;value_t, V&gt;</a> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52">type</a>;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;</div><div class="line"><a name="l00284"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#a55d25116387f1c6d978462b1d245d675">  284</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">operator</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">value_type</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">value</a>; }</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;</div><div class="line"><a name="l00286"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18">  286</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">value_type</a> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18">operator()</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">value</a>; }</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;};</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;<span class="keyword">using</span> std::integral_constant;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;<span class="keyword">using</span> std::pair;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;</div><div class="line"><a name="l00297"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a0eddc4a3921e137f31fd8014be96e807">  297</a></span>&#160;<span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant&lt;bool, true&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a0eddc4a3921e137f31fd8014be96e807">true_type</a>;</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;</div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ad8c95b2109070847b13d355120344380">  300</a></span>&#160;<span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant&lt;bool, false&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#ad8c95b2109070847b13d355120344380">false_type</a>;</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201402L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1900))</span></div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> V&gt;</div><div class="line"><a name="l00306"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1bool__constant.html">  306</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1bool__constant.html">bool_constant</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">platform::integral_constant</a>&lt;bool, V&gt; {};</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;<span class="keyword">using</span> std::bool_constant;</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1700))</span></div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div><div class="line"><a name="l00317"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1nullptr__t.html">  317</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1nullptr__t.html">nullptr_t</a> {};</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;<span class="keyword">using</span> std::nullptr_t;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;<span class="comment">// Conditional metaprogramming &lt;type_traits&gt;</span></div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1600))</span></div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> C, <span class="keyword">typename</span> T = <span class="keywordtype">void</span>&gt;</div><div class="line"><a name="l00333"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1enable__if.html">  333</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1enable__if.html">enable_if</a> {</div><div class="line"><a name="l00334"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99">  334</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99">type</a>;</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;};</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00339"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html">  339</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1enable__if.html">enable_if</a>&lt;false, T&gt; {};</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> B, <span class="keyword">class</span> T, <span class="keyword">class</span> F&gt;</div><div class="line"><a name="l00343"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1conditional.html">  343</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1conditional.html">conditional</a> {</div><div class="line"><a name="l00344"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11">  344</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11">type</a>;</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;};</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, <span class="keyword">class</span> F&gt;</div><div class="line"><a name="l00349"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html">  349</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1conditional.html">conditional</a>&lt;false, T, F&gt; {</div><div class="line"><a name="l00350"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644">  350</a></span>&#160;  <span class="keyword">typedef</span> F <a class="code" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644">type</a>;</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;};</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;<span class="keyword">using</span> std::enable_if;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;<span class="keyword">using</span> std::conditional;</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;<span class="comment">// Const/volatility specifiers &lt;type_traits&gt;</span></div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00368"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__const.html">  368</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__const.html">remove_const</a> {</div><div class="line"><a name="l00369"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">  369</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">type</a>;</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;};</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00374"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html">  374</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__const.html">remove_const</a>&lt;const T&gt; {</div><div class="line"><a name="l00375"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3">  375</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3">type</a>;</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;};</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00380"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__volatile.html">  380</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__volatile.html">remove_volatile</a> {</div><div class="line"><a name="l00381"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1">  381</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1">type</a>;</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;};</div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00386"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html">  386</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__volatile.html">remove_volatile</a>&lt;volatile T&gt; {</div><div class="line"><a name="l00387"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3">  387</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3">type</a>;</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;};</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00392"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__cv.html">  392</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__cv.html">remove_cv</a> {</div><div class="line"><a name="l00393"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08">  393</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__volatile.html">remove_volatile&lt;typename remove_const&lt;T&gt;::type</a>&gt;<a class="code" href="structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08">::type</a> <a class="code" href="structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08">type</a>;</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;};</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;<span class="keyword">using</span> std::remove_const;</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;<span class="keyword">using</span> std::remove_volatile;</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;<span class="keyword">using</span> std::remove_cv;</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;<span class="comment">// Type relationships &lt;type_traits&gt;</span></div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A, <span class="keyword">typename</span> B&gt;</div><div class="line"><a name="l00412"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__same.html">  412</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__same.html">is_same</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">false_type</a> {};</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A&gt;</div><div class="line"><a name="l00416"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html">  416</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__same.html">is_same</a>&lt;A, A&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;</div><div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> BaseT, <span class="keyword">typename</span> DerivedT&gt;</div><div class="line"><a name="l00420"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper.html">  420</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html">is_base_of_helper</a> {</div><div class="line"><a name="l00421"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">  421</a></span>&#160;  <span class="keyword">typedef</span> char (&amp;<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">yes</a>)[1];</div><div class="line"><a name="l00422"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af">  422</a></span>&#160;  <span class="keyword">typedef</span> char (&amp;<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af">no</a>)[2];</div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;</div><div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> B, <span class="keyword">typename</span> D&gt;</div><div class="line"><a name="l00425"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">  425</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">dummy</a> {</div><div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">operator</span> B*() <span class="keyword">const</span>;</div><div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">operator</span> D*();</div><div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;  };</div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;</div><div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">static</span> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">yes</a> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b">check</a>(DerivedT*, T);</div><div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;</div><div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">static</span> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af">no</a> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b">check</a>(BaseT*, <span class="keywordtype">int</span>);</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;</div><div class="line"><a name="l00435"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff">  435</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff">value</a> = <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b">check</a>(<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">dummy&lt;BaseT, DerivedT&gt;</a>(), <span class="keywordtype">int</span>())) == <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">yes</a>);</div><div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;};</div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;</div><div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> BaseT, <span class="keyword">typename</span> DerivedT&gt;</div><div class="line"><a name="l00440"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of.html">  440</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__base__of.html">is_base_of</a></div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool,</div><div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;                        (is_base_of_helper&lt;typename remove_cv&lt;BaseT&gt;::type,</div><div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;                                           typename remove_cv&lt;DerivedT&gt;::type&gt;::value) ||</div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;                            (is_same&lt;typename remove_cv&lt;BaseT&gt;::type,</div><div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;                                     typename remove_cv&lt;DerivedT&gt;::type&gt;::value)&gt; {};</div><div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;</div><div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;<span class="keyword">using</span> std::is_same;</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;<span class="keyword">using</span> std::is_base_of;</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;</div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;</div><div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;<span class="comment">// Type properties &lt;type_traits&gt;</span></div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00462"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__volatile.html">  462</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__volatile.html">is_volatile</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">false_type</a> {};</div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00464"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html">  464</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__volatile.html">is_volatile</a>&lt;volatile T&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;</div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00468"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__pointer__helper.html">  468</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__pointer__helper.html">is_pointer_helper</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">false_type</a> {};</div><div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;</div><div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00472"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html">  472</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__pointer__helper.html">is_pointer_helper</a>&lt;T*&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;</div><div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00476"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__pointer.html">  476</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__pointer.html">is_pointer</a> : <a class="code" href="structcutlass_1_1platform_1_1is__pointer__helper.html">is_pointer_helper</a>&lt;typename remove_cv&lt;T&gt;::type&gt; {};</div><div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;</div><div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00480"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__void.html">  480</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__void.html">is_void</a> : <a class="code" href="structcutlass_1_1platform_1_1is__same.html">is_same</a>&lt;void, typename remove_cv&lt;T&gt;::type&gt; {};</div><div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;</div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00484"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral.html">  484</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">false_type</a> {};</div><div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00486"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html">  486</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;char&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00488"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html">  488</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;signed char&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00490"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html">  490</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned char&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00492"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html">  492</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;short&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00494"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html">  494</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned short&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00496"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html">  496</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;int&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00498"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html">  498</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned int&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00500"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html">  500</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;long&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00502"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html">  502</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned long&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00504"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html">  504</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;long long&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00506"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html">  506</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned long long&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00508"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html">  508</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;volatile T&gt; : <a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;T&gt; {};</div><div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00510"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html">  510</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;const T&gt; : <a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;T&gt; {};</div><div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00512"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html">  512</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;const volatile T&gt; : <a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;T&gt; {};</div><div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;</div><div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00516"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__floating__point.html">  516</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__floating__point.html">is_floating_point</a></div><div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool,</div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;                        (is_same&lt;float, typename remove_cv&lt;T&gt;::type&gt;::value ||</div><div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;                         is_same&lt;double, typename remove_cv&lt;T&gt;::type&gt;::value)&gt; {};</div><div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;</div><div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00523"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__arithmetic.html">  523</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__arithmetic.html">is_arithmetic</a></div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool, (is_integral&lt;T&gt;::value || is_floating_point&lt;T&gt;::value)&gt; {};</div><div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;</div><div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00528"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__fundamental.html">  528</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__fundamental.html">is_fundamental</a></div><div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool,</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;                        (is_arithmetic&lt;T&gt;::value || is_void&lt;T&gt;::value ||</div><div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;                         is_same&lt;nullptr_t, typename remove_cv&lt;T&gt;::type&gt;::value)&gt; {};</div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;</div><div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;</div><div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;<span class="keyword">using</span> std::is_volatile;</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;<span class="keyword">using</span> std::is_pointer;</div><div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;<span class="keyword">using</span> std::is_void;</div><div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;<span class="keyword">using</span> std::is_integral;</div><div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;<span class="keyword">using</span> std::is_floating_point;</div><div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;<span class="keyword">using</span> std::is_arithmetic;</div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;<span class="keyword">using</span> std::is_fundamental;</div><div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;</div><div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;</div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1800)) || \</span></div><div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;<span class="preprocessor">    (defined(__GNUG__) &amp;&amp; (__GNUC__ &lt; 5))</span></div><div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;</div><div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00559"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__trivially__copyable.html">  559</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__trivially__copyable.html">is_trivially_copyable</a></div><div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool, (is_fundamental&lt;T&gt;::value || is_pointer&lt;T&gt;::value)&gt; {};</div><div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;</div><div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;</div><div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;<span class="keyword">using</span> std::is_trivially_copyable;</div><div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;</div><div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;</div><div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;<span class="comment">// Alignment and layout utilities</span></div><div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;</div><div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;</div><div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00576"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of.html">  576</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a> {</div><div class="line"><a name="l00577"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">  577</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">pad</a> {</div><div class="line"><a name="l00578"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4">  578</a></span>&#160;    value_t <a class="code" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4">val</a>;</div><div class="line"><a name="l00579"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4">  579</a></span>&#160;    <span class="keywordtype">char</span> <a class="code" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4">byte</a>;</div><div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;  };</div><div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;</div><div class="line"><a name="l00582"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">  582</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">pad</a>) - <span class="keyword">sizeof</span>(value_t) };</div><div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;};</div><div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;</div><div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;</div><div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;<span class="keyword">struct </span>alignment_of : std::alignment_of&lt;value_t&gt; {};</div><div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;</div><div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;</div><div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;<span class="comment">/* 16B specializations where 32-bit Win32 host compiler disagrees with device compiler */</span></div><div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00594"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html">  594</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;int4&gt; {</div><div class="line"><a name="l00595"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html#a6005c446eb41749276e0114b82abd990a5b0129d0f9bb45f1c56506efbbb22b6f">  595</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;};</div><div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00598"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html">  598</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;uint4&gt; {</div><div class="line"><a name="l00599"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html#ac55e0c5a0bc4c95981744e55ee7580cea807729922944eede573430b20ad4b322">  599</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;};</div><div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00602"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html">  602</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;float4&gt; {</div><div class="line"><a name="l00603"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html#ac9e709c32271b14b35c9607c64835a95a6a6ee3f24f4d123fc7c138fe5b776f2e">  603</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;};</div><div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00606"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html">  606</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;long4&gt; {</div><div class="line"><a name="l00607"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html#ad58512f76f0b9b000d48f1ff869a0547a3d020dd8ba5c735a60d7c2c897e158f5">  607</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;};</div><div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00610"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html">  610</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;ulong4&gt; {</div><div class="line"><a name="l00611"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html#adc0eec628649de183fe984bb46898830a8152a79c27d055dc3d0b8d662c0bc96a">  611</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;};</div><div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00614"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html">  614</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;longlong2&gt; {</div><div class="line"><a name="l00615"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html#aadf6522691db02f1aab22c22716f0793a940fa73dc4f0a49b78e4e0cefaf4775d">  615</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;};</div><div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00618"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html">  618</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;ulonglong2&gt; {</div><div class="line"><a name="l00619"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html#a511f088278b3de04feb55ab60bdc5a09a58b5cc7be52956c43c2966af5887db80">  619</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;};</div><div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00622"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html">  622</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;double2&gt; {</div><div class="line"><a name="l00623"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html#a5fb114d264023728cca5364401bd6929a7b89d57c8009e094f69ff57e196d8318">  623</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;};</div><div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00626"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html">  626</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;longlong4&gt; {</div><div class="line"><a name="l00627"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html#a666c4fd30155873e3499f5cdc11782daafc1a7c2bb5e6483d42d380a2b4fd9561">  627</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;};</div><div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00630"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html">  630</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;ulonglong4&gt; {</div><div class="line"><a name="l00631"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html#a2568c1ab218cab6505bd20e3c2c420ffa54f6e1afec0ed30b18ab79fd6faf81b5">  631</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;};</div><div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00634"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html">  634</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;double4&gt; {</div><div class="line"><a name="l00635"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html#a024eaf40a8f3e8bd38b416868e0c68bca5a60b16666306472e92ad1320473ba85">  635</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;};</div><div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;</div><div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;<span class="comment">// Specializations for volatile/const qualified types</span></div><div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00640"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html">  640</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;volatile value_t&gt; : <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;value_t&gt; {};</div><div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00642"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html">  642</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;const value_t&gt; : <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;value_t&gt; {};</div><div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00644"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html">  644</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;const volatile value_t&gt; : <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;value_t&gt; {};</div><div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;</div><div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1800))</span></div><div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;</div><div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">size_t</span> Align&gt;</div><div class="line"><a name="l00649"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1aligned__chunk.html">  649</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>;</div><div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00651"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">  651</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(1) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;1&gt; {</div><div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;  uint8_t buff;</div><div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;};</div><div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00655"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a0bcb016704ec57f9499e662ba6156f98">  655</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(2) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;2&gt; {</div><div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;  uint16_t buff;</div><div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;};</div><div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00659"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a71be5af25eeffa4077777f919e67d8da">  659</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(4) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;4&gt; {</div><div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;  uint32_t buff;</div><div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;};</div><div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00663"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a42440254a16d4b6b95b95cc3360ee372">  663</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(8) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;8&gt; {</div><div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;  uint32_t buff[2];</div><div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;};</div><div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00667"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a91d5e970d6ebe619914f40a9510bdb1e">  667</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(16) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;16&gt; {</div><div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;  uint32_t buff[4];</div><div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;};</div><div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00671"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a210f4d360b1f9c3d074e71129fe4c0d9">  671</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(32) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;32&gt; {</div><div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;  uint32_t buff[8];</div><div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;};</div><div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00675"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ae792b1c7ada1a33e306cd552f583bdce">  675</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(64) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;64&gt; {</div><div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;  uint32_t buff[16];</div><div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;};</div><div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00679"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a5712ec4fed335a9b7f863fb3abe3c5eb">  679</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(128) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;128&gt; {</div><div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;  uint32_t buff[32];</div><div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;};</div><div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00683"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a595cc98db29fb4d59772d2e2f52e347a">  683</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(256) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;256&gt; {</div><div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;  uint32_t buff[64];</div><div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;};</div><div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00687"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ae70bb5d14a66500b47d2e3f83063d4a5">  687</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(512) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;512&gt; {</div><div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;  uint32_t buff[128];</div><div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;};</div><div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00691"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a181e44e9c66f704175590727aaa9e5a1">  691</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(1024) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;1024&gt; {</div><div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;  uint32_t buff[256];</div><div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;};</div><div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00695"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ae72c8fa997bb251d4140dceb03147154">  695</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(2048) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;2048&gt; {</div><div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;  uint32_t buff[512];</div><div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;};</div><div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00699"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ada29683f1b408ae7b73cc8fbe2108628">  699</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(4096) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;4096&gt; {</div><div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;  uint32_t buff[1024];</div><div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;};</div><div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;</div><div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">size_t</span> Len, <span class="keywordtype">size_t</span> Align&gt;</div><div class="line"><a name="l00705"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1aligned__storage.html">  705</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1aligned__storage.html">aligned_storage</a> {</div><div class="line"><a name="l00706"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1">  706</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk&lt;Align&gt;</a> <a class="code" href="structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1">type</a>[Len / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk&lt;Align&gt;</a>)];</div><div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;};</div><div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;</div><div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;</div><div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;<span class="keyword">using</span> std::aligned_storage;</div><div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;</div><div class="line"><a name="l00713"></a><span class="lineno">  713</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00714"></a><span class="lineno">  714</span>&#160;</div><div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00718"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1default__delete.html">  718</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1default__delete.html">default_delete</a> {</div><div class="line"><a name="l00719"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15">  719</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15">operator()</a>(T* ptr)<span class="keyword"> const </span>{ <span class="keyword">delete</span> ptr; }</div><div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;};</div><div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;</div><div class="line"><a name="l00723"></a><span class="lineno">  723</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00724"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html">  724</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1default__delete.html">default_delete</a>&lt;T[]&gt; {</div><div class="line"><a name="l00725"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87">  725</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87">operator()</a>(T* ptr)<span class="keyword"> const </span>{ <span class="keyword">delete</span>[] ptr; }</div><div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;};</div><div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;</div><div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, <span class="keyword">class</span> Deleter = default_delete&lt;T&gt; &gt;</div><div class="line"><a name="l00730"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html">  730</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr</a> {</div><div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00732"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">  732</a></span>&#160;  <span class="keyword">typedef</span> T* <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a>;</div><div class="line"><a name="l00733"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a94cea0ebf2ac4bec69dfa1f80ea07d50">  733</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a94cea0ebf2ac4bec69dfa1f80ea07d50">element_type</a>;</div><div class="line"><a name="l00734"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">  734</a></span>&#160;  <span class="keyword">typedef</span> Deleter <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">deleter_type</a>;</div><div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;</div><div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> _ptr;</div><div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;</div><div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">deleter_type</a> _deleter;</div><div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;</div><div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00744"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#aa8a370bc7e4c2d99eb85e7fea27b3179">  744</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#aa8a370bc7e4c2d99eb85e7fea27b3179">unique_ptr</a>() : _ptr(<a class="code" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>) {}</div><div class="line"><a name="l00745"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a14c8bf5a5deefe4a6602ccd5c5af364c">  745</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a14c8bf5a5deefe4a6602ccd5c5af364c">unique_ptr</a>(<a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> p) : _ptr(p) {}</div><div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;</div><div class="line"><a name="l00747"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf">  747</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf">~unique_ptr</a>() {</div><div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160;    <span class="keywordflow">if</span> (_ptr) {</div><div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;      _deleter(_ptr);</div><div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160;    }</div><div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;  }</div><div class="line"><a name="l00753"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a2e7c14b8a118f81c1df46ea5045e297b">  753</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> <span class="keyword">get</span>() <span class="keyword">const</span> <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _ptr; }</div><div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;</div><div class="line"><a name="l00756"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279">  756</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279">release</a>() <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> {</div><div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;    <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> p(_ptr);</div><div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;    _ptr = <span class="keyword">nullptr</span>;</div><div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;    <span class="keywordflow">return</span> p;</div><div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;  }</div><div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;</div><div class="line"><a name="l00763"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331">  763</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331">reset</a>(<a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> p = <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a>()) <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> {</div><div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160;    <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> old_ptr = _ptr;</div><div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;    _ptr = p;</div><div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;    <span class="keywordflow">if</span> (old_ptr != <span class="keyword">nullptr</span>) {</div><div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;      <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">get_deleter</a>()(old_ptr);</div><div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;    }</div><div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;  }</div><div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;</div><div class="line"><a name="l00772"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036">  772</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036">swap</a>(<a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr</a>&amp; other) <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <a class="code" href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">std::swap</a>(_ptr, other._ptr); }</div><div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;</div><div class="line"><a name="l00775"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">  775</a></span>&#160;  Deleter&amp; <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">get_deleter</a>() <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _deleter; }</div><div class="line"><a name="l00776"></a><span class="lineno">  776</span>&#160;</div><div class="line"><a name="l00778"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#aa427ab4ea4f2336ac6db28d53a4c11ac">  778</a></span>&#160;  Deleter <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#aa427ab4ea4f2336ac6db28d53a4c11ac">get_deleter</a>() const <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _deleter; }</div><div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;</div><div class="line"><a name="l00781"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005">  781</a></span>&#160;  <span class="keyword">operator</span> bool() const <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _ptr != <span class="keyword">nullptr</span>; }</div><div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160;</div><div class="line"><a name="l00784"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b">  784</a></span>&#160;  T&amp; <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b">operator*</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> *_ptr; }</div><div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160;</div><div class="line"><a name="l00787"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b">  787</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b">operator-&gt;</a>() const <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _ptr; }</div><div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;</div><div class="line"><a name="l00790"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d">  790</a></span>&#160;  T&amp; <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d">operator[]</a>(<span class="keywordtype">size_t</span> i)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> _ptr[i]; }</div><div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160;};</div><div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;</div><div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> Deleter&gt;</div><div class="line"><a name="l00795"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">  795</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">swap</a>(<a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr&lt;T, Deleter&gt;</a>&amp; lhs, <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr&lt;T, Deleter&gt;</a>&amp; rhs) <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> {</div><div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;  lhs.swap(rhs);</div><div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;}</div><div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;</div><div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;};  <span class="comment">// namespace platform</span></div><div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;};  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html_a9bbaca83ae76941edb9b75b2741d3ad9"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">cutlass::platform::integral_constant::value</a></div><div class="ttdeci">static const value_t value</div><div class="ttdef"><b>Definition:</b> platform.h:279</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_af6a9a165e53d7e85ae121d5789aa03e0"><div class="ttname"><a href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">cutlass::platform::max</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr const T &amp; max(const T &amp;a, const T &amp;b)</div><div class="ttdoc">std::max </div><div class="ttdef"><b>Definition:</b> platform.h:207</div></div>
+<a href="platform_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;</div><div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;<span class="comment">// Dependencies</span></div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="preprocessor">#include &lt;stdint.h&gt;</span></div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="comment">// Include STL files that platform provides functionality for</span></div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="preprocessor">#include &lt;algorithm&gt;</span>   <span class="comment">// Minimum/maximum operations</span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;<span class="preprocessor">#include &lt;cstddef&gt;</span>     <span class="comment">// nullptr_t</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;<span class="preprocessor">#include &lt;functional&gt;</span>  <span class="comment">// Arithmetic operations</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="preprocessor">#include &lt;utility&gt;</span>     <span class="comment">// For methods on std::pair</span></div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &gt;= 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MS_VER &gt;= 1500))</span></div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="preprocessor">#include &lt;type_traits&gt;</span>  <span class="comment">// For integral constants, conditional metaprogramming, and type traits</span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;<span class="comment">// OS</span></div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;<span class="preprocessor">#if defined(WIN32) || defined(_WIN32) || defined(__WIN32) &amp;&amp; !defined(__CYGWIN__)</span></div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="preprocessor">#define CUTLASS_OS_WINDOWS</span></div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="comment"> * Macros</span></div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;<span class="comment">// Keywords</span></div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1900))</span></div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="preprocessor">#ifndef noexcept</span></div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">  134</a></span>&#160;<span class="preprocessor">#define noexcept</span></div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="preprocessor">#ifndef constexpr</span></div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">  137</a></span>&#160;<span class="preprocessor">#define constexpr</span></div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1310))</span></div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="preprocessor">#ifndef nullptr</span></div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">  144</a></span>&#160;<span class="preprocessor">#define nullptr 0</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1600))</span></div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="preprocessor">#ifndef static_assert</span></div><div class="line"><a name="l00151"></a><span class="lineno"><a class="line" href="platform_8h.html#acd148999a5caeba8f6fd52e7e288e659">  151</a></span>&#160;<span class="preprocessor">#define __platform_cat_(a, b) a##b</span></div><div class="line"><a name="l00152"></a><span class="lineno"><a class="line" href="platform_8h.html#aece7fe71be5aaf8d12dc9e2372f97de4">  152</a></span>&#160;<span class="preprocessor">#define __platform_cat(a, b) __platform_cat_(a, b)</span></div><div class="line"><a name="l00153"></a><span class="lineno"><a class="line" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">  153</a></span>&#160;<span class="preprocessor">#define static_assert(__e, __m) typedef int __platform_cat(AsSeRt, __LINE__)[(__e) ? 1 : -1]</span></div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;<span class="comment">// Functions</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="preprocessor">#ifndef __NV_STD_MAX</span></div><div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="platform_8h.html#abd31f291635329bc15292954f1f01d38">  163</a></span>&#160;<span class="preprocessor">#define __NV_STD_MAX(a, b) (((b) &gt; (a)) ? (b) : (a))</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;<span class="preprocessor">#ifndef __NV_STD_MIN</span></div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">  168</a></span>&#160;<span class="preprocessor">#define __NV_STD_MIN(a, b) (((b) &lt; (a)) ? (b) : (a))</span></div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;<span class="comment"> * Re-implementations</span></div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;<span class="keyword">namespace </span>platform {</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="comment">// Arithmetic operations, comparisons &lt;functional&gt;</span></div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1plus.html">  183</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1plus.html">plus</a> {</div><div class="line"><a name="l00184"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c">  184</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> T <a class="code" href="structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c">operator()</a>(<span class="keyword">const</span> T&amp; lhs, <span class="keyword">const</span> T&amp; rhs)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> lhs + rhs; }</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;};</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00189"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1less.html">  189</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1less.html">less</a> {</div><div class="line"><a name="l00190"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5">  190</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5">operator()</a>(<span class="keyword">const</span> T&amp; lhs, <span class="keyword">const</span> T&amp; rhs)<span class="keyword"> const </span>{</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <span class="keywordflow">return</span> lhs &lt; rhs;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;  }</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;};</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1greater.html">  197</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1greater.html">greater</a> {</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978">  198</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978">operator()</a>(<span class="keyword">const</span> T&amp; lhs, <span class="keyword">const</span> T&amp; rhs)<span class="keyword"> const </span>{</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    <span class="keywordflow">return</span> lhs &gt; rhs;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;  }</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;};</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;<span class="comment">// Minimum/maximum operations &lt;algorithm&gt;</span></div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00209"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">  209</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keyword">const</span> T&amp; <a class="code" href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">min</a>(<span class="keyword">const</span> T&amp; a, <span class="keyword">const</span> T&amp; b) {</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <span class="keywordflow">return</span> (b &lt; a) ? b : a;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;}</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00215"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">  215</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keyword">const</span> T&amp; <a class="code" href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">max</a>(<span class="keyword">const</span> T&amp; a, <span class="keyword">const</span> T&amp; b) {</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;  <span class="keywordflow">return</span> (a &lt; b) ? b : a;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;}</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;<span class="comment">// Methods on std::pair</span></div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;<span class="keyword">using</span> std::pair;</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00227"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197">  227</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">operator==</a>(<span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;  <span class="keywordflow">return</span> (lhs.first == rhs.first) &amp;&amp; (lhs.second == rhs.second);</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;}</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00232"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566">  232</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">operator!=</a>(<span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;  <span class="keywordflow">return</span> (lhs.first != rhs.first) &amp;&amp; (lhs.second != rhs.second);</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;}</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a412dbdbc678ecd12b55fcad4ef4155bd">  237</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> operator&lt;(const pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;  <span class="keywordflow">return</span> (lhs.first &lt; rhs.first) ? true : (rhs.first &lt; lhs.first) ? <span class="keyword">false</span></div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;                                                                  : (lhs.second &lt; rhs.second);</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;}</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00243"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a41d573133357bd555f78d33afc1152d3">  243</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> operator&lt;=(const pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;  <span class="keywordflow">return</span> !(rhs &lt; lhs);</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;}</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00248"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12">  248</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12">operator&gt;</a>(<span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;  <span class="keywordflow">return</span> (rhs &lt; lhs);</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;}</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00253"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ab0f21e67c0a4b5c6952042b502c6816f">  253</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a> <span class="keywordtype">bool</span> <a class="code" href="namespacecutlass_1_1platform.html#ab0f21e67c0a4b5c6952042b502c6816f">operator&gt;=</a>(<span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; lhs, <span class="keyword">const</span> pair&lt;T1, T2&gt;&amp; rhs) {</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;  <span class="keywordflow">return</span> !(lhs &lt; rhs);</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;}</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T1, <span class="keyword">class</span> T2&gt;</div><div class="line"><a name="l00258"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5">  258</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> std::pair&lt;T1, T2&gt; <a class="code" href="namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5">make_pair</a>(T1 t, T2 u) {</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;  std::pair&lt;T1, T2&gt; retval;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;  retval.first = t;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;  retval.second = u;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;  <span class="keywordflow">return</span> retval;</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;}</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;}  <span class="comment">// namespace platform</span></div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;<span class="comment">/******************************************************************************</span></div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;<span class="comment"> * Implementations of C++ 11/14/17/... STL features</span></div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;<span class="comment"> ******************************************************************************/</span></div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;<span class="keyword">namespace </span>platform {</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;<span class="comment">// Integral constant helper types &lt;type_traits&gt;</span></div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t, value_t V&gt;</div><div class="line"><a name="l00282"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html">  282</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t, value_t V&gt;</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a> {</div><div class="line"><a name="l00287"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">  287</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> value_t <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">value</a> = V;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">  289</a></span>&#160;  <span class="keyword">typedef</span> value_t <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">value_type</a>;</div><div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52">  290</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant&lt;value_t, V&gt;</a> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52">type</a>;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;</div><div class="line"><a name="l00292"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#a55d25116387f1c6d978462b1d245d675">  292</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">operator</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">value_type</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">value</a>; }</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div><div class="line"><a name="l00294"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18">  294</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">value_type</a> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18">operator()</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">value</a>; }</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;};</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;<span class="keyword">using</span> std::integral_constant;</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;<span class="keyword">using</span> std::pair;</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;</div><div class="line"><a name="l00305"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a0eddc4a3921e137f31fd8014be96e807">  305</a></span>&#160;<span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant&lt;bool, true&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#a0eddc4a3921e137f31fd8014be96e807">true_type</a>;</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;</div><div class="line"><a name="l00308"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ad8c95b2109070847b13d355120344380">  308</a></span>&#160;<span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant&lt;bool, false&gt;</a> <a class="code" href="namespacecutlass_1_1platform.html#ad8c95b2109070847b13d355120344380">false_type</a>;</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt;= 201402L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1900))</span></div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> V&gt;</div><div class="line"><a name="l00314"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1bool__constant.html">  314</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1bool__constant.html">bool_constant</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">platform::integral_constant</a>&lt;bool, V&gt; {};</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;<span class="keyword">using</span> std::bool_constant;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1700))</span></div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;</div><div class="line"><a name="l00325"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1nullptr__t.html">  325</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1nullptr__t.html">nullptr_t</a> {};</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;<span class="keyword">using</span> std::nullptr_t;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;<span class="comment">// Conditional metaprogramming &lt;type_traits&gt;</span></div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1600))</span></div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> C, <span class="keyword">typename</span> T = <span class="keywordtype">void</span>&gt;</div><div class="line"><a name="l00341"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1enable__if.html">  341</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1enable__if.html">enable_if</a> {</div><div class="line"><a name="l00342"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99">  342</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99">type</a>;</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;};</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00347"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html">  347</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1enable__if.html">enable_if</a>&lt;false, T&gt; {};</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> B, <span class="keyword">class</span> T, <span class="keyword">class</span> F&gt;</div><div class="line"><a name="l00351"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1conditional.html">  351</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1conditional.html">conditional</a> {</div><div class="line"><a name="l00352"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11">  352</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11">type</a>;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;};</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, <span class="keyword">class</span> F&gt;</div><div class="line"><a name="l00357"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html">  357</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1conditional.html">conditional</a>&lt;false, T, F&gt; {</div><div class="line"><a name="l00358"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644">  358</a></span>&#160;  <span class="keyword">typedef</span> F <a class="code" href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644">type</a>;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;};</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;<span class="keyword">using</span> std::enable_if;</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;<span class="keyword">using</span> std::conditional;</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;<span class="comment">// Const/volatility specifiers &lt;type_traits&gt;</span></div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00376"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__const.html">  376</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__const.html">remove_const</a> {</div><div class="line"><a name="l00377"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">  377</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">type</a>;</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;};</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00382"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html">  382</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__const.html">remove_const</a>&lt;const T&gt; {</div><div class="line"><a name="l00383"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3">  383</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3">type</a>;</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;};</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;</div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00388"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__volatile.html">  388</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__volatile.html">remove_volatile</a> {</div><div class="line"><a name="l00389"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1">  389</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1">type</a>;</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;};</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00394"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html">  394</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__volatile.html">remove_volatile</a>&lt;volatile T&gt; {</div><div class="line"><a name="l00395"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3">  395</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3">type</a>;</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;};</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00400"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__cv.html">  400</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1remove__cv.html">remove_cv</a> {</div><div class="line"><a name="l00401"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08">  401</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__volatile.html">remove_volatile&lt;typename remove_const&lt;T&gt;::type</a>&gt;<a class="code" href="structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08">::type</a> <a class="code" href="structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08">type</a>;</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;};</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;<span class="keyword">using</span> std::remove_const;</div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;<span class="keyword">using</span> std::remove_volatile;</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;<span class="keyword">using</span> std::remove_cv;</div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;</div><div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;<span class="comment">// Type relationships &lt;type_traits&gt;</span></div><div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;</div><div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;</div><div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A, <span class="keyword">typename</span> B&gt;</div><div class="line"><a name="l00420"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__same.html">  420</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__same.html">is_same</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">false_type</a> {};</div><div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;</div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A&gt;</div><div class="line"><a name="l00424"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html">  424</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__same.html">is_same</a>&lt;A, A&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;</div><div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> BaseT, <span class="keyword">typename</span> DerivedT&gt;</div><div class="line"><a name="l00428"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper.html">  428</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html">is_base_of_helper</a> {</div><div class="line"><a name="l00429"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">  429</a></span>&#160;  <span class="keyword">typedef</span> char (&amp;<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">yes</a>)[1];</div><div class="line"><a name="l00430"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af">  430</a></span>&#160;  <span class="keyword">typedef</span> char (&amp;<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af">no</a>)[2];</div><div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;</div><div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> B, <span class="keyword">typename</span> D&gt;</div><div class="line"><a name="l00433"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">  433</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">dummy</a> {</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">operator</span> B*() <span class="keyword">const</span>;</div><div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">operator</span> D*();</div><div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;  };</div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;</div><div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">static</span> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">yes</a> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b">check</a>(DerivedT*, T);</div><div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;</div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">static</span> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af">no</a> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b">check</a>(BaseT*, <span class="keywordtype">int</span>);</div><div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;</div><div class="line"><a name="l00443"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff">  443</a></span>&#160;  <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff">value</a> = <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b">check</a>(<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">dummy&lt;BaseT, DerivedT&gt;</a>(), <span class="keywordtype">int</span>())) == <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">yes</a>);</div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;};</div><div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> BaseT, <span class="keyword">typename</span> DerivedT&gt;</div><div class="line"><a name="l00448"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__base__of.html">  448</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__base__of.html">is_base_of</a></div><div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool,</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;                        (is_base_of_helper&lt;typename remove_cv&lt;BaseT&gt;::type,</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;                                           typename remove_cv&lt;DerivedT&gt;::type&gt;::value) ||</div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;                            (is_same&lt;typename remove_cv&lt;BaseT&gt;::type,</div><div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;                                     typename remove_cv&lt;DerivedT&gt;::type&gt;::value)&gt; {};</div><div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;<span class="keyword">using</span> std::is_same;</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;<span class="keyword">using</span> std::is_base_of;</div><div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;</div><div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;<span class="comment">// Type properties &lt;type_traits&gt;</span></div><div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;</div><div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;</div><div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00470"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__volatile.html">  470</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__volatile.html">is_volatile</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">false_type</a> {};</div><div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00472"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html">  472</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__volatile.html">is_volatile</a>&lt;volatile T&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;</div><div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00476"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__pointer__helper.html">  476</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__pointer__helper.html">is_pointer_helper</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">false_type</a> {};</div><div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;</div><div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00480"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html">  480</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__pointer__helper.html">is_pointer_helper</a>&lt;T*&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;</div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00484"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__pointer.html">  484</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__pointer.html">is_pointer</a> : <a class="code" href="structcutlass_1_1platform_1_1is__pointer__helper.html">is_pointer_helper</a>&lt;typename remove_cv&lt;T&gt;::type&gt; {};</div><div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00488"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__void.html">  488</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__void.html">is_void</a> : <a class="code" href="structcutlass_1_1platform_1_1is__same.html">is_same</a>&lt;void, typename remove_cv&lt;T&gt;::type&gt; {};</div><div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;</div><div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00492"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral.html">  492</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a> : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">false_type</a> {};</div><div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00494"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html">  494</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;char&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00496"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html">  496</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;signed char&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00498"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html">  498</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned char&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00500"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html">  500</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;short&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00502"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html">  502</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned short&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00504"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html">  504</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;int&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00506"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html">  506</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned int&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00508"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html">  508</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;long&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00510"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html">  510</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned long&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00512"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html">  512</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;long long&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00514"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html">  514</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;unsigned long long&gt; : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">true_type</a> {};</div><div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00516"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html">  516</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;volatile T&gt; : <a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;T&gt; {};</div><div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00518"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html">  518</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;const T&gt; : <a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;T&gt; {};</div><div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00520"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html">  520</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;const volatile T&gt; : <a class="code" href="structcutlass_1_1platform_1_1is__integral.html">is_integral</a>&lt;T&gt; {};</div><div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;</div><div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00524"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__floating__point.html">  524</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__floating__point.html">is_floating_point</a></div><div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool,</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;                        (is_same&lt;float, typename remove_cv&lt;T&gt;::type&gt;::value ||</div><div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;                         is_same&lt;double, typename remove_cv&lt;T&gt;::type&gt;::value)&gt; {};</div><div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00531"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__arithmetic.html">  531</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__arithmetic.html">is_arithmetic</a></div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool, (is_integral&lt;T&gt;::value || is_floating_point&lt;T&gt;::value)&gt; {};</div><div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;</div><div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00536"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__fundamental.html">  536</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__fundamental.html">is_fundamental</a></div><div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool,</div><div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;                        (is_arithmetic&lt;T&gt;::value || is_void&lt;T&gt;::value ||</div><div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;                         is_same&lt;nullptr_t, typename remove_cv&lt;T&gt;::type&gt;::value)&gt; {};</div><div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;</div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;</div><div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;<span class="keyword">using</span> std::is_volatile;</div><div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;<span class="keyword">using</span> std::is_pointer;</div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;<span class="keyword">using</span> std::is_void;</div><div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;<span class="keyword">using</span> std::is_integral;</div><div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;<span class="keyword">using</span> std::is_floating_point;</div><div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;<span class="keyword">using</span> std::is_arithmetic;</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;<span class="keyword">using</span> std::is_fundamental;</div><div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;</div><div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;</div><div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1800)) || \</span></div><div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;<span class="preprocessor">    (defined(__GNUG__) &amp;&amp; (__GNUC__ &lt; 5))</span></div><div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;</div><div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00567"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1is__trivially__copyable.html">  567</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1is__trivially__copyable.html">is_trivially_copyable</a></div><div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;    : <a class="code" href="structcutlass_1_1platform_1_1integral__constant.html">integral_constant</a>&lt;bool, (is_fundamental&lt;T&gt;::value || is_pointer&lt;T&gt;::value)&gt; {};</div><div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;</div><div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;</div><div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;<span class="keyword">using</span> std::is_trivially_copyable;</div><div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;</div><div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;</div><div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;<span class="comment">// Alignment and layout utilities</span></div><div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div><div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;</div><div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1500))</span></div><div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;</div><div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00584"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of.html">  584</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a> {</div><div class="line"><a name="l00585"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">  585</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">pad</a> {</div><div class="line"><a name="l00586"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4">  586</a></span>&#160;    value_t <a class="code" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4">val</a>;</div><div class="line"><a name="l00587"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4">  587</a></span>&#160;    <span class="keywordtype">char</span> <a class="code" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4">byte</a>;</div><div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;  };</div><div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;</div><div class="line"><a name="l00590"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">  590</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">pad</a>) - <span class="keyword">sizeof</span>(value_t) };</div><div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;};</div><div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;</div><div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;</div><div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;<span class="keyword">struct </span>alignment_of : std::alignment_of&lt;value_t&gt; {};</div><div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;</div><div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;</div><div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;<span class="comment">/* 16B specializations where 32-bit Win32 host compiler disagrees with device compiler */</span></div><div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00602"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html">  602</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;int4&gt; {</div><div class="line"><a name="l00603"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html#a6005c446eb41749276e0114b82abd990a5b0129d0f9bb45f1c56506efbbb22b6f">  603</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;};</div><div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00606"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html">  606</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;uint4&gt; {</div><div class="line"><a name="l00607"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html#ac55e0c5a0bc4c95981744e55ee7580cea807729922944eede573430b20ad4b322">  607</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;};</div><div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00610"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html">  610</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;float4&gt; {</div><div class="line"><a name="l00611"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html#ac9e709c32271b14b35c9607c64835a95a6a6ee3f24f4d123fc7c138fe5b776f2e">  611</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;};</div><div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00614"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html">  614</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;long4&gt; {</div><div class="line"><a name="l00615"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html#ad58512f76f0b9b000d48f1ff869a0547a3d020dd8ba5c735a60d7c2c897e158f5">  615</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;};</div><div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00618"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html">  618</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;ulong4&gt; {</div><div class="line"><a name="l00619"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html#adc0eec628649de183fe984bb46898830a8152a79c27d055dc3d0b8d662c0bc96a">  619</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;};</div><div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00622"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html">  622</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;longlong2&gt; {</div><div class="line"><a name="l00623"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html#aadf6522691db02f1aab22c22716f0793a940fa73dc4f0a49b78e4e0cefaf4775d">  623</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;};</div><div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00626"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html">  626</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;ulonglong2&gt; {</div><div class="line"><a name="l00627"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html#a511f088278b3de04feb55ab60bdc5a09a58b5cc7be52956c43c2966af5887db80">  627</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;};</div><div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00630"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html">  630</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;double2&gt; {</div><div class="line"><a name="l00631"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html#a5fb114d264023728cca5364401bd6929a7b89d57c8009e094f69ff57e196d8318">  631</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;};</div><div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00634"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html">  634</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;longlong4&gt; {</div><div class="line"><a name="l00635"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html#a666c4fd30155873e3499f5cdc11782daafc1a7c2bb5e6483d42d380a2b4fd9561">  635</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;};</div><div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00638"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html">  638</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;ulonglong4&gt; {</div><div class="line"><a name="l00639"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html#a2568c1ab218cab6505bd20e3c2c420ffa54f6e1afec0ed30b18ab79fd6faf81b5">  639</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;};</div><div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00642"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html">  642</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;double4&gt; {</div><div class="line"><a name="l00643"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html#a024eaf40a8f3e8bd38b416868e0c68bca5a60b16666306472e92ad1320473ba85">  643</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">value</a> = 16 };</div><div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;};</div><div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;</div><div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;<span class="comment">// Specializations for volatile/const qualified types</span></div><div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00648"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html">  648</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;volatile value_t&gt; : <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;value_t&gt; {};</div><div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00650"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html">  650</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;const value_t&gt; : <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;value_t&gt; {};</div><div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> value_t&gt;</div><div class="line"><a name="l00652"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html">  652</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;const volatile value_t&gt; : <a class="code" href="structcutlass_1_1platform_1_1alignment__of.html">alignment_of</a>&lt;value_t&gt; {};</div><div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;</div><div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;<span class="preprocessor">#if (!defined(_MSC_VER) &amp;&amp; (__cplusplus &lt; 201103L)) || (defined(_MSC_VER) &amp;&amp; (_MSC_VER &lt; 1800))</span></div><div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;</div><div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">size_t</span> Align&gt;</div><div class="line"><a name="l00657"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1aligned__chunk.html">  657</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>;</div><div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00659"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">  659</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(1) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;1&gt; {</div><div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;  uint8_t buff;</div><div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;};</div><div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00663"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a0bcb016704ec57f9499e662ba6156f98">  663</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(2) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;2&gt; {</div><div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;  uint16_t buff;</div><div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;};</div><div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00667"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a71be5af25eeffa4077777f919e67d8da">  667</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(4) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;4&gt; {</div><div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;  uint32_t buff;</div><div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;};</div><div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00671"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a42440254a16d4b6b95b95cc3360ee372">  671</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(8) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;8&gt; {</div><div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;  uint32_t buff[2];</div><div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;};</div><div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00675"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a91d5e970d6ebe619914f40a9510bdb1e">  675</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(16) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;16&gt; {</div><div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;  uint32_t buff[4];</div><div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;};</div><div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00679"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a210f4d360b1f9c3d074e71129fe4c0d9">  679</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(32) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;32&gt; {</div><div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;  uint32_t buff[8];</div><div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;};</div><div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00683"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ae792b1c7ada1a33e306cd552f583bdce">  683</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(64) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;64&gt; {</div><div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;  uint32_t buff[16];</div><div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;};</div><div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00687"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a5712ec4fed335a9b7f863fb3abe3c5eb">  687</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(128) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;128&gt; {</div><div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;  uint32_t buff[32];</div><div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;};</div><div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00691"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a595cc98db29fb4d59772d2e2f52e347a">  691</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(256) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;256&gt; {</div><div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;  uint32_t buff[64];</div><div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;};</div><div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00695"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ae70bb5d14a66500b47d2e3f83063d4a5">  695</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(512) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;512&gt; {</div><div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;  uint32_t buff[128];</div><div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;};</div><div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00699"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a181e44e9c66f704175590727aaa9e5a1">  699</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(1024) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;1024&gt; {</div><div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;  uint32_t buff[256];</div><div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;};</div><div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00703"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ae72c8fa997bb251d4140dceb03147154">  703</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(2048) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;2048&gt; {</div><div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;  uint32_t buff[512];</div><div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;};</div><div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00707"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#ada29683f1b408ae7b73cc8fbe2108628">  707</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">__align__</a>(4096) <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk</a>&lt;4096&gt; {</div><div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;  uint32_t buff[1024];</div><div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;};</div><div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;</div><div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">size_t</span> Len, <span class="keywordtype">size_t</span> Align&gt;</div><div class="line"><a name="l00713"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1aligned__storage.html">  713</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1aligned__storage.html">aligned_storage</a> {</div><div class="line"><a name="l00714"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1">  714</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk&lt;Align&gt;</a> <a class="code" href="structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1">type</a>[Len / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1platform_1_1aligned__chunk.html">aligned_chunk&lt;Align&gt;</a>)];</div><div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;};</div><div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;</div><div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;</div><div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;<span class="keyword">using</span> std::aligned_storage;</div><div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;</div><div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00722"></a><span class="lineno">  722</span>&#160;</div><div class="line"><a name="l00723"></a><span class="lineno">  723</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__)</span></div><div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00726"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1default__delete.html">  726</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1default__delete.html">default_delete</a> {</div><div class="line"><a name="l00727"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15">  727</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15">operator()</a>(T* ptr)<span class="keyword"> const </span>{ <span class="keyword">delete</span> ptr; }</div><div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;};</div><div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;</div><div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00732"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html">  732</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1platform_1_1default__delete.html">default_delete</a>&lt;T[]&gt; {</div><div class="line"><a name="l00733"></a><span class="lineno"><a class="line" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87">  733</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87">operator()</a>(T* ptr)<span class="keyword"> const </span>{ <span class="keyword">delete</span>[] ptr; }</div><div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;};</div><div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;</div><div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T, <span class="keyword">class</span> Deleter = default_delete&lt;T&gt; &gt;</div><div class="line"><a name="l00738"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html">  738</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr</a> {</div><div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00740"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">  740</a></span>&#160;  <span class="keyword">typedef</span> T* <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a>;</div><div class="line"><a name="l00741"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a94cea0ebf2ac4bec69dfa1f80ea07d50">  741</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a94cea0ebf2ac4bec69dfa1f80ea07d50">element_type</a>;</div><div class="line"><a name="l00742"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">  742</a></span>&#160;  <span class="keyword">typedef</span> Deleter <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">deleter_type</a>;</div><div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;</div><div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> _ptr;</div><div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160;</div><div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">deleter_type</a> _deleter;</div><div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160;</div><div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00752"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#aa8a370bc7e4c2d99eb85e7fea27b3179">  752</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#aa8a370bc7e4c2d99eb85e7fea27b3179">unique_ptr</a>() : _ptr(<a class="code" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>) {}</div><div class="line"><a name="l00753"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a14c8bf5a5deefe4a6602ccd5c5af364c">  753</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a14c8bf5a5deefe4a6602ccd5c5af364c">unique_ptr</a>(<a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> p) : _ptr(p) {}</div><div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;</div><div class="line"><a name="l00755"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf">  755</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf">~unique_ptr</a>() {</div><div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;    <span class="keywordflow">if</span> (_ptr) {</div><div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;      _deleter(_ptr);</div><div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;    }</div><div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;  }</div><div class="line"><a name="l00761"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a2e7c14b8a118f81c1df46ea5045e297b">  761</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> <span class="keyword">get</span>() <span class="keyword">const</span> <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _ptr; }</div><div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;</div><div class="line"><a name="l00764"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279">  764</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279">release</a>() <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> {</div><div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;    <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> p(_ptr);</div><div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;    _ptr = <span class="keyword">nullptr</span>;</div><div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;    <span class="keywordflow">return</span> p;</div><div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;  }</div><div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;</div><div class="line"><a name="l00771"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331">  771</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331">reset</a>(<a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> p = <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a>()) <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> {</div><div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;    <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> old_ptr = _ptr;</div><div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;    _ptr = p;</div><div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;    <span class="keywordflow">if</span> (old_ptr != <span class="keyword">nullptr</span>) {</div><div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;      <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">get_deleter</a>()(old_ptr);</div><div class="line"><a name="l00776"></a><span class="lineno">  776</span>&#160;    }</div><div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160;  }</div><div class="line"><a name="l00778"></a><span class="lineno">  778</span>&#160;</div><div class="line"><a name="l00780"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036">  780</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036">swap</a>(<a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr</a>&amp; other) <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <a class="code" href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">std::swap</a>(_ptr, other._ptr); }</div><div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;</div><div class="line"><a name="l00783"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">  783</a></span>&#160;  Deleter&amp; <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">get_deleter</a>() <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _deleter; }</div><div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;</div><div class="line"><a name="l00786"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#aa427ab4ea4f2336ac6db28d53a4c11ac">  786</a></span>&#160;  Deleter <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#aa427ab4ea4f2336ac6db28d53a4c11ac">get_deleter</a>() const <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _deleter; }</div><div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;</div><div class="line"><a name="l00789"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005">  789</a></span>&#160;  <span class="keyword">operator</span> bool() const <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _ptr != <span class="keyword">nullptr</span>; }</div><div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;</div><div class="line"><a name="l00792"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b">  792</a></span>&#160;  T&amp; <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b">operator*</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> *_ptr; }</div><div class="line"><a name="l00793"></a><span class="lineno">  793</span>&#160;</div><div class="line"><a name="l00795"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b">  795</a></span>&#160;  <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">pointer</a> <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b">operator-&gt;</a>() const <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> { <span class="keywordflow">return</span> _ptr; }</div><div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;</div><div class="line"><a name="l00798"></a><span class="lineno"><a class="line" href="classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d">  798</a></span>&#160;  T&amp; <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d">operator[]</a>(<span class="keywordtype">size_t</span> i)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> _ptr[i]; }</div><div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;};</div><div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;</div><div class="line"><a name="l00802"></a><span class="lineno">  802</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> Deleter&gt;</div><div class="line"><a name="l00803"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">  803</a></span>&#160;<span class="keywordtype">void</span> <a class="code" href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">swap</a>(<a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr&lt;T, Deleter&gt;</a>&amp; lhs, <a class="code" href="classcutlass_1_1platform_1_1unique__ptr.html">unique_ptr&lt;T, Deleter&gt;</a>&amp; rhs) <a class="code" href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a> {</div><div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160;  lhs.swap(rhs);</div><div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;}</div><div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;</div><div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;};  <span class="comment">// namespace platform</span></div><div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;};  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html_a9bbaca83ae76941edb9b75b2741d3ad9"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9">cutlass::platform::integral_constant::value</a></div><div class="ttdeci">static const value_t value</div><div class="ttdef"><b>Definition:</b> platform.h:287</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_af6a9a165e53d7e85ae121d5789aa03e0"><div class="ttname"><a href="namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0">cutlass::platform::max</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr const T &amp; max(const T &amp;a, const T &amp;b)</div><div class="ttdoc">std::max </div><div class="ttdef"><b>Definition:</b> platform.h:215</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="platform_8h_html_a72f0657181cca64b44eb186b707eb380"><div class="ttname"><a href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a></div><div class="ttdeci">#define constexpr</div><div class="ttdef"><b>Definition:</b> platform.h:129</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1nullptr__t_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1nullptr__t.html">cutlass::platform::nullptr_t</a></div><div class="ttdoc">std::nullptr_t </div><div class="ttdef"><b>Definition:</b> platform.h:317</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_a3e83320a39137d92042eb0bf93be9678"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">cutlass::platform::swap</a></div><div class="ttdeci">void swap(unique_ptr&lt; T, Deleter &gt; &amp;lhs, unique_ptr&lt; T, Deleter &gt; &amp;rhs) noexcept</div><div class="ttdoc">Specializes the swap algorithm. </div><div class="ttdef"><b>Definition:</b> platform.h:795</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__pointer__helper_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__pointer__helper.html">cutlass::platform::is_pointer_helper</a></div><div class="ttdoc">Helper for std::is_pointer (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:468</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a85cab9945c36dc56bd7d6adf30c0d252"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">cutlass::platform::unique_ptr::deleter_type</a></div><div class="ttdeci">Deleter deleter_type</div><div class="ttdef"><b>Definition:</b> platform.h:734</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html_ac3662947fa50251daf58240a9c798085"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">cutlass::platform::remove_const::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:369</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_1_1pad_html_abc729cc51d5c90b1d7b0df3092d47cd4"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4">cutlass::platform::alignment_of::pad::val</a></div><div class="ttdeci">value_t val</div><div class="ttdef"><b>Definition:</b> platform.h:578</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1conditional_html_ab6484d0dd6449b5195c4e868026fed11"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11">cutlass::platform::conditional::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:344</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_ab6ce60d03d11b269c1e151dfa7c696f9"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">cutlass::platform::unique_ptr::pointer</a></div><div class="ttdeci">T * pointer</div><div class="ttdef"><b>Definition:</b> platform.h:732</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1less_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1less.html">cutlass::platform::less</a></div><div class="ttdoc">std::less </div><div class="ttdef"><b>Definition:</b> platform.h:181</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:412</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__pointer_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__pointer.html">cutlass::platform::is_pointer</a></div><div class="ttdoc">std::is_pointer </div><div class="ttdef"><b>Definition:</b> platform.h:476</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html_ab2ed0b3506818139f1f96639742e79fd"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">cutlass::platform::integral_constant::value_type</a></div><div class="ttdeci">value_t value_type</div><div class="ttdef"><b>Definition:</b> platform.h:281</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_a90ce74c7faa4e27c888ce56e957b73d5"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5">cutlass::platform::make_pair</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE std::pair&lt; T1, T2 &gt; make_pair(T1 t, T2 u)</div><div class="ttdef"><b>Definition:</b> platform.h:250</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_aa8a370bc7e4c2d99eb85e7fea27b3179"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#aa8a370bc7e4c2d99eb85e7fea27b3179">cutlass::platform::unique_ptr::unique_ptr</a></div><div class="ttdeci">unique_ptr()</div><div class="ttdef"><b>Definition:</b> platform.h:744</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1greater_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1greater.html">cutlass::platform::greater</a></div><div class="ttdoc">std::greater </div><div class="ttdef"><b>Definition:</b> platform.h:189</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_ab9b8306ae9dc21fa646c49b68fa8e197"><div class="ttname"><a href="namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197">cutlass::platform::operator==</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator==(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)</div><div class="ttdef"><b>Definition:</b> platform.h:219</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__void_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__void.html">cutlass::platform::is_void</a></div><div class="ttdoc">std::is_void </div><div class="ttdef"><b>Definition:</b> platform.h:480</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_ab0f21e67c0a4b5c6952042b502c6816f"><div class="ttname"><a href="namespacecutlass_1_1platform.html#ab0f21e67c0a4b5c6952042b502c6816f">cutlass::platform::operator&gt;=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator&gt;=(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)</div><div class="ttdef"><b>Definition:</b> platform.h:245</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_afa52edcaef23461ce1f9c1dac349c24b"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b">cutlass::platform::unique_ptr::operator-&gt;</a></div><div class="ttdeci">pointer operator-&gt;() const noexcept</div><div class="ttdoc">Returns a pointer to the managed object. </div><div class="ttdef"><b>Definition:</b> platform.h:787</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a5c7a204af07a7d325b0a8303e199a50d"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d">cutlass::platform::unique_ptr::operator[]</a></div><div class="ttdeci">T &amp; operator[](size_t i) const</div><div class="ttdoc">Array access to managed object. </div><div class="ttdef"><b>Definition:</b> platform.h:790</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_a9e8e698d40b8df881991fde9ba2a1b12"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12">cutlass::platform::operator&gt;</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator&gt;(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)</div><div class="ttdef"><b>Definition:</b> platform.h:240</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1default__delete_3_01T[]_4_html_a16c5595a5aec7d7ee34e38bef4a66c87"><div class="ttname"><a href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87">cutlass::platform::default_delete&lt; T[]&gt;::operator()</a></div><div class="ttdeci">void operator()(T *ptr) const</div><div class="ttdef"><b>Definition:</b> platform.h:725</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1default__delete_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1default__delete.html">cutlass::platform::default_delete</a></div><div class="ttdoc">Default deleter. </div><div class="ttdef"><b>Definition:</b> platform.h:718</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_html_aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">cutlass::platform::alignment_of::value</a></div><div class="ttdef"><b>Definition:</b> platform.h:582</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_a248f49adf09654d2cd04bd2760ab2566"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566">cutlass::platform::operator!=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator!=(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)</div><div class="ttdef"><b>Definition:</b> platform.h:224</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html">cutlass::platform::unique_ptr</a></div><div class="ttdoc">std::unique_ptr </div><div class="ttdef"><b>Definition:</b> platform.h:730</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_1_1pad_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">cutlass::platform::alignment_of::pad</a></div><div class="ttdef"><b>Definition:</b> platform.h:577</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__floating__point_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__floating__point.html">cutlass::platform::is_floating_point</a></div><div class="ttdoc">std::is_floating_point </div><div class="ttdef"><b>Definition:</b> platform.h:516</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4_html_a8d55f500f667de560650554e9c220644"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644">cutlass::platform::conditional&lt; false, T, F &gt;::type</a></div><div class="ttdeci">F type</div><div class="ttdef"><b>Definition:</b> platform.h:350</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_ad8c95b2109070847b13d355120344380"><div class="ttname"><a href="namespacecutlass_1_1platform.html#ad8c95b2109070847b13d355120344380">cutlass::platform::false_type</a></div><div class="ttdeci">integral_constant&lt; bool, false &gt; false_type</div><div class="ttdoc">The type used as a compile-time boolean with false value. </div><div class="ttdef"><b>Definition:</b> platform.h:300</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_aa427ab4ea4f2336ac6db28d53a4c11ac"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#aa427ab4ea4f2336ac6db28d53a4c11ac">cutlass::platform::unique_ptr::get_deleter</a></div><div class="ttdeci">Deleter const  &amp; get_deleter() const noexcept</div><div class="ttdoc">Returns the deleter object. </div><div class="ttdef"><b>Definition:</b> platform.h:778</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__cv_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__cv.html">cutlass::platform::remove_cv</a></div><div class="ttdoc">std::remove_cv </div><div class="ttdef"><b>Definition:</b> platform.h:392</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html_a5271a533526a535ae8b783c736252f18"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18">cutlass::platform::integral_constant::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE const value_type operator()() const</div><div class="ttdef"><b>Definition:</b> platform.h:286</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a8902399dac4ab64f08f909f2ad9d4bcf"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf">cutlass::platform::unique_ptr::~unique_ptr</a></div><div class="ttdeci">~unique_ptr()</div><div class="ttdef"><b>Definition:</b> platform.h:747</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1greater_html_a8d56cf343dd33acebe19d0b51abe3978"><div class="ttname"><a href="structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978">cutlass::platform::greater::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator()(const T &amp;lhs, const T &amp;rhs) const</div><div class="ttdef"><b>Definition:</b> platform.h:190</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_ac9068e2d027ffdf5cd564deecc2cb9e8"><div class="ttname"><a href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">cutlass::platform::__align__</a></div><div class="ttdeci">struct __align__(1) aligned_chunk&lt; 1 &gt;</div><div class="ttdef"><b>Definition:</b> platform.h:651</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4_html_af68706cfaa6af14edc26ad5b974b47e3"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3">cutlass::platform::remove_const&lt; const T &gt;::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:375</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__volatile_html_a4f5b043d46206248d1bbbcf650707dd1"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1">cutlass::platform::remove_volatile::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:381</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__integral_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__integral.html">cutlass::platform::is_integral</a></div><div class="ttdoc">std::is_integral </div><div class="ttdef"><b>Definition:</b> platform.h:484</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__trivially__copyable_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__trivially__copyable.html">cutlass::platform::is_trivially_copyable</a></div><div class="ttdef"><b>Definition:</b> platform.h:559</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">cutlass::platform::is_base_of_helper::dummy</a></div><div class="ttdef"><b>Definition:</b> platform.h:425</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html_af58810ccead8f16ed88cd6a4afdc6e52"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52">cutlass::platform::integral_constant::type</a></div><div class="ttdeci">integral_constant&lt; value_t, V &gt; type</div><div class="ttdef"><b>Definition:</b> platform.h:282</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__arithmetic_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__arithmetic.html">cutlass::platform::is_arithmetic</a></div><div class="ttdoc">std::is_arithmetic </div><div class="ttdef"><b>Definition:</b> platform.h:523</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_1_1pad_html_a86f075f91b80918e968951713430f0b4"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4">cutlass::platform::alignment_of::pad::byte</a></div><div class="ttdeci">char byte</div><div class="ttdef"><b>Definition:</b> platform.h:579</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html">cutlass::platform::integral_constant</a></div><div class="ttdoc">std::integral_constant </div><div class="ttdef"><b>Definition:</b> platform.h:274</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of.html">cutlass::platform::is_base_of</a></div><div class="ttdoc">std::is_base_of </div><div class="ttdef"><b>Definition:</b> platform.h:440</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1enable__if_html_aff9c0f270020cf097addf77e53a5af99"><div class="ttname"><a href="structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99">cutlass::platform::enable_if::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:334</div></div>
-<div class="ttc" id="platform_8h_html_ab979d9d4b4923f7c54d6caa6e1a61936"><div class="ttname"><a href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a></div><div class="ttdeci">#define nullptr</div><div class="ttdoc">nullptr </div><div class="ttdef"><b>Definition:</b> platform.h:136</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__volatile_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__volatile.html">cutlass::platform::is_volatile</a></div><div class="ttdoc">std::is_volatile </div><div class="ttdef"><b>Definition:</b> platform.h:462</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__fundamental_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__fundamental.html">cutlass::platform::is_fundamental</a></div><div class="ttdoc">std::is_fundamental </div><div class="ttdef"><b>Definition:</b> platform.h:528</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1plus_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1plus.html">cutlass::platform::plus</a></div><div class="ttdoc">platform::plus </div><div class="ttdef"><b>Definition:</b> platform.h:175</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1enable__if_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1enable__if.html">cutlass::platform::enable_if</a></div><div class="ttdoc">std::enable_if (true specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:333</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_a0eddc4a3921e137f31fd8014be96e807"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a0eddc4a3921e137f31fd8014be96e807">cutlass::platform::true_type</a></div><div class="ttdeci">integral_constant&lt; bool, true &gt; true_type</div><div class="ttdoc">The type used as a compile-time boolean with true value. </div><div class="ttdef"><b>Definition:</b> platform.h:297</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1default__delete_html_a59e6e3cc95685ac34fa6f9cf301b3a15"><div class="ttname"><a href="structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15">cutlass::platform::default_delete::operator()</a></div><div class="ttdeci">void operator()(T *ptr) const</div><div class="ttdef"><b>Definition:</b> platform.h:719</div></div>
+<div class="ttc" id="platform_8h_html_a72f0657181cca64b44eb186b707eb380"><div class="ttname"><a href="platform_8h.html#a72f0657181cca64b44eb186b707eb380">constexpr</a></div><div class="ttdeci">#define constexpr</div><div class="ttdef"><b>Definition:</b> platform.h:137</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1nullptr__t_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1nullptr__t.html">cutlass::platform::nullptr_t</a></div><div class="ttdoc">std::nullptr_t </div><div class="ttdef"><b>Definition:</b> platform.h:325</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a3e83320a39137d92042eb0bf93be9678"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678">cutlass::platform::swap</a></div><div class="ttdeci">void swap(unique_ptr&lt; T, Deleter &gt; &amp;lhs, unique_ptr&lt; T, Deleter &gt; &amp;rhs) noexcept</div><div class="ttdoc">Specializes the swap algorithm. </div><div class="ttdef"><b>Definition:</b> platform.h:803</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__pointer__helper_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__pointer__helper.html">cutlass::platform::is_pointer_helper</a></div><div class="ttdoc">Helper for std::is_pointer (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:476</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a85cab9945c36dc56bd7d6adf30c0d252"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252">cutlass::platform::unique_ptr::deleter_type</a></div><div class="ttdeci">Deleter deleter_type</div><div class="ttdef"><b>Definition:</b> platform.h:742</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html_ac3662947fa50251daf58240a9c798085"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">cutlass::platform::remove_const::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:377</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_1_1pad_html_abc729cc51d5c90b1d7b0df3092d47cd4"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4">cutlass::platform::alignment_of::pad::val</a></div><div class="ttdeci">value_t val</div><div class="ttdef"><b>Definition:</b> platform.h:586</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1conditional_html_ab6484d0dd6449b5195c4e868026fed11"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11">cutlass::platform::conditional::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:352</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_ab6ce60d03d11b269c1e151dfa7c696f9"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9">cutlass::platform::unique_ptr::pointer</a></div><div class="ttdeci">T * pointer</div><div class="ttdef"><b>Definition:</b> platform.h:740</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1less_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1less.html">cutlass::platform::less</a></div><div class="ttdoc">std::less </div><div class="ttdef"><b>Definition:</b> platform.h:189</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__same_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__same.html">cutlass::platform::is_same</a></div><div class="ttdoc">std::is_same (false specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:420</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__pointer_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__pointer.html">cutlass::platform::is_pointer</a></div><div class="ttdoc">std::is_pointer </div><div class="ttdef"><b>Definition:</b> platform.h:484</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html_ab2ed0b3506818139f1f96639742e79fd"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd">cutlass::platform::integral_constant::value_type</a></div><div class="ttdeci">value_t value_type</div><div class="ttdef"><b>Definition:</b> platform.h:289</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a90ce74c7faa4e27c888ce56e957b73d5"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5">cutlass::platform::make_pair</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE std::pair&lt; T1, T2 &gt; make_pair(T1 t, T2 u)</div><div class="ttdef"><b>Definition:</b> platform.h:258</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_aa8a370bc7e4c2d99eb85e7fea27b3179"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#aa8a370bc7e4c2d99eb85e7fea27b3179">cutlass::platform::unique_ptr::unique_ptr</a></div><div class="ttdeci">unique_ptr()</div><div class="ttdef"><b>Definition:</b> platform.h:752</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a043e8559161ee0fcaf943a1dfe1a9cbb"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb">cutlass::platform::operator==</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator==(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Equality operator. </div><div class="ttdef"><b>Definition:</b> complex.h:224</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1greater_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1greater.html">cutlass::platform::greater</a></div><div class="ttdoc">std::greater </div><div class="ttdef"><b>Definition:</b> platform.h:197</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__void_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__void.html">cutlass::platform::is_void</a></div><div class="ttdoc">std::is_void </div><div class="ttdef"><b>Definition:</b> platform.h:488</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_ab0f21e67c0a4b5c6952042b502c6816f"><div class="ttname"><a href="namespacecutlass_1_1platform.html#ab0f21e67c0a4b5c6952042b502c6816f">cutlass::platform::operator&gt;=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator&gt;=(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)</div><div class="ttdef"><b>Definition:</b> platform.h:253</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_afa52edcaef23461ce1f9c1dac349c24b"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b">cutlass::platform::unique_ptr::operator-&gt;</a></div><div class="ttdeci">pointer operator-&gt;() const noexcept</div><div class="ttdoc">Returns a pointer to the managed object. </div><div class="ttdef"><b>Definition:</b> platform.h:795</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a5c7a204af07a7d325b0a8303e199a50d"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d">cutlass::platform::unique_ptr::operator[]</a></div><div class="ttdeci">T &amp; operator[](size_t i) const</div><div class="ttdoc">Array access to managed object. </div><div class="ttdef"><b>Definition:</b> platform.h:798</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a9e8e698d40b8df881991fde9ba2a1b12"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12">cutlass::platform::operator&gt;</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator&gt;(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)</div><div class="ttdef"><b>Definition:</b> platform.h:248</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1default__delete_3_01T[]_4_html_a16c5595a5aec7d7ee34e38bef4a66c87"><div class="ttname"><a href="structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87">cutlass::platform::default_delete&lt; T[]&gt;::operator()</a></div><div class="ttdeci">void operator()(T *ptr) const</div><div class="ttdef"><b>Definition:</b> platform.h:733</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1default__delete_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1default__delete.html">cutlass::platform::default_delete</a></div><div class="ttdoc">Default deleter. </div><div class="ttdef"><b>Definition:</b> platform.h:726</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_html_aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83">cutlass::platform::alignment_of::value</a></div><div class="ttdef"><b>Definition:</b> platform.h:590</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html">cutlass::platform::unique_ptr</a></div><div class="ttdoc">std::unique_ptr </div><div class="ttdef"><b>Definition:</b> platform.h:738</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_1_1pad_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html">cutlass::platform::alignment_of::pad</a></div><div class="ttdef"><b>Definition:</b> platform.h:585</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__floating__point_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__floating__point.html">cutlass::platform::is_floating_point</a></div><div class="ttdoc">std::is_floating_point </div><div class="ttdef"><b>Definition:</b> platform.h:524</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4_html_a8d55f500f667de560650554e9c220644"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644">cutlass::platform::conditional&lt; false, T, F &gt;::type</a></div><div class="ttdeci">F type</div><div class="ttdef"><b>Definition:</b> platform.h:358</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_ad8c95b2109070847b13d355120344380"><div class="ttname"><a href="namespacecutlass_1_1platform.html#ad8c95b2109070847b13d355120344380">cutlass::platform::false_type</a></div><div class="ttdeci">integral_constant&lt; bool, false &gt; false_type</div><div class="ttdoc">The type used as a compile-time boolean with false value. </div><div class="ttdef"><b>Definition:</b> platform.h:308</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_aa427ab4ea4f2336ac6db28d53a4c11ac"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#aa427ab4ea4f2336ac6db28d53a4c11ac">cutlass::platform::unique_ptr::get_deleter</a></div><div class="ttdeci">Deleter const  &amp; get_deleter() const noexcept</div><div class="ttdoc">Returns the deleter object. </div><div class="ttdef"><b>Definition:</b> platform.h:786</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__cv_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__cv.html">cutlass::platform::remove_cv</a></div><div class="ttdoc">std::remove_cv </div><div class="ttdef"><b>Definition:</b> platform.h:400</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html_a5271a533526a535ae8b783c736252f18"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18">cutlass::platform::integral_constant::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE const value_type operator()() const</div><div class="ttdef"><b>Definition:</b> platform.h:294</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a8902399dac4ab64f08f909f2ad9d4bcf"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf">cutlass::platform::unique_ptr::~unique_ptr</a></div><div class="ttdeci">~unique_ptr()</div><div class="ttdef"><b>Definition:</b> platform.h:755</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1greater_html_a8d56cf343dd33acebe19d0b51abe3978"><div class="ttname"><a href="structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978">cutlass::platform::greater::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator()(const T &amp;lhs, const T &amp;rhs) const</div><div class="ttdef"><b>Definition:</b> platform.h:198</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_ac9068e2d027ffdf5cd564deecc2cb9e8"><div class="ttname"><a href="namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8">cutlass::platform::__align__</a></div><div class="ttdeci">struct __align__(1) aligned_chunk&lt; 1 &gt;</div><div class="ttdef"><b>Definition:</b> platform.h:659</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4_html_af68706cfaa6af14edc26ad5b974b47e3"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3">cutlass::platform::remove_const&lt; const T &gt;::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:383</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__volatile_html_a4f5b043d46206248d1bbbcf650707dd1"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1">cutlass::platform::remove_volatile::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:389</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__integral_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__integral.html">cutlass::platform::is_integral</a></div><div class="ttdoc">std::is_integral </div><div class="ttdef"><b>Definition:</b> platform.h:492</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__trivially__copyable_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__trivially__copyable.html">cutlass::platform::is_trivially_copyable</a></div><div class="ttdef"><b>Definition:</b> platform.h:567</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html">cutlass::platform::is_base_of_helper::dummy</a></div><div class="ttdef"><b>Definition:</b> platform.h:433</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html_af58810ccead8f16ed88cd6a4afdc6e52"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52">cutlass::platform::integral_constant::type</a></div><div class="ttdeci">integral_constant&lt; value_t, V &gt; type</div><div class="ttdef"><b>Definition:</b> platform.h:290</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__arithmetic_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__arithmetic.html">cutlass::platform::is_arithmetic</a></div><div class="ttdoc">std::is_arithmetic </div><div class="ttdef"><b>Definition:</b> platform.h:531</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_1_1pad_html_a86f075f91b80918e968951713430f0b4"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4">cutlass::platform::alignment_of::pad::byte</a></div><div class="ttdeci">char byte</div><div class="ttdef"><b>Definition:</b> platform.h:587</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1integral__constant_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1integral__constant.html">cutlass::platform::integral_constant</a></div><div class="ttdoc">std::integral_constant </div><div class="ttdef"><b>Definition:</b> platform.h:282</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of.html">cutlass::platform::is_base_of</a></div><div class="ttdoc">std::is_base_of </div><div class="ttdef"><b>Definition:</b> platform.h:448</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1enable__if_html_aff9c0f270020cf097addf77e53a5af99"><div class="ttname"><a href="structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99">cutlass::platform::enable_if::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:342</div></div>
+<div class="ttc" id="platform_8h_html_ab979d9d4b4923f7c54d6caa6e1a61936"><div class="ttname"><a href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a></div><div class="ttdeci">#define nullptr</div><div class="ttdoc">nullptr </div><div class="ttdef"><b>Definition:</b> platform.h:144</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__volatile_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__volatile.html">cutlass::platform::is_volatile</a></div><div class="ttdoc">std::is_volatile </div><div class="ttdef"><b>Definition:</b> platform.h:470</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__fundamental_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__fundamental.html">cutlass::platform::is_fundamental</a></div><div class="ttdoc">std::is_fundamental </div><div class="ttdef"><b>Definition:</b> platform.h:536</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1plus_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1plus.html">cutlass::platform::plus</a></div><div class="ttdoc">platform::plus </div><div class="ttdef"><b>Definition:</b> platform.h:183</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1enable__if_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1enable__if.html">cutlass::platform::enable_if</a></div><div class="ttdoc">std::enable_if (true specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:341</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a0eddc4a3921e137f31fd8014be96e807"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a0eddc4a3921e137f31fd8014be96e807">cutlass::platform::true_type</a></div><div class="ttdeci">integral_constant&lt; bool, true &gt; true_type</div><div class="ttdoc">The type used as a compile-time boolean with true value. </div><div class="ttdef"><b>Definition:</b> platform.h:305</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1default__delete_html_a59e6e3cc95685ac34fa6f9cf301b3a15"><div class="ttname"><a href="structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15">cutlass::platform::default_delete::operator()</a></div><div class="ttdeci">void operator()(T *ptr) const</div><div class="ttdef"><b>Definition:</b> platform.h:727</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a94cea0ebf2ac4bec69dfa1f80ea07d50"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a94cea0ebf2ac4bec69dfa1f80ea07d50">cutlass::platform::unique_ptr::element_type</a></div><div class="ttdeci">T element_type</div><div class="ttdef"><b>Definition:</b> platform.h:733</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a5b8d8ecafb4da336acd50e40cd42b6e0"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">cutlass::platform::unique_ptr::get_deleter</a></div><div class="ttdeci">Deleter &amp; get_deleter() noexcept</div><div class="ttdoc">Returns the deleter object. </div><div class="ttdef"><b>Definition:</b> platform.h:775</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of.html">cutlass::platform::alignment_of</a></div><div class="ttdoc">std::alignment_of </div><div class="ttdef"><b>Definition:</b> platform.h:576</div></div>
-<div class="ttc" id="namespacecutlass_1_1platform_html_a57c071d2a7305dd4ec60542e66b0c81c"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">cutlass::platform::min</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr const T &amp; min(const T &amp;a, const T &amp;b)</div><div class="ttdoc">std::min </div><div class="ttdef"><b>Definition:</b> platform.h:201</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__cv_html_a19e5b12cf4eb15ce13d6306735b6de08"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08">cutlass::platform::remove_cv::type</a></div><div class="ttdeci">remove_volatile&lt; typename remove_const&lt; T &gt;::type &gt;::type type</div><div class="ttdef"><b>Definition:</b> platform.h:393</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1conditional_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional.html">cutlass::platform::conditional</a></div><div class="ttdoc">std::conditional (true specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:343</div></div>
-<div class="ttc" id="platform_8h_html_a189faadd7f99f6c354db09acbb2aafcd"><div class="ttname"><a href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a></div><div class="ttdeci">#define noexcept</div><div class="ttdoc">noexcept, constexpr </div><div class="ttdef"><b>Definition:</b> platform.h:126</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a6740f71511f5495d6038cf8878862331"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331">cutlass::platform::unique_ptr::reset</a></div><div class="ttdeci">void reset(pointer p=pointer()) noexcept</div><div class="ttdoc">Replaces the managed object, deleting the old object. </div><div class="ttdef"><b>Definition:</b> platform.h:763</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a45a3cb6d8641a6130991d56e84cbb38b"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b">cutlass::platform::unique_ptr::operator*</a></div><div class="ttdeci">T &amp; operator*() const</div><div class="ttdoc">Dereferences the unique_ptr. </div><div class="ttdef"><b>Definition:</b> platform.h:784</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper.html">cutlass::platform::is_base_of_helper</a></div><div class="ttdoc">Helper for std::is_base_of. </div><div class="ttdef"><b>Definition:</b> platform.h:420</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html">cutlass::platform::remove_const</a></div><div class="ttdoc">std::remove_const (non-const specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:368</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1plus_html_a3bf1e5147df4287bf58ad8f11ea0d98c"><div class="ttname"><a href="structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c">cutlass::platform::plus::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr T operator()(const T &amp;lhs, const T &amp;rhs) const</div><div class="ttdef"><b>Definition:</b> platform.h:176</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1less_html_adfb49ee70a700a8483c70b4b353f6bc5"><div class="ttname"><a href="structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5">cutlass::platform::less::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator()(const T &amp;lhs, const T &amp;rhs) const</div><div class="ttdef"><b>Definition:</b> platform.h:182</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1aligned__chunk_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1aligned__chunk.html">cutlass::platform::aligned_chunk</a></div><div class="ttdef"><b>Definition:</b> platform.h:649</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a94cea0ebf2ac4bec69dfa1f80ea07d50"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a94cea0ebf2ac4bec69dfa1f80ea07d50">cutlass::platform::unique_ptr::element_type</a></div><div class="ttdeci">T element_type</div><div class="ttdef"><b>Definition:</b> platform.h:741</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a5b8d8ecafb4da336acd50e40cd42b6e0"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0">cutlass::platform::unique_ptr::get_deleter</a></div><div class="ttdeci">Deleter &amp; get_deleter() noexcept</div><div class="ttdoc">Returns the deleter object. </div><div class="ttdef"><b>Definition:</b> platform.h:783</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1alignment__of_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1alignment__of.html">cutlass::platform::alignment_of</a></div><div class="ttdoc">std::alignment_of </div><div class="ttdef"><b>Definition:</b> platform.h:584</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_a57c071d2a7305dd4ec60542e66b0c81c"><div class="ttname"><a href="namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c">cutlass::platform::min</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr const T &amp; min(const T &amp;a, const T &amp;b)</div><div class="ttdoc">std::min </div><div class="ttdef"><b>Definition:</b> platform.h:209</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__cv_html_a19e5b12cf4eb15ce13d6306735b6de08"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08">cutlass::platform::remove_cv::type</a></div><div class="ttdeci">remove_volatile&lt; typename remove_const&lt; T &gt;::type &gt;::type type</div><div class="ttdef"><b>Definition:</b> platform.h:401</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1conditional_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional.html">cutlass::platform::conditional</a></div><div class="ttdoc">std::conditional (true specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:351</div></div>
+<div class="ttc" id="platform_8h_html_a189faadd7f99f6c354db09acbb2aafcd"><div class="ttname"><a href="platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd">noexcept</a></div><div class="ttdeci">#define noexcept</div><div class="ttdoc">noexcept, constexpr </div><div class="ttdef"><b>Definition:</b> platform.h:134</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a6740f71511f5495d6038cf8878862331"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331">cutlass::platform::unique_ptr::reset</a></div><div class="ttdeci">void reset(pointer p=pointer()) noexcept</div><div class="ttdoc">Replaces the managed object, deleting the old object. </div><div class="ttdef"><b>Definition:</b> platform.h:771</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a45a3cb6d8641a6130991d56e84cbb38b"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b">cutlass::platform::unique_ptr::operator*</a></div><div class="ttdeci">T &amp; operator*() const</div><div class="ttdoc">Dereferences the unique_ptr. </div><div class="ttdef"><b>Definition:</b> platform.h:792</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper.html">cutlass::platform::is_base_of_helper</a></div><div class="ttdoc">Helper for std::is_base_of. </div><div class="ttdef"><b>Definition:</b> platform.h:428</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html">cutlass::platform::remove_const</a></div><div class="ttdoc">std::remove_const (non-const specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:376</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1plus_html_a3bf1e5147df4287bf58ad8f11ea0d98c"><div class="ttname"><a href="structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c">cutlass::platform::plus::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr T operator()(const T &amp;lhs, const T &amp;rhs) const</div><div class="ttdef"><b>Definition:</b> platform.h:184</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1less_html_adfb49ee70a700a8483c70b4b353f6bc5"><div class="ttname"><a href="structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5">cutlass::platform::less::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE constexpr bool operator()(const T &amp;lhs, const T &amp;rhs) const</div><div class="ttdef"><b>Definition:</b> platform.h:190</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1aligned__chunk_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1aligned__chunk.html">cutlass::platform::aligned_chunk</a></div><div class="ttdef"><b>Definition:</b> platform.h:657</div></div>
 <div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_html_a5bf08859497e304ca353699ad6ac332b"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b">cutlass::platform::is_base_of_helper::check</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE yes check(DerivedT *, T)</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4_html_aca9bb93efe43106321e4afe0b67542a3"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3">cutlass::platform::remove_volatile&lt; volatile T &gt;::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:387</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a748d413c50bdbbe9e2f9986fbc423036"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036">cutlass::platform::unique_ptr::swap</a></div><div class="ttdeci">void swap(unique_ptr &amp;other) noexcept</div><div class="ttdoc">Swaps the managed objects with *this and another unique_ptr. </div><div class="ttdef"><b>Definition:</b> platform.h:772</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_html_ac7e3ab73057682cc2eb6ed74c33e5eff"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff">cutlass::platform::is_base_of_helper::value</a></div><div class="ttdeci">static const bool value</div><div class="ttdef"><b>Definition:</b> platform.h:435</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1aligned__storage_html_a9cf0360f335bcd1e9d9e1b266b6dd6c1"><div class="ttname"><a href="structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1">cutlass::platform::aligned_storage::type</a></div><div class="ttdeci">aligned_chunk&lt; Align &gt; type[Len/sizeof(aligned_chunk&lt; Align &gt;)]</div><div class="ttdef"><b>Definition:</b> platform.h:706</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1aligned__storage_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1aligned__storage.html">cutlass::platform::aligned_storage</a></div><div class="ttdoc">std::aligned_storage </div><div class="ttdef"><b>Definition:</b> platform.h:705</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1remove__volatile_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__volatile.html">cutlass::platform::remove_volatile</a></div><div class="ttdoc">std::remove_volatile (non-volatile specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:380</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a14c8bf5a5deefe4a6602ccd5c5af364c"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a14c8bf5a5deefe4a6602ccd5c5af364c">cutlass::platform::unique_ptr::unique_ptr</a></div><div class="ttdeci">unique_ptr(pointer p)</div><div class="ttdef"><b>Definition:</b> platform.h:745</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_html_ac1cf3f804e7686213fd42c678cc6d669"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">cutlass::platform::is_base_of_helper::yes</a></div><div class="ttdeci">char(&amp; yes)[1]</div><div class="ttdef"><b>Definition:</b> platform.h:421</div></div>
-<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a7ac06ebe7bc66573d3225891e12d2279"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279">cutlass::platform::unique_ptr::release</a></div><div class="ttdeci">pointer release() noexcept</div><div class="ttdoc">Releases ownership of the managed object, if any. </div><div class="ttdef"><b>Definition:</b> platform.h:756</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4_html_aca9bb93efe43106321e4afe0b67542a3"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3">cutlass::platform::remove_volatile&lt; volatile T &gt;::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:395</div></div>
+<div class="ttc" id="namespacecutlass_1_1platform_html_aa8b8911c3529ee9d433b0c4d90bde50c"><div class="ttname"><a href="namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c">cutlass::platform::operator!=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator!=(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)</div><div class="ttdoc">Inequality operator. </div><div class="ttdef"><b>Definition:</b> complex.h:232</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a748d413c50bdbbe9e2f9986fbc423036"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036">cutlass::platform::unique_ptr::swap</a></div><div class="ttdeci">void swap(unique_ptr &amp;other) noexcept</div><div class="ttdoc">Swaps the managed objects with *this and another unique_ptr. </div><div class="ttdef"><b>Definition:</b> platform.h:780</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_html_ac7e3ab73057682cc2eb6ed74c33e5eff"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff">cutlass::platform::is_base_of_helper::value</a></div><div class="ttdeci">static const bool value</div><div class="ttdef"><b>Definition:</b> platform.h:443</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1aligned__storage_html_a9cf0360f335bcd1e9d9e1b266b6dd6c1"><div class="ttname"><a href="structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1">cutlass::platform::aligned_storage::type</a></div><div class="ttdeci">aligned_chunk&lt; Align &gt; type[Len/sizeof(aligned_chunk&lt; Align &gt;)]</div><div class="ttdef"><b>Definition:</b> platform.h:714</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1aligned__storage_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1aligned__storage.html">cutlass::platform::aligned_storage</a></div><div class="ttdoc">std::aligned_storage </div><div class="ttdef"><b>Definition:</b> platform.h:713</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__volatile_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__volatile.html">cutlass::platform::remove_volatile</a></div><div class="ttdoc">std::remove_volatile (non-volatile specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:388</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a14c8bf5a5deefe4a6602ccd5c5af364c"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a14c8bf5a5deefe4a6602ccd5c5af364c">cutlass::platform::unique_ptr::unique_ptr</a></div><div class="ttdeci">unique_ptr(pointer p)</div><div class="ttdef"><b>Definition:</b> platform.h:753</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_html_ac1cf3f804e7686213fd42c678cc6d669"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669">cutlass::platform::is_base_of_helper::yes</a></div><div class="ttdeci">char(&amp; yes)[1]</div><div class="ttdef"><b>Definition:</b> platform.h:429</div></div>
+<div class="ttc" id="classcutlass_1_1platform_1_1unique__ptr_html_a7ac06ebe7bc66573d3225891e12d2279"><div class="ttname"><a href="classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279">cutlass::platform::unique_ptr::release</a></div><div class="ttdeci">pointer release() noexcept</div><div class="ttdoc">Releases ownership of the managed object, if any. </div><div class="ttdef"><b>Definition:</b> platform.h:764</div></div>
 <div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1bool__constant_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1bool__constant.html">cutlass::platform::bool_constant</a></div><div class="ttdoc">std::bool_constant </div><div class="ttdef"><b>Definition:</b> platform.h:306</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_html_ae096aa6c67f60d8d9c5a4b084118a8af"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af">cutlass::platform::is_base_of_helper::no</a></div><div class="ttdeci">char(&amp; no)[2]</div><div class="ttdef"><b>Definition:</b> platform.h:422</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1bool__constant_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1bool__constant.html">cutlass::platform::bool_constant</a></div><div class="ttdoc">std::bool_constant </div><div class="ttdef"><b>Definition:</b> platform.h:314</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1is__base__of__helper_html_ae096aa6c67f60d8d9c5a4b084118a8af"><div class="ttname"><a href="structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af">cutlass::platform::is_base_of_helper::no</a></div><div class="ttdeci">char(&amp; no)[2]</div><div class="ttdef"><b>Definition:</b> platform.h:430</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/predicate__vector_8h.html b/docs/predicate__vector_8h.html
index 42e3f56f3..612092eda 100644
--- a/docs/predicate__vector_8h.html
+++ b/docs/predicate__vector_8h.html
@@ -82,10 +82,11 @@ $(function() {
 
 <p>Defines container classes and iterators for managing a statically sized vector of boolean predicates.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;stdint.h&gt;</code><br />
-<code>#include &lt;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &lt;assert.h&gt;</code><br />
+<code>#include &lt;stdint.h&gt;</code><br />
+<code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&quot;</code><br />
 </div>
 <p><a href="predicate__vector_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -121,7 +122,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/predicate__vector_8h_source.html b/docs/predicate__vector_8h_source.html
index fed29ff10..3123af79a 100644
--- a/docs/predicate__vector_8h_source.html
+++ b/docs/predicate__vector_8h_source.html
@@ -76,78 +76,78 @@ $(function() {
 <div class="title">predicate_vector.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="predicate__vector_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;stdint.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <span class="keywordtype">int</span> kPredicates_,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    <span class="keywordtype">int</span> kPredicatesPerByte_ = 4,</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keywordtype">int</span> kPredicateStart_ = 0&gt;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html">  104</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> {</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">  106</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a> = kPredicates_;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">  109</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a> = kPredicatesPerByte_;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">  112</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">kPredicateStart</a> = kPredicateStart_;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <span class="comment">// Make sure no one tries to put more than 8 bits in a byte :)</span></div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">  115</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a> &lt;= 8, <span class="stringliteral">&quot;kPredicatesPerByte must fit within an actual byte&quot;</span>);</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  <span class="comment">// Make sure the &quot;offsetted&quot; bits fit in one byte.</span></div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">kPredicateStart</a> + <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a> &lt; 8,</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;                <span class="stringliteral">&quot;The offsetted predicates must fit within an actual byte.&quot;</span>);</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <span class="keyword">typedef</span> uint32_t <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">  124</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">kBytes</a> = (<a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a> + <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a> - 1) / <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a>;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">  127</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a> = (<a class="code" href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">kBytes</a> + <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>) - 1) / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>);</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> storageData[<a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>];</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> computeStorageOffset(<span class="keywordtype">int</span> &amp;word, <span class="keywordtype">int</span> &amp;bit, <span class="keywordtype">int</span> idx)<span class="keyword"> const </span>{</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <a class="code" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a>(idx &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a>);</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="keywordtype">int</span> byte = (idx / <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a>);</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keywordtype">int</span> bit_offset = (idx % <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a>);</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    word = byte / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>);</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <span class="keywordtype">int</span> byte_offset = (byte % <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>));</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    bit = byte_offset * 8 + bit_offset + <a class="code" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">kPredicateStart</a>;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  }</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> &amp;storage(<span class="keywordtype">int</span> word) {</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    <a class="code" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a>(word &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>);</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="keywordflow">return</span> storageData[word];</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  }</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> <span class="keyword">const</span> &amp;storage(<span class="keywordtype">int</span> word)<span class="keyword"> const </span>{</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    <a class="code" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a>(word &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>);</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <span class="keywordflow">return</span> storageData[word];</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  }</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  <span class="comment">// Iterator</span></div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00176"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">  176</a></span>&#160;  <span class="keyword">class </span><a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> {</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;vec_;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <span class="keywordtype">int</span> bit_;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;   <span class="keyword">public</span>:</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7">  186</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7">ConstIterator</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <span class="keyword">const</span> &amp;it) : vec_(it.vec_), bit_(it.bit_) {}</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00190"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda">  190</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda">ConstIterator</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;_vec, <span class="keywordtype">int</span> _start = 0) : vec_(_vec), bit_(_start) {}</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70">  194</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70">operator++</a>() {</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      ++bit_;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    }</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286">  201</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286">operator--</a>() {</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      --bit_;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;    }</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00208"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5">  208</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5">operator++</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      ret.bit_++;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    }</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00216"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b">  216</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b">operator--</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      ret.bit_--;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;    }</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357">  224</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357">operator==</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <span class="keyword">const</span> &amp;it)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> bit_ == it.bit_; }</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00228"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685">  228</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685">operator!=</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <span class="keyword">const</span> &amp;it)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> bit_ != it.bit_; }</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00232"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946">  232</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946">operator*</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> vec_[bit_]; }</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;  };</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div><div class="line"><a name="l00240"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html">  240</a></span>&#160;  <span class="keyword">class </span><a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> {</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> &amp;vec_;</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;    <span class="keywordtype">int</span> bit_;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;   <span class="keyword">public</span>:</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00250"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077">  250</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077">Iterator</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <span class="keyword">const</span> &amp;it) : vec_(it.vec_), bit_(it.bit_) {}</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00254"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038">  254</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038">Iterator</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> &amp;_vec, <span class="keywordtype">int</span> _start = 0) : vec_(_vec), bit_(_start) {}</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00258"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3">  258</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> &amp;<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3">operator++</a>() {</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;      ++bit_;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    }</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00265"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61">  265</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> &amp;<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61">operator--</a>() {</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;      --bit_;</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    }</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00272"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3">  272</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3">operator++</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;      <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;      ret.bit_++;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;    }</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00280"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a">  280</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a">operator--</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;      <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;      ret.bit_--;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;    }</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00288"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e">  288</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e">operator==</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <span class="keyword">const</span> &amp;it)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> bit_ == it.bit_; }</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00292"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887">  292</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887">operator!=</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <span class="keyword">const</span> &amp;it)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> bit_ != it.bit_; }</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00296"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#af035589126434bd2dbef4000cd864b8b">  296</a></span>&#160;    <span class="keywordtype">bool</span> <span class="keyword">get</span>() { <span class="keywordflow">return</span> vec_[bit_]; }</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4">  300</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4">operator*</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> vec_[bit_]; }</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00304"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aadfd039b5622098c9e46706a27122575">  304</a></span>&#160;    <span class="keywordtype">void</span> <span class="keyword">set</span>(<span class="keywordtype">bool</span> value = <span class="keyword">true</span>) { vec_.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(bit_, value); }</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;  };</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;</div><div class="line"><a name="l00308"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">  308</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">TrivialIterator</a> {</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00311"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a6cb3664b5cba4280b7055a65ddad7850">  311</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a6cb3664b5cba4280b7055a65ddad7850">TrivialIterator</a>() {}</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00315"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14">  315</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14">TrivialIterator</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <span class="keyword">const</span> &amp;it) {}</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00319"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721">  319</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721">TrivialIterator</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;_vec) {}</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00323"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a">  323</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">TrivialIterator</a> &amp;<a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a">operator++</a>() { <span class="keywordflow">return</span> *<span class="keyword">this</span>; }</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00327"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051">  327</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">TrivialIterator</a> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051">operator++</a>(<span class="keywordtype">int</span>) { <span class="keywordflow">return</span> *<span class="keyword">this</span>; }</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00331"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78">  331</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78">operator*</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;  };</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;</div><div class="line"><a name="l00340"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21">  340</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21">PredicateVector</a>(<span class="keywordtype">bool</span> value = <span class="keyword">true</span>) { <a class="code" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">fill</a>(value); }</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;</div><div class="line"><a name="l00343"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">  343</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">fill</a>(<span class="keywordtype">bool</span> value = <span class="keyword">true</span>) {</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> item = (value ? ~<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>(0) : <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>(0));</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>; ++i) {</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;      storage(i) = item;</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    }</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;  }</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;</div><div class="line"><a name="l00353"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5">  353</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5">operator[]</a>(<span class="keywordtype">int</span> idx)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">at</a>(idx); }</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">  356</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">at</a>(<span class="keywordtype">int</span> idx)<span class="keyword"> const </span>{</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    <span class="keywordtype">int</span> bit, word;</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    computeStorageOffset(word, bit, idx);</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;    <span class="keywordflow">return</span> ((storage(word) &gt;&gt; bit) &amp; 1);</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;  }</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;</div><div class="line"><a name="l00364"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">  364</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <span class="keyword">set</span>(<span class="keywordtype">int</span> idx, <span class="keywordtype">bool</span> value = <span class="keyword">true</span>) {</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;    <span class="keywordtype">int</span> bit, word;</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;    computeStorageOffset(word, bit, idx);</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> disable_mask = (~(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>(1) &lt;&lt; bit));</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> enable_mask = (<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>(value) &lt;&lt; bit);</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;    storage(word) = ((storage(word) &amp; disable_mask) | enable_mask);</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;  }</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;</div><div class="line"><a name="l00375"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9">  375</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> &amp;<a class="code" href="structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9">operator&amp;=</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;predicates) {</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>; ++i) {</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;      storage(i) = (storage(i) &amp; predicates.storage(i));</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;    }</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;  }</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;</div><div class="line"><a name="l00384"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc">  384</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> &amp;<a class="code" href="structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc">operator|=</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;predicates) {</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>; ++i) {</div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;      storage(i) = (storage(i) | predicates.storage(i));</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;    }</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;  }</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;</div><div class="line"><a name="l00393"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a">  393</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a">is_zero</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> mask(0);</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> byte = 0; byte &lt; <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>); ++byte) {</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;      <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> byte_mask = (((1 &lt;&lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a>) - 1) &lt;&lt; <a class="code" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">kPredicateStart</a>);</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;      mask |= (byte_mask &lt;&lt; (byte * 8));</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;    }</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;    uint32_t result = 0;</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> word = 0; word &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>; ++word) {</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;      result |= storage(word);</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;    }</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;    <span class="keywordflow">return</span> result == 0;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;  }</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;</div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00408"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5">  408</a></span>&#160;  Iterator <a class="code" href="structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5">begin</a>() { <span class="keywordflow">return</span> Iterator(*<span class="keyword">this</span>); }</div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00412"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275">  412</a></span>&#160;  Iterator <a class="code" href="structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275">end</a>() { <span class="keywordflow">return</span> Iterator(*<span class="keyword">this</span>, <a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a>); }</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00416"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#aeb7f9226a4fa49d06500c3c83958dc41">  416</a></span>&#160;  ConstIterator <a class="code" href="structcutlass_1_1PredicateVector.html#aeb7f9226a4fa49d06500c3c83958dc41">const_begin</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ConstIterator(*<span class="keyword">this</span>); }</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;</div><div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00420"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321">  420</a></span>&#160;  ConstIterator <a class="code" href="structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321">const_end</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ConstIterator(*<span class="keyword">this</span>, <a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a>); }</div><div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;};</div><div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;</div><div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;</div><div class="line"><a name="l00426"></a><span class="lineno"><a class="line" href="structcutlass_1_1TrivialPredicateTileAdapter.html">  426</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html">TrivialPredicateTileAdapter</a> {</div><div class="line"><a name="l00428"></a><span class="lineno"><a class="line" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7">  428</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7">TrivialPredicateTileAdapter</a>() {}</div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;</div><div class="line"><a name="l00431"></a><span class="lineno"><a class="line" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f">  431</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f">at</a>(<span class="keywordtype">int</span>, <span class="keywordtype">int</span>, <span class="keywordtype">int</span>, <span class="keywordtype">int</span>)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;};</div><div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;</div><div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;</div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> PredicateVector_, <span class="keyword">typename</span> Iterations_&gt;</div><div class="line"><a name="l00438"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html">  438</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1PredicateTileAdapter.html">PredicateTileAdapter</a> {</div><div class="line"><a name="l00440"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">  440</a></span>&#160;  <span class="keyword">typedef</span> PredicateVector_ <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">PredicateVector</a>;</div><div class="line"><a name="l00442"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450">  442</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450">Iterations</a>;</div><div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;</div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;  <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">PredicateVector</a> &amp;predicates;</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;</div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00450"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea">  450</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea">PredicateTileAdapter</a>(<a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">PredicateVector</a> &amp;predicates_) : predicates(predicates_) {}</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;</div><div class="line"><a name="l00453"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986">  453</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">ComputeOffsetFromShape&lt;Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;    <span class="keywordflow">return</span> predicates.at(bit);</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;  }</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;</div><div class="line"><a name="l00459"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#aeda47efdda0387f9c3c7b31f836afca5">  459</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <span class="keyword">set</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c, <span class="keywordtype">bool</span> value) {</div><div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">ComputeOffsetFromShape&lt;Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;    predicates.set(bit, value);</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;  }</div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;};</div><div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;</div><div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;</div><div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> PredicateVector_, <span class="keyword">typename</span> Iterations_&gt;</div><div class="line"><a name="l00469"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html">  469</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html">ConstPredicateTileAdapter</a> {</div><div class="line"><a name="l00471"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">  471</a></span>&#160;  <span class="keyword">typedef</span> PredicateVector_ <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">PredicateVector</a>;</div><div class="line"><a name="l00473"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058">  473</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058">Iterations</a>;</div><div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;</div><div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;  <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">PredicateVector</a> <span class="keyword">const</span> &amp;predicates;</div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;</div><div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00481"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1">  481</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1">ConstPredicateTileAdapter</a>(<a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">PredicateVector</a> <span class="keyword">const</span> &amp;predicates_)</div><div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;      : predicates(predicates_) {}</div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;</div><div class="line"><a name="l00485"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd">  485</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">ComputeOffsetFromShape&lt;Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;    <span class="keywordflow">return</span> predicates.at(bit);</div><div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;  }</div><div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;};</div><div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;</div><div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;</div><div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a83c2f584bd061f0b9b6b2a6cddf5b038"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038">cutlass::PredicateVector::Iterator::Iterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator(PredicateVector &amp;_vec, int _start=0)</div><div class="ttdoc">Constructs an iterator from a PredicateVector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:254</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a3d06715a77740034697686a7977cb685"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685">cutlass::PredicateVector::ConstIterator::operator!=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator!=(ConstIterator const &amp;it) const</div><div class="ttdoc">Returns false if iterators point to the same bit. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:228</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_aab9de134132c62de1c062ca57582cdbc"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc">cutlass::PredicateVector::operator|=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE PredicateVector &amp; operator|=(PredicateVector const &amp;predicates)</div><div class="ttdoc">Computes the union of two identical predicate vectors. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:384</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_ad24e9b451064e99fb19955f772c30e6a"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a">cutlass::PredicateVector::TrivialIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator &amp; operator++()</div><div class="ttdoc">Pre-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:323</div></div>
+<a href="predicate__vector_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;assert.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;stdint.h&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    <span class="keywordtype">int</span> kPredicates_,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    <span class="keywordtype">int</span> kPredicatesPerByte_ = 4,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="keywordtype">int</span> kPredicateStart_ = 0&gt;</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html">  105</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> {</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">  107</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a> = kPredicates_;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">  110</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a> = kPredicatesPerByte_;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">  113</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">kPredicateStart</a> = kPredicateStart_;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  <span class="comment">// Make sure no one tries to put more than 8 bits in a byte :)</span></div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">  116</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a> &lt;= 8, <span class="stringliteral">&quot;kPredicatesPerByte must fit within an actual byte&quot;</span>);</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  <span class="comment">// Make sure the &quot;offsetted&quot; bits fit in one byte.</span></div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">kPredicateStart</a> + <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a> &lt;= 8,</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;                <span class="stringliteral">&quot;The offsetted predicates must fit within an actual byte.&quot;</span>);</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  <span class="keyword">typedef</span> uint32_t <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">  125</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">kBytes</a> = (<a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a> + <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a> - 1) / <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a>;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">  128</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a> = (<a class="code" href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">kBytes</a> + <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>) - 1) / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>);</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> storageData[<a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>];</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> computeStorageOffset(<span class="keywordtype">int</span> &amp;word, <span class="keywordtype">int</span> &amp;bit, <span class="keywordtype">int</span> idx)<span class="keyword"> const </span>{</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <a class="code" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a>(idx &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a>);</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keywordtype">int</span> byte = (idx / <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a>);</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    <span class="keywordtype">int</span> bit_offset = (idx % <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a>);</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    word = byte / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>);</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <span class="keywordtype">int</span> byte_offset = (byte % <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>));</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    bit = byte_offset * 8 + bit_offset + <a class="code" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">kPredicateStart</a>;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  }</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> &amp;storage(<span class="keywordtype">int</span> word) {</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <a class="code" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a>(word &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>);</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    <span class="keywordflow">return</span> storageData[word];</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;  }</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> <span class="keyword">const</span> &amp;storage(<span class="keywordtype">int</span> word)<span class="keyword"> const </span>{</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <a class="code" href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a>(word &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>);</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    <span class="keywordflow">return</span> storageData[word];</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  }</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  <span class="comment">// Iterator</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">  177</a></span>&#160;  <span class="keyword">class </span><a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> {</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;vec_;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keywordtype">int</span> bit_;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;   <span class="keyword">public</span>:</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00187"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7">  187</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7">ConstIterator</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <span class="keyword">const</span> &amp;it) : vec_(it.vec_), bit_(it.bit_) {}</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda">  191</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda">ConstIterator</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;_vec, <span class="keywordtype">int</span> _start = 0) : vec_(_vec), bit_(_start) {}</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00195"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70">  195</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70">operator++</a>() {</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;      ++bit_;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    }</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00202"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286">  202</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286">operator--</a>() {</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;      --bit_;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;    }</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00209"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5">  209</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5">operator++</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      ret.bit_++;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    }</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00217"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b">  217</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b">operator--</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      ret.bit_--;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    }</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00225"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357">  225</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357">operator==</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <span class="keyword">const</span> &amp;it)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> bit_ == it.bit_; }</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685">  229</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685">operator!=</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">ConstIterator</a> <span class="keyword">const</span> &amp;it)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> bit_ != it.bit_; }</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00233"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946">  233</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946">operator*</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> vec_[bit_]; }</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;  };</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00241"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html">  241</a></span>&#160;  <span class="keyword">class </span><a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> {</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> &amp;vec_;</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;    <span class="keywordtype">int</span> bit_;</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;   <span class="keyword">public</span>:</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00251"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077">  251</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077">Iterator</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <span class="keyword">const</span> &amp;it) : vec_(it.vec_), bit_(it.bit_) {}</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00255"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038">  255</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038">Iterator</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> &amp;_vec, <span class="keywordtype">int</span> _start = 0) : vec_(_vec), bit_(_start) {}</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00259"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3">  259</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> &amp;<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3">operator++</a>() {</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;      ++bit_;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    }</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00266"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61">  266</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> &amp;<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61">operator--</a>() {</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;      --bit_;</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;    }</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00273"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3">  273</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3">operator++</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;      <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;      ret.bit_++;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;    }</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00281"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a">  281</a></span>&#160;    <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a">operator--</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;      <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      ret.bit_--;</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;    }</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00289"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e">  289</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e">operator==</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <span class="keyword">const</span> &amp;it)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> bit_ == it.bit_; }</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00293"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887">  293</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887">operator!=</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <span class="keyword">const</span> &amp;it)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> bit_ != it.bit_; }</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00297"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#af035589126434bd2dbef4000cd864b8b">  297</a></span>&#160;    <span class="keywordtype">bool</span> <span class="keyword">get</span>() { <span class="keywordflow">return</span> vec_[bit_]; }</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00301"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4">  301</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4">operator*</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> vec_[bit_]; }</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00305"></a><span class="lineno"><a class="line" href="classcutlass_1_1PredicateVector_1_1Iterator.html#aadfd039b5622098c9e46706a27122575">  305</a></span>&#160;    <span class="keywordtype">void</span> <span class="keyword">set</span>(<span class="keywordtype">bool</span> value = <span class="keyword">true</span>) { vec_.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(bit_, value); }</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;  };</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div><div class="line"><a name="l00309"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">  309</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">TrivialIterator</a> {</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00312"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a6cb3664b5cba4280b7055a65ddad7850">  312</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a6cb3664b5cba4280b7055a65ddad7850">TrivialIterator</a>() {}</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00316"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14">  316</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14">TrivialIterator</a>(<a class="code" href="classcutlass_1_1PredicateVector_1_1Iterator.html">Iterator</a> <span class="keyword">const</span> &amp;it) {}</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00320"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721">  320</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721">TrivialIterator</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;_vec) {}</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00324"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a">  324</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">TrivialIterator</a> &amp;<a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a">operator++</a>() { <span class="keywordflow">return</span> *<span class="keyword">this</span>; }</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00328"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051">  328</a></span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">TrivialIterator</a> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051">operator++</a>(<span class="keywordtype">int</span>) { <span class="keywordflow">return</span> *<span class="keyword">this</span>; }</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00332"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78">  332</a></span>&#160;    <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78">operator*</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;  };</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;</div><div class="line"><a name="l00341"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21">  341</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21">PredicateVector</a>(<span class="keywordtype">bool</span> value = <span class="keyword">true</span>) { <a class="code" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">fill</a>(value); }</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;</div><div class="line"><a name="l00344"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">  344</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">fill</a>(<span class="keywordtype">bool</span> value = <span class="keyword">true</span>) {</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> item = (value ? ~<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>(0) : <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>(0));</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>; ++i) {</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;      storage(i) = item;</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;    }</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;  }</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div><div class="line"><a name="l00354"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5">  354</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5">operator[]</a>(<span class="keywordtype">int</span> idx)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">at</a>(idx); }</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;</div><div class="line"><a name="l00357"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">  357</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">at</a>(<span class="keywordtype">int</span> idx)<span class="keyword"> const </span>{</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    <span class="keywordtype">int</span> bit, word;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;    computeStorageOffset(word, bit, idx);</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;    <span class="keywordflow">return</span> ((storage(word) &gt;&gt; bit) &amp; 1);</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;  }</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;</div><div class="line"><a name="l00365"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">  365</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <span class="keyword">set</span>(<span class="keywordtype">int</span> idx, <span class="keywordtype">bool</span> value = <span class="keyword">true</span>) {</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;    <span class="keywordtype">int</span> bit, word;</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;    computeStorageOffset(word, bit, idx);</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> disable_mask = (~(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>(1) &lt;&lt; bit));</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> enable_mask = (<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>(value) &lt;&lt; bit);</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;    storage(word) = ((storage(word) &amp; disable_mask) | enable_mask);</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;  }</div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;</div><div class="line"><a name="l00376"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9">  376</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> &amp;<a class="code" href="structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9">operator&amp;=</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;predicates) {</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>; ++i) {</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;      storage(i) = (storage(i) &amp; predicates.storage(i));</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;    }</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;  }</div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;</div><div class="line"><a name="l00385"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc">  385</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> &amp;<a class="code" href="structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc">operator|=</a>(<a class="code" href="structcutlass_1_1PredicateVector.html">PredicateVector</a> <span class="keyword">const</span> &amp;predicates) {</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>; ++i) {</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;      storage(i) = (storage(i) | predicates.storage(i));</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;    }</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;  }</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;</div><div class="line"><a name="l00394"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a">  394</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a">is_zero</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;    <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> mask(0);</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> byte = 0; byte &lt; <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a>); ++byte) {</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;      <a class="code" href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">Storage</a> byte_mask = (((1 &lt;&lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">kPredicatesPerByte</a>) - 1) &lt;&lt; <a class="code" href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">kPredicateStart</a>);</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;      mask |= (byte_mask &lt;&lt; (byte * 8));</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;    }</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;    uint32_t result = 0;</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> word = 0; word &lt; <a class="code" href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">kWordCount</a>; ++word) {</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;      result |= storage(word);</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;    }</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;    <span class="keywordflow">return</span> result == 0;</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;  }</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00409"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5">  409</a></span>&#160;  Iterator <a class="code" href="structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5">begin</a>() { <span class="keywordflow">return</span> Iterator(*<span class="keyword">this</span>); }</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;</div><div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00413"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275">  413</a></span>&#160;  Iterator <a class="code" href="structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275">end</a>() { <span class="keywordflow">return</span> Iterator(*<span class="keyword">this</span>, <a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a>); }</div><div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;</div><div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00417"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#aeb7f9226a4fa49d06500c3c83958dc41">  417</a></span>&#160;  ConstIterator <a class="code" href="structcutlass_1_1PredicateVector.html#aeb7f9226a4fa49d06500c3c83958dc41">const_begin</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ConstIterator(*<span class="keyword">this</span>); }</div><div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;</div><div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00421"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321">  421</a></span>&#160;  ConstIterator <a class="code" href="structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321">const_end</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ConstIterator(*<span class="keyword">this</span>, <a class="code" href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">kPredicates</a>); }</div><div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;};</div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;</div><div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;</div><div class="line"><a name="l00427"></a><span class="lineno"><a class="line" href="structcutlass_1_1TrivialPredicateTileAdapter.html">  427</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html">TrivialPredicateTileAdapter</a> {</div><div class="line"><a name="l00429"></a><span class="lineno"><a class="line" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7">  429</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7">TrivialPredicateTileAdapter</a>() {}</div><div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;</div><div class="line"><a name="l00432"></a><span class="lineno"><a class="line" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f">  432</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f">at</a>(<span class="keywordtype">int</span>, <span class="keywordtype">int</span>, <span class="keywordtype">int</span>, <span class="keywordtype">int</span>)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;};</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;</div><div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;</div><div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> PredicateVector_, <span class="keyword">typename</span> Iterations_&gt;</div><div class="line"><a name="l00439"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html">  439</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1PredicateTileAdapter.html">PredicateTileAdapter</a> {</div><div class="line"><a name="l00441"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">  441</a></span>&#160;  <span class="keyword">typedef</span> PredicateVector_ <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">PredicateVector</a>;</div><div class="line"><a name="l00443"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450">  443</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450">Iterations</a>;</div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;</div><div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;  <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">PredicateVector</a> &amp;predicates;</div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;</div><div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00451"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea">  451</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea">PredicateTileAdapter</a>(<a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">PredicateVector</a> &amp;predicates_) : predicates(predicates_) {}</div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;</div><div class="line"><a name="l00454"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986">  454</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">ComputeOffsetFromShape&lt;Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;    <span class="keywordflow">return</span> predicates.at(bit);</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;  }</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;</div><div class="line"><a name="l00460"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicateTileAdapter.html#aeda47efdda0387f9c3c7b31f836afca5">  460</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <span class="keyword">set</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c, <span class="keywordtype">bool</span> value) {</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">ComputeOffsetFromShape&lt;Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;    predicates.set(bit, value);</div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;  }</div><div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;};</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;</div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;</div><div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> PredicateVector_, <span class="keyword">typename</span> Iterations_&gt;</div><div class="line"><a name="l00470"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html">  470</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html">ConstPredicateTileAdapter</a> {</div><div class="line"><a name="l00472"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">  472</a></span>&#160;  <span class="keyword">typedef</span> PredicateVector_ <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">PredicateVector</a>;</div><div class="line"><a name="l00474"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058">  474</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058">Iterations</a>;</div><div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;</div><div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;  <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">PredicateVector</a> <span class="keyword">const</span> &amp;predicates;</div><div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;</div><div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00482"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1">  482</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1">ConstPredicateTileAdapter</a>(<a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">PredicateVector</a> <span class="keyword">const</span> &amp;predicates_)</div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;      : predicates(predicates_) {}</div><div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;</div><div class="line"><a name="l00486"></a><span class="lineno"><a class="line" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd">  486</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd">at</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> bit = <a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">ComputeOffsetFromShape&lt;Iterations&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;    <span class="keywordflow">return</span> predicates.at(bit);</div><div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;  }</div><div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;};</div><div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;</div><div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;</div><div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a83c2f584bd061f0b9b6b2a6cddf5b038"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038">cutlass::PredicateVector::Iterator::Iterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator(PredicateVector &amp;_vec, int _start=0)</div><div class="ttdoc">Constructs an iterator from a PredicateVector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:255</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a3d06715a77740034697686a7977cb685"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685">cutlass::PredicateVector::ConstIterator::operator!=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator!=(ConstIterator const &amp;it) const</div><div class="ttdoc">Returns false if iterators point to the same bit. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:229</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_aab9de134132c62de1c062ca57582cdbc"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc">cutlass::PredicateVector::operator|=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE PredicateVector &amp; operator|=(PredicateVector const &amp;predicates)</div><div class="ttdoc">Computes the union of two identical predicate vectors. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:385</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_ad24e9b451064e99fb19955f772c30e6a"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a">cutlass::PredicateVector::TrivialIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator &amp; operator++()</div><div class="ttdoc">Pre-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:324</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a1c4fe2bec906cd7937428ed6561ac79a"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a">cutlass::PredicateVector::is_zero</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool is_zero() const</div><div class="ttdoc">Returns true if entire predicate array is zero. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:393</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_afe85a07b9f311327c6bf04e3a5f94e5a"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">cutlass::PredicateVector::Storage</a></div><div class="ttdeci">uint32_t Storage</div><div class="ttdoc">Storage type of individual elements. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:115</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_a3adf0440f9a0143a61b43d39c3f03721"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721">cutlass::PredicateVector::TrivialIterator::TrivialIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator(PredicateVector const &amp;_vec)</div><div class="ttdoc">Constructs an iterator from a PredicateVector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:319</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a2763012a9284e97650b14e20c5668286"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286">cutlass::PredicateVector::ConstIterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator--()</div><div class="ttdoc">Pre-decrement. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:201</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_ab870e074b33c598f69fe11e104615c5a"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">cutlass::PredicateVector::kBytes</a></div><div class="ttdeci">static int const kBytes</div><div class="ttdoc">Number of bytes needed. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:124</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_aeb7f9226a4fa49d06500c3c83958dc41"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#aeb7f9226a4fa49d06500c3c83958dc41">cutlass::PredicateVector::const_begin</a></div><div class="ttdeci">CUTLASS_DEVICE ConstIterator const_begin() const</div><div class="ttdoc">Returns a ConstIterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:416</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a590e4f4533c87162c0b79e8d876a8fda"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda">cutlass::PredicateVector::ConstIterator::ConstIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator(PredicateVector const &amp;_vec, int _start=0)</div><div class="ttdef"><b>Definition:</b> predicate_vector.h:190</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_ac8eca7087d1f7575b0c6beeb5f907bfd"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">cutlass::PredicateVector::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool at(int idx) const</div><div class="ttdoc">Accesses a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:356</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a10ee4bb2f206432aa5ee1a83cb046b70"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70">cutlass::PredicateVector::ConstIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator++()</div><div class="ttdoc">Pre-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:194</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html_a72669300eb0bd18ea8124f780862a0e4"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">cutlass::PredicateTileAdapter::PredicateVector</a></div><div class="ttdeci">PredicateVector_ PredicateVector</div><div class="ttdoc">The vector of predicates. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:440</div></div>
-<div class="ttc" id="structcutlass_1_1ComputeOffsetFromShape_html_a3c6f60a59178ffb84899aa449bd51d38"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">cutlass::ComputeOffsetFromShape::get</a></div><div class="ttdeci">static CUTLASS_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:166</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a977a99af3166a58d5bc5a613a1abe7d5"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5">cutlass::PredicateVector::ConstIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator++(int)</div><div class="ttdoc">Post-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:208</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a6c7333ad14d545cafc707e78752bf1e3"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3">cutlass::PredicateVector::Iterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator operator++(int)</div><div class="ttdoc">Post-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:272</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html">cutlass::PredicateTileAdapter</a></div><div class="ttdoc">Adapter to enable random access to predicates via logical coordinate within a tile. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:438</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_ada8cd3ac6db568bb9bf268ba2c3a3e14"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14">cutlass::PredicateVector::TrivialIterator::TrivialIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator(Iterator const &amp;it)</div><div class="ttdoc">Copy constructor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:315</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a1c4fe2bec906cd7937428ed6561ac79a"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a">cutlass::PredicateVector::is_zero</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool is_zero() const</div><div class="ttdoc">Returns true if entire predicate array is zero. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:394</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_afe85a07b9f311327c6bf04e3a5f94e5a"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a">cutlass::PredicateVector::Storage</a></div><div class="ttdeci">uint32_t Storage</div><div class="ttdoc">Storage type of individual elements. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:116</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_a3adf0440f9a0143a61b43d39c3f03721"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721">cutlass::PredicateVector::TrivialIterator::TrivialIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator(PredicateVector const &amp;_vec)</div><div class="ttdoc">Constructs an iterator from a PredicateVector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:320</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a2763012a9284e97650b14e20c5668286"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286">cutlass::PredicateVector::ConstIterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator--()</div><div class="ttdoc">Pre-decrement. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:202</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_ab870e074b33c598f69fe11e104615c5a"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a">cutlass::PredicateVector::kBytes</a></div><div class="ttdeci">static int const kBytes</div><div class="ttdoc">Number of bytes needed. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:125</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_aeb7f9226a4fa49d06500c3c83958dc41"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#aeb7f9226a4fa49d06500c3c83958dc41">cutlass::PredicateVector::const_begin</a></div><div class="ttdeci">CUTLASS_DEVICE ConstIterator const_begin() const</div><div class="ttdoc">Returns a ConstIterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:417</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a590e4f4533c87162c0b79e8d876a8fda"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda">cutlass::PredicateVector::ConstIterator::ConstIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator(PredicateVector const &amp;_vec, int _start=0)</div><div class="ttdef"><b>Definition:</b> predicate_vector.h:191</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_ac8eca7087d1f7575b0c6beeb5f907bfd"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">cutlass::PredicateVector::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool at(int idx) const</div><div class="ttdoc">Accesses a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:357</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a10ee4bb2f206432aa5ee1a83cb046b70"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70">cutlass::PredicateVector::ConstIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator++()</div><div class="ttdoc">Pre-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:195</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html_a72669300eb0bd18ea8124f780862a0e4"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4">cutlass::PredicateTileAdapter::PredicateVector</a></div><div class="ttdeci">PredicateVector_ PredicateVector</div><div class="ttdoc">The vector of predicates. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:441</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a977a99af3166a58d5bc5a613a1abe7d5"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5">cutlass::PredicateVector::ConstIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator++(int)</div><div class="ttdoc">Post-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:209</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a6c7333ad14d545cafc707e78752bf1e3"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3">cutlass::PredicateVector::Iterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator operator++(int)</div><div class="ttdoc">Post-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:273</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html">cutlass::PredicateTileAdapter</a></div><div class="ttdoc">Adapter to enable random access to predicates via logical coordinate within a tile. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:439</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_ada8cd3ac6db568bb9bf268ba2c3a3e14"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14">cutlass::PredicateVector::TrivialIterator::TrivialIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator(Iterator const &amp;it)</div><div class="ttdoc">Copy constructor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:316</div></div>
+<div class="ttc" id="structcutlass_1_1ComputeOffsetFromShape_html_a7bc0bc7e03cd974a05d00e98a72ee78b"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">cutlass::ComputeOffsetFromShape::get</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:181</div></div>
 <div class="ttc" id="platform_8h_html"><div class="ttname"><a href="platform_8h.html">platform.h</a></div><div class="ttdoc">C++ features that may be otherwise unimplemented for CUDA device functions. </div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">cutlass::PredicateVector::TrivialIterator</a></div><div class="ttdoc">Iterator that always returns true. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:308</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_aa35b9165920b83b9a5a888df83925051"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051">cutlass::PredicateVector::TrivialIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator operator++(int)</div><div class="ttdoc">Post-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:327</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a5c5266fcef67c7b263682c4bc4a5000e"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e">cutlass::PredicateVector::Iterator::operator==</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator==(Iterator const &amp;it) const</div><div class="ttdoc">Returns true if iterators point to the same bit. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:288</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html_a4c9eb6c6498ccf117427a3b35f7ce5ea"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea">cutlass::PredicateTileAdapter::PredicateTileAdapter</a></div><div class="ttdeci">CUTLASS_DEVICE PredicateTileAdapter(PredicateVector &amp;predicates_)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:450</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html_a7d54e877bca2e840c142293b4826e986"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986">cutlass::PredicateTileAdapter::at</a></div><div class="ttdeci">CUTLASS_DEVICE bool at(int d, int h, int w, int c) const</div><div class="ttdoc">Get the value at location (d, h, w, c). </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:453</div></div>
-<div class="ttc" id="cutlass_8h_html_a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><div class="ttname"><a href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="ttdeci">#define CUTLASS_PRAGMA_UNROLL</div><div class="ttdef"><b>Definition:</b> cutlass.h:60</div></div>
-<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html_a9e5651009a7b8df9960527c18c7b05dd"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd">cutlass::ConstPredicateTileAdapter::at</a></div><div class="ttdeci">CUTLASS_DEVICE bool at(int d, int h, int w, int c) const</div><div class="ttdoc">Get the value at location (d, h, w, c). </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:485</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a69fb5b24eeb43331b7401768e8584e61"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61">cutlass::PredicateVector::Iterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator &amp; operator--()</div><div class="ttdoc">Pre-decrement. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:265</div></div>
-<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html_ab9143288811a1262f7007f1b76b32e8f"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">cutlass::ConstPredicateTileAdapter::PredicateVector</a></div><div class="ttdeci">PredicateVector_ PredicateVector</div><div class="ttdoc">The vector of predicates. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:471</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a3dd9aeba8f3cbe7a8198d68d91a0bbb9"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9">cutlass::PredicateVector::operator &amp;=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE PredicateVector &amp; operator &amp;=(PredicateVector const &amp;predicates)</div><div class="ttdoc">Computes the intersection of two identical predicate vectors. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:375</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a91b7d25cbd64e696ef23c87671f0b077"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077">cutlass::PredicateVector::Iterator::Iterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator(Iterator const &amp;it)</div><div class="ttdoc">Copy constructor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:250</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a840985438ac8306ec680eb20edd4e5c5"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5">cutlass::PredicateVector::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator[](int idx) const</div><div class="ttdoc">Accesses a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:353</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a049b568e0f5de011ee76ce79bcedbab4"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4">cutlass::PredicateVector::Iterator::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator*() const</div><div class="ttdoc">Dereferences iterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:300</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_a78016158f99dd87e822a2a2cbd4cec78"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78">cutlass::PredicateVector::TrivialIterator::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator*() const</div><div class="ttdoc">Dereferences iterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:331</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a236bd1a822479750a809452fd58dd917"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">cutlass::PredicateVector::fill</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void fill(bool value=true)</div><div class="ttdoc">Fills all predicates with a given value. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:343</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_afff3a2142d9853606d6ad7c3a459f492"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">cutlass::PredicateVector::kPredicates</a></div><div class="ttdeci">static int const kPredicates</div><div class="ttdoc">Number of bits stored by the PredicateVector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:106</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_ad9493fc80fdc33330cc15641779cc275"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275">cutlass::PredicateVector::end</a></div><div class="ttdeci">CUTLASS_DEVICE Iterator end()</div><div class="ttdoc">Returns an iterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:412</div></div>
-<div class="ttc" id="cutlass_8h_html_a0159b8e4cd578881a1ccfd0921516af7"><div class="ttname"><a href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a></div><div class="ttdeci">#define CUTLASS_ASSERT(x)</div><div class="ttdef"><b>Definition:</b> cutlass.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1TrivialPredicateTileAdapter_html_a3e41ab145489df08fca79251b2253d0f"><div class="ttname"><a href="structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f">cutlass::TrivialPredicateTileAdapter::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool at(int, int, int, int) const</div><div class="ttdoc">The value at location (d, h, w, c). </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:431</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">cutlass::PredicateVector::TrivialIterator</a></div><div class="ttdoc">Iterator that always returns true. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:309</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_aa35b9165920b83b9a5a888df83925051"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051">cutlass::PredicateVector::TrivialIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator operator++(int)</div><div class="ttdoc">Post-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:328</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a5c5266fcef67c7b263682c4bc4a5000e"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e">cutlass::PredicateVector::Iterator::operator==</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator==(Iterator const &amp;it) const</div><div class="ttdoc">Returns true if iterators point to the same bit. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:289</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html_a4c9eb6c6498ccf117427a3b35f7ce5ea"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea">cutlass::PredicateTileAdapter::PredicateTileAdapter</a></div><div class="ttdeci">CUTLASS_DEVICE PredicateTileAdapter(PredicateVector &amp;predicates_)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:451</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html_a7d54e877bca2e840c142293b4826e986"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986">cutlass::PredicateTileAdapter::at</a></div><div class="ttdeci">CUTLASS_DEVICE bool at(int d, int h, int w, int c) const</div><div class="ttdoc">Get the value at location (d, h, w, c). </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:454</div></div>
+<div class="ttc" id="cutlass_8h_html_a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><div class="ttname"><a href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="ttdeci">#define CUTLASS_PRAGMA_UNROLL</div><div class="ttdef"><b>Definition:</b> cutlass.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html_a9e5651009a7b8df9960527c18c7b05dd"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd">cutlass::ConstPredicateTileAdapter::at</a></div><div class="ttdeci">CUTLASS_DEVICE bool at(int d, int h, int w, int c) const</div><div class="ttdoc">Get the value at location (d, h, w, c). </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:486</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a69fb5b24eeb43331b7401768e8584e61"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61">cutlass::PredicateVector::Iterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator &amp; operator--()</div><div class="ttdoc">Pre-decrement. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:266</div></div>
+<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html_ab9143288811a1262f7007f1b76b32e8f"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f">cutlass::ConstPredicateTileAdapter::PredicateVector</a></div><div class="ttdeci">PredicateVector_ PredicateVector</div><div class="ttdoc">The vector of predicates. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:472</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a3dd9aeba8f3cbe7a8198d68d91a0bbb9"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9">cutlass::PredicateVector::operator &amp;=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE PredicateVector &amp; operator &amp;=(PredicateVector const &amp;predicates)</div><div class="ttdoc">Computes the intersection of two identical predicate vectors. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:376</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a91b7d25cbd64e696ef23c87671f0b077"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077">cutlass::PredicateVector::Iterator::Iterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator(Iterator const &amp;it)</div><div class="ttdoc">Copy constructor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:251</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a840985438ac8306ec680eb20edd4e5c5"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5">cutlass::PredicateVector::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator[](int idx) const</div><div class="ttdoc">Accesses a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:354</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a049b568e0f5de011ee76ce79bcedbab4"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4">cutlass::PredicateVector::Iterator::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator*() const</div><div class="ttdoc">Dereferences iterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:301</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_a78016158f99dd87e822a2a2cbd4cec78"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78">cutlass::PredicateVector::TrivialIterator::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator*() const</div><div class="ttdoc">Dereferences iterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:332</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a236bd1a822479750a809452fd58dd917"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917">cutlass::PredicateVector::fill</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void fill(bool value=true)</div><div class="ttdoc">Fills all predicates with a given value. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:344</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_afff3a2142d9853606d6ad7c3a459f492"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492">cutlass::PredicateVector::kPredicates</a></div><div class="ttdeci">static int const kPredicates</div><div class="ttdoc">Number of bits stored by the PredicateVector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:107</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_ad9493fc80fdc33330cc15641779cc275"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275">cutlass::PredicateVector::end</a></div><div class="ttdeci">CUTLASS_DEVICE Iterator end()</div><div class="ttdoc">Returns an iterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:413</div></div>
+<div class="ttc" id="cutlass_8h_html_a0159b8e4cd578881a1ccfd0921516af7"><div class="ttname"><a href="cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7">CUTLASS_ASSERT</a></div><div class="ttdeci">#define CUTLASS_ASSERT(x)</div><div class="ttdef"><b>Definition:</b> cutlass.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1TrivialPredicateTileAdapter_html_a3e41ab145489df08fca79251b2253d0f"><div class="ttname"><a href="structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f">cutlass::TrivialPredicateTileAdapter::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool at(int, int, int, int) const</div><div class="ttdoc">The value at location (d, h, w, c). </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:432</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a1387c4a964f971ed4611d750a09ec0b5"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">cutlass::PredicateVector::kPredicatesPerByte</a></div><div class="ttdeci">static int const kPredicatesPerByte</div><div class="ttdoc">Number of bits stored within each byte of the predicate bit vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:109</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a></div><div class="ttdoc">Statically sized array of bits implementing. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:104</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a734bbfaf3829f73ef0b44fa7db4ccd42"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">cutlass::PredicateVector::kWordCount</a></div><div class="ttdeci">static int const kWordCount</div><div class="ttdoc">Number of storage elements needed. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:127</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_ab931610bc07ee0e87bb4d9a4d53a2321"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321">cutlass::PredicateVector::const_end</a></div><div class="ttdeci">CUTLASS_DEVICE ConstIterator const_end() const</div><div class="ttdoc">Returns a ConstIterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:420</div></div>
-<div class="ttc" id="structcutlass_1_1TrivialPredicateTileAdapter_html"><div class="ttname"><a href="structcutlass_1_1TrivialPredicateTileAdapter.html">cutlass::TrivialPredicateTileAdapter</a></div><div class="ttdoc">Always returns true predicate. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:426</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a7dddc0a6b5c958156beef29bedfd1bd3"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3">cutlass::PredicateVector::Iterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator &amp; operator++()</div><div class="ttdoc">Pre-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:258</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">cutlass::PredicateVector::ConstIterator</a></div><div class="ttdoc">A const iterator implementing Predicate Iterator Concept enabling sequential read-only access to pred...</div><div class="ttdef"><b>Definition:</b> predicate_vector.h:176</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a062fa8a8df725ef08ced2ffcca8336af"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">cutlass::PredicateVector::set</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void set(int idx, bool value=true)</div><div class="ttdoc">Set a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:364</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_aa2d03d88ac23051803d010f78157c357"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357">cutlass::PredicateVector::ConstIterator::operator==</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator==(ConstIterator const &amp;it) const</div><div class="ttdoc">Returns true if iterators point to the same bit. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:224</div></div>
-<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html_a5e461e0eb376de60605a6ab5fdc38058"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058">cutlass::ConstPredicateTileAdapter::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">The iterations. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:473</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html_a1f2d52eec9f488c2a53c4d62af824450"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450">cutlass::PredicateTileAdapter::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">The iterations. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:442</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_abbc2bceb6cf8d7f168b8a00eb48c0946"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946">cutlass::PredicateVector::ConstIterator::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator*() const</div><div class="ttdoc">Dereferences iterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:232</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a08cb4d1395b88a4451fbb1a27e010887"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887">cutlass::PredicateVector::Iterator::operator!=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator!=(Iterator const &amp;it) const</div><div class="ttdoc">Returns false if iterators point to the same bit. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:292</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_acf848dce84c01453ab8a2d00c8d4f86e"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">cutlass::PredicateVector::kPredicateStart</a></div><div class="ttdeci">static int const kPredicateStart</div><div class="ttdoc">First bit withing each byte containing predicates. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:112</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a1216aab9c567ec0d4232019008ef3ea7"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7">cutlass::PredicateVector::ConstIterator::ConstIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator(ConstIterator const &amp;it)</div><div class="ttdoc">Copy constructor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:186</div></div>
-<div class="ttc" id="structcutlass_1_1TrivialPredicateTileAdapter_html_a7259853a129a7e319b972d3b41dd59d7"><div class="ttname"><a href="structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7">cutlass::TrivialPredicateTileAdapter::TrivialPredicateTileAdapter</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialPredicateTileAdapter()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:428</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a2910a714d34a688b8ea560ea2933436b"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b">cutlass::PredicateVector::ConstIterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator--(int)</div><div class="ttdoc">Post-decrement. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:216</div></div>
-<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html">cutlass::ConstPredicateTileAdapter</a></div><div class="ttdoc">Adapter to enable random access to predicates via logical coordinate within a tile. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:469</div></div>
-<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html_a9abd78d5c3e444bfb23d2b1a08be2be1"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1">cutlass::ConstPredicateTileAdapter::ConstPredicateTileAdapter</a></div><div class="ttdeci">CUTLASS_DEVICE ConstPredicateTileAdapter(PredicateVector const &amp;predicates_)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:481</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a1387c4a964f971ed4611d750a09ec0b5"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5">cutlass::PredicateVector::kPredicatesPerByte</a></div><div class="ttdeci">static int const kPredicatesPerByte</div><div class="ttdoc">Number of bits stored within each byte of the predicate bit vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:110</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a></div><div class="ttdoc">Statically sized array of bits implementing. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:105</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a734bbfaf3829f73ef0b44fa7db4ccd42"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42">cutlass::PredicateVector::kWordCount</a></div><div class="ttdeci">static int const kWordCount</div><div class="ttdoc">Number of storage elements needed. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:128</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_ab931610bc07ee0e87bb4d9a4d53a2321"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321">cutlass::PredicateVector::const_end</a></div><div class="ttdeci">CUTLASS_DEVICE ConstIterator const_end() const</div><div class="ttdoc">Returns a ConstIterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:421</div></div>
+<div class="ttc" id="structcutlass_1_1TrivialPredicateTileAdapter_html"><div class="ttname"><a href="structcutlass_1_1TrivialPredicateTileAdapter.html">cutlass::TrivialPredicateTileAdapter</a></div><div class="ttdoc">Always returns true predicate. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:427</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a7dddc0a6b5c958156beef29bedfd1bd3"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3">cutlass::PredicateVector::Iterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator &amp; operator++()</div><div class="ttdoc">Pre-increment. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:259</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html">cutlass::PredicateVector::ConstIterator</a></div><div class="ttdoc">A const iterator implementing Predicate Iterator Concept enabling sequential read-only access to pred...</div><div class="ttdef"><b>Definition:</b> predicate_vector.h:177</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a062fa8a8df725ef08ced2ffcca8336af"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">cutlass::PredicateVector::set</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void set(int idx, bool value=true)</div><div class="ttdoc">Set a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:365</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_aa2d03d88ac23051803d010f78157c357"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357">cutlass::PredicateVector::ConstIterator::operator==</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator==(ConstIterator const &amp;it) const</div><div class="ttdoc">Returns true if iterators point to the same bit. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:225</div></div>
+<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html_a5e461e0eb376de60605a6ab5fdc38058"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058">cutlass::ConstPredicateTileAdapter::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">The iterations. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:474</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateTileAdapter_html_a1f2d52eec9f488c2a53c4d62af824450"><div class="ttname"><a href="structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450">cutlass::PredicateTileAdapter::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">The iterations. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:443</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_abbc2bceb6cf8d7f168b8a00eb48c0946"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946">cutlass::PredicateVector::ConstIterator::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator*() const</div><div class="ttdoc">Dereferences iterator. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:233</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_a08cb4d1395b88a4451fbb1a27e010887"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887">cutlass::PredicateVector::Iterator::operator!=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator!=(Iterator const &amp;it) const</div><div class="ttdoc">Returns false if iterators point to the same bit. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:293</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_acf848dce84c01453ab8a2d00c8d4f86e"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e">cutlass::PredicateVector::kPredicateStart</a></div><div class="ttdeci">static int const kPredicateStart</div><div class="ttdoc">First bit withing each byte containing predicates. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:113</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a1216aab9c567ec0d4232019008ef3ea7"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7">cutlass::PredicateVector::ConstIterator::ConstIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator(ConstIterator const &amp;it)</div><div class="ttdoc">Copy constructor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:187</div></div>
+<div class="ttc" id="structcutlass_1_1TrivialPredicateTileAdapter_html_a7259853a129a7e319b972d3b41dd59d7"><div class="ttname"><a href="structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7">cutlass::TrivialPredicateTileAdapter::TrivialPredicateTileAdapter</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialPredicateTileAdapter()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:429</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1ConstIterator_html_a2910a714d34a688b8ea560ea2933436b"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b">cutlass::PredicateVector::ConstIterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator--(int)</div><div class="ttdoc">Post-decrement. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:217</div></div>
+<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html">cutlass::ConstPredicateTileAdapter</a></div><div class="ttdoc">Adapter to enable random access to predicates via logical coordinate within a tile. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:470</div></div>
+<div class="ttc" id="structcutlass_1_1ConstPredicateTileAdapter_html_a9abd78d5c3e444bfb23d2b1a08be2be1"><div class="ttname"><a href="structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1">cutlass::ConstPredicateTileAdapter::ConstPredicateTileAdapter</a></div><div class="ttdeci">CUTLASS_DEVICE ConstPredicateTileAdapter(PredicateVector const &amp;predicates_)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:482</div></div>
 <div class="ttc" id="shape_8h_html"><div class="ttname"><a href="shape_8h.html">shape.h</a></div><div class="ttdoc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects. </div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_aec1201df19c0ed0516810a3f19353c21"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21">cutlass::PredicateVector::PredicateVector</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE PredicateVector(bool value=true)</div><div class="ttdoc">Initialize the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:340</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a649045d8224514a4c28bcaf4b247b4a5"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5">cutlass::PredicateVector::begin</a></div><div class="ttdeci">CUTLASS_DEVICE Iterator begin()</div><div class="ttdoc">Returns an iterator to the start of the bit vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:408</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_aec1201df19c0ed0516810a3f19353c21"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21">cutlass::PredicateVector::PredicateVector</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE PredicateVector(bool value=true)</div><div class="ttdoc">Initialize the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:341</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_html_a649045d8224514a4c28bcaf4b247b4a5"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5">cutlass::PredicateVector::begin</a></div><div class="ttdeci">CUTLASS_DEVICE Iterator begin()</div><div class="ttdoc">Returns an iterator to the start of the bit vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:409</div></div>
 <div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html">cutlass::PredicateVector::Iterator</a></div><div class="ttdoc">An iterator implementing Predicate Iterator Concept enabling sequential read and write access to pred...</div><div class="ttdef"><b>Definition:</b> predicate_vector.h:240</div></div>
-<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_aad709a11f43b84c88e3ce3a0394f8e8a"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a">cutlass::PredicateVector::Iterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator operator--(int)</div><div class="ttdoc">Post-decrement. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:280</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_a6cb3664b5cba4280b7055a65ddad7850"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a6cb3664b5cba4280b7055a65ddad7850">cutlass::PredicateVector::TrivialIterator::TrivialIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator()</div><div class="ttdoc">Constructor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:311</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html">cutlass::PredicateVector::Iterator</a></div><div class="ttdoc">An iterator implementing Predicate Iterator Concept enabling sequential read and write access to pred...</div><div class="ttdef"><b>Definition:</b> predicate_vector.h:241</div></div>
+<div class="ttc" id="classcutlass_1_1PredicateVector_1_1Iterator_html_aad709a11f43b84c88e3ce3a0394f8e8a"><div class="ttname"><a href="classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a">cutlass::PredicateVector::Iterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Iterator operator--(int)</div><div class="ttdoc">Post-decrement. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:281</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html_a6cb3664b5cba4280b7055a65ddad7850"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a6cb3664b5cba4280b7055a65ddad7850">cutlass::PredicateVector::TrivialIterator::TrivialIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TrivialIterator()</div><div class="ttdoc">Constructor. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:312</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/reshape__tile_8h.html b/docs/reshape__tile_8h.html
index 3712944a1..9eb505f35 100644
--- a/docs/reshape__tile_8h.html
+++ b/docs/reshape__tile_8h.html
@@ -82,7 +82,7 @@ $(function() {
 
 <p>Defines a type for restructuring a tile.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&quot;</code><br />
 </div>
 <p><a href="reshape__tile_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -101,7 +101,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/reshape__tile_8h_source.html b/docs/reshape__tile_8h_source.html
index bb7a11796..b3bdb43b4 100644
--- a/docs/reshape__tile_8h_source.html
+++ b/docs/reshape__tile_8h_source.html
@@ -76,16 +76,16 @@ $(function() {
 <div class="title">reshape_tile.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="reshape__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="comment">// The following functor reshapes a tile of data. The goal is to have at least kAccessSize in</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment">// the inner-most dimension. If the user respects that constraint, there is nothing to be done. If</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="comment">// that&#39;s not the case, this functor will correct that and &quot;extract&quot; the right number of elements</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="comment">// from the next dimension.</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> kAccessSize_, <span class="keywordtype">bool</span> = (Tile_::kC &lt; kAccessSize_)&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1ReshapeTile.html">   42</a></span>&#160;struct ReshapeTile {</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">   43</a></span>&#160;  typedef Tile_ Tile;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;};</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html">   47</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html">ReshapeTile&lt;Tile_, kAccessSize_, true&gt;</a> {</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  <span class="comment">// Make sure the W dimension of the tile is large enough.</span></div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06">   49</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Tile_::kW &gt;= kAccessSize_, <span class="stringliteral">&quot;The W dimension is too small&quot;</span>);</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="comment">// Make sure the dimension can be divided by the number of scalars.</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Tile_::kW % kAccessSize_ == 0, <span class="stringliteral">&quot;Not supported&quot;</span>);</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="comment">// Collapse the W dimension.</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;Tile_::kD, Tile_::kH, Tile_::kW / kAccessSize_, kAccessSize_&gt; <a class="code" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06">Tile</a>;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;};</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<a href="reshape__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="comment">// The following functor reshapes a tile of data. The goal is to have at least kAccessSize in</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment">// the inner-most dimension. If the user respects that constraint, there is nothing to be done. If</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="comment">// that&#39;s not the case, this functor will correct that and &quot;extract&quot; the right number of elements</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="comment">// from the next dimension.</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> kAccessSize_, <span class="keywordtype">bool</span> = (Tile_::kC &lt; kAccessSize_)&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1ReshapeTile.html">   42</a></span>&#160;struct ReshapeTile {</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">   43</a></span>&#160;  typedef Tile_ Tile;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;};</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html">   47</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html">ReshapeTile&lt;Tile_, kAccessSize_, true&gt;</a> {</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  <span class="comment">// Make sure the W dimension of the tile is large enough.</span></div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06">   49</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Tile_::kW &gt;= kAccessSize_, <span class="stringliteral">&quot;The W dimension is too small&quot;</span>);</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="comment">// Make sure the dimension can be divided by the number of scalars.</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Tile_::kW % kAccessSize_ == 0, <span class="stringliteral">&quot;Not supported&quot;</span>);</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="comment">// Collapse the W dimension.</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;Tile_::kD, Tile_::kH, Tile_::kW / kAccessSize_, kAccessSize_&gt; <a class="code" href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06">Tile</a>;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;};</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4_html"><div class="ttname"><a href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;</a></div><div class="ttdef"><b>Definition:</b> reshape_tile.h:47</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
 <div class="ttc" id="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4_html_a966a9432cf42dfdff8ad6b89ebd74f06"><div class="ttname"><a href="structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06">cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;::Tile</a></div><div class="ttdeci">Shape&lt; Tile_::kD, Tile_::kH, Tile_::kW/kAccessSize_, kAccessSize_ &gt; Tile</div><div class="ttdef"><b>Definition:</b> reshape_tile.h:49</div></div>
 <div class="ttc" id="shape_8h_html"><div class="ttname"><a href="shape_8h.html">shape.h</a></div><div class="ttdoc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects. </div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/scalar__or__pointer_8h.html b/docs/scalar__or__pointer_8h.html
new file mode 100644
index 000000000..85668193c
--- /dev/null
+++ b/docs/scalar__or__pointer_8h.html
@@ -0,0 +1,109 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: scalar_or_pointer.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">scalar_or_pointer.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Implements the BLAS linear scaling function alpha*AB + beta*C.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+</div>
+<p><a href="scalar__or__pointer_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1detail"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1detail.html">cutlass::detail</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/scalar__or__pointer_8h_source.html b/docs/scalar__or__pointer_8h_source.html
new file mode 100644
index 000000000..a4b6c7e91
--- /dev/null
+++ b/docs/scalar__or__pointer_8h_source.html
@@ -0,0 +1,101 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: scalar_or_pointer.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">scalar_or_pointer.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="scalar__or__pointer_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;</div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1detail.html">   37</a></span>&#160;<span class="keyword">namespace </span>detail {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">   42</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a> {</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">public</span>:</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">   45</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a>;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">private</span>:</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> scalar;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <span class="keyword">const</span> *ptr;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="keyword">public</span>:</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a45cf72b3f0e3408a4b51990b648b71ee">   66</a></span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a45cf72b3f0e3408a4b51990b648b71ee">ScalarOrPointer</a>(): scalar(0), ptr(<a class="code" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>) {}</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b85e1940149922942c7d495f9d12134">   70</a></span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b85e1940149922942c7d495f9d12134">ScalarOrPointer</a>(<a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <span class="keyword">const</span> &amp;val): scalar(val), ptr(<a class="code" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>) {}</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a03a54e9150c2cccb26d9fa688ea03f96">   74</a></span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a03a54e9150c2cccb26d9fa688ea03f96">ScalarOrPointer</a>(<a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <span class="keyword">const</span> *ptr_): scalar(0), ptr(ptr_) {}</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a95373f3d1b286c61cb204ba6a1282ce0">   78</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a95373f3d1b286c61cb204ba6a1282ce0">is_pointer</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    <span class="keywordflow">return</span> bool(ptr);</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  }</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a6b066568947df37094e4125b0347faf1">   84</a></span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <span class="keyword">const</span> *<a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a6b066568947df37094e4125b0347faf1">get_ptr</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <span class="keywordflow">return</span> ptr;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  }</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a81bd7b4f50b8d7c5effe5291ad920380">   90</a></span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a81bd7b4f50b8d7c5effe5291ad920380">get_scalar</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    <span class="keywordflow">return</span> scalar;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  }</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b29491782c3a129355fa4ef159cb970">   96</a></span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a> &amp;<a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b29491782c3a129355fa4ef159cb970">operator=</a>(<a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <span class="keyword">const</span> &amp;scalar_) {</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    scalar = scalar_;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    ptr = <span class="keyword">nullptr</span>;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  }</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a54357e2f1d52aa8355b2ae7796740ea3">  104</a></span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html">ScalarOrPointer</a> &amp;<a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a54357e2f1d52aa8355b2ae7796740ea3">operator=</a>(<a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <span class="keyword">const</span> *ptr_) {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    ptr = ptr_;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  }</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a1661baed19b4aa4eea725a6f6e6b26a3">  111</a></span>&#160;  <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a> <span class="keyword">get</span>() <span class="keyword">const</span> {</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    <span class="keywordflow">if</span> (ptr) {</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;      <span class="keywordflow">return</span> *ptr;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    }</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <span class="keywordflow">return</span> scalar;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  }</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a896f35e776c1291ceda0f432cc3da654">  120</a></span>&#160;  <span class="keyword">operator</span> <a class="code" href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">Scalar</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">get</span>();</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  }</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;};</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;} <span class="comment">// namespace detail</span></div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html_a81bd7b4f50b8d7c5effe5291ad920380"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a81bd7b4f50b8d7c5effe5291ad920380">cutlass::detail::ScalarOrPointer::get_scalar</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar get_scalar() const</div><div class="ttdoc">Gets the pointer value. </div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:90</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html_a3b85e1940149922942c7d495f9d12134"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b85e1940149922942c7d495f9d12134">cutlass::detail::ScalarOrPointer::ScalarOrPointer</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ScalarOrPointer(Scalar const &amp;val)</div><div class="ttdoc">Object behaves as a scalar. </div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:70</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html_a9d3006fc0c8bd98b9262606858b26cad"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad">cutlass::detail::ScalarOrPointer::Scalar</a></div><div class="ttdeci">Scalar_ Scalar</div><div class="ttdoc">Underlying scalar type. </div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:45</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html_a54357e2f1d52aa8355b2ae7796740ea3"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a54357e2f1d52aa8355b2ae7796740ea3">cutlass::detail::ScalarOrPointer::operator=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ScalarOrPointer &amp; operator=(Scalar const *ptr_)</div><div class="ttdoc">Assigns to a pointer value. </div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:104</div></div>
+<div class="ttc" id="platform_8h_html_ab979d9d4b4923f7c54d6caa6e1a61936"><div class="ttname"><a href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a></div><div class="ttdeci">#define nullptr</div><div class="ttdoc">nullptr </div><div class="ttdef"><b>Definition:</b> platform.h:144</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html_a03a54e9150c2cccb26d9fa688ea03f96"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a03a54e9150c2cccb26d9fa688ea03f96">cutlass::detail::ScalarOrPointer::ScalarOrPointer</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ScalarOrPointer(Scalar const *ptr_)</div><div class="ttdoc">Object behaves as a scalar. </div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:74</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html_a95373f3d1b286c61cb204ba6a1282ce0"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a95373f3d1b286c61cb204ba6a1282ce0">cutlass::detail::ScalarOrPointer::is_pointer</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool is_pointer() const</div><div class="ttdoc">Returns true if is pointer. </div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:78</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html_a45cf72b3f0e3408a4b51990b648b71ee"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a45cf72b3f0e3408a4b51990b648b71ee">cutlass::detail::ScalarOrPointer::ScalarOrPointer</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ScalarOrPointer()</div><div class="ttdoc">Default ctor. </div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:66</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html_a6b066568947df37094e4125b0347faf1"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a6b066568947df37094e4125b0347faf1">cutlass::detail::ScalarOrPointer::get_ptr</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar const  * get_ptr() const</div><div class="ttdoc">Gets the pointer value. </div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:84</div></div>
+<div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html_a3b29491782c3a129355fa4ef159cb970"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b29491782c3a129355fa4ef159cb970">cutlass::detail::ScalarOrPointer::operator=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ScalarOrPointer &amp; operator=(Scalar const &amp;scalar_)</div><div class="ttdoc">Assigns to a scalar and sets pointer to nullptr. </div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:96</div></div>
+<div class="ttc" id="classcutlass_1_1detail_1_1ScalarOrPointer_html"><div class="ttname"><a href="classcutlass_1_1detail_1_1ScalarOrPointer.html">cutlass::detail::ScalarOrPointer</a></div><div class="ttdef"><b>Definition:</b> scalar_or_pointer.h:42</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/search/all_0.js b/docs/search/all_0.js
index 0165dcec1..f97d7299d 100644
--- a/docs/search/all_0.js
+++ b/docs/search/all_0.js
@@ -1,6 +1,7 @@
 var searchData=
 [
   ['_5f_5falign_5f_5f',['__align__',['../namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8',1,'cutlass::platform::__align__(1) aligned_chunk&lt; 1 &gt;'],['../namespacecutlass_1_1platform.html#a0bcb016704ec57f9499e662ba6156f98',1,'cutlass::platform::__align__(2) aligned_chunk&lt; 2 &gt;'],['../namespacecutlass_1_1platform.html#a71be5af25eeffa4077777f919e67d8da',1,'cutlass::platform::__align__(4) aligned_chunk&lt; 4 &gt;'],['../namespacecutlass_1_1platform.html#a42440254a16d4b6b95b95cc3360ee372',1,'cutlass::platform::__align__(8) aligned_chunk&lt; 8 &gt;'],['../namespacecutlass_1_1platform.html#a91d5e970d6ebe619914f40a9510bdb1e',1,'cutlass::platform::__align__(16) aligned_chunk&lt; 16 &gt;'],['../namespacecutlass_1_1platform.html#a210f4d360b1f9c3d074e71129fe4c0d9',1,'cutlass::platform::__align__(32) aligned_chunk&lt; 32 &gt;'],['../namespacecutlass_1_1platform.html#ae792b1c7ada1a33e306cd552f583bdce',1,'cutlass::platform::__align__(64) aligned_chunk&lt; 64 &gt;'],['../namespacecutlass_1_1platform.html#a5712ec4fed335a9b7f863fb3abe3c5eb',1,'cutlass::platform::__align__(128) aligned_chunk&lt; 128 &gt;'],['../namespacecutlass_1_1platform.html#a595cc98db29fb4d59772d2e2f52e347a',1,'cutlass::platform::__align__(256) aligned_chunk&lt; 256 &gt;'],['../namespacecutlass_1_1platform.html#ae70bb5d14a66500b47d2e3f83063d4a5',1,'cutlass::platform::__align__(512) aligned_chunk&lt; 512 &gt;'],['../namespacecutlass_1_1platform.html#a181e44e9c66f704175590727aaa9e5a1',1,'cutlass::platform::__align__(1024) aligned_chunk&lt; 1024 &gt;'],['../namespacecutlass_1_1platform.html#ae72c8fa997bb251d4140dceb03147154',1,'cutlass::platform::__align__(2048) aligned_chunk&lt; 2048 &gt;'],['../namespacecutlass_1_1platform.html#ada29683f1b408ae7b73cc8fbe2108628',1,'cutlass::platform::__align__(4096) aligned_chunk&lt; 4096 &gt;'],['../namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706',1,'cutlass::__align__(1) AlignedStruct&lt; 1 &gt;'],['../namespacecutlass.html#a602227fad962270da185209ecc6012f2',1,'cutlass::__align__(2) AlignedStruct&lt; 2 &gt;'],['../namespacecutlass.html#a266d7d2ae6e79537e46ee37b4fdface7',1,'cutlass::__align__(4) AlignedStruct&lt; 4 &gt;'],['../namespacecutlass.html#a1101e01215ddb0e5a7b120a4541a3c4e',1,'cutlass::__align__(8) AlignedStruct&lt; 8 &gt;'],['../namespacecutlass.html#aa4071cf5103f352a5100d9b4bba895e2',1,'cutlass::__align__(16) AlignedStruct&lt; 16 &gt;'],['../namespacecutlass.html#ada65694bdd4b70d4c9d769a536275a47',1,'cutlass::__align__(32) AlignedStruct&lt; 32 &gt;'],['../namespacecutlass.html#aa80a7cb3febd19b96f2ecbcb610b1b9e',1,'cutlass::__align__(64) AlignedStruct&lt; 64 &gt;']]],
+  ['_5f_5flaunch_5fbounds_5f_5f',['__launch_bounds__',['../namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55',1,'cutlass::gemm']]],
   ['_5f_5fnv_5fstd_5fmax',['__NV_STD_MAX',['../platform_8h.html#abd31f291635329bc15292954f1f01d38',1,'platform.h']]],
   ['_5f_5fnv_5fstd_5fmin',['__NV_STD_MIN',['../platform_8h.html#a39e234a3e3b0018b58df720bcb143420',1,'platform.h']]],
   ['_5f_5fplatform_5fcat',['__platform_cat',['../platform_8h.html#aece7fe71be5aaf8d12dc9e2372f97de4',1,'platform.h']]],
diff --git a/docs/search/all_1.js b/docs/search/all_1.js
index b1bf99160..706f28c32 100644
--- a/docs/search/all_1.js
+++ b/docs/search/all_1.js
@@ -1,12 +1,14 @@
 var searchData=
 [
-  ['accesstype',['AccessType',['../structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7',1,'cutlass::FragmentIterator::AccessType()'],['../structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b',1,'cutlass::FragmentConstIterator::AccessType()'],['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html#a0b656c41b9fff6402f33e95204ce8860',1,'cutlass::FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::AccessType()'],['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html#a7eccab04c8d3968e74486d0525a3fa02',1,'cutlass::FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::AccessType()'],['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html#abca5165caae7304f33fcad267c16b002',1,'cutlass::FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::AccessType()'],['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html#a87d46956aa317f06f2ba9a535fdfc5da',1,'cutlass::FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::AccessType()'],['../structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae',1,'cutlass::Load::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a5d7ed0abaeea99ec3399f8eea930f761',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a2b9faed8d92f55a46e313d79d214316d',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a8611550c045d6def964d9dafb2be80c6',1,'cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a942970f88e13c88f496a9da67ed47a6f',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::AccessType()'],['../structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942',1,'cutlass::Store::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a89f329ba11f96ee3ce4428cbc792ac3d',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#ac0af6ae18137156abe24d6479232b955',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ad073f5e8252ad24b086f14bd2a109cf9',1,'cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aeb70e4859e2795b6af63ad5e203b4da9',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::AccessType()'],['../structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53',1,'cutlass::TileIteratorBase::AccessType()'],['../structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0',1,'cutlass::TileLoadIterator::AccessType()'],['../structcutlass_1_1TileStoreIterator.html#a0e79ed59263ebc3478c43f2f9a50cb5a',1,'cutlass::TileStoreIterator::AccessType()']]],
-  ['accumulators',['Accumulators',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce',1,'cutlass::gemm::GemmEpilogue::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2',1,'cutlass::gemm::GemmEpilogueTraits::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54',1,'cutlass::gemm::GemmConfig::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a505306c2af2059f6e84ba32d701d1602',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a4712650b46b6183ea60d79ef18f55b86',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d',1,'cutlass::gemm::ThreadMultiplyAdd::Accumulators()']]],
-  ['accumulatorsperthread',['AccumulatorsPerThread',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a98d0f84730551eaabfe7404b36478b50',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a47807c9c9fb43e7f7b5f409a49986c30',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5',1,'cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerThread()']]],
-  ['accumulatorsperwarp',['AccumulatorsPerWarp',['../structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108',1,'cutlass::gemm::GemmConfig::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af0c856abdd9f7f26f671493cc629bf0a',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a327ce1b7b6478c27c80baf5d9e26bdbc',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77',1,'cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerWarp()']]],
+  ['a',['A',['../structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b',1,'cutlass::gemm::GemmDesc']]],
+  ['abs',['abs',['../namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5',1,'cutlass::platform']]],
+  ['accesstype',['AccessType',['../structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7',1,'cutlass::FragmentIterator::AccessType()'],['../structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b',1,'cutlass::FragmentConstIterator::AccessType()'],['../structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8',1,'cutlass::Load::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57',1,'cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::AccessType()'],['../structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7',1,'cutlass::Store::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44',1,'cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301',1,'cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a',1,'cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9',1,'cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973',1,'cutlass::TileIteratorBase::AccessType()'],['../structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125',1,'cutlass::TileLoadIterator::AccessType()'],['../structcutlass_1_1TileStoreIterator.html#a10431ed94c0dd66a8c1d01ba7c8b5aa2',1,'cutlass::TileStoreIterator::AccessType()']]],
+  ['accumulators',['Accumulators',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591',1,'cutlass::gemm::GemmConfig::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce',1,'cutlass::gemm::GemmEpilogue::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4',1,'cutlass::gemm::GemmEpilogueTraits::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6',1,'cutlass::gemm::ThreadMultiplyAdd::Accumulators()']]],
+  ['accumulatorsperthread',['AccumulatorsPerThread',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d',1,'cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerThread()']]],
+  ['accumulatorsperwarp',['AccumulatorsPerWarp',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3',1,'cutlass::gemm::GemmConfig::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e',1,'cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerWarp()']]],
+  ['add_5fpointer_5foffset',['add_pointer_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6',1,'cutlass::gemm::GemmGlobalIteratorAb::add_pointer_offset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db',1,'cutlass::gemm::GemmGlobalIteratorCd::add_pointer_offset()'],['../classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143',1,'cutlass::TensorRef::add_pointer_offset()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a93ff0a9fda3e136a1674aeb82de050db',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::add_pointer_offset()'],['../structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232',1,'cutlass::TileLoadIterator::add_pointer_offset()'],['../structcutlass_1_1TileStoreIterator.html#aa6977ded39ead005b3435f13f0e51116',1,'cutlass::TileStoreIterator::add_pointer_offset()'],['../classcutlass_1_1ZipTileIterator.html#a0752af296e110d9104a45ae24bd0a104',1,'cutlass::ZipTileIterator::add_pointer_offset()']]],
   ['additive',['Additive',['../structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375a77d7cc80ec0c3ff42ca9b2aff98a1646',1,'cutlass::Identity']]],
-  ['advance',['advance',['../classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478',1,'cutlass::TensorRef']]],
-  ['aligned_5f',['aligned_',['../unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c',1,'cutlass::Vector::aligned_()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896',1,'cutlass::Vector&lt; half, kLanes_ &gt;::aligned_()']]],
+  ['aligned_5f',['aligned_',['../unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c',1,'cutlass::Vector::aligned_()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#acc698443a38fd0ad63f931bdf172ad99',1,'cutlass::Vector&lt; half, 1 &gt;::aligned_()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896',1,'cutlass::Vector&lt; half, kLanes_ &gt;::aligned_()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1df3324868465331db13bd7775b55e87',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::aligned_()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ad6784e347f068ad20af52379286337c0',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::aligned_()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a4eab187b6f7650bd88ccd421c8330d3c',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::aligned_()']]],
   ['aligned_5fchunk',['aligned_chunk',['../structcutlass_1_1platform_1_1aligned__chunk.html',1,'cutlass::platform']]],
   ['aligned_5fstorage',['aligned_storage',['../structcutlass_1_1platform_1_1aligned__storage.html',1,'cutlass::platform']]],
   ['alignedstruct',['AlignedStruct',['../structcutlass_1_1AlignedStruct.html',1,'cutlass']]],
@@ -26,6 +28,8 @@ var searchData=
   ['alignment_5fof_3c_20ulonglong2_20_3e',['alignment_of&lt; ulonglong2 &gt;',['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html',1,'cutlass::platform']]],
   ['alignment_5fof_3c_20ulonglong4_20_3e',['alignment_of&lt; ulonglong4 &gt;',['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html',1,'cutlass::platform']]],
   ['alignment_5fof_3c_20volatile_20value_5ft_20_3e',['alignment_of&lt; volatile value_t &gt;',['../structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html',1,'cutlass::platform']]],
-  ['alpha',['alpha',['../structcutlass_1_1gemm_1_1GemmDesc.html#a053c2b529be527f510ee317737fbf7e8',1,'cutlass::gemm::GemmDesc::alpha()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70',1,'cutlass::gemm::LinearScaling::Params::alpha()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6',1,'cutlass::gemm::LinearScaling::alpha()']]],
-  ['at',['at',['../structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8',1,'cutlass::Coord::at()'],['../structcutlass_1_1Coord.html#ab511a16210d1b94449f5bc6476f6a266',1,'cutlass::Coord::at(int dim)'],['../structcutlass_1_1Coord.html#af9cc7ab2088544d1240ac51c4c6e685d',1,'cutlass::Coord::at() const'],['../structcutlass_1_1Coord.html#aed4f4d1c7c0749fe72736d7a1213b6e9',1,'cutlass::Coord::at(int dim) const'],['../structcutlass_1_1FragmentIterator.html#a9cf31df06ff035705a1341810fcdcbf2',1,'cutlass::FragmentIterator::at(int d, int h, int w, int c=0) const'],['../structcutlass_1_1FragmentIterator.html#a7bdc407aae8d7360e089af347b585a53',1,'cutlass::FragmentIterator::at(int d, int h, int w, int c=0)'],['../structcutlass_1_1FragmentConstIterator.html#a8b957150545becacab1b8ead1be29424',1,'cutlass::FragmentConstIterator::at()'],['../structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd',1,'cutlass::PredicateVector::at()'],['../structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f',1,'cutlass::TrivialPredicateTileAdapter::at()'],['../structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986',1,'cutlass::PredicateTileAdapter::at()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd',1,'cutlass::ConstPredicateTileAdapter::at()'],['../classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f',1,'cutlass::TensorRef::at(Coord&lt; Rank &gt; const &amp;coord) const'],['../classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215',1,'cutlass::TensorRef::at(int idx) const'],['../classcutlass_1_1TensorView.html#ad894a8b373c413d308cb1b7c7ba545ce',1,'cutlass::TensorView::at(Coord_t const &amp;coord) const'],['../classcutlass_1_1TensorView.html#acc55581896fae8c0449b44b56d750155',1,'cutlass::TensorView::at(Offset_t idx) const']]]
+  ['alpha',['alpha',['../structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785',1,'cutlass::gemm::GemmDesc::alpha()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70',1,'cutlass::gemm::LinearScaling::Params::alpha()'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662',1,'cutlass::gemm::LinearScalingDevicePtr::Params::alpha()']]],
+  ['arg',['arg',['../namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0',1,'cutlass::platform']]],
+  ['at',['at',['../structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93',1,'cutlass::Coord::at()'],['../structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694',1,'cutlass::Coord::at(int dim)'],['../structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe',1,'cutlass::Coord::at() const'],['../structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46',1,'cutlass::Coord::at(int dim) const'],['../structcutlass_1_1FragmentIterator.html#a35b721563536ab2c5dbab0f5de1c2b43',1,'cutlass::FragmentIterator::at(int d, int h, int w, int c=0) const'],['../structcutlass_1_1FragmentIterator.html#adb863b44dfbc1fa923625e767f6dd7cd',1,'cutlass::FragmentIterator::at(int d, int h, int w, int c=0)'],['../structcutlass_1_1FragmentConstIterator.html#a14f2ad2f9b90aea092ff1836e8fb159d',1,'cutlass::FragmentConstIterator::at()'],['../structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd',1,'cutlass::PredicateVector::at()'],['../structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f',1,'cutlass::TrivialPredicateTileAdapter::at()'],['../structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986',1,'cutlass::PredicateTileAdapter::at()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd',1,'cutlass::ConstPredicateTileAdapter::at()'],['../classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f',1,'cutlass::TensorRef::at(TensorCoord const &amp;coord) const'],['../classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c',1,'cutlass::TensorRef::at(LongIndex idx) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a597bb02594c918c50f0bdb0cb4ce74c8',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::at(TensorCoord const &amp;coord) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a92371a586e756734522a853bef74324d',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::at(LongIndex idx) const'],['../structcutlass_1_1TensorRefBatchStrided.html#aac4b013050925c1e2db4019140e82602',1,'cutlass::TensorRefBatchStrided::at()'],['../structcutlass_1_1TensorRefArray.html#a2a95fd42d48c550a45f340b04f9dfe3d',1,'cutlass::TensorRefArray::at()']]],
+  ['atype',['AType',['../structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037',1,'cutlass::gemm::GemmDesc']]]
 ];
diff --git a/docs/search/all_10.js b/docs/search/all_10.js
index 19828a38f..69ff2ab61 100644
--- a/docs/search/all_10.js
+++ b/docs/search/all_10.js
@@ -1,20 +1,29 @@
 var searchData=
 [
-  ['rank',['Rank',['../classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66',1,'cutlass::TensorRef::Rank()'],['../classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90',1,'cutlass::TensorView::Rank()']]],
-  ['ref',['ref',['../classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09',1,'cutlass::TensorView::ref()'],['../classcutlass_1_1TensorView.html#a5cbff89d3d8dc71d27a4d6c1d7abb58a',1,'cutlass::TensorView::ref() const']]],
-  ['registers',['registers',['../unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a',1,'cutlass::Vector::registers()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f',1,'cutlass::Vector&lt; half, kLanes_ &gt;::registers()']]],
+  ['rank',['Rank',['../classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a',1,'cutlass::TensorRef::Rank()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a233fba9abdbbd0fe3a2cc7465ea76a41',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Rank()'],['../classcutlass_1_1TensorView.html#a8dbb7043546fae133547d2c3e46dddab',1,'cutlass::TensorView::Rank()']]],
+  ['real',['real',['../classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974',1,'cutlass::platform::complex::real() const'],['../classcutlass_1_1platform_1_1complex.html#acda3e2050b2fefb1aca1fa8aa2063f8b',1,'cutlass::platform::complex::real()'],['../namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39',1,'cutlass::platform::real(cuFloatComplex const &amp;z)'],['../namespacecutlass_1_1platform.html#aa9b17e4705337452761c0d3bd5edfc67',1,'cutlass::platform::real(cuFloatComplex &amp;z)'],['../namespacecutlass_1_1platform.html#a1f13c0049c5f94b0480c619612608f7b',1,'cutlass::platform::real(cuDoubleComplex const &amp;z)'],['../namespacecutlass_1_1platform.html#a3365c0200a034973b7baecede9728239',1,'cutlass::platform::real(cuDoubleComplex &amp;z)'],['../namespacecutlass_1_1platform.html#a01e98d1c13ac9384f2bdc407fce6131b',1,'cutlass::platform::real(complex&lt; T &gt; const &amp;z)'],['../namespacecutlass_1_1platform.html#aa5cfa5849e12b745236485dd2db5f854',1,'cutlass::platform::real(complex&lt; T &gt; &amp;z)']]],
+  ['ref',['ref',['../classcutlass_1_1TensorView.html#a7e2beb56a3bc2d58c9ec65467b78c4f3',1,'cutlass::TensorView']]],
+  ['reference',['reference',['../structcutlass_1_1TileAllocation.html#a3466ef2b478e4617aa1ff261217cfd05',1,'cutlass::TileAllocation::reference()'],['../structcutlass_1_1TileAllocation.html#afcdc0be82acf0b4ae66468e2170c5a0d',1,'cutlass::TileAllocation::reference() const'],['../structcutlass_1_1ZipTileAllocation.html#a0d00001220df7f2bdb1f09ae3f37c585',1,'cutlass::ZipTileAllocation::reference()'],['../structcutlass_1_1ZipTileAllocation.html#af9964904e789b3ab58334f1ec1ceee56',1,'cutlass::ZipTileAllocation::reference() const']]],
+  ['registers',['registers',['../unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a',1,'cutlass::Vector::registers()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f',1,'cutlass::Vector&lt; half, kLanes_ &gt;::registers()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#af27a36f604513f05aebe0624a9c539ab',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::registers()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ace5e03860b434b2d2a4590bd2bc8c147',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::registers()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a15d5103e46d53e030100dedaecb0220a',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::registers()']]],
+  ['regulartilepredicatefunctor',['RegularTilePredicateFunctor',['../structcutlass_1_1RegularTilePredicateFunctor.html',1,'cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;'],['../structcutlass_1_1RegularTilePredicateFunctor.html#a0e0b728d3685097a9280fbca6a47a2af',1,'cutlass::RegularTilePredicateFunctor::RegularTilePredicateFunctor()']]],
   ['release',['release',['../classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279',1,'cutlass::platform::unique_ptr']]],
   ['remove_5fconst',['remove_const',['../structcutlass_1_1platform_1_1remove__const.html',1,'cutlass::platform']]],
   ['remove_5fconst_3c_20const_20t_20_3e',['remove_const&lt; const T &gt;',['../structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html',1,'cutlass::platform']]],
   ['remove_5fcv',['remove_cv',['../structcutlass_1_1platform_1_1remove__cv.html',1,'cutlass::platform']]],
   ['remove_5fvolatile',['remove_volatile',['../structcutlass_1_1platform_1_1remove__volatile.html',1,'cutlass::platform']]],
   ['remove_5fvolatile_3c_20volatile_20t_20_3e',['remove_volatile&lt; volatile T &gt;',['../structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html',1,'cutlass::platform']]],
-  ['reset',['reset',['../classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674',1,'cutlass::TensorRef::reset()'],['../classcutlass_1_1TensorView.html#a8b1785a1ea5d7aa7eba8e45297d539d3',1,'cutlass::TensorView::reset()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331',1,'cutlass::platform::unique_ptr::reset()']]],
+  ['reset',['reset',['../classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0',1,'cutlass::TensorRef::reset(Storage *ptr=nullptr)'],['../classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b',1,'cutlass::TensorRef::reset(Storage *ptr, StorageCoord const &amp;stride)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a1043f0ef382179b8ecd9f4e710f6e106',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::reset(Storage *ptr=nullptr)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6339a8ac88f9172acf0337d149b98cb4',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::reset(Storage *ptr, StorageCoord const &amp;stride)'],['../classcutlass_1_1TensorView.html#ae142eb93cf91e000b635d32fcacf1db3',1,'cutlass::TensorView::reset()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331',1,'cutlass::platform::unique_ptr::reset()']]],
   ['reshape_5ftile_2eh',['reshape_tile.h',['../reshape__tile_8h.html',1,'']]],
   ['reshapethreads',['ReshapeThreads',['../structcutlass_1_1gemm_1_1ReshapeThreads.html',1,'cutlass::gemm']]],
   ['reshapethreads_3c_20tile_5f_2c_20threads_5f_2c_20true_20_3e',['ReshapeThreads&lt; Tile_, Threads_, true &gt;',['../structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html',1,'cutlass::gemm']]],
   ['reshapetile',['ReshapeTile',['../structcutlass_1_1ReshapeTile.html',1,'cutlass']]],
   ['reshapetile_3c_20tile_5f_2c_20kaccesssize_5f_2c_20true_20_3e',['ReshapeTile&lt; Tile_, kAccessSize_, true &gt;',['../structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html',1,'cutlass']]],
-  ['residue',['residue',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9',1,'cutlass::gemm::GlobalLoadStreamBase::residue()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aab37ea6c47e34466371314ed3971dc7b',1,'cutlass::gemm::GemmGlobalIteratorAb::residue()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a405b93680bb6e356369863244d0b56aa',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::residue()']]],
-  ['round_5fnearest',['round_nearest',['../namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e',1,'cutlass']]]
+  ['residue',['residue',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17',1,'cutlass::gemm::GlobalLoadStream::residue()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593',1,'cutlass::gemm::GemmGlobalIteratorAb::residue()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a',1,'cutlass::gemm::GlobalLoadStreamPair::residue()']]],
+  ['rollback',['rollback',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1e2eecdba1871fc11aa43a06edf6ed34',1,'cutlass::gemm::GlobalLoadStream::rollback()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6a9287a2cd87ca8a96cbf6b6d29199da',1,'cutlass::gemm::GlobalLoadStreamPair::rollback()']]],
+  ['round_5fnearest',['round_nearest',['../namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e',1,'cutlass']]],
+  ['row',['row',['../structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546',1,'cutlass::MatrixCoord::row() const'],['../structcutlass_1_1MatrixCoord.html#a67f3102e51abad1205e8a3450e7a6c7e',1,'cutlass::MatrixCoord::row()']]],
+  ['rowmajor',['RowMajor',['../structcutlass_1_1MatrixLayout_1_1RowMajor.html',1,'cutlass::MatrixLayout']]],
+  ['rowmajorblocklinear',['RowMajorBlockLinear',['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html',1,'cutlass::MatrixLayout']]],
+  ['rowmajorblockswizzle',['RowMajorBlockSwizzle',['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html',1,'cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;'],['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a4ed7847f8ddad11a6765d914b6f32fcd',1,'cutlass::gemm::RowMajorBlockSwizzle::RowMajorBlockSwizzle()']]],
+  ['rowmajorinterleaved',['RowMajorInterleaved',['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html',1,'cutlass::MatrixLayout']]]
 ];
diff --git a/docs/search/all_11.js b/docs/search/all_11.js
index 4f0bed2ee..4953381bb 100644
--- a/docs/search/all_11.js
+++ b/docs/search/all_11.js
@@ -1,89 +1,107 @@
 var searchData=
 [
-  ['scalar',['Scalar',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295',1,'cutlass::gemm::GemmEpilogue::Scalar()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66',1,'cutlass::gemm::GemmEpilogueTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Scalar()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6',1,'cutlass::gemm::GlobalLoadStreamBase::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b',1,'cutlass::gemm::GemmGlobalTileTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a',1,'cutlass::gemm::GemmGlobalIteratorAb::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e',1,'cutlass::gemm::GemmGlobalIteratorCd::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a8b04fd003fc2db46d749360e8838438b',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aaa439a0bb6b9de5e2722ea7b011effea',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14',1,'cutlass::gemm::GemmSharedLoadTileATraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317',1,'cutlass::gemm::IgemmEpilogueScalar::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650',1,'cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183',1,'cutlass::gemm::LinearScaling::Scalar()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Scalar()'],['../structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16',1,'cutlass::TileIteratorBase::Scalar()'],['../structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895',1,'cutlass::TileLoadIterator::Scalar()'],['../structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7',1,'cutlass::TileStoreIterator::Scalar()'],['../unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd',1,'cutlass::Vector::Scalar()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b',1,'cutlass::Vector&lt; half, kLanes_ &gt;::Scalar()'],['../structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599',1,'cutlass::VectorTraits::Scalar()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Scalar()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Scalar()']]],
-  ['scalara',['ScalarA',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarA()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a366083b229b28e7f44da38273b2ab263',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b',1,'cutlass::gemm::Gemm::ScalarA()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa',1,'cutlass::gemm::GemmConfig::ScalarA()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6',1,'cutlass::gemm::GemmTraits::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a236a408791a38358cbadf19dd0e8ed9f',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aeef5fa0437b4ce1c2e8ac4bc7e062b65',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarA()']]],
-  ['scalarb',['ScalarB',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarB()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af52ec4b92a3e788169764014aebb85a1',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4',1,'cutlass::gemm::Gemm::ScalarB()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b',1,'cutlass::gemm::GemmConfig::ScalarB()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698',1,'cutlass::gemm::GemmTraits::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac7557562de1108bf1abc10829c83e88f',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aaf9e4b8b16150a6ad826c228af2bf103',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarB()']]],
-  ['scalarc',['ScalarC',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarC()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af553be8ef0b4dc9bb593d98dfce8628d',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55',1,'cutlass::gemm::Gemm::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0',1,'cutlass::gemm::GemmEpilogue::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc',1,'cutlass::gemm::GemmEpilogueTraits::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea',1,'cutlass::gemm::GemmConfig::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443',1,'cutlass::gemm::GemmTraits::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af1a6d91d4734683ea791bf57f3c3bbb0',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#acdd554e996a712ff62eb70d6ecf8e116',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarC()']]],
-  ['scalard',['ScalarD',['../structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694',1,'cutlass::gemm::Gemm::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f',1,'cutlass::gemm::GemmEpilogue::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe',1,'cutlass::gemm::GemmEpilogueTraits::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8',1,'cutlass::gemm::GemmConfig::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e',1,'cutlass::gemm::GemmTraits::ScalarD()']]],
+  ['scalar',['Scalar',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295',1,'cutlass::gemm::GemmEpilogue::Scalar()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a',1,'cutlass::gemm::GemmEpilogueTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Scalar()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c',1,'cutlass::gemm::GlobalLoadStream::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b',1,'cutlass::gemm::GemmGlobalTileTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a',1,'cutlass::gemm::GemmGlobalIteratorAb::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e',1,'cutlass::gemm::GemmGlobalIteratorCd::Scalar()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429',1,'cutlass::gemm::SharedLoadStream::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a8b04fd003fc2db46d749360e8838438b',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aaa439a0bb6b9de5e2722ea7b011effea',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14',1,'cutlass::gemm::GemmSharedLoadTileATraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317',1,'cutlass::gemm::IgemmEpilogueScalar::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650',1,'cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183',1,'cutlass::gemm::LinearScaling::Scalar()'],['../structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e',1,'cutlass::gemm::LinearScalingDevicePtr::Scalar()'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad',1,'cutlass::detail::ScalarOrPointer::Scalar()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Scalar()'],['../structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6',1,'cutlass::TileAllocation::Scalar()'],['../structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34',1,'cutlass::TileIteratorBase::Scalar()'],['../structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511',1,'cutlass::TileLoadIterator::Scalar()'],['../structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5',1,'cutlass::TileStoreIterator::Scalar()'],['../unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd',1,'cutlass::Vector::Scalar()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac',1,'cutlass::Vector&lt; half, 1 &gt;::Scalar()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b',1,'cutlass::Vector&lt; half, kLanes_ &gt;::Scalar()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::Scalar()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::Scalar()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::Scalar()'],['../structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599',1,'cutlass::VectorTraits::Scalar()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Scalar()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Scalar()']]],
+  ['scalar_5for_5fpointer_2eh',['scalar_or_pointer.h',['../scalar__or__pointer_8h.html',1,'']]],
+  ['scalara',['ScalarA',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b',1,'cutlass::gemm::Gemm::ScalarA()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b',1,'cutlass::gemm::GemmConfig::ScalarA()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6',1,'cutlass::gemm::GemmTraits::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarA()']]],
+  ['scalaraccum',['ScalarAccum',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarAccum()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::ScalarAccum()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309',1,'cutlass::gemm::LinearScaling::ScalarAccum()']]],
+  ['scalaralphabeta',['ScalarAlphaBeta',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarAlphaBeta()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::ScalarAlphaBeta()']]],
+  ['scalarb',['ScalarB',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4',1,'cutlass::gemm::Gemm::ScalarB()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6',1,'cutlass::gemm::GemmConfig::ScalarB()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698',1,'cutlass::gemm::GemmTraits::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarB()']]],
+  ['scalarc',['ScalarC',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55',1,'cutlass::gemm::Gemm::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d',1,'cutlass::gemm::GemmConfig::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0',1,'cutlass::gemm::GemmEpilogue::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c',1,'cutlass::gemm::GemmEpilogueTraits::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443',1,'cutlass::gemm::GemmTraits::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarC()']]],
+  ['scalard',['ScalarD',['../structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694',1,'cutlass::gemm::Gemm::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa',1,'cutlass::gemm::GemmConfig::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f',1,'cutlass::gemm::GemmEpilogue::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50',1,'cutlass::gemm::GemmEpilogueTraits::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e',1,'cutlass::gemm::GemmTraits::ScalarD()']]],
   ['scalarepilogue',['ScalarEpilogue',['../structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936',1,'cutlass::gemm::Gemm']]],
-  ['scalars',['scalars',['../unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f',1,'cutlass::Vector::scalars()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3',1,'cutlass::Vector&lt; half, kLanes_ &gt;::scalars()']]],
+  ['scalario',['ScalarIO',['../structcutlass_1_1ScalarIO.html',1,'cutlass::ScalarIO&lt; T &gt;'],['../structcutlass_1_1ScalarIO.html#ad4166575521254088bf6c6300c351714',1,'cutlass::ScalarIO::ScalarIO()'],['../structcutlass_1_1ScalarIO.html#a5227e1e9ed24326ad4f8dc94d186186f',1,'cutlass::ScalarIO::ScalarIO(T value)']]],
+  ['scalarorpointer',['ScalarOrPointer',['../classcutlass_1_1detail_1_1ScalarOrPointer.html',1,'cutlass::detail::ScalarOrPointer&lt; Scalar_ &gt;'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a45cf72b3f0e3408a4b51990b648b71ee',1,'cutlass::detail::ScalarOrPointer::ScalarOrPointer()'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b85e1940149922942c7d495f9d12134',1,'cutlass::detail::ScalarOrPointer::ScalarOrPointer(Scalar const &amp;val)'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a03a54e9150c2cccb26d9fa688ea03f96',1,'cutlass::detail::ScalarOrPointer::ScalarOrPointer(Scalar const *ptr_)']]],
+  ['scalarorpointer_3c_20scalar_20_3e',['ScalarOrPointer&lt; Scalar &gt;',['../classcutlass_1_1detail_1_1ScalarOrPointer.html',1,'cutlass::detail']]],
+  ['scalars',['scalars',['../unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f',1,'cutlass::Vector::scalars()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a81709dacea12d6bd3bb328a3f0a519b0',1,'cutlass::Vector&lt; half, 1 &gt;::scalars()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3',1,'cutlass::Vector&lt; half, kLanes_ &gt;::scalars()']]],
+  ['second',['second',['../structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc',1,'cutlass::ZipTileAllocation::second()'],['../structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c',1,'cutlass::ZipFragment::second()'],['../structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9',1,'cutlass::ZipConvert::second()'],['../structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451',1,'cutlass::ZipTensorRef::second()'],['../structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26',1,'cutlass::ZipTileIterator::Params::second()'],['../classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0',1,'cutlass::ZipTileIterator::second()'],['../structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527',1,'cutlass::ZipTileAllocation::Second()'],['../structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a',1,'cutlass::ZipFragment::Second()'],['../structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10',1,'cutlass::ZipConvert::Second()'],['../structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e',1,'cutlass::ZipTensorRef::Second()'],['../classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c',1,'cutlass::ZipTileIterator::Second()']]],
   ['set',['set',['../classcutlass_1_1PredicateVector_1_1Iterator.html#aadfd039b5622098c9e46706a27122575',1,'cutlass::PredicateVector::Iterator::set()'],['../structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af',1,'cutlass::PredicateVector::set()'],['../structcutlass_1_1PredicateTileAdapter.html#aeda47efdda0387f9c3c7b31f836afca5',1,'cutlass::PredicateTileAdapter::set()']]],
   ['sgemm_5ftraits_2eh',['sgemm_traits.h',['../sgemm__traits_8h.html',1,'']]],
   ['sgemmconfig',['SgemmConfig',['../structcutlass_1_1gemm_1_1SgemmConfig.html',1,'cutlass::gemm']]],
+  ['sgemmlbtraits',['SgemmLBTraits',['../structcutlass_1_1gemm_1_1SgemmLBTraits.html',1,'cutlass::gemm']]],
   ['sgemmtraits',['SgemmTraits',['../structcutlass_1_1gemm_1_1SgemmTraits.html',1,'cutlass::gemm']]],
-  ['shape',['Shape',['../structcutlass_1_1Shape.html',1,'cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;'],['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e',1,'cutlass::gemm::GemmMultiplicandTraits::Shape()'],['../structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29',1,'cutlass::ShapeScale::Shape()'],['../structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71',1,'cutlass::ShapeAdd::Shape()'],['../structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9',1,'cutlass::ShapeSub::Shape()'],['../structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94',1,'cutlass::ShapeMul::Shape()'],['../structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b',1,'cutlass::ShapeDiv::Shape()'],['../structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961',1,'cutlass::ShapeMax::Shape()'],['../structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549',1,'cutlass::ShapeMin::Shape()'],['../structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a',1,'cutlass::ShapeStrides::Shape()']]],
+  ['shape',['Shape',['../structcutlass_1_1Shape.html',1,'cutlass::Shape&lt; kD_, kH_, kW_, kC_ &gt;'],['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e',1,'cutlass::gemm::GemmMultiplicandTraits::Shape()'],['../structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29',1,'cutlass::ShapeScale::Shape()'],['../structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71',1,'cutlass::ShapeAdd::Shape()'],['../structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9',1,'cutlass::ShapeSub::Shape()'],['../structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94',1,'cutlass::ShapeMul::Shape()'],['../structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b',1,'cutlass::ShapeDiv::Shape()'],['../structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799',1,'cutlass::ShapeDivCeiling::Shape()'],['../structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961',1,'cutlass::ShapeMax::Shape()'],['../structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549',1,'cutlass::ShapeMin::Shape()'],['../structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4',1,'cutlass::ShapeStrides::Shape()'],['../structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc',1,'cutlass::TileAllocation::Shape()']]],
   ['shape_2eh',['shape.h',['../shape_8h.html',1,'']]],
   ['shapeadd',['ShapeAdd',['../structcutlass_1_1ShapeAdd.html',1,'cutlass']]],
   ['shapecount',['ShapeCount',['../structcutlass_1_1ShapeCount.html',1,'cutlass']]],
   ['shapediv',['ShapeDiv',['../structcutlass_1_1ShapeDiv.html',1,'cutlass']]],
+  ['shapedivceiling',['ShapeDivCeiling',['../structcutlass_1_1ShapeDivCeiling.html',1,'cutlass']]],
   ['shapemax',['ShapeMax',['../structcutlass_1_1ShapeMax.html',1,'cutlass']]],
   ['shapemin',['ShapeMin',['../structcutlass_1_1ShapeMin.html',1,'cutlass']]],
   ['shapemul',['ShapeMul',['../structcutlass_1_1ShapeMul.html',1,'cutlass']]],
   ['shapescale',['ShapeScale',['../structcutlass_1_1ShapeScale.html',1,'cutlass']]],
   ['shapestrides',['ShapeStrides',['../structcutlass_1_1ShapeStrides.html',1,'cutlass']]],
   ['shapesub',['ShapeSub',['../structcutlass_1_1ShapeSub.html',1,'cutlass']]],
-  ['shared',['shared',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#afabd328b106d45b156200f73942d211e',1,'cutlass::gemm::GemmTraits::StreamSharedStorage']]],
-  ['shared_5fiterator_5fload',['shared_iterator_load',['../namespacecutlass.html#abcec976c59cab75ca55b338d125154a3',1,'cutlass::shared_iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)'],['../namespacecutlass.html#aa9416026c6db08d92a34c2ac08fea8c3',1,'cutlass::shared_iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment, int d)']]],
-  ['shared_5fiterator_5fstore',['shared_iterator_store',['../namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109',1,'cutlass']]],
   ['shared_5fload_5ffence',['shared_load_fence',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84',1,'cutlass::gemm::GemmEpilogue::shared_load_fence()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe',1,'cutlass::gemm::GemmTraits::shared_load_fence()']]],
-  ['shared_5fload_5fiterator_5fd',['shared_load_iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a1742e43c128665f0ca39cb578291df81',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
+  ['shared_5fload_5fstream_5fd',['shared_load_stream_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a5d3d1abd85f18476a74bcf616a717f9d',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
   ['shared_5fstorage',['shared_storage',['../structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b',1,'cutlass::gemm::Gemm::shared_storage()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e',1,'cutlass::gemm::GemmEpilogue::shared_storage()']]],
   ['shared_5fstore_5ffence',['shared_store_fence',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691',1,'cutlass::gemm::GemmEpilogue::shared_store_fence()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f',1,'cutlass::gemm::GemmTraits::shared_store_fence()']]],
-  ['shared_5fstore_5fiterator_5fd',['shared_store_iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#af79a0c74a4c30ccec59b393721b5dfc1',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
-  ['shared_5fstream',['shared_stream',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#ae63b5a52106dbd37ea304196335ec210',1,'cutlass::gemm::GemmEpilogueTraits::SharedStorage']]],
-  ['shared_5fstream_5fa',['shared_stream_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978',1,'cutlass::gemm::GemmTraits::Params']]],
-  ['shared_5fstream_5fb',['shared_stream_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d',1,'cutlass::gemm::GemmTraits::Params']]],
-  ['sharedloaditeratora',['SharedLoadIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorA()']]],
-  ['sharedloaditeratorb',['SharedLoadIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorB()']]],
-  ['sharedloaditeratord',['SharedLoadIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070',1,'cutlass::gemm::GemmEpilogue::SharedLoadIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5',1,'cutlass::gemm::GemmEpilogueTraits::SharedLoadIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadIteratorD()']]],
-  ['sharedloadstream',['SharedLoadStream',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html',1,'cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad',1,'cutlass::gemm::SharedLoadStream::SharedLoadStream()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a93e9bcdca4ceb68754fb1f73e2b25d25',1,'cutlass::gemm::SharedLoadStream::SharedLoadStream(Params const &amp;params, SharedStorage &amp;shared_storage)'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a49315aea1c54d84ff19b0ac215128b95',1,'cutlass::gemm::GemmTraits::SharedLoadStream::SharedLoadStream()']]],
-  ['sharedloadstreama',['SharedLoadStreamA',['../structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc',1,'cutlass::gemm::GemmTraits::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamA()']]],
-  ['sharedloadstreamb',['SharedLoadStreamB',['../structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290',1,'cutlass::gemm::GemmTraits::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamB()']]],
-  ['sharedloadtiletraits',['SharedLoadTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a458cbcc16fc296d024f2a1a95fb926c1',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af1bc7f7c26db3399201cd95f35a56790',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadTileTraits()']]],
-  ['sharedloadtransformerd',['SharedLoadTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13',1,'cutlass::gemm::GemmEpilogue']]],
-  ['sharedstorage',['SharedStorage',['../structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html',1,'cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage'],['../unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage'],['../unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html',1,'cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7',1,'cutlass::gemm::Gemm::SharedStorage()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc',1,'cutlass::gemm::GemmEpilogue::SharedStorage()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404',1,'cutlass::gemm::SharedLoadStream::SharedStorage()'],['../structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39',1,'cutlass::TileLoadIterator::SharedStorage()'],['../structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b',1,'cutlass::TileStoreIterator::SharedStorage()']]],
+  ['shared_5fstore_5fiterator_5fd',['shared_store_iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adfdf3eca06ea4061fbfe016336a3f276',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
+  ['shared_5fstream',['shared_stream',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e',1,'cutlass::gemm::GemmEpilogueTraits::SharedStorage::shared_stream()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a50e9cc382a32abd5beab299a79b30b27',1,'cutlass::gemm::GemmTraits::Params::shared_stream()']]],
+  ['sharedloaditeratora',['SharedLoadIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorA()']]],
+  ['sharedloaditeratorb',['SharedLoadIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorB()']]],
+  ['sharedloaditeratord',['SharedLoadIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadIteratorD()']]],
+  ['sharedloadstream',['SharedLoadStream',['../structcutlass_1_1gemm_1_1SharedLoadStream.html',1,'cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad',1,'cutlass::gemm::SharedLoadStream::SharedLoadStream()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#ad2f619712c817f91d62a13db0476a627',1,'cutlass::gemm::SharedLoadStream::SharedLoadStream(Params const &amp;params, TensorRef const &amp;ref)']]],
+  ['sharedloadstreama',['SharedLoadStreamA',['../structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc',1,'cutlass::gemm::GemmTraits::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamA()']]],
+  ['sharedloadstreamb',['SharedLoadStreamB',['../structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290',1,'cutlass::gemm::GemmTraits::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamB()']]],
+  ['sharedloadstreamd',['SharedLoadStreamD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b',1,'cutlass::gemm::GemmEpilogue::SharedLoadStreamD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f',1,'cutlass::gemm::GemmEpilogueTraits::SharedLoadStreamD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadStreamD()']]],
+  ['sharedloadtiletraits',['SharedLoadTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::SharedLoadTileTraits()']]],
+  ['sharedstorage',['SharedStorage',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html',1,'cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage'],['../unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html',1,'cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html',1,'cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7',1,'cutlass::gemm::Gemm::SharedStorage()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc',1,'cutlass::gemm::GemmEpilogue::SharedStorage()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404',1,'cutlass::gemm::SharedLoadStream::SharedStorage()'],['../structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948',1,'cutlass::TileLoadIterator::SharedStorage()'],['../structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca',1,'cutlass::TileStoreIterator::SharedStorage()']]],
   ['sharedstorefragmentd',['SharedStoreFragmentD',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8',1,'cutlass::gemm::IgemmEpilogueTraitsHelper']]],
-  ['sharedstoreiteratora',['SharedStoreIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4',1,'cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46',1,'cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorA()']]],
-  ['sharedstoreiteratorb',['SharedStoreIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448',1,'cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f',1,'cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorB()']]],
-  ['sharedstoreiteratord',['SharedStoreIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a',1,'cutlass::gemm::GemmEpilogue::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc',1,'cutlass::gemm::GemmEpilogueTraits::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreIteratorD()']]],
-  ['sharedstorestorage',['SharedStoreStorage',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa',1,'cutlass::gemm::GlobalLoadStreamBase']]],
-  ['sharedstorestoragea',['SharedStoreStorageA',['../structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c',1,'cutlass::gemm::GemmTraits']]],
-  ['sharedstorestorageb',['SharedStoreStorageB',['../structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed',1,'cutlass::gemm::GemmTraits']]],
-  ['sharedstoretiletraits',['SharedStoreTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a2aad3b2454d956f20dac1bb0ad75a2f8',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab1ae3d51f65f7af60147da1c51a7a0c2',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a7624585480f83a46725c92b5dee20ebc',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aca6118b5bbe6f667f05c53bd52543045',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()']]],
-  ['sharedstoretransformerd',['SharedStoreTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c',1,'cutlass::gemm::GemmEpilogue::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c',1,'cutlass::gemm::GemmEpilogueTraits::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTransformerD()']]],
+  ['sharedstoreiteratora',['SharedStoreIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9',1,'cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae',1,'cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorA()']]],
+  ['sharedstoreiteratorb',['SharedStoreIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce',1,'cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1',1,'cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorB()']]],
+  ['sharedstoreiteratord',['SharedStoreIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a',1,'cutlass::gemm::GemmEpilogue::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668',1,'cutlass::gemm::GemmEpilogueTraits::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreIteratorD()']]],
+  ['sharedstoretiletraits',['SharedStoreTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aa21c231aa56c9e5f2705cac62b17bbbe',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a872dc2d0b8ed6c75c41d258a23183861',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits()']]],
+  ['sharedstoretransformerd',['SharedStoreTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c',1,'cutlass::gemm::GemmEpilogue::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69',1,'cutlass::gemm::GemmEpilogueTraits::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTransformerD()']]],
+  ['sharedstream',['SharedStream',['../structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17',1,'cutlass::gemm::GemmTraits']]],
+  ['sharedstreampair',['SharedStreamPair',['../structcutlass_1_1gemm_1_1SharedStreamPair.html',1,'cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a0b69ca0b37dad32ba25c7f7e71a3dcc1',1,'cutlass::gemm::SharedStreamPair::SharedStreamPair()']]],
   ['simplifiedgemmepiloguetraits',['SimplifiedGemmEpilogueTraits',['../structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html',1,'cutlass::gemm']]],
   ['simplifiedgemmtraits',['SimplifiedGemmTraits',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html',1,'cutlass::gemm']]],
   ['simplifiedgemmtraits_3c_20klayouta_5f_2c_20klayoutb_5f_2c_20gemmconfig_5f_2c_20gemmepilogue_3c_20gemmepiloguetraits_5f_20_3e_2c_20index_5f_20_3e',['SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, Index_ &gt;',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html',1,'cutlass::gemm']]],
   ['simplifiedgemmtraitshelper',['SimplifiedGemmTraitsHelper',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html',1,'cutlass::gemm']]],
-  ['size',['size',['../classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027',1,'cutlass::TensorView::size() const'],['../classcutlass_1_1TensorView.html#a6218d8555679966eab784a6bb1fa4ed1',1,'cutlass::TensorView::size(int dim) const']]],
-  ['skew',['Skew',['../structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16',1,'cutlass::TileIteratorBase::Skew()'],['../structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c',1,'cutlass::TileLoadIterator::Skew()'],['../structcutlass_1_1TileStoreIterator.html#a57348779bb004ed1ea0fd9cc252e895d',1,'cutlass::TileStoreIterator::Skew()']]],
+  ['sin',['sin',['../namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a',1,'cutlass::platform']]],
+  ['size',['size',['../classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a',1,'cutlass::TensorView::size() const'],['../classcutlass_1_1TensorView.html#a3778dc1c62a27ed811f1bb82a420096e',1,'cutlass::TensorView::size(int dim) const']]],
+  ['skew',['Skew',['../structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1',1,'cutlass::TileIteratorBase::Skew()'],['../structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f',1,'cutlass::TileLoadIterator::Skew()'],['../structcutlass_1_1TileStoreIterator.html#a18248da35dc9a0ae2411121bee323085',1,'cutlass::TileStoreIterator::Skew()']]],
+  ['slice',['slice',['../structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c',1,'cutlass::Coord']]],
+  ['source_5ffragment',['source_fragment',['../structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a',1,'cutlass::TileStoreStream']]],
+  ['source_5frequired',['source_required',['../structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54',1,'cutlass::gemm::LinearScaling']]],
+  ['sqrt',['sqrt',['../namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747',1,'cutlass::platform']]],
   ['sqrt_5fest',['sqrt_est',['../structcutlass_1_1sqrt__est.html',1,'cutlass']]],
-  ['stage',['stage',['../structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92',1,'cutlass::TileLoadIterator::stage()'],['../structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e',1,'cutlass::TileStoreIterator::stage()']]],
+  ['stage',['stage',['../structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3',1,'cutlass::TileLoadIterator::stage()'],['../structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e',1,'cutlass::TileStoreIterator::stage()']]],
   ['static_5fassert',['static_assert',['../platform_8h.html#adde4c9ea91b753491851361a4198c009',1,'platform.h']]],
-  ['storage',['Storage',['../structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a',1,'cutlass::PredicateVector::Storage()'],['../classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd',1,'cutlass::TensorRef::Storage()'],['../structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a',1,'cutlass::TileIteratorBase::Storage()']]],
+  ['storage',['storage',['../structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604',1,'cutlass::TileAllocation::storage()'],['../structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a',1,'cutlass::PredicateVector::Storage()'],['../classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009',1,'cutlass::TensorRef::Storage()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Storage()'],['../structcutlass_1_1TensorRefBatchStrided.html#aa86a59779c0830e8cf82066853dc1089',1,'cutlass::TensorRefBatchStrided::Storage()'],['../structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8',1,'cutlass::TensorRefArray::Storage()'],['../classcutlass_1_1TensorView.html#a52fb77744c7c7ecf0f8a3a725556293d',1,'cutlass::TensorView::Storage()'],['../structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd',1,'cutlass::TileAllocation::Storage()'],['../structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0',1,'cutlass::TileIteratorBase::Storage()']]],
+  ['storagecoord',['StorageCoord',['../classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d',1,'cutlass::TensorRef::StorageCoord()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StorageCoord()'],['../classcutlass_1_1TensorView.html#abaf7ec0e96bc99cf0ce243e703b8711c',1,'cutlass::TensorView::StorageCoord()']]],
   ['storagetype',['StorageType',['../structcutlass_1_1StorageType.html',1,'cutlass']]],
   ['storagetype_3c_201_20_3e',['StorageType&lt; 1 &gt;',['../structcutlass_1_1StorageType_3_011_01_4.html',1,'cutlass']]],
   ['storagetype_3c_202_20_3e',['StorageType&lt; 2 &gt;',['../structcutlass_1_1StorageType_3_012_01_4.html',1,'cutlass']]],
   ['storagetype_3c_204_20_3e',['StorageType&lt; 4 &gt;',['../structcutlass_1_1StorageType_3_014_01_4.html',1,'cutlass']]],
-  ['store',['Store',['../structcutlass_1_1Store.html',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;'],['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a1f31090613c4e6f0895f598880d6c4e5',1,'cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage::store()'],['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html#a118c78aa6b0ae0f0c78889689b6878c8',1,'cutlass::FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::store()'],['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html#a45319520b7d341c66bd54d3e8fec48f8',1,'cutlass::FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::store()'],['../structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf',1,'cutlass::Store::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a00f6bb93d318bf4cff35c9dabc630167',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a027980b8456243974b0c442866a66e3a',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::store()'],['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ab70d04589637f285f861902f649f834e',1,'cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aa130564bb2eba7b07e1f183c98f1d9e2',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::store()'],['../structcutlass_1_1TileStoreIterator.html#a53820de506cecb1f5fb07b3385d8272a',1,'cutlass::TileStoreIterator::store(Fragment &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileStoreIterator.html#a60258b7c1a1708f97e28f8f6c292bfe4',1,'cutlass::TileStoreIterator::store(Fragment &amp;fragment) const']]],
-  ['store_3c_20double_2c_202_2c_20memory_5f_2c_20true_2c_2016_20_3e',['Store&lt; double, 2, Memory_, true, 16 &gt;',['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html',1,'cutlass']]],
-  ['store_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_2016_20_3e',['Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html',1,'cutlass']]],
-  ['store_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_204_20_3e',['Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html',1,'cutlass']]],
-  ['store_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_208_20_3e',['Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html',1,'cutlass']]],
-  ['store_5fiterator',['store_iterator',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a3e5167fa3f2dc0d8b4b903bd4e936969',1,'cutlass::gemm::GlobalLoadStreamBase::Params::store_iterator()'],['../unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a939e9ddecc5ee97882a54211a61f5586',1,'cutlass::gemm::GlobalLoadStreamBase::SharedStorage::store_iterator()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae',1,'cutlass::gemm::GlobalLoadStreamBase::store_iterator()']]],
-  ['store_5fpost_5fincrement',['store_post_increment',['../structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526',1,'cutlass::TileStoreIterator::store_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileStoreIterator.html#ae63949f58c1b32959bbfa5b64d521f0f',1,'cutlass::TileStoreIterator::store_post_increment(Fragment &amp;fragment)']]],
-  ['storeiterator',['StoreIterator',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834',1,'cutlass::gemm::GlobalLoadStreamBase']]],
-  ['stream_5fa',['stream_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage::stream_a()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::stream_a()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8',1,'cutlass::gemm::GemmTraits::SharedLoadStream::stream_a()']]],
-  ['stream_5fb',['stream_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage::stream_b()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::stream_b()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d',1,'cutlass::gemm::GemmTraits::SharedLoadStream::stream_b()']]],
-  ['streamsharedstorage',['StreamSharedStorage',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStream_, SharedLoadStream_ &gt;'],['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage']]],
-  ['streamsharedstorage_3c_20globalloadstreama_2c_20sharedloadstreama_20_3e',['StreamSharedStorage&lt; GlobalLoadStreamA, SharedLoadStreamA &gt;',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmTraits']]],
-  ['streamsharedstorage_3c_20globalloadstreamb_2c_20sharedloadstreamb_20_3e',['StreamSharedStorage&lt; GlobalLoadStreamB, SharedLoadStreamB &gt;',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmTraits']]],
-  ['stride',['stride',['../classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878',1,'cutlass::TensorRef::stride() const'],['../classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31',1,'cutlass::TensorRef::stride(int dim) const'],['../classcutlass_1_1TensorView.html#a3ac125a25199fd91f73d2cfe9fc3d09b',1,'cutlass::TensorView::stride() const'],['../classcutlass_1_1TensorView.html#a522630bb0df977282a9bff17e6fee843',1,'cutlass::TensorView::stride(int dim) const']]],
-  ['stride_5fd',['stride_d',['../structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1',1,'cutlass::TileIteratorBase::Params']]],
-  ['stride_5fh',['stride_h',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae0fdc7426b22ff2c20f077e251ebc823',1,'cutlass::gemm::GemmEpilogueTraits::Params::stride_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::stride_h()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::stride_h()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc',1,'cutlass::TileIteratorBase::Params::stride_h()']]],
-  ['stride_5fw',['stride_w',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2',1,'cutlass::gemm::GemmEpilogueTraits::Params::stride_w()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c',1,'cutlass::TileIteratorBase::Params::stride_w()']]],
-  ['strides',['Strides',['../structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1',1,'cutlass::FragmentIterator']]],
-  ['subview',['subview',['../classcutlass_1_1TensorView.html#aee43c516397d7c06eb8012711d8d7c15',1,'cutlass::TensorView']]],
+  ['storagetype_3c_20kalignment_5f_20_3e',['StorageType&lt; kAlignment_ &gt;',['../structcutlass_1_1StorageType.html',1,'cutlass']]],
+  ['storagetype_3c_20sizeof_28scalar_29_3e',['StorageType&lt; sizeof(Scalar)&gt;',['../structcutlass_1_1StorageType.html',1,'cutlass']]],
+  ['store',['Store',['../structcutlass_1_1Store.html',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;'],['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a673ddeb91e89c9a39c0a4dbaaa97dd8f',1,'cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage::store()'],['../structcutlass_1_1Store.html#a187b63f682f7f00f8bf9ed3ee59d602f',1,'cutlass::Store::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#a535b4356c9bc21352fc2459b3c2246d1',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a453a2eed81a86d6637778a50bed06b59',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a1fcdc328d4b2deb1c50be5d31ef9e55f',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::store()'],['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a174ed368f1c702b4c958887f0b895eee',1,'cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#ae16a5d6d7a42ffeba0f0ebe2d252ec28',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a298a08c8c4c1ea871e92e2491b2cb549',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::store()'],['../structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e',1,'cutlass::TileStoreIterator::store(Fragment const &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileStoreIterator.html#aa27a456bf12d0e44adc89a1c2ca7bc3b',1,'cutlass::TileStoreIterator::store(Fragment const &amp;fragment) const'],['../classcutlass_1_1ZipTileIterator.html#a884983cd1df81739fc971b46697b851c',1,'cutlass::ZipTileIterator::store(Fragment const &amp;fragment) const'],['../classcutlass_1_1ZipTileIterator.html#a425b4a4f2e66f3ff5960742d19d06bc2',1,'cutlass::ZipTileIterator::store(Fragment const &amp;fragment, Coord&lt; 4 &gt; const &amp;offset) const'],['../classcutlass_1_1ZipTileIterator.html#aa617653e75535fe13aafa80bc4cc9cc4',1,'cutlass::ZipTileIterator::store(Fragment const &amp;fragment, PredicateIterator pred_it) const']]],
+  ['store_3c_20double_2c_202_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20double_2c_20kstride_2c_2016_20_3e',['Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;',['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_201_2c_202_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_2016_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_204_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_208_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html',1,'cutlass']]],
+  ['store_5felement',['store_element',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d',1,'cutlass::gemm::GemmGlobalIteratorCd::store_element()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a051eb2a8637601cf9c1f52999117151b',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::store_element()'],['../structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08',1,'cutlass::TileStoreIterator::store_element()']]],
+  ['store_5fiterator',['store_iterator',['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f',1,'cutlass::gemm::GlobalLoadStream::Params::store_iterator()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d',1,'cutlass::gemm::GlobalLoadStream::store_iterator()']]],
+  ['store_5fpost_5fincrement',['store_post_increment',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a',1,'cutlass::gemm::GemmGlobalIteratorCd::store_post_increment()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a018d5be34cdbb263d7f133197b2921ca',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::store_post_increment()'],['../structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44',1,'cutlass::TileStoreIterator::store_post_increment(Fragment const &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileStoreIterator.html#a35ab2595b09912d31a60c2a4e5847c88',1,'cutlass::TileStoreIterator::store_post_increment(Fragment const &amp;fragment)'],['../classcutlass_1_1ZipTileIterator.html#a961a340f902542f3000dc80e852958f2',1,'cutlass::ZipTileIterator::store_post_increment(Fragment const &amp;fragment)'],['../classcutlass_1_1ZipTileIterator.html#a18ed76e6be1a02d0229cdf1d6528e34f',1,'cutlass::ZipTileIterator::store_post_increment(Fragment const &amp;fragment, Coord&lt; 4 &gt; const &amp;offset)'],['../classcutlass_1_1ZipTileIterator.html#a3a2cae47533c1122eb8ec404473a0d9e',1,'cutlass::ZipTileIterator::store_post_increment(Fragment const &amp;fragment, PredicateIterator pred_it)']]],
+  ['storeiterator',['StoreIterator',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2',1,'cutlass::gemm::GlobalLoadStream']]],
+  ['stream_5fa',['stream_a',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705',1,'cutlass::gemm::GlobalLoadStreamPair::Params::stream_a()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a87d507b703a0eb654265f4529ed18f66',1,'cutlass::gemm::GlobalLoadStreamPair::SharedStorage::stream_a()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127',1,'cutlass::gemm::GlobalLoadStreamPair::stream_a()'],['../structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#afb56016927b59b8d5447c3656f0b634e',1,'cutlass::gemm::SharedStreamPair::Params::stream_a()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a',1,'cutlass::gemm::SharedStreamPair::stream_a()']]],
+  ['stream_5fb',['stream_b',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258',1,'cutlass::gemm::GlobalLoadStreamPair::Params::stream_b()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a6d9444ed13ed544febe196e3e835ea16',1,'cutlass::gemm::GlobalLoadStreamPair::SharedStorage::stream_b()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9',1,'cutlass::gemm::GlobalLoadStreamPair::stream_b()'],['../structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#a4a8f9207ffb3bbcdb000af62808371f5',1,'cutlass::gemm::SharedStreamPair::Params::stream_b()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9',1,'cutlass::gemm::SharedStreamPair::stream_b()']]],
+  ['streama',['StreamA',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227',1,'cutlass::gemm::GlobalLoadStreamPair::StreamA()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4',1,'cutlass::gemm::SharedStreamPair::StreamA()']]],
+  ['streamb',['StreamB',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c',1,'cutlass::gemm::GlobalLoadStreamPair::StreamB()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529',1,'cutlass::gemm::SharedStreamPair::StreamB()']]],
+  ['streamsharedstorage',['StreamSharedStorage',['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmEpilogueTraits']]],
+  ['stride',['stride',['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a56f728be8b1a3e71f4f322e1dbfb3495',1,'cutlass::MatrixLayout::RowMajorInterleaved::stride()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dab2c5aee6958c9d99109183401f41f',1,'cutlass::MatrixLayout::ColumnMajorInterleaved::stride()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#aa3c5b8d44216fdeeee9cce5e38ce418b',1,'cutlass::MatrixLayout::ContiguousLayout::stride()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#abb88bd43e5493682d1132c550b734a36',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::stride()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a1b25b4a7061d81041a8e2a548128ca71',1,'cutlass::MatrixLayout::RowMajorBlockLinear::stride()'],['../classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c',1,'cutlass::TensorRef::stride() const'],['../classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7',1,'cutlass::TensorRef::stride(int dim) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::stride() const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af83380ffc0e5949d40d1a5039a5ddc00',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::stride(int dim) const']]],
+  ['stride_5fadvance',['stride_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7',1,'cutlass::gemm::GemmGlobalIteratorAb::stride_advance()'],['../structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11',1,'cutlass::TileLoadIterator::stride_advance()']]],
+  ['stride_5fd',['stride_d',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::stride_d()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2',1,'cutlass::TileIteratorBase::Params::stride_d()']]],
+  ['stride_5fh',['stride_h',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a497b91e93d0eb29ca54553f8de4c694f',1,'cutlass::gemm::GemmEpilogueTraits::Params::stride_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::stride_h()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623',1,'cutlass::TileIteratorBase::Params::stride_h()']]],
+  ['stride_5fw',['stride_w',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68',1,'cutlass::gemm::GemmEpilogueTraits::Params::stride_w()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d',1,'cutlass::TileIteratorBase::Params::stride_w()']]],
+  ['strides',['strides',['../structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be',1,'cutlass::TensorRefArray::strides()'],['../structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e',1,'cutlass::FragmentIterator::Strides()'],['../structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c',1,'cutlass::TileAllocation::Strides()']]],
+  ['stridevector',['StrideVector',['../structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StrideVector'],['../classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059',1,'cutlass::TensorRef::StrideVector()'],['../classcutlass_1_1TensorView.html#a625892aa9063eebf769bb2ed0cba7684',1,'cutlass::TensorView::StrideVector()']]],
+  ['stype',['SType',['../structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2',1,'cutlass::gemm::GemmDesc']]],
+  ['subview',['subview',['../classcutlass_1_1TensorView.html#ad4b3faa318699b786f94cf8735a11dbb',1,'cutlass::TensorView']]],
   ['swap',['swap',['../classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036',1,'cutlass::platform::unique_ptr::swap()'],['../namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678',1,'cutlass::platform::swap()']]],
-  ['swizzle',['swizzle',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8',1,'cutlass::gemm::IdentityBlockSwizzle']]]
+  ['swizzle',['swizzle',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8',1,'cutlass::gemm::IdentityBlockSwizzle::swizzle()'],['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b',1,'cutlass::gemm::ColumnMajorBlockSwizzle::swizzle()'],['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d',1,'cutlass::gemm::RowMajorBlockSwizzle::swizzle()']]],
+  ['swizzledirection',['swizzleDirection',['../structcutlass_1_1gemm_1_1swizzleDirection.html',1,'cutlass::gemm']]]
 ];
diff --git a/docs/search/all_12.js b/docs/search/all_12.js
index cd80c9c19..c17b85a6f 100644
--- a/docs/search/all_12.js
+++ b/docs/search/all_12.js
@@ -1,37 +1,65 @@
 var searchData=
 [
   ['tensor_5fref_2eh',['tensor_ref.h',['../tensor__ref_8h.html',1,'']]],
+  ['tensor_5fref_5fcollection_2eh',['tensor_ref_collection.h',['../tensor__ref__collection_8h.html',1,'']]],
+  ['tensor_5fstride',['tensor_stride',['../structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f',1,'cutlass::TensorRefBatchStrided']]],
   ['tensor_5fview_2eh',['tensor_view.h',['../tensor__view_8h.html',1,'']]],
-  ['tensorref',['TensorRef',['../classcutlass_1_1TensorRef.html',1,'cutlass::TensorRef&lt; Storage_, Rank_ &gt;'],['../classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478',1,'cutlass::TensorRef::TensorRef()'],['../classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8',1,'cutlass::TensorRef::TensorRef(Storage *ptr, Coord&lt; Rank &gt; stride)']]],
-  ['tensorref_3c_20t_2c_204_20_3e',['TensorRef&lt; T, 4 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
-  ['tensorref_5ft',['TensorRef_t',['../classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab',1,'cutlass::TensorView']]],
-  ['tensorview',['TensorView',['../classcutlass_1_1TensorView.html',1,'cutlass::TensorView&lt; T &gt;'],['../classcutlass_1_1TensorView.html#a22401348796d603546e44d6c196018dc',1,'cutlass::TensorView::TensorView()'],['../classcutlass_1_1TensorView.html#a80480aa986a488a106a9b0aea331c317',1,'cutlass::TensorView::TensorView(TensorRef_t const &amp;_ref, Coord_t const &amp;_size)']]],
-  ['this_5f',['This_',['../structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95',1,'cutlass::Fragment::This_()'],['../structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369',1,'cutlass::FragmentIterator::This_()'],['../structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f',1,'cutlass::FragmentConstIterator::This_()'],['../structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317',1,'cutlass::gemm::Gemm::This_()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8',1,'cutlass::gemm::GemmGlobalIteratorAb::This_()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b',1,'cutlass::gemm::GemmGlobalIteratorCd::This_()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::This_()']]],
+  ['tensorarrayref',['TensorArrayRef',['../structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109',1,'cutlass::TensorRefArray::TensorArrayRef()'],['../structcutlass_1_1TensorRefArray.html#aea35239326dcb23c3c6a18e7b3f92091',1,'cutlass::TensorRefArray::TensorArrayRef(Storage **_pointers, Index _strides[kStorageRank - 1])']]],
+  ['tensorcoord',['TensorCoord',['../classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65',1,'cutlass::TensorRef::TensorCoord()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorCoord()'],['../structcutlass_1_1TensorRefBatchStrided.html#a9d07d96c2eccba10c3a9e4bef58d4e01',1,'cutlass::TensorRefBatchStrided::TensorCoord()'],['../classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e',1,'cutlass::TensorView::TensorCoord()']]],
+  ['tensorref',['TensorRef',['../classcutlass_1_1TensorRef.html',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a',1,'cutlass::gemm::SharedLoadStream::TensorRef()'],['../structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd',1,'cutlass::TensorRefBatchStrided::TensorRef()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc',1,'cutlass::TensorRefBatchStrided::ConstIterator::TensorRef()'],['../structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75',1,'cutlass::TensorRefArray::TensorRef()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f',1,'cutlass::TensorRefArray::ConstIterator::TensorRef()'],['../classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507',1,'cutlass::TensorView::TensorRef()'],['../structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80',1,'cutlass::TileAllocation::TensorRef()'],['../structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf',1,'cutlass::ZipTileAllocation::TensorRef()'],['../structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548',1,'cutlass::TileLoadIterator::TensorRef()'],['../structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac',1,'cutlass::TileStoreIterator::TensorRef()'],['../structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7',1,'cutlass::TileLoadStream::TensorRef()'],['../structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe',1,'cutlass::TileStoreStream::TensorRef()'],['../classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c',1,'cutlass::ZipTileIterator::TensorRef()'],['../classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765',1,'cutlass::TensorRef::TensorRef(Storage *ptr=nullptr)'],['../classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135',1,'cutlass::TensorRef::TensorRef(Storage *ptr, Index ldm)'],['../classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c',1,'cutlass::TensorRef::TensorRef(Storage *ptr, StrideVector const &amp;stride)'],['../classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0',1,'cutlass::TensorRef::TensorRef(Storage *ptr, StorageCoord const &amp;stride)'],['../classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1',1,'cutlass::TensorRef::TensorRef(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa091e497277d0ba8a98c4ebf73c0cdba',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef(Storage *ptr=nullptr)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a3464537a35ef7fbfc9349e5ce2233f1c',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef(Storage *ptr, StrideVector const &amp;stride)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeacb444d31783eafe27a9e8d8cab98f8',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef(Storage *ptr, StorageCoord const &amp;stride)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af815dd66739801b10d43acc097e23636',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)']]],
+  ['tensorref_3c_20atype_20const_2c_202_20_3e',['TensorRef&lt; AType const, 2 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
+  ['tensorref_3c_20btype_20const_2c_202_20_3e',['TensorRef&lt; BType const, 2 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
+  ['tensorref_3c_20ctype_20const_2c_202_20_3e',['TensorRef&lt; CType const, 2 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
+  ['tensorref_3c_20dtype_2c_202_20_3e',['TensorRef&lt; DType, 2 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
+  ['tensorref_3c_20storage_5f_2c_20rank_5f_2c_20mapfunc_5f_2c_201_2c_20index_5f_2c_20longindex_5f_20_3e',['TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;',['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html',1,'cutlass']]],
+  ['tensorref_5ft',['TensorRef_t',['../classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606',1,'cutlass::TensorView']]],
+  ['tensorrefa',['TensorRefA',['../structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe',1,'cutlass::gemm::GemmDesc']]],
+  ['tensorrefarray',['TensorRefArray',['../structcutlass_1_1TensorRefArray.html',1,'cutlass']]],
+  ['tensorrefb',['TensorRefB',['../structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab',1,'cutlass::gemm::GemmDesc']]],
+  ['tensorrefbatchstrided',['TensorRefBatchStrided',['../structcutlass_1_1TensorRefBatchStrided.html',1,'cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;'],['../structcutlass_1_1TensorRefBatchStrided.html#aa5d7e9a4589d7dacc5d69ca3c70ecc2b',1,'cutlass::TensorRefBatchStrided::TensorRefBatchStrided()'],['../structcutlass_1_1TensorRefBatchStrided.html#abc2ddccdb742f95438b214e0a3a14620',1,'cutlass::TensorRefBatchStrided::TensorRefBatchStrided(TensorRef const &amp;ref, LongIndex _tensor_stride=0)']]],
+  ['tensorrefc',['TensorRefC',['../structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b',1,'cutlass::gemm::GemmDesc']]],
+  ['tensorrefd',['TensorRefD',['../structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052',1,'cutlass::gemm::GemmDesc']]],
+  ['tensorview',['TensorView',['../classcutlass_1_1TensorView.html',1,'cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;'],['../classcutlass_1_1TensorView.html#a36d48227f65ad482a7bded99d6a3d0c1',1,'cutlass::TensorView::TensorView()'],['../classcutlass_1_1TensorView.html#aad06edac0f43c358c5644dffb5fe9ad7',1,'cutlass::TensorView::TensorView(Base const &amp;_ref, TensorCoord const &amp;_size)'],['../classcutlass_1_1TensorView.html#a73f049694ca1ea4825b5a651852827f5',1,'cutlass::TensorView::TensorView(Storage *ptr, StrideVector const &amp;stride, TensorCoord const &amp;size)'],['../classcutlass_1_1TensorView.html#af64d4195fd6ba2cba53179e1ae678737',1,'cutlass::TensorView::TensorView(Storage *ptr, StorageCoord const &amp;stride, TensorCoord const &amp;size)']]],
+  ['this_5f',['This_',['../structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95',1,'cutlass::Fragment::This_()'],['../structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369',1,'cutlass::FragmentIterator::This_()'],['../structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f',1,'cutlass::FragmentConstIterator::This_()'],['../structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317',1,'cutlass::gemm::Gemm::This_()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8',1,'cutlass::gemm::GemmGlobalIteratorAb::This_()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b',1,'cutlass::gemm::GemmGlobalIteratorCd::This_()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989',1,'cutlass::gemm::GemmTraits::This_()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::This_()'],['../structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1',1,'cutlass::ZipFragment::This_()']]],
   ['thread_5fmultiply_5fadd_2eh',['thread_multiply_add.h',['../thread__multiply__add_8h.html',1,'']]],
-  ['thread_5foffset',['thread_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04',1,'cutlass::gemm::GemmGlobalIteratorAb::thread_offset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0',1,'cutlass::gemm::GemmGlobalIteratorCd::thread_offset()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::thread_offset()'],['../structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457',1,'cutlass::TileLoadIterator::thread_offset()'],['../structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035',1,'cutlass::TileStoreIterator::thread_offset()']]],
+  ['thread_5foffset',['thread_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04',1,'cutlass::gemm::GemmGlobalIteratorAb::thread_offset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0',1,'cutlass::gemm::GemmGlobalIteratorCd::thread_offset()'],['../structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f',1,'cutlass::TileLoadIterator::thread_offset()'],['../structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825',1,'cutlass::TileStoreIterator::thread_offset()']]],
+  ['threadblock_5foffset',['threadblock_offset',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a',1,'cutlass::gemm::GlobalLoadStream']]],
+  ['threadblock_5fswizzle_2eh',['threadblock_swizzle.h',['../threadblock__swizzle_8h.html',1,'']]],
+  ['threadblock_5ftile',['threadblock_tile',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#af8f0050e818b788402526857afc7c919',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage']]],
   ['threadblocktile',['ThreadBlockTile',['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc',1,'cutlass::gemm::GemmMultiplicandTraits']]],
-  ['threadmultiplyadd',['ThreadMultiplyAdd',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#acec155117a56c942c5e695984b0f072d',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a9b75e499f4c14369b5c86051dceeb81d',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ab271a3f11ccde4b629ddb11b78c0d555',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadMultiplyAdd()']]],
-  ['threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20threadsperwarp_5f_2c_20half_2c_20half_2c_20half_20_3e',['ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html',1,'cutlass::gemm']]],
-  ['threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20threadsperwarp_5f_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e',['ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html',1,'cutlass::gemm']]],
-  ['threadoffset',['ThreadOffset',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;::ThreadOffset'],['../structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html',1,'cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5',1,'cutlass::gemm::GemmGlobalIteratorAb::ThreadOffset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1',1,'cutlass::gemm::GemmGlobalIteratorCd::ThreadOffset()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::ThreadOffset()'],['../structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd',1,'cutlass::TileTraits::ThreadOffset()'],['../structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f',1,'cutlass::TileIteratorBase::ThreadOffset()'],['../structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d',1,'cutlass::TileLoadIterator::ThreadOffset()'],['../structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27',1,'cutlass::TileStoreIterator::ThreadOffset()'],['../structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c',1,'cutlass::TileTraitsStrideMajor::ThreadOffset()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351',1,'cutlass::TileTraitsContiguousMajor::ThreadOffset()']]],
-  ['threads',['Threads',['../structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57',1,'cutlass::gemm::ReshapeThreads::Threads()'],['../structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c',1,'cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6',1,'cutlass::gemm::GemmGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6',1,'cutlass::gemm::GemmGlobalTileCdTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50',1,'cutlass::gemm::GemmGlobalIteratorAb::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02',1,'cutlass::gemm::GemmGlobalIteratorCd::Threads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Threads()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a5fd1a9f132c7aa0f68e129553f519d1e',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Threads()']]],
-  ['threadsdelta',['ThreadsDelta',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d',1,'cutlass::gemm::GemmGlobalTileTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077',1,'cutlass::gemm::GemmGlobalTileCdTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a6eee97f03dcea1c441116e143cf58018',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a2bb0f0820e52417ff77e7a2bdb9ed434',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::ThreadsDelta()']]],
+  ['threadblocktileref',['ThreadblockTileRef',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77',1,'cutlass::gemm::GlobalLoadStream::ThreadblockTileRef()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be',1,'cutlass::gemm::GlobalLoadStreamPair::ThreadblockTileRef()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d',1,'cutlass::gemm::SharedStreamPair::ThreadblockTileRef()']]],
+  ['threadblocktilestorage',['ThreadblockTileStorage',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8',1,'cutlass::gemm::GlobalLoadStream::ThreadblockTileStorage()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158',1,'cutlass::gemm::GlobalLoadStreamPair::ThreadblockTileStorage()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee',1,'cutlass::gemm::GemmTraits::ThreadblockTileStorage()']]],
+  ['threadgemmshape',['ThreadGemmShape',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ThreadGemmShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ThreadGemmShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadGemmShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadGemmShape()']]],
+  ['threadmultiplyadd',['ThreadMultiplyAdd',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a0ab850304c3c6e73bcba321426ba93f9',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a32b234c873ffe44090a12e12d871024c',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aad8a642f46c88e407a1150ee1d42b8dd',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac087f0b397599221b74d220fcb1c7121',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadMultiplyAdd()']]],
+  ['threadmultiplyadd_3c_20threadgemmshape_5f_2c_20threadsperwarp_5f_2c_20half_2c_20half_2c_20float_20_3e',['ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html',1,'cutlass::gemm']]],
+  ['threadmultiplyadd_3c_20threadgemmshape_5f_2c_20threadsperwarp_5f_2c_20half_2c_20half_2c_20half_20_3e',['ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html',1,'cutlass::gemm']]],
+  ['threadmultiplyadd_3c_20threadgemmshape_5f_2c_20threadsperwarp_5f_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e',['ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html',1,'cutlass::gemm']]],
+  ['threadoffset',['ThreadOffset',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html',1,'cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5',1,'cutlass::gemm::GemmGlobalIteratorAb::ThreadOffset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1',1,'cutlass::gemm::GemmGlobalIteratorCd::ThreadOffset()'],['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30',1,'cutlass::gemm::IgemmGlobalIteratorAb::ThreadOffset()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::ThreadOffset()'],['../structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb',1,'cutlass::TileTraits::ThreadOffset()'],['../structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5',1,'cutlass::TileIteratorBase::ThreadOffset()'],['../structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a',1,'cutlass::TileLoadIterator::ThreadOffset()'],['../structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a',1,'cutlass::TileStoreIterator::ThreadOffset()'],['../structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c',1,'cutlass::TileTraitsStrideMajor::ThreadOffset()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351',1,'cutlass::TileTraitsContiguousMajor::ThreadOffset()']]],
+  ['threads',['Threads',['../structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57',1,'cutlass::gemm::ReshapeThreads::Threads()'],['../structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c',1,'cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30',1,'cutlass::gemm::GemmGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6',1,'cutlass::gemm::GemmGlobalTileCdTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50',1,'cutlass::gemm::GemmGlobalIteratorAb::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02',1,'cutlass::gemm::GemmGlobalIteratorCd::Threads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Threads()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f',1,'cutlass::gemm::IgemmGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Threads()']]],
+  ['threadsdelta',['ThreadsDelta',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9',1,'cutlass::gemm::GemmGlobalTileTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077',1,'cutlass::gemm::GemmGlobalTileCdTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a61907b1afa07c12de74545d2e23a4281',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a160d1ecd86de4742f550d11bc281786b',1,'cutlass::gemm::IgemmGlobalTileTraits::ThreadsDelta()']]],
   ['threadshape',['ThreadShape',['../structcutlass_1_1TileTraitsStrideMajor.html#a03567f41ce616ebb4cdb309c85820599',1,'cutlass::TileTraitsStrideMajor::ThreadShape()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a33116b67e580292d4e354ca17ecd4167',1,'cutlass::TileTraitsContiguousMajor::ThreadShape()'],['../structcutlass_1_1TileTraitsWarpRake.html#ad6619e0b5d876fafd51c78e39f2c029e',1,'cutlass::TileTraitsWarpRake::ThreadShape()']]],
-  ['threadsperwarp',['ThreadsPerWarp',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f',1,'cutlass::gemm::GemmSharedLoadTileATraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa784f29ff453c1656fdea8270454fa55',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a5bc98fd196c1f1e4e3f1bfc621df4f50',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadsPerWarp()']]],
+  ['threadsperwarp',['ThreadsPerWarp',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f',1,'cutlass::gemm::GemmSharedLoadTileATraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadsPerWarp()']]],
   ['threadsstrides',['ThreadsStrides',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadsStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadsStrides()']]],
-  ['tile',['Tile',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758',1,'cutlass::gemm::GemmGlobalTileTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc',1,'cutlass::gemm::GemmSharedLoadTileATraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Tile()'],['../structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5',1,'cutlass::ReshapeTile::Tile()'],['../structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06',1,'cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;::Tile()'],['../structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831',1,'cutlass::TileTraits::Tile()'],['../structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c',1,'cutlass::TileIteratorBase::Tile()'],['../structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10',1,'cutlass::TileLoadIterator::Tile()'],['../structcutlass_1_1TileStoreIterator.html#a8a87c8ef986e110a01a9226012594a61',1,'cutlass::TileStoreIterator::Tile()'],['../structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac',1,'cutlass::TileTraitsStrideMajor::Tile()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763',1,'cutlass::TileTraitsContiguousMajor::Tile()'],['../structcutlass_1_1TileTraitsWarpRake.html#adcd658d9daf286368a9d51c8c1647f89',1,'cutlass::TileTraitsWarpRake::Tile()'],['../structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b',1,'cutlass::TileTraitsStandard::Tile()']]],
+  ['tile',['Tile',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec',1,'cutlass::gemm::GlobalLoadStream::Tile()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19',1,'cutlass::gemm::GemmGlobalTileTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111',1,'cutlass::gemm::GemmGlobalIteratorAb::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc',1,'cutlass::gemm::GemmSharedLoadTileATraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Tile()'],['../structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5',1,'cutlass::ReshapeTile::Tile()'],['../structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06',1,'cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;::Tile()'],['../structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0',1,'cutlass::TileTraits::Tile()'],['../structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4',1,'cutlass::TileIteratorBase::Tile()'],['../structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539',1,'cutlass::TileLoadIterator::Tile()'],['../structcutlass_1_1TileStoreIterator.html#ad18ee6f519b03e1dbf711339b63e16d6',1,'cutlass::TileStoreIterator::Tile()'],['../structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac',1,'cutlass::TileTraitsStrideMajor::Tile()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763',1,'cutlass::TileTraitsContiguousMajor::Tile()'],['../structcutlass_1_1TileTraitsWarpRake.html#adcd658d9daf286368a9d51c8c1647f89',1,'cutlass::TileTraitsWarpRake::Tile()'],['../structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b',1,'cutlass::TileTraitsStandard::Tile()']]],
+  ['tile_5fallocation_2eh',['tile_allocation.h',['../tile__allocation_8h.html',1,'']]],
+  ['tile_5fcoord_2eh',['tile_coord.h',['../tile__coord_8h.html',1,'']]],
   ['tile_5fiterator_2eh',['tile_iterator.h',['../tile__iterator_8h.html',1,'']]],
   ['tile_20load_20iterator_20concept',['Tile Load Iterator Concept',['../group__tile__load__iterator__concept.html',1,'']]],
   ['tile_20store_20iterator_20concept',['Tile Store Iterator Concept',['../group__tile__store__iterator__concept.html',1,'']]],
+  ['tile_5fstream_2eh',['tile_stream.h',['../tile__stream_8h.html',1,'']]],
   ['tile_20traits_20concept',['Tile Traits Concept',['../group__tile__traits__concept.html',1,'']]],
   ['tile_5ftraits_5fstandard_2eh',['tile_traits_standard.h',['../tile__traits__standard_8h.html',1,'']]],
+  ['tileallocation',['TileAllocation',['../structcutlass_1_1TileAllocation.html',1,'cutlass']]],
+  ['tilecoord',['TileCoord',['../structcutlass_1_1TileCoord.html',1,'cutlass::TileCoord&lt; Index_ &gt;'],['../structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95',1,'cutlass::TileCoord::TileCoord()'],['../structcutlass_1_1TileCoord.html#ac760795433c0f0ccc5c44fb58626f51d',1,'cutlass::TileCoord::TileCoord(Coord&lt; 3, Index &gt; const &amp;coord)'],['../structcutlass_1_1TileCoord.html#a752dcc11f1a018de692e5846a80fe185',1,'cutlass::TileCoord::TileCoord(Coord&lt; 4, Index &gt; const &amp;coord)'],['../structcutlass_1_1TileCoord.html#a2ff6ac0ad18cff304ee7f79597fdc274',1,'cutlass::TileCoord::TileCoord(Index coord[4])'],['../structcutlass_1_1TileCoord.html#a28ee00699941f879cfa92327c038fca6',1,'cutlass::TileCoord::TileCoord(Index d, Index h, Index w, Index c)']]],
   ['tiledthreadoffset',['TiledThreadOffset',['../structcutlass_1_1TiledThreadOffset.html',1,'cutlass']]],
   ['tileiteratorbase',['TileIteratorBase',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
-  ['tileiteratorbase_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20advance_5f_2c_20memoryspace_2c_20index_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20iteratorfragment_3a_3akscalar_2c_20shape_3c_200_2c_200_2c_200_2c_200_20_3e_20_3e',['TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
+  ['tileiteratorbase_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20advance_5f_2c_20memoryspace_2c_20index_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20fragmentelementtype_3a_3akscalar_2c_20shape_3c_200_2c_200_2c_200_2c_200_20_3e_20_3e',['TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
   ['tileiteratorbase_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20iteratoradvance_3a_3akh_2c_20memoryspace_3a_3akglobal_2c_20index_5f_20_3e',['TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
-  ['tileloaditerator',['TileLoadIterator',['../structcutlass_1_1TileLoadIterator.html',1,'cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;'],['../structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e',1,'cutlass::TileLoadIterator::TileLoadIterator()'],['../structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23',1,'cutlass::TileLoadIterator::TileLoadIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6',1,'cutlass::TileLoadIterator::TileLoadIterator(Params const &amp;, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())']]],
+  ['tileloaditerator',['TileLoadIterator',['../structcutlass_1_1TileLoadIterator.html',1,'cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;'],['../structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e',1,'cutlass::TileLoadIterator::TileLoadIterator()'],['../structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322',1,'cutlass::TileLoadIterator::TileLoadIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30',1,'cutlass::TileLoadIterator::TileLoadIterator(Params const &amp;, Scalar const *ptr, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())']]],
   ['tileloaditerator_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20tiletraits_5f_3a_3amultiplicandtraits_3a_3akkstrided_20_3f_20iteratoradvance_3a_3akh_20_3aiteratoradvance_3a_3akw_2c_20memoryspace_3a_3akglobal_2c_20index_5f_20_3e',['TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;',['../structcutlass_1_1TileLoadIterator.html',1,'cutlass']]],
-  ['tilestoreiterator',['TileStoreIterator',['../structcutlass_1_1TileStoreIterator.html',1,'cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;'],['../structcutlass_1_1TileStoreIterator.html#aac4d49854d63f632627b6974f9b59dbb',1,'cutlass::TileStoreIterator::TileStoreIterator()'],['../structcutlass_1_1TileStoreIterator.html#a037ccd942359e6bc8640a240b13cd330',1,'cutlass::TileStoreIterator::TileStoreIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1TileStoreIterator.html#a4f89c5182659de94605300e15c3651b2',1,'cutlass::TileStoreIterator::TileStoreIterator(Params const &amp;, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())']]],
+  ['tileloadstream',['TileLoadStream',['../structcutlass_1_1TileLoadStream.html',1,'cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;'],['../structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3',1,'cutlass::TileLoadStream::TileLoadStream(Params const &amp;_params, TensorRef const &amp;_ref)'],['../structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7',1,'cutlass::TileLoadStream::TileLoadStream(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))']]],
+  ['tilestoreiterator',['TileStoreIterator',['../structcutlass_1_1TileStoreIterator.html',1,'cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;'],['../structcutlass_1_1TileStoreIterator.html#a9f4501c6e8ba0f4511919c1b63c14e69',1,'cutlass::TileStoreIterator::TileStoreIterator()'],['../structcutlass_1_1TileStoreIterator.html#aa563bb10f8e58d97e81959556923e210',1,'cutlass::TileStoreIterator::TileStoreIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1TileStoreIterator.html#a2b58a21331cf3255f5d3938a39babf20',1,'cutlass::TileStoreIterator::TileStoreIterator(Params const &amp;, Scalar *ptr, ThreadOffset thread_offset_func=ThreadOffset())']]],
+  ['tilestorestream',['TileStoreStream',['../structcutlass_1_1TileStoreStream.html',1,'cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;'],['../structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b',1,'cutlass::TileStoreStream::TileStoreStream(Params const &amp;_params, TensorRef const &amp;_ref)'],['../structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084',1,'cutlass::TileStoreStream::TileStoreStream(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))']]],
   ['tiletraits',['TileTraits',['../structcutlass_1_1TileTraits.html',1,'cutlass']]],
   ['tiletraitscontiguousmajor',['TileTraitsContiguousMajor',['../structcutlass_1_1TileTraitsContiguousMajor.html',1,'cutlass']]],
   ['tiletraitsstandard',['TileTraitsStandard',['../structcutlass_1_1TileTraitsStandard.html',1,'cutlass']]],
@@ -40,15 +68,14 @@ var searchData=
   ['tilewithoutskew',['TileWithoutSkew',['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a050cf5964a2d3683491bc4313ead5450',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::TileWithoutSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213',1,'cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a1f35981a6d661635dfbcf7c7a76056a2',1,'cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew()']]],
   ['tilewithoutskew_5f',['TileWithoutSkew_',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a93ae99460695718babaef6d1ef597e38',1,'cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew_()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a3d8be9ddea1cab53d1b4b3d508f9eab8',1,'cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew_()']]],
   ['tilewithskew',['TileWithSkew',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a72e0214f86cf8b3711d006dcd69d7a17',1,'cutlass::gemm::GemmSharedLoadTileATraits::TileWithSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a69c7ec2a779718556e6d9119588e791c',1,'cutlass::gemm::GemmSharedLoadTileBTraits::TileWithSkew()']]],
-  ['traits',['Traits',['../structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff',1,'cutlass::gemm::Gemm::Traits()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b',1,'cutlass::gemm::GemmEpilogue::Traits()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Traits()'],['../structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696',1,'cutlass::TileIteratorBase::Traits()'],['../structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a',1,'cutlass::TileLoadIterator::Traits()'],['../structcutlass_1_1TileStoreIterator.html#a6f50a8aec2d7045e9057b93df08172a8',1,'cutlass::TileStoreIterator::Traits()']]],
-  ['transform',['transform',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#aa9fe67c947bf461ba3e3ca48daa34815',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3',1,'cutlass::Copy::transform(Fragment_ const &amp;src, Fragment_ &amp;dst)'],['../structcutlass_1_1Copy.html#a171f9a44c05b6fb432b0339979de4eb2',1,'cutlass::Copy::transform(InputFragment_ const &amp;src, int offset, Fragment_ &amp;dst)'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26',1,'cutlass::gemm::HgemmSwizzle::transform()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b',1,'cutlass::gemm::IgemmFloatToInt8Converter::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd',1,'cutlass::gemm::IgemmFloatToInt8Converter::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d',1,'cutlass::gemm::IgemmInt8ToFloatConverter::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3',1,'cutlass::gemm::IgemmInt8ToFloatConverter::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811',1,'cutlass::gemm::IgemmSwizzle::transform()']]],
-  ['transformed_5fa',['transformed_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a883b28ca237b1ec076856232cfee0c6f',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['transformed_5fb',['transformed_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a9369a5f819d2a42997491e0df96f47ef',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['transformed_5ffragment',['transformed_fragment',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf',1,'cutlass::gemm::GlobalLoadStreamBase']]],
-  ['transformedfragment',['TransformedFragment',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108',1,'cutlass::gemm::GlobalLoadStreamBase::TransformedFragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4',1,'cutlass::gemm::SharedLoadStream::TransformedFragment()']]],
-  ['transformer',['transformer',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9',1,'cutlass::gemm::GlobalLoadStreamBase::transformer()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7',1,'cutlass::gemm::SharedLoadStream::transformer()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe',1,'cutlass::gemm::GlobalLoadStreamBase::Transformer()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904',1,'cutlass::gemm::SharedLoadStream::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296',1,'cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b',1,'cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7',1,'cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85',1,'cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html#a98aefa95117dbfdf2e577890318a6c13',1,'cutlass::gemm::IgemmGlobalStoreTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html#a52ecdfd8b94d8d7f4881048e11a33aba',1,'cutlass::gemm::IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html#ad3190650741cef20c1aca919eddd9d72',1,'cutlass::gemm::IgemmGlobalLoadTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html#a49c249026be24ec8a66f5eda99cb855c',1,'cutlass::gemm::IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html#a9edd08d595327a8cc3b8da50622b3bd2',1,'cutlass::gemm::IgemmSharedStoreTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197',1,'cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f',1,'cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49',1,'cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a',1,'cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()']]],
+  ['traits',['Traits',['../structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff',1,'cutlass::gemm::Gemm::Traits()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b',1,'cutlass::gemm::GemmEpilogue::Traits()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Traits()'],['../structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7',1,'cutlass::TileIteratorBase::Traits()'],['../structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948',1,'cutlass::TileLoadIterator::Traits()'],['../structcutlass_1_1TileStoreIterator.html#a5016bd7b24938026a2879ec0054eb3b6',1,'cutlass::TileStoreIterator::Traits()']]],
+  ['transform',['transform',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#aa9fe67c947bf461ba3e3ca48daa34815',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3',1,'cutlass::Copy::transform(Fragment_ const &amp;src, Fragment_ &amp;dst)'],['../structcutlass_1_1Copy.html#a171f9a44c05b6fb432b0339979de4eb2',1,'cutlass::Copy::transform(InputFragment_ const &amp;src, int offset, Fragment_ &amp;dst)'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26',1,'cutlass::gemm::HgemmSwizzle::transform()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b',1,'cutlass::gemm::IgemmFloatToInt8Converter::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd',1,'cutlass::gemm::IgemmFloatToInt8Converter::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d',1,'cutlass::gemm::IgemmInt8ToFloatConverter::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3',1,'cutlass::gemm::IgemmInt8ToFloatConverter::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811',1,'cutlass::gemm::IgemmSwizzle::transform()'],['../structcutlass_1_1ZipConvert.html#a7e6398ad8ecd8757744a42f3ab8ef955',1,'cutlass::ZipConvert::transform()']]],
+  ['transformed',['transformed',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88',1,'cutlass::gemm::SharedLoadStream']]],
+  ['transformed_5ffragment',['transformed_fragment',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1',1,'cutlass::gemm::GlobalLoadStream::transformed_fragment()'],['../structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01',1,'cutlass::TileLoadStream::transformed_fragment()'],['../structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48',1,'cutlass::TileStoreStream::transformed_fragment()']]],
+  ['transformedfragment',['TransformedFragment',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9',1,'cutlass::gemm::GlobalLoadStream::TransformedFragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4',1,'cutlass::gemm::SharedLoadStream::TransformedFragment()'],['../structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1',1,'cutlass::TileLoadStream::TransformedFragment()'],['../structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993',1,'cutlass::TileStoreStream::TransformedFragment()'],['../structcutlass_1_1PredicatedTileLoadStream.html#adeb35451885c1c4fb930ae8c914ceb20',1,'cutlass::PredicatedTileLoadStream::TransformedFragment()'],['../structcutlass_1_1PredicatedTileStoreStream.html#af349831b19bb91d414a83c67d14f6927',1,'cutlass::PredicatedTileStoreStream::TransformedFragment()']]],
+  ['transformer',['transformer',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4',1,'cutlass::gemm::GlobalLoadStream::transformer()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7',1,'cutlass::gemm::SharedLoadStream::transformer()'],['../structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552',1,'cutlass::TileLoadStream::transformer()'],['../structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934',1,'cutlass::TileStoreStream::transformer()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02',1,'cutlass::gemm::GlobalLoadStream::Transformer()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904',1,'cutlass::gemm::SharedLoadStream::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296',1,'cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b',1,'cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7',1,'cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85',1,'cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html#a98aefa95117dbfdf2e577890318a6c13',1,'cutlass::gemm::IgemmGlobalStoreTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html#a52ecdfd8b94d8d7f4881048e11a33aba',1,'cutlass::gemm::IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html#ad3190650741cef20c1aca919eddd9d72',1,'cutlass::gemm::IgemmGlobalLoadTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html#a49c249026be24ec8a66f5eda99cb855c',1,'cutlass::gemm::IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html#a9edd08d595327a8cc3b8da50622b3bd2',1,'cutlass::gemm::IgemmSharedStoreTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197',1,'cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f',1,'cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49',1,'cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a',1,'cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7',1,'cutlass::TileLoadStream::Transformer()'],['../structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e',1,'cutlass::TileStoreStream::Transformer()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a9f79fd30231825b38694bf7c1d12ec2a',1,'cutlass::PredicatedTileLoadStream::Transformer()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a0f91f328ed2b6bd65ef4eeafe18f9afd',1,'cutlass::PredicatedTileStoreStream::Transformer()']]],
   ['trivialiterator',['TrivialIterator',['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html',1,'cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::TrivialIterator'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a6cb3664b5cba4280b7055a65ddad7850',1,'cutlass::PredicateVector::TrivialIterator::TrivialIterator()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14',1,'cutlass::PredicateVector::TrivialIterator::TrivialIterator(Iterator const &amp;it)'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721',1,'cutlass::PredicateVector::TrivialIterator::TrivialIterator(PredicateVector const &amp;_vec)']]],
   ['trivialpredicatetileadapter',['TrivialPredicateTileAdapter',['../structcutlass_1_1TrivialPredicateTileAdapter.html',1,'cutlass::TrivialPredicateTileAdapter'],['../structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7',1,'cutlass::TrivialPredicateTileAdapter::TrivialPredicateTileAdapter()']]],
   ['true_5ftype',['true_type',['../namespacecutlass_1_1platform.html#a0eddc4a3921e137f31fd8014be96e807',1,'cutlass::platform']]],
-  ['type',['Type',['../structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06',1,'cutlass::StorageType::Type()'],['../structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807',1,'cutlass::StorageType&lt; 4 &gt;::Type()'],['../structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4',1,'cutlass::StorageType&lt; 2 &gt;::Type()'],['../structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4',1,'cutlass::StorageType&lt; 1 &gt;::Type()'],['../structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e',1,'cutlass::Vectorize::Type()'],['../structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html#a79f147933e3f520145aee94ae18da3c5',1,'cutlass::Vectorize&lt; Element_, 1 &gt;::Type()'],['../structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52',1,'cutlass::platform::integral_constant::type()'],['../structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99',1,'cutlass::platform::enable_if::type()'],['../structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11',1,'cutlass::platform::conditional::type()'],['../structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644',1,'cutlass::platform::conditional&lt; false, T, F &gt;::type()'],['../structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085',1,'cutlass::platform::remove_const::type()'],['../structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3',1,'cutlass::platform::remove_const&lt; const T &gt;::type()'],['../structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1',1,'cutlass::platform::remove_volatile::type()'],['../structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3',1,'cutlass::platform::remove_volatile&lt; volatile T &gt;::type()'],['../structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08',1,'cutlass::platform::remove_cv::type()'],['../structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1',1,'cutlass::platform::aligned_storage::type()']]]
+  ['type',['Type',['../structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b',1,'cutlass::StorageType::Type()'],['../structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807',1,'cutlass::StorageType&lt; 4 &gt;::Type()'],['../structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4',1,'cutlass::StorageType&lt; 2 &gt;::Type()'],['../structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4',1,'cutlass::StorageType&lt; 1 &gt;::Type()'],['../structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e',1,'cutlass::Vectorize::Type()'],['../structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186',1,'cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;::Type()'],['../structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06',1,'cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;::Type()'],['../structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca',1,'cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;::Type()'],['../structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52',1,'cutlass::platform::integral_constant::type()'],['../structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99',1,'cutlass::platform::enable_if::type()'],['../structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11',1,'cutlass::platform::conditional::type()'],['../structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644',1,'cutlass::platform::conditional&lt; false, T, F &gt;::type()'],['../structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085',1,'cutlass::platform::remove_const::type()'],['../structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3',1,'cutlass::platform::remove_const&lt; const T &gt;::type()'],['../structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1',1,'cutlass::platform::remove_volatile::type()'],['../structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3',1,'cutlass::platform::remove_volatile&lt; volatile T &gt;::type()'],['../structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08',1,'cutlass::platform::remove_cv::type()'],['../structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1',1,'cutlass::platform::aligned_storage::type()']]]
 ];
diff --git a/docs/search/all_13.js b/docs/search/all_13.js
index e175495c8..084d5b67f 100644
--- a/docs/search/all_13.js
+++ b/docs/search/all_13.js
@@ -1,4 +1,5 @@
 var searchData=
 [
+  ['uint4_5ft',['uint4_t',['../structcutlass_1_1uint4__t.html',1,'cutlass']]],
   ['unique_5fptr',['unique_ptr',['../classcutlass_1_1platform_1_1unique__ptr.html',1,'cutlass::platform::unique_ptr&lt; T, Deleter &gt;'],['../classcutlass_1_1platform_1_1unique__ptr.html#aa8a370bc7e4c2d99eb85e7fea27b3179',1,'cutlass::platform::unique_ptr::unique_ptr()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a14c8bf5a5deefe4a6602ccd5c5af364c',1,'cutlass::platform::unique_ptr::unique_ptr(pointer p)']]]
 ];
diff --git a/docs/search/all_14.js b/docs/search/all_14.js
index 267126dcc..0b95a13df 100644
--- a/docs/search/all_14.js
+++ b/docs/search/all_14.js
@@ -1,14 +1,21 @@
 var searchData=
 [
   ['val',['val',['../structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4',1,'cutlass::platform::alignment_of::pad']]],
-  ['valid',['valid',['../structcutlass_1_1FragmentIterator.html#ab18f8ea676b45831f939715212167a99',1,'cutlass::FragmentIterator::valid()'],['../structcutlass_1_1FragmentConstIterator.html#a01571b2fc566793fd50a10fa82441951',1,'cutlass::FragmentConstIterator::valid()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ac4d2c293f9312b673ea29bf79b2882fd',1,'cutlass::gemm::GemmGlobalIteratorAb::valid()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6594acc213fc8d4289c6c73631f60120',1,'cutlass::gemm::GemmGlobalIteratorCd::valid()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a468f8f503777e4a2b0089ee2bd6c471a',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::valid()'],['../structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770',1,'cutlass::TileIteratorBase::valid()']]],
-  ['value',['value',['../structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d',1,'cutlass::log2_down::value()'],['../structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html#ad7d3c2329ab708bd4af36ffaee8509cba282c4c5d8f66dc49544f34071f148b1f',1,'cutlass::log2_down&lt; N, 1, Count &gt;::value()'],['../structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6',1,'cutlass::log2_up::value()'],['../structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html#ab001737f02df0a2c514334a1bfa6f1f9a6b6af5b6bf14ee5d3e3f1442e7f75117',1,'cutlass::log2_up&lt; N, 1, Count &gt;::value()'],['../structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964',1,'cutlass::sqrt_est::value()'],['../structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc',1,'cutlass::divide_assert::value()'],['../structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9',1,'cutlass::platform::integral_constant::value()'],['../structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff',1,'cutlass::platform::is_base_of_helper::value()'],['../structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83',1,'cutlass::platform::alignment_of::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html#a6005c446eb41749276e0114b82abd990a5b0129d0f9bb45f1c56506efbbb22b6f',1,'cutlass::platform::alignment_of&lt; int4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html#ac55e0c5a0bc4c95981744e55ee7580cea807729922944eede573430b20ad4b322',1,'cutlass::platform::alignment_of&lt; uint4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html#ac9e709c32271b14b35c9607c64835a95a6a6ee3f24f4d123fc7c138fe5b776f2e',1,'cutlass::platform::alignment_of&lt; float4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html#ad58512f76f0b9b000d48f1ff869a0547a3d020dd8ba5c735a60d7c2c897e158f5',1,'cutlass::platform::alignment_of&lt; long4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html#adc0eec628649de183fe984bb46898830a8152a79c27d055dc3d0b8d662c0bc96a',1,'cutlass::platform::alignment_of&lt; ulong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html#aadf6522691db02f1aab22c22716f0793a940fa73dc4f0a49b78e4e0cefaf4775d',1,'cutlass::platform::alignment_of&lt; longlong2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html#a511f088278b3de04feb55ab60bdc5a09a58b5cc7be52956c43c2966af5887db80',1,'cutlass::platform::alignment_of&lt; ulonglong2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html#a5fb114d264023728cca5364401bd6929a7b89d57c8009e094f69ff57e196d8318',1,'cutlass::platform::alignment_of&lt; double2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html#a666c4fd30155873e3499f5cdc11782daafc1a7c2bb5e6483d42d380a2b4fd9561',1,'cutlass::platform::alignment_of&lt; longlong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html#a2568c1ab218cab6505bd20e3c2c420ffa54f6e1afec0ed30b18ab79fd6faf81b5',1,'cutlass::platform::alignment_of&lt; ulonglong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html#a024eaf40a8f3e8bd38b416868e0c68bca5a60b16666306472e92ad1320473ba85',1,'cutlass::platform::alignment_of&lt; double4 &gt;::value()']]],
-  ['value_5ftype',['value_type',['../structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd',1,'cutlass::platform::integral_constant']]],
-  ['vector',['Vector',['../unioncutlass_1_1Vector.html',1,'cutlass::Vector&lt; Scalar_, kLanes_ &gt;'],['../structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2',1,'cutlass::VectorTraits::Vector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Vector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Vector()']]],
+  ['valid',['valid',['../structcutlass_1_1FragmentIterator.html#a8608dd815ed4906d8c82c41a10df23e2',1,'cutlass::FragmentIterator::valid()'],['../structcutlass_1_1FragmentConstIterator.html#ac4d601998a84a3eac23e3b7a7c8a935b',1,'cutlass::FragmentConstIterator::valid()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0',1,'cutlass::gemm::GemmGlobalIteratorAb::valid()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0',1,'cutlass::gemm::GemmGlobalIteratorCd::valid()'],['../structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973',1,'cutlass::TileIteratorBase::valid()']]],
+  ['value',['value',['../structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd',1,'cutlass::ScalarIO::value()'],['../structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d',1,'cutlass::log2_down::value()'],['../structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html#ad7d3c2329ab708bd4af36ffaee8509cba282c4c5d8f66dc49544f34071f148b1f',1,'cutlass::log2_down&lt; N, 1, Count &gt;::value()'],['../structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6',1,'cutlass::log2_up::value()'],['../structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html#ab001737f02df0a2c514334a1bfa6f1f9a6b6af5b6bf14ee5d3e3f1442e7f75117',1,'cutlass::log2_up&lt; N, 1, Count &gt;::value()'],['../structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964',1,'cutlass::sqrt_est::value()'],['../structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc',1,'cutlass::divide_assert::value()'],['../structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9',1,'cutlass::platform::integral_constant::value()'],['../structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff',1,'cutlass::platform::is_base_of_helper::value()'],['../structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83',1,'cutlass::platform::alignment_of::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html#a6005c446eb41749276e0114b82abd990a5b0129d0f9bb45f1c56506efbbb22b6f',1,'cutlass::platform::alignment_of&lt; int4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html#ac55e0c5a0bc4c95981744e55ee7580cea807729922944eede573430b20ad4b322',1,'cutlass::platform::alignment_of&lt; uint4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html#ac9e709c32271b14b35c9607c64835a95a6a6ee3f24f4d123fc7c138fe5b776f2e',1,'cutlass::platform::alignment_of&lt; float4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html#ad58512f76f0b9b000d48f1ff869a0547a3d020dd8ba5c735a60d7c2c897e158f5',1,'cutlass::platform::alignment_of&lt; long4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html#adc0eec628649de183fe984bb46898830a8152a79c27d055dc3d0b8d662c0bc96a',1,'cutlass::platform::alignment_of&lt; ulong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html#aadf6522691db02f1aab22c22716f0793a940fa73dc4f0a49b78e4e0cefaf4775d',1,'cutlass::platform::alignment_of&lt; longlong2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html#a511f088278b3de04feb55ab60bdc5a09a58b5cc7be52956c43c2966af5887db80',1,'cutlass::platform::alignment_of&lt; ulonglong2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html#a5fb114d264023728cca5364401bd6929a7b89d57c8009e094f69ff57e196d8318',1,'cutlass::platform::alignment_of&lt; double2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html#a666c4fd30155873e3499f5cdc11782daafc1a7c2bb5e6483d42d380a2b4fd9561',1,'cutlass::platform::alignment_of&lt; longlong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html#a2568c1ab218cab6505bd20e3c2c420ffa54f6e1afec0ed30b18ab79fd6faf81b5',1,'cutlass::platform::alignment_of&lt; ulonglong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html#a024eaf40a8f3e8bd38b416868e0c68bca5a60b16666306472e92ad1320473ba85',1,'cutlass::platform::alignment_of&lt; double4 &gt;::value()']]],
+  ['value_5ftype',['value_type',['../classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6',1,'cutlass::platform::complex::value_type()'],['../structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd',1,'cutlass::platform::integral_constant::value_type()']]],
+  ['vector',['Vector',['../unioncutlass_1_1Vector.html',1,'cutlass::Vector&lt; Scalar_, kLanes_ &gt;'],['../structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2',1,'cutlass::VectorTraits::Vector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Vector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Vector()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1310cf2e92e260cf55cfda1cb2cb7280',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::Vector()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a50ae62579267952a648d4b6a6be3c663',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::Vector(uint32_t value)'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af166f710ebbfdff8a62453eee454c1d5',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::Vector()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a5feb070268f85bd73c3095eaf2d0e2bb',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::Vector(uint32_t value)'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a48e193a0b636934ea553c6e60ffef563',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::Vector()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a023d6ae1bf06d678f8cb5652eca1bf79',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::Vector(uint32_t value)']]],
   ['vector_2eh',['vector.h',['../vector_8h.html',1,'']]],
+  ['vector_3c_20bin1_5ft_2c_20klanes_5f_20_3e',['Vector&lt; bin1_t, kLanes_ &gt;',['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vector_3c_20half_2c_201_20_3e',['Vector&lt; half, 1 &gt;',['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html',1,'cutlass']]],
   ['vector_3c_20half_2c_20klanes_5f_20_3e',['Vector&lt; half, kLanes_ &gt;',['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vector_3c_20int4_5ft_2c_20klanes_5f_20_3e',['Vector&lt; int4_t, kLanes_ &gt;',['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vector_3c_20uint4_5ft_2c_20klanes_5f_20_3e',['Vector&lt; uint4_t, kLanes_ &gt;',['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html',1,'cutlass']]],
   ['vectorize',['Vectorize',['../structcutlass_1_1Vectorize.html',1,'cutlass']]],
-  ['vectorize_3c_20element_5f_2c_201_20_3e',['Vectorize&lt; Element_, 1 &gt;',['../structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html',1,'cutlass']]],
+  ['vectorize_3c_20vector_3c_20bin1_5ft_2c_2032_20_3e_2c_20klanes_5f_20_3e',['Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;',['../structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vectorize_3c_20vector_3c_20int4_5ft_2c_208_20_3e_2c_20klanes_5f_20_3e',['Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;',['../structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vectorize_3c_20vector_3c_20uint4_5ft_2c_208_20_3e_2c_20klanes_5f_20_3e',['Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;',['../structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vectorizedtile',['VectorizedTile',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac',1,'cutlass::gemm::GemmGlobalTileTraits']]],
   ['vectortraits',['VectorTraits',['../structcutlass_1_1VectorTraits.html',1,'cutlass']]],
   ['vectortraits_3c_20vector_3c_20t_2c_20lanes_20_3e_20_3e',['VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;',['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html',1,'cutlass']]],
   ['vectortraits_3c_20vector_3c_20t_2c_20lanes_20_3e_20const_20_3e',['VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;',['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html',1,'cutlass']]]
diff --git a/docs/search/all_15.js b/docs/search/all_15.js
index ddd79cabe..21319e6be 100644
--- a/docs/search/all_15.js
+++ b/docs/search/all_15.js
@@ -1,12 +1,13 @@
 var searchData=
 [
-  ['warps',['Warps',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4',1,'cutlass::gemm::GemmSharedLoadTileATraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd',1,'cutlass::gemm::GemmConfig::Warps()']]],
+  ['w',['w',['../structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613',1,'cutlass::TileCoord::w() const'],['../structcutlass_1_1TileCoord.html#a8f83026751c83f57c1854c8544e75bd0',1,'cutlass::TileCoord::w()']]],
+  ['warps',['Warps',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3',1,'cutlass::gemm::GemmConfig::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4',1,'cutlass::gemm::GemmSharedLoadTileATraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Warps()']]],
   ['wmma_5fgemm_5fepilogue_5ftraits_2eh',['wmma_gemm_epilogue_traits.h',['../wmma__gemm__epilogue__traits_8h.html',1,'']]],
   ['wmma_5fgemm_5fglobal_5ftile_2eh',['wmma_gemm_global_tile.h',['../wmma__gemm__global__tile_8h.html',1,'']]],
   ['wmma_5fgemm_5fmultiply_5fadd_2eh',['wmma_gemm_multiply_add.h',['../wmma__gemm__multiply__add_8h.html',1,'']]],
   ['wmma_5fgemm_5fshared_5ftile_2eh',['wmma_gemm_shared_tile.h',['../wmma__gemm__shared__tile_8h.html',1,'']]],
   ['wmma_5fgemm_5ftraits_2eh',['wmma_gemm_traits.h',['../wmma__gemm__traits_8h.html',1,'']]],
   ['wmma_5fmatrix_2eh',['wmma_matrix.h',['../wmma__matrix_8h.html',1,'']]],
-  ['wmmagemmglobaliteratorcd',['WmmaGemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a505f124fa3f47c6d57b7275e81be6dd3',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::WmmaGemmGlobalIteratorCd()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::WmmaGemmGlobalIteratorCd(Params const &amp;params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int const pointer_offset=0, int const pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())']]],
+  ['wmmagemmglobaliteratorcd',['WmmaGemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::WmmaGemmGlobalIteratorCd()']]],
   ['wmmagemmglobaliteratorcdtraits',['WmmaGemmGlobalIteratorCdTraits',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html',1,'cutlass::gemm']]]
 ];
diff --git a/docs/search/all_17.js b/docs/search/all_17.js
index 10f55890b..ac707a2d9 100644
--- a/docs/search/all_17.js
+++ b/docs/search/all_17.js
@@ -1,4 +1,11 @@
 var searchData=
 [
-  ['_7eunique_5fptr',['~unique_ptr',['../classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf',1,'cutlass::platform::unique_ptr']]]
+  ['zip_5ffragment_2eh',['zip_fragment.h',['../zip__fragment_8h.html',1,'']]],
+  ['zip_5ftensor_5fref_2eh',['zip_tensor_ref.h',['../zip__tensor__ref_8h.html',1,'']]],
+  ['zip_5ftile_5fiterator_2eh',['zip_tile_iterator.h',['../zip__tile__iterator_8h.html',1,'']]],
+  ['zipconvert',['ZipConvert',['../structcutlass_1_1ZipConvert.html',1,'cutlass::ZipConvert&lt; First_, Second_ &gt;'],['../structcutlass_1_1ZipConvert.html#a7aa56d3ea300ebc58493c4d66339fff5',1,'cutlass::ZipConvert::ZipConvert()'],['../structcutlass_1_1ZipConvert.html#a3322c88b418c365423480a481e29df29',1,'cutlass::ZipConvert::ZipConvert(First const &amp;_first, Second const &amp;_second)']]],
+  ['zipfragment',['ZipFragment',['../structcutlass_1_1ZipFragment.html',1,'cutlass::ZipFragment&lt; First_, Second_ &gt;'],['../structcutlass_1_1ZipFragment.html#aeb654423884324b14130a8fa8bc1ab83',1,'cutlass::ZipFragment::ZipFragment()'],['../structcutlass_1_1ZipFragment.html#a520318d060123c5870c4153b99cf0427',1,'cutlass::ZipFragment::ZipFragment(First const &amp;_first, Second const &amp;_second)']]],
+  ['ziptensorref',['ZipTensorRef',['../structcutlass_1_1ZipTensorRef.html',1,'cutlass::ZipTensorRef&lt; First_, Second_ &gt;'],['../structcutlass_1_1ZipTensorRef.html#a9b4e616da5b0a71ac2d9bd03b4e07b86',1,'cutlass::ZipTensorRef::ZipTensorRef()'],['../structcutlass_1_1ZipTensorRef.html#a6905b853de0521e2f2fedac407a920e1',1,'cutlass::ZipTensorRef::ZipTensorRef(First const &amp;_first, Second const &amp;_second)']]],
+  ['ziptileallocation',['ZipTileAllocation',['../structcutlass_1_1ZipTileAllocation.html',1,'cutlass']]],
+  ['ziptileiterator',['ZipTileIterator',['../classcutlass_1_1ZipTileIterator.html',1,'cutlass::ZipTileIterator&lt; First_, Second_ &gt;'],['../classcutlass_1_1ZipTileIterator.html#a09eab0c5218fc122848b623462c18149',1,'cutlass::ZipTileIterator::ZipTileIterator()'],['../classcutlass_1_1ZipTileIterator.html#a45a8ba275f8d4f71deb102ad46712b3e',1,'cutlass::ZipTileIterator::ZipTileIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))'],['../classcutlass_1_1ZipTileIterator.html#a31553842afd1cfd5a18a2fd6c39e17b5',1,'cutlass::ZipTileIterator::ZipTileIterator(First const &amp;_first, Second const &amp;_second)'],['../classcutlass_1_1ZipTileIterator.html#a808e06560609aa5b7bb693ec79a3aa57',1,'cutlass::ZipTileIterator::ZipTileIterator(TensorRef const &amp;ref)'],['../classcutlass_1_1ZipTileIterator.html#a9d70b24bf38122c0fea49558c6f6b344',1,'cutlass::ZipTileIterator::ZipTileIterator(Params const &amp;_params, TensorRef const &amp;ref)']]]
 ];
diff --git a/docs/search/all_18.html b/docs/search/all_18.html
new file mode 100644
index 000000000..2a0090254
--- /dev/null
+++ b/docs/search/all_18.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="all_18.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/all_18.js b/docs/search/all_18.js
new file mode 100644
index 000000000..10f55890b
--- /dev/null
+++ b/docs/search/all_18.js
@@ -0,0 +1,4 @@
+var searchData=
+[
+  ['_7eunique_5fptr',['~unique_ptr',['../classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf',1,'cutlass::platform::unique_ptr']]]
+];
diff --git a/docs/search/all_2.js b/docs/search/all_2.js
index b440de047..776b8f816 100644
--- a/docs/search/all_2.js
+++ b/docs/search/all_2.js
@@ -1,10 +1,21 @@
 var searchData=
 [
-  ['base',['Base',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160',1,'cutlass::gemm::GlobalLoadStream::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a',1,'cutlass::gemm::GemmGlobalTileCdTraits::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed',1,'cutlass::gemm::GemmGlobalIteratorAb::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5',1,'cutlass::gemm::GemmGlobalIteratorCd::Base()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Base()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04',1,'cutlass::gemm::IgemmEpilogue::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#ab19f72d239f639f261fbb63f72f10acf',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::Base()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#affd04d88a0bbef13c54f10000a5dc15d',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aef7047c6a0d0c3db0bfb6bec08520aad',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Base()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Base()'],['../classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4',1,'cutlass::TensorView::Base()'],['../structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3',1,'cutlass::TileLoadIterator::Base()'],['../structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67',1,'cutlass::TileStoreIterator::Base()']]],
-  ['baseparams',['BaseParams',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517',1,'cutlass::gemm::GemmGlobalIteratorAb::BaseParams()'],['../structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76',1,'cutlass::TileLoadIterator::BaseParams()'],['../structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0',1,'cutlass::TileStoreIterator::BaseParams()']]],
-  ['begin',['begin',['../structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5',1,'cutlass::PredicateVector']]],
-  ['beta',['beta',['../structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332',1,'cutlass::gemm::GemmDesc::beta()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b',1,'cutlass::gemm::LinearScaling::Params::beta()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e',1,'cutlass::gemm::LinearScaling::beta()']]],
+  ['b',['B',['../structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774',1,'cutlass::gemm::GemmDesc']]],
+  ['base',['Base',['../structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b',1,'cutlass::gemm::GemmCoord::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a',1,'cutlass::gemm::GemmGlobalTileCdTraits::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed',1,'cutlass::gemm::GemmGlobalIteratorAb::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5',1,'cutlass::gemm::GemmGlobalIteratorCd::Base()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Base()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04',1,'cutlass::gemm::IgemmEpilogue::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c',1,'cutlass::gemm::IgemmGlobalTileTraits::Base()'],['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a82a9cfc61ecc117592bdb30f57bd35c9',1,'cutlass::gemm::IgemmGlobalIteratorAb::Base()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85',1,'cutlass::gemm::LinearScalingDevicePtr::Base()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Base()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aea87c73ae2d4e027014ebd4d8141c89e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Base()'],['../structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d',1,'cutlass::MatrixCoord::Base()'],['../structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000',1,'cutlass::TensorRefBatchStrided::Base()'],['../classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6',1,'cutlass::TensorView::Base()'],['../structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca',1,'cutlass::TileCoord::Base()'],['../structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264',1,'cutlass::TileLoadIterator::Base()'],['../structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48',1,'cutlass::TileStoreIterator::Base()'],['../structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1',1,'cutlass::PredicatedTileLoadStream::Base()'],['../structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b',1,'cutlass::PredicatedTileStoreStream::Base()']]],
+  ['baseparams',['BaseParams',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517',1,'cutlass::gemm::GemmGlobalIteratorAb::BaseParams()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::BaseParams()'],['../structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e',1,'cutlass::TileLoadIterator::BaseParams()'],['../structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66',1,'cutlass::TileStoreIterator::BaseParams()']]],
+  ['batch',['batch',['../structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26',1,'cutlass::gemm::GemmCoord::batch() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#adaf31768b8239f497c0ec9b40bad1cb5',1,'cutlass::gemm::GemmCoord::batch()']]],
+  ['batch_5fstride_5fa',['batch_stride_A',['../structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599',1,'cutlass::gemm::GemmDesc']]],
+  ['batch_5fstride_5fb',['batch_stride_B',['../structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a',1,'cutlass::gemm::GemmDesc']]],
+  ['batch_5fstride_5fc',['batch_stride_C',['../structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2',1,'cutlass::gemm::GemmDesc']]],
+  ['batch_5fstride_5fd',['batch_stride_D',['../structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de',1,'cutlass::gemm::GemmDesc']]],
+  ['begin',['begin',['../structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5',1,'cutlass::PredicateVector::begin()'],['../structcutlass_1_1TensorRefBatchStrided.html#a4f4a2f860cc10688ee27cc9ce1df1015',1,'cutlass::TensorRefBatchStrided::begin()'],['../structcutlass_1_1TensorRefArray.html#a6b0f0d9cef4a2f3f4a8bf6c192a282db',1,'cutlass::TensorRefArray::begin()']]],
+  ['beta',['beta',['../structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b',1,'cutlass::gemm::GemmDesc::beta()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b',1,'cutlass::gemm::LinearScaling::Params::beta()'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816',1,'cutlass::gemm::LinearScalingDevicePtr::Params::beta()']]],
+  ['bin1_5ft',['bin1_t',['../structcutlass_1_1bin1__t.html',1,'cutlass']]],
+  ['block',['block',['../structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd',1,'cutlass::KernelLaunchConfiguration']]],
   ['blockswizzle',['BlockSwizzle',['../structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941',1,'cutlass::gemm::GemmTraits']]],
   ['bool_5fconstant',['bool_constant',['../structcutlass_1_1platform_1_1bool__constant.html',1,'cutlass::platform']]],
+  ['bounds',['bounds',['../structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a',1,'cutlass::RegularTilePredicateFunctor']]],
+  ['boustrophedon',['Boustrophedon',['../structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa',1,'cutlass::gemm::swizzleDirection']]],
+  ['btype',['BType',['../structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49',1,'cutlass::gemm::GemmDesc']]],
   ['byte',['byte',['../structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4',1,'cutlass::platform::alignment_of::pad']]]
 ];
diff --git a/docs/search/all_3.js b/docs/search/all_3.js
index fa720a8db..7695e19ca 100644
--- a/docs/search/all_3.js
+++ b/docs/search/all_3.js
@@ -1,42 +1,59 @@
 var searchData=
 [
+  ['c',['c',['../structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c',1,'cutlass::TileCoord::c() const'],['../structcutlass_1_1TileCoord.html#ad8281750f2978c6c1c91982f347a14cd',1,'cutlass::TileCoord::c()'],['../structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30',1,'cutlass::gemm::GemmDesc::C()']]],
+  ['capacity',['capacity',['../classcutlass_1_1TensorView.html#ad870c366ffe904d3363df1dfb0d5f04c',1,'cutlass::TensorView']]],
   ['check',['check',['../structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b',1,'cutlass::platform::is_base_of_helper::check(DerivedT *, T)'],['../structcutlass_1_1platform_1_1is__base__of__helper.html#ae8896817cabf297437b3a073e693ffd2',1,'cutlass::platform::is_base_of_helper::check(BaseT *, int)']]],
-  ['clamp',['clamp',['../structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e',1,'cutlass::Coord']]],
-  ['clear',['clear',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage::clear()'],['../structcutlass_1_1Fragment.html#a29e7408fcde8cdf9de5e3a10eaa46391',1,'cutlass::Fragment::clear()'],['../structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab',1,'cutlass::gemm::ClearAccumulators::clear()']]],
+  ['clamp',['clamp',['../structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba',1,'cutlass::Coord']]],
+  ['clear',['clear',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage::clear()'],['../structcutlass_1_1Fragment.html#acf28266500b87484530b2395925fca51',1,'cutlass::Fragment::clear()'],['../structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab',1,'cutlass::gemm::ClearAccumulators::clear()'],['../structcutlass_1_1ZipFragment.html#aa978dd7fca15ca20e9f52d15e6f8f9c1',1,'cutlass::ZipFragment::clear()']]],
   ['clear_5faccumulators_2eh',['clear_accumulators.h',['../clear__accumulators_8h.html',1,'']]],
-  ['clearaccumulators',['ClearAccumulators',['../structcutlass_1_1gemm_1_1ClearAccumulators.html',1,'cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;'],['../structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165',1,'cutlass::gemm::GemmTraits::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041',1,'cutlass::gemm::HgemmTraitsHelper::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5',1,'cutlass::gemm::IgemmTraitsHelper::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef',1,'cutlass::gemm::ClearAccumulators::ClearAccumulators()']]],
-  ['commit',['commit',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae',1,'cutlass::gemm::GlobalLoadStreamBase::commit()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a9cc435369c7fc76d0bb6233a8258e257',1,'cutlass::gemm::SharedLoadStream::commit()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a6dc512be014b9d849057e2fd4c0b0485',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::commit()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#ade2d85507dec77591e66276339a1eef5',1,'cutlass::gemm::GemmTraits::SharedLoadStream::commit()']]],
+  ['clearaccumulators',['ClearAccumulators',['../structcutlass_1_1gemm_1_1ClearAccumulators.html',1,'cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;'],['../structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165',1,'cutlass::gemm::GemmTraits::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6',1,'cutlass::gemm::HgemmTraitsHelper::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760',1,'cutlass::gemm::IgemmTraitsHelper::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef',1,'cutlass::gemm::ClearAccumulators::ClearAccumulators(SharedStorage &amp;shared_storage)'],['../structcutlass_1_1gemm_1_1ClearAccumulators.html#aef1832b62ae8caef5e6d34cb1d1564e3',1,'cutlass::gemm::ClearAccumulators::ClearAccumulators()']]],
+  ['clz',['clz',['../namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005',1,'cutlass']]],
+  ['column',['column',['../structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9',1,'cutlass::MatrixCoord::column() const'],['../structcutlass_1_1MatrixCoord.html#a093f5e568a81c6464dbf4aef996c32ba',1,'cutlass::MatrixCoord::column()']]],
+  ['columnmajor',['ColumnMajor',['../structcutlass_1_1MatrixLayout_1_1ColumnMajor.html',1,'cutlass::MatrixLayout']]],
+  ['columnmajorblocklinear',['ColumnMajorBlockLinear',['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html',1,'cutlass::MatrixLayout']]],
+  ['columnmajorblockswizzle',['ColumnMajorBlockSwizzle',['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html',1,'cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;'],['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a6d0ee4e76371af26030ab4922e6c915a',1,'cutlass::gemm::ColumnMajorBlockSwizzle::ColumnMajorBlockSwizzle()']]],
+  ['columnmajorinterleaved',['ColumnMajorInterleaved',['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html',1,'cutlass::MatrixLayout']]],
+  ['commit',['commit',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab39c82ac1a8138c4b6d69dab9d48bdbc',1,'cutlass::gemm::GlobalLoadStream::commit()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#aa3aa987bf0fd6303e06f46e2f54e47e4',1,'cutlass::gemm::SharedLoadStream::commit()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6be479189765a1803ceced424561466b',1,'cutlass::gemm::SharedLoadStream::commit(int step)'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6699714c357f2714df011f58c1c48861',1,'cutlass::gemm::GlobalLoadStreamPair::commit()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a93cc2a7eb3215ce5bae343fb117f55c5',1,'cutlass::gemm::SharedStreamPair::commit()'],['../structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627',1,'cutlass::TileLoadStream::commit()'],['../structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579',1,'cutlass::TileStoreStream::commit()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a165a0d486f53fb2315d4e555c9f59891',1,'cutlass::PredicatedTileStoreStream::commit()']]],
+  ['complex',['complex',['../classcutlass_1_1platform_1_1complex.html',1,'cutlass::platform::complex&lt; T &gt;'],['../classcutlass_1_1platform_1_1complex.html#a2e852c886e61a39e884026d6f4c32c1e',1,'cutlass::platform::complex::complex(T r=T(0), T i=T(0))'],['../classcutlass_1_1platform_1_1complex.html#a71ee9d620f72fbcd54f6e3049707eb99',1,'cutlass::platform::complex::complex(cuFloatComplex const &amp;z)'],['../classcutlass_1_1platform_1_1complex.html#af40324ec4d1d35a0ceda676c8de968f8',1,'cutlass::platform::complex::complex(cuDoubleComplex const &amp;z)']]],
+  ['complex_2eh',['complex.h',['../complex_8h.html',1,'']]],
   ['computeoffsetfromshape',['ComputeOffsetFromShape',['../structcutlass_1_1ComputeOffsetFromShape.html',1,'cutlass']]],
-  ['computeoffsetfromshape_3c_20shape_3c_201_2c_20ksh_5f_2c_20ksw_5f_2c_201_20_3e_20_3e',['ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;',['../structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html',1,'cutlass']]],
-  ['computeoffsetfromshape_3c_20shape_3c_201_2c_20ksh_5f_2c_20ksw_5f_2c_20ksc_5f_20_3e_20_3e',['ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;',['../structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html',1,'cutlass']]],
   ['computeoffsetfromstrides',['ComputeOffsetFromStrides',['../structcutlass_1_1ComputeOffsetFromStrides.html',1,'cutlass']]],
-  ['computeoffsetfromstrides_3c_20shape_3c_201_2c_20s_5fh_5f_2c_20s_5fw_5f_2c_201_20_3e_20_3e',['ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;',['../structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html',1,'cutlass']]],
-  ['computeoffsetfromstrides_3c_20shape_3c_201_2c_20s_5fh_5f_2c_20s_5fw_5f_2c_20s_5fc_5f_20_3e_20_3e',['ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;',['../structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html',1,'cutlass']]],
   ['computethreadoffsetfromstrides',['ComputeThreadOffsetFromStrides',['../structcutlass_1_1ComputeThreadOffsetFromStrides.html',1,'cutlass']]],
   ['computethreadoffsetfromstrides_3c_20shape_3c_201_2c_20t_5fh_5f_2c_20t_5fw_5f_2c_201_20_3e_2c_20shape_3c_201_2c_20s_5fh_5f_2c_20s_5fw_5f_2c_201_20_3e_20_3e',['ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;',['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html',1,'cutlass']]],
   ['computethreadoffsetfromstrides_3c_20shape_3c_201_2c_20t_5fh_5f_2c_20t_5fw_5f_2c_20t_5fc_5f_20_3e_2c_20shape_3c_201_2c_20s_5fh_5f_2c_20s_5fw_5f_2c_20s_5fc_5f_20_3e_20_3e',['ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;',['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html',1,'cutlass']]],
   ['conditional',['conditional',['../structcutlass_1_1platform_1_1conditional.html',1,'cutlass::platform']]],
   ['conditional_3c_20false_2c_20t_2c_20f_20_3e',['conditional&lt; false, T, F &gt;',['../structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html',1,'cutlass::platform']]],
   ['congruous',['Congruous',['../structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html#abe4eb7f9a0ed7d48a81029e88849dcf2',1,'cutlass::gemm::GemmOperandTraitsAb']]],
+  ['conj',['conj',['../namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4',1,'cutlass::platform']]],
   ['const_5fbegin',['const_begin',['../structcutlass_1_1PredicateVector.html#aeb7f9226a4fa49d06500c3c83958dc41',1,'cutlass::PredicateVector']]],
   ['const_5fend',['const_end',['../structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321',1,'cutlass::PredicateVector']]],
-  ['const_5fref',['const_ref',['../classcutlass_1_1TensorView.html#a23564f1d333bb16343ed3a885f894285',1,'cutlass::TensorView']]],
+  ['const_5fref',['const_ref',['../classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47',1,'cutlass::TensorRef::const_ref()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0a48de201c35cbc9d5e3b94fa597a617',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::const_ref()'],['../classcutlass_1_1TensorView.html#a559f7210b445c77a167ab1f41c8d0827',1,'cutlass::TensorView::const_ref()']]],
   ['constexpr',['constexpr',['../platform_8h.html#a72f0657181cca64b44eb186b707eb380',1,'platform.h']]],
-  ['constiterator',['ConstIterator',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html',1,'cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7',1,'cutlass::PredicateVector::ConstIterator::ConstIterator(ConstIterator const &amp;it)'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda',1,'cutlass::PredicateVector::ConstIterator::ConstIterator(PredicateVector const &amp;_vec, int _start=0)']]],
+  ['constiterator',['ConstIterator',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html',1,'cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html',1,'cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html',1,'cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7',1,'cutlass::PredicateVector::ConstIterator::ConstIterator(ConstIterator const &amp;it)'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda',1,'cutlass::PredicateVector::ConstIterator::ConstIterator(PredicateVector const &amp;_vec, int _start=0)'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed',1,'cutlass::TensorRefBatchStrided::ConstIterator::ConstIterator()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541',1,'cutlass::TensorRefArray::ConstIterator::ConstIterator()']]],
   ['constpredicatetileadapter',['ConstPredicateTileAdapter',['../structcutlass_1_1ConstPredicateTileAdapter.html',1,'cutlass::ConstPredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;'],['../structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1',1,'cutlass::ConstPredicateTileAdapter::ConstPredicateTileAdapter()']]],
-  ['consttensorref_5ft',['ConstTensorRef_t',['../classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830',1,'cutlass::TensorView']]],
-  ['contains',['contains',['../classcutlass_1_1TensorView.html#aa94063d9a9c6e599d3f53e22433274be',1,'cutlass::TensorView']]],
-  ['convert',['Convert',['../structcutlass_1_1Convert.html',1,'cutlass::Convert&lt; InputFragment_, OutputFragment_ &gt;'],['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::Convert()'],['../classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c',1,'cutlass::TensorRef::convert()']]],
+  ['consttensorref',['ConstTensorRef',['../classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17',1,'cutlass::TensorRef::ConstTensorRef()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::ConstTensorRef()'],['../classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57',1,'cutlass::TensorView::ConstTensorRef()'],['../structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033',1,'cutlass::TileAllocation::ConstTensorRef()'],['../structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4',1,'cutlass::ZipTileAllocation::ConstTensorRef()']]],
+  ['consttensorref_5ft',['ConstTensorRef_t',['../classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165',1,'cutlass::TensorView']]],
+  ['consttensorview',['ConstTensorView',['../classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719',1,'cutlass::TensorView']]],
+  ['consume_5ftile',['consume_tile',['../structcutlass_1_1gemm_1_1Gemm.html#af8bb78ae198af4dccb0241da44428053',1,'cutlass::gemm::Gemm']]],
+  ['contains',['contains',['../classcutlass_1_1TensorView.html#a3f448bcf6e664c244f472e2659215628',1,'cutlass::TensorView']]],
+  ['contiguouslayout',['ContiguousLayout',['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html',1,'cutlass::MatrixLayout']]],
+  ['convert',['Convert',['../structcutlass_1_1Convert.html',1,'cutlass::Convert&lt; InputFragment_, OutputFragment_ &gt;'],['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::Convert()']]],
   ['convert_2eh',['convert.h',['../convert_8h.html',1,'']]],
   ['convert_3c_20fragment_3c_20inputscalar_5f_2c_20kscalars_5f_20_3e_2c_20fragment_3c_20outputscalar_5f_2c_20kscalars_5f_20_3e_20_3e',['Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html',1,'cutlass']]],
-  ['coord',['Coord',['../structcutlass_1_1Coord.html',1,'cutlass::Coord&lt; N_ &gt;'],['../structcutlass_1_1Coord.html#a9cbfff91f0b0d0a149534c97e3d6e69b',1,'cutlass::Coord::Coord(int value=0)'],['../structcutlass_1_1Coord.html#a53a3d88a884f6cb7fda8aedfe2cec2c5',1,'cutlass::Coord::Coord(int _idx[])']]],
+  ['coord',['Coord',['../structcutlass_1_1Coord.html',1,'cutlass::Coord&lt; Rank_, Index_ &gt;'],['../structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0',1,'cutlass::Coord::Coord(Index value=0)'],['../structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4',1,'cutlass::Coord::Coord(Index _idx[])'],['../structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573',1,'cutlass::Coord::Coord(Coord&lt; kRank &gt; const &amp;coord)']]],
   ['coord_2eh',['coord.h',['../coord_8h.html',1,'']]],
+  ['coord_3c_202_2c_20int_20_3e',['Coord&lt; 2, int &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
+  ['coord_3c_203_20_3e',['Coord&lt; 3 &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
   ['coord_3c_204_20_3e',['Coord&lt; 4 &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
-  ['coord_3c_20rank_20_3e',['Coord&lt; Rank &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
-  ['coord_5ft',['Coord_t',['../classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017',1,'cutlass::TensorView']]],
-  ['copy',['Copy',['../structcutlass_1_1Copy.html',1,'cutlass::Copy&lt; Fragment_ &gt;'],['../structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1',1,'cutlass::Copy::Copy()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e',1,'cutlass::gemm::GlobalLoadStreamBase::copy()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a7f6bf3b8d70bcd74d84519decd9f0d8e',1,'cutlass::gemm::SharedLoadStream::copy(FetchedFragment &amp;fetched)'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a279144e9722055d4b862e3fa25948762',1,'cutlass::gemm::SharedLoadStream::copy(int d, FetchedFragment &amp;fetched)'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ae033f55779b45b4228f40a4d699062bb',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::copy()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#af25495bb0bb35bd64246d3a80fe4806f',1,'cutlass::gemm::GemmTraits::SharedLoadStream::copy()']]],
+  ['coord_3c_204_2c_20index_5f_20_3e',['Coord&lt; 4, Index_ &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
+  ['coord_3c_204_2c_20int_20_3e',['Coord&lt; 4, int &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
+  ['coord_3c_20kstoragerank_20_2d_201_20_3e',['Coord&lt; kStorageRank - 1 &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
+  ['coord_5ft',['Coord_t',['../classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6',1,'cutlass::TensorRef::Coord_t()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Coord_t()'],['../classcutlass_1_1TensorView.html#ab16a0244199ca2800ea5460ed8ed6ae2',1,'cutlass::TensorView::Coord_t()']]],
+  ['copy',['Copy',['../structcutlass_1_1Copy.html',1,'cutlass::Copy&lt; Fragment_ &gt;'],['../structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1',1,'cutlass::Copy::Copy()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a3784dbb3efe0865ffa946419111c824a',1,'cutlass::gemm::GlobalLoadStream::copy()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a4b919d229e259909efbf994ff2c09339',1,'cutlass::gemm::SharedLoadStream::copy()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a99039d115a539fc99e2235c12ac57eed',1,'cutlass::gemm::SharedLoadStream::copy(int step)'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5c0efc259bb3bd1675f5d395dab71e95',1,'cutlass::gemm::GlobalLoadStreamPair::copy()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#ad46887abb2e3136b635c3ef5be29cf69',1,'cutlass::gemm::SharedStreamPair::copy()'],['../structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23',1,'cutlass::TileLoadStream::copy()'],['../structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009',1,'cutlass::TileStoreStream::copy()'],['../structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978',1,'cutlass::TileStoreStream::copy(Fragment const &amp;frag)'],['../structcutlass_1_1PredicatedTileLoadStream.html#a60a03c95452fe627477933d60815f7cb',1,'cutlass::PredicatedTileLoadStream::copy()'],['../structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350',1,'cutlass::PredicatedTileStoreStream::copy()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a1d33da4593ae68e6301df54b310a70a0',1,'cutlass::PredicatedTileStoreStream::copy(Fragment const &amp;frag)']]],
   ['core_5fio_2eh',['core_io.h',['../core__io_8h.html',1,'']]],
-  ['count',['count',['../structcutlass_1_1Coord.html#a40429a9154f7a142ad7e9eb35282d196',1,'cutlass::Coord']]],
+  ['cos',['cos',['../namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92',1,'cutlass::platform']]],
+  ['count',['count',['../structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017',1,'cutlass::Coord']]],
+  ['ctype',['CType',['../structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704',1,'cutlass::gemm::GemmDesc']]],
   ['cuda_5flog',['CUDA_LOG',['../debug_8h.html#a27e3466bcf1ec7fda4f6f95aa0a51177',1,'debug.h']]],
   ['cuda_5flog_5fdebug',['CUDA_LOG_DEBUG',['../debug_8h.html#a8d6986db819719ada8b29d53dfc104a6',1,'debug.h']]],
   ['cuda_5fperror',['CUDA_PERROR',['../debug_8h.html#aed8337b88d71895f95f8980ef0b3a50b',1,'debug.h']]],
@@ -46,6 +63,7 @@ var searchData=
   ['cutlass',['cutlass',['../namespacecutlass.html',1,'']]],
   ['cutlass_2eh',['cutlass.h',['../cutlass_8h.html',1,'']]],
   ['cutlass_5fassert',['CUTLASS_ASSERT',['../cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7',1,'cutlass.h']]],
+  ['cutlass_5fgemm_5floop',['CUTLASS_GEMM_LOOP',['../cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71',1,'cutlass.h']]],
   ['cutlass_5fhost_5fdevice',['CUTLASS_HOST_DEVICE',['../cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1',1,'cutlass.h']]],
   ['cutlass_5fmajor',['CUTLASS_MAJOR',['../cutlass_8h.html#a8ff3cda9323810c1c504793a0206d4b8',1,'cutlass.h']]],
   ['cutlass_5fmath_2eh',['cutlass_math.h',['../cutlass__math_8h.html',1,'']]],
@@ -54,6 +72,7 @@ var searchData=
   ['cutlass_5fpragma_5fno_5funroll',['CUTLASS_PRAGMA_NO_UNROLL',['../cutlass_8h.html#adb3bc73d74b4a4bf13099d5696db3352',1,'cutlass.h']]],
   ['cutlass_5fpragma_5funroll',['CUTLASS_PRAGMA_UNROLL',['../cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4',1,'cutlass.h']]],
   ['cutlass_5fversion',['CUTLASS_VERSION',['../cutlass_8h.html#aa3040eddf073214969f9445bfa925039',1,'cutlass.h']]],
+  ['detail',['detail',['../namespacecutlass_1_1detail.html',1,'cutlass']]],
   ['gemm',['gemm',['../namespacecutlass_1_1gemm.html',1,'cutlass']]],
   ['platform',['platform',['../namespacecutlass_1_1platform.html',1,'cutlass']]]
 ];
diff --git a/docs/search/all_4.js b/docs/search/all_4.js
index c58b1aa48..7ecb56d6c 100644
--- a/docs/search/all_4.js
+++ b/docs/search/all_4.js
@@ -1,19 +1,24 @@
 var searchData=
 [
-  ['d_5fa',['d_a',['../structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447',1,'cutlass::gemm::GemmDesc']]],
-  ['d_5fb',['d_b',['../structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b',1,'cutlass::gemm::GemmDesc']]],
-  ['d_5fc',['d_c',['../structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5',1,'cutlass::gemm::GemmDesc']]],
-  ['d_5fd',['d_d',['../structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216',1,'cutlass::gemm::GemmDesc']]],
-  ['data',['data',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3af66b82b1a0cc5bf6141f940553e048',1,'cutlass::gemm::GemmGlobalIteratorAb::data()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a0d3c1a58f23957f9850d1b22992a981a',1,'cutlass::gemm::GemmGlobalIteratorCd::data()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6fd4e62eb280a5b8c17eb79141414581',1,'cutlass::gemm::GemmGlobalIteratorCd::data() const'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afe77778a126449e210c0bd6ec2dc6709',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::data()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a90e9886534ecbbce69f57b4030d0903f',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::data() const'],['../classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7',1,'cutlass::TensorRef::data()'],['../classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8',1,'cutlass::TensorView::data()'],['../structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4',1,'cutlass::TileLoadIterator::data()'],['../structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0',1,'cutlass::TileStoreIterator::data()']]],
+  ['d',['d',['../structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b',1,'cutlass::TileCoord::d() const'],['../structcutlass_1_1TileCoord.html#aec4ffcdc8fbf57a8b649fff38af55007',1,'cutlass::TileCoord::d()'],['../structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f',1,'cutlass::gemm::GemmDesc::D()']]],
+  ['data',['data',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a0e05007f939b27e6a17dce5c2a49e3e0',1,'cutlass::gemm::GemmEpilogueTraits::SharedStorage::data()'],['../classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7',1,'cutlass::TensorRef::data()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a67b25cc51ce867b073feead7b94e6aa3',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::data()'],['../structcutlass_1_1TileAllocation.html#a69c43b27939e9ecebd23edb18ed3a9dc',1,'cutlass::TileAllocation::data()'],['../structcutlass_1_1TileAllocation.html#acc3f2c29fe21316091a1405613083000',1,'cutlass::TileAllocation::data() const']]],
   ['debug_2eh',['debug.h',['../debug_8h.html',1,'']]],
+  ['debugtype',['DebugType',['../structDebugType.html',1,'']]],
+  ['debugtypefunc',['DebugTypeFunc',['../cutlass_8h.html#ab7e23b523490567225b20e2c72649f20',1,'cutlass.h']]],
+  ['debugvalue',['DebugValue',['../structDebugValue.html',1,'']]],
+  ['decrement',['decrement',['../classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6',1,'cutlass::ZipTileIterator']]],
   ['default_5fdelete',['default_delete',['../structcutlass_1_1platform_1_1default__delete.html',1,'cutlass::platform']]],
   ['default_5fdelete_3c_20t_5b_5d_3e',['default_delete&lt; T[]&gt;',['../structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html',1,'cutlass::platform']]],
   ['deleter_5ftype',['deleter_type',['../classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252',1,'cutlass::platform::unique_ptr']]],
-  ['delta',['Delta',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae',1,'cutlass::gemm::GemmEpilogueTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aede069e51e0732a9648c437261bd4d66',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Delta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f',1,'cutlass::gemm::GemmGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4',1,'cutlass::gemm::GemmGlobalTileCdTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea',1,'cutlass::gemm::GemmSharedLoadTileATraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Delta()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Delta()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a08dada072eefded4c859df4e5fc25ca6',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Delta()'],['../structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb',1,'cutlass::TileTraits::Delta()'],['../structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088',1,'cutlass::TileIteratorBase::Delta()'],['../structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf',1,'cutlass::TileLoadIterator::Delta()'],['../structcutlass_1_1TileStoreIterator.html#a1c433ba0eea5e6a46f36101d8de98ed0',1,'cutlass::TileStoreIterator::Delta()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5',1,'cutlass::TileTraitsStrideMajor::Delta()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896',1,'cutlass::TileTraitsContiguousMajor::Delta()'],['../structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe',1,'cutlass::TileTraitsWarpRake::Delta()']]],
+  ['delta',['Delta',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da',1,'cutlass::gemm::GemmEpilogueTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aede069e51e0732a9648c437261bd4d66',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Delta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f',1,'cutlass::gemm::GemmGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4',1,'cutlass::gemm::GemmGlobalTileCdTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024',1,'cutlass::gemm::GemmSharedLoadTileATraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Delta()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Delta()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#adab639892c3586464e2ea5f947b9e0f0',1,'cutlass::gemm::IgemmGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Delta()'],['../structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82',1,'cutlass::TileTraits::Delta()'],['../structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360',1,'cutlass::RegularTilePredicateFunctor::Delta()'],['../structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815',1,'cutlass::TileIteratorBase::Delta()'],['../structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604',1,'cutlass::TileLoadIterator::Delta()'],['../structcutlass_1_1TileStoreIterator.html#afdb38f790d9c7cf1ac238643103b45ce',1,'cutlass::TileStoreIterator::Delta()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5',1,'cutlass::TileTraitsStrideMajor::Delta()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896',1,'cutlass::TileTraitsContiguousMajor::Delta()'],['../structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe',1,'cutlass::TileTraitsWarpRake::Delta()']]],
   ['dgemm_5ftraits_2eh',['dgemm_traits.h',['../dgemm__traits_8h.html',1,'']]],
   ['dgemmconfig',['DgemmConfig',['../structcutlass_1_1gemm_1_1DgemmConfig.html',1,'cutlass::gemm']]],
   ['dgemmtraits',['DgemmTraits',['../structcutlass_1_1gemm_1_1DgemmTraits.html',1,'cutlass::gemm']]],
+  ['dhw',['dhw',['../structcutlass_1_1TileCoord.html#abe65d1a0ff3798b662376032d51e9713',1,'cutlass::TileCoord']]],
   ['divide_5fassert',['divide_assert',['../structcutlass_1_1divide__assert.html',1,'cutlass']]],
-  ['dot',['dot',['../structcutlass_1_1Coord.html#ad4b3704d14057c043f972827671115cf',1,'cutlass::Coord::dot(Coord const &amp;b, T sum) const'],['../structcutlass_1_1Coord.html#ae023c0c664c22a978e9b9ce5e063aae4',1,'cutlass::Coord::dot(Coord const &amp;b) const']]],
-  ['dummy',['dummy',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html',1,'cutlass::platform::is_base_of_helper']]]
+  ['dot',['dot',['../structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184',1,'cutlass::Coord::dot(Coord const &amp;b, T sum) const'],['../structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d',1,'cutlass::Coord::dot(Coord const &amp;b) const']]],
+  ['dtype',['DType',['../structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd',1,'cutlass::gemm::GemmDesc']]],
+  ['dummy',['dummy',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html',1,'cutlass::platform::is_base_of_helper']]],
+  ['dumptype',['DumpType',['../structcutlass_1_1DumpType.html',1,'cutlass']]],
+  ['dynamic_5fsmem',['dynamic_smem',['../structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc',1,'cutlass::KernelLaunchConfiguration']]]
 ];
diff --git a/docs/search/all_5.js b/docs/search/all_5.js
index 066d4cd38..29dcf77e9 100644
--- a/docs/search/all_5.js
+++ b/docs/search/all_5.js
@@ -5,9 +5,10 @@ var searchData=
   ['enable_5fif',['enable_if',['../structcutlass_1_1platform_1_1enable__if.html',1,'cutlass::platform']]],
   ['enable_5fif_3c_20false_2c_20t_20_3e',['enable_if&lt; false, T &gt;',['../structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html',1,'cutlass::platform']]],
   ['end',['end',['../structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275',1,'cutlass::PredicateVector']]],
-  ['epilogue',['Epilogue',['../structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe',1,'cutlass::gemm::GemmTraits::Epilogue()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98',1,'cutlass::gemm::HgemmTraitsHelper::Epilogue()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651',1,'cutlass::gemm::IgemmTraitsHelper::Epilogue()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8',1,'cutlass::gemm::GemmTraits::Params::epilogue()'],['../unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#afdca9ac1d28e17efaa394f5831a60c04',1,'cutlass::gemm::GemmTraits::SharedStorage::epilogue()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c',1,'cutlass::gemm::GemmEpilogue::epilogue()']]],
-  ['epilogue_5fwith_5for_5fwithout_5fbeta',['epilogue_with_or_without_beta',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4',1,'cutlass::gemm::GemmEpilogue']]],
-  ['evaluate',['evaluate',['../structcutlass_1_1gemm_1_1LinearScaling.html#a2e0d140aed388d2457dfb24d28fcd08a',1,'cutlass::gemm::LinearScaling::evaluate(Fragment_ const &amp;accum, Fragment_ &amp;output)'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a47a53e5b67b2207fb3ba38a8b9cef448',1,'cutlass::gemm::LinearScaling::evaluate(Fragment_ const &amp;accum, Fragment_ const &amp;old, Fragment_ &amp;output)']]],
+  ['epilogue',['Epilogue',['../structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe',1,'cutlass::gemm::GemmTraits::Epilogue()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae',1,'cutlass::gemm::HgemmTraitsHelper::Epilogue()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915',1,'cutlass::gemm::IgemmTraitsHelper::Epilogue()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8',1,'cutlass::gemm::GemmTraits::Params::epilogue()'],['../unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#afdca9ac1d28e17efaa394f5831a60c04',1,'cutlass::gemm::GemmTraits::SharedStorage::epilogue()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3',1,'cutlass::gemm::GemmEpilogue::epilogue()']]],
+  ['epilogue_5fwith_5for_5fwithout_5fbeta',['epilogue_with_or_without_beta',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32',1,'cutlass::gemm::GemmEpilogue']]],
+  ['evaluate',['evaluate',['../structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb',1,'cutlass::gemm::LinearScaling::evaluate(FragmentA_ const &amp;accum, FragmentB_ &amp;output)'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02',1,'cutlass::gemm::LinearScaling::evaluate(ScalarAccum const *accum, ScalarOutput *output)'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1',1,'cutlass::gemm::LinearScaling::evaluate(FragmentA_ const &amp;accum, FragmentB_ const &amp;old, FragmentB_ &amp;output)'],['../structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947',1,'cutlass::gemm::LinearScaling::evaluate(ScalarAccum const *accum, ScalarOutput const *old, ScalarOutput *output)']]],
+  ['exp',['exp',['../namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b',1,'cutlass::platform']]],
   ['extent',['Extent',['../structcutlass_1_1Extent.html',1,'cutlass']]],
   ['extent_3c_20vector_3c_20t_2c_20lanes_20_3e_20_3e',['Extent&lt; Vector&lt; T, Lanes &gt; &gt;',['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html',1,'cutlass']]],
   ['extent_3c_20vector_3c_20t_2c_20lanes_20_3e_20const_20_3e',['Extent&lt; Vector&lt; T, Lanes &gt; const &gt;',['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html',1,'cutlass']]]
diff --git a/docs/search/all_6.js b/docs/search/all_6.js
index 0734def49..6320fd676 100644
--- a/docs/search/all_6.js
+++ b/docs/search/all_6.js
@@ -1,32 +1,31 @@
 var searchData=
 [
   ['false_5ftype',['false_type',['../namespacecutlass_1_1platform.html#ad8c95b2109070847b13d355120344380',1,'cutlass::platform']]],
-  ['fetched_5fa',['fetched_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a3147da380e4c1e465aba0b965ac87ab5',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['fetched_5fb',['fetched_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a837fbec1d47ae45480941de6290889c0',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['fetched_5ffragment',['fetched_fragment',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d',1,'cutlass::gemm::GlobalLoadStreamBase']]],
-  ['fetchedfragment',['FetchedFragment',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36',1,'cutlass::gemm::GlobalLoadStreamBase::FetchedFragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7',1,'cutlass::gemm::SharedLoadStream::FetchedFragment()']]],
+  ['fetched',['fetched',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4',1,'cutlass::gemm::SharedLoadStream']]],
+  ['fetched_5ffragment',['fetched_fragment',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03',1,'cutlass::gemm::GlobalLoadStream::fetched_fragment()'],['../structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869',1,'cutlass::TileLoadStream::fetched_fragment()']]],
+  ['fetchedfragment',['FetchedFragment',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf',1,'cutlass::gemm::GlobalLoadStream::FetchedFragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7',1,'cutlass::gemm::SharedLoadStream::FetchedFragment()']]],
   ['fill',['fill',['../structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917',1,'cutlass::PredicateVector']]],
-  ['fragment',['Fragment',['../structcutlass_1_1Fragment.html',1,'cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;'],['../structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808',1,'cutlass::FragmentIterator::Fragment()'],['../structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05',1,'cutlass::FragmentConstIterator::Fragment()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be',1,'cutlass::gemm::GlobalLoadStreamBase::Fragment()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4',1,'cutlass::gemm::GemmGlobalIteratorAb::Fragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7',1,'cutlass::gemm::SharedLoadStream::Fragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7',1,'cutlass::gemm::HgemmSwizzle::Fragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d',1,'cutlass::gemm::IgemmSwizzle::Fragment()'],['../structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e',1,'cutlass::TileIteratorBase::Fragment()'],['../structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc',1,'cutlass::TileLoadIterator::Fragment()'],['../structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1',1,'cutlass::TileStoreIterator::Fragment()']]],
+  ['find_5flog2',['find_log2',['../namespacecutlass.html#a58a119c3f7b33d97c43ae8c114004d9e',1,'cutlass']]],
+  ['first',['First',['../structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2',1,'cutlass::ZipTileAllocation::First()'],['../structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4',1,'cutlass::ZipFragment::First()'],['../structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4',1,'cutlass::ZipConvert::First()'],['../structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9',1,'cutlass::ZipTensorRef::First()'],['../classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7',1,'cutlass::ZipTileIterator::First()'],['../structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014',1,'cutlass::ZipTileAllocation::first()'],['../structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c',1,'cutlass::ZipFragment::first()'],['../structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f',1,'cutlass::ZipConvert::first()'],['../structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c',1,'cutlass::ZipTensorRef::first()'],['../structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e',1,'cutlass::ZipTileIterator::Params::first()'],['../classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9',1,'cutlass::ZipTileIterator::first()']]],
+  ['fp16_5fsgemm_5fmultiply_5fadd_2eh',['fp16_sgemm_multiply_add.h',['../fp16__sgemm__multiply__add_8h.html',1,'']]],
+  ['fp16_5fsgemm_5ftraits_2eh',['fp16_sgemm_traits.h',['../fp16__sgemm__traits_8h.html',1,'']]],
+  ['fp16sgemmconfig',['Fp16SgemmConfig',['../structcutlass_1_1gemm_1_1Fp16SgemmConfig.html',1,'cutlass::gemm']]],
+  ['fp16sgemmsgemmtraits',['Fp16SgemmSgemmTraits',['../structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html',1,'cutlass::gemm']]],
+  ['fragment',['Fragment',['../structcutlass_1_1Fragment.html',1,'cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;'],['../structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808',1,'cutlass::FragmentIterator::Fragment()'],['../structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05',1,'cutlass::FragmentConstIterator::Fragment()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106',1,'cutlass::gemm::GlobalLoadStream::Fragment()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4',1,'cutlass::gemm::GemmGlobalIteratorAb::Fragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7',1,'cutlass::gemm::SharedLoadStream::Fragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7',1,'cutlass::gemm::HgemmSwizzle::Fragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d',1,'cutlass::gemm::IgemmSwizzle::Fragment()'],['../structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219',1,'cutlass::TileIteratorBase::Fragment()'],['../structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139',1,'cutlass::TileLoadIterator::Fragment()'],['../structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb',1,'cutlass::TileStoreIterator::Fragment()'],['../structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81',1,'cutlass::TileLoadStream::Fragment()'],['../structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878',1,'cutlass::TileStoreStream::Fragment()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a7f802c4c733375d0a63f91c58196e6a0',1,'cutlass::PredicatedTileLoadStream::Fragment()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a6c9737f5b09e7eb1aa7daabb00ae2e69',1,'cutlass::PredicatedTileStoreStream::Fragment()'],['../classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06',1,'cutlass::ZipTileIterator::Fragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#ad5cb076de46e841a165bd43924dab463',1,'cutlass::gemm::SharedLoadStream::fragment(int step=0)'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a30e815fcee63b5a99b2797464b6a3192',1,'cutlass::gemm::SharedLoadStream::fragment(int step=0) const'],['../structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be',1,'cutlass::TileLoadStream::fragment()'],['../structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5',1,'cutlass::TileStoreStream::fragment()']]],
   ['fragment_2eh',['fragment.h',['../fragment_8h.html',1,'']]],
-  ['fragment_5fa',['fragment_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a4a8c64d85aa012e3689dd024c486924b',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['fragment_5fb',['fragment_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#aa28f34fb0c4bf739246d92c2fef80e0b',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
+  ['fragment_5fa',['fragment_a',['../structcutlass_1_1gemm_1_1SharedStreamPair.html#af29f052dc0145abe3144dea1472d241a',1,'cutlass::gemm::SharedStreamPair']]],
+  ['fragment_5fb',['fragment_b',['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a375e96bc2e35447682bd1dea3c4d87ad',1,'cutlass::gemm::SharedStreamPair']]],
   ['fragment_20concept',['Fragment Concept',['../group__fragment__concept.html',1,'']]],
   ['fragment_20iterator_20concept',['Fragment Iterator Concept',['../group__fragment__iterator__concept.html',1,'']]],
-  ['fragment_5fload_5fstore_2eh',['fragment_load_store.h',['../fragment__load__store_8h.html',1,'']]],
   ['fragment_5fmultiply_5fadd_2eh',['fragment_multiply_add.h',['../fragment__multiply__add_8h.html',1,'']]],
-  ['fragmenta',['FragmentA',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1daf96b6d152c5cf32f248bbfd605b74',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a71aadbb130d4b1a6532c45282b37354f',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914',1,'cutlass::gemm::ThreadMultiplyAdd::FragmentA()']]],
-  ['fragmentb',['FragmentB',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae79e7fc5be2f4c8d30ca83edc151f63a',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a43e278686b493d0aef943f32a9f47b9e',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620',1,'cutlass::gemm::ThreadMultiplyAdd::FragmentB()']]],
-  ['fragmentconstiterator',['FragmentConstIterator',['../structcutlass_1_1FragmentConstIterator.html',1,'cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;'],['../structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60',1,'cutlass::TileIteratorBase::FragmentConstIterator()'],['../structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76',1,'cutlass::TileLoadIterator::FragmentConstIterator()'],['../structcutlass_1_1TileStoreIterator.html#a48de0db7ee2ee9699b946a9d5a0364c7',1,'cutlass::TileStoreIterator::FragmentConstIterator()'],['../structcutlass_1_1FragmentConstIterator.html#ac4b6f351e6e72bed37e425f02a10c81e',1,'cutlass::FragmentConstIterator::FragmentConstIterator(OtherFragment_ &amp;fragment, int offset=0)'],['../structcutlass_1_1FragmentConstIterator.html#a3a8fd8f13c157ed13dc93fd78036c59e',1,'cutlass::FragmentConstIterator::FragmentConstIterator(FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)']]],
-  ['fragmentelement',['FragmentElement',['../structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7',1,'cutlass::TileIteratorBase::FragmentElement()'],['../structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464',1,'cutlass::TileLoadIterator::FragmentElement()'],['../structcutlass_1_1TileStoreIterator.html#a2b13136a970fae187fcb377c9be28fac',1,'cutlass::TileStoreIterator::FragmentElement()']]],
-  ['fragmentiterator',['FragmentIterator',['../structcutlass_1_1FragmentIterator.html',1,'cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;'],['../structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5',1,'cutlass::TileIteratorBase::FragmentIterator()'],['../structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591',1,'cutlass::TileLoadIterator::FragmentIterator()'],['../structcutlass_1_1TileStoreIterator.html#a0843b2d82422e7178f324a8d3be9d705',1,'cutlass::TileStoreIterator::FragmentIterator()'],['../structcutlass_1_1FragmentIterator.html#ae1825fe3e138e2aa62d27dab2b5227b4',1,'cutlass::FragmentIterator::FragmentIterator()']]],
-  ['fragmentload',['FragmentLoad',['../structcutlass_1_1FragmentLoad.html',1,'cutlass']]],
-  ['fragmentload_3c_20iteratorfragment_3a_3akscalar_2c_20kaccesssize_2c_20scalar_5f_2c_20memory_5f_2c_20fragmentelement_5f_2c_20kstride_20_3e',['FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;',['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html',1,'cutlass']]],
-  ['fragmentload_3c_20iteratorfragment_3a_3akwmmamatrix_2c_20kaccesssize_2c_20scalar_5f_2c_20memory_5f_2c_20fragmentelement_5f_2c_20kstride_20_3e',['FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;',['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html',1,'cutlass']]],
-  ['fragmentmultiplyadd',['FragmentMultiplyAdd',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html',1,'cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;'],['../structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8',1,'cutlass::gemm::LinearScaling::FragmentMultiplyAdd()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af19e14a22aefd1124f7d31beec6f8c42',1,'cutlass::gemm::FragmentMultiplyAdd::FragmentMultiplyAdd()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a21f0965f6178917c7f5c6d79ed048059',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::FragmentMultiplyAdd()']]],
-  ['fragmentmultiplyadd_3c_20half_20_3e',['FragmentMultiplyAdd&lt; half &gt;',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html',1,'cutlass::gemm']]],
-  ['fragmentshape',['FragmentShape',['../structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76',1,'cutlass::FragmentIterator::FragmentShape()'],['../structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577',1,'cutlass::FragmentConstIterator::FragmentShape()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4',1,'cutlass::gemm::HgemmSwizzle::FragmentShape()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004',1,'cutlass::gemm::IgemmSwizzle::FragmentShape()'],['../structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24',1,'cutlass::TileIteratorBase::FragmentShape()'],['../structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869',1,'cutlass::TileLoadIterator::FragmentShape()'],['../structcutlass_1_1TileStoreIterator.html#a3b872e85844c9e009fa480a71a829136',1,'cutlass::TileStoreIterator::FragmentShape()']]],
-  ['fragmentstore',['FragmentStore',['../structcutlass_1_1FragmentStore.html',1,'cutlass']]],
-  ['fragmentstore_3c_20iteratorfragment_3a_3akscalar_2c_20kaccesssize_2c_20scalar_5f_2c_20memory_5f_2c_20fragmentelement_5f_2c_20kstride_20_3e',['FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;',['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html',1,'cutlass']]],
-  ['fragmentstore_3c_20iteratorfragment_3a_3akwmmamatrix_2c_20kaccesssize_2c_20scalar_5f_2c_20memory_5f_2c_20fragmentelement_5f_2c_20kstride_20_3e',['FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;',['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html',1,'cutlass']]],
-  ['functor',['functor',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06',1,'cutlass::gemm::GemmEpilogueTraits::Params::functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1',1,'cutlass::gemm::GemmEpilogue::Functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee',1,'cutlass::gemm::GemmEpilogueTraits::Functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Functor()']]]
+  ['fragmenta',['FragmentA',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649',1,'cutlass::gemm::ThreadMultiplyAdd::FragmentA()']]],
+  ['fragmentb',['FragmentB',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad',1,'cutlass::gemm::ThreadMultiplyAdd::FragmentB()']]],
+  ['fragmentconstiterator',['FragmentConstIterator',['../structcutlass_1_1FragmentConstIterator.html',1,'cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;'],['../structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5',1,'cutlass::TileIteratorBase::FragmentConstIterator()'],['../structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca',1,'cutlass::TileLoadIterator::FragmentConstIterator()'],['../structcutlass_1_1TileStoreIterator.html#adfcd8a2e63bd0c515ef03760cc1c4283',1,'cutlass::TileStoreIterator::FragmentConstIterator()'],['../structcutlass_1_1FragmentConstIterator.html#ad3e99cd7f56d4aec0a28cfcbde66f5af',1,'cutlass::FragmentConstIterator::FragmentConstIterator(OtherFragment_ &amp;fragment, int offset=0)'],['../structcutlass_1_1FragmentConstIterator.html#a18f926c9c877e15a279f16637bd24e83',1,'cutlass::FragmentConstIterator::FragmentConstIterator(FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)']]],
+  ['fragmentelement',['FragmentElement',['../structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45',1,'cutlass::TileIteratorBase::FragmentElement()'],['../structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6',1,'cutlass::TileLoadIterator::FragmentElement()'],['../structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8',1,'cutlass::TileStoreIterator::FragmentElement()']]],
+  ['fragmentelementtype',['FragmentElementType',['../structcutlass_1_1FragmentElementType.html',1,'cutlass']]],
+  ['fragmentiterator',['FragmentIterator',['../structcutlass_1_1FragmentIterator.html',1,'cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;'],['../structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51',1,'cutlass::TileIteratorBase::FragmentIterator()'],['../structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016',1,'cutlass::TileLoadIterator::FragmentIterator()'],['../structcutlass_1_1TileStoreIterator.html#ace8a65d90db264a0ee93a810be38918f',1,'cutlass::TileStoreIterator::FragmentIterator()'],['../structcutlass_1_1FragmentIterator.html#a638e4e1d84b4ae84e758288c7f37548b',1,'cutlass::FragmentIterator::FragmentIterator()']]],
+  ['fragmentmultiplyadd',['FragmentMultiplyAdd',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html',1,'cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;'],['../structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8',1,'cutlass::gemm::LinearScaling::FragmentMultiplyAdd()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ae1fbd0fd103deda51208102f15f896ed',1,'cutlass::gemm::FragmentMultiplyAdd::FragmentMultiplyAdd()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ad35b57b3f0cf5a467a1b0e48cffc3061',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::FragmentMultiplyAdd()']]],
+  ['fragmentmultiplyadd_3c_20half_2c_20half_2c_20true_20_3e',['FragmentMultiplyAdd&lt; half, half, true &gt;',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html',1,'cutlass::gemm']]],
+  ['fragmentshape',['FragmentShape',['../structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76',1,'cutlass::FragmentIterator::FragmentShape()'],['../structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577',1,'cutlass::FragmentConstIterator::FragmentShape()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4',1,'cutlass::gemm::HgemmSwizzle::FragmentShape()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004',1,'cutlass::gemm::IgemmSwizzle::FragmentShape()'],['../structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be',1,'cutlass::TileIteratorBase::FragmentShape()'],['../structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1',1,'cutlass::TileLoadIterator::FragmentShape()'],['../structcutlass_1_1TileStoreIterator.html#a82ceeea55603dbb0c6e5bf9c22ac692e',1,'cutlass::TileStoreIterator::FragmentShape()']]],
+  ['functor',['Functor',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1',1,'cutlass::gemm::GemmEpilogue::Functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99',1,'cutlass::gemm::GemmEpilogueTraits::Functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57',1,'cutlass::gemm::GemmEpilogue::functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee',1,'cutlass::gemm::GemmEpilogueTraits::Params::functor()']]]
 ];
diff --git a/docs/search/all_7.js b/docs/search/all_7.js
index 4c4dee825..d0d7ba237 100644
--- a/docs/search/all_7.js
+++ b/docs/search/all_7.js
@@ -3,30 +3,36 @@ var searchData=
   ['gcd',['gcd',['../namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8',1,'cutlass']]],
   ['gemm',['Gemm',['../structcutlass_1_1gemm_1_1Gemm.html',1,'cutlass::gemm::Gemm&lt; GemmTraits_ &gt;'],['../structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd',1,'cutlass::gemm::Gemm::Gemm()']]],
   ['gemm_2eh',['gemm.h',['../gemm_8h.html',1,'']]],
+  ['gemm_5fconfig_2eh',['gemm_config.h',['../gemm__config_8h.html',1,'']]],
+  ['gemm_5fcoord_2eh',['gemm_coord.h',['../gemm__coord_8h.html',1,'']]],
+  ['gemm_5fdesc_2eh',['gemm_desc.h',['../gemm__desc_8h.html',1,'']]],
   ['gemm_5fepilogue_2eh',['gemm_epilogue.h',['../gemm__epilogue_8h.html',1,'']]],
   ['gemm_5fepilogue_5ftraits_2eh',['gemm_epilogue_traits.h',['../gemm__epilogue__traits_8h.html',1,'']]],
   ['gemm_5fglobal_5fstream_2eh',['gemm_global_stream.h',['../gemm__global__stream_8h.html',1,'']]],
   ['gemm_5fglobal_5ftile_2eh',['gemm_global_tile.h',['../gemm__global__tile_8h.html',1,'']]],
-  ['gemm_5fkernel',['gemm_kernel',['../namespacecutlass_1_1gemm.html#ad9577c9086b0f7fd1202d7f8109e4439',1,'cutlass::gemm']]],
+  ['gemm_5fkernel_5fnolb',['gemm_kernel_nolb',['../namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9',1,'cutlass::gemm']]],
   ['gemm_5foperand_2eh',['gemm_operand.h',['../gemm__operand_8h.html',1,'']]],
   ['gemm_5fshared_5fstream_2eh',['gemm_shared_stream.h',['../gemm__shared__stream_8h.html',1,'']]],
   ['gemm_5fshared_5ftile_2eh',['gemm_shared_tile.h',['../gemm__shared__tile_8h.html',1,'']]],
+  ['gemm_5fstream_5fpair_2eh',['gemm_stream_pair.h',['../gemm__stream__pair_8h.html',1,'']]],
   ['gemm_5ftraits_2eh',['gemm_traits.h',['../gemm__traits_8h.html',1,'']]],
-  ['gemmconfig',['GemmConfig',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5',1,'cutlass::gemm::GemmTraits::GemmConfig()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118',1,'cutlass::gemm::HgemmTraitsHelper::GemmConfig()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac',1,'cutlass::gemm::IgemmTraitsHelper::GemmConfig()']]],
-  ['gemmconfig_3c_20double_2c_20double_2c_20double_2c_20double_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20double_2c_20double_2c_20double_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_202_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_202_2c_201_2c_202_2c_201_2c_202_20_3e',['GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmconfig_3c_20float_2c_20float_2c_20float_2c_20float_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20float_2c_20float_2c_20float_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_204_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_204_2c_201_2c_204_2c_201_2c_202_20_3e',['GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmconfig_3c_20half_2c_20half_2c_20half_2c_20half_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20half_2c_20half_2c_20half_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_208_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_208_2c_202_2c_208_2c_202_2c_202_20_3e',['GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmconfig_3c_20int8_5ft_2c_20int8_5ft_2c_20int8_5ft_2c_20int8_5ft_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_204_2c_202_20_3e',['GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmconfig_3c_20int8_5ft_2c_20int8_5ft_2c_20scalard_5f_2c_20scalard_5f_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_2016_2c_201_2c_204_2c_201_2c_202_20_3e',['GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmdesc',['GemmDesc',['../structcutlass_1_1gemm_1_1GemmDesc.html',1,'cutlass::gemm']]],
-  ['gemmepilogue',['GemmEpilogue',['../structcutlass_1_1gemm_1_1GemmEpilogue.html',1,'cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925',1,'cutlass::gemm::GemmEpilogue::GemmEpilogue()']]],
-  ['gemmepiloguetraits',['GemmEpilogueTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6',1,'cutlass::gemm::HgemmTraitsHelper::GemmEpilogueTraits()']]],
-  ['gemmepiloguetraits_3c_20gemmconfig_5f_3a_3aoutputtile_2c_20gemmconfig_5f_3a_3aaccumulators_2c_20helper_5f_3a_3agloballoaditeratorc_2c_20helper_5f_3a_3aglobaltransformerc_2c_20helper_5f_3a_3aglobaltransformerd_2c_20helper_5f_3a_3aglobalstoreiteratord_2c_20helper_5f_3a_3asharedstoreiteratord_2c_20helper_5f_3a_3asharedstoretransformerd_2c_20helper_5f_3a_3asharedloaditeratord_2c_20helper_5f_3a_3aiterations_2c_20helper_5f_3a_3adelta_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm']]],
-  ['gemmepiloguetraits_3c_20igemmconfig_5f_3a_3aoutputtile_2c_20igemmconfig_5f_3a_3aaccumulators_2c_20helper_5f_3a_3agloballoaditeratorc_2c_20helper_5f_3a_3aglobaltransformerc_2c_20helper_5f_3a_3aglobaltransformerd_2c_20helper_5f_3a_3aglobalstoreiteratord_2c_20helper_5f_3a_3asharedstoreiteratord_2c_20helper_5f_3a_3asharedstoretransformerd_2c_20helper_5f_3a_3asharedloaditeratord_2c_20helper_5f_3a_3aiterations_2c_20helper_5f_3a_3adelta_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm']]],
+  ['gemmconfig',['GemmConfig',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5',1,'cutlass::gemm::GemmTraits::GemmConfig()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4',1,'cutlass::gemm::HgemmTraitsHelper::GemmConfig()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71',1,'cutlass::gemm::IgemmTraitsHelper::GemmConfig()']]],
+  ['gemmconfig_3c_20double_2c_20double_2c_20double_2c_20double_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20double_2c_20double_2c_20double_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_202_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_202_2c_201_2c_202_2c_201_2c_202_2c_20false_2c_20false_2c_20false_20_3e',['GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20float_2c_20float_2c_20float_2c_20float_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20float_2c_20float_2c_20float_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_204_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_204_2c_201_2c_204_2c_201_2c_202_2c_20false_2c_20true_2c_20klaunchbounds_20_3e',['GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20half_2c_20half_2c_20half_2c_20half_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20half_2c_20half_2c_20half_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_208_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_208_2c_202_2c_208_2c_202_2c_202_2c_20false_2c_20true_2c_20false_20_3e',['GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20int8_5ft_2c_20int8_5ft_2c_20int8_5ft_2c_20int8_5ft_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_204_2c_202_2c_20false_2c_20true_2c_20false_20_3e',['GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20int8_5ft_2c_20int8_5ft_2c_20scalard_5f_2c_20scalard_5f_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_2016_2c_201_2c_204_2c_201_2c_202_2c_20false_2c_20false_2c_20false_20_3e',['GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20scalara_5f_2c_20scalarb_5f_2c_20scalarc_5f_2c_20scalard_5f_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20scalara_5f_2c_20scalarb_5f_2c_20float_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_204_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_204_2c_201_2c_204_2c_201_2c_202_20_3e',['GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmcoord',['GemmCoord',['../structcutlass_1_1gemm_1_1GemmCoord.html',1,'cutlass::gemm::GemmCoord'],['../structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01',1,'cutlass::gemm::GemmCoord::GemmCoord()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a03e6bfa95156962be51e190d381c8b5e',1,'cutlass::gemm::GemmCoord::GemmCoord(Coord&lt; 3, Index &gt; const &amp;coord, Index _batch=0)'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a65d1ca12c0f27984920cf1700322a746',1,'cutlass::gemm::GemmCoord::GemmCoord(Coord&lt; 4, Index &gt; const &amp;coord)'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a17da9936dbad99f2402c42b1bd6ea5ea',1,'cutlass::gemm::GemmCoord::GemmCoord(Index coord[4])'],['../structcutlass_1_1gemm_1_1GemmCoord.html#ac3b1cbdf86bd36d6b4b5e295ef846dfe',1,'cutlass::gemm::GemmCoord::GemmCoord(Index k, Index n, Index m, Index batch=0)']]],
+  ['gemmdesc',['GemmDesc',['../structcutlass_1_1gemm_1_1GemmDesc.html',1,'cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1GemmDesc.html#ae2708b731cbb99d3e638382ecf599425',1,'cutlass::gemm::GemmDesc::GemmDesc()'],['../structcutlass_1_1gemm_1_1GemmDesc.html#a948af4a974f1aa74d3b6da9cd3e185de',1,'cutlass::gemm::GemmDesc::GemmDesc(Coord&lt; 3 &gt; _problem_size, SType _alpha, TensorRefA const &amp;_A, TensorRefB const &amp;_B, SType _beta, TensorRefC const &amp;_C, TensorRefD const &amp;_D)'],['../structcutlass_1_1gemm_1_1GemmDesc.html#a7292ac0196f22525b13f223a02271bc3',1,'cutlass::gemm::GemmDesc::GemmDesc(GemmCoord _problem_size, SType _alpha, TensorRefA const &amp;_A, TensorRefB const &amp;_B, SType _beta, TensorRefC const &amp;_C, TensorRefD const &amp;_D)'],['../structcutlass_1_1gemm_1_1GemmDesc.html#af96cd9c8f2454ea118dfa7358dd24824',1,'cutlass::gemm::GemmDesc::GemmDesc(GemmCoord _problem_size, SType _alpha, TensorRefA const &amp;_A, long long _batch_stride_A, TensorRefB const &amp;_B, long long _batch_stride_B, SType _beta, TensorRefC const &amp;_C, long long _batch_stride_C, TensorRefD const &amp;_D, long long _batch_stride_D)']]],
+  ['gemmepilogue',['GemmEpilogue',['../structcutlass_1_1gemm_1_1GemmEpilogue.html',1,'cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8',1,'cutlass::gemm::GemmEpilogue::GemmEpilogue()']]],
+  ['gemmepiloguetraits',['GemmEpilogueTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047',1,'cutlass::gemm::HgemmTraitsHelper::GemmEpilogueTraits()']]],
+  ['gemmepiloguetraits_3c_20gemmconfig_5f_3a_3aoutputtile_2c_20gemmconfig_5f_3a_3aaccumulators_2c_20helper_5f_3a_3agloballoaditeratorc_2c_20helper_5f_3a_3aglobaltransformerc_2c_20helper_5f_3a_3aglobaltransformerd_2c_20helper_5f_3a_3aglobalstoreiteratord_2c_20helper_5f_3a_3asharedstoreiteratord_2c_20helper_5f_3a_3asharedstoretransformerd_2c_20helper_5f_3a_3asharedloadstreamd_2c_20helper_5f_3a_3aiterations_2c_20helper_5f_3a_3adelta_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm']]],
+  ['gemmepiloguetraits_3c_20igemmconfig_5f_3a_3aoutputtile_2c_20igemmconfig_5f_3a_3aaccumulators_2c_20helper_5f_3a_3agloballoaditeratorc_2c_20helper_5f_3a_3aglobaltransformerc_2c_20helper_5f_3a_3aglobaltransformerd_2c_20helper_5f_3a_3aglobalstoreiteratord_2c_20helper_5f_3a_3asharedstoreiteratord_2c_20helper_5f_3a_3asharedstoretransformerd_2c_20helper_5f_3a_3asharedloadstreamd_2c_20helper_5f_3a_3aiterations_2c_20helper_5f_3a_3adelta_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm']]],
   ['gemmepiloguetraitshelper',['GemmEpilogueTraitsHelper',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html',1,'cutlass::gemm']]],
   ['gemmepiloguetraitshelper_3c_20igemmconfig_5f_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html',1,'cutlass::gemm']]],
-  ['gemmglobaliteratorab',['GemmGlobalIteratorAb',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html',1,'cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a34cb153d311377388e7819296a84d07e',1,'cutlass::gemm::GemmGlobalIteratorAb::GemmGlobalIteratorAb()']]],
-  ['gemmglobaliteratorcd',['GemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html',1,'cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6dae81995ab94c0b7f28eeeeb84a6c8d',1,'cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a64f1df43acb37a1901f0b55becaa9557',1,'cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd(Params const &amp;params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())']]],
+  ['gemmglobaliteratorab',['GemmGlobalIteratorAb',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html',1,'cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5',1,'cutlass::gemm::GemmGlobalIteratorAb::GemmGlobalIteratorAb()']]],
+  ['gemmglobaliteratorcd',['GemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html',1,'cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff',1,'cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block_offset, ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6',1,'cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())']]],
   ['gemmglobaltilecdtraits',['GemmGlobalTileCdTraits',['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html',1,'cutlass::gemm']]],
   ['gemmglobaltiletraits',['GemmGlobalTileTraits',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html',1,'cutlass::gemm']]],
   ['gemmglobaltiletraits_3c_20gemmoperand_3a_3akc_2c_20matrixlayout_3a_3akcolumnmajor_2c_20scalar_5f_2c_20tile_5f_2c_20threads_5f_2c_20kaccesssize_5f_20_3e',['GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html',1,'cutlass::gemm']]],
@@ -39,11 +45,11 @@ var searchData=
   ['gemmsharedstoretileabtraits',['GemmSharedStoreTileAbTraits',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html',1,'cutlass::gemm']]],
   ['gemmsharedstoretiledtraits',['GemmSharedStoreTileDTraits',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html',1,'cutlass::gemm']]],
   ['gemmsharedstorewithskewtileabtraits',['GemmSharedStoreWithSkewTileAbTraits',['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html',1,'cutlass::gemm']]],
-  ['gemmtiletraitshelpera',['GemmTileTraitsHelperA',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; Kind, GemmConfig_ &gt;'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417',1,'cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf',1,'cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperA()']]],
+  ['gemmtiletraitshelpera',['GemmTileTraitsHelperA',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; Kind, GemmConfig_ &gt;'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02',1,'cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3',1,'cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperA()']]],
   ['gemmtiletraitshelpera_3c_20klayout_5f_2c_20gemmconfig_5f_20_3e',['GemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html',1,'cutlass::gemm']]],
   ['gemmtiletraitshelpera_3c_20matrixlayout_3a_3akcolumnmajor_2c_20gemmconfig_5f_20_3e',['GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html',1,'cutlass::gemm']]],
   ['gemmtiletraitshelpera_3c_20matrixlayout_3a_3akrowmajor_2c_20gemmconfig_5f_20_3e',['GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html',1,'cutlass::gemm']]],
-  ['gemmtiletraitshelperb',['GemmTileTraitsHelperB',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; Kind, GemmConfig_ &gt;'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89',1,'cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8',1,'cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperB()']]],
+  ['gemmtiletraitshelperb',['GemmTileTraitsHelperB',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; Kind, GemmConfig_ &gt;'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d',1,'cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685',1,'cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperB()']]],
   ['gemmtiletraitshelperb_3c_20klayout_5f_2c_20gemmconfig_5f_20_3e',['GemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html',1,'cutlass::gemm']]],
   ['gemmtiletraitshelperb_3c_20matrixlayout_3a_3akcolumnmajor_2c_20gemmconfig_5f_20_3e',['GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html',1,'cutlass::gemm']]],
   ['gemmtiletraitshelperb_3c_20matrixlayout_3a_3akrowmajor_2c_20gemmconfig_5f_20_3e',['GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html',1,'cutlass::gemm']]],
@@ -51,35 +57,40 @@ var searchData=
   ['gemmtraits_3c_20gemmconfig_5f_2c_20helper_5f_3a_3agloballoadstreama_2c_20helper_5f_3a_3agloballoadstreamb_2c_20helper_5f_3a_3asharedloadstreama_2c_20helper_5f_3a_3asharedloadstreamb_2c_20epilogue_5f_2c_20identityblockswizzle_2c_20index_5f_2c_20clearaccumulators_3c_20gemmconfig_5f_3a_3aaccumulators_3a_3aelement_20_3e_20_3e',['GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;',['../structcutlass_1_1gemm_1_1GemmTraits.html',1,'cutlass::gemm']]],
   ['gemmtraits_3c_20gemmconfig_5f_2c_20simplifiedgemmtraitshelper_3c_20gemmtiletraitshelpera_3c_20klayouta_5f_2c_20gemmconfig_5f_20_3e_2c_20gemmtiletraitshelperb_3c_20klayoutb_5f_2c_20gemmconfig_5f_20_3e_2c_20index_5f_20_3e_20_3a_3agloballoadstreama_2c_20simplifiedgemmtraitshelper_3c_20gemmtiletraitshelpera_3c_20klayouta_5f_2c_20gemmconfig_5f_20_3e_2c_20gemmtiletraitshelperb_3c_20klayoutb_5f_2c_20gemmconfig_5f_20_3e_2c_20index_5f_20_3e_20_3a_3agloballoadstreamb_2c_20simplifiedgemmtraitshelper_3c_20gemmtiletraitshelpera_3c_20klayouta_5f_2c_20gemmconfig_5f_20_3e_2c_20gemmtiletraitshelperb_3c_20klayoutb_5f_2c_20gemmconfig_5f_20_3e_2c_20index_5f_20_3e_20_3a_3asharedloadstreama_2c_20simplifiedgemmtraitshelper_3c_20gemmtiletraitshelpera_3c_20klayouta_5f_2c_20gemmconfig_5f_20_3e_2c_20gemmtiletraitshelperb_3c_20klayoutb_5f_2c_20gemmconfig_5f_20_3e_2c_20index_5f_20_3e_20_3a_3asharedloadstreamb_2c_20gemmepilogue_3c_20gemmepiloguetraits_5f_20_3e_2c_20identityblockswizzle_2c_20index_5f_2c_20clearaccumulators_3c_20gemmconfig_5f_3a_3aaccumulators_3a_3aelement_20_3e_20_3e',['GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;',['../structcutlass_1_1gemm_1_1GemmTraits.html',1,'cutlass::gemm']]],
   ['gemmtraits_3c_20helper_5f_3a_3agemmconfig_2c_20helper_5f_3a_3agloballoadstreama_2c_20helper_5f_3a_3agloballoadstreamb_2c_20helper_5f_3a_3asharedloadstreama_2c_20helper_5f_3a_3asharedloadstreamb_2c_20helper_5f_3a_3aepilogue_2c_20identityblockswizzle_2c_20index_5f_2c_20helper_5f_3a_3aclearaccumulators_20_3e',['GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;',['../structcutlass_1_1gemm_1_1GemmTraits.html',1,'cutlass::gemm']]],
-  ['get',['get',['../classcutlass_1_1PredicateVector_1_1Iterator.html#af035589126434bd2dbef4000cd864b8b',1,'cutlass::PredicateVector::Iterator::get()'],['../structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38',1,'cutlass::ComputeOffsetFromShape::get()'],['../structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html#a5198e838e3892245fe7b10884555ec93',1,'cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;::get()'],['../structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html#a11bf40abc57580db5ce4b0fd4c3e55ff',1,'cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;::get()'],['../structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409',1,'cutlass::ComputeOffsetFromStrides::get()'],['../structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html#acdbb9c7cdf9fc054656614f72396434e',1,'cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;::get()'],['../structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html#a512a9d46f6bea9d85641d7263bcfee36',1,'cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad',1,'cutlass::ComputeThreadOffsetFromStrides::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html#a5d446b2663c01362361e09435a726996',1,'cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html#a6e621f5fae2ba29277fde46be1cede24',1,'cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;::get()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a2e7c14b8a118f81c1df46ea5045e297b',1,'cutlass::platform::unique_ptr::get()']]],
-  ['get_5fcoord_5fdhw',['get_Coord_dhw',['../namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e',1,'cutlass']]],
-  ['get_5fcoord_5fhw',['get_Coord_hw',['../namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e',1,'cutlass::get_Coord_hw(Coord&lt; 3 &gt; const &amp;coord)'],['../namespacecutlass.html#a082e7a2e4acc2879468243f5732ccf0b',1,'cutlass::get_Coord_hw(Coord&lt; 4 &gt; const &amp;coord)']]],
-  ['get_5fcoord_5fhwc',['get_Coord_hwc',['../namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f',1,'cutlass']]],
+  ['get',['get',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a1661baed19b4aa4eea725a6f6e6b26a3',1,'cutlass::detail::ScalarOrPointer::get()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#af035589126434bd2dbef4000cd864b8b',1,'cutlass::PredicateVector::Iterator::get()'],['../structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b',1,'cutlass::ComputeOffsetFromShape::get()'],['../structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e',1,'cutlass::ComputeOffsetFromStrides::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad',1,'cutlass::ComputeThreadOffsetFromStrides::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html#a5d446b2663c01362361e09435a726996',1,'cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html#a6e621f5fae2ba29277fde46be1cede24',1,'cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;::get()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a2e7c14b8a118f81c1df46ea5045e297b',1,'cutlass::platform::unique_ptr::get()']]],
+  ['get_5fbatch_5fid',['get_batch_id',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a8f84a2b830caecff3edd052dc24635e6',1,'cutlass::gemm::IdentityBlockSwizzle::get_batch_id()'],['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#abb21a72e2cef3217f446f70758c59c1e',1,'cutlass::gemm::ColumnMajorBlockSwizzle::get_batch_id()'],['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a9be74716c0e3dc6a7f4cdd64cbb16211',1,'cutlass::gemm::RowMajorBlockSwizzle::get_batch_id()']]],
   ['get_5fdeleter',['get_deleter',['../classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0',1,'cutlass::platform::unique_ptr::get_deleter() noexcept'],['../classcutlass_1_1platform_1_1unique__ptr.html#aa427ab4ea4f2336ac6db28d53a4c11ac',1,'cutlass::platform::unique_ptr::get_deleter() const noexcept']]],
+  ['get_5fgrid_5flayout',['get_grid_layout',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#afc20f302a5cc5b736cfc1c91dfcaa57c',1,'cutlass::gemm::IdentityBlockSwizzle::get_grid_layout()'],['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a927ce3eed4cd22554f9e6fe20a1ccc6e',1,'cutlass::gemm::ColumnMajorBlockSwizzle::get_grid_layout()'],['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#aa9fc825e19404ff527cb3d2dcc55ae1c',1,'cutlass::gemm::RowMajorBlockSwizzle::get_grid_layout()']]],
+  ['get_5fpointer_5foffset',['get_pointer_offset',['../structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c',1,'cutlass::TensorRefBatchStrided']]],
+  ['get_5fptr',['get_ptr',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a6b066568947df37094e4125b0347faf1',1,'cutlass::detail::ScalarOrPointer']]],
+  ['get_5fscalar',['get_scalar',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a81bd7b4f50b8d7c5effe5291ad920380',1,'cutlass::detail::ScalarOrPointer']]],
+  ['get_5fthreadblock_5foffset',['get_threadblock_offset',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a386e5cf702b0dcc3d57f9fdb4ab5d236',1,'cutlass::gemm::IdentityBlockSwizzle::get_threadblock_offset()'],['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a380fb7f905548c52933ea411166424b4',1,'cutlass::gemm::ColumnMajorBlockSwizzle::get_threadblock_offset()'],['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#af7c1b4e0afb08e893cd14a169a0b47cd',1,'cutlass::gemm::RowMajorBlockSwizzle::get_threadblock_offset()']]],
   ['getextent',['GetExtent',['../structcutlass_1_1gemm_1_1GetExtent.html',1,'cutlass::gemm']]],
   ['getextent_3c_20gemmoperand_3a_3aka_2c_20tile_5f_20_3e',['GetExtent&lt; GemmOperand::kA, Tile_ &gt;',['../structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html',1,'cutlass::gemm']]],
   ['getextent_3c_20gemmoperand_3a_3akb_2c_20tile_5f_20_3e',['GetExtent&lt; GemmOperand::kB, Tile_ &gt;',['../structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html',1,'cutlass::gemm']]],
-  ['global',['global',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#a3c2980547310ec4307f3a5f9817dfc51',1,'cutlass::gemm::GemmTraits::StreamSharedStorage']]],
-  ['global_5fstream_5fa',['global_stream_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64',1,'cutlass::gemm::GemmTraits::Params']]],
-  ['global_5fstream_5fb',['global_stream_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596',1,'cutlass::gemm::GemmTraits::Params']]],
+  ['getlinearidx',['getLinearIdx',['../namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e',1,'cutlass::gemm']]],
+  ['getlinearidx_3c_20swizzledirection_3a_3aboustrophedon_20_3e',['getLinearIdx&lt; swizzleDirection::Boustrophedon &gt;',['../namespacecutlass_1_1gemm.html#a37c566ad59d61647374f215c3d33f088',1,'cutlass::gemm']]],
+  ['global_5fto_5fshared_5fstream',['global_to_shared_stream',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3',1,'cutlass::gemm::GemmTraits::Params::global_to_shared_stream()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a61fcc63cb0df6754eef16f5cf138f3a2',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage::global_to_shared_stream()']]],
   ['globalfragmentc',['GlobalFragmentC',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e',1,'cutlass::gemm::IgemmEpilogueTraitsHelper']]],
   ['globalfragmentd',['GlobalFragmentD',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88',1,'cutlass::gemm::IgemmEpilogueTraitsHelper']]],
   ['globaliterator',['GlobalIterator',['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642',1,'cutlass::gemm::HgemmSwizzle::GlobalIterator()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a880878914c25db44a1781725c24af514',1,'cutlass::gemm::IgemmSwizzle::GlobalIterator()']]],
-  ['globalloaditeratora',['GlobalLoadIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorA()']]],
-  ['globalloaditeratorb',['GlobalLoadIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorB()']]],
-  ['globalloaditeratorc',['GlobalLoadIteratorC',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a',1,'cutlass::gemm::GemmEpilogue::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2',1,'cutlass::gemm::GemmEpilogueTraits::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalLoadIteratorC()']]],
-  ['globalloadstream',['GlobalLoadStream',['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html',1,'cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a4dd11a75375b6b9d7b8dcbd4d402d8d6',1,'cutlass::gemm::GlobalLoadStream::GlobalLoadStream()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ab2961b4db0694cf128d55d38a98db575',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::GlobalLoadStream()']]],
-  ['globalloadstreama',['GlobalLoadStreamA',['../structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47',1,'cutlass::gemm::GemmTraits::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamA()']]],
-  ['globalloadstreamb',['GlobalLoadStreamB',['../structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b',1,'cutlass::gemm::GemmTraits::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamB()']]],
-  ['globalloadstreambase',['GlobalLoadStreamBase',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html',1,'cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278',1,'cutlass::gemm::GlobalLoadStreamBase::GlobalLoadStreamBase()']]],
+  ['globalloaditerator',['GlobalLoadIterator',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator()']]],
+  ['globalloaditeratora',['GlobalLoadIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorA()']]],
+  ['globalloaditeratorb',['GlobalLoadIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorB()']]],
+  ['globalloaditeratorc',['GlobalLoadIteratorC',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a',1,'cutlass::gemm::GemmEpilogue::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24',1,'cutlass::gemm::GemmEpilogueTraits::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalLoadIteratorC()']]],
+  ['globalloadstream',['GlobalLoadStream',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html',1,'cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8',1,'cutlass::gemm::GemmTraits::GlobalLoadStream()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#aec86bdf5d7d4ad1f7b6ebebcf2da8395',1,'cutlass::gemm::GlobalLoadStream::GlobalLoadStream()']]],
+  ['globalloadstreama',['GlobalLoadStreamA',['../structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47',1,'cutlass::gemm::GemmTraits::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamA()']]],
+  ['globalloadstreamb',['GlobalLoadStreamB',['../structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b',1,'cutlass::gemm::GemmTraits::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamB()']]],
+  ['globalloadstreampair',['GlobalLoadStreamPair',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html',1,'cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab97442e24a1d6d64727b6320ab901ad1',1,'cutlass::gemm::GlobalLoadStreamPair::GlobalLoadStreamPair()']]],
   ['globalloadtiletraits',['GlobalLoadTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aaa009025dcd6360ead1dc18005688821',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalLoadTileTraits()']]],
-  ['globalstoreiteratord',['GlobalStoreIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4',1,'cutlass::gemm::GemmEpilogue::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1',1,'cutlass::gemm::GemmEpilogueTraits::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalStoreIteratorD()']]],
+  ['globalstoreiteratord',['GlobalStoreIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4',1,'cutlass::gemm::GemmEpilogue::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02',1,'cutlass::gemm::GemmEpilogueTraits::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalStoreIteratorD()']]],
   ['globalstoretiletraits',['GlobalStoreTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a16b06a1611dbd22adaa0c9ee5e1b15bd',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalStoreTileTraits()']]],
-  ['globaltiletraits',['GlobalTileTraits',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a738774d1eb79de7e29c372ddfd48258d',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a24f38105e3c331c733cb672c3a9be588',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()']]],
-  ['globaltransformera',['GlobalTransformerA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647',1,'cutlass::gemm::HgemmTraitsHelper::GlobalTransformerA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d',1,'cutlass::gemm::IgemmTraitsHelper::GlobalTransformerA()']]],
-  ['globaltransformerb',['GlobalTransformerB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de',1,'cutlass::gemm::HgemmTraitsHelper::GlobalTransformerB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9',1,'cutlass::gemm::IgemmTraitsHelper::GlobalTransformerB()']]],
-  ['globaltransformerc',['GlobalTransformerC',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9',1,'cutlass::gemm::GemmEpilogue::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa',1,'cutlass::gemm::GemmEpilogueTraits::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalTransformerC()']]],
-  ['globaltransformerd',['GlobalTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7',1,'cutlass::gemm::GemmEpilogue::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7',1,'cutlass::gemm::GemmEpilogueTraits::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalTransformerD()']]],
-  ['good',['good',['../classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780',1,'cutlass::TensorRef::good()'],['../classcutlass_1_1TensorView.html#a837881bc82704491accf54aad2b9def9',1,'cutlass::TensorView::good()']]],
-  ['greater',['greater',['../structcutlass_1_1platform_1_1greater.html',1,'cutlass::platform']]]
+  ['globaltiletraits',['GlobalTileTraits',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a66f11407e9f5bf0d6123c81dfee6b330',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a125c9a43da3bcdc00d5194a1376f613c',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits()']]],
+  ['globaltransformera',['GlobalTransformerA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60',1,'cutlass::gemm::HgemmTraitsHelper::GlobalTransformerA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb',1,'cutlass::gemm::IgemmTraitsHelper::GlobalTransformerA()']]],
+  ['globaltransformerb',['GlobalTransformerB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184',1,'cutlass::gemm::HgemmTraitsHelper::GlobalTransformerB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2',1,'cutlass::gemm::IgemmTraitsHelper::GlobalTransformerB()']]],
+  ['globaltransformerc',['GlobalTransformerC',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9',1,'cutlass::gemm::GemmEpilogue::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d',1,'cutlass::gemm::GemmEpilogueTraits::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalTransformerC()']]],
+  ['globaltransformerd',['GlobalTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7',1,'cutlass::gemm::GemmEpilogue::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6',1,'cutlass::gemm::GemmEpilogueTraits::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalTransformerD()']]],
+  ['good',['good',['../classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8',1,'cutlass::TensorRef::good()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::good()']]],
+  ['greater',['greater',['../structcutlass_1_1platform_1_1greater.html',1,'cutlass::platform']]],
+  ['grid',['grid',['../structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b',1,'cutlass::KernelLaunchConfiguration']]]
 ];
diff --git a/docs/search/all_8.js b/docs/search/all_8.js
index 684d3e47c..247ec40c5 100644
--- a/docs/search/all_8.js
+++ b/docs/search/all_8.js
@@ -1,5 +1,6 @@
 var searchData=
 [
+  ['h',['h',['../structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3',1,'cutlass::TileCoord::h() const'],['../structcutlass_1_1TileCoord.html#a1d91ffa0a63ad03431ff79185526f92f',1,'cutlass::TileCoord::h()']]],
   ['hgemm_5fglobal_5ftile_2eh',['hgemm_global_tile.h',['../hgemm__global__tile_8h.html',1,'']]],
   ['hgemm_5fmultiply_5fadd_2eh',['hgemm_multiply_add.h',['../hgemm__multiply__add_8h.html',1,'']]],
   ['hgemm_5fswizzle_2eh',['hgemm_swizzle.h',['../hgemm__swizzle_8h.html',1,'']]],
@@ -18,5 +19,7 @@ var searchData=
   ['hgemmtransformera_3c_20matrixlayout_3a_3akrowmajor_2c_20iterator_5f_20_3e',['HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;',['../structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html',1,'cutlass::gemm']]],
   ['hgemmtransformerb',['HgemmTransformerB',['../structcutlass_1_1gemm_1_1HgemmTransformerB.html',1,'cutlass::gemm']]],
   ['hgemmtransformerb_3c_20matrixlayout_3a_3akcolumnmajor_2c_20iterator_5f_20_3e',['HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;',['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html',1,'cutlass::gemm']]],
-  ['hgemmtransformerb_3c_20matrixlayout_3a_3akrowmajor_2c_20iterator_5f_20_3e',['HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;',['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html',1,'cutlass::gemm']]]
+  ['hgemmtransformerb_3c_20matrixlayout_3a_3akrowmajor_2c_20iterator_5f_20_3e',['HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;',['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html',1,'cutlass::gemm']]],
+  ['hw',['hw',['../structcutlass_1_1TileCoord.html#a0927c4ba212d00f3687034afe6bb8daf',1,'cutlass::TileCoord']]],
+  ['hwc',['hwc',['../structcutlass_1_1TileCoord.html#a11bb7593ce7bba2dcedd199322a8b42b',1,'cutlass::TileCoord']]]
 ];
diff --git a/docs/search/all_9.js b/docs/search/all_9.js
index fe5b5cd3d..d575d372b 100644
--- a/docs/search/all_9.js
+++ b/docs/search/all_9.js
@@ -1,35 +1,39 @@
 var searchData=
 [
   ['identity',['Identity',['../structcutlass_1_1Identity.html',1,'cutlass']]],
-  ['identity_5fblock_5fswizzle_2eh',['identity_block_swizzle.h',['../identity__block__swizzle_8h.html',1,'']]],
-  ['identityblockswizzle',['IdentityBlockSwizzle',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html',1,'cutlass::gemm::IdentityBlockSwizzle'],['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#abfde9b316173b1c0b8622cf22ffb6d68',1,'cutlass::gemm::IdentityBlockSwizzle::IdentityBlockSwizzle()']]],
-  ['idx',['idx',['../structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc',1,'cutlass::Coord']]],
+  ['identityblockswizzle',['IdentityBlockSwizzle',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html',1,'cutlass::gemm::IdentityBlockSwizzle'],['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a046a5dfd01164df2abd514e9a52987c3',1,'cutlass::gemm::IdentityBlockSwizzle::IdentityBlockSwizzle()'],['../group__IdentityBlockSwizzle.html',1,'(Global Namespace)']]],
+  ['identitytensormapfunc',['IdentityTensorMapFunc',['../structcutlass_1_1IdentityTensorMapFunc.html',1,'cutlass']]],
+  ['identitytensormapfunc_3c_20rank_5f_20_3e',['IdentityTensorMapFunc&lt; Rank_ &gt;',['../structcutlass_1_1IdentityTensorMapFunc.html',1,'cutlass']]],
+  ['idx',['idx',['../structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68',1,'cutlass::Coord']]],
   ['igemm_5fepilogue_2eh',['igemm_epilogue.h',['../igemm__epilogue_8h.html',1,'']]],
   ['igemm_5fglobal_5ftile_2eh',['igemm_global_tile.h',['../igemm__global__tile_8h.html',1,'']]],
   ['igemm_5fmultiply_5fadd_2eh',['igemm_multiply_add.h',['../igemm__multiply__add_8h.html',1,'']]],
   ['igemm_5fswizzle_2eh',['igemm_swizzle.h',['../igemm__swizzle_8h.html',1,'']]],
   ['igemm_5ftraits_2eh',['igemm_traits.h',['../igemm__traits_8h.html',1,'']]],
-  ['igemmconfig',['IgemmConfig',['../structcutlass_1_1gemm_1_1IgemmConfig.html',1,'cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt;'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5a52727bb9b5d5f8afa7d0384f564036',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::IgemmConfig()']]],
-  ['igemmconfig_3c_20outputtile_5f_2c_20int8_5ft_2c_20accumulatorsperthread_5f_20_3e',['IgemmConfig&lt; OutputTile_, int8_t, AccumulatorsPerThread_ &gt;',['../structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01AccumulatorsPerThread___01_4.html',1,'cutlass::gemm']]],
-  ['igemmcontiguousglobaltiletraits',['IgemmContiguousGlobalTileTraits',['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html',1,'cutlass::gemm']]],
-  ['igemmepilogue',['IgemmEpilogue',['../structcutlass_1_1gemm_1_1IgemmEpilogue.html',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;'],['../structcutlass_1_1gemm_1_1IgemmEpilogue.html#ab7a51121d24250d6441ee538e6521dc2',1,'cutlass::gemm::IgemmEpilogue::IgemmEpilogue()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a49ac00bed1532707aacd3ff108c84623',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::IgemmEpilogue()']]],
+  ['igemmconfig',['IgemmConfig',['../structcutlass_1_1gemm_1_1IgemmConfig.html',1,'cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt;'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5a52727bb9b5d5f8afa7d0384f564036',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::IgemmConfig()']]],
+  ['igemmconfig_3c_20outputtile_5f_2c_20int8_5ft_2c_20threadgemmshape_5f_20_3e',['IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;',['../structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html',1,'cutlass::gemm']]],
+  ['igemmepilogue',['IgemmEpilogue',['../structcutlass_1_1gemm_1_1IgemmEpilogue.html',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;'],['../structcutlass_1_1gemm_1_1IgemmEpilogue.html#a599a50becefed561d063c1b834188aca',1,'cutlass::gemm::IgemmEpilogue::IgemmEpilogue()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a0a1be1aab827127161406871ca75cbe0',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::IgemmEpilogue()']]],
   ['igemmepilogue_3c_20gemmepiloguetraits_5f_2c_20true_20_3e',['IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;',['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html',1,'cutlass::gemm']]],
   ['igemmepiloguescalar',['IgemmEpilogueScalar',['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html',1,'cutlass::gemm']]],
   ['igemmepiloguescalar_3c_20int_20_3e',['IgemmEpilogueScalar&lt; int &gt;',['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html',1,'cutlass::gemm']]],
   ['igemmepiloguetraits',['IgemmEpilogueTraits',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html',1,'cutlass::gemm']]],
   ['igemmepiloguetraitshelper',['IgemmEpilogueTraitsHelper',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html',1,'cutlass::gemm']]],
   ['igemmfloattoint8converter',['IgemmFloatToInt8Converter',['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html',1,'cutlass::gemm::IgemmFloatToInt8Converter&lt; kElements_ &gt;'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#ac65f020e93584b1bd3cdb849ff625026',1,'cutlass::gemm::IgemmFloatToInt8Converter::IgemmFloatToInt8Converter()']]],
+  ['igemmglobaliteratorab',['IgemmGlobalIteratorAb',['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html',1,'cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;'],['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a489fe448cd7f7e1f3805d33504f9d336',1,'cutlass::gemm::IgemmGlobalIteratorAb::IgemmGlobalIteratorAb()']]],
   ['igemmgloballoadtransformer',['IgemmGlobalLoadTransformer',['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html',1,'cutlass::gemm']]],
   ['igemmgloballoadtransformer_3c_20fragment_3c_20int8_5ft_2c_20kelements_5f_20_3e_2c_20float_20_3e',['IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;',['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html',1,'cutlass::gemm']]],
   ['igemmglobalstoretransformer',['IgemmGlobalStoreTransformer',['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html',1,'cutlass::gemm']]],
   ['igemmglobalstoretransformer_3c_20float_2c_20fragment_3c_20int8_5ft_2c_20kelements_5f_20_3e_20_3e',['IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;',['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html',1,'cutlass::gemm']]],
+  ['igemmglobaltiletraits',['IgemmGlobalTileTraits',['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html',1,'cutlass::gemm']]],
   ['igemmint8tofloatconverter',['IgemmInt8ToFloatConverter',['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html',1,'cutlass::gemm::IgemmInt8ToFloatConverter&lt; kElements_ &gt;'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a88a55a494d3a30d50477d50bf6a8804d',1,'cutlass::gemm::IgemmInt8ToFloatConverter::IgemmInt8ToFloatConverter()']]],
   ['igemmsharedstoretransformer',['IgemmSharedStoreTransformer',['../structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html',1,'cutlass::gemm']]],
   ['igemmswizzle',['IgemmSwizzle',['../structcutlass_1_1gemm_1_1IgemmSwizzle.html',1,'cutlass::gemm::IgemmSwizzle&lt; GlobalIterator_ &gt;'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac041d287c966cf568599d7e462e81d5a',1,'cutlass::gemm::IgemmSwizzle::IgemmSwizzle()']]],
   ['igemmtiletraitshelpera',['IgemmTileTraitsHelperA',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html',1,'cutlass::gemm']]],
-  ['igemmtiletraitshelpera_3c_20matrixlayout_3a_3akcolumnmajor_2c_20gemmconfig_5f_20_3e',['IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html',1,'cutlass::gemm']]],
+  ['igemmtiletraitshelpera_3c_20matrixlayout_3a_3akcolumnmajor_2c_20gemmconfig_5f_2c_20index_5f_20_3e',['IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html',1,'cutlass::gemm']]],
+  ['igemmtiletraitshelpera_3c_20matrixlayout_3a_3akrowmajor_2c_20gemmconfig_5f_2c_20index_5f_20_3e',['IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html',1,'cutlass::gemm']]],
   ['igemmtiletraitshelperb',['IgemmTileTraitsHelperB',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html',1,'cutlass::gemm']]],
-  ['igemmtiletraitshelperb_3c_20matrixlayout_3a_3akrowmajor_2c_20gemmconfig_5f_20_3e',['IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html',1,'cutlass::gemm']]],
+  ['igemmtiletraitshelperb_3c_20matrixlayout_3a_3akcolumnmajor_2c_20gemmconfig_5f_2c_20index_5f_20_3e',['IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html',1,'cutlass::gemm']]],
+  ['igemmtiletraitshelperb_3c_20matrixlayout_3a_3akrowmajor_2c_20gemmconfig_5f_2c_20index_5f_20_3e',['IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html',1,'cutlass::gemm']]],
   ['igemmtraits',['IgemmTraits',['../structcutlass_1_1gemm_1_1IgemmTraits.html',1,'cutlass::gemm']]],
   ['igemmtraitshelper',['IgemmTraitsHelper',['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html',1,'cutlass::gemm']]],
   ['igemmtransformera',['IgemmTransformerA',['../structcutlass_1_1gemm_1_1IgemmTransformerA.html',1,'cutlass::gemm']]],
@@ -38,18 +42,21 @@ var searchData=
   ['igemmtransformerb',['IgemmTransformerB',['../structcutlass_1_1gemm_1_1IgemmTransformerB.html',1,'cutlass::gemm']]],
   ['igemmtransformerb_3c_20matrixlayout_3a_3akcolumnmajor_2c_20iterator_5f_20_3e',['IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html',1,'cutlass::gemm']]],
   ['igemmtransformerb_3c_20matrixlayout_3a_3akrowmajor_2c_20iterator_5f_20_3e',['IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html',1,'cutlass::gemm']]],
-  ['immediateoffsetstrides',['ImmediateOffsetStrides',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf',1,'cutlass::gemm::GemmGlobalTileTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c',1,'cutlass::gemm::GemmGlobalTileCdTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368',1,'cutlass::gemm::GemmSharedLoadTileATraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::ImmediateOffsetStrides()'],['../structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8',1,'cutlass::TileIteratorBase::ImmediateOffsetStrides()']]],
-  ['inc_5fadvance',['inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::inc_advance()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::inc_advance()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2',1,'cutlass::TileIteratorBase::Params::inc_advance()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a9dea455aa86bb59517b4a4d0309e424b',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_advance()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab4b8150f19c9f8649d75c69ec0a76e1a',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_advance()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a174ae7d8aa0664eaf1d6f63c5606baa0',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_advance()'],['../structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37',1,'cutlass::TileLoadIterator::inc_advance()'],['../structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75',1,'cutlass::TileStoreIterator::inc_advance()']]],
-  ['inc_5fc',['inc_c',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a12ead84ea9634e963d10c6df7b7792c9',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_c()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a44287250bf5631a490b514859fd101d1',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_c()']]],
-  ['inc_5fd',['inc_d',['../structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150',1,'cutlass::TileIteratorBase::Params::inc_d()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1e42503e5a54cdc01308e9030aebdd35',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_d()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad26ab8d8010c9a1d7f3b91f60940b460',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_d()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab1ebbe54e4315ac07daf260a88f41d04',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_d()'],['../structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5',1,'cutlass::TileLoadIterator::inc_d()'],['../structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3',1,'cutlass::TileStoreIterator::inc_d()']]],
-  ['inc_5fh',['inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::inc_h()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::inc_h()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366',1,'cutlass::TileIteratorBase::Params::inc_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aa24336597f4a3316d94df6ab0c20f714',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ae07fa10a53d44471a04275145201299e',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_h()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa9a733f35e9be67663c9c8f80b0034d4',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_h()'],['../structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface',1,'cutlass::TileLoadIterator::inc_h()'],['../structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1',1,'cutlass::TileStoreIterator::inc_h()']]],
-  ['inc_5fstage',['inc_stage',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f',1,'cutlass::gemm::SharedLoadStream::inc_stage()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8851150a49e4a9c135279c8c9dfdc592',1,'cutlass::gemm::GemmTraits::SharedLoadStream::inc_stage()'],['../structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64',1,'cutlass::TileLoadIterator::inc_stage()'],['../structcutlass_1_1TileStoreIterator.html#a187e0852ec4862f6d3cb6249bedc3bb3',1,'cutlass::TileStoreIterator::inc_stage()']]],
-  ['inc_5fw',['inc_w',['../structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178',1,'cutlass::TileIteratorBase::Params::inc_w()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a622a4dd27162854ec96efea93cdd4380',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_w()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aec2d692967d9be5d42673dfde21f5427',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_w()'],['../structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073',1,'cutlass::TileLoadIterator::inc_w()'],['../structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1',1,'cutlass::TileStoreIterator::inc_w()']]],
-  ['index',['Index',['../structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34',1,'cutlass::gemm::Gemm::Index()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e',1,'cutlass::gemm::GemmEpilogue::Index()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331',1,'cutlass::gemm::GemmEpilogueTraits::Index()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2',1,'cutlass::gemm::GlobalLoadStreamBase::Index()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f',1,'cutlass::gemm::GemmGlobalIteratorAb::Index()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f',1,'cutlass::gemm::GemmGlobalIteratorCd::Index()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367',1,'cutlass::gemm::GemmTraits::Index()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Index()'],['../structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3',1,'cutlass::TileIteratorBase::Index()'],['../structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36',1,'cutlass::TileLoadIterator::Index()'],['../structcutlass_1_1TileStoreIterator.html#a5ac2280dfcac08cec17b8c0db1c4593e',1,'cutlass::TileStoreIterator::Index()']]],
-  ['initialize',['initialize',['../structcutlass_1_1gemm_1_1Gemm_1_1Params.html#ac00c9d78a187d9c7d53399f971c0e129',1,'cutlass::gemm::Gemm::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a3e9d0fd2989fea776b0cab0e0f2813ce',1,'cutlass::gemm::GemmEpilogueTraits::Params::initialize()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a7c7e448384156c801ed362359a1a6a40',1,'cutlass::gemm::GlobalLoadStreamBase::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#a73091e07b6d4c99f6e0319fbf6bd1709',1,'cutlass::gemm::GemmGlobalIteratorAb::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#af5a496f1b6a46ea6a9894512029add6a',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::initialize()'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a',1,'cutlass::gemm::SharedLoadStream::Params::initialize()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf',1,'cutlass::gemm::SharedLoadStream::initialize()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983',1,'cutlass::gemm::GemmTraits::Params::initialize()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d',1,'cutlass::gemm::LinearScaling::Params::initialize()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#ad6b65c5f3ed7cd9e7ffeb684cbf30d04',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::initialize()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55',1,'cutlass::TileIteratorBase::Params::initialize(Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be',1,'cutlass::TileIteratorBase::Params::initialize(Index _stride_d, Index _stride_h, Index _stride_w)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224',1,'cutlass::TileIteratorBase::Params::initialize()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76',1,'cutlass::TileLoadIterator::Params::initialize(SharedStorage const &amp;storage)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr, Index stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr, Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8',1,'cutlass::TileLoadIterator::Params::initialize()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a71f5238a712f7b2f377fb58938ac829b',1,'cutlass::TileStoreIterator::Params::initialize(SharedStorage &amp;storage)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#af0d26a2df2a1a5ba3c3169b736bd5d43',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr, Index stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#ac1cfe92f1543ba445fa10f1859a0db98',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr, Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#af884f720d36aa82e7f972932686ae986',1,'cutlass::TileStoreIterator::Params::initialize()']]],
-  ['initialize_5fpredicates',['initialize_predicates',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff',1,'cutlass::gemm::GemmGlobalIteratorAb::initialize_predicates()'],['../structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7',1,'cutlass::TileIteratorBase::initialize_predicates()'],['../structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5',1,'cutlass::TileLoadIterator::initialize_predicates()'],['../structcutlass_1_1TileStoreIterator.html#af92ba20db048a9ec96976a1673f0f7c2',1,'cutlass::TileStoreIterator::initialize_predicates()']]],
-  ['inputfragment',['InputFragment',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::InputFragment()'],['../structcutlass_1_1Copy.html#aed254bbc1ad94ed9d335ab02f199ceb1',1,'cutlass::Copy::InputFragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ab5fab63d83eb0444c08bda16491d2627',1,'cutlass::gemm::HgemmSwizzle::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c',1,'cutlass::gemm::IgemmFloatToInt8Converter::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb',1,'cutlass::gemm::IgemmInt8ToFloatConverter::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727',1,'cutlass::gemm::IgemmSwizzle::InputFragment()']]],
-  ['instructionshape',['InstructionShape',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13',1,'cutlass::gemm::FragmentMultiplyAdd::InstructionShape()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ab16a3d8adda89cc4f9765116ea75a4b7',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b',1,'cutlass::gemm::GemmConfig::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa56cdefa659af5ce4efd493b94bafdfd',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad73372a37315b0c17a8db21e40a78574',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b',1,'cutlass::gemm::ThreadMultiplyAdd::InstructionShape()']]],
+  ['imag',['imag',['../classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801',1,'cutlass::platform::complex::imag() const'],['../classcutlass_1_1platform_1_1complex.html#a835363f62c6a079496c22074ab428651',1,'cutlass::platform::complex::imag()'],['../namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6',1,'cutlass::platform::imag(cuFloatComplex const &amp;z)'],['../namespacecutlass_1_1platform.html#af127cab494309510051d6b45914faf33',1,'cutlass::platform::imag(cuFloatComplex &amp;z)'],['../namespacecutlass_1_1platform.html#a1739f880ca8398f808ee57a3f0c3c30b',1,'cutlass::platform::imag(cuDoubleComplex const &amp;z)'],['../namespacecutlass_1_1platform.html#a8f356af3c5828b7d31279a5d075c5bc9',1,'cutlass::platform::imag(cuDoubleComplex &amp;z)'],['../namespacecutlass_1_1platform.html#a714db927a811c86cda26fc12ca830356',1,'cutlass::platform::imag(complex&lt; T &gt; const &amp;z)'],['../namespacecutlass_1_1platform.html#aa35ea4f804f9ed39578b595ba2620c1d',1,'cutlass::platform::imag(complex&lt; T &gt; &amp;z)']]],
+  ['immediateoffsetstrides',['ImmediateOffsetStrides',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf',1,'cutlass::gemm::GemmGlobalTileTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c',1,'cutlass::gemm::GemmGlobalTileCdTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121',1,'cutlass::gemm::GemmSharedLoadTileATraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::ImmediateOffsetStrides()'],['../structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f',1,'cutlass::TileTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4',1,'cutlass::TileIteratorBase::ImmediateOffsetStrides()']]],
+  ['inc_5fadvance',['inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::inc_advance()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3',1,'cutlass::TileIteratorBase::Params::inc_advance()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_advance()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_advance()'],['../structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b',1,'cutlass::TileLoadIterator::inc_advance()'],['../structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d',1,'cutlass::TileStoreIterator::inc_advance()']]],
+  ['inc_5fc',['inc_c',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316',1,'cutlass::gemm::GemmGlobalIteratorCd']]],
+  ['inc_5fd',['inc_d',['../structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd',1,'cutlass::TileIteratorBase::Params::inc_d()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_d()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_d()'],['../structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674',1,'cutlass::TileLoadIterator::inc_d()'],['../structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975',1,'cutlass::TileStoreIterator::inc_d()']]],
+  ['inc_5fh',['inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::inc_h()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06',1,'cutlass::TileIteratorBase::Params::inc_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_h()'],['../structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51',1,'cutlass::TileLoadIterator::inc_h()'],['../structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d',1,'cutlass::TileStoreIterator::inc_h()']]],
+  ['inc_5fstage',['inc_stage',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f',1,'cutlass::gemm::SharedLoadStream::inc_stage()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#ad4b9b1c1fe4b0c6961842d0eff6d7db7',1,'cutlass::gemm::SharedStreamPair::inc_stage()'],['../structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d',1,'cutlass::TileLoadIterator::inc_stage()'],['../structcutlass_1_1TileStoreIterator.html#ad61206a742c8c5ab5bcd64b76ece9f74',1,'cutlass::TileStoreIterator::inc_stage()']]],
+  ['inc_5fw',['inc_w',['../structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c',1,'cutlass::TileIteratorBase::Params::inc_w()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_w()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_w()'],['../structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c',1,'cutlass::TileLoadIterator::inc_w()'],['../structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1',1,'cutlass::TileStoreIterator::inc_w()']]],
+  ['increment',['increment',['../classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808',1,'cutlass::ZipTileIterator']]],
+  ['index',['Index',['../structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c',1,'cutlass::Coord::Index()'],['../structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34',1,'cutlass::gemm::Gemm::Index()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892',1,'cutlass::gemm::GemmCoord::Index()'],['../structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171',1,'cutlass::gemm::GemmDesc::Index()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e',1,'cutlass::gemm::GemmEpilogue::Index()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0',1,'cutlass::gemm::GemmEpilogueTraits::Index()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02',1,'cutlass::gemm::GlobalLoadStream::Index()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f',1,'cutlass::gemm::GemmGlobalIteratorAb::Index()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f',1,'cutlass::gemm::GemmGlobalIteratorCd::Index()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a',1,'cutlass::gemm::GlobalLoadStreamPair::Index()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367',1,'cutlass::gemm::GemmTraits::Index()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Index()'],['../structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f',1,'cutlass::MatrixCoord::Index()'],['../classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890',1,'cutlass::TensorRef::Index()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Index()'],['../structcutlass_1_1TensorRefBatchStrided.html#ab12d9d196122dc3075185ab239a27fb4',1,'cutlass::TensorRefBatchStrided::Index()'],['../structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9',1,'cutlass::TensorRefArray::Index()'],['../classcutlass_1_1TensorView.html#a5a3f096a01e6a2dfe984d7e605380599',1,'cutlass::TensorView::Index()'],['../structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259',1,'cutlass::TileCoord::Index()'],['../structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c',1,'cutlass::TileIteratorBase::Index()'],['../structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827',1,'cutlass::TileLoadIterator::Index()'],['../structcutlass_1_1TileStoreIterator.html#aae07fdedeef68abd4e6c099924c70910',1,'cutlass::TileStoreIterator::Index()'],['../structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652',1,'cutlass::TileLoadStream::Index()'],['../structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4',1,'cutlass::TileStoreStream::Index()'],['../classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0',1,'cutlass::ZipTileIterator::Index()']]],
+  ['initialize',['initialize',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a13395bf81eabdc539c935e179c31d7ca',1,'cutlass::gemm::GemmEpilogueTraits::Params::initialize()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a054aee5b4bf288cc1f5945f2521ef835',1,'cutlass::gemm::GlobalLoadStream::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#ad0602cf5d322e98e3e5990c84ae1e3f3',1,'cutlass::gemm::GemmGlobalIteratorAb::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::initialize()'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a',1,'cutlass::gemm::SharedLoadStream::Params::initialize()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0',1,'cutlass::gemm::SharedLoadStream::initialize()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983',1,'cutlass::gemm::GemmTraits::Params::initialize(GemmDesc_ const &amp;desc)'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#ac4cd0b74130ffc09e4ccb7b0acba87f8',1,'cutlass::gemm::GemmTraits::Params::initialize(Index m, Index n, Index k, typename Epilogue::Scalar alpha, ScalarA const *d_a, Index lda, ScalarB const *d_b, Index ldb, typename Epilogue::Scalar beta, ScalarC const *d_c, Index ldc, ScalarD *d_d, Index ldd)'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a95314e9a9279c4870f37f68a2357e064',1,'cutlass::gemm::GemmTraits::Params::initialize(Index m, Index n, Index k, typename Epilogue::Scalar alpha, ScalarA const *d_a, Index lda, long long int batch_stride_A, ScalarB const *d_b, Index ldb, long long int batch_stride_B, typename Epilogue::Scalar beta, ScalarC const *d_c, Index ldc, long long int batch_stride_C, ScalarD *d_d, Index ldd, long long int batch_stride_D, Index batch_count)'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ad4089906220d4656ba075fb9afd1012c',1,'cutlass::gemm::LinearScaling::Params::initialize(Scalar _alpha, Scalar _beta)'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d',1,'cutlass::gemm::LinearScaling::Params::initialize(GemmDesc_ const &amp;desc)'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ad1b2291b898091ee1966b73bd1ad56fa',1,'cutlass::gemm::LinearScalingDevicePtr::Params::initialize(Scalar alpha, Scalar beta)'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ab4dbffb32daffb64d2033e3091963507',1,'cutlass::gemm::LinearScalingDevicePtr::Params::initialize(Scalar const *alpha, Scalar const *beta)'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a491496037bf6613e128e667f87fda696',1,'cutlass::gemm::LinearScalingDevicePtr::Params::initialize(GemmDesc_ const &amp;desc)'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a98867f4fc4daf790e309f8365e71cc8f',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::initialize()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60',1,'cutlass::TileIteratorBase::Params::initialize(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd',1,'cutlass::TileIteratorBase::Params::initialize(Coord&lt; 4 &gt; const &amp;stride)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9',1,'cutlass::TileIteratorBase::Params::initialize(long long _stride_d, Index _stride_h, Index _stride_w)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9',1,'cutlass::TileIteratorBase::Params::initialize()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803',1,'cutlass::TileLoadIterator::Params::initialize(TensorRef const &amp;ref)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0',1,'cutlass::TileLoadIterator::Params::initialize(SharedStorage const &amp;storage)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d',1,'cutlass::TileLoadIterator::Params::initialize()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#aca14058b112b7d5105658457341726cb',1,'cutlass::TileStoreIterator::Params::initialize(SharedStorage &amp;storage)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a0d36c05a4a757db5ebfe5f180b174b8c',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a23c9e9d1d2bed7e5d8579df9cc42dda3',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a6a7702de0e88449b3d1864b208adf87a',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#ad90642d96a3b5354813fbf4d9b04b83f',1,'cutlass::TileStoreIterator::Params::initialize()']]],
+  ['initialize_5fpredicates',['initialize_predicates',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018',1,'cutlass::gemm::GemmGlobalIteratorAb::initialize_predicates()'],['../structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208',1,'cutlass::TileIteratorBase::initialize_predicates()'],['../structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82',1,'cutlass::TileLoadIterator::initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))'],['../structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49',1,'cutlass::TileLoadIterator::initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)'],['../structcutlass_1_1TileStoreIterator.html#acb6bc889b93d25c9e483a0b7297d7c89',1,'cutlass::TileStoreIterator::initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))'],['../structcutlass_1_1TileStoreIterator.html#a890a7239a89679662aeaea797ba32d32',1,'cutlass::TileStoreIterator::initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)'],['../classcutlass_1_1ZipTileIterator.html#a8f334010614b50d962e4769904d7b76f',1,'cutlass::ZipTileIterator::initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))'],['../classcutlass_1_1ZipTileIterator.html#ab0f93878bbe5aac072450f9bf1dd8b64',1,'cutlass::ZipTileIterator::initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)']]],
+  ['inputfragment',['InputFragment',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::InputFragment()'],['../structcutlass_1_1Copy.html#aed254bbc1ad94ed9d335ab02f199ceb1',1,'cutlass::Copy::InputFragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ab5fab63d83eb0444c08bda16491d2627',1,'cutlass::gemm::HgemmSwizzle::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c',1,'cutlass::gemm::IgemmFloatToInt8Converter::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb',1,'cutlass::gemm::IgemmInt8ToFloatConverter::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727',1,'cutlass::gemm::IgemmSwizzle::InputFragment()'],['../structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3',1,'cutlass::ZipConvert::InputFragment()']]],
+  ['instructionshape',['InstructionShape',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76',1,'cutlass::gemm::FragmentMultiplyAdd::InstructionShape()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b',1,'cutlass::gemm::GemmConfig::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af',1,'cutlass::gemm::ThreadMultiplyAdd::InstructionShape()']]],
+  ['int4_5ft',['int4_t',['../structcutlass_1_1int4__t.html',1,'cutlass']]],
   ['integral_5fconstant',['integral_constant',['../structcutlass_1_1platform_1_1integral__constant.html',1,'cutlass::platform']]],
   ['integral_5fconstant_3c_20bool_2c_20v_20_3e',['integral_constant&lt; bool, V &gt;',['../structcutlass_1_1platform_1_1integral__constant.html',1,'cutlass::platform']]],
   ['integral_5fconstant_3c_20bool_2c_28is_5farithmetic_3c_20t_20_3e_3a_3avalue_7c_7cis_5fvoid_3c_20t_20_3e_3a_3avalue_7c_7cis_5fsame_3c_20nullptr_5ft_2c_20remove_5fcv_3c_20t_20_3e_3a_3atype_20_3e_3a_3avalue_29_3e',['integral_constant&lt; bool,(is_arithmetic&lt; T &gt;::value||is_void&lt; T &gt;::value||is_same&lt; nullptr_t, remove_cv&lt; T &gt;::type &gt;::value)&gt;',['../structcutlass_1_1platform_1_1integral__constant.html',1,'cutlass::platform']]],
@@ -58,6 +65,7 @@ var searchData=
   ['integral_5fconstant_3c_20bool_2c_28is_5fintegral_3c_20t_20_3e_3a_3avalue_7c_7cis_5ffloating_5fpoint_3c_20t_20_3e_3a_3avalue_29_3e',['integral_constant&lt; bool,(is_integral&lt; T &gt;::value||is_floating_point&lt; T &gt;::value)&gt;',['../structcutlass_1_1platform_1_1integral__constant.html',1,'cutlass::platform']]],
   ['integral_5fconstant_3c_20bool_2c_28is_5fsame_3c_20float_2c_20remove_5fcv_3c_20t_20_3e_3a_3atype_20_3e_3a_3avalue_7c_7cis_5fsame_3c_20double_2c_20remove_5fcv_3c_20t_20_3e_3a_3atype_20_3e_3a_3avalue_29_3e',['integral_constant&lt; bool,(is_same&lt; float, remove_cv&lt; T &gt;::type &gt;::value||is_same&lt; double, remove_cv&lt; T &gt;::type &gt;::value)&gt;',['../structcutlass_1_1platform_1_1integral__constant.html',1,'cutlass::platform']]],
   ['integral_5fconstant_3c_20bool_2c_28n_20_26_28n_20_2d_201_29_29_3d_3d0_20_3e',['integral_constant&lt; bool,(N &amp;(N - 1))==0 &gt;',['../structcutlass_1_1platform_1_1integral__constant.html',1,'cutlass::platform']]],
+  ['intermediate_5ffragment',['intermediate_fragment',['../structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093',1,'cutlass::TileLoadStream::intermediate_fragment()'],['../structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71',1,'cutlass::TileStoreStream::intermediate_fragment()']]],
   ['is_5farithmetic',['is_arithmetic',['../structcutlass_1_1platform_1_1is__arithmetic.html',1,'cutlass::platform']]],
   ['is_5fbase_5fof',['is_base_of',['../structcutlass_1_1platform_1_1is__base__of.html',1,'cutlass::platform']]],
   ['is_5fbase_5fof_5fhelper',['is_base_of_helper',['../structcutlass_1_1platform_1_1is__base__of__helper.html',1,'cutlass::platform']]],
@@ -78,7 +86,7 @@ var searchData=
   ['is_5fintegral_3c_20unsigned_20long_20long_20_3e',['is_integral&lt; unsigned long long &gt;',['../structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html',1,'cutlass::platform']]],
   ['is_5fintegral_3c_20unsigned_20short_20_3e',['is_integral&lt; unsigned short &gt;',['../structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html',1,'cutlass::platform']]],
   ['is_5fintegral_3c_20volatile_20t_20_3e',['is_integral&lt; volatile T &gt;',['../structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html',1,'cutlass::platform']]],
-  ['is_5fpointer',['is_pointer',['../structcutlass_1_1platform_1_1is__pointer.html',1,'cutlass::platform']]],
+  ['is_5fpointer',['is_pointer',['../structcutlass_1_1platform_1_1is__pointer.html',1,'cutlass::platform::is_pointer&lt; T &gt;'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a95373f3d1b286c61cb204ba6a1282ce0',1,'cutlass::detail::ScalarOrPointer::is_pointer()']]],
   ['is_5fpointer_5fhelper',['is_pointer_helper',['../structcutlass_1_1platform_1_1is__pointer__helper.html',1,'cutlass::platform']]],
   ['is_5fpointer_5fhelper_3c_20remove_5fcv_3c_20t_20_3e_3a_3atype_20_3e',['is_pointer_helper&lt; remove_cv&lt; T &gt;::type &gt;',['../structcutlass_1_1platform_1_1is__pointer__helper.html',1,'cutlass::platform']]],
   ['is_5fpointer_5fhelper_3c_20t_20_2a_20_3e',['is_pointer_helper&lt; T * &gt;',['../structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html',1,'cutlass::platform']]],
@@ -92,16 +100,13 @@ var searchData=
   ['is_5fvolatile_3c_20volatile_20t_20_3e',['is_volatile&lt; volatile T &gt;',['../structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html',1,'cutlass::platform']]],
   ['is_5fzero',['is_zero',['../structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a',1,'cutlass::PredicateVector::is_zero()'],['../namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb',1,'cutlass::gemm::is_zero(T x)'],['../namespacecutlass_1_1gemm.html#a4a12fcfae60f26efa47bf0a79483d8ac',1,'cutlass::gemm::is_zero(half x)']]],
   ['isvector',['IsVector',['../structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2',1,'cutlass::VectorTraits::IsVector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aead181209c756f25ab5870682670bb99',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::IsVector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a893488718d8437970c1b4ed4f4056620',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::IsVector()']]],
-  ['iterations',['Iterations',['../structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0',1,'cutlass::FragmentIterator::Iterations()'],['../structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2',1,'cutlass::FragmentConstIterator::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae',1,'cutlass::gemm::GemmEpilogue::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d',1,'cutlass::gemm::GemmEpilogueTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Iterations()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f',1,'cutlass::gemm::GemmGlobalTileTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a',1,'cutlass::gemm::GemmGlobalTileCdTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b',1,'cutlass::gemm::GemmSharedLoadTileATraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Iterations()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#aa9b46937bea47d071d277aa212dd610b',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Iterations()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Iterations()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a9fb4b56091d4458ebd82130bc3951e5b',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::Iterations()'],['../structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450',1,'cutlass::PredicateTileAdapter::Iterations()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058',1,'cutlass::ConstPredicateTileAdapter::Iterations()'],['../structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469',1,'cutlass::TileTraits::Iterations()'],['../structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474',1,'cutlass::TileIteratorBase::Iterations()'],['../structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf',1,'cutlass::TileLoadIterator::Iterations()'],['../structcutlass_1_1TileStoreIterator.html#a552a67fb03c28e985d143f6193f88308',1,'cutlass::TileStoreIterator::Iterations()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2',1,'cutlass::TileTraitsStrideMajor::Iterations()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82',1,'cutlass::TileTraitsContiguousMajor::Iterations()'],['../structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323',1,'cutlass::TileTraitsWarpRake::Iterations()']]],
-  ['iterationsstrides',['IterationsStrides',['../structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b',1,'cutlass::FragmentConstIterator']]],
-  ['iterator',['Iterator',['../classcutlass_1_1PredicateVector_1_1Iterator.html',1,'cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6',1,'cutlass::gemm::SharedLoadStream::Iterator()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077',1,'cutlass::PredicateVector::Iterator::Iterator(Iterator const &amp;it)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038',1,'cutlass::PredicateVector::Iterator::Iterator(PredicateVector &amp;_vec, int _start=0)'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7',1,'cutlass::gemm::SharedLoadStream::Params::iterator()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10',1,'cutlass::gemm::SharedLoadStream::iterator()']]],
+  ['iterations',['Iterations',['../structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0',1,'cutlass::FragmentIterator::Iterations()'],['../structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2',1,'cutlass::FragmentConstIterator::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae',1,'cutlass::gemm::GemmEpilogue::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10',1,'cutlass::gemm::GemmEpilogueTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Iterations()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c',1,'cutlass::gemm::GemmGlobalTileTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a',1,'cutlass::gemm::GemmGlobalTileCdTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b',1,'cutlass::gemm::GemmSharedLoadTileATraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Iterations()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a2dc8573498bcda33273b86db76dbd511',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Iterations()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Iterations()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ae1d930fa295d8ddfaa10bda5978258de',1,'cutlass::gemm::IgemmGlobalTileTraits::Iterations()'],['../structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450',1,'cutlass::PredicateTileAdapter::Iterations()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058',1,'cutlass::ConstPredicateTileAdapter::Iterations()'],['../structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc',1,'cutlass::TileTraits::Iterations()'],['../structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da',1,'cutlass::TileIteratorBase::Iterations()'],['../structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce',1,'cutlass::TileLoadIterator::Iterations()'],['../structcutlass_1_1TileStoreIterator.html#a8628ea7116f736b59c644fc0d85d395f',1,'cutlass::TileStoreIterator::Iterations()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2',1,'cutlass::TileTraitsStrideMajor::Iterations()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82',1,'cutlass::TileTraitsContiguousMajor::Iterations()'],['../structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323',1,'cutlass::TileTraitsWarpRake::Iterations()']]],
+  ['iterationsstrides',['IterationsStrides',['../structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a',1,'cutlass::FragmentConstIterator']]],
+  ['iterator',['Iterator',['../classcutlass_1_1PredicateVector_1_1Iterator.html',1,'cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::Iterator'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7',1,'cutlass::gemm::SharedLoadStream::Params::iterator()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10',1,'cutlass::gemm::SharedLoadStream::iterator()'],['../structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57',1,'cutlass::TileLoadStream::Params::iterator()'],['../structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8',1,'cutlass::TileLoadStream::iterator()'],['../structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088',1,'cutlass::TileStoreStream::Params::iterator()'],['../structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c',1,'cutlass::TileStoreStream::iterator()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6',1,'cutlass::gemm::SharedLoadStream::Iterator()'],['../structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b',1,'cutlass::TileLoadStream::Iterator()'],['../structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97',1,'cutlass::TileStoreStream::Iterator()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a1f2314aa062360b249b7c57c39af5430',1,'cutlass::PredicatedTileLoadStream::Iterator()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a0ba9097d54f3ba7b7dab12012631fa76',1,'cutlass::PredicatedTileStoreStream::Iterator()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077',1,'cutlass::PredicateVector::Iterator::Iterator(Iterator const &amp;it)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038',1,'cutlass::PredicateVector::Iterator::Iterator(PredicateVector &amp;_vec, int _start=0)']]],
   ['iterator_5faccess_2eh',['iterator_access.h',['../iterator__access_8h.html',1,'']]],
-  ['iterator_5fc',['iterator_c',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
-  ['iterator_5fd',['iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
-  ['iterator_5fload',['iterator_load',['../namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be',1,'cutlass::iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)'],['../namespacecutlass.html#a50f08aa93d7fe6825599d17e3c977031',1,'cutlass::iterator_load(InputIterator const &amp;_iterator, Fragment &amp;fragment, typename InputIterator::Index offset, ConstPredicateAdapter predicate_adapter)'],['../namespacecutlass.html#aca491136bdb966638a7ae57c47f86d1e',1,'cutlass::iterator_load(InputIterator const &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset=0)'],['../namespacecutlass.html#af25d56f7391322d9a3b9aa3c507f90dc',1,'cutlass::iterator_load(InputIterator const &amp;iterator, Fragment &amp;fragment, ConstPredicateAdapter pred_it)']]],
-  ['iterator_5fload_5fpost_5fincrement',['iterator_load_post_increment',['../namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b',1,'cutlass::iterator_load_post_increment(InputIterator &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset, ConstPredicateAdapter predicate_adapter)'],['../namespacecutlass.html#af5abe551df7461eab66aa43907063d6b',1,'cutlass::iterator_load_post_increment(InputIterator &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset=0)'],['../namespacecutlass.html#afb8e7a4e611e8b5ae7ca19d02f791d37',1,'cutlass::iterator_load_post_increment(InputIterator &amp;iterator, Fragment &amp;fragment, ConstPredicateAdapter pred_it)']]],
-  ['iterator_5fstore',['iterator_store',['../namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9',1,'cutlass::iterator_store(OutputIterator &amp;iterator, Fragment &amp;fragment)'],['../namespacecutlass.html#a88dce4b124a294cc123f7cf5fd2d6472',1,'cutlass::iterator_store(OutputIterator const &amp;_iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset, ConstPredicateAdapter predicate_adapter)'],['../namespacecutlass.html#a410ed4d45ccafc2db842967740b6211f',1,'cutlass::iterator_store(OutputIterator const &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset=0)'],['../namespacecutlass.html#ad804b804ac19360b293046f9cbfd8dd5',1,'cutlass::iterator_store(OutputIterator const &amp;iterator, Fragment const &amp;fragment, ConstPredicateAdapter pred_it)']]],
-  ['iterator_5fstore_5fpost_5fincrement',['iterator_store_post_increment',['../namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de',1,'cutlass::iterator_store_post_increment(OutputIterator &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset, ConstPredicateAdapter predicate_adapter)'],['../namespacecutlass.html#ab8efb0edefca7a59acc5a14b7311130c',1,'cutlass::iterator_store_post_increment(OutputIterator &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset=0)'],['../namespacecutlass.html#a96fdb65e922f6a3d46aa5de9ea78d460',1,'cutlass::iterator_store_post_increment(OutputIterator &amp;iterator, Fragment const &amp;fragment, ConstPredicateAdapter pred_it)']]],
-  ['iteratoradvance',['IteratorAdvance',['../structcutlass_1_1IteratorAdvance.html',1,'cutlass']]],
-  ['iteratorfragment',['IteratorFragment',['../structcutlass_1_1IteratorFragment.html',1,'cutlass']]]
+  ['iterator_5fc',['iterator_c',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
+  ['iterator_5fd',['iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
+  ['iterator_5fload',['iterator_load',['../namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be',1,'cutlass']]],
+  ['iterator_5fstore',['iterator_store',['../namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9',1,'cutlass']]],
+  ['iteratoradvance',['IteratorAdvance',['../structcutlass_1_1IteratorAdvance.html',1,'cutlass']]]
 ];
diff --git a/docs/search/all_a.js b/docs/search/all_a.js
index fec5dfcc8..a3bd6e5dd 100644
--- a/docs/search/all_a.js
+++ b/docs/search/all_a.js
@@ -1,76 +1,101 @@
 var searchData=
 [
-  ['k',['k',['../structcutlass_1_1gemm_1_1GemmDesc.html#ac789a7e5d2db65d006f1e8e3df542a6f',1,'cutlass::gemm::GemmDesc::k()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aae3a008b39f9678a03192f6ff54152d8',1,'cutlass::gemm::GemmTraits::Params::k()']]],
+  ['k',['k',['../structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7',1,'cutlass::gemm::GemmCoord::k() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#ae12eb84ec47ddf01b4d459c7aabc22ad',1,'cutlass::gemm::GemmCoord::k()']]],
   ['ka',['kA',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a',1,'cutlass::GemmOperand']]],
-  ['kaccesssize',['kAccessSize',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f',1,'cutlass::gemm::GemmGlobalTileTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e',1,'cutlass::gemm::GemmSharedLoadTileATraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kAccessSize()'],['../structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3',1,'cutlass::TileIteratorBase::kAccessSize()']]],
-  ['kaccumulatorsperldsa',['kAccumulatorsPerLdsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf',1,'cutlass::gemm::GemmConfig']]],
-  ['kaccumulatorsperldsb',['kAccumulatorsPerLdsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1',1,'cutlass::gemm::GemmConfig']]],
-  ['kadvance',['kAdvance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125',1,'cutlass::gemm::GemmGlobalIteratorAb::kAdvance()'],['../structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421',1,'cutlass::TileIteratorBase::kAdvance()'],['../structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6',1,'cutlass::TileLoadIterator::kAdvance()'],['../structcutlass_1_1TileStoreIterator.html#a8059c57030df99b73309e9210ec5f624',1,'cutlass::TileStoreIterator::kAdvance()']]],
+  ['kaccesssize',['kAccessSize',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f',1,'cutlass::gemm::GemmGlobalTileTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e',1,'cutlass::gemm::GemmSharedLoadTileATraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kAccessSize()'],['../structcutlass_1_1TileTraits.html#a0a494c2eacb51b65487f8405908a0214',1,'cutlass::TileTraits::kAccessSize()'],['../structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499',1,'cutlass::TileIteratorBase::kAccessSize()'],['../structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8',1,'cutlass::TileLoadIterator::kAccessSize()'],['../structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671',1,'cutlass::TileStoreIterator::kAccessSize()'],['../structcutlass_1_1TileTraitsStandard.html#a5e04777205c7a292602880c59d6b43c8',1,'cutlass::TileTraitsStandard::kAccessSize()']]],
+  ['kaccumulatorsperldsa',['kAccumulatorsPerLdsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5',1,'cutlass::gemm::GemmConfig']]],
+  ['kaccumulatorsperldsb',['kAccumulatorsPerLdsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb',1,'cutlass::gemm::GemmConfig']]],
+  ['kadvance',['kAdvance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125',1,'cutlass::gemm::GemmGlobalIteratorAb::kAdvance()'],['../structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f',1,'cutlass::TileIteratorBase::kAdvance()'],['../structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352',1,'cutlass::TileLoadIterator::kAdvance()'],['../structcutlass_1_1TileStoreIterator.html#a44200854ad5b35c1863f73c435b8750b',1,'cutlass::TileStoreIterator::kAdvance()']]],
+  ['kalignment',['kAlignment',['../structcutlass_1_1Fragment.html#a84b6d68a5a24dbd04d842e0755b42bda',1,'cutlass::Fragment']]],
   ['kb',['kB',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9',1,'cutlass::GemmOperand']]],
+  ['kbatch',['kBatch',['../structcutlass_1_1gemm_1_1GemmCoord.html#ad7b490ce2150e54fccad6b0f11932382',1,'cutlass::gemm::GemmCoord']]],
+  ['kblockcolumns',['kBlockColumns',['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::kBlockColumns()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e',1,'cutlass::MatrixLayout::RowMajorBlockLinear::kBlockColumns()']]],
+  ['kblockrows',['kBlockRows',['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::kBlockRows()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922',1,'cutlass::MatrixLayout::RowMajorBlockLinear::kBlockRows()']]],
   ['kbytes',['kBytes',['../structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a',1,'cutlass::PredicateVector']]],
-  ['kc',['kC',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc',1,'cutlass::GemmOperand::kC()'],['../structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c',1,'cutlass::Shape::kC()']]],
+  ['kc',['kC',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc',1,'cutlass::GemmOperand::kC()'],['../structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c',1,'cutlass::Shape::kC()'],['../structcutlass_1_1TileCoord.html#a8236879e1670072033983b7ec4b7ae32',1,'cutlass::TileCoord::kC()']]],
+  ['kcolumn',['kColumn',['../structcutlass_1_1MatrixCoord.html#a1e096b25138e027c31ea8624729ec433',1,'cutlass::MatrixCoord::kColumn()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#adb3b8cccf1ac91265fff998a3d48f5e7',1,'cutlass::MatrixLayout::ContiguousLayout::kColumn()']]],
   ['kcolumnmajor',['kColumnMajor',['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b',1,'cutlass::MatrixLayout']]],
+  ['kconjugate',['kConjugate',['../structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683',1,'cutlass::MatrixTransform']]],
   ['kcount',['kCount',['../structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5',1,'cutlass::ShapeCount']]],
-  ['kd',['kD',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe',1,'cutlass::GemmOperand::kD()'],['../structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25',1,'cutlass::Shape::kD()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5',1,'cutlass::IteratorAdvance::kD()']]],
+  ['kd',['kD',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe',1,'cutlass::GemmOperand::kD()'],['../structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25',1,'cutlass::Shape::kD()'],['../structcutlass_1_1TileCoord.html#ab5ebf352327baadcc740175d6b39adcb',1,'cutlass::TileCoord::kD()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5',1,'cutlass::IteratorAdvance::kD()']]],
   ['kdhw',['kDhw',['../structcutlass_1_1ShapeCount.html#af7d7ccd42de2c49fe57f03cf0e657fe8',1,'cutlass::ShapeCount']]],
   ['kdhwc',['kDhwc',['../structcutlass_1_1ShapeCount.html#a5a274564d6b8607a0be621b2664fba18',1,'cutlass::ShapeCount']]],
   ['kelements',['kElements',['../structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60',1,'cutlass::Fragment']]],
   ['kelementsperaccess',['kElementsPerAccess',['../structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a',1,'cutlass::FragmentIterator::kElementsPerAccess()'],['../structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f',1,'cutlass::FragmentConstIterator::kElementsPerAccess()']]],
+  ['kernel_5flaunch_2eh',['kernel_launch.h',['../kernel__launch_8h.html',1,'']]],
+  ['kernelclass',['KernelClass',['../structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae',1,'cutlass::gemm::GemmTraits']]],
+  ['kernellaunchconfiguration',['KernelLaunchConfiguration',['../structcutlass_1_1KernelLaunchConfiguration.html',1,'cutlass::KernelLaunchConfiguration'],['../structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa',1,'cutlass::KernelLaunchConfiguration::KernelLaunchConfiguration()']]],
   ['kextent',['kExtent',['../structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html#a881f84951bc9e47ab2be9ef3f2c1e423',1,'cutlass::gemm::GetExtent&lt; GemmOperand::kA, Tile_ &gt;::kExtent()'],['../structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html#a82ff9b447e4a58164b5f7d53d2602930',1,'cutlass::gemm::GetExtent&lt; GemmOperand::kB, Tile_ &gt;::kExtent()']]],
-  ['kfragmentsize',['kFragmentSize',['../structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2',1,'cutlass::TileIteratorBase']]],
+  ['kfragmentelementtype',['kFragmentElementType',['../structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826',1,'cutlass::TileIteratorBase::kFragmentElementType()'],['../structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177',1,'cutlass::TileLoadIterator::kFragmentElementType()'],['../structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f',1,'cutlass::TileStoreIterator::kFragmentElementType()']]],
+  ['kfragmentsize',['kFragmentSize',['../structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761',1,'cutlass::TileIteratorBase']]],
   ['kgeneric',['kGeneric',['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38',1,'cutlass::MemorySpace']]],
   ['kglobal',['kGlobal',['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37',1,'cutlass::MemorySpace']]],
-  ['kh',['kH',['../structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e',1,'cutlass::Shape::kH()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81',1,'cutlass::IteratorAdvance::kH()']]],
+  ['kh',['kH',['../structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e',1,'cutlass::Shape::kH()'],['../structcutlass_1_1TileCoord.html#a24d32587359493bb965745f5551e1624',1,'cutlass::TileCoord::kH()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81',1,'cutlass::IteratorAdvance::kH()']]],
   ['khw',['kHw',['../structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f',1,'cutlass::ShapeCount']]],
   ['khwc',['kHwc',['../structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742',1,'cutlass::ShapeCount']]],
-  ['kind',['Kind',['../structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375',1,'cutlass::Identity::Kind()'],['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c',1,'cutlass::MemorySpace::Kind()'],['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b',1,'cutlass::MatrixLayout::Kind()'],['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c',1,'cutlass::GemmOperand::Kind()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda',1,'cutlass::IteratorAdvance::Kind()'],['../structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80',1,'cutlass::IteratorFragment::Kind()']]],
+  ['kind',['Kind',['../structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375',1,'cutlass::Identity::Kind()'],['../structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8',1,'cutlass::gemm::swizzleDirection::Kind()'],['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c',1,'cutlass::MemorySpace::Kind()'],['../structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b',1,'cutlass::FragmentElementType::Kind()'],['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b',1,'cutlass::MatrixLayout::Kind()'],['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c',1,'cutlass::GemmOperand::Kind()'],['../structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48',1,'cutlass::MatrixTransform::Kind()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda',1,'cutlass::IteratorAdvance::Kind()']]],
   ['kint8output',['kInt8Output',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4',1,'cutlass::gemm::IgemmEpilogueTraits']]],
+  ['kinterleave',['kInterleave',['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143',1,'cutlass::MatrixLayout::RowMajorInterleaved::kInterleave()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7',1,'cutlass::MatrixLayout::ColumnMajorInterleaved::kInterleave()']]],
   ['kiterationsd',['kIterationsD',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0',1,'cutlass::gemm::GemmSharedLoadTileDTraits']]],
   ['kiterationsh',['kIterationsH',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1',1,'cutlass::gemm::GemmSharedLoadTileDTraits']]],
   ['kiterationsinhperwarp',['kIterationsInHPerWarp',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237',1,'cutlass::gemm::GemmSharedLoadTileDTraits']]],
-  ['kiteratorfragment',['kIteratorFragment',['../structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be',1,'cutlass::TileIteratorBase::kIteratorFragment()'],['../structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98',1,'cutlass::TileLoadIterator::kIteratorFragment()'],['../structcutlass_1_1TileStoreIterator.html#a94c0567316118abfb84fc28560a5a46a',1,'cutlass::TileStoreIterator::kIteratorFragment()']]],
+  ['kk',['kK',['../structcutlass_1_1gemm_1_1GemmCoord.html#a521d4b8e720d2261c825e05397c92a5e',1,'cutlass::gemm::GemmCoord']]],
   ['kkstrided',['kKstrided',['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85',1,'cutlass::gemm::GemmMultiplicandTraits']]],
-  ['klanes',['kLanes',['../unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27',1,'cutlass::Vector::kLanes()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392',1,'cutlass::Vector&lt; half, kLanes_ &gt;::kLanes()'],['../structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8',1,'cutlass::VectorTraits::kLanes()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aca745b59c6c21292f119943e5a480f39',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::kLanes()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a43ac200035052a2c352c8c4b84aac73c',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::kLanes()']]],
-  ['klayout',['kLayout',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c',1,'cutlass::gemm::GlobalLoadStreamBase::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90',1,'cutlass::gemm::GemmGlobalTileTraits::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece',1,'cutlass::gemm::GemmGlobalIteratorAb::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a',1,'cutlass::gemm::GemmGlobalIteratorCd::kLayout()'],['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd',1,'cutlass::gemm::GemmMultiplicandTraits::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ad2010686bceb21aec9a1924ae379edc1',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::kLayout()']]],
+  ['klanes',['kLanes',['../unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27',1,'cutlass::Vector::kLanes()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393',1,'cutlass::Vector&lt; half, 1 &gt;::kLanes()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392',1,'cutlass::Vector&lt; half, kLanes_ &gt;::kLanes()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a4020f25408022dbf20c26ed4fa8c7dffa14befaa9d739f1b754bc372f717b105b',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::kLanes()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a322ddd3ec1f47b76e21c24d3a3c44c5badeba151dbcb3c15e581bad7d767a93fa',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::kLanes()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a9aacb7538f1b83762d68c768629c98eba17b71e816051646b567cf47334649a9b',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::kLanes()'],['../structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8',1,'cutlass::VectorTraits::kLanes()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aca745b59c6c21292f119943e5a480f39',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::kLanes()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a43ac200035052a2c352c8c4b84aac73c',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::kLanes()']]],
+  ['klaunchbounds',['kLaunchBounds',['../structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b',1,'cutlass::gemm::GemmConfig']]],
+  ['klayout',['kLayout',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db',1,'cutlass::gemm::GlobalLoadStream::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90',1,'cutlass::gemm::GemmGlobalTileTraits::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece',1,'cutlass::gemm::GemmGlobalIteratorAb::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a',1,'cutlass::gemm::GemmGlobalIteratorCd::kLayout()'],['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd',1,'cutlass::gemm::GemmMultiplicandTraits::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ad2010686bceb21aec9a1924ae379edc1',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a32729d0fad10fcbbcf2643a2fa5671d6',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a11026d05b2b32f1373020c049f2cfa66',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::kLayout()']]],
   ['klayouta',['kLayoutA',['../structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b',1,'cutlass::gemm::GemmTraits']]],
   ['klayoutb',['kLayoutB',['../structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684',1,'cutlass::gemm::GemmTraits']]],
-  ['kmemoryspace',['kMemorySpace',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d',1,'cutlass::gemm::GemmGlobalTileTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5',1,'cutlass::gemm::GemmSharedLoadTileATraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kMemorySpace()'],['../structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97',1,'cutlass::TileIteratorBase::kMemorySpace()'],['../structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1',1,'cutlass::TileLoadIterator::kMemorySpace()'],['../structcutlass_1_1TileStoreIterator.html#adaebec9eacf767f63f048033de73ea5b',1,'cutlass::TileStoreIterator::kMemorySpace()']]],
-  ['koperand',['kOperand',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1',1,'cutlass::gemm::GemmGlobalTileTraits::kOperand()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851',1,'cutlass::gemm::GemmSharedLoadTileATraits::kOperand()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kOperand()']]],
+  ['km',['km',['../structcutlass_1_1gemm_1_1GemmCoord.html#ad6c884a5bb6e5edaf371e8af10df367d',1,'cutlass::gemm::GemmCoord::km() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#af1f5c03c35eaa406c6a63082da26bec3',1,'cutlass::gemm::GemmCoord::kM()']]],
+  ['kmemoryspace',['kMemorySpace',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d',1,'cutlass::gemm::GemmGlobalTileTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5',1,'cutlass::gemm::GemmSharedLoadTileATraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kMemorySpace()'],['../structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56',1,'cutlass::TileIteratorBase::kMemorySpace()'],['../structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043',1,'cutlass::TileLoadIterator::kMemorySpace()'],['../structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f',1,'cutlass::TileStoreIterator::kMemorySpace()']]],
+  ['kn',['kn',['../structcutlass_1_1gemm_1_1GemmCoord.html#a16501265d58ddaca0e2d9bb4e21d66ea',1,'cutlass::gemm::GemmCoord::kn() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a67f08a03dabee497fa5547cff0f1faea',1,'cutlass::gemm::GemmCoord::kN()']]],
+  ['knm',['knm',['../structcutlass_1_1gemm_1_1GemmCoord.html#a4062c040208868c75dbc6ba18910bffb',1,'cutlass::gemm::GemmCoord']]],
+  ['knone',['kNone',['../structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5',1,'cutlass::MatrixTransform']]],
+  ['koperand',['kOperand',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700',1,'cutlass::gemm::GlobalLoadStream::kOperand()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1',1,'cutlass::gemm::GemmGlobalTileTraits::kOperand()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851',1,'cutlass::gemm::GemmSharedLoadTileATraits::kOperand()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kOperand()']]],
   ['kpredicates',['kPredicates',['../structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492',1,'cutlass::PredicateVector']]],
   ['kpredicatesperbyte',['kPredicatesPerByte',['../structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5',1,'cutlass::PredicateVector']]],
   ['kpredicatestart',['kPredicateStart',['../structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e',1,'cutlass::PredicateVector']]],
-  ['krequiresloadfence',['kRequiresLoadFence',['../structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc',1,'cutlass::TileLoadIterator']]],
+  ['krank',['kRank',['../structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3',1,'cutlass::Coord::kRank()'],['../classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31',1,'cutlass::TensorRef::kRank()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::kRank()']]],
+  ['krequiresloadfence',['kRequiresLoadFence',['../structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126',1,'cutlass::TileLoadIterator']]],
+  ['kresidueinprolog',['kResidueInProlog',['../structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46',1,'cutlass::gemm::GemmConfig']]],
+  ['kresidueseparate',['kResidueSeparate',['../structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c',1,'cutlass::gemm::GemmConfig']]],
+  ['krow',['kRow',['../structcutlass_1_1MatrixCoord.html#a5149f4a37407746407251efc0779bb53',1,'cutlass::MatrixCoord::kRow()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#ae97a9ba9d5045bef258d8994eb732256',1,'cutlass::MatrixLayout::ContiguousLayout::kRow()']]],
   ['krowmajor',['kRowMajor',['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb',1,'cutlass::MatrixLayout']]],
-  ['kscalar',['kScalar',['../structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954',1,'cutlass::IteratorFragment']]],
+  ['kscalar',['kScalar',['../structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b',1,'cutlass::FragmentElementType']]],
   ['kscalarsin4b',['kScalarsIn4B',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kScalarsIn4B()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kScalarsIn4B()']]],
-  ['kscalarsperldga',['kScalarsPerLdgA',['../structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldgb',['kScalarsPerLdgB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldgc',['kScalarsPerLdgC',['../structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldsa',['kScalarsPerLdsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldsb',['kScalarsPerLdsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldsd',['kScalarsPerLdsD',['../structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldga',['kScalarsPerLdgA',['../structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldgb',['kScalarsPerLdgB',['../structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldgc',['kScalarsPerLdgC',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldsa',['kScalarsPerLdsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldsb',['kScalarsPerLdsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldsd',['kScalarsPerLdsD',['../structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951',1,'cutlass::gemm::GemmConfig']]],
   ['kscalarsperrow',['kScalarsPerRow',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kScalarsPerRow()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kScalarsPerRow()']]],
-  ['kscalarsperstgd',['kScalarsPerStgD',['../structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperstsa',['kScalarsPerStsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186',1,'cutlass::gemm::GemmConfig::kScalarsPerStsA()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ae396f7301f934c179e054f68f0420edf',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kScalarsPerStsA()']]],
-  ['kscalarsperstsb',['kScalarsPerStsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21',1,'cutlass::gemm::GemmConfig::kScalarsPerStsB()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a47d99d98c783cf1d317698bd465ffa9a',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kScalarsPerStsB()']]],
-  ['kscalarsperstsd',['kScalarsPerStsD',['../structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperstgd',['kScalarsPerStgD',['../structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperstsa',['kScalarsPerStsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f',1,'cutlass::gemm::GemmConfig::kScalarsPerStsA()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a69775031f651795f697b628677b8e4eb',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::kScalarsPerStsA()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aedb61c43d8fb9c4ba18ae72601b9f6e1',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::kScalarsPerStsA()']]],
+  ['kscalarsperstsb',['kScalarsPerStsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce',1,'cutlass::gemm::GemmConfig::kScalarsPerStsB()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aaa3228d45ff4428bba0f88a7a6e8b31b',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::kScalarsPerStsB()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a8a6cef5e733eab9c0ead20b1e345ad6f',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::kScalarsPerStsB()']]],
+  ['kscalarsperstsd',['kScalarsPerStsD',['../structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f',1,'cutlass::gemm::GemmConfig']]],
   ['kscalarsperthread',['kScalarsPerThread',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kScalarsPerThread()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kScalarsPerThread()']]],
   ['kshared',['kShared',['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc',1,'cutlass::MemorySpace']]],
   ['kskew',['kSkew',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ace14ca9ad11e2cdafcd4a4b63c0df591',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aba6decf87d770becaadd610d9fc27491',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaffe67e519e919bf561142e05da6e6c8',1,'cutlass::gemm::GemmSharedLoadTileATraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac9cd90ecd02809060a2fe6e2da4210f9',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kSkew()']]],
-  ['kstages',['kStages',['../structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52',1,'cutlass::gemm::GemmConfig']]],
+  ['kskewa',['kSkewA',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9c296924f9a6c6908f09830bbbf6a775',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kSkewA()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac8da30393042cf6e785bdd54b11d9408',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kSkewA()']]],
+  ['kskewb',['kSkewB',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab35a6b3ff04e4128e4ca4a8cc0459b16',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kSkewB()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a6d0f50e83067373b249b38444eb7fe65',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kSkewB()']]],
+  ['ksplitk',['kSplitK',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2',1,'cutlass::gemm::GemmSharedLoadTileDTraits']]],
+  ['kstages',['kStages',['../structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508',1,'cutlass::gemm::GemmConfig']]],
+  ['kstoragerank',['kStorageRank',['../structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30',1,'cutlass::MatrixLayout::RowMajor::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70',1,'cutlass::MatrixLayout::ColumnMajor::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800',1,'cutlass::MatrixLayout::RowMajorInterleaved::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f',1,'cutlass::MatrixLayout::ColumnMajorInterleaved::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7',1,'cutlass::MatrixLayout::ContiguousLayout::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d',1,'cutlass::MatrixLayout::RowMajorBlockLinear::kStorageRank()'],['../structcutlass_1_1IdentityTensorMapFunc.html#ac609498e7fe858b4fb3791d1039438f4',1,'cutlass::IdentityTensorMapFunc::kStorageRank()'],['../classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2',1,'cutlass::TensorRef::kStorageRank()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::kStorageRank()'],['../structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243',1,'cutlass::TensorRefArray::kStorageRank()']]],
   ['kstrideh',['kStrideH',['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97',1,'cutlass::gemm::GemmGlobalTileCdTraits']]],
-  ['kthreads',['kThreads',['../structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b',1,'cutlass::gemm::Gemm::kThreads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kThreads()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kThreads()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf',1,'cutlass::gemm::GemmConfig::kThreads()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85',1,'cutlass::TileTraitsStrideMajor::kThreads()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9',1,'cutlass::TileTraitsContiguousMajor::kThreads()'],['../structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642',1,'cutlass::TileTraitsWarpRake::kThreads()'],['../structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1',1,'cutlass::TileTraitsStandard::kThreads()']]],
+  ['kthreads',['kThreads',['../structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b',1,'cutlass::gemm::Gemm::kThreads()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f',1,'cutlass::gemm::GemmConfig::kThreads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kThreads()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kThreads()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85',1,'cutlass::TileTraitsStrideMajor::kThreads()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9',1,'cutlass::TileTraitsContiguousMajor::kThreads()'],['../structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642',1,'cutlass::TileTraitsWarpRake::kThreads()'],['../structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1',1,'cutlass::TileTraitsStandard::kThreads()']]],
   ['kthreadsperwarp',['kThreadsPerWarp',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f',1,'cutlass::gemm::GemmSharedLoadTileATraits::kThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kThreadsPerWarp()']]],
   ['kusage',['kUsage',['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a962ffde3b3db78792b67dd1f57ab0a05',1,'cutlass::gemm::GemmMultiplicandTraits']]],
-  ['kvalue',['kValue',['../structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad',1,'cutlass::Extent::kValue()'],['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a10f7184a9a50de0268efa45dab5dc304',1,'cutlass::Extent&lt; Vector&lt; T, Lanes &gt; &gt;::kValue()'],['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a87917a6dfbb1662416c4ea4831669aaf',1,'cutlass::Extent&lt; Vector&lt; T, Lanes &gt; const &gt;::kValue()']]],
-  ['kvectorsize',['kVectorSize',['../unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e',1,'cutlass::Vector::kVectorSize()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79',1,'cutlass::Vector&lt; half, kLanes_ &gt;::kVectorSize()']]],
-  ['kw',['kW',['../structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421',1,'cutlass::Shape::kW()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0',1,'cutlass::IteratorAdvance::kW()']]],
+  ['kvalue',['kValue',['../structcutlass_1_1Min.html#a97e6dd3ff6fb5404e8a6e6109f73f429',1,'cutlass::Min::kValue()'],['../structcutlass_1_1Max.html#a6ed8be7ed855eea8f8d08921f7b5d763',1,'cutlass::Max::kValue()'],['../structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad',1,'cutlass::Extent::kValue()'],['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a10f7184a9a50de0268efa45dab5dc304',1,'cutlass::Extent&lt; Vector&lt; T, Lanes &gt; &gt;::kValue()'],['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a87917a6dfbb1662416c4ea4831669aaf',1,'cutlass::Extent&lt; Vector&lt; T, Lanes &gt; const &gt;::kValue()']]],
+  ['kvectorsize',['kVectorSize',['../unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e',1,'cutlass::Vector::kVectorSize()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d',1,'cutlass::Vector&lt; half, 1 &gt;::kVectorSize()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79',1,'cutlass::Vector&lt; half, kLanes_ &gt;::kVectorSize()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::kVectorSize()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::kVectorSize()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::kVectorSize()']]],
+  ['kw',['kW',['../structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421',1,'cutlass::Shape::kW()'],['../structcutlass_1_1TileCoord.html#ac2c14af3ceffd5ef8f17c9e0efb4e5ec',1,'cutlass::TileCoord::kW()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0',1,'cutlass::IteratorAdvance::kW()']]],
   ['kwarpcount',['kWarpCount',['../structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d',1,'cutlass::TileTraitsWarpRake::kWarpCount()'],['../structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25',1,'cutlass::TileTraitsStandard::kWarpCount()']]],
+  ['kwarpgemmsteps',['kWarpGemmSteps',['../structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356',1,'cutlass::gemm::Gemm']]],
   ['kwarps',['kWarps',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be',1,'cutlass::gemm::GemmSharedLoadTileATraits::kWarps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kWarps()']]],
   ['kwarpscontiguous',['kWarpsContiguous',['../structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce',1,'cutlass::TileTraitsWarpRake']]],
-  ['kwarpsize',['kWarpSize',['../structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e',1,'cutlass::gemm::GemmConfig::kWarpSize()'],['../structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b',1,'cutlass::TileTraitsWarpRake::kWarpSize()'],['../structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10',1,'cutlass::TileTraitsStandard::kWarpSize()']]],
+  ['kwarpsize',['kWarpSize',['../structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396',1,'cutlass::gemm::GemmConfig::kWarpSize()'],['../structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b',1,'cutlass::TileTraitsWarpRake::kWarpSize()'],['../structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10',1,'cutlass::TileTraitsStandard::kWarpSize()']]],
   ['kwarpsstrided',['kWarpsStrided',['../structcutlass_1_1TileTraitsWarpRake.html#a8b1d3fe590f426ce11d597bb98c51bd4',1,'cutlass::TileTraitsWarpRake']]],
   ['kwc',['kWc',['../structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276',1,'cutlass::ShapeCount']]],
-  ['kwmmamatrix',['kWmmaMatrix',['../structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419',1,'cutlass::IteratorFragment']]],
+  ['kwmmamatrix',['kWmmaMatrix',['../structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd',1,'cutlass::FragmentElementType']]],
   ['kwordcount',['kWordCount',['../structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42',1,'cutlass::PredicateVector']]]
 ];
diff --git a/docs/search/all_b.js b/docs/search/all_b.js
index d156678a6..76fe0654c 100644
--- a/docs/search/all_b.js
+++ b/docs/search/all_b.js
@@ -1,27 +1,35 @@
 var searchData=
 [
-  ['launch',['launch',['../structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c',1,'cutlass::gemm::Gemm::launch(Params const &amp;params, cudaStream_t stream=cudaStreamDefault)'],['../structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906',1,'cutlass::gemm::Gemm::launch(CUfunction kernel, Params const &amp;params, CUstream stream=CU_STREAM_LEGACY)']]],
+  ['launch',['Launch',['../structcutlass_1_1gemm_1_1Launch.html',1,'cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt;'],['../structcutlass_1_1gemm_1_1Launch.html#a8552a524b9419f60bf8ef3c6b8528d27',1,'cutlass::gemm::Launch::Launch()'],['../structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#ab7a89806834a5fa8022daae4180e6180',1,'cutlass::gemm::Launch&lt; Gemm, false &gt;::Launch()'],['../structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c',1,'cutlass::gemm::Gemm::launch(Params const &amp;params, cudaStream_t stream=cudaStreamDefault)'],['../structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906',1,'cutlass::gemm::Gemm::launch(CUfunction kernel, Params const &amp;params, CUstream stream=CU_STREAM_LEGACY)']]],
+  ['launch_3c_20gemm_2c_20false_20_3e',['Launch&lt; Gemm, false &gt;',['../structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html',1,'cutlass::gemm']]],
   ['layout_20concept',['Layout Concept',['../group__layout__concept.html',1,'']]],
   ['lcm',['lcm',['../namespacecutlass.html#af07506fee11de882d926f4e8237eef09',1,'cutlass']]],
-  ['lda',['lda',['../structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789',1,'cutlass::gemm::GemmDesc']]],
-  ['ldb',['ldb',['../structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe',1,'cutlass::gemm::GemmDesc']]],
-  ['ldc',['ldc',['../structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db',1,'cutlass::gemm::GemmDesc']]],
-  ['ldd',['ldd',['../structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9',1,'cutlass::gemm::GemmDesc']]],
-  ['leading_5fdim',['leading_dim',['../classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77',1,'cutlass::TensorRef']]],
+  ['leading_5fdim',['leading_dim',['../classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca',1,'cutlass::TensorRef::leading_dim()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6c580a451a36143d1eb0e409e7b13e33',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::leading_dim()']]],
   ['less',['less',['../structcutlass_1_1platform_1_1less.html',1,'cutlass::platform']]],
   ['linear_5fscaling_2eh',['linear_scaling.h',['../linear__scaling_8h.html',1,'']]],
-  ['linearscaling',['LinearScaling',['../structcutlass_1_1gemm_1_1LinearScaling.html',1,'cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a34df6970f033b3090ad8f4d40063b1b2',1,'cutlass::gemm::LinearScaling::LinearScaling()']]],
-  ['load',['Load',['../structcutlass_1_1Load.html',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;'],['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#aea5ed35a44624684ffa9ada9d09a8893',1,'cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage::load()'],['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html#a01a847858cb330d7d109ddee228e96ce',1,'cutlass::FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::load()'],['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html#a014682b143bce65667075ea15fad184d',1,'cutlass::FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::load()'],['../structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140',1,'cutlass::Load::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#aa9d5e227ea20ad3c6952f296016ec167',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a0e58d26dd68aabb6cb9678f5656c7e6f',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::load()'],['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a7ba77016bee8e941f7831cc9fbfa994d',1,'cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a4ee00178c441bdf4d4a1f8cf984bc03f',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::load()'],['../structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment) const']]],
-  ['load_3c_20double_2c_202_2c_20memory_5f_2c_20true_2c_2016_20_3e',['Load&lt; double, 2, Memory_, true, 16 &gt;',['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html',1,'cutlass']]],
-  ['load_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_2016_20_3e',['Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html',1,'cutlass']]],
-  ['load_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_204_20_3e',['Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html',1,'cutlass']]],
-  ['load_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_208_20_3e',['Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html',1,'cutlass']]],
-  ['load_5fiterator',['load_iterator',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a42ffcba6af2b5ddfb1f4825a34d43532',1,'cutlass::gemm::GlobalLoadStreamBase::Params::load_iterator()'],['../unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a3be938f8661f9cd10966866b7b80b471',1,'cutlass::gemm::GlobalLoadStreamBase::SharedStorage::load_iterator()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e',1,'cutlass::gemm::GlobalLoadStreamBase::load_iterator()']]],
-  ['load_5fpost_5fincrement',['load_post_increment',['../structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915',1,'cutlass::TileLoadIterator::load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d',1,'cutlass::TileLoadIterator::load_post_increment(Fragment &amp;fragment)']]],
+  ['linear_5fscaling_5fdevice_5fptr_2eh',['linear_scaling_device_ptr.h',['../linear__scaling__device__ptr_8h.html',1,'']]],
+  ['linearscaling',['LinearScaling',['../structcutlass_1_1gemm_1_1LinearScaling.html',1,'cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;'],['../structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe',1,'cutlass::gemm::LinearScaling::LinearScaling()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889',1,'cutlass::gemm::LinearScaling::LinearScaling(Params const &amp;_params)']]],
+  ['linearscalingdeviceptr',['LinearScalingDevicePtr',['../structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html',1,'cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;'],['../structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a9dcb15bbcf3785280fd5cea0e0da5602',1,'cutlass::gemm::LinearScalingDevicePtr::LinearScalingDevicePtr()']]],
+  ['load',['Load',['../structcutlass_1_1Load.html',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;'],['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af',1,'cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage::load()'],['../structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7',1,'cutlass::Load::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a4bab8959d29ee868fb6b3e1f9abc04fc',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#a2e906364a0631c2c9f97acd0ae4a1873',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#afee69b86f070e3badc75ab00bcc5996b',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::load()'],['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a7d9027453aa78d4448d70dc44307791e',1,'cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a7d3d3e156dc527f9c00acc7a66d21326',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a854c684b3f6c1a10b6e8fcf7967f6642',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load()'],['../structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#a619f643794f51b35f3c0a1011ba00bbd',1,'cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load()'],['../structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#abc4f879290c847a6e73dc9e68a340f74',1,'cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load()'],['../structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#af587adae1103b4242e0d56eb902f9302',1,'cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load()'],['../structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment) const'],['../structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment, int d)'],['../structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6',1,'cutlass::TileStoreIterator::load(Fragment &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileStoreIterator.html#a8c42ab8699c3fd74dc7b59d559364b9a',1,'cutlass::TileStoreIterator::load(Fragment &amp;fragment) const'],['../structcutlass_1_1TileStoreIterator.html#ad33c46a584deb1c7968e08e349382af3',1,'cutlass::TileStoreIterator::load(Fragment &amp;fragment, int d)'],['../classcutlass_1_1ZipTileIterator.html#a23b72b086f350dfe07cff22ac010c45c',1,'cutlass::ZipTileIterator::load(Fragment &amp;fragment) const'],['../classcutlass_1_1ZipTileIterator.html#a9a3f2f913ee73f0c04e74ec89c6c5cbb',1,'cutlass::ZipTileIterator::load(Fragment &amp;fragment, Coord&lt; 4 &gt; const &amp;offset) const'],['../classcutlass_1_1ZipTileIterator.html#a4c9997488be2f09b9653d8ef8ac06c2b',1,'cutlass::ZipTileIterator::load(Fragment &amp;fragment, PredicateIterator pred_it) const']]],
+  ['load_3c_20double_2c_202_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20double_2c_20kstride_2c_2016_20_3e',['Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;',['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_201_2c_202_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_2016_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_204_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_208_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html',1,'cutlass']]],
+  ['load_3c_20vector_3c_20bin1_5ft_2c_2032_20_3e_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html',1,'cutlass']]],
+  ['load_3c_20vector_3c_20int4_5ft_2c_208_20_3e_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html',1,'cutlass']]],
+  ['load_3c_20vector_3c_20uint4_5ft_2c_208_20_3e_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html',1,'cutlass']]],
+  ['load_5felement',['load_element',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06',1,'cutlass::gemm::GemmGlobalIteratorAb::load_element()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433',1,'cutlass::gemm::GemmGlobalIteratorCd::load_element()'],['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a5cbda0dea8c87ca55499c97cc80b1ccf',1,'cutlass::gemm::IgemmGlobalIteratorAb::load_element()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a109209936a9453e8f1f3f5eecfd6afca',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::load_element()'],['../structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910',1,'cutlass::TileLoadIterator::load_element()'],['../structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c',1,'cutlass::TileStoreIterator::load_element()']]],
+  ['load_5fiterator',['load_iterator',['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065',1,'cutlass::gemm::GlobalLoadStream::Params::load_iterator()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c',1,'cutlass::gemm::GlobalLoadStream::load_iterator()']]],
+  ['load_5fpost_5fincrement',['load_post_increment',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7',1,'cutlass::gemm::GemmGlobalIteratorAb::load_post_increment()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1',1,'cutlass::gemm::GemmGlobalIteratorCd::load_post_increment()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae2febd768cbbfb8aab3c2cb669c0505d',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::load_post_increment()'],['../structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f',1,'cutlass::TileLoadIterator::load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a',1,'cutlass::TileLoadIterator::load_post_increment(Fragment &amp;fragment)'],['../structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214',1,'cutlass::TileStoreIterator::load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileStoreIterator.html#adfbd262dfb19fffd91e0712190d9712d',1,'cutlass::TileStoreIterator::load_post_increment(Fragment &amp;fragment)'],['../classcutlass_1_1ZipTileIterator.html#a95b8db4af9228beed273669b3b0b12fe',1,'cutlass::ZipTileIterator::load_post_increment(Fragment &amp;fragment)'],['../classcutlass_1_1ZipTileIterator.html#a3020bcd0a49efad674ca5539ea1c96c0',1,'cutlass::ZipTileIterator::load_post_increment(Fragment &amp;fragment, Coord&lt; 4 &gt; const &amp;offset)'],['../classcutlass_1_1ZipTileIterator.html#a53045f40d203a805af9c92fa0b5bc684',1,'cutlass::ZipTileIterator::load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)']]],
   ['load_5fstore_2eh',['load_store.h',['../load__store_8h.html',1,'']]],
-  ['loaditerator',['LoadIterator',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe',1,'cutlass::gemm::GlobalLoadStreamBase']]],
+  ['loaditerator',['LoadIterator',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64',1,'cutlass::gemm::GlobalLoadStream']]],
+  ['log',['log',['../namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c',1,'cutlass::platform']]],
+  ['log10',['log10',['../namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06',1,'cutlass::platform']]],
   ['log2_5fdown',['log2_down',['../structcutlass_1_1log2__down.html',1,'cutlass']]],
   ['log2_5fdown_3c_20n_2c_201_2c_20count_20_3e',['log2_down&lt; N, 1, Count &gt;',['../structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html',1,'cutlass']]],
   ['log2_5fup',['log2_up',['../structcutlass_1_1log2__up.html',1,'cutlass']]],
-  ['log2_5fup_3c_20n_2c_201_2c_20count_20_3e',['log2_up&lt; N, 1, Count &gt;',['../structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html',1,'cutlass']]]
+  ['log2_5fup_3c_20n_2c_201_2c_20count_20_3e',['log2_up&lt; N, 1, Count &gt;',['../structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html',1,'cutlass']]],
+  ['longindex',['LongIndex',['../classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1',1,'cutlass::TensorRef::LongIndex()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::LongIndex()'],['../structcutlass_1_1TensorRefBatchStrided.html#aa3df5b7337d41d8f96717ea73bf3e24e',1,'cutlass::TensorRefBatchStrided::LongIndex()'],['../structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0',1,'cutlass::TensorRefArray::LongIndex()']]]
 ];
diff --git a/docs/search/all_c.js b/docs/search/all_c.js
index 7420bb3e6..9710eb39a 100644
--- a/docs/search/all_c.js
+++ b/docs/search/all_c.js
@@ -1,20 +1,31 @@
 var searchData=
 [
-  ['m',['m',['../structcutlass_1_1gemm_1_1GemmDesc.html#a5c2b3e75cb6873762ba3f85487b78579',1,'cutlass::gemm::GemmDesc::m()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22',1,'cutlass::gemm::GemmEpilogue::m()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aaf27c0f2f4ab730ed5c865e9f7d2373b',1,'cutlass::gemm::GemmTraits::Params::m()']]],
+  ['m',['m',['../structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793',1,'cutlass::gemm::GemmCoord::m() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a8199f5e336a20c31e54d68b11e9fa3d3',1,'cutlass::gemm::GemmCoord::m()']]],
   ['main_5floop',['main_loop',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4',1,'cutlass::gemm::GemmTraits::SharedStorage']]],
   ['mainloopsharedstorage',['MainLoopSharedStorage',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html',1,'cutlass::gemm::GemmTraits']]],
   ['make_5fcoord',['make_Coord',['../namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9',1,'cutlass::make_Coord(int _0)'],['../namespacecutlass.html#a61d81e5363bcb8a7f6dd70f053242564',1,'cutlass::make_Coord(int _0, int _1)'],['../namespacecutlass.html#a25acf680a7d2592c957a7ac603f4c361',1,'cutlass::make_Coord(int _0, int _1, int _2)'],['../namespacecutlass.html#a9410b1f5956d3aaf4584e65d047428fc',1,'cutlass::make_Coord(int _0, int _1, int _2, int _3)']]],
+  ['make_5fcoord_5ffrom_5fshape',['make_Coord_from_shape',['../namespacecutlass.html#a90028a415a05ce09073860e5c761aa6f',1,'cutlass']]],
   ['make_5fpair',['make_pair',['../namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5',1,'cutlass::platform']]],
-  ['make_5fzero',['make_zero',['../namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf',1,'cutlass::make_zero(Scalar_ &amp;x)'],['../namespacecutlass.html#abc5c00b4986db5a114e774cee9999717',1,'cutlass::make_zero(Vector&lt; Scalar_, kLanes_ &gt; &amp;vec)']]],
+  ['make_5fzero',['make_zero',['../namespacecutlass.html#aa03883e612d292e1b53eedd46e08ccd1',1,'cutlass::make_zero(Scalar_ &amp;x)'],['../namespacecutlass.html#a55b5b15eadf125d5ddddee1ea22191ee',1,'cutlass::make_zero(Vector&lt; Scalar_, kLanes_ &gt; &amp;vec)']]],
+  ['make_5fzipconvert',['make_ZipConvert',['../namespacecutlass.html#adad916101ca58fc9714362c611a0cad8',1,'cutlass']]],
+  ['make_5fzipfragment',['make_ZipFragment',['../namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6',1,'cutlass']]],
+  ['make_5fziptensorref',['make_ZipTensorRef',['../namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a',1,'cutlass']]],
+  ['map',['map',['../classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360',1,'cutlass::TensorRef::map()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a215f63b5a1b3799654c5670ef108fcfb',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::map()']]],
+  ['mapfunc',['MapFunc',['../classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29',1,'cutlass::TensorRef::MapFunc()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::MapFunc()']]],
+  ['mask_5f',['mask_',['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762',1,'cutlass::gemm::IgemmGlobalIteratorAb']]],
   ['matrix_5ftraits_2eh',['matrix_traits.h',['../matrix__traits_8h.html',1,'']]],
+  ['matrixcoord',['MatrixCoord',['../structcutlass_1_1MatrixCoord.html',1,'cutlass::MatrixCoord'],['../structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6',1,'cutlass::MatrixCoord::MatrixCoord()'],['../structcutlass_1_1MatrixCoord.html#a64bddbf8238dc937a01a140722f7f39c',1,'cutlass::MatrixCoord::MatrixCoord(Coord&lt; 2, Index &gt; const &amp;coord)'],['../structcutlass_1_1MatrixCoord.html#ac77b18e67be18cfdfe1935939e7f2017',1,'cutlass::MatrixCoord::MatrixCoord(Index row, Index column)']]],
   ['matrixlayout',['MatrixLayout',['../structcutlass_1_1MatrixLayout.html',1,'cutlass']]],
-  ['max',['max',['../namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0',1,'cutlass::platform']]],
+  ['matrixtransform',['MatrixTransform',['../structcutlass_1_1MatrixTransform.html',1,'cutlass']]],
+  ['max',['Max',['../structcutlass_1_1Max.html',1,'cutlass::Max&lt; A, B &gt;'],['../namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0',1,'cutlass::platform::max()']]],
   ['memoryspace',['MemorySpace',['../structcutlass_1_1MemorySpace.html',1,'cutlass']]],
-  ['min',['min',['../namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c',1,'cutlass::platform']]],
+  ['min',['Min',['../structcutlass_1_1Min.html',1,'cutlass::Min&lt; A, B &gt;'],['../namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c',1,'cutlass::platform::min()']]],
+  ['move_5fto_5fresidue',['move_to_residue',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac269a9280a55d3988ca60f571bdf7f29',1,'cutlass::gemm::GlobalLoadStream::move_to_residue()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab94c0c95d6d4e019563ba8a142f9d410',1,'cutlass::gemm::GlobalLoadStreamPair::move_to_residue()']]],
+  ['multiplicand_5fbounds',['multiplicand_bounds',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1',1,'cutlass::gemm::GlobalLoadStream']]],
   ['multiplicandtraits',['MultiplicandTraits',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7',1,'cutlass::gemm::GemmGlobalTileTraits']]],
   ['multiplicative',['Multiplicative',['../structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597',1,'cutlass::Identity']]],
-  ['multiply',['multiply',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a522301fbe3e276cb5ef9fbe75bb2ab50',1,'cutlass::gemm::FragmentMultiplyAdd::multiply()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ae62d61ec068ac958753d0a2f5a99d8e2',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::multiply()']]],
-  ['multiply_5fadd',['multiply_add',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a34bbf209967fef6181d3d46dd27fa0c0',1,'cutlass::gemm::FragmentMultiplyAdd::multiply_add()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a89c8b663af69f13c2a02cb464b5172a5',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f',1,'cutlass::gemm::Gemm::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a66486d38349fa20eb065ae9542eb43aa',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad22dd143c304c22c2630aedbfd3459af',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5dcf66c8126ec8adf8e66d4bf5b2f347',1,'cutlass::gemm::ThreadMultiplyAdd::multiply_add()']]],
-  ['multiplyadd',['MultiplyAdd',['../structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7',1,'cutlass::gemm::GemmConfig::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c',1,'cutlass::gemm::GemmTraits::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8',1,'cutlass::gemm::HgemmTraitsHelper::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8',1,'cutlass::gemm::IgemmTraitsHelper::MultiplyAdd()']]],
-  ['multiplyaddscalar',['MultiplyAddScalar',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar()']]]
+  ['multiply',['multiply',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a934c0d74c70fc87796ecb5cde50fd516',1,'cutlass::gemm::FragmentMultiplyAdd::multiply()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a6bed70e7074931419e9441688aee00ea',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::multiply()']]],
+  ['multiply_5fadd',['multiply_add',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aafa37c2e1ffd2f7d7031c24c732157d8',1,'cutlass::gemm::FragmentMultiplyAdd::multiply_add()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a92edee5611d25b60cdab6a1c8e32141f',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#ae0ea662652907b60140598dad777c5ab',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f',1,'cutlass::gemm::Gemm::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aaf8ea4aaf393488f03ba7fb7af264940',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ad9d8e47e8896d8d4eab538aa78b56e47',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7989d48e4c2e16b7804b813630f347cb',1,'cutlass::gemm::ThreadMultiplyAdd::multiply_add()']]],
+  ['multiplyadd',['MultiplyAdd',['../structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835',1,'cutlass::gemm::Gemm::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd',1,'cutlass::gemm::GemmConfig::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c',1,'cutlass::gemm::GemmTraits::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef',1,'cutlass::gemm::HgemmTraitsHelper::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e',1,'cutlass::gemm::IgemmTraitsHelper::MultiplyAdd()']]],
+  ['multiplyaddscalar',['MultiplyAddScalar',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::MultiplyAddScalar()']]]
 ];
diff --git a/docs/search/all_d.js b/docs/search/all_d.js
index 7c84844e4..28befa5b0 100644
--- a/docs/search/all_d.js
+++ b/docs/search/all_d.js
@@ -1,8 +1,11 @@
 var searchData=
 [
-  ['n',['N',['../structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca',1,'cutlass::Coord::N()'],['../structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a',1,'cutlass::gemm::GemmDesc::n()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea',1,'cutlass::gemm::GemmEpilogue::n()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a437d4b6f1f149849c5ae635a5993e7ac',1,'cutlass::gemm::GemmTraits::Params::n()']]],
+  ['n',['N',['../structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030',1,'cutlass::Coord::N()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd',1,'cutlass::gemm::GemmCoord::n() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a1327b9b4b9379df24df3d4b716952d11',1,'cutlass::gemm::GemmCoord::n()']]],
+  ['nm',['nm',['../structcutlass_1_1gemm_1_1GemmCoord.html#ac4550a7e80e1f0265eacecebe54794d9',1,'cutlass::gemm::GemmCoord']]],
   ['no',['no',['../structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af',1,'cutlass::platform::is_base_of_helper']]],
   ['noexcept',['noexcept',['../platform_8h.html#a189faadd7f99f6c354db09acbb2aafcd',1,'platform.h']]],
+  ['norm',['norm',['../namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1',1,'cutlass::platform']]],
   ['nullptr',['nullptr',['../platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936',1,'platform.h']]],
-  ['nullptr_5ft',['nullptr_t',['../structcutlass_1_1platform_1_1nullptr__t.html',1,'cutlass::platform']]]
+  ['nullptr_5ft',['nullptr_t',['../structcutlass_1_1platform_1_1nullptr__t.html',1,'cutlass::platform']]],
+  ['numeric_5ftypes_2eh',['numeric_types.h',['../numeric__types_8h.html',1,'']]]
 ];
diff --git a/docs/search/all_e.js b/docs/search/all_e.js
index 49c17a921..572fa6181 100644
--- a/docs/search/all_e.js
+++ b/docs/search/all_e.js
@@ -1,34 +1,41 @@
 var searchData=
 [
-  ['offset',['offset',['../classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8',1,'cutlass::TensorRef::offset()'],['../classcutlass_1_1TensorView.html#a064f3630e69798e7915f910c4ee99ab7',1,'cutlass::TensorView::offset()']]],
-  ['offset_5ft',['Offset_t',['../classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f',1,'cutlass::TensorView']]],
+  ['offset',['offset',['../classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1',1,'cutlass::TensorRef::offset()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a07c7f56e724cfbc844777e8ee9f616b5',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::offset()']]],
+  ['offset_5ft',['Offset_t',['../classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1',1,'cutlass::TensorView']]],
+  ['offset_5fto_5fresidue',['offset_to_residue',['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1',1,'cutlass::gemm::GlobalLoadStream::Params']]],
+  ['onedirection',['OneDirection',['../structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5',1,'cutlass::gemm::swizzleDirection']]],
+  ['operator',['operator',['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679',1,'cutlass::TensorRefArray::ConstIterator::operator()']]],
   ['operator_20_26_3d',['operator &amp;=',['../structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9',1,'cutlass::PredicateVector']]],
   ['operator_20b_2a',['operator B*',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8d100273203db9018dffbbe84e0b6c76',1,'cutlass::platform::is_base_of_helper::dummy']]],
-  ['operator_20bool',['operator bool',['../classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005',1,'cutlass::platform::unique_ptr']]],
+  ['operator_20bool',['operator bool',['../structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f',1,'cutlass::Coord::operator bool()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005',1,'cutlass::platform::unique_ptr::operator bool()']]],
+  ['operator_20cudoublecomplex',['operator cuDoubleComplex',['../classcutlass_1_1platform_1_1complex.html#a3b92e54de1c4262c7e481218162be7ec',1,'cutlass::platform::complex']]],
+  ['operator_20cufloatcomplex',['operator cuFloatComplex',['../classcutlass_1_1platform_1_1complex.html#ac5a3a0dc9815dadbe539312eb6fe36c4',1,'cutlass::platform::complex']]],
   ['operator_20d_2a',['operator D*',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8aadc500baf1492b1a4d05cc8b35fc13',1,'cutlass::platform::is_base_of_helper::dummy']]],
+  ['operator_20scalar',['operator Scalar',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a896f35e776c1291ceda0f432cc3da654',1,'cutlass::detail::ScalarOrPointer']]],
   ['operator_20value_5ftype',['operator value_type',['../structcutlass_1_1platform_1_1integral__constant.html#a55d25116387f1c6d978462b1d245d675',1,'cutlass::platform::integral_constant']]],
-  ['operator_21_3d',['operator!=',['../structcutlass_1_1Coord.html#a7fb46873e8f3cf38212703d35bd36995',1,'cutlass::Coord::operator!=()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685',1,'cutlass::PredicateVector::ConstIterator::operator!=()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887',1,'cutlass::PredicateVector::Iterator::operator!=()'],['../namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566',1,'cutlass::platform::operator!=()']]],
-  ['operator_28_29',['operator()',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be',1,'cutlass::gemm::GemmGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52',1,'cutlass::gemm::GemmGlobalTileCdTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html#a1e357fe5bc1daef333e6be776a21a2ca',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410',1,'cutlass::gemm::GemmSharedLoadTileATraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html#a5b4a635a521364357386259b0f84c0ba',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html#a1228edf6cc0f81af520dc77c8792b94c',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::ThreadOffset::operator()()'],['../structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2',1,'cutlass::TiledThreadOffset::operator()()'],['../structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000',1,'cutlass::TileTraitsWarpRake::ThreadOffset::operator()()'],['../structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c',1,'cutlass::platform::plus::operator()()'],['../structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5',1,'cutlass::platform::less::operator()()'],['../structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978',1,'cutlass::platform::greater::operator()()'],['../structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18',1,'cutlass::platform::integral_constant::operator()()'],['../structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15',1,'cutlass::platform::default_delete::operator()()'],['../structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87',1,'cutlass::platform::default_delete&lt; T[]&gt;::operator()()']]],
-  ['operator_2a',['operator*',['../structcutlass_1_1Coord.html#a8e4f7df55a75d040cf50cf9984c04c8a',1,'cutlass::Coord::operator*()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946',1,'cutlass::PredicateVector::ConstIterator::operator*()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4',1,'cutlass::PredicateVector::Iterator::operator*()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78',1,'cutlass::PredicateVector::TrivialIterator::operator*()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b',1,'cutlass::platform::unique_ptr::operator*()']]],
-  ['operator_2a_3d',['operator*=',['../structcutlass_1_1Coord.html#a282b6cc9ac8b2f72720c252791155aad',1,'cutlass::Coord']]],
-  ['operator_2b',['operator+',['../structcutlass_1_1Coord.html#a3dfc4ce4191097b6c3268696f2a45ef5',1,'cutlass::Coord::operator+()'],['../classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842',1,'cutlass::TensorRef::operator+()']]],
-  ['operator_2b_2b',['operator++',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70',1,'cutlass::PredicateVector::ConstIterator::operator++()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5',1,'cutlass::PredicateVector::ConstIterator::operator++(int)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3',1,'cutlass::PredicateVector::Iterator::operator++()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3',1,'cutlass::PredicateVector::Iterator::operator++(int)'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a',1,'cutlass::PredicateVector::TrivialIterator::operator++()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051',1,'cutlass::PredicateVector::TrivialIterator::operator++(int)']]],
-  ['operator_2b_3d',['operator+=',['../structcutlass_1_1Coord.html#aeb209486943fa9d42911325b16e49e09',1,'cutlass::Coord']]],
-  ['operator_2d',['operator-',['../structcutlass_1_1Coord.html#acc510511ffb52bed7f6a52f14b99750d',1,'cutlass::Coord::operator-()'],['../classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938',1,'cutlass::TensorRef::operator-()']]],
-  ['operator_2d_2d',['operator--',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286',1,'cutlass::PredicateVector::ConstIterator::operator--()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b',1,'cutlass::PredicateVector::ConstIterator::operator--(int)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61',1,'cutlass::PredicateVector::Iterator::operator--()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a',1,'cutlass::PredicateVector::Iterator::operator--(int)']]],
-  ['operator_2d_3d',['operator-=',['../structcutlass_1_1Coord.html#ac1795ec2a5890d8a39840567a4bea88e',1,'cutlass::Coord']]],
+  ['operator_21',['operator!',['../structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02',1,'cutlass::Coord']]],
+  ['operator_21_3d',['operator!=',['../structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3',1,'cutlass::Coord::operator!=()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685',1,'cutlass::PredicateVector::ConstIterator::operator!=()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887',1,'cutlass::PredicateVector::Iterator::operator!=()'],['../namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c',1,'cutlass::platform::operator!=(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566',1,'cutlass::platform::operator!=(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)']]],
+  ['operator_28_29',['operator()',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be',1,'cutlass::gemm::GemmGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52',1,'cutlass::gemm::GemmGlobalTileCdTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html#a1e357fe5bc1daef333e6be776a21a2ca',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410',1,'cutlass::gemm::GemmSharedLoadTileATraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html#a5b4a635a521364357386259b0f84c0ba',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#a80562f5ceab2049c3b7834c2891a07ee',1,'cutlass::gemm::IgemmGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::ThreadOffset::operator()()'],['../structcutlass_1_1MatrixLayout_1_1RowMajor.html#a736620aef395e4224d7aae098573aa34',1,'cutlass::MatrixLayout::RowMajor::operator()()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#af51e07c6605524581e5d27d290c8b8d2',1,'cutlass::MatrixLayout::ColumnMajor::operator()()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a5199cb7f7c10f6123c63703453b7937c',1,'cutlass::MatrixLayout::RowMajorInterleaved::operator()()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dbf79e5df5bcf52d54a699d2587319d',1,'cutlass::MatrixLayout::ColumnMajorInterleaved::operator()()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a512248a443c5914fab6aeabc4a73978e',1,'cutlass::MatrixLayout::ContiguousLayout::operator()()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a24c06bb7e64a8015ac528b3ae954a689',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::operator()()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#abde0a4a7c487da0c78ea2519323c04af',1,'cutlass::MatrixLayout::RowMajorBlockLinear::operator()()'],['../structcutlass_1_1IdentityTensorMapFunc.html#a3922130841c34d3ce8c112ee6fae4ca1',1,'cutlass::IdentityTensorMapFunc::operator()()'],['../structcutlass_1_1RegularTilePredicateFunctor.html#a084c0a2732827a74f7a30873c5883827',1,'cutlass::RegularTilePredicateFunctor::operator()()'],['../structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2',1,'cutlass::TiledThreadOffset::operator()()'],['../structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000',1,'cutlass::TileTraitsWarpRake::ThreadOffset::operator()()'],['../structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c',1,'cutlass::platform::plus::operator()()'],['../structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5',1,'cutlass::platform::less::operator()()'],['../structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978',1,'cutlass::platform::greater::operator()()'],['../structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18',1,'cutlass::platform::integral_constant::operator()()'],['../structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15',1,'cutlass::platform::default_delete::operator()()'],['../structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87',1,'cutlass::platform::default_delete&lt; T[]&gt;::operator()()']]],
+  ['operator_2a',['operator*',['../structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033',1,'cutlass::Coord::operator*()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a5a158b5f3c0b1779972b25aa52be1164',1,'cutlass::gemm::GemmCoord::operator*()'],['../structcutlass_1_1MatrixCoord.html#ac68a57c17811b0a04dc6fb21423ab226',1,'cutlass::MatrixCoord::operator*()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946',1,'cutlass::PredicateVector::ConstIterator::operator*()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4',1,'cutlass::PredicateVector::Iterator::operator*()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78',1,'cutlass::PredicateVector::TrivialIterator::operator*()'],['../structcutlass_1_1TileCoord.html#ab8fbb13cc5ea4f580a7fc32963de9553',1,'cutlass::TileCoord::operator*()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b',1,'cutlass::platform::unique_ptr::operator*()'],['../namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba',1,'cutlass::platform::operator*(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#aef5da2c88431ab40b58fdd6afea13dba',1,'cutlass::platform::operator*(complex&lt; T &gt; const &amp;lhs, T const &amp;s)'],['../namespacecutlass_1_1platform.html#a289b6e31bdc0be1302b8dbab55eb568c',1,'cutlass::platform::operator*(T const &amp;s, complex&lt; T &gt; const &amp;rhs)']]],
+  ['operator_2a_3d',['operator*=',['../structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168',1,'cutlass::Coord::operator*=()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a69fb0bb5e73f35d3c8df71a0174d6520',1,'cutlass::gemm::GemmCoord::operator*=()'],['../structcutlass_1_1MatrixCoord.html#a5fd3c3b58af1147a5c73657c05a16f5b',1,'cutlass::MatrixCoord::operator*=()'],['../structcutlass_1_1TileCoord.html#ae946b3af6b795d26632da7ca66b3751c',1,'cutlass::TileCoord::operator*=()'],['../namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac',1,'cutlass::platform::operator*=(complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#a21adde191e48e604908ce886690c6d6b',1,'cutlass::platform::operator*=(complex&lt; T &gt; &amp;lhs, T s)']]],
+  ['operator_2b',['operator+',['../structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc',1,'cutlass::Coord::operator+()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a675efbb9ed360888faf3c333708ae4d5',1,'cutlass::gemm::GemmCoord::operator+()'],['../structcutlass_1_1MatrixCoord.html#a25236953237f965965b1c9b7a04ba26e',1,'cutlass::MatrixCoord::operator+()'],['../classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f',1,'cutlass::TensorRef::operator+()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ad054f14b5580c9480d671b8fc8ef016a',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator+()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a1d48f4fea3fa85a7bf1b26b421387afd',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator+()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a9fcd43018e60f12cb328859c76ec7891',1,'cutlass::TensorRefArray::ConstIterator::operator+()'],['../classcutlass_1_1TensorView.html#aa2390d8e127a51df239affd2ca36e97a',1,'cutlass::TensorView::operator+()'],['../structcutlass_1_1TileCoord.html#a3bfa2daa0e63144c1e8510ba336f185b',1,'cutlass::TileCoord::operator+()'],['../namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c',1,'cutlass::platform::operator+()']]],
+  ['operator_2b_2b',['operator++',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70',1,'cutlass::PredicateVector::ConstIterator::operator++()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5',1,'cutlass::PredicateVector::ConstIterator::operator++(int)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3',1,'cutlass::PredicateVector::Iterator::operator++()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3',1,'cutlass::PredicateVector::Iterator::operator++(int)'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a',1,'cutlass::PredicateVector::TrivialIterator::operator++()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051',1,'cutlass::PredicateVector::TrivialIterator::operator++(int)'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a3481d6f41defd25ab574bb19ee5fe424',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator++()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#aca860ff7f125e02f35c7dc174e84708d',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator++(int)'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a8ce80124ab0f4ab9981f1a4d64d976a5',1,'cutlass::TensorRefArray::ConstIterator::operator++()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a051f34d90c0680dc5f4e4e1c4d79e929',1,'cutlass::TensorRefArray::ConstIterator::operator++(int)'],['../classcutlass_1_1ZipTileIterator.html#a47d270fc4a119d7b95b2d5dd3ee5b87b',1,'cutlass::ZipTileIterator::operator++()']]],
+  ['operator_2b_3d',['operator+=',['../structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20',1,'cutlass::Coord::operator+=()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a5465f7308778eac5d14d8020179a65e0',1,'cutlass::gemm::GemmCoord::operator+=()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a8e79a153de72eef10d90bfd02b5dd27e',1,'cutlass::gemm::GlobalLoadStream::operator+=()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af',1,'cutlass::gemm::GemmGlobalIteratorAb::operator+=()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec',1,'cutlass::gemm::GemmGlobalIteratorCd::operator+=()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a769813dcffe1767aab49ac30b838a5f4',1,'cutlass::gemm::GlobalLoadStreamPair::operator+=()'],['../structcutlass_1_1MatrixCoord.html#ad105615dbf7ede75caa0e778c873bd06',1,'cutlass::MatrixCoord::operator+=()'],['../classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306',1,'cutlass::TensorRef::operator+=()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0753aeb57365a976bc0a88481af504cb',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator+=()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab07a5d1a4ec6d96ec53e868b3a6d7cae',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator+=()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a22b87d281057c8e03b80db7046c54dd8',1,'cutlass::TensorRefArray::ConstIterator::operator+=()'],['../classcutlass_1_1TensorView.html#a4fa8fa35d00eb4d0097da492c738cddc',1,'cutlass::TensorView::operator+=()'],['../structcutlass_1_1TileCoord.html#a812760c633ea813db8a2bc24826c68df',1,'cutlass::TileCoord::operator+=()'],['../structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120',1,'cutlass::TileLoadIterator::operator+=()'],['../structcutlass_1_1TileStoreIterator.html#a57b284e6cbff892d45e5cfeb0ae1e3ed',1,'cutlass::TileStoreIterator::operator+=()'],['../classcutlass_1_1ZipTileIterator.html#a60ba516d7382cb7788d5430023f7fc44',1,'cutlass::ZipTileIterator::operator+=(int count)'],['../classcutlass_1_1ZipTileIterator.html#a200a4e88ee6d23dcc80e974c77f8fa1f',1,'cutlass::ZipTileIterator::operator+=(Coord&lt; 3 &gt; const &amp;offset)'],['../namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d',1,'cutlass::platform::operator+=()']]],
+  ['operator_2d',['operator-',['../structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b',1,'cutlass::Coord::operator-()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a762fd45e61477d700c82bfd67443c6f9',1,'cutlass::gemm::GemmCoord::operator-()'],['../structcutlass_1_1MatrixCoord.html#aa462303d75a5d98b680b6e20080ce877',1,'cutlass::MatrixCoord::operator-()'],['../classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa',1,'cutlass::TensorRef::operator-()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#afde28cda18918d3e177d3e5024ed3dd4',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator-()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad1d8099e8d63b6d88c53738ec68a7589',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator-(Index idx)'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab92bc090d6753ff5e17676ba85a1e478',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator-(ConstIterator const &amp;it)'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a143ec893406d930aa4c5aa860052197e',1,'cutlass::TensorRefArray::ConstIterator::operator-()'],['../classcutlass_1_1TensorView.html#a1e4b2bb02c5843898f72f62787403add',1,'cutlass::TensorView::operator-()'],['../structcutlass_1_1TileCoord.html#a9f274d8e93f9cd3e0a9699e11b85fa7c',1,'cutlass::TileCoord::operator-()'],['../namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763',1,'cutlass::platform::operator-()']]],
+  ['operator_2d_2d',['operator--',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286',1,'cutlass::PredicateVector::ConstIterator::operator--()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b',1,'cutlass::PredicateVector::ConstIterator::operator--(int)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61',1,'cutlass::PredicateVector::Iterator::operator--()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a',1,'cutlass::PredicateVector::Iterator::operator--(int)'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad5290f0e7814892cb4fff55e9518562b',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator--()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a09909fbe2e4365b5f34ddb61658f27b3',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator--(int)'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a0f395558e2c589ac48179447a23b59d8',1,'cutlass::TensorRefArray::ConstIterator::operator--()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ac9019febbc8b6bfea06ac4d23d253d57',1,'cutlass::TensorRefArray::ConstIterator::operator--(int)'],['../classcutlass_1_1ZipTileIterator.html#a3d22dab34b2abd0d05c00668f8591151',1,'cutlass::ZipTileIterator::operator--()']]],
+  ['operator_2d_3d',['operator-=',['../structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b',1,'cutlass::Coord::operator-=()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a12ba250be3d5474b7c6fc4eddd4f58d5',1,'cutlass::gemm::GemmCoord::operator-=()'],['../structcutlass_1_1MatrixCoord.html#a6feef48cf24733d22ca53a27cbc33ac0',1,'cutlass::MatrixCoord::operator-=()'],['../classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890',1,'cutlass::TensorRef::operator-=()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a11964d045ac8e41c80026515adb03008',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator-=()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ac4018b51e78842fb252d6917738fa571',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator-=()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ae3561f863072cd7be7dcdee2cb5cc1f0',1,'cutlass::TensorRefArray::ConstIterator::operator-=()'],['../classcutlass_1_1TensorView.html#abc088fad6debb6a0ceb04c5d2767e81b',1,'cutlass::TensorView::operator-=()'],['../structcutlass_1_1TileCoord.html#a02da20e580962fe0754a772842045389',1,'cutlass::TileCoord::operator-=()'],['../classcutlass_1_1ZipTileIterator.html#a7bae0f9b789e75bb154c5f37db50e14c',1,'cutlass::ZipTileIterator::operator-=()'],['../namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9',1,'cutlass::platform::operator-=()']]],
   ['operator_2d_3e',['operator-&gt;',['../classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b',1,'cutlass::platform::unique_ptr']]],
-  ['operator_2f',['operator/',['../structcutlass_1_1Coord.html#a87f485be079fa68bcf576da4d56f0ece',1,'cutlass::Coord']]],
-  ['operator_2f_3d',['operator/=',['../structcutlass_1_1Coord.html#abe91e59962ef0d73aec9c14824f64ecc',1,'cutlass::Coord']]],
-  ['operator_3c',['operator&lt;',['../namespacecutlass_1_1platform.html#a412dbdbc678ecd12b55fcad4ef4155bd',1,'cutlass::platform']]],
-  ['operator_3c_3c',['operator&lt;&lt;',['../core__io_8h.html#a4a0d84a2a19a11549b87a2328d58690d',1,'core_io.h']]],
-  ['operator_3c_3d',['operator&lt;=',['../namespacecutlass_1_1platform.html#a41d573133357bd555f78d33afc1152d3',1,'cutlass::platform']]],
-  ['operator_3d',['operator=',['../classcutlass_1_1TensorView.html#aa9e9e19f35ce3111f64b763ca49b51ef',1,'cutlass::TensorView']]],
-  ['operator_3d_3d',['operator==',['../structcutlass_1_1Coord.html#acfa94aabd0c9a71ee994ca479d5f515f',1,'cutlass::Coord::operator==()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357',1,'cutlass::PredicateVector::ConstIterator::operator==()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e',1,'cutlass::PredicateVector::Iterator::operator==()'],['../namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197',1,'cutlass::platform::operator==()']]],
+  ['operator_2f',['operator/',['../structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568',1,'cutlass::Coord::operator/()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a41770bb99f02f4debbafe95e019ce02b',1,'cutlass::gemm::GemmCoord::operator/()'],['../structcutlass_1_1MatrixCoord.html#aa89b196410d25d8c9ed3746fb6833374',1,'cutlass::MatrixCoord::operator/()'],['../structcutlass_1_1TileCoord.html#a5d2cc915343a3b90fb530348ddd329d2',1,'cutlass::TileCoord::operator/()'],['../namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f',1,'cutlass::platform::operator/(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#a33f75d77ff629335c9666128837c4581',1,'cutlass::platform::operator/(complex&lt; T &gt; const &amp;lhs, T const &amp;s)'],['../namespacecutlass_1_1platform.html#ae302b414576ecb5afb0cdfdda6b30ad3',1,'cutlass::platform::operator/(T const &amp;s, complex&lt; T &gt; const &amp;rhs)']]],
+  ['operator_2f_3d',['operator/=',['../structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28',1,'cutlass::Coord::operator/=()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#aac1e1bad751237fd76d32a1ea10f6c40',1,'cutlass::gemm::GemmCoord::operator/=()'],['../structcutlass_1_1MatrixCoord.html#aab345c8ddb8048bfe3d667bc7ce6522f',1,'cutlass::MatrixCoord::operator/=()'],['../structcutlass_1_1TileCoord.html#ac3207d8aa879c86a907cdcc93ccb2eb5',1,'cutlass::TileCoord::operator/=()'],['../namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40',1,'cutlass::platform::operator/=()']]],
+  ['operator_3c',['operator&lt;',['../structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308',1,'cutlass::Coord::operator&lt;()'],['../namespacecutlass_1_1platform.html#a412dbdbc678ecd12b55fcad4ef4155bd',1,'cutlass::platform::operator&lt;()']]],
+  ['operator_3c_3c',['operator&lt;&lt;',['../namespacecutlass.html#afe231b125bbb1e9aa51307a8abdf9a60',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, Coord&lt; Rank &gt; const &amp;coord)'],['../namespacecutlass.html#a30ddfc5e90b9103840cb30c9f9b96b49',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; T &gt; const &amp;scalar)'],['../namespacecutlass.html#a36690681ed19dc7e398fcdafdbfe9975',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; int8_t &gt; const &amp;scalar)'],['../namespacecutlass.html#a1a35d6b9b984a9c143957db733a93f51',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; uint8_t &gt; const &amp;scalar)'],['../namespacecutlass.html#a2fd306c63f71877f9231a7e1265752cf',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; cutlass::Vector&lt; cutlass::bin1_t, 32 &gt; &gt; const &amp;scalar)'],['../namespacecutlass.html#aecf2cd62eee939946b7173a110ecf76e',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; cutlass::Vector&lt; cutlass::int4_t, 8 &gt; &gt; const &amp;scalar)'],['../namespacecutlass.html#a3ceda5ed2d923222662a37e8f355c9b8',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; cutlass::Vector&lt; cutlass::uint4_t, 8 &gt; &gt; const &amp;scalar)'],['../namespacecutlass_1_1platform.html#ab4c3e4eabba020d7a9faf86ee6cf437a',1,'cutlass::platform::operator&lt;&lt;()']]],
+  ['operator_3c_3d',['operator&lt;=',['../structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c',1,'cutlass::Coord::operator&lt;=()'],['../namespacecutlass_1_1platform.html#a41d573133357bd555f78d33afc1152d3',1,'cutlass::platform::operator&lt;=()']]],
+  ['operator_3d',['operator=',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b29491782c3a129355fa4ef159cb970',1,'cutlass::detail::ScalarOrPointer::operator=(Scalar const &amp;scalar_)'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a54357e2f1d52aa8355b2ae7796740ea3',1,'cutlass::detail::ScalarOrPointer::operator=(Scalar const *ptr_)'],['../classcutlass_1_1TensorView.html#acf0c156efb9197bc7538f7e9057d8a68',1,'cutlass::TensorView::operator=()']]],
+  ['operator_3d_3d',['operator==',['../structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d',1,'cutlass::Coord::operator==()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357',1,'cutlass::PredicateVector::ConstIterator::operator==()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e',1,'cutlass::PredicateVector::Iterator::operator==()'],['../namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb',1,'cutlass::platform::operator==(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197',1,'cutlass::platform::operator==(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)']]],
   ['operator_3e',['operator&gt;',['../namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12',1,'cutlass::platform']]],
   ['operator_3e_3d',['operator&gt;=',['../namespacecutlass_1_1platform.html#ab0f21e67c0a4b5c6952042b502c6816f',1,'cutlass::platform']]],
-  ['operator_5b_5d',['operator[]',['../structcutlass_1_1Coord.html#ab7fc89de3ccd7096ab275fb5dd40104c',1,'cutlass::Coord::operator[](int dim)'],['../structcutlass_1_1Coord.html#a6eeab0a1686ee25389e1bd017c5f03ae',1,'cutlass::Coord::operator[](int dim) const'],['../structcutlass_1_1Fragment.html#a99fef5f3093b2df50905ab13819b67a0',1,'cutlass::Fragment::operator[](int i)'],['../structcutlass_1_1Fragment.html#a75f51bb6ca84615076aab42ac9d42592',1,'cutlass::Fragment::operator[](int i) const'],['../structcutlass_1_1FragmentIterator.html#a83bb6a3ed588e2d890bf986665d2b7bb',1,'cutlass::FragmentIterator::operator[](int i) const'],['../structcutlass_1_1FragmentIterator.html#a3bd2a9d8467f8db02ca3a01ae0c11ad7',1,'cutlass::FragmentIterator::operator[](int i)'],['../structcutlass_1_1FragmentConstIterator.html#af16f2aa14ff424b038a393b683c4783e',1,'cutlass::FragmentConstIterator::operator[]()'],['../structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5',1,'cutlass::PredicateVector::operator[]()'],['../classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974',1,'cutlass::TensorRef::operator[](Coord&lt; Rank &gt; const &amp;coord) const'],['../classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c',1,'cutlass::TensorRef::operator[](int idx) const'],['../classcutlass_1_1TensorView.html#a7fe7e44e15fd1ac58fb55edf72e8fb23',1,'cutlass::TensorView::operator[]()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d',1,'cutlass::platform::unique_ptr::operator[]()'],['../unioncutlass_1_1Vector.html#a250860c921c94a6077344f9e11bf5b02',1,'cutlass::Vector::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector.html#a44cc27bf8a7b789b4ae8538155a50156',1,'cutlass::Vector::operator[](uint32_t i)'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab0516cef8949f5998b5251cc6b6db683',1,'cutlass::Vector&lt; half, kLanes_ &gt;::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a8ade80e040264fbd669d3f15c249884e',1,'cutlass::Vector&lt; half, kLanes_ &gt;::operator[](uint32_t i)']]],
+  ['operator_5b_5d',['operator[]',['../structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24',1,'cutlass::Coord::operator[](int dim)'],['../structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454',1,'cutlass::Coord::operator[](int dim) const'],['../structcutlass_1_1Fragment.html#a77ba7cddf7822d64534b019c4ad9732e',1,'cutlass::Fragment::operator[](int i)'],['../structcutlass_1_1Fragment.html#a7795c5cf4d5626ff125abd5e8f156e9b',1,'cutlass::Fragment::operator[](int i) const'],['../structcutlass_1_1FragmentIterator.html#a21877944988f34eb69cb6eefb00c6575',1,'cutlass::FragmentIterator::operator[](int i) const'],['../structcutlass_1_1FragmentIterator.html#ad665745f3d6a3a88d7894fe0fc1bbd3e',1,'cutlass::FragmentIterator::operator[](int i)'],['../structcutlass_1_1FragmentConstIterator.html#a6216b58ffe6322f037f1e0a3ffa714c8',1,'cutlass::FragmentConstIterator::operator[]()'],['../structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5',1,'cutlass::PredicateVector::operator[]()'],['../classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6',1,'cutlass::TensorRef::operator[](TensorCoord const &amp;coord) const'],['../classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3',1,'cutlass::TensorRef::operator[](LongIndex idx) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a64a5e91e01555b8bfd22875543573d22',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator[](TensorCoord const &amp;coord) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a57f132816e51bbdb4c807d57c067b619',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator[](LongIndex idx) const'],['../classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d',1,'cutlass::platform::unique_ptr::operator[]()'],['../unioncutlass_1_1Vector.html#a69be4f85c1dac371fa6f1c6747724adc',1,'cutlass::Vector::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector.html#abf531676caf85cde1c8df435c1ebe8bb',1,'cutlass::Vector::operator[](uint32_t i)'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a12fa9366dd57fadb2d3f624ab7836dc8',1,'cutlass::Vector&lt; half, 1 &gt;::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1e6568c0f3f958db739074ab6978ff10',1,'cutlass::Vector&lt; half, 1 &gt;::operator[](uint32_t i)'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ad50b5d4acbd7ead82c128091c9db9113',1,'cutlass::Vector&lt; half, kLanes_ &gt;::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a3891ce1c321a3e57e938c8864de9baf0',1,'cutlass::Vector&lt; half, kLanes_ &gt;::operator[](uint32_t i)'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a8eda6e6181a5333ca8350977374708cb',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::operator[]()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2d5ec0b76daa136dae0b4aec1edf9e0b',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::operator[]()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#ae2215fe7c2c223175b4172d73a6c7a82',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::operator[]()']]],
   ['operator_7c_3d',['operator|=',['../structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc',1,'cutlass::PredicateVector']]],
-  ['outputfragment',['OutputFragment',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::OutputFragment()'],['../structcutlass_1_1Copy.html#a545be6c284d625b0841a10cc9126e14a',1,'cutlass::Copy::OutputFragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a9c04f0b0eb0293325f661b72168d4fa8',1,'cutlass::gemm::HgemmSwizzle::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553',1,'cutlass::gemm::IgemmFloatToInt8Converter::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7',1,'cutlass::gemm::IgemmInt8ToFloatConverter::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8',1,'cutlass::gemm::IgemmSwizzle::OutputFragment()']]],
-  ['outputtile',['OutputTile',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b',1,'cutlass::gemm::GemmEpilogue::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075',1,'cutlass::gemm::GemmEpilogueTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101',1,'cutlass::gemm::GemmEpilogueTraitsHelper::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d',1,'cutlass::gemm::GemmSharedStoreTileDTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899',1,'cutlass::gemm::GemmSharedLoadTileDTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd',1,'cutlass::gemm::GemmConfig::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367',1,'cutlass::gemm::GemmTraits::OutputTile()']]]
+  ['outputfragment',['OutputFragment',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::OutputFragment()'],['../structcutlass_1_1Copy.html#a545be6c284d625b0841a10cc9126e14a',1,'cutlass::Copy::OutputFragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a9c04f0b0eb0293325f661b72168d4fa8',1,'cutlass::gemm::HgemmSwizzle::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553',1,'cutlass::gemm::IgemmFloatToInt8Converter::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7',1,'cutlass::gemm::IgemmInt8ToFloatConverter::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8',1,'cutlass::gemm::IgemmSwizzle::OutputFragment()'],['../structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584',1,'cutlass::ZipConvert::OutputFragment()']]],
+  ['outputtile',['OutputTile',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399',1,'cutlass::gemm::GemmConfig::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b',1,'cutlass::gemm::GemmEpilogue::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c',1,'cutlass::gemm::GemmEpilogueTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101',1,'cutlass::gemm::GemmEpilogueTraitsHelper::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d',1,'cutlass::gemm::GemmSharedStoreTileDTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899',1,'cutlass::gemm::GemmSharedLoadTileDTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367',1,'cutlass::gemm::GemmTraits::OutputTile()']]]
 ];
diff --git a/docs/search/all_f.js b/docs/search/all_f.js
index 05e5e9221..26daa9427 100644
--- a/docs/search/all_f.js
+++ b/docs/search/all_f.js
@@ -1,23 +1,31 @@
 var searchData=
 [
   ['pad',['pad',['../structcutlass_1_1platform_1_1alignment__of_1_1pad.html',1,'cutlass::platform::alignment_of']]],
-  ['params',['Params',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html',1,'cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1TileIteratorBase_1_1Params.html',1,'cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html',1,'cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1TileLoadIterator_1_1Params.html',1,'cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params'],['../structcutlass_1_1TileStoreIterator_1_1Params.html',1,'cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params'],['../structcutlass_1_1gemm_1_1Gemm_1_1Params.html',1,'cutlass::gemm::Gemm&lt; GemmTraits_ &gt;::Params'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html',1,'cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html',1,'cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html',1,'cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e',1,'cutlass::gemm::GemmEpilogue::Params()'],['../structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2',1,'cutlass::gemm::Gemm::params()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362',1,'cutlass::gemm::GemmEpilogue::params()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322',1,'cutlass::gemm::GemmGlobalIteratorAb::params()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f',1,'cutlass::gemm::GemmGlobalIteratorCd::params()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::params()'],['../structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b',1,'cutlass::TileLoadIterator::params()'],['../structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f',1,'cutlass::TileStoreIterator::params()']]],
+  ['params',['Params',['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html',1,'cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html',1,'cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html',1,'cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1ZipTileIterator_1_1Params.html',1,'cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html',1,'cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html',1,'cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html',1,'cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html',1,'cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params'],['../structcutlass_1_1TileIteratorBase_1_1Params.html',1,'cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params'],['../structcutlass_1_1TileLoadIterator_1_1Params.html',1,'cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params'],['../structcutlass_1_1TileStoreIterator_1_1Params.html',1,'cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params'],['../structcutlass_1_1TileLoadStream_1_1Params.html',1,'cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1TileStoreStream_1_1Params.html',1,'cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html',1,'cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916',1,'cutlass::gemm::Gemm::Params()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e',1,'cutlass::gemm::GemmEpilogue::Params()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6',1,'cutlass::PredicatedTileLoadStream::Params()'],['../structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba',1,'cutlass::PredicatedTileStoreStream::Params()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#afb39229d0ad334834cd2ba0c1fcc9412',1,'cutlass::gemm::GlobalLoadStreamPair::Params::Params()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#ab26c1aaa2b7709c32bab39801d6c7772',1,'cutlass::gemm::GlobalLoadStreamPair::Params::Params(typename StreamA::Params const &amp;_params_A, typename StreamB::Params const &amp;_params_B)'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ae515cd98a75ff3eafffcc69692d6301a',1,'cutlass::gemm::LinearScaling::Params::Params()'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae28323819fc8950bc0fee3a34b2184ff',1,'cutlass::gemm::LinearScalingDevicePtr::Params::Params()'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a26b04702140a550f3ab598132a74cd93',1,'cutlass::gemm::LinearScalingDevicePtr::Params::Params(Scalar alpha, Scalar beta)'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a38aa3e6beb09c7c4bea952094a2ea682',1,'cutlass::gemm::LinearScalingDevicePtr::Params::Params(Scalar const *alpha_ptr, Scalar const *beta_ptr)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71',1,'cutlass::TileIteratorBase::Params::Params()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c',1,'cutlass::TileIteratorBase::Params::Params(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a',1,'cutlass::TileIteratorBase::Params::Params(Coord&lt; 4 &gt; const &amp;stride)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5',1,'cutlass::TileLoadIterator::Params::Params()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282',1,'cutlass::TileLoadIterator::Params::Params(Scalar const *ptr)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192',1,'cutlass::TileLoadIterator::Params::Params(TensorRef const &amp;ref)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e',1,'cutlass::TileLoadIterator::Params::Params(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a',1,'cutlass::TileLoadIterator::Params::Params(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a79304c022d2466c97cd671a98128815a',1,'cutlass::TileStoreIterator::Params::Params()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#ae1cb260e7b05034ec9b7fa61c92bbc80',1,'cutlass::TileStoreIterator::Params::Params(Scalar *ptr)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#afae37ebc78884290300f38fce7c021b1',1,'cutlass::TileStoreIterator::Params::Params(TensorRef const &amp;ref)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#aa131e0ef02ce37038c1a17bea7088ef6',1,'cutlass::TileStoreIterator::Params::Params(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a9cf4cd4ecb0a81cf3c03a70c7bfc4e09',1,'cutlass::TileStoreIterator::Params::Params(Scalar *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileLoadStream_1_1Params.html#a90772ac34f8c49f049eb62fada0a2165',1,'cutlass::TileLoadStream::Params::Params()'],['../structcutlass_1_1TileLoadStream_1_1Params.html#a50f136516b139f011939015c8c417ddd',1,'cutlass::TileLoadStream::Params::Params(typename Iterator::Params const &amp;_iterator)'],['../structcutlass_1_1TileStoreStream_1_1Params.html#adfa2399bf13cdff16b7bfe1cb0dd2bd9',1,'cutlass::TileStoreStream::Params::Params()'],['../structcutlass_1_1TileStoreStream_1_1Params.html#acc400568f7694f818b5afbb109bd2e63',1,'cutlass::TileStoreStream::Params::Params(typename Iterator::Params const &amp;_iterator)'],['../structcutlass_1_1ZipTileIterator_1_1Params.html#a4ed93b5319fe96457caf53e9384722d4',1,'cutlass::ZipTileIterator::Params::Params()'],['../structcutlass_1_1ZipTileIterator_1_1Params.html#ad38f6a2cc5800c0ec82b12d183040390',1,'cutlass::ZipTileIterator::Params::Params(typename First::Params const &amp;_first, typename Second::Params const &amp;_second)'],['../structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2',1,'cutlass::gemm::Gemm::params()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362',1,'cutlass::gemm::GemmEpilogue::params()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e',1,'cutlass::gemm::GlobalLoadStream::params()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322',1,'cutlass::gemm::GemmGlobalIteratorAb::params()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f',1,'cutlass::gemm::GemmGlobalIteratorCd::params()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d',1,'cutlass::gemm::LinearScaling::params()'],['../structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596',1,'cutlass::TileLoadIterator::params()'],['../structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d',1,'cutlass::TileStoreIterator::params()']]],
   ['platform_2eh',['platform.h',['../platform_8h.html',1,'']]],
   ['plus',['plus',['../structcutlass_1_1platform_1_1plus.html',1,'cutlass::platform']]],
-  ['pointer',['pointer',['../classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9',1,'cutlass::platform::unique_ptr::pointer()'],['../structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6',1,'cutlass::FragmentIterator::pointer()'],['../structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b',1,'cutlass::FragmentConstIterator::pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::pointer()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::pointer()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9',1,'cutlass::TileLoadIterator::Params::pointer()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b',1,'cutlass::TileStoreIterator::Params::pointer()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1',1,'cutlass::gemm::GlobalLoadStreamBase::Pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd',1,'cutlass::gemm::GemmGlobalTileTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6',1,'cutlass::gemm::GemmGlobalIteratorCd::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864',1,'cutlass::gemm::GemmSharedLoadTileATraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Pointer()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Pointer()'],['../structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8',1,'cutlass::TileLoadIterator::Pointer()']]],
-  ['predicate_5finc_5fadvance',['predicate_inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_advance()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::predicate_inc_advance()']]],
-  ['predicate_5finc_5fh',['predicate_inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_h()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::predicate_inc_h()']]],
+  ['pointer',['pointer',['../classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9',1,'cutlass::platform::unique_ptr::pointer()'],['../structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6',1,'cutlass::FragmentIterator::pointer()'],['../structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b',1,'cutlass::FragmentConstIterator::pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::pointer()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6',1,'cutlass::TileLoadIterator::Params::pointer()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827',1,'cutlass::TileStoreIterator::Params::pointer()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2',1,'cutlass::gemm::GlobalLoadStream::Pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd',1,'cutlass::gemm::GemmGlobalTileTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6',1,'cutlass::gemm::GemmGlobalIteratorCd::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864',1,'cutlass::gemm::GemmSharedLoadTileATraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Pointer()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Pointer()'],['../structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f',1,'cutlass::TileLoadIterator::Pointer()'],['../structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35',1,'cutlass::TileStoreIterator::Pointer()']]],
+  ['pointers',['pointers',['../structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e',1,'cutlass::TensorRefArray']]],
+  ['polar',['polar',['../namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62',1,'cutlass::platform']]],
+  ['predicate_5finc_5fadvance',['predicate_inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129',1,'cutlass::gemm::GemmGlobalIteratorCd::Params']]],
+  ['predicate_5finc_5fh',['predicate_inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c',1,'cutlass::gemm::GemmGlobalIteratorCd::Params']]],
   ['predicate_20iterator_20concept',['Predicate Iterator Concept',['../group__predicate__iterator__concept.html',1,'']]],
-  ['predicate_5foffset',['predicate_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_offset()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::predicate_offset()']]],
+  ['predicate_5foffset',['predicate_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a',1,'cutlass::gemm::GemmGlobalIteratorCd::Params']]],
   ['predicate_20tile_20adapter_20concept',['Predicate Tile Adapter Concept',['../group__predicate__tile__adapter.html',1,'']]],
   ['predicate_5fvector_2eh',['predicate_vector.h',['../predicate__vector_8h.html',1,'']]],
   ['predicate_20vector_20concept',['Predicate Vector Concept',['../group__predicate__vector__concept.html',1,'']]],
-  ['predicates',['predicates',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c',1,'cutlass::gemm::GemmGlobalIteratorAb::predicates()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977',1,'cutlass::gemm::GemmGlobalIteratorCd::predicates()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::predicates()']]],
+  ['predicatedtileloadstream',['PredicatedTileLoadStream',['../structcutlass_1_1PredicatedTileLoadStream.html',1,'cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;'],['../structcutlass_1_1PredicatedTileLoadStream.html#a672a8883d16eff4ecc90dc79162084d3',1,'cutlass::PredicatedTileLoadStream::PredicatedTileLoadStream()']]],
+  ['predicatedtilestorestream',['PredicatedTileStoreStream',['../structcutlass_1_1PredicatedTileStoreStream.html',1,'cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;'],['../structcutlass_1_1PredicatedTileStoreStream.html#ac4aafc6bcc6cf3bff5b31b9cd60fd667',1,'cutlass::PredicatedTileStoreStream::PredicatedTileStoreStream()']]],
+  ['predicatefunctor',['PredicateFunctor',['../structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5',1,'cutlass::PredicatedTileLoadStream::PredicateFunctor()'],['../structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f',1,'cutlass::PredicatedTileStoreStream::PredicateFunctor()']]],
+  ['predicates',['predicates',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c',1,'cutlass::gemm::GemmGlobalIteratorAb::predicates()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977',1,'cutlass::gemm::GemmGlobalIteratorCd::predicates()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f',1,'cutlass::PredicatedTileLoadStream::predicates()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe',1,'cutlass::PredicatedTileStoreStream::predicates()']]],
   ['predicatetileadapter',['PredicateTileAdapter',['../structcutlass_1_1PredicateTileAdapter.html',1,'cutlass::PredicateTileAdapter&lt; PredicateVector_, Iterations_ &gt;'],['../structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea',1,'cutlass::PredicateTileAdapter::PredicateTileAdapter()']]],
-  ['predicatevector',['PredicateVector',['../structcutlass_1_1PredicateVector.html',1,'cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c',1,'cutlass::gemm::GemmGlobalIteratorAb::PredicateVector()'],['../structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4',1,'cutlass::PredicateTileAdapter::PredicateVector()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f',1,'cutlass::ConstPredicateTileAdapter::PredicateVector()'],['../structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5',1,'cutlass::TileIteratorBase::PredicateVector()'],['../structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328',1,'cutlass::TileLoadIterator::PredicateVector()'],['../structcutlass_1_1TileStoreIterator.html#a5aa507eaeb63951f8e69fb223ec41809',1,'cutlass::TileStoreIterator::PredicateVector()'],['../structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21',1,'cutlass::PredicateVector::PredicateVector()']]],
+  ['predicatevector',['PredicateVector',['../structcutlass_1_1TileLoadStream_1_1PredicateVector.html',1,'cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::PredicateVector'],['../structcutlass_1_1PredicateVector.html',1,'cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;'],['../structcutlass_1_1TileStoreStream_1_1PredicateVector.html',1,'cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::PredicateVector'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c',1,'cutlass::gemm::GemmGlobalIteratorAb::PredicateVector()'],['../structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4',1,'cutlass::PredicateTileAdapter::PredicateVector()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f',1,'cutlass::ConstPredicateTileAdapter::PredicateVector()'],['../structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000',1,'cutlass::TileIteratorBase::PredicateVector()'],['../structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5',1,'cutlass::TileLoadIterator::PredicateVector()'],['../structcutlass_1_1TileStoreIterator.html#a6157fe8a2ffefd45eba6f3953f0e2994',1,'cutlass::TileStoreIterator::PredicateVector()'],['../classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15',1,'cutlass::ZipTileIterator::PredicateVector()'],['../structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21',1,'cutlass::PredicateVector::PredicateVector()']]],
   ['predicatevector_3c_20base_3a_3aiterations_3a_3akw_20_3e',['PredicateVector&lt; Base::Iterations::kW &gt;',['../structcutlass_1_1PredicateVector.html',1,'cutlass']]],
   ['predicatevector_3c_20shapecount_3c_20typename_20base_3a_3aiterations_20_3e_3a_3akcount_20_3e',['PredicateVector&lt; ShapeCount&lt; typename Base::Iterations &gt;::kCount &gt;',['../structcutlass_1_1PredicateVector.html',1,'cutlass']]],
+  ['problem_5fsize',['problem_size',['../structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f',1,'cutlass::gemm::GemmDesc::problem_size()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e',1,'cutlass::gemm::GemmEpilogue::problem_size()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90',1,'cutlass::gemm::GemmTraits::Params::problem_size()']]],
+  ['proj',['proj',['../namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39',1,'cutlass::platform']]],
   ['project',['project',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html#ae91b2350374f1734a30cbed45e14b8e3',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;::project()'],['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html#a0f1579013f56fe16ebc147271f163c3c',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;::project()'],['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kC, true &gt;::project()'],['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kD, true &gt;::project()']]],
+  ['project_5fcoordinate',['project_coordinate',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001',1,'cutlass::gemm::GlobalLoadStream']]],
   ['projectoperand',['ProjectOperand',['../structcutlass_1_1gemm_1_1ProjectOperand.html',1,'cutlass::gemm']]],
   ['projectoperand_3c_20gemmoperand_3a_3aka_2c_20kstrided_20_3e',['ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html',1,'cutlass::gemm']]],
   ['projectoperand_3c_20gemmoperand_3a_3akb_2c_20kstrided_20_3e',['ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html',1,'cutlass::gemm']]],
diff --git a/docs/search/classes_1.js b/docs/search/classes_1.js
index 1f2829239..0894d9a57 100644
--- a/docs/search/classes_1.js
+++ b/docs/search/classes_1.js
@@ -1,4 +1,5 @@
 var searchData=
 [
+  ['bin1_5ft',['bin1_t',['../structcutlass_1_1bin1__t.html',1,'cutlass']]],
   ['bool_5fconstant',['bool_constant',['../structcutlass_1_1platform_1_1bool__constant.html',1,'cutlass::platform']]]
 ];
diff --git a/docs/search/classes_10.js b/docs/search/classes_10.js
index 348d5341b..e7ee728ab 100644
--- a/docs/search/classes_10.js
+++ b/docs/search/classes_10.js
@@ -1,4 +1,35 @@
 var searchData=
 [
-  ['unique_5fptr',['unique_ptr',['../classcutlass_1_1platform_1_1unique__ptr.html',1,'cutlass::platform']]]
+  ['tensorref',['TensorRef',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
+  ['tensorref_3c_20atype_20const_2c_202_20_3e',['TensorRef&lt; AType const, 2 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
+  ['tensorref_3c_20btype_20const_2c_202_20_3e',['TensorRef&lt; BType const, 2 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
+  ['tensorref_3c_20ctype_20const_2c_202_20_3e',['TensorRef&lt; CType const, 2 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
+  ['tensorref_3c_20dtype_2c_202_20_3e',['TensorRef&lt; DType, 2 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
+  ['tensorref_3c_20storage_5f_2c_20rank_5f_2c_20mapfunc_5f_2c_201_2c_20index_5f_2c_20longindex_5f_20_3e',['TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;',['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html',1,'cutlass']]],
+  ['tensorrefarray',['TensorRefArray',['../structcutlass_1_1TensorRefArray.html',1,'cutlass']]],
+  ['tensorrefbatchstrided',['TensorRefBatchStrided',['../structcutlass_1_1TensorRefBatchStrided.html',1,'cutlass']]],
+  ['tensorview',['TensorView',['../classcutlass_1_1TensorView.html',1,'cutlass']]],
+  ['threadmultiplyadd',['ThreadMultiplyAdd',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html',1,'cutlass::gemm']]],
+  ['threadmultiplyadd_3c_20threadgemmshape_5f_2c_20threadsperwarp_5f_2c_20half_2c_20half_2c_20float_20_3e',['ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html',1,'cutlass::gemm']]],
+  ['threadmultiplyadd_3c_20threadgemmshape_5f_2c_20threadsperwarp_5f_2c_20half_2c_20half_2c_20half_20_3e',['ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html',1,'cutlass::gemm']]],
+  ['threadmultiplyadd_3c_20threadgemmshape_5f_2c_20threadsperwarp_5f_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e',['ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html',1,'cutlass::gemm']]],
+  ['threadoffset',['ThreadOffset',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html',1,'cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset']]],
+  ['tileallocation',['TileAllocation',['../structcutlass_1_1TileAllocation.html',1,'cutlass']]],
+  ['tilecoord',['TileCoord',['../structcutlass_1_1TileCoord.html',1,'cutlass']]],
+  ['tiledthreadoffset',['TiledThreadOffset',['../structcutlass_1_1TiledThreadOffset.html',1,'cutlass']]],
+  ['tileiteratorbase',['TileIteratorBase',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
+  ['tileiteratorbase_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20advance_5f_2c_20memoryspace_2c_20index_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20fragmentelementtype_3a_3akscalar_2c_20shape_3c_200_2c_200_2c_200_2c_200_20_3e_20_3e',['TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
+  ['tileiteratorbase_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20iteratoradvance_3a_3akh_2c_20memoryspace_3a_3akglobal_2c_20index_5f_20_3e',['TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
+  ['tileloaditerator',['TileLoadIterator',['../structcutlass_1_1TileLoadIterator.html',1,'cutlass']]],
+  ['tileloaditerator_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20tiletraits_5f_3a_3amultiplicandtraits_3a_3akkstrided_20_3f_20iteratoradvance_3a_3akh_20_3aiteratoradvance_3a_3akw_2c_20memoryspace_3a_3akglobal_2c_20index_5f_20_3e',['TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;',['../structcutlass_1_1TileLoadIterator.html',1,'cutlass']]],
+  ['tileloadstream',['TileLoadStream',['../structcutlass_1_1TileLoadStream.html',1,'cutlass']]],
+  ['tilestoreiterator',['TileStoreIterator',['../structcutlass_1_1TileStoreIterator.html',1,'cutlass']]],
+  ['tilestorestream',['TileStoreStream',['../structcutlass_1_1TileStoreStream.html',1,'cutlass']]],
+  ['tiletraits',['TileTraits',['../structcutlass_1_1TileTraits.html',1,'cutlass']]],
+  ['tiletraitscontiguousmajor',['TileTraitsContiguousMajor',['../structcutlass_1_1TileTraitsContiguousMajor.html',1,'cutlass']]],
+  ['tiletraitsstandard',['TileTraitsStandard',['../structcutlass_1_1TileTraitsStandard.html',1,'cutlass']]],
+  ['tiletraitsstridemajor',['TileTraitsStrideMajor',['../structcutlass_1_1TileTraitsStrideMajor.html',1,'cutlass']]],
+  ['tiletraitswarprake',['TileTraitsWarpRake',['../structcutlass_1_1TileTraitsWarpRake.html',1,'cutlass']]],
+  ['trivialiterator',['TrivialIterator',['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html',1,'cutlass::PredicateVector']]],
+  ['trivialpredicatetileadapter',['TrivialPredicateTileAdapter',['../structcutlass_1_1TrivialPredicateTileAdapter.html',1,'cutlass']]]
 ];
diff --git a/docs/search/classes_11.js b/docs/search/classes_11.js
index f0fc14931..3cc4c4962 100644
--- a/docs/search/classes_11.js
+++ b/docs/search/classes_11.js
@@ -1,10 +1,5 @@
 var searchData=
 [
-  ['vector',['Vector',['../unioncutlass_1_1Vector.html',1,'cutlass']]],
-  ['vector_3c_20half_2c_20klanes_5f_20_3e',['Vector&lt; half, kLanes_ &gt;',['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html',1,'cutlass']]],
-  ['vectorize',['Vectorize',['../structcutlass_1_1Vectorize.html',1,'cutlass']]],
-  ['vectorize_3c_20element_5f_2c_201_20_3e',['Vectorize&lt; Element_, 1 &gt;',['../structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html',1,'cutlass']]],
-  ['vectortraits',['VectorTraits',['../structcutlass_1_1VectorTraits.html',1,'cutlass']]],
-  ['vectortraits_3c_20vector_3c_20t_2c_20lanes_20_3e_20_3e',['VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;',['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html',1,'cutlass']]],
-  ['vectortraits_3c_20vector_3c_20t_2c_20lanes_20_3e_20const_20_3e',['VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;',['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html',1,'cutlass']]]
+  ['uint4_5ft',['uint4_t',['../structcutlass_1_1uint4__t.html',1,'cutlass']]],
+  ['unique_5fptr',['unique_ptr',['../classcutlass_1_1platform_1_1unique__ptr.html',1,'cutlass::platform']]]
 ];
diff --git a/docs/search/classes_12.js b/docs/search/classes_12.js
index dadc97812..9ce87853d 100644
--- a/docs/search/classes_12.js
+++ b/docs/search/classes_12.js
@@ -1,5 +1,16 @@
 var searchData=
 [
-  ['wmmagemmglobaliteratorcd',['WmmaGemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html',1,'cutlass::gemm']]],
-  ['wmmagemmglobaliteratorcdtraits',['WmmaGemmGlobalIteratorCdTraits',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html',1,'cutlass::gemm']]]
+  ['vector',['Vector',['../unioncutlass_1_1Vector.html',1,'cutlass']]],
+  ['vector_3c_20bin1_5ft_2c_20klanes_5f_20_3e',['Vector&lt; bin1_t, kLanes_ &gt;',['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vector_3c_20half_2c_201_20_3e',['Vector&lt; half, 1 &gt;',['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html',1,'cutlass']]],
+  ['vector_3c_20half_2c_20klanes_5f_20_3e',['Vector&lt; half, kLanes_ &gt;',['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vector_3c_20int4_5ft_2c_20klanes_5f_20_3e',['Vector&lt; int4_t, kLanes_ &gt;',['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vector_3c_20uint4_5ft_2c_20klanes_5f_20_3e',['Vector&lt; uint4_t, kLanes_ &gt;',['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vectorize',['Vectorize',['../structcutlass_1_1Vectorize.html',1,'cutlass']]],
+  ['vectorize_3c_20vector_3c_20bin1_5ft_2c_2032_20_3e_2c_20klanes_5f_20_3e',['Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;',['../structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vectorize_3c_20vector_3c_20int4_5ft_2c_208_20_3e_2c_20klanes_5f_20_3e',['Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;',['../structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vectorize_3c_20vector_3c_20uint4_5ft_2c_208_20_3e_2c_20klanes_5f_20_3e',['Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;',['../structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html',1,'cutlass']]],
+  ['vectortraits',['VectorTraits',['../structcutlass_1_1VectorTraits.html',1,'cutlass']]],
+  ['vectortraits_3c_20vector_3c_20t_2c_20lanes_20_3e_20_3e',['VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;',['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html',1,'cutlass']]],
+  ['vectortraits_3c_20vector_3c_20t_2c_20lanes_20_3e_20const_20_3e',['VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;',['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html',1,'cutlass']]]
 ];
diff --git a/docs/search/classes_13.html b/docs/search/classes_13.html
new file mode 100644
index 000000000..c38b027b0
--- /dev/null
+++ b/docs/search/classes_13.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="classes_13.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/classes_13.js b/docs/search/classes_13.js
new file mode 100644
index 000000000..dadc97812
--- /dev/null
+++ b/docs/search/classes_13.js
@@ -0,0 +1,5 @@
+var searchData=
+[
+  ['wmmagemmglobaliteratorcd',['WmmaGemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html',1,'cutlass::gemm']]],
+  ['wmmagemmglobaliteratorcdtraits',['WmmaGemmGlobalIteratorCdTraits',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html',1,'cutlass::gemm']]]
+];
diff --git a/docs/search/classes_14.html b/docs/search/classes_14.html
new file mode 100644
index 000000000..c978bce03
--- /dev/null
+++ b/docs/search/classes_14.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="classes_14.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/classes_14.js b/docs/search/classes_14.js
new file mode 100644
index 000000000..352654f41
--- /dev/null
+++ b/docs/search/classes_14.js
@@ -0,0 +1,8 @@
+var searchData=
+[
+  ['zipconvert',['ZipConvert',['../structcutlass_1_1ZipConvert.html',1,'cutlass']]],
+  ['zipfragment',['ZipFragment',['../structcutlass_1_1ZipFragment.html',1,'cutlass']]],
+  ['ziptensorref',['ZipTensorRef',['../structcutlass_1_1ZipTensorRef.html',1,'cutlass']]],
+  ['ziptileallocation',['ZipTileAllocation',['../structcutlass_1_1ZipTileAllocation.html',1,'cutlass']]],
+  ['ziptileiterator',['ZipTileIterator',['../classcutlass_1_1ZipTileIterator.html',1,'cutlass']]]
+];
diff --git a/docs/search/classes_2.js b/docs/search/classes_2.js
index ee2cf1654..17c358086 100644
--- a/docs/search/classes_2.js
+++ b/docs/search/classes_2.js
@@ -1,23 +1,29 @@
 var searchData=
 [
   ['clearaccumulators',['ClearAccumulators',['../structcutlass_1_1gemm_1_1ClearAccumulators.html',1,'cutlass::gemm']]],
+  ['columnmajor',['ColumnMajor',['../structcutlass_1_1MatrixLayout_1_1ColumnMajor.html',1,'cutlass::MatrixLayout']]],
+  ['columnmajorblocklinear',['ColumnMajorBlockLinear',['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html',1,'cutlass::MatrixLayout']]],
+  ['columnmajorblockswizzle',['ColumnMajorBlockSwizzle',['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html',1,'cutlass::gemm']]],
+  ['columnmajorinterleaved',['ColumnMajorInterleaved',['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html',1,'cutlass::MatrixLayout']]],
+  ['complex',['complex',['../classcutlass_1_1platform_1_1complex.html',1,'cutlass::platform']]],
   ['computeoffsetfromshape',['ComputeOffsetFromShape',['../structcutlass_1_1ComputeOffsetFromShape.html',1,'cutlass']]],
-  ['computeoffsetfromshape_3c_20shape_3c_201_2c_20ksh_5f_2c_20ksw_5f_2c_201_20_3e_20_3e',['ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;',['../structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html',1,'cutlass']]],
-  ['computeoffsetfromshape_3c_20shape_3c_201_2c_20ksh_5f_2c_20ksw_5f_2c_20ksc_5f_20_3e_20_3e',['ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;',['../structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html',1,'cutlass']]],
   ['computeoffsetfromstrides',['ComputeOffsetFromStrides',['../structcutlass_1_1ComputeOffsetFromStrides.html',1,'cutlass']]],
-  ['computeoffsetfromstrides_3c_20shape_3c_201_2c_20s_5fh_5f_2c_20s_5fw_5f_2c_201_20_3e_20_3e',['ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;',['../structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html',1,'cutlass']]],
-  ['computeoffsetfromstrides_3c_20shape_3c_201_2c_20s_5fh_5f_2c_20s_5fw_5f_2c_20s_5fc_5f_20_3e_20_3e',['ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;',['../structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html',1,'cutlass']]],
   ['computethreadoffsetfromstrides',['ComputeThreadOffsetFromStrides',['../structcutlass_1_1ComputeThreadOffsetFromStrides.html',1,'cutlass']]],
   ['computethreadoffsetfromstrides_3c_20shape_3c_201_2c_20t_5fh_5f_2c_20t_5fw_5f_2c_201_20_3e_2c_20shape_3c_201_2c_20s_5fh_5f_2c_20s_5fw_5f_2c_201_20_3e_20_3e',['ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;',['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html',1,'cutlass']]],
   ['computethreadoffsetfromstrides_3c_20shape_3c_201_2c_20t_5fh_5f_2c_20t_5fw_5f_2c_20t_5fc_5f_20_3e_2c_20shape_3c_201_2c_20s_5fh_5f_2c_20s_5fw_5f_2c_20s_5fc_5f_20_3e_20_3e',['ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;',['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html',1,'cutlass']]],
   ['conditional',['conditional',['../structcutlass_1_1platform_1_1conditional.html',1,'cutlass::platform']]],
   ['conditional_3c_20false_2c_20t_2c_20f_20_3e',['conditional&lt; false, T, F &gt;',['../structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html',1,'cutlass::platform']]],
-  ['constiterator',['ConstIterator',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html',1,'cutlass::PredicateVector']]],
+  ['constiterator',['ConstIterator',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html',1,'cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;::ConstIterator'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html',1,'cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html',1,'cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator']]],
   ['constpredicatetileadapter',['ConstPredicateTileAdapter',['../structcutlass_1_1ConstPredicateTileAdapter.html',1,'cutlass']]],
+  ['contiguouslayout',['ContiguousLayout',['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html',1,'cutlass::MatrixLayout']]],
   ['convert',['Convert',['../structcutlass_1_1Convert.html',1,'cutlass']]],
   ['convert_3c_20fragment_3c_20inputscalar_5f_2c_20kscalars_5f_20_3e_2c_20fragment_3c_20outputscalar_5f_2c_20kscalars_5f_20_3e_20_3e',['Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html',1,'cutlass']]],
   ['coord',['Coord',['../structcutlass_1_1Coord.html',1,'cutlass']]],
+  ['coord_3c_202_2c_20int_20_3e',['Coord&lt; 2, int &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
+  ['coord_3c_203_20_3e',['Coord&lt; 3 &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
   ['coord_3c_204_20_3e',['Coord&lt; 4 &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
-  ['coord_3c_20rank_20_3e',['Coord&lt; Rank &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
+  ['coord_3c_204_2c_20index_5f_20_3e',['Coord&lt; 4, Index_ &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
+  ['coord_3c_204_2c_20int_20_3e',['Coord&lt; 4, int &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
+  ['coord_3c_20kstoragerank_20_2d_201_20_3e',['Coord&lt; kStorageRank - 1 &gt;',['../structcutlass_1_1Coord.html',1,'cutlass']]],
   ['copy',['Copy',['../structcutlass_1_1Copy.html',1,'cutlass']]]
 ];
diff --git a/docs/search/classes_3.js b/docs/search/classes_3.js
index ec9fedbdd..9586b5df9 100644
--- a/docs/search/classes_3.js
+++ b/docs/search/classes_3.js
@@ -1,9 +1,12 @@
 var searchData=
 [
+  ['debugtype',['DebugType',['../structDebugType.html',1,'']]],
+  ['debugvalue',['DebugValue',['../structDebugValue.html',1,'']]],
   ['default_5fdelete',['default_delete',['../structcutlass_1_1platform_1_1default__delete.html',1,'cutlass::platform']]],
   ['default_5fdelete_3c_20t_5b_5d_3e',['default_delete&lt; T[]&gt;',['../structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html',1,'cutlass::platform']]],
   ['dgemmconfig',['DgemmConfig',['../structcutlass_1_1gemm_1_1DgemmConfig.html',1,'cutlass::gemm']]],
   ['dgemmtraits',['DgemmTraits',['../structcutlass_1_1gemm_1_1DgemmTraits.html',1,'cutlass::gemm']]],
   ['divide_5fassert',['divide_assert',['../structcutlass_1_1divide__assert.html',1,'cutlass']]],
-  ['dummy',['dummy',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html',1,'cutlass::platform::is_base_of_helper']]]
+  ['dummy',['dummy',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html',1,'cutlass::platform::is_base_of_helper']]],
+  ['dumptype',['DumpType',['../structcutlass_1_1DumpType.html',1,'cutlass']]]
 ];
diff --git a/docs/search/classes_5.js b/docs/search/classes_5.js
index 6202ed097..8de35f557 100644
--- a/docs/search/classes_5.js
+++ b/docs/search/classes_5.js
@@ -1,14 +1,11 @@
 var searchData=
 [
+  ['fp16sgemmconfig',['Fp16SgemmConfig',['../structcutlass_1_1gemm_1_1Fp16SgemmConfig.html',1,'cutlass::gemm']]],
+  ['fp16sgemmsgemmtraits',['Fp16SgemmSgemmTraits',['../structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html',1,'cutlass::gemm']]],
   ['fragment',['Fragment',['../structcutlass_1_1Fragment.html',1,'cutlass']]],
   ['fragmentconstiterator',['FragmentConstIterator',['../structcutlass_1_1FragmentConstIterator.html',1,'cutlass']]],
+  ['fragmentelementtype',['FragmentElementType',['../structcutlass_1_1FragmentElementType.html',1,'cutlass']]],
   ['fragmentiterator',['FragmentIterator',['../structcutlass_1_1FragmentIterator.html',1,'cutlass']]],
-  ['fragmentload',['FragmentLoad',['../structcutlass_1_1FragmentLoad.html',1,'cutlass']]],
-  ['fragmentload_3c_20iteratorfragment_3a_3akscalar_2c_20kaccesssize_2c_20scalar_5f_2c_20memory_5f_2c_20fragmentelement_5f_2c_20kstride_20_3e',['FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;',['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html',1,'cutlass']]],
-  ['fragmentload_3c_20iteratorfragment_3a_3akwmmamatrix_2c_20kaccesssize_2c_20scalar_5f_2c_20memory_5f_2c_20fragmentelement_5f_2c_20kstride_20_3e',['FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;',['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html',1,'cutlass']]],
   ['fragmentmultiplyadd',['FragmentMultiplyAdd',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html',1,'cutlass::gemm']]],
-  ['fragmentmultiplyadd_3c_20half_20_3e',['FragmentMultiplyAdd&lt; half &gt;',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html',1,'cutlass::gemm']]],
-  ['fragmentstore',['FragmentStore',['../structcutlass_1_1FragmentStore.html',1,'cutlass']]],
-  ['fragmentstore_3c_20iteratorfragment_3a_3akscalar_2c_20kaccesssize_2c_20scalar_5f_2c_20memory_5f_2c_20fragmentelement_5f_2c_20kstride_20_3e',['FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;',['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html',1,'cutlass']]],
-  ['fragmentstore_3c_20iteratorfragment_3a_3akwmmamatrix_2c_20kaccesssize_2c_20scalar_5f_2c_20memory_5f_2c_20fragmentelement_5f_2c_20kstride_20_3e',['FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;',['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html',1,'cutlass']]]
+  ['fragmentmultiplyadd_3c_20half_2c_20half_2c_20true_20_3e',['FragmentMultiplyAdd&lt; half, half, true &gt;',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html',1,'cutlass::gemm']]]
 ];
diff --git a/docs/search/classes_6.js b/docs/search/classes_6.js
index bc65aaca4..2ec1cb6ed 100644
--- a/docs/search/classes_6.js
+++ b/docs/search/classes_6.js
@@ -2,16 +2,18 @@ var searchData=
 [
   ['gemm',['Gemm',['../structcutlass_1_1gemm_1_1Gemm.html',1,'cutlass::gemm']]],
   ['gemmconfig',['GemmConfig',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmconfig_3c_20double_2c_20double_2c_20double_2c_20double_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20double_2c_20double_2c_20double_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_202_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_202_2c_201_2c_202_2c_201_2c_202_20_3e',['GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmconfig_3c_20float_2c_20float_2c_20float_2c_20float_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20float_2c_20float_2c_20float_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_204_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_204_2c_201_2c_204_2c_201_2c_202_20_3e',['GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmconfig_3c_20half_2c_20half_2c_20half_2c_20half_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20half_2c_20half_2c_20half_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_208_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_208_2c_202_2c_208_2c_202_2c_202_20_3e',['GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmconfig_3c_20int8_5ft_2c_20int8_5ft_2c_20int8_5ft_2c_20int8_5ft_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_204_2c_202_20_3e',['GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
-  ['gemmconfig_3c_20int8_5ft_2c_20int8_5ft_2c_20scalard_5f_2c_20scalard_5f_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_2016_2c_201_2c_204_2c_201_2c_202_20_3e',['GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20double_2c_20double_2c_20double_2c_20double_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20double_2c_20double_2c_20double_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_202_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_202_2c_201_2c_202_2c_201_2c_202_2c_20false_2c_20false_2c_20false_20_3e',['GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20float_2c_20float_2c_20float_2c_20float_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20float_2c_20float_2c_20float_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_204_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_204_2c_201_2c_204_2c_201_2c_202_2c_20false_2c_20true_2c_20klaunchbounds_20_3e',['GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20half_2c_20half_2c_20half_2c_20half_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20half_2c_20half_2c_20half_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_208_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_208_2c_202_2c_208_2c_202_2c_202_2c_20false_2c_20true_2c_20false_20_3e',['GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20int8_5ft_2c_20int8_5ft_2c_20int8_5ft_2c_20int8_5ft_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_204_2c_202_2c_20false_2c_20true_2c_20false_20_3e',['GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20int8_5ft_2c_20int8_5ft_2c_20scalard_5f_2c_20scalard_5f_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e_2c_204_2c_204_2c_2016_2c_204_2c_204_2c_2016_2c_201_2c_204_2c_201_2c_202_2c_20false_2c_20false_2c_20false_20_3e',['GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmconfig_3c_20scalara_5f_2c_20scalarb_5f_2c_20scalarc_5f_2c_20scalard_5f_2c_20outputtile_5f_2c_20threadmultiplyadd_3c_20threadgemmshape_5f_2c_20shape_3c_201_2c_204_2c_208_20_3e_2c_20scalara_5f_2c_20scalarb_5f_2c_20float_20_3e_2c_20kscalarsperldga_5f_2c_20kscalarsperldga_5f_2c_204_2c_20kscalarsperldgb_5f_2c_20kscalarsperldgb_5f_2c_204_2c_201_2c_204_2c_201_2c_202_20_3e',['GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;',['../structcutlass_1_1gemm_1_1GemmConfig.html',1,'cutlass::gemm']]],
+  ['gemmcoord',['GemmCoord',['../structcutlass_1_1gemm_1_1GemmCoord.html',1,'cutlass::gemm']]],
   ['gemmdesc',['GemmDesc',['../structcutlass_1_1gemm_1_1GemmDesc.html',1,'cutlass::gemm']]],
   ['gemmepilogue',['GemmEpilogue',['../structcutlass_1_1gemm_1_1GemmEpilogue.html',1,'cutlass::gemm']]],
   ['gemmepiloguetraits',['GemmEpilogueTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm']]],
-  ['gemmepiloguetraits_3c_20gemmconfig_5f_3a_3aoutputtile_2c_20gemmconfig_5f_3a_3aaccumulators_2c_20helper_5f_3a_3agloballoaditeratorc_2c_20helper_5f_3a_3aglobaltransformerc_2c_20helper_5f_3a_3aglobaltransformerd_2c_20helper_5f_3a_3aglobalstoreiteratord_2c_20helper_5f_3a_3asharedstoreiteratord_2c_20helper_5f_3a_3asharedstoretransformerd_2c_20helper_5f_3a_3asharedloaditeratord_2c_20helper_5f_3a_3aiterations_2c_20helper_5f_3a_3adelta_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm']]],
-  ['gemmepiloguetraits_3c_20igemmconfig_5f_3a_3aoutputtile_2c_20igemmconfig_5f_3a_3aaccumulators_2c_20helper_5f_3a_3agloballoaditeratorc_2c_20helper_5f_3a_3aglobaltransformerc_2c_20helper_5f_3a_3aglobaltransformerd_2c_20helper_5f_3a_3aglobalstoreiteratord_2c_20helper_5f_3a_3asharedstoreiteratord_2c_20helper_5f_3a_3asharedstoretransformerd_2c_20helper_5f_3a_3asharedloaditeratord_2c_20helper_5f_3a_3aiterations_2c_20helper_5f_3a_3adelta_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm']]],
+  ['gemmepiloguetraits_3c_20gemmconfig_5f_3a_3aoutputtile_2c_20gemmconfig_5f_3a_3aaccumulators_2c_20helper_5f_3a_3agloballoaditeratorc_2c_20helper_5f_3a_3aglobaltransformerc_2c_20helper_5f_3a_3aglobaltransformerd_2c_20helper_5f_3a_3aglobalstoreiteratord_2c_20helper_5f_3a_3asharedstoreiteratord_2c_20helper_5f_3a_3asharedstoretransformerd_2c_20helper_5f_3a_3asharedloadstreamd_2c_20helper_5f_3a_3aiterations_2c_20helper_5f_3a_3adelta_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm']]],
+  ['gemmepiloguetraits_3c_20igemmconfig_5f_3a_3aoutputtile_2c_20igemmconfig_5f_3a_3aaccumulators_2c_20helper_5f_3a_3agloballoaditeratorc_2c_20helper_5f_3a_3aglobaltransformerc_2c_20helper_5f_3a_3aglobaltransformerd_2c_20helper_5f_3a_3aglobalstoreiteratord_2c_20helper_5f_3a_3asharedstoreiteratord_2c_20helper_5f_3a_3asharedstoretransformerd_2c_20helper_5f_3a_3asharedloadstreamd_2c_20helper_5f_3a_3aiterations_2c_20helper_5f_3a_3adelta_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html',1,'cutlass::gemm']]],
   ['gemmepiloguetraitshelper',['GemmEpilogueTraitsHelper',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html',1,'cutlass::gemm']]],
   ['gemmepiloguetraitshelper_3c_20igemmconfig_5f_2c_20epiloguefunctor_5f_2c_20index_5f_20_3e',['GemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html',1,'cutlass::gemm']]],
   ['gemmglobaliteratorab',['GemmGlobalIteratorAb',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html',1,'cutlass::gemm']]],
@@ -43,7 +45,7 @@ var searchData=
   ['getextent',['GetExtent',['../structcutlass_1_1gemm_1_1GetExtent.html',1,'cutlass::gemm']]],
   ['getextent_3c_20gemmoperand_3a_3aka_2c_20tile_5f_20_3e',['GetExtent&lt; GemmOperand::kA, Tile_ &gt;',['../structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html',1,'cutlass::gemm']]],
   ['getextent_3c_20gemmoperand_3a_3akb_2c_20tile_5f_20_3e',['GetExtent&lt; GemmOperand::kB, Tile_ &gt;',['../structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html',1,'cutlass::gemm']]],
-  ['globalloadstream',['GlobalLoadStream',['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::GlobalLoadStream'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html',1,'cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;']]],
-  ['globalloadstreambase',['GlobalLoadStreamBase',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html',1,'cutlass::gemm']]],
+  ['globalloadstream',['GlobalLoadStream',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html',1,'cutlass::gemm']]],
+  ['globalloadstreampair',['GlobalLoadStreamPair',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html',1,'cutlass::gemm']]],
   ['greater',['greater',['../structcutlass_1_1platform_1_1greater.html',1,'cutlass::platform']]]
 ];
diff --git a/docs/search/classes_8.js b/docs/search/classes_8.js
index b0bdbcd65..6ab84b3cf 100644
--- a/docs/search/classes_8.js
+++ b/docs/search/classes_8.js
@@ -2,9 +2,10 @@ var searchData=
 [
   ['identity',['Identity',['../structcutlass_1_1Identity.html',1,'cutlass']]],
   ['identityblockswizzle',['IdentityBlockSwizzle',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html',1,'cutlass::gemm']]],
+  ['identitytensormapfunc',['IdentityTensorMapFunc',['../structcutlass_1_1IdentityTensorMapFunc.html',1,'cutlass']]],
+  ['identitytensormapfunc_3c_20rank_5f_20_3e',['IdentityTensorMapFunc&lt; Rank_ &gt;',['../structcutlass_1_1IdentityTensorMapFunc.html',1,'cutlass']]],
   ['igemmconfig',['IgemmConfig',['../structcutlass_1_1gemm_1_1IgemmConfig.html',1,'cutlass::gemm']]],
-  ['igemmconfig_3c_20outputtile_5f_2c_20int8_5ft_2c_20accumulatorsperthread_5f_20_3e',['IgemmConfig&lt; OutputTile_, int8_t, AccumulatorsPerThread_ &gt;',['../structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01AccumulatorsPerThread___01_4.html',1,'cutlass::gemm']]],
-  ['igemmcontiguousglobaltiletraits',['IgemmContiguousGlobalTileTraits',['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html',1,'cutlass::gemm']]],
+  ['igemmconfig_3c_20outputtile_5f_2c_20int8_5ft_2c_20threadgemmshape_5f_20_3e',['IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;',['../structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html',1,'cutlass::gemm']]],
   ['igemmepilogue',['IgemmEpilogue',['../structcutlass_1_1gemm_1_1IgemmEpilogue.html',1,'cutlass::gemm']]],
   ['igemmepilogue_3c_20gemmepiloguetraits_5f_2c_20true_20_3e',['IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;',['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html',1,'cutlass::gemm']]],
   ['igemmepiloguescalar',['IgemmEpilogueScalar',['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html',1,'cutlass::gemm']]],
@@ -12,17 +13,21 @@ var searchData=
   ['igemmepiloguetraits',['IgemmEpilogueTraits',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html',1,'cutlass::gemm']]],
   ['igemmepiloguetraitshelper',['IgemmEpilogueTraitsHelper',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html',1,'cutlass::gemm']]],
   ['igemmfloattoint8converter',['IgemmFloatToInt8Converter',['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html',1,'cutlass::gemm']]],
+  ['igemmglobaliteratorab',['IgemmGlobalIteratorAb',['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html',1,'cutlass::gemm']]],
   ['igemmgloballoadtransformer',['IgemmGlobalLoadTransformer',['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html',1,'cutlass::gemm']]],
   ['igemmgloballoadtransformer_3c_20fragment_3c_20int8_5ft_2c_20kelements_5f_20_3e_2c_20float_20_3e',['IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;',['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html',1,'cutlass::gemm']]],
   ['igemmglobalstoretransformer',['IgemmGlobalStoreTransformer',['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html',1,'cutlass::gemm']]],
   ['igemmglobalstoretransformer_3c_20float_2c_20fragment_3c_20int8_5ft_2c_20kelements_5f_20_3e_20_3e',['IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;',['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html',1,'cutlass::gemm']]],
+  ['igemmglobaltiletraits',['IgemmGlobalTileTraits',['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html',1,'cutlass::gemm']]],
   ['igemmint8tofloatconverter',['IgemmInt8ToFloatConverter',['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html',1,'cutlass::gemm']]],
   ['igemmsharedstoretransformer',['IgemmSharedStoreTransformer',['../structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html',1,'cutlass::gemm']]],
   ['igemmswizzle',['IgemmSwizzle',['../structcutlass_1_1gemm_1_1IgemmSwizzle.html',1,'cutlass::gemm']]],
   ['igemmtiletraitshelpera',['IgemmTileTraitsHelperA',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html',1,'cutlass::gemm']]],
-  ['igemmtiletraitshelpera_3c_20matrixlayout_3a_3akcolumnmajor_2c_20gemmconfig_5f_20_3e',['IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html',1,'cutlass::gemm']]],
+  ['igemmtiletraitshelpera_3c_20matrixlayout_3a_3akcolumnmajor_2c_20gemmconfig_5f_2c_20index_5f_20_3e',['IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html',1,'cutlass::gemm']]],
+  ['igemmtiletraitshelpera_3c_20matrixlayout_3a_3akrowmajor_2c_20gemmconfig_5f_2c_20index_5f_20_3e',['IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html',1,'cutlass::gemm']]],
   ['igemmtiletraitshelperb',['IgemmTileTraitsHelperB',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html',1,'cutlass::gemm']]],
-  ['igemmtiletraitshelperb_3c_20matrixlayout_3a_3akrowmajor_2c_20gemmconfig_5f_20_3e',['IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html',1,'cutlass::gemm']]],
+  ['igemmtiletraitshelperb_3c_20matrixlayout_3a_3akcolumnmajor_2c_20gemmconfig_5f_2c_20index_5f_20_3e',['IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html',1,'cutlass::gemm']]],
+  ['igemmtiletraitshelperb_3c_20matrixlayout_3a_3akrowmajor_2c_20gemmconfig_5f_2c_20index_5f_20_3e',['IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html',1,'cutlass::gemm']]],
   ['igemmtraits',['IgemmTraits',['../structcutlass_1_1gemm_1_1IgemmTraits.html',1,'cutlass::gemm']]],
   ['igemmtraitshelper',['IgemmTraitsHelper',['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html',1,'cutlass::gemm']]],
   ['igemmtransformera',['IgemmTransformerA',['../structcutlass_1_1gemm_1_1IgemmTransformerA.html',1,'cutlass::gemm']]],
@@ -31,6 +36,7 @@ var searchData=
   ['igemmtransformerb',['IgemmTransformerB',['../structcutlass_1_1gemm_1_1IgemmTransformerB.html',1,'cutlass::gemm']]],
   ['igemmtransformerb_3c_20matrixlayout_3a_3akcolumnmajor_2c_20iterator_5f_20_3e',['IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html',1,'cutlass::gemm']]],
   ['igemmtransformerb_3c_20matrixlayout_3a_3akrowmajor_2c_20iterator_5f_20_3e',['IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;',['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html',1,'cutlass::gemm']]],
+  ['int4_5ft',['int4_t',['../structcutlass_1_1int4__t.html',1,'cutlass']]],
   ['integral_5fconstant',['integral_constant',['../structcutlass_1_1platform_1_1integral__constant.html',1,'cutlass::platform']]],
   ['integral_5fconstant_3c_20bool_2c_20v_20_3e',['integral_constant&lt; bool, V &gt;',['../structcutlass_1_1platform_1_1integral__constant.html',1,'cutlass::platform']]],
   ['integral_5fconstant_3c_20bool_2c_28is_5farithmetic_3c_20t_20_3e_3a_3avalue_7c_7cis_5fvoid_3c_20t_20_3e_3a_3avalue_7c_7cis_5fsame_3c_20nullptr_5ft_2c_20remove_5fcv_3c_20t_20_3e_3a_3atype_20_3e_3a_3avalue_29_3e',['integral_constant&lt; bool,(is_arithmetic&lt; T &gt;::value||is_void&lt; T &gt;::value||is_same&lt; nullptr_t, remove_cv&lt; T &gt;::type &gt;::value)&gt;',['../structcutlass_1_1platform_1_1integral__constant.html',1,'cutlass::platform']]],
@@ -72,6 +78,5 @@ var searchData=
   ['is_5fvolatile',['is_volatile',['../structcutlass_1_1platform_1_1is__volatile.html',1,'cutlass::platform']]],
   ['is_5fvolatile_3c_20volatile_20t_20_3e',['is_volatile&lt; volatile T &gt;',['../structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html',1,'cutlass::platform']]],
   ['iterator',['Iterator',['../classcutlass_1_1PredicateVector_1_1Iterator.html',1,'cutlass::PredicateVector']]],
-  ['iteratoradvance',['IteratorAdvance',['../structcutlass_1_1IteratorAdvance.html',1,'cutlass']]],
-  ['iteratorfragment',['IteratorFragment',['../structcutlass_1_1IteratorFragment.html',1,'cutlass']]]
+  ['iteratoradvance',['IteratorAdvance',['../structcutlass_1_1IteratorAdvance.html',1,'cutlass']]]
 ];
diff --git a/docs/search/classes_9.js b/docs/search/classes_9.js
index cf0d35f6d..3274ef182 100644
--- a/docs/search/classes_9.js
+++ b/docs/search/classes_9.js
@@ -1,14 +1,4 @@
 var searchData=
 [
-  ['less',['less',['../structcutlass_1_1platform_1_1less.html',1,'cutlass::platform']]],
-  ['linearscaling',['LinearScaling',['../structcutlass_1_1gemm_1_1LinearScaling.html',1,'cutlass::gemm']]],
-  ['load',['Load',['../structcutlass_1_1Load.html',1,'cutlass']]],
-  ['load_3c_20double_2c_202_2c_20memory_5f_2c_20true_2c_2016_20_3e',['Load&lt; double, 2, Memory_, true, 16 &gt;',['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html',1,'cutlass']]],
-  ['load_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_2016_20_3e',['Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html',1,'cutlass']]],
-  ['load_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_204_20_3e',['Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html',1,'cutlass']]],
-  ['load_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_208_20_3e',['Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html',1,'cutlass']]],
-  ['log2_5fdown',['log2_down',['../structcutlass_1_1log2__down.html',1,'cutlass']]],
-  ['log2_5fdown_3c_20n_2c_201_2c_20count_20_3e',['log2_down&lt; N, 1, Count &gt;',['../structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html',1,'cutlass']]],
-  ['log2_5fup',['log2_up',['../structcutlass_1_1log2__up.html',1,'cutlass']]],
-  ['log2_5fup_3c_20n_2c_201_2c_20count_20_3e',['log2_up&lt; N, 1, Count &gt;',['../structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html',1,'cutlass']]]
+  ['kernellaunchconfiguration',['KernelLaunchConfiguration',['../structcutlass_1_1KernelLaunchConfiguration.html',1,'cutlass']]]
 ];
diff --git a/docs/search/classes_a.js b/docs/search/classes_a.js
index 0556c78d0..4d8f0bda2 100644
--- a/docs/search/classes_a.js
+++ b/docs/search/classes_a.js
@@ -1,6 +1,22 @@
 var searchData=
 [
-  ['mainloopsharedstorage',['MainLoopSharedStorage',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html',1,'cutlass::gemm::GemmTraits']]],
-  ['matrixlayout',['MatrixLayout',['../structcutlass_1_1MatrixLayout.html',1,'cutlass']]],
-  ['memoryspace',['MemorySpace',['../structcutlass_1_1MemorySpace.html',1,'cutlass']]]
+  ['launch',['Launch',['../structcutlass_1_1gemm_1_1Launch.html',1,'cutlass::gemm']]],
+  ['launch_3c_20gemm_2c_20false_20_3e',['Launch&lt; Gemm, false &gt;',['../structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html',1,'cutlass::gemm']]],
+  ['less',['less',['../structcutlass_1_1platform_1_1less.html',1,'cutlass::platform']]],
+  ['linearscaling',['LinearScaling',['../structcutlass_1_1gemm_1_1LinearScaling.html',1,'cutlass::gemm']]],
+  ['linearscalingdeviceptr',['LinearScalingDevicePtr',['../structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html',1,'cutlass::gemm']]],
+  ['load',['Load',['../structcutlass_1_1Load.html',1,'cutlass']]],
+  ['load_3c_20double_2c_202_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20double_2c_20kstride_2c_2016_20_3e',['Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;',['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_201_2c_202_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_2016_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_204_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_208_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html',1,'cutlass']]],
+  ['load_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html',1,'cutlass']]],
+  ['load_3c_20vector_3c_20bin1_5ft_2c_2032_20_3e_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html',1,'cutlass']]],
+  ['load_3c_20vector_3c_20int4_5ft_2c_208_20_3e_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html',1,'cutlass']]],
+  ['load_3c_20vector_3c_20uint4_5ft_2c_208_20_3e_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html',1,'cutlass']]],
+  ['log2_5fdown',['log2_down',['../structcutlass_1_1log2__down.html',1,'cutlass']]],
+  ['log2_5fdown_3c_20n_2c_201_2c_20count_20_3e',['log2_down&lt; N, 1, Count &gt;',['../structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html',1,'cutlass']]],
+  ['log2_5fup',['log2_up',['../structcutlass_1_1log2__up.html',1,'cutlass']]],
+  ['log2_5fup_3c_20n_2c_201_2c_20count_20_3e',['log2_up&lt; N, 1, Count &gt;',['../structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html',1,'cutlass']]]
 ];
diff --git a/docs/search/classes_b.js b/docs/search/classes_b.js
index 02d4e0ba8..1077a1097 100644
--- a/docs/search/classes_b.js
+++ b/docs/search/classes_b.js
@@ -1,4 +1,10 @@
 var searchData=
 [
-  ['nullptr_5ft',['nullptr_t',['../structcutlass_1_1platform_1_1nullptr__t.html',1,'cutlass::platform']]]
+  ['mainloopsharedstorage',['MainLoopSharedStorage',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html',1,'cutlass::gemm::GemmTraits']]],
+  ['matrixcoord',['MatrixCoord',['../structcutlass_1_1MatrixCoord.html',1,'cutlass']]],
+  ['matrixlayout',['MatrixLayout',['../structcutlass_1_1MatrixLayout.html',1,'cutlass']]],
+  ['matrixtransform',['MatrixTransform',['../structcutlass_1_1MatrixTransform.html',1,'cutlass']]],
+  ['max',['Max',['../structcutlass_1_1Max.html',1,'cutlass']]],
+  ['memoryspace',['MemorySpace',['../structcutlass_1_1MemorySpace.html',1,'cutlass']]],
+  ['min',['Min',['../structcutlass_1_1Min.html',1,'cutlass']]]
 ];
diff --git a/docs/search/classes_c.js b/docs/search/classes_c.js
index 5b7a2f997..02d4e0ba8 100644
--- a/docs/search/classes_c.js
+++ b/docs/search/classes_c.js
@@ -1,15 +1,4 @@
 var searchData=
 [
-  ['pad',['pad',['../structcutlass_1_1platform_1_1alignment__of_1_1pad.html',1,'cutlass::platform::alignment_of']]],
-  ['params',['Params',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html',1,'cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1TileIteratorBase_1_1Params.html',1,'cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html',1,'cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1TileLoadIterator_1_1Params.html',1,'cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params'],['../structcutlass_1_1TileStoreIterator_1_1Params.html',1,'cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params'],['../structcutlass_1_1gemm_1_1Gemm_1_1Params.html',1,'cutlass::gemm::Gemm&lt; GemmTraits_ &gt;::Params'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html',1,'cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html',1,'cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html',1,'cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params']]],
-  ['plus',['plus',['../structcutlass_1_1platform_1_1plus.html',1,'cutlass::platform']]],
-  ['predicatetileadapter',['PredicateTileAdapter',['../structcutlass_1_1PredicateTileAdapter.html',1,'cutlass']]],
-  ['predicatevector',['PredicateVector',['../structcutlass_1_1PredicateVector.html',1,'cutlass']]],
-  ['predicatevector_3c_20base_3a_3aiterations_3a_3akw_20_3e',['PredicateVector&lt; Base::Iterations::kW &gt;',['../structcutlass_1_1PredicateVector.html',1,'cutlass']]],
-  ['predicatevector_3c_20shapecount_3c_20typename_20base_3a_3aiterations_20_3e_3a_3akcount_20_3e',['PredicateVector&lt; ShapeCount&lt; typename Base::Iterations &gt;::kCount &gt;',['../structcutlass_1_1PredicateVector.html',1,'cutlass']]],
-  ['projectoperand',['ProjectOperand',['../structcutlass_1_1gemm_1_1ProjectOperand.html',1,'cutlass::gemm']]],
-  ['projectoperand_3c_20gemmoperand_3a_3aka_2c_20kstrided_20_3e',['ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html',1,'cutlass::gemm']]],
-  ['projectoperand_3c_20gemmoperand_3a_3akb_2c_20kstrided_20_3e',['ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html',1,'cutlass::gemm']]],
-  ['projectoperand_3c_20gemmoperand_3a_3akc_2c_20true_20_3e',['ProjectOperand&lt; GemmOperand::kC, true &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html',1,'cutlass::gemm']]],
-  ['projectoperand_3c_20gemmoperand_3a_3akd_2c_20true_20_3e',['ProjectOperand&lt; GemmOperand::kD, true &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html',1,'cutlass::gemm']]]
+  ['nullptr_5ft',['nullptr_t',['../structcutlass_1_1platform_1_1nullptr__t.html',1,'cutlass::platform']]]
 ];
diff --git a/docs/search/classes_d.js b/docs/search/classes_d.js
index b7e543fba..3b3d2af53 100644
--- a/docs/search/classes_d.js
+++ b/docs/search/classes_d.js
@@ -1,12 +1,17 @@
 var searchData=
 [
-  ['remove_5fconst',['remove_const',['../structcutlass_1_1platform_1_1remove__const.html',1,'cutlass::platform']]],
-  ['remove_5fconst_3c_20const_20t_20_3e',['remove_const&lt; const T &gt;',['../structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html',1,'cutlass::platform']]],
-  ['remove_5fcv',['remove_cv',['../structcutlass_1_1platform_1_1remove__cv.html',1,'cutlass::platform']]],
-  ['remove_5fvolatile',['remove_volatile',['../structcutlass_1_1platform_1_1remove__volatile.html',1,'cutlass::platform']]],
-  ['remove_5fvolatile_3c_20volatile_20t_20_3e',['remove_volatile&lt; volatile T &gt;',['../structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html',1,'cutlass::platform']]],
-  ['reshapethreads',['ReshapeThreads',['../structcutlass_1_1gemm_1_1ReshapeThreads.html',1,'cutlass::gemm']]],
-  ['reshapethreads_3c_20tile_5f_2c_20threads_5f_2c_20true_20_3e',['ReshapeThreads&lt; Tile_, Threads_, true &gt;',['../structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html',1,'cutlass::gemm']]],
-  ['reshapetile',['ReshapeTile',['../structcutlass_1_1ReshapeTile.html',1,'cutlass']]],
-  ['reshapetile_3c_20tile_5f_2c_20kaccesssize_5f_2c_20true_20_3e',['ReshapeTile&lt; Tile_, kAccessSize_, true &gt;',['../structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html',1,'cutlass']]]
+  ['pad',['pad',['../structcutlass_1_1platform_1_1alignment__of_1_1pad.html',1,'cutlass::platform::alignment_of']]],
+  ['params',['Params',['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html',1,'cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html',1,'cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html',1,'cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1ZipTileIterator_1_1Params.html',1,'cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html',1,'cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html',1,'cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html',1,'cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html',1,'cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params'],['../structcutlass_1_1TileIteratorBase_1_1Params.html',1,'cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params'],['../structcutlass_1_1TileLoadIterator_1_1Params.html',1,'cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params'],['../structcutlass_1_1TileStoreIterator_1_1Params.html',1,'cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params'],['../structcutlass_1_1TileLoadStream_1_1Params.html',1,'cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1TileStoreStream_1_1Params.html',1,'cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html',1,'cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;::Params']]],
+  ['plus',['plus',['../structcutlass_1_1platform_1_1plus.html',1,'cutlass::platform']]],
+  ['predicatedtileloadstream',['PredicatedTileLoadStream',['../structcutlass_1_1PredicatedTileLoadStream.html',1,'cutlass']]],
+  ['predicatedtilestorestream',['PredicatedTileStoreStream',['../structcutlass_1_1PredicatedTileStoreStream.html',1,'cutlass']]],
+  ['predicatetileadapter',['PredicateTileAdapter',['../structcutlass_1_1PredicateTileAdapter.html',1,'cutlass']]],
+  ['predicatevector',['PredicateVector',['../structcutlass_1_1TileLoadStream_1_1PredicateVector.html',1,'cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::PredicateVector'],['../structcutlass_1_1PredicateVector.html',1,'cutlass::PredicateVector&lt; kPredicates_, kPredicatesPerByte_, kPredicateStart_ &gt;'],['../structcutlass_1_1TileStoreStream_1_1PredicateVector.html',1,'cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::PredicateVector']]],
+  ['predicatevector_3c_20base_3a_3aiterations_3a_3akw_20_3e',['PredicateVector&lt; Base::Iterations::kW &gt;',['../structcutlass_1_1PredicateVector.html',1,'cutlass']]],
+  ['predicatevector_3c_20shapecount_3c_20typename_20base_3a_3aiterations_20_3e_3a_3akcount_20_3e',['PredicateVector&lt; ShapeCount&lt; typename Base::Iterations &gt;::kCount &gt;',['../structcutlass_1_1PredicateVector.html',1,'cutlass']]],
+  ['projectoperand',['ProjectOperand',['../structcutlass_1_1gemm_1_1ProjectOperand.html',1,'cutlass::gemm']]],
+  ['projectoperand_3c_20gemmoperand_3a_3aka_2c_20kstrided_20_3e',['ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html',1,'cutlass::gemm']]],
+  ['projectoperand_3c_20gemmoperand_3a_3akb_2c_20kstrided_20_3e',['ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html',1,'cutlass::gemm']]],
+  ['projectoperand_3c_20gemmoperand_3a_3akc_2c_20true_20_3e',['ProjectOperand&lt; GemmOperand::kC, true &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html',1,'cutlass::gemm']]],
+  ['projectoperand_3c_20gemmoperand_3a_3akd_2c_20true_20_3e',['ProjectOperand&lt; GemmOperand::kD, true &gt;',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html',1,'cutlass::gemm']]]
 ];
diff --git a/docs/search/classes_e.js b/docs/search/classes_e.js
index 82b741305..449489f17 100644
--- a/docs/search/classes_e.js
+++ b/docs/search/classes_e.js
@@ -1,34 +1,17 @@
 var searchData=
 [
-  ['sgemmconfig',['SgemmConfig',['../structcutlass_1_1gemm_1_1SgemmConfig.html',1,'cutlass::gemm']]],
-  ['sgemmtraits',['SgemmTraits',['../structcutlass_1_1gemm_1_1SgemmTraits.html',1,'cutlass::gemm']]],
-  ['shape',['Shape',['../structcutlass_1_1Shape.html',1,'cutlass']]],
-  ['shapeadd',['ShapeAdd',['../structcutlass_1_1ShapeAdd.html',1,'cutlass']]],
-  ['shapecount',['ShapeCount',['../structcutlass_1_1ShapeCount.html',1,'cutlass']]],
-  ['shapediv',['ShapeDiv',['../structcutlass_1_1ShapeDiv.html',1,'cutlass']]],
-  ['shapemax',['ShapeMax',['../structcutlass_1_1ShapeMax.html',1,'cutlass']]],
-  ['shapemin',['ShapeMin',['../structcutlass_1_1ShapeMin.html',1,'cutlass']]],
-  ['shapemul',['ShapeMul',['../structcutlass_1_1ShapeMul.html',1,'cutlass']]],
-  ['shapescale',['ShapeScale',['../structcutlass_1_1ShapeScale.html',1,'cutlass']]],
-  ['shapestrides',['ShapeStrides',['../structcutlass_1_1ShapeStrides.html',1,'cutlass']]],
-  ['shapesub',['ShapeSub',['../structcutlass_1_1ShapeSub.html',1,'cutlass']]],
-  ['sharedloadstream',['SharedLoadStream',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedLoadStream'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html',1,'cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;']]],
-  ['sharedstorage',['SharedStorage',['../structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html',1,'cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage'],['../unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage'],['../unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html',1,'cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage']]],
-  ['simplifiedgemmepiloguetraits',['SimplifiedGemmEpilogueTraits',['../structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html',1,'cutlass::gemm']]],
-  ['simplifiedgemmtraits',['SimplifiedGemmTraits',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html',1,'cutlass::gemm']]],
-  ['simplifiedgemmtraits_3c_20klayouta_5f_2c_20klayoutb_5f_2c_20gemmconfig_5f_2c_20gemmepilogue_3c_20gemmepiloguetraits_5f_20_3e_2c_20index_5f_20_3e',['SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, Index_ &gt;',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html',1,'cutlass::gemm']]],
-  ['simplifiedgemmtraitshelper',['SimplifiedGemmTraitsHelper',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html',1,'cutlass::gemm']]],
-  ['sqrt_5fest',['sqrt_est',['../structcutlass_1_1sqrt__est.html',1,'cutlass']]],
-  ['storagetype',['StorageType',['../structcutlass_1_1StorageType.html',1,'cutlass']]],
-  ['storagetype_3c_201_20_3e',['StorageType&lt; 1 &gt;',['../structcutlass_1_1StorageType_3_011_01_4.html',1,'cutlass']]],
-  ['storagetype_3c_202_20_3e',['StorageType&lt; 2 &gt;',['../structcutlass_1_1StorageType_3_012_01_4.html',1,'cutlass']]],
-  ['storagetype_3c_204_20_3e',['StorageType&lt; 4 &gt;',['../structcutlass_1_1StorageType_3_014_01_4.html',1,'cutlass']]],
-  ['store',['Store',['../structcutlass_1_1Store.html',1,'cutlass']]],
-  ['store_3c_20double_2c_202_2c_20memory_5f_2c_20true_2c_2016_20_3e',['Store&lt; double, 2, Memory_, true, 16 &gt;',['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html',1,'cutlass']]],
-  ['store_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_2016_20_3e',['Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html',1,'cutlass']]],
-  ['store_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_204_20_3e',['Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html',1,'cutlass']]],
-  ['store_3c_20scalar_5f_2c_20lanes_5f_2c_20memory_5f_2c_20true_2c_208_20_3e',['Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html',1,'cutlass']]],
-  ['streamsharedstorage',['StreamSharedStorage',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::StreamSharedStorage&lt; GlobalLoadStream_, SharedLoadStream_ &gt;'],['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage']]],
-  ['streamsharedstorage_3c_20globalloadstreama_2c_20sharedloadstreama_20_3e',['StreamSharedStorage&lt; GlobalLoadStreamA, SharedLoadStreamA &gt;',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmTraits']]],
-  ['streamsharedstorage_3c_20globalloadstreamb_2c_20sharedloadstreamb_20_3e',['StreamSharedStorage&lt; GlobalLoadStreamB, SharedLoadStreamB &gt;',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmTraits']]]
+  ['regulartilepredicatefunctor',['RegularTilePredicateFunctor',['../structcutlass_1_1RegularTilePredicateFunctor.html',1,'cutlass']]],
+  ['remove_5fconst',['remove_const',['../structcutlass_1_1platform_1_1remove__const.html',1,'cutlass::platform']]],
+  ['remove_5fconst_3c_20const_20t_20_3e',['remove_const&lt; const T &gt;',['../structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html',1,'cutlass::platform']]],
+  ['remove_5fcv',['remove_cv',['../structcutlass_1_1platform_1_1remove__cv.html',1,'cutlass::platform']]],
+  ['remove_5fvolatile',['remove_volatile',['../structcutlass_1_1platform_1_1remove__volatile.html',1,'cutlass::platform']]],
+  ['remove_5fvolatile_3c_20volatile_20t_20_3e',['remove_volatile&lt; volatile T &gt;',['../structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html',1,'cutlass::platform']]],
+  ['reshapethreads',['ReshapeThreads',['../structcutlass_1_1gemm_1_1ReshapeThreads.html',1,'cutlass::gemm']]],
+  ['reshapethreads_3c_20tile_5f_2c_20threads_5f_2c_20true_20_3e',['ReshapeThreads&lt; Tile_, Threads_, true &gt;',['../structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html',1,'cutlass::gemm']]],
+  ['reshapetile',['ReshapeTile',['../structcutlass_1_1ReshapeTile.html',1,'cutlass']]],
+  ['reshapetile_3c_20tile_5f_2c_20kaccesssize_5f_2c_20true_20_3e',['ReshapeTile&lt; Tile_, kAccessSize_, true &gt;',['../structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html',1,'cutlass']]],
+  ['rowmajor',['RowMajor',['../structcutlass_1_1MatrixLayout_1_1RowMajor.html',1,'cutlass::MatrixLayout']]],
+  ['rowmajorblocklinear',['RowMajorBlockLinear',['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html',1,'cutlass::MatrixLayout']]],
+  ['rowmajorblockswizzle',['RowMajorBlockSwizzle',['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html',1,'cutlass::gemm']]],
+  ['rowmajorinterleaved',['RowMajorInterleaved',['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html',1,'cutlass::MatrixLayout']]]
 ];
diff --git a/docs/search/classes_f.js b/docs/search/classes_f.js
index 72998f534..d7c546da0 100644
--- a/docs/search/classes_f.js
+++ b/docs/search/classes_f.js
@@ -1,24 +1,44 @@
 var searchData=
 [
-  ['tensorref',['TensorRef',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
-  ['tensorref_3c_20t_2c_204_20_3e',['TensorRef&lt; T, 4 &gt;',['../classcutlass_1_1TensorRef.html',1,'cutlass']]],
-  ['tensorview',['TensorView',['../classcutlass_1_1TensorView.html',1,'cutlass']]],
-  ['threadmultiplyadd',['ThreadMultiplyAdd',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html',1,'cutlass::gemm']]],
-  ['threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20threadsperwarp_5f_2c_20half_2c_20half_2c_20half_20_3e',['ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html',1,'cutlass::gemm']]],
-  ['threadmultiplyadd_3c_20accumulatorsperthread_5f_2c_20threadsperwarp_5f_2c_20int8_5ft_2c_20int8_5ft_2c_20int_20_3e',['ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html',1,'cutlass::gemm']]],
-  ['threadoffset',['ThreadOffset',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_ &gt;::ThreadOffset'],['../structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html',1,'cutlass::TileTraitsWarpRake&lt; Tile_, Threads &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits&lt; Scalar_, Tile_, Threads_, kScalarsPerSts_, kSkew_ &gt;::ThreadOffset'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset']]],
-  ['tiledthreadoffset',['TiledThreadOffset',['../structcutlass_1_1TiledThreadOffset.html',1,'cutlass']]],
-  ['tileiteratorbase',['TileIteratorBase',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
-  ['tileiteratorbase_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20advance_5f_2c_20memoryspace_2c_20index_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20iteratorfragment_3a_3akscalar_2c_20shape_3c_200_2c_200_2c_200_2c_200_20_3e_20_3e',['TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
-  ['tileiteratorbase_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20iteratoradvance_3a_3akh_2c_20memoryspace_3a_3akglobal_2c_20index_5f_20_3e',['TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;',['../structcutlass_1_1TileIteratorBase.html',1,'cutlass']]],
-  ['tileloaditerator',['TileLoadIterator',['../structcutlass_1_1TileLoadIterator.html',1,'cutlass']]],
-  ['tileloaditerator_3c_20tiletraits_5f_2c_20tiletraits_5f_3a_3ascalar_2c_20tiletraits_5f_3a_3amultiplicandtraits_3a_3akkstrided_20_3f_20iteratoradvance_3a_3akh_20_3aiteratoradvance_3a_3akw_2c_20memoryspace_3a_3akglobal_2c_20index_5f_20_3e',['TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;',['../structcutlass_1_1TileLoadIterator.html',1,'cutlass']]],
-  ['tilestoreiterator',['TileStoreIterator',['../structcutlass_1_1TileStoreIterator.html',1,'cutlass']]],
-  ['tiletraits',['TileTraits',['../structcutlass_1_1TileTraits.html',1,'cutlass']]],
-  ['tiletraitscontiguousmajor',['TileTraitsContiguousMajor',['../structcutlass_1_1TileTraitsContiguousMajor.html',1,'cutlass']]],
-  ['tiletraitsstandard',['TileTraitsStandard',['../structcutlass_1_1TileTraitsStandard.html',1,'cutlass']]],
-  ['tiletraitsstridemajor',['TileTraitsStrideMajor',['../structcutlass_1_1TileTraitsStrideMajor.html',1,'cutlass']]],
-  ['tiletraitswarprake',['TileTraitsWarpRake',['../structcutlass_1_1TileTraitsWarpRake.html',1,'cutlass']]],
-  ['trivialiterator',['TrivialIterator',['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html',1,'cutlass::PredicateVector']]],
-  ['trivialpredicatetileadapter',['TrivialPredicateTileAdapter',['../structcutlass_1_1TrivialPredicateTileAdapter.html',1,'cutlass']]]
+  ['scalario',['ScalarIO',['../structcutlass_1_1ScalarIO.html',1,'cutlass']]],
+  ['scalarorpointer',['ScalarOrPointer',['../classcutlass_1_1detail_1_1ScalarOrPointer.html',1,'cutlass::detail']]],
+  ['scalarorpointer_3c_20scalar_20_3e',['ScalarOrPointer&lt; Scalar &gt;',['../classcutlass_1_1detail_1_1ScalarOrPointer.html',1,'cutlass::detail']]],
+  ['sgemmconfig',['SgemmConfig',['../structcutlass_1_1gemm_1_1SgemmConfig.html',1,'cutlass::gemm']]],
+  ['sgemmlbtraits',['SgemmLBTraits',['../structcutlass_1_1gemm_1_1SgemmLBTraits.html',1,'cutlass::gemm']]],
+  ['sgemmtraits',['SgemmTraits',['../structcutlass_1_1gemm_1_1SgemmTraits.html',1,'cutlass::gemm']]],
+  ['shape',['Shape',['../structcutlass_1_1Shape.html',1,'cutlass']]],
+  ['shapeadd',['ShapeAdd',['../structcutlass_1_1ShapeAdd.html',1,'cutlass']]],
+  ['shapecount',['ShapeCount',['../structcutlass_1_1ShapeCount.html',1,'cutlass']]],
+  ['shapediv',['ShapeDiv',['../structcutlass_1_1ShapeDiv.html',1,'cutlass']]],
+  ['shapedivceiling',['ShapeDivCeiling',['../structcutlass_1_1ShapeDivCeiling.html',1,'cutlass']]],
+  ['shapemax',['ShapeMax',['../structcutlass_1_1ShapeMax.html',1,'cutlass']]],
+  ['shapemin',['ShapeMin',['../structcutlass_1_1ShapeMin.html',1,'cutlass']]],
+  ['shapemul',['ShapeMul',['../structcutlass_1_1ShapeMul.html',1,'cutlass']]],
+  ['shapescale',['ShapeScale',['../structcutlass_1_1ShapeScale.html',1,'cutlass']]],
+  ['shapestrides',['ShapeStrides',['../structcutlass_1_1ShapeStrides.html',1,'cutlass']]],
+  ['shapesub',['ShapeSub',['../structcutlass_1_1ShapeSub.html',1,'cutlass']]],
+  ['sharedloadstream',['SharedLoadStream',['../structcutlass_1_1gemm_1_1SharedLoadStream.html',1,'cutlass::gemm']]],
+  ['sharedstorage',['SharedStorage',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html',1,'cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html',1,'cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage'],['../unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html',1,'cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html',1,'cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage'],['../structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html',1,'cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;::SharedStorage']]],
+  ['sharedstreampair',['SharedStreamPair',['../structcutlass_1_1gemm_1_1SharedStreamPair.html',1,'cutlass::gemm']]],
+  ['simplifiedgemmepiloguetraits',['SimplifiedGemmEpilogueTraits',['../structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html',1,'cutlass::gemm']]],
+  ['simplifiedgemmtraits',['SimplifiedGemmTraits',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html',1,'cutlass::gemm']]],
+  ['simplifiedgemmtraits_3c_20klayouta_5f_2c_20klayoutb_5f_2c_20gemmconfig_5f_2c_20gemmepilogue_3c_20gemmepiloguetraits_5f_20_3e_2c_20index_5f_20_3e',['SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, Index_ &gt;',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html',1,'cutlass::gemm']]],
+  ['simplifiedgemmtraitshelper',['SimplifiedGemmTraitsHelper',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html',1,'cutlass::gemm']]],
+  ['sqrt_5fest',['sqrt_est',['../structcutlass_1_1sqrt__est.html',1,'cutlass']]],
+  ['storagetype',['StorageType',['../structcutlass_1_1StorageType.html',1,'cutlass']]],
+  ['storagetype_3c_201_20_3e',['StorageType&lt; 1 &gt;',['../structcutlass_1_1StorageType_3_011_01_4.html',1,'cutlass']]],
+  ['storagetype_3c_202_20_3e',['StorageType&lt; 2 &gt;',['../structcutlass_1_1StorageType_3_012_01_4.html',1,'cutlass']]],
+  ['storagetype_3c_204_20_3e',['StorageType&lt; 4 &gt;',['../structcutlass_1_1StorageType_3_014_01_4.html',1,'cutlass']]],
+  ['storagetype_3c_20kalignment_5f_20_3e',['StorageType&lt; kAlignment_ &gt;',['../structcutlass_1_1StorageType.html',1,'cutlass']]],
+  ['storagetype_3c_20sizeof_28scalar_29_3e',['StorageType&lt; sizeof(Scalar)&gt;',['../structcutlass_1_1StorageType.html',1,'cutlass']]],
+  ['store',['Store',['../structcutlass_1_1Store.html',1,'cutlass']]],
+  ['store_3c_20double_2c_202_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20double_2c_20kstride_2c_2016_20_3e',['Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;',['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_201_2c_202_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_2016_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_204_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akscalar_2c_20scalar_5f_2c_20kstride_2c_208_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html',1,'cutlass']]],
+  ['store_3c_20scalar_5f_2c_20kaccesssize_2c_20memory_5f_2c_20fragmentelementtype_3a_3akwmmamatrix_2c_20fragmentelement_5f_2c_20kstride_2c_20size_20_3e',['Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;',['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html',1,'cutlass']]],
+  ['streamsharedstorage',['StreamSharedStorage',['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html',1,'cutlass::gemm::GemmEpilogueTraits']]],
+  ['stridevector',['StrideVector',['../structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;']]],
+  ['swizzledirection',['swizzleDirection',['../structcutlass_1_1gemm_1_1swizzleDirection.html',1,'cutlass::gemm']]]
 ];
diff --git a/docs/search/defines_1.js b/docs/search/defines_1.js
index f59274bcf..45043b327 100644
--- a/docs/search/defines_1.js
+++ b/docs/search/defines_1.js
@@ -7,6 +7,7 @@ var searchData=
   ['cuda_5fperror_5fdebug',['CUDA_PERROR_DEBUG',['../debug_8h.html#a36436f5408940a47ac5cdfc9b31648db',1,'debug.h']]],
   ['cuda_5fperror_5fexit',['CUDA_PERROR_EXIT',['../debug_8h.html#a002632ff687c83cff0484476be401f05',1,'debug.h']]],
   ['cutlass_5fassert',['CUTLASS_ASSERT',['../cutlass_8h.html#a0159b8e4cd578881a1ccfd0921516af7',1,'cutlass.h']]],
+  ['cutlass_5fgemm_5floop',['CUTLASS_GEMM_LOOP',['../cutlass_8h.html#a8e18ced39c05ab3304bb4fcdc0cc9f71',1,'cutlass.h']]],
   ['cutlass_5fhost_5fdevice',['CUTLASS_HOST_DEVICE',['../cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1',1,'cutlass.h']]],
   ['cutlass_5fmajor',['CUTLASS_MAJOR',['../cutlass_8h.html#a8ff3cda9323810c1c504793a0206d4b8',1,'cutlass.h']]],
   ['cutlass_5fminor',['CUTLASS_MINOR',['../cutlass_8h.html#ad114a1ab01f73833ea00020ffb7bcea7',1,'cutlass.h']]],
diff --git a/docs/search/enums_0.js b/docs/search/enums_0.js
index 73c94c1fe..a0c2b03ea 100644
--- a/docs/search/enums_0.js
+++ b/docs/search/enums_0.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['kind',['Kind',['../structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375',1,'cutlass::Identity::Kind()'],['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c',1,'cutlass::MemorySpace::Kind()'],['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b',1,'cutlass::MatrixLayout::Kind()'],['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c',1,'cutlass::GemmOperand::Kind()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda',1,'cutlass::IteratorAdvance::Kind()'],['../structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80',1,'cutlass::IteratorFragment::Kind()']]]
+  ['kind',['Kind',['../structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375',1,'cutlass::Identity::Kind()'],['../structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8',1,'cutlass::gemm::swizzleDirection::Kind()'],['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c',1,'cutlass::MemorySpace::Kind()'],['../structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b',1,'cutlass::FragmentElementType::Kind()'],['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b',1,'cutlass::MatrixLayout::Kind()'],['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c',1,'cutlass::GemmOperand::Kind()'],['../structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48',1,'cutlass::MatrixTransform::Kind()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda',1,'cutlass::IteratorAdvance::Kind()']]]
 ];
diff --git a/docs/search/enumvalues_1.js b/docs/search/enumvalues_1.js
index b06592d01..8764845d7 100644
--- a/docs/search/enumvalues_1.js
+++ b/docs/search/enumvalues_1.js
@@ -1,19 +1,4 @@
 var searchData=
 [
-  ['ka',['kA',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a',1,'cutlass::GemmOperand']]],
-  ['kb',['kB',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9',1,'cutlass::GemmOperand']]],
-  ['kc',['kC',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc',1,'cutlass::GemmOperand']]],
-  ['kcolumnmajor',['kColumnMajor',['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b',1,'cutlass::MatrixLayout']]],
-  ['kd',['kD',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe',1,'cutlass::GemmOperand::kD()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5',1,'cutlass::IteratorAdvance::kD()']]],
-  ['kgeneric',['kGeneric',['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38',1,'cutlass::MemorySpace']]],
-  ['kglobal',['kGlobal',['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37',1,'cutlass::MemorySpace']]],
-  ['kh',['kH',['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81',1,'cutlass::IteratorAdvance']]],
-  ['klanes',['kLanes',['../unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27',1,'cutlass::Vector::kLanes()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392',1,'cutlass::Vector&lt; half, kLanes_ &gt;::kLanes()']]],
-  ['krequiresloadfence',['kRequiresLoadFence',['../structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc',1,'cutlass::TileLoadIterator']]],
-  ['krowmajor',['kRowMajor',['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb',1,'cutlass::MatrixLayout']]],
-  ['kscalar',['kScalar',['../structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954',1,'cutlass::IteratorFragment']]],
-  ['kshared',['kShared',['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc',1,'cutlass::MemorySpace']]],
-  ['kvectorsize',['kVectorSize',['../unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e',1,'cutlass::Vector::kVectorSize()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79',1,'cutlass::Vector&lt; half, kLanes_ &gt;::kVectorSize()']]],
-  ['kw',['kW',['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0',1,'cutlass::IteratorAdvance']]],
-  ['kwmmamatrix',['kWmmaMatrix',['../structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419',1,'cutlass::IteratorFragment']]]
+  ['boustrophedon',['Boustrophedon',['../structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa',1,'cutlass::gemm::swizzleDirection']]]
 ];
diff --git a/docs/search/enumvalues_2.js b/docs/search/enumvalues_2.js
index d96aad12a..0528e4bc6 100644
--- a/docs/search/enumvalues_2.js
+++ b/docs/search/enumvalues_2.js
@@ -1,4 +1,21 @@
 var searchData=
 [
-  ['multiplicative',['Multiplicative',['../structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597',1,'cutlass::Identity']]]
+  ['ka',['kA',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a',1,'cutlass::GemmOperand']]],
+  ['kb',['kB',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9',1,'cutlass::GemmOperand']]],
+  ['kc',['kC',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc',1,'cutlass::GemmOperand']]],
+  ['kcolumnmajor',['kColumnMajor',['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b',1,'cutlass::MatrixLayout']]],
+  ['kconjugate',['kConjugate',['../structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683',1,'cutlass::MatrixTransform']]],
+  ['kd',['kD',['../structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca49eef82461e44c96462f9c4dbaab71fe',1,'cutlass::GemmOperand::kD()'],['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5',1,'cutlass::IteratorAdvance::kD()']]],
+  ['kgeneric',['kGeneric',['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38',1,'cutlass::MemorySpace']]],
+  ['kglobal',['kGlobal',['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37',1,'cutlass::MemorySpace']]],
+  ['kh',['kH',['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81',1,'cutlass::IteratorAdvance']]],
+  ['klanes',['kLanes',['../unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27',1,'cutlass::Vector::kLanes()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393',1,'cutlass::Vector&lt; half, 1 &gt;::kLanes()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392',1,'cutlass::Vector&lt; half, kLanes_ &gt;::kLanes()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a4020f25408022dbf20c26ed4fa8c7dffa14befaa9d739f1b754bc372f717b105b',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::kLanes()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a322ddd3ec1f47b76e21c24d3a3c44c5badeba151dbcb3c15e581bad7d767a93fa',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::kLanes()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a9aacb7538f1b83762d68c768629c98eba17b71e816051646b567cf47334649a9b',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::kLanes()']]],
+  ['knone',['kNone',['../structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5',1,'cutlass::MatrixTransform']]],
+  ['krequiresloadfence',['kRequiresLoadFence',['../structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126',1,'cutlass::TileLoadIterator']]],
+  ['krowmajor',['kRowMajor',['../structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb',1,'cutlass::MatrixLayout']]],
+  ['kscalar',['kScalar',['../structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b',1,'cutlass::FragmentElementType']]],
+  ['kshared',['kShared',['../structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc',1,'cutlass::MemorySpace']]],
+  ['kvectorsize',['kVectorSize',['../unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e',1,'cutlass::Vector::kVectorSize()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d',1,'cutlass::Vector&lt; half, 1 &gt;::kVectorSize()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79',1,'cutlass::Vector&lt; half, kLanes_ &gt;::kVectorSize()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::kVectorSize()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::kVectorSize()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::kVectorSize()']]],
+  ['kw',['kW',['../structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0',1,'cutlass::IteratorAdvance']]],
+  ['kwmmamatrix',['kWmmaMatrix',['../structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd',1,'cutlass::FragmentElementType']]]
 ];
diff --git a/docs/search/enumvalues_3.js b/docs/search/enumvalues_3.js
index 254df8ef6..d96aad12a 100644
--- a/docs/search/enumvalues_3.js
+++ b/docs/search/enumvalues_3.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['value',['value',['../structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d',1,'cutlass::log2_down::value()'],['../structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html#ad7d3c2329ab708bd4af36ffaee8509cba282c4c5d8f66dc49544f34071f148b1f',1,'cutlass::log2_down&lt; N, 1, Count &gt;::value()'],['../structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6',1,'cutlass::log2_up::value()'],['../structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html#ab001737f02df0a2c514334a1bfa6f1f9a6b6af5b6bf14ee5d3e3f1442e7f75117',1,'cutlass::log2_up&lt; N, 1, Count &gt;::value()'],['../structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964',1,'cutlass::sqrt_est::value()'],['../structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc',1,'cutlass::divide_assert::value()'],['../structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83',1,'cutlass::platform::alignment_of::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html#a6005c446eb41749276e0114b82abd990a5b0129d0f9bb45f1c56506efbbb22b6f',1,'cutlass::platform::alignment_of&lt; int4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html#ac55e0c5a0bc4c95981744e55ee7580cea807729922944eede573430b20ad4b322',1,'cutlass::platform::alignment_of&lt; uint4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html#ac9e709c32271b14b35c9607c64835a95a6a6ee3f24f4d123fc7c138fe5b776f2e',1,'cutlass::platform::alignment_of&lt; float4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html#ad58512f76f0b9b000d48f1ff869a0547a3d020dd8ba5c735a60d7c2c897e158f5',1,'cutlass::platform::alignment_of&lt; long4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html#adc0eec628649de183fe984bb46898830a8152a79c27d055dc3d0b8d662c0bc96a',1,'cutlass::platform::alignment_of&lt; ulong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html#aadf6522691db02f1aab22c22716f0793a940fa73dc4f0a49b78e4e0cefaf4775d',1,'cutlass::platform::alignment_of&lt; longlong2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html#a511f088278b3de04feb55ab60bdc5a09a58b5cc7be52956c43c2966af5887db80',1,'cutlass::platform::alignment_of&lt; ulonglong2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html#a5fb114d264023728cca5364401bd6929a7b89d57c8009e094f69ff57e196d8318',1,'cutlass::platform::alignment_of&lt; double2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html#a666c4fd30155873e3499f5cdc11782daafc1a7c2bb5e6483d42d380a2b4fd9561',1,'cutlass::platform::alignment_of&lt; longlong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html#a2568c1ab218cab6505bd20e3c2c420ffa54f6e1afec0ed30b18ab79fd6faf81b5',1,'cutlass::platform::alignment_of&lt; ulonglong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html#a024eaf40a8f3e8bd38b416868e0c68bca5a60b16666306472e92ad1320473ba85',1,'cutlass::platform::alignment_of&lt; double4 &gt;::value()']]]
+  ['multiplicative',['Multiplicative',['../structcutlass_1_1Identity.html#a37966282c824c6d0e32b432275ea8375af0cc1d8a713958a86af1063595604597',1,'cutlass::Identity']]]
 ];
diff --git a/docs/search/enumvalues_4.html b/docs/search/enumvalues_4.html
new file mode 100644
index 000000000..3f50abb8b
--- /dev/null
+++ b/docs/search/enumvalues_4.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="enumvalues_4.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/enumvalues_4.js b/docs/search/enumvalues_4.js
new file mode 100644
index 000000000..dfa8823a1
--- /dev/null
+++ b/docs/search/enumvalues_4.js
@@ -0,0 +1,4 @@
+var searchData=
+[
+  ['onedirection',['OneDirection',['../structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5',1,'cutlass::gemm::swizzleDirection']]]
+];
diff --git a/docs/search/enumvalues_5.html b/docs/search/enumvalues_5.html
new file mode 100644
index 000000000..b6f20f292
--- /dev/null
+++ b/docs/search/enumvalues_5.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="enumvalues_5.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/enumvalues_5.js b/docs/search/enumvalues_5.js
new file mode 100644
index 000000000..254df8ef6
--- /dev/null
+++ b/docs/search/enumvalues_5.js
@@ -0,0 +1,4 @@
+var searchData=
+[
+  ['value',['value',['../structcutlass_1_1log2__down.html#a793565cd891559fab765455e847171dca23d1b50f2f02e1026d4b5dc7ebd6880d',1,'cutlass::log2_down::value()'],['../structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html#ad7d3c2329ab708bd4af36ffaee8509cba282c4c5d8f66dc49544f34071f148b1f',1,'cutlass::log2_down&lt; N, 1, Count &gt;::value()'],['../structcutlass_1_1log2__up.html#a5826002505544547d0c5cc311c2338e3a09591054a7c9b184769d579c56dd09d6',1,'cutlass::log2_up::value()'],['../structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html#ab001737f02df0a2c514334a1bfa6f1f9a6b6af5b6bf14ee5d3e3f1442e7f75117',1,'cutlass::log2_up&lt; N, 1, Count &gt;::value()'],['../structcutlass_1_1sqrt__est.html#abe44577e3d8f34fc07bb9ecf89b25b11a2e73d046302be2504f50c08d788e9964',1,'cutlass::sqrt_est::value()'],['../structcutlass_1_1divide__assert.html#a20e8b8a803c6b5cfe636724760442e33ab924a64662c2eb917b1dd4ca31fdd2dc',1,'cutlass::divide_assert::value()'],['../structcutlass_1_1platform_1_1alignment__of.html#aa1d40937d3536b68e90c580765821389aa36284864bc3d1f73d3bf73cd8da7c83',1,'cutlass::platform::alignment_of::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html#a6005c446eb41749276e0114b82abd990a5b0129d0f9bb45f1c56506efbbb22b6f',1,'cutlass::platform::alignment_of&lt; int4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html#ac55e0c5a0bc4c95981744e55ee7580cea807729922944eede573430b20ad4b322',1,'cutlass::platform::alignment_of&lt; uint4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html#ac9e709c32271b14b35c9607c64835a95a6a6ee3f24f4d123fc7c138fe5b776f2e',1,'cutlass::platform::alignment_of&lt; float4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html#ad58512f76f0b9b000d48f1ff869a0547a3d020dd8ba5c735a60d7c2c897e158f5',1,'cutlass::platform::alignment_of&lt; long4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html#adc0eec628649de183fe984bb46898830a8152a79c27d055dc3d0b8d662c0bc96a',1,'cutlass::platform::alignment_of&lt; ulong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html#aadf6522691db02f1aab22c22716f0793a940fa73dc4f0a49b78e4e0cefaf4775d',1,'cutlass::platform::alignment_of&lt; longlong2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html#a511f088278b3de04feb55ab60bdc5a09a58b5cc7be52956c43c2966af5887db80',1,'cutlass::platform::alignment_of&lt; ulonglong2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html#a5fb114d264023728cca5364401bd6929a7b89d57c8009e094f69ff57e196d8318',1,'cutlass::platform::alignment_of&lt; double2 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html#a666c4fd30155873e3499f5cdc11782daafc1a7c2bb5e6483d42d380a2b4fd9561',1,'cutlass::platform::alignment_of&lt; longlong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html#a2568c1ab218cab6505bd20e3c2c420ffa54f6e1afec0ed30b18ab79fd6faf81b5',1,'cutlass::platform::alignment_of&lt; ulonglong4 &gt;::value()'],['../structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html#a024eaf40a8f3e8bd38b416868e0c68bca5a60b16666306472e92ad1320473ba85',1,'cutlass::platform::alignment_of&lt; double4 &gt;::value()']]]
+];
diff --git a/docs/search/files_0.js b/docs/search/files_0.js
index 0ba05c30a..455c8c450 100644
--- a/docs/search/files_0.js
+++ b/docs/search/files_0.js
@@ -1,6 +1,7 @@
 var searchData=
 [
   ['clear_5faccumulators_2eh',['clear_accumulators.h',['../clear__accumulators_8h.html',1,'']]],
+  ['complex_2eh',['complex.h',['../complex_8h.html',1,'']]],
   ['convert_2eh',['convert.h',['../convert_8h.html',1,'']]],
   ['coord_2eh',['coord.h',['../coord_8h.html',1,'']]],
   ['core_5fio_2eh',['core_io.h',['../core__io_8h.html',1,'']]],
diff --git a/docs/search/files_10.html b/docs/search/files_10.html
new file mode 100644
index 000000000..0ffd7bf01
--- /dev/null
+++ b/docs/search/files_10.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="files_10.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/files_10.js b/docs/search/files_10.js
new file mode 100644
index 000000000..1e59cee52
--- /dev/null
+++ b/docs/search/files_10.js
@@ -0,0 +1,6 @@
+var searchData=
+[
+  ['zip_5ffragment_2eh',['zip_fragment.h',['../zip__fragment_8h.html',1,'']]],
+  ['zip_5ftensor_5fref_2eh',['zip_tensor_ref.h',['../zip__tensor__ref_8h.html',1,'']]],
+  ['zip_5ftile_5fiterator_2eh',['zip_tile_iterator.h',['../zip__tile__iterator_8h.html',1,'']]]
+];
diff --git a/docs/search/files_2.js b/docs/search/files_2.js
index a34177fed..664fc205c 100644
--- a/docs/search/files_2.js
+++ b/docs/search/files_2.js
@@ -1,6 +1,7 @@
 var searchData=
 [
+  ['fp16_5fsgemm_5fmultiply_5fadd_2eh',['fp16_sgemm_multiply_add.h',['../fp16__sgemm__multiply__add_8h.html',1,'']]],
+  ['fp16_5fsgemm_5ftraits_2eh',['fp16_sgemm_traits.h',['../fp16__sgemm__traits_8h.html',1,'']]],
   ['fragment_2eh',['fragment.h',['../fragment_8h.html',1,'']]],
-  ['fragment_5fload_5fstore_2eh',['fragment_load_store.h',['../fragment__load__store_8h.html',1,'']]],
   ['fragment_5fmultiply_5fadd_2eh',['fragment_multiply_add.h',['../fragment__multiply__add_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_3.js b/docs/search/files_3.js
index 0c2ade3e7..e377b0b3f 100644
--- a/docs/search/files_3.js
+++ b/docs/search/files_3.js
@@ -1,6 +1,9 @@
 var searchData=
 [
   ['gemm_2eh',['gemm.h',['../gemm_8h.html',1,'']]],
+  ['gemm_5fconfig_2eh',['gemm_config.h',['../gemm__config_8h.html',1,'']]],
+  ['gemm_5fcoord_2eh',['gemm_coord.h',['../gemm__coord_8h.html',1,'']]],
+  ['gemm_5fdesc_2eh',['gemm_desc.h',['../gemm__desc_8h.html',1,'']]],
   ['gemm_5fepilogue_2eh',['gemm_epilogue.h',['../gemm__epilogue_8h.html',1,'']]],
   ['gemm_5fepilogue_5ftraits_2eh',['gemm_epilogue_traits.h',['../gemm__epilogue__traits_8h.html',1,'']]],
   ['gemm_5fglobal_5fstream_2eh',['gemm_global_stream.h',['../gemm__global__stream_8h.html',1,'']]],
@@ -8,5 +11,6 @@ var searchData=
   ['gemm_5foperand_2eh',['gemm_operand.h',['../gemm__operand_8h.html',1,'']]],
   ['gemm_5fshared_5fstream_2eh',['gemm_shared_stream.h',['../gemm__shared__stream_8h.html',1,'']]],
   ['gemm_5fshared_5ftile_2eh',['gemm_shared_tile.h',['../gemm__shared__tile_8h.html',1,'']]],
+  ['gemm_5fstream_5fpair_2eh',['gemm_stream_pair.h',['../gemm__stream__pair_8h.html',1,'']]],
   ['gemm_5ftraits_2eh',['gemm_traits.h',['../gemm__traits_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_5.js b/docs/search/files_5.js
index 6e82d0ebe..696f4b3b1 100644
--- a/docs/search/files_5.js
+++ b/docs/search/files_5.js
@@ -1,6 +1,5 @@
 var searchData=
 [
-  ['identity_5fblock_5fswizzle_2eh',['identity_block_swizzle.h',['../identity__block__swizzle_8h.html',1,'']]],
   ['igemm_5fepilogue_2eh',['igemm_epilogue.h',['../igemm__epilogue_8h.html',1,'']]],
   ['igemm_5fglobal_5ftile_2eh',['igemm_global_tile.h',['../igemm__global__tile_8h.html',1,'']]],
   ['igemm_5fmultiply_5fadd_2eh',['igemm_multiply_add.h',['../igemm__multiply__add_8h.html',1,'']]],
diff --git a/docs/search/files_6.js b/docs/search/files_6.js
index 20c8aded9..2c6d691e7 100644
--- a/docs/search/files_6.js
+++ b/docs/search/files_6.js
@@ -1,5 +1,4 @@
 var searchData=
 [
-  ['linear_5fscaling_2eh',['linear_scaling.h',['../linear__scaling_8h.html',1,'']]],
-  ['load_5fstore_2eh',['load_store.h',['../load__store_8h.html',1,'']]]
+  ['kernel_5flaunch_2eh',['kernel_launch.h',['../kernel__launch_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_7.js b/docs/search/files_7.js
index c9a077bce..79230be97 100644
--- a/docs/search/files_7.js
+++ b/docs/search/files_7.js
@@ -1,4 +1,6 @@
 var searchData=
 [
-  ['matrix_5ftraits_2eh',['matrix_traits.h',['../matrix__traits_8h.html',1,'']]]
+  ['linear_5fscaling_2eh',['linear_scaling.h',['../linear__scaling_8h.html',1,'']]],
+  ['linear_5fscaling_5fdevice_5fptr_2eh',['linear_scaling_device_ptr.h',['../linear__scaling__device__ptr_8h.html',1,'']]],
+  ['load_5fstore_2eh',['load_store.h',['../load__store_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_8.js b/docs/search/files_8.js
index b0cdc6b74..c9a077bce 100644
--- a/docs/search/files_8.js
+++ b/docs/search/files_8.js
@@ -1,5 +1,4 @@
 var searchData=
 [
-  ['platform_2eh',['platform.h',['../platform_8h.html',1,'']]],
-  ['predicate_5fvector_2eh',['predicate_vector.h',['../predicate__vector_8h.html',1,'']]]
+  ['matrix_5ftraits_2eh',['matrix_traits.h',['../matrix__traits_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_9.js b/docs/search/files_9.js
index e3c39a100..0808acef9 100644
--- a/docs/search/files_9.js
+++ b/docs/search/files_9.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['reshape_5ftile_2eh',['reshape_tile.h',['../reshape__tile_8h.html',1,'']]]
+  ['numeric_5ftypes_2eh',['numeric_types.h',['../numeric__types_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_a.js b/docs/search/files_a.js
index 5ee474248..b0cdc6b74 100644
--- a/docs/search/files_a.js
+++ b/docs/search/files_a.js
@@ -1,5 +1,5 @@
 var searchData=
 [
-  ['sgemm_5ftraits_2eh',['sgemm_traits.h',['../sgemm__traits_8h.html',1,'']]],
-  ['shape_2eh',['shape.h',['../shape_8h.html',1,'']]]
+  ['platform_2eh',['platform.h',['../platform_8h.html',1,'']]],
+  ['predicate_5fvector_2eh',['predicate_vector.h',['../predicate__vector_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_b.js b/docs/search/files_b.js
index f443994e6..e3c39a100 100644
--- a/docs/search/files_b.js
+++ b/docs/search/files_b.js
@@ -1,8 +1,4 @@
 var searchData=
 [
-  ['tensor_5fref_2eh',['tensor_ref.h',['../tensor__ref_8h.html',1,'']]],
-  ['tensor_5fview_2eh',['tensor_view.h',['../tensor__view_8h.html',1,'']]],
-  ['thread_5fmultiply_5fadd_2eh',['thread_multiply_add.h',['../thread__multiply__add_8h.html',1,'']]],
-  ['tile_5fiterator_2eh',['tile_iterator.h',['../tile__iterator_8h.html',1,'']]],
-  ['tile_5ftraits_5fstandard_2eh',['tile_traits_standard.h',['../tile__traits__standard_8h.html',1,'']]]
+  ['reshape_5ftile_2eh',['reshape_tile.h',['../reshape__tile_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_c.js b/docs/search/files_c.js
index 4edbbe392..cb299f5fe 100644
--- a/docs/search/files_c.js
+++ b/docs/search/files_c.js
@@ -1,4 +1,6 @@
 var searchData=
 [
-  ['vector_2eh',['vector.h',['../vector_8h.html',1,'']]]
+  ['scalar_5for_5fpointer_2eh',['scalar_or_pointer.h',['../scalar__or__pointer_8h.html',1,'']]],
+  ['sgemm_5ftraits_2eh',['sgemm_traits.h',['../sgemm__traits_8h.html',1,'']]],
+  ['shape_2eh',['shape.h',['../shape_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_d.js b/docs/search/files_d.js
index 732797da7..7043d69e9 100644
--- a/docs/search/files_d.js
+++ b/docs/search/files_d.js
@@ -1,9 +1,13 @@
 var searchData=
 [
-  ['wmma_5fgemm_5fepilogue_5ftraits_2eh',['wmma_gemm_epilogue_traits.h',['../wmma__gemm__epilogue__traits_8h.html',1,'']]],
-  ['wmma_5fgemm_5fglobal_5ftile_2eh',['wmma_gemm_global_tile.h',['../wmma__gemm__global__tile_8h.html',1,'']]],
-  ['wmma_5fgemm_5fmultiply_5fadd_2eh',['wmma_gemm_multiply_add.h',['../wmma__gemm__multiply__add_8h.html',1,'']]],
-  ['wmma_5fgemm_5fshared_5ftile_2eh',['wmma_gemm_shared_tile.h',['../wmma__gemm__shared__tile_8h.html',1,'']]],
-  ['wmma_5fgemm_5ftraits_2eh',['wmma_gemm_traits.h',['../wmma__gemm__traits_8h.html',1,'']]],
-  ['wmma_5fmatrix_2eh',['wmma_matrix.h',['../wmma__matrix_8h.html',1,'']]]
+  ['tensor_5fref_2eh',['tensor_ref.h',['../tensor__ref_8h.html',1,'']]],
+  ['tensor_5fref_5fcollection_2eh',['tensor_ref_collection.h',['../tensor__ref__collection_8h.html',1,'']]],
+  ['tensor_5fview_2eh',['tensor_view.h',['../tensor__view_8h.html',1,'']]],
+  ['thread_5fmultiply_5fadd_2eh',['thread_multiply_add.h',['../thread__multiply__add_8h.html',1,'']]],
+  ['threadblock_5fswizzle_2eh',['threadblock_swizzle.h',['../threadblock__swizzle_8h.html',1,'']]],
+  ['tile_5fallocation_2eh',['tile_allocation.h',['../tile__allocation_8h.html',1,'']]],
+  ['tile_5fcoord_2eh',['tile_coord.h',['../tile__coord_8h.html',1,'']]],
+  ['tile_5fiterator_2eh',['tile_iterator.h',['../tile__iterator_8h.html',1,'']]],
+  ['tile_5fstream_2eh',['tile_stream.h',['../tile__stream_8h.html',1,'']]],
+  ['tile_5ftraits_5fstandard_2eh',['tile_traits_standard.h',['../tile__traits__standard_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_e.js b/docs/search/files_e.js
index 732797da7..4edbbe392 100644
--- a/docs/search/files_e.js
+++ b/docs/search/files_e.js
@@ -1,9 +1,4 @@
 var searchData=
 [
-  ['wmma_5fgemm_5fepilogue_5ftraits_2eh',['wmma_gemm_epilogue_traits.h',['../wmma__gemm__epilogue__traits_8h.html',1,'']]],
-  ['wmma_5fgemm_5fglobal_5ftile_2eh',['wmma_gemm_global_tile.h',['../wmma__gemm__global__tile_8h.html',1,'']]],
-  ['wmma_5fgemm_5fmultiply_5fadd_2eh',['wmma_gemm_multiply_add.h',['../wmma__gemm__multiply__add_8h.html',1,'']]],
-  ['wmma_5fgemm_5fshared_5ftile_2eh',['wmma_gemm_shared_tile.h',['../wmma__gemm__shared__tile_8h.html',1,'']]],
-  ['wmma_5fgemm_5ftraits_2eh',['wmma_gemm_traits.h',['../wmma__gemm__traits_8h.html',1,'']]],
-  ['wmma_5fmatrix_2eh',['wmma_matrix.h',['../wmma__matrix_8h.html',1,'']]]
+  ['vector_2eh',['vector.h',['../vector_8h.html',1,'']]]
 ];
diff --git a/docs/search/files_f.html b/docs/search/files_f.html
new file mode 100644
index 000000000..30cd09be2
--- /dev/null
+++ b/docs/search/files_f.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="files_f.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/files_f.js b/docs/search/files_f.js
new file mode 100644
index 000000000..732797da7
--- /dev/null
+++ b/docs/search/files_f.js
@@ -0,0 +1,9 @@
+var searchData=
+[
+  ['wmma_5fgemm_5fepilogue_5ftraits_2eh',['wmma_gemm_epilogue_traits.h',['../wmma__gemm__epilogue__traits_8h.html',1,'']]],
+  ['wmma_5fgemm_5fglobal_5ftile_2eh',['wmma_gemm_global_tile.h',['../wmma__gemm__global__tile_8h.html',1,'']]],
+  ['wmma_5fgemm_5fmultiply_5fadd_2eh',['wmma_gemm_multiply_add.h',['../wmma__gemm__multiply__add_8h.html',1,'']]],
+  ['wmma_5fgemm_5fshared_5ftile_2eh',['wmma_gemm_shared_tile.h',['../wmma__gemm__shared__tile_8h.html',1,'']]],
+  ['wmma_5fgemm_5ftraits_2eh',['wmma_gemm_traits.h',['../wmma__gemm__traits_8h.html',1,'']]],
+  ['wmma_5fmatrix_2eh',['wmma_matrix.h',['../wmma__matrix_8h.html',1,'']]]
+];
diff --git a/docs/search/functions_0.js b/docs/search/functions_0.js
index 9bb68b7cf..60c7988db 100644
--- a/docs/search/functions_0.js
+++ b/docs/search/functions_0.js
@@ -1,4 +1,5 @@
 var searchData=
 [
-  ['_5f_5falign_5f_5f',['__align__',['../namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8',1,'cutlass::platform::__align__(1) aligned_chunk&lt; 1 &gt;'],['../namespacecutlass_1_1platform.html#a0bcb016704ec57f9499e662ba6156f98',1,'cutlass::platform::__align__(2) aligned_chunk&lt; 2 &gt;'],['../namespacecutlass_1_1platform.html#a71be5af25eeffa4077777f919e67d8da',1,'cutlass::platform::__align__(4) aligned_chunk&lt; 4 &gt;'],['../namespacecutlass_1_1platform.html#a42440254a16d4b6b95b95cc3360ee372',1,'cutlass::platform::__align__(8) aligned_chunk&lt; 8 &gt;'],['../namespacecutlass_1_1platform.html#a91d5e970d6ebe619914f40a9510bdb1e',1,'cutlass::platform::__align__(16) aligned_chunk&lt; 16 &gt;'],['../namespacecutlass_1_1platform.html#a210f4d360b1f9c3d074e71129fe4c0d9',1,'cutlass::platform::__align__(32) aligned_chunk&lt; 32 &gt;'],['../namespacecutlass_1_1platform.html#ae792b1c7ada1a33e306cd552f583bdce',1,'cutlass::platform::__align__(64) aligned_chunk&lt; 64 &gt;'],['../namespacecutlass_1_1platform.html#a5712ec4fed335a9b7f863fb3abe3c5eb',1,'cutlass::platform::__align__(128) aligned_chunk&lt; 128 &gt;'],['../namespacecutlass_1_1platform.html#a595cc98db29fb4d59772d2e2f52e347a',1,'cutlass::platform::__align__(256) aligned_chunk&lt; 256 &gt;'],['../namespacecutlass_1_1platform.html#ae70bb5d14a66500b47d2e3f83063d4a5',1,'cutlass::platform::__align__(512) aligned_chunk&lt; 512 &gt;'],['../namespacecutlass_1_1platform.html#a181e44e9c66f704175590727aaa9e5a1',1,'cutlass::platform::__align__(1024) aligned_chunk&lt; 1024 &gt;'],['../namespacecutlass_1_1platform.html#ae72c8fa997bb251d4140dceb03147154',1,'cutlass::platform::__align__(2048) aligned_chunk&lt; 2048 &gt;'],['../namespacecutlass_1_1platform.html#ada29683f1b408ae7b73cc8fbe2108628',1,'cutlass::platform::__align__(4096) aligned_chunk&lt; 4096 &gt;'],['../namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706',1,'cutlass::__align__(1) AlignedStruct&lt; 1 &gt;'],['../namespacecutlass.html#a602227fad962270da185209ecc6012f2',1,'cutlass::__align__(2) AlignedStruct&lt; 2 &gt;'],['../namespacecutlass.html#a266d7d2ae6e79537e46ee37b4fdface7',1,'cutlass::__align__(4) AlignedStruct&lt; 4 &gt;'],['../namespacecutlass.html#a1101e01215ddb0e5a7b120a4541a3c4e',1,'cutlass::__align__(8) AlignedStruct&lt; 8 &gt;'],['../namespacecutlass.html#aa4071cf5103f352a5100d9b4bba895e2',1,'cutlass::__align__(16) AlignedStruct&lt; 16 &gt;'],['../namespacecutlass.html#ada65694bdd4b70d4c9d769a536275a47',1,'cutlass::__align__(32) AlignedStruct&lt; 32 &gt;'],['../namespacecutlass.html#aa80a7cb3febd19b96f2ecbcb610b1b9e',1,'cutlass::__align__(64) AlignedStruct&lt; 64 &gt;']]]
+  ['_5f_5falign_5f_5f',['__align__',['../namespacecutlass_1_1platform.html#ac9068e2d027ffdf5cd564deecc2cb9e8',1,'cutlass::platform::__align__(1) aligned_chunk&lt; 1 &gt;'],['../namespacecutlass_1_1platform.html#a0bcb016704ec57f9499e662ba6156f98',1,'cutlass::platform::__align__(2) aligned_chunk&lt; 2 &gt;'],['../namespacecutlass_1_1platform.html#a71be5af25eeffa4077777f919e67d8da',1,'cutlass::platform::__align__(4) aligned_chunk&lt; 4 &gt;'],['../namespacecutlass_1_1platform.html#a42440254a16d4b6b95b95cc3360ee372',1,'cutlass::platform::__align__(8) aligned_chunk&lt; 8 &gt;'],['../namespacecutlass_1_1platform.html#a91d5e970d6ebe619914f40a9510bdb1e',1,'cutlass::platform::__align__(16) aligned_chunk&lt; 16 &gt;'],['../namespacecutlass_1_1platform.html#a210f4d360b1f9c3d074e71129fe4c0d9',1,'cutlass::platform::__align__(32) aligned_chunk&lt; 32 &gt;'],['../namespacecutlass_1_1platform.html#ae792b1c7ada1a33e306cd552f583bdce',1,'cutlass::platform::__align__(64) aligned_chunk&lt; 64 &gt;'],['../namespacecutlass_1_1platform.html#a5712ec4fed335a9b7f863fb3abe3c5eb',1,'cutlass::platform::__align__(128) aligned_chunk&lt; 128 &gt;'],['../namespacecutlass_1_1platform.html#a595cc98db29fb4d59772d2e2f52e347a',1,'cutlass::platform::__align__(256) aligned_chunk&lt; 256 &gt;'],['../namespacecutlass_1_1platform.html#ae70bb5d14a66500b47d2e3f83063d4a5',1,'cutlass::platform::__align__(512) aligned_chunk&lt; 512 &gt;'],['../namespacecutlass_1_1platform.html#a181e44e9c66f704175590727aaa9e5a1',1,'cutlass::platform::__align__(1024) aligned_chunk&lt; 1024 &gt;'],['../namespacecutlass_1_1platform.html#ae72c8fa997bb251d4140dceb03147154',1,'cutlass::platform::__align__(2048) aligned_chunk&lt; 2048 &gt;'],['../namespacecutlass_1_1platform.html#ada29683f1b408ae7b73cc8fbe2108628',1,'cutlass::platform::__align__(4096) aligned_chunk&lt; 4096 &gt;'],['../namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706',1,'cutlass::__align__(1) AlignedStruct&lt; 1 &gt;'],['../namespacecutlass.html#a602227fad962270da185209ecc6012f2',1,'cutlass::__align__(2) AlignedStruct&lt; 2 &gt;'],['../namespacecutlass.html#a266d7d2ae6e79537e46ee37b4fdface7',1,'cutlass::__align__(4) AlignedStruct&lt; 4 &gt;'],['../namespacecutlass.html#a1101e01215ddb0e5a7b120a4541a3c4e',1,'cutlass::__align__(8) AlignedStruct&lt; 8 &gt;'],['../namespacecutlass.html#aa4071cf5103f352a5100d9b4bba895e2',1,'cutlass::__align__(16) AlignedStruct&lt; 16 &gt;'],['../namespacecutlass.html#ada65694bdd4b70d4c9d769a536275a47',1,'cutlass::__align__(32) AlignedStruct&lt; 32 &gt;'],['../namespacecutlass.html#aa80a7cb3febd19b96f2ecbcb610b1b9e',1,'cutlass::__align__(64) AlignedStruct&lt; 64 &gt;']]],
+  ['_5f_5flaunch_5fbounds_5f_5f',['__launch_bounds__',['../namespacecutlass_1_1gemm.html#a01dd61085e2b3f578a7fc266b94fac55',1,'cutlass::gemm']]]
 ];
diff --git a/docs/search/functions_1.js b/docs/search/functions_1.js
index 8b50e666c..521fba1d7 100644
--- a/docs/search/functions_1.js
+++ b/docs/search/functions_1.js
@@ -1,5 +1,8 @@
 var searchData=
 [
-  ['advance',['advance',['../classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478',1,'cutlass::TensorRef']]],
-  ['at',['at',['../structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8',1,'cutlass::Coord::at()'],['../structcutlass_1_1Coord.html#ab511a16210d1b94449f5bc6476f6a266',1,'cutlass::Coord::at(int dim)'],['../structcutlass_1_1Coord.html#af9cc7ab2088544d1240ac51c4c6e685d',1,'cutlass::Coord::at() const'],['../structcutlass_1_1Coord.html#aed4f4d1c7c0749fe72736d7a1213b6e9',1,'cutlass::Coord::at(int dim) const'],['../structcutlass_1_1FragmentIterator.html#a9cf31df06ff035705a1341810fcdcbf2',1,'cutlass::FragmentIterator::at(int d, int h, int w, int c=0) const'],['../structcutlass_1_1FragmentIterator.html#a7bdc407aae8d7360e089af347b585a53',1,'cutlass::FragmentIterator::at(int d, int h, int w, int c=0)'],['../structcutlass_1_1FragmentConstIterator.html#a8b957150545becacab1b8ead1be29424',1,'cutlass::FragmentConstIterator::at()'],['../structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd',1,'cutlass::PredicateVector::at()'],['../structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f',1,'cutlass::TrivialPredicateTileAdapter::at()'],['../structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986',1,'cutlass::PredicateTileAdapter::at()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd',1,'cutlass::ConstPredicateTileAdapter::at()'],['../classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f',1,'cutlass::TensorRef::at(Coord&lt; Rank &gt; const &amp;coord) const'],['../classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215',1,'cutlass::TensorRef::at(int idx) const'],['../classcutlass_1_1TensorView.html#ad894a8b373c413d308cb1b7c7ba545ce',1,'cutlass::TensorView::at(Coord_t const &amp;coord) const'],['../classcutlass_1_1TensorView.html#acc55581896fae8c0449b44b56d750155',1,'cutlass::TensorView::at(Offset_t idx) const']]]
+  ['abs',['abs',['../namespacecutlass_1_1platform.html#a1fbf209c41242b3f605ac220c39e8fd5',1,'cutlass::platform']]],
+  ['add_5fpointer_5foffset',['add_pointer_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6',1,'cutlass::gemm::GemmGlobalIteratorAb::add_pointer_offset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db',1,'cutlass::gemm::GemmGlobalIteratorCd::add_pointer_offset()'],['../classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143',1,'cutlass::TensorRef::add_pointer_offset()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a93ff0a9fda3e136a1674aeb82de050db',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::add_pointer_offset()'],['../structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232',1,'cutlass::TileLoadIterator::add_pointer_offset()'],['../structcutlass_1_1TileStoreIterator.html#aa6977ded39ead005b3435f13f0e51116',1,'cutlass::TileStoreIterator::add_pointer_offset()'],['../classcutlass_1_1ZipTileIterator.html#a0752af296e110d9104a45ae24bd0a104',1,'cutlass::ZipTileIterator::add_pointer_offset()']]],
+  ['alpha',['alpha',['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae4038a59658c87d52cee3330bee59662',1,'cutlass::gemm::LinearScalingDevicePtr::Params']]],
+  ['arg',['arg',['../namespacecutlass_1_1platform.html#a8a1a03766dbd2c2ce10b10498f281bf0',1,'cutlass::platform']]],
+  ['at',['at',['../structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93',1,'cutlass::Coord::at()'],['../structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694',1,'cutlass::Coord::at(int dim)'],['../structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe',1,'cutlass::Coord::at() const'],['../structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46',1,'cutlass::Coord::at(int dim) const'],['../structcutlass_1_1FragmentIterator.html#a35b721563536ab2c5dbab0f5de1c2b43',1,'cutlass::FragmentIterator::at(int d, int h, int w, int c=0) const'],['../structcutlass_1_1FragmentIterator.html#adb863b44dfbc1fa923625e767f6dd7cd',1,'cutlass::FragmentIterator::at(int d, int h, int w, int c=0)'],['../structcutlass_1_1FragmentConstIterator.html#a14f2ad2f9b90aea092ff1836e8fb159d',1,'cutlass::FragmentConstIterator::at()'],['../structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd',1,'cutlass::PredicateVector::at()'],['../structcutlass_1_1TrivialPredicateTileAdapter.html#a3e41ab145489df08fca79251b2253d0f',1,'cutlass::TrivialPredicateTileAdapter::at()'],['../structcutlass_1_1PredicateTileAdapter.html#a7d54e877bca2e840c142293b4826e986',1,'cutlass::PredicateTileAdapter::at()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#a9e5651009a7b8df9960527c18c7b05dd',1,'cutlass::ConstPredicateTileAdapter::at()'],['../classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f',1,'cutlass::TensorRef::at(TensorCoord const &amp;coord) const'],['../classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c',1,'cutlass::TensorRef::at(LongIndex idx) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a597bb02594c918c50f0bdb0cb4ce74c8',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::at(TensorCoord const &amp;coord) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a92371a586e756734522a853bef74324d',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::at(LongIndex idx) const'],['../structcutlass_1_1TensorRefBatchStrided.html#aac4b013050925c1e2db4019140e82602',1,'cutlass::TensorRefBatchStrided::at()'],['../structcutlass_1_1TensorRefArray.html#a2a95fd42d48c550a45f340b04f9dfe3d',1,'cutlass::TensorRefArray::at()']]]
 ];
diff --git a/docs/search/functions_10.js b/docs/search/functions_10.js
index e7ab3ee10..ca213eb7f 100644
--- a/docs/search/functions_10.js
+++ b/docs/search/functions_10.js
@@ -1,11 +1,14 @@
 var searchData=
 [
-  ['tensorref',['TensorRef',['../classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478',1,'cutlass::TensorRef::TensorRef()'],['../classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8',1,'cutlass::TensorRef::TensorRef(Storage *ptr, Coord&lt; Rank &gt; stride)']]],
-  ['tensorview',['TensorView',['../classcutlass_1_1TensorView.html#a22401348796d603546e44d6c196018dc',1,'cutlass::TensorView::TensorView()'],['../classcutlass_1_1TensorView.html#a80480aa986a488a106a9b0aea331c317',1,'cutlass::TensorView::TensorView(TensorRef_t const &amp;_ref, Coord_t const &amp;_size)']]],
-  ['threadmultiplyadd',['ThreadMultiplyAdd',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#acec155117a56c942c5e695984b0f072d',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a9b75e499f4c14369b5c86051dceeb81d',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ab271a3f11ccde4b629ddb11b78c0d555',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadMultiplyAdd()']]],
-  ['tileloaditerator',['TileLoadIterator',['../structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e',1,'cutlass::TileLoadIterator::TileLoadIterator()'],['../structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23',1,'cutlass::TileLoadIterator::TileLoadIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6',1,'cutlass::TileLoadIterator::TileLoadIterator(Params const &amp;, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())']]],
-  ['tilestoreiterator',['TileStoreIterator',['../structcutlass_1_1TileStoreIterator.html#aac4d49854d63f632627b6974f9b59dbb',1,'cutlass::TileStoreIterator::TileStoreIterator()'],['../structcutlass_1_1TileStoreIterator.html#a037ccd942359e6bc8640a240b13cd330',1,'cutlass::TileStoreIterator::TileStoreIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1TileStoreIterator.html#a4f89c5182659de94605300e15c3651b2',1,'cutlass::TileStoreIterator::TileStoreIterator(Params const &amp;, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())']]],
-  ['transform',['transform',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#aa9fe67c947bf461ba3e3ca48daa34815',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3',1,'cutlass::Copy::transform(Fragment_ const &amp;src, Fragment_ &amp;dst)'],['../structcutlass_1_1Copy.html#a171f9a44c05b6fb432b0339979de4eb2',1,'cutlass::Copy::transform(InputFragment_ const &amp;src, int offset, Fragment_ &amp;dst)'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26',1,'cutlass::gemm::HgemmSwizzle::transform()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b',1,'cutlass::gemm::IgemmFloatToInt8Converter::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd',1,'cutlass::gemm::IgemmFloatToInt8Converter::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d',1,'cutlass::gemm::IgemmInt8ToFloatConverter::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3',1,'cutlass::gemm::IgemmInt8ToFloatConverter::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811',1,'cutlass::gemm::IgemmSwizzle::transform()']]],
-  ['trivialiterator',['TrivialIterator',['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a6cb3664b5cba4280b7055a65ddad7850',1,'cutlass::PredicateVector::TrivialIterator::TrivialIterator()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14',1,'cutlass::PredicateVector::TrivialIterator::TrivialIterator(Iterator const &amp;it)'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721',1,'cutlass::PredicateVector::TrivialIterator::TrivialIterator(PredicateVector const &amp;_vec)']]],
-  ['trivialpredicatetileadapter',['TrivialPredicateTileAdapter',['../structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7',1,'cutlass::TrivialPredicateTileAdapter']]]
+  ['real',['real',['../classcutlass_1_1platform_1_1complex.html#ab06cbc1eefd47df3d3748d42d6d95974',1,'cutlass::platform::complex::real() const'],['../classcutlass_1_1platform_1_1complex.html#acda3e2050b2fefb1aca1fa8aa2063f8b',1,'cutlass::platform::complex::real()'],['../namespacecutlass_1_1platform.html#a25a36d44c7b9f182eb404a3251cd4f39',1,'cutlass::platform::real(cuFloatComplex const &amp;z)'],['../namespacecutlass_1_1platform.html#aa9b17e4705337452761c0d3bd5edfc67',1,'cutlass::platform::real(cuFloatComplex &amp;z)'],['../namespacecutlass_1_1platform.html#a1f13c0049c5f94b0480c619612608f7b',1,'cutlass::platform::real(cuDoubleComplex const &amp;z)'],['../namespacecutlass_1_1platform.html#a3365c0200a034973b7baecede9728239',1,'cutlass::platform::real(cuDoubleComplex &amp;z)'],['../namespacecutlass_1_1platform.html#a01e98d1c13ac9384f2bdc407fce6131b',1,'cutlass::platform::real(complex&lt; T &gt; const &amp;z)'],['../namespacecutlass_1_1platform.html#aa5cfa5849e12b745236485dd2db5f854',1,'cutlass::platform::real(complex&lt; T &gt; &amp;z)']]],
+  ['ref',['ref',['../classcutlass_1_1TensorView.html#a7e2beb56a3bc2d58c9ec65467b78c4f3',1,'cutlass::TensorView']]],
+  ['reference',['reference',['../structcutlass_1_1TileAllocation.html#a3466ef2b478e4617aa1ff261217cfd05',1,'cutlass::TileAllocation::reference()'],['../structcutlass_1_1TileAllocation.html#afcdc0be82acf0b4ae66468e2170c5a0d',1,'cutlass::TileAllocation::reference() const'],['../structcutlass_1_1ZipTileAllocation.html#a0d00001220df7f2bdb1f09ae3f37c585',1,'cutlass::ZipTileAllocation::reference()'],['../structcutlass_1_1ZipTileAllocation.html#af9964904e789b3ab58334f1ec1ceee56',1,'cutlass::ZipTileAllocation::reference() const']]],
+  ['regulartilepredicatefunctor',['RegularTilePredicateFunctor',['../structcutlass_1_1RegularTilePredicateFunctor.html#a0e0b728d3685097a9280fbca6a47a2af',1,'cutlass::RegularTilePredicateFunctor']]],
+  ['release',['release',['../classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279',1,'cutlass::platform::unique_ptr']]],
+  ['reset',['reset',['../classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0',1,'cutlass::TensorRef::reset(Storage *ptr=nullptr)'],['../classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b',1,'cutlass::TensorRef::reset(Storage *ptr, StorageCoord const &amp;stride)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a1043f0ef382179b8ecd9f4e710f6e106',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::reset(Storage *ptr=nullptr)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6339a8ac88f9172acf0337d149b98cb4',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::reset(Storage *ptr, StorageCoord const &amp;stride)'],['../classcutlass_1_1TensorView.html#ae142eb93cf91e000b635d32fcacf1db3',1,'cutlass::TensorView::reset()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331',1,'cutlass::platform::unique_ptr::reset()']]],
+  ['residue',['residue',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17',1,'cutlass::gemm::GlobalLoadStream::residue()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593',1,'cutlass::gemm::GemmGlobalIteratorAb::residue()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a',1,'cutlass::gemm::GlobalLoadStreamPair::residue()']]],
+  ['rollback',['rollback',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1e2eecdba1871fc11aa43a06edf6ed34',1,'cutlass::gemm::GlobalLoadStream::rollback()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6a9287a2cd87ca8a96cbf6b6d29199da',1,'cutlass::gemm::GlobalLoadStreamPair::rollback()']]],
+  ['round_5fnearest',['round_nearest',['../namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e',1,'cutlass']]],
+  ['row',['row',['../structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546',1,'cutlass::MatrixCoord::row() const'],['../structcutlass_1_1MatrixCoord.html#a67f3102e51abad1205e8a3450e7a6c7e',1,'cutlass::MatrixCoord::row()']]],
+  ['rowmajorblockswizzle',['RowMajorBlockSwizzle',['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a4ed7847f8ddad11a6765d914b6f32fcd',1,'cutlass::gemm::RowMajorBlockSwizzle']]]
 ];
diff --git a/docs/search/functions_11.js b/docs/search/functions_11.js
index a0eb54d4d..6b87493d7 100644
--- a/docs/search/functions_11.js
+++ b/docs/search/functions_11.js
@@ -1,4 +1,23 @@
 var searchData=
 [
-  ['unique_5fptr',['unique_ptr',['../classcutlass_1_1platform_1_1unique__ptr.html#aa8a370bc7e4c2d99eb85e7fea27b3179',1,'cutlass::platform::unique_ptr::unique_ptr()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a14c8bf5a5deefe4a6602ccd5c5af364c',1,'cutlass::platform::unique_ptr::unique_ptr(pointer p)']]]
+  ['scalario',['ScalarIO',['../structcutlass_1_1ScalarIO.html#ad4166575521254088bf6c6300c351714',1,'cutlass::ScalarIO::ScalarIO()'],['../structcutlass_1_1ScalarIO.html#a5227e1e9ed24326ad4f8dc94d186186f',1,'cutlass::ScalarIO::ScalarIO(T value)']]],
+  ['scalarorpointer',['ScalarOrPointer',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a45cf72b3f0e3408a4b51990b648b71ee',1,'cutlass::detail::ScalarOrPointer::ScalarOrPointer()'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b85e1940149922942c7d495f9d12134',1,'cutlass::detail::ScalarOrPointer::ScalarOrPointer(Scalar const &amp;val)'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a03a54e9150c2cccb26d9fa688ea03f96',1,'cutlass::detail::ScalarOrPointer::ScalarOrPointer(Scalar const *ptr_)']]],
+  ['set',['set',['../classcutlass_1_1PredicateVector_1_1Iterator.html#aadfd039b5622098c9e46706a27122575',1,'cutlass::PredicateVector::Iterator::set()'],['../structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af',1,'cutlass::PredicateVector::set()'],['../structcutlass_1_1PredicateTileAdapter.html#aeda47efdda0387f9c3c7b31f836afca5',1,'cutlass::PredicateTileAdapter::set()']]],
+  ['shared_5fload_5ffence',['shared_load_fence',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84',1,'cutlass::gemm::GemmEpilogue::shared_load_fence()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe',1,'cutlass::gemm::GemmTraits::shared_load_fence()']]],
+  ['shared_5fstore_5ffence',['shared_store_fence',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691',1,'cutlass::gemm::GemmEpilogue::shared_store_fence()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f',1,'cutlass::gemm::GemmTraits::shared_store_fence()']]],
+  ['sharedloadstream',['SharedLoadStream',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad',1,'cutlass::gemm::SharedLoadStream::SharedLoadStream()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#ad2f619712c817f91d62a13db0476a627',1,'cutlass::gemm::SharedLoadStream::SharedLoadStream(Params const &amp;params, TensorRef const &amp;ref)']]],
+  ['sharedstreampair',['SharedStreamPair',['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a0b69ca0b37dad32ba25c7f7e71a3dcc1',1,'cutlass::gemm::SharedStreamPair']]],
+  ['sin',['sin',['../namespacecutlass_1_1platform.html#a3c5dc10135c54b3b212c9e107ba1476a',1,'cutlass::platform']]],
+  ['size',['size',['../classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a',1,'cutlass::TensorView::size() const'],['../classcutlass_1_1TensorView.html#a3778dc1c62a27ed811f1bb82a420096e',1,'cutlass::TensorView::size(int dim) const']]],
+  ['slice',['slice',['../structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c',1,'cutlass::Coord']]],
+  ['source_5frequired',['source_required',['../structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54',1,'cutlass::gemm::LinearScaling']]],
+  ['sqrt',['sqrt',['../namespacecutlass_1_1platform.html#a81308ccea406262e143e27193cbdf747',1,'cutlass::platform']]],
+  ['store',['store',['../structcutlass_1_1Store.html#a187b63f682f7f00f8bf9ed3ee59d602f',1,'cutlass::Store::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#a535b4356c9bc21352fc2459b3c2246d1',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a453a2eed81a86d6637778a50bed06b59',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a1fcdc328d4b2deb1c50be5d31ef9e55f',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::store()'],['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a174ed368f1c702b4c958887f0b895eee',1,'cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#ae16a5d6d7a42ffeba0f0ebe2d252ec28',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a298a08c8c4c1ea871e92e2491b2cb549',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::store()'],['../structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e',1,'cutlass::TileStoreIterator::store(Fragment const &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileStoreIterator.html#aa27a456bf12d0e44adc89a1c2ca7bc3b',1,'cutlass::TileStoreIterator::store(Fragment const &amp;fragment) const'],['../classcutlass_1_1ZipTileIterator.html#a884983cd1df81739fc971b46697b851c',1,'cutlass::ZipTileIterator::store(Fragment const &amp;fragment) const'],['../classcutlass_1_1ZipTileIterator.html#a425b4a4f2e66f3ff5960742d19d06bc2',1,'cutlass::ZipTileIterator::store(Fragment const &amp;fragment, Coord&lt; 4 &gt; const &amp;offset) const'],['../classcutlass_1_1ZipTileIterator.html#aa617653e75535fe13aafa80bc4cc9cc4',1,'cutlass::ZipTileIterator::store(Fragment const &amp;fragment, PredicateIterator pred_it) const']]],
+  ['store_5felement',['store_element',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d',1,'cutlass::gemm::GemmGlobalIteratorCd::store_element()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a051eb2a8637601cf9c1f52999117151b',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::store_element()'],['../structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08',1,'cutlass::TileStoreIterator::store_element()']]],
+  ['store_5fpost_5fincrement',['store_post_increment',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a',1,'cutlass::gemm::GemmGlobalIteratorCd::store_post_increment()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a018d5be34cdbb263d7f133197b2921ca',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::store_post_increment()'],['../structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44',1,'cutlass::TileStoreIterator::store_post_increment(Fragment const &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileStoreIterator.html#a35ab2595b09912d31a60c2a4e5847c88',1,'cutlass::TileStoreIterator::store_post_increment(Fragment const &amp;fragment)'],['../classcutlass_1_1ZipTileIterator.html#a961a340f902542f3000dc80e852958f2',1,'cutlass::ZipTileIterator::store_post_increment(Fragment const &amp;fragment)'],['../classcutlass_1_1ZipTileIterator.html#a18ed76e6be1a02d0229cdf1d6528e34f',1,'cutlass::ZipTileIterator::store_post_increment(Fragment const &amp;fragment, Coord&lt; 4 &gt; const &amp;offset)'],['../classcutlass_1_1ZipTileIterator.html#a3a2cae47533c1122eb8ec404473a0d9e',1,'cutlass::ZipTileIterator::store_post_increment(Fragment const &amp;fragment, PredicateIterator pred_it)']]],
+  ['stride',['stride',['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a56f728be8b1a3e71f4f322e1dbfb3495',1,'cutlass::MatrixLayout::RowMajorInterleaved::stride()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dab2c5aee6958c9d99109183401f41f',1,'cutlass::MatrixLayout::ColumnMajorInterleaved::stride()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#aa3c5b8d44216fdeeee9cce5e38ce418b',1,'cutlass::MatrixLayout::ContiguousLayout::stride()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#abb88bd43e5493682d1132c550b734a36',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::stride()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a1b25b4a7061d81041a8e2a548128ca71',1,'cutlass::MatrixLayout::RowMajorBlockLinear::stride()'],['../classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c',1,'cutlass::TensorRef::stride() const'],['../classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7',1,'cutlass::TensorRef::stride(int dim) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::stride() const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af83380ffc0e5949d40d1a5039a5ddc00',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::stride(int dim) const']]],
+  ['stride_5fadvance',['stride_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7',1,'cutlass::gemm::GemmGlobalIteratorAb::stride_advance()'],['../structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11',1,'cutlass::TileLoadIterator::stride_advance()']]],
+  ['subview',['subview',['../classcutlass_1_1TensorView.html#ad4b3faa318699b786f94cf8735a11dbb',1,'cutlass::TensorView']]],
+  ['swap',['swap',['../classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036',1,'cutlass::platform::unique_ptr::swap()'],['../namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678',1,'cutlass::platform::swap()']]],
+  ['swizzle',['swizzle',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8',1,'cutlass::gemm::IdentityBlockSwizzle::swizzle()'],['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b',1,'cutlass::gemm::ColumnMajorBlockSwizzle::swizzle()'],['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d',1,'cutlass::gemm::RowMajorBlockSwizzle::swizzle()']]]
 ];
diff --git a/docs/search/functions_12.js b/docs/search/functions_12.js
index 972cb6527..0f645f1d2 100644
--- a/docs/search/functions_12.js
+++ b/docs/search/functions_12.js
@@ -1,4 +1,16 @@
 var searchData=
 [
-  ['valid',['valid',['../structcutlass_1_1FragmentIterator.html#ab18f8ea676b45831f939715212167a99',1,'cutlass::FragmentIterator::valid()'],['../structcutlass_1_1FragmentConstIterator.html#a01571b2fc566793fd50a10fa82441951',1,'cutlass::FragmentConstIterator::valid()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ac4d2c293f9312b673ea29bf79b2882fd',1,'cutlass::gemm::GemmGlobalIteratorAb::valid()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6594acc213fc8d4289c6c73631f60120',1,'cutlass::gemm::GemmGlobalIteratorCd::valid()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a468f8f503777e4a2b0089ee2bd6c471a',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::valid()'],['../structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770',1,'cutlass::TileIteratorBase::valid()']]]
+  ['tensorarrayref',['TensorArrayRef',['../structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109',1,'cutlass::TensorRefArray::TensorArrayRef()'],['../structcutlass_1_1TensorRefArray.html#aea35239326dcb23c3c6a18e7b3f92091',1,'cutlass::TensorRefArray::TensorArrayRef(Storage **_pointers, Index _strides[kStorageRank - 1])']]],
+  ['tensorref',['TensorRef',['../classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765',1,'cutlass::TensorRef::TensorRef(Storage *ptr=nullptr)'],['../classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135',1,'cutlass::TensorRef::TensorRef(Storage *ptr, Index ldm)'],['../classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c',1,'cutlass::TensorRef::TensorRef(Storage *ptr, StrideVector const &amp;stride)'],['../classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0',1,'cutlass::TensorRef::TensorRef(Storage *ptr, StorageCoord const &amp;stride)'],['../classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1',1,'cutlass::TensorRef::TensorRef(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa091e497277d0ba8a98c4ebf73c0cdba',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef(Storage *ptr=nullptr)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a3464537a35ef7fbfc9349e5ce2233f1c',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef(Storage *ptr, StrideVector const &amp;stride)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeacb444d31783eafe27a9e8d8cab98f8',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef(Storage *ptr, StorageCoord const &amp;stride)'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af815dd66739801b10d43acc097e23636',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)']]],
+  ['tensorrefbatchstrided',['TensorRefBatchStrided',['../structcutlass_1_1TensorRefBatchStrided.html#aa5d7e9a4589d7dacc5d69ca3c70ecc2b',1,'cutlass::TensorRefBatchStrided::TensorRefBatchStrided()'],['../structcutlass_1_1TensorRefBatchStrided.html#abc2ddccdb742f95438b214e0a3a14620',1,'cutlass::TensorRefBatchStrided::TensorRefBatchStrided(TensorRef const &amp;ref, LongIndex _tensor_stride=0)']]],
+  ['tensorview',['TensorView',['../classcutlass_1_1TensorView.html#a36d48227f65ad482a7bded99d6a3d0c1',1,'cutlass::TensorView::TensorView()'],['../classcutlass_1_1TensorView.html#aad06edac0f43c358c5644dffb5fe9ad7',1,'cutlass::TensorView::TensorView(Base const &amp;_ref, TensorCoord const &amp;_size)'],['../classcutlass_1_1TensorView.html#a73f049694ca1ea4825b5a651852827f5',1,'cutlass::TensorView::TensorView(Storage *ptr, StrideVector const &amp;stride, TensorCoord const &amp;size)'],['../classcutlass_1_1TensorView.html#af64d4195fd6ba2cba53179e1ae678737',1,'cutlass::TensorView::TensorView(Storage *ptr, StorageCoord const &amp;stride, TensorCoord const &amp;size)']]],
+  ['threadmultiplyadd',['ThreadMultiplyAdd',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a0ab850304c3c6e73bcba321426ba93f9',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a32b234c873ffe44090a12e12d871024c',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aad8a642f46c88e407a1150ee1d42b8dd',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadMultiplyAdd()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac087f0b397599221b74d220fcb1c7121',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadMultiplyAdd()']]],
+  ['tilecoord',['TileCoord',['../structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95',1,'cutlass::TileCoord::TileCoord()'],['../structcutlass_1_1TileCoord.html#ac760795433c0f0ccc5c44fb58626f51d',1,'cutlass::TileCoord::TileCoord(Coord&lt; 3, Index &gt; const &amp;coord)'],['../structcutlass_1_1TileCoord.html#a752dcc11f1a018de692e5846a80fe185',1,'cutlass::TileCoord::TileCoord(Coord&lt; 4, Index &gt; const &amp;coord)'],['../structcutlass_1_1TileCoord.html#a2ff6ac0ad18cff304ee7f79597fdc274',1,'cutlass::TileCoord::TileCoord(Index coord[4])'],['../structcutlass_1_1TileCoord.html#a28ee00699941f879cfa92327c038fca6',1,'cutlass::TileCoord::TileCoord(Index d, Index h, Index w, Index c)']]],
+  ['tileloaditerator',['TileLoadIterator',['../structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e',1,'cutlass::TileLoadIterator::TileLoadIterator()'],['../structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322',1,'cutlass::TileLoadIterator::TileLoadIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30',1,'cutlass::TileLoadIterator::TileLoadIterator(Params const &amp;, Scalar const *ptr, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())']]],
+  ['tileloadstream',['TileLoadStream',['../structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3',1,'cutlass::TileLoadStream::TileLoadStream(Params const &amp;_params, TensorRef const &amp;_ref)'],['../structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7',1,'cutlass::TileLoadStream::TileLoadStream(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))']]],
+  ['tilestoreiterator',['TileStoreIterator',['../structcutlass_1_1TileStoreIterator.html#a9f4501c6e8ba0f4511919c1b63c14e69',1,'cutlass::TileStoreIterator::TileStoreIterator()'],['../structcutlass_1_1TileStoreIterator.html#aa563bb10f8e58d97e81959556923e210',1,'cutlass::TileStoreIterator::TileStoreIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1TileStoreIterator.html#a2b58a21331cf3255f5d3938a39babf20',1,'cutlass::TileStoreIterator::TileStoreIterator(Params const &amp;, Scalar *ptr, ThreadOffset thread_offset_func=ThreadOffset())']]],
+  ['tilestorestream',['TileStoreStream',['../structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b',1,'cutlass::TileStoreStream::TileStoreStream(Params const &amp;_params, TensorRef const &amp;_ref)'],['../structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084',1,'cutlass::TileStoreStream::TileStoreStream(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))']]],
+  ['transform',['transform',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a4dd95354137d3cb52752ecdd346a5685',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#aa9fe67c947bf461ba3e3ca48daa34815',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1Copy.html#ab356f0f473aa3fd8df8fb8ddd8e0e9f3',1,'cutlass::Copy::transform(Fragment_ const &amp;src, Fragment_ &amp;dst)'],['../structcutlass_1_1Copy.html#a171f9a44c05b6fb432b0339979de4eb2',1,'cutlass::Copy::transform(InputFragment_ const &amp;src, int offset, Fragment_ &amp;dst)'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ad467ce744bf9d478900fb2661d7a1c26',1,'cutlass::gemm::HgemmSwizzle::transform()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a91ad48362b99a5f96ac1e92e95104f7b',1,'cutlass::gemm::IgemmFloatToInt8Converter::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a819fd33db88a68521108bab2641d73fd',1,'cutlass::gemm::IgemmFloatToInt8Converter::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#aca8a61e8eb1ab33b9c61e2e7d342379d',1,'cutlass::gemm::IgemmInt8ToFloatConverter::transform(InputFragment const &amp;src, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a89e078dbf376da872c3993ccbaf744d3',1,'cutlass::gemm::IgemmInt8ToFloatConverter::transform(Fragment_ const &amp;src, int offset, OutputFragment &amp;dst)'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a084917a512c7a411b76a69f86b906811',1,'cutlass::gemm::IgemmSwizzle::transform()'],['../structcutlass_1_1ZipConvert.html#a7e6398ad8ecd8757744a42f3ab8ef955',1,'cutlass::ZipConvert::transform()']]],
+  ['trivialiterator',['TrivialIterator',['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a6cb3664b5cba4280b7055a65ddad7850',1,'cutlass::PredicateVector::TrivialIterator::TrivialIterator()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ada8cd3ac6db568bb9bf268ba2c3a3e14',1,'cutlass::PredicateVector::TrivialIterator::TrivialIterator(Iterator const &amp;it)'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a3adf0440f9a0143a61b43d39c3f03721',1,'cutlass::PredicateVector::TrivialIterator::TrivialIterator(PredicateVector const &amp;_vec)']]],
+  ['trivialpredicatetileadapter',['TrivialPredicateTileAdapter',['../structcutlass_1_1TrivialPredicateTileAdapter.html#a7259853a129a7e319b972d3b41dd59d7',1,'cutlass::TrivialPredicateTileAdapter']]]
 ];
diff --git a/docs/search/functions_13.js b/docs/search/functions_13.js
index f2593b4ad..a0eb54d4d 100644
--- a/docs/search/functions_13.js
+++ b/docs/search/functions_13.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['wmmagemmglobaliteratorcd',['WmmaGemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a505f124fa3f47c6d57b7275e81be6dd3',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::WmmaGemmGlobalIteratorCd()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::WmmaGemmGlobalIteratorCd(Params const &amp;params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int const pointer_offset=0, int const pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())']]]
+  ['unique_5fptr',['unique_ptr',['../classcutlass_1_1platform_1_1unique__ptr.html#aa8a370bc7e4c2d99eb85e7fea27b3179',1,'cutlass::platform::unique_ptr::unique_ptr()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a14c8bf5a5deefe4a6602ccd5c5af364c',1,'cutlass::platform::unique_ptr::unique_ptr(pointer p)']]]
 ];
diff --git a/docs/search/functions_14.js b/docs/search/functions_14.js
index 10f55890b..fcec0184c 100644
--- a/docs/search/functions_14.js
+++ b/docs/search/functions_14.js
@@ -1,4 +1,5 @@
 var searchData=
 [
-  ['_7eunique_5fptr',['~unique_ptr',['../classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf',1,'cutlass::platform::unique_ptr']]]
+  ['valid',['valid',['../structcutlass_1_1FragmentIterator.html#a8608dd815ed4906d8c82c41a10df23e2',1,'cutlass::FragmentIterator::valid()'],['../structcutlass_1_1FragmentConstIterator.html#ac4d601998a84a3eac23e3b7a7c8a935b',1,'cutlass::FragmentConstIterator::valid()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0',1,'cutlass::gemm::GemmGlobalIteratorAb::valid()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0',1,'cutlass::gemm::GemmGlobalIteratorCd::valid()'],['../structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973',1,'cutlass::TileIteratorBase::valid()']]],
+  ['vector',['Vector',['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1310cf2e92e260cf55cfda1cb2cb7280',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::Vector()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a50ae62579267952a648d4b6a6be3c663',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::Vector(uint32_t value)'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af166f710ebbfdff8a62453eee454c1d5',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::Vector()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a5feb070268f85bd73c3095eaf2d0e2bb',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::Vector(uint32_t value)'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a48e193a0b636934ea553c6e60ffef563',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::Vector()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a023d6ae1bf06d678f8cb5652eca1bf79',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::Vector(uint32_t value)']]]
 ];
diff --git a/docs/search/functions_15.html b/docs/search/functions_15.html
new file mode 100644
index 000000000..546d13e65
--- /dev/null
+++ b/docs/search/functions_15.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="functions_15.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/functions_15.js b/docs/search/functions_15.js
new file mode 100644
index 000000000..52580278f
--- /dev/null
+++ b/docs/search/functions_15.js
@@ -0,0 +1,5 @@
+var searchData=
+[
+  ['w',['w',['../structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613',1,'cutlass::TileCoord::w() const'],['../structcutlass_1_1TileCoord.html#a8f83026751c83f57c1854c8544e75bd0',1,'cutlass::TileCoord::w()']]],
+  ['wmmagemmglobaliteratorcd',['WmmaGemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd']]]
+];
diff --git a/docs/search/functions_16.html b/docs/search/functions_16.html
new file mode 100644
index 000000000..b3e771acd
--- /dev/null
+++ b/docs/search/functions_16.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="functions_16.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/functions_16.js b/docs/search/functions_16.js
new file mode 100644
index 000000000..f24ea7a91
--- /dev/null
+++ b/docs/search/functions_16.js
@@ -0,0 +1,7 @@
+var searchData=
+[
+  ['zipconvert',['ZipConvert',['../structcutlass_1_1ZipConvert.html#a7aa56d3ea300ebc58493c4d66339fff5',1,'cutlass::ZipConvert::ZipConvert()'],['../structcutlass_1_1ZipConvert.html#a3322c88b418c365423480a481e29df29',1,'cutlass::ZipConvert::ZipConvert(First const &amp;_first, Second const &amp;_second)']]],
+  ['zipfragment',['ZipFragment',['../structcutlass_1_1ZipFragment.html#aeb654423884324b14130a8fa8bc1ab83',1,'cutlass::ZipFragment::ZipFragment()'],['../structcutlass_1_1ZipFragment.html#a520318d060123c5870c4153b99cf0427',1,'cutlass::ZipFragment::ZipFragment(First const &amp;_first, Second const &amp;_second)']]],
+  ['ziptensorref',['ZipTensorRef',['../structcutlass_1_1ZipTensorRef.html#a9b4e616da5b0a71ac2d9bd03b4e07b86',1,'cutlass::ZipTensorRef::ZipTensorRef()'],['../structcutlass_1_1ZipTensorRef.html#a6905b853de0521e2f2fedac407a920e1',1,'cutlass::ZipTensorRef::ZipTensorRef(First const &amp;_first, Second const &amp;_second)']]],
+  ['ziptileiterator',['ZipTileIterator',['../classcutlass_1_1ZipTileIterator.html#a09eab0c5218fc122848b623462c18149',1,'cutlass::ZipTileIterator::ZipTileIterator()'],['../classcutlass_1_1ZipTileIterator.html#a45a8ba275f8d4f71deb102ad46712b3e',1,'cutlass::ZipTileIterator::ZipTileIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))'],['../classcutlass_1_1ZipTileIterator.html#a31553842afd1cfd5a18a2fd6c39e17b5',1,'cutlass::ZipTileIterator::ZipTileIterator(First const &amp;_first, Second const &amp;_second)'],['../classcutlass_1_1ZipTileIterator.html#a808e06560609aa5b7bb693ec79a3aa57',1,'cutlass::ZipTileIterator::ZipTileIterator(TensorRef const &amp;ref)'],['../classcutlass_1_1ZipTileIterator.html#a9d70b24bf38122c0fea49558c6f6b344',1,'cutlass::ZipTileIterator::ZipTileIterator(Params const &amp;_params, TensorRef const &amp;ref)']]]
+];
diff --git a/docs/search/functions_17.html b/docs/search/functions_17.html
new file mode 100644
index 000000000..a7b906875
--- /dev/null
+++ b/docs/search/functions_17.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="functions_17.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/functions_17.js b/docs/search/functions_17.js
new file mode 100644
index 000000000..10f55890b
--- /dev/null
+++ b/docs/search/functions_17.js
@@ -0,0 +1,4 @@
+var searchData=
+[
+  ['_7eunique_5fptr',['~unique_ptr',['../classcutlass_1_1platform_1_1unique__ptr.html#a8902399dac4ab64f08f909f2ad9d4bcf',1,'cutlass::platform::unique_ptr']]]
+];
diff --git a/docs/search/functions_2.js b/docs/search/functions_2.js
index 93a72e5ae..047747158 100644
--- a/docs/search/functions_2.js
+++ b/docs/search/functions_2.js
@@ -1,4 +1,6 @@
 var searchData=
 [
-  ['begin',['begin',['../structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5',1,'cutlass::PredicateVector']]]
+  ['batch',['batch',['../structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26',1,'cutlass::gemm::GemmCoord::batch() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#adaf31768b8239f497c0ec9b40bad1cb5',1,'cutlass::gemm::GemmCoord::batch()']]],
+  ['begin',['begin',['../structcutlass_1_1PredicateVector.html#a649045d8224514a4c28bcaf4b247b4a5',1,'cutlass::PredicateVector::begin()'],['../structcutlass_1_1TensorRefBatchStrided.html#a4f4a2f860cc10688ee27cc9ce1df1015',1,'cutlass::TensorRefBatchStrided::begin()'],['../structcutlass_1_1TensorRefArray.html#a6b0f0d9cef4a2f3f4a8bf6c192a282db',1,'cutlass::TensorRefArray::begin()']]],
+  ['beta',['beta',['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a0938bcb61d2572d5cf6cf2de95d11816',1,'cutlass::gemm::LinearScalingDevicePtr::Params']]]
 ];
diff --git a/docs/search/functions_3.js b/docs/search/functions_3.js
index b9f86bbaa..dae6e6611 100644
--- a/docs/search/functions_3.js
+++ b/docs/search/functions_3.js
@@ -1,19 +1,28 @@
 var searchData=
 [
+  ['c',['c',['../structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c',1,'cutlass::TileCoord::c() const'],['../structcutlass_1_1TileCoord.html#ad8281750f2978c6c1c91982f347a14cd',1,'cutlass::TileCoord::c()']]],
+  ['capacity',['capacity',['../classcutlass_1_1TensorView.html#ad870c366ffe904d3363df1dfb0d5f04c',1,'cutlass::TensorView']]],
   ['check',['check',['../structcutlass_1_1platform_1_1is__base__of__helper.html#a5bf08859497e304ca353699ad6ac332b',1,'cutlass::platform::is_base_of_helper::check(DerivedT *, T)'],['../structcutlass_1_1platform_1_1is__base__of__helper.html#ae8896817cabf297437b3a073e693ffd2',1,'cutlass::platform::is_base_of_helper::check(BaseT *, int)']]],
-  ['clamp',['clamp',['../structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e',1,'cutlass::Coord']]],
-  ['clear',['clear',['../structcutlass_1_1Fragment.html#a29e7408fcde8cdf9de5e3a10eaa46391',1,'cutlass::Fragment::clear()'],['../structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab',1,'cutlass::gemm::ClearAccumulators::clear()']]],
-  ['clearaccumulators',['ClearAccumulators',['../structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef',1,'cutlass::gemm::ClearAccumulators']]],
-  ['commit',['commit',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae',1,'cutlass::gemm::GlobalLoadStreamBase::commit()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a9cc435369c7fc76d0bb6233a8258e257',1,'cutlass::gemm::SharedLoadStream::commit()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a6dc512be014b9d849057e2fd4c0b0485',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::commit()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#ade2d85507dec77591e66276339a1eef5',1,'cutlass::gemm::GemmTraits::SharedLoadStream::commit()']]],
+  ['clamp',['clamp',['../structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba',1,'cutlass::Coord']]],
+  ['clear',['clear',['../structcutlass_1_1Fragment.html#acf28266500b87484530b2395925fca51',1,'cutlass::Fragment::clear()'],['../structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab',1,'cutlass::gemm::ClearAccumulators::clear()'],['../structcutlass_1_1ZipFragment.html#aa978dd7fca15ca20e9f52d15e6f8f9c1',1,'cutlass::ZipFragment::clear()']]],
+  ['clearaccumulators',['ClearAccumulators',['../structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef',1,'cutlass::gemm::ClearAccumulators::ClearAccumulators(SharedStorage &amp;shared_storage)'],['../structcutlass_1_1gemm_1_1ClearAccumulators.html#aef1832b62ae8caef5e6d34cb1d1564e3',1,'cutlass::gemm::ClearAccumulators::ClearAccumulators()']]],
+  ['clz',['clz',['../namespacecutlass.html#a6bc666acc9f0d7278a788975e226e005',1,'cutlass']]],
+  ['column',['column',['../structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9',1,'cutlass::MatrixCoord::column() const'],['../structcutlass_1_1MatrixCoord.html#a093f5e568a81c6464dbf4aef996c32ba',1,'cutlass::MatrixCoord::column()']]],
+  ['columnmajorblockswizzle',['ColumnMajorBlockSwizzle',['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a6d0ee4e76371af26030ab4922e6c915a',1,'cutlass::gemm::ColumnMajorBlockSwizzle']]],
+  ['commit',['commit',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab39c82ac1a8138c4b6d69dab9d48bdbc',1,'cutlass::gemm::GlobalLoadStream::commit()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#aa3aa987bf0fd6303e06f46e2f54e47e4',1,'cutlass::gemm::SharedLoadStream::commit()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6be479189765a1803ceced424561466b',1,'cutlass::gemm::SharedLoadStream::commit(int step)'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6699714c357f2714df011f58c1c48861',1,'cutlass::gemm::GlobalLoadStreamPair::commit()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a93cc2a7eb3215ce5bae343fb117f55c5',1,'cutlass::gemm::SharedStreamPair::commit()'],['../structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627',1,'cutlass::TileLoadStream::commit()'],['../structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579',1,'cutlass::TileStoreStream::commit()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a165a0d486f53fb2315d4e555c9f59891',1,'cutlass::PredicatedTileStoreStream::commit()']]],
+  ['complex',['complex',['../classcutlass_1_1platform_1_1complex.html#a2e852c886e61a39e884026d6f4c32c1e',1,'cutlass::platform::complex::complex(T r=T(0), T i=T(0))'],['../classcutlass_1_1platform_1_1complex.html#a71ee9d620f72fbcd54f6e3049707eb99',1,'cutlass::platform::complex::complex(cuFloatComplex const &amp;z)'],['../classcutlass_1_1platform_1_1complex.html#af40324ec4d1d35a0ceda676c8de968f8',1,'cutlass::platform::complex::complex(cuDoubleComplex const &amp;z)']]],
+  ['conj',['conj',['../namespacecutlass_1_1platform.html#a7167baf0f7fcf52471c0413f084d98d4',1,'cutlass::platform']]],
   ['const_5fbegin',['const_begin',['../structcutlass_1_1PredicateVector.html#aeb7f9226a4fa49d06500c3c83958dc41',1,'cutlass::PredicateVector']]],
   ['const_5fend',['const_end',['../structcutlass_1_1PredicateVector.html#ab931610bc07ee0e87bb4d9a4d53a2321',1,'cutlass::PredicateVector']]],
-  ['const_5fref',['const_ref',['../classcutlass_1_1TensorView.html#a23564f1d333bb16343ed3a885f894285',1,'cutlass::TensorView']]],
-  ['constiterator',['ConstIterator',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7',1,'cutlass::PredicateVector::ConstIterator::ConstIterator(ConstIterator const &amp;it)'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda',1,'cutlass::PredicateVector::ConstIterator::ConstIterator(PredicateVector const &amp;_vec, int _start=0)']]],
+  ['const_5fref',['const_ref',['../classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47',1,'cutlass::TensorRef::const_ref()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0a48de201c35cbc9d5e3b94fa597a617',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::const_ref()'],['../classcutlass_1_1TensorView.html#a559f7210b445c77a167ab1f41c8d0827',1,'cutlass::TensorView::const_ref()']]],
+  ['constiterator',['ConstIterator',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a1216aab9c567ec0d4232019008ef3ea7',1,'cutlass::PredicateVector::ConstIterator::ConstIterator(ConstIterator const &amp;it)'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a590e4f4533c87162c0b79e8d876a8fda',1,'cutlass::PredicateVector::ConstIterator::ConstIterator(PredicateVector const &amp;_vec, int _start=0)'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed',1,'cutlass::TensorRefBatchStrided::ConstIterator::ConstIterator()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541',1,'cutlass::TensorRefArray::ConstIterator::ConstIterator()']]],
   ['constpredicatetileadapter',['ConstPredicateTileAdapter',['../structcutlass_1_1ConstPredicateTileAdapter.html#a9abd78d5c3e444bfb23d2b1a08be2be1',1,'cutlass::ConstPredicateTileAdapter']]],
-  ['contains',['contains',['../classcutlass_1_1TensorView.html#aa94063d9a9c6e599d3f53e22433274be',1,'cutlass::TensorView']]],
-  ['convert',['Convert',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::Convert()'],['../classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c',1,'cutlass::TensorRef::convert()']]],
-  ['coord',['Coord',['../structcutlass_1_1Coord.html#a9cbfff91f0b0d0a149534c97e3d6e69b',1,'cutlass::Coord::Coord(int value=0)'],['../structcutlass_1_1Coord.html#a53a3d88a884f6cb7fda8aedfe2cec2c5',1,'cutlass::Coord::Coord(int _idx[])']]],
-  ['copy',['Copy',['../structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1',1,'cutlass::Copy::Copy()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e',1,'cutlass::gemm::GlobalLoadStreamBase::copy()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a7f6bf3b8d70bcd74d84519decd9f0d8e',1,'cutlass::gemm::SharedLoadStream::copy(FetchedFragment &amp;fetched)'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a279144e9722055d4b862e3fa25948762',1,'cutlass::gemm::SharedLoadStream::copy(int d, FetchedFragment &amp;fetched)'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ae033f55779b45b4228f40a4d699062bb',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::copy()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#af25495bb0bb35bd64246d3a80fe4806f',1,'cutlass::gemm::GemmTraits::SharedLoadStream::copy()']]],
-  ['count',['count',['../structcutlass_1_1Coord.html#a40429a9154f7a142ad7e9eb35282d196',1,'cutlass::Coord']]],
+  ['consume_5ftile',['consume_tile',['../structcutlass_1_1gemm_1_1Gemm.html#af8bb78ae198af4dccb0241da44428053',1,'cutlass::gemm::Gemm']]],
+  ['contains',['contains',['../classcutlass_1_1TensorView.html#a3f448bcf6e664c244f472e2659215628',1,'cutlass::TensorView']]],
+  ['convert',['Convert',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a593a5a2c48708965e829d242ccb3b99f',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;']]],
+  ['coord',['Coord',['../structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0',1,'cutlass::Coord::Coord(Index value=0)'],['../structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4',1,'cutlass::Coord::Coord(Index _idx[])'],['../structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573',1,'cutlass::Coord::Coord(Coord&lt; kRank &gt; const &amp;coord)']]],
+  ['copy',['Copy',['../structcutlass_1_1Copy.html#ab2c20f886208396a1779c6d29b56c3f1',1,'cutlass::Copy::Copy()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a3784dbb3efe0865ffa946419111c824a',1,'cutlass::gemm::GlobalLoadStream::copy()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a4b919d229e259909efbf994ff2c09339',1,'cutlass::gemm::SharedLoadStream::copy()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a99039d115a539fc99e2235c12ac57eed',1,'cutlass::gemm::SharedLoadStream::copy(int step)'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5c0efc259bb3bd1675f5d395dab71e95',1,'cutlass::gemm::GlobalLoadStreamPair::copy()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#ad46887abb2e3136b635c3ef5be29cf69',1,'cutlass::gemm::SharedStreamPair::copy()'],['../structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23',1,'cutlass::TileLoadStream::copy()'],['../structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009',1,'cutlass::TileStoreStream::copy()'],['../structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978',1,'cutlass::TileStoreStream::copy(Fragment const &amp;frag)'],['../structcutlass_1_1PredicatedTileLoadStream.html#a60a03c95452fe627477933d60815f7cb',1,'cutlass::PredicatedTileLoadStream::copy()'],['../structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350',1,'cutlass::PredicatedTileStoreStream::copy()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a1d33da4593ae68e6301df54b310a70a0',1,'cutlass::PredicatedTileStoreStream::copy(Fragment const &amp;frag)']]],
+  ['cos',['cos',['../namespacecutlass_1_1platform.html#ae0ad2891ed2be526d97bc5665d5c0a92',1,'cutlass::platform']]],
+  ['count',['count',['../structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017',1,'cutlass::Coord']]],
   ['cuda_5fperror_5fimpl',['cuda_perror_impl',['../namespacecutlass.html#a6d3dfeb642a2ce3d5f52243fe48f89cc',1,'cutlass']]]
 ];
diff --git a/docs/search/functions_4.js b/docs/search/functions_4.js
index 7288b4053..c5d6c2247 100644
--- a/docs/search/functions_4.js
+++ b/docs/search/functions_4.js
@@ -1,5 +1,9 @@
 var searchData=
 [
-  ['data',['data',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3af66b82b1a0cc5bf6141f940553e048',1,'cutlass::gemm::GemmGlobalIteratorAb::data()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a0d3c1a58f23957f9850d1b22992a981a',1,'cutlass::gemm::GemmGlobalIteratorCd::data()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6fd4e62eb280a5b8c17eb79141414581',1,'cutlass::gemm::GemmGlobalIteratorCd::data() const'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afe77778a126449e210c0bd6ec2dc6709',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::data()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a90e9886534ecbbce69f57b4030d0903f',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::data() const'],['../classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7',1,'cutlass::TensorRef::data()'],['../classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8',1,'cutlass::TensorView::data()'],['../structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4',1,'cutlass::TileLoadIterator::data()'],['../structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0',1,'cutlass::TileStoreIterator::data()']]],
-  ['dot',['dot',['../structcutlass_1_1Coord.html#ad4b3704d14057c043f972827671115cf',1,'cutlass::Coord::dot(Coord const &amp;b, T sum) const'],['../structcutlass_1_1Coord.html#ae023c0c664c22a978e9b9ce5e063aae4',1,'cutlass::Coord::dot(Coord const &amp;b) const']]]
+  ['d',['d',['../structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b',1,'cutlass::TileCoord::d() const'],['../structcutlass_1_1TileCoord.html#aec4ffcdc8fbf57a8b649fff38af55007',1,'cutlass::TileCoord::d()']]],
+  ['data',['data',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a0e05007f939b27e6a17dce5c2a49e3e0',1,'cutlass::gemm::GemmEpilogueTraits::SharedStorage::data()'],['../classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7',1,'cutlass::TensorRef::data()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a67b25cc51ce867b073feead7b94e6aa3',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::data()'],['../structcutlass_1_1TileAllocation.html#a69c43b27939e9ecebd23edb18ed3a9dc',1,'cutlass::TileAllocation::data()'],['../structcutlass_1_1TileAllocation.html#acc3f2c29fe21316091a1405613083000',1,'cutlass::TileAllocation::data() const']]],
+  ['debugtypefunc',['DebugTypeFunc',['../cutlass_8h.html#ab7e23b523490567225b20e2c72649f20',1,'cutlass.h']]],
+  ['decrement',['decrement',['../classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6',1,'cutlass::ZipTileIterator']]],
+  ['dhw',['dhw',['../structcutlass_1_1TileCoord.html#abe65d1a0ff3798b662376032d51e9713',1,'cutlass::TileCoord']]],
+  ['dot',['dot',['../structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184',1,'cutlass::Coord::dot(Coord const &amp;b, T sum) const'],['../structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d',1,'cutlass::Coord::dot(Coord const &amp;b) const']]]
 ];
diff --git a/docs/search/functions_5.js b/docs/search/functions_5.js
index 64953e70f..7e85d21f2 100644
--- a/docs/search/functions_5.js
+++ b/docs/search/functions_5.js
@@ -1,7 +1,8 @@
 var searchData=
 [
   ['end',['end',['../structcutlass_1_1PredicateVector.html#ad9493fc80fdc33330cc15641779cc275',1,'cutlass::PredicateVector']]],
-  ['epilogue',['epilogue',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c',1,'cutlass::gemm::GemmEpilogue']]],
-  ['epilogue_5fwith_5for_5fwithout_5fbeta',['epilogue_with_or_without_beta',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4',1,'cutlass::gemm::GemmEpilogue']]],
-  ['evaluate',['evaluate',['../structcutlass_1_1gemm_1_1LinearScaling.html#a2e0d140aed388d2457dfb24d28fcd08a',1,'cutlass::gemm::LinearScaling::evaluate(Fragment_ const &amp;accum, Fragment_ &amp;output)'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a47a53e5b67b2207fb3ba38a8b9cef448',1,'cutlass::gemm::LinearScaling::evaluate(Fragment_ const &amp;accum, Fragment_ const &amp;old, Fragment_ &amp;output)']]]
+  ['epilogue',['epilogue',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3',1,'cutlass::gemm::GemmEpilogue']]],
+  ['epilogue_5fwith_5for_5fwithout_5fbeta',['epilogue_with_or_without_beta',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32',1,'cutlass::gemm::GemmEpilogue']]],
+  ['evaluate',['evaluate',['../structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb',1,'cutlass::gemm::LinearScaling::evaluate(FragmentA_ const &amp;accum, FragmentB_ &amp;output)'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02',1,'cutlass::gemm::LinearScaling::evaluate(ScalarAccum const *accum, ScalarOutput *output)'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1',1,'cutlass::gemm::LinearScaling::evaluate(FragmentA_ const &amp;accum, FragmentB_ const &amp;old, FragmentB_ &amp;output)'],['../structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947',1,'cutlass::gemm::LinearScaling::evaluate(ScalarAccum const *accum, ScalarOutput const *old, ScalarOutput *output)']]],
+  ['exp',['exp',['../namespacecutlass_1_1platform.html#a1a6ab5742404272f76faeaf22f3ec11b',1,'cutlass::platform']]]
 ];
diff --git a/docs/search/functions_6.js b/docs/search/functions_6.js
index 3d4faf676..86e2fbe68 100644
--- a/docs/search/functions_6.js
+++ b/docs/search/functions_6.js
@@ -1,9 +1,11 @@
 var searchData=
 [
   ['fill',['fill',['../structcutlass_1_1PredicateVector.html#a236bd1a822479750a809452fd58dd917',1,'cutlass::PredicateVector']]],
-  ['fragment_5fa',['fragment_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a4a8c64d85aa012e3689dd024c486924b',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['fragment_5fb',['fragment_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#aa28f34fb0c4bf739246d92c2fef80e0b',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['fragmentconstiterator',['FragmentConstIterator',['../structcutlass_1_1FragmentConstIterator.html#ac4b6f351e6e72bed37e425f02a10c81e',1,'cutlass::FragmentConstIterator::FragmentConstIterator(OtherFragment_ &amp;fragment, int offset=0)'],['../structcutlass_1_1FragmentConstIterator.html#a3a8fd8f13c157ed13dc93fd78036c59e',1,'cutlass::FragmentConstIterator::FragmentConstIterator(FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)']]],
-  ['fragmentiterator',['FragmentIterator',['../structcutlass_1_1FragmentIterator.html#ae1825fe3e138e2aa62d27dab2b5227b4',1,'cutlass::FragmentIterator']]],
-  ['fragmentmultiplyadd',['FragmentMultiplyAdd',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af19e14a22aefd1124f7d31beec6f8c42',1,'cutlass::gemm::FragmentMultiplyAdd::FragmentMultiplyAdd()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a21f0965f6178917c7f5c6d79ed048059',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::FragmentMultiplyAdd()']]]
+  ['find_5flog2',['find_log2',['../namespacecutlass.html#a58a119c3f7b33d97c43ae8c114004d9e',1,'cutlass']]],
+  ['fragment',['fragment',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#ad5cb076de46e841a165bd43924dab463',1,'cutlass::gemm::SharedLoadStream::fragment(int step=0)'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a30e815fcee63b5a99b2797464b6a3192',1,'cutlass::gemm::SharedLoadStream::fragment(int step=0) const'],['../structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be',1,'cutlass::TileLoadStream::fragment()'],['../structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5',1,'cutlass::TileStoreStream::fragment()']]],
+  ['fragment_5fa',['fragment_a',['../structcutlass_1_1gemm_1_1SharedStreamPair.html#af29f052dc0145abe3144dea1472d241a',1,'cutlass::gemm::SharedStreamPair']]],
+  ['fragment_5fb',['fragment_b',['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a375e96bc2e35447682bd1dea3c4d87ad',1,'cutlass::gemm::SharedStreamPair']]],
+  ['fragmentconstiterator',['FragmentConstIterator',['../structcutlass_1_1FragmentConstIterator.html#ad3e99cd7f56d4aec0a28cfcbde66f5af',1,'cutlass::FragmentConstIterator::FragmentConstIterator(OtherFragment_ &amp;fragment, int offset=0)'],['../structcutlass_1_1FragmentConstIterator.html#a18f926c9c877e15a279f16637bd24e83',1,'cutlass::FragmentConstIterator::FragmentConstIterator(FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)']]],
+  ['fragmentiterator',['FragmentIterator',['../structcutlass_1_1FragmentIterator.html#a638e4e1d84b4ae84e758288c7f37548b',1,'cutlass::FragmentIterator']]],
+  ['fragmentmultiplyadd',['FragmentMultiplyAdd',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ae1fbd0fd103deda51208102f15f896ed',1,'cutlass::gemm::FragmentMultiplyAdd::FragmentMultiplyAdd()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ad35b57b3f0cf5a467a1b0e48cffc3061',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::FragmentMultiplyAdd()']]]
 ];
diff --git a/docs/search/functions_7.js b/docs/search/functions_7.js
index 3ce9c5d82..ba5f46cde 100644
--- a/docs/search/functions_7.js
+++ b/docs/search/functions_7.js
@@ -2,16 +2,23 @@ var searchData=
 [
   ['gcd',['gcd',['../namespacecutlass.html#a38481ebfe13bc199aa621ceecfa016b8',1,'cutlass']]],
   ['gemm',['Gemm',['../structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd',1,'cutlass::gemm::Gemm']]],
-  ['gemm_5fkernel',['gemm_kernel',['../namespacecutlass_1_1gemm.html#ad9577c9086b0f7fd1202d7f8109e4439',1,'cutlass::gemm']]],
-  ['gemmepilogue',['GemmEpilogue',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925',1,'cutlass::gemm::GemmEpilogue']]],
-  ['gemmglobaliteratorab',['GemmGlobalIteratorAb',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a34cb153d311377388e7819296a84d07e',1,'cutlass::gemm::GemmGlobalIteratorAb']]],
-  ['gemmglobaliteratorcd',['GemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6dae81995ab94c0b7f28eeeeb84a6c8d',1,'cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a64f1df43acb37a1901f0b55becaa9557',1,'cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd(Params const &amp;params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())']]],
-  ['get',['get',['../classcutlass_1_1PredicateVector_1_1Iterator.html#af035589126434bd2dbef4000cd864b8b',1,'cutlass::PredicateVector::Iterator::get()'],['../structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38',1,'cutlass::ComputeOffsetFromShape::get()'],['../structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html#a5198e838e3892245fe7b10884555ec93',1,'cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;::get()'],['../structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html#a11bf40abc57580db5ce4b0fd4c3e55ff',1,'cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;::get()'],['../structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409',1,'cutlass::ComputeOffsetFromStrides::get()'],['../structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html#acdbb9c7cdf9fc054656614f72396434e',1,'cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;::get()'],['../structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html#a512a9d46f6bea9d85641d7263bcfee36',1,'cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad',1,'cutlass::ComputeThreadOffsetFromStrides::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html#a5d446b2663c01362361e09435a726996',1,'cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html#a6e621f5fae2ba29277fde46be1cede24',1,'cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;::get()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a2e7c14b8a118f81c1df46ea5045e297b',1,'cutlass::platform::unique_ptr::get()']]],
-  ['get_5fcoord_5fdhw',['get_Coord_dhw',['../namespacecutlass.html#a4680709eeeb679ef0219938f85f7394e',1,'cutlass']]],
-  ['get_5fcoord_5fhw',['get_Coord_hw',['../namespacecutlass.html#a7d2ab683e29b47d245e183ad5aeb962e',1,'cutlass::get_Coord_hw(Coord&lt; 3 &gt; const &amp;coord)'],['../namespacecutlass.html#a082e7a2e4acc2879468243f5732ccf0b',1,'cutlass::get_Coord_hw(Coord&lt; 4 &gt; const &amp;coord)']]],
-  ['get_5fcoord_5fhwc',['get_Coord_hwc',['../namespacecutlass.html#a71f3e2a12b9e98be1fba082610fa9d4f',1,'cutlass']]],
+  ['gemm_5fkernel_5fnolb',['gemm_kernel_nolb',['../namespacecutlass_1_1gemm.html#ae23b870e60261e2322f3c6edb3d2bcb9',1,'cutlass::gemm']]],
+  ['gemmcoord',['GemmCoord',['../structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01',1,'cutlass::gemm::GemmCoord::GemmCoord()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a03e6bfa95156962be51e190d381c8b5e',1,'cutlass::gemm::GemmCoord::GemmCoord(Coord&lt; 3, Index &gt; const &amp;coord, Index _batch=0)'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a65d1ca12c0f27984920cf1700322a746',1,'cutlass::gemm::GemmCoord::GemmCoord(Coord&lt; 4, Index &gt; const &amp;coord)'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a17da9936dbad99f2402c42b1bd6ea5ea',1,'cutlass::gemm::GemmCoord::GemmCoord(Index coord[4])'],['../structcutlass_1_1gemm_1_1GemmCoord.html#ac3b1cbdf86bd36d6b4b5e295ef846dfe',1,'cutlass::gemm::GemmCoord::GemmCoord(Index k, Index n, Index m, Index batch=0)']]],
+  ['gemmdesc',['GemmDesc',['../structcutlass_1_1gemm_1_1GemmDesc.html#ae2708b731cbb99d3e638382ecf599425',1,'cutlass::gemm::GemmDesc::GemmDesc()'],['../structcutlass_1_1gemm_1_1GemmDesc.html#a948af4a974f1aa74d3b6da9cd3e185de',1,'cutlass::gemm::GemmDesc::GemmDesc(Coord&lt; 3 &gt; _problem_size, SType _alpha, TensorRefA const &amp;_A, TensorRefB const &amp;_B, SType _beta, TensorRefC const &amp;_C, TensorRefD const &amp;_D)'],['../structcutlass_1_1gemm_1_1GemmDesc.html#a7292ac0196f22525b13f223a02271bc3',1,'cutlass::gemm::GemmDesc::GemmDesc(GemmCoord _problem_size, SType _alpha, TensorRefA const &amp;_A, TensorRefB const &amp;_B, SType _beta, TensorRefC const &amp;_C, TensorRefD const &amp;_D)'],['../structcutlass_1_1gemm_1_1GemmDesc.html#af96cd9c8f2454ea118dfa7358dd24824',1,'cutlass::gemm::GemmDesc::GemmDesc(GemmCoord _problem_size, SType _alpha, TensorRefA const &amp;_A, long long _batch_stride_A, TensorRefB const &amp;_B, long long _batch_stride_B, SType _beta, TensorRefC const &amp;_C, long long _batch_stride_C, TensorRefD const &amp;_D, long long _batch_stride_D)']]],
+  ['gemmepilogue',['GemmEpilogue',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8',1,'cutlass::gemm::GemmEpilogue']]],
+  ['gemmglobaliteratorab',['GemmGlobalIteratorAb',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5',1,'cutlass::gemm::GemmGlobalIteratorAb']]],
+  ['gemmglobaliteratorcd',['GemmGlobalIteratorCd',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff',1,'cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block_offset, ThreadOffset thread_offset_func=ThreadOffset())'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6',1,'cutlass::gemm::GemmGlobalIteratorCd::GemmGlobalIteratorCd(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())']]],
+  ['get',['get',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a1661baed19b4aa4eea725a6f6e6b26a3',1,'cutlass::detail::ScalarOrPointer::get()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#af035589126434bd2dbef4000cd864b8b',1,'cutlass::PredicateVector::Iterator::get()'],['../structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b',1,'cutlass::ComputeOffsetFromShape::get()'],['../structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e',1,'cutlass::ComputeOffsetFromStrides::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad',1,'cutlass::ComputeThreadOffsetFromStrides::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html#a5d446b2663c01362361e09435a726996',1,'cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, T_c_ &gt;, Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;::get()'],['../structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html#a6e621f5fae2ba29277fde46be1cede24',1,'cutlass::ComputeThreadOffsetFromStrides&lt; Shape&lt; 1, T_h_, T_w_, 1 &gt;, Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;::get()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a2e7c14b8a118f81c1df46ea5045e297b',1,'cutlass::platform::unique_ptr::get()']]],
+  ['get_5fbatch_5fid',['get_batch_id',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a8f84a2b830caecff3edd052dc24635e6',1,'cutlass::gemm::IdentityBlockSwizzle::get_batch_id()'],['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#abb21a72e2cef3217f446f70758c59c1e',1,'cutlass::gemm::ColumnMajorBlockSwizzle::get_batch_id()'],['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a9be74716c0e3dc6a7f4cdd64cbb16211',1,'cutlass::gemm::RowMajorBlockSwizzle::get_batch_id()']]],
   ['get_5fdeleter',['get_deleter',['../classcutlass_1_1platform_1_1unique__ptr.html#a5b8d8ecafb4da336acd50e40cd42b6e0',1,'cutlass::platform::unique_ptr::get_deleter() noexcept'],['../classcutlass_1_1platform_1_1unique__ptr.html#aa427ab4ea4f2336ac6db28d53a4c11ac',1,'cutlass::platform::unique_ptr::get_deleter() const noexcept']]],
-  ['globalloadstream',['GlobalLoadStream',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a4dd11a75375b6b9d7b8dcbd4d402d8d6',1,'cutlass::gemm::GlobalLoadStream::GlobalLoadStream()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#ab2961b4db0694cf128d55d38a98db575',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::GlobalLoadStream()']]],
-  ['globalloadstreambase',['GlobalLoadStreamBase',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278',1,'cutlass::gemm::GlobalLoadStreamBase']]],
-  ['good',['good',['../classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780',1,'cutlass::TensorRef::good()'],['../classcutlass_1_1TensorView.html#a837881bc82704491accf54aad2b9def9',1,'cutlass::TensorView::good()']]]
+  ['get_5fgrid_5flayout',['get_grid_layout',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#afc20f302a5cc5b736cfc1c91dfcaa57c',1,'cutlass::gemm::IdentityBlockSwizzle::get_grid_layout()'],['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a927ce3eed4cd22554f9e6fe20a1ccc6e',1,'cutlass::gemm::ColumnMajorBlockSwizzle::get_grid_layout()'],['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#aa9fc825e19404ff527cb3d2dcc55ae1c',1,'cutlass::gemm::RowMajorBlockSwizzle::get_grid_layout()']]],
+  ['get_5fpointer_5foffset',['get_pointer_offset',['../structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c',1,'cutlass::TensorRefBatchStrided']]],
+  ['get_5fptr',['get_ptr',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a6b066568947df37094e4125b0347faf1',1,'cutlass::detail::ScalarOrPointer']]],
+  ['get_5fscalar',['get_scalar',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a81bd7b4f50b8d7c5effe5291ad920380',1,'cutlass::detail::ScalarOrPointer']]],
+  ['get_5fthreadblock_5foffset',['get_threadblock_offset',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a386e5cf702b0dcc3d57f9fdb4ab5d236',1,'cutlass::gemm::IdentityBlockSwizzle::get_threadblock_offset()'],['../structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a380fb7f905548c52933ea411166424b4',1,'cutlass::gemm::ColumnMajorBlockSwizzle::get_threadblock_offset()'],['../structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#af7c1b4e0afb08e893cd14a169a0b47cd',1,'cutlass::gemm::RowMajorBlockSwizzle::get_threadblock_offset()']]],
+  ['getlinearidx',['getLinearIdx',['../namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e',1,'cutlass::gemm']]],
+  ['getlinearidx_3c_20swizzledirection_3a_3aboustrophedon_20_3e',['getLinearIdx&lt; swizzleDirection::Boustrophedon &gt;',['../namespacecutlass_1_1gemm.html#a37c566ad59d61647374f215c3d33f088',1,'cutlass::gemm']]],
+  ['globalloadstream',['GlobalLoadStream',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#aec86bdf5d7d4ad1f7b6ebebcf2da8395',1,'cutlass::gemm::GlobalLoadStream']]],
+  ['globalloadstreampair',['GlobalLoadStreamPair',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab97442e24a1d6d64727b6320ab901ad1',1,'cutlass::gemm::GlobalLoadStreamPair']]],
+  ['good',['good',['../classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8',1,'cutlass::TensorRef::good()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::good()']]]
 ];
diff --git a/docs/search/functions_8.js b/docs/search/functions_8.js
index 9418317ca..9b1cff368 100644
--- a/docs/search/functions_8.js
+++ b/docs/search/functions_8.js
@@ -1,4 +1,7 @@
 var searchData=
 [
-  ['hgemmswizzle',['HgemmSwizzle',['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ac3c52e0fee9b37a3dfc39ca168a63d36',1,'cutlass::gemm::HgemmSwizzle']]]
+  ['h',['h',['../structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3',1,'cutlass::TileCoord::h() const'],['../structcutlass_1_1TileCoord.html#a1d91ffa0a63ad03431ff79185526f92f',1,'cutlass::TileCoord::h()']]],
+  ['hgemmswizzle',['HgemmSwizzle',['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ac3c52e0fee9b37a3dfc39ca168a63d36',1,'cutlass::gemm::HgemmSwizzle']]],
+  ['hw',['hw',['../structcutlass_1_1TileCoord.html#a0927c4ba212d00f3687034afe6bb8daf',1,'cutlass::TileCoord']]],
+  ['hwc',['hwc',['../structcutlass_1_1TileCoord.html#a11bb7593ce7bba2dcedd199322a8b42b',1,'cutlass::TileCoord']]]
 ];
diff --git a/docs/search/functions_9.js b/docs/search/functions_9.js
index 04276e19e..d4b69c9e2 100644
--- a/docs/search/functions_9.js
+++ b/docs/search/functions_9.js
@@ -1,22 +1,25 @@
 var searchData=
 [
-  ['identityblockswizzle',['IdentityBlockSwizzle',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#abfde9b316173b1c0b8622cf22ffb6d68',1,'cutlass::gemm::IdentityBlockSwizzle']]],
-  ['igemmepilogue',['IgemmEpilogue',['../structcutlass_1_1gemm_1_1IgemmEpilogue.html#ab7a51121d24250d6441ee538e6521dc2',1,'cutlass::gemm::IgemmEpilogue::IgemmEpilogue()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a49ac00bed1532707aacd3ff108c84623',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::IgemmEpilogue()']]],
+  ['identityblockswizzle',['IdentityBlockSwizzle',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a046a5dfd01164df2abd514e9a52987c3',1,'cutlass::gemm::IdentityBlockSwizzle']]],
+  ['igemmepilogue',['IgemmEpilogue',['../structcutlass_1_1gemm_1_1IgemmEpilogue.html#a599a50becefed561d063c1b834188aca',1,'cutlass::gemm::IgemmEpilogue::IgemmEpilogue()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a0a1be1aab827127161406871ca75cbe0',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::IgemmEpilogue()']]],
   ['igemmfloattoint8converter',['IgemmFloatToInt8Converter',['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#ac65f020e93584b1bd3cdb849ff625026',1,'cutlass::gemm::IgemmFloatToInt8Converter']]],
+  ['igemmglobaliteratorab',['IgemmGlobalIteratorAb',['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a489fe448cd7f7e1f3805d33504f9d336',1,'cutlass::gemm::IgemmGlobalIteratorAb']]],
   ['igemmint8tofloatconverter',['IgemmInt8ToFloatConverter',['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a88a55a494d3a30d50477d50bf6a8804d',1,'cutlass::gemm::IgemmInt8ToFloatConverter']]],
   ['igemmswizzle',['IgemmSwizzle',['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac041d287c966cf568599d7e462e81d5a',1,'cutlass::gemm::IgemmSwizzle']]],
-  ['inc_5fadvance',['inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a9dea455aa86bb59517b4a4d0309e424b',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_advance()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab4b8150f19c9f8649d75c69ec0a76e1a',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_advance()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a174ae7d8aa0664eaf1d6f63c5606baa0',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_advance()'],['../structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37',1,'cutlass::TileLoadIterator::inc_advance()'],['../structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75',1,'cutlass::TileStoreIterator::inc_advance()']]],
-  ['inc_5fc',['inc_c',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a12ead84ea9634e963d10c6df7b7792c9',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_c()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a44287250bf5631a490b514859fd101d1',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_c()']]],
-  ['inc_5fd',['inc_d',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1e42503e5a54cdc01308e9030aebdd35',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_d()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad26ab8d8010c9a1d7f3b91f60940b460',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_d()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab1ebbe54e4315ac07daf260a88f41d04',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_d()'],['../structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5',1,'cutlass::TileLoadIterator::inc_d()'],['../structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3',1,'cutlass::TileStoreIterator::inc_d()']]],
-  ['inc_5fh',['inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aa24336597f4a3316d94df6ab0c20f714',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ae07fa10a53d44471a04275145201299e',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_h()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa9a733f35e9be67663c9c8f80b0034d4',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_h()'],['../structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface',1,'cutlass::TileLoadIterator::inc_h()'],['../structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1',1,'cutlass::TileStoreIterator::inc_h()']]],
-  ['inc_5fstage',['inc_stage',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f',1,'cutlass::gemm::SharedLoadStream::inc_stage()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8851150a49e4a9c135279c8c9dfdc592',1,'cutlass::gemm::GemmTraits::SharedLoadStream::inc_stage()'],['../structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64',1,'cutlass::TileLoadIterator::inc_stage()'],['../structcutlass_1_1TileStoreIterator.html#a187e0852ec4862f6d3cb6249bedc3bb3',1,'cutlass::TileStoreIterator::inc_stage()']]],
-  ['inc_5fw',['inc_w',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a622a4dd27162854ec96efea93cdd4380',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_w()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aec2d692967d9be5d42673dfde21f5427',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_w()'],['../structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073',1,'cutlass::TileLoadIterator::inc_w()'],['../structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1',1,'cutlass::TileStoreIterator::inc_w()']]],
-  ['initialize',['initialize',['../structcutlass_1_1gemm_1_1Gemm_1_1Params.html#ac00c9d78a187d9c7d53399f971c0e129',1,'cutlass::gemm::Gemm::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a3e9d0fd2989fea776b0cab0e0f2813ce',1,'cutlass::gemm::GemmEpilogueTraits::Params::initialize()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a7c7e448384156c801ed362359a1a6a40',1,'cutlass::gemm::GlobalLoadStreamBase::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#a73091e07b6d4c99f6e0319fbf6bd1709',1,'cutlass::gemm::GemmGlobalIteratorAb::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#af5a496f1b6a46ea6a9894512029add6a',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::initialize()'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a',1,'cutlass::gemm::SharedLoadStream::Params::initialize()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf',1,'cutlass::gemm::SharedLoadStream::initialize()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983',1,'cutlass::gemm::GemmTraits::Params::initialize()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d',1,'cutlass::gemm::LinearScaling::Params::initialize()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#ad6b65c5f3ed7cd9e7ffeb684cbf30d04',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::initialize()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55',1,'cutlass::TileIteratorBase::Params::initialize(Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be',1,'cutlass::TileIteratorBase::Params::initialize(Index _stride_d, Index _stride_h, Index _stride_w)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224',1,'cutlass::TileIteratorBase::Params::initialize()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76',1,'cutlass::TileLoadIterator::Params::initialize(SharedStorage const &amp;storage)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr, Index stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr, Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8',1,'cutlass::TileLoadIterator::Params::initialize()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a71f5238a712f7b2f377fb58938ac829b',1,'cutlass::TileStoreIterator::Params::initialize(SharedStorage &amp;storage)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#af0d26a2df2a1a5ba3c3169b736bd5d43',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr, Index stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#ac1cfe92f1543ba445fa10f1859a0db98',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr, Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#af884f720d36aa82e7f972932686ae986',1,'cutlass::TileStoreIterator::Params::initialize()']]],
-  ['initialize_5fpredicates',['initialize_predicates',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff',1,'cutlass::gemm::GemmGlobalIteratorAb::initialize_predicates()'],['../structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7',1,'cutlass::TileIteratorBase::initialize_predicates()'],['../structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5',1,'cutlass::TileLoadIterator::initialize_predicates()'],['../structcutlass_1_1TileStoreIterator.html#af92ba20db048a9ec96976a1673f0f7c2',1,'cutlass::TileStoreIterator::initialize_predicates()']]],
+  ['imag',['imag',['../classcutlass_1_1platform_1_1complex.html#a57360dbcada12083ecb92fba32fae801',1,'cutlass::platform::complex::imag() const'],['../classcutlass_1_1platform_1_1complex.html#a835363f62c6a079496c22074ab428651',1,'cutlass::platform::complex::imag()'],['../namespacecutlass_1_1platform.html#a18bc43cfdc4d066a6c10ad2002196ee6',1,'cutlass::platform::imag(cuFloatComplex const &amp;z)'],['../namespacecutlass_1_1platform.html#af127cab494309510051d6b45914faf33',1,'cutlass::platform::imag(cuFloatComplex &amp;z)'],['../namespacecutlass_1_1platform.html#a1739f880ca8398f808ee57a3f0c3c30b',1,'cutlass::platform::imag(cuDoubleComplex const &amp;z)'],['../namespacecutlass_1_1platform.html#a8f356af3c5828b7d31279a5d075c5bc9',1,'cutlass::platform::imag(cuDoubleComplex &amp;z)'],['../namespacecutlass_1_1platform.html#a714db927a811c86cda26fc12ca830356',1,'cutlass::platform::imag(complex&lt; T &gt; const &amp;z)'],['../namespacecutlass_1_1platform.html#aa35ea4f804f9ed39578b595ba2620c1d',1,'cutlass::platform::imag(complex&lt; T &gt; &amp;z)']]],
+  ['inc_5fadvance',['inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_advance()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_advance()'],['../structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b',1,'cutlass::TileLoadIterator::inc_advance()'],['../structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d',1,'cutlass::TileStoreIterator::inc_advance()']]],
+  ['inc_5fc',['inc_c',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316',1,'cutlass::gemm::GemmGlobalIteratorCd']]],
+  ['inc_5fd',['inc_d',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_d()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_d()'],['../structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674',1,'cutlass::TileLoadIterator::inc_d()'],['../structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975',1,'cutlass::TileStoreIterator::inc_d()']]],
+  ['inc_5fh',['inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_h()'],['../structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51',1,'cutlass::TileLoadIterator::inc_h()'],['../structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d',1,'cutlass::TileStoreIterator::inc_h()']]],
+  ['inc_5fstage',['inc_stage',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f',1,'cutlass::gemm::SharedLoadStream::inc_stage()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#ad4b9b1c1fe4b0c6961842d0eff6d7db7',1,'cutlass::gemm::SharedStreamPair::inc_stage()'],['../structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d',1,'cutlass::TileLoadIterator::inc_stage()'],['../structcutlass_1_1TileStoreIterator.html#ad61206a742c8c5ab5bcd64b76ece9f74',1,'cutlass::TileStoreIterator::inc_stage()']]],
+  ['inc_5fw',['inc_w',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209',1,'cutlass::gemm::GemmGlobalIteratorAb::inc_w()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2',1,'cutlass::gemm::GemmGlobalIteratorCd::inc_w()'],['../structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c',1,'cutlass::TileLoadIterator::inc_w()'],['../structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1',1,'cutlass::TileStoreIterator::inc_w()']]],
+  ['increment',['increment',['../classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808',1,'cutlass::ZipTileIterator']]],
+  ['initialize',['initialize',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a13395bf81eabdc539c935e179c31d7ca',1,'cutlass::gemm::GemmEpilogueTraits::Params::initialize()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a054aee5b4bf288cc1f5945f2521ef835',1,'cutlass::gemm::GlobalLoadStream::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#ad0602cf5d322e98e3e5990c84ae1e3f3',1,'cutlass::gemm::GemmGlobalIteratorAb::Params::initialize()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::initialize()'],['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#adb66103b905b35a1594c6f0bab65758a',1,'cutlass::gemm::SharedLoadStream::Params::initialize()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0',1,'cutlass::gemm::SharedLoadStream::initialize()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983',1,'cutlass::gemm::GemmTraits::Params::initialize(GemmDesc_ const &amp;desc)'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#ac4cd0b74130ffc09e4ccb7b0acba87f8',1,'cutlass::gemm::GemmTraits::Params::initialize(Index m, Index n, Index k, typename Epilogue::Scalar alpha, ScalarA const *d_a, Index lda, ScalarB const *d_b, Index ldb, typename Epilogue::Scalar beta, ScalarC const *d_c, Index ldc, ScalarD *d_d, Index ldd)'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a95314e9a9279c4870f37f68a2357e064',1,'cutlass::gemm::GemmTraits::Params::initialize(Index m, Index n, Index k, typename Epilogue::Scalar alpha, ScalarA const *d_a, Index lda, long long int batch_stride_A, ScalarB const *d_b, Index ldb, long long int batch_stride_B, typename Epilogue::Scalar beta, ScalarC const *d_c, Index ldc, long long int batch_stride_C, ScalarD *d_d, Index ldd, long long int batch_stride_D, Index batch_count)'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ad4089906220d4656ba075fb9afd1012c',1,'cutlass::gemm::LinearScaling::Params::initialize(Scalar _alpha, Scalar _beta)'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d',1,'cutlass::gemm::LinearScaling::Params::initialize(GemmDesc_ const &amp;desc)'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ad1b2291b898091ee1966b73bd1ad56fa',1,'cutlass::gemm::LinearScalingDevicePtr::Params::initialize(Scalar alpha, Scalar beta)'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ab4dbffb32daffb64d2033e3091963507',1,'cutlass::gemm::LinearScalingDevicePtr::Params::initialize(Scalar const *alpha, Scalar const *beta)'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a491496037bf6613e128e667f87fda696',1,'cutlass::gemm::LinearScalingDevicePtr::Params::initialize(GemmDesc_ const &amp;desc)'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a98867f4fc4daf790e309f8365e71cc8f',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::initialize()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60',1,'cutlass::TileIteratorBase::Params::initialize(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd',1,'cutlass::TileIteratorBase::Params::initialize(Coord&lt; 4 &gt; const &amp;stride)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9',1,'cutlass::TileIteratorBase::Params::initialize(long long _stride_d, Index _stride_h, Index _stride_w)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9',1,'cutlass::TileIteratorBase::Params::initialize()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803',1,'cutlass::TileLoadIterator::Params::initialize(TensorRef const &amp;ref)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0',1,'cutlass::TileLoadIterator::Params::initialize(SharedStorage const &amp;storage)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d',1,'cutlass::TileLoadIterator::Params::initialize(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d',1,'cutlass::TileLoadIterator::Params::initialize()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#aca14058b112b7d5105658457341726cb',1,'cutlass::TileStoreIterator::Params::initialize(SharedStorage &amp;storage)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a0d36c05a4a757db5ebfe5f180b174b8c',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a23c9e9d1d2bed7e5d8579df9cc42dda3',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a6a7702de0e88449b3d1864b208adf87a',1,'cutlass::TileStoreIterator::Params::initialize(Scalar *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#ad90642d96a3b5354813fbf4d9b04b83f',1,'cutlass::TileStoreIterator::Params::initialize()']]],
+  ['initialize_5fpredicates',['initialize_predicates',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018',1,'cutlass::gemm::GemmGlobalIteratorAb::initialize_predicates()'],['../structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208',1,'cutlass::TileIteratorBase::initialize_predicates()'],['../structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82',1,'cutlass::TileLoadIterator::initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))'],['../structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49',1,'cutlass::TileLoadIterator::initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)'],['../structcutlass_1_1TileStoreIterator.html#acb6bc889b93d25c9e483a0b7297d7c89',1,'cutlass::TileStoreIterator::initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))'],['../structcutlass_1_1TileStoreIterator.html#a890a7239a89679662aeaea797ba32d32',1,'cutlass::TileStoreIterator::initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)'],['../classcutlass_1_1ZipTileIterator.html#a8f334010614b50d962e4769904d7b76f',1,'cutlass::ZipTileIterator::initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))'],['../classcutlass_1_1ZipTileIterator.html#ab0f93878bbe5aac072450f9bf1dd8b64',1,'cutlass::ZipTileIterator::initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)']]],
+  ['intermediate_5ffragment',['intermediate_fragment',['../structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093',1,'cutlass::TileLoadStream::intermediate_fragment()'],['../structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71',1,'cutlass::TileStoreStream::intermediate_fragment()']]],
+  ['is_5fpointer',['is_pointer',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a95373f3d1b286c61cb204ba6a1282ce0',1,'cutlass::detail::ScalarOrPointer']]],
   ['is_5fzero',['is_zero',['../structcutlass_1_1PredicateVector.html#a1c4fe2bec906cd7937428ed6561ac79a',1,'cutlass::PredicateVector::is_zero()'],['../namespacecutlass_1_1gemm.html#a3e30ae89e6f7501725028144cd2d88cb',1,'cutlass::gemm::is_zero(T x)'],['../namespacecutlass_1_1gemm.html#a4a12fcfae60f26efa47bf0a79483d8ac',1,'cutlass::gemm::is_zero(half x)']]],
   ['iterator',['Iterator',['../classcutlass_1_1PredicateVector_1_1Iterator.html#a91b7d25cbd64e696ef23c87671f0b077',1,'cutlass::PredicateVector::Iterator::Iterator(Iterator const &amp;it)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a83c2f584bd061f0b9b6b2a6cddf5b038',1,'cutlass::PredicateVector::Iterator::Iterator(PredicateVector &amp;_vec, int _start=0)']]],
-  ['iterator_5fload',['iterator_load',['../namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be',1,'cutlass::iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)'],['../namespacecutlass.html#a50f08aa93d7fe6825599d17e3c977031',1,'cutlass::iterator_load(InputIterator const &amp;_iterator, Fragment &amp;fragment, typename InputIterator::Index offset, ConstPredicateAdapter predicate_adapter)'],['../namespacecutlass.html#aca491136bdb966638a7ae57c47f86d1e',1,'cutlass::iterator_load(InputIterator const &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset=0)'],['../namespacecutlass.html#af25d56f7391322d9a3b9aa3c507f90dc',1,'cutlass::iterator_load(InputIterator const &amp;iterator, Fragment &amp;fragment, ConstPredicateAdapter pred_it)']]],
-  ['iterator_5fload_5fpost_5fincrement',['iterator_load_post_increment',['../namespacecutlass.html#a3965068d8a4fdfe5e05782930fb4fe6b',1,'cutlass::iterator_load_post_increment(InputIterator &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset, ConstPredicateAdapter predicate_adapter)'],['../namespacecutlass.html#af5abe551df7461eab66aa43907063d6b',1,'cutlass::iterator_load_post_increment(InputIterator &amp;iterator, Fragment &amp;fragment, typename InputIterator::Index offset=0)'],['../namespacecutlass.html#afb8e7a4e611e8b5ae7ca19d02f791d37',1,'cutlass::iterator_load_post_increment(InputIterator &amp;iterator, Fragment &amp;fragment, ConstPredicateAdapter pred_it)']]],
-  ['iterator_5fstore',['iterator_store',['../namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9',1,'cutlass::iterator_store(OutputIterator &amp;iterator, Fragment &amp;fragment)'],['../namespacecutlass.html#a88dce4b124a294cc123f7cf5fd2d6472',1,'cutlass::iterator_store(OutputIterator const &amp;_iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset, ConstPredicateAdapter predicate_adapter)'],['../namespacecutlass.html#a410ed4d45ccafc2db842967740b6211f',1,'cutlass::iterator_store(OutputIterator const &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset=0)'],['../namespacecutlass.html#ad804b804ac19360b293046f9cbfd8dd5',1,'cutlass::iterator_store(OutputIterator const &amp;iterator, Fragment const &amp;fragment, ConstPredicateAdapter pred_it)']]],
-  ['iterator_5fstore_5fpost_5fincrement',['iterator_store_post_increment',['../namespacecutlass.html#a5bf15cbf4cf4649d895fcbc2edf6a2de',1,'cutlass::iterator_store_post_increment(OutputIterator &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset, ConstPredicateAdapter predicate_adapter)'],['../namespacecutlass.html#ab8efb0edefca7a59acc5a14b7311130c',1,'cutlass::iterator_store_post_increment(OutputIterator &amp;iterator, Fragment const &amp;fragment, typename OutputIterator::Index offset=0)'],['../namespacecutlass.html#a96fdb65e922f6a3d46aa5de9ea78d460',1,'cutlass::iterator_store_post_increment(OutputIterator &amp;iterator, Fragment const &amp;fragment, ConstPredicateAdapter pred_it)']]]
+  ['iterator_5fload',['iterator_load',['../namespacecutlass.html#a45dd7add04736cb5c3e69991d2f210be',1,'cutlass']]],
+  ['iterator_5fstore',['iterator_store',['../namespacecutlass.html#a0cb5bdf7bef498705c51a9cdcbef71f9',1,'cutlass']]]
 ];
diff --git a/docs/search/functions_a.js b/docs/search/functions_a.js
index 61f3d1a74..a3d676ab8 100644
--- a/docs/search/functions_a.js
+++ b/docs/search/functions_a.js
@@ -1,9 +1,8 @@
 var searchData=
 [
-  ['launch',['launch',['../structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c',1,'cutlass::gemm::Gemm::launch(Params const &amp;params, cudaStream_t stream=cudaStreamDefault)'],['../structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906',1,'cutlass::gemm::Gemm::launch(CUfunction kernel, Params const &amp;params, CUstream stream=CU_STREAM_LEGACY)']]],
-  ['lcm',['lcm',['../namespacecutlass.html#af07506fee11de882d926f4e8237eef09',1,'cutlass']]],
-  ['leading_5fdim',['leading_dim',['../classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77',1,'cutlass::TensorRef']]],
-  ['linearscaling',['LinearScaling',['../structcutlass_1_1gemm_1_1LinearScaling.html#a34df6970f033b3090ad8f4d40063b1b2',1,'cutlass::gemm::LinearScaling']]],
-  ['load',['load',['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html#a01a847858cb330d7d109ddee228e96ce',1,'cutlass::FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::load()'],['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html#a014682b143bce65667075ea15fad184d',1,'cutlass::FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::load()'],['../structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140',1,'cutlass::Load::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#aa9d5e227ea20ad3c6952f296016ec167',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a0e58d26dd68aabb6cb9678f5656c7e6f',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::load()'],['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a7ba77016bee8e941f7831cc9fbfa994d',1,'cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a4ee00178c441bdf4d4a1f8cf984bc03f',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::load()'],['../structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment) const']]],
-  ['load_5fpost_5fincrement',['load_post_increment',['../structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915',1,'cutlass::TileLoadIterator::load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d',1,'cutlass::TileLoadIterator::load_post_increment(Fragment &amp;fragment)']]]
+  ['k',['k',['../structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7',1,'cutlass::gemm::GemmCoord::k() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#ae12eb84ec47ddf01b4d459c7aabc22ad',1,'cutlass::gemm::GemmCoord::k()']]],
+  ['kernellaunchconfiguration',['KernelLaunchConfiguration',['../structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa',1,'cutlass::KernelLaunchConfiguration']]],
+  ['km',['km',['../structcutlass_1_1gemm_1_1GemmCoord.html#ad6c884a5bb6e5edaf371e8af10df367d',1,'cutlass::gemm::GemmCoord']]],
+  ['kn',['kn',['../structcutlass_1_1gemm_1_1GemmCoord.html#a16501265d58ddaca0e2d9bb4e21d66ea',1,'cutlass::gemm::GemmCoord']]],
+  ['knm',['knm',['../structcutlass_1_1gemm_1_1GemmCoord.html#a4062c040208868c75dbc6ba18910bffb',1,'cutlass::gemm::GemmCoord']]]
 ];
diff --git a/docs/search/functions_b.js b/docs/search/functions_b.js
index 7b4b2eb9a..6b8f60908 100644
--- a/docs/search/functions_b.js
+++ b/docs/search/functions_b.js
@@ -1,10 +1,13 @@
 var searchData=
 [
-  ['make_5fcoord',['make_Coord',['../namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9',1,'cutlass::make_Coord(int _0)'],['../namespacecutlass.html#a61d81e5363bcb8a7f6dd70f053242564',1,'cutlass::make_Coord(int _0, int _1)'],['../namespacecutlass.html#a25acf680a7d2592c957a7ac603f4c361',1,'cutlass::make_Coord(int _0, int _1, int _2)'],['../namespacecutlass.html#a9410b1f5956d3aaf4584e65d047428fc',1,'cutlass::make_Coord(int _0, int _1, int _2, int _3)']]],
-  ['make_5fpair',['make_pair',['../namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5',1,'cutlass::platform']]],
-  ['make_5fzero',['make_zero',['../namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf',1,'cutlass::make_zero(Scalar_ &amp;x)'],['../namespacecutlass.html#abc5c00b4986db5a114e774cee9999717',1,'cutlass::make_zero(Vector&lt; Scalar_, kLanes_ &gt; &amp;vec)']]],
-  ['max',['max',['../namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0',1,'cutlass::platform']]],
-  ['min',['min',['../namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c',1,'cutlass::platform']]],
-  ['multiply',['multiply',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a522301fbe3e276cb5ef9fbe75bb2ab50',1,'cutlass::gemm::FragmentMultiplyAdd::multiply()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ae62d61ec068ac958753d0a2f5a99d8e2',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::multiply()']]],
-  ['multiply_5fadd',['multiply_add',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a34bbf209967fef6181d3d46dd27fa0c0',1,'cutlass::gemm::FragmentMultiplyAdd::multiply_add()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a89c8b663af69f13c2a02cb464b5172a5',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f',1,'cutlass::gemm::Gemm::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a66486d38349fa20eb065ae9542eb43aa',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad22dd143c304c22c2630aedbfd3459af',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5dcf66c8126ec8adf8e66d4bf5b2f347',1,'cutlass::gemm::ThreadMultiplyAdd::multiply_add()']]]
+  ['launch',['Launch',['../structcutlass_1_1gemm_1_1Launch.html#a8552a524b9419f60bf8ef3c6b8528d27',1,'cutlass::gemm::Launch::Launch()'],['../structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#ab7a89806834a5fa8022daae4180e6180',1,'cutlass::gemm::Launch&lt; Gemm, false &gt;::Launch()'],['../structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c',1,'cutlass::gemm::Gemm::launch(Params const &amp;params, cudaStream_t stream=cudaStreamDefault)'],['../structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906',1,'cutlass::gemm::Gemm::launch(CUfunction kernel, Params const &amp;params, CUstream stream=CU_STREAM_LEGACY)']]],
+  ['lcm',['lcm',['../namespacecutlass.html#af07506fee11de882d926f4e8237eef09',1,'cutlass']]],
+  ['leading_5fdim',['leading_dim',['../classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca',1,'cutlass::TensorRef::leading_dim()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6c580a451a36143d1eb0e409e7b13e33',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::leading_dim()']]],
+  ['linearscaling',['LinearScaling',['../structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe',1,'cutlass::gemm::LinearScaling::LinearScaling()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889',1,'cutlass::gemm::LinearScaling::LinearScaling(Params const &amp;_params)']]],
+  ['linearscalingdeviceptr',['LinearScalingDevicePtr',['../structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a9dcb15bbcf3785280fd5cea0e0da5602',1,'cutlass::gemm::LinearScalingDevicePtr']]],
+  ['load',['load',['../structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7',1,'cutlass::Load::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a4bab8959d29ee868fb6b3e1f9abc04fc',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#a2e906364a0631c2c9f97acd0ae4a1873',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#afee69b86f070e3badc75ab00bcc5996b',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::load()'],['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a7d9027453aa78d4448d70dc44307791e',1,'cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a7d3d3e156dc527f9c00acc7a66d21326',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::load()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a854c684b3f6c1a10b6e8fcf7967f6642',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load()'],['../structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#a619f643794f51b35f3c0a1011ba00bbd',1,'cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load()'],['../structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#abc4f879290c847a6e73dc9e68a340f74',1,'cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load()'],['../structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#af587adae1103b4242e0d56eb902f9302',1,'cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::load()'],['../structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment) const'],['../structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6',1,'cutlass::TileLoadIterator::load(Fragment &amp;fragment, int d)'],['../structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6',1,'cutlass::TileStoreIterator::load(Fragment &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileStoreIterator.html#a8c42ab8699c3fd74dc7b59d559364b9a',1,'cutlass::TileStoreIterator::load(Fragment &amp;fragment) const'],['../structcutlass_1_1TileStoreIterator.html#ad33c46a584deb1c7968e08e349382af3',1,'cutlass::TileStoreIterator::load(Fragment &amp;fragment, int d)'],['../classcutlass_1_1ZipTileIterator.html#a23b72b086f350dfe07cff22ac010c45c',1,'cutlass::ZipTileIterator::load(Fragment &amp;fragment) const'],['../classcutlass_1_1ZipTileIterator.html#a9a3f2f913ee73f0c04e74ec89c6c5cbb',1,'cutlass::ZipTileIterator::load(Fragment &amp;fragment, Coord&lt; 4 &gt; const &amp;offset) const'],['../classcutlass_1_1ZipTileIterator.html#a4c9997488be2f09b9653d8ef8ac06c2b',1,'cutlass::ZipTileIterator::load(Fragment &amp;fragment, PredicateIterator pred_it) const']]],
+  ['load_5felement',['load_element',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06',1,'cutlass::gemm::GemmGlobalIteratorAb::load_element()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433',1,'cutlass::gemm::GemmGlobalIteratorCd::load_element()'],['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a5cbda0dea8c87ca55499c97cc80b1ccf',1,'cutlass::gemm::IgemmGlobalIteratorAb::load_element()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a109209936a9453e8f1f3f5eecfd6afca',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::load_element()'],['../structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910',1,'cutlass::TileLoadIterator::load_element()'],['../structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c',1,'cutlass::TileStoreIterator::load_element()']]],
+  ['load_5fpost_5fincrement',['load_post_increment',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7',1,'cutlass::gemm::GemmGlobalIteratorAb::load_post_increment()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1',1,'cutlass::gemm::GemmGlobalIteratorCd::load_post_increment()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae2febd768cbbfb8aab3c2cb669c0505d',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::load_post_increment()'],['../structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f',1,'cutlass::TileLoadIterator::load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a',1,'cutlass::TileLoadIterator::load_post_increment(Fragment &amp;fragment)'],['../structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214',1,'cutlass::TileStoreIterator::load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileStoreIterator.html#adfbd262dfb19fffd91e0712190d9712d',1,'cutlass::TileStoreIterator::load_post_increment(Fragment &amp;fragment)'],['../classcutlass_1_1ZipTileIterator.html#a95b8db4af9228beed273669b3b0b12fe',1,'cutlass::ZipTileIterator::load_post_increment(Fragment &amp;fragment)'],['../classcutlass_1_1ZipTileIterator.html#a3020bcd0a49efad674ca5539ea1c96c0',1,'cutlass::ZipTileIterator::load_post_increment(Fragment &amp;fragment, Coord&lt; 4 &gt; const &amp;offset)'],['../classcutlass_1_1ZipTileIterator.html#a53045f40d203a805af9c92fa0b5bc684',1,'cutlass::ZipTileIterator::load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)']]],
+  ['log',['log',['../namespacecutlass_1_1platform.html#adc1afc18e182f42f72210e2203ba293c',1,'cutlass::platform']]],
+  ['log10',['log10',['../namespacecutlass_1_1platform.html#a62dd6ae0e1b4476fd62ac70c26f12a06',1,'cutlass::platform']]]
 ];
diff --git a/docs/search/functions_c.js b/docs/search/functions_c.js
index 14ca492a3..2a79fffae 100644
--- a/docs/search/functions_c.js
+++ b/docs/search/functions_c.js
@@ -1,31 +1,18 @@
 var searchData=
 [
-  ['offset',['offset',['../classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8',1,'cutlass::TensorRef::offset()'],['../classcutlass_1_1TensorView.html#a064f3630e69798e7915f910c4ee99ab7',1,'cutlass::TensorView::offset()']]],
-  ['operator_20_26_3d',['operator &amp;=',['../structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9',1,'cutlass::PredicateVector']]],
-  ['operator_20b_2a',['operator B*',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8d100273203db9018dffbbe84e0b6c76',1,'cutlass::platform::is_base_of_helper::dummy']]],
-  ['operator_20bool',['operator bool',['../classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005',1,'cutlass::platform::unique_ptr']]],
-  ['operator_20d_2a',['operator D*',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8aadc500baf1492b1a4d05cc8b35fc13',1,'cutlass::platform::is_base_of_helper::dummy']]],
-  ['operator_20value_5ftype',['operator value_type',['../structcutlass_1_1platform_1_1integral__constant.html#a55d25116387f1c6d978462b1d245d675',1,'cutlass::platform::integral_constant']]],
-  ['operator_21_3d',['operator!=',['../structcutlass_1_1Coord.html#a7fb46873e8f3cf38212703d35bd36995',1,'cutlass::Coord::operator!=()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685',1,'cutlass::PredicateVector::ConstIterator::operator!=()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887',1,'cutlass::PredicateVector::Iterator::operator!=()'],['../namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566',1,'cutlass::platform::operator!=()']]],
-  ['operator_28_29',['operator()',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be',1,'cutlass::gemm::GemmGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52',1,'cutlass::gemm::GemmGlobalTileCdTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html#a1e357fe5bc1daef333e6be776a21a2ca',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410',1,'cutlass::gemm::GemmSharedLoadTileATraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html#a5b4a635a521364357386259b0f84c0ba',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits_1_1ThreadOffset.html#a1228edf6cc0f81af520dc77c8792b94c',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::ThreadOffset::operator()()'],['../structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2',1,'cutlass::TiledThreadOffset::operator()()'],['../structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000',1,'cutlass::TileTraitsWarpRake::ThreadOffset::operator()()'],['../structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c',1,'cutlass::platform::plus::operator()()'],['../structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5',1,'cutlass::platform::less::operator()()'],['../structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978',1,'cutlass::platform::greater::operator()()'],['../structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18',1,'cutlass::platform::integral_constant::operator()()'],['../structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15',1,'cutlass::platform::default_delete::operator()()'],['../structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87',1,'cutlass::platform::default_delete&lt; T[]&gt;::operator()()']]],
-  ['operator_2a',['operator*',['../structcutlass_1_1Coord.html#a8e4f7df55a75d040cf50cf9984c04c8a',1,'cutlass::Coord::operator*()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946',1,'cutlass::PredicateVector::ConstIterator::operator*()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4',1,'cutlass::PredicateVector::Iterator::operator*()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78',1,'cutlass::PredicateVector::TrivialIterator::operator*()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b',1,'cutlass::platform::unique_ptr::operator*()']]],
-  ['operator_2a_3d',['operator*=',['../structcutlass_1_1Coord.html#a282b6cc9ac8b2f72720c252791155aad',1,'cutlass::Coord']]],
-  ['operator_2b',['operator+',['../structcutlass_1_1Coord.html#a3dfc4ce4191097b6c3268696f2a45ef5',1,'cutlass::Coord::operator+()'],['../classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842',1,'cutlass::TensorRef::operator+()']]],
-  ['operator_2b_2b',['operator++',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70',1,'cutlass::PredicateVector::ConstIterator::operator++()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5',1,'cutlass::PredicateVector::ConstIterator::operator++(int)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3',1,'cutlass::PredicateVector::Iterator::operator++()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3',1,'cutlass::PredicateVector::Iterator::operator++(int)'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a',1,'cutlass::PredicateVector::TrivialIterator::operator++()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051',1,'cutlass::PredicateVector::TrivialIterator::operator++(int)']]],
-  ['operator_2b_3d',['operator+=',['../structcutlass_1_1Coord.html#aeb209486943fa9d42911325b16e49e09',1,'cutlass::Coord']]],
-  ['operator_2d',['operator-',['../structcutlass_1_1Coord.html#acc510511ffb52bed7f6a52f14b99750d',1,'cutlass::Coord::operator-()'],['../classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938',1,'cutlass::TensorRef::operator-()']]],
-  ['operator_2d_2d',['operator--',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286',1,'cutlass::PredicateVector::ConstIterator::operator--()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b',1,'cutlass::PredicateVector::ConstIterator::operator--(int)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61',1,'cutlass::PredicateVector::Iterator::operator--()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a',1,'cutlass::PredicateVector::Iterator::operator--(int)']]],
-  ['operator_2d_3d',['operator-=',['../structcutlass_1_1Coord.html#ac1795ec2a5890d8a39840567a4bea88e',1,'cutlass::Coord']]],
-  ['operator_2d_3e',['operator-&gt;',['../classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b',1,'cutlass::platform::unique_ptr']]],
-  ['operator_2f',['operator/',['../structcutlass_1_1Coord.html#a87f485be079fa68bcf576da4d56f0ece',1,'cutlass::Coord']]],
-  ['operator_2f_3d',['operator/=',['../structcutlass_1_1Coord.html#abe91e59962ef0d73aec9c14824f64ecc',1,'cutlass::Coord']]],
-  ['operator_3c',['operator&lt;',['../namespacecutlass_1_1platform.html#a412dbdbc678ecd12b55fcad4ef4155bd',1,'cutlass::platform']]],
-  ['operator_3c_3c',['operator&lt;&lt;',['../core__io_8h.html#a4a0d84a2a19a11549b87a2328d58690d',1,'core_io.h']]],
-  ['operator_3c_3d',['operator&lt;=',['../namespacecutlass_1_1platform.html#a41d573133357bd555f78d33afc1152d3',1,'cutlass::platform']]],
-  ['operator_3d',['operator=',['../classcutlass_1_1TensorView.html#aa9e9e19f35ce3111f64b763ca49b51ef',1,'cutlass::TensorView']]],
-  ['operator_3d_3d',['operator==',['../structcutlass_1_1Coord.html#acfa94aabd0c9a71ee994ca479d5f515f',1,'cutlass::Coord::operator==()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357',1,'cutlass::PredicateVector::ConstIterator::operator==()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e',1,'cutlass::PredicateVector::Iterator::operator==()'],['../namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197',1,'cutlass::platform::operator==()']]],
-  ['operator_3e',['operator&gt;',['../namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12',1,'cutlass::platform']]],
-  ['operator_3e_3d',['operator&gt;=',['../namespacecutlass_1_1platform.html#ab0f21e67c0a4b5c6952042b502c6816f',1,'cutlass::platform']]],
-  ['operator_5b_5d',['operator[]',['../structcutlass_1_1Coord.html#ab7fc89de3ccd7096ab275fb5dd40104c',1,'cutlass::Coord::operator[](int dim)'],['../structcutlass_1_1Coord.html#a6eeab0a1686ee25389e1bd017c5f03ae',1,'cutlass::Coord::operator[](int dim) const'],['../structcutlass_1_1Fragment.html#a99fef5f3093b2df50905ab13819b67a0',1,'cutlass::Fragment::operator[](int i)'],['../structcutlass_1_1Fragment.html#a75f51bb6ca84615076aab42ac9d42592',1,'cutlass::Fragment::operator[](int i) const'],['../structcutlass_1_1FragmentIterator.html#a83bb6a3ed588e2d890bf986665d2b7bb',1,'cutlass::FragmentIterator::operator[](int i) const'],['../structcutlass_1_1FragmentIterator.html#a3bd2a9d8467f8db02ca3a01ae0c11ad7',1,'cutlass::FragmentIterator::operator[](int i)'],['../structcutlass_1_1FragmentConstIterator.html#af16f2aa14ff424b038a393b683c4783e',1,'cutlass::FragmentConstIterator::operator[]()'],['../structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5',1,'cutlass::PredicateVector::operator[]()'],['../classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974',1,'cutlass::TensorRef::operator[](Coord&lt; Rank &gt; const &amp;coord) const'],['../classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c',1,'cutlass::TensorRef::operator[](int idx) const'],['../classcutlass_1_1TensorView.html#a7fe7e44e15fd1ac58fb55edf72e8fb23',1,'cutlass::TensorView::operator[]()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d',1,'cutlass::platform::unique_ptr::operator[]()'],['../unioncutlass_1_1Vector.html#a250860c921c94a6077344f9e11bf5b02',1,'cutlass::Vector::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector.html#a44cc27bf8a7b789b4ae8538155a50156',1,'cutlass::Vector::operator[](uint32_t i)'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab0516cef8949f5998b5251cc6b6db683',1,'cutlass::Vector&lt; half, kLanes_ &gt;::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a8ade80e040264fbd669d3f15c249884e',1,'cutlass::Vector&lt; half, kLanes_ &gt;::operator[](uint32_t i)']]],
-  ['operator_7c_3d',['operator|=',['../structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc',1,'cutlass::PredicateVector']]]
+  ['m',['m',['../structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793',1,'cutlass::gemm::GemmCoord::m() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a8199f5e336a20c31e54d68b11e9fa3d3',1,'cutlass::gemm::GemmCoord::m()']]],
+  ['make_5fcoord',['make_Coord',['../namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9',1,'cutlass::make_Coord(int _0)'],['../namespacecutlass.html#a61d81e5363bcb8a7f6dd70f053242564',1,'cutlass::make_Coord(int _0, int _1)'],['../namespacecutlass.html#a25acf680a7d2592c957a7ac603f4c361',1,'cutlass::make_Coord(int _0, int _1, int _2)'],['../namespacecutlass.html#a9410b1f5956d3aaf4584e65d047428fc',1,'cutlass::make_Coord(int _0, int _1, int _2, int _3)']]],
+  ['make_5fcoord_5ffrom_5fshape',['make_Coord_from_shape',['../namespacecutlass.html#a90028a415a05ce09073860e5c761aa6f',1,'cutlass']]],
+  ['make_5fpair',['make_pair',['../namespacecutlass_1_1platform.html#a90ce74c7faa4e27c888ce56e957b73d5',1,'cutlass::platform']]],
+  ['make_5fzero',['make_zero',['../namespacecutlass.html#aa03883e612d292e1b53eedd46e08ccd1',1,'cutlass::make_zero(Scalar_ &amp;x)'],['../namespacecutlass.html#a55b5b15eadf125d5ddddee1ea22191ee',1,'cutlass::make_zero(Vector&lt; Scalar_, kLanes_ &gt; &amp;vec)']]],
+  ['make_5fzipconvert',['make_ZipConvert',['../namespacecutlass.html#adad916101ca58fc9714362c611a0cad8',1,'cutlass']]],
+  ['make_5fzipfragment',['make_ZipFragment',['../namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6',1,'cutlass']]],
+  ['make_5fziptensorref',['make_ZipTensorRef',['../namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a',1,'cutlass']]],
+  ['map',['map',['../classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360',1,'cutlass::TensorRef::map()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a215f63b5a1b3799654c5670ef108fcfb',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::map()']]],
+  ['matrixcoord',['MatrixCoord',['../structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6',1,'cutlass::MatrixCoord::MatrixCoord()'],['../structcutlass_1_1MatrixCoord.html#a64bddbf8238dc937a01a140722f7f39c',1,'cutlass::MatrixCoord::MatrixCoord(Coord&lt; 2, Index &gt; const &amp;coord)'],['../structcutlass_1_1MatrixCoord.html#ac77b18e67be18cfdfe1935939e7f2017',1,'cutlass::MatrixCoord::MatrixCoord(Index row, Index column)']]],
+  ['max',['max',['../namespacecutlass_1_1platform.html#af6a9a165e53d7e85ae121d5789aa03e0',1,'cutlass::platform']]],
+  ['min',['min',['../namespacecutlass_1_1platform.html#a57c071d2a7305dd4ec60542e66b0c81c',1,'cutlass::platform']]],
+  ['move_5fto_5fresidue',['move_to_residue',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac269a9280a55d3988ca60f571bdf7f29',1,'cutlass::gemm::GlobalLoadStream::move_to_residue()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab94c0c95d6d4e019563ba8a142f9d410',1,'cutlass::gemm::GlobalLoadStreamPair::move_to_residue()']]],
+  ['multiply',['multiply',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a934c0d74c70fc87796ecb5cde50fd516',1,'cutlass::gemm::FragmentMultiplyAdd::multiply()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a6bed70e7074931419e9441688aee00ea',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::multiply()']]],
+  ['multiply_5fadd',['multiply_add',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aafa37c2e1ffd2f7d7031c24c732157d8',1,'cutlass::gemm::FragmentMultiplyAdd::multiply_add()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a92edee5611d25b60cdab6a1c8e32141f',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#ae0ea662652907b60140598dad777c5ab',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f',1,'cutlass::gemm::Gemm::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aaf8ea4aaf393488f03ba7fb7af264940',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ad9d8e47e8896d8d4eab538aa78b56e47',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::multiply_add()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7989d48e4c2e16b7804b813630f347cb',1,'cutlass::gemm::ThreadMultiplyAdd::multiply_add()']]]
 ];
diff --git a/docs/search/functions_d.js b/docs/search/functions_d.js
index 8aefe3b0f..4f1b1aa62 100644
--- a/docs/search/functions_d.js
+++ b/docs/search/functions_d.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['predicatetileadapter',['PredicateTileAdapter',['../structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea',1,'cutlass::PredicateTileAdapter']]],
-  ['predicatevector',['PredicateVector',['../structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21',1,'cutlass::PredicateVector']]],
-  ['project',['project',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html#ae91b2350374f1734a30cbed45e14b8e3',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;::project()'],['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html#a0f1579013f56fe16ebc147271f163c3c',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;::project()'],['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kC, true &gt;::project()'],['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kD, true &gt;::project()']]]
+  ['n',['n',['../structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd',1,'cutlass::gemm::GemmCoord::n() const'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a1327b9b4b9379df24df3d4b716952d11',1,'cutlass::gemm::GemmCoord::n()']]],
+  ['nm',['nm',['../structcutlass_1_1gemm_1_1GemmCoord.html#ac4550a7e80e1f0265eacecebe54794d9',1,'cutlass::gemm::GemmCoord']]],
+  ['norm',['norm',['../namespacecutlass_1_1platform.html#a9d631b040eea94d9b5af04faa5c20bb1',1,'cutlass::platform']]]
 ];
diff --git a/docs/search/functions_e.js b/docs/search/functions_e.js
index 8bc9b1112..26a243fb8 100644
--- a/docs/search/functions_e.js
+++ b/docs/search/functions_e.js
@@ -1,8 +1,36 @@
 var searchData=
 [
-  ['ref',['ref',['../classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09',1,'cutlass::TensorView::ref()'],['../classcutlass_1_1TensorView.html#a5cbff89d3d8dc71d27a4d6c1d7abb58a',1,'cutlass::TensorView::ref() const']]],
-  ['release',['release',['../classcutlass_1_1platform_1_1unique__ptr.html#a7ac06ebe7bc66573d3225891e12d2279',1,'cutlass::platform::unique_ptr']]],
-  ['reset',['reset',['../classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674',1,'cutlass::TensorRef::reset()'],['../classcutlass_1_1TensorView.html#a8b1785a1ea5d7aa7eba8e45297d539d3',1,'cutlass::TensorView::reset()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a6740f71511f5495d6038cf8878862331',1,'cutlass::platform::unique_ptr::reset()']]],
-  ['residue',['residue',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9',1,'cutlass::gemm::GlobalLoadStreamBase::residue()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aab37ea6c47e34466371314ed3971dc7b',1,'cutlass::gemm::GemmGlobalIteratorAb::residue()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a405b93680bb6e356369863244d0b56aa',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::residue()']]],
-  ['round_5fnearest',['round_nearest',['../namespacecutlass.html#a17c8c408d672d26f1c70d2435f6ac83e',1,'cutlass']]]
+  ['offset',['offset',['../classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1',1,'cutlass::TensorRef::offset()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a07c7f56e724cfbc844777e8ee9f616b5',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::offset()']]],
+  ['operator',['operator',['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679',1,'cutlass::TensorRefArray::ConstIterator::operator()']]],
+  ['operator_20_26_3d',['operator &amp;=',['../structcutlass_1_1PredicateVector.html#a3dd9aeba8f3cbe7a8198d68d91a0bbb9',1,'cutlass::PredicateVector']]],
+  ['operator_20b_2a',['operator B*',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8d100273203db9018dffbbe84e0b6c76',1,'cutlass::platform::is_base_of_helper::dummy']]],
+  ['operator_20bool',['operator bool',['../structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f',1,'cutlass::Coord::operator bool()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a5791650488ae864f10ad04bec4a31005',1,'cutlass::platform::unique_ptr::operator bool()']]],
+  ['operator_20cudoublecomplex',['operator cuDoubleComplex',['../classcutlass_1_1platform_1_1complex.html#a3b92e54de1c4262c7e481218162be7ec',1,'cutlass::platform::complex']]],
+  ['operator_20cufloatcomplex',['operator cuFloatComplex',['../classcutlass_1_1platform_1_1complex.html#ac5a3a0dc9815dadbe539312eb6fe36c4',1,'cutlass::platform::complex']]],
+  ['operator_20d_2a',['operator D*',['../structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html#a8aadc500baf1492b1a4d05cc8b35fc13',1,'cutlass::platform::is_base_of_helper::dummy']]],
+  ['operator_20scalar',['operator Scalar',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a896f35e776c1291ceda0f432cc3da654',1,'cutlass::detail::ScalarOrPointer']]],
+  ['operator_20value_5ftype',['operator value_type',['../structcutlass_1_1platform_1_1integral__constant.html#a55d25116387f1c6d978462b1d245d675',1,'cutlass::platform::integral_constant']]],
+  ['operator_21',['operator!',['../structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02',1,'cutlass::Coord']]],
+  ['operator_21_3d',['operator!=',['../structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3',1,'cutlass::Coord::operator!=()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a3d06715a77740034697686a7977cb685',1,'cutlass::PredicateVector::ConstIterator::operator!=()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a08cb4d1395b88a4451fbb1a27e010887',1,'cutlass::PredicateVector::Iterator::operator!=()'],['../namespacecutlass_1_1platform.html#aa8b8911c3529ee9d433b0c4d90bde50c',1,'cutlass::platform::operator!=(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#a248f49adf09654d2cd04bd2760ab2566',1,'cutlass::platform::operator!=(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)']]],
+  ['operator_28_29',['operator()',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html#ab8adb983c0573a0015469f40a75287be',1,'cutlass::gemm::GemmGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html#abaf0d4459a64b3e9533758b59600bd52',1,'cutlass::gemm::GemmGlobalTileCdTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html#a1e357fe5bc1daef333e6be776a21a2ca',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html#a4e35f0b2ca63a6b981230b73f843f726',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html#a51a325b435b9a53effaa003b3670e410',1,'cutlass::gemm::GemmSharedLoadTileATraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html#a5b4a635a521364357386259b0f84c0ba',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html#a4f9cca16303ac9ae29a0eaa11dcc23b6',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html#ace1b936cab289c6884e673312283d422',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html#a9fc1ca09733113f80fe5fe45db3d9b81',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#a80562f5ceab2049c3b7834c2891a07ee',1,'cutlass::gemm::IgemmGlobalTileTraits::ThreadOffset::operator()()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::ThreadOffset::operator()()'],['../structcutlass_1_1MatrixLayout_1_1RowMajor.html#a736620aef395e4224d7aae098573aa34',1,'cutlass::MatrixLayout::RowMajor::operator()()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#af51e07c6605524581e5d27d290c8b8d2',1,'cutlass::MatrixLayout::ColumnMajor::operator()()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a5199cb7f7c10f6123c63703453b7937c',1,'cutlass::MatrixLayout::RowMajorInterleaved::operator()()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dbf79e5df5bcf52d54a699d2587319d',1,'cutlass::MatrixLayout::ColumnMajorInterleaved::operator()()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a512248a443c5914fab6aeabc4a73978e',1,'cutlass::MatrixLayout::ContiguousLayout::operator()()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a24c06bb7e64a8015ac528b3ae954a689',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::operator()()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#abde0a4a7c487da0c78ea2519323c04af',1,'cutlass::MatrixLayout::RowMajorBlockLinear::operator()()'],['../structcutlass_1_1IdentityTensorMapFunc.html#a3922130841c34d3ce8c112ee6fae4ca1',1,'cutlass::IdentityTensorMapFunc::operator()()'],['../structcutlass_1_1RegularTilePredicateFunctor.html#a084c0a2732827a74f7a30873c5883827',1,'cutlass::RegularTilePredicateFunctor::operator()()'],['../structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2',1,'cutlass::TiledThreadOffset::operator()()'],['../structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000',1,'cutlass::TileTraitsWarpRake::ThreadOffset::operator()()'],['../structcutlass_1_1platform_1_1plus.html#a3bf1e5147df4287bf58ad8f11ea0d98c',1,'cutlass::platform::plus::operator()()'],['../structcutlass_1_1platform_1_1less.html#adfb49ee70a700a8483c70b4b353f6bc5',1,'cutlass::platform::less::operator()()'],['../structcutlass_1_1platform_1_1greater.html#a8d56cf343dd33acebe19d0b51abe3978',1,'cutlass::platform::greater::operator()()'],['../structcutlass_1_1platform_1_1integral__constant.html#a5271a533526a535ae8b783c736252f18',1,'cutlass::platform::integral_constant::operator()()'],['../structcutlass_1_1platform_1_1default__delete.html#a59e6e3cc95685ac34fa6f9cf301b3a15',1,'cutlass::platform::default_delete::operator()()'],['../structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html#a16c5595a5aec7d7ee34e38bef4a66c87',1,'cutlass::platform::default_delete&lt; T[]&gt;::operator()()']]],
+  ['operator_2a',['operator*',['../structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033',1,'cutlass::Coord::operator*()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a5a158b5f3c0b1779972b25aa52be1164',1,'cutlass::gemm::GemmCoord::operator*()'],['../structcutlass_1_1MatrixCoord.html#ac68a57c17811b0a04dc6fb21423ab226',1,'cutlass::MatrixCoord::operator*()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#abbc2bceb6cf8d7f168b8a00eb48c0946',1,'cutlass::PredicateVector::ConstIterator::operator*()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a049b568e0f5de011ee76ce79bcedbab4',1,'cutlass::PredicateVector::Iterator::operator*()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#a78016158f99dd87e822a2a2cbd4cec78',1,'cutlass::PredicateVector::TrivialIterator::operator*()'],['../structcutlass_1_1TileCoord.html#ab8fbb13cc5ea4f580a7fc32963de9553',1,'cutlass::TileCoord::operator*()'],['../classcutlass_1_1platform_1_1unique__ptr.html#a45a3cb6d8641a6130991d56e84cbb38b',1,'cutlass::platform::unique_ptr::operator*()'],['../namespacecutlass_1_1platform.html#a34950f01ed89108b1d79c651aa58ecba',1,'cutlass::platform::operator*(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#aef5da2c88431ab40b58fdd6afea13dba',1,'cutlass::platform::operator*(complex&lt; T &gt; const &amp;lhs, T const &amp;s)'],['../namespacecutlass_1_1platform.html#a289b6e31bdc0be1302b8dbab55eb568c',1,'cutlass::platform::operator*(T const &amp;s, complex&lt; T &gt; const &amp;rhs)']]],
+  ['operator_2a_3d',['operator*=',['../structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168',1,'cutlass::Coord::operator*=()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a69fb0bb5e73f35d3c8df71a0174d6520',1,'cutlass::gemm::GemmCoord::operator*=()'],['../structcutlass_1_1MatrixCoord.html#a5fd3c3b58af1147a5c73657c05a16f5b',1,'cutlass::MatrixCoord::operator*=()'],['../structcutlass_1_1TileCoord.html#ae946b3af6b795d26632da7ca66b3751c',1,'cutlass::TileCoord::operator*=()'],['../namespacecutlass_1_1platform.html#a9a4928ab582beee4e7ddd337529d45ac',1,'cutlass::platform::operator*=(complex&lt; T &gt; &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#a21adde191e48e604908ce886690c6d6b',1,'cutlass::platform::operator*=(complex&lt; T &gt; &amp;lhs, T s)']]],
+  ['operator_2b',['operator+',['../structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc',1,'cutlass::Coord::operator+()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a675efbb9ed360888faf3c333708ae4d5',1,'cutlass::gemm::GemmCoord::operator+()'],['../structcutlass_1_1MatrixCoord.html#a25236953237f965965b1c9b7a04ba26e',1,'cutlass::MatrixCoord::operator+()'],['../classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f',1,'cutlass::TensorRef::operator+()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ad054f14b5580c9480d671b8fc8ef016a',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator+()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a1d48f4fea3fa85a7bf1b26b421387afd',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator+()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a9fcd43018e60f12cb328859c76ec7891',1,'cutlass::TensorRefArray::ConstIterator::operator+()'],['../classcutlass_1_1TensorView.html#aa2390d8e127a51df239affd2ca36e97a',1,'cutlass::TensorView::operator+()'],['../structcutlass_1_1TileCoord.html#a3bfa2daa0e63144c1e8510ba336f185b',1,'cutlass::TileCoord::operator+()'],['../namespacecutlass_1_1platform.html#a93b0f0d73fa3cf11c5018460b257837c',1,'cutlass::platform::operator+()']]],
+  ['operator_2b_2b',['operator++',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a10ee4bb2f206432aa5ee1a83cb046b70',1,'cutlass::PredicateVector::ConstIterator::operator++()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a977a99af3166a58d5bc5a613a1abe7d5',1,'cutlass::PredicateVector::ConstIterator::operator++(int)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a7dddc0a6b5c958156beef29bedfd1bd3',1,'cutlass::PredicateVector::Iterator::operator++()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a6c7333ad14d545cafc707e78752bf1e3',1,'cutlass::PredicateVector::Iterator::operator++(int)'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#ad24e9b451064e99fb19955f772c30e6a',1,'cutlass::PredicateVector::TrivialIterator::operator++()'],['../structcutlass_1_1PredicateVector_1_1TrivialIterator.html#aa35b9165920b83b9a5a888df83925051',1,'cutlass::PredicateVector::TrivialIterator::operator++(int)'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a3481d6f41defd25ab574bb19ee5fe424',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator++()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#aca860ff7f125e02f35c7dc174e84708d',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator++(int)'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a8ce80124ab0f4ab9981f1a4d64d976a5',1,'cutlass::TensorRefArray::ConstIterator::operator++()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a051f34d90c0680dc5f4e4e1c4d79e929',1,'cutlass::TensorRefArray::ConstIterator::operator++(int)'],['../classcutlass_1_1ZipTileIterator.html#a47d270fc4a119d7b95b2d5dd3ee5b87b',1,'cutlass::ZipTileIterator::operator++()']]],
+  ['operator_2b_3d',['operator+=',['../structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20',1,'cutlass::Coord::operator+=()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a5465f7308778eac5d14d8020179a65e0',1,'cutlass::gemm::GemmCoord::operator+=()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a8e79a153de72eef10d90bfd02b5dd27e',1,'cutlass::gemm::GlobalLoadStream::operator+=()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af',1,'cutlass::gemm::GemmGlobalIteratorAb::operator+=()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec',1,'cutlass::gemm::GemmGlobalIteratorCd::operator+=()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a769813dcffe1767aab49ac30b838a5f4',1,'cutlass::gemm::GlobalLoadStreamPair::operator+=()'],['../structcutlass_1_1MatrixCoord.html#ad105615dbf7ede75caa0e778c873bd06',1,'cutlass::MatrixCoord::operator+=()'],['../classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306',1,'cutlass::TensorRef::operator+=()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0753aeb57365a976bc0a88481af504cb',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator+=()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab07a5d1a4ec6d96ec53e868b3a6d7cae',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator+=()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a22b87d281057c8e03b80db7046c54dd8',1,'cutlass::TensorRefArray::ConstIterator::operator+=()'],['../classcutlass_1_1TensorView.html#a4fa8fa35d00eb4d0097da492c738cddc',1,'cutlass::TensorView::operator+=()'],['../structcutlass_1_1TileCoord.html#a812760c633ea813db8a2bc24826c68df',1,'cutlass::TileCoord::operator+=()'],['../structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120',1,'cutlass::TileLoadIterator::operator+=()'],['../structcutlass_1_1TileStoreIterator.html#a57b284e6cbff892d45e5cfeb0ae1e3ed',1,'cutlass::TileStoreIterator::operator+=()'],['../classcutlass_1_1ZipTileIterator.html#a60ba516d7382cb7788d5430023f7fc44',1,'cutlass::ZipTileIterator::operator+=(int count)'],['../classcutlass_1_1ZipTileIterator.html#a200a4e88ee6d23dcc80e974c77f8fa1f',1,'cutlass::ZipTileIterator::operator+=(Coord&lt; 3 &gt; const &amp;offset)'],['../namespacecutlass_1_1platform.html#a34c5ca341da805d5d1bc703c53c96d9d',1,'cutlass::platform::operator+=()']]],
+  ['operator_2d',['operator-',['../structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b',1,'cutlass::Coord::operator-()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a762fd45e61477d700c82bfd67443c6f9',1,'cutlass::gemm::GemmCoord::operator-()'],['../structcutlass_1_1MatrixCoord.html#aa462303d75a5d98b680b6e20080ce877',1,'cutlass::MatrixCoord::operator-()'],['../classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa',1,'cutlass::TensorRef::operator-()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#afde28cda18918d3e177d3e5024ed3dd4',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator-()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad1d8099e8d63b6d88c53738ec68a7589',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator-(Index idx)'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab92bc090d6753ff5e17676ba85a1e478',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator-(ConstIterator const &amp;it)'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a143ec893406d930aa4c5aa860052197e',1,'cutlass::TensorRefArray::ConstIterator::operator-()'],['../classcutlass_1_1TensorView.html#a1e4b2bb02c5843898f72f62787403add',1,'cutlass::TensorView::operator-()'],['../structcutlass_1_1TileCoord.html#a9f274d8e93f9cd3e0a9699e11b85fa7c',1,'cutlass::TileCoord::operator-()'],['../namespacecutlass_1_1platform.html#aa486433971cdd6b7648c1e5459c42763',1,'cutlass::platform::operator-()']]],
+  ['operator_2d_2d',['operator--',['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2763012a9284e97650b14e20c5668286',1,'cutlass::PredicateVector::ConstIterator::operator--()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#a2910a714d34a688b8ea560ea2933436b',1,'cutlass::PredicateVector::ConstIterator::operator--(int)'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a69fb5b24eeb43331b7401768e8584e61',1,'cutlass::PredicateVector::Iterator::operator--()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#aad709a11f43b84c88e3ce3a0394f8e8a',1,'cutlass::PredicateVector::Iterator::operator--(int)'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad5290f0e7814892cb4fff55e9518562b',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator--()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a09909fbe2e4365b5f34ddb61658f27b3',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator--(int)'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a0f395558e2c589ac48179447a23b59d8',1,'cutlass::TensorRefArray::ConstIterator::operator--()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ac9019febbc8b6bfea06ac4d23d253d57',1,'cutlass::TensorRefArray::ConstIterator::operator--(int)'],['../classcutlass_1_1ZipTileIterator.html#a3d22dab34b2abd0d05c00668f8591151',1,'cutlass::ZipTileIterator::operator--()']]],
+  ['operator_2d_3d',['operator-=',['../structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b',1,'cutlass::Coord::operator-=()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a12ba250be3d5474b7c6fc4eddd4f58d5',1,'cutlass::gemm::GemmCoord::operator-=()'],['../structcutlass_1_1MatrixCoord.html#a6feef48cf24733d22ca53a27cbc33ac0',1,'cutlass::MatrixCoord::operator-=()'],['../classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890',1,'cutlass::TensorRef::operator-=()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a11964d045ac8e41c80026515adb03008',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator-=()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ac4018b51e78842fb252d6917738fa571',1,'cutlass::TensorRefBatchStrided::ConstIterator::operator-=()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ae3561f863072cd7be7dcdee2cb5cc1f0',1,'cutlass::TensorRefArray::ConstIterator::operator-=()'],['../classcutlass_1_1TensorView.html#abc088fad6debb6a0ceb04c5d2767e81b',1,'cutlass::TensorView::operator-=()'],['../structcutlass_1_1TileCoord.html#a02da20e580962fe0754a772842045389',1,'cutlass::TileCoord::operator-=()'],['../classcutlass_1_1ZipTileIterator.html#a7bae0f9b789e75bb154c5f37db50e14c',1,'cutlass::ZipTileIterator::operator-=()'],['../namespacecutlass_1_1platform.html#abff9e10130849ea46f6245f4e8cc2cc9',1,'cutlass::platform::operator-=()']]],
+  ['operator_2d_3e',['operator-&gt;',['../classcutlass_1_1platform_1_1unique__ptr.html#afa52edcaef23461ce1f9c1dac349c24b',1,'cutlass::platform::unique_ptr']]],
+  ['operator_2f',['operator/',['../structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568',1,'cutlass::Coord::operator/()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a41770bb99f02f4debbafe95e019ce02b',1,'cutlass::gemm::GemmCoord::operator/()'],['../structcutlass_1_1MatrixCoord.html#aa89b196410d25d8c9ed3746fb6833374',1,'cutlass::MatrixCoord::operator/()'],['../structcutlass_1_1TileCoord.html#a5d2cc915343a3b90fb530348ddd329d2',1,'cutlass::TileCoord::operator/()'],['../namespacecutlass_1_1platform.html#a4fe79c19fb599cd9b85d08676a711f9f',1,'cutlass::platform::operator/(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#a33f75d77ff629335c9666128837c4581',1,'cutlass::platform::operator/(complex&lt; T &gt; const &amp;lhs, T const &amp;s)'],['../namespacecutlass_1_1platform.html#ae302b414576ecb5afb0cdfdda6b30ad3',1,'cutlass::platform::operator/(T const &amp;s, complex&lt; T &gt; const &amp;rhs)']]],
+  ['operator_2f_3d',['operator/=',['../structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28',1,'cutlass::Coord::operator/=()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#aac1e1bad751237fd76d32a1ea10f6c40',1,'cutlass::gemm::GemmCoord::operator/=()'],['../structcutlass_1_1MatrixCoord.html#aab345c8ddb8048bfe3d667bc7ce6522f',1,'cutlass::MatrixCoord::operator/=()'],['../structcutlass_1_1TileCoord.html#ac3207d8aa879c86a907cdcc93ccb2eb5',1,'cutlass::TileCoord::operator/=()'],['../namespacecutlass_1_1platform.html#ac594526ef64ecf364ae957753ce64b40',1,'cutlass::platform::operator/=()']]],
+  ['operator_3c',['operator&lt;',['../structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308',1,'cutlass::Coord::operator&lt;()'],['../namespacecutlass_1_1platform.html#a412dbdbc678ecd12b55fcad4ef4155bd',1,'cutlass::platform::operator&lt;()']]],
+  ['operator_3c_3c',['operator&lt;&lt;',['../namespacecutlass.html#afe231b125bbb1e9aa51307a8abdf9a60',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, Coord&lt; Rank &gt; const &amp;coord)'],['../namespacecutlass.html#a30ddfc5e90b9103840cb30c9f9b96b49',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; T &gt; const &amp;scalar)'],['../namespacecutlass.html#a36690681ed19dc7e398fcdafdbfe9975',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; int8_t &gt; const &amp;scalar)'],['../namespacecutlass.html#a1a35d6b9b984a9c143957db733a93f51',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; uint8_t &gt; const &amp;scalar)'],['../namespacecutlass.html#a2fd306c63f71877f9231a7e1265752cf',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; cutlass::Vector&lt; cutlass::bin1_t, 32 &gt; &gt; const &amp;scalar)'],['../namespacecutlass.html#aecf2cd62eee939946b7173a110ecf76e',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; cutlass::Vector&lt; cutlass::int4_t, 8 &gt; &gt; const &amp;scalar)'],['../namespacecutlass.html#a3ceda5ed2d923222662a37e8f355c9b8',1,'cutlass::operator&lt;&lt;(std::ostream &amp;out, ScalarIO&lt; cutlass::Vector&lt; cutlass::uint4_t, 8 &gt; &gt; const &amp;scalar)'],['../namespacecutlass_1_1platform.html#ab4c3e4eabba020d7a9faf86ee6cf437a',1,'cutlass::platform::operator&lt;&lt;()']]],
+  ['operator_3c_3d',['operator&lt;=',['../structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c',1,'cutlass::Coord::operator&lt;=()'],['../namespacecutlass_1_1platform.html#a41d573133357bd555f78d33afc1152d3',1,'cutlass::platform::operator&lt;=()']]],
+  ['operator_3d',['operator=',['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a3b29491782c3a129355fa4ef159cb970',1,'cutlass::detail::ScalarOrPointer::operator=(Scalar const &amp;scalar_)'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a54357e2f1d52aa8355b2ae7796740ea3',1,'cutlass::detail::ScalarOrPointer::operator=(Scalar const *ptr_)'],['../classcutlass_1_1TensorView.html#acf0c156efb9197bc7538f7e9057d8a68',1,'cutlass::TensorView::operator=()']]],
+  ['operator_3d_3d',['operator==',['../structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d',1,'cutlass::Coord::operator==()'],['../classcutlass_1_1PredicateVector_1_1ConstIterator.html#aa2d03d88ac23051803d010f78157c357',1,'cutlass::PredicateVector::ConstIterator::operator==()'],['../classcutlass_1_1PredicateVector_1_1Iterator.html#a5c5266fcef67c7b263682c4bc4a5000e',1,'cutlass::PredicateVector::Iterator::operator==()'],['../namespacecutlass_1_1platform.html#a043e8559161ee0fcaf943a1dfe1a9cbb',1,'cutlass::platform::operator==(complex&lt; T &gt; const &amp;lhs, complex&lt; T &gt; const &amp;rhs)'],['../namespacecutlass_1_1platform.html#ab9b8306ae9dc21fa646c49b68fa8e197',1,'cutlass::platform::operator==(const pair&lt; T1, T2 &gt; &amp;lhs, const pair&lt; T1, T2 &gt; &amp;rhs)']]],
+  ['operator_3e',['operator&gt;',['../namespacecutlass_1_1platform.html#a9e8e698d40b8df881991fde9ba2a1b12',1,'cutlass::platform']]],
+  ['operator_3e_3d',['operator&gt;=',['../namespacecutlass_1_1platform.html#ab0f21e67c0a4b5c6952042b502c6816f',1,'cutlass::platform']]],
+  ['operator_5b_5d',['operator[]',['../structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24',1,'cutlass::Coord::operator[](int dim)'],['../structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454',1,'cutlass::Coord::operator[](int dim) const'],['../structcutlass_1_1Fragment.html#a77ba7cddf7822d64534b019c4ad9732e',1,'cutlass::Fragment::operator[](int i)'],['../structcutlass_1_1Fragment.html#a7795c5cf4d5626ff125abd5e8f156e9b',1,'cutlass::Fragment::operator[](int i) const'],['../structcutlass_1_1FragmentIterator.html#a21877944988f34eb69cb6eefb00c6575',1,'cutlass::FragmentIterator::operator[](int i) const'],['../structcutlass_1_1FragmentIterator.html#ad665745f3d6a3a88d7894fe0fc1bbd3e',1,'cutlass::FragmentIterator::operator[](int i)'],['../structcutlass_1_1FragmentConstIterator.html#a6216b58ffe6322f037f1e0a3ffa714c8',1,'cutlass::FragmentConstIterator::operator[]()'],['../structcutlass_1_1PredicateVector.html#a840985438ac8306ec680eb20edd4e5c5',1,'cutlass::PredicateVector::operator[]()'],['../classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6',1,'cutlass::TensorRef::operator[](TensorCoord const &amp;coord) const'],['../classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3',1,'cutlass::TensorRef::operator[](LongIndex idx) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a64a5e91e01555b8bfd22875543573d22',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator[](TensorCoord const &amp;coord) const'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a57f132816e51bbdb4c807d57c067b619',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator[](LongIndex idx) const'],['../classcutlass_1_1platform_1_1unique__ptr.html#a5c7a204af07a7d325b0a8303e199a50d',1,'cutlass::platform::unique_ptr::operator[]()'],['../unioncutlass_1_1Vector.html#a69be4f85c1dac371fa6f1c6747724adc',1,'cutlass::Vector::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector.html#abf531676caf85cde1c8df435c1ebe8bb',1,'cutlass::Vector::operator[](uint32_t i)'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a12fa9366dd57fadb2d3f624ab7836dc8',1,'cutlass::Vector&lt; half, 1 &gt;::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1e6568c0f3f958db739074ab6978ff10',1,'cutlass::Vector&lt; half, 1 &gt;::operator[](uint32_t i)'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ad50b5d4acbd7ead82c128091c9db9113',1,'cutlass::Vector&lt; half, kLanes_ &gt;::operator[](uint32_t i) const'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a3891ce1c321a3e57e938c8864de9baf0',1,'cutlass::Vector&lt; half, kLanes_ &gt;::operator[](uint32_t i)'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a8eda6e6181a5333ca8350977374708cb',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::operator[]()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2d5ec0b76daa136dae0b4aec1edf9e0b',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::operator[]()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#ae2215fe7c2c223175b4172d73a6c7a82',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::operator[]()']]],
+  ['operator_7c_3d',['operator|=',['../structcutlass_1_1PredicateVector.html#aab9de134132c62de1c062ca57582cdbc',1,'cutlass::PredicateVector']]]
 ];
diff --git a/docs/search/functions_f.js b/docs/search/functions_f.js
index 183adc887..ab75d047d 100644
--- a/docs/search/functions_f.js
+++ b/docs/search/functions_f.js
@@ -1,16 +1,12 @@
 var searchData=
 [
-  ['set',['set',['../classcutlass_1_1PredicateVector_1_1Iterator.html#aadfd039b5622098c9e46706a27122575',1,'cutlass::PredicateVector::Iterator::set()'],['../structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af',1,'cutlass::PredicateVector::set()'],['../structcutlass_1_1PredicateTileAdapter.html#aeda47efdda0387f9c3c7b31f836afca5',1,'cutlass::PredicateTileAdapter::set()']]],
-  ['shared_5fiterator_5fload',['shared_iterator_load',['../namespacecutlass.html#abcec976c59cab75ca55b338d125154a3',1,'cutlass::shared_iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment)'],['../namespacecutlass.html#aa9416026c6db08d92a34c2ac08fea8c3',1,'cutlass::shared_iterator_load(InputIterator &amp;iterator, Fragment &amp;fragment, int d)']]],
-  ['shared_5fiterator_5fstore',['shared_iterator_store',['../namespacecutlass.html#a705c6d75513e112d2731d1c40f4cf109',1,'cutlass']]],
-  ['shared_5fload_5ffence',['shared_load_fence',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84',1,'cutlass::gemm::GemmEpilogue::shared_load_fence()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe',1,'cutlass::gemm::GemmTraits::shared_load_fence()']]],
-  ['shared_5fstore_5ffence',['shared_store_fence',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691',1,'cutlass::gemm::GemmEpilogue::shared_store_fence()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f',1,'cutlass::gemm::GemmTraits::shared_store_fence()']]],
-  ['sharedloadstream',['SharedLoadStream',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad',1,'cutlass::gemm::SharedLoadStream::SharedLoadStream()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a93e9bcdca4ceb68754fb1f73e2b25d25',1,'cutlass::gemm::SharedLoadStream::SharedLoadStream(Params const &amp;params, SharedStorage &amp;shared_storage)'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a49315aea1c54d84ff19b0ac215128b95',1,'cutlass::gemm::GemmTraits::SharedLoadStream::SharedLoadStream()']]],
-  ['size',['size',['../classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027',1,'cutlass::TensorView::size() const'],['../classcutlass_1_1TensorView.html#a6218d8555679966eab784a6bb1fa4ed1',1,'cutlass::TensorView::size(int dim) const']]],
-  ['store',['store',['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html#a118c78aa6b0ae0f0c78889689b6878c8',1,'cutlass::FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::store()'],['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html#a45319520b7d341c66bd54d3e8fec48f8',1,'cutlass::FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::store()'],['../structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf',1,'cutlass::Store::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a00f6bb93d318bf4cff35c9dabc630167',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a027980b8456243974b0c442866a66e3a',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::store()'],['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ab70d04589637f285f861902f649f834e',1,'cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;::store()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aa130564bb2eba7b07e1f183c98f1d9e2',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::store()'],['../structcutlass_1_1TileStoreIterator.html#a53820de506cecb1f5fb07b3385d8272a',1,'cutlass::TileStoreIterator::store(Fragment &amp;fragment, PredicateIterator pred_it) const'],['../structcutlass_1_1TileStoreIterator.html#a60258b7c1a1708f97e28f8f6c292bfe4',1,'cutlass::TileStoreIterator::store(Fragment &amp;fragment) const']]],
-  ['store_5fpost_5fincrement',['store_post_increment',['../structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526',1,'cutlass::TileStoreIterator::store_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)'],['../structcutlass_1_1TileStoreIterator.html#ae63949f58c1b32959bbfa5b64d521f0f',1,'cutlass::TileStoreIterator::store_post_increment(Fragment &amp;fragment)']]],
-  ['stride',['stride',['../classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878',1,'cutlass::TensorRef::stride() const'],['../classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31',1,'cutlass::TensorRef::stride(int dim) const'],['../classcutlass_1_1TensorView.html#a3ac125a25199fd91f73d2cfe9fc3d09b',1,'cutlass::TensorView::stride() const'],['../classcutlass_1_1TensorView.html#a522630bb0df977282a9bff17e6fee843',1,'cutlass::TensorView::stride(int dim) const']]],
-  ['subview',['subview',['../classcutlass_1_1TensorView.html#aee43c516397d7c06eb8012711d8d7c15',1,'cutlass::TensorView']]],
-  ['swap',['swap',['../classcutlass_1_1platform_1_1unique__ptr.html#a748d413c50bdbbe9e2f9986fbc423036',1,'cutlass::platform::unique_ptr::swap()'],['../namespacecutlass_1_1platform.html#a3e83320a39137d92042eb0bf93be9678',1,'cutlass::platform::swap()']]],
-  ['swizzle',['swizzle',['../structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8',1,'cutlass::gemm::IdentityBlockSwizzle']]]
+  ['params',['Params',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#afb39229d0ad334834cd2ba0c1fcc9412',1,'cutlass::gemm::GlobalLoadStreamPair::Params::Params()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#ab26c1aaa2b7709c32bab39801d6c7772',1,'cutlass::gemm::GlobalLoadStreamPair::Params::Params(typename StreamA::Params const &amp;_params_A, typename StreamB::Params const &amp;_params_B)'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ae515cd98a75ff3eafffcc69692d6301a',1,'cutlass::gemm::LinearScaling::Params::Params()'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#ae28323819fc8950bc0fee3a34b2184ff',1,'cutlass::gemm::LinearScalingDevicePtr::Params::Params()'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a26b04702140a550f3ab598132a74cd93',1,'cutlass::gemm::LinearScalingDevicePtr::Params::Params(Scalar alpha, Scalar beta)'],['../classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#a38aa3e6beb09c7c4bea952094a2ea682',1,'cutlass::gemm::LinearScalingDevicePtr::Params::Params(Scalar const *alpha_ptr, Scalar const *beta_ptr)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71',1,'cutlass::TileIteratorBase::Params::Params()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c',1,'cutlass::TileIteratorBase::Params::Params(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a',1,'cutlass::TileIteratorBase::Params::Params(Coord&lt; 4 &gt; const &amp;stride)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5',1,'cutlass::TileLoadIterator::Params::Params()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282',1,'cutlass::TileLoadIterator::Params::Params(Scalar const *ptr)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192',1,'cutlass::TileLoadIterator::Params::Params(TensorRef const &amp;ref)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e',1,'cutlass::TileLoadIterator::Params::Params(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a',1,'cutlass::TileLoadIterator::Params::Params(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a79304c022d2466c97cd671a98128815a',1,'cutlass::TileStoreIterator::Params::Params()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#ae1cb260e7b05034ec9b7fa61c92bbc80',1,'cutlass::TileStoreIterator::Params::Params(Scalar *ptr)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#afae37ebc78884290300f38fce7c021b1',1,'cutlass::TileStoreIterator::Params::Params(TensorRef const &amp;ref)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#aa131e0ef02ce37038c1a17bea7088ef6',1,'cutlass::TileStoreIterator::Params::Params(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w)'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a9cf4cd4ecb0a81cf3c03a70c7bfc4e09',1,'cutlass::TileStoreIterator::Params::Params(Scalar *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)'],['../structcutlass_1_1TileLoadStream_1_1Params.html#a90772ac34f8c49f049eb62fada0a2165',1,'cutlass::TileLoadStream::Params::Params()'],['../structcutlass_1_1TileLoadStream_1_1Params.html#a50f136516b139f011939015c8c417ddd',1,'cutlass::TileLoadStream::Params::Params(typename Iterator::Params const &amp;_iterator)'],['../structcutlass_1_1TileStoreStream_1_1Params.html#adfa2399bf13cdff16b7bfe1cb0dd2bd9',1,'cutlass::TileStoreStream::Params::Params()'],['../structcutlass_1_1TileStoreStream_1_1Params.html#acc400568f7694f818b5afbb109bd2e63',1,'cutlass::TileStoreStream::Params::Params(typename Iterator::Params const &amp;_iterator)'],['../structcutlass_1_1ZipTileIterator_1_1Params.html#a4ed93b5319fe96457caf53e9384722d4',1,'cutlass::ZipTileIterator::Params::Params()'],['../structcutlass_1_1ZipTileIterator_1_1Params.html#ad38f6a2cc5800c0ec82b12d183040390',1,'cutlass::ZipTileIterator::Params::Params(typename First::Params const &amp;_first, typename Second::Params const &amp;_second)']]],
+  ['polar',['polar',['../namespacecutlass_1_1platform.html#a6c9200b03868a5090027e5cfc8e27c62',1,'cutlass::platform']]],
+  ['predicatedtileloadstream',['PredicatedTileLoadStream',['../structcutlass_1_1PredicatedTileLoadStream.html#a672a8883d16eff4ecc90dc79162084d3',1,'cutlass::PredicatedTileLoadStream']]],
+  ['predicatedtilestorestream',['PredicatedTileStoreStream',['../structcutlass_1_1PredicatedTileStoreStream.html#ac4aafc6bcc6cf3bff5b31b9cd60fd667',1,'cutlass::PredicatedTileStoreStream']]],
+  ['predicatetileadapter',['PredicateTileAdapter',['../structcutlass_1_1PredicateTileAdapter.html#a4c9eb6c6498ccf117427a3b35f7ce5ea',1,'cutlass::PredicateTileAdapter']]],
+  ['predicatevector',['PredicateVector',['../structcutlass_1_1PredicateVector.html#aec1201df19c0ed0516810a3f19353c21',1,'cutlass::PredicateVector']]],
+  ['proj',['proj',['../namespacecutlass_1_1platform.html#a4e57cfad9bf0b78e338d536ff1bdda39',1,'cutlass::platform']]],
+  ['project',['project',['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html#ae91b2350374f1734a30cbed45e14b8e3',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kA, Kstrided &gt;::project()'],['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html#a0f1579013f56fe16ebc147271f163c3c',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kB, Kstrided &gt;::project()'],['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html#af2a323461334a6b55b95074a1973d250',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kC, true &gt;::project()'],['../structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html#ace04040ccb13af5f9a283ca80ffe93d1',1,'cutlass::gemm::ProjectOperand&lt; GemmOperand::kD, true &gt;::project()']]],
+  ['project_5fcoordinate',['project_coordinate',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001',1,'cutlass::gemm::GlobalLoadStream']]]
 ];
diff --git a/docs/search/groups_1.js b/docs/search/groups_1.js
index 5ebe29b05..5597eb84e 100644
--- a/docs/search/groups_1.js
+++ b/docs/search/groups_1.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['layout_20concept',['Layout Concept',['../group__layout__concept.html',1,'']]]
+  ['identity_20block_20swizzle',['Identity Block Swizzle',['../group__IdentityBlockSwizzle.html',1,'']]]
 ];
diff --git a/docs/search/groups_2.js b/docs/search/groups_2.js
index b7fc0e347..5ebe29b05 100644
--- a/docs/search/groups_2.js
+++ b/docs/search/groups_2.js
@@ -1,6 +1,4 @@
 var searchData=
 [
-  ['predicate_20iterator_20concept',['Predicate Iterator Concept',['../group__predicate__iterator__concept.html',1,'']]],
-  ['predicate_20tile_20adapter_20concept',['Predicate Tile Adapter Concept',['../group__predicate__tile__adapter.html',1,'']]],
-  ['predicate_20vector_20concept',['Predicate Vector Concept',['../group__predicate__vector__concept.html',1,'']]]
+  ['layout_20concept',['Layout Concept',['../group__layout__concept.html',1,'']]]
 ];
diff --git a/docs/search/groups_3.js b/docs/search/groups_3.js
index e48e674fa..b7fc0e347 100644
--- a/docs/search/groups_3.js
+++ b/docs/search/groups_3.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['tile_20load_20iterator_20concept',['Tile Load Iterator Concept',['../group__tile__load__iterator__concept.html',1,'']]],
-  ['tile_20store_20iterator_20concept',['Tile Store Iterator Concept',['../group__tile__store__iterator__concept.html',1,'']]],
-  ['tile_20traits_20concept',['Tile Traits Concept',['../group__tile__traits__concept.html',1,'']]]
+  ['predicate_20iterator_20concept',['Predicate Iterator Concept',['../group__predicate__iterator__concept.html',1,'']]],
+  ['predicate_20tile_20adapter_20concept',['Predicate Tile Adapter Concept',['../group__predicate__tile__adapter.html',1,'']]],
+  ['predicate_20vector_20concept',['Predicate Vector Concept',['../group__predicate__vector__concept.html',1,'']]]
 ];
diff --git a/docs/search/groups_4.html b/docs/search/groups_4.html
new file mode 100644
index 000000000..34edffce9
--- /dev/null
+++ b/docs/search/groups_4.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="groups_4.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/groups_4.js b/docs/search/groups_4.js
new file mode 100644
index 000000000..e48e674fa
--- /dev/null
+++ b/docs/search/groups_4.js
@@ -0,0 +1,6 @@
+var searchData=
+[
+  ['tile_20load_20iterator_20concept',['Tile Load Iterator Concept',['../group__tile__load__iterator__concept.html',1,'']]],
+  ['tile_20store_20iterator_20concept',['Tile Store Iterator Concept',['../group__tile__store__iterator__concept.html',1,'']]],
+  ['tile_20traits_20concept',['Tile Traits Concept',['../group__tile__traits__concept.html',1,'']]]
+];
diff --git a/docs/search/namespaces_0.js b/docs/search/namespaces_0.js
index 538984567..04a4d974a 100644
--- a/docs/search/namespaces_0.js
+++ b/docs/search/namespaces_0.js
@@ -1,6 +1,7 @@
 var searchData=
 [
   ['cutlass',['cutlass',['../namespacecutlass.html',1,'']]],
+  ['detail',['detail',['../namespacecutlass_1_1detail.html',1,'cutlass']]],
   ['gemm',['gemm',['../namespacecutlass_1_1gemm.html',1,'cutlass']]],
   ['platform',['platform',['../namespacecutlass_1_1platform.html',1,'cutlass']]]
 ];
diff --git a/docs/search/searchdata.js b/docs/search/searchdata.js
index 556504886..d9737d431 100644
--- a/docs/search/searchdata.js
+++ b/docs/search/searchdata.js
@@ -1,16 +1,16 @@
 var indexSectionsWithContent =
 {
-  0: "_abcdefghiklmnoprstuvwy~",
-  1: "abcdefghilmnprstuvw",
+  0: "_abcdefghiklmnoprstuvwyz~",
+  1: "abcdefghiklmnprstuvwz",
   2: "c",
-  3: "cdfghilmprstvw",
-  4: "_abcdefghilmoprstuvw~",
-  5: "abcdefgiklmnprstv",
-  6: "abcdefgilmnopstvwy",
+  3: "cdfghiklmnprstvwz",
+  4: "_abcdefghiklmnoprstuvwz~",
+  5: "abcdefgiklmnoprstv",
+  6: "abcdefgiklmnopstvwy",
   7: "k",
-  8: "akmv",
+  8: "abkmov",
   9: "_cns",
-  10: "flpt"
+  10: "filpt"
 };
 
 var indexSectionNames =
diff --git a/docs/search/typedefs_0.js b/docs/search/typedefs_0.js
index fc2d59d1a..651158735 100644
--- a/docs/search/typedefs_0.js
+++ b/docs/search/typedefs_0.js
@@ -1,7 +1,8 @@
 var searchData=
 [
-  ['accesstype',['AccessType',['../structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7',1,'cutlass::FragmentIterator::AccessType()'],['../structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b',1,'cutlass::FragmentConstIterator::AccessType()'],['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar__a157bdca477e8efca5bc9cda0db6db8e.html#a0b656c41b9fff6402f33e95204ce8860',1,'cutlass::FragmentLoad&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::AccessType()'],['../structcutlass_1_1FragmentLoad_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___00_9bf6f8f94e2cd7f3702b853d418a9863.html#a7eccab04c8d3968e74486d0525a3fa02',1,'cutlass::FragmentLoad&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::AccessType()'],['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kWmmaMatrix_00_01kAccessSize_00_01Scalar_00c2299561c3ffbb17f8afc6add32eba.html#abca5165caae7304f33fcad267c16b002',1,'cutlass::FragmentStore&lt; IteratorFragment::kWmmaMatrix, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::AccessType()'],['../structcutlass_1_1FragmentStore_3_01IteratorFragment_1_1kScalar_00_01kAccessSize_00_01Scalar___0087787c90510d0c4c07703b5a90c263de.html#a87d46956aa317f06f2ba9a535fdfc5da',1,'cutlass::FragmentStore&lt; IteratorFragment::kScalar, kAccessSize, Scalar_, Memory_, FragmentElement_, kStride &gt;::AccessType()'],['../structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae',1,'cutlass::Load::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a5d7ed0abaeea99ec3399f8eea930f761',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#a2b9faed8d92f55a46e313d79d214316d',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#a8611550c045d6def964d9dafb2be80c6',1,'cutlass::Load&lt; double, 2, Memory_, true, 16 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#a942970f88e13c88f496a9da67ed47a6f',1,'cutlass::Load&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::AccessType()'],['../structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942',1,'cutlass::Store::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_014_01_4.html#a89f329ba11f96ee3ce4428cbc792ac3d',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 4 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_018_01_4.html#ac0af6ae18137156abe24d6479232b955',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 8 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01true_00_0116_01_4.html#ad073f5e8252ad24b086f14bd2a109cf9',1,'cutlass::Store&lt; double, 2, Memory_, true, 16 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01Lanes___00_01Memory___00_01true_00_0116_01_4.html#aeb70e4859e2795b6af63ad5e203b4da9',1,'cutlass::Store&lt; Scalar_, Lanes_, Memory_, true, 16 &gt;::AccessType()'],['../structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53',1,'cutlass::TileIteratorBase::AccessType()'],['../structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0',1,'cutlass::TileLoadIterator::AccessType()'],['../structcutlass_1_1TileStoreIterator.html#a0e79ed59263ebc3478c43f2f9a50cb5a',1,'cutlass::TileStoreIterator::AccessType()']]],
-  ['accumulators',['Accumulators',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce',1,'cutlass::gemm::GemmEpilogue::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2',1,'cutlass::gemm::GemmEpilogueTraits::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54',1,'cutlass::gemm::GemmConfig::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a505306c2af2059f6e84ba32d701d1602',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a4712650b46b6183ea60d79ef18f55b86',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d',1,'cutlass::gemm::ThreadMultiplyAdd::Accumulators()']]],
-  ['accumulatorsperthread',['AccumulatorsPerThread',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a98d0f84730551eaabfe7404b36478b50',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a47807c9c9fb43e7f7b5f409a49986c30',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5',1,'cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerThread()']]],
-  ['accumulatorsperwarp',['AccumulatorsPerWarp',['../structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108',1,'cutlass::gemm::GemmConfig::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af0c856abdd9f7f26f671493cc629bf0a',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a327ce1b7b6478c27c80baf5d9e26bdbc',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77',1,'cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerWarp()']]]
+  ['accesstype',['AccessType',['../structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7',1,'cutlass::FragmentIterator::AccessType()'],['../structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b',1,'cutlass::FragmentConstIterator::AccessType()'],['../structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8',1,'cutlass::Load::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57',1,'cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::AccessType()'],['../structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7',1,'cutlass::Store::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44',1,'cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab',1,'cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301',1,'cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a',1,'cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9',1,'cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385',1,'cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;::AccessType()'],['../structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973',1,'cutlass::TileIteratorBase::AccessType()'],['../structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125',1,'cutlass::TileLoadIterator::AccessType()'],['../structcutlass_1_1TileStoreIterator.html#a10431ed94c0dd66a8c1d01ba7c8b5aa2',1,'cutlass::TileStoreIterator::AccessType()']]],
+  ['accumulators',['Accumulators',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591',1,'cutlass::gemm::GemmConfig::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce',1,'cutlass::gemm::GemmEpilogue::Accumulators()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4',1,'cutlass::gemm::GemmEpilogueTraits::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::Accumulators()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6',1,'cutlass::gemm::ThreadMultiplyAdd::Accumulators()']]],
+  ['accumulatorsperthread',['AccumulatorsPerThread',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerThread()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d',1,'cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerThread()']]],
+  ['accumulatorsperwarp',['AccumulatorsPerWarp',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3',1,'cutlass::gemm::GemmConfig::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::AccumulatorsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e',1,'cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerWarp()']]],
+  ['atype',['AType',['../structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037',1,'cutlass::gemm::GemmDesc']]]
 ];
diff --git a/docs/search/typedefs_1.js b/docs/search/typedefs_1.js
index e1e869f3d..45a9fd779 100644
--- a/docs/search/typedefs_1.js
+++ b/docs/search/typedefs_1.js
@@ -1,6 +1,7 @@
 var searchData=
 [
-  ['base',['Base',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160',1,'cutlass::gemm::GlobalLoadStream::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a',1,'cutlass::gemm::GemmGlobalTileCdTraits::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed',1,'cutlass::gemm::GemmGlobalIteratorAb::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5',1,'cutlass::gemm::GemmGlobalIteratorCd::Base()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Base()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04',1,'cutlass::gemm::IgemmEpilogue::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#ab19f72d239f639f261fbb63f72f10acf',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::Base()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#affd04d88a0bbef13c54f10000a5dc15d',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aef7047c6a0d0c3db0bfb6bec08520aad',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Base()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Base()'],['../classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4',1,'cutlass::TensorView::Base()'],['../structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3',1,'cutlass::TileLoadIterator::Base()'],['../structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67',1,'cutlass::TileStoreIterator::Base()']]],
-  ['baseparams',['BaseParams',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517',1,'cutlass::gemm::GemmGlobalIteratorAb::BaseParams()'],['../structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76',1,'cutlass::TileLoadIterator::BaseParams()'],['../structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0',1,'cutlass::TileStoreIterator::BaseParams()']]],
-  ['blockswizzle',['BlockSwizzle',['../structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941',1,'cutlass::gemm::GemmTraits']]]
+  ['base',['Base',['../structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b',1,'cutlass::gemm::GemmCoord::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a581b7cdeef3e620f246923fa07f9db5a',1,'cutlass::gemm::GemmGlobalTileCdTraits::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed',1,'cutlass::gemm::GemmGlobalIteratorAb::Base()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5',1,'cutlass::gemm::GemmGlobalIteratorCd::Base()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Base()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7ec19bf90207a7f598f2ec5166649495',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aca63ec1099444c555299dc144282dded',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a4b23ba8c14e26672a516aa43063250c2',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04',1,'cutlass::gemm::IgemmEpilogue::Base()'],['../structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf',1,'cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c',1,'cutlass::gemm::IgemmGlobalTileTraits::Base()'],['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a82a9cfc61ecc117592bdb30f57bd35c9',1,'cutlass::gemm::IgemmGlobalIteratorAb::Base()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::Base()'],['../structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85',1,'cutlass::gemm::LinearScalingDevicePtr::Base()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Base()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aea87c73ae2d4e027014ebd4d8141c89e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Base()'],['../structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d',1,'cutlass::MatrixCoord::Base()'],['../structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000',1,'cutlass::TensorRefBatchStrided::Base()'],['../classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6',1,'cutlass::TensorView::Base()'],['../structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca',1,'cutlass::TileCoord::Base()'],['../structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264',1,'cutlass::TileLoadIterator::Base()'],['../structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48',1,'cutlass::TileStoreIterator::Base()'],['../structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1',1,'cutlass::PredicatedTileLoadStream::Base()'],['../structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b',1,'cutlass::PredicatedTileStoreStream::Base()']]],
+  ['baseparams',['BaseParams',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517',1,'cutlass::gemm::GemmGlobalIteratorAb::BaseParams()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::BaseParams()'],['../structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e',1,'cutlass::TileLoadIterator::BaseParams()'],['../structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66',1,'cutlass::TileStoreIterator::BaseParams()']]],
+  ['blockswizzle',['BlockSwizzle',['../structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941',1,'cutlass::gemm::GemmTraits']]],
+  ['btype',['BType',['../structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49',1,'cutlass::gemm::GemmDesc']]]
 ];
diff --git a/docs/search/typedefs_10.js b/docs/search/typedefs_10.js
index e488958fd..4d47f80af 100644
--- a/docs/search/typedefs_10.js
+++ b/docs/search/typedefs_10.js
@@ -1,4 +1,6 @@
 var searchData=
 [
-  ['warps',['Warps',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4',1,'cutlass::gemm::GemmSharedLoadTileATraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd',1,'cutlass::gemm::GemmConfig::Warps()']]]
+  ['value_5ftype',['value_type',['../classcutlass_1_1platform_1_1complex.html#aa7c319b0c67f8ffeee3d1bb4b83ea0d6',1,'cutlass::platform::complex::value_type()'],['../structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd',1,'cutlass::platform::integral_constant::value_type()']]],
+  ['vector',['Vector',['../structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2',1,'cutlass::VectorTraits::Vector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Vector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Vector()']]],
+  ['vectorizedtile',['VectorizedTile',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac',1,'cutlass::gemm::GemmGlobalTileTraits']]]
 ];
diff --git a/docs/search/typedefs_11.js b/docs/search/typedefs_11.js
index d8526488a..1ad66a092 100644
--- a/docs/search/typedefs_11.js
+++ b/docs/search/typedefs_11.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['yes',['yes',['../structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669',1,'cutlass::platform::is_base_of_helper']]]
+  ['warps',['Warps',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3',1,'cutlass::gemm::GemmConfig::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaff4a5e0f9e4256f184a22cad0ce8cf4',1,'cutlass::gemm::GemmSharedLoadTileATraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7ad7a4e33ed43926e165e66162eb620b',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af4597927405d8bb1ad2c464fad064703',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Warps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Warps()']]]
 ];
diff --git a/docs/search/typedefs_12.html b/docs/search/typedefs_12.html
new file mode 100644
index 000000000..b1382a290
--- /dev/null
+++ b/docs/search/typedefs_12.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="typedefs_12.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/typedefs_12.js b/docs/search/typedefs_12.js
new file mode 100644
index 000000000..d8526488a
--- /dev/null
+++ b/docs/search/typedefs_12.js
@@ -0,0 +1,4 @@
+var searchData=
+[
+  ['yes',['yes',['../structcutlass_1_1platform_1_1is__base__of__helper.html#ac1cf3f804e7686213fd42c678cc6d669',1,'cutlass::platform::is_base_of_helper']]]
+];
diff --git a/docs/search/typedefs_2.js b/docs/search/typedefs_2.js
index d216b1090..3fe0e321e 100644
--- a/docs/search/typedefs_2.js
+++ b/docs/search/typedefs_2.js
@@ -1,6 +1,9 @@
 var searchData=
 [
-  ['clearaccumulators',['ClearAccumulators',['../structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165',1,'cutlass::gemm::GemmTraits::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041',1,'cutlass::gemm::HgemmTraitsHelper::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5',1,'cutlass::gemm::IgemmTraitsHelper::ClearAccumulators()']]],
-  ['consttensorref_5ft',['ConstTensorRef_t',['../classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830',1,'cutlass::TensorView']]],
-  ['coord_5ft',['Coord_t',['../classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017',1,'cutlass::TensorView']]]
+  ['clearaccumulators',['ClearAccumulators',['../structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165',1,'cutlass::gemm::GemmTraits::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6',1,'cutlass::gemm::HgemmTraitsHelper::ClearAccumulators()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760',1,'cutlass::gemm::IgemmTraitsHelper::ClearAccumulators()']]],
+  ['consttensorref',['ConstTensorRef',['../classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17',1,'cutlass::TensorRef::ConstTensorRef()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::ConstTensorRef()'],['../classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57',1,'cutlass::TensorView::ConstTensorRef()'],['../structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033',1,'cutlass::TileAllocation::ConstTensorRef()'],['../structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4',1,'cutlass::ZipTileAllocation::ConstTensorRef()']]],
+  ['consttensorref_5ft',['ConstTensorRef_t',['../classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165',1,'cutlass::TensorView']]],
+  ['consttensorview',['ConstTensorView',['../classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719',1,'cutlass::TensorView']]],
+  ['coord_5ft',['Coord_t',['../classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6',1,'cutlass::TensorRef::Coord_t()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Coord_t()'],['../classcutlass_1_1TensorView.html#ab16a0244199ca2800ea5460ed8ed6ae2',1,'cutlass::TensorView::Coord_t()']]],
+  ['ctype',['CType',['../structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704',1,'cutlass::gemm::GemmDesc']]]
 ];
diff --git a/docs/search/typedefs_3.js b/docs/search/typedefs_3.js
index 1c82be67f..c42930812 100644
--- a/docs/search/typedefs_3.js
+++ b/docs/search/typedefs_3.js
@@ -1,5 +1,6 @@
 var searchData=
 [
   ['deleter_5ftype',['deleter_type',['../classcutlass_1_1platform_1_1unique__ptr.html#a85cab9945c36dc56bd7d6adf30c0d252',1,'cutlass::platform::unique_ptr']]],
-  ['delta',['Delta',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae',1,'cutlass::gemm::GemmEpilogueTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aede069e51e0732a9648c437261bd4d66',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Delta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f',1,'cutlass::gemm::GemmGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4',1,'cutlass::gemm::GemmGlobalTileCdTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea',1,'cutlass::gemm::GemmSharedLoadTileATraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Delta()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Delta()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a08dada072eefded4c859df4e5fc25ca6',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Delta()'],['../structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb',1,'cutlass::TileTraits::Delta()'],['../structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088',1,'cutlass::TileIteratorBase::Delta()'],['../structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf',1,'cutlass::TileLoadIterator::Delta()'],['../structcutlass_1_1TileStoreIterator.html#a1c433ba0eea5e6a46f36101d8de98ed0',1,'cutlass::TileStoreIterator::Delta()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5',1,'cutlass::TileTraitsStrideMajor::Delta()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896',1,'cutlass::TileTraitsContiguousMajor::Delta()'],['../structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe',1,'cutlass::TileTraitsWarpRake::Delta()']]]
+  ['delta',['Delta',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da',1,'cutlass::gemm::GemmEpilogueTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aede069e51e0732a9648c437261bd4d66',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Delta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f',1,'cutlass::gemm::GemmGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4',1,'cutlass::gemm::GemmGlobalTileCdTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a645f65f7d8f123936b286521df470224',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#afd691b764b7d105a1ed41dada6049e71',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024',1,'cutlass::gemm::GemmSharedLoadTileATraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a5587ef22f419ab9a7c6117917cc99c57',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Delta()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Delta()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aed055504ec5f09657e059416150188a9',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Delta()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#adab639892c3586464e2ea5f947b9e0f0',1,'cutlass::gemm::IgemmGlobalTileTraits::Delta()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002',1,'cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Delta()'],['../structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82',1,'cutlass::TileTraits::Delta()'],['../structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360',1,'cutlass::RegularTilePredicateFunctor::Delta()'],['../structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815',1,'cutlass::TileIteratorBase::Delta()'],['../structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604',1,'cutlass::TileLoadIterator::Delta()'],['../structcutlass_1_1TileStoreIterator.html#afdb38f790d9c7cf1ac238643103b45ce',1,'cutlass::TileStoreIterator::Delta()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5',1,'cutlass::TileTraitsStrideMajor::Delta()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896',1,'cutlass::TileTraitsContiguousMajor::Delta()'],['../structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe',1,'cutlass::TileTraitsWarpRake::Delta()']]],
+  ['dtype',['DType',['../structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd',1,'cutlass::gemm::GemmDesc']]]
 ];
diff --git a/docs/search/typedefs_4.js b/docs/search/typedefs_4.js
index 6415af337..2c50d31a6 100644
--- a/docs/search/typedefs_4.js
+++ b/docs/search/typedefs_4.js
@@ -2,5 +2,5 @@ var searchData=
 [
   ['element',['Element',['../structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab',1,'cutlass::Fragment::Element()'],['../structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d',1,'cutlass::FragmentIterator::Element()'],['../structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706',1,'cutlass::FragmentConstIterator::Element()']]],
   ['element_5ftype',['element_type',['../classcutlass_1_1platform_1_1unique__ptr.html#a94cea0ebf2ac4bec69dfa1f80ea07d50',1,'cutlass::platform::unique_ptr']]],
-  ['epilogue',['Epilogue',['../structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe',1,'cutlass::gemm::GemmTraits::Epilogue()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98',1,'cutlass::gemm::HgemmTraitsHelper::Epilogue()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651',1,'cutlass::gemm::IgemmTraitsHelper::Epilogue()']]]
+  ['epilogue',['Epilogue',['../structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe',1,'cutlass::gemm::GemmTraits::Epilogue()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae',1,'cutlass::gemm::HgemmTraitsHelper::Epilogue()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915',1,'cutlass::gemm::IgemmTraitsHelper::Epilogue()']]]
 ];
diff --git a/docs/search/typedefs_5.js b/docs/search/typedefs_5.js
index 84d69abc4..37a4cd06f 100644
--- a/docs/search/typedefs_5.js
+++ b/docs/search/typedefs_5.js
@@ -1,14 +1,15 @@
 var searchData=
 [
   ['false_5ftype',['false_type',['../namespacecutlass_1_1platform.html#ad8c95b2109070847b13d355120344380',1,'cutlass::platform']]],
-  ['fetchedfragment',['FetchedFragment',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36',1,'cutlass::gemm::GlobalLoadStreamBase::FetchedFragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7',1,'cutlass::gemm::SharedLoadStream::FetchedFragment()']]],
-  ['fragment',['Fragment',['../structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808',1,'cutlass::FragmentIterator::Fragment()'],['../structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05',1,'cutlass::FragmentConstIterator::Fragment()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be',1,'cutlass::gemm::GlobalLoadStreamBase::Fragment()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4',1,'cutlass::gemm::GemmGlobalIteratorAb::Fragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7',1,'cutlass::gemm::SharedLoadStream::Fragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7',1,'cutlass::gemm::HgemmSwizzle::Fragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d',1,'cutlass::gemm::IgemmSwizzle::Fragment()'],['../structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e',1,'cutlass::TileIteratorBase::Fragment()'],['../structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc',1,'cutlass::TileLoadIterator::Fragment()'],['../structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1',1,'cutlass::TileStoreIterator::Fragment()']]],
-  ['fragmenta',['FragmentA',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1daf96b6d152c5cf32f248bbfd605b74',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a71aadbb130d4b1a6532c45282b37354f',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914',1,'cutlass::gemm::ThreadMultiplyAdd::FragmentA()']]],
-  ['fragmentb',['FragmentB',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae79e7fc5be2f4c8d30ca83edc151f63a',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a43e278686b493d0aef943f32a9f47b9e',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620',1,'cutlass::gemm::ThreadMultiplyAdd::FragmentB()']]],
-  ['fragmentconstiterator',['FragmentConstIterator',['../structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60',1,'cutlass::TileIteratorBase::FragmentConstIterator()'],['../structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76',1,'cutlass::TileLoadIterator::FragmentConstIterator()'],['../structcutlass_1_1TileStoreIterator.html#a48de0db7ee2ee9699b946a9d5a0364c7',1,'cutlass::TileStoreIterator::FragmentConstIterator()']]],
-  ['fragmentelement',['FragmentElement',['../structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7',1,'cutlass::TileIteratorBase::FragmentElement()'],['../structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464',1,'cutlass::TileLoadIterator::FragmentElement()'],['../structcutlass_1_1TileStoreIterator.html#a2b13136a970fae187fcb377c9be28fac',1,'cutlass::TileStoreIterator::FragmentElement()']]],
-  ['fragmentiterator',['FragmentIterator',['../structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5',1,'cutlass::TileIteratorBase::FragmentIterator()'],['../structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591',1,'cutlass::TileLoadIterator::FragmentIterator()'],['../structcutlass_1_1TileStoreIterator.html#a0843b2d82422e7178f324a8d3be9d705',1,'cutlass::TileStoreIterator::FragmentIterator()']]],
+  ['fetchedfragment',['FetchedFragment',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf',1,'cutlass::gemm::GlobalLoadStream::FetchedFragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7',1,'cutlass::gemm::SharedLoadStream::FetchedFragment()']]],
+  ['first',['First',['../structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2',1,'cutlass::ZipTileAllocation::First()'],['../structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4',1,'cutlass::ZipFragment::First()'],['../structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4',1,'cutlass::ZipConvert::First()'],['../structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9',1,'cutlass::ZipTensorRef::First()'],['../classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7',1,'cutlass::ZipTileIterator::First()']]],
+  ['fragment',['Fragment',['../structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808',1,'cutlass::FragmentIterator::Fragment()'],['../structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05',1,'cutlass::FragmentConstIterator::Fragment()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106',1,'cutlass::gemm::GlobalLoadStream::Fragment()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4',1,'cutlass::gemm::GemmGlobalIteratorAb::Fragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7',1,'cutlass::gemm::SharedLoadStream::Fragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a82dc6d9a10de7aba9a69e6025b2cc2b7',1,'cutlass::gemm::HgemmSwizzle::Fragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a67693ee79f93cb61fc37f2e632eaea8d',1,'cutlass::gemm::IgemmSwizzle::Fragment()'],['../structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219',1,'cutlass::TileIteratorBase::Fragment()'],['../structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139',1,'cutlass::TileLoadIterator::Fragment()'],['../structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb',1,'cutlass::TileStoreIterator::Fragment()'],['../structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81',1,'cutlass::TileLoadStream::Fragment()'],['../structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878',1,'cutlass::TileStoreStream::Fragment()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a7f802c4c733375d0a63f91c58196e6a0',1,'cutlass::PredicatedTileLoadStream::Fragment()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a6c9737f5b09e7eb1aa7daabb00ae2e69',1,'cutlass::PredicatedTileStoreStream::Fragment()'],['../classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06',1,'cutlass::ZipTileIterator::Fragment()']]],
+  ['fragmenta',['FragmentA',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649',1,'cutlass::gemm::ThreadMultiplyAdd::FragmentA()']]],
+  ['fragmentb',['FragmentB',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::FragmentB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad',1,'cutlass::gemm::ThreadMultiplyAdd::FragmentB()']]],
+  ['fragmentconstiterator',['FragmentConstIterator',['../structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5',1,'cutlass::TileIteratorBase::FragmentConstIterator()'],['../structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca',1,'cutlass::TileLoadIterator::FragmentConstIterator()'],['../structcutlass_1_1TileStoreIterator.html#adfcd8a2e63bd0c515ef03760cc1c4283',1,'cutlass::TileStoreIterator::FragmentConstIterator()']]],
+  ['fragmentelement',['FragmentElement',['../structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45',1,'cutlass::TileIteratorBase::FragmentElement()'],['../structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6',1,'cutlass::TileLoadIterator::FragmentElement()'],['../structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8',1,'cutlass::TileStoreIterator::FragmentElement()']]],
+  ['fragmentiterator',['FragmentIterator',['../structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51',1,'cutlass::TileIteratorBase::FragmentIterator()'],['../structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016',1,'cutlass::TileLoadIterator::FragmentIterator()'],['../structcutlass_1_1TileStoreIterator.html#ace8a65d90db264a0ee93a810be38918f',1,'cutlass::TileStoreIterator::FragmentIterator()']]],
   ['fragmentmultiplyadd',['FragmentMultiplyAdd',['../structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8',1,'cutlass::gemm::LinearScaling']]],
-  ['fragmentshape',['FragmentShape',['../structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76',1,'cutlass::FragmentIterator::FragmentShape()'],['../structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577',1,'cutlass::FragmentConstIterator::FragmentShape()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4',1,'cutlass::gemm::HgemmSwizzle::FragmentShape()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004',1,'cutlass::gemm::IgemmSwizzle::FragmentShape()'],['../structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24',1,'cutlass::TileIteratorBase::FragmentShape()'],['../structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869',1,'cutlass::TileLoadIterator::FragmentShape()'],['../structcutlass_1_1TileStoreIterator.html#a3b872e85844c9e009fa480a71a829136',1,'cutlass::TileStoreIterator::FragmentShape()']]],
-  ['functor',['Functor',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1',1,'cutlass::gemm::GemmEpilogue::Functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee',1,'cutlass::gemm::GemmEpilogueTraits::Functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Functor()']]]
+  ['fragmentshape',['FragmentShape',['../structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76',1,'cutlass::FragmentIterator::FragmentShape()'],['../structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577',1,'cutlass::FragmentConstIterator::FragmentShape()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#afe44fedcf24b90c0cf6ac7d1495b89e4',1,'cutlass::gemm::HgemmSwizzle::FragmentShape()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a13a3b052cd8b714471489a9cc4dc7004',1,'cutlass::gemm::IgemmSwizzle::FragmentShape()'],['../structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be',1,'cutlass::TileIteratorBase::FragmentShape()'],['../structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1',1,'cutlass::TileLoadIterator::FragmentShape()'],['../structcutlass_1_1TileStoreIterator.html#a82ceeea55603dbb0c6e5bf9c22ac692e',1,'cutlass::TileStoreIterator::FragmentShape()']]],
+  ['functor',['Functor',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1',1,'cutlass::gemm::GemmEpilogue::Functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99',1,'cutlass::gemm::GemmEpilogueTraits::Functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Functor()']]]
 ];
diff --git a/docs/search/typedefs_6.js b/docs/search/typedefs_6.js
index 84c6585cf..aac9a6750 100644
--- a/docs/search/typedefs_6.js
+++ b/docs/search/typedefs_6.js
@@ -1,23 +1,25 @@
 var searchData=
 [
-  ['gemmconfig',['GemmConfig',['../structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5',1,'cutlass::gemm::GemmTraits::GemmConfig()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118',1,'cutlass::gemm::HgemmTraitsHelper::GemmConfig()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac',1,'cutlass::gemm::IgemmTraitsHelper::GemmConfig()']]],
-  ['gemmepiloguetraits',['GemmEpilogueTraits',['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6',1,'cutlass::gemm::HgemmTraitsHelper']]],
-  ['gemmtiletraitshelpera',['GemmTileTraitsHelperA',['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417',1,'cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf',1,'cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperA()']]],
-  ['gemmtiletraitshelperb',['GemmTileTraitsHelperB',['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89',1,'cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8',1,'cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperB()']]],
+  ['gemmconfig',['GemmConfig',['../structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5',1,'cutlass::gemm::GemmTraits::GemmConfig()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4',1,'cutlass::gemm::HgemmTraitsHelper::GemmConfig()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71',1,'cutlass::gemm::IgemmTraitsHelper::GemmConfig()']]],
+  ['gemmepiloguetraits',['GemmEpilogueTraits',['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047',1,'cutlass::gemm::HgemmTraitsHelper']]],
+  ['gemmtiletraitshelpera',['GemmTileTraitsHelperA',['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02',1,'cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3',1,'cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperA()']]],
+  ['gemmtiletraitshelperb',['GemmTileTraitsHelperB',['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d',1,'cutlass::gemm::HgemmTraitsHelper::GemmTileTraitsHelperB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685',1,'cutlass::gemm::IgemmTraitsHelper::GemmTileTraitsHelperB()']]],
   ['globalfragmentc',['GlobalFragmentC',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e',1,'cutlass::gemm::IgemmEpilogueTraitsHelper']]],
   ['globalfragmentd',['GlobalFragmentD',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88',1,'cutlass::gemm::IgemmEpilogueTraitsHelper']]],
   ['globaliterator',['GlobalIterator',['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a56d3f2606f9464ec57aa61aae378c642',1,'cutlass::gemm::HgemmSwizzle::GlobalIterator()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a880878914c25db44a1781725c24af514',1,'cutlass::gemm::IgemmSwizzle::GlobalIterator()']]],
-  ['globalloaditeratora',['GlobalLoadIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorA()']]],
-  ['globalloaditeratorb',['GlobalLoadIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorB()']]],
-  ['globalloaditeratorc',['GlobalLoadIteratorC',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a',1,'cutlass::gemm::GemmEpilogue::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2',1,'cutlass::gemm::GemmEpilogueTraits::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalLoadIteratorC()']]],
-  ['globalloadstreama',['GlobalLoadStreamA',['../structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47',1,'cutlass::gemm::GemmTraits::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamA()']]],
-  ['globalloadstreamb',['GlobalLoadStreamB',['../structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b',1,'cutlass::gemm::GemmTraits::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamB()']]],
+  ['globalloaditerator',['GlobalLoadIterator',['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalLoadIterator()']]],
+  ['globalloaditeratora',['GlobalLoadIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorA()']]],
+  ['globalloaditeratorb',['GlobalLoadIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadIteratorB()']]],
+  ['globalloaditeratorc',['GlobalLoadIteratorC',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a',1,'cutlass::gemm::GemmEpilogue::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24',1,'cutlass::gemm::GemmEpilogueTraits::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadIteratorC()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalLoadIteratorC()']]],
+  ['globalloadstream',['GlobalLoadStream',['../structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8',1,'cutlass::gemm::GemmTraits']]],
+  ['globalloadstreama',['GlobalLoadStreamA',['../structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47',1,'cutlass::gemm::GemmTraits::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamA()']]],
+  ['globalloadstreamb',['GlobalLoadStreamB',['../structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b',1,'cutlass::gemm::GemmTraits::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba',1,'cutlass::gemm::HgemmTraitsHelper::GlobalLoadStreamB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8',1,'cutlass::gemm::IgemmTraitsHelper::GlobalLoadStreamB()']]],
   ['globalloadtiletraits',['GlobalLoadTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aaa009025dcd6360ead1dc18005688821',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalLoadTileTraits()']]],
-  ['globalstoreiteratord',['GlobalStoreIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4',1,'cutlass::gemm::GemmEpilogue::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1',1,'cutlass::gemm::GemmEpilogueTraits::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalStoreIteratorD()']]],
+  ['globalstoreiteratord',['GlobalStoreIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4',1,'cutlass::gemm::GemmEpilogue::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02',1,'cutlass::gemm::GemmEpilogueTraits::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalStoreIteratorD()']]],
   ['globalstoretiletraits',['GlobalStoreTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a16b06a1611dbd22adaa0c9ee5e1b15bd',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalStoreTileTraits()']]],
-  ['globaltiletraits',['GlobalTileTraits',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a738774d1eb79de7e29c372ddfd48258d',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a24f38105e3c331c733cb672c3a9be588',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()']]],
-  ['globaltransformera',['GlobalTransformerA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647',1,'cutlass::gemm::HgemmTraitsHelper::GlobalTransformerA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d',1,'cutlass::gemm::IgemmTraitsHelper::GlobalTransformerA()']]],
-  ['globaltransformerb',['GlobalTransformerB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de',1,'cutlass::gemm::HgemmTraitsHelper::GlobalTransformerB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9',1,'cutlass::gemm::IgemmTraitsHelper::GlobalTransformerB()']]],
-  ['globaltransformerc',['GlobalTransformerC',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9',1,'cutlass::gemm::GemmEpilogue::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa',1,'cutlass::gemm::GemmEpilogueTraits::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalTransformerC()']]],
-  ['globaltransformerd',['GlobalTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7',1,'cutlass::gemm::GemmEpilogue::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7',1,'cutlass::gemm::GemmEpilogueTraits::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalTransformerD()']]]
+  ['globaltiletraits',['GlobalTileTraits',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a66f11407e9f5bf0d6123c81dfee6b330',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a125c9a43da3bcdc00d5194a1376f613c',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::GlobalTileTraits()']]],
+  ['globaltransformera',['GlobalTransformerA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60',1,'cutlass::gemm::HgemmTraitsHelper::GlobalTransformerA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb',1,'cutlass::gemm::IgemmTraitsHelper::GlobalTransformerA()']]],
+  ['globaltransformerb',['GlobalTransformerB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::GlobalTransformerB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184',1,'cutlass::gemm::HgemmTraitsHelper::GlobalTransformerB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2',1,'cutlass::gemm::IgemmTraitsHelper::GlobalTransformerB()']]],
+  ['globaltransformerc',['GlobalTransformerC',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9',1,'cutlass::gemm::GemmEpilogue::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d',1,'cutlass::gemm::GemmEpilogueTraits::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerC()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalTransformerC()']]],
+  ['globaltransformerd',['GlobalTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7',1,'cutlass::gemm::GemmEpilogue::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6',1,'cutlass::gemm::GemmEpilogueTraits::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43',1,'cutlass::gemm::GemmEpilogueTraitsHelper::GlobalTransformerD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::GlobalTransformerD()']]]
 ];
diff --git a/docs/search/typedefs_7.js b/docs/search/typedefs_7.js
index ec9235483..8920b6049 100644
--- a/docs/search/typedefs_7.js
+++ b/docs/search/typedefs_7.js
@@ -1,11 +1,11 @@
 var searchData=
 [
   ['igemmconfig',['IgemmConfig',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5a52727bb9b5d5f8afa7d0384f564036',1,'cutlass::gemm::IgemmEpilogueTraitsHelper']]],
-  ['immediateoffsetstrides',['ImmediateOffsetStrides',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf',1,'cutlass::gemm::GemmGlobalTileTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c',1,'cutlass::gemm::GemmGlobalTileCdTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368',1,'cutlass::gemm::GemmSharedLoadTileATraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::ImmediateOffsetStrides()'],['../structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8',1,'cutlass::TileIteratorBase::ImmediateOffsetStrides()']]],
-  ['index',['Index',['../structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34',1,'cutlass::gemm::Gemm::Index()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e',1,'cutlass::gemm::GemmEpilogue::Index()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331',1,'cutlass::gemm::GemmEpilogueTraits::Index()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2',1,'cutlass::gemm::GlobalLoadStreamBase::Index()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f',1,'cutlass::gemm::GemmGlobalIteratorAb::Index()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f',1,'cutlass::gemm::GemmGlobalIteratorCd::Index()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367',1,'cutlass::gemm::GemmTraits::Index()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Index()'],['../structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3',1,'cutlass::TileIteratorBase::Index()'],['../structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36',1,'cutlass::TileLoadIterator::Index()'],['../structcutlass_1_1TileStoreIterator.html#a5ac2280dfcac08cec17b8c0db1c4593e',1,'cutlass::TileStoreIterator::Index()']]],
-  ['inputfragment',['InputFragment',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::InputFragment()'],['../structcutlass_1_1Copy.html#aed254bbc1ad94ed9d335ab02f199ceb1',1,'cutlass::Copy::InputFragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ab5fab63d83eb0444c08bda16491d2627',1,'cutlass::gemm::HgemmSwizzle::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c',1,'cutlass::gemm::IgemmFloatToInt8Converter::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb',1,'cutlass::gemm::IgemmInt8ToFloatConverter::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727',1,'cutlass::gemm::IgemmSwizzle::InputFragment()']]],
-  ['instructionshape',['InstructionShape',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13',1,'cutlass::gemm::FragmentMultiplyAdd::InstructionShape()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#ab16a3d8adda89cc4f9765116ea75a4b7',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b',1,'cutlass::gemm::GemmConfig::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa56cdefa659af5ce4efd493b94bafdfd',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#ad73372a37315b0c17a8db21e40a78574',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b',1,'cutlass::gemm::ThreadMultiplyAdd::InstructionShape()']]],
-  ['iterations',['Iterations',['../structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0',1,'cutlass::FragmentIterator::Iterations()'],['../structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2',1,'cutlass::FragmentConstIterator::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae',1,'cutlass::gemm::GemmEpilogue::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d',1,'cutlass::gemm::GemmEpilogueTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Iterations()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f',1,'cutlass::gemm::GemmGlobalTileTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a',1,'cutlass::gemm::GemmGlobalTileCdTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b',1,'cutlass::gemm::GemmSharedLoadTileATraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Iterations()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#aa9b46937bea47d071d277aa212dd610b',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Iterations()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Iterations()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a9fb4b56091d4458ebd82130bc3951e5b',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::Iterations()'],['../structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450',1,'cutlass::PredicateTileAdapter::Iterations()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058',1,'cutlass::ConstPredicateTileAdapter::Iterations()'],['../structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469',1,'cutlass::TileTraits::Iterations()'],['../structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474',1,'cutlass::TileIteratorBase::Iterations()'],['../structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf',1,'cutlass::TileLoadIterator::Iterations()'],['../structcutlass_1_1TileStoreIterator.html#a552a67fb03c28e985d143f6193f88308',1,'cutlass::TileStoreIterator::Iterations()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2',1,'cutlass::TileTraitsStrideMajor::Iterations()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82',1,'cutlass::TileTraitsContiguousMajor::Iterations()'],['../structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323',1,'cutlass::TileTraitsWarpRake::Iterations()']]],
-  ['iterationsstrides',['IterationsStrides',['../structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b',1,'cutlass::FragmentConstIterator']]],
-  ['iterator',['Iterator',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6',1,'cutlass::gemm::SharedLoadStream']]]
+  ['immediateoffsetstrides',['ImmediateOffsetStrides',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf',1,'cutlass::gemm::GemmGlobalTileTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c',1,'cutlass::gemm::GemmGlobalTileCdTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a027bebceeda2287b40915ffd95d494a7',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a39414f484da7f993bc96d61c97273614',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121',1,'cutlass::gemm::GemmSharedLoadTileATraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ac585815d08290d9a5a9cdbd611ffdac4',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::ImmediateOffsetStrides()'],['../structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f',1,'cutlass::TileTraits::ImmediateOffsetStrides()'],['../structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4',1,'cutlass::TileIteratorBase::ImmediateOffsetStrides()']]],
+  ['index',['Index',['../structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c',1,'cutlass::Coord::Index()'],['../structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34',1,'cutlass::gemm::Gemm::Index()'],['../structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892',1,'cutlass::gemm::GemmCoord::Index()'],['../structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171',1,'cutlass::gemm::GemmDesc::Index()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e',1,'cutlass::gemm::GemmEpilogue::Index()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0',1,'cutlass::gemm::GemmEpilogueTraits::Index()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02',1,'cutlass::gemm::GlobalLoadStream::Index()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f',1,'cutlass::gemm::GemmGlobalIteratorAb::Index()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f',1,'cutlass::gemm::GemmGlobalIteratorCd::Index()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a',1,'cutlass::gemm::GlobalLoadStreamPair::Index()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367',1,'cutlass::gemm::GemmTraits::Index()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Index()'],['../structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f',1,'cutlass::MatrixCoord::Index()'],['../classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890',1,'cutlass::TensorRef::Index()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Index()'],['../structcutlass_1_1TensorRefBatchStrided.html#ab12d9d196122dc3075185ab239a27fb4',1,'cutlass::TensorRefBatchStrided::Index()'],['../structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9',1,'cutlass::TensorRefArray::Index()'],['../classcutlass_1_1TensorView.html#a5a3f096a01e6a2dfe984d7e605380599',1,'cutlass::TensorView::Index()'],['../structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259',1,'cutlass::TileCoord::Index()'],['../structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c',1,'cutlass::TileIteratorBase::Index()'],['../structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827',1,'cutlass::TileLoadIterator::Index()'],['../structcutlass_1_1TileStoreIterator.html#aae07fdedeef68abd4e6c099924c70910',1,'cutlass::TileStoreIterator::Index()'],['../structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652',1,'cutlass::TileLoadStream::Index()'],['../structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4',1,'cutlass::TileStoreStream::Index()'],['../classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0',1,'cutlass::ZipTileIterator::Index()']]],
+  ['inputfragment',['InputFragment',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#ac7906301019c3e6d60985c3851f1e95e',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::InputFragment()'],['../structcutlass_1_1Copy.html#aed254bbc1ad94ed9d335ab02f199ceb1',1,'cutlass::Copy::InputFragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#ab5fab63d83eb0444c08bda16491d2627',1,'cutlass::gemm::HgemmSwizzle::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#aa9a4b05f9fc28b80a4ae4aabb2ce1e8c',1,'cutlass::gemm::IgemmFloatToInt8Converter::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a702ca51abc077355a2d7343976a0cfdb',1,'cutlass::gemm::IgemmInt8ToFloatConverter::InputFragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#a24a0bd5a9251ba5204b35eb4c4ac7727',1,'cutlass::gemm::IgemmSwizzle::InputFragment()'],['../structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3',1,'cutlass::ZipConvert::InputFragment()']]],
+  ['instructionshape',['InstructionShape',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76',1,'cutlass::gemm::FragmentMultiplyAdd::InstructionShape()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b',1,'cutlass::gemm::GemmConfig::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::InstructionShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af',1,'cutlass::gemm::ThreadMultiplyAdd::InstructionShape()']]],
+  ['iterations',['Iterations',['../structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0',1,'cutlass::FragmentIterator::Iterations()'],['../structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2',1,'cutlass::FragmentConstIterator::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae',1,'cutlass::gemm::GemmEpilogue::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10',1,'cutlass::gemm::GemmEpilogueTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Iterations()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c',1,'cutlass::gemm::GemmGlobalTileTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a',1,'cutlass::gemm::GemmGlobalTileCdTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a6125e052e47296c3ef53c8a149ffd31b',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a025445699c5c86237d8c3e48f01081ea',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b',1,'cutlass::gemm::GemmSharedLoadTileATraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a6bacc866485330f80596f634e6d14336',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Iterations()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Iterations()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a2dc8573498bcda33273b86db76dbd511',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Iterations()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a0b9b2b7838cb13a61a16501a2662fa51',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Iterations()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ae1d930fa295d8ddfaa10bda5978258de',1,'cutlass::gemm::IgemmGlobalTileTraits::Iterations()'],['../structcutlass_1_1PredicateTileAdapter.html#a1f2d52eec9f488c2a53c4d62af824450',1,'cutlass::PredicateTileAdapter::Iterations()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#a5e461e0eb376de60605a6ab5fdc38058',1,'cutlass::ConstPredicateTileAdapter::Iterations()'],['../structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc',1,'cutlass::TileTraits::Iterations()'],['../structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da',1,'cutlass::TileIteratorBase::Iterations()'],['../structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce',1,'cutlass::TileLoadIterator::Iterations()'],['../structcutlass_1_1TileStoreIterator.html#a8628ea7116f736b59c644fc0d85d395f',1,'cutlass::TileStoreIterator::Iterations()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2',1,'cutlass::TileTraitsStrideMajor::Iterations()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82',1,'cutlass::TileTraitsContiguousMajor::Iterations()'],['../structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323',1,'cutlass::TileTraitsWarpRake::Iterations()']]],
+  ['iterationsstrides',['IterationsStrides',['../structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a',1,'cutlass::FragmentConstIterator']]],
+  ['iterator',['Iterator',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6',1,'cutlass::gemm::SharedLoadStream::Iterator()'],['../structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b',1,'cutlass::TileLoadStream::Iterator()'],['../structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97',1,'cutlass::TileStoreStream::Iterator()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a1f2314aa062360b249b7c57c39af5430',1,'cutlass::PredicatedTileLoadStream::Iterator()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a0ba9097d54f3ba7b7dab12012631fa76',1,'cutlass::PredicatedTileStoreStream::Iterator()']]]
 ];
diff --git a/docs/search/typedefs_8.js b/docs/search/typedefs_8.js
index e54f847b9..d3b667c21 100644
--- a/docs/search/typedefs_8.js
+++ b/docs/search/typedefs_8.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['loaditerator',['LoadIterator',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe',1,'cutlass::gemm::GlobalLoadStreamBase']]]
+  ['kernelclass',['KernelClass',['../structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae',1,'cutlass::gemm::GemmTraits']]]
 ];
diff --git a/docs/search/typedefs_9.js b/docs/search/typedefs_9.js
index 76a1247d2..6eb3858ed 100644
--- a/docs/search/typedefs_9.js
+++ b/docs/search/typedefs_9.js
@@ -1,6 +1,5 @@
 var searchData=
 [
-  ['multiplicandtraits',['MultiplicandTraits',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7',1,'cutlass::gemm::GemmGlobalTileTraits']]],
-  ['multiplyadd',['MultiplyAdd',['../structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7',1,'cutlass::gemm::GemmConfig::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c',1,'cutlass::gemm::GemmTraits::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8',1,'cutlass::gemm::HgemmTraitsHelper::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8',1,'cutlass::gemm::IgemmTraitsHelper::MultiplyAdd()']]],
-  ['multiplyaddscalar',['MultiplyAddScalar',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar()']]]
+  ['loaditerator',['LoadIterator',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64',1,'cutlass::gemm::GlobalLoadStream']]],
+  ['longindex',['LongIndex',['../classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1',1,'cutlass::TensorRef::LongIndex()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::LongIndex()'],['../structcutlass_1_1TensorRefBatchStrided.html#aa3df5b7337d41d8f96717ea73bf3e24e',1,'cutlass::TensorRefBatchStrided::LongIndex()'],['../structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0',1,'cutlass::TensorRefArray::LongIndex()']]]
 ];
diff --git a/docs/search/typedefs_a.js b/docs/search/typedefs_a.js
index be59a69a5..c8ea6851f 100644
--- a/docs/search/typedefs_a.js
+++ b/docs/search/typedefs_a.js
@@ -1,4 +1,7 @@
 var searchData=
 [
-  ['no',['no',['../structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af',1,'cutlass::platform::is_base_of_helper']]]
+  ['mapfunc',['MapFunc',['../classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29',1,'cutlass::TensorRef::MapFunc()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::MapFunc()']]],
+  ['multiplicandtraits',['MultiplicandTraits',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7',1,'cutlass::gemm::GemmGlobalTileTraits']]],
+  ['multiplyadd',['MultiplyAdd',['../structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835',1,'cutlass::gemm::Gemm::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd',1,'cutlass::gemm::GemmConfig::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c',1,'cutlass::gemm::GemmTraits::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef',1,'cutlass::gemm::HgemmTraitsHelper::MultiplyAdd()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e',1,'cutlass::gemm::IgemmTraitsHelper::MultiplyAdd()']]],
+  ['multiplyaddscalar',['MultiplyAddScalar',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::MultiplyAddScalar()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::MultiplyAddScalar()']]]
 ];
diff --git a/docs/search/typedefs_b.js b/docs/search/typedefs_b.js
index 90d2ef437..be59a69a5 100644
--- a/docs/search/typedefs_b.js
+++ b/docs/search/typedefs_b.js
@@ -1,6 +1,4 @@
 var searchData=
 [
-  ['offset_5ft',['Offset_t',['../classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f',1,'cutlass::TensorView']]],
-  ['outputfragment',['OutputFragment',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::OutputFragment()'],['../structcutlass_1_1Copy.html#a545be6c284d625b0841a10cc9126e14a',1,'cutlass::Copy::OutputFragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a9c04f0b0eb0293325f661b72168d4fa8',1,'cutlass::gemm::HgemmSwizzle::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553',1,'cutlass::gemm::IgemmFloatToInt8Converter::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7',1,'cutlass::gemm::IgemmInt8ToFloatConverter::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8',1,'cutlass::gemm::IgemmSwizzle::OutputFragment()']]],
-  ['outputtile',['OutputTile',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b',1,'cutlass::gemm::GemmEpilogue::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075',1,'cutlass::gemm::GemmEpilogueTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101',1,'cutlass::gemm::GemmEpilogueTraitsHelper::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d',1,'cutlass::gemm::GemmSharedStoreTileDTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899',1,'cutlass::gemm::GemmSharedLoadTileDTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd',1,'cutlass::gemm::GemmConfig::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367',1,'cutlass::gemm::GemmTraits::OutputTile()']]]
+  ['no',['no',['../structcutlass_1_1platform_1_1is__base__of__helper.html#ae096aa6c67f60d8d9c5a4b084118a8af',1,'cutlass::platform::is_base_of_helper']]]
 ];
diff --git a/docs/search/typedefs_c.js b/docs/search/typedefs_c.js
index 7807c3a1f..612b8f908 100644
--- a/docs/search/typedefs_c.js
+++ b/docs/search/typedefs_c.js
@@ -1,6 +1,6 @@
 var searchData=
 [
-  ['params',['Params',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e',1,'cutlass::gemm::GemmEpilogue']]],
-  ['pointer',['pointer',['../classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9',1,'cutlass::platform::unique_ptr::pointer()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1',1,'cutlass::gemm::GlobalLoadStreamBase::Pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd',1,'cutlass::gemm::GemmGlobalTileTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6',1,'cutlass::gemm::GemmGlobalIteratorCd::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864',1,'cutlass::gemm::GemmSharedLoadTileATraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Pointer()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Pointer()'],['../structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8',1,'cutlass::TileLoadIterator::Pointer()']]],
-  ['predicatevector',['PredicateVector',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c',1,'cutlass::gemm::GemmGlobalIteratorAb::PredicateVector()'],['../structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4',1,'cutlass::PredicateTileAdapter::PredicateVector()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f',1,'cutlass::ConstPredicateTileAdapter::PredicateVector()'],['../structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5',1,'cutlass::TileIteratorBase::PredicateVector()'],['../structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328',1,'cutlass::TileLoadIterator::PredicateVector()'],['../structcutlass_1_1TileStoreIterator.html#a5aa507eaeb63951f8e69fb223ec41809',1,'cutlass::TileStoreIterator::PredicateVector()']]]
+  ['offset_5ft',['Offset_t',['../classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1',1,'cutlass::TensorView']]],
+  ['outputfragment',['OutputFragment',['../structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html#a8ef69ab595489e142911e8e240fb405a',1,'cutlass::Convert&lt; Fragment&lt; InputScalar_, kScalars_ &gt;, Fragment&lt; OutputScalar_, kScalars_ &gt; &gt;::OutputFragment()'],['../structcutlass_1_1Copy.html#a545be6c284d625b0841a10cc9126e14a',1,'cutlass::Copy::OutputFragment()'],['../structcutlass_1_1gemm_1_1HgemmSwizzle.html#a9c04f0b0eb0293325f661b72168d4fa8',1,'cutlass::gemm::HgemmSwizzle::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html#a3d89bfc0d94cd695cbe4a61859e5e553',1,'cutlass::gemm::IgemmFloatToInt8Converter::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html#a66ac385a1cd771b95f70ee36cd74e8f7',1,'cutlass::gemm::IgemmInt8ToFloatConverter::OutputFragment()'],['../structcutlass_1_1gemm_1_1IgemmSwizzle.html#ac0a4e31e95f8e0c77ae087284bb02ff8',1,'cutlass::gemm::IgemmSwizzle::OutputFragment()'],['../structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584',1,'cutlass::ZipConvert::OutputFragment()']]],
+  ['outputtile',['OutputTile',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399',1,'cutlass::gemm::GemmConfig::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b',1,'cutlass::gemm::GemmEpilogue::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c',1,'cutlass::gemm::GemmEpilogueTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101',1,'cutlass::gemm::GemmEpilogueTraitsHelper::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ad52b81080731ee1f0d3c2c7eaba6f60d',1,'cutlass::gemm::GemmSharedStoreTileDTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899',1,'cutlass::gemm::GemmSharedLoadTileDTraits::OutputTile()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367',1,'cutlass::gemm::GemmTraits::OutputTile()']]]
 ];
diff --git a/docs/search/typedefs_d.js b/docs/search/typedefs_d.js
index b57336569..7d07a8349 100644
--- a/docs/search/typedefs_d.js
+++ b/docs/search/typedefs_d.js
@@ -1,31 +1,7 @@
 var searchData=
 [
-  ['scalar',['Scalar',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295',1,'cutlass::gemm::GemmEpilogue::Scalar()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66',1,'cutlass::gemm::GemmEpilogueTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Scalar()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6',1,'cutlass::gemm::GlobalLoadStreamBase::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b',1,'cutlass::gemm::GemmGlobalTileTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a',1,'cutlass::gemm::GemmGlobalIteratorAb::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e',1,'cutlass::gemm::GemmGlobalIteratorCd::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a8b04fd003fc2db46d749360e8838438b',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aaa439a0bb6b9de5e2722ea7b011effea',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14',1,'cutlass::gemm::GemmSharedLoadTileATraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317',1,'cutlass::gemm::IgemmEpilogueScalar::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650',1,'cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183',1,'cutlass::gemm::LinearScaling::Scalar()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Scalar()'],['../structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16',1,'cutlass::TileIteratorBase::Scalar()'],['../structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895',1,'cutlass::TileLoadIterator::Scalar()'],['../structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7',1,'cutlass::TileStoreIterator::Scalar()'],['../unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd',1,'cutlass::Vector::Scalar()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b',1,'cutlass::Vector&lt; half, kLanes_ &gt;::Scalar()'],['../structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599',1,'cutlass::VectorTraits::Scalar()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Scalar()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Scalar()']]],
-  ['scalara',['ScalarA',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarA()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#a366083b229b28e7f44da38273b2ab263',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b',1,'cutlass::gemm::Gemm::ScalarA()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa',1,'cutlass::gemm::GemmConfig::ScalarA()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6',1,'cutlass::gemm::GemmTraits::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a236a408791a38358cbadf19dd0e8ed9f',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aeef5fa0437b4ce1c2e8ac4bc7e062b65',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarA()']]],
-  ['scalarb',['ScalarB',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarB()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af52ec4b92a3e788169764014aebb85a1',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4',1,'cutlass::gemm::Gemm::ScalarB()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b',1,'cutlass::gemm::GemmConfig::ScalarB()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698',1,'cutlass::gemm::GemmTraits::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac7557562de1108bf1abc10829c83e88f',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#aaf9e4b8b16150a6ad826c228af2bf103',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarB()']]],
-  ['scalarc',['ScalarC',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarC()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_01_4.html#af553be8ef0b4dc9bb593d98dfce8628d',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55',1,'cutlass::gemm::Gemm::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0',1,'cutlass::gemm::GemmEpilogue::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc',1,'cutlass::gemm::GemmEpilogueTraits::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea',1,'cutlass::gemm::GemmConfig::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443',1,'cutlass::gemm::GemmTraits::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af1a6d91d4734683ea791bf57f3c3bbb0',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#acdd554e996a712ff62eb70d6ecf8e116',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarC()']]],
-  ['scalard',['ScalarD',['../structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694',1,'cutlass::gemm::Gemm::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f',1,'cutlass::gemm::GemmEpilogue::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe',1,'cutlass::gemm::GemmEpilogueTraits::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8',1,'cutlass::gemm::GemmConfig::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e',1,'cutlass::gemm::GemmTraits::ScalarD()']]],
-  ['scalarepilogue',['ScalarEpilogue',['../structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936',1,'cutlass::gemm::Gemm']]],
-  ['shape',['Shape',['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e',1,'cutlass::gemm::GemmMultiplicandTraits::Shape()'],['../structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29',1,'cutlass::ShapeScale::Shape()'],['../structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71',1,'cutlass::ShapeAdd::Shape()'],['../structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9',1,'cutlass::ShapeSub::Shape()'],['../structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94',1,'cutlass::ShapeMul::Shape()'],['../structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b',1,'cutlass::ShapeDiv::Shape()'],['../structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961',1,'cutlass::ShapeMax::Shape()'],['../structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549',1,'cutlass::ShapeMin::Shape()'],['../structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a',1,'cutlass::ShapeStrides::Shape()']]],
-  ['sharedloaditeratora',['SharedLoadIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorA()']]],
-  ['sharedloaditeratorb',['SharedLoadIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorB()']]],
-  ['sharedloaditeratord',['SharedLoadIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070',1,'cutlass::gemm::GemmEpilogue::SharedLoadIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5',1,'cutlass::gemm::GemmEpilogueTraits::SharedLoadIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadIteratorD()']]],
-  ['sharedloadstreama',['SharedLoadStreamA',['../structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc',1,'cutlass::gemm::GemmTraits::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamA()']]],
-  ['sharedloadstreamb',['SharedLoadStreamB',['../structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290',1,'cutlass::gemm::GemmTraits::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamB()']]],
-  ['sharedloadtiletraits',['SharedLoadTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a458cbcc16fc296d024f2a1a95fb926c1',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af1bc7f7c26db3399201cd95f35a56790',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadTileTraits()']]],
-  ['sharedloadtransformerd',['SharedLoadTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13',1,'cutlass::gemm::GemmEpilogue']]],
-  ['sharedstorage',['SharedStorage',['../structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7',1,'cutlass::gemm::Gemm::SharedStorage()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc',1,'cutlass::gemm::GemmEpilogue::SharedStorage()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404',1,'cutlass::gemm::SharedLoadStream::SharedStorage()'],['../structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39',1,'cutlass::TileLoadIterator::SharedStorage()'],['../structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b',1,'cutlass::TileStoreIterator::SharedStorage()']]],
-  ['sharedstorefragmentd',['SharedStoreFragmentD',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8',1,'cutlass::gemm::IgemmEpilogueTraitsHelper']]],
-  ['sharedstoreiteratora',['SharedStoreIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4',1,'cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46',1,'cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorA()']]],
-  ['sharedstoreiteratorb',['SharedStoreIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448',1,'cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f',1,'cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorB()']]],
-  ['sharedstoreiteratord',['SharedStoreIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a',1,'cutlass::gemm::GemmEpilogue::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc',1,'cutlass::gemm::GemmEpilogueTraits::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreIteratorD()']]],
-  ['sharedstorestorage',['SharedStoreStorage',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa',1,'cutlass::gemm::GlobalLoadStreamBase']]],
-  ['sharedstorestoragea',['SharedStoreStorageA',['../structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c',1,'cutlass::gemm::GemmTraits']]],
-  ['sharedstorestorageb',['SharedStoreStorageB',['../structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed',1,'cutlass::gemm::GemmTraits']]],
-  ['sharedstoretiletraits',['SharedStoreTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a2aad3b2454d956f20dac1bb0ad75a2f8',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab1ae3d51f65f7af60147da1c51a7a0c2',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a7624585480f83a46725c92b5dee20ebc',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aca6118b5bbe6f667f05c53bd52543045',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()']]],
-  ['sharedstoretransformerd',['SharedStoreTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c',1,'cutlass::gemm::GemmEpilogue::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c',1,'cutlass::gemm::GemmEpilogueTraits::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTransformerD()']]],
-  ['skew',['Skew',['../structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16',1,'cutlass::TileIteratorBase::Skew()'],['../structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c',1,'cutlass::TileLoadIterator::Skew()'],['../structcutlass_1_1TileStoreIterator.html#a57348779bb004ed1ea0fd9cc252e895d',1,'cutlass::TileStoreIterator::Skew()']]],
-  ['storage',['Storage',['../structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a',1,'cutlass::PredicateVector::Storage()'],['../classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd',1,'cutlass::TensorRef::Storage()'],['../structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a',1,'cutlass::TileIteratorBase::Storage()']]],
-  ['storeiterator',['StoreIterator',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834',1,'cutlass::gemm::GlobalLoadStreamBase']]],
-  ['strides',['Strides',['../structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1',1,'cutlass::FragmentIterator']]]
+  ['params',['Params',['../structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916',1,'cutlass::gemm::Gemm::Params()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e',1,'cutlass::gemm::GemmEpilogue::Params()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6',1,'cutlass::PredicatedTileLoadStream::Params()'],['../structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba',1,'cutlass::PredicatedTileStoreStream::Params()']]],
+  ['pointer',['pointer',['../classcutlass_1_1platform_1_1unique__ptr.html#ab6ce60d03d11b269c1e151dfa7c696f9',1,'cutlass::platform::unique_ptr::pointer()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2',1,'cutlass::gemm::GlobalLoadStream::Pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd',1,'cutlass::gemm::GemmGlobalTileTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6',1,'cutlass::gemm::GemmGlobalIteratorCd::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a5be0c995c57faafaad7ae55ae015fc00',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ab883c2a8b90262152faca9cabe515dc4',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#adc4946dfbe914140c6852d0c05b30864',1,'cutlass::gemm::GemmSharedLoadTileATraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afafb3d9ae470c8ef56ec4ca5e66e2182',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a20471c2f569c28538dad8a220ab25624',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Pointer()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Pointer()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Pointer()'],['../structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f',1,'cutlass::TileLoadIterator::Pointer()'],['../structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35',1,'cutlass::TileStoreIterator::Pointer()']]],
+  ['predicatefunctor',['PredicateFunctor',['../structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5',1,'cutlass::PredicatedTileLoadStream::PredicateFunctor()'],['../structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f',1,'cutlass::PredicatedTileStoreStream::PredicateFunctor()']]],
+  ['predicatevector',['PredicateVector',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c',1,'cutlass::gemm::GemmGlobalIteratorAb::PredicateVector()'],['../structcutlass_1_1PredicateTileAdapter.html#a72669300eb0bd18ea8124f780862a0e4',1,'cutlass::PredicateTileAdapter::PredicateVector()'],['../structcutlass_1_1ConstPredicateTileAdapter.html#ab9143288811a1262f7007f1b76b32e8f',1,'cutlass::ConstPredicateTileAdapter::PredicateVector()'],['../structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000',1,'cutlass::TileIteratorBase::PredicateVector()'],['../structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5',1,'cutlass::TileLoadIterator::PredicateVector()'],['../structcutlass_1_1TileStoreIterator.html#a6157fe8a2ffefd45eba6f3953f0e2994',1,'cutlass::TileStoreIterator::PredicateVector()'],['../classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15',1,'cutlass::ZipTileIterator::PredicateVector()']]]
 ];
diff --git a/docs/search/typedefs_e.js b/docs/search/typedefs_e.js
index 529cbd114..4131dc29e 100644
--- a/docs/search/typedefs_e.js
+++ b/docs/search/typedefs_e.js
@@ -1,21 +1,37 @@
 var searchData=
 [
-  ['tensorref_5ft',['TensorRef_t',['../classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab',1,'cutlass::TensorView']]],
-  ['this_5f',['This_',['../structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95',1,'cutlass::Fragment::This_()'],['../structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369',1,'cutlass::FragmentIterator::This_()'],['../structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f',1,'cutlass::FragmentConstIterator::This_()'],['../structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317',1,'cutlass::gemm::Gemm::This_()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8',1,'cutlass::gemm::GemmGlobalIteratorAb::This_()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b',1,'cutlass::gemm::GemmGlobalIteratorCd::This_()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::This_()']]],
-  ['threadblocktile',['ThreadBlockTile',['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc',1,'cutlass::gemm::GemmMultiplicandTraits']]],
-  ['threadoffset',['ThreadOffset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5',1,'cutlass::gemm::GemmGlobalIteratorAb::ThreadOffset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1',1,'cutlass::gemm::GemmGlobalIteratorCd::ThreadOffset()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::ThreadOffset()'],['../structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd',1,'cutlass::TileTraits::ThreadOffset()'],['../structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f',1,'cutlass::TileIteratorBase::ThreadOffset()'],['../structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d',1,'cutlass::TileLoadIterator::ThreadOffset()'],['../structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27',1,'cutlass::TileStoreIterator::ThreadOffset()'],['../structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c',1,'cutlass::TileTraitsStrideMajor::ThreadOffset()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351',1,'cutlass::TileTraitsContiguousMajor::ThreadOffset()']]],
-  ['threads',['Threads',['../structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57',1,'cutlass::gemm::ReshapeThreads::Threads()'],['../structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c',1,'cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6',1,'cutlass::gemm::GemmGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6',1,'cutlass::gemm::GemmGlobalTileCdTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50',1,'cutlass::gemm::GemmGlobalIteratorAb::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02',1,'cutlass::gemm::GemmGlobalIteratorCd::Threads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Threads()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a5fd1a9f132c7aa0f68e129553f519d1e',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Threads()']]],
-  ['threadsdelta',['ThreadsDelta',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d',1,'cutlass::gemm::GemmGlobalTileTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077',1,'cutlass::gemm::GemmGlobalTileCdTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a6eee97f03dcea1c441116e143cf58018',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html#a2bb0f0820e52417ff77e7a2bdb9ed434',1,'cutlass::gemm::IgemmContiguousGlobalTileTraits::ThreadsDelta()']]],
-  ['threadshape',['ThreadShape',['../structcutlass_1_1TileTraitsStrideMajor.html#a03567f41ce616ebb4cdb309c85820599',1,'cutlass::TileTraitsStrideMajor::ThreadShape()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a33116b67e580292d4e354ca17ecd4167',1,'cutlass::TileTraitsContiguousMajor::ThreadShape()'],['../structcutlass_1_1TileTraitsWarpRake.html#ad6619e0b5d876fafd51c78e39f2c029e',1,'cutlass::TileTraitsWarpRake::ThreadShape()']]],
-  ['threadsperwarp',['ThreadsPerWarp',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f',1,'cutlass::gemm::GemmSharedLoadTileATraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aa784f29ff453c1656fdea8270454fa55',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, half, half, half &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01AccumulatorsPerThread___00_01ThreadsPerWarp___00_f5353db950bbf0023472029cac4814b6.html#a5bc98fd196c1f1e4e3f1bfc621df4f50',1,'cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadsPerWarp()']]],
-  ['threadsstrides',['ThreadsStrides',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadsStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadsStrides()']]],
-  ['tile',['Tile',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758',1,'cutlass::gemm::GemmGlobalTileTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc',1,'cutlass::gemm::GemmSharedLoadTileATraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Tile()'],['../structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5',1,'cutlass::ReshapeTile::Tile()'],['../structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06',1,'cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;::Tile()'],['../structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831',1,'cutlass::TileTraits::Tile()'],['../structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c',1,'cutlass::TileIteratorBase::Tile()'],['../structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10',1,'cutlass::TileLoadIterator::Tile()'],['../structcutlass_1_1TileStoreIterator.html#a8a87c8ef986e110a01a9226012594a61',1,'cutlass::TileStoreIterator::Tile()'],['../structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac',1,'cutlass::TileTraitsStrideMajor::Tile()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763',1,'cutlass::TileTraitsContiguousMajor::Tile()'],['../structcutlass_1_1TileTraitsWarpRake.html#adcd658d9daf286368a9d51c8c1647f89',1,'cutlass::TileTraitsWarpRake::Tile()'],['../structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b',1,'cutlass::TileTraitsStandard::Tile()']]],
-  ['tilewithoutskew',['TileWithoutSkew',['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a050cf5964a2d3683491bc4313ead5450',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::TileWithoutSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213',1,'cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a1f35981a6d661635dfbcf7c7a76056a2',1,'cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew()']]],
-  ['tilewithoutskew_5f',['TileWithoutSkew_',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a93ae99460695718babaef6d1ef597e38',1,'cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew_()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a3d8be9ddea1cab53d1b4b3d508f9eab8',1,'cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew_()']]],
-  ['tilewithskew',['TileWithSkew',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a72e0214f86cf8b3711d006dcd69d7a17',1,'cutlass::gemm::GemmSharedLoadTileATraits::TileWithSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a69c7ec2a779718556e6d9119588e791c',1,'cutlass::gemm::GemmSharedLoadTileBTraits::TileWithSkew()']]],
-  ['traits',['Traits',['../structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff',1,'cutlass::gemm::Gemm::Traits()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b',1,'cutlass::gemm::GemmEpilogue::Traits()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Traits()'],['../structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696',1,'cutlass::TileIteratorBase::Traits()'],['../structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a',1,'cutlass::TileLoadIterator::Traits()'],['../structcutlass_1_1TileStoreIterator.html#a6f50a8aec2d7045e9057b93df08172a8',1,'cutlass::TileStoreIterator::Traits()']]],
-  ['transformedfragment',['TransformedFragment',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108',1,'cutlass::gemm::GlobalLoadStreamBase::TransformedFragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4',1,'cutlass::gemm::SharedLoadStream::TransformedFragment()']]],
-  ['transformer',['Transformer',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe',1,'cutlass::gemm::GlobalLoadStreamBase::Transformer()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904',1,'cutlass::gemm::SharedLoadStream::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296',1,'cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b',1,'cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7',1,'cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85',1,'cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html#a98aefa95117dbfdf2e577890318a6c13',1,'cutlass::gemm::IgemmGlobalStoreTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html#a52ecdfd8b94d8d7f4881048e11a33aba',1,'cutlass::gemm::IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html#ad3190650741cef20c1aca919eddd9d72',1,'cutlass::gemm::IgemmGlobalLoadTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html#a49c249026be24ec8a66f5eda99cb855c',1,'cutlass::gemm::IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html#a9edd08d595327a8cc3b8da50622b3bd2',1,'cutlass::gemm::IgemmSharedStoreTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197',1,'cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f',1,'cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49',1,'cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a',1,'cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()']]],
-  ['true_5ftype',['true_type',['../namespacecutlass_1_1platform.html#a0eddc4a3921e137f31fd8014be96e807',1,'cutlass::platform']]],
-  ['type',['Type',['../structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06',1,'cutlass::StorageType::Type()'],['../structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807',1,'cutlass::StorageType&lt; 4 &gt;::Type()'],['../structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4',1,'cutlass::StorageType&lt; 2 &gt;::Type()'],['../structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4',1,'cutlass::StorageType&lt; 1 &gt;::Type()'],['../structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e',1,'cutlass::Vectorize::Type()'],['../structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html#a79f147933e3f520145aee94ae18da3c5',1,'cutlass::Vectorize&lt; Element_, 1 &gt;::Type()'],['../structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52',1,'cutlass::platform::integral_constant::type()'],['../structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99',1,'cutlass::platform::enable_if::type()'],['../structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11',1,'cutlass::platform::conditional::type()'],['../structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644',1,'cutlass::platform::conditional&lt; false, T, F &gt;::type()'],['../structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085',1,'cutlass::platform::remove_const::type()'],['../structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3',1,'cutlass::platform::remove_const&lt; const T &gt;::type()'],['../structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1',1,'cutlass::platform::remove_volatile::type()'],['../structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3',1,'cutlass::platform::remove_volatile&lt; volatile T &gt;::type()'],['../structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08',1,'cutlass::platform::remove_cv::type()'],['../structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1',1,'cutlass::platform::aligned_storage::type()']]]
+  ['scalar',['Scalar',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295',1,'cutlass::gemm::GemmEpilogue::Scalar()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a',1,'cutlass::gemm::GemmEpilogueTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8',1,'cutlass::gemm::GemmEpilogueTraitsHelper::Scalar()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c',1,'cutlass::gemm::GlobalLoadStream::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b',1,'cutlass::gemm::GemmGlobalTileTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a',1,'cutlass::gemm::GemmGlobalIteratorAb::Scalar()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e',1,'cutlass::gemm::GemmGlobalIteratorCd::Scalar()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429',1,'cutlass::gemm::SharedLoadStream::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a8b04fd003fc2db46d749360e8838438b',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aaa439a0bb6b9de5e2722ea7b011effea',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a1b6956adc65254202864520b668edd14',1,'cutlass::gemm::GemmSharedLoadTileATraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a2a6065e583155b3e389253d3bfb64d73',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html#ab1068ba72468f9ede1d05ba41ea31317',1,'cutlass::gemm::IgemmEpilogueScalar::Scalar()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html#a0983fd25494f6a7ed5af37a02e99f650',1,'cutlass::gemm::IgemmEpilogueScalar&lt; int &gt;::Scalar()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183',1,'cutlass::gemm::LinearScaling::Scalar()'],['../structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e',1,'cutlass::gemm::LinearScalingDevicePtr::Scalar()'],['../classcutlass_1_1detail_1_1ScalarOrPointer.html#a9d3006fc0c8bd98b9262606858b26cad',1,'cutlass::detail::ScalarOrPointer::Scalar()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Scalar()'],['../structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6',1,'cutlass::TileAllocation::Scalar()'],['../structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34',1,'cutlass::TileIteratorBase::Scalar()'],['../structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511',1,'cutlass::TileLoadIterator::Scalar()'],['../structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5',1,'cutlass::TileStoreIterator::Scalar()'],['../unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd',1,'cutlass::Vector::Scalar()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac',1,'cutlass::Vector&lt; half, 1 &gt;::Scalar()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b',1,'cutlass::Vector&lt; half, kLanes_ &gt;::Scalar()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::Scalar()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::Scalar()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::Scalar()'],['../structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599',1,'cutlass::VectorTraits::Scalar()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Scalar()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Scalar()']]],
+  ['scalara',['ScalarA',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b',1,'cutlass::gemm::Gemm::ScalarA()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b',1,'cutlass::gemm::GemmConfig::ScalarA()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6',1,'cutlass::gemm::GemmTraits::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarA()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarA()']]],
+  ['scalaraccum',['ScalarAccum',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarAccum()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::ScalarAccum()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309',1,'cutlass::gemm::LinearScaling::ScalarAccum()']]],
+  ['scalaralphabeta',['ScalarAlphaBeta',['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322',1,'cutlass::gemm::FragmentMultiplyAdd::ScalarAlphaBeta()'],['../structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d',1,'cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;::ScalarAlphaBeta()']]],
+  ['scalarb',['ScalarB',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4',1,'cutlass::gemm::Gemm::ScalarB()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6',1,'cutlass::gemm::GemmConfig::ScalarB()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698',1,'cutlass::gemm::GemmTraits::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarB()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarB()']]],
+  ['scalarc',['ScalarC',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1Gemm.html#a71f0c91768a1a87e94030c8c2db51e55',1,'cutlass::gemm::Gemm::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d',1,'cutlass::gemm::GemmConfig::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0',1,'cutlass::gemm::GemmEpilogue::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c',1,'cutlass::gemm::GemmEpilogueTraits::ScalarC()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443',1,'cutlass::gemm::GemmTraits::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ScalarC()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1',1,'cutlass::gemm::ThreadMultiplyAdd::ScalarC()']]],
+  ['scalard',['ScalarD',['../structcutlass_1_1gemm_1_1Gemm.html#ae2aa3663f9f6f5708e816dcf7cd66694',1,'cutlass::gemm::Gemm::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa',1,'cutlass::gemm::GemmConfig::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f',1,'cutlass::gemm::GemmEpilogue::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50',1,'cutlass::gemm::GemmEpilogueTraits::ScalarD()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e',1,'cutlass::gemm::GemmTraits::ScalarD()']]],
+  ['scalarepilogue',['ScalarEpilogue',['../structcutlass_1_1gemm_1_1Gemm.html#a9349fc5f20215c1c6508e250b0b4e936',1,'cutlass::gemm::Gemm']]],
+  ['second',['Second',['../structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527',1,'cutlass::ZipTileAllocation::Second()'],['../structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a',1,'cutlass::ZipFragment::Second()'],['../structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10',1,'cutlass::ZipConvert::Second()'],['../structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e',1,'cutlass::ZipTensorRef::Second()'],['../classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c',1,'cutlass::ZipTileIterator::Second()']]],
+  ['shape',['Shape',['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a89f1d9599b418c8bb81c104ca86cf00e',1,'cutlass::gemm::GemmMultiplicandTraits::Shape()'],['../structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29',1,'cutlass::ShapeScale::Shape()'],['../structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71',1,'cutlass::ShapeAdd::Shape()'],['../structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9',1,'cutlass::ShapeSub::Shape()'],['../structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94',1,'cutlass::ShapeMul::Shape()'],['../structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b',1,'cutlass::ShapeDiv::Shape()'],['../structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799',1,'cutlass::ShapeDivCeiling::Shape()'],['../structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961',1,'cutlass::ShapeMax::Shape()'],['../structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549',1,'cutlass::ShapeMin::Shape()'],['../structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4',1,'cutlass::ShapeStrides::Shape()'],['../structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc',1,'cutlass::TileAllocation::Shape()']]],
+  ['sharedloaditeratora',['SharedLoadIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorA()']]],
+  ['sharedloaditeratorb',['SharedLoadIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a4de905aadc734df69fd0db83f01be56e',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadIteratorB()']]],
+  ['sharedloaditeratord',['SharedLoadIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadIteratorD()']]],
+  ['sharedloadstreama',['SharedLoadStreamA',['../structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc',1,'cutlass::gemm::GemmTraits::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aa5ebe3a857b55412a86ec65ad1c55dd8',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamA()']]],
+  ['sharedloadstreamb',['SharedLoadStreamB',['../structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290',1,'cutlass::gemm::GemmTraits::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a12447ce4d11601a625662f9d177cc3d8',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b',1,'cutlass::gemm::HgemmTraitsHelper::SharedLoadStreamB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d',1,'cutlass::gemm::IgemmTraitsHelper::SharedLoadStreamB()']]],
+  ['sharedloadstreamd',['SharedLoadStreamD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b',1,'cutlass::gemm::GemmEpilogue::SharedLoadStreamD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f',1,'cutlass::gemm::GemmEpilogueTraits::SharedLoadStreamD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadStreamD()']]],
+  ['sharedloadtiletraits',['SharedLoadTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::SharedLoadTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::SharedLoadTileTraits()']]],
+  ['sharedstorage',['SharedStorage',['../structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7',1,'cutlass::gemm::Gemm::SharedStorage()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc',1,'cutlass::gemm::GemmEpilogue::SharedStorage()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404',1,'cutlass::gemm::SharedLoadStream::SharedStorage()'],['../structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948',1,'cutlass::TileLoadIterator::SharedStorage()'],['../structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca',1,'cutlass::TileStoreIterator::SharedStorage()']]],
+  ['sharedstorefragmentd',['SharedStoreFragmentD',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8',1,'cutlass::gemm::IgemmEpilogueTraitsHelper']]],
+  ['sharedstoreiteratora',['SharedStoreIteratorA',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorA()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9',1,'cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorA()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae',1,'cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorA()']]],
+  ['sharedstoreiteratorb',['SharedStoreIteratorB',['../structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08',1,'cutlass::gemm::SimplifiedGemmTraitsHelper::SharedStoreIteratorB()'],['../structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce',1,'cutlass::gemm::HgemmTraitsHelper::SharedStoreIteratorB()'],['../structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1',1,'cutlass::gemm::IgemmTraitsHelper::SharedStoreIteratorB()']]],
+  ['sharedstoreiteratord',['SharedStoreIteratorD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a',1,'cutlass::gemm::GemmEpilogue::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668',1,'cutlass::gemm::GemmEpilogueTraits::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreIteratorD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreIteratorD()']]],
+  ['sharedstoretiletraits',['SharedStoreTileTraits',['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aa21c231aa56c9e5f2705cac62b17bbbe',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a872dc2d0b8ed6c75c41d258a23183861',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::SharedStoreTileTraits()']]],
+  ['sharedstoretransformerd',['SharedStoreTransformerD',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c',1,'cutlass::gemm::GemmEpilogue::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69',1,'cutlass::gemm::GemmEpilogueTraits::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33',1,'cutlass::gemm::GemmEpilogueTraitsHelper::SharedStoreTransformerD()'],['../structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf',1,'cutlass::gemm::IgemmEpilogueTraitsHelper::SharedStoreTransformerD()']]],
+  ['sharedstream',['SharedStream',['../structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17',1,'cutlass::gemm::GemmTraits']]],
+  ['skew',['Skew',['../structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1',1,'cutlass::TileIteratorBase::Skew()'],['../structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f',1,'cutlass::TileLoadIterator::Skew()'],['../structcutlass_1_1TileStoreIterator.html#a18248da35dc9a0ae2411121bee323085',1,'cutlass::TileStoreIterator::Skew()']]],
+  ['storage',['Storage',['../structcutlass_1_1PredicateVector.html#afe85a07b9f311327c6bf04e3a5f94e5a',1,'cutlass::PredicateVector::Storage()'],['../classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009',1,'cutlass::TensorRef::Storage()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Storage()'],['../structcutlass_1_1TensorRefBatchStrided.html#aa86a59779c0830e8cf82066853dc1089',1,'cutlass::TensorRefBatchStrided::Storage()'],['../structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8',1,'cutlass::TensorRefArray::Storage()'],['../classcutlass_1_1TensorView.html#a52fb77744c7c7ecf0f8a3a725556293d',1,'cutlass::TensorView::Storage()'],['../structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd',1,'cutlass::TileAllocation::Storage()'],['../structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0',1,'cutlass::TileIteratorBase::Storage()']]],
+  ['storagecoord',['StorageCoord',['../classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d',1,'cutlass::TensorRef::StorageCoord()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StorageCoord()'],['../classcutlass_1_1TensorView.html#abaf7ec0e96bc99cf0ce243e703b8711c',1,'cutlass::TensorView::StorageCoord()']]],
+  ['storeiterator',['StoreIterator',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2',1,'cutlass::gemm::GlobalLoadStream']]],
+  ['streama',['StreamA',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227',1,'cutlass::gemm::GlobalLoadStreamPair::StreamA()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4',1,'cutlass::gemm::SharedStreamPair::StreamA()']]],
+  ['streamb',['StreamB',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c',1,'cutlass::gemm::GlobalLoadStreamPair::StreamB()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529',1,'cutlass::gemm::SharedStreamPair::StreamB()']]],
+  ['strides',['Strides',['../structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e',1,'cutlass::FragmentIterator::Strides()'],['../structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c',1,'cutlass::TileAllocation::Strides()']]],
+  ['stridevector',['StrideVector',['../classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059',1,'cutlass::TensorRef::StrideVector()'],['../classcutlass_1_1TensorView.html#a625892aa9063eebf769bb2ed0cba7684',1,'cutlass::TensorView::StrideVector()']]],
+  ['stype',['SType',['../structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2',1,'cutlass::gemm::GemmDesc']]]
 ];
diff --git a/docs/search/typedefs_f.js b/docs/search/typedefs_f.js
index 1d8d48510..2cc14d93f 100644
--- a/docs/search/typedefs_f.js
+++ b/docs/search/typedefs_f.js
@@ -1,5 +1,30 @@
 var searchData=
 [
-  ['value_5ftype',['value_type',['../structcutlass_1_1platform_1_1integral__constant.html#ab2ed0b3506818139f1f96639742e79fd',1,'cutlass::platform::integral_constant']]],
-  ['vector',['Vector',['../structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2',1,'cutlass::VectorTraits::Vector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Vector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Vector()']]]
+  ['tensorcoord',['TensorCoord',['../classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65',1,'cutlass::TensorRef::TensorCoord()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorCoord()'],['../structcutlass_1_1TensorRefBatchStrided.html#a9d07d96c2eccba10c3a9e4bef58d4e01',1,'cutlass::TensorRefBatchStrided::TensorCoord()'],['../classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e',1,'cutlass::TensorView::TensorCoord()']]],
+  ['tensorref',['TensorRef',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a',1,'cutlass::gemm::SharedLoadStream::TensorRef()'],['../structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd',1,'cutlass::TensorRefBatchStrided::TensorRef()'],['../classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc',1,'cutlass::TensorRefBatchStrided::ConstIterator::TensorRef()'],['../structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75',1,'cutlass::TensorRefArray::TensorRef()'],['../classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f',1,'cutlass::TensorRefArray::ConstIterator::TensorRef()'],['../classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507',1,'cutlass::TensorView::TensorRef()'],['../structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80',1,'cutlass::TileAllocation::TensorRef()'],['../structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf',1,'cutlass::ZipTileAllocation::TensorRef()'],['../structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548',1,'cutlass::TileLoadIterator::TensorRef()'],['../structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac',1,'cutlass::TileStoreIterator::TensorRef()'],['../structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7',1,'cutlass::TileLoadStream::TensorRef()'],['../structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe',1,'cutlass::TileStoreStream::TensorRef()'],['../classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c',1,'cutlass::ZipTileIterator::TensorRef()']]],
+  ['tensorref_5ft',['TensorRef_t',['../classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606',1,'cutlass::TensorView']]],
+  ['tensorrefa',['TensorRefA',['../structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe',1,'cutlass::gemm::GemmDesc']]],
+  ['tensorrefb',['TensorRefB',['../structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab',1,'cutlass::gemm::GemmDesc']]],
+  ['tensorrefc',['TensorRefC',['../structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b',1,'cutlass::gemm::GemmDesc']]],
+  ['tensorrefd',['TensorRefD',['../structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052',1,'cutlass::gemm::GemmDesc']]],
+  ['this_5f',['This_',['../structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95',1,'cutlass::Fragment::This_()'],['../structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369',1,'cutlass::FragmentIterator::This_()'],['../structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f',1,'cutlass::FragmentConstIterator::This_()'],['../structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317',1,'cutlass::gemm::Gemm::This_()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8',1,'cutlass::gemm::GemmGlobalIteratorAb::This_()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b',1,'cutlass::gemm::GemmGlobalIteratorCd::This_()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989',1,'cutlass::gemm::GemmTraits::This_()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::This_()'],['../structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1',1,'cutlass::ZipFragment::This_()']]],
+  ['threadblocktile',['ThreadBlockTile',['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a5e43f3c9aa8d7dc5f01dfc63b1ea97dc',1,'cutlass::gemm::GemmMultiplicandTraits']]],
+  ['threadblocktileref',['ThreadblockTileRef',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77',1,'cutlass::gemm::GlobalLoadStream::ThreadblockTileRef()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be',1,'cutlass::gemm::GlobalLoadStreamPair::ThreadblockTileRef()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d',1,'cutlass::gemm::SharedStreamPair::ThreadblockTileRef()']]],
+  ['threadblocktilestorage',['ThreadblockTileStorage',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8',1,'cutlass::gemm::GlobalLoadStream::ThreadblockTileStorage()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158',1,'cutlass::gemm::GlobalLoadStreamPair::ThreadblockTileStorage()'],['../structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee',1,'cutlass::gemm::GemmTraits::ThreadblockTileStorage()']]],
+  ['threadgemmshape',['ThreadGemmShape',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ThreadGemmShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ThreadGemmShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadGemmShape()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadGemmShape()']]],
+  ['threadoffset',['ThreadOffset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5',1,'cutlass::gemm::GemmGlobalIteratorAb::ThreadOffset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1',1,'cutlass::gemm::GemmGlobalIteratorCd::ThreadOffset()'],['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30',1,'cutlass::gemm::IgemmGlobalIteratorAb::ThreadOffset()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::ThreadOffset()'],['../structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb',1,'cutlass::TileTraits::ThreadOffset()'],['../structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5',1,'cutlass::TileIteratorBase::ThreadOffset()'],['../structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a',1,'cutlass::TileLoadIterator::ThreadOffset()'],['../structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a',1,'cutlass::TileStoreIterator::ThreadOffset()'],['../structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c',1,'cutlass::TileTraitsStrideMajor::ThreadOffset()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351',1,'cutlass::TileTraitsContiguousMajor::ThreadOffset()']]],
+  ['threads',['Threads',['../structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57',1,'cutlass::gemm::ReshapeThreads::Threads()'],['../structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html#a894932ad04fae3aea06eb6d259e01c1c',1,'cutlass::gemm::ReshapeThreads&lt; Tile_, Threads_, true &gt;::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30',1,'cutlass::gemm::GemmGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6',1,'cutlass::gemm::GemmGlobalTileCdTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50',1,'cutlass::gemm::GemmGlobalIteratorAb::Threads()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02',1,'cutlass::gemm::GemmGlobalIteratorCd::Threads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a1acf2a1d8bf73fda142e7d82e05f00a2',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Threads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a9bef06b59f27c6e673066a7f0280aa06',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Threads()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f',1,'cutlass::gemm::IgemmGlobalTileTraits::Threads()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Threads()']]],
+  ['threadsdelta',['ThreadsDelta',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9',1,'cutlass::gemm::GemmGlobalTileTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077',1,'cutlass::gemm::GemmGlobalTileCdTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a61907b1afa07c12de74545d2e23a4281',1,'cutlass::gemm::HgemmCrosswiseGlobalTileTraits::ThreadsDelta()'],['../structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a160d1ecd86de4742f550d11bc281786b',1,'cutlass::gemm::IgemmGlobalTileTraits::ThreadsDelta()']]],
+  ['threadshape',['ThreadShape',['../structcutlass_1_1TileTraitsStrideMajor.html#a03567f41ce616ebb4cdb309c85820599',1,'cutlass::TileTraitsStrideMajor::ThreadShape()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a33116b67e580292d4e354ca17ecd4167',1,'cutlass::TileTraitsContiguousMajor::ThreadShape()'],['../structcutlass_1_1TileTraitsWarpRake.html#ad6619e0b5d876fafd51c78e39f2c029e',1,'cutlass::TileTraitsWarpRake::ThreadShape()']]],
+  ['threadsperwarp',['ThreadsPerWarp',['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0761c497c41a45652368fc0d54def98f',1,'cutlass::gemm::GemmSharedLoadTileATraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aed92656a074e915d97a1b6a990aeba66',1,'cutlass::gemm::GemmSharedLoadTileBTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#adf72ea773b8d4d3eb184f59c8cdf9543',1,'cutlass::gemm::GemmSharedStoreTileDTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3',1,'cutlass::gemm::GemmSharedLoadTileDTraits::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df',1,'cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::ThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b',1,'cutlass::gemm::ThreadMultiplyAdd::ThreadsPerWarp()']]],
+  ['threadsstrides',['ThreadsStrides',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae540e7ea7106552682aa4c97b833b3b1',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::ThreadsStrides()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a2053e4b9cb3ed2727c89960354ea0b29',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::ThreadsStrides()']]],
+  ['tile',['Tile',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec',1,'cutlass::gemm::GlobalLoadStream::Tile()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19',1,'cutlass::gemm::GemmGlobalTileTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111',1,'cutlass::gemm::GemmGlobalIteratorAb::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ab96f324083e51ce4c2b73c18803c69a7',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a74196946c28e98ee60346b0eeede1471',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a9a00be672617162c4c7ac94c7d8980cc',1,'cutlass::gemm::GemmSharedLoadTileATraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac242508ec46db0493a69a589dbfc19e4',1,'cutlass::gemm::GemmSharedLoadTileBTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a2bc41b907417b47f3dca9c3dd358f8bc',1,'cutlass::gemm::GemmSharedStoreTileDTraits::Tile()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5',1,'cutlass::gemm::GemmSharedLoadTileDTraits::Tile()'],['../structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5',1,'cutlass::ReshapeTile::Tile()'],['../structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html#a966a9432cf42dfdff8ad6b89ebd74f06',1,'cutlass::ReshapeTile&lt; Tile_, kAccessSize_, true &gt;::Tile()'],['../structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0',1,'cutlass::TileTraits::Tile()'],['../structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4',1,'cutlass::TileIteratorBase::Tile()'],['../structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539',1,'cutlass::TileLoadIterator::Tile()'],['../structcutlass_1_1TileStoreIterator.html#ad18ee6f519b03e1dbf711339b63e16d6',1,'cutlass::TileStoreIterator::Tile()'],['../structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac',1,'cutlass::TileTraitsStrideMajor::Tile()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763',1,'cutlass::TileTraitsContiguousMajor::Tile()'],['../structcutlass_1_1TileTraitsWarpRake.html#adcd658d9daf286368a9d51c8c1647f89',1,'cutlass::TileTraitsWarpRake::Tile()'],['../structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b',1,'cutlass::TileTraitsStandard::Tile()']]],
+  ['tilewithoutskew',['TileWithoutSkew',['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a050cf5964a2d3683491bc4313ead5450',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::TileWithoutSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a5a5a36fc570e1225b20ce0a48c89d213',1,'cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a1f35981a6d661635dfbcf7c7a76056a2',1,'cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew()']]],
+  ['tilewithoutskew_5f',['TileWithoutSkew_',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a93ae99460695718babaef6d1ef597e38',1,'cutlass::gemm::GemmSharedLoadTileATraits::TileWithoutSkew_()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a3d8be9ddea1cab53d1b4b3d508f9eab8',1,'cutlass::gemm::GemmSharedLoadTileBTraits::TileWithoutSkew_()']]],
+  ['tilewithskew',['TileWithSkew',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a72e0214f86cf8b3711d006dcd69d7a17',1,'cutlass::gemm::GemmSharedLoadTileATraits::TileWithSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a69c7ec2a779718556e6d9119588e791c',1,'cutlass::gemm::GemmSharedLoadTileBTraits::TileWithSkew()']]],
+  ['traits',['Traits',['../structcutlass_1_1gemm_1_1Gemm.html#a29f52e33e1f1cf150f5062d9ad2590ff',1,'cutlass::gemm::Gemm::Traits()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b',1,'cutlass::gemm::GemmEpilogue::Traits()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Traits()'],['../structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7',1,'cutlass::TileIteratorBase::Traits()'],['../structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948',1,'cutlass::TileLoadIterator::Traits()'],['../structcutlass_1_1TileStoreIterator.html#a5016bd7b24938026a2879ec0054eb3b6',1,'cutlass::TileStoreIterator::Traits()']]],
+  ['transformedfragment',['TransformedFragment',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9',1,'cutlass::gemm::GlobalLoadStream::TransformedFragment()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4',1,'cutlass::gemm::SharedLoadStream::TransformedFragment()'],['../structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1',1,'cutlass::TileLoadStream::TransformedFragment()'],['../structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993',1,'cutlass::TileStoreStream::TransformedFragment()'],['../structcutlass_1_1PredicatedTileLoadStream.html#adeb35451885c1c4fb930ae8c914ceb20',1,'cutlass::PredicatedTileLoadStream::TransformedFragment()'],['../structcutlass_1_1PredicatedTileStoreStream.html#af349831b19bb91d414a83c67d14f6927',1,'cutlass::PredicatedTileStoreStream::TransformedFragment()']]],
+  ['transformer',['Transformer',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02',1,'cutlass::gemm::GlobalLoadStream::Transformer()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904',1,'cutlass::gemm::SharedLoadStream::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a882c10bed18f62ece97f5f20f9de3296',1,'cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a42c5bafcb226623b3326dbd01fc72f3b',1,'cutlass::gemm::HgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#aaaccb3f02a857e0c80d2891c6c6dcdb7',1,'cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#ae66bb2c1f87e19278ff471c32e71ea85',1,'cutlass::gemm::HgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html#a98aefa95117dbfdf2e577890318a6c13',1,'cutlass::gemm::IgemmGlobalStoreTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html#a52ecdfd8b94d8d7f4881048e11a33aba',1,'cutlass::gemm::IgemmGlobalStoreTransformer&lt; float, Fragment&lt; int8_t, kElements_ &gt; &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html#ad3190650741cef20c1aca919eddd9d72',1,'cutlass::gemm::IgemmGlobalLoadTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html#a49c249026be24ec8a66f5eda99cb855c',1,'cutlass::gemm::IgemmGlobalLoadTransformer&lt; Fragment&lt; int8_t, kElements_ &gt;, float &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html#a9edd08d595327a8cc3b8da50622b3bd2',1,'cutlass::gemm::IgemmSharedStoreTransformer::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a0b53e18f109ac0fd116e0d01ed6ec197',1,'cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a8a4e3ce1174789e2b695bda7b863079f',1,'cutlass::gemm::IgemmTransformerA&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html#a92320b7224a77a8af61e55beef30ad49',1,'cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kColumnMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html#a9728f71c2e7a6a649bd28d8c11241b0a',1,'cutlass::gemm::IgemmTransformerB&lt; MatrixLayout::kRowMajor, Iterator_ &gt;::Transformer()'],['../structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7',1,'cutlass::TileLoadStream::Transformer()'],['../structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e',1,'cutlass::TileStoreStream::Transformer()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a9f79fd30231825b38694bf7c1d12ec2a',1,'cutlass::PredicatedTileLoadStream::Transformer()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a0f91f328ed2b6bd65ef4eeafe18f9afd',1,'cutlass::PredicatedTileStoreStream::Transformer()']]],
+  ['true_5ftype',['true_type',['../namespacecutlass_1_1platform.html#a0eddc4a3921e137f31fd8014be96e807',1,'cutlass::platform']]],
+  ['type',['Type',['../structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b',1,'cutlass::StorageType::Type()'],['../structcutlass_1_1StorageType_3_014_01_4.html#aa6754c0eb530544a1457afe1ae94a807',1,'cutlass::StorageType&lt; 4 &gt;::Type()'],['../structcutlass_1_1StorageType_3_012_01_4.html#a66c52fe770774ea01c511aea1af1f8d4',1,'cutlass::StorageType&lt; 2 &gt;::Type()'],['../structcutlass_1_1StorageType_3_011_01_4.html#a4a70002785c378c1f180800f2a65bcd4',1,'cutlass::StorageType&lt; 1 &gt;::Type()'],['../structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e',1,'cutlass::Vectorize::Type()'],['../structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186',1,'cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;::Type()'],['../structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06',1,'cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;::Type()'],['../structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca',1,'cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;::Type()'],['../structcutlass_1_1platform_1_1integral__constant.html#af58810ccead8f16ed88cd6a4afdc6e52',1,'cutlass::platform::integral_constant::type()'],['../structcutlass_1_1platform_1_1enable__if.html#aff9c0f270020cf097addf77e53a5af99',1,'cutlass::platform::enable_if::type()'],['../structcutlass_1_1platform_1_1conditional.html#ab6484d0dd6449b5195c4e868026fed11',1,'cutlass::platform::conditional::type()'],['../structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html#a8d55f500f667de560650554e9c220644',1,'cutlass::platform::conditional&lt; false, T, F &gt;::type()'],['../structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085',1,'cutlass::platform::remove_const::type()'],['../structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html#af68706cfaa6af14edc26ad5b974b47e3',1,'cutlass::platform::remove_const&lt; const T &gt;::type()'],['../structcutlass_1_1platform_1_1remove__volatile.html#a4f5b043d46206248d1bbbcf650707dd1',1,'cutlass::platform::remove_volatile::type()'],['../structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html#aca9bb93efe43106321e4afe0b67542a3',1,'cutlass::platform::remove_volatile&lt; volatile T &gt;::type()'],['../structcutlass_1_1platform_1_1remove__cv.html#a19e5b12cf4eb15ce13d6306735b6de08',1,'cutlass::platform::remove_cv::type()'],['../structcutlass_1_1platform_1_1aligned__storage.html#a9cf0360f335bcd1e9d9e1b266b6dd6c1',1,'cutlass::platform::aligned_storage::type()']]]
 ];
diff --git a/docs/search/variables_0.js b/docs/search/variables_0.js
index 6dbf197f1..542bfed42 100644
--- a/docs/search/variables_0.js
+++ b/docs/search/variables_0.js
@@ -1,5 +1,6 @@
 var searchData=
 [
-  ['aligned_5f',['aligned_',['../unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c',1,'cutlass::Vector::aligned_()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896',1,'cutlass::Vector&lt; half, kLanes_ &gt;::aligned_()']]],
-  ['alpha',['alpha',['../structcutlass_1_1gemm_1_1GemmDesc.html#a053c2b529be527f510ee317737fbf7e8',1,'cutlass::gemm::GemmDesc::alpha()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70',1,'cutlass::gemm::LinearScaling::Params::alpha()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6',1,'cutlass::gemm::LinearScaling::alpha()']]]
+  ['a',['A',['../structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b',1,'cutlass::gemm::GemmDesc']]],
+  ['aligned_5f',['aligned_',['../unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c',1,'cutlass::Vector::aligned_()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#acc698443a38fd0ad63f931bdf172ad99',1,'cutlass::Vector&lt; half, 1 &gt;::aligned_()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896',1,'cutlass::Vector&lt; half, kLanes_ &gt;::aligned_()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1df3324868465331db13bd7775b55e87',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::aligned_()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ad6784e347f068ad20af52379286337c0',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::aligned_()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a4eab187b6f7650bd88ccd421c8330d3c',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::aligned_()']]],
+  ['alpha',['alpha',['../structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785',1,'cutlass::gemm::GemmDesc::alpha()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70',1,'cutlass::gemm::LinearScaling::Params::alpha()']]]
 ];
diff --git a/docs/search/variables_1.js b/docs/search/variables_1.js
index 15bf17b9f..dcd8404ca 100644
--- a/docs/search/variables_1.js
+++ b/docs/search/variables_1.js
@@ -1,5 +1,12 @@
 var searchData=
 [
-  ['beta',['beta',['../structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332',1,'cutlass::gemm::GemmDesc::beta()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b',1,'cutlass::gemm::LinearScaling::Params::beta()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e',1,'cutlass::gemm::LinearScaling::beta()']]],
+  ['b',['B',['../structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774',1,'cutlass::gemm::GemmDesc']]],
+  ['batch_5fstride_5fa',['batch_stride_A',['../structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599',1,'cutlass::gemm::GemmDesc']]],
+  ['batch_5fstride_5fb',['batch_stride_B',['../structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a',1,'cutlass::gemm::GemmDesc']]],
+  ['batch_5fstride_5fc',['batch_stride_C',['../structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2',1,'cutlass::gemm::GemmDesc']]],
+  ['batch_5fstride_5fd',['batch_stride_D',['../structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de',1,'cutlass::gemm::GemmDesc']]],
+  ['beta',['beta',['../structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b',1,'cutlass::gemm::GemmDesc::beta()'],['../structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b',1,'cutlass::gemm::LinearScaling::Params::beta()']]],
+  ['block',['block',['../structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd',1,'cutlass::KernelLaunchConfiguration']]],
+  ['bounds',['bounds',['../structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a',1,'cutlass::RegularTilePredicateFunctor']]],
   ['byte',['byte',['../structcutlass_1_1platform_1_1alignment__of_1_1pad.html#a86f075f91b80918e968951713430f0b4',1,'cutlass::platform::alignment_of::pad']]]
 ];
diff --git a/docs/search/variables_10.js b/docs/search/variables_10.js
index c57703859..9f7e84fb6 100644
--- a/docs/search/variables_10.js
+++ b/docs/search/variables_10.js
@@ -1,5 +1,10 @@
 var searchData=
 [
-  ['val',['val',['../structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4',1,'cutlass::platform::alignment_of::pad']]],
-  ['value',['value',['../structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9',1,'cutlass::platform::integral_constant::value()'],['../structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff',1,'cutlass::platform::is_base_of_helper::value()']]]
+  ['tensor_5fstride',['tensor_stride',['../structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f',1,'cutlass::TensorRefBatchStrided']]],
+  ['thread_5foffset',['thread_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04',1,'cutlass::gemm::GemmGlobalIteratorAb::thread_offset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0',1,'cutlass::gemm::GemmGlobalIteratorCd::thread_offset()'],['../structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f',1,'cutlass::TileLoadIterator::thread_offset()'],['../structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825',1,'cutlass::TileStoreIterator::thread_offset()']]],
+  ['threadblock_5foffset',['threadblock_offset',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a',1,'cutlass::gemm::GlobalLoadStream']]],
+  ['threadblock_5ftile',['threadblock_tile',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#af8f0050e818b788402526857afc7c919',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage']]],
+  ['transformed',['transformed',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88',1,'cutlass::gemm::SharedLoadStream']]],
+  ['transformed_5ffragment',['transformed_fragment',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1',1,'cutlass::gemm::GlobalLoadStream::transformed_fragment()'],['../structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01',1,'cutlass::TileLoadStream::transformed_fragment()'],['../structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48',1,'cutlass::TileStoreStream::transformed_fragment()']]],
+  ['transformer',['transformer',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4',1,'cutlass::gemm::GlobalLoadStream::transformer()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7',1,'cutlass::gemm::SharedLoadStream::transformer()'],['../structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552',1,'cutlass::TileLoadStream::transformer()'],['../structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934',1,'cutlass::TileStoreStream::transformer()']]]
 ];
diff --git a/docs/search/variables_11.html b/docs/search/variables_11.html
new file mode 100644
index 000000000..2ce8561a1
--- /dev/null
+++ b/docs/search/variables_11.html
@@ -0,0 +1,30 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html><head><title></title>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<link rel="stylesheet" type="text/css" href="search.css"/>
+<script type="text/javascript" src="variables_11.js"></script>
+<script type="text/javascript" src="search.js"></script>
+</head>
+<body class="SRPage">
+<div id="SRIndex">
+<div class="SRStatus" id="Loading">Loading...</div>
+<div id="SRResults"></div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+createResults();
+/* @license-end */
+--></script>
+<div class="SRStatus" id="Searching">Searching...</div>
+<div class="SRStatus" id="NoMatches">No Matches</div>
+<script type="text/javascript"><!--
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+document.getElementById("Loading").style.display="none";
+document.getElementById("NoMatches").style.display="none";
+var searchResults = new SearchResults("searchResults");
+searchResults.Search();
+/* @license-end */
+--></script>
+</div>
+</body>
+</html>
diff --git a/docs/search/variables_11.js b/docs/search/variables_11.js
new file mode 100644
index 000000000..c9d76cbb9
--- /dev/null
+++ b/docs/search/variables_11.js
@@ -0,0 +1,5 @@
+var searchData=
+[
+  ['val',['val',['../structcutlass_1_1platform_1_1alignment__of_1_1pad.html#abc729cc51d5c90b1d7b0df3092d47cd4',1,'cutlass::platform::alignment_of::pad']]],
+  ['value',['value',['../structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd',1,'cutlass::ScalarIO::value()'],['../structcutlass_1_1platform_1_1integral__constant.html#a9bbaca83ae76941edb9b75b2741d3ad9',1,'cutlass::platform::integral_constant::value()'],['../structcutlass_1_1platform_1_1is__base__of__helper.html#ac7e3ab73057682cc2eb6ed74c33e5eff',1,'cutlass::platform::is_base_of_helper::value()']]]
+];
diff --git a/docs/search/variables_2.js b/docs/search/variables_2.js
index 1f0095000..04694b2b9 100644
--- a/docs/search/variables_2.js
+++ b/docs/search/variables_2.js
@@ -1,5 +1,6 @@
 var searchData=
 [
+  ['c',['C',['../structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30',1,'cutlass::gemm::GemmDesc']]],
   ['clear',['clear',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage']]],
   ['congruous',['Congruous',['../structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html#abe4eb7f9a0ed7d48a81029e88849dcf2',1,'cutlass::gemm::GemmOperandTraitsAb']]]
 ];
diff --git a/docs/search/variables_3.js b/docs/search/variables_3.js
index 91abc96bc..614ae3701 100644
--- a/docs/search/variables_3.js
+++ b/docs/search/variables_3.js
@@ -1,7 +1,5 @@
 var searchData=
 [
-  ['d_5fa',['d_a',['../structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447',1,'cutlass::gemm::GemmDesc']]],
-  ['d_5fb',['d_b',['../structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b',1,'cutlass::gemm::GemmDesc']]],
-  ['d_5fc',['d_c',['../structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5',1,'cutlass::gemm::GemmDesc']]],
-  ['d_5fd',['d_d',['../structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216',1,'cutlass::gemm::GemmDesc']]]
+  ['d',['D',['../structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f',1,'cutlass::gemm::GemmDesc']]],
+  ['dynamic_5fsmem',['dynamic_smem',['../structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc',1,'cutlass::KernelLaunchConfiguration']]]
 ];
diff --git a/docs/search/variables_5.js b/docs/search/variables_5.js
index b10e64d98..a940fd693 100644
--- a/docs/search/variables_5.js
+++ b/docs/search/variables_5.js
@@ -1,7 +1,7 @@
 var searchData=
 [
-  ['fetched_5fa',['fetched_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a3147da380e4c1e465aba0b965ac87ab5',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['fetched_5fb',['fetched_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a837fbec1d47ae45480941de6290889c0',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['fetched_5ffragment',['fetched_fragment',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d',1,'cutlass::gemm::GlobalLoadStreamBase']]],
-  ['functor',['functor',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06',1,'cutlass::gemm::GemmEpilogueTraits::Params']]]
+  ['fetched',['fetched',['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4',1,'cutlass::gemm::SharedLoadStream']]],
+  ['fetched_5ffragment',['fetched_fragment',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03',1,'cutlass::gemm::GlobalLoadStream::fetched_fragment()'],['../structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869',1,'cutlass::TileLoadStream::fetched_fragment()']]],
+  ['first',['first',['../structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014',1,'cutlass::ZipTileAllocation::first()'],['../structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c',1,'cutlass::ZipFragment::first()'],['../structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f',1,'cutlass::ZipConvert::first()'],['../structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c',1,'cutlass::ZipTensorRef::first()'],['../structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e',1,'cutlass::ZipTileIterator::Params::first()'],['../classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9',1,'cutlass::ZipTileIterator::first()']]],
+  ['functor',['functor',['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57',1,'cutlass::gemm::GemmEpilogue::functor()'],['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee',1,'cutlass::gemm::GemmEpilogueTraits::Params::functor()']]]
 ];
diff --git a/docs/search/variables_6.js b/docs/search/variables_6.js
index 859d50bf7..e3c09b99a 100644
--- a/docs/search/variables_6.js
+++ b/docs/search/variables_6.js
@@ -1,6 +1,5 @@
 var searchData=
 [
-  ['global',['global',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#a3c2980547310ec4307f3a5f9817dfc51',1,'cutlass::gemm::GemmTraits::StreamSharedStorage']]],
-  ['global_5fstream_5fa',['global_stream_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64',1,'cutlass::gemm::GemmTraits::Params']]],
-  ['global_5fstream_5fb',['global_stream_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596',1,'cutlass::gemm::GemmTraits::Params']]]
+  ['global_5fto_5fshared_5fstream',['global_to_shared_stream',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3',1,'cutlass::gemm::GemmTraits::Params::global_to_shared_stream()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a61fcc63cb0df6754eef16f5cf138f3a2',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage::global_to_shared_stream()']]],
+  ['grid',['grid',['../structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b',1,'cutlass::KernelLaunchConfiguration']]]
 ];
diff --git a/docs/search/variables_7.js b/docs/search/variables_7.js
index 504309120..c33caec12 100644
--- a/docs/search/variables_7.js
+++ b/docs/search/variables_7.js
@@ -1,12 +1,12 @@
 var searchData=
 [
-  ['idx',['idx',['../structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc',1,'cutlass::Coord']]],
-  ['inc_5fadvance',['inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::inc_advance()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::inc_advance()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2',1,'cutlass::TileIteratorBase::Params::inc_advance()']]],
-  ['inc_5fd',['inc_d',['../structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150',1,'cutlass::TileIteratorBase::Params']]],
-  ['inc_5fh',['inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::inc_h()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::inc_h()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366',1,'cutlass::TileIteratorBase::Params::inc_h()']]],
-  ['inc_5fw',['inc_w',['../structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178',1,'cutlass::TileIteratorBase::Params']]],
+  ['idx',['idx',['../structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68',1,'cutlass::Coord']]],
+  ['inc_5fadvance',['inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::inc_advance()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3',1,'cutlass::TileIteratorBase::Params::inc_advance()']]],
+  ['inc_5fd',['inc_d',['../structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd',1,'cutlass::TileIteratorBase::Params']]],
+  ['inc_5fh',['inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::inc_h()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06',1,'cutlass::TileIteratorBase::Params::inc_h()']]],
+  ['inc_5fw',['inc_w',['../structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c',1,'cutlass::TileIteratorBase::Params']]],
   ['isvector',['IsVector',['../structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2',1,'cutlass::VectorTraits::IsVector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aead181209c756f25ab5870682670bb99',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::IsVector()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a893488718d8437970c1b4ed4f4056620',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::IsVector()']]],
-  ['iterator',['iterator',['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7',1,'cutlass::gemm::SharedLoadStream::Params::iterator()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10',1,'cutlass::gemm::SharedLoadStream::iterator()']]],
-  ['iterator_5fc',['iterator_c',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
-  ['iterator_5fd',['iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7',1,'cutlass::gemm::GemmEpilogueTraits::Params']]]
+  ['iterator',['iterator',['../structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html#ae59f871c06a0ac7b9224f0de923082d7',1,'cutlass::gemm::SharedLoadStream::Params::iterator()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10',1,'cutlass::gemm::SharedLoadStream::iterator()'],['../structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57',1,'cutlass::TileLoadStream::Params::iterator()'],['../structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8',1,'cutlass::TileLoadStream::iterator()'],['../structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088',1,'cutlass::TileStoreStream::Params::iterator()'],['../structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c',1,'cutlass::TileStoreStream::iterator()']]],
+  ['iterator_5fc',['iterator_c',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
+  ['iterator_5fd',['iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346',1,'cutlass::gemm::GemmEpilogueTraits::Params']]]
 ];
diff --git a/docs/search/variables_8.js b/docs/search/variables_8.js
index 7406b1191..114a0042a 100644
--- a/docs/search/variables_8.js
+++ b/docs/search/variables_8.js
@@ -1,63 +1,81 @@
 var searchData=
 [
-  ['k',['k',['../structcutlass_1_1gemm_1_1GemmDesc.html#ac789a7e5d2db65d006f1e8e3df542a6f',1,'cutlass::gemm::GemmDesc::k()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aae3a008b39f9678a03192f6ff54152d8',1,'cutlass::gemm::GemmTraits::Params::k()']]],
-  ['kaccesssize',['kAccessSize',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f',1,'cutlass::gemm::GemmGlobalTileTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e',1,'cutlass::gemm::GemmSharedLoadTileATraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kAccessSize()'],['../structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3',1,'cutlass::TileIteratorBase::kAccessSize()']]],
-  ['kaccumulatorsperldsa',['kAccumulatorsPerLdsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf',1,'cutlass::gemm::GemmConfig']]],
-  ['kaccumulatorsperldsb',['kAccumulatorsPerLdsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1',1,'cutlass::gemm::GemmConfig']]],
-  ['kadvance',['kAdvance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125',1,'cutlass::gemm::GemmGlobalIteratorAb::kAdvance()'],['../structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421',1,'cutlass::TileIteratorBase::kAdvance()'],['../structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6',1,'cutlass::TileLoadIterator::kAdvance()'],['../structcutlass_1_1TileStoreIterator.html#a8059c57030df99b73309e9210ec5f624',1,'cutlass::TileStoreIterator::kAdvance()']]],
+  ['kaccesssize',['kAccessSize',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f',1,'cutlass::gemm::GemmGlobalTileTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ae852c89da0455025c0c41af258e47047',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#a846e6d8d06be0ba6fa41b1431c8ec061',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e',1,'cutlass::gemm::GemmSharedLoadTileATraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9521c4017e227b2511891a7fb18513e1',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kAccessSize()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kAccessSize()'],['../structcutlass_1_1TileTraits.html#a0a494c2eacb51b65487f8405908a0214',1,'cutlass::TileTraits::kAccessSize()'],['../structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499',1,'cutlass::TileIteratorBase::kAccessSize()'],['../structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8',1,'cutlass::TileLoadIterator::kAccessSize()'],['../structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671',1,'cutlass::TileStoreIterator::kAccessSize()'],['../structcutlass_1_1TileTraitsStandard.html#a5e04777205c7a292602880c59d6b43c8',1,'cutlass::TileTraitsStandard::kAccessSize()']]],
+  ['kaccumulatorsperldsa',['kAccumulatorsPerLdsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5',1,'cutlass::gemm::GemmConfig']]],
+  ['kaccumulatorsperldsb',['kAccumulatorsPerLdsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb',1,'cutlass::gemm::GemmConfig']]],
+  ['kadvance',['kAdvance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125',1,'cutlass::gemm::GemmGlobalIteratorAb::kAdvance()'],['../structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f',1,'cutlass::TileIteratorBase::kAdvance()'],['../structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352',1,'cutlass::TileLoadIterator::kAdvance()'],['../structcutlass_1_1TileStoreIterator.html#a44200854ad5b35c1863f73c435b8750b',1,'cutlass::TileStoreIterator::kAdvance()']]],
+  ['kalignment',['kAlignment',['../structcutlass_1_1Fragment.html#a84b6d68a5a24dbd04d842e0755b42bda',1,'cutlass::Fragment']]],
+  ['kbatch',['kBatch',['../structcutlass_1_1gemm_1_1GemmCoord.html#ad7b490ce2150e54fccad6b0f11932382',1,'cutlass::gemm::GemmCoord']]],
+  ['kblockcolumns',['kBlockColumns',['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::kBlockColumns()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e',1,'cutlass::MatrixLayout::RowMajorBlockLinear::kBlockColumns()']]],
+  ['kblockrows',['kBlockRows',['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::kBlockRows()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922',1,'cutlass::MatrixLayout::RowMajorBlockLinear::kBlockRows()']]],
   ['kbytes',['kBytes',['../structcutlass_1_1PredicateVector.html#ab870e074b33c598f69fe11e104615c5a',1,'cutlass::PredicateVector']]],
-  ['kc',['kC',['../structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c',1,'cutlass::Shape']]],
+  ['kc',['kC',['../structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c',1,'cutlass::Shape::kC()'],['../structcutlass_1_1TileCoord.html#a8236879e1670072033983b7ec4b7ae32',1,'cutlass::TileCoord::kC()']]],
+  ['kcolumn',['kColumn',['../structcutlass_1_1MatrixCoord.html#a1e096b25138e027c31ea8624729ec433',1,'cutlass::MatrixCoord::kColumn()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#adb3b8cccf1ac91265fff998a3d48f5e7',1,'cutlass::MatrixLayout::ContiguousLayout::kColumn()']]],
   ['kcount',['kCount',['../structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5',1,'cutlass::ShapeCount']]],
-  ['kd',['kD',['../structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25',1,'cutlass::Shape']]],
+  ['kd',['kD',['../structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25',1,'cutlass::Shape::kD()'],['../structcutlass_1_1TileCoord.html#ab5ebf352327baadcc740175d6b39adcb',1,'cutlass::TileCoord::kD()']]],
   ['kdhw',['kDhw',['../structcutlass_1_1ShapeCount.html#af7d7ccd42de2c49fe57f03cf0e657fe8',1,'cutlass::ShapeCount']]],
   ['kdhwc',['kDhwc',['../structcutlass_1_1ShapeCount.html#a5a274564d6b8607a0be621b2664fba18',1,'cutlass::ShapeCount']]],
   ['kelements',['kElements',['../structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60',1,'cutlass::Fragment']]],
   ['kelementsperaccess',['kElementsPerAccess',['../structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a',1,'cutlass::FragmentIterator::kElementsPerAccess()'],['../structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f',1,'cutlass::FragmentConstIterator::kElementsPerAccess()']]],
   ['kextent',['kExtent',['../structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html#a881f84951bc9e47ab2be9ef3f2c1e423',1,'cutlass::gemm::GetExtent&lt; GemmOperand::kA, Tile_ &gt;::kExtent()'],['../structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html#a82ff9b447e4a58164b5f7d53d2602930',1,'cutlass::gemm::GetExtent&lt; GemmOperand::kB, Tile_ &gt;::kExtent()']]],
-  ['kfragmentsize',['kFragmentSize',['../structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2',1,'cutlass::TileIteratorBase']]],
-  ['kh',['kH',['../structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e',1,'cutlass::Shape']]],
+  ['kfragmentelementtype',['kFragmentElementType',['../structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826',1,'cutlass::TileIteratorBase::kFragmentElementType()'],['../structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177',1,'cutlass::TileLoadIterator::kFragmentElementType()'],['../structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f',1,'cutlass::TileStoreIterator::kFragmentElementType()']]],
+  ['kfragmentsize',['kFragmentSize',['../structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761',1,'cutlass::TileIteratorBase']]],
+  ['kh',['kH',['../structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e',1,'cutlass::Shape::kH()'],['../structcutlass_1_1TileCoord.html#a24d32587359493bb965745f5551e1624',1,'cutlass::TileCoord::kH()']]],
   ['khw',['kHw',['../structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f',1,'cutlass::ShapeCount']]],
   ['khwc',['kHwc',['../structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742',1,'cutlass::ShapeCount']]],
   ['kint8output',['kInt8Output',['../structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4',1,'cutlass::gemm::IgemmEpilogueTraits']]],
+  ['kinterleave',['kInterleave',['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143',1,'cutlass::MatrixLayout::RowMajorInterleaved::kInterleave()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7',1,'cutlass::MatrixLayout::ColumnMajorInterleaved::kInterleave()']]],
   ['kiterationsd',['kIterationsD',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0',1,'cutlass::gemm::GemmSharedLoadTileDTraits']]],
   ['kiterationsh',['kIterationsH',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1',1,'cutlass::gemm::GemmSharedLoadTileDTraits']]],
   ['kiterationsinhperwarp',['kIterationsInHPerWarp',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237',1,'cutlass::gemm::GemmSharedLoadTileDTraits']]],
-  ['kiteratorfragment',['kIteratorFragment',['../structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be',1,'cutlass::TileIteratorBase::kIteratorFragment()'],['../structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98',1,'cutlass::TileLoadIterator::kIteratorFragment()'],['../structcutlass_1_1TileStoreIterator.html#a94c0567316118abfb84fc28560a5a46a',1,'cutlass::TileStoreIterator::kIteratorFragment()']]],
+  ['kk',['kK',['../structcutlass_1_1gemm_1_1GemmCoord.html#a521d4b8e720d2261c825e05397c92a5e',1,'cutlass::gemm::GemmCoord']]],
   ['kkstrided',['kKstrided',['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a1984c9ef6abfd029acbc3f702593ab85',1,'cutlass::gemm::GemmMultiplicandTraits']]],
   ['klanes',['kLanes',['../structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8',1,'cutlass::VectorTraits::kLanes()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aca745b59c6c21292f119943e5a480f39',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::kLanes()'],['../structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a43ac200035052a2c352c8c4b84aac73c',1,'cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::kLanes()']]],
-  ['klayout',['kLayout',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c',1,'cutlass::gemm::GlobalLoadStreamBase::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90',1,'cutlass::gemm::GemmGlobalTileTraits::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece',1,'cutlass::gemm::GemmGlobalIteratorAb::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a',1,'cutlass::gemm::GemmGlobalIteratorCd::kLayout()'],['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd',1,'cutlass::gemm::GemmMultiplicandTraits::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ad2010686bceb21aec9a1924ae379edc1',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::kLayout()']]],
+  ['klaunchbounds',['kLaunchBounds',['../structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b',1,'cutlass::gemm::GemmConfig']]],
+  ['klayout',['kLayout',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db',1,'cutlass::gemm::GlobalLoadStream::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90',1,'cutlass::gemm::GemmGlobalTileTraits::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece',1,'cutlass::gemm::GemmGlobalIteratorAb::kLayout()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a',1,'cutlass::gemm::GemmGlobalIteratorCd::kLayout()'],['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a19076e58e60d296da74cf504e2a473fd',1,'cutlass::gemm::GemmMultiplicandTraits::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ad2010686bceb21aec9a1924ae379edc1',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a32729d0fad10fcbbcf2643a2fa5671d6',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a11026d05b2b32f1373020c049f2cfa66',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::kLayout()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::kLayout()']]],
   ['klayouta',['kLayoutA',['../structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b',1,'cutlass::gemm::GemmTraits']]],
   ['klayoutb',['kLayoutB',['../structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684',1,'cutlass::gemm::GemmTraits']]],
-  ['kmemoryspace',['kMemorySpace',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d',1,'cutlass::gemm::GemmGlobalTileTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5',1,'cutlass::gemm::GemmSharedLoadTileATraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kMemorySpace()'],['../structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97',1,'cutlass::TileIteratorBase::kMemorySpace()'],['../structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1',1,'cutlass::TileLoadIterator::kMemorySpace()'],['../structcutlass_1_1TileStoreIterator.html#adaebec9eacf767f63f048033de73ea5b',1,'cutlass::TileStoreIterator::kMemorySpace()']]],
-  ['koperand',['kOperand',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1',1,'cutlass::gemm::GemmGlobalTileTraits::kOperand()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851',1,'cutlass::gemm::GemmSharedLoadTileATraits::kOperand()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kOperand()']]],
+  ['km',['kM',['../structcutlass_1_1gemm_1_1GemmCoord.html#af1f5c03c35eaa406c6a63082da26bec3',1,'cutlass::gemm::GemmCoord']]],
+  ['kmemoryspace',['kMemorySpace',['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d',1,'cutlass::gemm::GemmGlobalTileTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#a59c981aa720f983b846bed7c3e4a7cab',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#ae5a07814b9cfe9a64f69bac0f0772f20',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5',1,'cutlass::gemm::GemmSharedLoadTileATraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a8914bc5154f21fa5fd182b0009c44c39',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kMemorySpace()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#afb4687520eff9c6a21c35a5e04f69de8',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kMemorySpace()'],['../structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56',1,'cutlass::TileIteratorBase::kMemorySpace()'],['../structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043',1,'cutlass::TileLoadIterator::kMemorySpace()'],['../structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f',1,'cutlass::TileStoreIterator::kMemorySpace()']]],
+  ['kn',['kN',['../structcutlass_1_1gemm_1_1GemmCoord.html#a67f08a03dabee497fa5547cff0f1faea',1,'cutlass::gemm::GemmCoord']]],
+  ['koperand',['kOperand',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700',1,'cutlass::gemm::GlobalLoadStream::kOperand()'],['../structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1',1,'cutlass::gemm::GemmGlobalTileTraits::kOperand()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af511bba9fc2125516eb1442b1c88d851',1,'cutlass::gemm::GemmSharedLoadTileATraits::kOperand()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#afd4881aae69c8041d3931982d85f44e4',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kOperand()']]],
   ['kpredicates',['kPredicates',['../structcutlass_1_1PredicateVector.html#afff3a2142d9853606d6ad7c3a459f492',1,'cutlass::PredicateVector']]],
   ['kpredicatesperbyte',['kPredicatesPerByte',['../structcutlass_1_1PredicateVector.html#a1387c4a964f971ed4611d750a09ec0b5',1,'cutlass::PredicateVector']]],
   ['kpredicatestart',['kPredicateStart',['../structcutlass_1_1PredicateVector.html#acf848dce84c01453ab8a2d00c8d4f86e',1,'cutlass::PredicateVector']]],
+  ['krank',['kRank',['../structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3',1,'cutlass::Coord::kRank()'],['../classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31',1,'cutlass::TensorRef::kRank()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::kRank()']]],
+  ['kresidueinprolog',['kResidueInProlog',['../structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46',1,'cutlass::gemm::GemmConfig']]],
+  ['kresidueseparate',['kResidueSeparate',['../structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c',1,'cutlass::gemm::GemmConfig']]],
+  ['krow',['kRow',['../structcutlass_1_1MatrixCoord.html#a5149f4a37407746407251efc0779bb53',1,'cutlass::MatrixCoord::kRow()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#ae97a9ba9d5045bef258d8994eb732256',1,'cutlass::MatrixLayout::ContiguousLayout::kRow()']]],
   ['kscalarsin4b',['kScalarsIn4B',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kScalarsIn4B()'],['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kScalarsIn4B()']]],
-  ['kscalarsperldga',['kScalarsPerLdgA',['../structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldgb',['kScalarsPerLdgB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldgc',['kScalarsPerLdgC',['../structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldsa',['kScalarsPerLdsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldsb',['kScalarsPerLdsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperldsd',['kScalarsPerLdsD',['../structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldga',['kScalarsPerLdgA',['../structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldgb',['kScalarsPerLdgB',['../structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldgc',['kScalarsPerLdgC',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldsa',['kScalarsPerLdsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldsb',['kScalarsPerLdsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperldsd',['kScalarsPerLdsD',['../structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951',1,'cutlass::gemm::GemmConfig']]],
   ['kscalarsperrow',['kScalarsPerRow',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#af1c981ec89a9cabaf5d34231d51a029c',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kScalarsPerRow()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kScalarsPerRow()']]],
-  ['kscalarsperstgd',['kScalarsPerStgD',['../structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7',1,'cutlass::gemm::GemmConfig']]],
-  ['kscalarsperstsa',['kScalarsPerStsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186',1,'cutlass::gemm::GemmConfig::kScalarsPerStsA()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ae396f7301f934c179e054f68f0420edf',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kScalarsPerStsA()']]],
-  ['kscalarsperstsb',['kScalarsPerStsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21',1,'cutlass::gemm::GemmConfig::kScalarsPerStsB()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a47d99d98c783cf1d317698bd465ffa9a',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kScalarsPerStsB()']]],
-  ['kscalarsperstsd',['kScalarsPerStsD',['../structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperstgd',['kScalarsPerStgD',['../structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203',1,'cutlass::gemm::GemmConfig']]],
+  ['kscalarsperstsa',['kScalarsPerStsA',['../structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f',1,'cutlass::gemm::GemmConfig::kScalarsPerStsA()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a69775031f651795f697b628677b8e4eb',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::kScalarsPerStsA()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aedb61c43d8fb9c4ba18ae72601b9f6e1',1,'cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::kScalarsPerStsA()']]],
+  ['kscalarsperstsb',['kScalarsPerStsB',['../structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce',1,'cutlass::gemm::GemmConfig::kScalarsPerStsB()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aaa3228d45ff4428bba0f88a7a6e8b31b',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;::kScalarsPerStsB()'],['../structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a8a6cef5e733eab9c0ead20b1e345ad6f',1,'cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;::kScalarsPerStsB()']]],
+  ['kscalarsperstsd',['kScalarsPerStsD',['../structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f',1,'cutlass::gemm::GemmConfig']]],
   ['kscalarsperthread',['kScalarsPerThread',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#ae0b53d76096f9d34df6e16280565c7b1',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kScalarsPerThread()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kScalarsPerThread()']]],
   ['kskew',['kSkew',['../structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html#ace14ca9ad11e2cdafcd4a4b63c0df591',1,'cutlass::gemm::GemmSharedStoreTileAbTraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html#aba6decf87d770becaadd610d9fc27491',1,'cutlass::gemm::GemmSharedStoreWithSkewTileAbTraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#aaffe67e519e919bf561142e05da6e6c8',1,'cutlass::gemm::GemmSharedLoadTileATraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ac9cd90ecd02809060a2fe6e2da4210f9',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kSkew()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kSkew()']]],
-  ['kstages',['kStages',['../structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52',1,'cutlass::gemm::GemmConfig']]],
+  ['kskewa',['kSkewA',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9c296924f9a6c6908f09830bbbf6a775',1,'cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kSkewA()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac8da30393042cf6e785bdd54b11d9408',1,'cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;::kSkewA()']]],
+  ['kskewb',['kSkewB',['../structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab35a6b3ff04e4128e4ca4a8cc0459b16',1,'cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kSkewB()'],['../structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a6d0f50e83067373b249b38444eb7fe65',1,'cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;::kSkewB()']]],
+  ['ksplitk',['kSplitK',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2',1,'cutlass::gemm::GemmSharedLoadTileDTraits']]],
+  ['kstages',['kStages',['../structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508',1,'cutlass::gemm::GemmConfig']]],
+  ['kstoragerank',['kStorageRank',['../structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30',1,'cutlass::MatrixLayout::RowMajor::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70',1,'cutlass::MatrixLayout::ColumnMajor::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800',1,'cutlass::MatrixLayout::RowMajorInterleaved::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f',1,'cutlass::MatrixLayout::ColumnMajorInterleaved::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7',1,'cutlass::MatrixLayout::ContiguousLayout::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3',1,'cutlass::MatrixLayout::ColumnMajorBlockLinear::kStorageRank()'],['../structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d',1,'cutlass::MatrixLayout::RowMajorBlockLinear::kStorageRank()'],['../structcutlass_1_1IdentityTensorMapFunc.html#ac609498e7fe858b4fb3791d1039438f4',1,'cutlass::IdentityTensorMapFunc::kStorageRank()'],['../classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2',1,'cutlass::TensorRef::kStorageRank()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::kStorageRank()'],['../structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243',1,'cutlass::TensorRefArray::kStorageRank()']]],
   ['kstrideh',['kStrideH',['../structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a87918f4d67a9c1e19dcd3c6bfc243e97',1,'cutlass::gemm::GemmGlobalTileCdTraits']]],
-  ['kthreads',['kThreads',['../structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b',1,'cutlass::gemm::Gemm::kThreads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kThreads()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kThreads()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf',1,'cutlass::gemm::GemmConfig::kThreads()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85',1,'cutlass::TileTraitsStrideMajor::kThreads()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9',1,'cutlass::TileTraitsContiguousMajor::kThreads()'],['../structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642',1,'cutlass::TileTraitsWarpRake::kThreads()'],['../structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1',1,'cutlass::TileTraitsStandard::kThreads()']]],
+  ['kthreads',['kThreads',['../structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b',1,'cutlass::gemm::Gemm::kThreads()'],['../structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f',1,'cutlass::gemm::GemmConfig::kThreads()'],['../structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a05039ba8b7d9890903064b1a834dcd3e',1,'cutlass::gemm::GemmSharedStoreTileDTraits::kThreads()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d',1,'cutlass::gemm::GemmSharedLoadTileDTraits::kThreads()'],['../structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85',1,'cutlass::TileTraitsStrideMajor::kThreads()'],['../structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9',1,'cutlass::TileTraitsContiguousMajor::kThreads()'],['../structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642',1,'cutlass::TileTraitsWarpRake::kThreads()'],['../structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1',1,'cutlass::TileTraitsStandard::kThreads()']]],
   ['kthreadsperwarp',['kThreadsPerWarp',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f',1,'cutlass::gemm::GemmSharedLoadTileATraits::kThreadsPerWarp()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kThreadsPerWarp()']]],
   ['kusage',['kUsage',['../structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html#a962ffde3b3db78792b67dd1f57ab0a05',1,'cutlass::gemm::GemmMultiplicandTraits']]],
-  ['kvalue',['kValue',['../structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad',1,'cutlass::Extent::kValue()'],['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a10f7184a9a50de0268efa45dab5dc304',1,'cutlass::Extent&lt; Vector&lt; T, Lanes &gt; &gt;::kValue()'],['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a87917a6dfbb1662416c4ea4831669aaf',1,'cutlass::Extent&lt; Vector&lt; T, Lanes &gt; const &gt;::kValue()']]],
-  ['kw',['kW',['../structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421',1,'cutlass::Shape']]],
+  ['kvalue',['kValue',['../structcutlass_1_1Min.html#a97e6dd3ff6fb5404e8a6e6109f73f429',1,'cutlass::Min::kValue()'],['../structcutlass_1_1Max.html#a6ed8be7ed855eea8f8d08921f7b5d763',1,'cutlass::Max::kValue()'],['../structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad',1,'cutlass::Extent::kValue()'],['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a10f7184a9a50de0268efa45dab5dc304',1,'cutlass::Extent&lt; Vector&lt; T, Lanes &gt; &gt;::kValue()'],['../structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a87917a6dfbb1662416c4ea4831669aaf',1,'cutlass::Extent&lt; Vector&lt; T, Lanes &gt; const &gt;::kValue()']]],
+  ['kw',['kW',['../structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421',1,'cutlass::Shape::kW()'],['../structcutlass_1_1TileCoord.html#ac2c14af3ceffd5ef8f17c9e0efb4e5ec',1,'cutlass::TileCoord::kW()']]],
   ['kwarpcount',['kWarpCount',['../structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d',1,'cutlass::TileTraitsWarpRake::kWarpCount()'],['../structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25',1,'cutlass::TileTraitsStandard::kWarpCount()']]],
+  ['kwarpgemmsteps',['kWarpGemmSteps',['../structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356',1,'cutlass::gemm::Gemm']]],
   ['kwarps',['kWarps',['../structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be',1,'cutlass::gemm::GemmSharedLoadTileATraits::kWarps()'],['../structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2',1,'cutlass::gemm::GemmSharedLoadTileBTraits::kWarps()']]],
   ['kwarpscontiguous',['kWarpsContiguous',['../structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce',1,'cutlass::TileTraitsWarpRake']]],
-  ['kwarpsize',['kWarpSize',['../structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e',1,'cutlass::gemm::GemmConfig::kWarpSize()'],['../structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b',1,'cutlass::TileTraitsWarpRake::kWarpSize()'],['../structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10',1,'cutlass::TileTraitsStandard::kWarpSize()']]],
+  ['kwarpsize',['kWarpSize',['../structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396',1,'cutlass::gemm::GemmConfig::kWarpSize()'],['../structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b',1,'cutlass::TileTraitsWarpRake::kWarpSize()'],['../structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10',1,'cutlass::TileTraitsStandard::kWarpSize()']]],
   ['kwarpsstrided',['kWarpsStrided',['../structcutlass_1_1TileTraitsWarpRake.html#a8b1d3fe590f426ce11d597bb98c51bd4',1,'cutlass::TileTraitsWarpRake']]],
   ['kwc',['kWc',['../structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276',1,'cutlass::ShapeCount']]],
   ['kwordcount',['kWordCount',['../structcutlass_1_1PredicateVector.html#a734bbfaf3829f73ef0b44fa7db4ccd42',1,'cutlass::PredicateVector']]]
diff --git a/docs/search/variables_9.js b/docs/search/variables_9.js
index d7ebf99aa..8041de3c4 100644
--- a/docs/search/variables_9.js
+++ b/docs/search/variables_9.js
@@ -1,9 +1,5 @@
 var searchData=
 [
-  ['lda',['lda',['../structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789',1,'cutlass::gemm::GemmDesc']]],
-  ['ldb',['ldb',['../structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe',1,'cutlass::gemm::GemmDesc']]],
-  ['ldc',['ldc',['../structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db',1,'cutlass::gemm::GemmDesc']]],
-  ['ldd',['ldd',['../structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9',1,'cutlass::gemm::GemmDesc']]],
-  ['load',['load',['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#aea5ed35a44624684ffa9ada9d09a8893',1,'cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage']]],
-  ['load_5fiterator',['load_iterator',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a42ffcba6af2b5ddfb1f4825a34d43532',1,'cutlass::gemm::GlobalLoadStreamBase::Params::load_iterator()'],['../unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a3be938f8661f9cd10966866b7b80b471',1,'cutlass::gemm::GlobalLoadStreamBase::SharedStorage::load_iterator()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e',1,'cutlass::gemm::GlobalLoadStreamBase::load_iterator()']]]
+  ['load',['load',['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af',1,'cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage']]],
+  ['load_5fiterator',['load_iterator',['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065',1,'cutlass::gemm::GlobalLoadStream::Params::load_iterator()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c',1,'cutlass::gemm::GlobalLoadStream::load_iterator()']]]
 ];
diff --git a/docs/search/variables_a.js b/docs/search/variables_a.js
index 131fefbd7..a26f7fe2c 100644
--- a/docs/search/variables_a.js
+++ b/docs/search/variables_a.js
@@ -1,5 +1,6 @@
 var searchData=
 [
-  ['m',['m',['../structcutlass_1_1gemm_1_1GemmDesc.html#a5c2b3e75cb6873762ba3f85487b78579',1,'cutlass::gemm::GemmDesc::m()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22',1,'cutlass::gemm::GemmEpilogue::m()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aaf27c0f2f4ab730ed5c865e9f7d2373b',1,'cutlass::gemm::GemmTraits::Params::m()']]],
-  ['main_5floop',['main_loop',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4',1,'cutlass::gemm::GemmTraits::SharedStorage']]]
+  ['main_5floop',['main_loop',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#aa5dd7edc3cffa785eb1e5b62c18c74c4',1,'cutlass::gemm::GemmTraits::SharedStorage']]],
+  ['mask_5f',['mask_',['../structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762',1,'cutlass::gemm::IgemmGlobalIteratorAb']]],
+  ['multiplicand_5fbounds',['multiplicand_bounds',['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1',1,'cutlass::gemm::GlobalLoadStream']]]
 ];
diff --git a/docs/search/variables_b.js b/docs/search/variables_b.js
index 97f3b3b15..edb0ab20a 100644
--- a/docs/search/variables_b.js
+++ b/docs/search/variables_b.js
@@ -1,4 +1,4 @@
 var searchData=
 [
-  ['n',['N',['../structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca',1,'cutlass::Coord::N()'],['../structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a',1,'cutlass::gemm::GemmDesc::n()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea',1,'cutlass::gemm::GemmEpilogue::n()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a437d4b6f1f149849c5ae635a5993e7ac',1,'cutlass::gemm::GemmTraits::Params::n()']]]
+  ['n',['N',['../structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030',1,'cutlass::Coord']]]
 ];
diff --git a/docs/search/variables_c.js b/docs/search/variables_c.js
index 4774d499d..1dfe6b3ef 100644
--- a/docs/search/variables_c.js
+++ b/docs/search/variables_c.js
@@ -1,9 +1,4 @@
 var searchData=
 [
-  ['params',['params',['../structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2',1,'cutlass::gemm::Gemm::params()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362',1,'cutlass::gemm::GemmEpilogue::params()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322',1,'cutlass::gemm::GemmGlobalIteratorAb::params()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f',1,'cutlass::gemm::GemmGlobalIteratorCd::params()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::params()'],['../structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b',1,'cutlass::TileLoadIterator::params()'],['../structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f',1,'cutlass::TileStoreIterator::params()']]],
-  ['pointer',['pointer',['../structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6',1,'cutlass::FragmentIterator::pointer()'],['../structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b',1,'cutlass::FragmentConstIterator::pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::pointer()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::pointer()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9',1,'cutlass::TileLoadIterator::Params::pointer()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b',1,'cutlass::TileStoreIterator::Params::pointer()']]],
-  ['predicate_5finc_5fadvance',['predicate_inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_advance()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::predicate_inc_advance()']]],
-  ['predicate_5finc_5fh',['predicate_inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_h()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::predicate_inc_h()']]],
-  ['predicate_5foffset',['predicate_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_offset()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::predicate_offset()']]],
-  ['predicates',['predicates',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c',1,'cutlass::gemm::GemmGlobalIteratorAb::predicates()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977',1,'cutlass::gemm::GemmGlobalIteratorCd::predicates()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::predicates()']]]
+  ['offset_5fto_5fresidue',['offset_to_residue',['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1',1,'cutlass::gemm::GlobalLoadStream::Params']]]
 ];
diff --git a/docs/search/variables_d.js b/docs/search/variables_d.js
index c72e15396..32f5df5c6 100644
--- a/docs/search/variables_d.js
+++ b/docs/search/variables_d.js
@@ -1,5 +1,11 @@
 var searchData=
 [
-  ['rank',['Rank',['../classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66',1,'cutlass::TensorRef::Rank()'],['../classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90',1,'cutlass::TensorView::Rank()']]],
-  ['registers',['registers',['../unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a',1,'cutlass::Vector::registers()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f',1,'cutlass::Vector&lt; half, kLanes_ &gt;::registers()']]]
+  ['params',['params',['../structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2',1,'cutlass::gemm::Gemm::params()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362',1,'cutlass::gemm::GemmEpilogue::params()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e',1,'cutlass::gemm::GlobalLoadStream::params()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322',1,'cutlass::gemm::GemmGlobalIteratorAb::params()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f',1,'cutlass::gemm::GemmGlobalIteratorCd::params()'],['../structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d',1,'cutlass::gemm::LinearScaling::params()'],['../structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596',1,'cutlass::TileLoadIterator::params()'],['../structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d',1,'cutlass::TileStoreIterator::params()']]],
+  ['pointer',['pointer',['../structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6',1,'cutlass::FragmentIterator::pointer()'],['../structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b',1,'cutlass::FragmentConstIterator::pointer()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::pointer()'],['../structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6',1,'cutlass::TileLoadIterator::Params::pointer()'],['../structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827',1,'cutlass::TileStoreIterator::Params::pointer()']]],
+  ['pointers',['pointers',['../structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e',1,'cutlass::TensorRefArray']]],
+  ['predicate_5finc_5fadvance',['predicate_inc_advance',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129',1,'cutlass::gemm::GemmGlobalIteratorCd::Params']]],
+  ['predicate_5finc_5fh',['predicate_inc_h',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c',1,'cutlass::gemm::GemmGlobalIteratorCd::Params']]],
+  ['predicate_5foffset',['predicate_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a',1,'cutlass::gemm::GemmGlobalIteratorCd::Params']]],
+  ['predicates',['predicates',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c',1,'cutlass::gemm::GemmGlobalIteratorAb::predicates()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977',1,'cutlass::gemm::GemmGlobalIteratorCd::predicates()'],['../structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f',1,'cutlass::PredicatedTileLoadStream::predicates()'],['../structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe',1,'cutlass::PredicatedTileStoreStream::predicates()']]],
+  ['problem_5fsize',['problem_size',['../structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f',1,'cutlass::gemm::GemmDesc::problem_size()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e',1,'cutlass::gemm::GemmEpilogue::problem_size()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90',1,'cutlass::gemm::GemmTraits::Params::problem_size()']]]
 ];
diff --git a/docs/search/variables_e.js b/docs/search/variables_e.js
index 0f47e5498..a908e7a2d 100644
--- a/docs/search/variables_e.js
+++ b/docs/search/variables_e.js
@@ -1,19 +1,5 @@
 var searchData=
 [
-  ['scalars',['scalars',['../unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f',1,'cutlass::Vector::scalars()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3',1,'cutlass::Vector&lt; half, kLanes_ &gt;::scalars()']]],
-  ['shared',['shared',['../unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html#afabd328b106d45b156200f73942d211e',1,'cutlass::gemm::GemmTraits::StreamSharedStorage']]],
-  ['shared_5fload_5fiterator_5fd',['shared_load_iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a1742e43c128665f0ca39cb578291df81',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
-  ['shared_5fstorage',['shared_storage',['../structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b',1,'cutlass::gemm::Gemm::shared_storage()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e',1,'cutlass::gemm::GemmEpilogue::shared_storage()']]],
-  ['shared_5fstore_5fiterator_5fd',['shared_store_iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#af79a0c74a4c30ccec59b393721b5dfc1',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
-  ['shared_5fstream',['shared_stream',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#ae63b5a52106dbd37ea304196335ec210',1,'cutlass::gemm::GemmEpilogueTraits::SharedStorage']]],
-  ['shared_5fstream_5fa',['shared_stream_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978',1,'cutlass::gemm::GemmTraits::Params']]],
-  ['shared_5fstream_5fb',['shared_stream_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d',1,'cutlass::gemm::GemmTraits::Params']]],
-  ['stage',['stage',['../structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92',1,'cutlass::TileLoadIterator::stage()'],['../structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e',1,'cutlass::TileStoreIterator::stage()']]],
-  ['store',['store',['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a1f31090613c4e6f0895f598880d6c4e5',1,'cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage']]],
-  ['store_5fiterator',['store_iterator',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html#a3e5167fa3f2dc0d8b4b903bd4e936969',1,'cutlass::gemm::GlobalLoadStreamBase::Params::store_iterator()'],['../unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html#a939e9ddecc5ee97882a54211a61f5586',1,'cutlass::gemm::GlobalLoadStreamBase::SharedStorage::store_iterator()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae',1,'cutlass::gemm::GlobalLoadStreamBase::store_iterator()']]],
-  ['stream_5fa',['stream_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage::stream_a()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#a82a59524b5d3134eb609d280193a5c47',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::stream_a()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a8e68561561ac6b08efbfd116903198c8',1,'cutlass::gemm::GemmTraits::SharedLoadStream::stream_a()']]],
-  ['stream_5fb',['stream_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa',1,'cutlass::gemm::GemmTraits::MainLoopSharedStorage::stream_b()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#acc287ce5e2f3635d9d55d91914d2d04c',1,'cutlass::gemm::GemmTraits::GlobalLoadStream::stream_b()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a1fdc6af44c14c88a94529d187fda176d',1,'cutlass::gemm::GemmTraits::SharedLoadStream::stream_b()']]],
-  ['stride_5fd',['stride_d',['../structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1',1,'cutlass::TileIteratorBase::Params']]],
-  ['stride_5fh',['stride_h',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae0fdc7426b22ff2c20f077e251ebc823',1,'cutlass::gemm::GemmEpilogueTraits::Params::stride_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::stride_h()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::stride_h()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc',1,'cutlass::TileIteratorBase::Params::stride_h()']]],
-  ['stride_5fw',['stride_w',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2',1,'cutlass::gemm::GemmEpilogueTraits::Params::stride_w()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c',1,'cutlass::TileIteratorBase::Params::stride_w()']]]
+  ['rank',['Rank',['../classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a',1,'cutlass::TensorRef::Rank()'],['../classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a233fba9abdbbd0fe3a2cc7465ea76a41',1,'cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Rank()'],['../classcutlass_1_1TensorView.html#a8dbb7043546fae133547d2c3e46dddab',1,'cutlass::TensorView::Rank()']]],
+  ['registers',['registers',['../unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a',1,'cutlass::Vector::registers()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f',1,'cutlass::Vector&lt; half, kLanes_ &gt;::registers()'],['../unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#af27a36f604513f05aebe0624a9c539ab',1,'cutlass::Vector&lt; bin1_t, kLanes_ &gt;::registers()'],['../unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ace5e03860b434b2d2a4590bd2bc8c147',1,'cutlass::Vector&lt; int4_t, kLanes_ &gt;::registers()'],['../unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a15d5103e46d53e030100dedaecb0220a',1,'cutlass::Vector&lt; uint4_t, kLanes_ &gt;::registers()']]]
 ];
diff --git a/docs/search/variables_f.js b/docs/search/variables_f.js
index 834a84b7c..c8429bd42 100644
--- a/docs/search/variables_f.js
+++ b/docs/search/variables_f.js
@@ -1,8 +1,20 @@
 var searchData=
 [
-  ['thread_5foffset',['thread_offset',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04',1,'cutlass::gemm::GemmGlobalIteratorAb::thread_offset()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0',1,'cutlass::gemm::GemmGlobalIteratorCd::thread_offset()'],['../structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066',1,'cutlass::gemm::WmmaGemmGlobalIteratorCd::thread_offset()'],['../structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457',1,'cutlass::TileLoadIterator::thread_offset()'],['../structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035',1,'cutlass::TileStoreIterator::thread_offset()']]],
-  ['transformed_5fa',['transformed_a',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a883b28ca237b1ec076856232cfee0c6f',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['transformed_5fb',['transformed_b',['../structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#a9369a5f819d2a42997491e0df96f47ef',1,'cutlass::gemm::GemmTraits::SharedLoadStream']]],
-  ['transformed_5ffragment',['transformed_fragment',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf',1,'cutlass::gemm::GlobalLoadStreamBase']]],
-  ['transformer',['transformer',['../structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9',1,'cutlass::gemm::GlobalLoadStreamBase::transformer()'],['../structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7',1,'cutlass::gemm::SharedLoadStream::transformer()']]]
+  ['scalars',['scalars',['../unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f',1,'cutlass::Vector::scalars()'],['../unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a81709dacea12d6bd3bb328a3f0a519b0',1,'cutlass::Vector&lt; half, 1 &gt;::scalars()'],['../unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3',1,'cutlass::Vector&lt; half, kLanes_ &gt;::scalars()']]],
+  ['second',['second',['../structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc',1,'cutlass::ZipTileAllocation::second()'],['../structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c',1,'cutlass::ZipFragment::second()'],['../structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9',1,'cutlass::ZipConvert::second()'],['../structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451',1,'cutlass::ZipTensorRef::second()'],['../structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26',1,'cutlass::ZipTileIterator::Params::second()'],['../classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0',1,'cutlass::ZipTileIterator::second()']]],
+  ['shared_5fload_5fstream_5fd',['shared_load_stream_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a5d3d1abd85f18476a74bcf616a717f9d',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
+  ['shared_5fstorage',['shared_storage',['../structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b',1,'cutlass::gemm::Gemm::shared_storage()'],['../structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e',1,'cutlass::gemm::GemmEpilogue::shared_storage()']]],
+  ['shared_5fstore_5fiterator_5fd',['shared_store_iterator_d',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adfdf3eca06ea4061fbfe016336a3f276',1,'cutlass::gemm::GemmEpilogueTraits::Params']]],
+  ['shared_5fstream',['shared_stream',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e',1,'cutlass::gemm::GemmEpilogueTraits::SharedStorage::shared_stream()'],['../structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a50e9cc382a32abd5beab299a79b30b27',1,'cutlass::gemm::GemmTraits::Params::shared_stream()']]],
+  ['source_5ffragment',['source_fragment',['../structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a',1,'cutlass::TileStoreStream']]],
+  ['stage',['stage',['../structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3',1,'cutlass::TileLoadIterator::stage()'],['../structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e',1,'cutlass::TileStoreIterator::stage()']]],
+  ['storage',['storage',['../structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604',1,'cutlass::TileAllocation']]],
+  ['store',['store',['../unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a673ddeb91e89c9a39c0a4dbaaa97dd8f',1,'cutlass::gemm::GemmEpilogueTraits::StreamSharedStorage']]],
+  ['store_5fiterator',['store_iterator',['../structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f',1,'cutlass::gemm::GlobalLoadStream::Params::store_iterator()'],['../structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d',1,'cutlass::gemm::GlobalLoadStream::store_iterator()']]],
+  ['stream_5fa',['stream_a',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705',1,'cutlass::gemm::GlobalLoadStreamPair::Params::stream_a()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a87d507b703a0eb654265f4529ed18f66',1,'cutlass::gemm::GlobalLoadStreamPair::SharedStorage::stream_a()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127',1,'cutlass::gemm::GlobalLoadStreamPair::stream_a()'],['../structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#afb56016927b59b8d5447c3656f0b634e',1,'cutlass::gemm::SharedStreamPair::Params::stream_a()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a',1,'cutlass::gemm::SharedStreamPair::stream_a()']]],
+  ['stream_5fb',['stream_b',['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258',1,'cutlass::gemm::GlobalLoadStreamPair::Params::stream_b()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a6d9444ed13ed544febe196e3e835ea16',1,'cutlass::gemm::GlobalLoadStreamPair::SharedStorage::stream_b()'],['../structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9',1,'cutlass::gemm::GlobalLoadStreamPair::stream_b()'],['../structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#a4a8f9207ffb3bbcdb000af62808371f5',1,'cutlass::gemm::SharedStreamPair::Params::stream_b()'],['../structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9',1,'cutlass::gemm::SharedStreamPair::stream_b()']]],
+  ['stride_5fd',['stride_d',['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::stride_d()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2',1,'cutlass::TileIteratorBase::Params::stride_d()']]],
+  ['stride_5fh',['stride_h',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a497b91e93d0eb29ca54553f8de4c694f',1,'cutlass::gemm::GemmEpilogueTraits::Params::stride_h()'],['../structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e',1,'cutlass::gemm::GemmGlobalIteratorCd::Params::stride_h()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623',1,'cutlass::TileIteratorBase::Params::stride_h()']]],
+  ['stride_5fw',['stride_w',['../structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68',1,'cutlass::gemm::GemmEpilogueTraits::Params::stride_w()'],['../structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d',1,'cutlass::TileIteratorBase::Params::stride_w()']]],
+  ['strides',['strides',['../structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be',1,'cutlass::TensorRefArray']]]
 ];
diff --git a/docs/sgemm__traits_8h.html b/docs/sgemm__traits_8h.html
index 4dd76bfcc..ad0a7e506 100644
--- a/docs/sgemm__traits_8h.html
+++ b/docs/sgemm__traits_8h.html
@@ -82,21 +82,24 @@ $(function() {
 
 <p>Defies structural properties of single-precision GEMM.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__epilogue_8h_source.html">cutlass/gemm/gemm_epilogue.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__epilogue__traits_8h_source.html">cutlass/gemm/gemm_epilogue_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="gemm__traits_8h_source.html">cutlass/gemm/gemm_traits.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="thread__multiply__add_8h_source.html">cutlass/gemm/thread_multiply_add.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="gemm_8h_source.html">cutlass/gemm/gemm.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue_8h_source.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__epilogue__traits_8h_source.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__shared__tile_8h_source.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__traits_8h_source.html">cutlass/gemm/gemm_traits.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="thread__multiply__add_8h_source.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</code><br />
 </div>
 <p><a href="sgemm__traits_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html">cutlass::gemm::SgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html">cutlass::gemm::SgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, kLaunchBounds &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html">cutlass::gemm::SgemmLBTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to define SGEMM traits using <a class="el" href="structcutlass_1_1gemm_1_1Launch.html" title="Partial specialization for launching the GEMM kernel with or without launch bounds. ">Launch</a> Bounds.  <a href="structcutlass_1_1gemm_1_1SgemmLBTraits.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -109,7 +112,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/sgemm__traits_8h_source.html b/docs/sgemm__traits_8h_source.html
index 965c54970..01b42b7b7 100644
--- a/docs/sgemm__traits_8h_source.html
+++ b/docs/sgemm__traits_8h_source.html
@@ -76,26 +76,27 @@ $(function() {
 <div class="title">sgemm_traits.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="sgemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="thread__multiply__add_8h.html">cutlass/gemm/thread_multiply_add.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1&gt;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SgemmConfig.html">   52</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SgemmConfig.html">SgemmConfig</a></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;          float,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;          float,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;          float,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;          float,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;          OutputTile_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;          ThreadMultiplyAdd&lt;AccumulatorsPerThread_, Shape&lt;1, 4, 8&gt;, float, float, float&gt;,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;          kScalarsPerLdgA_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;          kScalarsPerLdgA_,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;          4,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;          kScalarsPerLdgB_,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;          kScalarsPerLdgB_,</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;          4,</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;          1,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;          4,</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;          1,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;          2&gt; {};</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 128, 128&gt;</a>,</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;float&gt;</a>,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerThread_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 8, 8&gt;</a>,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1,</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="keyword">typename</span> GemmConfig_ =</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SgemmConfig.html">SgemmConfig&lt;OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_&gt;</a>,</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="keyword">typename</span> GemmEpilogueTraits_ =</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits&lt;GemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SgemmTraits.html">  112</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SgemmTraits.html">SgemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a>&lt;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                         <span class="comment">// The layout for A.</span></div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;                         kLayoutA_,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                         <span class="comment">// The layout for B.</span></div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;                         kLayoutB_,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;                         GemmConfig_,</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;                         GemmEpilogue&lt;GemmEpilogueTraits_&gt;,</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;                         Index_&gt; {};</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<a href="sgemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__multiply__add_8h.html">cutlass/gemm/thread_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <span class="keywordtype">bool</span> kLaunchBounds = <span class="keyword">true</span>&gt;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SgemmConfig.html">   54</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SgemmConfig.html">SgemmConfig</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html">GemmConfig</a>&lt;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;                         float,</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;                         float,</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;                         float,</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;                         float,</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;                         OutputTile_,</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;                         ThreadMultiplyAdd&lt;ThreadGemmShape_, Shape&lt;1, 4, 8&gt;, float, float, float&gt;,</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;                         kScalarsPerLdgA_,</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;                         kScalarsPerLdgA_,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                         4,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                         kScalarsPerLdgB_,</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;                         kScalarsPerLdgB_,</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;                         4,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                         1,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;                         4,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;                         1,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;                         2,</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;                         false,</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;                         true,</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;                         kLaunchBounds&gt; {};</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 128, 128&gt;</a>,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;float&gt;</a>,</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 8, 8&gt;</a>,</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="keyword">typename</span> GemmConfig_ =</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SgemmConfig.html">SgemmConfig&lt;OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, false&gt;</a>,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keyword">typename</span> GemmEpilogueTraits_ =</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits&lt;GemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SgemmTraits.html">  119</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SgemmTraits.html">SgemmTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a>&lt;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;                         <span class="comment">// The layout for A.</span></div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;                         kLayoutA_,</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;                         <span class="comment">// The layout for B.</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;                         kLayoutB_,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;                         GemmConfig_,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;                         GemmEpilogue&lt;GemmEpilogueTraits_&gt;,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;                         Index_&gt; {};</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <span class="keyword">typename</span> OutputTile_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 128, 128&gt;</a>,</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = <a class="code" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling&lt;float&gt;</a>,</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="keyword">typename</span> ThreadGemmShape_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;8, 8, 8&gt;</a>,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 1,</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 1,</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    <span class="keyword">typename</span> GemmConfig_ =</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SgemmConfig.html">SgemmConfig&lt;OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, true&gt;</a>,</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <span class="keyword">typename</span> GemmEpilogueTraits_ =</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits&lt;GemmConfig_, EpilogueFunctor_, Index_&gt;</a> &gt;</div><div class="line"><a name="l00157"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html">  157</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html">SgemmLBTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">SimplifiedGemmTraits</a>&lt;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;                         <span class="comment">// The layout for A.</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;                         kLayoutA_,</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;                         <span class="comment">// The layout for B.</span></div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;                         kLayoutB_,</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;                         <span class="comment">// The config.</span></div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;                         GemmConfig_,</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;                         <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;                         GemmEpilogue&lt;GemmEpilogueTraits_&gt;,</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;                         <span class="comment">// The index.</span></div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;                         Index_&gt; {};</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
 <div class="ttc" id="gemm__traits_8h_html"><div class="ttname"><a href="gemm__traits_8h.html">gemm_traits.h</a></div><div class="ttdoc">Defines structural properties of complete GEMM computation. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SgemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SgemmConfig.html">cutlass::gemm::SgemmConfig</a></div><div class="ttdef"><b>Definition:</b> sgemm_traits.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SgemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SgemmConfig.html">cutlass::gemm::SgemmConfig</a></div><div class="ttdef"><b>Definition:</b> sgemm_traits.h:54</div></div>
 <div class="ttc" id="thread__multiply__add_8h_html"><div class="ttname"><a href="thread__multiply__add_8h.html">thread_multiply_add.h</a></div><div class="ttdoc">Template implementing matrix multiply-add operations on fragments. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SgemmLBTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SgemmLBTraits.html">cutlass::gemm::SgemmLBTraits</a></div><div class="ttdoc">Helper to define SGEMM traits using Launch Bounds. </div><div class="ttdef"><b>Definition:</b> sgemm_traits.h:157</div></div>
 <div class="ttc" id="gemm__epilogue_8h_html"><div class="ttname"><a href="gemm__epilogue_8h.html">gemm_epilogue.h</a></div><div class="ttdoc">Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the comp...</div></div>
 <div class="ttc" id="gemm__shared__tile_8h_html"><div class="ttname"><a href="gemm__shared__tile_8h.html">gemm_shared_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing tiles to and from shared memory. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:79</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a></div><div class="ttdef"><b>Definition:</b> gemm_config.h:76</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:300</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SgemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SgemmTraits.html">cutlass::gemm::SgemmTraits</a></div><div class="ttdef"><b>Definition:</b> sgemm_traits.h:112</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:40</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_epilogue_traits.h:323</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SgemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SgemmTraits.html">cutlass::gemm::SgemmTraits</a></div><div class="ttdef"><b>Definition:</b> sgemm_traits.h:119</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1LinearScaling_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a></div><div class="ttdoc">Functor to compute linear combination of fragments. </div><div class="ttdef"><b>Definition:</b> linear_scaling.h:51</div></div>
 <div class="ttc" id="gemm_8h_html"><div class="ttname"><a href="gemm_8h.html">gemm.h</a></div><div class="ttdoc">Implements a software-pipelined efficient GEMM. </div></div>
 <div class="ttc" id="gemm__epilogue__traits_8h_html"><div class="ttname"><a href="gemm__epilogue__traits_8h.html">gemm_epilogue_traits.h</a></div><div class="ttdoc">Defines structural properties of the GEMM epilogue. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">cutlass::gemm::SimplifiedGemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:723</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1SimplifiedGemmTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html">cutlass::gemm::SimplifiedGemmTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_traits.h:650</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/shape_8h.html b/docs/shape_8h.html
index 483edeeb0..9c876db2f 100644
--- a/docs/shape_8h.html
+++ b/docs/shape_8h.html
@@ -82,7 +82,7 @@ $(function() {
 
 <p>Defines Shape implementing the Layout concept for representing a 4D hypercube of objects.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
 </div>
 <p><a href="shape_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -104,30 +104,20 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeDiv.html">cutlass::ShapeDiv&lt; A_, B_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeDivCeiling.html">cutlass::ShapeDivCeiling&lt; A_, B_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeMax.html">cutlass::ShapeMax&lt; A_, B_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeMin.html">cutlass::ShapeMin&lt; A_, B_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides&lt; Shape_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides&lt; Shape_, elementsPerAccess &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube.  <a href="structcutlass_1_1ComputeOffsetFromShape.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html">cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, kSc_ &gt; &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube with a depth of 1.  <a href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html">cutlass::ComputeOffsetFromShape&lt; Shape&lt; 1, kSh_, kSw_, 1 &gt; &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube with one channel and a depth of 1.  <a href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube.  <a href="structcutlass_1_1ComputeOffsetFromStrides.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html">cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, S_c_ &gt; &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube with a depth of 1.  <a href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html">cutlass::ComputeOffsetFromStrides&lt; Shape&lt; 1, S_h_, S_w_, 1 &gt; &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Compute the offset for the given coordinates in a cube with one channel and a depth of 1.  <a href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">cutlass::ComputeThreadOffsetFromStrides&lt; Threads_, Strides_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Decompose threadId.x into coordinate of a cube whose dimensions are specified by Threads_. Afterwards compute the offset of those coordinates using Strides_.  <a href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -146,7 +136,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/shape_8h_source.html b/docs/shape_8h_source.html
index 5b980198b..0e48d6eb2 100644
--- a/docs/shape_8h_source.html
+++ b/docs/shape_8h_source.html
@@ -76,43 +76,46 @@ $(function() {
 <div class="title">shape.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="shape_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kD_ = 1, <span class="keywordtype">int</span> kH_ = 1, <span class="keywordtype">int</span> kW_ = 1, <span class="keywordtype">int</span> kC_ = 1&gt;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html">   64</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Shape.html">Shape</a> {</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">   66</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">kD</a> = kD_;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">   68</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">kH</a> = kH_;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">   70</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">kW</a> = kW_;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">   72</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">kC</a> = kC_;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;};</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Shape&gt;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html">   79</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount</a> {</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276">   81</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276">kWc</a> = <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Shape::kW</a> * <a class="code" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">Shape::kC</a>;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f">   83</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f">kHw</a> = <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Shape::kH</a> * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Shape::kW</a>;</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742">   85</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742">kHwc</a> = <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Shape::kH</a> * <a class="code" href="structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276">kWc</a>;</div><div class="line"><a name="l00087"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#af7d7ccd42de2c49fe57f03cf0e657fe8">   87</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#af7d7ccd42de2c49fe57f03cf0e657fe8">kDhw</a> = <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Shape::kD</a> * <a class="code" href="structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f">kHw</a>;</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#a5a274564d6b8607a0be621b2664fba18">   89</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#a5a274564d6b8607a0be621b2664fba18">kDhwc</a> = <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Shape::kD</a> * <a class="code" href="structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742">kHwc</a>;</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">   91</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">kCount</a> = <a class="code" href="structcutlass_1_1ShapeCount.html#a5a274564d6b8607a0be621b2664fba18">kDhwc</a>;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;};</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keywordtype">int</span> kScale_&gt;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeScale.html">   97</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeScale.html">ShapeScale</a> {</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29">   98</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29">Shape&lt;A_::kD * kScale_, A_::kH * kScale_, A_::kW * kScale_, A_::kC * kScale_&gt;</a> <a class="code" href="structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29">Shape</a>;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;};</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeAdd.html">  104</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeAdd.html">ShapeAdd</a> {</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71">  105</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71">Shape&lt;A_::kD + B_::kD, A_::kH + B_::kH, A_::kW + B_::kW, A_::kC + B_::kC&gt;</a> <a class="code" href="structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71">Shape</a>;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;};</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeSub.html">  111</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeSub.html">ShapeSub</a> {</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9">  112</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9">Shape</a>&lt;A_::kD - B_::kD, A_::kH - B_::kH, A_::kW - B_::kW, A_::kC - B_::kC&gt; <a class="code" href="structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9">Shape</a>;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;};</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00118"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMul.html">  118</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeMul.html">ShapeMul</a> {</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">  119</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">Shape&lt;A_::kD * B_::kD, A_::kH * B_::kH, A_::kW * B_::kW, A_::kC * B_::kC&gt;</a> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">Shape</a>;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;};</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeDiv.html">  125</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a> {</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">  126</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">Shape</a>&lt;A_::kD / B_::kD, A_::kH / B_::kH, A_::kW / B_::kW, A_::kC / B_::kC&gt; <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">Shape</a>;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;};</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00132"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMax.html">  132</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeMax.html">ShapeMax</a> {</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">Shape&lt;(A_::kD &gt;</a> B_::kD ? A_::kD : B_::kD),</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;                (A_::kH &gt; B_::kH ? A_::kH : B_::kH),</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;                (A_::kW &gt; B_::kW ? A_::kW : B_::kW),</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;                (A_::kC &gt; B_::kC ? A_::kC : B_::kC)&gt;</div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">  137</a></span>&#160;      <a class="code" href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">Shape</a>;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;};</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMin.html">  143</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeMin.html">ShapeMin</a> {</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">Shape</a>&lt;(A_::kD &lt; B_::kD ? A_::kD : B_::kD),</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;                (A_::kH &lt; B_::kH ? A_::kH : B_::kH),</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;                (A_::kW &lt; B_::kW ? A_::kW : B_::kW),</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;                (A_::kC &lt; B_::kC ? A_::kC : B_::kC)&gt;</div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">  148</a></span>&#160;      <a class="code" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">Shape</a>;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;};</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Shape_&gt;</div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeStrides.html">  154</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a> {</div><div class="line"><a name="l00155"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">  155</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">Shape&lt;Shape_::kH * Shape_::kW * Shape_::kC, Shape_::kW * Shape_::kC, Shape_::kC, 1&gt;</a> <a class="code" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">Shape</a>;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;};</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Shape_&gt;</div><div class="line"><a name="l00165"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromShape.html">  165</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html">ComputeOffsetFromShape</a> {</div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">  166</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) {</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    <span class="comment">// clang-format off</span></div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    <span class="keywordflow">return</span> d * Shape_::kH * Shape_::kW * Shape_::kC +</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;           h * Shape_::kW * Shape_::kC +</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;           w * Shape_::kC +</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;           c;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    <span class="comment">// clang-format on</span></div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;  }</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;};</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kSh_, <span class="keywordtype">int</span> kSw_, <span class="keywordtype">int</span> kSc_&gt;</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html">  185</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html">ComputeOffsetFromShape</a>&lt;<a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, kSh_, kSw_, kSc_&gt; &gt; {</div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_01kSc___01_4_01_4.html#a5198e838e3892245fe7b10884555ec93">  186</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) {</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <span class="keywordflow">return</span> h * kSw_ * kSc_ + w * kSc_ + c;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  }</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;};</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kSh_, <span class="keywordtype">int</span> kSw_&gt;</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html">  199</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html">ComputeOffsetFromShape</a>&lt;<a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, kSh_, kSw_, 1&gt; &gt; {</div><div class="line"><a name="l00200"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromShape_3_01Shape_3_011_00_01kSh___00_01kSw___00_011_01_4_01_4.html#a11bf40abc57580db5ce4b0fd4c3e55ff">  200</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) { <span class="keywordflow">return</span> h * kSw_ + w; }</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;};</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Str<span class="keywordtype">id</span>es_&gt;</div><div class="line"><a name="l00210"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromStrides.html">  210</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html">ComputeOffsetFromStrides</a> {</div><div class="line"><a name="l00211"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">  211</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) {</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    <span class="keywordflow">return</span> d * Strides_::kD + h * Strides_::kH + w * Strides_::kW + c * Strides_::kC;</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;  }</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;};</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> S_h_, <span class="keywordtype">int</span> S_w_, <span class="keywordtype">int</span> S_c_&gt;</div><div class="line"><a name="l00225"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html">  225</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html">ComputeOffsetFromStrides</a>&lt;<a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, S_h_, S_w_, S_c_&gt; &gt; {</div><div class="line"><a name="l00226"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_01S__c___01_4_01_4.html#acdbb9c7cdf9fc054656614f72396434e">  226</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) {</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    <span class="keywordflow">return</span> h * S_h_ + w * S_w_ + c * S_c_;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;  }</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;};</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> S_h_, <span class="keywordtype">int</span> S_w_&gt;</div><div class="line"><a name="l00239"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html">  239</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html">ComputeOffsetFromStrides</a>&lt;<a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, S_h_, S_w_, 1&gt; &gt; {</div><div class="line"><a name="l00240"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromStrides_3_01Shape_3_011_00_01S__h___00_01S__w___00_011_01_4_01_4.html#a512a9d46f6bea9d85641d7263bcfee36">  240</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) { <span class="keywordflow">return</span> h * S_h_ + w * S_w_; }</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;};</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Threads_, <span class="keyword">typename</span> Str<span class="keywordtype">id</span>es_&gt;</div><div class="line"><a name="l00252"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">  252</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">ComputeThreadOffsetFromStrides</a> {</div><div class="line"><a name="l00253"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">  253</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>() {</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    <span class="comment">// Decompose the thread index.</span></div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;    <span class="keywordtype">int</span> c = threadIdx.x % Threads_::kC;</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    <span class="keywordtype">int</span> w = threadIdx.x / Threads_::kC % Threads_::kW;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;    <span class="keywordtype">int</span> h = threadIdx.x / Threads_::kC / Threads_::kW % Threads_::kH;</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    <span class="keywordtype">int</span> d = threadIdx.x / Threads_::kC / Threads_::kW / Threads_::kH;</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;    <span class="comment">// Compute the offset.</span></div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    <span class="keywordflow">return</span> d * Strides_::kD + h * Strides_::kH + w * Strides_::kW + c * Strides_::kC;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;  }</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;};</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> T_h_, <span class="keywordtype">int</span> T_w_, <span class="keywordtype">int</span> T_c_, <span class="keywordtype">int</span> S_h_, <span class="keywordtype">int</span> S_w_, <span class="keywordtype">int</span> S_c_&gt;</div><div class="line"><a name="l00270"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html">  270</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">ComputeThreadOffsetFromStrides</a>&lt;<a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, T_h_, T_w_, T_c_&gt;, <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, S_h_, S_w_, S_c_&gt; &gt; {</div><div class="line"><a name="l00271"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html#a5d446b2663c01362361e09435a726996">  271</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>() {</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    <span class="comment">// Decompose the thread index.</span></div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;    <span class="keywordtype">int</span> c = threadIdx.x % T_c_;</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;    <span class="keywordtype">int</span> w = threadIdx.x / T_c_ % T_w_;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    <span class="keywordtype">int</span> h = threadIdx.x / T_c_ / T_w_ % T_h_;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;    <span class="comment">// Compute the offset.</span></div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    <span class="keywordflow">return</span> h * S_h_ + w * S_w_ + c * S_c_;</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;  }</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;};</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> T_h_, <span class="keywordtype">int</span> T_w_, <span class="keywordtype">int</span> S_h_, <span class="keywordtype">int</span> S_w_&gt;</div><div class="line"><a name="l00288"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html">  288</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">ComputeThreadOffsetFromStrides</a>&lt;<a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, T_h_, T_w_, 1&gt;, <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, S_h_, S_w_, 1&gt; &gt; {</div><div class="line"><a name="l00289"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html#a6e621f5fae2ba29277fde46be1cede24">  289</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>() {</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;    <span class="comment">// Decompose the thread index.</span></div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    <span class="keywordtype">int</span> w = threadIdx.x % T_w_;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;    <span class="keywordtype">int</span> h = threadIdx.x / T_w_;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;    <span class="comment">// Compute the offset.</span></div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;    <span class="keywordflow">return</span> h * S_h_ + w * S_w_;</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;  }</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;};</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1ComputeThreadOffsetFromStrides_html"><div class="ttname"><a href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">cutlass::ComputeThreadOffsetFromStrides</a></div><div class="ttdoc">Decompose threadId.x into coordinate of a cube whose dimensions are specified by Threads_. Afterwards compute the offset of those coordinates using Strides_. </div><div class="ttdef"><b>Definition:</b> shape.h:252</div></div>
+<a href="shape_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kD_ = 1, <span class="keywordtype">int</span> kH_ = 1, <span class="keywordtype">int</span> kW_ = 1, <span class="keywordtype">int</span> kC_ = 1&gt;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html">   64</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Shape.html">Shape</a> {</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">   66</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">kD</a> = kD_;</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">   68</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">kH</a> = kH_;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">   70</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">kW</a> = kW_;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">   72</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">kC</a> = kC_;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;};</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Shape&gt;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html">   79</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount</a> {</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276">   81</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276">kWc</a> = <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Shape::kW</a> * <a class="code" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">Shape::kC</a>;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f">   83</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f">kHw</a> = <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Shape::kH</a> * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Shape::kW</a>;</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742">   85</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742">kHwc</a> = <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Shape::kH</a> * <a class="code" href="structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276">kWc</a>;</div><div class="line"><a name="l00087"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#af7d7ccd42de2c49fe57f03cf0e657fe8">   87</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#af7d7ccd42de2c49fe57f03cf0e657fe8">kDhw</a> = <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Shape::kD</a> * <a class="code" href="structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f">kHw</a>;</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#a5a274564d6b8607a0be621b2664fba18">   89</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#a5a274564d6b8607a0be621b2664fba18">kDhwc</a> = <a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Shape::kD</a> * <a class="code" href="structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742">kHwc</a>;</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">   91</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">kCount</a> = <a class="code" href="structcutlass_1_1ShapeCount.html#a5a274564d6b8607a0be621b2664fba18">kDhwc</a>;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;};</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keywordtype">int</span> kScale_&gt;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeScale.html">   97</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeScale.html">ShapeScale</a> {</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29">   98</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29">Shape&lt;A_::kD * kScale_, A_::kH * kScale_, A_::kW * kScale_, A_::kC * kScale_&gt;</a> <a class="code" href="structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29">Shape</a>;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;};</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeAdd.html">  104</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeAdd.html">ShapeAdd</a> {</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71">  105</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71">Shape&lt;A_::kD + B_::kD, A_::kH + B_::kH, A_::kW + B_::kW, A_::kC + B_::kC&gt;</a> <a class="code" href="structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71">Shape</a>;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;};</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeSub.html">  111</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeSub.html">ShapeSub</a> {</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9">  112</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9">Shape</a>&lt;A_::kD - B_::kD, A_::kH - B_::kH, A_::kW - B_::kW, A_::kC - B_::kC&gt; <a class="code" href="structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9">Shape</a>;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;};</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00118"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMul.html">  118</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeMul.html">ShapeMul</a> {</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">  119</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">Shape&lt;A_::kD * B_::kD, A_::kH * B_::kH, A_::kW * B_::kW, A_::kC * B_::kC&gt;</a> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">Shape</a>;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;};</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeDiv.html">  125</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a> {</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">  126</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">Shape</a>&lt;A_::kD / B_::kD, A_::kH / B_::kH, A_::kW / B_::kW, A_::kC / B_::kC&gt; <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">Shape</a>;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;};</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00132"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeDivCeiling.html">  132</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeDivCeiling.html">ShapeDivCeiling</a> {</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">Shape</a>&lt;(A_::kD + B_::kD - 1) / B_::kD,</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;                (A_::kH + B_::kH - 1) / B_::kH,</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;                (A_::kW + B_::kW - 1) / B_::kW,</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;                (A_::kC + B_::kC - 1) / B_::kC&gt;</div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">  137</a></span>&#160;      <a class="code" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">Shape</a>;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;};</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMax.html">  143</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeMax.html">ShapeMax</a> {</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">Shape&lt;(A_::kD &gt;</a> B_::kD ? A_::kD : B_::kD),</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;                (A_::kH &gt; B_::kH ? A_::kH : B_::kH),</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;                (A_::kW &gt; B_::kW ? A_::kW : B_::kW),</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;                (A_::kC &gt; B_::kC ? A_::kC : B_::kC)&gt;</div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">  148</a></span>&#160;      <a class="code" href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">Shape</a>;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;};</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A_, <span class="keyword">typename</span> B_&gt;</div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMin.html">  154</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeMin.html">ShapeMin</a> {</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">Shape</a>&lt;(A_::kD &lt; B_::kD ? A_::kD : B_::kD),</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;                (A_::kH &lt; B_::kH ? A_::kH : B_::kH),</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;                (A_::kW &lt; B_::kW ? A_::kW : B_::kW),</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;                (A_::kC &lt; B_::kC ? A_::kC : B_::kC)&gt;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">  159</a></span>&#160;      <a class="code" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">Shape</a>;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;};</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Shape_, <span class="keywordtype">int</span> elementsPerAccess&gt;</div><div class="line"><a name="l00165"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeStrides.html">  165</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a> {</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">Shape</a>&lt;Shape_::kH * Shape_::kW * Shape_::kC,</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;                Shape_::kW * Shape_::kC,</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;                Shape_::kC,</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;                elementsPerAccess&gt;</div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">  170</a></span>&#160;      <a class="code" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">Shape</a>;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;};</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Shape_&gt;</div><div class="line"><a name="l00180"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromShape.html">  180</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeOffsetFromShape.html">ComputeOffsetFromShape</a> {</div><div class="line"><a name="l00181"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">  181</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <span class="keyword">get</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) {</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="comment">// clang-format off</span></div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keywordflow">return</span> d * Shape_::kH * Shape_::kW * Shape_::kC +</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;           h * Shape_::kW * Shape_::kC +</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;           w * Shape_::kC +</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;           c;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <span class="comment">// clang-format on</span></div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  }</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;};</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Str<span class="keywordtype">id</span>es_&gt;</div><div class="line"><a name="l00198"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromStrides.html">  198</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html">ComputeOffsetFromStrides</a> {</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">  199</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <span class="keyword">get</span>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) {</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    <span class="keywordflow">return</span> d * Strides_::kD + h * Strides_::kH + w * Strides_::kW + c * Strides_::kC;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;  }</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;};</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Threads_, <span class="keyword">typename</span> Str<span class="keywordtype">id</span>es_&gt;</div><div class="line"><a name="l00213"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">  213</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">ComputeThreadOffsetFromStrides</a> {</div><div class="line"><a name="l00214"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">  214</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>() {</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    <span class="comment">// Decompose the thread index.</span></div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    <span class="keywordtype">int</span> c = threadIdx.x % Threads_::kC;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;    <span class="keywordtype">int</span> w = threadIdx.x / Threads_::kC % Threads_::kW;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    <span class="keywordtype">int</span> h = threadIdx.x / Threads_::kC / Threads_::kW % Threads_::kH;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <span class="keywordtype">int</span> d = threadIdx.x / Threads_::kC / Threads_::kW / Threads_::kH;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <span class="comment">// Compute the offset.</span></div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;    <span class="keywordflow">return</span> d * Strides_::kD + h * Strides_::kH + w * Strides_::kW + c * Strides_::kC;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;  }</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;};</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> T_h_, <span class="keywordtype">int</span> T_w_, <span class="keywordtype">int</span> T_c_, <span class="keywordtype">int</span> S_h_, <span class="keywordtype">int</span> S_w_, <span class="keywordtype">int</span> S_c_&gt;</div><div class="line"><a name="l00231"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html">  231</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">ComputeThreadOffsetFromStrides</a>&lt;<a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, T_h_, T_w_, T_c_&gt;, <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, S_h_, S_w_, S_c_&gt; &gt; {</div><div class="line"><a name="l00232"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html#a5d446b2663c01362361e09435a726996">  232</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>() {</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;    <span class="comment">// Decompose the thread index.</span></div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;    <span class="keywordtype">int</span> c = threadIdx.x % T_c_;</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;    <span class="keywordtype">int</span> w = threadIdx.x / T_c_ % T_w_;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;    <span class="keywordtype">int</span> h = threadIdx.x / T_c_ / T_w_ % T_h_;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    <span class="comment">// Compute the offset.</span></div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    <span class="keywordflow">return</span> h * S_h_ + w * S_w_ + c * S_c_;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;  }</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;};</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> T_h_, <span class="keywordtype">int</span> T_w_, <span class="keywordtype">int</span> S_h_, <span class="keywordtype">int</span> S_w_&gt;</div><div class="line"><a name="l00249"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html">  249</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">ComputeThreadOffsetFromStrides</a>&lt;<a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, T_h_, T_w_, 1&gt;, <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, S_h_, S_w_, 1&gt; &gt; {</div><div class="line"><a name="l00250"></a><span class="lineno"><a class="line" href="structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html#a6e621f5fae2ba29277fde46be1cede24">  250</a></span>&#160;  <span class="keyword">static</span> CUTLASS_DEVICE <span class="keywordtype">int</span> <span class="keyword">get</span>() {</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;    <span class="comment">// Decompose the thread index.</span></div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    <span class="keywordtype">int</span> w = threadIdx.x % T_w_;</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    <span class="keywordtype">int</span> h = threadIdx.x / T_w_;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;    <span class="comment">// Compute the offset.</span></div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    <span class="keywordflow">return</span> h * S_h_ + w * S_w_;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;  }</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;};</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1ComputeThreadOffsetFromStrides_html"><div class="ttname"><a href="structcutlass_1_1ComputeThreadOffsetFromStrides.html">cutlass::ComputeThreadOffsetFromStrides</a></div><div class="ttdoc">Decompose threadId.x into coordinate of a cube whose dimensions are specified by Threads_. Afterwards compute the offset of those coordinates using Strides_. </div><div class="ttdef"><b>Definition:</b> shape.h:213</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html_aac5c49469aa80d119c2006291b431276"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html#aac5c49469aa80d119c2006291b431276">cutlass::ShapeCount::kWc</a></div><div class="ttdeci">static int const kWc</div><div class="ttdoc">The number of elements per row. </div><div class="ttdef"><b>Definition:</b> shape.h:81</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeStrides_html_a76cde4c3ebd1d191e0191826b2663be4"><div class="ttname"><a href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">cutlass::ShapeStrides::Shape</a></div><div class="ttdeci">Shape&lt; Shape_::kH *Shape_::kW *Shape_::kC, Shape_::kW *Shape_::kC, Shape_::kC, elementsPerAccess &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:170</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeAdd_html_ad4712a1339445038949445de1dd74e71"><div class="ttname"><a href="structcutlass_1_1ShapeAdd.html#ad4712a1339445038949445de1dd74e71">cutlass::ShapeAdd::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD+B_::kD, A_::kH+B_::kH, A_::kW+B_::kW, A_::kC+B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:105</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeDivCeiling_html_a0e3b032e241a8ead89e1d9ffb472d799"><div class="ttname"><a href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">cutlass::ShapeDivCeiling::Shape</a></div><div class="ttdeci">Shape&lt;(A_::kD+B_::kD - 1)/B_::kD,(A_::kH+B_::kH - 1)/B_::kH,(A_::kW+B_::kW - 1)/B_::kW,(A_::kC+B_::kC - 1)/B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:137</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeScale_html_aae9cfc35c517cd89018e4f914acbac29"><div class="ttname"><a href="structcutlass_1_1ShapeScale.html#aae9cfc35c517cd89018e4f914acbac29">cutlass::ShapeScale::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD *kScale_, A_::kH *kScale_, A_::kW *kScale_, A_::kC *kScale_ &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:98</div></div>
-<div class="ttc" id="structcutlass_1_1ShapeStrides_html_ac6fcda9b8e1782f24c1e6d67cd880a6a"><div class="ttname"><a href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">cutlass::ShapeStrides::Shape</a></div><div class="ttdeci">Shape&lt; Shape_::kH *Shape_::kW *Shape_::kC, Shape_::kW *Shape_::kC, Shape_::kC, 1 &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:155</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeMul_html_a8875fc5e861339f981360ed774e8cc94"><div class="ttname"><a href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">cutlass::ShapeMul::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD *B_::kD, A_::kH *B_::kH, A_::kW *B_::kW, A_::kC *B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:119</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeSub_html_a24b6dd8cb6171b85c4e2f37407f9a5c9"><div class="ttname"><a href="structcutlass_1_1ShapeSub.html#a24b6dd8cb6171b85c4e2f37407f9a5c9">cutlass::ShapeSub::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD - B_::kD, A_::kH - B_::kH, A_::kW - B_::kW, A_::kC - B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:112</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeSub_html"><div class="ttname"><a href="structcutlass_1_1ShapeSub.html">cutlass::ShapeSub</a></div><div class="ttdef"><b>Definition:</b> shape.h:111</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a3a20d9062bba613c160bb2cd14f80a5e"><div class="ttname"><a href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">cutlass::Shape::kH</a></div><div class="ttdeci">static int const kH</div><div class="ttdoc">The height of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:68</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a3f2433fd6401dd28f1130499f9fd340c"><div class="ttname"><a href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">cutlass::Shape::kC</a></div><div class="ttdeci">static int const kC</div><div class="ttdoc">The number of scalars per element. </div><div class="ttdef"><b>Definition:</b> shape.h:72</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeScale_html"><div class="ttname"><a href="structcutlass_1_1ShapeScale.html">cutlass::ShapeScale</a></div><div class="ttdef"><b>Definition:</b> shape.h:97</div></div>
-<div class="ttc" id="structcutlass_1_1ComputeOffsetFromShape_html"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromShape.html">cutlass::ComputeOffsetFromShape</a></div><div class="ttdoc">Compute the offset for the given coordinates in a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:165</div></div>
+<div class="ttc" id="structcutlass_1_1ComputeOffsetFromShape_html"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromShape.html">cutlass::ComputeOffsetFromShape</a></div><div class="ttdoc">Compute the offset for the given coordinates in a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:180</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeDiv_html_a108ded386ef6708afc6fe769a77a234b"><div class="ttname"><a href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">cutlass::ShapeDiv::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD/B_::kD, A_::kH/B_::kH, A_::kW/B_::kW, A_::kC/B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:126</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html_af7d7ccd42de2c49fe57f03cf0e657fe8"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html#af7d7ccd42de2c49fe57f03cf0e657fe8">cutlass::ShapeCount::kDhw</a></div><div class="ttdeci">static int const kDhw</div><div class="ttdoc">The number of pixels per cube. </div><div class="ttdef"><b>Definition:</b> shape.h:87</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeMul_html"><div class="ttname"><a href="structcutlass_1_1ShapeMul.html">cutlass::ShapeMul</a></div><div class="ttdef"><b>Definition:</b> shape.h:118</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeDiv_html"><div class="ttname"><a href="structcutlass_1_1ShapeDiv.html">cutlass::ShapeDiv</a></div><div class="ttdef"><b>Definition:</b> shape.h:125</div></div>
-<div class="ttc" id="structcutlass_1_1ComputeOffsetFromStrides_html"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromStrides.html">cutlass::ComputeOffsetFromStrides</a></div><div class="ttdoc">Compute the offset for the given coordinates in a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:210</div></div>
+<div class="ttc" id="structcutlass_1_1ComputeOffsetFromStrides_html"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromStrides.html">cutlass::ComputeOffsetFromStrides</a></div><div class="ttdoc">Compute the offset for the given coordinates in a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:198</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeDivCeiling_html"><div class="ttname"><a href="structcutlass_1_1ShapeDivCeiling.html">cutlass::ShapeDivCeiling</a></div><div class="ttdef"><b>Definition:</b> shape.h:132</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1ShapeMax_html"><div class="ttname"><a href="structcutlass_1_1ShapeMax.html">cutlass::ShapeMax</a></div><div class="ttdef"><b>Definition:</b> shape.h:132</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeMax_html"><div class="ttname"><a href="structcutlass_1_1ShapeMax.html">cutlass::ShapeMax</a></div><div class="ttdef"><b>Definition:</b> shape.h:143</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeAdd_html"><div class="ttname"><a href="structcutlass_1_1ShapeAdd.html">cutlass::ShapeAdd</a></div><div class="ttdef"><b>Definition:</b> shape.h:104</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html_a8d25b48b3294b5563f89c62a6e6d00e5"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">cutlass::ShapeCount::kCount</a></div><div class="ttdeci">static int const kCount</div><div class="ttdoc">The number of elements in the 4D space. </div><div class="ttdef"><b>Definition:</b> shape.h:91</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html_a5a274564d6b8607a0be621b2664fba18"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html#a5a274564d6b8607a0be621b2664fba18">cutlass::ShapeCount::kDhwc</a></div><div class="ttdeci">static int const kDhwc</div><div class="ttdoc">The number of elements in the 4D space. </div><div class="ttdef"><b>Definition:</b> shape.h:89</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a78836a20250ff24c25a6622ad818b421"><div class="ttname"><a href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">cutlass::Shape::kW</a></div><div class="ttdeci">static int const kW</div><div class="ttdoc">The width of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1ShapeMin_html"><div class="ttname"><a href="structcutlass_1_1ShapeMin.html">cutlass::ShapeMin</a></div><div class="ttdef"><b>Definition:</b> shape.h:143</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeMin_html"><div class="ttname"><a href="structcutlass_1_1ShapeMin.html">cutlass::ShapeMin</a></div><div class="ttdef"><b>Definition:</b> shape.h:154</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html_afc957be69eb78e4849ba8ab3cc66583f"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html#afc957be69eb78e4849ba8ab3cc66583f">cutlass::ShapeCount::kHw</a></div><div class="ttdeci">static int const kHw</div><div class="ttdoc">The number of pixels per image. </div><div class="ttdef"><b>Definition:</b> shape.h:83</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a19086a5567d6c710ec853e35a7f29c25"><div class="ttname"><a href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">cutlass::Shape::kD</a></div><div class="ttdeci">static int const kD</div><div class="ttdoc">The depth of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:66</div></div>
-<div class="ttc" id="structcutlass_1_1ShapeStrides_html"><div class="ttname"><a href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides</a></div><div class="ttdef"><b>Definition:</b> shape.h:154</div></div>
-<div class="ttc" id="structcutlass_1_1ShapeMax_html_ad566aceac2563024982eeabb78c6c961"><div class="ttname"><a href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">cutlass::ShapeMax::Shape</a></div><div class="ttdeci">Shape&lt;(A_::kD &gt; B_::kD ? A_::kD :B_::kD),(A_::kH &gt; B_::kH ? A_::kH :B_::kH),(A_::kW &gt; B_::kW ? A_::kW :B_::kW),(A_::kC &gt; B_::kC ? A_::kC :B_::kC)&gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:137</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeStrides_html"><div class="ttname"><a href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides</a></div><div class="ttdef"><b>Definition:</b> shape.h:165</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeMax_html_ad566aceac2563024982eeabb78c6c961"><div class="ttname"><a href="structcutlass_1_1ShapeMax.html#ad566aceac2563024982eeabb78c6c961">cutlass::ShapeMax::Shape</a></div><div class="ttdeci">Shape&lt;(A_::kD &gt; B_::kD ? A_::kD :B_::kD),(A_::kH &gt; B_::kH ? A_::kH :B_::kH),(A_::kW &gt; B_::kW ? A_::kW :B_::kW),(A_::kC &gt; B_::kC ? A_::kC :B_::kC)&gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:148</div></div>
 <div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
-<div class="ttc" id="structcutlass_1_1ShapeMin_html_a5c813e4c34ea612431d31b36120f8549"><div class="ttname"><a href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">cutlass::ShapeMin::Shape</a></div><div class="ttdeci">Shape&lt;(A_::kD&lt; B_::kD ? A_::kD :B_::kD),(A_::kH&lt; B_::kH ? A_::kH :B_::kH),(A_::kW&lt; B_::kW ? A_::kW :B_::kW),(A_::kC&lt; B_::kC ? A_::kC :B_::kC)&gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:148</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeMin_html_a5c813e4c34ea612431d31b36120f8549"><div class="ttname"><a href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">cutlass::ShapeMin::Shape</a></div><div class="ttdeci">Shape&lt;(A_::kD&lt; B_::kD ? A_::kD :B_::kD),(A_::kH&lt; B_::kH ? A_::kH :B_::kH),(A_::kW&lt; B_::kW ? A_::kW :B_::kW),(A_::kC&lt; B_::kC ? A_::kC :B_::kC)&gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:159</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html">cutlass::ShapeCount</a></div><div class="ttdoc">Compute derived counted of a Layout Concept based class. </div><div class="ttdef"><b>Definition:</b> shape.h:79</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html_a75324e2c9d31a0787343fc994586b742"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html#a75324e2c9d31a0787343fc994586b742">cutlass::ShapeCount::kHwc</a></div><div class="ttdeci">static int const kHwc</div><div class="ttdoc">The number of elements per image. </div><div class="ttdef"><b>Definition:</b> shape.h:85</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structDebugType.html b/docs/structDebugType.html
new file mode 100644
index 000000000..20491d0ed
--- /dev/null
+++ b/docs/structDebugType.html
@@ -0,0 +1,88 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: DebugType&lt; T &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">DebugType&lt; T &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="cutlass_8h_source.html">cutlass.h</a>&gt;</code></p>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="cutlass_8h_source.html">cutlass.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structDebugValue.html b/docs/structDebugValue.html
new file mode 100644
index 000000000..1d8cedbfc
--- /dev/null
+++ b/docs/structDebugValue.html
@@ -0,0 +1,88 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: DebugValue&lt; Value &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">DebugValue&lt; Value &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="cutlass_8h_source.html">cutlass.h</a>&gt;</code></p>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="cutlass_8h_source.html">cutlass.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1AlignedStruct.html b/docs/structcutlass_1_1AlignedStruct.html
index b7df247de..44eed3488 100644
--- a/docs/structcutlass_1_1AlignedStruct.html
+++ b/docs/structcutlass_1_1AlignedStruct.html
@@ -93,7 +93,7 @@ Inheritance diagram for cutlass::AlignedStruct&lt; kAlignment_ &gt;:</div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeOffsetFromShape-members.html b/docs/structcutlass_1_1ComputeOffsetFromShape-members.html
index c31427b5d..831824c10 100644
--- a/docs/structcutlass_1_1ComputeOffsetFromShape-members.html
+++ b/docs/structcutlass_1_1ComputeOffsetFromShape-members.html
@@ -79,11 +79,11 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">get</a>(int d, int h, int w, int c)</td><td class="entry"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">get</a>(int d, int h, int w, int c)</td><td class="entry"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html">cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeOffsetFromShape.html b/docs/structcutlass_1_1ComputeOffsetFromShape.html
index 709f76ee4..0bc8b4238 100644
--- a/docs/structcutlass_1_1ComputeOffsetFromShape.html
+++ b/docs/structcutlass_1_1ComputeOffsetFromShape.html
@@ -87,8 +87,8 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
 Static Public Member Functions</h2></td></tr>
-<tr class="memitem:a3c6f60a59178ffb84899aa449bd51d38"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html#a3c6f60a59178ffb84899aa449bd51d38">get</a> (int d, int h, int w, int c)</td></tr>
-<tr class="separator:a3c6f60a59178ffb84899aa449bd51d38"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7bc0bc7e03cd974a05d00e98a72ee78b"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html#a7bc0bc7e03cd974a05d00e98a72ee78b">get</a> (int d, int h, int w, int c)</td></tr>
+<tr class="separator:a7bc0bc7e03cd974a05d00e98a72ee78b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
 <div class="textblock"><h3>template&lt;typename Shape_&gt;<br />
@@ -101,8 +101,8 @@ struct cutlass::ComputeOffsetFromShape&lt; Shape_ &gt;</h3>
   </dd>
 </dl>
 </div><h2 class="groupheader">Member Function Documentation</h2>
-<a id="a3c6f60a59178ffb84899aa449bd51d38"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3c6f60a59178ffb84899aa449bd51d38">&#9670;&nbsp;</a></span>get()</h2>
+<a id="a7bc0bc7e03cd974a05d00e98a72ee78b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7bc0bc7e03cd974a05d00e98a72ee78b">&#9670;&nbsp;</a></span>get()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -113,7 +113,7 @@ template&lt;typename Shape_ &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">static CUTLASS_DEVICE int <a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html">cutlass::ComputeOffsetFromShape</a>&lt; Shape_ &gt;::get </td>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1ComputeOffsetFromShape.html">cutlass::ComputeOffsetFromShape</a>&lt; Shape_ &gt;::get </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -157,7 +157,7 @@ template&lt;typename Shape_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeOffsetFromStrides-members.html b/docs/structcutlass_1_1ComputeOffsetFromStrides-members.html
index 369de9ff6..ea6eabbb3 100644
--- a/docs/structcutlass_1_1ComputeOffsetFromStrides-members.html
+++ b/docs/structcutlass_1_1ComputeOffsetFromStrides-members.html
@@ -79,11 +79,11 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">get</a>(int d, int h, int w, int c)</td><td class="entry"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">get</a>(int d, int h, int w, int c)</td><td class="entry"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html">cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeOffsetFromStrides.html b/docs/structcutlass_1_1ComputeOffsetFromStrides.html
index 5c3254d1f..4ab5b8c8b 100644
--- a/docs/structcutlass_1_1ComputeOffsetFromStrides.html
+++ b/docs/structcutlass_1_1ComputeOffsetFromStrides.html
@@ -87,8 +87,8 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
 Static Public Member Functions</h2></td></tr>
-<tr class="memitem:af5e46bc2b325cb6952d2d68c8aca1409"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html#af5e46bc2b325cb6952d2d68c8aca1409">get</a> (int d, int h, int w, int c)</td></tr>
-<tr class="separator:af5e46bc2b325cb6952d2d68c8aca1409"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa28231590bfa0ced0f317e6a4d52dc1e"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">get</a> (int d, int h, int w, int c)</td></tr>
+<tr class="separator:aa28231590bfa0ced0f317e6a4d52dc1e"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
 <div class="textblock"><h3>template&lt;typename Strides_&gt;<br />
@@ -101,8 +101,8 @@ struct cutlass::ComputeOffsetFromStrides&lt; Strides_ &gt;</h3>
   </dd>
 </dl>
 </div><h2 class="groupheader">Member Function Documentation</h2>
-<a id="af5e46bc2b325cb6952d2d68c8aca1409"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af5e46bc2b325cb6952d2d68c8aca1409">&#9670;&nbsp;</a></span>get()</h2>
+<a id="aa28231590bfa0ced0f317e6a4d52dc1e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa28231590bfa0ced0f317e6a4d52dc1e">&#9670;&nbsp;</a></span>get()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -113,7 +113,7 @@ template&lt;typename Strides_ &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">static CUTLASS_DEVICE int <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html">cutlass::ComputeOffsetFromStrides</a>&lt; Strides_ &gt;::get </td>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1ComputeOffsetFromStrides.html">cutlass::ComputeOffsetFromStrides</a>&lt; Strides_ &gt;::get </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -157,7 +157,7 @@ template&lt;typename Strides_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides-members.html b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides-members.html
index 104116b7d..935079e98 100644
--- a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides-members.html
+++ b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides.html b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides.html
index d434e920f..783481f49 100644
--- a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides.html
+++ b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides.html
@@ -135,7 +135,7 @@ template&lt;typename Threads_ , typename Strides_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_03ed682791cf043da79a7cc93228a8c85.html b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_03ed682791cf043da79a7cc93228a8c85.html
index be0dd1975..eda304dfe 100644
--- a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_03ed682791cf043da79a7cc93228a8c85.html
+++ b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_03ed682791cf043da79a7cc93228a8c85.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html
index 55392ee2d..1f99dd6fd 100644
--- a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html
+++ b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_011_0e75281d7e02fa191f5d498e10e25dc1b.html
@@ -124,7 +124,7 @@ template&lt;int T_h_, int T_w_, int S_h_, int S_w_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html
index 7a2a0294f..60bbf6ae2 100644
--- a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html
+++ b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__dd54c41f6edb97d3c208cb7c6fe4ab9b.html
@@ -124,7 +124,7 @@ template&lt;int T_h_, int T_w_, int T_c_, int S_h_, int S_w_, int S_c_&gt; </div
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__f2e6d84a53db391977c787a65ed62aca.html b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__f2e6d84a53db391977c787a65ed62aca.html
index 80afb2f90..6ed4a5e97 100644
--- a/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__f2e6d84a53db391977c787a65ed62aca.html
+++ b/docs/structcutlass_1_1ComputeThreadOffsetFromStrides_3_01Shape_3_011_00_01T__h___00_01T__w___00_01T__f2e6d84a53db391977c787a65ed62aca.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ConstPredicateTileAdapter-members.html b/docs/structcutlass_1_1ConstPredicateTileAdapter-members.html
index 12404785c..95313d92c 100644
--- a/docs/structcutlass_1_1ConstPredicateTileAdapter-members.html
+++ b/docs/structcutlass_1_1ConstPredicateTileAdapter-members.html
@@ -86,7 +86,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ConstPredicateTileAdapter.html b/docs/structcutlass_1_1ConstPredicateTileAdapter.html
index 6e00d30be..80e8be3ee 100644
--- a/docs/structcutlass_1_1ConstPredicateTileAdapter.html
+++ b/docs/structcutlass_1_1ConstPredicateTileAdapter.html
@@ -223,7 +223,7 @@ template&lt;typename PredicateVector_ , typename Iterations_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Convert.html b/docs/structcutlass_1_1Convert.html
index 5b2e67b91..da9ae6fd6 100644
--- a/docs/structcutlass_1_1Convert.html
+++ b/docs/structcutlass_1_1Convert.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ob568b5e19b6f78a5fa50d1f821f0bc2a.html b/docs/structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ob568b5e19b6f78a5fa50d1f821f0bc2a.html
index 559a16fc5..a1f22df50 100644
--- a/docs/structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ob568b5e19b6f78a5fa50d1f821f0bc2a.html
+++ b/docs/structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ob568b5e19b6f78a5fa50d1f821f0bc2a.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html b/docs/structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html
index daf9a756f..b86bde661 100644
--- a/docs/structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html
+++ b/docs/structcutlass_1_1Convert_3_01Fragment_3_01InputScalar___00_01kScalars___01_4_00_01Fragment_3_01Ofca5985d18bcb54bc1f49355f3cee121.html
@@ -257,7 +257,7 @@ template&lt;typename Fragment_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Coord-members.html b/docs/structcutlass_1_1Coord-members.html
index a8348bb18..095b79b9d 100644
--- a/docs/structcutlass_1_1Coord-members.html
+++ b/docs/structcutlass_1_1Coord-members.html
@@ -73,40 +73,48 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::Coord&lt; N_ &gt; Member List</div>  </div>
+<div class="title">cutlass::Coord&lt; Rank_, Index_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">at</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ab511a16210d1b94449f5bc6476f6a266">at</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#af9cc7ab2088544d1240ac51c4c6e685d">at</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#aed4f4d1c7c0749fe72736d7a1213b6e9">at</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e">clamp</a>(Coord&lt; N &gt; const &amp;max, Coord&lt; N &gt; const &amp;min=Coord&lt; N &gt;())</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9cbfff91f0b0d0a149534c97e3d6e69b">Coord</a>(int value=0)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a53a3d88a884f6cb7fda8aedfe2cec2c5">Coord</a>(int _idx[])</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a40429a9154f7a142ad7e9eb35282d196">count</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ad4b3704d14057c043f972827671115cf">dot</a>(Coord const &amp;b, T sum) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ae023c0c664c22a978e9b9ce5e063aae4">dot</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a7fb46873e8f3cf38212703d35bd36995">operator!=</a>(Coord&lt; N &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a8e4f7df55a75d040cf50cf9984c04c8a">operator*</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a282b6cc9ac8b2f72720c252791155aad">operator*=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a3dfc4ce4191097b6c3268696f2a45ef5">operator+</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#aeb209486943fa9d42911325b16e49e09">operator+=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#acc510511ffb52bed7f6a52f14b99750d">operator-</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac1795ec2a5890d8a39840567a4bea88e">operator-=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a87f485be079fa68bcf576da4d56f0ece">operator/</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#abe91e59962ef0d73aec9c14824f64ecc">operator/=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#acfa94aabd0c9a71ee994ca479d5f515f">operator==</a>(Coord&lt; N &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ab7fc89de3ccd7096ab275fb5dd40104c">operator[]</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6eeab0a1686ee25389e1bd017c5f03ae">operator[]</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; N_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">at</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">at</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">at</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a>(Coord&lt; kRank &gt; const &amp;max, Coord&lt; kRank &gt; const &amp;min=Coord&lt; kRank &gt;())</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">Coord</a>(Index value=0)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">Coord</a>(Index _idx[])</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">Coord</a>(Coord&lt; kRank &gt; const &amp;coord)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">count</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">dot</a>(Coord const &amp;b, T sum) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">dot</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">N</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">operator bool</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">operator!=</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">operator*</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">operator*=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">operator+</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">operator+=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">operator-</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">operator-=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">operator/</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">operator/=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">operator&lt;</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">operator&lt;=</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">operator==</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">operator[]</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">operator[]</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a>(int start=0, Index identity=0) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Coord.html b/docs/structcutlass_1_1Coord.html
index 18094b37b..63fa2f719 100644
--- a/docs/structcutlass_1_1Coord.html
+++ b/docs/structcutlass_1_1Coord.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::Coord&lt; N_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::Coord&lt; Rank_, Index_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -73,12 +73,13 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
 <a href="#pub-methods">Public Member Functions</a> &#124;
 <a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1Coord-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::Coord&lt; N_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::Coord&lt; Rank_, Index_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -87,106 +88,151 @@ $(function() {
 
 <p><code>#include &lt;<a class="el" href="coord_8h_source.html">coord.h</a>&gt;</code></p>
 <table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a7c73966e94b4f45854f16e33683bc02c"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a></td></tr>
+<tr class="memdesc:a7c73966e94b4f45854f16e33683bc02c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type used to store elements.  <a href="#a7c73966e94b4f45854f16e33683bc02c">More...</a><br /></td></tr>
+<tr class="separator:a7c73966e94b4f45854f16e33683bc02c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a9cbfff91f0b0d0a149534c97e3d6e69b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9cbfff91f0b0d0a149534c97e3d6e69b">Coord</a> (int value=0)</td></tr>
-<tr class="memdesc:a9cbfff91f0b0d0a149534c97e3d6e69b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor initializes uniformly.  <a href="#a9cbfff91f0b0d0a149534c97e3d6e69b">More...</a><br /></td></tr>
-<tr class="separator:a9cbfff91f0b0d0a149534c97e3d6e69b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a53a3d88a884f6cb7fda8aedfe2cec2c5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a53a3d88a884f6cb7fda8aedfe2cec2c5">Coord</a> (int _idx[])</td></tr>
-<tr class="memdesc:a53a3d88a884f6cb7fda8aedfe2cec2c5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of integers.  <a href="#a53a3d88a884f6cb7fda8aedfe2cec2c5">More...</a><br /></td></tr>
-<tr class="separator:a53a3d88a884f6cb7fda8aedfe2cec2c5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3dfc4ce4191097b6c3268696f2a45ef5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a3dfc4ce4191097b6c3268696f2a45ef5">operator+</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
-<tr class="memdesc:a3dfc4ce4191097b6c3268696f2a45ef5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise addition.  <a href="#a3dfc4ce4191097b6c3268696f2a45ef5">More...</a><br /></td></tr>
-<tr class="separator:a3dfc4ce4191097b6c3268696f2a45ef5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:acc510511ffb52bed7f6a52f14b99750d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#acc510511ffb52bed7f6a52f14b99750d">operator-</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
-<tr class="memdesc:acc510511ffb52bed7f6a52f14b99750d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise subtraction.  <a href="#acc510511ffb52bed7f6a52f14b99750d">More...</a><br /></td></tr>
-<tr class="separator:acc510511ffb52bed7f6a52f14b99750d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8e4f7df55a75d040cf50cf9984c04c8a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a8e4f7df55a75d040cf50cf9984c04c8a">operator*</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
-<tr class="memdesc:a8e4f7df55a75d040cf50cf9984c04c8a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise multiplication.  <a href="#a8e4f7df55a75d040cf50cf9984c04c8a">More...</a><br /></td></tr>
-<tr class="separator:a8e4f7df55a75d040cf50cf9984c04c8a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a87f485be079fa68bcf576da4d56f0ece"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a87f485be079fa68bcf576da4d56f0ece">operator/</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
-<tr class="memdesc:a87f485be079fa68bcf576da4d56f0ece"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise division.  <a href="#a87f485be079fa68bcf576da4d56f0ece">More...</a><br /></td></tr>
-<tr class="separator:a87f485be079fa68bcf576da4d56f0ece"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aeb209486943fa9d42911325b16e49e09"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#aeb209486943fa9d42911325b16e49e09">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
-<tr class="memdesc:aeb209486943fa9d42911325b16e49e09"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place addition.  <a href="#aeb209486943fa9d42911325b16e49e09">More...</a><br /></td></tr>
-<tr class="separator:aeb209486943fa9d42911325b16e49e09"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac1795ec2a5890d8a39840567a4bea88e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac1795ec2a5890d8a39840567a4bea88e">operator-=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
-<tr class="memdesc:ac1795ec2a5890d8a39840567a4bea88e"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place subtraction.  <a href="#ac1795ec2a5890d8a39840567a4bea88e">More...</a><br /></td></tr>
-<tr class="separator:ac1795ec2a5890d8a39840567a4bea88e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a282b6cc9ac8b2f72720c252791155aad"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a282b6cc9ac8b2f72720c252791155aad">operator*=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
-<tr class="memdesc:a282b6cc9ac8b2f72720c252791155aad"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place multiplication.  <a href="#a282b6cc9ac8b2f72720c252791155aad">More...</a><br /></td></tr>
-<tr class="separator:a282b6cc9ac8b2f72720c252791155aad"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abe91e59962ef0d73aec9c14824f64ecc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#abe91e59962ef0d73aec9c14824f64ecc">operator/=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
-<tr class="memdesc:abe91e59962ef0d73aec9c14824f64ecc"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place division.  <a href="#abe91e59962ef0d73aec9c14824f64ecc">More...</a><br /></td></tr>
-<tr class="separator:abe91e59962ef0d73aec9c14824f64ecc"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab7fc89de3ccd7096ab275fb5dd40104c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ab7fc89de3ccd7096ab275fb5dd40104c">operator[]</a> (int dim)</td></tr>
-<tr class="memdesc:ab7fc89de3ccd7096ab275fb5dd40104c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="#ab7fc89de3ccd7096ab275fb5dd40104c">More...</a><br /></td></tr>
-<tr class="separator:ab7fc89de3ccd7096ab275fb5dd40104c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6eeab0a1686ee25389e1bd017c5f03ae"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6eeab0a1686ee25389e1bd017c5f03ae">operator[]</a> (int dim) const</td></tr>
-<tr class="memdesc:a6eeab0a1686ee25389e1bd017c5f03ae"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="#a6eeab0a1686ee25389e1bd017c5f03ae">More...</a><br /></td></tr>
-<tr class="separator:a6eeab0a1686ee25389e1bd017c5f03ae"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad4b3704d14057c043f972827671115cf"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
-<tr class="memitem:ad4b3704d14057c043f972827671115cf"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ad4b3704d14057c043f972827671115cf">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b, T sum) const</td></tr>
-<tr class="memdesc:ad4b3704d14057c043f972827671115cf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> instances.  <a href="#ad4b3704d14057c043f972827671115cf">More...</a><br /></td></tr>
-<tr class="separator:ad4b3704d14057c043f972827671115cf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae023c0c664c22a978e9b9ce5e063aae4"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
-<tr class="memitem:ae023c0c664c22a978e9b9ce5e063aae4"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ae023c0c664c22a978e9b9ce5e063aae4">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
-<tr class="memdesc:ae023c0c664c22a978e9b9ce5e063aae4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> instances.  <a href="#ae023c0c664c22a978e9b9ce5e063aae4">More...</a><br /></td></tr>
-<tr class="separator:ae023c0c664c22a978e9b9ce5e063aae4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad10b59430927a354fcd874d2d32f1bd8"><td class="memTemplParams" colspan="2">template&lt;int Dim&gt; </td></tr>
-<tr class="memitem:ad10b59430927a354fcd874d2d32f1bd8"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">at</a> ()</td></tr>
-<tr class="memdesc:ad10b59430927a354fcd874d2d32f1bd8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> element.  <a href="#ad10b59430927a354fcd874d2d32f1bd8">More...</a><br /></td></tr>
-<tr class="separator:ad10b59430927a354fcd874d2d32f1bd8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab511a16210d1b94449f5bc6476f6a266"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ab511a16210d1b94449f5bc6476f6a266">at</a> (int dim)</td></tr>
-<tr class="memdesc:ab511a16210d1b94449f5bc6476f6a266"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="#ab511a16210d1b94449f5bc6476f6a266">More...</a><br /></td></tr>
-<tr class="separator:ab511a16210d1b94449f5bc6476f6a266"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af9cc7ab2088544d1240ac51c4c6e685d"><td class="memTemplParams" colspan="2">template&lt;int Dim&gt; </td></tr>
-<tr class="memitem:af9cc7ab2088544d1240ac51c4c6e685d"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const  &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#af9cc7ab2088544d1240ac51c4c6e685d">at</a> () const</td></tr>
-<tr class="memdesc:af9cc7ab2088544d1240ac51c4c6e685d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> element.  <a href="#af9cc7ab2088544d1240ac51c4c6e685d">More...</a><br /></td></tr>
-<tr class="separator:af9cc7ab2088544d1240ac51c4c6e685d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aed4f4d1c7c0749fe72736d7a1213b6e9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#aed4f4d1c7c0749fe72736d7a1213b6e9">at</a> (int dim) const</td></tr>
-<tr class="memdesc:aed4f4d1c7c0749fe72736d7a1213b6e9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="#aed4f4d1c7c0749fe72736d7a1213b6e9">More...</a><br /></td></tr>
-<tr class="separator:aed4f4d1c7c0749fe72736d7a1213b6e9"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:acfa94aabd0c9a71ee994ca479d5f515f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#acfa94aabd0c9a71ee994ca479d5f515f">operator==</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> &gt; const &amp;b) const</td></tr>
-<tr class="memdesc:acfa94aabd0c9a71ee994ca479d5f515f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Determines if two Coord&lt;&gt; objects are equal.  <a href="#acfa94aabd0c9a71ee994ca479d5f515f">More...</a><br /></td></tr>
-<tr class="separator:acfa94aabd0c9a71ee994ca479d5f515f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7fb46873e8f3cf38212703d35bd36995"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a7fb46873e8f3cf38212703d35bd36995">operator!=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> &gt; const &amp;b) const</td></tr>
-<tr class="memdesc:a7fb46873e8f3cf38212703d35bd36995"><td class="mdescLeft">&#160;</td><td class="mdescRight">Not equal.  <a href="#a7fb46873e8f3cf38212703d35bd36995">More...</a><br /></td></tr>
-<tr class="separator:a7fb46873e8f3cf38212703d35bd36995"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a482ada6da62f427987c22098796fcf7e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e">clamp</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> &gt; const &amp;max, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> &gt; const &amp;min=<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> &gt;())</td></tr>
-<tr class="memdesc:a482ada6da62f427987c22098796fcf7e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clamps a coordinate to a range specified by maximum and minimum values.  <a href="#a482ada6da62f427987c22098796fcf7e">More...</a><br /></td></tr>
-<tr class="separator:a482ada6da62f427987c22098796fcf7e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a40429a9154f7a142ad7e9eb35282d196"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a40429a9154f7a142ad7e9eb35282d196">count</a> () const</td></tr>
-<tr class="memdesc:a40429a9154f7a142ad7e9eb35282d196"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the product of all elements.  <a href="#a40429a9154f7a142ad7e9eb35282d196">More...</a><br /></td></tr>
-<tr class="separator:a40429a9154f7a142ad7e9eb35282d196"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a422aa7e2d2bf5dd3a60f65427bc0d7c0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> value=0)</td></tr>
+<tr class="memdesc:a422aa7e2d2bf5dd3a60f65427bc0d7c0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor initializes uniformly.  <a href="#a422aa7e2d2bf5dd3a60f65427bc0d7c0">More...</a><br /></td></tr>
+<tr class="separator:a422aa7e2d2bf5dd3a60f65427bc0d7c0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a63ad1225ab2c51a68add731e994526b4"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> _idx[])</td></tr>
+<tr class="memdesc:a63ad1225ab2c51a68add731e994526b4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of integers.  <a href="#a63ad1225ab2c51a68add731e994526b4">More...</a><br /></td></tr>
+<tr class="separator:a63ad1225ab2c51a68add731e994526b4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6110e4cfd090561696a81a8a4068a573"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;coord)</td></tr>
+<tr class="memdesc:a6110e4cfd090561696a81a8a4068a573"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of integers.  <a href="#a6110e4cfd090561696a81a8a4068a573">More...</a><br /></td></tr>
+<tr class="separator:a6110e4cfd090561696a81a8a4068a573"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac8f7a9b0835efc34fd28894b2b45342c"><td class="memTemplParams" colspan="2">template&lt;int Slice&gt; </td></tr>
+<tr class="memitem:ac8f7a9b0835efc34fd28894b2b45342c"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Slice &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a> (int start=0, <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> identity=0) const</td></tr>
+<tr class="separator:ac8f7a9b0835efc34fd28894b2b45342c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1781b3c5a2d653b0c1718ec3154ae48f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">operator bool</a> () const</td></tr>
+<tr class="memdesc:a1781b3c5a2d653b0c1718ec3154ae48f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> is non-zero.  <a href="#a1781b3c5a2d653b0c1718ec3154ae48f">More...</a><br /></td></tr>
+<tr class="separator:a1781b3c5a2d653b0c1718ec3154ae48f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a232095edae2f74c01a3c8abf68166e02"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a> () const</td></tr>
+<tr class="memdesc:a232095edae2f74c01a3c8abf68166e02"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> is uniformly zero.  <a href="#a232095edae2f74c01a3c8abf68166e02">More...</a><br /></td></tr>
+<tr class="separator:a232095edae2f74c01a3c8abf68166e02"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37672637771a70910df9aa1a0cffddc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">operator+</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:ab37672637771a70910df9aa1a0cffddc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise addition.  <a href="#ab37672637771a70910df9aa1a0cffddc">More...</a><br /></td></tr>
+<tr class="separator:ab37672637771a70910df9aa1a0cffddc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6b876f61a85a4a4ef3763b6742bfaa6b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">operator-</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a6b876f61a85a4a4ef3763b6742bfaa6b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise subtraction.  <a href="#a6b876f61a85a4a4ef3763b6742bfaa6b">More...</a><br /></td></tr>
+<tr class="separator:a6b876f61a85a4a4ef3763b6742bfaa6b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e94c093f82908ff3dba4f23b5d10033"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">operator*</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a2e94c093f82908ff3dba4f23b5d10033"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise multiplication.  <a href="#a2e94c093f82908ff3dba4f23b5d10033">More...</a><br /></td></tr>
+<tr class="separator:a2e94c093f82908ff3dba4f23b5d10033"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9bb07631f09efc80219413ac8309f568"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">operator/</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a9bb07631f09efc80219413ac8309f568"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise division.  <a href="#a9bb07631f09efc80219413ac8309f568">More...</a><br /></td></tr>
+<tr class="separator:a9bb07631f09efc80219413ac8309f568"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae4f2cb12b84411118cb93e7c4cb88b20"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ae4f2cb12b84411118cb93e7c4cb88b20"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place addition.  <a href="#ae4f2cb12b84411118cb93e7c4cb88b20">More...</a><br /></td></tr>
+<tr class="separator:ae4f2cb12b84411118cb93e7c4cb88b20"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a304334cbcad636d7b058fdc6310f0e6b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">operator-=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a304334cbcad636d7b058fdc6310f0e6b"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place subtraction.  <a href="#a304334cbcad636d7b058fdc6310f0e6b">More...</a><br /></td></tr>
+<tr class="separator:a304334cbcad636d7b058fdc6310f0e6b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad4303b578b72b5cb2a0198375290e168"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">operator*=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ad4303b578b72b5cb2a0198375290e168"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place multiplication.  <a href="#ad4303b578b72b5cb2a0198375290e168">More...</a><br /></td></tr>
+<tr class="separator:ad4303b578b72b5cb2a0198375290e168"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac87199c4c9a4e20aac4eb6e3b9a68f28"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">operator/=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ac87199c4c9a4e20aac4eb6e3b9a68f28"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place division.  <a href="#ac87199c4c9a4e20aac4eb6e3b9a68f28">More...</a><br /></td></tr>
+<tr class="separator:ac87199c4c9a4e20aac4eb6e3b9a68f28"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6e0967541a1d74edeb93897ea6069e24"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">operator[]</a> (int dim)</td></tr>
+<tr class="memdesc:a6e0967541a1d74edeb93897ea6069e24"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="#a6e0967541a1d74edeb93897ea6069e24">More...</a><br /></td></tr>
+<tr class="separator:a6e0967541a1d74edeb93897ea6069e24"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a882e7ac07bbd6983659ef2e574b46454"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">operator[]</a> (int dim) const</td></tr>
+<tr class="memdesc:a882e7ac07bbd6983659ef2e574b46454"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="#a882e7ac07bbd6983659ef2e574b46454">More...</a><br /></td></tr>
+<tr class="separator:a882e7ac07bbd6983659ef2e574b46454"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac8ec94703830ab2c62ee055533ea2184"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:ac8ec94703830ab2c62ee055533ea2184"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b, T sum) const</td></tr>
+<tr class="memdesc:ac8ec94703830ab2c62ee055533ea2184"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> instances.  <a href="#ac8ec94703830ab2c62ee055533ea2184">More...</a><br /></td></tr>
+<tr class="separator:ac8ec94703830ab2c62ee055533ea2184"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0acc37908acb6b879c37f54ff7ffc93d"><td class="memTemplParams" colspan="2">template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a0acc37908acb6b879c37f54ff7ffc93d"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a0acc37908acb6b879c37f54ff7ffc93d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> instances.  <a href="#a0acc37908acb6b879c37f54ff7ffc93d">More...</a><br /></td></tr>
+<tr class="separator:a0acc37908acb6b879c37f54ff7ffc93d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9eff24a3b74b68d11839b92324613c93"><td class="memTemplParams" colspan="2">template&lt;int Dim&gt; </td></tr>
+<tr class="memitem:a9eff24a3b74b68d11839b92324613c93"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a> ()</td></tr>
+<tr class="memdesc:a9eff24a3b74b68d11839b92324613c93"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> element.  <a href="#a9eff24a3b74b68d11839b92324613c93">More...</a><br /></td></tr>
+<tr class="separator:a9eff24a3b74b68d11839b92324613c93"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa253bf69fc819876a7c7770305f1a694"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">at</a> (int dim)</td></tr>
+<tr class="memdesc:aa253bf69fc819876a7c7770305f1a694"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="#aa253bf69fc819876a7c7770305f1a694">More...</a><br /></td></tr>
+<tr class="separator:aa253bf69fc819876a7c7770305f1a694"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a177adcc2d0fb5e72ebcb523edd24e6fe"><td class="memTemplParams" colspan="2">template&lt;int Dim&gt; </td></tr>
+<tr class="memitem:a177adcc2d0fb5e72ebcb523edd24e6fe"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const  &amp;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">at</a> () const</td></tr>
+<tr class="memdesc:a177adcc2d0fb5e72ebcb523edd24e6fe"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> element.  <a href="#a177adcc2d0fb5e72ebcb523edd24e6fe">More...</a><br /></td></tr>
+<tr class="separator:a177adcc2d0fb5e72ebcb523edd24e6fe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b47b1521820c898b03868627c3f8e46"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">at</a> (int dim) const</td></tr>
+<tr class="memdesc:a9b47b1521820c898b03868627c3f8e46"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="#a9b47b1521820c898b03868627c3f8e46">More...</a><br /></td></tr>
+<tr class="separator:a9b47b1521820c898b03868627c3f8e46"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f919aeb2a895bc040599971400dec8d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">operator==</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a7f919aeb2a895bc040599971400dec8d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Determines if two Coord&lt;&gt; objects are equal.  <a href="#a7f919aeb2a895bc040599971400dec8d">More...</a><br /></td></tr>
+<tr class="separator:a7f919aeb2a895bc040599971400dec8d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a353d847675e5ba2402c407dcd4ae4de3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">operator!=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a353d847675e5ba2402c407dcd4ae4de3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Not equal.  <a href="#a353d847675e5ba2402c407dcd4ae4de3">More...</a><br /></td></tr>
+<tr class="separator:a353d847675e5ba2402c407dcd4ae4de3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a404a3b4e00f59cac71d41fb1bbba38ba"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;max, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;min=<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt;())</td></tr>
+<tr class="memdesc:a404a3b4e00f59cac71d41fb1bbba38ba"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clamps a coordinate to a range specified by maximum and minimum values.  <a href="#a404a3b4e00f59cac71d41fb1bbba38ba">More...</a><br /></td></tr>
+<tr class="separator:a404a3b4e00f59cac71d41fb1bbba38ba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac0ac5f2aa2cbea3887d126645025e017"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">count</a> () const</td></tr>
+<tr class="memdesc:ac0ac5f2aa2cbea3887d126645025e017"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the product of all elements.  <a href="#ac0ac5f2aa2cbea3887d126645025e017">More...</a><br /></td></tr>
+<tr class="separator:ac0ac5f2aa2cbea3887d126645025e017"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a148851df63840ac63e23b2f170bd1308"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">operator&lt;</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a148851df63840ac63e23b2f170bd1308"><td class="mdescLeft">&#160;</td><td class="mdescRight">Less than operator.  <a href="#a148851df63840ac63e23b2f170bd1308">More...</a><br /></td></tr>
+<tr class="separator:a148851df63840ac63e23b2f170bd1308"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dc9f063be329d475f040afd449d304c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">operator&lt;=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a9dc9f063be329d475f040afd449d304c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Less than or equals operator.  <a href="#a9dc9f063be329d475f040afd449d304c">More...</a><br /></td></tr>
+<tr class="separator:a9dc9f063be329d475f040afd449d304c"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:a50de265129f1db7bdf2f0aefbc6a46bc"><td class="memItemLeft" align="right" valign="top">int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a50de265129f1db7bdf2f0aefbc6a46bc">idx</a> [<a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>]</td></tr>
-<tr class="memdesc:a50de265129f1db7bdf2f0aefbc6a46bc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Indices.  <a href="#a50de265129f1db7bdf2f0aefbc6a46bc">More...</a><br /></td></tr>
-<tr class="separator:a50de265129f1db7bdf2f0aefbc6a46bc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a872e1e0d9cc255fa438c04daaf10ad68"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a> [<a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>]</td></tr>
+<tr class="memdesc:a872e1e0d9cc255fa438c04daaf10ad68"><td class="mdescLeft">&#160;</td><td class="mdescRight">Indices.  <a href="#a872e1e0d9cc255fa438c04daaf10ad68">More...</a><br /></td></tr>
+<tr class="separator:a872e1e0d9cc255fa438c04daaf10ad68"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
-<tr class="memitem:a3f2f5a9d7ef2063456c4d9f7e57e71ca"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> = N_</td></tr>
-<tr class="separator:a3f2f5a9d7ef2063456c4d9f7e57e71ca"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a23e1b9a7f5fa8fd4afeadfb85de7c5c3"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> = Rank_</td></tr>
+<tr class="memdesc:a23e1b9a7f5fa8fd4afeadfb85de7c5c3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of elements in <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">More...</a><br /></td></tr>
+<tr class="separator:a23e1b9a7f5fa8fd4afeadfb85de7c5c3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acfd416eafec51e47b42b8b713ba76030"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">N</a> = Rank_</td></tr>
+<tr class="memdesc:acfd416eafec51e47b42b8b713ba76030"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of elements in <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>, aliased for compatibility.  <a href="#acfd416eafec51e47b42b8b713ba76030">More...</a><br /></td></tr>
+<tr class="separator:acfd416eafec51e47b42b8b713ba76030"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
-<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a9cbfff91f0b0d0a149534c97e3d6e69b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9cbfff91f0b0d0a149534c97e3d6e69b">&#9670;&nbsp;</a></span>Coord() <span class="overload">[1/2]</span></h2>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a7c73966e94b4f45854f16e33683bc02c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7c73966e94b4f45854f16e33683bc02c">&#9670;&nbsp;</a></span>Index</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::<a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a422aa7e2d2bf5dd3a60f65427bc0d7c0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a422aa7e2d2bf5dd3a60f65427bc0d7c0">&#9670;&nbsp;</a></span>Coord() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::<a class="el" href="structcutlass_1_1Coord.html">Coord</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::<a class="el" href="structcutlass_1_1Coord.html">Coord</a> </td>
           <td>(</td>
-          <td class="paramtype">int&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td>
           <td class="paramname"><em>value</em> = <code>0</code></td><td>)</td>
           <td></td>
         </tr>
@@ -200,21 +246,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="a53a3d88a884f6cb7fda8aedfe2cec2c5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a53a3d88a884f6cb7fda8aedfe2cec2c5">&#9670;&nbsp;</a></span>Coord() <span class="overload">[2/2]</span></h2>
+<a id="a63ad1225ab2c51a68add731e994526b4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a63ad1225ab2c51a68add731e994526b4">&#9670;&nbsp;</a></span>Coord() <span class="overload">[2/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::<a class="el" href="structcutlass_1_1Coord.html">Coord</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::<a class="el" href="structcutlass_1_1Coord.html">Coord</a> </td>
           <td>(</td>
-          <td class="paramtype">int&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td>
           <td class="paramname"><em>_idx</em>[]</td><td>)</td>
           <td></td>
         </tr>
@@ -226,16 +272,44 @@ template&lt;int N_&gt; </div>
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a6110e4cfd090561696a81a8a4068a573"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6110e4cfd090561696a81a8a4068a573">&#9670;&nbsp;</a></span>Coord() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::<a class="el" href="structcutlass_1_1Coord.html">Coord</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="ad10b59430927a354fcd874d2d32f1bd8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad10b59430927a354fcd874d2d32f1bd8">&#9670;&nbsp;</a></span>at() <span class="overload">[1/4]</span></h2>
+<a id="a9eff24a3b74b68d11839b92324613c93"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9eff24a3b74b68d11839b92324613c93">&#9670;&nbsp;</a></span>at() <span class="overload">[1/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <div class="memtemplate">
 template&lt;int Dim&gt; </div>
 <table class="mlabels">
@@ -243,7 +317,7 @@ template&lt;int Dim&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::at </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::at </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -258,19 +332,19 @@ template&lt;int Dim&gt; </div>
 
 </div>
 </div>
-<a id="ab511a16210d1b94449f5bc6476f6a266"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab511a16210d1b94449f5bc6476f6a266">&#9670;&nbsp;</a></span>at() <span class="overload">[2/4]</span></h2>
+<a id="aa253bf69fc819876a7c7770305f1a694"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa253bf69fc819876a7c7770305f1a694">&#9670;&nbsp;</a></span>at() <span class="overload">[2/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::at </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::at </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>dim</em></td><td>)</td>
@@ -286,13 +360,13 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="af9cc7ab2088544d1240ac51c4c6e685d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af9cc7ab2088544d1240ac51c4c6e685d">&#9670;&nbsp;</a></span>at() <span class="overload">[3/4]</span></h2>
+<a id="a177adcc2d0fb5e72ebcb523edd24e6fe"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a177adcc2d0fb5e72ebcb523edd24e6fe">&#9670;&nbsp;</a></span>at() <span class="overload">[3/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <div class="memtemplate">
 template&lt;int Dim&gt; </div>
 <table class="mlabels">
@@ -300,7 +374,7 @@ template&lt;int Dim&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::at </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::at </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td> const</td>
@@ -315,19 +389,19 @@ template&lt;int Dim&gt; </div>
 
 </div>
 </div>
-<a id="aed4f4d1c7c0749fe72736d7a1213b6e9"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aed4f4d1c7c0749fe72736d7a1213b6e9">&#9670;&nbsp;</a></span>at() <span class="overload">[4/4]</span></h2>
+<a id="a9b47b1521820c898b03868627c3f8e46"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9b47b1521820c898b03868627c3f8e46">&#9670;&nbsp;</a></span>at() <span class="overload">[4/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::at </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::at </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>dim</em></td><td>)</td>
@@ -343,28 +417,28 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="a482ada6da62f427987c22098796fcf7e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a482ada6da62f427987c22098796fcf7e">&#9670;&nbsp;</a></span>clamp()</h2>
+<a id="a404a3b4e00f59cac71d41fb1bbba38ba"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a404a3b4e00f59cac71d41fb1bbba38ba">&#9670;&nbsp;</a></span>clamp()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::clamp </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::clamp </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;&#160;</td>
           <td class="paramname"><em>max</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>min</em> = <code><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>&gt;()</code>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>min</em> = <code><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>&gt;()</code>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -381,19 +455,19 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="a40429a9154f7a142ad7e9eb35282d196"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a40429a9154f7a142ad7e9eb35282d196">&#9670;&nbsp;</a></span>count()</h2>
+<a id="ac0ac5f2aa2cbea3887d126645025e017"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac0ac5f2aa2cbea3887d126645025e017">&#9670;&nbsp;</a></span>count()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::count </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::count </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td> const</td>
@@ -408,13 +482,13 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="ad4b3704d14057c043f972827671115cf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad4b3704d14057c043f972827671115cf">&#9670;&nbsp;</a></span>dot() <span class="overload">[1/2]</span></h2>
+<a id="ac8ec94703830ab2c62ee055533ea2184"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac8ec94703830ab2c62ee055533ea2184">&#9670;&nbsp;</a></span>dot() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <div class="memtemplate">
 template&lt;typename T &gt; </div>
 <table class="mlabels">
@@ -422,9 +496,9 @@ template&lt;typename T &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::dot </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::dot </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em>, </td>
         </tr>
         <tr>
@@ -448,13 +522,13 @@ template&lt;typename T &gt; </div>
 
 </div>
 </div>
-<a id="ae023c0c664c22a978e9b9ce5e063aae4"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae023c0c664c22a978e9b9ce5e063aae4">&#9670;&nbsp;</a></span>dot() <span class="overload">[2/2]</span></h2>
+<a id="a0acc37908acb6b879c37f54ff7ffc93d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0acc37908acb6b879c37f54ff7ffc93d">&#9670;&nbsp;</a></span>dot() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <div class="memtemplate">
 template&lt;typename T &gt; </div>
 <table class="mlabels">
@@ -462,9 +536,9 @@ template&lt;typename T &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::dot </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::dot </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td> const</td>
         </tr>
@@ -478,21 +552,75 @@ template&lt;typename T &gt; </div>
 
 </div>
 </div>
-<a id="a7fb46873e8f3cf38212703d35bd36995"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7fb46873e8f3cf38212703d35bd36995">&#9670;&nbsp;</a></span>operator!=()</h2>
+<a id="a1781b3c5a2d653b0c1718ec3154ae48f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1781b3c5a2d653b0c1718ec3154ae48f">&#9670;&nbsp;</a></span>operator bool()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator!= </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator bool </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a232095edae2f74c01a3c8abf68166e02"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a232095edae2f74c01a3c8abf68166e02">&#9670;&nbsp;</a></span>operator!()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator! </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a353d847675e5ba2402c407dcd4ae4de3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a353d847675e5ba2402c407dcd4ae4de3">&#9670;&nbsp;</a></span>operator!=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::<a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a>= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td> const</td>
         </tr>
@@ -506,21 +634,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="a8e4f7df55a75d040cf50cf9984c04c8a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8e4f7df55a75d040cf50cf9984c04c8a">&#9670;&nbsp;</a></span>operator*()</h2>
+<a id="a2e94c093f82908ff3dba4f23b5d10033"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2e94c093f82908ff3dba4f23b5d10033">&#9670;&nbsp;</a></span>operator*()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator* </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator* </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td> const</td>
         </tr>
@@ -534,21 +662,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="a282b6cc9ac8b2f72720c252791155aad"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a282b6cc9ac8b2f72720c252791155aad">&#9670;&nbsp;</a></span>operator*=()</h2>
+<a id="ad4303b578b72b5cb2a0198375290e168"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad4303b578b72b5cb2a0198375290e168">&#9670;&nbsp;</a></span>operator*=()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator*= </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator*= </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td></td>
         </tr>
@@ -562,21 +690,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="a3dfc4ce4191097b6c3268696f2a45ef5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3dfc4ce4191097b6c3268696f2a45ef5">&#9670;&nbsp;</a></span>operator+()</h2>
+<a id="ab37672637771a70910df9aa1a0cffddc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab37672637771a70910df9aa1a0cffddc">&#9670;&nbsp;</a></span>operator+()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator+ </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator+ </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td> const</td>
         </tr>
@@ -590,21 +718,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="aeb209486943fa9d42911325b16e49e09"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aeb209486943fa9d42911325b16e49e09">&#9670;&nbsp;</a></span>operator+=()</h2>
+<a id="ae4f2cb12b84411118cb93e7c4cb88b20"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae4f2cb12b84411118cb93e7c4cb88b20">&#9670;&nbsp;</a></span>operator+=()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator+= </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator+= </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td></td>
         </tr>
@@ -618,21 +746,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="acc510511ffb52bed7f6a52f14b99750d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#acc510511ffb52bed7f6a52f14b99750d">&#9670;&nbsp;</a></span>operator-()</h2>
+<a id="a6b876f61a85a4a4ef3763b6742bfaa6b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6b876f61a85a4a4ef3763b6742bfaa6b">&#9670;&nbsp;</a></span>operator-()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator- </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator- </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td> const</td>
         </tr>
@@ -646,21 +774,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="ac1795ec2a5890d8a39840567a4bea88e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac1795ec2a5890d8a39840567a4bea88e">&#9670;&nbsp;</a></span>operator-=()</h2>
+<a id="a304334cbcad636d7b058fdc6310f0e6b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a304334cbcad636d7b058fdc6310f0e6b">&#9670;&nbsp;</a></span>operator-=()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator-= </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator-= </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td></td>
         </tr>
@@ -674,21 +802,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="a87f485be079fa68bcf576da4d56f0ece"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a87f485be079fa68bcf576da4d56f0ece">&#9670;&nbsp;</a></span>operator/()</h2>
+<a id="a9bb07631f09efc80219413ac8309f568"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9bb07631f09efc80219413ac8309f568">&#9670;&nbsp;</a></span>operator/()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator/ </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator/ </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td> const</td>
         </tr>
@@ -702,21 +830,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="abe91e59962ef0d73aec9c14824f64ecc"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abe91e59962ef0d73aec9c14824f64ecc">&#9670;&nbsp;</a></span>operator/=()</h2>
+<a id="ac87199c4c9a4e20aac4eb6e3b9a68f28"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac87199c4c9a4e20aac4eb6e3b9a68f28">&#9670;&nbsp;</a></span>operator/=()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator/= </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator/= </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; N_ &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank_, Index_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td></td>
         </tr>
@@ -730,21 +858,21 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="acfa94aabd0c9a71ee994ca479d5f515f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#acfa94aabd0c9a71ee994ca479d5f515f">&#9670;&nbsp;</a></span>operator==()</h2>
+<a id="a148851df63840ac63e23b2f170bd1308"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a148851df63840ac63e23b2f170bd1308">&#9670;&nbsp;</a></span>operator&lt;()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator== </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator&lt; </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a> &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;&#160;</td>
           <td class="paramname"><em>b</em></td><td>)</td>
           <td> const</td>
         </tr>
@@ -758,19 +886,75 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="ab7fc89de3ccd7096ab275fb5dd40104c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab7fc89de3ccd7096ab275fb5dd40104c">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
+<a id="a9dc9f063be329d475f040afd449d304c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9dc9f063be329d475f040afd449d304c">&#9670;&nbsp;</a></span>operator&lt;=()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator&lt;= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7f919aeb2a895bc040599971400dec8d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7f919aeb2a895bc040599971400dec8d">&#9670;&nbsp;</a></span>operator==()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator== </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6e0967541a1d74edeb93897ea6069e24"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6e0967541a1d74edeb93897ea6069e24">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>dim</em></td><td>)</td>
@@ -786,19 +970,19 @@ template&lt;int N_&gt; </div>
 
 </div>
 </div>
-<a id="a6eeab0a1686ee25389e1bd017c5f03ae"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6eeab0a1686ee25389e1bd017c5f03ae">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
+<a id="a882e7ac07bbd6983659ef2e574b46454"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a882e7ac07bbd6983659ef2e574b46454">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int const&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const&amp; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>dim</em></td><td>)</td>
@@ -812,38 +996,103 @@ template&lt;int N_&gt; </div>
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="ac8f7a9b0835efc34fd28894b2b45342c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac8f7a9b0835efc34fd28894b2b45342c">&#9670;&nbsp;</a></span>slice()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank_, typename Index_ = int&gt; </div>
+<div class="memtemplate">
+template&lt;int Slice&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;Slice&gt; <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::slice </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>start</em> = <code>0</code>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td>
+          <td class="paramname"><em>identity</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Returns a slice of the <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> which may be larger or smaller in rank than this. </p>
+
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="a50de265129f1db7bdf2f0aefbc6a46bc"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a50de265129f1db7bdf2f0aefbc6a46bc">&#9670;&nbsp;</a></span>idx</h2>
+<a id="a872e1e0d9cc255fa438c04daaf10ad68"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a872e1e0d9cc255fa438c04daaf10ad68">&#9670;&nbsp;</a></span>idx</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">int <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::idx[<a class="el" href="structcutlass_1_1Coord.html#a3f2f5a9d7ef2063456c4d9f7e57e71ca">N</a>]</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::idx[<a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>]</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a3f2f5a9d7ef2063456c4d9f7e57e71ca"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3f2f5a9d7ef2063456c4d9f7e57e71ca">&#9670;&nbsp;</a></span>N</h2>
+<a id="a23e1b9a7f5fa8fd4afeadfb85de7c5c3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">&#9670;&nbsp;</a></span>kRank</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int N_&gt; </div>
+template&lt;int Rank_, typename Index_ = int&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; N_ &gt;::N = N_</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::kRank = Rank_</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="acfd416eafec51e47b42b8b713ba76030"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acfd416eafec51e47b42b8b713ba76030">&#9670;&nbsp;</a></span>N</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord</a>&lt; Rank_, Index_ &gt;::N = Rank_</td>
         </tr>
       </table>
   </td>
@@ -861,7 +1110,7 @@ template&lt;int N_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Copy-members.html b/docs/structcutlass_1_1Copy-members.html
index 42d212fc5..b05b6d6f8 100644
--- a/docs/structcutlass_1_1Copy-members.html
+++ b/docs/structcutlass_1_1Copy-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Copy.html b/docs/structcutlass_1_1Copy.html
index 65da8b81f..379c65ac0 100644
--- a/docs/structcutlass_1_1Copy.html
+++ b/docs/structcutlass_1_1Copy.html
@@ -257,7 +257,7 @@ template&lt;typename InputFragment_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1DumpType.html b/docs/structcutlass_1_1DumpType.html
new file mode 100644
index 000000000..1a89100e7
--- /dev/null
+++ b/docs/structcutlass_1_1DumpType.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::DumpType&lt; T &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1DumpType.html">DumpType</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::DumpType&lt; T &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a>&gt;</code></p>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Extent-members.html b/docs/structcutlass_1_1Extent-members.html
index f0a499a6b..1d4b28998 100644
--- a/docs/structcutlass_1_1Extent-members.html
+++ b/docs/structcutlass_1_1Extent-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Extent.html b/docs/structcutlass_1_1Extent.html
index 0efd6f839..6ea17e378 100644
--- a/docs/structcutlass_1_1Extent.html
+++ b/docs/structcutlass_1_1Extent.html
@@ -121,7 +121,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4-members.html b/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4-members.html
index f9f4108b0..3a80e4020 100644
--- a/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4-members.html
+++ b/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html b/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html
index 705991660..48cb9f01d 100644
--- a/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html
+++ b/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html
@@ -121,7 +121,7 @@ template&lt;typename T , int Lanes&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4-members.html b/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4-members.html
index 7c95798ee..2d22e08c7 100644
--- a/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4-members.html
+++ b/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html b/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html
index 6afa4a192..ffb5903ca 100644
--- a/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html
+++ b/docs/structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html
@@ -121,7 +121,7 @@ template&lt;typename T , int Lanes&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Fragment-members.html b/docs/structcutlass_1_1Fragment-members.html
index b6b050c04..614cc97fa 100644
--- a/docs/structcutlass_1_1Fragment-members.html
+++ b/docs/structcutlass_1_1Fragment-members.html
@@ -79,16 +79,17 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a29e7408fcde8cdf9de5e3a10eaa46391">clear</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#acf28266500b87484530b2395925fca51">clear</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a></td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a99fef5f3093b2df50905ab13819b67a0">operator[]</a>(int i)</td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a75f51bb6ca84615076aab42ac9d42592">operator[]</a>(int i) const</td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a84b6d68a5a24dbd04d842e0755b42bda">kAlignment</a></td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a></td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a77ba7cddf7822d64534b019c4ad9732e">operator[]</a>(int i)</td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a7795c5cf4d5626ff125abd5e8f156e9b">operator[]</a>(int i) const</td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment&lt; Element_, kElements_, kAlignment_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Fragment.html b/docs/structcutlass_1_1Fragment.html
index 640994f86..98573fccc 100644
--- a/docs/structcutlass_1_1Fragment.html
+++ b/docs/structcutlass_1_1Fragment.html
@@ -107,21 +107,24 @@ Public Types</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a29e7408fcde8cdf9de5e3a10eaa46391"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Fragment.html#a29e7408fcde8cdf9de5e3a10eaa46391">clear</a> ()</td></tr>
-<tr class="memdesc:a29e7408fcde8cdf9de5e3a10eaa46391"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear a fragment.  <a href="#a29e7408fcde8cdf9de5e3a10eaa46391">More...</a><br /></td></tr>
-<tr class="separator:a29e7408fcde8cdf9de5e3a10eaa46391"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a99fef5f3093b2df50905ab13819b67a0"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Fragment.html#a99fef5f3093b2df50905ab13819b67a0">operator[]</a> (int i)</td></tr>
-<tr class="memdesc:a99fef5f3093b2df50905ab13819b67a0"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a99fef5f3093b2df50905ab13819b67a0">More...</a><br /></td></tr>
-<tr class="separator:a99fef5f3093b2df50905ab13819b67a0"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a75f51bb6ca84615076aab42ac9d42592"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Fragment.html#a75f51bb6ca84615076aab42ac9d42592">operator[]</a> (int i) const</td></tr>
-<tr class="memdesc:a75f51bb6ca84615076aab42ac9d42592"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a75f51bb6ca84615076aab42ac9d42592">More...</a><br /></td></tr>
-<tr class="separator:a75f51bb6ca84615076aab42ac9d42592"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acf28266500b87484530b2395925fca51"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Fragment.html#acf28266500b87484530b2395925fca51">clear</a> ()</td></tr>
+<tr class="memdesc:acf28266500b87484530b2395925fca51"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear a fragment.  <a href="#acf28266500b87484530b2395925fca51">More...</a><br /></td></tr>
+<tr class="separator:acf28266500b87484530b2395925fca51"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a77ba7cddf7822d64534b019c4ad9732e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Fragment.html#a77ba7cddf7822d64534b019c4ad9732e">operator[]</a> (int i)</td></tr>
+<tr class="memdesc:a77ba7cddf7822d64534b019c4ad9732e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a77ba7cddf7822d64534b019c4ad9732e">More...</a><br /></td></tr>
+<tr class="separator:a77ba7cddf7822d64534b019c4ad9732e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7795c5cf4d5626ff125abd5e8f156e9b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Fragment.html#a7795c5cf4d5626ff125abd5e8f156e9b">operator[]</a> (int i) const</td></tr>
+<tr class="memdesc:a7795c5cf4d5626ff125abd5e8f156e9b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a7795c5cf4d5626ff125abd5e8f156e9b">More...</a><br /></td></tr>
+<tr class="separator:a7795c5cf4d5626ff125abd5e8f156e9b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
 <tr class="memitem:a2b9a64391d00ef23dd8d456c2337fa60"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Fragment.html#a2b9a64391d00ef23dd8d456c2337fa60">kElements</a> = kElements_</td></tr>
 <tr class="memdesc:a2b9a64391d00ef23dd8d456c2337fa60"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of elements.  <a href="#a2b9a64391d00ef23dd8d456c2337fa60">More...</a><br /></td></tr>
 <tr class="separator:a2b9a64391d00ef23dd8d456c2337fa60"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a84b6d68a5a24dbd04d842e0755b42bda"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Fragment.html#a84b6d68a5a24dbd04d842e0755b42bda">kAlignment</a> = kAlignment_</td></tr>
+<tr class="memdesc:a84b6d68a5a24dbd04d842e0755b42bda"><td class="mdescLeft">&#160;</td><td class="mdescRight">Alignment.  <a href="#a84b6d68a5a24dbd04d842e0755b42bda">More...</a><br /></td></tr>
+<tr class="separator:a84b6d68a5a24dbd04d842e0755b42bda"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="a9c67fa5bbd0b8b49bd6ec002dee3cbab"></a>
@@ -130,7 +133,7 @@ Static Public Attributes</h2></td></tr>
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </div>
+template&lt;typename Element_, int kElements_, size_t kAlignment_ = 16&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef Element_ <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment</a>&lt; Element_, kElements_, kAlignment_ &gt;::<a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a></td>
@@ -146,7 +149,7 @@ template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </di
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </div>
+template&lt;typename Element_, int kElements_, size_t kAlignment_ = 16&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;Element_, kElements_&gt; <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment</a>&lt; Element_, kElements_, kAlignment_ &gt;::<a class="el" href="structcutlass_1_1Fragment.html#a32f7ff86b73576a15c5ddaa40c4e0a95">This_</a></td>
@@ -158,19 +161,19 @@ template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </di
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a29e7408fcde8cdf9de5e3a10eaa46391"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a29e7408fcde8cdf9de5e3a10eaa46391">&#9670;&nbsp;</a></span>clear()</h2>
+<a id="acf28266500b87484530b2395925fca51"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acf28266500b87484530b2395925fca51">&#9670;&nbsp;</a></span>clear()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </div>
+template&lt;typename Element_, int kElements_, size_t kAlignment_ = 16&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment</a>&lt; Element_, kElements_, kAlignment_ &gt;::clear </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment</a>&lt; Element_, kElements_, kAlignment_ &gt;::clear </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -185,19 +188,19 @@ template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </di
 
 </div>
 </div>
-<a id="a99fef5f3093b2df50905ab13819b67a0"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a99fef5f3093b2df50905ab13819b67a0">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
+<a id="a77ba7cddf7822d64534b019c4ad9732e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a77ba7cddf7822d64534b019c4ad9732e">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </div>
+template&lt;typename Element_, int kElements_, size_t kAlignment_ = 16&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>&amp; <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment</a>&lt; Element_, kElements_, kAlignment_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a>&amp; <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment</a>&lt; Element_, kElements_, kAlignment_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>i</em></td><td>)</td>
@@ -213,19 +216,19 @@ template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </di
 
 </div>
 </div>
-<a id="a75f51bb6ca84615076aab42ac9d42592"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a75f51bb6ca84615076aab42ac9d42592">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
+<a id="a7795c5cf4d5626ff125abd5e8f156e9b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7795c5cf4d5626ff125abd5e8f156e9b">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </div>
+template&lt;typename Element_, int kElements_, size_t kAlignment_ = 16&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> const&amp; <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment</a>&lt; Element_, kElements_, kAlignment_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">Element</a> const&amp; <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment</a>&lt; Element_, kElements_, kAlignment_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>i</em></td><td>)</td>
@@ -242,13 +245,37 @@ template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </di
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
+<a id="a84b6d68a5a24dbd04d842e0755b42bda"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a84b6d68a5a24dbd04d842e0755b42bda">&#9670;&nbsp;</a></span>kAlignment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Element_, int kElements_, size_t kAlignment_ = 16&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1Fragment.html">cutlass::Fragment</a>&lt; Element_, kElements_, kAlignment_ &gt;::kAlignment = kAlignment_</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
 <a id="a2b9a64391d00ef23dd8d456c2337fa60"></a>
 <h2 class="memtitle"><span class="permalink"><a href="#a2b9a64391d00ef23dd8d456c2337fa60">&#9670;&nbsp;</a></span>kElements</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </div>
+template&lt;typename Element_, int kElements_, size_t kAlignment_ = 16&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
@@ -272,7 +299,7 @@ template&lt;typename Element_ , int kElements_, size_t kAlignment_ = 16&gt; </di
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1FragmentConstIterator-members.html b/docs/structcutlass_1_1FragmentConstIterator-members.html
index 0de6feda5..d92eb9431 100644
--- a/docs/structcutlass_1_1FragmentConstIterator-members.html
+++ b/docs/structcutlass_1_1FragmentConstIterator-members.html
@@ -80,23 +80,23 @@ $(function() {
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a8b957150545becacab1b8ead1be29424">at</a>(int d, int h, int w, int c=0) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a14f2ad2f9b90aea092ff1836e8fb159d">at</a>(int d, int h, int w, int c=0) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#ae98ab2a88342e7dbf9631cfb5cf5e706">Element</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#acac5b62b365f36f370adb0fee11cea05">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#ac4b6f351e6e72bed37e425f02a10c81e">FragmentConstIterator</a>(OtherFragment_ &amp;fragment, int offset=0)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a3a8fd8f13c157ed13dc93fd78036c59e">FragmentConstIterator</a>(FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#ad3e99cd7f56d4aec0a28cfcbde66f5af">FragmentConstIterator</a>(OtherFragment_ &amp;fragment, int offset=0)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a18f926c9c877e15a279f16637bd24e83">FragmentConstIterator</a>(FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b">IterationsStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a">IterationsStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">kElementsPerAccess</a></td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#af16f2aa14ff424b038a393b683c4783e">operator[]</a>(int i) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a6216b58ffe6322f037f1e0a3ffa714c8">operator[]</a>(int i) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#aee37f8ea06127b94a304bb776945509b">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#add14f695231c2bdd6284bf22b1e66f8f">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a01571b2fc566793fd50a10fa82441951">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#ac4d601998a84a3eac23e3b7a7c8a935b">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1FragmentConstIterator.html b/docs/structcutlass_1_1FragmentConstIterator.html
index 6a02e2f1e..3b6817228 100644
--- a/docs/structcutlass_1_1FragmentConstIterator.html
+++ b/docs/structcutlass_1_1FragmentConstIterator.html
@@ -105,28 +105,28 @@ Public Types</h2></td></tr>
 <tr class="memitem:a880f12d0cd42cdae7ce6009d2233f577"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt; <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a527100e34ed700787b1419157710dbb2">Iterations</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, 1, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">kElementsPerAccess</a> &gt; &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">FragmentShape</a></td></tr>
 <tr class="memdesc:a880f12d0cd42cdae7ce6009d2233f577"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the the fragment.  <a href="#a880f12d0cd42cdae7ce6009d2233f577">More...</a><br /></td></tr>
 <tr class="separator:a880f12d0cd42cdae7ce6009d2233f577"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab683796885f3bae3765efd96883f311b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt; <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">FragmentShape</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b">IterationsStrides</a></td></tr>
-<tr class="memdesc:ab683796885f3bae3765efd96883f311b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The linear strides for iterations.  <a href="#ab683796885f3bae3765efd96883f311b">More...</a><br /></td></tr>
-<tr class="separator:ab683796885f3bae3765efd96883f311b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a14ef0a0095e391503a19067e146c584a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt; <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">FragmentShape</a>, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">kElementsPerAccess</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a">IterationsStrides</a></td></tr>
+<tr class="memdesc:a14ef0a0095e391503a19067e146c584a"><td class="mdescLeft">&#160;</td><td class="mdescRight">The linear strides for iterations.  <a href="#a14ef0a0095e391503a19067e146c584a">More...</a><br /></td></tr>
+<tr class="separator:a14ef0a0095e391503a19067e146c584a"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:ac4b6f351e6e72bed37e425f02a10c81e"><td class="memTemplParams" colspan="2">template&lt;typename OtherFragment_ &gt; </td></tr>
-<tr class="memitem:ac4b6f351e6e72bed37e425f02a10c81e"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#ac4b6f351e6e72bed37e425f02a10c81e">FragmentConstIterator</a> (OtherFragment_ &amp;fragment, int offset=0)</td></tr>
-<tr class="memdesc:ac4b6f351e6e72bed37e425f02a10c81e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ac4b6f351e6e72bed37e425f02a10c81e">More...</a><br /></td></tr>
-<tr class="separator:ac4b6f351e6e72bed37e425f02a10c81e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3a8fd8f13c157ed13dc93fd78036c59e"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a3a8fd8f13c157ed13dc93fd78036c59e">FragmentConstIterator</a> (<a class="el" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)</td></tr>
-<tr class="memdesc:a3a8fd8f13c157ed13dc93fd78036c59e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Create from non-constant <a class="el" href="structcutlass_1_1FragmentIterator.html" title="A template defining Fragment Iterator Concept. ">FragmentIterator</a>.  <a href="#a3a8fd8f13c157ed13dc93fd78036c59e">More...</a><br /></td></tr>
-<tr class="separator:a3a8fd8f13c157ed13dc93fd78036c59e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8b957150545becacab1b8ead1be29424"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a8b957150545becacab1b8ead1be29424">at</a> (int d, int h, int w, int c=0) const</td></tr>
-<tr class="memdesc:a8b957150545becacab1b8ead1be29424"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a8b957150545becacab1b8ead1be29424">More...</a><br /></td></tr>
-<tr class="separator:a8b957150545becacab1b8ead1be29424"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af16f2aa14ff424b038a393b683c4783e"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#af16f2aa14ff424b038a393b683c4783e">operator[]</a> (int i) const</td></tr>
-<tr class="memdesc:af16f2aa14ff424b038a393b683c4783e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#af16f2aa14ff424b038a393b683c4783e">More...</a><br /></td></tr>
-<tr class="separator:af16f2aa14ff424b038a393b683c4783e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a01571b2fc566793fd50a10fa82441951"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a01571b2fc566793fd50a10fa82441951">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:a01571b2fc566793fd50a10fa82441951"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="#a01571b2fc566793fd50a10fa82441951">More...</a><br /></td></tr>
-<tr class="separator:a01571b2fc566793fd50a10fa82441951"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad3e99cd7f56d4aec0a28cfcbde66f5af"><td class="memTemplParams" colspan="2">template&lt;typename OtherFragment_ &gt; </td></tr>
+<tr class="memitem:ad3e99cd7f56d4aec0a28cfcbde66f5af"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#ad3e99cd7f56d4aec0a28cfcbde66f5af">FragmentConstIterator</a> (OtherFragment_ &amp;fragment, int offset=0)</td></tr>
+<tr class="memdesc:ad3e99cd7f56d4aec0a28cfcbde66f5af"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ad3e99cd7f56d4aec0a28cfcbde66f5af">More...</a><br /></td></tr>
+<tr class="separator:ad3e99cd7f56d4aec0a28cfcbde66f5af"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a18f926c9c877e15a279f16637bd24e83"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a18f926c9c877e15a279f16637bd24e83">FragmentConstIterator</a> (<a class="el" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;rhs_)</td></tr>
+<tr class="memdesc:a18f926c9c877e15a279f16637bd24e83"><td class="mdescLeft">&#160;</td><td class="mdescRight">Create from non-constant <a class="el" href="structcutlass_1_1FragmentIterator.html" title="A template defining Fragment Iterator Concept. ">FragmentIterator</a>.  <a href="#a18f926c9c877e15a279f16637bd24e83">More...</a><br /></td></tr>
+<tr class="separator:a18f926c9c877e15a279f16637bd24e83"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a14f2ad2f9b90aea092ff1836e8fb159d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a14f2ad2f9b90aea092ff1836e8fb159d">at</a> (int d, int h, int w, int c=0) const</td></tr>
+<tr class="memdesc:a14f2ad2f9b90aea092ff1836e8fb159d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a14f2ad2f9b90aea092ff1836e8fb159d">More...</a><br /></td></tr>
+<tr class="separator:a14f2ad2f9b90aea092ff1836e8fb159d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6216b58ffe6322f037f1e0a3ffa714c8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#a6216b58ffe6322f037f1e0a3ffa714c8">operator[]</a> (int i) const</td></tr>
+<tr class="memdesc:a6216b58ffe6322f037f1e0a3ffa714c8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a6216b58ffe6322f037f1e0a3ffa714c8">More...</a><br /></td></tr>
+<tr class="separator:a6216b58ffe6322f037f1e0a3ffa714c8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac4d601998a84a3eac23e3b7a7c8a935b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentConstIterator.html#ac4d601998a84a3eac23e3b7a7c8a935b">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ac4d601998a84a3eac23e3b7a7c8a935b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="#ac4d601998a84a3eac23e3b7a7c8a935b">More...</a><br /></td></tr>
+<tr class="separator:ac4d601998a84a3eac23e3b7a7c8a935b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
@@ -221,8 +221,8 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
 
 </div>
 </div>
-<a id="ab683796885f3bae3765efd96883f311b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab683796885f3bae3765efd96883f311b">&#9670;&nbsp;</a></span>IterationsStrides</h2>
+<a id="a14ef0a0095e391503a19067e146c584a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a14ef0a0095e391503a19067e146c584a">&#9670;&nbsp;</a></span>IterationsStrides</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -230,7 +230,7 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
 template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt;<a class="el" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">FragmentShape</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentConstIterator.html#ab683796885f3bae3765efd96883f311b">IterationsStrides</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt;<a class="el" href="structcutlass_1_1FragmentConstIterator.html#a880f12d0cd42cdae7ce6009d2233f577">FragmentShape</a>, <a class="el" href="structcutlass_1_1FragmentConstIterator.html#a004fabc9caa6924f3fb4badcbb19e88f">kElementsPerAccess</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentConstIterator.html#a14ef0a0095e391503a19067e146c584a">IterationsStrides</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -254,8 +254,8 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="ac4b6f351e6e72bed37e425f02a10c81e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac4b6f351e6e72bed37e425f02a10c81e">&#9670;&nbsp;</a></span>FragmentConstIterator() <span class="overload">[1/2]</span></h2>
+<a id="ad3e99cd7f56d4aec0a28cfcbde66f5af"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad3e99cd7f56d4aec0a28cfcbde66f5af">&#9670;&nbsp;</a></span>FragmentConstIterator() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -268,7 +268,7 @@ template&lt;typename OtherFragment_ &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentConstIterator.html">FragmentConstIterator</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentConstIterator.html">FragmentConstIterator</a> </td>
           <td>(</td>
           <td class="paramtype">OtherFragment_ &amp;&#160;</td>
           <td class="paramname"><em>fragment</em>, </td>
@@ -294,8 +294,8 @@ template&lt;typename OtherFragment_ &gt; </div>
 
 </div>
 </div>
-<a id="a3a8fd8f13c157ed13dc93fd78036c59e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3a8fd8f13c157ed13dc93fd78036c59e">&#9670;&nbsp;</a></span>FragmentConstIterator() <span class="overload">[2/2]</span></h2>
+<a id="a18f926c9c877e15a279f16637bd24e83"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a18f926c9c877e15a279f16637bd24e83">&#9670;&nbsp;</a></span>FragmentConstIterator() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -306,7 +306,7 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentConstIterator.html">FragmentConstIterator</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentConstIterator.html">FragmentConstIterator</a> </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt; const &amp;&#160;</td>
           <td class="paramname"><em>rhs_</em></td><td>)</td>
@@ -323,8 +323,8 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a8b957150545becacab1b8ead1be29424"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8b957150545becacab1b8ead1be29424">&#9670;&nbsp;</a></span>at()</h2>
+<a id="a14f2ad2f9b90aea092ff1836e8fb159d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a14f2ad2f9b90aea092ff1836e8fb159d">&#9670;&nbsp;</a></span>at()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -335,7 +335,7 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const&amp; <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::at </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const&amp; <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::at </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -373,8 +373,8 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
 
 </div>
 </div>
-<a id="af16f2aa14ff424b038a393b683c4783e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af16f2aa14ff424b038a393b683c4783e">&#9670;&nbsp;</a></span>operator[]()</h2>
+<a id="a6216b58ffe6322f037f1e0a3ffa714c8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6216b58ffe6322f037f1e0a3ffa714c8">&#9670;&nbsp;</a></span>operator[]()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -385,7 +385,7 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const&amp; <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentConstIterator.html#addf5c21444f129211eefe7cdca6dfa1b">AccessType</a> const&amp; <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>i</em></td><td>)</td>
@@ -401,8 +401,8 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
 
 </div>
 </div>
-<a id="a01571b2fc566793fd50a10fa82441951"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a01571b2fc566793fd50a10fa82441951">&#9670;&nbsp;</a></span>valid()</h2>
+<a id="ac4d601998a84a3eac23e3b7a7c8a935b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac4d601998a84a3eac23e3b7a7c8a935b">&#9670;&nbsp;</a></span>valid()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -413,7 +413,7 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE bool <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::valid </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1FragmentConstIterator.html">cutlass::FragmentConstIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::valid </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -498,7 +498,7 @@ template&lt;typename Fragment_ , typename Iterations_ , typename AccessType_ &gt
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1FragmentElementType-members.html b/docs/structcutlass_1_1FragmentElementType-members.html
new file mode 100644
index 000000000..44c05c238
--- /dev/null
+++ b/docs/structcutlass_1_1FragmentElementType-members.html
@@ -0,0 +1,93 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::FragmentElementType Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1FragmentElementType.html">cutlass::FragmentElementType</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">Kind</a> enum name</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentElementType.html">cutlass::FragmentElementType</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">kScalar</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentElementType.html">cutlass::FragmentElementType</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">kWmmaMatrix</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentElementType.html">cutlass::FragmentElementType</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1FragmentElementType.html b/docs/structcutlass_1_1FragmentElementType.html
new file mode 100644
index 000000000..ba5466328
--- /dev/null
+++ b/docs/structcutlass_1_1FragmentElementType.html
@@ -0,0 +1,125 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::FragmentElementType Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1FragmentElementType.html">FragmentElementType</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="structcutlass_1_1FragmentElementType-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::FragmentElementType Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a62883b0695dc3a7ff82916ff9d75df0b"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">Kind</a> { <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">kScalar</a>, 
+<a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">kWmmaMatrix</a>
+ }</td></tr>
+<tr class="separator:a62883b0695dc3a7ff82916ff9d75df0b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Enumeration Documentation</h2>
+<a id="a62883b0695dc3a7ff82916ff9d75df0b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a62883b0695dc3a7ff82916ff9d75df0b">&#9670;&nbsp;</a></span>Kind</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">enum <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">cutlass::FragmentElementType::Kind</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b"></a>kScalar&#160;</td><td class="fielddoc"></td></tr>
+<tr><td class="fieldname"><a id="a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd"></a>kWmmaMatrix&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1FragmentIterator-members.html b/docs/structcutlass_1_1FragmentIterator-members.html
index eba645feb..e2f03aa96 100644
--- a/docs/structcutlass_1_1FragmentIterator-members.html
+++ b/docs/structcutlass_1_1FragmentIterator-members.html
@@ -80,24 +80,24 @@ $(function() {
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a9cf31df06ff035705a1341810fcdcbf2">at</a>(int d, int h, int w, int c=0) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a7bdc407aae8d7360e089af347b585a53">at</a>(int d, int h, int w, int c=0)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a35b721563536ab2c5dbab0f5de1c2b43">at</a>(int d, int h, int w, int c=0) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#adb863b44dfbc1fa923625e767f6dd7cd">at</a>(int d, int h, int w, int c=0)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#ab4ef3c5a6b5e13224e45bbbcb9f1bc5d">Element</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#afd15cbe1c9a0fd7871b12f3f3042c808">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#ae1825fe3e138e2aa62d27dab2b5227b4">FragmentIterator</a>(OtherFragment_ &amp;fragment, int offset=0)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a638e4e1d84b4ae84e758288c7f37548b">FragmentIterator</a>(OtherFragment_ &amp;fragment, int offset=0)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a></td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a83bb6a3ed588e2d890bf986665d2b7bb">operator[]</a>(int i) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a3bd2a9d8467f8db02ca3a01ae0c11ad7">operator[]</a>(int i)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a21877944988f34eb69cb6eefb00c6575">operator[]</a>(int i) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#ad665745f3d6a3a88d7894fe0fc1bbd3e">operator[]</a>(int i)</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#af667793926cdb24d701eb75e0345bbd6">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1">Strides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e">Strides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#ae320d9672450f5341abcdb24a8b09369">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#ab18f8ea676b45831f939715212167a99">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html#a8608dd815ed4906d8c82c41a10df23e2">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator&lt; Fragment_, Iterations_, AccessType_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1FragmentIterator.html b/docs/structcutlass_1_1FragmentIterator.html
index 3bd495f67..4c3590939 100644
--- a/docs/structcutlass_1_1FragmentIterator.html
+++ b/docs/structcutlass_1_1FragmentIterator.html
@@ -108,31 +108,31 @@ Public Types</h2></td></tr>
 <tr class="memitem:a63ff1767c4923b0a2b6b64487306ed76"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt; <a class="el" href="structcutlass_1_1FragmentIterator.html#a4324ae522c6463e66a64f05d2e58b5f0">Iterations</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, 1, <a class="el" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a> &gt; &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentShape</a></td></tr>
 <tr class="memdesc:a63ff1767c4923b0a2b6b64487306ed76"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the the fragment.  <a href="#a63ff1767c4923b0a2b6b64487306ed76">More...</a><br /></td></tr>
 <tr class="separator:a63ff1767c4923b0a2b6b64487306ed76"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2858ba9a8a9bbaef1de73415cff9b3c1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt; <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentShape</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1">Strides</a></td></tr>
-<tr class="memdesc:a2858ba9a8a9bbaef1de73415cff9b3c1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The linear strides for iterations.  <a href="#a2858ba9a8a9bbaef1de73415cff9b3c1">More...</a><br /></td></tr>
-<tr class="separator:a2858ba9a8a9bbaef1de73415cff9b3c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e93985d759d904ac858054eeaa9e50e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt; <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentShape</a>, <a class="el" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e">Strides</a></td></tr>
+<tr class="memdesc:a2e93985d759d904ac858054eeaa9e50e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The linear strides for iterations.  <a href="#a2e93985d759d904ac858054eeaa9e50e">More...</a><br /></td></tr>
+<tr class="separator:a2e93985d759d904ac858054eeaa9e50e"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:ae1825fe3e138e2aa62d27dab2b5227b4"><td class="memTemplParams" colspan="2">template&lt;typename OtherFragment_ &gt; </td></tr>
-<tr class="memitem:ae1825fe3e138e2aa62d27dab2b5227b4"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#ae1825fe3e138e2aa62d27dab2b5227b4">FragmentIterator</a> (OtherFragment_ &amp;fragment, int offset=0)</td></tr>
-<tr class="memdesc:ae1825fe3e138e2aa62d27dab2b5227b4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ae1825fe3e138e2aa62d27dab2b5227b4">More...</a><br /></td></tr>
-<tr class="separator:ae1825fe3e138e2aa62d27dab2b5227b4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9cf31df06ff035705a1341810fcdcbf2"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a9cf31df06ff035705a1341810fcdcbf2">at</a> (int d, int h, int w, int c=0) const</td></tr>
-<tr class="memdesc:a9cf31df06ff035705a1341810fcdcbf2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a9cf31df06ff035705a1341810fcdcbf2">More...</a><br /></td></tr>
-<tr class="separator:a9cf31df06ff035705a1341810fcdcbf2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7bdc407aae8d7360e089af347b585a53"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a7bdc407aae8d7360e089af347b585a53">at</a> (int d, int h, int w, int c=0)</td></tr>
-<tr class="memdesc:a7bdc407aae8d7360e089af347b585a53"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a7bdc407aae8d7360e089af347b585a53">More...</a><br /></td></tr>
-<tr class="separator:a7bdc407aae8d7360e089af347b585a53"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a83bb6a3ed588e2d890bf986665d2b7bb"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a83bb6a3ed588e2d890bf986665d2b7bb">operator[]</a> (int i) const</td></tr>
-<tr class="memdesc:a83bb6a3ed588e2d890bf986665d2b7bb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a83bb6a3ed588e2d890bf986665d2b7bb">More...</a><br /></td></tr>
-<tr class="separator:a83bb6a3ed588e2d890bf986665d2b7bb"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3bd2a9d8467f8db02ca3a01ae0c11ad7"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a3bd2a9d8467f8db02ca3a01ae0c11ad7">operator[]</a> (int i)</td></tr>
-<tr class="memdesc:a3bd2a9d8467f8db02ca3a01ae0c11ad7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a3bd2a9d8467f8db02ca3a01ae0c11ad7">More...</a><br /></td></tr>
-<tr class="separator:a3bd2a9d8467f8db02ca3a01ae0c11ad7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab18f8ea676b45831f939715212167a99"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#ab18f8ea676b45831f939715212167a99">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:ab18f8ea676b45831f939715212167a99"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="#ab18f8ea676b45831f939715212167a99">More...</a><br /></td></tr>
-<tr class="separator:ab18f8ea676b45831f939715212167a99"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a638e4e1d84b4ae84e758288c7f37548b"><td class="memTemplParams" colspan="2">template&lt;typename OtherFragment_ &gt; </td></tr>
+<tr class="memitem:a638e4e1d84b4ae84e758288c7f37548b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a638e4e1d84b4ae84e758288c7f37548b">FragmentIterator</a> (OtherFragment_ &amp;fragment, int offset=0)</td></tr>
+<tr class="memdesc:a638e4e1d84b4ae84e758288c7f37548b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a638e4e1d84b4ae84e758288c7f37548b">More...</a><br /></td></tr>
+<tr class="separator:a638e4e1d84b4ae84e758288c7f37548b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a35b721563536ab2c5dbab0f5de1c2b43"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a35b721563536ab2c5dbab0f5de1c2b43">at</a> (int d, int h, int w, int c=0) const</td></tr>
+<tr class="memdesc:a35b721563536ab2c5dbab0f5de1c2b43"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a35b721563536ab2c5dbab0f5de1c2b43">More...</a><br /></td></tr>
+<tr class="separator:a35b721563536ab2c5dbab0f5de1c2b43"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adb863b44dfbc1fa923625e767f6dd7cd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#adb863b44dfbc1fa923625e767f6dd7cd">at</a> (int d, int h, int w, int c=0)</td></tr>
+<tr class="memdesc:adb863b44dfbc1fa923625e767f6dd7cd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#adb863b44dfbc1fa923625e767f6dd7cd">More...</a><br /></td></tr>
+<tr class="separator:adb863b44dfbc1fa923625e767f6dd7cd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a21877944988f34eb69cb6eefb00c6575"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a21877944988f34eb69cb6eefb00c6575">operator[]</a> (int i) const</td></tr>
+<tr class="memdesc:a21877944988f34eb69cb6eefb00c6575"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#a21877944988f34eb69cb6eefb00c6575">More...</a><br /></td></tr>
+<tr class="separator:a21877944988f34eb69cb6eefb00c6575"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad665745f3d6a3a88d7894fe0fc1bbd3e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#ad665745f3d6a3a88d7894fe0fc1bbd3e">operator[]</a> (int i)</td></tr>
+<tr class="memdesc:ad665745f3d6a3a88d7894fe0fc1bbd3e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accessor.  <a href="#ad665745f3d6a3a88d7894fe0fc1bbd3e">More...</a><br /></td></tr>
+<tr class="separator:ad665745f3d6a3a88d7894fe0fc1bbd3e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8608dd815ed4906d8c82c41a10df23e2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1FragmentIterator.html#a8608dd815ed4906d8c82c41a10df23e2">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a8608dd815ed4906d8c82c41a10df23e2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="#a8608dd815ed4906d8c82c41a10df23e2">More...</a><br /></td></tr>
+<tr class="separator:a8608dd815ed4906d8c82c41a10df23e2"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
@@ -227,8 +227,8 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
 
 </div>
 </div>
-<a id="a2858ba9a8a9bbaef1de73415cff9b3c1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2858ba9a8a9bbaef1de73415cff9b3c1">&#9670;&nbsp;</a></span>Strides</h2>
+<a id="a2e93985d759d904ac858054eeaa9e50e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2e93985d759d904ac858054eeaa9e50e">&#9670;&nbsp;</a></span>Strides</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -236,7 +236,7 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
 template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt;<a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentShape</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentIterator.html#a2858ba9a8a9bbaef1de73415cff9b3c1">Strides</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt;<a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentShape</a>, <a class="el" href="structcutlass_1_1FragmentIterator.html#ad2c43e30e78e8799df7cb02ac08cee9a">kElementsPerAccess</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentIterator.html#a2e93985d759d904ac858054eeaa9e50e">Strides</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -260,8 +260,8 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="ae1825fe3e138e2aa62d27dab2b5227b4"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae1825fe3e138e2aa62d27dab2b5227b4">&#9670;&nbsp;</a></span>FragmentIterator()</h2>
+<a id="a638e4e1d84b4ae84e758288c7f37548b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a638e4e1d84b4ae84e758288c7f37548b">&#9670;&nbsp;</a></span>FragmentIterator()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -274,7 +274,7 @@ template&lt;typename OtherFragment_ &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::<a class="el" href="structcutlass_1_1FragmentIterator.html">FragmentIterator</a> </td>
           <td>(</td>
           <td class="paramtype">OtherFragment_ &amp;&#160;</td>
           <td class="paramname"><em>fragment</em>, </td>
@@ -301,8 +301,8 @@ template&lt;typename OtherFragment_ &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a9cf31df06ff035705a1341810fcdcbf2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9cf31df06ff035705a1341810fcdcbf2">&#9670;&nbsp;</a></span>at() <span class="overload">[1/2]</span></h2>
+<a id="a35b721563536ab2c5dbab0f5de1c2b43"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a35b721563536ab2c5dbab0f5de1c2b43">&#9670;&nbsp;</a></span>at() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -313,7 +313,7 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const&amp; <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::at </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const&amp; <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::at </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -351,8 +351,8 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
 
 </div>
 </div>
-<a id="a7bdc407aae8d7360e089af347b585a53"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7bdc407aae8d7360e089af347b585a53">&#9670;&nbsp;</a></span>at() <span class="overload">[2/2]</span></h2>
+<a id="adb863b44dfbc1fa923625e767f6dd7cd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adb863b44dfbc1fa923625e767f6dd7cd">&#9670;&nbsp;</a></span>at() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -363,7 +363,7 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp; <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::at </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp; <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::at </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -401,8 +401,8 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
 
 </div>
 </div>
-<a id="a83bb6a3ed588e2d890bf986665d2b7bb"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a83bb6a3ed588e2d890bf986665d2b7bb">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
+<a id="a21877944988f34eb69cb6eefb00c6575"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a21877944988f34eb69cb6eefb00c6575">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -413,7 +413,7 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const&amp; <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a> const&amp; <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>i</em></td><td>)</td>
@@ -429,8 +429,8 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
 
 </div>
 </div>
-<a id="a3bd2a9d8467f8db02ca3a01ae0c11ad7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3bd2a9d8467f8db02ca3a01ae0c11ad7">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
+<a id="ad665745f3d6a3a88d7894fe0fc1bbd3e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad665745f3d6a3a88d7894fe0fc1bbd3e">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -441,7 +441,7 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp; <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1FragmentIterator.html#a012c5af3a8a40843c576c55ecbc663e7">AccessType</a>&amp; <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>i</em></td><td>)</td>
@@ -457,8 +457,8 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
 
 </div>
 </div>
-<a id="ab18f8ea676b45831f939715212167a99"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab18f8ea676b45831f939715212167a99">&#9670;&nbsp;</a></span>valid()</h2>
+<a id="a8608dd815ed4906d8c82c41a10df23e2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8608dd815ed4906d8c82c41a10df23e2">&#9670;&nbsp;</a></span>valid()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -469,7 +469,7 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE bool <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::valid </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1FragmentIterator.html">cutlass::FragmentIterator</a>&lt; Fragment_, Iterations_, AccessType_ &gt;::valid </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -554,7 +554,7 @@ template&lt;typename Fragment_, typename Iterations_, typename AccessType_&gt; <
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1GemmOperand-members.html b/docs/structcutlass_1_1GemmOperand-members.html
index 1f0d6f482..4086172cd 100644
--- a/docs/structcutlass_1_1GemmOperand-members.html
+++ b/docs/structcutlass_1_1GemmOperand-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1GemmOperand.html b/docs/structcutlass_1_1GemmOperand.html
index b97ab4795..54e028a2c 100644
--- a/docs/structcutlass_1_1GemmOperand.html
+++ b/docs/structcutlass_1_1GemmOperand.html
@@ -121,7 +121,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Identity-members.html b/docs/structcutlass_1_1Identity-members.html
index 7d06d4320..04e63064f 100644
--- a/docs/structcutlass_1_1Identity-members.html
+++ b/docs/structcutlass_1_1Identity-members.html
@@ -85,7 +85,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Identity.html b/docs/structcutlass_1_1Identity.html
index 1629a334c..d4b8d6271 100644
--- a/docs/structcutlass_1_1Identity.html
+++ b/docs/structcutlass_1_1Identity.html
@@ -118,7 +118,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1IdentityTensorMapFunc-members.html b/docs/structcutlass_1_1IdentityTensorMapFunc-members.html
new file mode 100644
index 000000000..d08785960
--- /dev/null
+++ b/docs/structcutlass_1_1IdentityTensorMapFunc-members.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">IdentityTensorMapFunc</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::IdentityTensorMapFunc&lt; Rank &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">cutlass::IdentityTensorMapFunc&lt; Rank &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html#ac609498e7fe858b4fb3791d1039438f4">kStorageRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">cutlass::IdentityTensorMapFunc&lt; Rank &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html#a3922130841c34d3ce8c112ee6fae4ca1">operator()</a>(Coord&lt; Rank &gt; const &amp;coord) const</td><td class="entry"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">cutlass::IdentityTensorMapFunc&lt; Rank &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1IdentityTensorMapFunc.html b/docs/structcutlass_1_1IdentityTensorMapFunc.html
new file mode 100644
index 000000000..9c350a380
--- /dev/null
+++ b/docs/structcutlass_1_1IdentityTensorMapFunc.html
@@ -0,0 +1,166 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::IdentityTensorMapFunc&lt; Rank &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">IdentityTensorMapFunc</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1IdentityTensorMapFunc-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::IdentityTensorMapFunc&lt; Rank &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="tensor__ref_8h_source.html">tensor_ref.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a3922130841c34d3ce8c112ee6fae4ca1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html#a3922130841c34d3ce8c112ee6fae4ca1">operator()</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank &gt; const &amp;coord) const</td></tr>
+<tr class="separator:a3922130841c34d3ce8c112ee6fae4ca1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:ac609498e7fe858b4fb3791d1039438f4"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html#ac609498e7fe858b4fb3791d1039438f4">kStorageRank</a> = Rank</td></tr>
+<tr class="separator:ac609498e7fe858b4fb3791d1039438f4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;int Rank&gt;<br />
+struct cutlass::IdentityTensorMapFunc&lt; Rank &gt;</h3>
+
+<p>Default mapping function from coordinates in a tensor's index space into the n-D array held in memory. Assumes StorageRank = Rank </p>
+</div><h2 class="groupheader">Member Function Documentation</h2>
+<a id="a3922130841c34d3ce8c112ee6fae4ca1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3922130841c34d3ce8c112ee6fae4ca1">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;Rank&gt; <a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">cutlass::IdentityTensorMapFunc</a>&lt; Rank &gt;::operator() </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Rank &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="ac609498e7fe858b4fb3791d1039438f4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac609498e7fe858b4fb3791d1039438f4">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Rank&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">cutlass::IdentityTensorMapFunc</a>&lt; Rank &gt;::kStorageRank = Rank</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tensor__ref_8h_source.html">tensor_ref.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1IteratorAdvance-members.html b/docs/structcutlass_1_1IteratorAdvance-members.html
index b7e004e46..b012bd911 100644
--- a/docs/structcutlass_1_1IteratorAdvance-members.html
+++ b/docs/structcutlass_1_1IteratorAdvance-members.html
@@ -86,7 +86,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1IteratorAdvance.html b/docs/structcutlass_1_1IteratorAdvance.html
index 91a9d3bcc..a4a49940a 100644
--- a/docs/structcutlass_1_1IteratorAdvance.html
+++ b/docs/structcutlass_1_1IteratorAdvance.html
@@ -119,7 +119,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1KernelLaunchConfiguration-members.html b/docs/structcutlass_1_1KernelLaunchConfiguration-members.html
new file mode 100644
index 000000000..f93f3de0f
--- /dev/null
+++ b/docs/structcutlass_1_1KernelLaunchConfiguration-members.html
@@ -0,0 +1,94 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">KernelLaunchConfiguration</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::KernelLaunchConfiguration Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">block</a></td><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">dynamic_smem</a></td><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">grid</a></td><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">KernelLaunchConfiguration</a>(dim3 _grid=dim3(1, 1, 1), dim3 _block=dim3(1, 1, 1), size_t _dynamic_smem=0)</td><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1KernelLaunchConfiguration.html b/docs/structcutlass_1_1KernelLaunchConfiguration.html
new file mode 100644
index 000000000..305f68ec0
--- /dev/null
+++ b/docs/structcutlass_1_1KernelLaunchConfiguration.html
@@ -0,0 +1,213 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::KernelLaunchConfiguration Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">KernelLaunchConfiguration</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1KernelLaunchConfiguration-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::KernelLaunchConfiguration Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Structure containing the basic launch configuration of a CUDA kernel.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="kernel__launch_8h_source.html">kernel_launch.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::KernelLaunchConfiguration:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1KernelLaunchConfiguration.png" usemap="#cutlass::KernelLaunchConfiguration_map" alt=""/>
+  <map id="cutlass::KernelLaunchConfiguration_map" name="cutlass::KernelLaunchConfiguration_map">
+<area href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html" title="Parameters object constructable on the host. " alt="cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params" shape="rect" coords="0,56,1154,80"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a726db328ccc8f5e186ff8e7cef568eaa"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">KernelLaunchConfiguration</a> (dim3 _grid=dim3(1, 1, 1), dim3 _block=dim3(1, 1, 1), size_t _dynamic_smem=0)</td></tr>
+<tr class="memdesc:a726db328ccc8f5e186ff8e7cef568eaa"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a KernellaunchConfiguration object.  <a href="#a726db328ccc8f5e186ff8e7cef568eaa">More...</a><br /></td></tr>
+<tr class="separator:a726db328ccc8f5e186ff8e7cef568eaa"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:ab86ba1464dd9c6cd15ae0de4a552201b"><td class="memItemLeft" align="right" valign="top">dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">grid</a></td></tr>
+<tr class="memdesc:ab86ba1464dd9c6cd15ae0de4a552201b"><td class="mdescLeft">&#160;</td><td class="mdescRight">CUDA grid dimensions.  <a href="#ab86ba1464dd9c6cd15ae0de4a552201b">More...</a><br /></td></tr>
+<tr class="separator:ab86ba1464dd9c6cd15ae0de4a552201b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a09535026bf08f94c6940c358d95d1edd"><td class="memItemLeft" align="right" valign="top">dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">block</a></td></tr>
+<tr class="memdesc:a09535026bf08f94c6940c358d95d1edd"><td class="mdescLeft">&#160;</td><td class="mdescRight">CUDA threablock dimensions.  <a href="#a09535026bf08f94c6940c358d95d1edd">More...</a><br /></td></tr>
+<tr class="separator:a09535026bf08f94c6940c358d95d1edd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4a6ac693d4284c84301279219623e2bc"><td class="memItemLeft" align="right" valign="top">size_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">dynamic_smem</a></td></tr>
+<tr class="memdesc:a4a6ac693d4284c84301279219623e2bc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Bytes of dynamically allocated SMEM in addition to static SMEM.  <a href="#a4a6ac693d4284c84301279219623e2bc">More...</a><br /></td></tr>
+<tr class="separator:a4a6ac693d4284c84301279219623e2bc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a726db328ccc8f5e186ff8e7cef568eaa"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a726db328ccc8f5e186ff8e7cef568eaa">&#9670;&nbsp;</a></span>KernelLaunchConfiguration()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::KernelLaunchConfiguration::KernelLaunchConfiguration </td>
+          <td>(</td>
+          <td class="paramtype">dim3&#160;</td>
+          <td class="paramname"><em>_grid</em> = <code>dim3(1,1,1)</code>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">dim3&#160;</td>
+          <td class="paramname"><em>_block</em> = <code>dim3(1,1,1)</code>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">size_t&#160;</td>
+          <td class="paramname"><em>_dynamic_smem</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a09535026bf08f94c6940c358d95d1edd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a09535026bf08f94c6940c358d95d1edd">&#9670;&nbsp;</a></span>block</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">dim3 cutlass::KernelLaunchConfiguration::block</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4a6ac693d4284c84301279219623e2bc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4a6ac693d4284c84301279219623e2bc">&#9670;&nbsp;</a></span>dynamic_smem</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">size_t cutlass::KernelLaunchConfiguration::dynamic_smem</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab86ba1464dd9c6cd15ae0de4a552201b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab86ba1464dd9c6cd15ae0de4a552201b">&#9670;&nbsp;</a></span>grid</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">dim3 cutlass::KernelLaunchConfiguration::grid</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="kernel__launch_8h_source.html">kernel_launch.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1KernelLaunchConfiguration.png b/docs/structcutlass_1_1KernelLaunchConfiguration.png
new file mode 100644
index 0000000000000000000000000000000000000000..a5b5f63f56d31280419ccf02048cfa0ecf8a9904
GIT binary patch
literal 2229
zcmc&$X;c$g8U-aDCauAvbR#I>V34H+MA?J@lWAy33lRv5Agf>t$|9&?2@nk9w1^rF
z2nG%i2}{ck61G4<iAISKTAIxOK^DVmNJ0!rAejPZeofDu`8RdWtM9wFs@_-k-BaJI
zEDxm1KCl*8Nl9rR!qv%3Nl66<<Q}TKfwPyuGztiZJlwpU6$%BAu89^ZUfz5NWILm$
zr{{cQk}m*NZ+Ib5O2AFq$8ewbDS&c9IKjP>lvgL0(QKQ&&L7XYT<w=R3T$YuWv1wf
zsIe%VuU(5i_-{wA3G1T@DlQgOJbO|RWn2+ea2J5)Pe>WNz=okJ<wp&HY>yWhw+)Z}
z8{9AooDw}BP3!v7tQ)KnIUCp=D2KD=C*q!{fH#;%pcm&p9t5XML3l<B=cCMad%L{E
zKUG)ZJc&xVGcTwz<J5ENxTd<xoZypq<yM6_Ol*@KQqV*7WKz;s7z~ljB-^D;_KHC<
zWx7NdPE$R>INsUW`)tMw{HM0V3om?BWf;gVF}dT><;=W;%YiQbEw@M+aZX06G&8%f
z8Ux?S6Pb=9b`|ziCHIGNayNG@Q-;5^cFVBZ`6C+;#bZ9jnO3!@O>{o@=@UtP;jO6q
z=kpGBd%{<t<wrM^b8*wMgfh}ipH?hpJ{nse|D`|@1GepJ0yGf4_NRsv_@p(ojdH59
zk(5FF6v*MXzSClumocEbd|T#XM~`EkB&IPWe_gPQE^lRu`g(P~XSU(7K@WXxi;#8U
zqtF&y3UuhcV&RP?6PPjXC%8vXQk8i67ZkAOuLZv)4rA7OjX-eaOk%|q`;En1+_p7`
zT#Z!0fHk-N7`}0a4_UasvT#S4yAOH04Ox5(z#o9;l1i{&o!$G@%GZ3B<NS`te+Slf
z+v6h|yB}xnlyLr9;%RQi|4{M2zt8{k>W1Z~<l^k)V(!Iat|UfI<R+W`lSni-Ks<sv
z6Vwr2(6_2T!GW-Y_m-*W{)_(0f1r`-7D0HZ<eXbR7Lo9hF~538NDNW2(~dtQHqK&q
zUfoktLl@CjR}l&H@jHJO@|IJrFobBylGa|gnVS8D$kc9yu9z1~Eg2i2Y9>0c>$C}T
zf2v<vdwsn~6hVN^HnRy4jC|t-t(i;V`UnPJyFODJpER69Wu%=|ma%i@GES>KAS!B-
zN~l}eS5KbGs=V#mq{A~_h?cXn{3c~=_4O(UOFRqh=QF`6%XvQVYM7aSFpZO#$1WG~
z!mnN5l6J|OFu0+3e7CNFPNsuH;&*A<E1~pbOD3b0wWIa}Tgg06-SE6Cu)fA%Dys?h
z%IYnb$y?@PDFW#k>qkEhhdLc7IYEDax=^zq2l0U%BrSZ#ULVm%chTf&-zAy6v;8~=
zhe)4Qa|Mu=GgI6sRP^x+@)OSt-fEtWm07pbs`crmB=ks2EGi+@Vzgd=iMFoipxwIu
zi60SD3h2Ez2BUuiDw<04eM%i4!SVK(sC}?Y*x0O;y`TLOJFqI-n9;iDHdBtPD6@xj
zY#}mMW0)PmEqq^iKV%bjE$4U7@Xn>m3gbykQgAuhH2N-;h^b9S&5^CgzrR>XGNp)|
zF4R`iY)`SWf~2vLu%UA_q||l{3ID}R4}ob86CYDcY*_u3>_^2sxeV4isbKhGn&NM^
z8W2+o@by(M-arSy@%C662wVE-^DXgs3!0fLili#qaRZMDWp)tt-yg4#2G~AWZ(jf5
z)FvW@GS*q+w)jBS%>}3AQus;MSCV5;?{#9{aA&nZl+4(fi2z=5Lx}HSJVPXD7R6z1
z$~y9qD><;ZEpuT>jNGMF{OEz7BCd9)bfdpHOZ~>Cdj9~nloYXqualI39FWr#T*rZ$
z>=hG`s5)U^4)n0?>IqZZfT<wqxo?||hCb?X46r1UFn-cu5H#j3x!J&}A;maw!_?3c
za-x*M#nP@J(H*_R3XtU?A{~qJAgrA6^LTzOuDk9s1o$p60|#tqWYpm6F-G-5I}XjU
zO4Lz}^n14@_#E&QHMk{>KVIlO6^Go`1!ggd3?tp2YcPjG8MPCR=Lt6~!t#SY<$#kS
zt~bOwbZ!1PppY+d-U*#84;9l-gWM6A=n;B$*9tvwwX<--%GU<ciG5!<I@K3mPwF+8
zP&jxD24g2bNbliB_GjZv;j!bKBWa0Z!Lm8?SiUIbRM8RUR^_bp{<Q4|e_ghet~Vyw
zD?6TA);VdCcRBj=1@eTjJtUH4tsgl*re+(GPUd2Be{S_hQ?BHUThTQ}LL&|s+-@uG
zhAgr>iCuBhUZwusD<9V46EI8Wyr}7*Z_KQt(XupinXSk!y>OOHD-?Cn?qN#%1KbJr
zMHjxrH4!iEYcw`QOnroAK_%S@zh*!+S-QmvEMFj3LquP<VJ=#XnqlsUcPVaH^ZC3{
z^=7aoLJp2K;#g7HKNFy2Nv}|`$WU;g@ddq}UM`dJOKSY!X-9u1V*()v*{}qqxs^b%
z2eDy&+imM41XC7ZfS}zC@%GqhWIG+K^Q@5};x5#PQ07ViwutSZ2VhOtKc<20LI`8M
og0ZffvxI@~gfI;N{;;7zo11OgyyVUU{xOsg&Pb=azlP%e0cn6tlmGw#

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1Load-members.html b/docs/structcutlass_1_1Load-members.html
index f977a3854..894aba6c7 100644
--- a/docs/structcutlass_1_1Load-members.html
+++ b/docs/structcutlass_1_1Load-members.html
@@ -73,18 +73,18 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt; Member List</div>  </div>
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load.html">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load.html">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">load</a>(AccessType &amp;dst, Scalar_ const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load.html">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7">load</a>(AccessType &amp;dst, Scalar_ const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Load.html b/docs/structcutlass_1_1Load.html
index e3640b254..856358b45 100644
--- a/docs/structcutlass_1_1Load.html
+++ b/docs/structcutlass_1_1Load.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,7 +77,7 @@ $(function() {
 <a href="#pub-static-methods">Static Public Member Functions</a> &#124;
 <a href="structcutlass_1_1Load-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::Load&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -85,27 +85,27 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:ad0bf2da0c240f3a2a3f4c92162d347ae"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, Lanes_ &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">AccessType</a></td></tr>
-<tr class="memdesc:ad0bf2da0c240f3a2a3f4c92162d347ae"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#ad0bf2da0c240f3a2a3f4c92162d347ae">More...</a><br /></td></tr>
-<tr class="separator:ad0bf2da0c240f3a2a3f4c92162d347ae"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad34e83ea01c482100c0557e23bc688f8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">AccessType</a></td></tr>
+<tr class="memdesc:ad34e83ea01c482100c0557e23bc688f8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#ad34e83ea01c482100c0557e23bc688f8">More...</a><br /></td></tr>
+<tr class="separator:ad34e83ea01c482100c0557e23bc688f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
 Static Public Member Functions</h2></td></tr>
-<tr class="memitem:ad033ebc1452d96b18913333bf7068140"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">load</a> (<a class="el" href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">AccessType</a> &amp;dst, Scalar_ const *pointer, int offset)</td></tr>
-<tr class="memdesc:ad033ebc1452d96b18913333bf7068140"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#ad033ebc1452d96b18913333bf7068140">More...</a><br /></td></tr>
-<tr class="separator:ad033ebc1452d96b18913333bf7068140"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0d13c39fdb813c3f043cdfaf0f1221a7"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load.html#a0d13c39fdb813c3f043cdfaf0f1221a7">load</a> (<a class="el" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">AccessType</a> &amp;dst, Scalar_ const *pointer, int offset)</td></tr>
+<tr class="memdesc:a0d13c39fdb813c3f043cdfaf0f1221a7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#a0d13c39fdb813c3f043cdfaf0f1221a7">More...</a><br /></td></tr>
+<tr class="separator:a0d13c39fdb813c3f043cdfaf0f1221a7"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="ad0bf2da0c240f3a2a3f4c92162d347ae"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad0bf2da0c240f3a2a3f4c92162d347ae">&#9670;&nbsp;</a></span>AccessType</h2>
+<a id="ad34e83ea01c482100c0557e23bc688f8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad34e83ea01c482100c0557e23bc688f8">&#9670;&nbsp;</a></span>AccessType</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ , int Lanes_, MemorySpace::Kind Memory_, bool  = (Lanes_ &gt; 1), size_t  = (sizeof(Scalar_) * Lanes_)&gt; </div>
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, FragmentElementType::Kind kFragmentElementType = FragmentElementType::kScalar, typename FragmentElement_  = Scalar_, int kStride = 1, size_t size = (sizeof(Scalar_) * kAccessSize)&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, Lanes_&gt;::Type <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;::<a class="el" href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">AccessType</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;::<a class="el" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">AccessType</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -113,21 +113,21 @@ template&lt;typename Scalar_ , int Lanes_, MemorySpace::Kind Memory_, bool  = (L
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="ad033ebc1452d96b18913333bf7068140"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad033ebc1452d96b18913333bf7068140">&#9670;&nbsp;</a></span>load()</h2>
+<a id="a0d13c39fdb813c3f043cdfaf0f1221a7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0d13c39fdb813c3f043cdfaf0f1221a7">&#9670;&nbsp;</a></span>load()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ , int Lanes_, MemorySpace::Kind Memory_, bool  = (Lanes_ &gt; 1), size_t  = (sizeof(Scalar_) * Lanes_)&gt; </div>
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, FragmentElementType::Kind kFragmentElementType = FragmentElementType::kScalar, typename FragmentElement_  = Scalar_, int kStride = 1, size_t size = (sizeof(Scalar_) * kAccessSize)&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">static CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;::load </td>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;::load </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Load.html#ad0bf2da0c240f3a2a3f4c92162d347ae">AccessType</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load.html#ad34e83ea01c482100c0557e23bc688f8">AccessType</a> &amp;&#160;</td>
           <td class="paramname"><em>dst</em>, </td>
         </tr>
         <tr>
@@ -163,7 +163,7 @@ template&lt;typename Scalar_ , int Lanes_, MemorySpace::Kind Memory_, bool  = (L
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html
new file mode 100644
index 000000000..78072035e
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf2952bcb62d20c76c595eac4c59f7239.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ab3f1d2f24c3aaec7690aae184b57bc59"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">AccessType</a></td></tr>
+<tr class="memdesc:ab3f1d2f24c3aaec7690aae184b57bc59"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#ab3f1d2f24c3aaec7690aae184b57bc59">More...</a><br /></td></tr>
+<tr class="separator:ab3f1d2f24c3aaec7690aae184b57bc59"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a2e906364a0631c2c9f97acd0ae4a1873"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#a2e906364a0631c2c9f97acd0ae4a1873">load</a> (<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">AccessType</a> &amp;dst, Scalar_ const *pointer, int offset)</td></tr>
+<tr class="memdesc:a2e906364a0631c2c9f97acd0ae4a1873"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#a2e906364a0631c2c9f97acd0ae4a1873">More...</a><br /></td></tr>
+<tr class="separator:a2e906364a0631c2c9f97acd0ae4a1873"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ab3f1d2f24c3aaec7690aae184b57bc59"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab3f1d2f24c3aaec7690aae184b57bc59">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 4 &gt;::<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a2e906364a0631c2c9f97acd0ae4a1873"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2e906364a0631c2c9f97acd0ae4a1873">&#9670;&nbsp;</a></span>load()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 4 &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>dst</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ const *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html
new file mode 100644
index 000000000..11d007169
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS966cdf9ba449f056a92458bf87878053.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a379269fb6baf7f5e5a1c3173ed048064"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">AccessType</a></td></tr>
+<tr class="memdesc:a379269fb6baf7f5e5a1c3173ed048064"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a379269fb6baf7f5e5a1c3173ed048064">More...</a><br /></td></tr>
+<tr class="separator:a379269fb6baf7f5e5a1c3173ed048064"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a7d3d3e156dc527f9c00acc7a66d21326"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a7d3d3e156dc527f9c00acc7a66d21326">load</a> (<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">AccessType</a> &amp;dst, Scalar_ const *pointer, int offset)</td></tr>
+<tr class="memdesc:a7d3d3e156dc527f9c00acc7a66d21326"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#a7d3d3e156dc527f9c00acc7a66d21326">More...</a><br /></td></tr>
+<tr class="separator:a7d3d3e156dc527f9c00acc7a66d21326"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a379269fb6baf7f5e5a1c3173ed048064"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a379269fb6baf7f5e5a1c3173ed048064">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 16 &gt;::<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a7d3d3e156dc527f9c00acc7a66d21326"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7d3d3e156dc527f9c00acc7a66d21326">&#9670;&nbsp;</a></span>load()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 16 &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>dst</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ const *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS840de374cd1e3ee3a4aa6a70a9fa83d1.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS840de374cd1e3ee3a4aa6a70a9fa83d1.html
new file mode 100644
index 000000000..37f16cddf
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS840de374cd1e3ee3a4aa6a70a9fa83d1.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#afee69b86f070e3badc75ab00bcc5996b">load</a>(AccessType &amp;dst, Scalar_ const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html
new file mode 100644
index 000000000..ea576ee8b
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS840de374cd1e3ee3a4aa6a70a9fa83d1.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a7eab78b09f87ca0ee3646eec4fd91b78"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">AccessType</a></td></tr>
+<tr class="memdesc:a7eab78b09f87ca0ee3646eec4fd91b78"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a7eab78b09f87ca0ee3646eec4fd91b78">More...</a><br /></td></tr>
+<tr class="separator:a7eab78b09f87ca0ee3646eec4fd91b78"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:afee69b86f070e3badc75ab00bcc5996b"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#afee69b86f070e3badc75ab00bcc5996b">load</a> (<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">AccessType</a> &amp;dst, Scalar_ const *pointer, int offset)</td></tr>
+<tr class="memdesc:afee69b86f070e3badc75ab00bcc5996b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#afee69b86f070e3badc75ab00bcc5996b">More...</a><br /></td></tr>
+<tr class="separator:afee69b86f070e3badc75ab00bcc5996b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a7eab78b09f87ca0ee3646eec4fd91b78"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7eab78b09f87ca0ee3646eec4fd91b78">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 8 &gt;::<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="afee69b86f070e3badc75ab00bcc5996b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afee69b86f070e3badc75ab00bcc5996b">&#9670;&nbsp;</a></span>load()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 8 &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS91ff65dd36f118bca4542df6128d6d99.html#a7eab78b09f87ca0ee3646eec4fd91b78">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>dst</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ const *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS966cdf9ba449f056a92458bf87878053.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS966cdf9ba449f056a92458bf87878053.html
new file mode 100644
index 000000000..e147efbb5
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS966cdf9ba449f056a92458bf87878053.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a379269fb6baf7f5e5a1c3173ed048064">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html#a7d3d3e156dc527f9c00acc7a66d21326">load</a>(AccessType &amp;dst, Scalar_ const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS3de71ba9ef724a37fb1cf315da8bf9b5.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSc8e65d97c8f615e98ac2e03f0bcd236e.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSc8e65d97c8f615e98ac2e03f0bcd236e.html
new file mode 100644
index 000000000..897679563
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSc8e65d97c8f615e98ac2e03f0bcd236e.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a4bab8959d29ee868fb6b3e1f9abc04fc">load</a>(AccessType &amp;dst, Scalar_ const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html
new file mode 100644
index 000000000..b40fdf836
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html
@@ -0,0 +1,174 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSc8e65d97c8f615e98ac2e03f0bcd236e.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Partial specialization for 16b loads.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a33f5160c8c038680ba2fe4c98cf036b0"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">AccessType</a></td></tr>
+<tr class="memdesc:a33f5160c8c038680ba2fe4c98cf036b0"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a33f5160c8c038680ba2fe4c98cf036b0">More...</a><br /></td></tr>
+<tr class="separator:a33f5160c8c038680ba2fe4c98cf036b0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a4bab8959d29ee868fb6b3e1f9abc04fc"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a4bab8959d29ee868fb6b3e1f9abc04fc">load</a> (<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">AccessType</a> &amp;dst, Scalar_ const *pointer, int offset)</td></tr>
+<tr class="memdesc:a4bab8959d29ee868fb6b3e1f9abc04fc"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#a4bab8959d29ee868fb6b3e1f9abc04fc">More...</a><br /></td></tr>
+<tr class="separator:a4bab8959d29ee868fb6b3e1f9abc04fc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a33f5160c8c038680ba2fe4c98cf036b0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a33f5160c8c038680ba2fe4c98cf036b0">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, 1, 2 &gt;::<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a4bab8959d29ee868fb6b3e1f9abc04fc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4bab8959d29ee868fb6b3e1f9abc04fc">&#9670;&nbsp;</a></span>load()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, 1, 2 &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf1f63874ddc1302ed9e60e0478e1a8ad.html#a33f5160c8c038680ba2fe4c98cf036b0">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>dst</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ const *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf2952bcb62d20c76c595eac4c59f7239.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf2952bcb62d20c76c595eac4c59f7239.html
new file mode 100644
index 000000000..4f69e6d52
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kSf2952bcb62d20c76c595eac4c59f7239.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#ab3f1d2f24c3aaec7690aae184b57bc59">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html#a2e906364a0631c2c9f97acd0ae4a1873">load</a>(AccessType &amp;dst, Scalar_ const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kS1b28106546bd22002cd52e60197548ce.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kW847237836867f08e1121b00b7e44d8ae.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kW847237836867f08e1121b00b7e44d8ae.html
new file mode 100644
index 000000000..9436b3d55
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kW847237836867f08e1121b00b7e44d8ae.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a854c684b3f6c1a10b6e8fcf7967f6642">load</a>(AccessType &amp;value, Scalar_ const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html
new file mode 100644
index 000000000..9d5dad43c
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html">Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kW847237836867f08e1121b00b7e44d8ae.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a1aa08c9c7424ba4f998d7445ba83eaab"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">AccessType</a></td></tr>
+<tr class="memdesc:a1aa08c9c7424ba4f998d7445ba83eaab"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a1aa08c9c7424ba4f998d7445ba83eaab">More...</a><br /></td></tr>
+<tr class="separator:a1aa08c9c7424ba4f998d7445ba83eaab"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a854c684b3f6c1a10b6e8fcf7967f6642"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a854c684b3f6c1a10b6e8fcf7967f6642">load</a> (<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">AccessType</a> &amp;value, Scalar_ const *pointer, int offset)</td></tr>
+<tr class="memdesc:a854c684b3f6c1a10b6e8fcf7967f6642"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#a854c684b3f6c1a10b6e8fcf7967f6642">More...</a><br /></td></tr>
+<tr class="separator:a854c684b3f6c1a10b6e8fcf7967f6642"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a1aa08c9c7424ba4f998d7445ba83eaab"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1aa08c9c7424ba4f998d7445ba83eaab">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef FragmentElement_ <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::<a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a854c684b3f6c1a10b6e8fcf7967f6642"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a854c684b3f6c1a10b6e8fcf7967f6642">&#9670;&nbsp;</a></span>load()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kWe58d0048e24352beeec002fd483c53b2.html#a1aa08c9c7424ba4f998d7445ba83eaab">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ const *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fr16ad55dd7bca84e6a7fc608c26eee889.html b/docs/structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fr16ad55dd7bca84e6a7fc608c26eee889.html
new file mode 100644
index 000000000..876561418
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fr16ad55dd7bca84e6a7fc608c26eee889.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html">Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#a619f643794f51b35f3c0a1011ba00bbd">load</a>(AccessType &amp;value, Vector&lt; bin1_t, 32 &gt; const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html b/docs/structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html
new file mode 100644
index 000000000..e44efecea
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html">Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fr16ad55dd7bca84e6a7fc608c26eee889.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Vector&lt; bin1_t, 32 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ae5df4a17f7f946534cfe7cdbd325e301"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">AccessType</a></td></tr>
+<tr class="memdesc:ae5df4a17f7f946534cfe7cdbd325e301"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#ae5df4a17f7f946534cfe7cdbd325e301">More...</a><br /></td></tr>
+<tr class="separator:ae5df4a17f7f946534cfe7cdbd325e301"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a619f643794f51b35f3c0a1011ba00bbd"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#a619f643794f51b35f3c0a1011ba00bbd">load</a> (<a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">AccessType</a> &amp;value, <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, 32 &gt; const *pointer, int offset)</td></tr>
+<tr class="memdesc:a619f643794f51b35f3c0a1011ba00bbd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#a619f643794f51b35f3c0a1011ba00bbd">More...</a><br /></td></tr>
+<tr class="separator:a619f643794f51b35f3c0a1011ba00bbd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ae5df4a17f7f946534cfe7cdbd325e301"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae5df4a17f7f946534cfe7cdbd325e301">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef FragmentElement_ <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, 32 &gt;, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::<a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a619f643794f51b35f3c0a1011ba00bbd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a619f643794f51b35f3c0a1011ba00bbd">&#9670;&nbsp;</a></span>load()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, 32 &gt;, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kAccessSize_00_01Memory___00_01Fra240d9c28383cd3945277ec3a927c538.html#ae5df4a17f7f946534cfe7cdbd325e301">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, 32 &gt; const *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra03475418f27732d726d18feb23feeed2.html b/docs/structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra03475418f27732d726d18feb23feeed2.html
new file mode 100644
index 000000000..4ddb71a67
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra03475418f27732d726d18feb23feeed2.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html">Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#abc4f879290c847a6e73dc9e68a340f74">load</a>(AccessType &amp;value, Vector&lt; int4_t, 8 &gt; const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html b/docs/structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html
new file mode 100644
index 000000000..6ff5e6eac
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html">Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra03475418f27732d726d18feb23feeed2.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Vector&lt; int4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a2265e1ad87bc6fd227f0a83e7043c87a"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">AccessType</a></td></tr>
+<tr class="memdesc:a2265e1ad87bc6fd227f0a83e7043c87a"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a2265e1ad87bc6fd227f0a83e7043c87a">More...</a><br /></td></tr>
+<tr class="separator:a2265e1ad87bc6fd227f0a83e7043c87a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:abc4f879290c847a6e73dc9e68a340f74"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#abc4f879290c847a6e73dc9e68a340f74">load</a> (<a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">AccessType</a> &amp;value, <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, 8 &gt; const *pointer, int offset)</td></tr>
+<tr class="memdesc:abc4f879290c847a6e73dc9e68a340f74"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#abc4f879290c847a6e73dc9e68a340f74">More...</a><br /></td></tr>
+<tr class="separator:abc4f879290c847a6e73dc9e68a340f74"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a2265e1ad87bc6fd227f0a83e7043c87a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2265e1ad87bc6fd227f0a83e7043c87a">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef FragmentElement_ <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, 8 &gt;, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::<a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="abc4f879290c847a6e73dc9e68a340f74"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abc4f879290c847a6e73dc9e68a340f74">&#9670;&nbsp;</a></span>load()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, 8 &gt;, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01int4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fra934529165fa8fecdd392b5302d25ef26.html#a2265e1ad87bc6fd227f0a83e7043c87a">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, 8 &gt; const *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html b/docs/structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html
new file mode 100644
index 000000000..f6e7b108a
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html">Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Frc8b0aa6ddd9b4317158c26574a6881de.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ae82bca88b6dcca352bfb45d5789d9ce9"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">AccessType</a></td></tr>
+<tr class="memdesc:ae82bca88b6dcca352bfb45d5789d9ce9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#ae82bca88b6dcca352bfb45d5789d9ce9">More...</a><br /></td></tr>
+<tr class="separator:ae82bca88b6dcca352bfb45d5789d9ce9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:af587adae1103b4242e0d56eb902f9302"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#af587adae1103b4242e0d56eb902f9302">load</a> (<a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">AccessType</a> &amp;value, <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, 8 &gt; const *pointer, int offset)</td></tr>
+<tr class="memdesc:af587adae1103b4242e0d56eb902f9302"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#af587adae1103b4242e0d56eb902f9302">More...</a><br /></td></tr>
+<tr class="separator:af587adae1103b4242e0d56eb902f9302"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ae82bca88b6dcca352bfb45d5789d9ce9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae82bca88b6dcca352bfb45d5789d9ce9">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef FragmentElement_ <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, 8 &gt;, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::<a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="af587adae1103b4242e0d56eb902f9302"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af587adae1103b4242e0d56eb902f9302">&#9670;&nbsp;</a></span>load()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, 8 &gt;, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, 8 &gt; const *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Frc8b0aa6ddd9b4317158c26574a6881de.html b/docs/structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Frc8b0aa6ddd9b4317158c26574a6881de.html
new file mode 100644
index 000000000..b5f9c24ac
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Frc8b0aa6ddd9b4317158c26574a6881de.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html">Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#ae82bca88b6dcca352bfb45d5789d9ce9">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html#af587adae1103b4242e0d56eb902f9302">load</a>(AccessType &amp;value, Vector&lt; uint4_t, 8 &gt; const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01Vector_3_01uint4__t_00_018_01_4_00_01kAccessSize_00_01Memory___00_01Fr23088b868c6eeec9377c46892553686f.html">cutlass::Load&lt; Vector&lt; uint4_t, 8 &gt;, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01d9e675253ca19588f1ae4bd898579523f.html b/docs/structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01d9e675253ca19588f1ae4bd898579523f.html
new file mode 100644
index 000000000..c89be5a6f
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01d9e675253ca19588f1ae4bd898579523f.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html">Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a7d9027453aa78d4448d70dc44307791e">load</a>(AccessType &amp;dst, double const *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html b/docs/structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html
new file mode 100644
index 000000000..1e361ce51
--- /dev/null
+++ b/docs/structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html">Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01d9e675253ca19588f1ae4bd898579523f.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Load&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a925ca73bca88c8a1835061cc1391ae57"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; double, 2 &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">AccessType</a></td></tr>
+<tr class="memdesc:a925ca73bca88c8a1835061cc1391ae57"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a925ca73bca88c8a1835061cc1391ae57">More...</a><br /></td></tr>
+<tr class="separator:a925ca73bca88c8a1835061cc1391ae57"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a7d9027453aa78d4448d70dc44307791e"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a7d9027453aa78d4448d70dc44307791e">load</a> (<a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">AccessType</a> &amp;dst, double const *pointer, int offset)</td></tr>
+<tr class="memdesc:a7d9027453aa78d4448d70dc44307791e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load function.  <a href="#a7d9027453aa78d4448d70dc44307791e">More...</a><br /></td></tr>
+<tr class="separator:a7d9027453aa78d4448d70dc44307791e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a925ca73bca88c8a1835061cc1391ae57"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a925ca73bca88c8a1835061cc1391ae57">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;MemorySpace::Kind Memory_, int kStride&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;double, 2&gt;::Type <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; double, 2, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, double, kStride, 16 &gt;::<a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a7d9027453aa78d4448d70dc44307791e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7d9027453aa78d4448d70dc44307791e">&#9670;&nbsp;</a></span>load()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;MemorySpace::Kind Memory_, int kStride&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Load.html">cutlass::Load</a>&lt; double, 2, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, double, kStride, 16 &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Load_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_01double_00_01kStride_00_0116_01_4.html#a925ca73bca88c8a1835061cc1391ae57">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>dst</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">double const *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixCoord-members.html b/docs/structcutlass_1_1MatrixCoord-members.html
new file mode 100644
index 000000000..c1e673903
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixCoord-members.html
@@ -0,0 +1,140 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::MatrixCoord Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">at</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">at</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">at</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a>(Coord&lt; kRank &gt; const &amp;max, Coord&lt; kRank &gt; const &amp;min=Coord&lt; kRank &gt;())</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a093f5e568a81c6464dbf4aef996c32ba">column</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">Coord</a>(Index value=0)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">Coord</a>(Index _idx[])</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">Coord</a>(Coord&lt; kRank &gt; const &amp;coord)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">count</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">dot</a>(Coord const &amp;b, T sum) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">dot</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a1e096b25138e027c31ea8624729ec433">kColumn</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a5149f4a37407746407251efc0779bb53">kRow</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">MatrixCoord</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a64bddbf8238dc937a01a140722f7f39c">MatrixCoord</a>(Coord&lt; 2, Index &gt; const &amp;coord)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#ac77b18e67be18cfdfe1935939e7f2017">MatrixCoord</a>(Index row, Index column)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">N</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">operator bool</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">operator!=</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#ac68a57c17811b0a04dc6fb21423ab226">operator*</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">Coord&lt; 2, int &gt;::operator*</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a5fd3c3b58af1147a5c73657c05a16f5b">operator*=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">Coord&lt; 2, int &gt;::operator*=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a25236953237f965965b1c9b7a04ba26e">operator+</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">Coord&lt; 2, int &gt;::operator+</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#ad105615dbf7ede75caa0e778c873bd06">operator+=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">Coord&lt; 2, int &gt;::operator+=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#aa462303d75a5d98b680b6e20080ce877">operator-</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">Coord&lt; 2, int &gt;::operator-</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a6feef48cf24733d22ca53a27cbc33ac0">operator-=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">Coord&lt; 2, int &gt;::operator-=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#aa89b196410d25d8c9ed3746fb6833374">operator/</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">Coord&lt; 2, int &gt;::operator/</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#aab345c8ddb8048bfe3d667bc7ce6522f">operator/=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">Coord&lt; 2, int &gt;::operator/=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">operator&lt;</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">operator&lt;=</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">operator==</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">operator[]</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">operator[]</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html#a67f3102e51abad1205e8a3450e7a6c7e">row</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixCoord.html">cutlass::MatrixCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a>(int start=0, Index identity=0) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixCoord.html b/docs/structcutlass_1_1MatrixCoord.html
new file mode 100644
index 000000000..ca323c47b
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixCoord.html
@@ -0,0 +1,748 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::MatrixCoord Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1MatrixCoord-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::MatrixCoord Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::MatrixCoord:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1MatrixCoord.png" usemap="#cutlass::MatrixCoord_map" alt=""/>
+  <map id="cutlass::MatrixCoord_map" name="cutlass::MatrixCoord_map">
+<area href="structcutlass_1_1Coord.html" alt="cutlass::Coord&lt; 2, int &gt;" shape="rect" coords="0,0,145,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a33eea222c3dcaf22cf62502e41afb24f"><td class="memItemLeft" align="right" valign="top">typedef int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a></td></tr>
+<tr class="memdesc:a33eea222c3dcaf22cf62502e41afb24f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Integer-valued index.  <a href="#a33eea222c3dcaf22cf62502e41afb24f">More...</a><br /></td></tr>
+<tr class="separator:a33eea222c3dcaf22cf62502e41afb24f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07f7e0ff4347aa6d75a5b3a63676d51d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 2, <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a></td></tr>
+<tr class="memdesc:a07f7e0ff4347aa6d75a5b3a63676d51d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base type is a <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> of rank=2.  <a href="#a07f7e0ff4347aa6d75a5b3a63676d51d">More...</a><br /></td></tr>
+<tr class="separator:a07f7e0ff4347aa6d75a5b3a63676d51d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td></tr>
+<tr class="memitem:a7c73966e94b4f45854f16e33683bc02c inherit pub_types_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top">typedef int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a></td></tr>
+<tr class="memdesc:a7c73966e94b4f45854f16e33683bc02c inherit pub_types_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type used to store elements.  <a href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">More...</a><br /></td></tr>
+<tr class="separator:a7c73966e94b4f45854f16e33683bc02c inherit pub_types_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a36a8a680a466b55325eb0c0cb9fc29c6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a36a8a680a466b55325eb0c0cb9fc29c6">MatrixCoord</a> ()</td></tr>
+<tr class="memdesc:a36a8a680a466b55325eb0c0cb9fc29c6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor.  <a href="#a36a8a680a466b55325eb0c0cb9fc29c6">More...</a><br /></td></tr>
+<tr class="separator:a36a8a680a466b55325eb0c0cb9fc29c6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64bddbf8238dc937a01a140722f7f39c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a64bddbf8238dc937a01a140722f7f39c">MatrixCoord</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 2, <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> &gt; const &amp;coord)</td></tr>
+<tr class="memdesc:a64bddbf8238dc937a01a140722f7f39c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from Coord&lt;2&gt;  <a href="#a64bddbf8238dc937a01a140722f7f39c">More...</a><br /></td></tr>
+<tr class="separator:a64bddbf8238dc937a01a140722f7f39c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac77b18e67be18cfdfe1935939e7f2017"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#ac77b18e67be18cfdfe1935939e7f2017">MatrixCoord</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a>, <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a>)</td></tr>
+<tr class="memdesc:ac77b18e67be18cfdfe1935939e7f2017"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct from a row and column.  <a href="#ac77b18e67be18cfdfe1935939e7f2017">More...</a><br /></td></tr>
+<tr class="separator:ac77b18e67be18cfdfe1935939e7f2017"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a525949dd8a6b631e755511764848e546"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a525949dd8a6b631e755511764848e546">row</a> () const</td></tr>
+<tr class="memdesc:a525949dd8a6b631e755511764848e546"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the row of the coordinate.  <a href="#a525949dd8a6b631e755511764848e546">More...</a><br /></td></tr>
+<tr class="separator:a525949dd8a6b631e755511764848e546"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a67f3102e51abad1205e8a3450e7a6c7e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a67f3102e51abad1205e8a3450e7a6c7e">row</a> ()</td></tr>
+<tr class="memdesc:a67f3102e51abad1205e8a3450e7a6c7e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the row of the coordinate.  <a href="#a67f3102e51abad1205e8a3450e7a6c7e">More...</a><br /></td></tr>
+<tr class="separator:a67f3102e51abad1205e8a3450e7a6c7e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6a34cc85c9816263982e6253fe02abf9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a6a34cc85c9816263982e6253fe02abf9">column</a> () const</td></tr>
+<tr class="memdesc:a6a34cc85c9816263982e6253fe02abf9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the column of the coordinate.  <a href="#a6a34cc85c9816263982e6253fe02abf9">More...</a><br /></td></tr>
+<tr class="separator:a6a34cc85c9816263982e6253fe02abf9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a093f5e568a81c6464dbf4aef996c32ba"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a093f5e568a81c6464dbf4aef996c32ba">column</a> ()</td></tr>
+<tr class="memdesc:a093f5e568a81c6464dbf4aef996c32ba"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the column of the coordinate.  <a href="#a093f5e568a81c6464dbf4aef996c32ba">More...</a><br /></td></tr>
+<tr class="separator:a093f5e568a81c6464dbf4aef996c32ba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a25236953237f965965b1c9b7a04ba26e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a25236953237f965965b1c9b7a04ba26e">operator+</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a25236953237f965965b1c9b7a04ba26e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise addition.  <a href="#a25236953237f965965b1c9b7a04ba26e">More...</a><br /></td></tr>
+<tr class="separator:a25236953237f965965b1c9b7a04ba26e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa462303d75a5d98b680b6e20080ce877"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#aa462303d75a5d98b680b6e20080ce877">operator-</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:aa462303d75a5d98b680b6e20080ce877"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise subtraction.  <a href="#aa462303d75a5d98b680b6e20080ce877">More...</a><br /></td></tr>
+<tr class="separator:aa462303d75a5d98b680b6e20080ce877"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac68a57c17811b0a04dc6fb21423ab226"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#ac68a57c17811b0a04dc6fb21423ab226">operator*</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:ac68a57c17811b0a04dc6fb21423ab226"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise multiplication.  <a href="#ac68a57c17811b0a04dc6fb21423ab226">More...</a><br /></td></tr>
+<tr class="separator:ac68a57c17811b0a04dc6fb21423ab226"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa89b196410d25d8c9ed3746fb6833374"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#aa89b196410d25d8c9ed3746fb6833374">operator/</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:aa89b196410d25d8c9ed3746fb6833374"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise division.  <a href="#aa89b196410d25d8c9ed3746fb6833374">More...</a><br /></td></tr>
+<tr class="separator:aa89b196410d25d8c9ed3746fb6833374"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad105615dbf7ede75caa0e778c873bd06"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#ad105615dbf7ede75caa0e778c873bd06">operator+=</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:ad105615dbf7ede75caa0e778c873bd06"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place addition.  <a href="#ad105615dbf7ede75caa0e778c873bd06">More...</a><br /></td></tr>
+<tr class="separator:ad105615dbf7ede75caa0e778c873bd06"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6feef48cf24733d22ca53a27cbc33ac0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a6feef48cf24733d22ca53a27cbc33ac0">operator-=</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:a6feef48cf24733d22ca53a27cbc33ac0"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place subtraction.  <a href="#a6feef48cf24733d22ca53a27cbc33ac0">More...</a><br /></td></tr>
+<tr class="separator:a6feef48cf24733d22ca53a27cbc33ac0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5fd3c3b58af1147a5c73657c05a16f5b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a5fd3c3b58af1147a5c73657c05a16f5b">operator*=</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:a5fd3c3b58af1147a5c73657c05a16f5b"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place multiplication.  <a href="#a5fd3c3b58af1147a5c73657c05a16f5b">More...</a><br /></td></tr>
+<tr class="separator:a5fd3c3b58af1147a5c73657c05a16f5b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aab345c8ddb8048bfe3d667bc7ce6522f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#aab345c8ddb8048bfe3d667bc7ce6522f">operator/=</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:aab345c8ddb8048bfe3d667bc7ce6522f"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place division.  <a href="#aab345c8ddb8048bfe3d667bc7ce6522f">More...</a><br /></td></tr>
+<tr class="separator:aab345c8ddb8048bfe3d667bc7ce6522f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td></tr>
+<tr class="memitem:a422aa7e2d2bf5dd3a60f65427bc0d7c0 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> value=0)</td></tr>
+<tr class="memdesc:a422aa7e2d2bf5dd3a60f65427bc0d7c0 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor initializes uniformly.  <a href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">More...</a><br /></td></tr>
+<tr class="separator:a422aa7e2d2bf5dd3a60f65427bc0d7c0 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a63ad1225ab2c51a68add731e994526b4 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> _idx[])</td></tr>
+<tr class="memdesc:a63ad1225ab2c51a68add731e994526b4 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of integers.  <a href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">More...</a><br /></td></tr>
+<tr class="separator:a63ad1225ab2c51a68add731e994526b4 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6110e4cfd090561696a81a8a4068a573 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;coord)</td></tr>
+<tr class="memdesc:a6110e4cfd090561696a81a8a4068a573 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of integers.  <a href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">More...</a><br /></td></tr>
+<tr class="separator:a6110e4cfd090561696a81a8a4068a573 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac8f7a9b0835efc34fd28894b2b45342c inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Slice &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a> (int start=0, <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> identity=0) const</td></tr>
+<tr class="separator:ac8f7a9b0835efc34fd28894b2b45342c inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1781b3c5a2d653b0c1718ec3154ae48f inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">operator bool</a> () const</td></tr>
+<tr class="memdesc:a1781b3c5a2d653b0c1718ec3154ae48f inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if Coord is non-zero.  <a href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">More...</a><br /></td></tr>
+<tr class="separator:a1781b3c5a2d653b0c1718ec3154ae48f inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a232095edae2f74c01a3c8abf68166e02 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a> () const</td></tr>
+<tr class="memdesc:a232095edae2f74c01a3c8abf68166e02 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if Coord is uniformly zero.  <a href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">More...</a><br /></td></tr>
+<tr class="separator:a232095edae2f74c01a3c8abf68166e02 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37672637771a70910df9aa1a0cffddc inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">operator+</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:ab37672637771a70910df9aa1a0cffddc inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise addition.  <a href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">More...</a><br /></td></tr>
+<tr class="separator:ab37672637771a70910df9aa1a0cffddc inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6b876f61a85a4a4ef3763b6742bfaa6b inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">operator-</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a6b876f61a85a4a4ef3763b6742bfaa6b inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise subtraction.  <a href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">More...</a><br /></td></tr>
+<tr class="separator:a6b876f61a85a4a4ef3763b6742bfaa6b inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e94c093f82908ff3dba4f23b5d10033 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">operator*</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a2e94c093f82908ff3dba4f23b5d10033 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise multiplication.  <a href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">More...</a><br /></td></tr>
+<tr class="separator:a2e94c093f82908ff3dba4f23b5d10033 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9bb07631f09efc80219413ac8309f568 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">operator/</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a9bb07631f09efc80219413ac8309f568 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise division.  <a href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">More...</a><br /></td></tr>
+<tr class="separator:a9bb07631f09efc80219413ac8309f568 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae4f2cb12b84411118cb93e7c4cb88b20 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ae4f2cb12b84411118cb93e7c4cb88b20 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place addition.  <a href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">More...</a><br /></td></tr>
+<tr class="separator:ae4f2cb12b84411118cb93e7c4cb88b20 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a304334cbcad636d7b058fdc6310f0e6b inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">operator-=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a304334cbcad636d7b058fdc6310f0e6b inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place subtraction.  <a href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">More...</a><br /></td></tr>
+<tr class="separator:a304334cbcad636d7b058fdc6310f0e6b inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad4303b578b72b5cb2a0198375290e168 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">operator*=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ad4303b578b72b5cb2a0198375290e168 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place multiplication.  <a href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">More...</a><br /></td></tr>
+<tr class="separator:ad4303b578b72b5cb2a0198375290e168 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac87199c4c9a4e20aac4eb6e3b9a68f28 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">operator/=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ac87199c4c9a4e20aac4eb6e3b9a68f28 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place division.  <a href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">More...</a><br /></td></tr>
+<tr class="separator:ac87199c4c9a4e20aac4eb6e3b9a68f28 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6e0967541a1d74edeb93897ea6069e24 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">operator[]</a> (int dim)</td></tr>
+<tr class="memdesc:a6e0967541a1d74edeb93897ea6069e24 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">More...</a><br /></td></tr>
+<tr class="separator:a6e0967541a1d74edeb93897ea6069e24 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a882e7ac07bbd6983659ef2e574b46454 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">operator[]</a> (int dim) const</td></tr>
+<tr class="memdesc:a882e7ac07bbd6983659ef2e574b46454 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">More...</a><br /></td></tr>
+<tr class="separator:a882e7ac07bbd6983659ef2e574b46454 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac8ec94703830ab2c62ee055533ea2184 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b, T sum) const</td></tr>
+<tr class="memdesc:ac8ec94703830ab2c62ee055533ea2184 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two Coord instances.  <a href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">More...</a><br /></td></tr>
+<tr class="separator:ac8ec94703830ab2c62ee055533ea2184 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0acc37908acb6b879c37f54ff7ffc93d inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a0acc37908acb6b879c37f54ff7ffc93d inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two Coord instances.  <a href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">More...</a><br /></td></tr>
+<tr class="separator:a0acc37908acb6b879c37f54ff7ffc93d inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9eff24a3b74b68d11839b92324613c93 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a> ()</td></tr>
+<tr class="memdesc:a9eff24a3b74b68d11839b92324613c93 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given Coord element.  <a href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">More...</a><br /></td></tr>
+<tr class="separator:a9eff24a3b74b68d11839b92324613c93 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa253bf69fc819876a7c7770305f1a694 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">at</a> (int dim)</td></tr>
+<tr class="memdesc:aa253bf69fc819876a7c7770305f1a694 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">More...</a><br /></td></tr>
+<tr class="separator:aa253bf69fc819876a7c7770305f1a694 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a177adcc2d0fb5e72ebcb523edd24e6fe inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">at</a> () const</td></tr>
+<tr class="memdesc:a177adcc2d0fb5e72ebcb523edd24e6fe inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given Coord element.  <a href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">More...</a><br /></td></tr>
+<tr class="separator:a177adcc2d0fb5e72ebcb523edd24e6fe inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b47b1521820c898b03868627c3f8e46 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">at</a> (int dim) const</td></tr>
+<tr class="memdesc:a9b47b1521820c898b03868627c3f8e46 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">More...</a><br /></td></tr>
+<tr class="separator:a9b47b1521820c898b03868627c3f8e46 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f919aeb2a895bc040599971400dec8d inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">operator==</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a7f919aeb2a895bc040599971400dec8d inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Determines if two Coord&lt;&gt; objects are equal.  <a href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">More...</a><br /></td></tr>
+<tr class="separator:a7f919aeb2a895bc040599971400dec8d inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a353d847675e5ba2402c407dcd4ae4de3 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">operator!=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a353d847675e5ba2402c407dcd4ae4de3 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Not equal.  <a href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">More...</a><br /></td></tr>
+<tr class="separator:a353d847675e5ba2402c407dcd4ae4de3 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a404a3b4e00f59cac71d41fb1bbba38ba inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;max, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;min=<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt;())</td></tr>
+<tr class="memdesc:a404a3b4e00f59cac71d41fb1bbba38ba inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clamps a coordinate to a range specified by maximum and minimum values.  <a href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">More...</a><br /></td></tr>
+<tr class="separator:a404a3b4e00f59cac71d41fb1bbba38ba inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac0ac5f2aa2cbea3887d126645025e017 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">count</a> () const</td></tr>
+<tr class="memdesc:ac0ac5f2aa2cbea3887d126645025e017 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the product of all elements.  <a href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">More...</a><br /></td></tr>
+<tr class="separator:ac0ac5f2aa2cbea3887d126645025e017 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a148851df63840ac63e23b2f170bd1308 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">operator&lt;</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a148851df63840ac63e23b2f170bd1308 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Less than operator.  <a href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">More...</a><br /></td></tr>
+<tr class="separator:a148851df63840ac63e23b2f170bd1308 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dc9f063be329d475f040afd449d304c inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">operator&lt;=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a9dc9f063be329d475f040afd449d304c inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Less than or equals operator.  <a href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">More...</a><br /></td></tr>
+<tr class="separator:a9dc9f063be329d475f040afd449d304c inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a5149f4a37407746407251efc0779bb53"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a5149f4a37407746407251efc0779bb53">kRow</a> = 0</td></tr>
+<tr class="memdesc:a5149f4a37407746407251efc0779bb53"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rows dimension.  <a href="#a5149f4a37407746407251efc0779bb53">More...</a><br /></td></tr>
+<tr class="separator:a5149f4a37407746407251efc0779bb53"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e096b25138e027c31ea8624729ec433"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixCoord.html#a1e096b25138e027c31ea8624729ec433">kColumn</a> = 1</td></tr>
+<tr class="memdesc:a1e096b25138e027c31ea8624729ec433"><td class="mdescLeft">&#160;</td><td class="mdescRight">Columns dimension.  <a href="#a1e096b25138e027c31ea8624729ec433">More...</a><br /></td></tr>
+<tr class="separator:a1e096b25138e027c31ea8624729ec433"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td></tr>
+<tr class="memitem:a23e1b9a7f5fa8fd4afeadfb85de7c5c3 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a></td></tr>
+<tr class="memdesc:a23e1b9a7f5fa8fd4afeadfb85de7c5c3 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of elements in Coord.  <a href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">More...</a><br /></td></tr>
+<tr class="separator:a23e1b9a7f5fa8fd4afeadfb85de7c5c3 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acfd416eafec51e47b42b8b713ba76030 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">N</a></td></tr>
+<tr class="memdesc:acfd416eafec51e47b42b8b713ba76030 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of elements in Coord, aliased for compatibility.  <a href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">More...</a><br /></td></tr>
+<tr class="separator:acfd416eafec51e47b42b8b713ba76030 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 2, int &gt;</a></td></tr>
+<tr class="memitem:a872e1e0d9cc255fa438c04daaf10ad68 inherit pub_attribs_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a> [<a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>]</td></tr>
+<tr class="memdesc:a872e1e0d9cc255fa438c04daaf10ad68 inherit pub_attribs_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Indices.  <a href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">More...</a><br /></td></tr>
+<tr class="separator:a872e1e0d9cc255fa438c04daaf10ad68 inherit pub_attribs_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><p><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> wraps <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;2, int&gt;</a> to provide a helper for accessing named dimensions. Classes expecting a coordinate in the rank=2 index space of a matrix should use <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>. </p>
+</div><h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a07f7e0ff4347aa6d75a5b3a63676d51d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a07f7e0ff4347aa6d75a5b3a63676d51d">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;2, <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a>&gt; <a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">cutlass::MatrixCoord::Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a33eea222c3dcaf22cf62502e41afb24f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a33eea222c3dcaf22cf62502e41afb24f">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef int <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">cutlass::MatrixCoord::Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a36a8a680a466b55325eb0c0cb9fc29c6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a36a8a680a466b55325eb0c0cb9fc29c6">&#9670;&nbsp;</a></span>MatrixCoord() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::MatrixCoord::MatrixCoord </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a64bddbf8238dc937a01a140722f7f39c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a64bddbf8238dc937a01a140722f7f39c">&#9670;&nbsp;</a></span>MatrixCoord() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::MatrixCoord::MatrixCoord </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 2, <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac77b18e67be18cfdfe1935939e7f2017"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac77b18e67be18cfdfe1935939e7f2017">&#9670;&nbsp;</a></span>MatrixCoord() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::MatrixCoord::MatrixCoord </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a>&#160;</td>
+          <td class="paramname"><em>row</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a>&#160;</td>
+          <td class="paramname"><em>column</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a6a34cc85c9816263982e6253fe02abf9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6a34cc85c9816263982e6253fe02abf9">&#9670;&nbsp;</a></span>column() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> const&amp; cutlass::MatrixCoord::column </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a093f5e568a81c6464dbf4aef996c32ba"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a093f5e568a81c6464dbf4aef996c32ba">&#9670;&nbsp;</a></span>column() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a>&amp; cutlass::MatrixCoord::column </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac68a57c17811b0a04dc6fb21423ab226"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac68a57c17811b0a04dc6fb21423ab226">&#9670;&nbsp;</a></span>operator*()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> cutlass::MatrixCoord::operator* </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5fd3c3b58af1147a5c73657c05a16f5b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5fd3c3b58af1147a5c73657c05a16f5b">&#9670;&nbsp;</a></span>operator*=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&amp; cutlass::MatrixCoord::operator*= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a25236953237f965965b1c9b7a04ba26e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a25236953237f965965b1c9b7a04ba26e">&#9670;&nbsp;</a></span>operator+()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> cutlass::MatrixCoord::operator+ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad105615dbf7ede75caa0e778c873bd06"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad105615dbf7ede75caa0e778c873bd06">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&amp; cutlass::MatrixCoord::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa462303d75a5d98b680b6e20080ce877"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa462303d75a5d98b680b6e20080ce877">&#9670;&nbsp;</a></span>operator-()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> cutlass::MatrixCoord::operator- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6feef48cf24733d22ca53a27cbc33ac0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6feef48cf24733d22ca53a27cbc33ac0">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&amp; cutlass::MatrixCoord::operator-= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa89b196410d25d8c9ed3746fb6833374"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa89b196410d25d8c9ed3746fb6833374">&#9670;&nbsp;</a></span>operator/()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> cutlass::MatrixCoord::operator/ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aab345c8ddb8048bfe3d667bc7ce6522f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aab345c8ddb8048bfe3d667bc7ce6522f">&#9670;&nbsp;</a></span>operator/=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a>&amp; cutlass::MatrixCoord::operator/= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html#a07f7e0ff4347aa6d75a5b3a63676d51d">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a525949dd8a6b631e755511764848e546"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a525949dd8a6b631e755511764848e546">&#9670;&nbsp;</a></span>row() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a> const&amp; cutlass::MatrixCoord::row </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a67f3102e51abad1205e8a3450e7a6c7e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a67f3102e51abad1205e8a3450e7a6c7e">&#9670;&nbsp;</a></span>row() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1MatrixCoord.html#a33eea222c3dcaf22cf62502e41afb24f">Index</a>&amp; cutlass::MatrixCoord::row </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a1e096b25138e027c31ea8624729ec433"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1e096b25138e027c31ea8624729ec433">&#9670;&nbsp;</a></span>kColumn</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::MatrixCoord::kColumn = 1</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5149f4a37407746407251efc0779bb53"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5149f4a37407746407251efc0779bb53">&#9670;&nbsp;</a></span>kRow</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::MatrixCoord::kRow = 0</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixCoord.png b/docs/structcutlass_1_1MatrixCoord.png
new file mode 100644
index 0000000000000000000000000000000000000000..24fcf6f1677af5f8498a86443fa6a229d349ebe0
GIT binary patch
literal 640
zcmeAS@N?(olHy`uVBq!ia0vp^6M;B@gBeKbZAu4{3=#o8A+G=b{|7QZe0{O(Q0W99
z3ycpOI1sV1A`HmoC<*clW&kPzfvcxNj2IZ0_&r@5Ln;{G&V5_-Sb@it|GIJIfA@Pw
z5+)d)$lEP{rY~xpaI*lr;>7(qx3}r4nt4WfII4K=Yx0;><J)oRo=WDTFaIVl+4yVW
zxgC3XYHB8D$j^x`QJ#N&<3{f(-zR?kxv&0o_2%<+laEIv{>f22KQ(3c+gsm%&otyJ
zQPr||oBW|jO5)6^)gfiOW9qZoQ}5oG@nVb1YmI;I((gLgv<a^{ADk6ZJb%TL_kXS|
zbJ-j+Pbl=iUf}5ydOq<z7ngpKJH8_Iph^F(C~4uZl_mZrr<8-k*T#9Bof&MsN9KEA
zeD+o6`pTQq2Lvp)s(IE&{agB*zeA4ksQy}&yBZxTC&L9iC#^TXxGnd#7t;^jDn^~9
zPdnn)U!5>bxr$l0ZHrvs6{!Prn>Y@H3o!oRQeudAWO<<7!BE30*sxxK>4T^X!#*U*
z|Hgq{n!2h&2b`cvU-!MReI+TAeD>L`&EdueBK}_R@BFkN@?+NC?`P)PD4eoBWwow-
zllSjE0&mTJ2L7}Df7Mf3@{Zl&c~Ud~7*-groiP8o>W17WJEUxtt<L7lswzx>d9^ck
zLtCC($`{^6ljd9x-pr__{w=)Y))_sYwimk|oLyPlxkC1%Nx$DQ=S7Q;y?H+Mg`?ce
zU0Fv1vd+!9Wm$1{+1!}5zaHDY%3iC-v_)*c5{mohYwIqZB6dmNNL=oDK=B<1U~*yb
MboFyt=akR{0JYX7d;kCd

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1MatrixLayout-members.html b/docs/structcutlass_1_1MatrixLayout-members.html
index 9a6cfd745..ec3c8cd6a 100644
--- a/docs/structcutlass_1_1MatrixLayout-members.html
+++ b/docs/structcutlass_1_1MatrixLayout-members.html
@@ -85,7 +85,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1MatrixLayout.html b/docs/structcutlass_1_1MatrixLayout.html
index 1a79f4d14..2e0a59834 100644
--- a/docs/structcutlass_1_1MatrixLayout.html
+++ b/docs/structcutlass_1_1MatrixLayout.html
@@ -73,6 +73,7 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
 <a href="#pub-types">Public Types</a> &#124;
 <a href="structcutlass_1_1MatrixLayout-members.html">List of all members</a>  </div>
   <div class="headertitle">
@@ -80,16 +81,36 @@ $(function() {
 </div><!--header-->
 <div class="contents">
 
-<p>Describes layouts of matrices.  
+<p>Defines data layouts of various matrix formats usable by <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> and other classes.  
 </p>
 
 <p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
 <table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">ColumnMajor</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Mapping function for column-major matrices.  <a href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">ColumnMajorBlockLinear</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">ColumnMajorInterleaved</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">ContiguousLayout</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">RowMajor</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Mapping function for row-major matrices.  <a href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">RowMajorBlockLinear</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">RowMajorInterleaved</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
 <tr class="memitem:a97ef07af21b122c1804245b0c7784d2b"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">Kind</a> { <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">kRowMajor</a>, 
 <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">kColumnMajor</a>
  }</td></tr>
+<tr class="memdesc:a97ef07af21b122c1804245b0c7784d2b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Enumeration defining fundamental contiguous layouts.  <a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">More...</a><br /></td></tr>
 <tr class="separator:a97ef07af21b122c1804245b0c7784d2b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Enumeration Documentation</h2>
@@ -117,7 +138,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajor-members.html b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajor-members.html
new file mode 100644
index 000000000..99d2c3e36
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajor-members.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">ColumnMajor</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::ColumnMajor Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">cutlass::MatrixLayout::ColumnMajor</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70">kStorageRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">cutlass::MatrixLayout::ColumnMajor</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#af51e07c6605524581e5d27d290c8b8d2">operator()</a>(MatrixCoord const &amp;coord) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">cutlass::MatrixLayout::ColumnMajor</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajor.html b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajor.html
new file mode 100644
index 000000000..87d058e93
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajor.html
@@ -0,0 +1,161 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::MatrixLayout::ColumnMajor Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html">ColumnMajor</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1MatrixLayout_1_1ColumnMajor-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::ColumnMajor Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Mapping function for column-major matrices.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:af51e07c6605524581e5d27d290c8b8d2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#af51e07c6605524581e5d27d290c8b8d2">operator()</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:af51e07c6605524581e5d27d290c8b8d2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps (i, j) to (j, i)  <a href="#af51e07c6605524581e5d27d290c8b8d2">More...</a><br /></td></tr>
+<tr class="separator:af51e07c6605524581e5d27d290c8b8d2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:ab6be000553d79c0a6e39ccabe1f38c70"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70">kStorageRank</a> = 2</td></tr>
+<tr class="separator:ab6be000553d79c0a6e39ccabe1f38c70"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="af51e07c6605524581e5d27d290c8b8d2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af51e07c6605524581e5d27d290c8b8d2">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajor.html#ab6be000553d79c0a6e39ccabe1f38c70">kStorageRank</a>&gt; cutlass::MatrixLayout::ColumnMajor::operator() </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="ab6be000553d79c0a6e39ccabe1f38c70"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab6be000553d79c0a6e39ccabe1f38c70">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::MatrixLayout::ColumnMajor::kStorageRank = 2</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear-members.html b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear-members.html
new file mode 100644
index 000000000..21c856dcf
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear-members.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">ColumnMajorBlockLinear</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">kBlockColumns</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">kBlockRows</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">kStorageRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a24c06bb7e64a8015ac528b3ae954a689">operator()</a>(MatrixCoord const &amp;coord) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#abb88bd43e5493682d1132c550b734a36">stride</a>(int ldm)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html
new file mode 100644
index 000000000..d1d738721
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html
@@ -0,0 +1,257 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">ColumnMajorBlockLinear</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a24c06bb7e64a8015ac528b3ae954a689"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a24c06bb7e64a8015ac528b3ae954a689">operator()</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a24c06bb7e64a8015ac528b3ae954a689"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps (row, col) to (col, row, col, row)  <a href="#a24c06bb7e64a8015ac528b3ae954a689">More...</a><br /></td></tr>
+<tr class="separator:a24c06bb7e64a8015ac528b3ae954a689"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:abb88bd43e5493682d1132c550b734a36"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#abb88bd43e5493682d1132c550b734a36">stride</a> (int ldm)</td></tr>
+<tr class="memdesc:abb88bd43e5493682d1132c550b734a36"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to compute stride vector from leading dimension.  <a href="#abb88bd43e5493682d1132c550b734a36">More...</a><br /></td></tr>
+<tr class="separator:abb88bd43e5493682d1132c550b734a36"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a626305f3e11ad87e8185e028095a91d3"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">kStorageRank</a> = 4</td></tr>
+<tr class="memdesc:a626305f3e11ad87e8185e028095a91d3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of storage n-D array.  <a href="#a626305f3e11ad87e8185e028095a91d3">More...</a><br /></td></tr>
+<tr class="separator:a626305f3e11ad87e8185e028095a91d3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada7a9316475bb6b2f4e7a70bc654ef5b"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#ada7a9316475bb6b2f4e7a70bc654ef5b">kBlockRows</a> = BlockRows</td></tr>
+<tr class="memdesc:ada7a9316475bb6b2f4e7a70bc654ef5b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Interleaving size in rows dimension.  <a href="#ada7a9316475bb6b2f4e7a70bc654ef5b">More...</a><br /></td></tr>
+<tr class="separator:ada7a9316475bb6b2f4e7a70bc654ef5b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0c2fe4bc9ffbc347f14dad8ffb4f7b21"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">kBlockColumns</a> = BlockColumns</td></tr>
+<tr class="memdesc:a0c2fe4bc9ffbc347f14dad8ffb4f7b21"><td class="mdescLeft">&#160;</td><td class="mdescRight">Interleaving size in columns dimension.  <a href="#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">More...</a><br /></td></tr>
+<tr class="separator:a0c2fe4bc9ffbc347f14dad8ffb4f7b21"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;int BlockRows, int BlockColumns&gt;<br />
+struct cutlass::MatrixLayout::ColumnMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</h3>
+
+<p>Mapping function for block-linear matrices. Matrix is structured as column-major arrangement of 2D tiles (that are column-major). </p>
+</div><h2 class="groupheader">Member Function Documentation</h2>
+<a id="a24c06bb7e64a8015ac528b3ae954a689"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a24c06bb7e64a8015ac528b3ae954a689">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">kStorageRank</a>&gt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::operator() </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="abb88bd43e5493682d1132c550b734a36"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abb88bd43e5493682d1132c550b734a36">&#9670;&nbsp;</a></span>stride()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html#a626305f3e11ad87e8185e028095a91d3">kStorageRank</a>&gt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::stride </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>ldm</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a0c2fe4bc9ffbc347f14dad8ffb4f7b21"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0c2fe4bc9ffbc347f14dad8ffb4f7b21">&#9670;&nbsp;</a></span>kBlockColumns</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::kBlockColumns = BlockColumns</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ada7a9316475bb6b2f4e7a70bc654ef5b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ada7a9316475bb6b2f4e7a70bc654ef5b">&#9670;&nbsp;</a></span>kBlockRows</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::kBlockRows = BlockRows</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a626305f3e11ad87e8185e028095a91d3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a626305f3e11ad87e8185e028095a91d3">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorBlockLinear.html">cutlass::MatrixLayout::ColumnMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::kStorageRank = 4</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved-members.html b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved-members.html
new file mode 100644
index 000000000..6282ce957
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved-members.html
@@ -0,0 +1,94 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">ColumnMajorInterleaved</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">kInterleave</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">kStorageRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dbf79e5df5bcf52d54a699d2587319d">operator()</a>(MatrixCoord const &amp;coord) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dab2c5aee6958c9d99109183401f41f">stride</a>(int ldm)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html
new file mode 100644
index 000000000..dfdb2a483
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html
@@ -0,0 +1,230 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">ColumnMajorInterleaved</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a9dbf79e5df5bcf52d54a699d2587319d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dbf79e5df5bcf52d54a699d2587319d">operator()</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a9dbf79e5df5bcf52d54a699d2587319d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps (row, col) to (col, row, col)  <a href="#a9dbf79e5df5bcf52d54a699d2587319d">More...</a><br /></td></tr>
+<tr class="separator:a9dbf79e5df5bcf52d54a699d2587319d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a9dab2c5aee6958c9d99109183401f41f"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#a9dab2c5aee6958c9d99109183401f41f">stride</a> (int ldm)</td></tr>
+<tr class="memdesc:a9dab2c5aee6958c9d99109183401f41f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to compute stride vector from leading dimension.  <a href="#a9dab2c5aee6958c9d99109183401f41f">More...</a><br /></td></tr>
+<tr class="separator:a9dab2c5aee6958c9d99109183401f41f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:af32144a5875e5db43cf395307a4ab00f"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">kStorageRank</a> = 3</td></tr>
+<tr class="memdesc:af32144a5875e5db43cf395307a4ab00f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of storage n-D array.  <a href="#af32144a5875e5db43cf395307a4ab00f">More...</a><br /></td></tr>
+<tr class="separator:af32144a5875e5db43cf395307a4ab00f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae0ff392e62f2af6614ab502df0cdbab7"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#ae0ff392e62f2af6614ab502df0cdbab7">kInterleave</a> = Interleave</td></tr>
+<tr class="memdesc:ae0ff392e62f2af6614ab502df0cdbab7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Interleaving size.  <a href="#ae0ff392e62f2af6614ab502df0cdbab7">More...</a><br /></td></tr>
+<tr class="separator:ae0ff392e62f2af6614ab502df0cdbab7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;int Interleave&gt;<br />
+struct cutlass::MatrixLayout::ColumnMajorInterleaved&lt; Interleave &gt;</h3>
+
+<p>Mapping function for interleaved matrices. Matrix is structured as column-major arrangement of fixed-size rows. </p>
+</div><h2 class="groupheader">Member Function Documentation</h2>
+<a id="a9dbf79e5df5bcf52d54a699d2587319d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9dbf79e5df5bcf52d54a699d2587319d">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Interleave&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">kStorageRank</a>&gt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved</a>&lt; Interleave &gt;::operator() </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9dab2c5aee6958c9d99109183401f41f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9dab2c5aee6958c9d99109183401f41f">&#9670;&nbsp;</a></span>stride()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Interleave&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html#af32144a5875e5db43cf395307a4ab00f">kStorageRank</a>&gt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved</a>&lt; Interleave &gt;::stride </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>ldm</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="ae0ff392e62f2af6614ab502df0cdbab7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae0ff392e62f2af6614ab502df0cdbab7">&#9670;&nbsp;</a></span>kInterleave</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Interleave&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved</a>&lt; Interleave &gt;::kInterleave = Interleave</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af32144a5875e5db43cf395307a4ab00f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af32144a5875e5db43cf395307a4ab00f">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Interleave&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1ColumnMajorInterleaved.html">cutlass::MatrixLayout::ColumnMajorInterleaved</a>&lt; Interleave &gt;::kStorageRank = 3</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1ContiguousLayout-members.html b/docs/structcutlass_1_1MatrixLayout_1_1ContiguousLayout-members.html
new file mode 100644
index 000000000..bd9e4cfee
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1ContiguousLayout-members.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">ContiguousLayout</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::ContiguousLayout Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">cutlass::MatrixLayout::ContiguousLayout</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#adb3b8cccf1ac91265fff998a3d48f5e7">kColumn</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">cutlass::MatrixLayout::ContiguousLayout</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#ae97a9ba9d5045bef258d8994eb732256">kRow</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">cutlass::MatrixLayout::ContiguousLayout</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">kStorageRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">cutlass::MatrixLayout::ContiguousLayout</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a512248a443c5914fab6aeabc4a73978e">operator()</a>(MatrixCoord const &amp;coord) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">cutlass::MatrixLayout::ContiguousLayout</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#aa3c5b8d44216fdeeee9cce5e38ce418b">stride</a>(MatrixLayout::Kind layout, int ldm)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">cutlass::MatrixLayout::ContiguousLayout</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html b/docs/structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html
new file mode 100644
index 000000000..b37188023
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html
@@ -0,0 +1,254 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::MatrixLayout::ContiguousLayout Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html">ContiguousLayout</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::ContiguousLayout Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a512248a443c5914fab6aeabc4a73978e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a512248a443c5914fab6aeabc4a73978e">operator()</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;coord) const</td></tr>
+<tr class="separator:a512248a443c5914fab6aeabc4a73978e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:aa3c5b8d44216fdeeee9cce5e38ce418b"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#aa3c5b8d44216fdeeee9cce5e38ce418b">stride</a> (<a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> layout, int ldm)</td></tr>
+<tr class="memdesc:aa3c5b8d44216fdeeee9cce5e38ce418b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct a stride vector based on contiguous matrix layout and leading dimension.  <a href="#aa3c5b8d44216fdeeee9cce5e38ce418b">More...</a><br /></td></tr>
+<tr class="separator:aa3c5b8d44216fdeeee9cce5e38ce418b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a68bde445429b6b3a5156460eaff6a8a7"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">kStorageRank</a> = 3</td></tr>
+<tr class="memdesc:a68bde445429b6b3a5156460eaff6a8a7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Arbitrary storage rank.  <a href="#a68bde445429b6b3a5156460eaff6a8a7">More...</a><br /></td></tr>
+<tr class="separator:a68bde445429b6b3a5156460eaff6a8a7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae97a9ba9d5045bef258d8994eb732256"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#ae97a9ba9d5045bef258d8994eb732256">kRow</a> = 0</td></tr>
+<tr class="memdesc:ae97a9ba9d5045bef258d8994eb732256"><td class="mdescLeft">&#160;</td><td class="mdescRight">Dimension of rows.  <a href="#ae97a9ba9d5045bef258d8994eb732256">More...</a><br /></td></tr>
+<tr class="separator:ae97a9ba9d5045bef258d8994eb732256"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adb3b8cccf1ac91265fff998a3d48f5e7"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#adb3b8cccf1ac91265fff998a3d48f5e7">kColumn</a> = 1</td></tr>
+<tr class="memdesc:adb3b8cccf1ac91265fff998a3d48f5e7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Dimension of columns.  <a href="#adb3b8cccf1ac91265fff998a3d48f5e7">More...</a><br /></td></tr>
+<tr class="separator:adb3b8cccf1ac91265fff998a3d48f5e7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><p>Mapping function for scenario in which layout is row-major or column-major but this information is only available at runtime. </p>
+</div><h2 class="groupheader">Member Function Documentation</h2>
+<a id="a512248a443c5914fab6aeabc4a73978e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a512248a443c5914fab6aeabc4a73978e">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">kStorageRank</a>&gt; cutlass::MatrixLayout::ContiguousLayout::operator() </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Mapping function defined by runtime variable. Returns coordinates in n-D storage array as (matrix row, matrix colum, 0) </p>
+
+</div>
+</div>
+<a id="aa3c5b8d44216fdeeee9cce5e38ce418b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa3c5b8d44216fdeeee9cce5e38ce418b">&#9670;&nbsp;</a></span>stride()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1ContiguousLayout.html#a68bde445429b6b3a5156460eaff6a8a7">kStorageRank</a>&gt; cutlass::MatrixLayout::ContiguousLayout::stride </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a>&#160;</td>
+          <td class="paramname"><em>layout</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>ldm</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="adb3b8cccf1ac91265fff998a3d48f5e7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adb3b8cccf1ac91265fff998a3d48f5e7">&#9670;&nbsp;</a></span>kColumn</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::MatrixLayout::ContiguousLayout::kColumn = 1</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae97a9ba9d5045bef258d8994eb732256"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae97a9ba9d5045bef258d8994eb732256">&#9670;&nbsp;</a></span>kRow</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::MatrixLayout::ContiguousLayout::kRow = 0</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a68bde445429b6b3a5156460eaff6a8a7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a68bde445429b6b3a5156460eaff6a8a7">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::MatrixLayout::ContiguousLayout::kStorageRank = 3</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1RowMajor-members.html b/docs/structcutlass_1_1MatrixLayout_1_1RowMajor-members.html
new file mode 100644
index 000000000..c985ea4a4
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1RowMajor-members.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">RowMajor</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::RowMajor Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">cutlass::MatrixLayout::RowMajor</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30">kStorageRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">cutlass::MatrixLayout::RowMajor</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a736620aef395e4224d7aae098573aa34">operator()</a>(MatrixCoord const &amp;coord) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">cutlass::MatrixLayout::RowMajor</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1RowMajor.html b/docs/structcutlass_1_1MatrixLayout_1_1RowMajor.html
new file mode 100644
index 000000000..a264edfc8
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1RowMajor.html
@@ -0,0 +1,161 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::MatrixLayout::RowMajor Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html">RowMajor</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1MatrixLayout_1_1RowMajor-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::RowMajor Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Mapping function for row-major matrices.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a736620aef395e4224d7aae098573aa34"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a736620aef395e4224d7aae098573aa34">operator()</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a736620aef395e4224d7aae098573aa34"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps (i, j) to (i, j)  <a href="#a736620aef395e4224d7aae098573aa34">More...</a><br /></td></tr>
+<tr class="separator:a736620aef395e4224d7aae098573aa34"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a87fe43681c95afc9ef46818fd84d9f30"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30">kStorageRank</a> = 2</td></tr>
+<tr class="separator:a87fe43681c95afc9ef46818fd84d9f30"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a736620aef395e4224d7aae098573aa34"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a736620aef395e4224d7aae098573aa34">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajor.html#a87fe43681c95afc9ef46818fd84d9f30">kStorageRank</a>&gt; cutlass::MatrixLayout::RowMajor::operator() </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a87fe43681c95afc9ef46818fd84d9f30"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a87fe43681c95afc9ef46818fd84d9f30">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::MatrixLayout::RowMajor::kStorageRank = 2</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear-members.html b/docs/structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear-members.html
new file mode 100644
index 000000000..390121d6c
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear-members.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">RowMajorBlockLinear</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">kBlockColumns</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">kBlockRows</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">kStorageRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#abde0a4a7c487da0c78ea2519323c04af">operator()</a>(MatrixCoord const &amp;coord) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a1b25b4a7061d81041a8e2a548128ca71">stride</a>(int ldm)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html b/docs/structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html
new file mode 100644
index 000000000..9db6c0f74
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html
@@ -0,0 +1,257 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">RowMajorBlockLinear</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:abde0a4a7c487da0c78ea2519323c04af"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#abde0a4a7c487da0c78ea2519323c04af">operator()</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:abde0a4a7c487da0c78ea2519323c04af"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps (row, col) to (row, col, row, col)  <a href="#abde0a4a7c487da0c78ea2519323c04af">More...</a><br /></td></tr>
+<tr class="separator:abde0a4a7c487da0c78ea2519323c04af"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a1b25b4a7061d81041a8e2a548128ca71"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a1b25b4a7061d81041a8e2a548128ca71">stride</a> (int ldm)</td></tr>
+<tr class="memdesc:a1b25b4a7061d81041a8e2a548128ca71"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to compute stride vector from leading dimension.  <a href="#a1b25b4a7061d81041a8e2a548128ca71">More...</a><br /></td></tr>
+<tr class="separator:a1b25b4a7061d81041a8e2a548128ca71"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:ab1ef1db408fd1e4bda8d6ef203d50c3d"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">kStorageRank</a> = 4</td></tr>
+<tr class="memdesc:ab1ef1db408fd1e4bda8d6ef203d50c3d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of storage n-D array.  <a href="#ab1ef1db408fd1e4bda8d6ef203d50c3d">More...</a><br /></td></tr>
+<tr class="separator:ab1ef1db408fd1e4bda8d6ef203d50c3d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64cf7313c507bb13e010850d6a2ff922"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a64cf7313c507bb13e010850d6a2ff922">kBlockRows</a> = BlockRows</td></tr>
+<tr class="memdesc:a64cf7313c507bb13e010850d6a2ff922"><td class="mdescLeft">&#160;</td><td class="mdescRight">Interleaving size in rows dimension.  <a href="#a64cf7313c507bb13e010850d6a2ff922">More...</a><br /></td></tr>
+<tr class="separator:a64cf7313c507bb13e010850d6a2ff922"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8ee57a9b5364f20890c5d3ace21c4b4e"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#a8ee57a9b5364f20890c5d3ace21c4b4e">kBlockColumns</a> = BlockColumns</td></tr>
+<tr class="memdesc:a8ee57a9b5364f20890c5d3ace21c4b4e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Interleaving size in columns dimension.  <a href="#a8ee57a9b5364f20890c5d3ace21c4b4e">More...</a><br /></td></tr>
+<tr class="separator:a8ee57a9b5364f20890c5d3ace21c4b4e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;int BlockRows, int BlockColumns&gt;<br />
+struct cutlass::MatrixLayout::RowMajorBlockLinear&lt; BlockRows, BlockColumns &gt;</h3>
+
+<p>Mapping function for block-linear matrices. Matrix is structured as row-major arrangement of 2D tiles (that are row-major) </p>
+</div><h2 class="groupheader">Member Function Documentation</h2>
+<a id="abde0a4a7c487da0c78ea2519323c04af"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abde0a4a7c487da0c78ea2519323c04af">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">kStorageRank</a>&gt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::operator() </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1b25b4a7061d81041a8e2a548128ca71"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1b25b4a7061d81041a8e2a548128ca71">&#9670;&nbsp;</a></span>stride()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html#ab1ef1db408fd1e4bda8d6ef203d50c3d">kStorageRank</a>&gt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::stride </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>ldm</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a8ee57a9b5364f20890c5d3ace21c4b4e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8ee57a9b5364f20890c5d3ace21c4b4e">&#9670;&nbsp;</a></span>kBlockColumns</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::kBlockColumns = BlockColumns</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a64cf7313c507bb13e010850d6a2ff922"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a64cf7313c507bb13e010850d6a2ff922">&#9670;&nbsp;</a></span>kBlockRows</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::kBlockRows = BlockRows</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab1ef1db408fd1e4bda8d6ef203d50c3d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab1ef1db408fd1e4bda8d6ef203d50c3d">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int BlockRows, int BlockColumns&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorBlockLinear.html">cutlass::MatrixLayout::RowMajorBlockLinear</a>&lt; BlockRows, BlockColumns &gt;::kStorageRank = 4</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved-members.html b/docs/structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved-members.html
new file mode 100644
index 000000000..49463c33c
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved-members.html
@@ -0,0 +1,94 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">RowMajorInterleaved</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">kInterleave</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">kStorageRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a5199cb7f7c10f6123c63703453b7937c">operator()</a>(MatrixCoord const &amp;coord) const</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a56f728be8b1a3e71f4f322e1dbfb3495">stride</a>(int ldm)</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html b/docs/structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html
new file mode 100644
index 000000000..1a596c6e8
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html
@@ -0,0 +1,230 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout.html">MatrixLayout</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">RowMajorInterleaved</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a5199cb7f7c10f6123c63703453b7937c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a5199cb7f7c10f6123c63703453b7937c">operator()</a> (<a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a5199cb7f7c10f6123c63703453b7937c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps (row, col) to (row, col, row)  <a href="#a5199cb7f7c10f6123c63703453b7937c">More...</a><br /></td></tr>
+<tr class="separator:a5199cb7f7c10f6123c63703453b7937c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a56f728be8b1a3e71f4f322e1dbfb3495"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a56f728be8b1a3e71f4f322e1dbfb3495">stride</a> (int ldm)</td></tr>
+<tr class="memdesc:a56f728be8b1a3e71f4f322e1dbfb3495"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to compute stride vector from leading dimension.  <a href="#a56f728be8b1a3e71f4f322e1dbfb3495">More...</a><br /></td></tr>
+<tr class="separator:a56f728be8b1a3e71f4f322e1dbfb3495"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a7be6d445e879f042a0b8aa2c9a378800"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">kStorageRank</a> = 3</td></tr>
+<tr class="memdesc:a7be6d445e879f042a0b8aa2c9a378800"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of storage n-D array.  <a href="#a7be6d445e879f042a0b8aa2c9a378800">More...</a><br /></td></tr>
+<tr class="separator:a7be6d445e879f042a0b8aa2c9a378800"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea33a554c0b02e455fba76c945527143"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#aea33a554c0b02e455fba76c945527143">kInterleave</a> = Interleave</td></tr>
+<tr class="memdesc:aea33a554c0b02e455fba76c945527143"><td class="mdescLeft">&#160;</td><td class="mdescRight">Interleaving size.  <a href="#aea33a554c0b02e455fba76c945527143">More...</a><br /></td></tr>
+<tr class="separator:aea33a554c0b02e455fba76c945527143"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;int Interleave&gt;<br />
+struct cutlass::MatrixLayout::RowMajorInterleaved&lt; Interleave &gt;</h3>
+
+<p>Mapping function for interleaved matrices. Matrix is structured as row-major arrangement of fixed-size columns. </p>
+</div><h2 class="groupheader">Member Function Documentation</h2>
+<a id="a5199cb7f7c10f6123c63703453b7937c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5199cb7f7c10f6123c63703453b7937c">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Interleave&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">kStorageRank</a>&gt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved</a>&lt; Interleave &gt;::operator() </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1MatrixCoord.html">MatrixCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a56f728be8b1a3e71f4f322e1dbfb3495"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a56f728be8b1a3e71f4f322e1dbfb3495">&#9670;&nbsp;</a></span>stride()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Interleave&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html#a7be6d445e879f042a0b8aa2c9a378800">kStorageRank</a>&gt; <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved</a>&lt; Interleave &gt;::stride </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>ldm</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="aea33a554c0b02e455fba76c945527143"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea33a554c0b02e455fba76c945527143">&#9670;&nbsp;</a></span>kInterleave</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Interleave&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved</a>&lt; Interleave &gt;::kInterleave = Interleave</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7be6d445e879f042a0b8aa2c9a378800"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7be6d445e879f042a0b8aa2c9a378800">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int Interleave&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1MatrixLayout_1_1RowMajorInterleaved.html">cutlass::MatrixLayout::RowMajorInterleaved</a>&lt; Interleave &gt;::kStorageRank = 3</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixTransform-members.html b/docs/structcutlass_1_1MatrixTransform-members.html
new file mode 100644
index 000000000..b662a473e
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixTransform-members.html
@@ -0,0 +1,93 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixTransform.html">MatrixTransform</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::MatrixTransform Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1MatrixTransform.html">cutlass::MatrixTransform</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683">kConjugate</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixTransform.html">cutlass::MatrixTransform</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48">Kind</a> enum name</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixTransform.html">cutlass::MatrixTransform</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5">kNone</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1MatrixTransform.html">cutlass::MatrixTransform</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MatrixTransform.html b/docs/structcutlass_1_1MatrixTransform.html
new file mode 100644
index 000000000..32a41d684
--- /dev/null
+++ b/docs/structcutlass_1_1MatrixTransform.html
@@ -0,0 +1,126 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::MatrixTransform Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1MatrixTransform.html">MatrixTransform</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="structcutlass_1_1MatrixTransform-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::MatrixTransform Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Transformation applied to matrix operands.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:abf79785f7ae47385d0bbc38d0c431f48"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48">Kind</a> { <a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5">kNone</a>, 
+<a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683">kConjugate</a>
+ }</td></tr>
+<tr class="separator:abf79785f7ae47385d0bbc38d0c431f48"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Enumeration Documentation</h2>
+<a id="abf79785f7ae47385d0bbc38d0c431f48"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abf79785f7ae47385d0bbc38d0c431f48">&#9670;&nbsp;</a></span>Kind</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">enum <a class="el" href="structcutlass_1_1MatrixTransform.html#abf79785f7ae47385d0bbc38d0c431f48">cutlass::MatrixTransform::Kind</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="abf79785f7ae47385d0bbc38d0c431f48a67f5e7ba395d17d2c4808b7d524cbfa5"></a>kNone&#160;</td><td class="fielddoc"></td></tr>
+<tr><td class="fieldname"><a id="abf79785f7ae47385d0bbc38d0c431f48aead07a43bea51d6b4d728cda844cd683"></a>kConjugate&#160;</td><td class="fielddoc"><p>no operation </p>
+</td></tr>
+</table>
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="matrix__traits_8h_source.html">matrix_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Max-members.html b/docs/structcutlass_1_1Max-members.html
new file mode 100644
index 000000000..d35dbc07f
--- /dev/null
+++ b/docs/structcutlass_1_1Max-members.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Max.html">Max</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Max&lt; A, B &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Max.html">cutlass::Max&lt; A, B &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Max.html#a6ed8be7ed855eea8f8d08921f7b5d763">kValue</a></td><td class="entry"><a class="el" href="structcutlass_1_1Max.html">cutlass::Max&lt; A, B &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Max.html b/docs/structcutlass_1_1Max.html
new file mode 100644
index 000000000..a100e616f
--- /dev/null
+++ b/docs/structcutlass_1_1Max.html
@@ -0,0 +1,126 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Max&lt; A, B &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Max.html">Max</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1Max-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Max&lt; A, B &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="cutlass__math_8h_source.html">cutlass_math.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a6ed8be7ed855eea8f8d08921f7b5d763"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Max.html#a6ed8be7ed855eea8f8d08921f7b5d763">kValue</a> = (A &gt; B) ? A : B</td></tr>
+<tr class="separator:a6ed8be7ed855eea8f8d08921f7b5d763"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a6ed8be7ed855eea8f8d08921f7b5d763"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6ed8be7ed855eea8f8d08921f7b5d763">&#9670;&nbsp;</a></span>kValue</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int A, int B&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1Max.html">cutlass::Max</a>&lt; A, B &gt;::kValue = (A &gt; B) ? A : B</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="cutlass__math_8h_source.html">cutlass_math.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1MemorySpace-members.html b/docs/structcutlass_1_1MemorySpace-members.html
index 22af2209a..a14b4d6f3 100644
--- a/docs/structcutlass_1_1MemorySpace-members.html
+++ b/docs/structcutlass_1_1MemorySpace-members.html
@@ -86,7 +86,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1MemorySpace.html b/docs/structcutlass_1_1MemorySpace.html
index 410826bf3..4d8eb1d72 100644
--- a/docs/structcutlass_1_1MemorySpace.html
+++ b/docs/structcutlass_1_1MemorySpace.html
@@ -119,7 +119,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Min-members.html b/docs/structcutlass_1_1Min-members.html
new file mode 100644
index 000000000..39e0939a7
--- /dev/null
+++ b/docs/structcutlass_1_1Min-members.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Min.html">Min</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Min&lt; A, B &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Min.html">cutlass::Min&lt; A, B &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Min.html#a97e6dd3ff6fb5404e8a6e6109f73f429">kValue</a></td><td class="entry"><a class="el" href="structcutlass_1_1Min.html">cutlass::Min&lt; A, B &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Min.html b/docs/structcutlass_1_1Min.html
new file mode 100644
index 000000000..47933e87f
--- /dev/null
+++ b/docs/structcutlass_1_1Min.html
@@ -0,0 +1,126 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Min&lt; A, B &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Min.html">Min</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1Min-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Min&lt; A, B &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="cutlass__math_8h_source.html">cutlass_math.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a97e6dd3ff6fb5404e8a6e6109f73f429"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Min.html#a97e6dd3ff6fb5404e8a6e6109f73f429">kValue</a> = (A &lt; B) ? A : B</td></tr>
+<tr class="separator:a97e6dd3ff6fb5404e8a6e6109f73f429"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a97e6dd3ff6fb5404e8a6e6109f73f429"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a97e6dd3ff6fb5404e8a6e6109f73f429">&#9670;&nbsp;</a></span>kValue</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int A, int B&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1Min.html">cutlass::Min</a>&lt; A, B &gt;::kValue = (A &lt; B) ? A : B</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="cutlass__math_8h_source.html">cutlass_math.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1PredicateTileAdapter-members.html b/docs/structcutlass_1_1PredicateTileAdapter-members.html
index f064207c5..d035ab60d 100644
--- a/docs/structcutlass_1_1PredicateTileAdapter-members.html
+++ b/docs/structcutlass_1_1PredicateTileAdapter-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1PredicateTileAdapter.html b/docs/structcutlass_1_1PredicateTileAdapter.html
index 0dd3d00ad..db7b19a80 100644
--- a/docs/structcutlass_1_1PredicateTileAdapter.html
+++ b/docs/structcutlass_1_1PredicateTileAdapter.html
@@ -282,7 +282,7 @@ template&lt;typename PredicateVector_ , typename Iterations_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1PredicateVector-members.html b/docs/structcutlass_1_1PredicateVector-members.html
index b4475cc1e..26cf69c57 100644
--- a/docs/structcutlass_1_1PredicateVector-members.html
+++ b/docs/structcutlass_1_1PredicateVector-members.html
@@ -100,7 +100,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1PredicateVector.html b/docs/structcutlass_1_1PredicateVector.html
index 43645c578..66be2023f 100644
--- a/docs/structcutlass_1_1PredicateVector.html
+++ b/docs/structcutlass_1_1PredicateVector.html
@@ -650,7 +650,7 @@ template&lt;int kPredicates_, int kPredicatesPerByte_ = 4, int kPredicateStart_
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1PredicateVector_1_1TrivialIterator-members.html b/docs/structcutlass_1_1PredicateVector_1_1TrivialIterator-members.html
index d2f4a9c33..aa56770e2 100644
--- a/docs/structcutlass_1_1PredicateVector_1_1TrivialIterator-members.html
+++ b/docs/structcutlass_1_1PredicateVector_1_1TrivialIterator-members.html
@@ -88,7 +88,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1PredicateVector_1_1TrivialIterator.html b/docs/structcutlass_1_1PredicateVector_1_1TrivialIterator.html
index 4e008feb5..e4dd10155 100644
--- a/docs/structcutlass_1_1PredicateVector_1_1TrivialIterator.html
+++ b/docs/structcutlass_1_1PredicateVector_1_1TrivialIterator.html
@@ -279,7 +279,7 @@ template&lt;int kPredicates_, int kPredicatesPerByte_ = 4, int kPredicateStart_
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1PredicatedTileLoadStream-members.html b/docs/structcutlass_1_1PredicatedTileLoadStream-members.html
new file mode 100644
index 000000000..338c0d3ab
--- /dev/null
+++ b/docs/structcutlass_1_1PredicatedTileLoadStream-members.html
@@ -0,0 +1,111 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">PredicatedTileLoadStream</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">commit</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a60a03c95452fe627477933d60815f7cb">copy</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">fetched_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a7f802c4c733375d0a63f91c58196e6a0">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">fragment</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">intermediate_fragment</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a1f2314aa062360b249b7c57c39af5430">Iterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">Params</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a672a8883d16eff4ecc90dc79162084d3">PredicatedTileLoadStream</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5">PredicateFunctor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f">predicates</a></td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3">TileLoadStream</a>(Params const &amp;_params, TensorRef const &amp;_ref)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7">TileLoadStream</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">transformed_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#adeb35451885c1c4fb930ae8c914ceb20">TransformedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">transformer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a9f79fd30231825b38694bf7c1d12ec2a">Transformer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1PredicatedTileLoadStream.html b/docs/structcutlass_1_1PredicatedTileLoadStream.html
new file mode 100644
index 000000000..6873775d6
--- /dev/null
+++ b/docs/structcutlass_1_1PredicatedTileLoadStream.html
@@ -0,0 +1,402 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">PredicatedTileLoadStream</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1PredicatedTileLoadStream-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Generic stream for loading and transforming fragments.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__stream_8h_source.html">tile_stream.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1PredicatedTileLoadStream.png" usemap="#cutlass::PredicatedTileLoadStream_3C_20Iterator_5F_2C_20PredicateFunctor_5F_2C_20Transformer_5F_20_3E_map" alt=""/>
+  <map id="cutlass::PredicatedTileLoadStream_3C_20Iterator_5F_2C_20PredicateFunctor_5F_2C_20Transformer_5F_20_3E_map" name="cutlass::PredicatedTileLoadStream_3C_20Iterator_5F_2C_20PredicateFunctor_5F_2C_20Transformer_5F_20_3E_map">
+<area href="structcutlass_1_1TileLoadStream.html" title="Generic stream for loading and transforming fragments. " alt="cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;" shape="rect" coords="0,0,475,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ac7f57248d3e10c9309f042e5d41440c1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1">Base</a></td></tr>
+<tr class="separator:ac7f57248d3e10c9309f042e5d41440c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1f2314aa062360b249b7c57c39af5430"><td class="memItemLeft" align="right" valign="top">typedef Iterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a1f2314aa062360b249b7c57c39af5430">Iterator</a></td></tr>
+<tr class="memdesc:a1f2314aa062360b249b7c57c39af5430"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1TileLoadIterator.html" title="An iterator implementing Tile Load Iterator Concept for loading a tile from memory. ">TileLoadIterator</a>.  <a href="#a1f2314aa062360b249b7c57c39af5430">More...</a><br /></td></tr>
+<tr class="separator:a1f2314aa062360b249b7c57c39af5430"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aedafb6329f8c484071e04ffd8949edc5"><td class="memItemLeft" align="right" valign="top">typedef PredicateFunctor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5">PredicateFunctor</a></td></tr>
+<tr class="memdesc:aedafb6329f8c484071e04ffd8949edc5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Predicate functor.  <a href="#aedafb6329f8c484071e04ffd8949edc5">More...</a><br /></td></tr>
+<tr class="separator:aedafb6329f8c484071e04ffd8949edc5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f79fd30231825b38694bf7c1d12ec2a"><td class="memItemLeft" align="right" valign="top">typedef Transformer_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a9f79fd30231825b38694bf7c1d12ec2a">Transformer</a></td></tr>
+<tr class="memdesc:a9f79fd30231825b38694bf7c1d12ec2a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformer.  <a href="#a9f79fd30231825b38694bf7c1d12ec2a">More...</a><br /></td></tr>
+<tr class="separator:a9f79fd30231825b38694bf7c1d12ec2a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f802c4c733375d0a63f91c58196e6a0"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a7f802c4c733375d0a63f91c58196e6a0">Fragment</a></td></tr>
+<tr class="memdesc:a7f802c4c733375d0a63f91c58196e6a0"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> fetched from source memory.  <a href="#a7f802c4c733375d0a63f91c58196e6a0">More...</a><br /></td></tr>
+<tr class="separator:a7f802c4c733375d0a63f91c58196e6a0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adeb35451885c1c4fb930ae8c914ceb20"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">Base::TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#adeb35451885c1c4fb930ae8c914ceb20">TransformedFragment</a></td></tr>
+<tr class="memdesc:adeb35451885c1c4fb930ae8c914ceb20"><td class="mdescLeft">&#160;</td><td class="mdescRight">Output fragment from transformer.  <a href="#adeb35451885c1c4fb930ae8c914ceb20">More...</a><br /></td></tr>
+<tr class="separator:adeb35451885c1c4fb930ae8c914ceb20"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3af1a02201f53d4d09adc483fdcc23a6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Base::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">Params</a></td></tr>
+<tr class="memdesc:a3af1a02201f53d4d09adc483fdcc23a6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object used to construct generic load stream.  <a href="#a3af1a02201f53d4d09adc483fdcc23a6">More...</a><br /></td></tr>
+<tr class="separator:a3af1a02201f53d4d09adc483fdcc23a6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1TileLoadStream"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileLoadStream')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memitem:a21234ea1d4e0ff5cd599c763035b967b inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">typedef Iterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a></td></tr>
+<tr class="memdesc:a21234ea1d4e0ff5cd599c763035b967b inherit pub_types_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1TileLoadIterator.html" title="An iterator implementing Tile Load Iterator Concept for loading a tile from memory. ">TileLoadIterator</a>.  <a href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">More...</a><br /></td></tr>
+<tr class="separator:a21234ea1d4e0ff5cd599c763035b967b inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad531770d336b2541c303c19148ef5cd7 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">typedef Transformer_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a></td></tr>
+<tr class="memdesc:ad531770d336b2541c303c19148ef5cd7 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformer.  <a href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">More...</a><br /></td></tr>
+<tr class="separator:ad531770d336b2541c303c19148ef5cd7 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea86cbd64781caabeee293cfa2070e81 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">typedef Iterator::Fragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a></td></tr>
+<tr class="memdesc:aea86cbd64781caabeee293cfa2070e81 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> fetched from source memory.  <a href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">More...</a><br /></td></tr>
+<tr class="separator:aea86cbd64781caabeee293cfa2070e81 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a94cde8bcdcedc934cc14de19e43375d1 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">typedef Transformer::OutputFragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a></td></tr>
+<tr class="memdesc:a94cde8bcdcedc934cc14de19e43375d1 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Output fragment from transformer.  <a href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">More...</a><br /></td></tr>
+<tr class="separator:a94cde8bcdcedc934cc14de19e43375d1 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8c9256c5cdd1fd129dbcc6536375aca7 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">typedef Iterator::TensorRef&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a></td></tr>
+<tr class="memdesc:a8c9256c5cdd1fd129dbcc6536375aca7 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference expected by the stream.  <a href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">More...</a><br /></td></tr>
+<tr class="separator:a8c9256c5cdd1fd129dbcc6536375aca7 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a90ca6bbd882e39b5624ee0cd17e0d652 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">typedef Iterator::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">Index</a></td></tr>
+<tr class="memdesc:a90ca6bbd882e39b5624ee0cd17e0d652 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">More...</a><br /></td></tr>
+<tr class="separator:a90ca6bbd882e39b5624ee0cd17e0d652 inherit pub_types_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a672a8883d16eff4ecc90dc79162084d3"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a672a8883d16eff4ecc90dc79162084d3">PredicatedTileLoadStream</a> (<a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;threadblock_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:a672a8883d16eff4ecc90dc79162084d3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a672a8883d16eff4ecc90dc79162084d3">More...</a><br /></td></tr>
+<tr class="separator:a672a8883d16eff4ecc90dc79162084d3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60a03c95452fe627477933d60815f7cb"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a60a03c95452fe627477933d60815f7cb">copy</a> ()</td></tr>
+<tr class="memdesc:a60a03c95452fe627477933d60815f7cb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a tile and increments the iterator.  <a href="#a60a03c95452fe627477933d60815f7cb">More...</a><br /></td></tr>
+<tr class="separator:a60a03c95452fe627477933d60815f7cb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileLoadStream"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileLoadStream')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memitem:a40a9b1a87cda0f3eb6f4b3e73a4fade3 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3">TileLoadStream</a> (<a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a> const &amp;_ref)</td></tr>
+<tr class="memdesc:a40a9b1a87cda0f3eb6f4b3e73a4fade3 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3">More...</a><br /></td></tr>
+<tr class="separator:a40a9b1a87cda0f3eb6f4b3e73a4fade3 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6b8b65772d95c30d29e7833348d06ba7 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7">TileLoadStream</a> (<a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;threadblock_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:a6b8b65772d95c30d29e7833348d06ba7 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7">More...</a><br /></td></tr>
+<tr class="separator:a6b8b65772d95c30d29e7833348d06ba7 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aed4e6a6f1bc125ea40ae04fb120d6a23 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23">copy</a> ()</td></tr>
+<tr class="memdesc:aed4e6a6f1bc125ea40ae04fb120d6a23 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a tile and increments the iterator.  <a href="structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23">More...</a><br /></td></tr>
+<tr class="separator:aed4e6a6f1bc125ea40ae04fb120d6a23 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac004fc2e078591ced5d4e5521dfd8627 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">commit</a> ()</td></tr>
+<tr class="memdesc:ac004fc2e078591ced5d4e5521dfd8627 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commits the fetched fragment and applies a transformation.  <a href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">More...</a><br /></td></tr>
+<tr class="separator:ac004fc2e078591ced5d4e5521dfd8627 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af2727fc0ddeffd1cdaef751140aa6093 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">intermediate_fragment</a> ()</td></tr>
+<tr class="memdesc:af2727fc0ddeffd1cdaef751140aa6093 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the loaded, transformed fragment.  <a href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">More...</a><br /></td></tr>
+<tr class="separator:af2727fc0ddeffd1cdaef751140aa6093 inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5b7161b2b97100c13c2c5009edd2a6be inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">fragment</a> ()</td></tr>
+<tr class="memdesc:a5b7161b2b97100c13c2c5009edd2a6be inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the loaded, transformed fragment.  <a href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">More...</a><br /></td></tr>
+<tr class="separator:a5b7161b2b97100c13c2c5009edd2a6be inherit pub_methods_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a8f8c7c54dba8a0c8cd0799b89130564f"><td class="memItemLeft" align="right" valign="top">Iterator::PredicateVector&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f">predicates</a></td></tr>
+<tr class="memdesc:a8f8c7c54dba8a0c8cd0799b89130564f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Predicates.  <a href="#a8f8c7c54dba8a0c8cd0799b89130564f">More...</a><br /></td></tr>
+<tr class="separator:a8f8c7c54dba8a0c8cd0799b89130564f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1TileLoadStream"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileLoadStream')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memitem:ab6d8716c166d071615f4e78d9ac6efb8 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a></td></tr>
+<tr class="memdesc:ab6d8716c166d071615f4e78d9ac6efb8 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterator to load tiles.  <a href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">More...</a><br /></td></tr>
+<tr class="separator:ab6d8716c166d071615f4e78d9ac6efb8 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a89b0f92764b5492a8d1de2c1ada60869 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">fetched_fragment</a></td></tr>
+<tr class="memdesc:a89b0f92764b5492a8d1de2c1ada60869 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> loaded via iterator.  <a href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">More...</a><br /></td></tr>
+<tr class="separator:a89b0f92764b5492a8d1de2c1ada60869 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54399d7a42c1330ef0e756949483c552 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">transformer</a></td></tr>
+<tr class="memdesc:a54399d7a42c1330ef0e756949483c552 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformation applied to fragments.  <a href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">More...</a><br /></td></tr>
+<tr class="separator:a54399d7a42c1330ef0e756949483c552 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac61d45d91faf9d060509cf1e5c34fe01 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">transformed_fragment</a></td></tr>
+<tr class="memdesc:ac61d45d91faf9d060509cf1e5c34fe01 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformed fragment from transformer.  <a href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">More...</a><br /></td></tr>
+<tr class="separator:ac61d45d91faf9d060509cf1e5c34fe01 inherit pub_attribs_structcutlass_1_1TileLoadStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ac7f57248d3e10c9309f042e5d41440c1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac7f57248d3e10c9309f042e5d41440c1">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a>&lt;Iterator_, Transformer_&gt; <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7f802c4c733375d0a63f91c58196e6a0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7f802c4c733375d0a63f91c58196e6a0">&#9670;&nbsp;</a></span>Fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Base::Fragment</a> <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1f2314aa062360b249b7c57c39af5430"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1f2314aa062360b249b7c57c39af5430">&#9670;&nbsp;</a></span>Iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator_ <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3af1a02201f53d4d09adc483fdcc23a6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3af1a02201f53d4d09adc483fdcc23a6">&#9670;&nbsp;</a></span>Params</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Base::Params</a> <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">Params</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aedafb6329f8c484071e04ffd8949edc5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aedafb6329f8c484071e04ffd8949edc5">&#9670;&nbsp;</a></span>PredicateFunctor</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef PredicateFunctor_ <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5">PredicateFunctor</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="adeb35451885c1c4fb930ae8c914ceb20"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adeb35451885c1c4fb930ae8c914ceb20">&#9670;&nbsp;</a></span>TransformedFragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">Base::TransformedFragment</a> <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9f79fd30231825b38694bf7c1d12ec2a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9f79fd30231825b38694bf7c1d12ec2a">&#9670;&nbsp;</a></span>Transformer</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Transformer_ <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a672a8883d16eff4ecc90dc79162084d3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a672a8883d16eff4ecc90dc79162084d3">&#9670;&nbsp;</a></span>PredicatedTileLoadStream()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">PredicatedTileLoadStream</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>bounds</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>threadblock_offset</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;0,&#160;0)</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a60a03c95452fe627477933d60815f7cb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a60a03c95452fe627477933d60815f7cb">&#9670;&nbsp;</a></span>copy()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::copy </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a8f8c7c54dba8a0c8cd0799b89130564f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8f8c7c54dba8a0c8cd0799b89130564f">&#9670;&nbsp;</a></span>predicates</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">Iterator::PredicateVector <a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::predicates</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__stream_8h_source.html">tile_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1PredicatedTileLoadStream.png b/docs/structcutlass_1_1PredicatedTileLoadStream.png
new file mode 100644
index 0000000000000000000000000000000000000000..10a0c9044143f246a6c8dcbd1d80b478eb83dfd8
GIT binary patch
literal 1349
zcmb_cdsNZ~6#kiZQk%I|$I@yw(@2Y4HHk9G9%i6{ildS=P3^@iQP6Z6r)`=&%pgG}
zpoec$H1P++!q=87UmYNP{6urL%#hN2C5Vjn-_Fkd+db#r``vTCbMGJDcWzcNHo(E&
z#U20v2lSx>p#We7S#YqewWXda^eVHomBB$_{${h;0>`G_7B@3;Ea>lSY-~JQlT5IT
zwuzxwJYXSxju+3uwgG^R8hv1IShAH~pr`BBeX)@DDqmq<Kj?-yxM1{$AkK98v-8Dx
zXB(yKI4|xPSN(8vAhPCAD29E>qZbnz<W59iDU02N-kM8x_b5iSf&Ce79bp=gh=DX4
zh7cxoiQA4PxbyGte|?z!W|wIrTGUNDN!m8I5`v`lDEGQ?SI9W#KEfN(lZkN=_H_8O
z4lsg|Gz5pA;1~<!r6KZO!jA&AH%s2ME0r(va(TdhE$M4V96936>QHK=9XJ6-2~ASL
zRl@1hA91ze;Hf{=T?IiZVJ2GonzlV?|C#M_e~l+PvLj?dd=K%cTRwYJ<v2Npt7e=j
zxEr6Z(ch|s>$vwKTm0#8#rk-1ZfwRL>cvLaGL>%$t;D#V>_sUrnk$8!fL$l^<J;*G
z$_<r|<<Onk0sb2f+4N0ucZHrNWyiMiN9Jvact+X?li`!_oY!s}*H0!$BkFvcG;2@p
zZmu@>h?>=u)OC)7P(bR(msD;KntEdZqD7^)zPhObKIrRUl)Df7K;f}*374?9w^MH<
zGlo~ckoPyd=VV;Pr-=nhW=~}TQ5Q^Az{K-uI8djx{!UCpr&J7d64>)GCSWPr;AD}+
zB~j-@Ovovug)ltPqTq+Qg?Si|y&V6Pz&`2u57`*e^_$z+;oP{a4XlRyUaaMQNOvMD
z$6&z7fUk1NR{P#vLJTdi346Hka=F{$FY!;E))lkieiq$XmX&}-b}P%q1;2hKl*Rrp
zgp1cG9z}&15BJ*}0S{Kxzphw=D_%KI&`nl}1@MWCwsc)rmv8^5AsQOZ3QSI(^Fc*k
zB`vm%QqN|4I|B)VbQ`4RD%la6mczTBd!wc@5Y;qYB*O{@e5clY0=&v=D8I#5REBTW
zzt3AG8IFQCn2cPNHh7QRS;!Tm>y;_}kAE@s*#SNp+vzOhy(asf@$lo*<yEJ5+nQfz
z=Q%(It;L7uae@@k*mNgvZ#3$hgi2^2PpWFY6G}2m`9U+#DfK25RWzYpt2}D8BQm>9
zkj{S8vL*@K;%ZO%gghq;z(y=AkjO_7`vdi3Tk<P2bMY+4nz}gcl75ox=PGgHg`FUF
z5E}lYkKnLaj_efLT|6k7!p<~*yJPMe#dlHyllmy?+E9z?wOwOm2$r;8JGaH(ST^dA
zG}AphK<u$5pU5WlF@$lt7GdODry7SP)iJb082RwfwYxZbO6jMv=u#;E1_~W><q4<r
z9dmPYYcFb9cT%+;f}V4XmyOI6g4Cqjc7f(dAM2c9K4H>joSA6`*rkvvp0Dj0&(jN5
zX5a1{fJirKgCH!m*4vfCD*>0*DqX6$L>cp70O^Cc1(R?koR{9fH_m%Vj)6zcBHMo&
zA;s5yPbtnCO>9-bXnw~(n>ux;7_uX>8p^wdUoP{RKMP8!A$+?=Xo|b00^fN3!GC#g
j1z2>8?OAl|jA7AgL=3GE>HNFp=K*Mc?18F%QJ4M#6hEc7

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1PredicatedTileStoreStream-members.html b/docs/structcutlass_1_1PredicatedTileStoreStream-members.html
new file mode 100644
index 000000000..647f8fa75
--- /dev/null
+++ b/docs/structcutlass_1_1PredicatedTileStoreStream-members.html
@@ -0,0 +1,112 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">PredicatedTileStoreStream</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a165a0d486f53fb2315d4e555c9f59891">commit</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350">copy</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a1d33da4593ae68e6301df54b310a70a0">copy</a>(Fragment const &amp;frag)</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">fragment</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a6c9737f5b09e7eb1aa7daabb00ae2e69">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">intermediate_fragment</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a0ba9097d54f3ba7b7dab12012631fa76">Iterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">Params</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ac4aafc6bcc6cf3bff5b31b9cd60fd667">PredicatedTileStoreStream</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f">PredicateFunctor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe">predicates</a></td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">source_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">TileStoreStream</a>(Params const &amp;_params, TensorRef const &amp;_ref)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084">TileStoreStream</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">transformed_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#af349831b19bb91d414a83c67d14f6927">TransformedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">transformer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a0f91f328ed2b6bd65ef4eeafe18f9afd">Transformer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1PredicatedTileStoreStream.html b/docs/structcutlass_1_1PredicatedTileStoreStream.html
new file mode 100644
index 000000000..b2c31fd87
--- /dev/null
+++ b/docs/structcutlass_1_1PredicatedTileStoreStream.html
@@ -0,0 +1,466 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">PredicatedTileStoreStream</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1PredicatedTileStoreStream-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Generic stream for transforming and storing fragments.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__stream_8h_source.html">tile_stream.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1PredicatedTileStoreStream.png" usemap="#cutlass::PredicatedTileStoreStream_3C_20Iterator_5F_2C_20PredicateFunctor_5F_2C_20Transformer_5F_20_3E_map" alt=""/>
+  <map id="cutlass::PredicatedTileStoreStream_3C_20Iterator_5F_2C_20PredicateFunctor_5F_2C_20Transformer_5F_20_3E_map" name="cutlass::PredicatedTileStoreStream_3C_20Iterator_5F_2C_20PredicateFunctor_5F_2C_20Transformer_5F_20_3E_map">
+<area href="structcutlass_1_1TileStoreStream.html" title="Generic stream for transforming and storing fragments. " alt="cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;" shape="rect" coords="0,0,477,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:afc320f4d29f05102e9de0064ca31e49b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b">Base</a></td></tr>
+<tr class="separator:afc320f4d29f05102e9de0064ca31e49b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0ba9097d54f3ba7b7dab12012631fa76"><td class="memItemLeft" align="right" valign="top">typedef Iterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a0ba9097d54f3ba7b7dab12012631fa76">Iterator</a></td></tr>
+<tr class="memdesc:a0ba9097d54f3ba7b7dab12012631fa76"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1TileLoadIterator.html" title="An iterator implementing Tile Load Iterator Concept for loading a tile from memory. ">TileLoadIterator</a>.  <a href="#a0ba9097d54f3ba7b7dab12012631fa76">More...</a><br /></td></tr>
+<tr class="separator:a0ba9097d54f3ba7b7dab12012631fa76"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa6d4c263e057678b9f1b8ba6a9feb59f"><td class="memItemLeft" align="right" valign="top">typedef PredicateFunctor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f">PredicateFunctor</a></td></tr>
+<tr class="memdesc:aa6d4c263e057678b9f1b8ba6a9feb59f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Predicate functor.  <a href="#aa6d4c263e057678b9f1b8ba6a9feb59f">More...</a><br /></td></tr>
+<tr class="separator:aa6d4c263e057678b9f1b8ba6a9feb59f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0f91f328ed2b6bd65ef4eeafe18f9afd"><td class="memItemLeft" align="right" valign="top">typedef Transformer_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a0f91f328ed2b6bd65ef4eeafe18f9afd">Transformer</a></td></tr>
+<tr class="memdesc:a0f91f328ed2b6bd65ef4eeafe18f9afd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformer.  <a href="#a0f91f328ed2b6bd65ef4eeafe18f9afd">More...</a><br /></td></tr>
+<tr class="separator:a0f91f328ed2b6bd65ef4eeafe18f9afd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6c9737f5b09e7eb1aa7daabb00ae2e69"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a6c9737f5b09e7eb1aa7daabb00ae2e69">Fragment</a></td></tr>
+<tr class="memdesc:a6c9737f5b09e7eb1aa7daabb00ae2e69"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> fetched from source memory.  <a href="#a6c9737f5b09e7eb1aa7daabb00ae2e69">More...</a><br /></td></tr>
+<tr class="separator:a6c9737f5b09e7eb1aa7daabb00ae2e69"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af349831b19bb91d414a83c67d14f6927"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">Base::TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#af349831b19bb91d414a83c67d14f6927">TransformedFragment</a></td></tr>
+<tr class="memdesc:af349831b19bb91d414a83c67d14f6927"><td class="mdescLeft">&#160;</td><td class="mdescRight">Output fragment from transformer.  <a href="#af349831b19bb91d414a83c67d14f6927">More...</a><br /></td></tr>
+<tr class="separator:af349831b19bb91d414a83c67d14f6927"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad0c7a51f1b98111ce332ed906601a4ba"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Base::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">Params</a></td></tr>
+<tr class="memdesc:ad0c7a51f1b98111ce332ed906601a4ba"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object used to construct generic load stream.  <a href="#ad0c7a51f1b98111ce332ed906601a4ba">More...</a><br /></td></tr>
+<tr class="separator:ad0c7a51f1b98111ce332ed906601a4ba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1TileStoreStream"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileStoreStream')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memitem:a35009c9a697f20fd5a7ee634de4d6c97 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">typedef Iterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a></td></tr>
+<tr class="memdesc:a35009c9a697f20fd5a7ee634de4d6c97 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1TileLoadIterator.html" title="An iterator implementing Tile Load Iterator Concept for loading a tile from memory. ">TileLoadIterator</a>.  <a href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">More...</a><br /></td></tr>
+<tr class="separator:a35009c9a697f20fd5a7ee634de4d6c97 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa8c192da812ec83329350e5838838f5e inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">typedef Transformer_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a></td></tr>
+<tr class="memdesc:aa8c192da812ec83329350e5838838f5e inherit pub_types_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformer.  <a href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">More...</a><br /></td></tr>
+<tr class="separator:aa8c192da812ec83329350e5838838f5e inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea4357a67b8abef10f91a45e64840878 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">typedef Transformer::InputFragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a></td></tr>
+<tr class="memdesc:aea4357a67b8abef10f91a45e64840878 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source fragment.  <a href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">More...</a><br /></td></tr>
+<tr class="separator:aea4357a67b8abef10f91a45e64840878 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae14c71f6bb331030429d346f0140c993 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">typedef Transformer::OutputFragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a></td></tr>
+<tr class="memdesc:ae14c71f6bb331030429d346f0140c993 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformed fragment, compatible with Iterator::Fragment.  <a href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">More...</a><br /></td></tr>
+<tr class="separator:ae14c71f6bb331030429d346f0140c993 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2255d760e812cfe8e31f114cdb5793fe inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">typedef Iterator::TensorRef&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a></td></tr>
+<tr class="memdesc:a2255d760e812cfe8e31f114cdb5793fe inherit pub_types_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference expected by the underlying iterator.  <a href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">More...</a><br /></td></tr>
+<tr class="separator:a2255d760e812cfe8e31f114cdb5793fe inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa0e894a30d3a979ac56e5134360a08f4 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">typedef Iterator::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">Index</a></td></tr>
+<tr class="memdesc:aa0e894a30d3a979ac56e5134360a08f4 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">More...</a><br /></td></tr>
+<tr class="separator:aa0e894a30d3a979ac56e5134360a08f4 inherit pub_types_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:ac4aafc6bcc6cf3bff5b31b9cd60fd667"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ac4aafc6bcc6cf3bff5b31b9cd60fd667">PredicatedTileStoreStream</a> (<a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;threadblock_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:ac4aafc6bcc6cf3bff5b31b9cd60fd667"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ac4aafc6bcc6cf3bff5b31b9cd60fd667">More...</a><br /></td></tr>
+<tr class="separator:ac4aafc6bcc6cf3bff5b31b9cd60fd667"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae84437a66097189406c2090d88a79350"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350">copy</a> ()</td></tr>
+<tr class="memdesc:ae84437a66097189406c2090d88a79350"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores the fragment and increments the iterator.  <a href="#ae84437a66097189406c2090d88a79350">More...</a><br /></td></tr>
+<tr class="separator:ae84437a66097189406c2090d88a79350"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1d33da4593ae68e6301df54b310a70a0"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a1d33da4593ae68e6301df54b310a70a0">copy</a> (<a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> const &amp;frag)</td></tr>
+<tr class="memdesc:a1d33da4593ae68e6301df54b310a70a0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores the fragment and increments the iterator.  <a href="#a1d33da4593ae68e6301df54b310a70a0">More...</a><br /></td></tr>
+<tr class="separator:a1d33da4593ae68e6301df54b310a70a0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a165a0d486f53fb2315d4e555c9f59891"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a165a0d486f53fb2315d4e555c9f59891">commit</a> ()</td></tr>
+<tr class="memdesc:a165a0d486f53fb2315d4e555c9f59891"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commits the store operation.  <a href="#a165a0d486f53fb2315d4e555c9f59891">More...</a><br /></td></tr>
+<tr class="separator:a165a0d486f53fb2315d4e555c9f59891"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileStoreStream"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileStoreStream')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memitem:af85b3acfc29e41ee605df64b09698a8b inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">TileStoreStream</a> (<a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a> const &amp;_ref)</td></tr>
+<tr class="memdesc:af85b3acfc29e41ee605df64b09698a8b inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">More...</a><br /></td></tr>
+<tr class="separator:af85b3acfc29e41ee605df64b09698a8b inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a08e7e7bf74e1e0d670dd6a4e65d14084 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084">TileStoreStream</a> (<a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;threadblock_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:a08e7e7bf74e1e0d670dd6a4e65d14084 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084">More...</a><br /></td></tr>
+<tr class="separator:a08e7e7bf74e1e0d670dd6a4e65d14084 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a50b6b5bd08fd83baa36c3dc4461ca009 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009">copy</a> ()</td></tr>
+<tr class="memdesc:a50b6b5bd08fd83baa36c3dc4461ca009 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and increments the iterator.  <a href="structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009">More...</a><br /></td></tr>
+<tr class="separator:a50b6b5bd08fd83baa36c3dc4461ca009 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa0f3c75e59054d6229de159474c9c978 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978">copy</a> (<a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> const &amp;frag)</td></tr>
+<tr class="memdesc:aa0f3c75e59054d6229de159474c9c978 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and increments the iterator.  <a href="structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978">More...</a><br /></td></tr>
+<tr class="separator:aa0f3c75e59054d6229de159474c9c978 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab5176fc539364fdf63647dc33020f579 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579">commit</a> ()</td></tr>
+<tr class="memdesc:ab5176fc539364fdf63647dc33020f579 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commits the store operation.  <a href="structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579">More...</a><br /></td></tr>
+<tr class="separator:ab5176fc539364fdf63647dc33020f579 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad6ff1786f85d64053ece0ac8ae9a92b5 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">fragment</a> ()</td></tr>
+<tr class="memdesc:ad6ff1786f85d64053ece0ac8ae9a92b5 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the transformed fragment.  <a href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">More...</a><br /></td></tr>
+<tr class="separator:ad6ff1786f85d64053ece0ac8ae9a92b5 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff77aed0f1b1583b01a427fc935c5d71 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">intermediate_fragment</a> ()</td></tr>
+<tr class="memdesc:aff77aed0f1b1583b01a427fc935c5d71 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the fragment after trasnforming.  <a href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">More...</a><br /></td></tr>
+<tr class="separator:aff77aed0f1b1583b01a427fc935c5d71 inherit pub_methods_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a2ecdfa152dcf7b3acaf8767f3e69cfbe"><td class="memItemLeft" align="right" valign="top">Iterator::PredicateVector&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe">predicates</a></td></tr>
+<tr class="memdesc:a2ecdfa152dcf7b3acaf8767f3e69cfbe"><td class="mdescLeft">&#160;</td><td class="mdescRight">Predicates.  <a href="#a2ecdfa152dcf7b3acaf8767f3e69cfbe">More...</a><br /></td></tr>
+<tr class="separator:a2ecdfa152dcf7b3acaf8767f3e69cfbe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1TileStoreStream"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileStoreStream')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memitem:a601a296ec830e9b98aca9d5cf4b4010c inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a></td></tr>
+<tr class="memdesc:a601a296ec830e9b98aca9d5cf4b4010c inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterator to store tiles.  <a href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">More...</a><br /></td></tr>
+<tr class="separator:a601a296ec830e9b98aca9d5cf4b4010c inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a61d57147150bffda0c1662d6131a3934 inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">transformer</a></td></tr>
+<tr class="memdesc:a61d57147150bffda0c1662d6131a3934 inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformation applied to inputs.  <a href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">More...</a><br /></td></tr>
+<tr class="separator:a61d57147150bffda0c1662d6131a3934 inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0880c28b3ec82d38571ed332451c8d6a inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">source_fragment</a></td></tr>
+<tr class="memdesc:a0880c28b3ec82d38571ed332451c8d6a inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source fragment.  <a href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">More...</a><br /></td></tr>
+<tr class="separator:a0880c28b3ec82d38571ed332451c8d6a inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb5be2edcc35c7876abe5234663f9c48 inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">transformed_fragment</a></td></tr>
+<tr class="memdesc:aeb5be2edcc35c7876abe5234663f9c48 inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformed fragment from transformer.  <a href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">More...</a><br /></td></tr>
+<tr class="separator:aeb5be2edcc35c7876abe5234663f9c48 inherit pub_attribs_structcutlass_1_1TileStoreStream"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="afc320f4d29f05102e9de0064ca31e49b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afc320f4d29f05102e9de0064ca31e49b">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a>&lt;Iterator_, Transformer_&gt; <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6c9737f5b09e7eb1aa7daabb00ae2e69"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6c9737f5b09e7eb1aa7daabb00ae2e69">&#9670;&nbsp;</a></span>Fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Base::Fragment</a> <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0ba9097d54f3ba7b7dab12012631fa76"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0ba9097d54f3ba7b7dab12012631fa76">&#9670;&nbsp;</a></span>Iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator_ <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad0c7a51f1b98111ce332ed906601a4ba"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad0c7a51f1b98111ce332ed906601a4ba">&#9670;&nbsp;</a></span>Params</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Base::Params</a> <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">Params</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa6d4c263e057678b9f1b8ba6a9feb59f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa6d4c263e057678b9f1b8ba6a9feb59f">&#9670;&nbsp;</a></span>PredicateFunctor</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef PredicateFunctor_ <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f">PredicateFunctor</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af349831b19bb91d414a83c67d14f6927"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af349831b19bb91d414a83c67d14f6927">&#9670;&nbsp;</a></span>TransformedFragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">Base::TransformedFragment</a> <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0f91f328ed2b6bd65ef4eeafe18f9afd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0f91f328ed2b6bd65ef4eeafe18f9afd">&#9670;&nbsp;</a></span>Transformer</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Transformer_ <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ac4aafc6bcc6cf3bff5b31b9cd60fd667"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac4aafc6bcc6cf3bff5b31b9cd60fd667">&#9670;&nbsp;</a></span>PredicatedTileStoreStream()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">PredicatedTileStoreStream</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>bounds</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>threadblock_offset</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;0,&#160;0)</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a165a0d486f53fb2315d4e555c9f59891"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a165a0d486f53fb2315d4e555c9f59891">&#9670;&nbsp;</a></span>commit()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::commit </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae84437a66097189406c2090d88a79350"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae84437a66097189406c2090d88a79350">&#9670;&nbsp;</a></span>copy() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::copy </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1d33da4593ae68e6301df54b310a70a0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1d33da4593ae68e6301df54b310a70a0">&#9670;&nbsp;</a></span>copy() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::copy </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>frag</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a2ecdfa152dcf7b3acaf8767f3e69cfbe"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2ecdfa152dcf7b3acaf8767f3e69cfbe">&#9670;&nbsp;</a></span>predicates</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename PredicateFunctor_  = RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;, typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">Iterator::PredicateVector <a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a>&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;::predicates</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__stream_8h_source.html">tile_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1PredicatedTileStoreStream.png b/docs/structcutlass_1_1PredicatedTileStoreStream.png
new file mode 100644
index 0000000000000000000000000000000000000000..8563ea0bad955855baf44bd26faac9b7af431b24
GIT binary patch
literal 1350
zcmb`HeN>WX7{*_6_F>C)RtwFvRcxhYOwD9C-7L#qR;VN)6S2*cnuMJU5G~B<v1Q*;
zSc*s`mLCafq8rG^v}B}s5JdBX;ij2Zpwr2RrtWS3ZRhO2J?GrdeLd$~=f3~Ae&;EO
z!bYreS?>Y>z$)-SI1T_{Mo333cY<z;B*6kTx2S_L`xX}$AvrlS_MnA+9a4XnQmKrs
zV;+H?%V{|5VE{6{JBDX5{s8cv0Spg|VZzKjGh^82{e3|y%FO&m$ESX7Pksnd?;0oJ
z<4cZ5xP9Mn!`|LVjY}D5)ZBZH@J4`^wX{#v)wx1MCSJ=yh+HJ>5j?+~>$R7igqe%9
z8Cn}i8KK)jSz$8D7VWwfJk7&mbT4O+T~vRPBI_+3JEE%=pvi(WR}$C@ellKKO-)?1
zCBKO3sON4s>HP5ydnD0j|E{EFG?9^;{$<-3r53~PN(+$ouC6Z^inx3<N6<8Gqy^;8
zQl|K+)N!xd_YsEJw!R)xc8HFzNa=4G>>b17f~(42C4lr;(XnZc{sY=nq&Dz+^}Y0>
zo-|(#t{lXP&;v!Bm<X==#?yYEN_VT$x)TKRge7v`#5Ju<Tva@UPnMr+=$uDUI_5<F
zv%c#m%ITq?EjD@r%kDm2&k-=1izXtq)K@~JNyvc9`e%7Z-J7_EG{UJ!t+`lT_4sle
zn0o$Fzc0Z)VvNriT_a&I*w&tT;zs+|61W!u>)9-|$#3oLTk%p(WDXDvI-ltX59GSx
zrp|AsWm{~wA2Rv&{<#c_C#I7zYE+mz%vsZ`H53B-*QzExN3bZ)1}-94m!L2X(N4Pj
zq&lFpRiHS6$Zca7Ho-X_oT|FJ9VCDBkH92d#zyK&>OiAojS{JYf3;kBFL!6oVHV4o
z4Dekf0G6KT!Gw`~#+KOewa$}OcUKPK!{Ewl$OMf9puhoWBCHuQF!9>|#bDYWRDNrZ
zclk&ZB4>3@@V~bhaxEI>{t)9i0Iew`wo(=I59f9VlTKuXuGCW8mHF3tH@9zsT}GSg
z1WreVdN4;!7D!Pun~~L=Ls`NC(uNf&s&-n!#W&sKFDj9fPR$jVrb1Pj+^Vpi(JxR=
z*WMoT<DbrQdnRzSK>QsK6$&+v`szwyDJrj4h`uFerf<DfVo4?;hDHkSFez=1Ar5~l
zMT=?I^1@P=7C5$b6^mw%mGMh0r^+xF+Wb2i!AblV{oNj@tc_O#sF}!!BsK~(rK|FU
z1sB3ScVGR`@~pD5<-G8F(yBml>+9|lA&)k&&kjzlFrKXlE&jGK;ATbH>zzE2m_BO>
zg%invJH}4#P=3rcWwVx`<MX=){|J!0(CRx$Co|KESgx+p`4*jTU&&~8N#Lj?%$(Fi
zxJjR$DYmrVIOH+(m`1(-fFRjFxO7>=a0+89jjMCt8w96B&m3-zl3pTH<0IL-O6f<W
ziJKNaHzseMbCs}e#{F6Ehq~)N-ETJCQA?%2{A`j-x6;gS>Jv*9QjwlzHHx1uEDIKn
zlb_V4qt9ea<d?pj((|Ys^~k)pSwQStZz+uU(G2&j86Lo~G_65g@n{GzhiJ^Sob4Mv
zSRr3WjK?d!kjtOfO?0>yjK4!Wt&@_m2R>wbHBGcXxvD6!$h=3EI#0r6$5g+s{cKC>
le^6++l7{il$6?g`1t(`xV((iAx&!+30B|2RT)5|G?q4SYv*G{%

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1RegularTilePredicateFunctor-members.html b/docs/structcutlass_1_1RegularTilePredicateFunctor-members.html
new file mode 100644
index 000000000..327913ca5
--- /dev/null
+++ b/docs/structcutlass_1_1RegularTilePredicateFunctor-members.html
@@ -0,0 +1,94 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">RegularTilePredicateFunctor</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">bounds</a></td><td class="entry"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#a084c0a2732827a74f7a30873c5883827">operator()</a>(Coord&lt; 3 &gt; iteration, Coord&lt; 3 &gt; offset) const</td><td class="entry"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#a0e0b728d3685097a9280fbca6a47a2af">RegularTilePredicateFunctor</a>(Coord&lt; 3 &gt; _bounds)</td><td class="entry"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1RegularTilePredicateFunctor.html b/docs/structcutlass_1_1RegularTilePredicateFunctor.html
new file mode 100644
index 000000000..2ea8c91ff
--- /dev/null
+++ b/docs/structcutlass_1_1RegularTilePredicateFunctor.html
@@ -0,0 +1,223 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">RegularTilePredicateFunctor</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1RegularTilePredicateFunctor-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Functor computing a predicate given the logical position of an access.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:acd32282ce7852c4669098c06bcd9a360"><td class="memItemLeft" align="right" valign="top">typedef Delta_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360">Delta</a></td></tr>
+<tr class="separator:acd32282ce7852c4669098c06bcd9a360"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a0e0b728d3685097a9280fbca6a47a2af"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#a0e0b728d3685097a9280fbca6a47a2af">RegularTilePredicateFunctor</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; _bounds)</td></tr>
+<tr class="memdesc:a0e0b728d3685097a9280fbca6a47a2af"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a predicate functor given the bounds of a tensor.  <a href="#a0e0b728d3685097a9280fbca6a47a2af">More...</a><br /></td></tr>
+<tr class="separator:a0e0b728d3685097a9280fbca6a47a2af"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a084c0a2732827a74f7a30873c5883827"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#a084c0a2732827a74f7a30873c5883827">operator()</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; iteration, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; offset) const</td></tr>
+<tr class="memdesc:a084c0a2732827a74f7a30873c5883827"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the predicate given the logical position of an access.  <a href="#a084c0a2732827a74f7a30873c5883827">More...</a><br /></td></tr>
+<tr class="separator:a084c0a2732827a74f7a30873c5883827"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:ac2f49374e6f0a27ad2daffcb1f74708a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">bounds</a></td></tr>
+<tr class="memdesc:ac2f49374e6f0a27ad2daffcb1f74708a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Dimensions of the bounding volume.  <a href="#ac2f49374e6f0a27ad2daffcb1f74708a">More...</a><br /></td></tr>
+<tr class="separator:ac2f49374e6f0a27ad2daffcb1f74708a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="acd32282ce7852c4669098c06bcd9a360"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acd32282ce7852c4669098c06bcd9a360">&#9670;&nbsp;</a></span>Delta</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Delta_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Delta_ <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor</a>&lt; Delta_ &gt;::<a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360">Delta</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a0e0b728d3685097a9280fbca6a47a2af"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0e0b728d3685097a9280fbca6a47a2af">&#9670;&nbsp;</a></span>RegularTilePredicateFunctor()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Delta_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor</a>&lt; Delta_ &gt;::<a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">RegularTilePredicateFunctor</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td>
+          <td class="paramname"><em>_bounds</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a084c0a2732827a74f7a30873c5883827"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a084c0a2732827a74f7a30873c5883827">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Delta_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor</a>&lt; Delta_ &gt;::operator() </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td>
+          <td class="paramname"><em>iteration</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="ac2f49374e6f0a27ad2daffcb1f74708a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac2f49374e6f0a27ad2daffcb1f74708a">&#9670;&nbsp;</a></span>bounds</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Delta_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor</a>&lt; Delta_ &gt;::bounds</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ReshapeTile-members.html b/docs/structcutlass_1_1ReshapeTile-members.html
index 03567994b..29ee1fde5 100644
--- a/docs/structcutlass_1_1ReshapeTile-members.html
+++ b/docs/structcutlass_1_1ReshapeTile-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ReshapeTile.html b/docs/structcutlass_1_1ReshapeTile.html
index 936510b30..5c4a6c3b3 100644
--- a/docs/structcutlass_1_1ReshapeTile.html
+++ b/docs/structcutlass_1_1ReshapeTile.html
@@ -110,7 +110,7 @@ template&lt;typename Tile_, int kAccessSize_, bool  = (Tile_::kC &lt; kAccessSiz
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4-members.html b/docs/structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4-members.html
index 649f85d41..579c1fd68 100644
--- a/docs/structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4-members.html
+++ b/docs/structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html b/docs/structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html
index e7acf274d..3d2b1724f 100644
--- a/docs/structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html
+++ b/docs/structcutlass_1_1ReshapeTile_3_01Tile___00_01kAccessSize___00_01true_01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Tile_ , int kAccessSize_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ScalarIO-members.html b/docs/structcutlass_1_1ScalarIO-members.html
new file mode 100644
index 000000000..4828a33ba
--- /dev/null
+++ b/docs/structcutlass_1_1ScalarIO-members.html
@@ -0,0 +1,93 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::ScalarIO&lt; T &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1ScalarIO.html">cutlass::ScalarIO&lt; T &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ScalarIO.html#ad4166575521254088bf6c6300c351714">ScalarIO</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1ScalarIO.html">cutlass::ScalarIO&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ScalarIO.html#a5227e1e9ed24326ad4f8dc94d186186f">ScalarIO</a>(T value)</td><td class="entry"><a class="el" href="structcutlass_1_1ScalarIO.html">cutlass::ScalarIO&lt; T &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">value</a></td><td class="entry"><a class="el" href="structcutlass_1_1ScalarIO.html">cutlass::ScalarIO&lt; T &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ScalarIO.html b/docs/structcutlass_1_1ScalarIO.html
new file mode 100644
index 000000000..cb186c397
--- /dev/null
+++ b/docs/structcutlass_1_1ScalarIO.html
@@ -0,0 +1,188 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::ScalarIO&lt; T &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1ScalarIO-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::ScalarIO&lt; T &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Helper to enable formatted printing of CUTLASS scalar types to an ostream.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="core__io_8h_source.html">core_io.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:ad4166575521254088bf6c6300c351714"><td class="memItemLeft" align="right" valign="top">&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ScalarIO.html#ad4166575521254088bf6c6300c351714">ScalarIO</a> ()</td></tr>
+<tr class="memdesc:ad4166575521254088bf6c6300c351714"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor.  <a href="#ad4166575521254088bf6c6300c351714">More...</a><br /></td></tr>
+<tr class="separator:ad4166575521254088bf6c6300c351714"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5227e1e9ed24326ad4f8dc94d186186f"><td class="memItemLeft" align="right" valign="top">&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ScalarIO.html#a5227e1e9ed24326ad4f8dc94d186186f">ScalarIO</a> (T <a class="el" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">value</a>)</td></tr>
+<tr class="memdesc:a5227e1e9ed24326ad4f8dc94d186186f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from a value.  <a href="#a5227e1e9ed24326ad4f8dc94d186186f">More...</a><br /></td></tr>
+<tr class="separator:a5227e1e9ed24326ad4f8dc94d186186f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a76d2822161aef20f85c3798b855ca9dd"><td class="memItemLeft" align="right" valign="top">T&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ScalarIO.html#a76d2822161aef20f85c3798b855ca9dd">value</a></td></tr>
+<tr class="memdesc:a76d2822161aef20f85c3798b855ca9dd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Value to print.  <a href="#a76d2822161aef20f85c3798b855ca9dd">More...</a><br /></td></tr>
+<tr class="separator:a76d2822161aef20f85c3798b855ca9dd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ad4166575521254088bf6c6300c351714"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad4166575521254088bf6c6300c351714">&#9670;&nbsp;</a></span>ScalarIO() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ScalarIO.html">cutlass::ScalarIO</a>&lt; T &gt;::<a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5227e1e9ed24326ad4f8dc94d186186f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5227e1e9ed24326ad4f8dc94d186186f">&#9670;&nbsp;</a></span>ScalarIO() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ScalarIO.html">cutlass::ScalarIO</a>&lt; T &gt;::<a class="el" href="structcutlass_1_1ScalarIO.html">ScalarIO</a> </td>
+          <td>(</td>
+          <td class="paramtype">T&#160;</td>
+          <td class="paramname"><em>value</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a76d2822161aef20f85c3798b855ca9dd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a76d2822161aef20f85c3798b855ca9dd">&#9670;&nbsp;</a></span>value</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename T &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">T <a class="el" href="structcutlass_1_1ScalarIO.html">cutlass::ScalarIO</a>&lt; T &gt;::value</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="core__io_8h_source.html">core_io.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Shape-members.html b/docs/structcutlass_1_1Shape-members.html
index 629b6d0de..ccbdefb65 100644
--- a/docs/structcutlass_1_1Shape-members.html
+++ b/docs/structcutlass_1_1Shape-members.html
@@ -86,7 +86,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Shape.html b/docs/structcutlass_1_1Shape.html
index e0d5b53fe..d6df8f9f2 100644
--- a/docs/structcutlass_1_1Shape.html
+++ b/docs/structcutlass_1_1Shape.html
@@ -203,7 +203,7 @@ template&lt;int kD_ = 1, int kH_ = 1, int kW_ = 1, int kC_ = 1&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeAdd-members.html b/docs/structcutlass_1_1ShapeAdd-members.html
index a7c0d6c42..35d9ac771 100644
--- a/docs/structcutlass_1_1ShapeAdd-members.html
+++ b/docs/structcutlass_1_1ShapeAdd-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeAdd.html b/docs/structcutlass_1_1ShapeAdd.html
index 438ecfcff..eea44133d 100644
--- a/docs/structcutlass_1_1ShapeAdd.html
+++ b/docs/structcutlass_1_1ShapeAdd.html
@@ -110,7 +110,7 @@ template&lt;typename A_ , typename B_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeCount-members.html b/docs/structcutlass_1_1ShapeCount-members.html
index 18ff7b21f..4daed24e8 100644
--- a/docs/structcutlass_1_1ShapeCount-members.html
+++ b/docs/structcutlass_1_1ShapeCount-members.html
@@ -88,7 +88,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeCount.html b/docs/structcutlass_1_1ShapeCount.html
index 52f180e35..f0f166239 100644
--- a/docs/structcutlass_1_1ShapeCount.html
+++ b/docs/structcutlass_1_1ShapeCount.html
@@ -257,7 +257,7 @@ template&lt;typename Shape&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeDiv-members.html b/docs/structcutlass_1_1ShapeDiv-members.html
index 45aa63295..7deb95925 100644
--- a/docs/structcutlass_1_1ShapeDiv-members.html
+++ b/docs/structcutlass_1_1ShapeDiv-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeDiv.html b/docs/structcutlass_1_1ShapeDiv.html
index 46eb5608e..7e6fa73e1 100644
--- a/docs/structcutlass_1_1ShapeDiv.html
+++ b/docs/structcutlass_1_1ShapeDiv.html
@@ -110,7 +110,7 @@ template&lt;typename A_, typename B_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeDivCeiling-members.html b/docs/structcutlass_1_1ShapeDivCeiling-members.html
new file mode 100644
index 000000000..e520eb28f
--- /dev/null
+++ b/docs/structcutlass_1_1ShapeDivCeiling-members.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ShapeDivCeiling.html">ShapeDivCeiling</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::ShapeDivCeiling&lt; A_, B_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1ShapeDivCeiling.html">cutlass::ShapeDivCeiling&lt; A_, B_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">Shape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ShapeDivCeiling.html">cutlass::ShapeDivCeiling&lt; A_, B_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ShapeDivCeiling.html b/docs/structcutlass_1_1ShapeDivCeiling.html
new file mode 100644
index 000000000..84faee307
--- /dev/null
+++ b/docs/structcutlass_1_1ShapeDivCeiling.html
@@ -0,0 +1,118 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::ShapeDivCeiling&lt; A_, B_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ShapeDivCeiling.html">ShapeDivCeiling</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="structcutlass_1_1ShapeDivCeiling-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::ShapeDivCeiling&lt; A_, B_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="shape_8h_source.html">shape.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a0e3b032e241a8ead89e1d9ffb472d799"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">Shape</a>&lt;(A_::kD+B_::kD - 1)/B_::kD,(A_::kH+B_::kH - 1)/B_::kH,(A_::kW+B_::kW - 1)/B_::kW,(A_::kC+B_::kC - 1)/B_::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">Shape</a></td></tr>
+<tr class="separator:a0e3b032e241a8ead89e1d9ffb472d799"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a0e3b032e241a8ead89e1d9ffb472d799"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0e3b032e241a8ead89e1d9ffb472d799">&#9670;&nbsp;</a></span>Shape</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename A_ , typename B_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">Shape</a>&lt;(A_::kD + B_::kD - 1) / B_::kD, (A_::kH + B_::kH - 1) / B_::kH, (A_::kW + B_::kW - 1) / B_::kW, (A_::kC + B_::kC - 1) / B_::kC&gt; <a class="el" href="structcutlass_1_1ShapeDivCeiling.html">cutlass::ShapeDivCeiling</a>&lt; A_, B_ &gt;::<a class="el" href="structcutlass_1_1ShapeDivCeiling.html#a0e3b032e241a8ead89e1d9ffb472d799">Shape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="shape_8h_source.html">shape.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ShapeMax-members.html b/docs/structcutlass_1_1ShapeMax-members.html
index 6c7119c7e..09ddca9eb 100644
--- a/docs/structcutlass_1_1ShapeMax-members.html
+++ b/docs/structcutlass_1_1ShapeMax-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeMax.html b/docs/structcutlass_1_1ShapeMax.html
index f2f81b900..096a05a65 100644
--- a/docs/structcutlass_1_1ShapeMax.html
+++ b/docs/structcutlass_1_1ShapeMax.html
@@ -110,7 +110,7 @@ template&lt;typename A_ , typename B_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeMin-members.html b/docs/structcutlass_1_1ShapeMin-members.html
index ce2f15bb9..44c120214 100644
--- a/docs/structcutlass_1_1ShapeMin-members.html
+++ b/docs/structcutlass_1_1ShapeMin-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeMin.html b/docs/structcutlass_1_1ShapeMin.html
index 8cd3b4cf8..3a1e8fb0b 100644
--- a/docs/structcutlass_1_1ShapeMin.html
+++ b/docs/structcutlass_1_1ShapeMin.html
@@ -110,7 +110,7 @@ template&lt;typename A_ , typename B_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeMul-members.html b/docs/structcutlass_1_1ShapeMul-members.html
index 75cf214ca..70cb98979 100644
--- a/docs/structcutlass_1_1ShapeMul-members.html
+++ b/docs/structcutlass_1_1ShapeMul-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeMul.html b/docs/structcutlass_1_1ShapeMul.html
index 93d28b06d..2a7aea61d 100644
--- a/docs/structcutlass_1_1ShapeMul.html
+++ b/docs/structcutlass_1_1ShapeMul.html
@@ -110,7 +110,7 @@ template&lt;typename A_, typename B_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeScale-members.html b/docs/structcutlass_1_1ShapeScale-members.html
index 1ba06a848..ef9472502 100644
--- a/docs/structcutlass_1_1ShapeScale-members.html
+++ b/docs/structcutlass_1_1ShapeScale-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeScale.html b/docs/structcutlass_1_1ShapeScale.html
index 5056a89d4..6873a996e 100644
--- a/docs/structcutlass_1_1ShapeScale.html
+++ b/docs/structcutlass_1_1ShapeScale.html
@@ -110,7 +110,7 @@ template&lt;typename A_ , int kScale_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeStrides-members.html b/docs/structcutlass_1_1ShapeStrides-members.html
index 0ca76c50b..7ab093636 100644
--- a/docs/structcutlass_1_1ShapeStrides-members.html
+++ b/docs/structcutlass_1_1ShapeStrides-members.html
@@ -73,17 +73,17 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::ShapeStrides&lt; Shape_ &gt; Member List</div>  </div>
+<div class="title">cutlass::ShapeStrides&lt; Shape_, elementsPerAccess &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides&lt; Shape_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides&lt; Shape_, elementsPerAccess &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">Shape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides&lt; Shape_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">Shape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides&lt; Shape_, elementsPerAccess &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeStrides.html b/docs/structcutlass_1_1ShapeStrides.html
index 4328a3527..9d3882b4b 100644
--- a/docs/structcutlass_1_1ShapeStrides.html
+++ b/docs/structcutlass_1_1ShapeStrides.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::ShapeStrides&lt; Shape_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::ShapeStrides&lt; Shape_, elementsPerAccess &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -76,7 +76,7 @@ $(function() {
 <a href="#pub-types">Public Types</a> &#124;
 <a href="structcutlass_1_1ShapeStrides-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::ShapeStrides&lt; Shape_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::ShapeStrides&lt; Shape_, elementsPerAccess &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -84,20 +84,20 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:ac6fcda9b8e1782f24c1e6d67cd880a6a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">Shape</a>&lt; Shape_::kH *Shape_::kW *Shape_::kC, Shape_::kW *Shape_::kC, Shape_::kC, 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">Shape</a></td></tr>
-<tr class="separator:ac6fcda9b8e1782f24c1e6d67cd880a6a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a76cde4c3ebd1d191e0191826b2663be4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">Shape</a>&lt; Shape_::kH *Shape_::kW *Shape_::kC, Shape_::kW *Shape_::kC, Shape_::kC, elementsPerAccess &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">Shape</a></td></tr>
+<tr class="separator:a76cde4c3ebd1d191e0191826b2663be4"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="ac6fcda9b8e1782f24c1e6d67cd880a6a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac6fcda9b8e1782f24c1e6d67cd880a6a">&#9670;&nbsp;</a></span>Shape</h2>
+<a id="a76cde4c3ebd1d191e0191826b2663be4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a76cde4c3ebd1d191e0191826b2663be4">&#9670;&nbsp;</a></span>Shape</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Shape_&gt; </div>
+template&lt;typename Shape_, int elementsPerAccess&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">Shape</a>&lt;Shape_::kH * Shape_::kW * Shape_::kC, Shape_::kW * Shape_::kC, Shape_::kC, 1&gt; <a class="el" href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides</a>&lt; Shape_ &gt;::<a class="el" href="structcutlass_1_1ShapeStrides.html#ac6fcda9b8e1782f24c1e6d67cd880a6a">Shape</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">Shape</a>&lt;Shape_::kH * Shape_::kW * Shape_::kC, Shape_::kW * Shape_::kC, Shape_::kC, elementsPerAccess&gt; <a class="el" href="structcutlass_1_1ShapeStrides.html">cutlass::ShapeStrides</a>&lt; Shape_, elementsPerAccess &gt;::<a class="el" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">Shape</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -110,7 +110,7 @@ template&lt;typename Shape_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeSub-members.html b/docs/structcutlass_1_1ShapeSub-members.html
index 666b9cf09..d5b1f97f9 100644
--- a/docs/structcutlass_1_1ShapeSub-members.html
+++ b/docs/structcutlass_1_1ShapeSub-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1ShapeSub.html b/docs/structcutlass_1_1ShapeSub.html
index 81064ec15..8b5589b5f 100644
--- a/docs/structcutlass_1_1ShapeSub.html
+++ b/docs/structcutlass_1_1ShapeSub.html
@@ -110,7 +110,7 @@ template&lt;typename A_ , typename B_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1StorageType-members.html b/docs/structcutlass_1_1StorageType-members.html
index 69e4ddfd0..8672a7be5 100644
--- a/docs/structcutlass_1_1StorageType-members.html
+++ b/docs/structcutlass_1_1StorageType-members.html
@@ -73,17 +73,17 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::StorageType&lt; kAlignment_ &gt; Member List</div>  </div>
+<div class="title">cutlass::StorageType&lt; alignment &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1StorageType.html">cutlass::StorageType&lt; kAlignment_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1StorageType.html">cutlass::StorageType&lt; alignment &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06">Type</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1StorageType.html">cutlass::StorageType&lt; kAlignment_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b">Type</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1StorageType.html">cutlass::StorageType&lt; alignment &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1StorageType.html b/docs/structcutlass_1_1StorageType.html
index 9205f95cc..7b30d252f 100644
--- a/docs/structcutlass_1_1StorageType.html
+++ b/docs/structcutlass_1_1StorageType.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::StorageType&lt; kAlignment_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::StorageType&lt; alignment &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -76,7 +76,7 @@ $(function() {
 <a href="#pub-types">Public Types</a> &#124;
 <a href="structcutlass_1_1StorageType-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::StorageType&lt; kAlignment_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::StorageType&lt; alignment &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -84,20 +84,20 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:a2b9c99ae52eb4962428f776efc1e7f06"><td class="memItemLeft" align="right" valign="top">typedef uint64_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06">Type</a></td></tr>
-<tr class="separator:a2b9c99ae52eb4962428f776efc1e7f06"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abb0d270cdf38d46347261cac36dc619b"><td class="memItemLeft" align="right" valign="top">typedef uint64_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b">Type</a></td></tr>
+<tr class="separator:abb0d270cdf38d46347261cac36dc619b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a2b9c99ae52eb4962428f776efc1e7f06"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2b9c99ae52eb4962428f776efc1e7f06">&#9670;&nbsp;</a></span>Type</h2>
+<a id="abb0d270cdf38d46347261cac36dc619b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abb0d270cdf38d46347261cac36dc619b">&#9670;&nbsp;</a></span>Type</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;int kAlignment_&gt; </div>
+template&lt;int alignment&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef uint64_t <a class="el" href="structcutlass_1_1StorageType.html">cutlass::StorageType</a>&lt; kAlignment_ &gt;::<a class="el" href="structcutlass_1_1StorageType.html#a2b9c99ae52eb4962428f776efc1e7f06">Type</a></td>
+          <td class="memname">typedef uint64_t <a class="el" href="structcutlass_1_1StorageType.html">cutlass::StorageType</a>&lt; alignment &gt;::<a class="el" href="structcutlass_1_1StorageType.html#abb0d270cdf38d46347261cac36dc619b">Type</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -110,7 +110,7 @@ template&lt;int kAlignment_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1StorageType_3_011_01_4-members.html b/docs/structcutlass_1_1StorageType_3_011_01_4-members.html
index 401d5fc0c..383981683 100644
--- a/docs/structcutlass_1_1StorageType_3_011_01_4-members.html
+++ b/docs/structcutlass_1_1StorageType_3_011_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1StorageType_3_011_01_4.html b/docs/structcutlass_1_1StorageType_3_011_01_4.html
index ceab6b032..ecef1bc2a 100644
--- a/docs/structcutlass_1_1StorageType_3_011_01_4.html
+++ b/docs/structcutlass_1_1StorageType_3_011_01_4.html
@@ -108,7 +108,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1StorageType_3_012_01_4-members.html b/docs/structcutlass_1_1StorageType_3_012_01_4-members.html
index ac8127c9b..ae4e0451c 100644
--- a/docs/structcutlass_1_1StorageType_3_012_01_4-members.html
+++ b/docs/structcutlass_1_1StorageType_3_012_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1StorageType_3_012_01_4.html b/docs/structcutlass_1_1StorageType_3_012_01_4.html
index 846487257..3c9d5b3d2 100644
--- a/docs/structcutlass_1_1StorageType_3_012_01_4.html
+++ b/docs/structcutlass_1_1StorageType_3_012_01_4.html
@@ -108,7 +108,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1StorageType_3_014_01_4-members.html b/docs/structcutlass_1_1StorageType_3_014_01_4-members.html
index bf78873c4..4a6a49f38 100644
--- a/docs/structcutlass_1_1StorageType_3_014_01_4-members.html
+++ b/docs/structcutlass_1_1StorageType_3_014_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1StorageType_3_014_01_4.html b/docs/structcutlass_1_1StorageType_3_014_01_4.html
index 74751e577..3640ba5ff 100644
--- a/docs/structcutlass_1_1StorageType_3_014_01_4.html
+++ b/docs/structcutlass_1_1StorageType_3_014_01_4.html
@@ -108,7 +108,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Store-members.html b/docs/structcutlass_1_1Store-members.html
index f942adf61..909907277 100644
--- a/docs/structcutlass_1_1Store-members.html
+++ b/docs/structcutlass_1_1Store-members.html
@@ -73,18 +73,18 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt; Member List</div>  </div>
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Store.html">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Store.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Store.html">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf">store</a>(AccessType const &amp;src, Scalar_ *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Store.html">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Store.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Store.html#a187b63f682f7f00f8bf9ed3ee59d602f">store</a>(AccessType const &amp;src, Scalar_ *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Store.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Store.html b/docs/structcutlass_1_1Store.html
index 057010d12..893444c28 100644
--- a/docs/structcutlass_1_1Store.html
+++ b/docs/structcutlass_1_1Store.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,7 +77,7 @@ $(function() {
 <a href="#pub-static-methods">Static Public Member Functions</a> &#124;
 <a href="structcutlass_1_1Store-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::Store&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -85,27 +85,27 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:a8d2f927b2b61987dcea40e84f4575942"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, Lanes_ &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">AccessType</a></td></tr>
-<tr class="memdesc:a8d2f927b2b61987dcea40e84f4575942"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a8d2f927b2b61987dcea40e84f4575942">More...</a><br /></td></tr>
-<tr class="separator:a8d2f927b2b61987dcea40e84f4575942"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a82acff2a97f8e08d040b4e603419c2c7"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; FragmentElement_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">AccessType</a></td></tr>
+<tr class="memdesc:a82acff2a97f8e08d040b4e603419c2c7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a82acff2a97f8e08d040b4e603419c2c7">More...</a><br /></td></tr>
+<tr class="separator:a82acff2a97f8e08d040b4e603419c2c7"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
 Static Public Member Functions</h2></td></tr>
-<tr class="memitem:a1117fa7b7bdeeb3a7f2d647a1d340aaf"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf">store</a> (<a class="el" href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">AccessType</a> const &amp;src, Scalar_ *pointer, int offset)</td></tr>
-<tr class="memdesc:a1117fa7b7bdeeb3a7f2d647a1d340aaf"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store function.  <a href="#a1117fa7b7bdeeb3a7f2d647a1d340aaf">More...</a><br /></td></tr>
-<tr class="separator:a1117fa7b7bdeeb3a7f2d647a1d340aaf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a187b63f682f7f00f8bf9ed3ee59d602f"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store.html#a187b63f682f7f00f8bf9ed3ee59d602f">store</a> (<a class="el" href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">AccessType</a> const &amp;src, Scalar_ *pointer, int offset)</td></tr>
+<tr class="memdesc:a187b63f682f7f00f8bf9ed3ee59d602f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store function.  <a href="#a187b63f682f7f00f8bf9ed3ee59d602f">More...</a><br /></td></tr>
+<tr class="separator:a187b63f682f7f00f8bf9ed3ee59d602f"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a8d2f927b2b61987dcea40e84f4575942"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8d2f927b2b61987dcea40e84f4575942">&#9670;&nbsp;</a></span>AccessType</h2>
+<a id="a82acff2a97f8e08d040b4e603419c2c7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a82acff2a97f8e08d040b4e603419c2c7">&#9670;&nbsp;</a></span>AccessType</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ , int Lanes_, MemorySpace::Kind Memory_, bool  = (Lanes_ &gt; 1), size_t  = (sizeof(Scalar_) * Lanes_)&gt; </div>
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, FragmentElementType::Kind kFragmentElementType = FragmentElementType::kScalar, typename FragmentElement_  = Scalar_, int kStride = 1, size_t size = (sizeof(Scalar_) * kAccessSize)&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, Lanes_&gt;::Type <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;::<a class="el" href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">AccessType</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;FragmentElement_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;::<a class="el" href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">AccessType</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -113,21 +113,21 @@ template&lt;typename Scalar_ , int Lanes_, MemorySpace::Kind Memory_, bool  = (L
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a1117fa7b7bdeeb3a7f2d647a1d340aaf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1117fa7b7bdeeb3a7f2d647a1d340aaf">&#9670;&nbsp;</a></span>store()</h2>
+<a id="a187b63f682f7f00f8bf9ed3ee59d602f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a187b63f682f7f00f8bf9ed3ee59d602f">&#9670;&nbsp;</a></span>store()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ , int Lanes_, MemorySpace::Kind Memory_, bool  = (Lanes_ &gt; 1), size_t  = (sizeof(Scalar_) * Lanes_)&gt; </div>
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, FragmentElementType::Kind kFragmentElementType = FragmentElementType::kScalar, typename FragmentElement_  = Scalar_, int kStride = 1, size_t size = (sizeof(Scalar_) * kAccessSize)&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">static CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, Lanes_, Memory_, bool, size_t &gt;::store </td>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, kFragmentElementType, FragmentElement_, kStride, size &gt;::store </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Store.html#a8d2f927b2b61987dcea40e84f4575942">AccessType</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Store.html#a82acff2a97f8e08d040b4e603419c2c7">AccessType</a> const &amp;&#160;</td>
           <td class="paramname"><em>src</em>, </td>
         </tr>
         <tr>
@@ -163,7 +163,7 @@ template&lt;typename Scalar_ , int Lanes_, MemorySpace::Kind Memory_, bool  = (L
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k004b304998a534d76357f834068909f8.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k004b304998a534d76357f834068909f8.html
new file mode 100644
index 000000000..469365a9f
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k004b304998a534d76357f834068909f8.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a1fcdc328d4b2deb1c50be5d31ef9e55f">store</a>(AccessType const &amp;src, Scalar_ *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k12f5c8a016a307e76de374322fc00a66.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k12f5c8a016a307e76de374322fc00a66.html
new file mode 100644
index 000000000..b9b3985d5
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k12f5c8a016a307e76de374322fc00a66.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a298a08c8c4c1ea871e92e2491b2cb549">store</a>(AccessType const &amp;value, Scalar_ *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html
new file mode 100644
index 000000000..14e687415
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k60eedca420c41e94fd40b41299967ef2.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:affe0bee9dcc3d88c169472b421449900"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">AccessType</a></td></tr>
+<tr class="memdesc:affe0bee9dcc3d88c169472b421449900"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#affe0bee9dcc3d88c169472b421449900">More...</a><br /></td></tr>
+<tr class="separator:affe0bee9dcc3d88c169472b421449900"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:ae16a5d6d7a42ffeba0f0ebe2d252ec28"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#ae16a5d6d7a42ffeba0f0ebe2d252ec28">store</a> (<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">AccessType</a> const &amp;src, Scalar_ *pointer, int offset)</td></tr>
+<tr class="memdesc:ae16a5d6d7a42ffeba0f0ebe2d252ec28"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store function.  <a href="#ae16a5d6d7a42ffeba0f0ebe2d252ec28">More...</a><br /></td></tr>
+<tr class="separator:ae16a5d6d7a42ffeba0f0ebe2d252ec28"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="affe0bee9dcc3d88c169472b421449900"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#affe0bee9dcc3d88c169472b421449900">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 16 &gt;::<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ae16a5d6d7a42ffeba0f0ebe2d252ec28"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae16a5d6d7a42ffeba0f0ebe2d252ec28">&#9670;&nbsp;</a></span>store()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 16 &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">AccessType</a> const &amp;&#160;</td>
+          <td class="paramname"><em>src</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html
new file mode 100644
index 000000000..b5f8d29d0
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k775a1d27affec5236489735ed4503c92.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ab4e4ac8a34b08fe38676f9fe7efe4c4f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">AccessType</a></td></tr>
+<tr class="memdesc:ab4e4ac8a34b08fe38676f9fe7efe4c4f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#ab4e4ac8a34b08fe38676f9fe7efe4c4f">More...</a><br /></td></tr>
+<tr class="separator:ab4e4ac8a34b08fe38676f9fe7efe4c4f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a535b4356c9bc21352fc2459b3c2246d1"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#a535b4356c9bc21352fc2459b3c2246d1">store</a> (<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">AccessType</a> const &amp;src, Scalar_ *pointer, int offset)</td></tr>
+<tr class="memdesc:a535b4356c9bc21352fc2459b3c2246d1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store function.  <a href="#a535b4356c9bc21352fc2459b3c2246d1">More...</a><br /></td></tr>
+<tr class="separator:a535b4356c9bc21352fc2459b3c2246d1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ab4e4ac8a34b08fe38676f9fe7efe4c4f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab4e4ac8a34b08fe38676f9fe7efe4c4f">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, 1, 2 &gt;::<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a535b4356c9bc21352fc2459b3c2246d1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a535b4356c9bc21352fc2459b3c2246d1">&#9670;&nbsp;</a></span>store()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, 1, 2 &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">AccessType</a> const &amp;&#160;</td>
+          <td class="paramname"><em>src</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html
new file mode 100644
index 000000000..2e3d71185
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k84da7dcd68ee74b8d2bdb67885b0ca56.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a996c9a38e018d250ce8f0a7a474bc6e6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">AccessType</a></td></tr>
+<tr class="memdesc:a996c9a38e018d250ce8f0a7a474bc6e6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a996c9a38e018d250ce8f0a7a474bc6e6">More...</a><br /></td></tr>
+<tr class="separator:a996c9a38e018d250ce8f0a7a474bc6e6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a453a2eed81a86d6637778a50bed06b59"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a453a2eed81a86d6637778a50bed06b59">store</a> (<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">AccessType</a> const &amp;src, Scalar_ *pointer, int offset)</td></tr>
+<tr class="memdesc:a453a2eed81a86d6637778a50bed06b59"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store function.  <a href="#a453a2eed81a86d6637778a50bed06b59">More...</a><br /></td></tr>
+<tr class="separator:a453a2eed81a86d6637778a50bed06b59"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a996c9a38e018d250ce8f0a7a474bc6e6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a996c9a38e018d250ce8f0a7a474bc6e6">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 4 &gt;::<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a453a2eed81a86d6637778a50bed06b59"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a453a2eed81a86d6637778a50bed06b59">&#9670;&nbsp;</a></span>store()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 4 &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">AccessType</a> const &amp;&#160;</td>
+          <td class="paramname"><em>src</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k60eedca420c41e94fd40b41299967ef2.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k60eedca420c41e94fd40b41299967ef2.html
new file mode 100644
index 000000000..7b902f52b
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k60eedca420c41e94fd40b41299967ef2.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#affe0bee9dcc3d88c169472b421449900">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html#ae16a5d6d7a42ffeba0f0ebe2d252ec28">store</a>(AccessType const &amp;src, Scalar_ *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k220d5790f803f10840e2a92fb9a51dac.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 16 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k775a1d27affec5236489735ed4503c92.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k775a1d27affec5236489735ed4503c92.html
new file mode 100644
index 000000000..4d1705582
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k775a1d27affec5236489735ed4503c92.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#ab4e4ac8a34b08fe38676f9fe7efe4c4f">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html#a535b4356c9bc21352fc2459b3c2246d1">store</a>(AccessType const &amp;src, Scalar_ *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k28cc0b88a16efca73d258128312d2a7e.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k84da7dcd68ee74b8d2bdb67885b0ca56.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k84da7dcd68ee74b8d2bdb67885b0ca56.html
new file mode 100644
index 000000000..1f1c686d4
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k84da7dcd68ee74b8d2bdb67885b0ca56.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a996c9a38e018d250ce8f0a7a474bc6e6">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html#a453a2eed81a86d6637778a50bed06b59">store</a>(AccessType const &amp;src, Scalar_ *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k40d038d4bce377843c21a56ebf97d011.html">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 4 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html
new file mode 100644
index 000000000..41a456e7c
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k12f5c8a016a307e76de374322fc00a66.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kWmmaMatrix, FragmentElement_, kStride, size &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a5ca5fcd2d6d2ca350d4470b4a3e65385"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">AccessType</a></td></tr>
+<tr class="memdesc:a5ca5fcd2d6d2ca350d4470b4a3e65385"><td class="mdescLeft">&#160;</td><td class="mdescRight">The input type.  <a href="#a5ca5fcd2d6d2ca350d4470b4a3e65385">More...</a><br /></td></tr>
+<tr class="separator:a5ca5fcd2d6d2ca350d4470b4a3e65385"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a298a08c8c4c1ea871e92e2491b2cb549"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a298a08c8c4c1ea871e92e2491b2cb549">store</a> (<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">AccessType</a> const &amp;value, Scalar_ *pointer, int offset)</td></tr>
+<tr class="memdesc:a298a08c8c4c1ea871e92e2491b2cb549"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store function.  <a href="#a298a08c8c4c1ea871e92e2491b2cb549">More...</a><br /></td></tr>
+<tr class="separator:a298a08c8c4c1ea871e92e2491b2cb549"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a5ca5fcd2d6d2ca350d4470b4a3e65385"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5ca5fcd2d6d2ca350d4470b4a3e65385">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef FragmentElement_ <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a298a08c8c4c1ea871e92e2491b2cb549"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a298a08c8c4c1ea871e92e2491b2cb549">&#9670;&nbsp;</a></span>store()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, typename FragmentElement_ , int kStride, size_t size&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>, FragmentElement_, kStride, size &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1kd9a7e85f80a21c504388612a60462417.html#a5ca5fcd2d6d2ca350d4470b4a3e65385">AccessType</a> const &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html
new file mode 100644
index 000000000..46c9d9b44
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html">Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1k004b304998a534d76357f834068909f8.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; Scalar_, kAccessSize, Memory_, FragmentElementType::kScalar, Scalar_, kStride, 8 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a3fe2c0be6113ecb0ae4535cccb87680b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; Scalar_, kAccessSize &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">AccessType</a></td></tr>
+<tr class="memdesc:a3fe2c0be6113ecb0ae4535cccb87680b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a3fe2c0be6113ecb0ae4535cccb87680b">More...</a><br /></td></tr>
+<tr class="separator:a3fe2c0be6113ecb0ae4535cccb87680b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a1fcdc328d4b2deb1c50be5d31ef9e55f"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a1fcdc328d4b2deb1c50be5d31ef9e55f">store</a> (<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">AccessType</a> const &amp;src, Scalar_ *pointer, int offset)</td></tr>
+<tr class="memdesc:a1fcdc328d4b2deb1c50be5d31ef9e55f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store function.  <a href="#a1fcdc328d4b2deb1c50be5d31ef9e55f">More...</a><br /></td></tr>
+<tr class="separator:a1fcdc328d4b2deb1c50be5d31ef9e55f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a3fe2c0be6113ecb0ae4535cccb87680b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3fe2c0be6113ecb0ae4535cccb87680b">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Scalar_, kAccessSize&gt;::Type <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 8 &gt;::<a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a1fcdc328d4b2deb1c50be5d31ef9e55f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1fcdc328d4b2deb1c50be5d31ef9e55f">&#9670;&nbsp;</a></span>store()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kAccessSize, MemorySpace::Kind Memory_, int kStride&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; Scalar_, kAccessSize, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, Scalar_, kStride, 8 &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Store_3_01Scalar___00_01kAccessSize_00_01Memory___00_01FragmentElementType_1_1ke6d73d34fa7b5254cf828804a19842e1.html#a3fe2c0be6113ecb0ae4535cccb87680b">AccessType</a> const &amp;&#160;</td>
+          <td class="paramname"><em>src</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">Scalar_ *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_013d38935f41bf709e067932b9e042255a.html b/docs/structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_013d38935f41bf709e067932b9e042255a.html
new file mode 100644
index 000000000..70da9ff68
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_013d38935f41bf709e067932b9e042255a.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html">Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a174ed368f1c702b4c958887f0b895eee">store</a>(AccessType const &amp;src, double *pointer, int offset)</td><td class="entry"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html b/docs/structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html
new file mode 100644
index 000000000..2bbfac982
--- /dev/null
+++ b/docs/structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html
@@ -0,0 +1,171 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html">Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_013d38935f41bf709e067932b9e042255a.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Store&lt; double, 2, Memory_, FragmentElementType::kScalar, double, kStride, 16 &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="load__store_8h_source.html">load_store.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a6c7ee589e65cf77578402a5ae01afe44"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; double, 2 &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">AccessType</a></td></tr>
+<tr class="memdesc:a6c7ee589e65cf77578402a5ae01afe44"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output type.  <a href="#a6c7ee589e65cf77578402a5ae01afe44">More...</a><br /></td></tr>
+<tr class="separator:a6c7ee589e65cf77578402a5ae01afe44"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:a174ed368f1c702b4c958887f0b895eee"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a174ed368f1c702b4c958887f0b895eee">store</a> (<a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">AccessType</a> const &amp;src, double *pointer, int offset)</td></tr>
+<tr class="memdesc:a174ed368f1c702b4c958887f0b895eee"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store function.  <a href="#a174ed368f1c702b4c958887f0b895eee">More...</a><br /></td></tr>
+<tr class="separator:a174ed368f1c702b4c958887f0b895eee"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a6c7ee589e65cf77578402a5ae01afe44"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6c7ee589e65cf77578402a5ae01afe44">&#9670;&nbsp;</a></span>AccessType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;MemorySpace::Kind Memory_, int kStride&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;double, 2&gt;::Type <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; double, 2, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, double, kStride, 16 &gt;::<a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">AccessType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a174ed368f1c702b4c958887f0b895eee"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a174ed368f1c702b4c958887f0b895eee">&#9670;&nbsp;</a></span>store()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;MemorySpace::Kind Memory_, int kStride&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1Store.html">cutlass::Store</a>&lt; double, 2, Memory_, <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>, double, kStride, 16 &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Store_3_01double_00_012_00_01Memory___00_01FragmentElementType_1_1kScalar_00_0160391c6be5cb1d3f99e012a6a18e486d.html#a6c7ee589e65cf77578402a5ae01afe44">AccessType</a> const &amp;&#160;</td>
+          <td class="paramname"><em>src</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">double *&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="load__store_8h_source.html">load_store.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TensorRefArray-members.html b/docs/structcutlass_1_1TensorRefArray-members.html
new file mode 100644
index 000000000..1a0ae6f7b
--- /dev/null
+++ b/docs/structcutlass_1_1TensorRefArray-members.html
@@ -0,0 +1,101 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#a2a95fd42d48c550a45f340b04f9dfe3d">at</a>(Index idx) const</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#a6b0f0d9cef4a2f3f4a8bf6c192a282db">begin</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0">LongIndex</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e">pointers</a></td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be">strides</a></td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">TensorArrayRef</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#aea35239326dcb23c3c6a18e7b3f92091">TensorArrayRef</a>(Storage **_pointers, Index _strides[kStorageRank - 1])</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TensorRefArray.html b/docs/structcutlass_1_1TensorRefArray.html
new file mode 100644
index 000000000..6aa5adbe8
--- /dev/null
+++ b/docs/structcutlass_1_1TensorRefArray.html
@@ -0,0 +1,398 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1TensorRefArray-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="tensor__ref__collection_8h_source.html">tensor_ref_collection.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">TensorRefIterator over <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects in <a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a>.  <a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a066d684240f8a24e1ba621ae3904ec75"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a></td></tr>
+<tr class="memdesc:a066d684240f8a24e1ba621ae3904ec75"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> type obtained from the <a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a>.  <a href="#a066d684240f8a24e1ba621ae3904ec75">More...</a><br /></td></tr>
+<tr class="separator:a066d684240f8a24e1ba621ae3904ec75"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab6a6ed8af1a4b3da33e840409c0a72d8"><td class="memItemLeft" align="right" valign="top">typedef Storage_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a></td></tr>
+<tr class="memdesc:ab6a6ed8af1a4b3da33e840409c0a72d8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element pointed to by the <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="#ab6a6ed8af1a4b3da33e840409c0a72d8">More...</a><br /></td></tr>
+<tr class="separator:ab6a6ed8af1a4b3da33e840409c0a72d8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f4658dd194b305ae4f150cf371869d9"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a></td></tr>
+<tr class="memdesc:a8f4658dd194b305ae4f150cf371869d9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#a8f4658dd194b305ae4f150cf371869d9">More...</a><br /></td></tr>
+<tr class="separator:a8f4658dd194b305ae4f150cf371869d9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6220549b72ed8451dbf76466b50a96c0"><td class="memItemLeft" align="right" valign="top">typedef LongIndex_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0">LongIndex</a></td></tr>
+<tr class="memdesc:a6220549b72ed8451dbf76466b50a96c0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Typically, strides in memory can be very large.  <a href="#a6220549b72ed8451dbf76466b50a96c0">More...</a><br /></td></tr>
+<tr class="separator:a6220549b72ed8451dbf76466b50a96c0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a771ede5f73ec18729cc9a5946cf86109"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">TensorArrayRef</a> ()</td></tr>
+<tr class="separator:a771ede5f73ec18729cc9a5946cf86109"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea35239326dcb23c3c6a18e7b3f92091"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#aea35239326dcb23c3c6a18e7b3f92091">TensorArrayRef</a> (<a class="el" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a> **_pointers, <a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> _strides[<a class="el" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> - 1])</td></tr>
+<tr class="separator:aea35239326dcb23c3c6a18e7b3f92091"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2a95fd42d48c550a45f340b04f9dfe3d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#a2a95fd42d48c550a45f340b04f9dfe3d">at</a> (<a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx) const</td></tr>
+<tr class="separator:a2a95fd42d48c550a45f340b04f9dfe3d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6b0f0d9cef4a2f3f4a8bf6c192a282db"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#a6b0f0d9cef4a2f3f4a8bf6c192a282db">begin</a> ()</td></tr>
+<tr class="memdesc:a6b0f0d9cef4a2f3f4a8bf6c192a282db"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns an TesnorRefIterator over the <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects in this collection.  <a href="#a6b0f0d9cef4a2f3f4a8bf6c192a282db">More...</a><br /></td></tr>
+<tr class="separator:a6b0f0d9cef4a2f3f4a8bf6c192a282db"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:ae322501a04b0008e5db4f7fccb6e903e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a> **&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e">pointers</a></td></tr>
+<tr class="memdesc:ae322501a04b0008e5db4f7fccb6e903e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base addresses.  <a href="#ae322501a04b0008e5db4f7fccb6e903e">More...</a><br /></td></tr>
+<tr class="separator:ae322501a04b0008e5db4f7fccb6e903e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a76228819a72b8ed341e680ba84a960be"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be">strides</a> [<a class="el" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> - 1]</td></tr>
+<tr class="memdesc:a76228819a72b8ed341e680ba84a960be"><td class="mdescLeft">&#160;</td><td class="mdescRight">Array of strides.  <a href="#a76228819a72b8ed341e680ba84a960be">More...</a><br /></td></tr>
+<tr class="separator:a76228819a72b8ed341e680ba84a960be"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a131bdcf213e3d46672c9b3b34d6bf243"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> = TensorRef::kStorageRank</td></tr>
+<tr class="memdesc:a131bdcf213e3d46672c9b3b34d6bf243"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of the stride vector.  <a href="#a131bdcf213e3d46672c9b3b34d6bf243">More...</a><br /></td></tr>
+<tr class="separator:a131bdcf213e3d46672c9b3b34d6bf243"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt;<br />
+struct cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</h3>
+
+<p>This satisfies TensorRefCollection and stores a collection of <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects. This is a structure of arrays in that the individual members of the <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> are held in distinct arrays.</p>
+<p>Note, <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> maps a logical coordinate space to an n-D array with rank kStorageRank. It maintains a stride vector of similar rank, but the least significant rank is defined to be 1.</p>
+<p>The least significant stride of 1 is not stored, and therefore the number of stride arrays is kStorageRank - 1. </p>
+</div><h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a8f4658dd194b305ae4f150cf371869d9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8f4658dd194b305ae4f150cf371869d9">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6220549b72ed8451dbf76466b50a96c0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6220549b72ed8451dbf76466b50a96c0">&#9670;&nbsp;</a></span>LongIndex</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef LongIndex_ <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0">LongIndex</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab6a6ed8af1a4b3da33e840409c0a72d8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab6a6ed8af1a4b3da33e840409c0a72d8">&#9670;&nbsp;</a></span>Storage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Storage_ <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a066d684240f8a24e1ba621ae3904ec75"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a066d684240f8a24e1ba621ae3904ec75">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a>&lt;Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt; <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a2a95fd42d48c550a45f340b04f9dfe3d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2a95fd42d48c550a45f340b04f9dfe3d">&#9670;&nbsp;</a></span>at()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a> <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::at </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6b0f0d9cef4a2f3f4a8bf6c192a282db"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6b0f0d9cef4a2f3f4a8bf6c192a282db">&#9670;&nbsp;</a></span>begin()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::begin </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a771ede5f73ec18729cc9a5946cf86109"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a771ede5f73ec18729cc9a5946cf86109">&#9670;&nbsp;</a></span>TensorArrayRef() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::TensorArrayRef </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aea35239326dcb23c3c6a18e7b3f92091"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea35239326dcb23c3c6a18e7b3f92091">&#9670;&nbsp;</a></span>TensorArrayRef() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::TensorArrayRef </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a> **&#160;</td>
+          <td class="paramname"><em>_pointers</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a>&#160;</td>
+          <td class="paramname"><em>_strides</em>[kStorageRank - 1]&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a131bdcf213e3d46672c9b3b34d6bf243"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a131bdcf213e3d46672c9b3b34d6bf243">&#9670;&nbsp;</a></span>kStorageRank</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::kStorageRank = TensorRef::kStorageRank</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae322501a04b0008e5db4f7fccb6e903e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae322501a04b0008e5db4f7fccb6e903e">&#9670;&nbsp;</a></span>pointers</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a>** <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::pointers</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a76228819a72b8ed341e680ba84a960be"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a76228819a72b8ed341e680ba84a960be">&#9670;&nbsp;</a></span>strides</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a>* <a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::strides[<a class="el" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> - 1]</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tensor__ref__collection_8h_source.html">tensor_ref_collection.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TensorRefBatchStrided-members.html b/docs/structcutlass_1_1TensorRefBatchStrided-members.html
new file mode 100644
index 000000000..0319ad827
--- /dev/null
+++ b/docs/structcutlass_1_1TensorRefBatchStrided-members.html
@@ -0,0 +1,134 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(LongIndex delta)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aac4b013050925c1e2db4019140e82602">at</a>(Index idx) const</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">cutlass::TensorRef::at</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">cutlass::TensorRef::at</a>(LongIndex idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a4f4a2f860cc10688ee27cc9ce1df1015">begin</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">const_ref</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">Coord_t</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">data</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c">get_pointer_offset</a>(Index idx) const</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">good</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ab12d9d196122dc3075185ab239a27fb4">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">leading_dim</a>(int idx=0) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa3df5b7337d41d8f96717ea73bf3e24e">LongIndex</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">operator+</a>(TensorCoord const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">operator+=</a>(TensorCoord const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">operator-</a>(TensorCoord const &amp;b) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">operator-=</a>(TensorCoord const &amp;b)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">operator[]</a>(TensorCoord const &amp;coord) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">operator[]</a>(LongIndex idx) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">Rank</a></td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a>(Storage *ptr=nullptr)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">reset</a>(Storage *ptr, StorageCoord const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa86a59779c0830e8cf82066853dc1089">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>() const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">stride</a>(int dim) const</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> typedef</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a></td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a9d07d96c2eccba10c3a9e4bef58d4e01">TensorCoord</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">cutlass::TensorRef::TensorRef</a>(Storage *ptr=nullptr)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">cutlass::TensorRef::TensorRef</a>(Storage *ptr, Index ldm)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">cutlass::TensorRef::TensorRef</a>(Storage *ptr, StrideVector const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0">cutlass::TensorRef::TensorRef</a>(Storage *ptr, StorageCoord const &amp;stride)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">cutlass::TensorRef::TensorRef</a>(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)</td><td class="entry"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa5d7e9a4589d7dacc5d69ca3c70ecc2b">TensorRefBatchStrided</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#abc2ddccdb742f95438b214e0a3a14620">TensorRefBatchStrided</a>(TensorRef const &amp;ref, LongIndex _tensor_stride=0)</td><td class="entry"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TensorRefBatchStrided.html b/docs/structcutlass_1_1TensorRefBatchStrided.html
new file mode 100644
index 000000000..b1c969310
--- /dev/null
+++ b/docs/structcutlass_1_1TensorRefBatchStrided.html
@@ -0,0 +1,537 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1TensorRefBatchStrided-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="tensor__ref__collection_8h_source.html">tensor_ref_collection.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1TensorRefBatchStrided.png" usemap="#cutlass::TensorRefBatchStrided_3C_20Storage_5F_2C_20Rank_5F_2C_20MapFunc_5F_2C_20StorageRank_5F_2C_20Index_5F_2C_20LongIndex_5F_20_3E_map" alt=""/>
+  <map id="cutlass::TensorRefBatchStrided_3C_20Storage_5F_2C_20Rank_5F_2C_20MapFunc_5F_2C_20StorageRank_5F_2C_20Index_5F_2C_20LongIndex_5F_20_3E_map" name="cutlass::TensorRefBatchStrided_3C_20Storage_5F_2C_20Rank_5F_2C_20MapFunc_5F_2C_20StorageRank_5F_2C_20Index_5F_2C_20LongIndex_5F_20_3E_map">
+<area href="classcutlass_1_1TensorRef.html" alt="cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;" shape="rect" coords="0,0,584,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constant iterator over tensors implied by <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a>.  <a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ac92b0cbb46cea7a04ee4660c2603b000"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a></td></tr>
+<tr class="memdesc:ac92b0cbb46cea7a04ee4660c2603b000"><td class="mdescLeft">&#160;</td><td class="mdescRight">Underlying <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> type.  <a href="#ac92b0cbb46cea7a04ee4660c2603b000">More...</a><br /></td></tr>
+<tr class="separator:ac92b0cbb46cea7a04ee4660c2603b000"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa86a59779c0830e8cf82066853dc1089"><td class="memItemLeft" align="right" valign="top">typedef Base::Storage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa86a59779c0830e8cf82066853dc1089">Storage</a></td></tr>
+<tr class="memdesc:aa86a59779c0830e8cf82066853dc1089"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage type.  <a href="#aa86a59779c0830e8cf82066853dc1089">More...</a><br /></td></tr>
+<tr class="separator:aa86a59779c0830e8cf82066853dc1089"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab12d9d196122dc3075185ab239a27fb4"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ab12d9d196122dc3075185ab239a27fb4">Index</a></td></tr>
+<tr class="memdesc:ab12d9d196122dc3075185ab239a27fb4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#ab12d9d196122dc3075185ab239a27fb4">More...</a><br /></td></tr>
+<tr class="separator:ab12d9d196122dc3075185ab239a27fb4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa3df5b7337d41d8f96717ea73bf3e24e"><td class="memItemLeft" align="right" valign="top">typedef LongIndex_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa3df5b7337d41d8f96717ea73bf3e24e">LongIndex</a></td></tr>
+<tr class="memdesc:aa3df5b7337d41d8f96717ea73bf3e24e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Typically, strides in memory can be very large.  <a href="#aa3df5b7337d41d8f96717ea73bf3e24e">More...</a><br /></td></tr>
+<tr class="separator:aa3df5b7337d41d8f96717ea73bf3e24e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9d07d96c2eccba10c3a9e4bef58d4e01"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a9d07d96c2eccba10c3a9e4bef58d4e01">TensorCoord</a></td></tr>
+<tr class="memdesc:a9d07d96c2eccba10c3a9e4bef58d4e01"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="#a9d07d96c2eccba10c3a9e4bef58d4e01">More...</a><br /></td></tr>
+<tr class="separator:a9d07d96c2eccba10c3a9e4bef58d4e01"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0d5f100b9b87f881e7ecaced63bce9dd"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a></td></tr>
+<tr class="memdesc:a0d5f100b9b87f881e7ecaced63bce9dd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference implied by the <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a>.  <a href="#a0d5f100b9b87f881e7ecaced63bce9dd">More...</a><br /></td></tr>
+<tr class="separator:a0d5f100b9b87f881e7ecaced63bce9dd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_classcutlass_1_1TensorRef"><td colspan="2" onclick="javascript:toggleInherit('pub_types_classcutlass_1_1TensorRef')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="memitem:ad327edfe1f8085632ff682d354922009 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef Storage_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a></td></tr>
+<tr class="memdesc:ad327edfe1f8085632ff682d354922009 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Data type of individual access.  <a href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">More...</a><br /></td></tr>
+<tr class="separator:ad327edfe1f8085632ff682d354922009 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad0273300d26125278b6930b1e463ff29 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef MapFunc_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a></td></tr>
+<tr class="memdesc:ad0273300d26125278b6930b1e463ff29 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Mapping function from logical coordinate to internal n-D array.  <a href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">More...</a><br /></td></tr>
+<tr class="separator:ad0273300d26125278b6930b1e463ff29 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2beda7a1946bde2858e730bece21b890 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a></td></tr>
+<tr class="memdesc:a2beda7a1946bde2858e730bece21b890 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">More...</a><br /></td></tr>
+<tr class="separator:a2beda7a1946bde2858e730bece21b890 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a42ca6a39ab0e44296fed71a77c57b7b1 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef LongIndex_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a></td></tr>
+<tr class="memdesc:a42ca6a39ab0e44296fed71a77c57b7b1 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Typically, strides in memory can be very large.  <a href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">More...</a><br /></td></tr>
+<tr class="separator:a42ca6a39ab0e44296fed71a77c57b7b1 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a35b7e1fc59298e0f06f484652d62fd65 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a></td></tr>
+<tr class="memdesc:a35b7e1fc59298e0f06f484652d62fd65 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">More...</a><br /></td></tr>
+<tr class="separator:a35b7e1fc59298e0f06f484652d62fd65 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a455a2df539b53086699c210d06df1c5d inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a></td></tr>
+<tr class="memdesc:a455a2df539b53086699c210d06df1c5d inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in storage n-D array.  <a href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">More...</a><br /></td></tr>
+<tr class="separator:a455a2df539b53086699c210d06df1c5d inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07c4b1ace7c8799537553b54cfe0a059 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a></td></tr>
+<tr class="separator:a07c4b1ace7c8799537553b54cfe0a059 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8281d11677512d6e229504ab4babad17 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a></td></tr>
+<tr class="memdesc:a8281d11677512d6e229504ab4babad17 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to of constant value.  <a href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">More...</a><br /></td></tr>
+<tr class="separator:a8281d11677512d6e229504ab4babad17 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a758f24783e36ffc393b360d0b8640bc6 inherit pub_types_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">Coord_t</a></td></tr>
+<tr class="memdesc:a758f24783e36ffc393b360d0b8640bc6 inherit pub_types_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Coordinate in logical tensor space.  <a href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">More...</a><br /></td></tr>
+<tr class="separator:a758f24783e36ffc393b360d0b8640bc6 inherit pub_types_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:aa5d7e9a4589d7dacc5d69ca3c70ecc2b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aa5d7e9a4589d7dacc5d69ca3c70ecc2b">TensorRefBatchStrided</a> ()</td></tr>
+<tr class="separator:aa5d7e9a4589d7dacc5d69ca3c70ecc2b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abc2ddccdb742f95438b214e0a3a14620"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#abc2ddccdb742f95438b214e0a3a14620">TensorRefBatchStrided</a> (<a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a> const &amp;ref, <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> _tensor_stride=0)</td></tr>
+<tr class="separator:abc2ddccdb742f95438b214e0a3a14620"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3d1922402bba34d0bc865fcc3e1a9a5c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c">get_pointer_offset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx) const</td></tr>
+<tr class="memdesc:a3d1922402bba34d0bc865fcc3e1a9a5c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the pointer offset.  <a href="#a3d1922402bba34d0bc865fcc3e1a9a5c">More...</a><br /></td></tr>
+<tr class="separator:a3d1922402bba34d0bc865fcc3e1a9a5c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aac4b013050925c1e2db4019140e82602"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#aac4b013050925c1e2db4019140e82602">at</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx) const</td></tr>
+<tr class="separator:aac4b013050925c1e2db4019140e82602"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4f4a2f860cc10688ee27cc9ce1df1015"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a4f4a2f860cc10688ee27cc9ce1df1015">begin</a> ()</td></tr>
+<tr class="memdesc:a4f4a2f860cc10688ee27cc9ce1df1015"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns an iterator.  <a href="#a4f4a2f860cc10688ee27cc9ce1df1015">More...</a><br /></td></tr>
+<tr class="separator:a4f4a2f860cc10688ee27cc9ce1df1015"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_classcutlass_1_1TensorRef"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_classcutlass_1_1TensorRef')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="memitem:a5a667a48c64fb916c31802b73b769765 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>)</td></tr>
+<tr class="memdesc:a5a667a48c64fb916c31802b73b769765 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper for 1-D memory. All higher ranks are projected onto the fastest changing rank.  <a href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">More...</a><br /></td></tr>
+<tr class="separator:a5a667a48c64fb916c31802b73b769765 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a48b9b4ad9034f6cf2b7c2ee479aea135 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> ldm)</td></tr>
+<tr class="memdesc:a48b9b4ad9034f6cf2b7c2ee479aea135 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct from a pointer and single stride element for 2-D pitch linear memory.  <a href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">More...</a><br /></td></tr>
+<tr class="separator:a48b9b4ad9034f6cf2b7c2ee479aea135 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afe4fc6fa539f36b2764707d50351905c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>)</td></tr>
+<tr class="memdesc:afe4fc6fa539f36b2764707d50351905c inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from a single pointer and stride vector.  <a href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">More...</a><br /></td></tr>
+<tr class="separator:afe4fc6fa539f36b2764707d50351905c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeca439296c8446741ba84b78f5a601e0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>)</td></tr>
+<tr class="separator:aeca439296c8446741ba84b78f5a601e0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afe92be0a61fb8fc84426f4907faca6c1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">TensorRef</a> (<a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; typename <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &gt;::type, <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>, <a class="el" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>, <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> &gt; const &amp;ref)</td></tr>
+<tr class="memdesc:afe92be0a61fb8fc84426f4907faca6c1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Enables conversion from <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> of non-const type.  <a href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">More...</a><br /></td></tr>
+<tr class="separator:afe92be0a61fb8fc84426f4907faca6c1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6ab468e38773f5a971a8428673fb5e47 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">const_ref</a> () const</td></tr>
+<tr class="memdesc:a6ab468e38773f5a971a8428673fb5e47 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to constant-valued tensor.  <a href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">More...</a><br /></td></tr>
+<tr class="separator:a6ab468e38773f5a971a8428673fb5e47 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ec815838aed4e02dd96acb1000614c0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr=<a class="el" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>)</td></tr>
+<tr class="memdesc:a7ec815838aed4e02dd96acb1000614c0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates only the pointer.  <a href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">More...</a><br /></td></tr>
+<tr class="separator:a7ec815838aed4e02dd96acb1000614c0 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7a1da27a46883eb68e3f8983670b784b inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">reset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr, <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a> const &amp;<a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>)</td></tr>
+<tr class="memdesc:a7a1da27a46883eb68e3f8983670b784b inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Updates the pointer, stride, and location within a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">More...</a><br /></td></tr>
+<tr class="separator:a7a1da27a46883eb68e3f8983670b784b inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2dbee889626b4764d30e9058ef3a7ae8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">good</a> () const</td></tr>
+<tr class="memdesc:a2dbee889626b4764d30e9058ef3a7ae8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if the <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> may be safely accessed.  <a href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">More...</a><br /></td></tr>
+<tr class="separator:a2dbee889626b4764d30e9058ef3a7ae8 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae1c80b524cd9491e2d499d703e1459f7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">data</a> () const</td></tr>
+<tr class="memdesc:ae1c80b524cd9491e2d499d703e1459f7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the pointer to referenced data.  <a href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">More...</a><br /></td></tr>
+<tr class="separator:ae1c80b524cd9491e2d499d703e1459f7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adb52dd6f9f68e7b8b67b8ddfb5c0021c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a> () const</td></tr>
+<tr class="memdesc:adb52dd6f9f68e7b8b67b8ddfb5c0021c inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor.  <a href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">More...</a><br /></td></tr>
+<tr class="separator:adb52dd6f9f68e7b8b67b8ddfb5c0021c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa6956072f1231b79fe8925a78c4760b7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">stride</a> (int dim) const</td></tr>
+<tr class="memdesc:aa6956072f1231b79fe8925a78c4760b7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the stride of the tensor in the given dimension.  <a href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">More...</a><br /></td></tr>
+<tr class="separator:aa6956072f1231b79fe8925a78c4760b7 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa60b92372db1da1d2aa997d6a03e01ca inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">leading_dim</a> (int idx=0) const</td></tr>
+<tr class="memdesc:aa60b92372db1da1d2aa997d6a03e01ca inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the maximum stride element as the 'leading dimension'.  <a href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">More...</a><br /></td></tr>
+<tr class="separator:aa60b92372db1da1d2aa997d6a03e01ca inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07dfe328d4a8316e79e9acde50582360 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a07dfe328d4a8316e79e9acde50582360 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps a logical coordinate to an n-D array in memory.  <a href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">More...</a><br /></td></tr>
+<tr class="separator:a07dfe328d4a8316e79e9acde50582360 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4da903ecbeaaf80c35084e8779e920a1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a4da903ecbeaaf80c35084e8779e920a1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the offset of an index from the origin of the tensor.  <a href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">More...</a><br /></td></tr>
+<tr class="separator:a4da903ecbeaaf80c35084e8779e920a1 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4169a1344897c2c87822ee49d5e0002f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">at</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:a4169a1344897c2c87822ee49d5e0002f inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">More...</a><br /></td></tr>
+<tr class="separator:a4169a1344897c2c87822ee49d5e0002f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab0cf071be50423dece4e931878573a1c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">at</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> idx) const</td></tr>
+<tr class="memdesc:ab0cf071be50423dece4e931878573a1c inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given linear index.  <a href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">More...</a><br /></td></tr>
+<tr class="separator:ab0cf071be50423dece4e931878573a1c inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada832ce3a57aaf4919b1ed89192f1fa6 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">operator[]</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;coord) const</td></tr>
+<tr class="memdesc:ada832ce3a57aaf4919b1ed89192f1fa6 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a>.  <a href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">More...</a><br /></td></tr>
+<tr class="separator:ada832ce3a57aaf4919b1ed89192f1fa6 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a207a0dabf6c368fa1edcb32baa2110e3 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">operator[]</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> idx) const</td></tr>
+<tr class="memdesc:a207a0dabf6c368fa1edcb32baa2110e3 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a reference to the element at a given linear index.  <a href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">More...</a><br /></td></tr>
+<tr class="separator:a207a0dabf6c368fa1edcb32baa2110e3 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5f0363da1e0544f256438e066d3cc143 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> delta)</td></tr>
+<tr class="memdesc:a5f0363da1e0544f256438e066d3cc143 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds an offset to each pointer.  <a href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">More...</a><br /></td></tr>
+<tr class="separator:a5f0363da1e0544f256438e066d3cc143 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0a4fd9ace579b46bc9d575b8adc6882f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">operator+</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a0a4fd9ace579b46bc9d575b8adc6882f inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">More...</a><br /></td></tr>
+<tr class="separator:a0a4fd9ace579b46bc9d575b8adc6882f inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a727d9c25d6df0aa9e795123b638b9306 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">operator+=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a727d9c25d6df0aa9e795123b638b9306 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">More...</a><br /></td></tr>
+<tr class="separator:a727d9c25d6df0aa9e795123b638b9306 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4a56b323aed2a3b2c843c276b68378fa inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">operator-</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a4a56b323aed2a3b2c843c276b68378fa inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">More...</a><br /></td></tr>
+<tr class="separator:a4a56b323aed2a3b2c843c276b68378fa inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5b5af26da32278d19c27c0d5a4a18890 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">operator-=</a> (<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a5b5af26da32278d19c27c0d5a4a18890 inherit pub_methods_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> offset by a given amount.  <a href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">More...</a><br /></td></tr>
+<tr class="separator:a5b5af26da32278d19c27c0d5a4a18890 inherit pub_methods_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a27a1e93508bb9c602028cabc3431815f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a></td></tr>
+<tr class="memdesc:a27a1e93508bb9c602028cabc3431815f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stride between tensors.  <a href="#a27a1e93508bb9c602028cabc3431815f">More...</a><br /></td></tr>
+<tr class="separator:a27a1e93508bb9c602028cabc3431815f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_static_attribs_classcutlass_1_1TensorRef"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_classcutlass_1_1TensorRef')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="memitem:a429692d4ac03a3427fbd8fdfaac4ae31 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> = Rank_</td></tr>
+<tr class="memdesc:a429692d4ac03a3427fbd8fdfaac4ae31 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Logical rank of tensor index space.  <a href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">More...</a><br /></td></tr>
+<tr class="separator:a429692d4ac03a3427fbd8fdfaac4ae31 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a425ff3d894ed1153eee79b1944fa5ed2 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> = StorageRank_</td></tr>
+<tr class="memdesc:a425ff3d894ed1153eee79b1944fa5ed2 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rank of internal storage.  <a href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">More...</a><br /></td></tr>
+<tr class="separator:a425ff3d894ed1153eee79b1944fa5ed2 inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2088b39881deef375af08511bca1e90a inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">Rank</a> = <a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a></td></tr>
+<tr class="memdesc:a2088b39881deef375af08511bca1e90a inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Logical rank of tensor index space.  <a href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">More...</a><br /></td></tr>
+<tr class="separator:a2088b39881deef375af08511bca1e90a inherit pub_static_attribs_classcutlass_1_1TensorRef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;typename Storage_, int Rank_, typename MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_ = int, typename LongIndex_ = long long&gt;<br />
+struct cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</h3>
+
+<p>This satisfies TensorRefCollection and stores a collection of <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects that have identical strides. <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects are separated by a linear stride. </p>
+</div><h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ac92b0cbb46cea7a04ee4660c2603b000"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac92b0cbb46cea7a04ee4660c2603b000">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a>&lt;Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt; <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab12d9d196122dc3075185ab239a27fb4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab12d9d196122dc3075185ab239a27fb4">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa3df5b7337d41d8f96717ea73bf3e24e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa3df5b7337d41d8f96717ea73bf3e24e">&#9670;&nbsp;</a></span>LongIndex</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef LongIndex_ <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa86a59779c0830e8cf82066853dc1089"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa86a59779c0830e8cf82066853dc1089">&#9670;&nbsp;</a></span>Storage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Base::Storage <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9d07d96c2eccba10c3a9e4bef58d4e01"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9d07d96c2eccba10c3a9e4bef58d4e01">&#9670;&nbsp;</a></span>TensorCoord</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="el" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>&gt; <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0d5f100b9b87f881e7ecaced63bce9dd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0d5f100b9b87f881e7ecaced63bce9dd">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="aa5d7e9a4589d7dacc5d69ca3c70ecc2b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa5d7e9a4589d7dacc5d69ca3c70ecc2b">&#9670;&nbsp;</a></span>TensorRefBatchStrided() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="abc2ddccdb742f95438b214e0a3a14620"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abc2ddccdb742f95438b214e0a3a14620">&#9670;&nbsp;</a></span>TensorRefBatchStrided() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::<a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&#160;</td>
+          <td class="paramname"><em>_tensor_stride</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="aac4b013050925c1e2db4019140e82602"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aac4b013050925c1e2db4019140e82602">&#9670;&nbsp;</a></span>at()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::at </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4f4a2f860cc10688ee27cc9ce1df1015"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4f4a2f860cc10688ee27cc9ce1df1015">&#9670;&nbsp;</a></span>begin()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::begin </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3d1922402bba34d0bc865fcc3e1a9a5c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3d1922402bba34d0bc865fcc3e1a9a5c">&#9670;&nbsp;</a></span>get_pointer_offset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::get_pointer_offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>&#160;</td>
+          <td class="paramname"><em>idx</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a27a1e93508bb9c602028cabc3431815f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a27a1e93508bb9c602028cabc3431815f">&#9670;&nbsp;</a></span>tensor_stride</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Storage_ , int Rank_, typename MapFunc_  = IdentityTensorMapFunc&lt;Rank_&gt;, int StorageRank_ = MapFunc_::kStorageRank, typename Index_  = int, typename LongIndex_  = long long&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a>&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::tensor_stride</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tensor__ref__collection_8h_source.html">tensor_ref_collection.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TensorRefBatchStrided.png b/docs/structcutlass_1_1TensorRefBatchStrided.png
new file mode 100644
index 0000000000000000000000000000000000000000..9a21bce92cf1e271a7a02c78e7b90a29e4b26315
GIT binary patch
literal 1810
zcmchYYgm(I7{}ic2;zkmqMT$J8_+@{8KTKi8e=a`4s#p?1qy^145T$wj>Dh=$HrbD
z;<ziAcmN?vKqkaMWuc<Ay%XXfIFmW#<<wAuV7+K{^`);p*Y!Nl|GxhBhx^0-_dNLl
zem+Kq7KQ)-7=aWL4FGf~s17iA4LudZX<q1M7C@zYYqeTb&MiKz?`0RE>gAS5B%v**
zgVEC9Q<~oq0Bu@diraKY0NC&iNIFPAjX|m(L8FbENv|W9JGHp+uIT7PI_XhES2Dm7
zWny338%9n_hmkgBe;YIWJLbr9LLyW`p;?1M0T~jJpsy%65Umc01bBi#WFw=XuFQB7
z`JHB4(Czk`KZMN>Y`HW4d!{wGpwZJ173~9qJ@I!NR!L(=?hd`^ph8YR^3CJvllD&w
zxS3NbJ{LaqIezc<^x-4~mJk^iU{E|986|qwSvoj7*qk|!MB07-eEvhJ;|!t6b>J;G
zEFujNCeZ5+LQHpd=}+Tv2_myB+jKUYSQInD9VW1oFwKgo%10&JL$YQa1t7Gc+z~2|
zSHP~vk_Tvri^&RH_7;C%%-Ey0LBX92K}<L`v#AcR$MZ(=RytP9DW5RCkg5aMIVlR8
zj^M$$`o~fA^DBQ4aqoK^cetlF9h^H++|byyIhVll*-<8~fdg>8reK=_MtC43H6wh!
zZy7t=^kFM&>cHcWN?)k%m-<Nw|3t-iGO=LFYy22fn)ZH|H|>V`;MD8v#(HE14EL;z
z0t?`eP7b^s8VgfyFfJ(ANLP|bN_`w0<}71RRn*2fM3`<n{Oh?&d9u4Hn4@AMqZRxz
zDUxsHEaMKxvsbszHn+Xls<xHi4;D?<7&T3qU)u6uFH~MO)-An~@<lile=3}9YRP9f
z(JmgjkJ|?3IN!<@M{G`~>2qUZor>ablZ(mA*;cN7LnpSI_5>9_8#s|`RVqJzYcHQQ
zVs58q)Gt&-#KH~9p%me=0T*kaC(TPgDCPJu?>g3{(yEV2h(1GW#AW)M!S11dxEJFO
zJI3L`<>r)hYa8|M7cJw(-cSOoa&h42Lw*90{#qg~4{F(QOYp?vODhVI_z~S6JazYp
z)j6zrXDlQ-x;9s!QD3!D8+jBh=_`C?L=V>`VRq|!^twx(AiNE9m1F@z#$cFrAs)=f
z@BS;DOOCQvx&10}q%G6HQ)f=%z|q}_St@Zd_SE^dw>eUc=jcY|ysFChG7#7(QHcbA
zF~?g*MzwMLx}X2jCs}OVi3znX)GY#b3CJjjX!tRB0L?zyjz<4~Y2Q~u^QHL`K*IS9
zL%p3C3gC|WkAaf7n#F~ls1sWKISO|<&7iqSxHve!n!!y$j>z?+O4dlr<!9@!VF4WV
z;y*arlPwNw4HqKRoeV2EZ*6~jr8|(kF|DSZkv;Y|k(iK`LbCW?e?!uA_jB*>vyU$i
zOTVy^d(ebuo_kb>ID?CFY<Q6Fp3JiHm~@}<Zz74E*t*&+iG}c%<Nmi>vF*6cm#b+i
zXJwf32Xkf92#-}>E8zB4G@QBiu!1mSZ@G@7zpB*#lbHvly;-ips+MN=6ivO$L>SC!
z!g)@F!V%XZKj=2*By3@*;4ud?j@@+H^!~5=t4!kXsteC<wYGK@Pse5M=5;8URUM0u
z_s5n07BAN3ZR%U+v-TWD9_H3}nZxX(?CGpl$*bRMO!XW4$#=2v(^KN{SjUALF5UF$
zB*SG=-AC~Jj8D9jPA*88HdO>GQ?14xTnj{Ma?fbaVys)u_W#~hpt<*NNLx9sX8rX1
z(30sqb#HBcT7)|2PS&2}7w1_As6rjxn)cT0m4}hocDvLe3i`e&7FnI$!w*A5mDJS&
zc$D80<c4GSiphps)q$*N(aFF{`;#9hj6T{xy*_gJ`p{{5oxrO)4ch|zO|0@2vHjJP
ztgZJpCC+A<%q6I%2O{i?x(66rc~7K$3d>mkRmdEw3W9&_f?zujVZ;5s;=p9_N}k4;
zFL|01aPrvFrLK1y<ztp9WJDx>cs38&cRll>fs5I$EaAp)uSD8n)@+mf@sjYF=x)1B
z6T_pt43_3X>e5P~iEm$)iI1(@8!kn$u{SSno8WbHM*ocaY>>)H(0Y1L9k!gXT*|rW
yfjZ@RJ=($sBb2^9{{f5g4&{6a^eW*y7Cc;bpT5aEg9}4HFaY%SBQ<$No&6L3ykIo|

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html b/docs/structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html
new file mode 100644
index 000000000..76d7a9ec8
--- /dev/null
+++ b/docs/structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html
@@ -0,0 +1,97 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StrideVector Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">StrideVector</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StrideVector Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="tensor__ref_8h_source.html">tensor_ref.h</a>&gt;</code></p>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;typename Storage_, int Rank_, typename MapFunc_, typename Index_, typename LongIndex_&gt;<br />
+struct cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StrideVector</h3>
+
+<p>Stride vector in storage coordinage space - assumes least significant stride is 1 and does not store it. </p>
+</div><hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tensor__ref_8h_source.html">tensor_ref.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileAllocation-members.html b/docs/structcutlass_1_1TileAllocation-members.html
new file mode 100644
index 000000000..11af96977
--- /dev/null
+++ b/docs/structcutlass_1_1TileAllocation-members.html
@@ -0,0 +1,101 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileAllocation.html">TileAllocation</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">ConstTensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#a69c43b27939e9ecebd23edb18ed3a9dc">data</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#acc3f2c29fe21316091a1405613083000">data</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#a3466ef2b478e4617aa1ff261217cfd05">reference</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#afcdc0be82acf0b4ae66468e2170c5a0d">reference</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">Shape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604">storage</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c">Strides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileAllocation.html b/docs/structcutlass_1_1TileAllocation.html
new file mode 100644
index 000000000..7f5ad2df0
--- /dev/null
+++ b/docs/structcutlass_1_1TileAllocation.html
@@ -0,0 +1,366 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TileAllocation&lt; Scalar_, Shape_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileAllocation.html">TileAllocation</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1TileAllocation-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Class for storing a tile in memory and accessing it through a tensor ref.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__allocation_8h_source.html">tile_allocation.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a98f1243dc279999e3ff083ef45dee3f6"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a></td></tr>
+<tr class="memdesc:a98f1243dc279999e3ff083ef45dee3f6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="#a98f1243dc279999e3ff083ef45dee3f6">More...</a><br /></td></tr>
+<tr class="separator:a98f1243dc279999e3ff083ef45dee3f6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ace1f396620f3eb69c367bdf69aa27ebd"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1StorageType.html">StorageType</a>&lt; sizeof(<a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a>)&gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">Storage</a></td></tr>
+<tr class="memdesc:ace1f396620f3eb69c367bdf69aa27ebd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The actual storage (may differ from the scalar type)  <a href="#ace1f396620f3eb69c367bdf69aa27ebd">More...</a><br /></td></tr>
+<tr class="separator:ace1f396620f3eb69c367bdf69aa27ebd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2254302a3ce0b4da5c3657ada0cb8ccc"><td class="memItemLeft" align="right" valign="top">typedef Shape_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">Shape</a></td></tr>
+<tr class="memdesc:a2254302a3ce0b4da5c3657ada0cb8ccc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Size of the allocation in units of scalars.  <a href="#a2254302a3ce0b4da5c3657ada0cb8ccc">More...</a><br /></td></tr>
+<tr class="separator:a2254302a3ce0b4da5c3657ada0cb8ccc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aba9164abe2fd7a091a858b23c0d3ac9c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt; <a class="el" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">Shape</a>, 1 &gt;::<a class="el" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c">Strides</a></td></tr>
+<tr class="memdesc:aba9164abe2fd7a091a858b23c0d3ac9c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Strides.  <a href="#aba9164abe2fd7a091a858b23c0d3ac9c">More...</a><br /></td></tr>
+<tr class="separator:aba9164abe2fd7a091a858b23c0d3ac9c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a122fa067390f45b29946286271654033"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> const, 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">ConstTensorRef</a></td></tr>
+<tr class="memdesc:a122fa067390f45b29946286271654033"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines the tensor reference for this allocation.  <a href="#a122fa067390f45b29946286271654033">More...</a><br /></td></tr>
+<tr class="separator:a122fa067390f45b29946286271654033"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa0bf6caeab13dc004350c6c0cfe0df80"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a>, 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a></td></tr>
+<tr class="memdesc:aa0bf6caeab13dc004350c6c0cfe0df80"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines the tensor reference for this allocation.  <a href="#aa0bf6caeab13dc004350c6c0cfe0df80">More...</a><br /></td></tr>
+<tr class="separator:aa0bf6caeab13dc004350c6c0cfe0df80"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a69c43b27939e9ecebd23edb18ed3a9dc"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#a69c43b27939e9ecebd23edb18ed3a9dc">data</a> ()</td></tr>
+<tr class="memdesc:a69c43b27939e9ecebd23edb18ed3a9dc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a pointer to the raw data.  <a href="#a69c43b27939e9ecebd23edb18ed3a9dc">More...</a><br /></td></tr>
+<tr class="separator:a69c43b27939e9ecebd23edb18ed3a9dc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acc3f2c29fe21316091a1405613083000"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#acc3f2c29fe21316091a1405613083000">data</a> () const</td></tr>
+<tr class="memdesc:acc3f2c29fe21316091a1405613083000"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a const pointer to the raw data.  <a href="#acc3f2c29fe21316091a1405613083000">More...</a><br /></td></tr>
+<tr class="separator:acc3f2c29fe21316091a1405613083000"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3466ef2b478e4617aa1ff261217cfd05"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#a3466ef2b478e4617aa1ff261217cfd05">reference</a> ()</td></tr>
+<tr class="memdesc:a3466ef2b478e4617aa1ff261217cfd05"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> object pointing to the data.  <a href="#a3466ef2b478e4617aa1ff261217cfd05">More...</a><br /></td></tr>
+<tr class="separator:a3466ef2b478e4617aa1ff261217cfd05"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afcdc0be82acf0b4ae66468e2170c5a0d"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">ConstTensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#afcdc0be82acf0b4ae66468e2170c5a0d">reference</a> () const</td></tr>
+<tr class="memdesc:afcdc0be82acf0b4ae66468e2170c5a0d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> object pointing to the data.  <a href="#afcdc0be82acf0b4ae66468e2170c5a0d">More...</a><br /></td></tr>
+<tr class="separator:afcdc0be82acf0b4ae66468e2170c5a0d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a3c1ba61c511110b14558941367ad4604"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">Storage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604">storage</a> [<a class="el" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Shape::kD</a>][<a class="el" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Shape::kH</a>][<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Shape::kW</a>][<a class="el" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">Shape::kC</a>]</td></tr>
+<tr class="memdesc:a3c1ba61c511110b14558941367ad4604"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage.  <a href="#a3c1ba61c511110b14558941367ad4604">More...</a><br /></td></tr>
+<tr class="separator:a3c1ba61c511110b14558941367ad4604"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a122fa067390f45b29946286271654033"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a122fa067390f45b29946286271654033">&#9670;&nbsp;</a></span>ConstTensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a>&lt;<a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> const, 4&gt; <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::<a class="el" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">ConstTensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a98f1243dc279999e3ff083ef45dee3f6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a98f1243dc279999e3ff083ef45dee3f6">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Scalar_ <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::<a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a2254302a3ce0b4da5c3657ada0cb8ccc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2254302a3ce0b4da5c3657ada0cb8ccc">&#9670;&nbsp;</a></span>Shape</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Shape_ <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::<a class="el" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">Shape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ace1f396620f3eb69c367bdf69aa27ebd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ace1f396620f3eb69c367bdf69aa27ebd">&#9670;&nbsp;</a></span>Storage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1StorageType.html">StorageType</a>&lt;sizeof(<a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a>)&gt;::Type <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::<a class="el" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">Storage</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aba9164abe2fd7a091a858b23c0d3ac9c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aba9164abe2fd7a091a858b23c0d3ac9c">&#9670;&nbsp;</a></span>Strides</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeStrides.html">ShapeStrides</a>&lt;<a class="el" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">Shape</a>, 1&gt;::<a class="el" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">Shape</a> <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::<a class="el" href="structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c">Strides</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa0bf6caeab13dc004350c6c0cfe0df80"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa0bf6caeab13dc004350c6c0cfe0df80">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a>&lt;<a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a>, 4&gt; <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::<a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a69c43b27939e9ecebd23edb18ed3a9dc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a69c43b27939e9ecebd23edb18ed3a9dc">&#9670;&nbsp;</a></span>data() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a>* <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::data </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="acc3f2c29fe21316091a1405613083000"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acc3f2c29fe21316091a1405613083000">&#9670;&nbsp;</a></span>data() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> const* <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::data </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3466ef2b478e4617aa1ff261217cfd05"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3466ef2b478e4617aa1ff261217cfd05">&#9670;&nbsp;</a></span>reference() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a> <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::reference </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="afcdc0be82acf0b4ae66468e2170c5a0d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afcdc0be82acf0b4ae66468e2170c5a0d">&#9670;&nbsp;</a></span>reference() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">ConstTensorRef</a> <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::reference </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a3c1ba61c511110b14558941367ad4604"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3c1ba61c511110b14558941367ad4604">&#9670;&nbsp;</a></span>storage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename Shape_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">Storage</a> <a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a>&lt; Scalar_, Shape_ &gt;::storage[<a class="el" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Shape::kD</a>][<a class="el" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Shape::kH</a>][<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Shape::kW</a>][<a class="el" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">Shape::kC</a>]</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__allocation_8h_source.html">tile_allocation.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileCoord-members.html b/docs/structcutlass_1_1TileCoord-members.html
new file mode 100644
index 000000000..73a3fef58
--- /dev/null
+++ b/docs/structcutlass_1_1TileCoord-members.html
@@ -0,0 +1,151 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TileCoord&lt; Index_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">at</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">at</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">at</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">c</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ad8281750f2978c6c1c91982f347a14cd">c</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a>(Coord&lt; kRank &gt; const &amp;max, Coord&lt; kRank &gt; const &amp;min=Coord&lt; kRank &gt;())</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">Coord</a>(Index value=0)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">Coord</a>(Index _idx[])</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">Coord</a>(Coord&lt; kRank &gt; const &amp;coord)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">count</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">d</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#aec4ffcdc8fbf57a8b649fff38af55007">d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#abe65d1a0ff3798b662376032d51e9713">dhw</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">dot</a>(Coord const &amp;b, T sum) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">dot</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">h</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a1d91ffa0a63ad03431ff79185526f92f">h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a0927c4ba212d00f3687034afe6bb8daf">hw</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a11bb7593ce7bba2dcedd199322a8b42b">hwc</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a8236879e1670072033983b7ec4b7ae32">kC</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ab5ebf352327baadcc740175d6b39adcb">kD</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a24d32587359493bb965745f5551e1624">kH</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ac2c14af3ceffd5ef8f17c9e0efb4e5ec">kW</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">N</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">operator bool</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">operator!=</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ab8fbb13cc5ea4f580a7fc32963de9553">operator*</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">Coord&lt; 4, Index_ &gt;::operator*</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ae946b3af6b795d26632da7ca66b3751c">operator*=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">Coord&lt; 4, Index_ &gt;::operator*=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a3bfa2daa0e63144c1e8510ba336f185b">operator+</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">Coord&lt; 4, Index_ &gt;::operator+</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a812760c633ea813db8a2bc24826c68df">operator+=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">Coord&lt; 4, Index_ &gt;::operator+=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a9f274d8e93f9cd3e0a9699e11b85fa7c">operator-</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">Coord&lt; 4, Index_ &gt;::operator-</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a02da20e580962fe0754a772842045389">operator-=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">Coord&lt; 4, Index_ &gt;::operator-=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a5d2cc915343a3b90fb530348ddd329d2">operator/</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">Coord&lt; 4, Index_ &gt;::operator/</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ac3207d8aa879c86a907cdcc93ccb2eb5">operator/=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">Coord&lt; 4, Index_ &gt;::operator/=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">operator&lt;</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">operator&lt;=</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">operator==</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">operator[]</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">operator[]</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a>(int start=0, Index identity=0) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">TileCoord</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#ac760795433c0f0ccc5c44fb58626f51d">TileCoord</a>(Coord&lt; 3, Index &gt; const &amp;coord)</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a752dcc11f1a018de692e5846a80fe185">TileCoord</a>(Coord&lt; 4, Index &gt; const &amp;coord)</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a2ff6ac0ad18cff304ee7f79597fdc274">TileCoord</a>(Index coord[4])</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a28ee00699941f879cfa92327c038fca6">TileCoord</a>(Index d, Index h, Index w, Index c)</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">w</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html#a8f83026751c83f57c1854c8544e75bd0">w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileCoord.html b/docs/structcutlass_1_1TileCoord.html
new file mode 100644
index 000000000..e0684be4d
--- /dev/null
+++ b/docs/structcutlass_1_1TileCoord.html
@@ -0,0 +1,1127 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TileCoord&lt; Index_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1TileCoord-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TileCoord&lt; Index_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="tile__coord_8h_source.html">tile_coord.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::TileCoord&lt; Index_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1TileCoord.png" usemap="#cutlass::TileCoord_3C_20Index_5F_20_3E_map" alt=""/>
+  <map id="cutlass::TileCoord_3C_20Index_5F_20_3E_map" name="cutlass::TileCoord_3C_20Index_5F_20_3E_map">
+<area href="structcutlass_1_1Coord.html" alt="cutlass::Coord&lt; 4, Index_ &gt;" shape="rect" coords="0,0,173,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a7018df7f2dbc7d70345d5f076fb26259"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a></td></tr>
+<tr class="memdesc:a7018df7f2dbc7d70345d5f076fb26259"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#a7018df7f2dbc7d70345d5f076fb26259">More...</a><br /></td></tr>
+<tr class="separator:a7018df7f2dbc7d70345d5f076fb26259"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab40c6bb58967d6be5a349bf6276c2eca"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a></td></tr>
+<tr class="memdesc:ab40c6bb58967d6be5a349bf6276c2eca"><td class="mdescLeft">&#160;</td><td class="mdescRight">Underlying <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a>  <a href="#ab40c6bb58967d6be5a349bf6276c2eca">More...</a><br /></td></tr>
+<tr class="separator:ab40c6bb58967d6be5a349bf6276c2eca"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td></tr>
+<tr class="memitem:a7c73966e94b4f45854f16e33683bc02c inherit pub_types_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a></td></tr>
+<tr class="memdesc:a7c73966e94b4f45854f16e33683bc02c inherit pub_types_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type used to store elements.  <a href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">More...</a><br /></td></tr>
+<tr class="separator:a7c73966e94b4f45854f16e33683bc02c inherit pub_types_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:ae0c8cd0657a73f3ffff99e9546ea8a95"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">TileCoord</a> ()</td></tr>
+<tr class="memdesc:ae0c8cd0657a73f3ffff99e9546ea8a95"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor.  <a href="#ae0c8cd0657a73f3ffff99e9546ea8a95">More...</a><br /></td></tr>
+<tr class="separator:ae0c8cd0657a73f3ffff99e9546ea8a95"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac760795433c0f0ccc5c44fb58626f51d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ac760795433c0f0ccc5c44fb58626f51d">TileCoord</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &gt; const &amp;coord)</td></tr>
+<tr class="memdesc:ac760795433c0f0ccc5c44fb58626f51d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> and infers coord[kC] = 0.  <a href="#ac760795433c0f0ccc5c44fb58626f51d">More...</a><br /></td></tr>
+<tr class="separator:ac760795433c0f0ccc5c44fb58626f51d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a752dcc11f1a018de692e5846a80fe185"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a752dcc11f1a018de692e5846a80fe185">TileCoord</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &gt; const &amp;coord)</td></tr>
+<tr class="memdesc:a752dcc11f1a018de692e5846a80fe185"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a>  <a href="#a752dcc11f1a018de692e5846a80fe185">More...</a><br /></td></tr>
+<tr class="separator:a752dcc11f1a018de692e5846a80fe185"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2ff6ac0ad18cff304ee7f79597fdc274"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a2ff6ac0ad18cff304ee7f79597fdc274">TileCoord</a> (<a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> coord[4])</td></tr>
+<tr class="memdesc:a2ff6ac0ad18cff304ee7f79597fdc274"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of coordinate elements.  <a href="#a2ff6ac0ad18cff304ee7f79597fdc274">More...</a><br /></td></tr>
+<tr class="separator:a2ff6ac0ad18cff304ee7f79597fdc274"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a28ee00699941f879cfa92327c038fca6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a28ee00699941f879cfa92327c038fca6">TileCoord</a> (<a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <a class="el" href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">d</a>, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <a class="el" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">h</a>, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <a class="el" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">w</a>, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <a class="el" href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">c</a>)</td></tr>
+<tr class="memdesc:a28ee00699941f879cfa92327c038fca6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct from a row and column.  <a href="#a28ee00699941f879cfa92327c038fca6">More...</a><br /></td></tr>
+<tr class="separator:a28ee00699941f879cfa92327c038fca6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07a067df652b64bd580f2ddf373e292b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">d</a> () const</td></tr>
+<tr class="memdesc:a07a067df652b64bd580f2ddf373e292b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the D element of the coordinate.  <a href="#a07a067df652b64bd580f2ddf373e292b">More...</a><br /></td></tr>
+<tr class="separator:a07a067df652b64bd580f2ddf373e292b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aec4ffcdc8fbf57a8b649fff38af55007"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#aec4ffcdc8fbf57a8b649fff38af55007">d</a> ()</td></tr>
+<tr class="memdesc:aec4ffcdc8fbf57a8b649fff38af55007"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the D element of the coordinate.  <a href="#aec4ffcdc8fbf57a8b649fff38af55007">More...</a><br /></td></tr>
+<tr class="separator:aec4ffcdc8fbf57a8b649fff38af55007"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac7c697a6fd23c7f49ff19aa6db4a41a3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">h</a> () const</td></tr>
+<tr class="memdesc:ac7c697a6fd23c7f49ff19aa6db4a41a3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the H element of the coordinate.  <a href="#ac7c697a6fd23c7f49ff19aa6db4a41a3">More...</a><br /></td></tr>
+<tr class="separator:ac7c697a6fd23c7f49ff19aa6db4a41a3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1d91ffa0a63ad03431ff79185526f92f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a1d91ffa0a63ad03431ff79185526f92f">h</a> ()</td></tr>
+<tr class="memdesc:a1d91ffa0a63ad03431ff79185526f92f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the H element of the coordinate.  <a href="#a1d91ffa0a63ad03431ff79185526f92f">More...</a><br /></td></tr>
+<tr class="separator:a1d91ffa0a63ad03431ff79185526f92f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a21ae028c4ee3e5cbe5bf9d47a41e6613"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">w</a> () const</td></tr>
+<tr class="memdesc:a21ae028c4ee3e5cbe5bf9d47a41e6613"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the W element of the coordinate.  <a href="#a21ae028c4ee3e5cbe5bf9d47a41e6613">More...</a><br /></td></tr>
+<tr class="separator:a21ae028c4ee3e5cbe5bf9d47a41e6613"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f83026751c83f57c1854c8544e75bd0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a8f83026751c83f57c1854c8544e75bd0">w</a> ()</td></tr>
+<tr class="memdesc:a8f83026751c83f57c1854c8544e75bd0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the W element of the coordinate.  <a href="#a8f83026751c83f57c1854c8544e75bd0">More...</a><br /></td></tr>
+<tr class="separator:a8f83026751c83f57c1854c8544e75bd0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeebb556622fe87c0902448de13a30e0c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">c</a> () const</td></tr>
+<tr class="memdesc:aeebb556622fe87c0902448de13a30e0c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the Celement of the coordinate.  <a href="#aeebb556622fe87c0902448de13a30e0c">More...</a><br /></td></tr>
+<tr class="separator:aeebb556622fe87c0902448de13a30e0c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad8281750f2978c6c1c91982f347a14cd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ad8281750f2978c6c1c91982f347a14cd">c</a> ()</td></tr>
+<tr class="memdesc:ad8281750f2978c6c1c91982f347a14cd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the C element of the coordinate.  <a href="#ad8281750f2978c6c1c91982f347a14cd">More...</a><br /></td></tr>
+<tr class="separator:ad8281750f2978c6c1c91982f347a14cd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0927c4ba212d00f3687034afe6bb8daf"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a0927c4ba212d00f3687034afe6bb8daf">hw</a> () const</td></tr>
+<tr class="memdesc:a0927c4ba212d00f3687034afe6bb8daf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets H and W dimensions as a Coord&lt;2&gt;  <a href="#a0927c4ba212d00f3687034afe6bb8daf">More...</a><br /></td></tr>
+<tr class="separator:a0927c4ba212d00f3687034afe6bb8daf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a11bb7593ce7bba2dcedd199322a8b42b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a11bb7593ce7bba2dcedd199322a8b42b">hwc</a> () const</td></tr>
+<tr class="memdesc:a11bb7593ce7bba2dcedd199322a8b42b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets H, W, and C dimensions as a <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>  <a href="#a11bb7593ce7bba2dcedd199322a8b42b">More...</a><br /></td></tr>
+<tr class="separator:a11bb7593ce7bba2dcedd199322a8b42b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abe65d1a0ff3798b662376032d51e9713"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#abe65d1a0ff3798b662376032d51e9713">dhw</a> () const</td></tr>
+<tr class="memdesc:abe65d1a0ff3798b662376032d51e9713"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets D, H, and W dimensions as a <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>  <a href="#abe65d1a0ff3798b662376032d51e9713">More...</a><br /></td></tr>
+<tr class="separator:abe65d1a0ff3798b662376032d51e9713"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3bfa2daa0e63144c1e8510ba336f185b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a3bfa2daa0e63144c1e8510ba336f185b">operator+</a> (<a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a3bfa2daa0e63144c1e8510ba336f185b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise addition.  <a href="#a3bfa2daa0e63144c1e8510ba336f185b">More...</a><br /></td></tr>
+<tr class="separator:a3bfa2daa0e63144c1e8510ba336f185b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f274d8e93f9cd3e0a9699e11b85fa7c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a9f274d8e93f9cd3e0a9699e11b85fa7c">operator-</a> (<a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a9f274d8e93f9cd3e0a9699e11b85fa7c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise subtraction.  <a href="#a9f274d8e93f9cd3e0a9699e11b85fa7c">More...</a><br /></td></tr>
+<tr class="separator:a9f274d8e93f9cd3e0a9699e11b85fa7c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab8fbb13cc5ea4f580a7fc32963de9553"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ab8fbb13cc5ea4f580a7fc32963de9553">operator*</a> (<a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:ab8fbb13cc5ea4f580a7fc32963de9553"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise multiplication.  <a href="#ab8fbb13cc5ea4f580a7fc32963de9553">More...</a><br /></td></tr>
+<tr class="separator:ab8fbb13cc5ea4f580a7fc32963de9553"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5d2cc915343a3b90fb530348ddd329d2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a5d2cc915343a3b90fb530348ddd329d2">operator/</a> (<a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a5d2cc915343a3b90fb530348ddd329d2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise division.  <a href="#a5d2cc915343a3b90fb530348ddd329d2">More...</a><br /></td></tr>
+<tr class="separator:a5d2cc915343a3b90fb530348ddd329d2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a812760c633ea813db8a2bc24826c68df"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a812760c633ea813db8a2bc24826c68df">operator+=</a> (<a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:a812760c633ea813db8a2bc24826c68df"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place addition.  <a href="#a812760c633ea813db8a2bc24826c68df">More...</a><br /></td></tr>
+<tr class="separator:a812760c633ea813db8a2bc24826c68df"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a02da20e580962fe0754a772842045389"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a02da20e580962fe0754a772842045389">operator-=</a> (<a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:a02da20e580962fe0754a772842045389"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place subtraction.  <a href="#a02da20e580962fe0754a772842045389">More...</a><br /></td></tr>
+<tr class="separator:a02da20e580962fe0754a772842045389"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae946b3af6b795d26632da7ca66b3751c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ae946b3af6b795d26632da7ca66b3751c">operator*=</a> (<a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:ae946b3af6b795d26632da7ca66b3751c"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place multiplication.  <a href="#ae946b3af6b795d26632da7ca66b3751c">More...</a><br /></td></tr>
+<tr class="separator:ae946b3af6b795d26632da7ca66b3751c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac3207d8aa879c86a907cdcc93ccb2eb5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ac3207d8aa879c86a907cdcc93ccb2eb5">operator/=</a> (<a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:ac3207d8aa879c86a907cdcc93ccb2eb5"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place division.  <a href="#ac3207d8aa879c86a907cdcc93ccb2eb5">More...</a><br /></td></tr>
+<tr class="separator:ac3207d8aa879c86a907cdcc93ccb2eb5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td></tr>
+<tr class="memitem:a422aa7e2d2bf5dd3a60f65427bc0d7c0 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> value=0)</td></tr>
+<tr class="memdesc:a422aa7e2d2bf5dd3a60f65427bc0d7c0 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor initializes uniformly.  <a href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">More...</a><br /></td></tr>
+<tr class="separator:a422aa7e2d2bf5dd3a60f65427bc0d7c0 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a63ad1225ab2c51a68add731e994526b4 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> _idx[])</td></tr>
+<tr class="memdesc:a63ad1225ab2c51a68add731e994526b4 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of integers.  <a href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">More...</a><br /></td></tr>
+<tr class="separator:a63ad1225ab2c51a68add731e994526b4 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6110e4cfd090561696a81a8a4068a573 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;coord)</td></tr>
+<tr class="memdesc:a6110e4cfd090561696a81a8a4068a573 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of integers.  <a href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">More...</a><br /></td></tr>
+<tr class="separator:a6110e4cfd090561696a81a8a4068a573 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac8f7a9b0835efc34fd28894b2b45342c inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Slice &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a> (int start=0, <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> identity=0) const</td></tr>
+<tr class="separator:ac8f7a9b0835efc34fd28894b2b45342c inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1781b3c5a2d653b0c1718ec3154ae48f inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">operator bool</a> () const</td></tr>
+<tr class="memdesc:a1781b3c5a2d653b0c1718ec3154ae48f inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if Coord is non-zero.  <a href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">More...</a><br /></td></tr>
+<tr class="separator:a1781b3c5a2d653b0c1718ec3154ae48f inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a232095edae2f74c01a3c8abf68166e02 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a> () const</td></tr>
+<tr class="memdesc:a232095edae2f74c01a3c8abf68166e02 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if Coord is uniformly zero.  <a href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">More...</a><br /></td></tr>
+<tr class="separator:a232095edae2f74c01a3c8abf68166e02 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37672637771a70910df9aa1a0cffddc inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">operator+</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:ab37672637771a70910df9aa1a0cffddc inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise addition.  <a href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">More...</a><br /></td></tr>
+<tr class="separator:ab37672637771a70910df9aa1a0cffddc inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6b876f61a85a4a4ef3763b6742bfaa6b inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">operator-</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a6b876f61a85a4a4ef3763b6742bfaa6b inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise subtraction.  <a href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">More...</a><br /></td></tr>
+<tr class="separator:a6b876f61a85a4a4ef3763b6742bfaa6b inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e94c093f82908ff3dba4f23b5d10033 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">operator*</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a2e94c093f82908ff3dba4f23b5d10033 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise multiplication.  <a href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">More...</a><br /></td></tr>
+<tr class="separator:a2e94c093f82908ff3dba4f23b5d10033 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9bb07631f09efc80219413ac8309f568 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">operator/</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a9bb07631f09efc80219413ac8309f568 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise division.  <a href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">More...</a><br /></td></tr>
+<tr class="separator:a9bb07631f09efc80219413ac8309f568 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae4f2cb12b84411118cb93e7c4cb88b20 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ae4f2cb12b84411118cb93e7c4cb88b20 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place addition.  <a href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">More...</a><br /></td></tr>
+<tr class="separator:ae4f2cb12b84411118cb93e7c4cb88b20 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a304334cbcad636d7b058fdc6310f0e6b inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">operator-=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a304334cbcad636d7b058fdc6310f0e6b inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place subtraction.  <a href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">More...</a><br /></td></tr>
+<tr class="separator:a304334cbcad636d7b058fdc6310f0e6b inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad4303b578b72b5cb2a0198375290e168 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">operator*=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ad4303b578b72b5cb2a0198375290e168 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place multiplication.  <a href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">More...</a><br /></td></tr>
+<tr class="separator:ad4303b578b72b5cb2a0198375290e168 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac87199c4c9a4e20aac4eb6e3b9a68f28 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">operator/=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ac87199c4c9a4e20aac4eb6e3b9a68f28 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place division.  <a href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">More...</a><br /></td></tr>
+<tr class="separator:ac87199c4c9a4e20aac4eb6e3b9a68f28 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6e0967541a1d74edeb93897ea6069e24 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">operator[]</a> (int dim)</td></tr>
+<tr class="memdesc:a6e0967541a1d74edeb93897ea6069e24 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">More...</a><br /></td></tr>
+<tr class="separator:a6e0967541a1d74edeb93897ea6069e24 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a882e7ac07bbd6983659ef2e574b46454 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">operator[]</a> (int dim) const</td></tr>
+<tr class="memdesc:a882e7ac07bbd6983659ef2e574b46454 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">More...</a><br /></td></tr>
+<tr class="separator:a882e7ac07bbd6983659ef2e574b46454 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac8ec94703830ab2c62ee055533ea2184 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b, T sum) const</td></tr>
+<tr class="memdesc:ac8ec94703830ab2c62ee055533ea2184 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two Coord instances.  <a href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">More...</a><br /></td></tr>
+<tr class="separator:ac8ec94703830ab2c62ee055533ea2184 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0acc37908acb6b879c37f54ff7ffc93d inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a0acc37908acb6b879c37f54ff7ffc93d inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two Coord instances.  <a href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">More...</a><br /></td></tr>
+<tr class="separator:a0acc37908acb6b879c37f54ff7ffc93d inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9eff24a3b74b68d11839b92324613c93 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a> ()</td></tr>
+<tr class="memdesc:a9eff24a3b74b68d11839b92324613c93 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given Coord element.  <a href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">More...</a><br /></td></tr>
+<tr class="separator:a9eff24a3b74b68d11839b92324613c93 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa253bf69fc819876a7c7770305f1a694 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">at</a> (int dim)</td></tr>
+<tr class="memdesc:aa253bf69fc819876a7c7770305f1a694 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">More...</a><br /></td></tr>
+<tr class="separator:aa253bf69fc819876a7c7770305f1a694 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a177adcc2d0fb5e72ebcb523edd24e6fe inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">at</a> () const</td></tr>
+<tr class="memdesc:a177adcc2d0fb5e72ebcb523edd24e6fe inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given Coord element.  <a href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">More...</a><br /></td></tr>
+<tr class="separator:a177adcc2d0fb5e72ebcb523edd24e6fe inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b47b1521820c898b03868627c3f8e46 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">at</a> (int dim) const</td></tr>
+<tr class="memdesc:a9b47b1521820c898b03868627c3f8e46 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">More...</a><br /></td></tr>
+<tr class="separator:a9b47b1521820c898b03868627c3f8e46 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f919aeb2a895bc040599971400dec8d inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">operator==</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a7f919aeb2a895bc040599971400dec8d inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Determines if two Coord&lt;&gt; objects are equal.  <a href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">More...</a><br /></td></tr>
+<tr class="separator:a7f919aeb2a895bc040599971400dec8d inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a353d847675e5ba2402c407dcd4ae4de3 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">operator!=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a353d847675e5ba2402c407dcd4ae4de3 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Not equal.  <a href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">More...</a><br /></td></tr>
+<tr class="separator:a353d847675e5ba2402c407dcd4ae4de3 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a404a3b4e00f59cac71d41fb1bbba38ba inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;max, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;min=<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt;())</td></tr>
+<tr class="memdesc:a404a3b4e00f59cac71d41fb1bbba38ba inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clamps a coordinate to a range specified by maximum and minimum values.  <a href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">More...</a><br /></td></tr>
+<tr class="separator:a404a3b4e00f59cac71d41fb1bbba38ba inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac0ac5f2aa2cbea3887d126645025e017 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">count</a> () const</td></tr>
+<tr class="memdesc:ac0ac5f2aa2cbea3887d126645025e017 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the product of all elements.  <a href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">More...</a><br /></td></tr>
+<tr class="separator:ac0ac5f2aa2cbea3887d126645025e017 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a148851df63840ac63e23b2f170bd1308 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">operator&lt;</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a148851df63840ac63e23b2f170bd1308 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Less than operator.  <a href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">More...</a><br /></td></tr>
+<tr class="separator:a148851df63840ac63e23b2f170bd1308 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dc9f063be329d475f040afd449d304c inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">operator&lt;=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a9dc9f063be329d475f040afd449d304c inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Less than or equals operator.  <a href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">More...</a><br /></td></tr>
+<tr class="separator:a9dc9f063be329d475f040afd449d304c inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:ab5ebf352327baadcc740175d6b39adcb"><td class="memItemLeft" align="right" valign="top">static int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ab5ebf352327baadcc740175d6b39adcb">kD</a> = 0</td></tr>
+<tr class="memdesc:ab5ebf352327baadcc740175d6b39adcb"><td class="mdescLeft">&#160;</td><td class="mdescRight">D dimension.  <a href="#ab5ebf352327baadcc740175d6b39adcb">More...</a><br /></td></tr>
+<tr class="separator:ab5ebf352327baadcc740175d6b39adcb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24d32587359493bb965745f5551e1624"><td class="memItemLeft" align="right" valign="top">static int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a24d32587359493bb965745f5551e1624">kH</a> = 1</td></tr>
+<tr class="memdesc:a24d32587359493bb965745f5551e1624"><td class="mdescLeft">&#160;</td><td class="mdescRight">H dimension.  <a href="#a24d32587359493bb965745f5551e1624">More...</a><br /></td></tr>
+<tr class="separator:a24d32587359493bb965745f5551e1624"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac2c14af3ceffd5ef8f17c9e0efb4e5ec"><td class="memItemLeft" align="right" valign="top">static int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#ac2c14af3ceffd5ef8f17c9e0efb4e5ec">kW</a> = 2</td></tr>
+<tr class="memdesc:ac2c14af3ceffd5ef8f17c9e0efb4e5ec"><td class="mdescLeft">&#160;</td><td class="mdescRight">W dimension.  <a href="#ac2c14af3ceffd5ef8f17c9e0efb4e5ec">More...</a><br /></td></tr>
+<tr class="separator:ac2c14af3ceffd5ef8f17c9e0efb4e5ec"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8236879e1670072033983b7ec4b7ae32"><td class="memItemLeft" align="right" valign="top">static int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html#a8236879e1670072033983b7ec4b7ae32">kC</a> = 3</td></tr>
+<tr class="memdesc:a8236879e1670072033983b7ec4b7ae32"><td class="mdescLeft">&#160;</td><td class="mdescRight">C dimension.  <a href="#a8236879e1670072033983b7ec4b7ae32">More...</a><br /></td></tr>
+<tr class="separator:a8236879e1670072033983b7ec4b7ae32"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td></tr>
+<tr class="memitem:a23e1b9a7f5fa8fd4afeadfb85de7c5c3 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a></td></tr>
+<tr class="memdesc:a23e1b9a7f5fa8fd4afeadfb85de7c5c3 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of elements in Coord.  <a href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">More...</a><br /></td></tr>
+<tr class="separator:a23e1b9a7f5fa8fd4afeadfb85de7c5c3 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acfd416eafec51e47b42b8b713ba76030 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">N</a></td></tr>
+<tr class="memdesc:acfd416eafec51e47b42b8b713ba76030 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of elements in Coord, aliased for compatibility.  <a href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">More...</a><br /></td></tr>
+<tr class="separator:acfd416eafec51e47b42b8b713ba76030 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, Index_ &gt;</a></td></tr>
+<tr class="memitem:a872e1e0d9cc255fa438c04daaf10ad68 inherit pub_attribs_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a> [<a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>]</td></tr>
+<tr class="memdesc:a872e1e0d9cc255fa438c04daaf10ad68 inherit pub_attribs_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Indices.  <a href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">More...</a><br /></td></tr>
+<tr class="separator:a872e1e0d9cc255fa438c04daaf10ad68 inherit pub_attribs_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;typename Index_ = int&gt;<br />
+struct cutlass::TileCoord&lt; Index_ &gt;</h3>
+
+<p><a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> wraps <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;4, int&gt;</a> to provide a helper for accessing named dimensions. Classes expecting a coordinate in the rank=4 index space of a CUTLASS tile structure should use <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a>. </p>
+</div><h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ab40c6bb58967d6be5a349bf6276c2eca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab40c6bb58967d6be5a349bf6276c2eca">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;4, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&gt; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::<a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7018df7f2dbc7d70345d5f076fb26259"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7018df7f2dbc7d70345d5f076fb26259">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::<a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ae0c8cd0657a73f3ffff99e9546ea8a95"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae0c8cd0657a73f3ffff99e9546ea8a95">&#9670;&nbsp;</a></span>TileCoord() <span class="overload">[1/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::<a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac760795433c0f0ccc5c44fb58626f51d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac760795433c0f0ccc5c44fb58626f51d">&#9670;&nbsp;</a></span>TileCoord() <span class="overload">[2/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::<a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a752dcc11f1a018de692e5846a80fe185"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a752dcc11f1a018de692e5846a80fe185">&#9670;&nbsp;</a></span>TileCoord() <span class="overload">[3/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::<a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4, <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a2ff6ac0ad18cff304ee7f79597fdc274"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2ff6ac0ad18cff304ee7f79597fdc274">&#9670;&nbsp;</a></span>TileCoord() <span class="overload">[4/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::<a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&#160;</td>
+          <td class="paramname"><em>coord</em>[4]</td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a28ee00699941f879cfa92327c038fca6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a28ee00699941f879cfa92327c038fca6">&#9670;&nbsp;</a></span>TileCoord() <span class="overload">[5/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::<a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&#160;</td>
+          <td class="paramname"><em>d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&#160;</td>
+          <td class="paramname"><em>h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&#160;</td>
+          <td class="paramname"><em>w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&#160;</td>
+          <td class="paramname"><em>c</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="aeebb556622fe87c0902448de13a30e0c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeebb556622fe87c0902448de13a30e0c">&#9670;&nbsp;</a></span>c() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> const&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::c </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad8281750f2978c6c1c91982f347a14cd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad8281750f2978c6c1c91982f347a14cd">&#9670;&nbsp;</a></span>c() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::c </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a07a067df652b64bd580f2ddf373e292b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a07a067df652b64bd580f2ddf373e292b">&#9670;&nbsp;</a></span>d() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> const&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::d </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aec4ffcdc8fbf57a8b649fff38af55007"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aec4ffcdc8fbf57a8b649fff38af55007">&#9670;&nbsp;</a></span>d() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::d </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="abe65d1a0ff3798b662376032d51e9713"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abe65d1a0ff3798b662376032d51e9713">&#9670;&nbsp;</a></span>dhw()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::dhw </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac7c697a6fd23c7f49ff19aa6db4a41a3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac7c697a6fd23c7f49ff19aa6db4a41a3">&#9670;&nbsp;</a></span>h() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> const&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::h </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1d91ffa0a63ad03431ff79185526f92f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1d91ffa0a63ad03431ff79185526f92f">&#9670;&nbsp;</a></span>h() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::h </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0927c4ba212d00f3687034afe6bb8daf"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0927c4ba212d00f3687034afe6bb8daf">&#9670;&nbsp;</a></span>hw()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;2&gt; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::hw </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a11bb7593ce7bba2dcedd199322a8b42b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a11bb7593ce7bba2dcedd199322a8b42b">&#9670;&nbsp;</a></span>hwc()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::hwc </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab8fbb13cc5ea4f580a7fc32963de9553"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab8fbb13cc5ea4f580a7fc32963de9553">&#9670;&nbsp;</a></span>operator*()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::operator* </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae946b3af6b795d26632da7ca66b3751c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae946b3af6b795d26632da7ca66b3751c">&#9670;&nbsp;</a></span>operator*=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a>&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::operator*= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3bfa2daa0e63144c1e8510ba336f185b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3bfa2daa0e63144c1e8510ba336f185b">&#9670;&nbsp;</a></span>operator+()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::operator+ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a812760c633ea813db8a2bc24826c68df"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a812760c633ea813db8a2bc24826c68df">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a>&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9f274d8e93f9cd3e0a9699e11b85fa7c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9f274d8e93f9cd3e0a9699e11b85fa7c">&#9670;&nbsp;</a></span>operator-()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::operator- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a02da20e580962fe0754a772842045389"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a02da20e580962fe0754a772842045389">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a>&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::operator-= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5d2cc915343a3b90fb530348ddd329d2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5d2cc915343a3b90fb530348ddd329d2">&#9670;&nbsp;</a></span>operator/()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a> <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::operator/ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac3207d8aa879c86a907cdcc93ccb2eb5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac3207d8aa879c86a907cdcc93ccb2eb5">&#9670;&nbsp;</a></span>operator/=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html">TileCoord</a>&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::operator/= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a21ae028c4ee3e5cbe5bf9d47a41e6613"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a21ae028c4ee3e5cbe5bf9d47a41e6613">&#9670;&nbsp;</a></span>w() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> const&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::w </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8f83026751c83f57c1854c8544e75bd0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8f83026751c83f57c1854c8544e75bd0">&#9670;&nbsp;</a></span>w() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>&amp; <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::w </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a8236879e1670072033983b7ec4b7ae32"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8236879e1670072033983b7ec4b7ae32">&#9670;&nbsp;</a></span>kC</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::kC = 3</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab5ebf352327baadcc740175d6b39adcb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab5ebf352327baadcc740175d6b39adcb">&#9670;&nbsp;</a></span>kD</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::kD = 0</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a24d32587359493bb965745f5551e1624"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a24d32587359493bb965745f5551e1624">&#9670;&nbsp;</a></span>kH</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::kH = 1</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac2c14af3ceffd5ef8f17c9e0efb4e5ec"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac2c14af3ceffd5ef8f17c9e0efb4e5ec">&#9670;&nbsp;</a></span>kW</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int <a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a>&lt; Index_ &gt;::kW = 2</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__coord_8h_source.html">tile_coord.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileCoord.png b/docs/structcutlass_1_1TileCoord.png
new file mode 100644
index 0000000000000000000000000000000000000000..ed79e4b07588c4b785b84668be23425d6feb4987
GIT binary patch
literal 720
zcmeAS@N?(olHy`uVBq!ia0vp^Yk@d`gBeK1)Us{^QW60^A+G=b{|7QZe0{O(Q0W99
z3ycpOI1sV1A`HmoC<*clW&kPzfvcxNj2IZ0;yqm)Ln;{G&VAdr+JJ{uoqgr||0lLP
zC=_~RY>!@_r?Pks)6Y*wZoG@1mKwQCuv^7<(SoTe@~mrBer9;g-lpcsy!5%MXKie|
zPrvLw^Dn%&atmx88zuFBW4(1Za`(08Z!@<C{WoJfCpoj;_SwE`Ok20C?%ne;^F=Fn
z)~%kXyt(4W7b3R`zS;AwLiX0C@a&8qzEV-i`$|%7@9n>S>6+2}N3U+5Tgy3P+IP|1
zb4v?VcrvqhyT9jMYpAj^Fa0_9t)yjz@6Xrl-e@xa*{j=*dHuE7Oe^KL`})4P9QWwk
zx$UZX){$mix3&Iz$34Fl;Cg80E?+~7EGN%m&ro9(vmpDGoRglc-LAb_CHCv~E$<J$
z3%ob`_wjvGm&9visGf9p)b_NS)mIidEme%s;sv8Y@3KX;Hfe|Ec75Zt7JL`8B~X}Q
zkH{7VJFX}Oc~;$q{wA>l?vC6K7B67^5O{&<heift4T^Nx-XO0`sfi3~Fj<oYwPp9_
zEb_Wgb?qAag;3*^`1>U{-M3u*c6H6$!ac8cZ`qw(COcKvdiB5D3#Zl?RjoTU`C6v<
z`kd_Zz2|e^_1C<c#5*ne`O+`fwp=}R&QJQ{x$M3<yH71JOnbb}Kig+&Uk<y*TlOtm
zvkr%|Z!Ol_^L>kD{yXKw^E=ElZu0_znP<iAkE!o6ye;DH-2Smm?oVqz`_H@I*K#hZ
zyVIw9P)$yyr>gMwESrp33tk_|o%&z3y?;@Z(!$B9$4_m(x6O3nl3H^iyOo>_|M&j$
szxDXMkb!Ou!t)t_zx!z}_58vgW23UrSwrX<F!?cfy85}Sb4q9e0Q$#O0RR91

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1TileIteratorBase-members.html b/docs/structcutlass_1_1TileIteratorBase-members.html
index a313a5115..ce46e77f7 100644
--- a/docs/structcutlass_1_1TileIteratorBase-members.html
+++ b/docs/structcutlass_1_1TileIteratorBase-members.html
@@ -73,40 +73,40 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Member List</div>  </div>
+<div class="title">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a>(PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileIteratorBase.html b/docs/structcutlass_1_1TileIteratorBase.html
index a94691497..b01915206 100644
--- a/docs/structcutlass_1_1TileIteratorBase.html
+++ b/docs/structcutlass_1_1TileIteratorBase.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -80,7 +80,7 @@ $(function() {
 <a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1TileIteratorBase-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -89,13 +89,13 @@ $(function() {
 
 <p><code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;:</div>
+Inheritance diagram for cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1TileIteratorBase.png" usemap="#cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E_map" alt=""/>
-  <map id="cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E_map" name="cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E_map">
-<area href="structcutlass_1_1TileLoadIterator.html" title="An iterator implementing Tile Load Iterator Concept for loading a tile from memory. " alt="cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;" shape="rect" coords="0,56,734,80"/>
-<area href="structcutlass_1_1TileStoreIterator.html" title="An iterator implementing Tile Store Iterator Concept for storing a tile to memory. " alt="cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;" shape="rect" coords="744,56,1478,80"/>
+  <img src="structcutlass_1_1TileIteratorBase.png" usemap="#cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E_map" alt=""/>
+  <map id="cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E_map" name="cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E_map">
+<area href="structcutlass_1_1TileLoadIterator.html" title="An iterator implementing Tile Load Iterator Concept for loading a tile from memory. " alt="cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;" shape="rect" coords="0,56,766,80"/>
+<area href="structcutlass_1_1TileStoreIterator.html" title="An iterator implementing Tile Store Iterator Concept for storing a tile to memory. " alt="cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;" shape="rect" coords="776,56,1542,80"/>
 </map>
  </div></div>
 <table class="memberdecls">
@@ -107,356 +107,356 @@ Classes</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:ae7add0ee02bbec2c130ebaf608ab0696"><td class="memItemLeft" align="right" valign="top">typedef Traits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a></td></tr>
-<tr class="memdesc:ae7add0ee02bbec2c130ebaf608ab0696"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="#ae7add0ee02bbec2c130ebaf608ab0696">More...</a><br /></td></tr>
-<tr class="separator:ae7add0ee02bbec2c130ebaf608ab0696"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a17163e93d7d3616b4950925f72bb4c16"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a></td></tr>
-<tr class="memdesc:a17163e93d7d3616b4950925f72bb4c16"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="#a17163e93d7d3616b4950925f72bb4c16">More...</a><br /></td></tr>
-<tr class="separator:a17163e93d7d3616b4950925f72bb4c16"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac7cca14d54bf3f0749db1ffaea7c9ae7"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a></td></tr>
-<tr class="memdesc:ac7cca14d54bf3f0749db1ffaea7c9ae7"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="#ac7cca14d54bf3f0749db1ffaea7c9ae7">More...</a><br /></td></tr>
-<tr class="separator:ac7cca14d54bf3f0749db1ffaea7c9ae7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a44665808adfd69df0d26cec4b1840cc3"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a></td></tr>
-<tr class="memdesc:a44665808adfd69df0d26cec4b1840cc3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#a44665808adfd69df0d26cec4b1840cc3">More...</a><br /></td></tr>
-<tr class="separator:a44665808adfd69df0d26cec4b1840cc3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae89afbcf642b3023770ff22969c51d16"><td class="memItemLeft" align="right" valign="top">typedef Skew_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a></td></tr>
-<tr class="memdesc:ae89afbcf642b3023770ff22969c51d16"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="#ae89afbcf642b3023770ff22969c51d16">More...</a><br /></td></tr>
-<tr class="separator:ae89afbcf642b3023770ff22969c51d16"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a954ef18acc12d8256a7d4e37683f8c2c"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a></td></tr>
-<tr class="memdesc:a954ef18acc12d8256a7d4e37683f8c2c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="#a954ef18acc12d8256a7d4e37683f8c2c">More...</a><br /></td></tr>
-<tr class="separator:a954ef18acc12d8256a7d4e37683f8c2c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9bc6c04f4a3adeb5a29743fa43425088"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a></td></tr>
-<tr class="memdesc:a9bc6c04f4a3adeb5a29743fa43425088"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="#a9bc6c04f4a3adeb5a29743fa43425088">More...</a><br /></td></tr>
-<tr class="separator:a9bc6c04f4a3adeb5a29743fa43425088"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a561ceb1093b28b8dce67df0129b7b8b8"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a></td></tr>
-<tr class="memdesc:a561ceb1093b28b8dce67df0129b7b8b8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a561ceb1093b28b8dce67df0129b7b8b8">More...</a><br /></td></tr>
-<tr class="separator:a561ceb1093b28b8dce67df0129b7b8b8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a352ed0773b37f03bf68e4b6cf9899474"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a></td></tr>
-<tr class="memdesc:a352ed0773b37f03bf68e4b6cf9899474"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="#a352ed0773b37f03bf68e4b6cf9899474">More...</a><br /></td></tr>
-<tr class="separator:a352ed0773b37f03bf68e4b6cf9899474"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5abf4755aee07dc58b1d6183fbf4786f"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a></td></tr>
-<tr class="memdesc:a5abf4755aee07dc58b1d6183fbf4786f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="#a5abf4755aee07dc58b1d6183fbf4786f">More...</a><br /></td></tr>
-<tr class="separator:a5abf4755aee07dc58b1d6183fbf4786f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb3dde23971ad35a477b75ee99381b53"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a></td></tr>
-<tr class="memdesc:abb3dde23971ad35a477b75ee99381b53"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="#abb3dde23971ad35a477b75ee99381b53">More...</a><br /></td></tr>
-<tr class="separator:abb3dde23971ad35a477b75ee99381b53"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6ca47fd6e2f9cbb3498c138417ea414a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a></td></tr>
-<tr class="memdesc:a6ca47fd6e2f9cbb3498c138417ea414a"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="#a6ca47fd6e2f9cbb3498c138417ea414a">More...</a><br /></td></tr>
-<tr class="separator:a6ca47fd6e2f9cbb3498c138417ea414a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0d7b595d7959cc1680fc07c2e02e1c8e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a></td></tr>
-<tr class="memdesc:a0d7b595d7959cc1680fc07c2e02e1c8e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="#a0d7b595d7959cc1680fc07c2e02e1c8e">More...</a><br /></td></tr>
-<tr class="separator:a0d7b595d7959cc1680fc07c2e02e1c8e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a379a52ed1128fc9f93cad35d3e3233e5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a></td></tr>
-<tr class="memdesc:a379a52ed1128fc9f93cad35d3e3233e5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="#a379a52ed1128fc9f93cad35d3e3233e5">More...</a><br /></td></tr>
-<tr class="separator:a379a52ed1128fc9f93cad35d3e3233e5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a25a241bbdc0b0121992019a16f1a6d60"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a></td></tr>
-<tr class="memdesc:a25a241bbdc0b0121992019a16f1a6d60"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="#a25a241bbdc0b0121992019a16f1a6d60">More...</a><br /></td></tr>
-<tr class="separator:a25a241bbdc0b0121992019a16f1a6d60"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a14f4b356c9cd320e6e7b451edbf58c24"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a></td></tr>
-<tr class="memdesc:a14f4b356c9cd320e6e7b451edbf58c24"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="#a14f4b356c9cd320e6e7b451edbf58c24">More...</a><br /></td></tr>
-<tr class="separator:a14f4b356c9cd320e6e7b451edbf58c24"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7ab46a9210b421d32af4d1394892cfd5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a></td></tr>
-<tr class="memdesc:a7ab46a9210b421d32af4d1394892cfd5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="#a7ab46a9210b421d32af4d1394892cfd5">More...</a><br /></td></tr>
-<tr class="separator:a7ab46a9210b421d32af4d1394892cfd5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aac9e5b7890a53d46e5d49912b254ded7"><td class="memItemLeft" align="right" valign="top">typedef Traits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td></tr>
+<tr class="memdesc:aac9e5b7890a53d46e5d49912b254ded7"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="#aac9e5b7890a53d46e5d49912b254ded7">More...</a><br /></td></tr>
+<tr class="separator:aac9e5b7890a53d46e5d49912b254ded7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:affac5a91f0659bb6739db25d20822c34"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td></tr>
+<tr class="memdesc:affac5a91f0659bb6739db25d20822c34"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="#affac5a91f0659bb6739db25d20822c34">More...</a><br /></td></tr>
+<tr class="separator:affac5a91f0659bb6739db25d20822c34"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f2fe3fa2eb764bf664817097d22fe45"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td></tr>
+<tr class="memdesc:a7f2fe3fa2eb764bf664817097d22fe45"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="#a7f2fe3fa2eb764bf664817097d22fe45">More...</a><br /></td></tr>
+<tr class="separator:a7f2fe3fa2eb764bf664817097d22fe45"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab49ff66953031a8cfcfa11ddc092025c"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td></tr>
+<tr class="memdesc:ab49ff66953031a8cfcfa11ddc092025c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#ab49ff66953031a8cfcfa11ddc092025c">More...</a><br /></td></tr>
+<tr class="separator:ab49ff66953031a8cfcfa11ddc092025c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae50ca325a827bdf1d1bfab3ba6e204c1"><td class="memItemLeft" align="right" valign="top">typedef Skew_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td></tr>
+<tr class="memdesc:ae50ca325a827bdf1d1bfab3ba6e204c1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="#ae50ca325a827bdf1d1bfab3ba6e204c1">More...</a><br /></td></tr>
+<tr class="separator:ae50ca325a827bdf1d1bfab3ba6e204c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7fcf13023c85cf1e1150d867bd1559d4"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td></tr>
+<tr class="memdesc:a7fcf13023c85cf1e1150d867bd1559d4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="#a7fcf13023c85cf1e1150d867bd1559d4">More...</a><br /></td></tr>
+<tr class="separator:a7fcf13023c85cf1e1150d867bd1559d4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aaac43bc2258e06824c354a068e7815"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td></tr>
+<tr class="memdesc:a9aaac43bc2258e06824c354a068e7815"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="#a9aaac43bc2258e06824c354a068e7815">More...</a><br /></td></tr>
+<tr class="separator:a9aaac43bc2258e06824c354a068e7815"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37eec43846be90d558201bd6bb27ee4"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:ab37eec43846be90d558201bd6bb27ee4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#ab37eec43846be90d558201bd6bb27ee4">More...</a><br /></td></tr>
+<tr class="separator:ab37eec43846be90d558201bd6bb27ee4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbf563ecda4ffd4110d288f521c7e0da"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td></tr>
+<tr class="memdesc:adbf563ecda4ffd4110d288f521c7e0da"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="#adbf563ecda4ffd4110d288f521c7e0da">More...</a><br /></td></tr>
+<tr class="separator:adbf563ecda4ffd4110d288f521c7e0da"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0fec2c1f9c0b8fbde4ca6faf123b59a5"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td></tr>
+<tr class="memdesc:a0fec2c1f9c0b8fbde4ca6faf123b59a5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="#a0fec2c1f9c0b8fbde4ca6faf123b59a5">More...</a><br /></td></tr>
+<tr class="separator:a0fec2c1f9c0b8fbde4ca6faf123b59a5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24716c07ab1d7834a79d52231a990973"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td></tr>
+<tr class="memdesc:a24716c07ab1d7834a79d52231a990973"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="#a24716c07ab1d7834a79d52231a990973">More...</a><br /></td></tr>
+<tr class="separator:a24716c07ab1d7834a79d52231a990973"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e682380b5ea9ea05ee8ffd68a1205f0"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a></td></tr>
+<tr class="memdesc:a2e682380b5ea9ea05ee8ffd68a1205f0"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="#a2e682380b5ea9ea05ee8ffd68a1205f0">More...</a><br /></td></tr>
+<tr class="separator:a2e682380b5ea9ea05ee8ffd68a1205f0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ffa12dcd7ed1e96845e1cd273d9f219"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td></tr>
+<tr class="memdesc:a9ffa12dcd7ed1e96845e1cd273d9f219"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="#a9ffa12dcd7ed1e96845e1cd273d9f219">More...</a><br /></td></tr>
+<tr class="separator:a9ffa12dcd7ed1e96845e1cd273d9f219"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a59d40c5bd544fdabf42787b9f11cce51"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td></tr>
+<tr class="memdesc:a59d40c5bd544fdabf42787b9f11cce51"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="#a59d40c5bd544fdabf42787b9f11cce51">More...</a><br /></td></tr>
+<tr class="separator:a59d40c5bd544fdabf42787b9f11cce51"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5eb6375410d4440c0f73a25c06d282b5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:a5eb6375410d4440c0f73a25c06d282b5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="#a5eb6375410d4440c0f73a25c06d282b5">More...</a><br /></td></tr>
+<tr class="separator:a5eb6375410d4440c0f73a25c06d282b5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a064aaca9cc27e34bdae9684447a3f5be"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td></tr>
+<tr class="memdesc:a064aaca9cc27e34bdae9684447a3f5be"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="#a064aaca9cc27e34bdae9684447a3f5be">More...</a><br /></td></tr>
+<tr class="separator:a064aaca9cc27e34bdae9684447a3f5be"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a05065dadf7b8a20284c566c82cda8000"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td></tr>
+<tr class="memdesc:a05065dadf7b8a20284c566c82cda8000"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="#a05065dadf7b8a20284c566c82cda8000">More...</a><br /></td></tr>
+<tr class="separator:a05065dadf7b8a20284c566c82cda8000"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:af78a2bf3e7507dc7f50343a3c209f770"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:af78a2bf3e7507dc7f50343a3c209f770"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="#af78a2bf3e7507dc7f50343a3c209f770">More...</a><br /></td></tr>
-<tr class="separator:af78a2bf3e7507dc7f50343a3c209f770"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac811886f3412861928040546282b6973"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ac811886f3412861928040546282b6973"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="#ac811886f3412861928040546282b6973">More...</a><br /></td></tr>
+<tr class="separator:ac811886f3412861928040546282b6973"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
 Static Public Member Functions</h2></td></tr>
-<tr class="memitem:a78b6c0d6a1a96dd55a34bc302ecb07d7"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator &gt; </td></tr>
-<tr class="memitem:a78b6c0d6a1a96dd55a34bc302ecb07d7"><td class="memTemplItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
-<tr class="memdesc:a78b6c0d6a1a96dd55a34bc302ecb07d7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="#a78b6c0d6a1a96dd55a34bc302ecb07d7">More...</a><br /></td></tr>
-<tr class="separator:a78b6c0d6a1a96dd55a34bc302ecb07d7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208"><td class="memTemplItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:aa58daf082cf97108e2e2ad0b1fd89208"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="#aa58daf082cf97108e2e2ad0b1fd89208">More...</a><br /></td></tr>
+<tr class="separator:aa58daf082cf97108e2e2ad0b1fd89208"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
-<tr class="memitem:ac1a64e974dcd69c3a86a31db6cbff421"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a> = Advance_</td></tr>
-<tr class="memdesc:ac1a64e974dcd69c3a86a31db6cbff421"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="#ac1a64e974dcd69c3a86a31db6cbff421">More...</a><br /></td></tr>
-<tr class="separator:ac1a64e974dcd69c3a86a31db6cbff421"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a38c8ec1e9d0117172981b4c7dd4bf3be"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a> = IteratorFragment_</td></tr>
-<tr class="memdesc:a38c8ec1e9d0117172981b4c7dd4bf3be"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="#a38c8ec1e9d0117172981b4c7dd4bf3be">More...</a><br /></td></tr>
-<tr class="separator:a38c8ec1e9d0117172981b4c7dd4bf3be"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a871c9b82109eab432c5a1d465643bf97"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a> = <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a></td></tr>
-<tr class="memdesc:a871c9b82109eab432c5a1d465643bf97"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="#a871c9b82109eab432c5a1d465643bf97">More...</a><br /></td></tr>
-<tr class="separator:a871c9b82109eab432c5a1d465643bf97"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aef07ba456ea016092d7d2446751b76a3"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> = Tile::kC</td></tr>
-<tr class="memdesc:aef07ba456ea016092d7d2446751b76a3"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="#aef07ba456ea016092d7d2446751b76a3">More...</a><br /></td></tr>
-<tr class="separator:aef07ba456ea016092d7d2446751b76a3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4e0b2bc06bb8f52313e4d8c51ab30ff2"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td></tr>
-<tr class="memdesc:a4e0b2bc06bb8f52313e4d8c51ab30ff2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="#a4e0b2bc06bb8f52313e4d8c51ab30ff2">More...</a><br /></td></tr>
-<tr class="separator:a4e0b2bc06bb8f52313e4d8c51ab30ff2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acc8c86a3629a3ca105269fc3a47f2a4f"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a> = Advance_</td></tr>
+<tr class="memdesc:acc8c86a3629a3ca105269fc3a47f2a4f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="#acc8c86a3629a3ca105269fc3a47f2a4f">More...</a><br /></td></tr>
+<tr class="separator:acc8c86a3629a3ca105269fc3a47f2a4f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af405f6c5f0bd8f04487d8a7f41dc1826"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a> = FragmentElementType_</td></tr>
+<tr class="memdesc:af405f6c5f0bd8f04487d8a7f41dc1826"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="#af405f6c5f0bd8f04487d8a7f41dc1826">More...</a><br /></td></tr>
+<tr class="separator:af405f6c5f0bd8f04487d8a7f41dc1826"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab8bfa9914c4ba49a583d1cfaa8a62d56"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a> = <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a></td></tr>
+<tr class="memdesc:ab8bfa9914c4ba49a583d1cfaa8a62d56"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="#ab8bfa9914c4ba49a583d1cfaa8a62d56">More...</a><br /></td></tr>
+<tr class="separator:ab8bfa9914c4ba49a583d1cfaa8a62d56"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8a4edd46b8cad3eeafc2a3dc3a344499"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> = Traits::kAccessSize</td></tr>
+<tr class="memdesc:a8a4edd46b8cad3eeafc2a3dc3a344499"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="#a8a4edd46b8cad3eeafc2a3dc3a344499">More...</a><br /></td></tr>
+<tr class="separator:a8a4edd46b8cad3eeafc2a3dc3a344499"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aefe67241dde93bb032c5b4d82bc3f761"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td></tr>
+<tr class="memdesc:aefe67241dde93bb032c5b4d82bc3f761"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="#aefe67241dde93bb032c5b4d82bc3f761">More...</a><br /></td></tr>
+<tr class="separator:aefe67241dde93bb032c5b4d82bc3f761"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="abb3dde23971ad35a477b75ee99381b53"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abb3dde23971ad35a477b75ee99381b53">&#9670;&nbsp;</a></span>AccessType</h2>
+<a id="a24716c07ab1d7834a79d52231a990973"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a24716c07ab1d7834a79d52231a990973">&#9670;&nbsp;</a></span>AccessType</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a>&gt;::Type <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a>&gt;::Type <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a9bc6c04f4a3adeb5a29743fa43425088"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9bc6c04f4a3adeb5a29743fa43425088">&#9670;&nbsp;</a></span>Delta</h2>
+<a id="a9aaac43bc2258e06824c354a068e7815"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9aaac43bc2258e06824c354a068e7815">&#9670;&nbsp;</a></span>Delta</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Traits::Delta <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a></td>
+          <td class="memname">typedef Traits::Delta <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a0d7b595d7959cc1680fc07c2e02e1c8e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0d7b595d7959cc1680fc07c2e02e1c8e">&#9670;&nbsp;</a></span>Fragment</h2>
+<a id="a9ffa12dcd7ed1e96845e1cd273d9f219"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9ffa12dcd7ed1e96845e1cd273d9f219">&#9670;&nbsp;</a></span>Fragment</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>&gt;::kCount * <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>&gt;::kCount * <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a25a241bbdc0b0121992019a16f1a6d60"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a25a241bbdc0b0121992019a16f1a6d60">&#9670;&nbsp;</a></span>FragmentConstIterator</h2>
+<a id="a5eb6375410d4440c0f73a25c06d282b5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5eb6375410d4440c0f73a25c06d282b5">&#9670;&nbsp;</a></span>FragmentConstIterator</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a>&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a>&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ac7cca14d54bf3f0749db1ffaea7c9ae7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac7cca14d54bf3f0749db1ffaea7c9ae7">&#9670;&nbsp;</a></span>FragmentElement</h2>
+<a id="a7f2fe3fa2eb764bf664817097d22fe45"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7f2fe3fa2eb764bf664817097d22fe45">&#9670;&nbsp;</a></span>FragmentElement</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef FragmentElement_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a></td>
+          <td class="memname">typedef FragmentElement_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a379a52ed1128fc9f93cad35d3e3233e5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a379a52ed1128fc9f93cad35d3e3233e5">&#9670;&nbsp;</a></span>FragmentIterator</h2>
+<a id="a59d40c5bd544fdabf42787b9f11cce51"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a59d40c5bd544fdabf42787b9f11cce51">&#9670;&nbsp;</a></span>FragmentIterator</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a>&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a>&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a14f4b356c9cd320e6e7b451edbf58c24"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a14f4b356c9cd320e6e7b451edbf58c24">&#9670;&nbsp;</a></span>FragmentShape</h2>
+<a id="a064aaca9cc27e34bdae9684447a3f5be"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a064aaca9cc27e34bdae9684447a3f5be">&#9670;&nbsp;</a></span>FragmentShape</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a561ceb1093b28b8dce67df0129b7b8b8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a561ceb1093b28b8dce67df0129b7b8b8">&#9670;&nbsp;</a></span>ImmediateOffsetStrides</h2>
+<a id="ab37eec43846be90d558201bd6bb27ee4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab37eec43846be90d558201bd6bb27ee4">&#9670;&nbsp;</a></span>ImmediateOffsetStrides</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Traits::ImmediateOffsetStrides <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a></td>
+          <td class="memname">typedef Traits::ImmediateOffsetStrides <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a44665808adfd69df0d26cec4b1840cc3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a44665808adfd69df0d26cec4b1840cc3">&#9670;&nbsp;</a></span>Index</h2>
+<a id="ab49ff66953031a8cfcfa11ddc092025c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab49ff66953031a8cfcfa11ddc092025c">&#9670;&nbsp;</a></span>Index</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a></td>
+          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a352ed0773b37f03bf68e4b6cf9899474"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a352ed0773b37f03bf68e4b6cf9899474">&#9670;&nbsp;</a></span>Iterations</h2>
+<a id="adbf563ecda4ffd4110d288f521c7e0da"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adbf563ecda4ffd4110d288f521c7e0da">&#9670;&nbsp;</a></span>Iterations</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Traits::Iterations <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a></td>
+          <td class="memname">typedef Traits::Iterations <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7ab46a9210b421d32af4d1394892cfd5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7ab46a9210b421d32af4d1394892cfd5">&#9670;&nbsp;</a></span>PredicateVector</h2>
+<a id="a05065dadf7b8a20284c566c82cda8000"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a05065dadf7b8a20284c566c82cda8000">&#9670;&nbsp;</a></span>PredicateVector</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a>&lt;<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>&gt;::kCount&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a>&lt;<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>&gt;::kCount&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a17163e93d7d3616b4950925f72bb4c16"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a17163e93d7d3616b4950925f72bb4c16">&#9670;&nbsp;</a></span>Scalar</h2>
+<a id="affac5a91f0659bb6739db25d20822c34"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#affac5a91f0659bb6739db25d20822c34">&#9670;&nbsp;</a></span>Scalar</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Scalar_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a></td>
+          <td class="memname">typedef Scalar_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ae89afbcf642b3023770ff22969c51d16"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae89afbcf642b3023770ff22969c51d16">&#9670;&nbsp;</a></span>Skew</h2>
+<a id="ae50ca325a827bdf1d1bfab3ba6e204c1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae50ca325a827bdf1d1bfab3ba6e204c1">&#9670;&nbsp;</a></span>Skew</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Skew_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a></td>
+          <td class="memname">typedef Skew_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a6ca47fd6e2f9cbb3498c138417ea414a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6ca47fd6e2f9cbb3498c138417ea414a">&#9670;&nbsp;</a></span>Storage</h2>
+<a id="a2e682380b5ea9ea05ee8ffd68a1205f0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2e682380b5ea9ea05ee8ffd68a1205f0">&#9670;&nbsp;</a></span>Storage</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a>&gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a>&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a>&gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a>&gt; <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a5abf4755aee07dc58b1d6183fbf4786f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5abf4755aee07dc58b1d6183fbf4786f">&#9670;&nbsp;</a></span>ThreadOffset</h2>
+<a id="a0fec2c1f9c0b8fbde4ca6faf123b59a5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0fec2c1f9c0b8fbde4ca6faf123b59a5">&#9670;&nbsp;</a></span>ThreadOffset</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Traits::ThreadOffset <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a></td>
+          <td class="memname">typedef Traits::ThreadOffset <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a954ef18acc12d8256a7d4e37683f8c2c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a954ef18acc12d8256a7d4e37683f8c2c">&#9670;&nbsp;</a></span>Tile</h2>
+<a id="a7fcf13023c85cf1e1150d867bd1559d4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7fcf13023c85cf1e1150d867bd1559d4">&#9670;&nbsp;</a></span>Tile</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Traits::Tile <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a></td>
+          <td class="memname">typedef Traits::Tile <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ae7add0ee02bbec2c130ebaf608ab0696"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae7add0ee02bbec2c130ebaf608ab0696">&#9670;&nbsp;</a></span>Traits</h2>
+<a id="aac9e5b7890a53d46e5d49912b254ded7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aac9e5b7890a53d46e5d49912b254ded7">&#9670;&nbsp;</a></span>Traits</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Traits_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a></td>
+          <td class="memname">typedef Traits_ <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -464,21 +464,21 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a78b6c0d6a1a96dd55a34bc302ecb07d7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a78b6c0d6a1a96dd55a34bc302ecb07d7">&#9670;&nbsp;</a></span>initialize_predicates()</h2>
+<a id="aa58daf082cf97108e2e2ad0b1fd89208"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa58daf082cf97108e2e2ad0b1fd89208">&#9670;&nbsp;</a></span>initialize_predicates()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
-template&lt;typename PredicateIterator &gt; </div>
+template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">static CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::initialize_predicates </td>
+          <td class="memname">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::initialize_predicates </td>
           <td>(</td>
           <td class="paramtype">PredicateIterator&#160;</td>
           <td class="paramname"><em>predicate_it</em>, </td>
@@ -486,14 +486,14 @@ template&lt;typename PredicateIterator &gt; </div>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>bounds</em>, </td>
+          <td class="paramtype">PredicateFunctor const &amp;&#160;</td>
+          <td class="paramname"><em>predicate_func</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>offset</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;0,&#160;0)</code>&#160;</td>
+          <td class="paramname"><em>offset</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -510,19 +510,19 @@ template&lt;typename PredicateIterator &gt; </div>
 
 </div>
 </div>
-<a id="af78a2bf3e7507dc7f50343a3c209f770"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af78a2bf3e7507dc7f50343a3c209f770">&#9670;&nbsp;</a></span>valid()</h2>
+<a id="ac811886f3412861928040546282b6973"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac811886f3412861928040546282b6973">&#9670;&nbsp;</a></span>valid()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE bool <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::valid </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::valid </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -561,19 +561,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="aef07ba456ea016092d7d2446751b76a3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aef07ba456ea016092d7d2446751b76a3">&#9670;&nbsp;</a></span>kAccessSize</h2>
+<a id="a8a4edd46b8cad3eeafc2a3dc3a344499"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8a4edd46b8cad3eeafc2a3dc3a344499">&#9670;&nbsp;</a></span>kAccessSize</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kAccessSize = Tile::kC</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kAccessSize = Traits::kAccessSize</td>
         </tr>
       </table>
   </td>
@@ -585,19 +585,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="ac1a64e974dcd69c3a86a31db6cbff421"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac1a64e974dcd69c3a86a31db6cbff421">&#9670;&nbsp;</a></span>kAdvance</h2>
+<a id="acc8c86a3629a3ca105269fc3a47f2a4f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acc8c86a3629a3ca105269fc3a47f2a4f">&#9670;&nbsp;</a></span>kAdvance</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kAdvance = Advance_</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kAdvance = Advance_</td>
         </tr>
       </table>
   </td>
@@ -609,43 +609,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a4e0b2bc06bb8f52313e4d8c51ab30ff2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4e0b2bc06bb8f52313e4d8c51ab30ff2">&#9670;&nbsp;</a></span>kFragmentSize</h2>
+<a id="af405f6c5f0bd8f04487d8a7f41dc1826"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af405f6c5f0bd8f04487d8a7f41dc1826">&#9670;&nbsp;</a></span>kFragmentElementType</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kFragmentSize</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">static</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-<b>Initial value:</b><div class="fragment"><div class="line">=</div><div class="line">      (<a class="code" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a> == <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">IteratorFragment::kWmmaMatrix</a> ? 16 : <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a>))</div></div><!-- fragment -->
-</div>
-</div>
-<a id="a38c8ec1e9d0117172981b4c7dd4bf3be"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a38c8ec1e9d0117172981b4c7dd4bf3be">&#9670;&nbsp;</a></span>kIteratorFragment</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kIteratorFragment = IteratorFragment_</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kFragmentElementType = FragmentElementType_</td>
         </tr>
       </table>
   </td>
@@ -657,19 +633,43 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a871c9b82109eab432c5a1d465643bf97"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a871c9b82109eab432c5a1d465643bf97">&#9670;&nbsp;</a></span>kMemorySpace</h2>
+<a id="aefe67241dde93bb032c5b4d82bc3f761"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aefe67241dde93bb032c5b4d82bc3f761">&#9670;&nbsp;</a></span>kFragmentSize</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kMemorySpace = <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a></td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kFragmentSize</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<b>Initial value:</b><div class="fragment"><div class="line">=</div><div class="line">      (<a class="code" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a> == <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a> ? 16 : <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a>))</div></div><!-- fragment -->
+</div>
+</div>
+<a id="ab8bfa9914c4ba49a583d1cfaa8a62d56"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab8bfa9914c4ba49a583d1cfaa8a62d56">&#9670;&nbsp;</a></span>kMemorySpace</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kMemorySpace = <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a></td>
         </tr>
       </table>
   </td>
@@ -687,7 +687,7 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileIteratorBase.png b/docs/structcutlass_1_1TileIteratorBase.png
index ce0eacc9de4519c31a767f8a48a2268ef4061d77..0dd3418494831c0050fe0156a66b313c9aa421f1 100644
GIT binary patch
literal 2987
zcmdT_dpMNq7XO$UV%&0>nIi1XZlk$05+UQ(&d4pBQtq~)Tq4(r7?XtLHe*a~QIzAj
zL`rTk5@O19*^JvXh8ig$O2lwx)Y<zv=a2L3bN)N;^L%Ul-e<k*_pWcf@4Hs2gWX{%
zi5(IE07&7iEFA#=3>IJqagad12{m~sP%sA@r$ZYX8v;20`R%QTky!$?`O)cgmpZ~R
z!BjlL(e773ut+!t`kXKTAZduRG;<<|d?<1adv6HY;##UbN9_IbC`Lp<gJCzJL7Vh3
zs<V{U5ci4~fzV|zkWQ~l-moWVh=nHr13=FZHCqHy#V%eT_5WKOsks&#<M>18r`~#L
z+x&8h7F{bXlhLA0i<|jb1sKOERi+KHq&*QUkE>Fk^lhr#!t`Auit=rv-c%7lZ}Imj
z<Z}$*1$^Zx!hdez;NgvK#DOx4&X{2xHjjcq=eY+RXUS}|LIC4Kjde6%U|j236oK7^
zVGF$=biD>7Va``xb%V1}(CoT~>^oD}y5Vj!i(-j!r%!U8POOp(cg{4w;E9%8KXBOC
zZb;75=bWL6LBaXP(Q5HBIlPyi>jcHVsM+gY#3a{*DD~pqc!?SKfTT#VJ|%izb+cPo
zTjpew>5h=l#y5RPUsGjow!+^c6%$l)MTF_9Ku#7<^epY`GsR=5VMh44m{YkiYfB|V
z;-)^+JzeiALlP|CDh%5b$f}~J_o$fU-MevT^iWg8d-Y&%RR^_<lEl+~b)~fdFAp+#
zqNiIsyvd~fzb2pu-*am2=8~?8ecR<I*b&O!6~w={*N8%Ln*BIE|FQS!c*$}9_VOLI
ziUj1sdF=$75tn>g%i_l!NsyfKe#86GP6UJBQ%^q6ZB#0XB02{$uT|AN+4_Qz*r@?3
z4`>B9?5${MOJaUYz7v>dUK|+6x?zFW$MU||c7^DTAx-l1J|G^OdQ7{BKRl<DHXvhq
zWNdb%pYl;DPtCKMp)HHfN_o0FVB&gmT%gStkw@9FuCW)Ql5NwfqCB^9pGsTg-rEbD
zYHF9xHqIg;62AS4Kc+U4x%_}a8oE0XmR`0GlcmJTkJbVO?>rD-eOf;$L@oU_kwUt)
za;@RY&mdd1e0gXx_Dd*c?&$GX!}pB#G>6r#ns>f>7ur;8Z9_sg&@Z*DFYlF%)fC<2
zH?rld!-7=<CGTaC?tFG9lZwWJ?4*6i%e0)+7yk~i$za{SBc{51aGG=&^XyX1LKe-9
zm;^p|U8j6>Phxne>P^uH!{5#z`1Sd*H?CUWX<hd+<K{ggUVh;Z52{CRZB`ij%CjR7
z^+T?$uSTChA>w}@ny^kwOXT-ZkEIPTNlS<p>vVtJew|%?{_-h7usB3`KCG;I?j*i7
z^B8#HL>N7Hbj)*LA*?NZlAT-`*WNkYb)$4Qt9ENtLq?3WgAW`)196Ki9qvs&vEzEN
z#}Dwrli2&8N{2n;J3^v|Bsi=C^$-A-(6&-aMcWilHEfXOWV;zhd=qsS1CMx)JnmuK
zZXUmH6eLQ<f2s&{@dIh>0RiBW5Vvgr$4;IXeds|@JizJFHz<UzWh5G`h(Js^joSf;
zY4rbwA)V-}-Y~E(r1KdR0Mmt)W!~=0cjN`c&^I4!f(ROT5ZZD=41fqBxI|tU)#mDF
zk{eERL*c6yTH?Hf84y|$GHS(zYyyL+z6<!DjywN!loB5Orr%pI1K8xH0}+XMV3XGi
zXzuu9Z}y+GXKDrc`#0K<*HJC(Cm*6(@<u;Iy;l-izdoFn5rp3zDTvJQ(f<RU55F>L
zkbhRWN0qxjWAaq@S!JRqtHU5;5=D<hXG|{thPEbWYy5~iD2F#CU(tZ$-fd$f2$k$N
z1^>&lydUAPSqrlErD=-4N`JB6!0pVUJtoMx0R7eTeEyZ5aLo#QUGpjTSx2%&R5Gp1
z;xYmE;$M3J*-6(vZg#tBFI^HJ+9n6RAjyR)Jq*M+czlI2=p77QRM)7E*}CtNy&p8B
z;?+$JMdLg^`I7?om`7hcF6MH%ibr&v4Y3@eOzSw&)*|aB-d-(x0TT2>7^`@?ecEv{
znu}mC1L|RHf7?ENY{39J{-&{w+=yQY!^*KU_tA5r@gp<6>fx5cpJ4ijwV>j|?fHn0
z!^TXV5Sk}~O}GlW9~@#5Uj)5=*}{P~U#?<XiKMl{SS=i$we_TwG^_NML!mp-rWaAH
zS#cwagwjql<hY9?FLGSO3m_NY=dCMX8_M@?EOyPZPSaekDcFZogJmwKTRHmFq59=m
zG=*Qp9hNB3yI9!@J>;R@s_L5yIkCj_WaU=&b&W2$J|cA8@9>JX&x^vR)ST{}%C}~i
zEG@0{&tEN|sCq1~!vk#M4px_uS!5@Tn=d;jW#QE{nM+<rDtT{rW1bbFr@Swl#^gKh
zTRmvY|KP?AZqmYeTTUIg>n|3Y#UJS1|2~oyoWPhtF-noIGnpn{J92)hd`=mlHj#zB
zB8OjYdrB(kH^<;ONlyf*SUWMaGqDW({g^=Tt4w`V6XQu}30v`uOkxI;fv5`%FKZge
z;-6bOyPjM*v?g|&{36A5Bq#j-O2jbvVWa&i&{4mQfWifXOEn*BnJE#f<cSmpi)(+J
zs#`h|r+87{2y$Yu+mw8AP$7Vpo6~*g;UPHT7DW1M%&Tn4j->el39cLXLfF(IZw>2G
zvc0)Vp+#9Mpz3Ped8m<IfFPkg%_sZU%`-A{^zp=(poQLvc9wDBlh~XqVq8>Wz2sPj
z8&1$^xnWpmnQVn_rJ+!kDwY?2ES2sIC$vHOX73lgGY?f?%P@b8sZBW=9!D*lspngP
zqZmbaV&6vM47Mo^#Ba*s*Pp+J8_woXDzSa*?r$YzoME)lvANf3@L!i1<1_9m&{qX2
zw`M|O@01C8$(|jd>Y|4+^D7ua*4+0DPDyxENJRT`#h-AV#>jT1`n$Kgn4fr)@~mx=
z2(wgp6!E1A^=>+1l{U=4yiwWG^W2Ax^HzALgLg*v>kJ-woyrxR=pCd^Dfb_>cIDu$
zS~K^rE(&^!`Er2@5;f&&^oqa#i<mM}<!lX!5;!Dk<l3|UC!A(1d^rMMwNq<h^U6?@
zWPMG^>uUbaNSr1Lj+2<2)+BdSd=5W?&F63Rrz&)hsx*9FkL;I#XO&@7CC$ioq3TwS
zy~R`#&Svhi4vt0WwQ_`^P}x%bPi`aPPXDNiYS)HyW^1=u&F->y@5H#0w{L*pq3VsY
zChp?IV_=PG)boq$3|&jIL?3TA?vEz4CL;`FJ8}yyCUs6{%U>=-|EXZ*5ix?ACoF<b
s4KjW^z6B2JIlFJtAj40&r%q=bWbKR<du(>I5D*O9Av?<&bFT~k0IEnli2wiq

literal 2958
zcmc&#do+~m8Xsv>8kAh4=H$8wl{743N*pGk#wC)*tz2h@?K*C;-J(72*Ie2($R^`{
z8==UQ(6}`i#$`fM!)%usmpI?hI=i*bI&1Co*ZJ1^zUO_u^?RS^eV^y|{@%D7riT1{
zC-^`h5I@{V9{~dW)CG)h9O4GP2UV<m03&|mx`n~+?k+G~Ui(!1$}b5R?Y-^o?bcO+
zR)BlR7h!4+0zjN+xZ6Sv1UhmOu7AZMkn3yS^e;79V12=N*J-=S7|8=h|2%56Qg?i^
zmtA{!q*|FkdB6p3KdT1ru#a&N?>Ps)iUf&+xXCJ3TH#!u1RhDYgI00r0`{Qhjv1bF
zpirkGZt-wNWg{2(@}%_wi05~0Wi$ZS_yKP6e3ekbYiOUP+eBd`%`K=4PbFa!25r(E
zo|vVHg1nNkLvQ=%MUl}V(DG+u?Oc<yA>bgbicel{9Rzuvq`=O`dU(AzCn#YgaN%x=
z+1kR2W&Zu}c&#sogKsytxY7qJQ+55qm=u)Ml#l~yrxeG1r!fCZlv2cyCmmQ4#!8H+
z-QUS#Z8f~jo0*)k?v+{Eoj=XWd>6Uw>s>9+UVozl{w1!~l#5I*mr+%4KA4pC#Pmqt
z)z%WK{z1eeXe&5pG4)oSXAR#(kJnP0uv@nMywV}c&7ava*}46~ezcD*kgd>&AypK6
zxHEi6udwv!1(5B2?tv=_yYZ04L09^4(t>8aT}BD9BgK#)7_Sc!s(B*XpV`DE^z!hZ
zm!{!ihwxBs-xDA1^5rOZlfQx$qfu8PMqcS;1c^#SKf`ICTKfq>tew7foZCp5N<`bB
z=-y9Id;2TIDTv*Hl<$mywX2z%<&%k{6a^wFfii~`)CtjP-#9vN$>of2EJgZLzKKWU
zGRyi{L;i)1F?LS~7<^Mj^hHdAJ9EHoD7*Etd#1+rHAfJ?`E-WSR*>~OCrMtQ%Ra93
zL~gdGw&WvzEAn<=3r5*dX9>0JX6<D5vdae_DkHd<ZK%8gs_pa@(>9HybVn_g<W(yj
z1j`mS=|7_8Ie1{)VBsUx0d;3wFL)|fcDE|&Ind{!+wP7aNyf>mMgD}frpx<HHiWjG
zdc_WKqAys)vU=0WBY}Lak1=la=SxGy1J33>{P>JHB&y~7`>Vzep)}z_8}BMMT|!{<
ztBAerIUWR6)Wy6pkFya@^vmuZ(|T`~Ac>C})V!&h0EP4B#KRgs#Ex}XjRd;cm3W5u
zIFzS;8DZD>wBo|LyGr6RVMVcwp5Q5yU??r4;_>O&J7LeU2Rx|W?`m`IdHb(FZMotu
z39I7t0r4*AOb6!rI21S!K`uJZf)L_X=PGN*)2}h`O^Syqh7rYLP4^BG2tF;sA@8#s
z@!0shZ72M_PPO-a6Bk`XzMcp79Sb0|6(7ag=Xx*(hyGF2%KXp>d5)W}`}k`wv1#Iu
zjaes+^%_B2V&3w2Ok2tbZCzETewypVKD%`77S7J@#uy+4l6j;OT17W)mKre2!~^;9
zD>ZMwLo60LR+}<*j3dLzcLkDprTAfDn-<cOXD8>HVP|O@ofRff7LU<L*Y_j5n_Jw|
zX1O*n4%&G<3Gey4r~JQ(0=VN`mV-FY1#kyh48+sU5tHTP=<g$YkS-UeE9W?V2wy`^
zsMH<;_<!(+|43Cd1fU^+5f6Xg&Z#z-GY1l7@^3iLUvMyoM|%*qIHv^rInQ%8xR+_l
zsS?KxECYbFlk7SC=0L&|U;Y(167?T}r+CNF4LMB{Xbm6Y1bX5CF#9snng+;=OSumq
zPNy?80Cq_%0uy~7&hi6<=+Xj0pLE0m0-0ac2UIuq{|jg9ba_klY9`PLUXmnlb-HFk
zTZEr(0-eokJ<oA?p2|wV)l!Cz_jk#?HA+dw=U3v40V7bgXY%*W-|<FknA0@bQb&&B
zqjyVheG7V!!clxw5QH?j9!R^Da(nKkf?=l3HN?yN%#>Q=n`hx#Q^efFD`q5-lYQvV
z#&K}O%rW|yyiN^M%sDLgVKlnHcmPh5Tcvomj1Os0*)(an(wQB{mG#aF6}!6@EcGuR
z*M~Xr4E&4-<X%;5n{({vx2De!2zOWwGc+5bGNIQ%mRkTX2?bR$*M!((Ou`ZiGg$n(
z?X~B|rgc|OB;!SK*)sEsw@w!f?&6m0v2^h_*^A}UxD}GYm)s14ycPFXQ}-3uW}9|w
zV|v$YT*CD44qHT{?*|H_O_r**Z-b`OVha0a%_K~2&YR@(Qbq}(az+0B=E!T;5$>n^
zEgn9*1n(Ax?#O3Tj2p-*t8GU&-RT9}gKaaUP4&;(m~p77BsvUnskg*6^oFc7JPsRD
zl^~8pxE5T-=I3I6lToa<X>_v=w(7P-&wJc|^O~xB4dFQ*i0PhmPHT{jpL<5Y4}CA6
z<0x(FRZ%lt7lYa+sR?RP?V5oi?*2ip!6|r`3tEk;*IlY)7CU3#`eDZ|jPwNm{MFBH
z8kL=fC(nGeK^h(jE@ZghTl^&VuD-pf*?5D(yS8OMF+Xthb}-5GY2Rvk+SsT`sN#9J
zdlp}V{urg>cK%q`1KE|z$VfcTkqNzB?gCg9)9`L$lH_bOAFAFpRGcwt*oeI_rl(F6
z9m)${TGUSS%7gVNDb{5T1g)S_%swXzkG;5R`w%g)c+bwVG|Pdw=mwL0E!shuHM31m
zzj+TSQgDM+V-l)z9zIrSgzvRPxcfwyj<H3uArOcCoDgbYqm2(&O>4jbi_Dw;n_pEL
zbgmjKy|^tV7UumZV_u<**rFD2?bPr@F0-YYy*3W!{kG0msglK0RIk!k?4|uf$M&xd
zLD(PHx65(J%ngRLitmwcf>HUXkk)gLrOFoV%jR?>C!@3x0Ryar<|ir-ayAwHU=?jo
z%Um(ENENC%tJwE7*ivGCV*Gx!Orgb2wI;Q6UC`<|gT7a~(t9t`r#0kTUFfjPjnpE+
zloQH8g2}_7bxcBudDKF8sAt!o9;Za3TKX=$*x2dRJWX!NdiMKP&Uz`n?)m5Z;P(#Q
zCj7@q$BgA)|Lzr*0?<>cN+4M~hX3IiTWOg3<FYiwq>(Dau#C}?ai{Xej(i7jolw?m
zkXxe1^T&oVg{V|o5eeENd(o4_5~Pq~2D-rZ(*x;MdwR-hgjAj*TnX!zgeR-U8gUC4
zB9DA4XGwlgQmhU5>5|C2OR5M|6%L7uR)zC!Cr0m7L3Jl828UJPC4rndKU_9us@`y|
zUdi|X-71gN-WPI;{Si3ZPokUV1rN$`#sdodX*+f)sd$-dKB@S&xd5TX_Aa@F)Jn2k
z^!k~&QH~rTVn_DO`+f7jdm*E2&4i~C`@&~;%riua)c+e@^Rc%Sse&z-+<czqd@_>(
P0v@=5seXl?{jdK5<93yB

diff --git a/docs/structcutlass_1_1TileIteratorBase_1_1Params-members.html b/docs/structcutlass_1_1TileIteratorBase_1_1Params-members.html
index 3acf4206b..c3855bd16 100644
--- a/docs/structcutlass_1_1TileIteratorBase_1_1Params-members.html
+++ b/docs/structcutlass_1_1TileIteratorBase_1_1Params-members.html
@@ -73,26 +73,30 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params Member List</div>  </div>
+<div class="title">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">initialize</a>(Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">initialize</a>(Index _stride_d, Index _stride_h, Index _stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">initialize</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">initialize</a>(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">initialize</a>(Coord&lt; 4 &gt; const &amp;stride)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">initialize</a>(long long _stride_d, Index _stride_h, Index _stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">initialize</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">Params</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">Params</a>(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">Params</a>(Coord&lt; 4 &gt; const &amp;stride)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileIteratorBase_1_1Params.html b/docs/structcutlass_1_1TileIteratorBase_1_1Params.html
index be921381e..19a16384d 100644
--- a/docs/structcutlass_1_1TileIteratorBase_1_1Params.html
+++ b/docs/structcutlass_1_1TileIteratorBase_1_1Params.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params Struct Reference</title>
+<title>Cutlass: cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params Struct Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,7 +77,7 @@ $(function() {
 <a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="structcutlass_1_1TileIteratorBase_1_1Params-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params Struct Reference</div>  </div>
+<div class="title">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params Struct Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -86,96 +86,137 @@ $(function() {
 
 <p><code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params:</div>
+Inheritance diagram for cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1TileIteratorBase_1_1Params.png" usemap="#cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E::Params_map" alt=""/>
-  <map id="cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E::Params_map" name="cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E::Params_map">
-<area href="structcutlass_1_1TileLoadIterator_1_1Params.html" title="Parameters. " alt="cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params" shape="rect" coords="0,56,782,80"/>
-<area href="structcutlass_1_1TileStoreIterator_1_1Params.html" title="Parameters. " alt="cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params" shape="rect" coords="792,56,1574,80"/>
-<area href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html" alt="cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params" shape="rect" coords="0,112,782,136"/>
+  <img src="structcutlass_1_1TileIteratorBase_1_1Params.png" usemap="#cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E::Params_map" alt=""/>
+  <map id="cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E::Params_map" name="cutlass::TileIteratorBase_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E::Params_map">
+<area href="structcutlass_1_1TileLoadIterator_1_1Params.html" title="Parameters. " alt="cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params" shape="rect" coords="0,56,814,80"/>
+<area href="structcutlass_1_1TileStoreIterator_1_1Params.html" title="Parameters. " alt="cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params" shape="rect" coords="824,56,1638,80"/>
+<area href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html" alt="cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params" shape="rect" coords="0,112,814,136"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:ad2631ffcc963638aa5b016c66a2e2c55"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">initialize</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance)</td></tr>
-<tr class="memdesc:ad2631ffcc963638aa5b016c66a2e2c55"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="#ad2631ffcc963638aa5b016c66a2e2c55">More...</a><br /></td></tr>
-<tr class="separator:ad2631ffcc963638aa5b016c66a2e2c55"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3ba93370bd4b2ede4bd4eb97ac0881be"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">initialize</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w)</td></tr>
-<tr class="separator:a3ba93370bd4b2ede4bd4eb97ac0881be"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af496afebb8983e5d346c681334955224"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">initialize</a> ()</td></tr>
-<tr class="separator:af496afebb8983e5d346c681334955224"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acc0341b88143aac4ffd9bc1dcfaafa71"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">Params</a> ()</td></tr>
+<tr class="memdesc:acc0341b88143aac4ffd9bc1dcfaafa71"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params.  <a href="#acc0341b88143aac4ffd9bc1dcfaafa71">More...</a><br /></td></tr>
+<tr class="separator:acc0341b88143aac4ffd9bc1dcfaafa71"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab04617136a3bf909ef27eb97ea5ef81c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">Params</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, long long _inc_advance)</td></tr>
+<tr class="memdesc:ab04617136a3bf909ef27eb97ea5ef81c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params.  <a href="#ab04617136a3bf909ef27eb97ea5ef81c">More...</a><br /></td></tr>
+<tr class="separator:ab04617136a3bf909ef27eb97ea5ef81c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac030ea4568fa2cb6d6661df75062cd1a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">Params</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;stride)</td></tr>
+<tr class="memdesc:ac030ea4568fa2cb6d6661df75062cd1a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params with a stride vector.  <a href="#ac030ea4568fa2cb6d6661df75062cd1a">More...</a><br /></td></tr>
+<tr class="separator:ac030ea4568fa2cb6d6661df75062cd1a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a802c270449da579ed8661e915d27ce60"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">initialize</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, long long _inc_advance)</td></tr>
+<tr class="memdesc:a802c270449da579ed8661e915d27ce60"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="#a802c270449da579ed8661e915d27ce60">More...</a><br /></td></tr>
+<tr class="separator:a802c270449da579ed8661e915d27ce60"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2ef70d9e13b5aa7e4a53233b153d7edd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">initialize</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;stride)</td></tr>
+<tr class="memdesc:a2ef70d9e13b5aa7e4a53233b153d7edd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes the parameters object from a vector of strides.  <a href="#a2ef70d9e13b5aa7e4a53233b153d7edd">More...</a><br /></td></tr>
+<tr class="separator:a2ef70d9e13b5aa7e4a53233b153d7edd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a44870d45442ec45c8eaba46ab47a3ad9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">initialize</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w)</td></tr>
+<tr class="memdesc:a44870d45442ec45c8eaba46ab47a3ad9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes the parameters object from a vector of strides.  <a href="#a44870d45442ec45c8eaba46ab47a3ad9">More...</a><br /></td></tr>
+<tr class="separator:a44870d45442ec45c8eaba46ab47a3ad9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1776bf51e1e23cde6c58529be58aafb9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">initialize</a> ()</td></tr>
+<tr class="memdesc:a1776bf51e1e23cde6c58529be58aafb9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gotta have this.  <a href="#a1776bf51e1e23cde6c58529be58aafb9">More...</a><br /></td></tr>
+<tr class="separator:a1776bf51e1e23cde6c58529be58aafb9"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:ad67234ec264354a22032bb2519575dc1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a></td></tr>
-<tr class="separator:ad67234ec264354a22032bb2519575dc1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a58e8c883aea4cfdfa5a84c25a4704ebc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a></td></tr>
-<tr class="separator:a58e8c883aea4cfdfa5a84c25a4704ebc"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a313984457c78eea66c980f6813047b9c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a></td></tr>
-<tr class="separator:a313984457c78eea66c980f6813047b9c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af95fa1b5102176a0fa9b17713fd48150"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a></td></tr>
-<tr class="separator:af95fa1b5102176a0fa9b17713fd48150"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aea591d4278a8338ae8b50fa0b8f3a366"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a></td></tr>
-<tr class="separator:aea591d4278a8338ae8b50fa0b8f3a366"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac6e81450a2d78555a6c2415dcc42b178"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a></td></tr>
-<tr class="separator:ac6e81450a2d78555a6c2415dcc42b178"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1187258cd4068a627e73bee0302f1fc2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a></td></tr>
-<tr class="separator:a1187258cd4068a627e73bee0302f1fc2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a235647baff946e483dd61a2069aa01d2"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a></td></tr>
+<tr class="separator:a235647baff946e483dd61a2069aa01d2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4f029a268387bd63112d9074c185c623"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a></td></tr>
+<tr class="separator:a4f029a268387bd63112d9074c185c623"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af7e7a71a9fa41cc3f6d0e5963963339d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a></td></tr>
+<tr class="separator:af7e7a71a9fa41cc3f6d0e5963963339d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7b4293bf8291b0383dee695a60f2e0fd"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a></td></tr>
+<tr class="separator:a7b4293bf8291b0383dee695a60f2e0fd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a15227102466522445261b6ea65c89c06"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a></td></tr>
+<tr class="separator:a15227102466522445261b6ea65c89c06"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af0be1271cfe6d6c03a9a76ff992d8a5c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a></td></tr>
+<tr class="separator:af0be1271cfe6d6c03a9a76ff992d8a5c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6d8f1e07f286ed8d5761e2a878b807d3"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a></td></tr>
+<tr class="separator:a6d8f1e07f286ed8d5761e2a878b807d3"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
-<h2 class="groupheader">Member Function Documentation</h2>
-<a id="ad2631ffcc963638aa5b016c66a2e2c55"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad2631ffcc963638aa5b016c66a2e2c55">&#9670;&nbsp;</a></span>initialize() <span class="overload">[1/3]</span></h2>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="acc0341b88143aac4ffd9bc1dcfaafa71"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acc0341b88143aac4ffd9bc1dcfaafa71">&#9670;&nbsp;</a></span>Params() <span class="overload">[1/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab04617136a3bf909ef27eb97ea5ef81c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab04617136a3bf909ef27eb97ea5ef81c">&#9670;&nbsp;</a></span>Params() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype">long long&#160;</td>
           <td class="paramname"><em>_stride_d</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_stride_h</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_stride_w</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype">long long&#160;</td>
           <td class="paramname"><em>_inc_d</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_inc_h</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_inc_w</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype">long long&#160;</td>
           <td class="paramname"><em>_inc_advance</em>&#160;</td>
         </tr>
         <tr>
@@ -193,33 +234,158 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a3ba93370bd4b2ede4bd4eb97ac0881be"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3ba93370bd4b2ede4bd4eb97ac0881be">&#9670;&nbsp;</a></span>initialize() <span class="overload">[2/3]</span></h2>
+<a id="ac030ea4568fa2cb6d6661df75062cd1a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac030ea4568fa2cb6d6661df75062cd1a">&#9670;&nbsp;</a></span>Params() <span class="overload">[3/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>stride</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a802c270449da579ed8661e915d27ce60"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a802c270449da579ed8661e915d27ce60">&#9670;&nbsp;</a></span>initialize() <span class="overload">[1/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype">long long&#160;</td>
           <td class="paramname"><em>_stride_d</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_stride_h</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_stride_w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_inc_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_inc_h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_inc_w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_inc_advance</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a2ef70d9e13b5aa7e4a53233b153d7edd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2ef70d9e13b5aa7e4a53233b153d7edd">&#9670;&nbsp;</a></span>initialize() <span class="overload">[2/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>stride</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a44870d45442ec45c8eaba46ab47a3ad9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a44870d45442ec45c8eaba46ab47a3ad9">&#9670;&nbsp;</a></span>initialize() <span class="overload">[3/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_stride_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_stride_h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_stride_w</em>&#160;</td>
         </tr>
         <tr>
@@ -237,19 +403,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="af496afebb8983e5d346c681334955224"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af496afebb8983e5d346c681334955224">&#9670;&nbsp;</a></span>initialize() <span class="overload">[3/3]</span></h2>
+<a id="a1776bf51e1e23cde6c58529be58aafb9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1776bf51e1e23cde6c58529be58aafb9">&#9670;&nbsp;</a></span>initialize() <span class="overload">[4/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -265,112 +431,112 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="a1187258cd4068a627e73bee0302f1fc2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1187258cd4068a627e73bee0302f1fc2">&#9670;&nbsp;</a></span>inc_advance</h2>
+<a id="a6d8f1e07f286ed8d5761e2a878b807d3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6d8f1e07f286ed8d5761e2a878b807d3">&#9670;&nbsp;</a></span>inc_advance</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::inc_advance</td>
+          <td class="memname">long long <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::inc_advance</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="af95fa1b5102176a0fa9b17713fd48150"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af95fa1b5102176a0fa9b17713fd48150">&#9670;&nbsp;</a></span>inc_d</h2>
+<a id="a7b4293bf8291b0383dee695a60f2e0fd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7b4293bf8291b0383dee695a60f2e0fd">&#9670;&nbsp;</a></span>inc_d</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::inc_d</td>
+          <td class="memname">long long <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::inc_d</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aea591d4278a8338ae8b50fa0b8f3a366"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aea591d4278a8338ae8b50fa0b8f3a366">&#9670;&nbsp;</a></span>inc_h</h2>
+<a id="a15227102466522445261b6ea65c89c06"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a15227102466522445261b6ea65c89c06">&#9670;&nbsp;</a></span>inc_h</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::inc_h</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::inc_h</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ac6e81450a2d78555a6c2415dcc42b178"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac6e81450a2d78555a6c2415dcc42b178">&#9670;&nbsp;</a></span>inc_w</h2>
+<a id="af0be1271cfe6d6c03a9a76ff992d8a5c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af0be1271cfe6d6c03a9a76ff992d8a5c">&#9670;&nbsp;</a></span>inc_w</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::inc_w</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::inc_w</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ad67234ec264354a22032bb2519575dc1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad67234ec264354a22032bb2519575dc1">&#9670;&nbsp;</a></span>stride_d</h2>
+<a id="a235647baff946e483dd61a2069aa01d2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a235647baff946e483dd61a2069aa01d2">&#9670;&nbsp;</a></span>stride_d</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::stride_d</td>
+          <td class="memname">long long <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::stride_d</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a58e8c883aea4cfdfa5a84c25a4704ebc"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a58e8c883aea4cfdfa5a84c25a4704ebc">&#9670;&nbsp;</a></span>stride_h</h2>
+<a id="a4f029a268387bd63112d9074c185c623"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4f029a268387bd63112d9074c185c623">&#9670;&nbsp;</a></span>stride_h</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::stride_h</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::stride_h</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a313984457c78eea66c980f6813047b9c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a313984457c78eea66c980f6813047b9c">&#9670;&nbsp;</a></span>stride_w</h2>
+<a id="af7e7a71a9fa41cc3f6d0e5963963339d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af7e7a71a9fa41cc3f6d0e5963963339d">&#9670;&nbsp;</a></span>stride_w</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::stride_w</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::stride_w</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -383,7 +549,7 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileIteratorBase_1_1Params.png b/docs/structcutlass_1_1TileIteratorBase_1_1Params.png
index f1c874633c8c272f7da17bc560140267da64b932..2b723102b3b2fd41f4511ba2f9511cb8f90e414e 100644
GIT binary patch
literal 4455
zcmb_gdtB1V+P8B~*|F3**~Kh*TPfXLFDZ$Z2DP=vr3l=tT<>|Kypx7UMP;*A+cvdu
zQ%J>HTd7nuuXzD7T{$Mo7AhesnF=Z)Dk35R=ZCrH-S_<Wp3gqd=f@25n|WsDnVIkR
zncw%GC=X+!-9`om2F8f5PM$R|*nk1@H#hzn_<gnfXcS0xc_Pn!snh9z?5tw4>?Q6F
zkXwCTym;}=v!n~a-;Gz#qPz@%N_y#kb<WAaV9O%n<neP!>!ibyvjSwxUw)mquw6;$
za%-cS`|S8+DLgCnOvKg@4#Mgvm+<hN!__0jDBSNJ&avai+tyX?v9WpkI^<eLMyc;%
zPtWSoU;eayy+?igg9jHqepqj0loL5|?08$wj!kA}d-`7i)%M!$u(5HCY>7`#YxX)z
zm2-xsBMSPdVp_H22y66wjEQ>gB-i+bbpU?vhqMo(#>|z+g3k1|9HAh2Y9W}Jy+NnA
z;TLBR-Ev4Xeqv?Z?hxj|gLjYN-;;Z|3M_jMjaT`1v|Fqxe*BO+gk99K*S#V~xFQbS
z01HnFA(%mCKP{omE}8K}CD~*+2^gRe3=0nzqF>bt2}~Uhc9bQw2v3u$w6gkcbwQ(P
zCOYmOefP?<8xDp`F^|+{)iuqzbBUST+s2otRGDIXCKbPHE7!S`T`9m3L@g8)zw)6s
zq_vS5^Cl+4+GA`>L3?J<4oKCc`?O*ohclM!hvc~+lL+3H4V%ZDZ@b0x#h4{6%sQbQ
z1Tg{G<~BA<6;EbZ1gJJacl9>8(q3E|GCaOG#f|mK9D=|7W+Rd&)^tubHU&Esos_$`
zTg$UZw5SZ^@W4Yw^{t+VJP7i1(vatE-kn;n?(FTxr8Jb7-aw+ok+8SOio%T1=A&A*
z)o>13jh|m~LNz*7MA`n$2I%#lPctl0HG-h>5RDC{Y%FYLVL^Qf7EK9jbC<<-4w>E=
z6-*syXgRZ~aIlA}lRH8~FmjrBPg>FC&`j##x?&P9ZP>L71nRfj)=ST+`{im{`wcJl
zhcZn}sCPg^J}g=|9X^!G7r6i)H-gn!Kngx-?VCCAm(A9!X?TIm+xiuq$h%(BQklcq
zhY{VS81`V{Jj=%9i!uH)cJ^hx%3^cWBgKz?7HwVQ1Ib3WB_}N)?v`|}{6$iBJA9-q
z<-2mLt5FKS!r7i}CUN`}(~DA#B-py7gI#@1iBFmz>=g`?^t*I1M3jCcmkA2NxSO#?
zFWjxaMUI%oyGD1imq{s!lV{5LBnz%{4<VP_Kgz&&+;*%TyxG4uZfHfj*-Z*Nq5v&d
zdOyE19aoWVWyQq3l*su;QJZ;bp;?zSYPi@G%gii@9>b;CUd#Ff=q@9m{0ntjC8tYq
zym~97&_nW&l)SM{VP1V+1?pg@ESzvmpe!v$$!`;!WWDBUTg-r8qjS6axRlVoF7;hs
z2}L9lxhGo|{#Dtt4dqyy?uBKFlyjqL0uyqmBcy7#-kDe7w)Wx=_^(R{OhO|38p!0^
zsN+ILvP-INBuz0@1+N-Aa~<yH%DPMQa`(}>zNuuzP^_ulxbxh$M45Z;QrkM`=+|$r
z6iEg#^@iLxpq%$}$rYiZ(T)BwGpUP#-btGI`9qYd^rSi=d^G%46iVivsqPF+5ei+B
z4vAR{#G#-DfyhOF4)fAeCRScA2VuD-mLb#C0(HU(Lf`U)>5{<O-%z3xN(8HGkbZfh
zs25)1rv>3&Vl{JH60+zstV~$l9bph-dL2Q1quiJry6lxZI=Gwh$nnpsfbtIBI4F`0
zDhl?{uziGsqv0=@qhH261Hk3${}O|y0Yv-#L(#8SM#-eHev29zG0OBk0}`ZM94K0S
zm*Eh_22c;cJ)Y(iS+v<qFRAB4H>@@Y{Au6E1`faKX9>v8%WKs)=}`)hck6dUJoPgB
zC;eFmB<Wh`M>DO*elzo6t=}~>ph>AzS~&v9^lurHZvo?%eC<6wu}BHfd1AdkV4E~x
zY-aW$vI%gBW2FTE%l+}dFhYG@09Y=c0AQI_7Yo3$cefsvBZh%$w0u1*bDM!`0d_k9
zST4f>Gidn(4Kq14wx{j7YgW#W<cIr2`s7c<y=nHz4_EzA9}5&{kK}`&tSTSci6ov|
z)#xZT7_lF*zl*k3w1-PV5KjRbkWF5#e7MXp4}1^MmfaA<SwQ2Fp$8D30h;KHAwB|h
zoOH=CA%#f{>z-PHG^Pw{ha%Myah|`}we@M%fO-txu=G5JSfM8wdebW~e-<l8%=dMs
z@9+8#qB%zVH`An=K?t5u^`^MdI;{5EOI0n2pNa_F13@!}3d6?)R;Cj_^vBO6VmXc8
zWUvLy#||<7X}g!IG!j8Xs}^pssL!Fg==#*y{HkBr@)~}5?he!@F?DC}7KqXl&uNzj
zi3={S(4RFQHi=846_5B8=Pk|i_ZPE*xOg||Bwdk40{b*E7sgh`&bU8e2n6Z$!iVzd
z3sA#dPbUVX&2S~z!AcmEuje0s=nSK^TN(!+eK?(Uh90Y{`$_(omz64Qr7z<JV6MV=
z+ej>K@D`l~XAqUj!wBfG^*7A>+~&j((U;-10U*1g9lcCXS0%~ZQmiV;)(ye;O2X5(
zTC#jh|Dg#R<2HRJ14Y|{5eIl$3#DUDN!asD<6<${8<vw7)=K;CAkL3BA_{=@Hr@{&
zY0WA;<rLU{Wv*INzP%?mEVXNK@Bmp)Nl)`tSAd*g42073L^d(4+im@-MAbBW6M#S6
z;gG6JEihkKyCP74YXTeTAkbV_M=g;soDfXCm7G|%w-8nwIF&pye6~r}J}VXdMBL1C
zRjt@8#(uaS$#1U3%LJeCELwf+3Mc9UmY4)f7h5WlH$8T`$|@#LPs6U~yJsHa1aHq5
zRQ{Z6IIpmz(C;Vcq$Jf@{^q!jPrFWSqJAegHS0BWOfZ+!+{kiCe*0~fN4jnnCdECM
z9O23OrtNk;4Ug5d24<@1960-aSaaw8;k=dLIZ1W^x@qJlFe@BoM14ha0piX$&Xs@V
z6gW035WtT<Rh@b3s~I?uD!<Y0*D!J&?9)R3Lh=w8*13J{lKG{Y9zohc49p9Pjt^yA
z*Y6bToxSPop`e;M<q5jG`NhwZ#Nd=9Dl{^_R3X2lypt%I%e&2sscZ7Jl#Tk-_w>*2
znrtu5CRi2*Q-?hqWO-8IP*GMk{tdKC&&@n>ElvbBr>Q$lILk_cy;z8;jAju1WFP4M
zIUQ_qH%5Ln?egHuh|v}HOLC}acTPErzCA9tf6f+TnJFmG&-UXtUo(9gPG30DAOF3a
z{x}sX>n)$J@U?7+4b7~KX@zN6_uP|{srr6dPbfR5UC@BPmp7y10Sdb^_G0Aez0iKA
ziWD~tBM=JeW39P6!ANWgVgCIvXNl1umnk_j4sY7i{CPO7NXc>SJ@_kb8_Q*0Q>dUK
zW_Vj}77Xx$p(Xr-b8p8Qh}MNy=~+{%AvcaydNrqgNA_M;6D{UK%ON|>X!h<BR<o}N
zPj-oZtL-<c3JRnQ%KL=^EgYG2^tgj_t$f#v1%B$NB_2`Ja3qmcFs`i`hUy~NsZG(b
zn}m;74{M1{(LM}u+%Toa95Fux!ku#R|2@yGSKbeM&PaQyP|XTa`Cv|T2a>q*m0b~-
z|N13@Sg`cWF~LNsoJ0~swU51sqswFaL?-y*T;sIM`<Tqse)WQM8x0x;i-9S2(JJ%C
zPiwD{A^@ym(6Q;!Y;YI4Cgq$1p_CZbe%gcwK0FO4%{skv5q?E<Uos3ifJi6qKoM8&
zGO5@#P^>9mLrK=5kDwUly@rxG5&wULWmk~^+<p@7lkfX6vCjO@f(P$p^BYzvbA1qZ
zjRLFi_^95GoLS(!MuL*`pOFb4Ig|19H?n(u=MUt}KZtt&U^8v#dfV=^-8Hs^dyOCc
zs485&M4kR$=F`VBYb?iqy&5e2wwk4@fzTSig?Z?sg`CK>b<EKR5qlKytq`j6a|C02
zL1K-dwA4Lsye}x>Jv-VtMirx>Ft`qRA^`4|!ZWqY8xPIR19$0euQu!l`1Qm{*4w?}
z!T0+e<rFKlZxDPBb0~6Yo}@Y_0jsDVZ&?Iq42mkGj`C$pp)N)Dfd^L#d7bS_839eG
z;Jm*ijkPOlv#$-<UF4nM_e$;2XxfREIYMYxtvL3@_O(KfR`fma=LPpF;<Tl^n$mRD
z+Tcd0HIfLbTAiDw)G@)WFOQ3z_|cj-t5K`mG*=|BY<hpJYX|F!OBthRpj;MP0y{*`
zk?q68suJVsoc)M%_wyH@-}<yF%kTdC7-vDNA7Y*p0mNNxU+b`JWJH4QU1D_lj|ji1
z`EfH4Y9;F;nHsqM)sLsSR4O=6aSOO1q;yEFbiv;ha*@Xqv~rEMGeFSV2v!;D_v^dI
zx}Ql+MR&#5<K5jIDtm<`#C~U!Cf>|Q$k+m<#lIl_Xp2h-=5oAmi8hq&kJbXWm#vMx
z8WxERweCtf^E$q}u#!(PxeJB|t}fX!=oVSf<f@_go^hNzgrU^qEg=%zZPwyvMy$u=
z>(dCfdqte{`(MKxFlC&)p{n!$Q-w($8teIM-Z)DieXdT+--Ll<M{oG&&*xG6=beuK
z5E$FhvMFeKGBU1%t(gtnt1O>Q{Tsxu?O7lfxJn$e*q307Y4|^$mP@X>gUB)uu}Z1F
zRN$qUSEn#Wm}nH5=BJ}dXCRxiX|)<{h-<$C$W+)<G7^e`O@cy1gAq5$!3_c_Ow@7b
zhsI#w8aRzbi`3b@$_A4%u<FvkHwtkaqUD!5c40NSLm1+Up+4}%o(mPFE@}m0+0;tH
ztbJ8w-XneSEbvmC;Jg~ZK|eZuE%N)I51{}11F?48){@l^7A&pl_8M7B9|`#e_$p$6
N_!4!J_Ql1Fe*q*u?Op%?

literal 4162
zcmc&%dpJ~U+gG+~6SKRfP_M(5F{m)?N`$E>4HGtYB4?(PoKJ%plA_ra8iz5;p(vGd
z&d3ZCiDsO_mZoutaY&dk#0)dTyM|o*eXsA^|9#i>J=e9?dY<QZulqUO>-W1C&d$bC
zR(g-LgoK1F;<Samgv1soP`|ZJ61Y1aD>x236z!0XCs$Wjf$HqS*C&nPsX%S*dh_PZ
zxpMSbpt&u~-o`-!FcOzux}$-F1gHyPaoiETX=Y%?Ufs0x=J5XF;v=i(gTIZovLk+l
zP4jjqX3Qy{AnDL59xo_J3#A^|6ge2>*c62r=h(pirDd1zirOr_lTWKs%s+M+bu7Ny
z``TtH`6`3_Hz`H$B&4kNOG>B9OYYPv%g@*(6>FliMayom^p1z^kQT9L>9@}48eiUb
z%Fe;jZ>-6unHPp45Bf`(y$|nAE6!sI>7y~N@=MnZ`8ge}k0SeYpqQ_3;CmF2u2(U$
zsb*hm4K_*9^XN?#N6iKf<(9OdNY{4xRoYfjnd!FlrYJ^Q``4xRI9KQw^X;08tNXyS
zY9BjtYcgQmhZrYl{;>ua+imVuPtKA^u+aBfaChi-MO_I-6yr9xJh$kHjxO%c;rig*
z_sq6;4@gaan(^uH_+<yuH80oDL~m(^?YW~z5j9dhot+oe=WyPgI2eV_iL>r*Z%FuP
z_<kUD)*2RSak041Jhzj@bw#qwx2|-(f!$U6puNM%vthX63}JGd3@ku;nz-j3|01_j
zG^qtH)|dzxvVCoet-0ELO^|T%S6J{&pUjlu5KKQTo6$Mz8++@r>n=~1YK0v0oz^`u
zAct)&H@uY+Y;1m0*dcp1a)9^pbyjndoUkCip=k!qv8>L-2~3Z;S8LyB;GO%)F8>&#
zwdpSu2gDXdlBRWt=Xm%&E71ax+>_vLCcrwVvt_-}NBzC)u1a6cHjL!79F{jI?_YS4
zU}-4>0)_j&ME6m2T~@hI1L~G3--zO|KtlEShUCzZfJ~L4BsEiVYc&Nqe>Z-!6kT8t
ztX*O4uj0c0a3x~Zb&%uoq0XMy+}Rp26PSu)bo)G1Tnu#!o|lYi4ho!!b-{GDeF$FE
zb;5n|9jQiN;X46iwk#UuY;D%hhO<3Yhf7YDJo3=+QUiA?^DQM4Bul|bNYhlD+VRLC
z(4z-E&cth*$DD~Z3QK%!D(;!zc1|R|G7U%L*S*$5c@On{JmaU(-e~wle~H@KRANMB
zoH#}Nq~T3sy&E4|oNcC9{(J=5Mmv~HGlH-i{ywpoku7P|)z{ku_K?gj<x>8`ZTZLI
zEA$G7e1;|#-%(O=C_ju9RPK6JDfbT)RUI5NWlL*faA*7&1*&{(0nZeV!+txfav_bh
z$_^eeQwd{D9wgABf>f+;y0kWd*TZ6|UZ-94<cJaR(`DtIT6W{?kjb=C>{p>^d3x}8
z%ii4DxtaF;Zv}m0<RWUU`^=eU)kF1N-M#M;_?FhBU50Q_ZOftO<s!M;7jJV8=Bu4#
zHFoudcj#_)_?k3mn%m+ImD33z^uH##t5fPJ51LtDlL}0YG3+;R@TUS+UHg&j7TEX-
z-0ivmRjWZ-i%LE_gZqq6_3TkStgnL(U1&j44F#<re(`oQ)I?m2>3*<XzECnF*f`Ei
zex*p>OEK@Tz8>0dDfCI6^eC@YZ|YlIE@eVekX1Q#m9M@Ju&y%r5=Yl<UoCzShnT-n
zI?mbt;vWdYWjA0A@JYPX%k5gTtjqcUt<bM+ehipPA2{-Ze8$3zb7BtzAsxRtPEv2}
zDP<+*B7l?n9Y-D;1K$=<7mo~>pw8mH{UnBtJwpOb0P43qxo+$TaDlid@pmAA#P4MM
zEVhfk?)3xN@an1f1F`>MsCeqfc<Y97AU&Xr0p&3TDCw<R0b*oSDFMXj2CN_i@Ge)S
z3$%=YRxPleF<?DP8`$IUO;T2^o1}Lh*}$x(HcO{x0^Au?_ybG-D78~dXRDUom(v^A
zOBpRY7dgB9H}^I$7X@JVfI;KcH?S(*FQwkh>X%oU)uJK_aL@2(R<GhezN_|UdRR;W
z&<wmK6QY5z!V7&*5l`dsKt0wV0|(JY*zW@)?D2(;P<$Z-@eBz;AOO_ze|FmccrDok
zkL#H_jo(!?e=&C<XeH|7@`8`1ld7#{c$TPI#Ja<qfYNfOo@+Yk6(I3aN$r|6bNMAJ
z{NE&R67w`q`Tzo|d)N$pS~X0Ri^M!SFepd4+0}R&uenqz%?dRrr~Kq`0Gt9$Wxu<J
z(x6!|our-jB5}S#GqgV003nYl+k+o9-(EDg>LQDnTjza*0YLn#&yXg%w@LQBjhDP2
zwBLkIH}&5)xuwSrq<T<2;&MPyLU#+pR)&9jc-Pd6%7Y%cZllq{Z1z}sx?q}2gfN1s
ze-*3-gF(-yBJP)xcgu6CE9B<|dCUsGSaz;nCWjP=ik=w8*TkR+Go`lZr{C0`^?kS9
zk@M0Wv{Z{$7GVSMm)93aJD7N^$l{Kn9wMSYB>Yy$oG1~A`Q7=2gLrC~q{f=orXbe|
z`0Y5hZA)|(X!+8`K=!gPH>{*qEDQ*PU^nWgmP>FNEb&H1?D%`jqlo6<y01MISbv?!
zsPCkCm?o#}8HA<yxj{`tzBR7CTaR%*G!4mOn2Q`ef!B`?KJ?Qo9*zYil577AnZ@cQ
z)ggt!&TZWF83=oC>bEw95!oPi-}KW{DZbu>5u?Iz<H%QKJi!I+{&^V1ZA*r)V!`~9
zS^cZ>$md?KDh1!prwe}4EB12MooZYW89@&eA$>}RC;sScJ7aM7B51)OUW2xw73B}z
zvG6}b+^Ly3_`ci2O}2=LDwvDnP(Ez%9`5!_>upK*jeWld74ni2*dA?etbWaaNV@r<
zwo28$w`D`*)doNO<vVHv8T?;_X5}#ifyII1;c9ekpU<}lm1L5yaSE{Z_R=1>axVsa
zwyP9h_B4?vw-5@<AfCC4(UR@E$3bd)->~A?gAPs9h&qZJar=^26|DZa7exo0(A`-*
z5smir)JU$xEB(Pc7kZnK(s4nx-KCeXaM<aseWR*U*Ew0s<0=t{S1=uK|240o@g=M5
zfx%s$5II~7%#e04*Yq!2sZ8HJye3&_+-m5gN2|-ZQ>5B7UI_XW)XZHTl-4ai=!C{B
z)W|+hvgymwNwh$f*3{5{zPIcX{fZ>V@vYhSqUXbVTLKXS>eN6bZo!o!g#p7}8O>9Z
zs_IcelTW_urG<tq)cn%dJG=NWc3&B!CyT@E7M9EB7AH0gyFgbc2L=(n+O%Z(Q!*@$
z_8l@(SP`<w&t}i_rYZ#|8E(QD*9k)^ydbCHL-;)FZVa|EE_>8$%W-mBeYUgv^#*Ru
zh&(L;;>LpwR(Nr*a&t^T+Itj|>q|l-oU>2BUAwp@i@h)o%H~t*irbAo0>L3hNrYuL
z4m%_*KYOF1%<*sT!r;B8KaZn-W)mhe`;!c~EvR4_%)RI0DV^Wh{3{qSCmWS|2NKm*
zB(Jf%Iq3{iX3$ln-@|ENxn2j|-R!g*L+>D1=0QNt?=A2cYZpbt+!h_c{?EYu;ES)~
zGU_2w$+kLH26t@lXDLu#35|MerRD@<1h+xB?cjVowv7=Uffw#ry@nLWmxsIJ&{-&c
z^l16f=cToe5OeY#-6m<H#Y;ye1zUahBI?0_@3;K@lErIWw@z!14ep8A5w#a!$aIL&
z|I$gf003=7Na254Izs`1rC0l(XH@$Oy0#mX`!mn3_b^koNDE1nbtT#moDc^b;lD*H
z-C5)Lx_&(ti!z{JL8`mf)#)EJ=>I^*{$E@OQ5&+9P5{KI!k@Y50f=$>`YGTca3UR$
z?+rx)<nH>~jxTY=(z`B8Yda#pCRDVPBJsZgTn}8-cMlTRG})(#Pzfal=N;;Vx0F{0
zW1?d#(6KAXCncS^0}Eak@RZIj1YTJA!x@cC$wv2dgf|o3Hx<j7WMQ#K>RrzWLx}tj
z(~zZ)Vyh(u)JWL!KzoO9MYKG%z$k_DI8&p;qAAW~OFh9XJMzB%ZZevTJYpFtGq%t*
z)4>0(3-&3LF|9pNi>98Zkgf2_gwu=n<7~GCa6nuT!^Ieh53~gGiS#%-XuugGBU$w#
z6Gb59TQL&V=;U239hW_Wt|A9vC#%Vkq@pBk2Z6Hh$P-&0Vt*i_S^s9l9q(?Ymvx%S
z45gi6g%7k{bL9wyzN&%OysG0JL_L-R)y{q>2Q|XTgFiPG?(gYw08-N?kgs=O@IVD<
zhwcFKMDWT|EmhyIwN8TuKPL8&w--!Mi3|wynJ2dyQ{ft9{cMciAh!9Dpu@W4p=%81
z1T;~*2+LDJjeLH+m6)Ydvb^{^^vNh>cMC+;u<l$`%q8HPQWhspvA2-@%b&lSwr779
zniJ6nIpxS{mLijFLqGK_>*jboQfY+gtn`GU0q&WH@XEn|<q&+5336$pOmSj1rka7X
zW_@mLvX{`U45549IXv{hu&u@>dODhMLBSw6u$~-I2c~W{D8C{UWCg6sCd%*SK0v-u
zhSEp{Yr&uerq(iFkJVMzi`mcGiGuMEuteC9Xjs6MY6m$+5$aYaiq#JrYh?`&2!Z1Y
zEiilE6yEhKIDy2BNWsQ_cy*t66N!{z)1!yJQb=`W5E@DRUDByq0Ez8bA%4t+q%5g1
zk$Am)akni2H&i!2#Lg?4pP;$9U(}?fJlW{S>WisF9MeHxEZ50HyholV*EmLq7N@Nn
zITyeZGHVIfXo~}|6B}d%WUuGS{$`ZUEdW1EbgphXF4=F-`u?s8_~Dm8oV2khIpKNz
E->OpV*#H0l

diff --git a/docs/structcutlass_1_1TileLoadIterator-members.html b/docs/structcutlass_1_1TileLoadIterator-members.html
index 6acaea33b..7d9755f9f 100644
--- a/docs/structcutlass_1_1TileLoadIterator-members.html
+++ b/docs/structcutlass_1_1TileLoadIterator-members.html
@@ -73,61 +73,67 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Member List</div>  </div>
+<div class="title">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">BaseParams</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">data</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">inc_stage</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">kIteratorFragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc">kRequiresLoadFence</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">load</a>(Fragment &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db">load</a>(Fragment &amp;fragment) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">load_post_increment</a>(Fragment &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">TileLoadIterator</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23">TileLoadIterator</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6">TileLoadIterator</a>(Params const &amp;, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">add_pointer_offset</a>(Index offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">BaseParams</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">inc_stage</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">initialize_predicates</a>(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">kFragmentElementType</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126">kRequiresLoadFence</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a>(Fragment &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">load</a>(Fragment &amp;fragment) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">load</a>(Fragment &amp;fragment, int d)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">load_element</a>(AccessType &amp;value, int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">load_post_increment</a>(Fragment &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">operator+=</a>(Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11">stride_advance</a>(void)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">TileLoadIterator</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">TileLoadIterator</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">TileLoadIterator</a>(Params const &amp;, Scalar const *ptr, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileLoadIterator.html b/docs/structcutlass_1_1TileLoadIterator.html
index d670b93fb..f9e5ad7e5 100644
--- a/docs/structcutlass_1_1TileLoadIterator.html
+++ b/docs/structcutlass_1_1TileLoadIterator.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -80,7 +80,7 @@ $(function() {
 <a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1TileLoadIterator-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Struct Template Reference<div class="ingroups"><a class="el" href="group__tile__load__iterator__concept.html">Tile Load Iterator Concept</a></div></div>  </div>
+<div class="title">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Struct Template Reference<div class="ingroups"><a class="el" href="group__tile__load__iterator__concept.html">Tile Load Iterator Concept</a></div></div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -89,12 +89,12 @@ $(function() {
 
 <p><code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;:</div>
+Inheritance diagram for cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1TileLoadIterator.png" usemap="#cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E_map" alt=""/>
-  <map id="cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E_map" name="cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E_map">
-<area href="structcutlass_1_1TileIteratorBase.html" title="Iterator for accessing a stripmined tile in memory. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;" shape="rect" coords="0,0,732,24"/>
+  <img src="structcutlass_1_1TileLoadIterator.png" usemap="#cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E_map" alt=""/>
+  <map id="cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E_map" name="cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E_map">
+<area href="structcutlass_1_1TileIteratorBase.html" title="Iterator for accessing a stripmined tile in memory. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;" shape="rect" coords="0,0,764,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
@@ -106,521 +106,559 @@ Classes</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:a1f3601c595f12e7083919ece9b1ec84e"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc">kRequiresLoadFence</a> = Tile::kD == 1
+<tr class="memitem:a1f3601c595f12e7083919ece9b1ec84e"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126">kRequiresLoadFence</a> = Tile::kD == 1
  }</td></tr>
 <tr class="memdesc:a1f3601c595f12e7083919ece9b1ec84e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Do we require a fence?  <a href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84e">More...</a><br /></td></tr>
 <tr class="separator:a1f3601c595f12e7083919ece9b1ec84e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1bc1bd4893c14b313ee71b71db2903f3"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">Base</a></td></tr>
-<tr class="memdesc:a1bc1bd4893c14b313ee71b71db2903f3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base class.  <a href="#a1bc1bd4893c14b313ee71b71db2903f3">More...</a><br /></td></tr>
-<tr class="separator:a1bc1bd4893c14b313ee71b71db2903f3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7c6182031d9aa41d0e4a64516723e20a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Base::Traits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">Traits</a></td></tr>
-<tr class="memdesc:a7c6182031d9aa41d0e4a64516723e20a"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="#a7c6182031d9aa41d0e4a64516723e20a">More...</a><br /></td></tr>
-<tr class="separator:a7c6182031d9aa41d0e4a64516723e20a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae8dff52e619f06fbdbca8cb847c79895"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Base::Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a></td></tr>
-<tr class="memdesc:ae8dff52e619f06fbdbca8cb847c79895"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="#ae8dff52e619f06fbdbca8cb847c79895">More...</a><br /></td></tr>
-<tr class="separator:ae8dff52e619f06fbdbca8cb847c79895"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2edd89863b8035137ccd8dd3ad7be464"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">Base::FragmentElement</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">FragmentElement</a></td></tr>
-<tr class="memdesc:a2edd89863b8035137ccd8dd3ad7be464"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="#a2edd89863b8035137ccd8dd3ad7be464">More...</a><br /></td></tr>
-<tr class="separator:a2edd89863b8035137ccd8dd3ad7be464"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaa83f05e0cb3204053c3ee1da036cd36"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Base::Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36">Index</a></td></tr>
-<tr class="memdesc:aaa83f05e0cb3204053c3ee1da036cd36"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#aaa83f05e0cb3204053c3ee1da036cd36">More...</a><br /></td></tr>
-<tr class="separator:aaa83f05e0cb3204053c3ee1da036cd36"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a11ec4297c9a1352c8005ac222892b35c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Base::Skew</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">Skew</a></td></tr>
-<tr class="memdesc:a11ec4297c9a1352c8005ac222892b35c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="#a11ec4297c9a1352c8005ac222892b35c">More...</a><br /></td></tr>
-<tr class="separator:a11ec4297c9a1352c8005ac222892b35c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7f1499ada284c21624487d4d3a5dbd10"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Base::Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">Tile</a></td></tr>
-<tr class="memdesc:a7f1499ada284c21624487d4d3a5dbd10"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="#a7f1499ada284c21624487d4d3a5dbd10">More...</a><br /></td></tr>
-<tr class="separator:a7f1499ada284c21624487d4d3a5dbd10"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac2a7f94723259f0d3c7b8a6d5b8778bf"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Base::Delta</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">Delta</a></td></tr>
-<tr class="memdesc:ac2a7f94723259f0d3c7b8a6d5b8778bf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Delta.  <a href="#ac2a7f94723259f0d3c7b8a6d5b8778bf">More...</a><br /></td></tr>
-<tr class="separator:ac2a7f94723259f0d3c7b8a6d5b8778bf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9720b1e4a10c2d5aa85f9a9c66a31bbf"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Base::Iterations</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">Iterations</a></td></tr>
-<tr class="memdesc:a9720b1e4a10c2d5aa85f9a9c66a31bbf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="#a9720b1e4a10c2d5aa85f9a9c66a31bbf">More...</a><br /></td></tr>
-<tr class="separator:a9720b1e4a10c2d5aa85f9a9c66a31bbf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8a1527b4b469ae1f97afde2502ece70d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">Base::ThreadOffset</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">ThreadOffset</a></td></tr>
-<tr class="memdesc:a8a1527b4b469ae1f97afde2502ece70d"><td class="mdescLeft">&#160;</td><td class="mdescRight">ThreadOffset functor.  <a href="#a8a1527b4b469ae1f97afde2502ece70d">More...</a><br /></td></tr>
-<tr class="separator:a8a1527b4b469ae1f97afde2502ece70d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7c27a7b0d8593b002eca186c15fdc869"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">Base::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">FragmentShape</a></td></tr>
-<tr class="memdesc:a7c27a7b0d8593b002eca186c15fdc869"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> type.  <a href="#a7c27a7b0d8593b002eca186c15fdc869">More...</a><br /></td></tr>
-<tr class="separator:a7c27a7b0d8593b002eca186c15fdc869"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4af8eeabe7c1ec0362782687a84466e0"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">Base::AccessType</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">AccessType</a></td></tr>
-<tr class="memdesc:a4af8eeabe7c1ec0362782687a84466e0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory access type.  <a href="#a4af8eeabe7c1ec0362782687a84466e0">More...</a><br /></td></tr>
-<tr class="separator:a4af8eeabe7c1ec0362782687a84466e0"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaf72c4897641080b1d84c0bbd8d813cc"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">Fragment</a></td></tr>
-<tr class="memdesc:aaf72c4897641080b1d84c0bbd8d813cc"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> definition.  <a href="#aaf72c4897641080b1d84c0bbd8d813cc">More...</a><br /></td></tr>
-<tr class="separator:aaf72c4897641080b1d84c0bbd8d813cc"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aebbe5a0996dcd362caad618e78dc2591"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">Base::FragmentIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">FragmentIterator</a></td></tr>
-<tr class="memdesc:aebbe5a0996dcd362caad618e78dc2591"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> iterator definition.  <a href="#aebbe5a0996dcd362caad618e78dc2591">More...</a><br /></td></tr>
-<tr class="separator:aebbe5a0996dcd362caad618e78dc2591"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4c7a3a4917245de8269b74bdabe16b76"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">Base::FragmentConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">FragmentConstIterator</a></td></tr>
-<tr class="memdesc:a4c7a3a4917245de8269b74bdabe16b76"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> const iterator definition.  <a href="#a4c7a3a4917245de8269b74bdabe16b76">More...</a><br /></td></tr>
-<tr class="separator:a4c7a3a4917245de8269b74bdabe16b76"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a64ae02b44f275ef2f016949aec769328"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">Base::PredicateVector</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328">PredicateVector</a></td></tr>
-<tr class="memdesc:a64ae02b44f275ef2f016949aec769328"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="#a64ae02b44f275ef2f016949aec769328">More...</a><br /></td></tr>
-<tr class="separator:a64ae02b44f275ef2f016949aec769328"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab457bd7953af9ef418510f55f52d1f39"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Base::Storage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a></td></tr>
-<tr class="memdesc:ab457bd7953af9ef418510f55f52d1f39"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage object that may be loaded from.  <a href="#ab457bd7953af9ef418510f55f52d1f39">More...</a><br /></td></tr>
-<tr class="separator:ab457bd7953af9ef418510f55f52d1f39"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a788bab4fa46dc26854348b751cf1cc76"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">BaseParams</a></td></tr>
-<tr class="memdesc:a788bab4fa46dc26854348b751cf1cc76"><td class="mdescLeft">&#160;</td><td class="mdescRight">IteratorBase parameters.  <a href="#a788bab4fa46dc26854348b751cf1cc76">More...</a><br /></td></tr>
-<tr class="separator:a788bab4fa46dc26854348b751cf1cc76"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5a179e148ccd770e1703f288624fa9b8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">Pointer</a></td></tr>
-<tr class="memdesc:a5a179e148ccd770e1703f288624fa9b8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer type.  <a href="#a5a179e148ccd770e1703f288624fa9b8">More...</a><br /></td></tr>
-<tr class="separator:a5a179e148ccd770e1703f288624fa9b8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
-<tr class="memitem:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a></td></tr>
-<tr class="memdesc:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">More...</a><br /></td></tr>
-<tr class="separator:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a></td></tr>
-<tr class="memdesc:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">More...</a><br /></td></tr>
-<tr class="separator:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a></td></tr>
-<tr class="memdesc:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">More...</a><br /></td></tr>
-<tr class="separator:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a></td></tr>
-<tr class="memdesc:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">More...</a><br /></td></tr>
-<tr class="separator:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Skew_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a></td></tr>
-<tr class="memdesc:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">More...</a><br /></td></tr>
-<tr class="separator:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a></td></tr>
-<tr class="memdesc:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">More...</a><br /></td></tr>
-<tr class="separator:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a></td></tr>
-<tr class="memdesc:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">More...</a><br /></td></tr>
-<tr class="separator:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a></td></tr>
-<tr class="memdesc:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">More...</a><br /></td></tr>
-<tr class="separator:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a></td></tr>
-<tr class="memdesc:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">More...</a><br /></td></tr>
-<tr class="separator:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a></td></tr>
-<tr class="memdesc:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">More...</a><br /></td></tr>
-<tr class="separator:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a></td></tr>
-<tr class="memdesc:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">More...</a><br /></td></tr>
-<tr class="separator:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a></td></tr>
-<tr class="memdesc:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">More...</a><br /></td></tr>
-<tr class="separator:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a></td></tr>
-<tr class="memdesc:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">More...</a><br /></td></tr>
-<tr class="separator:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a></td></tr>
-<tr class="memdesc:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">More...</a><br /></td></tr>
-<tr class="separator:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a></td></tr>
-<tr class="memdesc:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">More...</a><br /></td></tr>
-<tr class="separator:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a></td></tr>
-<tr class="memdesc:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">More...</a><br /></td></tr>
-<tr class="separator:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a></td></tr>
-<tr class="memdesc:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">More...</a><br /></td></tr>
-<tr class="separator:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1dcbf633eac61ff06980e4992fbe8264"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">Base</a></td></tr>
+<tr class="memdesc:a1dcbf633eac61ff06980e4992fbe8264"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base class.  <a href="#a1dcbf633eac61ff06980e4992fbe8264">More...</a><br /></td></tr>
+<tr class="separator:a1dcbf633eac61ff06980e4992fbe8264"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6a5d065939282fa1b9454b28a1e73948"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Base::Traits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">Traits</a></td></tr>
+<tr class="memdesc:a6a5d065939282fa1b9454b28a1e73948"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="#a6a5d065939282fa1b9454b28a1e73948">More...</a><br /></td></tr>
+<tr class="separator:a6a5d065939282fa1b9454b28a1e73948"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aafbb7a2137a07f0e07a12838b66bd511"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Base::Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a></td></tr>
+<tr class="memdesc:aafbb7a2137a07f0e07a12838b66bd511"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="#aafbb7a2137a07f0e07a12838b66bd511">More...</a><br /></td></tr>
+<tr class="separator:aafbb7a2137a07f0e07a12838b66bd511"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a70dfd0b62feb082d8da34af09d9524a6"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">FragmentElement</a></td></tr>
+<tr class="memdesc:a70dfd0b62feb082d8da34af09d9524a6"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="#a70dfd0b62feb082d8da34af09d9524a6">More...</a><br /></td></tr>
+<tr class="separator:a70dfd0b62feb082d8da34af09d9524a6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaa5d98b72576478ba04e4ad554faa827"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Base::Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">Index</a></td></tr>
+<tr class="memdesc:aaa5d98b72576478ba04e4ad554faa827"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#aaa5d98b72576478ba04e4ad554faa827">More...</a><br /></td></tr>
+<tr class="separator:aaa5d98b72576478ba04e4ad554faa827"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb6cc0e2990c06c83b789b579a03b15f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Base::Skew</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">Skew</a></td></tr>
+<tr class="memdesc:aeb6cc0e2990c06c83b789b579a03b15f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="#aeb6cc0e2990c06c83b789b579a03b15f">More...</a><br /></td></tr>
+<tr class="separator:aeb6cc0e2990c06c83b789b579a03b15f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a88eaa581e0b5419b98ee5a71073d0539"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Base::Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">Tile</a></td></tr>
+<tr class="memdesc:a88eaa581e0b5419b98ee5a71073d0539"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="#a88eaa581e0b5419b98ee5a71073d0539">More...</a><br /></td></tr>
+<tr class="separator:a88eaa581e0b5419b98ee5a71073d0539"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afc68649cb9bb32931b27e711c7ce2604"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Base::Delta</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">Delta</a></td></tr>
+<tr class="memdesc:afc68649cb9bb32931b27e711c7ce2604"><td class="mdescLeft">&#160;</td><td class="mdescRight">Delta.  <a href="#afc68649cb9bb32931b27e711c7ce2604">More...</a><br /></td></tr>
+<tr class="separator:afc68649cb9bb32931b27e711c7ce2604"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6c570dfa1cb68d436d8da6bd23cce6ce"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Base::Iterations</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Iterations</a></td></tr>
+<tr class="memdesc:a6c570dfa1cb68d436d8da6bd23cce6ce"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="#a6c570dfa1cb68d436d8da6bd23cce6ce">More...</a><br /></td></tr>
+<tr class="separator:a6c570dfa1cb68d436d8da6bd23cce6ce"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae8cb43a98cd2fa28f6457afbda8ec58a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">Base::ThreadOffset</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">ThreadOffset</a></td></tr>
+<tr class="memdesc:ae8cb43a98cd2fa28f6457afbda8ec58a"><td class="mdescLeft">&#160;</td><td class="mdescRight">ThreadOffset functor.  <a href="#ae8cb43a98cd2fa28f6457afbda8ec58a">More...</a><br /></td></tr>
+<tr class="separator:ae8cb43a98cd2fa28f6457afbda8ec58a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a46a2cbf407d3f43a7441323d150d96f1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">Base::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">FragmentShape</a></td></tr>
+<tr class="memdesc:a46a2cbf407d3f43a7441323d150d96f1"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> type.  <a href="#a46a2cbf407d3f43a7441323d150d96f1">More...</a><br /></td></tr>
+<tr class="separator:a46a2cbf407d3f43a7441323d150d96f1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae8f2c93ec43646be70d4b9f32d034125"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">AccessType</a></td></tr>
+<tr class="memdesc:ae8f2c93ec43646be70d4b9f32d034125"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory access type.  <a href="#ae8f2c93ec43646be70d4b9f32d034125">More...</a><br /></td></tr>
+<tr class="separator:ae8f2c93ec43646be70d4b9f32d034125"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4604b230174b11bc7ddf5f3e9a922139"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">Fragment</a></td></tr>
+<tr class="memdesc:a4604b230174b11bc7ddf5f3e9a922139"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> definition.  <a href="#a4604b230174b11bc7ddf5f3e9a922139">More...</a><br /></td></tr>
+<tr class="separator:a4604b230174b11bc7ddf5f3e9a922139"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad9c77ca0521d18a90dd3542a3941f016"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">FragmentIterator</a></td></tr>
+<tr class="memdesc:ad9c77ca0521d18a90dd3542a3941f016"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> iterator definition.  <a href="#ad9c77ca0521d18a90dd3542a3941f016">More...</a><br /></td></tr>
+<tr class="separator:ad9c77ca0521d18a90dd3542a3941f016"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad272502e5a54615584bb037a33ff1dca"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">Base::FragmentConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:ad272502e5a54615584bb037a33ff1dca"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> const iterator definition.  <a href="#ad272502e5a54615584bb037a33ff1dca">More...</a><br /></td></tr>
+<tr class="separator:ad272502e5a54615584bb037a33ff1dca"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad71f865c61f02eba981c056ef71653f5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">Base::PredicateVector</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">PredicateVector</a></td></tr>
+<tr class="memdesc:ad71f865c61f02eba981c056ef71653f5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="#ad71f865c61f02eba981c056ef71653f5">More...</a><br /></td></tr>
+<tr class="separator:ad71f865c61f02eba981c056ef71653f5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a57eff980f6b1086abe39dd617de5b948"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Base::Storage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a></td></tr>
+<tr class="memdesc:a57eff980f6b1086abe39dd617de5b948"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage object that may be loaded from.  <a href="#a57eff980f6b1086abe39dd617de5b948">More...</a><br /></td></tr>
+<tr class="separator:a57eff980f6b1086abe39dd617de5b948"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aebb9153659320f1391671c215c519e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">BaseParams</a></td></tr>
+<tr class="memdesc:a9aebb9153659320f1391671c215c519e"><td class="mdescLeft">&#160;</td><td class="mdescRight">IteratorBase parameters.  <a href="#a9aebb9153659320f1391671c215c519e">More...</a><br /></td></tr>
+<tr class="separator:a9aebb9153659320f1391671c215c519e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a39acc5c35c8db019a3aeef79e8005b7f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">Pointer</a></td></tr>
+<tr class="memdesc:a39acc5c35c8db019a3aeef79e8005b7f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer type.  <a href="#a39acc5c35c8db019a3aeef79e8005b7f">More...</a><br /></td></tr>
+<tr class="separator:a39acc5c35c8db019a3aeef79e8005b7f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a146adfb1951efd70995b05a7a31fd548"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const, 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a></td></tr>
+<tr class="memdesc:a146adfb1951efd70995b05a7a31fd548"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference for the load iterator.  <a href="#a146adfb1951efd70995b05a7a31fd548">More...</a><br /></td></tr>
+<tr class="separator:a146adfb1951efd70995b05a7a31fd548"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td></tr>
+<tr class="memdesc:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">More...</a><br /></td></tr>
+<tr class="separator:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td></tr>
+<tr class="memdesc:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">More...</a><br /></td></tr>
+<tr class="separator:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td></tr>
+<tr class="memdesc:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">More...</a><br /></td></tr>
+<tr class="separator:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td></tr>
+<tr class="memdesc:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">More...</a><br /></td></tr>
+<tr class="separator:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Skew_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td></tr>
+<tr class="memdesc:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">More...</a><br /></td></tr>
+<tr class="separator:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td></tr>
+<tr class="memdesc:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">More...</a><br /></td></tr>
+<tr class="separator:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td></tr>
+<tr class="memdesc:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">More...</a><br /></td></tr>
+<tr class="separator:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">More...</a><br /></td></tr>
+<tr class="separator:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td></tr>
+<tr class="memdesc:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">More...</a><br /></td></tr>
+<tr class="separator:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td></tr>
+<tr class="memdesc:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">More...</a><br /></td></tr>
+<tr class="separator:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td></tr>
+<tr class="memdesc:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">More...</a><br /></td></tr>
+<tr class="separator:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a></td></tr>
+<tr class="memdesc:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">More...</a><br /></td></tr>
+<tr class="separator:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td></tr>
+<tr class="memdesc:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">More...</a><br /></td></tr>
+<tr class="separator:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td></tr>
+<tr class="memdesc:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">More...</a><br /></td></tr>
+<tr class="separator:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">More...</a><br /></td></tr>
+<tr class="separator:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td></tr>
+<tr class="memdesc:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">More...</a><br /></td></tr>
+<tr class="separator:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td></tr>
+<tr class="memdesc:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">More...</a><br /></td></tr>
+<tr class="separator:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a8291a51bf96f86bc77d0e3453345dbd5"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator &gt; </td></tr>
-<tr class="memitem:a8291a51bf96f86bc77d0e3453345dbd5"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
-<tr class="memdesc:a8291a51bf96f86bc77d0e3453345dbd5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="#a8291a51bf96f86bc77d0e3453345dbd5">More...</a><br /></td></tr>
-<tr class="separator:a8291a51bf96f86bc77d0e3453345dbd5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a81c9c0b17bf5f214230ecf10e0690a4e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">TileLoadIterator</a> ()</td></tr>
-<tr class="memdesc:a81c9c0b17bf5f214230ecf10e0690a4e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#a81c9c0b17bf5f214230ecf10e0690a4e">More...</a><br /></td></tr>
-<tr class="separator:a81c9c0b17bf5f214230ecf10e0690a4e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a93e166575be3b2f7489833ae5da23f23"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23">TileLoadIterator</a> (<a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>())</td></tr>
-<tr class="memdesc:a93e166575be3b2f7489833ae5da23f23"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="#a93e166575be3b2f7489833ae5da23f23">More...</a><br /></td></tr>
-<tr class="separator:a93e166575be3b2f7489833ae5da23f23"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a53282fa4cb33cfcec79033d26e418af6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6">TileLoadIterator</a> (<a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> const &amp;, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> &amp;shared_storage, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>())</td></tr>
-<tr class="memdesc:a53282fa4cb33cfcec79033d26e418af6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="#a53282fa4cb33cfcec79033d26e418af6">More...</a><br /></td></tr>
-<tr class="separator:a53282fa4cb33cfcec79033d26e418af6"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afb6320b600f1f561594a9fb543b954e4"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">data</a> () const</td></tr>
-<tr class="memdesc:afb6320b600f1f561594a9fb543b954e4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the current pointer.  <a href="#afb6320b600f1f561594a9fb543b954e4">More...</a><br /></td></tr>
-<tr class="separator:afb6320b600f1f561594a9fb543b954e4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0a93f37fd366a48c4ed6cc39aa850eb5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">inc_d</a> ()</td></tr>
-<tr class="memdesc:a0a93f37fd366a48c4ed6cc39aa850eb5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the D dimension.  <a href="#a0a93f37fd366a48c4ed6cc39aa850eb5">More...</a><br /></td></tr>
-<tr class="separator:a0a93f37fd366a48c4ed6cc39aa850eb5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a228a95cf2c9c6089287984fcbf5cface"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">inc_h</a> ()</td></tr>
-<tr class="memdesc:a228a95cf2c9c6089287984fcbf5cface"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the H dimension.  <a href="#a228a95cf2c9c6089287984fcbf5cface">More...</a><br /></td></tr>
-<tr class="separator:a228a95cf2c9c6089287984fcbf5cface"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a49cf3ee608debebf451cdd8c2125d073"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">inc_w</a> ()</td></tr>
-<tr class="memdesc:a49cf3ee608debebf451cdd8c2125d073"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the W dimension.  <a href="#a49cf3ee608debebf451cdd8c2125d073">More...</a><br /></td></tr>
-<tr class="separator:a49cf3ee608debebf451cdd8c2125d073"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a91e13a7aad4b0acac002b6dd125abc37"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">inc_advance</a> ()</td></tr>
-<tr class="memdesc:a91e13a7aad4b0acac002b6dd125abc37"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the next dimension.  <a href="#a91e13a7aad4b0acac002b6dd125abc37">More...</a><br /></td></tr>
-<tr class="separator:a91e13a7aad4b0acac002b6dd125abc37"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aeb3faf5e8f976f5a4d158ceb41a1cc64"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">inc_stage</a> ()</td></tr>
-<tr class="memdesc:aeb3faf5e8f976f5a4d158ceb41a1cc64"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the stage.  <a href="#aeb3faf5e8f976f5a4d158ceb41a1cc64">More...</a><br /></td></tr>
-<tr class="separator:aeb3faf5e8f976f5a4d158ceb41a1cc64"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2716b9010d2902b90e63abb0531ee915"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
-<tr class="memitem:a2716b9010d2902b90e63abb0531ee915"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it)</td></tr>
-<tr class="memdesc:a2716b9010d2902b90e63abb0531ee915"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="#a2716b9010d2902b90e63abb0531ee915">More...</a><br /></td></tr>
-<tr class="separator:a2716b9010d2902b90e63abb0531ee915"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a195993d58ae0eeb53203116ac02ab38d"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
-<tr class="memitem:a195993d58ae0eeb53203116ac02ab38d"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment)</td></tr>
-<tr class="memdesc:a195993d58ae0eeb53203116ac02ab38d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="#a195993d58ae0eeb53203116ac02ab38d">More...</a><br /></td></tr>
-<tr class="separator:a195993d58ae0eeb53203116ac02ab38d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9c4b332857f419e6f789a93404dc2140"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
-<tr class="memitem:a9c4b332857f419e6f789a93404dc2140"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it) const</td></tr>
-<tr class="memdesc:a9c4b332857f419e6f789a93404dc2140"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="#a9c4b332857f419e6f789a93404dc2140">More...</a><br /></td></tr>
-<tr class="separator:a9c4b332857f419e6f789a93404dc2140"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1058cdec33393db9c16b28c21d8957db"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
-<tr class="memitem:a1058cdec33393db9c16b28c21d8957db"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment) const</td></tr>
-<tr class="memdesc:a1058cdec33393db9c16b28c21d8957db"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="#a1058cdec33393db9c16b28c21d8957db">More...</a><br /></td></tr>
-<tr class="separator:a1058cdec33393db9c16b28c21d8957db"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
-<tr class="memitem:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">More...</a><br /></td></tr>
-<tr class="separator:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60bbb4d4a6a5b8fb32e176e7d33f9e82"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:a60bbb4d4a6a5b8fb32e176e7d33f9e82"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:a60bbb4d4a6a5b8fb32e176e7d33f9e82"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using a <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html" title="Functor computing a predicate given the logical position of an access. ">RegularTilePredicateFunctor</a>.  <a href="#a60bbb4d4a6a5b8fb32e176e7d33f9e82">More...</a><br /></td></tr>
+<tr class="separator:a60bbb4d4a6a5b8fb32e176e7d33f9e82"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa566cf603a5c19c59946a41b04642e49"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </td></tr>
+<tr class="memitem:aa566cf603a5c19c59946a41b04642e49"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;functor, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset)</td></tr>
+<tr class="memdesc:aa566cf603a5c19c59946a41b04642e49"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using an arbitrary predicate functor.  <a href="#aa566cf603a5c19c59946a41b04642e49">More...</a><br /></td></tr>
+<tr class="separator:aa566cf603a5c19c59946a41b04642e49"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:add962655973d5b8eff5673c04e053e4e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">TileLoadIterator</a> ()</td></tr>
+<tr class="memdesc:add962655973d5b8eff5673c04e053e4e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#add962655973d5b8eff5673c04e053e4e">More...</a><br /></td></tr>
+<tr class="separator:add962655973d5b8eff5673c04e053e4e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4ffe90c974b260220fe0b44274095322"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">TileLoadIterator</a> (<a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a4ffe90c974b260220fe0b44274095322"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="#a4ffe90c974b260220fe0b44274095322">More...</a><br /></td></tr>
+<tr class="separator:a4ffe90c974b260220fe0b44274095322"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1636f4e15ca7f9f56bfccb93a2826c30"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">TileLoadIterator</a> (<a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> const &amp;, <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const *ptr, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a1636f4e15ca7f9f56bfccb93a2826c30"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="#a1636f4e15ca7f9f56bfccb93a2826c30">More...</a><br /></td></tr>
+<tr class="separator:a1636f4e15ca7f9f56bfccb93a2826c30"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb92092230ae933ff6cc4a36960d0674"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">inc_d</a> ()</td></tr>
+<tr class="memdesc:aeb92092230ae933ff6cc4a36960d0674"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the D dimension.  <a href="#aeb92092230ae933ff6cc4a36960d0674">More...</a><br /></td></tr>
+<tr class="separator:aeb92092230ae933ff6cc4a36960d0674"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1b94be88a160b21347c0eb58ed8e1b51"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">inc_h</a> ()</td></tr>
+<tr class="memdesc:a1b94be88a160b21347c0eb58ed8e1b51"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the H dimension.  <a href="#a1b94be88a160b21347c0eb58ed8e1b51">More...</a><br /></td></tr>
+<tr class="separator:a1b94be88a160b21347c0eb58ed8e1b51"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af4f964364fc54a2b9a431fa529f6c44c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">inc_w</a> ()</td></tr>
+<tr class="memdesc:af4f964364fc54a2b9a431fa529f6c44c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the W dimension.  <a href="#af4f964364fc54a2b9a431fa529f6c44c">More...</a><br /></td></tr>
+<tr class="separator:af4f964364fc54a2b9a431fa529f6c44c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9bda55335fb2e90af2ee7d20571f3d9b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">inc_advance</a> ()</td></tr>
+<tr class="memdesc:a9bda55335fb2e90af2ee7d20571f3d9b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the next dimension.  <a href="#a9bda55335fb2e90af2ee7d20571f3d9b">More...</a><br /></td></tr>
+<tr class="separator:a9bda55335fb2e90af2ee7d20571f3d9b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6f74b87df129693ee6ac9a6fcc0c8910"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">load_element</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a6f74b87df129693ee6ac9a6fcc0c8910"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a single fragment element from memory.  <a href="#a6f74b87df129693ee6ac9a6fcc0c8910">More...</a><br /></td></tr>
+<tr class="separator:a6f74b87df129693ee6ac9a6fcc0c8910"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64ce59c5deb58e208529761a44c7661d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">inc_stage</a> ()</td></tr>
+<tr class="memdesc:a64ce59c5deb58e208529761a44c7661d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the stage.  <a href="#a64ce59c5deb58e208529761a44c7661d">More...</a><br /></td></tr>
+<tr class="separator:a64ce59c5deb58e208529761a44c7661d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a723041057b1e8212e075959a22c0c120"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a723041057b1e8212e075959a22c0c120"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a vector offset to the iterator.  <a href="#a723041057b1e8212e075959a22c0c120">More...</a><br /></td></tr>
+<tr class="separator:a723041057b1e8212e075959a22c0c120"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad65b7a0a5b4f42c590642ef7b269f232"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">add_pointer_offset</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> offset)</td></tr>
+<tr class="memdesc:ad65b7a0a5b4f42c590642ef7b269f232"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a raw offset to the pointer.  <a href="#ad65b7a0a5b4f42c590642ef7b269f232">More...</a><br /></td></tr>
+<tr class="separator:ad65b7a0a5b4f42c590642ef7b269f232"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a31a021d6c099e8027fa9bcb5fdc21c11"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11">stride_advance</a> (void)</td></tr>
+<tr class="separator:a31a021d6c099e8027fa9bcb5fdc21c11"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4d437597ae736c581a9ba0764f9d955f"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:a4d437597ae736c581a9ba0764f9d955f"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it)</td></tr>
+<tr class="memdesc:a4d437597ae736c581a9ba0764f9d955f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="#a4d437597ae736c581a9ba0764f9d955f">More...</a><br /></td></tr>
+<tr class="separator:a4d437597ae736c581a9ba0764f9d955f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5c8a4318ffd400363d9c7572c07ff32a"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a5c8a4318ffd400363d9c7572c07ff32a"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="memdesc:a5c8a4318ffd400363d9c7572c07ff32a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="#a5c8a4318ffd400363d9c7572c07ff32a">More...</a><br /></td></tr>
+<tr class="separator:a5c8a4318ffd400363d9c7572c07ff32a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa856180123f8d50a00222542fa6345cf"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:aa856180123f8d50a00222542fa6345cf"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it) const</td></tr>
+<tr class="memdesc:aa856180123f8d50a00222542fa6345cf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="#aa856180123f8d50a00222542fa6345cf">More...</a><br /></td></tr>
+<tr class="separator:aa856180123f8d50a00222542fa6345cf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a83dadcea858a5e426dcea54400138480"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a83dadcea858a5e426dcea54400138480"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment) const</td></tr>
+<tr class="memdesc:a83dadcea858a5e426dcea54400138480"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="#a83dadcea858a5e426dcea54400138480">More...</a><br /></td></tr>
+<tr class="separator:a83dadcea858a5e426dcea54400138480"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1b070fc66109d372f5a45a5857594ac6"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a1b070fc66109d372f5a45a5857594ac6"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, int d)</td></tr>
+<tr class="memdesc:a1b070fc66109d372f5a45a5857594ac6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="#a1b070fc66109d372f5a45a5857594ac6">More...</a><br /></td></tr>
+<tr class="separator:a1b070fc66109d372f5a45a5857594ac6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">More...</a><br /></td></tr>
+<tr class="separator:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:aaafe35622751532971c1b7efc54c888b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a></td></tr>
-<tr class="memdesc:aaafe35622751532971c1b7efc54c888b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters structure.  <a href="#aaafe35622751532971c1b7efc54c888b">More...</a><br /></td></tr>
-<tr class="separator:aaafe35622751532971c1b7efc54c888b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7726cdd4fe056c59bb04adb9e5504457"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">thread_offset</a></td></tr>
-<tr class="memdesc:a7726cdd4fe056c59bb04adb9e5504457"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="#a7726cdd4fe056c59bb04adb9e5504457">More...</a><br /></td></tr>
-<tr class="separator:a7726cdd4fe056c59bb04adb9e5504457"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa3fd9859de68d76e07ebee06c6ccee92"><td class="memItemLeft" align="right" valign="top">int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a></td></tr>
-<tr class="memdesc:aa3fd9859de68d76e07ebee06c6ccee92"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stage argument enables wrapping after some number of tiles have been loaded.  <a href="#aa3fd9859de68d76e07ebee06c6ccee92">More...</a><br /></td></tr>
-<tr class="separator:aa3fd9859de68d76e07ebee06c6ccee92"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5561e676148200c2fc85a603847cc596"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a></td></tr>
+<tr class="memdesc:a5561e676148200c2fc85a603847cc596"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters structure.  <a href="#a5561e676148200c2fc85a603847cc596">More...</a><br /></td></tr>
+<tr class="separator:a5561e676148200c2fc85a603847cc596"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7808588ce0b12017379dcbe1ba9c511f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a></td></tr>
+<tr class="memdesc:a7808588ce0b12017379dcbe1ba9c511f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="#a7808588ce0b12017379dcbe1ba9c511f">More...</a><br /></td></tr>
+<tr class="separator:a7808588ce0b12017379dcbe1ba9c511f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad8e730768c1805d98e23886a492389d3"><td class="memItemLeft" align="right" valign="top">int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a></td></tr>
+<tr class="memdesc:ad8e730768c1805d98e23886a492389d3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stage argument enables wrapping after some number of tiles have been loaded.  <a href="#ad8e730768c1805d98e23886a492389d3">More...</a><br /></td></tr>
+<tr class="separator:ad8e730768c1805d98e23886a492389d3"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
-<tr class="memitem:a69d2f21c8188fb3229af8c2dbe0a23b6"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">kAdvance</a> = Base::kAdvance</td></tr>
-<tr class="memdesc:a69d2f21c8188fb3229af8c2dbe0a23b6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies in which dimension post-increment accesses advance.  <a href="#a69d2f21c8188fb3229af8c2dbe0a23b6">More...</a><br /></td></tr>
-<tr class="separator:a69d2f21c8188fb3229af8c2dbe0a23b6"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aba1d75a0cd5f11dee2aecf89b2b13d98"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">kIteratorFragment</a> = Base::kIteratorFragment</td></tr>
-<tr class="memdesc:aba1d75a0cd5f11dee2aecf89b2b13d98"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies type of iterator fragment storage (Salar or WmmaMatrix)  <a href="#aba1d75a0cd5f11dee2aecf89b2b13d98">More...</a><br /></td></tr>
-<tr class="separator:aba1d75a0cd5f11dee2aecf89b2b13d98"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac21bd78b31c99c826f0eddb5aa033bf1"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">kMemorySpace</a> = Base::kMemorySpace</td></tr>
-<tr class="memdesc:ac21bd78b31c99c826f0eddb5aa033bf1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="#ac21bd78b31c99c826f0eddb5aa033bf1">More...</a><br /></td></tr>
-<tr class="separator:ac21bd78b31c99c826f0eddb5aa033bf1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_static_attribs_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
-<tr class="memitem:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a> = Advance_</td></tr>
-<tr class="memdesc:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">More...</a><br /></td></tr>
-<tr class="separator:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a> = IteratorFragment_</td></tr>
-<tr class="memdesc:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">More...</a><br /></td></tr>
-<tr class="separator:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a> = <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a></td></tr>
-<tr class="memdesc:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">More...</a><br /></td></tr>
-<tr class="separator:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> = Tile::kC</td></tr>
-<tr class="memdesc:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">More...</a><br /></td></tr>
-<tr class="separator:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td></tr>
-<tr class="memdesc:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">More...</a><br /></td></tr>
-<tr class="separator:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea9fbc738003a7424cfa9b0527d4a352"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">kAdvance</a> = Base::kAdvance</td></tr>
+<tr class="memdesc:aea9fbc738003a7424cfa9b0527d4a352"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies in which dimension post-increment accesses advance.  <a href="#aea9fbc738003a7424cfa9b0527d4a352">More...</a><br /></td></tr>
+<tr class="separator:aea9fbc738003a7424cfa9b0527d4a352"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2af872794b35a631f9c1a97df0c6d177"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">kFragmentElementType</a> = FragmentElementType_</td></tr>
+<tr class="memdesc:a2af872794b35a631f9c1a97df0c6d177"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies type of iterator fragment storage (Salar or WmmaMatrix)  <a href="#a2af872794b35a631f9c1a97df0c6d177">More...</a><br /></td></tr>
+<tr class="separator:a2af872794b35a631f9c1a97df0c6d177"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a44424164c9347f9916b2b86858706043"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">kMemorySpace</a> = Base::kMemorySpace</td></tr>
+<tr class="memdesc:a44424164c9347f9916b2b86858706043"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="#a44424164c9347f9916b2b86858706043">More...</a><br /></td></tr>
+<tr class="separator:a44424164c9347f9916b2b86858706043"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a84f2f19069c3b003b1fcad438f690bc8"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">kAccessSize</a> = Base::kAccessSize</td></tr>
+<tr class="memdesc:a84f2f19069c3b003b1fcad438f690bc8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="#a84f2f19069c3b003b1fcad438f690bc8">More...</a><br /></td></tr>
+<tr class="separator:a84f2f19069c3b003b1fcad438f690bc8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a> = Advance_</td></tr>
+<tr class="memdesc:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">More...</a><br /></td></tr>
+<tr class="separator:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a> = FragmentElementType_</td></tr>
+<tr class="memdesc:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">More...</a><br /></td></tr>
+<tr class="separator:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a> = <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a></td></tr>
+<tr class="memdesc:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">More...</a><br /></td></tr>
+<tr class="separator:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> = Traits::kAccessSize</td></tr>
+<tr class="memdesc:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">More...</a><br /></td></tr>
+<tr class="separator:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td></tr>
+<tr class="memdesc:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">More...</a><br /></td></tr>
+<tr class="separator:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_static_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
-<tr class="memitem:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator &gt; </td></tr>
-<tr class="memitem:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memTemplItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
-<tr class="memdesc:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">More...</a><br /></td></tr>
-<tr class="separator:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memTemplItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">More...</a><br /></td></tr>
+<tr class="separator:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a4af8eeabe7c1ec0362782687a84466e0"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4af8eeabe7c1ec0362782687a84466e0">&#9670;&nbsp;</a></span>AccessType</h2>
+<a id="ae8f2c93ec43646be70d4b9f32d034125"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae8f2c93ec43646be70d4b9f32d034125">&#9670;&nbsp;</a></span>AccessType</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">Base::AccessType</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a1bc1bd4893c14b313ee71b71db2903f3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1bc1bd4893c14b313ee71b71db2903f3">&#9670;&nbsp;</a></span>Base</h2>
+<a id="a1dcbf633eac61ff06980e4992fbe8264"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1dcbf633eac61ff06980e4992fbe8264">&#9670;&nbsp;</a></span>Base</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_&gt; <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">Base</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_&gt; <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">Base</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a788bab4fa46dc26854348b751cf1cc76"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a788bab4fa46dc26854348b751cf1cc76">&#9670;&nbsp;</a></span>BaseParams</h2>
+<a id="a9aebb9153659320f1391671c215c519e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9aebb9153659320f1391671c215c519e">&#9670;&nbsp;</a></span>BaseParams</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">BaseParams</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">BaseParams</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ac2a7f94723259f0d3c7b8a6d5b8778bf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac2a7f94723259f0d3c7b8a6d5b8778bf">&#9670;&nbsp;</a></span>Delta</h2>
+<a id="afc68649cb9bb32931b27e711c7ce2604"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afc68649cb9bb32931b27e711c7ce2604">&#9670;&nbsp;</a></span>Delta</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Base::Delta</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Base::Delta</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aaf72c4897641080b1d84c0bbd8d813cc"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aaf72c4897641080b1d84c0bbd8d813cc">&#9670;&nbsp;</a></span>Fragment</h2>
+<a id="a4604b230174b11bc7ddf5f3e9a922139"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4604b230174b11bc7ddf5f3e9a922139">&#9670;&nbsp;</a></span>Fragment</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Base::Fragment</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Base::Fragment</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a4c7a3a4917245de8269b74bdabe16b76"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4c7a3a4917245de8269b74bdabe16b76">&#9670;&nbsp;</a></span>FragmentConstIterator</h2>
+<a id="ad272502e5a54615584bb037a33ff1dca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad272502e5a54615584bb037a33ff1dca">&#9670;&nbsp;</a></span>FragmentConstIterator</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">Base::FragmentConstIterator</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">Base::FragmentConstIterator</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a2edd89863b8035137ccd8dd3ad7be464"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2edd89863b8035137ccd8dd3ad7be464">&#9670;&nbsp;</a></span>FragmentElement</h2>
+<a id="a70dfd0b62feb082d8da34af09d9524a6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a70dfd0b62feb082d8da34af09d9524a6">&#9670;&nbsp;</a></span>FragmentElement</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">Base::FragmentElement</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a></td>
+          <td class="memname">typedef FragmentElement_ <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aebbe5a0996dcd362caad618e78dc2591"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aebbe5a0996dcd362caad618e78dc2591">&#9670;&nbsp;</a></span>FragmentIterator</h2>
+<a id="ad9c77ca0521d18a90dd3542a3941f016"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad9c77ca0521d18a90dd3542a3941f016">&#9670;&nbsp;</a></span>FragmentIterator</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">Base::FragmentIterator</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7c27a7b0d8593b002eca186c15fdc869"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7c27a7b0d8593b002eca186c15fdc869">&#9670;&nbsp;</a></span>FragmentShape</h2>
+<a id="a46a2cbf407d3f43a7441323d150d96f1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a46a2cbf407d3f43a7441323d150d96f1">&#9670;&nbsp;</a></span>FragmentShape</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">Base::FragmentShape</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">Base::FragmentShape</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aaa83f05e0cb3204053c3ee1da036cd36"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aaa83f05e0cb3204053c3ee1da036cd36">&#9670;&nbsp;</a></span>Index</h2>
+<a id="aaa5d98b72576478ba04e4ad554faa827"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aaa5d98b72576478ba04e4ad554faa827">&#9670;&nbsp;</a></span>Index</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Base::Index</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Base::Index</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a9720b1e4a10c2d5aa85f9a9c66a31bbf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9720b1e4a10c2d5aa85f9a9c66a31bbf">&#9670;&nbsp;</a></span>Iterations</h2>
+<a id="a6c570dfa1cb68d436d8da6bd23cce6ce"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6c570dfa1cb68d436d8da6bd23cce6ce">&#9670;&nbsp;</a></span>Iterations</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Base::Iterations</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Base::Iterations</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a5a179e148ccd770e1703f288624fa9b8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5a179e148ccd770e1703f288624fa9b8">&#9670;&nbsp;</a></span>Pointer</h2>
+<a id="a39acc5c35c8db019a3aeef79e8005b7f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a39acc5c35c8db019a3aeef79e8005b7f">&#9670;&nbsp;</a></span>Pointer</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> const* <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">Pointer</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const* <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">Pointer</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a64ae02b44f275ef2f016949aec769328"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a64ae02b44f275ef2f016949aec769328">&#9670;&nbsp;</a></span>PredicateVector</h2>
+<a id="ad71f865c61f02eba981c056ef71653f5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad71f865c61f02eba981c056ef71653f5">&#9670;&nbsp;</a></span>PredicateVector</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">Base::PredicateVector</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">Base::PredicateVector</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ae8dff52e619f06fbdbca8cb847c79895"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae8dff52e619f06fbdbca8cb847c79895">&#9670;&nbsp;</a></span>Scalar</h2>
+<a id="aafbb7a2137a07f0e07a12838b66bd511"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aafbb7a2137a07f0e07a12838b66bd511">&#9670;&nbsp;</a></span>Scalar</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Base::Scalar</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Base::Scalar</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ab457bd7953af9ef418510f55f52d1f39"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab457bd7953af9ef418510f55f52d1f39">&#9670;&nbsp;</a></span>SharedStorage</h2>
+<a id="a57eff980f6b1086abe39dd617de5b948"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a57eff980f6b1086abe39dd617de5b948">&#9670;&nbsp;</a></span>SharedStorage</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Base::Storage</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Base::Storage</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a11ec4297c9a1352c8005ac222892b35c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a11ec4297c9a1352c8005ac222892b35c">&#9670;&nbsp;</a></span>Skew</h2>
+<a id="aeb6cc0e2990c06c83b789b579a03b15f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeb6cc0e2990c06c83b789b579a03b15f">&#9670;&nbsp;</a></span>Skew</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Base::Skew</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Base::Skew</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a8a1527b4b469ae1f97afde2502ece70d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8a1527b4b469ae1f97afde2502ece70d">&#9670;&nbsp;</a></span>ThreadOffset</h2>
+<a id="a146adfb1951efd70995b05a7a31fd548"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a146adfb1951efd70995b05a7a31fd548">&#9670;&nbsp;</a></span>TensorRef</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">Base::ThreadOffset</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const, 4&gt; <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7f1499ada284c21624487d4d3a5dbd10"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7f1499ada284c21624487d4d3a5dbd10">&#9670;&nbsp;</a></span>Tile</h2>
+<a id="ae8cb43a98cd2fa28f6457afbda8ec58a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae8cb43a98cd2fa28f6457afbda8ec58a">&#9670;&nbsp;</a></span>ThreadOffset</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Base::Tile</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">Base::ThreadOffset</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7c6182031d9aa41d0e4a64516723e20a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7c6182031d9aa41d0e4a64516723e20a">&#9670;&nbsp;</a></span>Traits</h2>
+<a id="a88eaa581e0b5419b98ee5a71073d0539"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a88eaa581e0b5419b98ee5a71073d0539">&#9670;&nbsp;</a></span>Tile</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Base::Traits</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Base::Tile</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6a5d065939282fa1b9454b28a1e73948"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6a5d065939282fa1b9454b28a1e73948">&#9670;&nbsp;</a></span>Traits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Base::Traits</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -634,7 +672,7 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">anonymous enum</td>
@@ -642,25 +680,25 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
       </table>
 </div><div class="memdoc">
 <table class="fieldtable">
-<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc"></a>kRequiresLoadFence&#160;</td><td class="fielddoc"></td></tr>
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126"></a>kRequiresLoadFence&#160;</td><td class="fielddoc"></td></tr>
 </table>
 
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a81c9c0b17bf5f214230ecf10e0690a4e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a81c9c0b17bf5f214230ecf10e0690a4e">&#9670;&nbsp;</a></span>TileLoadIterator() <span class="overload">[1/3]</span></h2>
+<a id="add962655973d5b8eff5673c04e053e4e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#add962655973d5b8eff5673c04e053e4e">&#9670;&nbsp;</a></span>TileLoadIterator() <span class="overload">[1/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -675,19 +713,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a93e166575be3b2f7489833ae5da23f23"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a93e166575be3b2f7489833ae5da23f23">&#9670;&nbsp;</a></span>TileLoadIterator() <span class="overload">[2/3]</span></h2>
+<a id="a4ffe90c974b260220fe0b44274095322"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4ffe90c974b260220fe0b44274095322">&#9670;&nbsp;</a></span>TileLoadIterator() <span class="overload">[2/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> const &amp;&#160;</td>
           <td class="paramname"><em>_params</em>, </td>
@@ -701,8 +739,8 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>&#160;</td>
-          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>()</code>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>&#160;</td>
+          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>()</code>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -719,19 +757,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a53282fa4cb33cfcec79033d26e418af6"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a53282fa4cb33cfcec79033d26e418af6">&#9670;&nbsp;</a></span>TileLoadIterator() <span class="overload">[3/3]</span></h2>
+<a id="a1636f4e15ca7f9f56bfccb93a2826c30"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1636f4e15ca7f9f56bfccb93a2826c30">&#9670;&nbsp;</a></span>TileLoadIterator() <span class="overload">[3/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> const &amp;&#160;</td>
           <td class="paramname">, </td>
@@ -739,8 +777,8 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> &amp;&#160;</td>
-          <td class="paramname"><em>shared_storage</em>, </td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
@@ -751,8 +789,8 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>&#160;</td>
-          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>()</code>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>&#160;</td>
+          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>()</code>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -770,22 +808,23 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="afb6320b600f1f561594a9fb543b954e4"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#afb6320b600f1f561594a9fb543b954e4">&#9670;&nbsp;</a></span>data()</h2>
+<a id="ad65b7a0a5b4f42c590642ef7b269f232"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad65b7a0a5b4f42c590642ef7b269f232">&#9670;&nbsp;</a></span>add_pointer_offset()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> const* <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::data </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::add_pointer_offset </td>
           <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
         </tr>
       </table>
   </td>
@@ -797,19 +836,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a91e13a7aad4b0acac002b6dd125abc37"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a91e13a7aad4b0acac002b6dd125abc37">&#9670;&nbsp;</a></span>inc_advance()</h2>
+<a id="a9bda55335fb2e90af2ee7d20571f3d9b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9bda55335fb2e90af2ee7d20571f3d9b">&#9670;&nbsp;</a></span>inc_advance()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_advance </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_advance </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -824,19 +863,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a0a93f37fd366a48c4ed6cc39aa850eb5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0a93f37fd366a48c4ed6cc39aa850eb5">&#9670;&nbsp;</a></span>inc_d()</h2>
+<a id="aeb92092230ae933ff6cc4a36960d0674"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeb92092230ae933ff6cc4a36960d0674">&#9670;&nbsp;</a></span>inc_d()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_d </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_d </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -851,19 +890,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a228a95cf2c9c6089287984fcbf5cface"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a228a95cf2c9c6089287984fcbf5cface">&#9670;&nbsp;</a></span>inc_h()</h2>
+<a id="a1b94be88a160b21347c0eb58ed8e1b51"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1b94be88a160b21347c0eb58ed8e1b51">&#9670;&nbsp;</a></span>inc_h()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_h </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_h </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -878,19 +917,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="aeb3faf5e8f976f5a4d158ceb41a1cc64"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aeb3faf5e8f976f5a4d158ceb41a1cc64">&#9670;&nbsp;</a></span>inc_stage()</h2>
+<a id="a64ce59c5deb58e208529761a44c7661d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a64ce59c5deb58e208529761a44c7661d">&#9670;&nbsp;</a></span>inc_stage()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_stage </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_stage </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -905,19 +944,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a49cf3ee608debebf451cdd8c2125d073"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a49cf3ee608debebf451cdd8c2125d073">&#9670;&nbsp;</a></span>inc_w()</h2>
+<a id="af4f964364fc54a2b9a431fa529f6c44c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af4f964364fc54a2b9a431fa529f6c44c">&#9670;&nbsp;</a></span>inc_w()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_w </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_w </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -932,13 +971,13 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="a8291a51bf96f86bc77d0e3453345dbd5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8291a51bf96f86bc77d0e3453345dbd5">&#9670;&nbsp;</a></span>initialize_predicates()</h2>
+<a id="a60bbb4d4a6a5b8fb32e176e7d33f9e82"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a60bbb4d4a6a5b8fb32e176e7d33f9e82">&#9670;&nbsp;</a></span>initialize_predicates() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename PredicateIterator &gt; </div>
 <table class="mlabels">
@@ -946,7 +985,7 @@ template&lt;typename PredicateIterator &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::initialize_predicates </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::initialize_predicates </td>
           <td>(</td>
           <td class="paramtype">PredicateIterator&#160;</td>
           <td class="paramname"><em>predicate_it</em>, </td>
@@ -978,13 +1017,59 @@ template&lt;typename PredicateIterator &gt; </div>
 
 </div>
 </div>
-<a id="a9c4b332857f419e6f789a93404dc2140"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9c4b332857f419e6f789a93404dc2140">&#9670;&nbsp;</a></span>load() <span class="overload">[1/2]</span></h2>
+<a id="aa566cf603a5c19c59946a41b04642e49"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa566cf603a5c19c59946a41b04642e49">&#9670;&nbsp;</a></span>initialize_predicates() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::initialize_predicates </td>
+          <td>(</td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>predicate_it</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">PredicateFunctor const &amp;&#160;</td>
+          <td class="paramname"><em>functor</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>block_offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa856180123f8d50a00222542fa6345cf"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa856180123f8d50a00222542fa6345cf">&#9670;&nbsp;</a></span>load() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename Fragment , typename PredicateIterator &gt; </div>
 <table class="mlabels">
@@ -992,9 +1077,9 @@ template&lt;typename Fragment , typename PredicateIterator &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::load </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
           <td class="paramname"><em>fragment</em>, </td>
         </tr>
         <tr>
@@ -1018,13 +1103,13 @@ template&lt;typename Fragment , typename PredicateIterator &gt; </div>
 
 </div>
 </div>
-<a id="a1058cdec33393db9c16b28c21d8957db"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1058cdec33393db9c16b28c21d8957db">&#9670;&nbsp;</a></span>load() <span class="overload">[2/2]</span></h2>
+<a id="a83dadcea858a5e426dcea54400138480"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a83dadcea858a5e426dcea54400138480">&#9670;&nbsp;</a></span>load() <span class="overload">[2/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename Fragment &gt; </div>
 <table class="mlabels">
@@ -1032,9 +1117,9 @@ template&lt;typename Fragment &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::load </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
           <td class="paramname"><em>fragment</em></td><td>)</td>
           <td> const</td>
         </tr>
@@ -1048,13 +1133,109 @@ template&lt;typename Fragment &gt; </div>
 
 </div>
 </div>
-<a id="a2716b9010d2902b90e63abb0531ee915"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2716b9010d2902b90e63abb0531ee915">&#9670;&nbsp;</a></span>load_post_increment() <span class="overload">[1/2]</span></h2>
+<a id="a1b070fc66109d372f5a45a5857594ac6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1b070fc66109d372f5a45a5857594ac6">&#9670;&nbsp;</a></span>load() <span class="overload">[3/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6f74b87df129693ee6ac9a6fcc0c8910"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6f74b87df129693ee6ac9a6fcc0c8910">&#9670;&nbsp;</a></span>load_element()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load_element </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>c</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4d437597ae736c581a9ba0764f9d955f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4d437597ae736c581a9ba0764f9d955f">&#9670;&nbsp;</a></span>load_post_increment() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename Fragment , typename PredicateIterator &gt; </div>
 <table class="mlabels">
@@ -1062,9 +1243,9 @@ template&lt;typename Fragment , typename PredicateIterator &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::load_post_increment </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load_post_increment </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
           <td class="paramname"><em>fragment</em>, </td>
         </tr>
         <tr>
@@ -1088,13 +1269,13 @@ template&lt;typename Fragment , typename PredicateIterator &gt; </div>
 
 </div>
 </div>
-<a id="a195993d58ae0eeb53203116ac02ab38d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a195993d58ae0eeb53203116ac02ab38d">&#9670;&nbsp;</a></span>load_post_increment() <span class="overload">[2/2]</span></h2>
+<a id="a5c8a4318ffd400363d9c7572c07ff32a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5c8a4318ffd400363d9c7572c07ff32a">&#9670;&nbsp;</a></span>load_post_increment() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename Fragment &gt; </div>
 <table class="mlabels">
@@ -1102,9 +1283,9 @@ template&lt;typename Fragment &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::load_post_increment </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load_post_increment </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
           <td class="paramname"><em>fragment</em></td><td>)</td>
           <td></td>
         </tr>
@@ -1116,22 +1297,78 @@ template&lt;typename Fragment &gt; </div>
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a723041057b1e8212e075959a22c0c120"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a723041057b1e8212e075959a22c0c120">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&amp; <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a31a021d6c099e8027fa9bcb5fdc21c11"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a31a021d6c099e8027fa9bcb5fdc21c11">&#9670;&nbsp;</a></span>stride_advance()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::stride_advance </td>
+          <td>(</td>
+          <td class="paramtype">void&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="a69d2f21c8188fb3229af8c2dbe0a23b6"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a69d2f21c8188fb3229af8c2dbe0a23b6">&#9670;&nbsp;</a></span>kAdvance</h2>
+<a id="a84f2f19069c3b003b1fcad438f690bc8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a84f2f19069c3b003b1fcad438f690bc8">&#9670;&nbsp;</a></span>kAccessSize</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kAdvance = Base::kAdvance</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kAccessSize = Base::kAccessSize</td>
         </tr>
       </table>
   </td>
@@ -1143,19 +1380,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="aba1d75a0cd5f11dee2aecf89b2b13d98"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aba1d75a0cd5f11dee2aecf89b2b13d98">&#9670;&nbsp;</a></span>kIteratorFragment</h2>
+<a id="aea9fbc738003a7424cfa9b0527d4a352"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea9fbc738003a7424cfa9b0527d4a352">&#9670;&nbsp;</a></span>kAdvance</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kIteratorFragment = Base::kIteratorFragment</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kAdvance = Base::kAdvance</td>
         </tr>
       </table>
   </td>
@@ -1167,19 +1404,19 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="ac21bd78b31c99c826f0eddb5aa033bf1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac21bd78b31c99c826f0eddb5aa033bf1">&#9670;&nbsp;</a></span>kMemorySpace</h2>
+<a id="a2af872794b35a631f9c1a97df0c6d177"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2af872794b35a631f9c1a97df0c6d177">&#9670;&nbsp;</a></span>kFragmentElementType</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kMemorySpace = Base::kMemorySpace</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kFragmentElementType = FragmentElementType_</td>
         </tr>
       </table>
   </td>
@@ -1191,48 +1428,72 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="aaafe35622751532971c1b7efc54c888b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aaafe35622751532971c1b7efc54c888b">&#9670;&nbsp;</a></span>params</h2>
+<a id="a44424164c9347f9916b2b86858706043"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a44424164c9347f9916b2b86858706043">&#9670;&nbsp;</a></span>kMemorySpace</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::params</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kMemorySpace = Base::kMemorySpace</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5561e676148200c2fc85a603847cc596"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5561e676148200c2fc85a603847cc596">&#9670;&nbsp;</a></span>params</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::params</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aa3fd9859de68d76e07ebee06c6ccee92"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa3fd9859de68d76e07ebee06c6ccee92">&#9670;&nbsp;</a></span>stage</h2>
+<a id="ad8e730768c1805d98e23886a492389d3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad8e730768c1805d98e23886a492389d3">&#9670;&nbsp;</a></span>stage</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::stage</td>
+          <td class="memname">int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::stage</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7726cdd4fe056c59bb04adb9e5504457"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7726cdd4fe056c59bb04adb9e5504457">&#9670;&nbsp;</a></span>thread_offset</h2>
+<a id="a7808588ce0b12017379dcbe1ba9c511f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7808588ce0b12017379dcbe1ba9c511f">&#9670;&nbsp;</a></span>thread_offset</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;4&gt; <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::thread_offset</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;4&gt; <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::thread_offset</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -1245,7 +1506,7 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileLoadIterator.png b/docs/structcutlass_1_1TileLoadIterator.png
index 30866fa85d7157dba4240da683495a780e57590b..bad871e1e7db79653c46c97b221490332eb6e82f 100644
GIT binary patch
literal 2306
zcmc(hdo<MR8pmf$?$^=<+n{i4HjP4P(y-kcavOv+o2{fw#&z5olG@nFkjqA@Q7(zf
zt%w<vaXAt)6w}0%OEWYQW}4gn+3i2hS?iqh?|IjH-{<mu{&?2A*7I3Umb<H?yo{O*
z2n3Qxp0GoKKw^Brcb9?yFN)#;28@dPNiTbmNCdd-jir0Nxa)xT*Cmt5zK`Nh0ije3
z%GDDD6m6f$A+N(gssL$c;}s8Hsho>q9g)gJXpVjrXg)<=a@N}4)P+pe(>`4}<KG05
zKHd{R#i2c!9gTH3^i<h%1EfCE2|0euiKDBpi=5D(E2%EhajCfyKtK^pD|e-Ci!o|s
zQnC>;yXBIIgSIVPV4gQX)*KBwbKHAr6Q>miMt0QoeY&&JI_!8bpiG=gs8&w77j2$+
zao;7*O4?2^VK;`J$UGL_qe<l-=9hS69g&wm+wK#^cj1^f=h%0oa(Qg$aig;AE^(3$
zZG0td%2s`beudOs(d5`J2)kb=Fp-M&#kwWZpCO`ol+D)J`pDy<Gn1b3`;oZ@ebn2z
zCh;f5-!YD?I#fC$v3{JKHwBt_j1O-Br#y$jBT>@E<lbXJg=~Sb(5`%nIMA)Z=pxJ}
zY6S-0buQEC{5_zgcH*M@d-KURLS??2AapMOWSeY@|IpO!GVRV(DTM<_SINxutzG_v
zij%3y>gzA?MIWd=ttOZ%R9yBe+z&m_+itZwo&RLU!84Rqo8(PGl60SLSX)ctowIeC
zowzQtigV`b791#i!}hKLi+_l}O4wvlh=yyG>v`^)TSdteDMWpEvS>9BTNM(;(oRD>
zYsJ%2ZfW(hadHmss;24O_m5Ik<>Bb6E7u_3UgBl&s@>2Rv{gcPG-r!>BWrJ8cvJMb
z52fyhBr4ZO8uaVa=}Bsga03s$D$4?$c2*>&^I^Z4$--FMexlupoQlwzua$u+`&I1Q
zGzhH6tGpjt^yJhclfL~Ztte?))M|OX`V=pD3GEz(*@}=MUGxcC4?l{JdAhmZj16Dh
z^F~Q{B!P&EL7SG^&#lXZ1k<^?bp@FS6_17fo{yv26|AHeLG(z<;PNi>>7NE4NQ!A}
zWS#y^r#Uo;=1vpdIOj9V&EGezcxP4Kj9r!cEt=CAaw<daJwo5!;sUHU+#%lLg5>dE
zyi#|FE{rR}@nP8#IkJWh%@+pd54@QqbzXxU<@lp?CO;;y;&Wb^v+;S^g7y^&o>yD*
zIn(Pyuo>USME3dzA*RefciqGCL5;SZuNZ@Ry2v8EAmJAUgR?BF{)2pnLVRJ)rv%68
zMKZJt@|;S{q|;yMv1-o;)H5huYK)2U@#C7W^6bhVM{;voSAqz;>v~~Gyt`gpVYP3#
zD)KP1O*SMVG-Y(-J`EA!gFJ7g5n;;ghO(M^Nx17>Xy@@gUBNno4ejXo43l+CBMkb%
zezCB6IPq9up%VQV_Qu?_(cl9F@OR6KwS)Z8I7j5CJvYt}Qe8+&5pf*ZeaQbcl7G+Z
zGDHZB@#~I8OelH^cK}=s5@rb@CjfgM)vI`2tkgv$DESJh2K~eHd#K6M6M*#7o))pU
zlU{eWYh0xf)-r)db@_m>{FiX=d-eZYAR{Io8#;&j73;Pd4j(S`1)+cr6aH(5rfDJu
zW02_EhUYiV3B!E&>lOn$8DHu;Xp2G~^fN9UpcF3NDb1Sp5qwqVi+IGH(U?^S*ve&j
z64dwrNQ>INv5@dC4bi|=>_c$Y44v4_8|rvv;Rq|JVBS+~M~5_mY*beNOdK#Yg?Ovy
zj|46p<}f!gW`^GO$6G{3pm1bQdEXLdYIAlgJW2K;-flF4QqO9{g4DdPh9xIu^_(?e
zYqTHgAMyTKQbHIM`=Q3+oz>J^$HsE0r1?*402F*n9WN0QtLc>&))RMgjq}_Bw#2Yj
zN)OLW-kopY?;RX6vAz|h?pZlrKO;J1HB0`?e9OB?g9cn~5@t;*_Sk?b6nO77sEEMg
z!TfxN8&&{{g`R;oZ|Y~ZvlwPOlfQI0gJa94=yyq$1+c8(g-fvaR0tT#@2*JmzstXu
zd5sMx%eCZHe!Gp@6Dw2_E?m~IEdgz{Rvi?quGwO-Y8o=e!xCF%R-Mzb9AddQ#w0MH
zB8qcVLc3P(k6*uKylnA9zma_c(2ve_n}hYW6Q9hW$Kw=4sa=Q1f;huCb=TN0PjZ9%
zale_`o3VK`z37Hhclyme!0oJp(9R`=&!O_A!B?N%$0*`giad%hOZEKtcmo7Lit)7*
zwUPV8Dy0ZupxV$|bx@0eRBI!+eYRAE9RAjOhF|_t(^3kKpTNRmzXK}VxYYb_K!Mf#
zI2k*=!_SKnjd};WeGC=G5o(`_6Oyp4v9#i`HJfDaHk-s**>KUC7|-T)*KG+Qn+1sr
zVZ-^7?5d(5_NRkA;SQW7aQ^(w|AZ#7*p0~)i(46_umNlIO-gZ#QVK-0SUZiM!9H{g
zhC4ezE>^wxNV?WJzci2~&SI8q{^VY={DrsL=i)1-Jbk*TaEHS}f@SURkG51g**~}l
zS4OfIp}$t?#(h;#^3UI!ir-gdTqs<)Ldj2>?5}A`64_Y8cZCi0e}qxna=>;n_r%Eb
zF@K6E9Zrv(lXHFW`Dtn^kHX}|lgAo(u@6ZyBB~AcrqD>6{O?SHJZYdnj!3VKFixrF
z(bD|!-RlrO*vv20VA*33{4Y2Hqd>rdAbA3OvgV4Wmbfvn9;EFi$2f7e1%O1se#Ni9
e&uj1jfnu{nMOLJTZ6C0(fROgCc8xy=Uj7qxr+B*n

literal 2304
zcmchZdo+~m9>>RhB4paFND>X!c3V>Jmr;lzxkoNFN5ZHXOc)ur_70I6-XUZ%?VU!F
zT#LbGl1nZnh0+YeHcT!vh@p%b=dHb4d!0YdI{%$_t>=Azzi0h!>sim|yWT91Q%>@-
z`(z;yh&<BS!3zQrXM(l|R04df-SHX%Kgu2_eH^#9w?T86|B2cWmkV0o7oAS`uT3}&
zy3km!Q{E6T=-V^W=VJ_R5s?nZd=kXCcNc&ObEpH6;d^D<X##o4^`J&-9o{tXzNURR
zthnT!RO;A9viqW-O=mrs<tN?(*Mk47fm}G)Yk=H=3{XH~kuJ_}an3kbuj9aNdms>i
z0S)`5*%PAcaK{g~5N9t&yd@u?0<kyrx?@lO#u&WHl!DJ`7*-+|X#Gxxh+-)|P^P+N
z$U(0S8G0lPFPCQ_ffsYrc@#gk0>Lu*JzDn~KEDiF%gCbcDJW#y4rsTSrGDkGZ<je4
zsR`V{F^IclN>C5rdIe1Wg(Q<L<$liCn8ka9>SCRB7`-CtwUpp}Ou#0?T>a+wd__iX
znRLPZ(cf+!NzhLxzsE3dS`q=WKW=Y*rLAc6*2%mD?GAOJR~ZboY&USoL<&J#QBgZv
ztu08&iPN&U@_jyB2rMqW>F#Vgle*bcJ&E8C16IZsz$M?lxi<rc8xKfkIRh`c>ga?l
z1Ed1g*7lagN+v)KYK;ryde7BCgBz8CWRs6+ojF|1KufErRLh6+Vt>>I?9tUK&oyXn
z6g8Tf+5E8!ZsxS}xSl=c2ZFPf$oQRWF;T@BYIuWL<`P3|cFmg8Z7Yt;Y+SEyRQ$<7
zxh}QlcwfWL0U6>PaVQ$#J2q)-a550clfXW5f9-j6d2rulcixezI%Eiru^D7Wi+5wr
zzW(~J(W9?&8H9cB7(O*vLsA}G$8_9M;c-k=&Xs)3%ZIz(YRlA@22W=y{o)%U(CE#M
zW3leNGAd$X);*QPaf2pX=n!Cdip))Z0+7j4&038rX53}0Hr}Ty!u3l3{4+0OIG%BH
z=roUtG79M6?B+G6fcHhhm51soQk5xeCq~~l)3rNigu%g{a6H$a_vdJDIJ}@}Yxg1z
z$bpGHM7Z7xyX~xJyMD9T+gt&54~x`7IAQWKjY+|>2o%l6Gk0ws1Z4w{l0JR7&b*JY
zCNtw|XnVHvm_vpt0D<&)ZAte>#Vk(Xr#1>Po!Rar{K~zagmr6?I~mdQ;PZ^XQM{B8
zn}IOsZ;Y{xEab<gLkW@0fEzF!BjdrIyl!Ozu~x1+Vm>O;(}waB-z2&MpHnZ4=;bc`
zDHk7CA2q_SHT-gHo%%GHPRnRVUK*bGeW;}nPISQ{H?KC)O5j}y7vQ}w&+mObIl5WA
z;Qo;n?T0+k)<2a`N!_zp4hWPjI86m*Dy_yqDEp~gRCKs4Cs8*~k>mzYSLC}&+!xQ(
zxCR0wbp%aoPUc?4RwL0HDZA@w5Fo;D6?6hjAV0TkCKn{*8r&cg-UyP4wt&;LKwSGZ
z{>Jqjd*UCO_lnzzPgYOvwG%%mRs#c=kR53w%L{&Ws-Ua<x7)=HHM0{(8Ng{`Fo>LH
zg?ui=AA~+lk`6L20f&Ide+%FLJsfN<?F`Y+gnvr`TZ1WJ=l^d?dj^K_tn(QrFof|8
zqg5jYhrl49TK%^nq}d|NRt;hN)=GfA&|Xhut$^z)dj05K+Xm}mD`BQ^q%5vT%Px)g
z8DcNV7jJsLgeyIv&J|A|qqe#1q))A_ycv|kW!ebCa6}$-*VJGpZ^7YRcAqOwJ&ZJd
zqh1oaoXdm|QO%zzfa;{upQzoBB_9vZjux)O#pledE-sQ6DDtx`pITauC_-&@%GxSC
zL#US+ri00jkCS+F4>#Q1Sg34$`}pex)9xmki?!!`bx8b3`3YMaKV!!yCD8Dx$V3i*
zT2$f`nVnd`x)7W2$DJgVo-w~*dhaFgb6V2ohqIcGGf%C;7(VSeAJ-9K(yBN?8$Trg
z{~j4VPw}vU!o;GR7Jnu9Z>K4FtE=~fV}+2@h7*?c>lN1;7pF~>l2)2s#ZC__@cLMx
z?7$F<%jI(B#hCfZPRM>2!YimkFBcl>JlEu@sC%)aR}E;XC~A)hx|?9N_HjD%BlGA<
zS)-6&35nyuixRZ^CB7Hy4<bS>Lbp-r`DhFMRHG{jl`21GeKQ$!OU>1a>s3m?QP2f$
zFjC8K&rlauq1=Dn!!MJH&S0Jugei{5j(*YBo$RFg^c*W}J*0^0)c14BFJ*?=$oR@?
zN>+BROVosn_srm{=5_ET$v)RWow&1UcsNZVT@&*pZMWI14BK>?sy6Y8eQW<UQj1C<
ziPXaFj?lwL=_?ydt?s}FBWPm#{BbgR)QJJnWy6k}6AvND&p$-}BTvcS&$c4{vg^_p
zvB#YxL87Cu?$d;`J<q89YKs-lDpB#JaBe+$-kWV&d3nvwDJII&RC6OjRZ$18b_v^+
z3dc9NX0RvdF0An)=7w8xf%0VMszEHvi;*kXc!+3M%Nwjh<FD@EHpTM#J_~Su`-Abd
zlAEg!Y@{9){hS<m4%<<Bhd%myC``GSGwpmn=Z~Hb>3&D~jb?hK?%A8Vv|+36v6Ke(
zI(|j!$V`-RtL>;1;$_>sv{?C_P2E~g!i^J42k3{2<{=1~>bKh&R*3kio!BZ0O;jf2
z3WbK5-YFvA8j1_=JllFeRG@_V4@r_o?PGbge(fxkYH1MDL8Ra$wjf7+MS+gQ0EOlD
t>1z1x|Dgn5G&lZY)SwpRb(cuY3VnMA`q0zE;O`0q>3GWF$#K*#{|0n|T-X2r

diff --git a/docs/structcutlass_1_1TileLoadIterator_1_1Params-members.html b/docs/structcutlass_1_1TileLoadIterator_1_1Params-members.html
index 1977795ea..25b1fdad2 100644
--- a/docs/structcutlass_1_1TileLoadIterator_1_1Params-members.html
+++ b/docs/structcutlass_1_1TileLoadIterator_1_1Params-members.html
@@ -73,30 +73,40 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params Member List</div>  </div>
+<div class="title">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">initialize</a>(SharedStorage const &amp;storage)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2">initialize</a>(Scalar const *ptr, Index stride_d, Index stride_h, Index stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1">initialize</a>(Scalar const *ptr, Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8">initialize</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">cutlass::TileIteratorBase::Params::initialize</a>(Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">cutlass::TileIteratorBase::Params::initialize</a>(Index _stride_d, Index _stride_h, Index _stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803">initialize</a>(TensorRef const &amp;ref)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0">initialize</a>(SharedStorage const &amp;storage)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf">initialize</a>(Scalar const *ptr)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662">initialize</a>(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d">initialize</a>(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d">initialize</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">cutlass::TileIteratorBase::Params::initialize</a>(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">cutlass::TileIteratorBase::Params::initialize</a>(Coord&lt; 4 &gt; const &amp;stride)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">cutlass::TileIteratorBase::Params::initialize</a>(long long _stride_d, Index _stride_h, Index _stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5">Params</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282">Params</a>(Scalar const *ptr)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192">Params</a>(TensorRef const &amp;ref)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e">Params</a>(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a">Params</a>(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">cutlass::TileIteratorBase::Params::Params</a>(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">cutlass::TileIteratorBase::Params::Params</a>(Coord&lt; 4 &gt; const &amp;stride)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileLoadIterator_1_1Params.html b/docs/structcutlass_1_1TileLoadIterator_1_1Params.html
index b25879f36..70ae9afbd 100644
--- a/docs/structcutlass_1_1TileLoadIterator_1_1Params.html
+++ b/docs/structcutlass_1_1TileLoadIterator_1_1Params.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params Struct Reference</title>
+<title>Cutlass: cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params Struct Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,7 +77,7 @@ $(function() {
 <a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="structcutlass_1_1TileLoadIterator_1_1Params-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params Struct Reference</div>  </div>
+<div class="title">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params Struct Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -86,76 +86,110 @@ $(function() {
 
 <p><code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params:</div>
+Inheritance diagram for cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1TileLoadIterator_1_1Params.png" usemap="#cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E::Params_map" alt=""/>
-  <map id="cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E::Params_map" name="cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E::Params_map">
-<area href="structcutlass_1_1TileIteratorBase_1_1Params.html" title="Parameters to the iterator. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params" shape="rect" coords="0,0,780,24"/>
-<area href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html" alt="cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params" shape="rect" coords="0,112,780,136"/>
+  <img src="structcutlass_1_1TileLoadIterator_1_1Params.png" usemap="#cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E::Params_map" alt=""/>
+  <map id="cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E::Params_map" name="cutlass::TileLoadIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E::Params_map">
+<area href="structcutlass_1_1TileIteratorBase_1_1Params.html" title="Parameters to the iterator. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params" shape="rect" coords="0,0,812,24"/>
+<area href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html" alt="cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params" shape="rect" coords="0,112,812,136"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:aeeea0f8bdee876553a4908b9b7cbaf76"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> const &amp;storage)</td></tr>
-<tr class="memdesc:aeeea0f8bdee876553a4908b9b7cbaf76"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#aeeea0f8bdee876553a4908b9b7cbaf76">More...</a><br /></td></tr>
-<tr class="separator:aeeea0f8bdee876553a4908b9b7cbaf76"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afd9e82df76ad35fe883b7834457242b2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> const *ptr, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>)</td></tr>
-<tr class="memdesc:afd9e82df76ad35fe883b7834457242b2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to access a raw pointer.  <a href="#afd9e82df76ad35fe883b7834457242b2">More...</a><br /></td></tr>
-<tr class="separator:afd9e82df76ad35fe883b7834457242b2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa3922946bb0da0c0040dec44aa389ec1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> const *ptr, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance)</td></tr>
-<tr class="memdesc:aa3922946bb0da0c0040dec44aa389ec1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="#aa3922946bb0da0c0040dec44aa389ec1">More...</a><br /></td></tr>
-<tr class="separator:aa3922946bb0da0c0040dec44aa389ec1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aebaecd0f971245ffc5a50fe5f7a9b4e8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8">initialize</a> ()</td></tr>
-<tr class="separator:aebaecd0f971245ffc5a50fe5f7a9b4e8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
-<tr class="memitem:ad2631ffcc963638aa5b016c66a2e2c55 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">initialize</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance)</td></tr>
-<tr class="memdesc:ad2631ffcc963638aa5b016c66a2e2c55 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">More...</a><br /></td></tr>
-<tr class="separator:ad2631ffcc963638aa5b016c66a2e2c55 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3ba93370bd4b2ede4bd4eb97ac0881be inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">initialize</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w)</td></tr>
-<tr class="separator:a3ba93370bd4b2ede4bd4eb97ac0881be inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af496afebb8983e5d346c681334955224 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">initialize</a> ()</td></tr>
-<tr class="separator:af496afebb8983e5d346c681334955224 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9a1098e6c7b8c7c377031fe59a18fbf5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5">Params</a> ()</td></tr>
+<tr class="memdesc:a9a1098e6c7b8c7c377031fe59a18fbf5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#a9a1098e6c7b8c7c377031fe59a18fbf5">More...</a><br /></td></tr>
+<tr class="separator:a9a1098e6c7b8c7c377031fe59a18fbf5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a88a90437f11d029ef109ebb4f828f282"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282">Params</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr)</td></tr>
+<tr class="memdesc:a88a90437f11d029ef109ebb4f828f282"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#a88a90437f11d029ef109ebb4f828f282">More...</a><br /></td></tr>
+<tr class="separator:a88a90437f11d029ef109ebb4f828f282"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2de32338814d0554b05ca985dbb7e192"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192">Params</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> const &amp;ref)</td></tr>
+<tr class="memdesc:a2de32338814d0554b05ca985dbb7e192"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs with a CompactTensorRef&lt;&gt;  <a href="#a2de32338814d0554b05ca985dbb7e192">More...</a><br /></td></tr>
+<tr class="separator:a2de32338814d0554b05ca985dbb7e192"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a78380e92553010656516400d51e14c7e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e">Params</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr, long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance)</td></tr>
+<tr class="memdesc:a78380e92553010656516400d51e14c7e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#a78380e92553010656516400d51e14c7e">More...</a><br /></td></tr>
+<tr class="separator:a78380e92553010656516400d51e14c7e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8c9856709d3392d8b70dce9a13fa529a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a">Params</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr, long long <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</td></tr>
+<tr class="memdesc:a8c9856709d3392d8b70dce9a13fa529a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#a8c9856709d3392d8b70dce9a13fa529a">More...</a><br /></td></tr>
+<tr class="separator:a8c9856709d3392d8b70dce9a13fa529a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac22d9229f3f8993d52b808dced173803"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> const &amp;ref)</td></tr>
+<tr class="memdesc:ac22d9229f3f8993d52b808dced173803"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to access a raw pointer.  <a href="#ac22d9229f3f8993d52b808dced173803">More...</a><br /></td></tr>
+<tr class="separator:ac22d9229f3f8993d52b808dced173803"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a61b898051d0397b013407a4c90409aa0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a> const &amp;storage)</td></tr>
+<tr class="memdesc:a61b898051d0397b013407a4c90409aa0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#a61b898051d0397b013407a4c90409aa0">More...</a><br /></td></tr>
+<tr class="separator:a61b898051d0397b013407a4c90409aa0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8869188d1c3b867fe6389aadf04837bf"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr)</td></tr>
+<tr class="memdesc:a8869188d1c3b867fe6389aadf04837bf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#a8869188d1c3b867fe6389aadf04837bf">More...</a><br /></td></tr>
+<tr class="separator:a8869188d1c3b867fe6389aadf04837bf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9a40662ff01a14e0616ce1a0fbb70662"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr, long long <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</td></tr>
+<tr class="memdesc:a9a40662ff01a14e0616ce1a0fbb70662"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to access a raw pointer.  <a href="#a9a40662ff01a14e0616ce1a0fbb70662">More...</a><br /></td></tr>
+<tr class="separator:a9a40662ff01a14e0616ce1a0fbb70662"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a53917e002fd29a5650752c65f96b353d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr, long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance)</td></tr>
+<tr class="memdesc:a53917e002fd29a5650752c65f96b353d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="#a53917e002fd29a5650752c65f96b353d">More...</a><br /></td></tr>
+<tr class="separator:a53917e002fd29a5650752c65f96b353d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3175746438646453e93e6e08e954bc8d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d">initialize</a> ()</td></tr>
+<tr class="separator:a3175746438646453e93e6e08e954bc8d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:acc0341b88143aac4ffd9bc1dcfaafa71 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">Params</a> ()</td></tr>
+<tr class="memdesc:acc0341b88143aac4ffd9bc1dcfaafa71 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">More...</a><br /></td></tr>
+<tr class="separator:acc0341b88143aac4ffd9bc1dcfaafa71 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab04617136a3bf909ef27eb97ea5ef81c inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">Params</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, long long _inc_advance)</td></tr>
+<tr class="memdesc:ab04617136a3bf909ef27eb97ea5ef81c inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">More...</a><br /></td></tr>
+<tr class="separator:ab04617136a3bf909ef27eb97ea5ef81c inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac030ea4568fa2cb6d6661df75062cd1a inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">Params</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;stride)</td></tr>
+<tr class="memdesc:ac030ea4568fa2cb6d6661df75062cd1a inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params with a stride vector.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">More...</a><br /></td></tr>
+<tr class="separator:ac030ea4568fa2cb6d6661df75062cd1a inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a802c270449da579ed8661e915d27ce60 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">initialize</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, long long _inc_advance)</td></tr>
+<tr class="memdesc:a802c270449da579ed8661e915d27ce60 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">More...</a><br /></td></tr>
+<tr class="separator:a802c270449da579ed8661e915d27ce60 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2ef70d9e13b5aa7e4a53233b153d7edd inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">initialize</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;stride)</td></tr>
+<tr class="memdesc:a2ef70d9e13b5aa7e4a53233b153d7edd inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes the parameters object from a vector of strides.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">More...</a><br /></td></tr>
+<tr class="separator:a2ef70d9e13b5aa7e4a53233b153d7edd inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a44870d45442ec45c8eaba46ab47a3ad9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">initialize</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w)</td></tr>
+<tr class="memdesc:a44870d45442ec45c8eaba46ab47a3ad9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes the parameters object from a vector of strides.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">More...</a><br /></td></tr>
+<tr class="separator:a44870d45442ec45c8eaba46ab47a3ad9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1776bf51e1e23cde6c58529be58aafb9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">initialize</a> ()</td></tr>
+<tr class="memdesc:a1776bf51e1e23cde6c58529be58aafb9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gotta have this.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">More...</a><br /></td></tr>
+<tr class="separator:a1776bf51e1e23cde6c58529be58aafb9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:a6608f7027994aaebdefd004fe94153d9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a></td></tr>
-<tr class="memdesc:a6608f7027994aaebdefd004fe94153d9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Pointer to memory.  <a href="#a6608f7027994aaebdefd004fe94153d9">More...</a><br /></td></tr>
-<tr class="separator:a6608f7027994aaebdefd004fe94153d9"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
-<tr class="memitem:ad67234ec264354a22032bb2519575dc1 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a></td></tr>
-<tr class="separator:ad67234ec264354a22032bb2519575dc1 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a58e8c883aea4cfdfa5a84c25a4704ebc inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a></td></tr>
-<tr class="separator:a58e8c883aea4cfdfa5a84c25a4704ebc inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a313984457c78eea66c980f6813047b9c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a></td></tr>
-<tr class="separator:a313984457c78eea66c980f6813047b9c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af95fa1b5102176a0fa9b17713fd48150 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a></td></tr>
-<tr class="separator:af95fa1b5102176a0fa9b17713fd48150 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aea591d4278a8338ae8b50fa0b8f3a366 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a></td></tr>
-<tr class="separator:aea591d4278a8338ae8b50fa0b8f3a366 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac6e81450a2d78555a6c2415dcc42b178 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a></td></tr>
-<tr class="separator:ac6e81450a2d78555a6c2415dcc42b178 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1187258cd4068a627e73bee0302f1fc2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a></td></tr>
-<tr class="separator:a1187258cd4068a627e73bee0302f1fc2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a388d464c35cc1bcd509d22937f38dcf6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a></td></tr>
+<tr class="memdesc:a388d464c35cc1bcd509d22937f38dcf6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Pointer to memory.  <a href="#a388d464c35cc1bcd509d22937f38dcf6">More...</a><br /></td></tr>
+<tr class="separator:a388d464c35cc1bcd509d22937f38dcf6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:a235647baff946e483dd61a2069aa01d2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a></td></tr>
+<tr class="separator:a235647baff946e483dd61a2069aa01d2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4f029a268387bd63112d9074c185c623 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a></td></tr>
+<tr class="separator:a4f029a268387bd63112d9074c185c623 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af7e7a71a9fa41cc3f6d0e5963963339d inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a></td></tr>
+<tr class="separator:af7e7a71a9fa41cc3f6d0e5963963339d inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7b4293bf8291b0383dee695a60f2e0fd inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a></td></tr>
+<tr class="separator:a7b4293bf8291b0383dee695a60f2e0fd inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a15227102466522445261b6ea65c89c06 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a></td></tr>
+<tr class="separator:a15227102466522445261b6ea65c89c06 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af0be1271cfe6d6c03a9a76ff992d8a5c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a></td></tr>
+<tr class="separator:af0be1271cfe6d6c03a9a76ff992d8a5c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6d8f1e07f286ed8d5761e2a878b807d3 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a></td></tr>
+<tr class="separator:a6d8f1e07f286ed8d5761e2a878b807d3 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
-<h2 class="groupheader">Member Function Documentation</h2>
-<a id="aeeea0f8bdee876553a4908b9b7cbaf76"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aeeea0f8bdee876553a4908b9b7cbaf76">&#9670;&nbsp;</a></span>initialize() <span class="overload">[1/4]</span></h2>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a9a1098e6c7b8c7c377031fe59a18fbf5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9a1098e6c7b8c7c377031fe59a18fbf5">&#9670;&nbsp;</a></span>Params() <span class="overload">[1/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> const &amp;&#160;</td>
-          <td class="paramname"><em>storage</em></td><td>)</td>
+          <td class="paramname"></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -168,45 +202,23 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="afd9e82df76ad35fe883b7834457242b2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#afd9e82df76ad35fe883b7834457242b2">&#9670;&nbsp;</a></span>initialize() <span class="overload">[2/4]</span></h2>
+<a id="a88a90437f11d029ef109ebb4f828f282"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a88a90437f11d029ef109ebb4f828f282">&#9670;&nbsp;</a></span>Params() <span class="overload">[2/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> const *&#160;</td>
-          <td class="paramname"><em>ptr</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>ptr</em></td><td>)</td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
-          <td class="paramname"><em>stride_d</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
-          <td class="paramname"><em>stride_h</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
-          <td class="paramname"><em>stride_w</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
         </tr>
       </table>
   </td>
@@ -218,63 +230,91 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="aa3922946bb0da0c0040dec44aa389ec1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa3922946bb0da0c0040dec44aa389ec1">&#9670;&nbsp;</a></span>initialize() <span class="overload">[3/4]</span></h2>
+<a id="a2de32338814d0554b05ca985dbb7e192"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2de32338814d0554b05ca985dbb7e192">&#9670;&nbsp;</a></span>Params() <span class="overload">[3/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> const *&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a78380e92553010656516400d51e14c7e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a78380e92553010656516400d51e14c7e">&#9670;&nbsp;</a></span>Params() <span class="overload">[4/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *&#160;</td>
           <td class="paramname"><em>ptr</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype">long long&#160;</td>
           <td class="paramname"><em>_stride_d</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_stride_h</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_stride_w</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype">long long&#160;</td>
           <td class="paramname"><em>_inc_d</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_inc_h</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_inc_w</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_inc_advance</em>&#160;</td>
         </tr>
         <tr>
@@ -292,19 +332,278 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 
 </div>
 </div>
-<a id="aebaecd0f971245ffc5a50fe5f7a9b4e8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aebaecd0f971245ffc5a50fe5f7a9b4e8">&#9670;&nbsp;</a></span>initialize() <span class="overload">[4/4]</span></h2>
+<a id="a8c9856709d3392d8b70dce9a13fa529a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8c9856709d3392d8b70dce9a13fa529a">&#9670;&nbsp;</a></span>Params() <span class="overload">[5/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>stride_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>stride_h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>stride_w</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ac22d9229f3f8993d52b808dced173803"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac22d9229f3f8993d52b808dced173803">&#9670;&nbsp;</a></span>initialize() <span class="overload">[1/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a61b898051d0397b013407a4c90409aa0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a61b898051d0397b013407a4c90409aa0">&#9670;&nbsp;</a></span>initialize() <span class="overload">[2/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a> const &amp;&#160;</td>
+          <td class="paramname"><em>storage</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8869188d1c3b867fe6389aadf04837bf"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8869188d1c3b867fe6389aadf04837bf">&#9670;&nbsp;</a></span>initialize() <span class="overload">[3/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>ptr</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9a40662ff01a14e0616ce1a0fbb70662"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9a40662ff01a14e0616ce1a0fbb70662">&#9670;&nbsp;</a></span>initialize() <span class="overload">[4/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>stride_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>stride_h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>stride_w</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a53917e002fd29a5650752c65f96b353d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a53917e002fd29a5650752c65f96b353d">&#9670;&nbsp;</a></span>initialize() <span class="overload">[5/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_stride_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_stride_h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_stride_w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_inc_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_inc_h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_inc_w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_inc_advance</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3175746438646453e93e6e08e954bc8d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3175746438646453e93e6e08e954bc8d">&#9670;&nbsp;</a></span>initialize() <span class="overload">[6/6]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -320,16 +619,16 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="a6608f7027994aaebdefd004fe94153d9"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6608f7027994aaebdefd004fe94153d9">&#9670;&nbsp;</a></span>pointer</h2>
+<a id="a388d464c35cc1bcd509d22937f38dcf6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a388d464c35cc1bcd509d22937f38dcf6">&#9670;&nbsp;</a></span>pointer</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_ = int, typename FragmentElement_ = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_ = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> const* <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::pointer</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const* <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::pointer</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -342,7 +641,7 @@ template&lt;typename Traits_, typename Scalar_, IteratorAdvance::Kind Advance_ =
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileLoadIterator_1_1Params.png b/docs/structcutlass_1_1TileLoadIterator_1_1Params.png
index 9993389178ac171e0b46840981fa7181857144c3..831398c27b0254c1d744e63da3d563eb6bcd55a0 100644
GIT binary patch
literal 3444
zcmd^?XH-*L7RLklqSB>_fD}zYAXMof@SY$9R3rqrbPT;K9ZbN&lU|GvIvF*<lM)OJ
zfdFEGfPe-KN`D|qG17~n!vvl6-j|tq^KCxNS?k`j&)xf!b=JPW^FPT~E}QXiigAKK
zARf562?7M-fU)ePBOI)^x+cDxRf%4?h&0{b-)EUi-@cT+jL2eH-=F8tp97?5J67{Z
zIO4Jmh!u2DK6E41S>tiQO@2m3v&|RJM~W-)nXVT(RIbN&g?!z_8h^ZA@;>B#N%p*~
zD1={+?$#gS@}`Mc=`awXIom|ktipOiy3Dcn2%M>=*fhuqc!4{K)r6de3&KR;>MXC{
zZR#ob1(xrUXp&b9H@pHM<6Hb2OY?sxThO!HI_GV2yz%-L$Fm5>bt8Wt#VoGmboq>=
zM8oL`;}fIW=YF?`ZS?V0a%T|=FpSj9jbUL!C{EohICU!0-!}EGctBm$*rZX4*GS~q
z$#s?eCIG^KzD&hfz_4oqD*7#ppMbpzz;z`wc?vOo{{2XZ6K{L(r)!<GYR|dUb#(zF
z^3W<eec9Tn5$2){c|6g*>8rYRB5Cm=^RpJ?La`~_&xBMolCd%ARPOxvqPC>uY_D`N
zFPKllM2fvtN*3>17i$n2m$~c+_iK4Ek)!DH3PL?LS7v;Uq2;1p=BeNNAqCnp&2(Gt
z)D)*8f`*hwm34g*N3a6K<WJJrY@J&2lejG$!6eCtDd@dIAZYNOBm`BjHQ8jBIq@-$
zV2q*EV-=>34n=2xpwK|F9YQSRT3$QdJB6T1o8f~#6Y9y4!>E^4CWOt4U;zZtMbKUZ
zS6nJ$$!Srv`*uFRp({G~-OwUZ{y~$yOFZC4e?f05YV#2P73g-F@qeqYV8H!B!}q#R
z1dPnrzB#B-m4@LTn^TR#JqBpgV_w%A^!h&+rFqr5RL-D=E)}07i&(boP3(Tjix>{?
zXb8F_aERn-=|M@DbuHE@GDnClH`?o_6xO^-Xe29F8k?sI*h6VK9$y~#Ml7FW?aZ5X
zZC@)uXp6aK%bMni;!c}SQgx%Yl6*QOD@z$uTYAlkD$sp(#JPZm`00_b>uH?lj>R$p
z7WBl-YQUE9a3CiXb|Y%s0rFTTrPTM<L<e<hMpAaRWGdM0UFQo1yEdRGpRTQAFjlUh
zi+$P1URc0nS|KDzb!+y&4bxj;$x~ON$3^wiwNNK)`({uK&!I7b-o79yynZeNAc9@B
z_im-j<*N%=iZ^wi*NWK_rhmDxVD~gQuQ^r7tfo&}|02rotSMbH)G%_>&T^^*All$j
zo4=zYokr3dI3(jwx^{zO;_B+V1`FcHHF`@he^)b%-ScH!vo>^46^|;41FPvd1))m<
z!pIwt*D@y8J=P+s{7_jLV^AbI(+;+&tn1zxz_f}$Q=WBftWEfhFRGG9MQfK=@y#9|
z?h|ljUppWa>^ygzq6mEJE;mXB?qOIDM~JEvnv0h;yPe$){C0fQ79koErSr8kz9S#P
zvq3}+DZC%!g)n&W!w~s2tHM{}-Xn|otr1ypuN*>dbaR`mG-a@5jl0tyzNLcRrk#S1
z-<&QTv*mww$`r!Tihn*4y!7VyJ%Y$z|Km@9A2>KFh59EVyj=!9RLwTwK%zIFrMQ8>
z&sm08>Q4ui+Os$ZrGqcrBml&HlTCE>fpFz_&oL3Mn{28e8<;SN!yP0Gzz(7=KKUM%
z=S~8Nf;d!PpjZ)L_uEu<cM$jULqCQ*`lBNYKL5Lp@h5v~VcrfnDy*kA&&vTP_I)kf
z#=rijm2$VQsOcViSGzlD+xBgwVr!Ok|A37Vl{3t3VSJ@nC$X@($A(=fJom6DqMghA
z<>Ix4!jc6=ksZH8TQKPToTVGOeSo+mPs-L^p`uQpbypGS8#9;o9s%Sa?eng9fxmq;
zC4pK@qI0a0fBFb@joh%19Pe_x*&g6Z^rU2O@_%EF;5e4+be#LwC^Lg=Kz+`AOt6aD
z@+0hg$=#W+J>14^IjisDTiT7$KDAN}M+*xpv%$9kT96r9xwm;r(O#i1J@MSNfo10G
zzyTg_$0isRAK-C?L^0g07cu|L!`oX~cI9=6QQ2fpF9@1@M@zGh;z&vuFmU>L+w9A+
zpJBRuvHH~%kFvZs*cRE8J0M8LF7@0)jC2}*@0=XoV3_TbPIwl%o~{@&v>jkD`7t7w
z{nL>T54qyQ9_~QYI=usKX^eeTO@<oDWp!-sJebTyQC1+)j}d2!W?#=|P09}tlNGso
zXo!^3qvnRzoIt^Rv;DJJ;0)r9_({$qr}cVO)S3qcNl5MH$VBkoWcGPY9>-CKlZg{5
z3Pa>snxiy}Ew78c6mWHvD2LJNjBgu_ZD%z5_9#H4jZb1VHPqFp)NL-oZ(=B{IolsA
zodm6s?14J3uSm79`?a5Tnfgs1Ek4liC7y(U*+YpBk<n)yUC?~e8NRK&@v#-HZyU;M
zZZCN!x=ctJo)4rx^^^V=Ts(0`-_nK_5{c6qd{jQG;j~tV$naWR(C0EfFJ$?Sy{3@r
zwiuIFbpzLYXDRnP6S)Y>;Ka^tB=qo+&zyn&!y`u08G{a6ib!4Yx%zc^F^}?h7hqE^
zho`+!^1+DW{bZoYG13fX&mqMbHyMSMKTQgMplE=+YH&l!7?ss*TO&Tbz<zzLX4^Xv
z4hv#COuV;Bdh_>N$c1F+G?TLT#eMq^7*a4{;k9*wu6Hv;I}*_7J{tSLk%}>UDerDM
zu8hwatB^aQ#noDdz4f|IXn|?|hmC4mdi@&K7G{eA3aw^}ICQSW6aKyFgwEXU%5<yv
z>Rlt9G$rl3fjc`h3&1y!V?l-Z{YeY**^O!d)GCA5+dDqG=_Tmb7QP-(hOgdRS;sWD
zS*z@xrGda`ds3kAS889pzaW1{`K3voy7~2s<9e?Mwd^hJBPX@kx~S8oK00<BJI7lw
zK5QFc4eL1jw=4#Nf>#eqEP(fK8`S?71Y(g7=cV>10<!;~$j8!zEZ~0&`84oDB<`lV
z=di@!f&Q}vVBf_e{m{QXMqWOX!A+?_7)B)YjyXLKL#<b+8K+r~eDP_>N5yT!%Q7g<
z4GVS_^srbt>{<;=YSPb1%9cfD2)muaC5nM7GrKmt>X&+`D|FUT2Hycl&d|Nn46=Gl
zFJ>nSBbnN^?$br9*Wc3uqCRXk`mU2z1}}$6PN_v)ZXdFQnJQ&g82Ill#|-Pbz!7b6
zSmsJ^`?a|7Vk48;PG$*S0e4oj6w0k6mbSEeI+d<Mk$K%;dO31P$$3$C03Ah(v_uGi
zNks}zMQq0))O#8I_*1sUWO-g1{t*;zl#Ykt2>Ai0`X?UODx`CVs!ayTWzIF-Gey`J
zxIm!8f_&|C$11@F{i_VwF0YWR8Mmp;cp_p?lQgID^jwrpxm3NHXRH!#vxy8Ymw4@z
z@krtXkOYOr2+c3V4k3js$$(dg3QkA@ejReFsN!)8&n0tu)Qp=zk1c26v;e&<P^=ob
zFx!EWFR-qlJq550KE<UJ<cL-3q>@!$T&2Ec{DNVJ5t*{%Ns`EE=p8qF!?blorul|7
zDOc%mG2cey2mT5Wg#xi;c{UCbk}+Pw*ijT!AcR`M>d(Ws7Iu&%bjvbxDf7^vp;Xw7
z;5ob*&UxIj$GvDfaaNh{>br^g_2V+y>x?Cr5}smcX@DHg!v^*>w_&vjLp~gV_vR!K
zc<eD0<$}fjZcA(&r;!~?#B&;by9K2#XFA(pTP0JWwxRH?WVF!!xRG{9Ocf5|K{DrT
w%a>tg7)vGmRet?(71`kL`STLPO4$0z_?VPm-U1wLY9LmDn_e~{{^EZ7ALpneCIA2c

literal 3293
zcmd6qc{o&k8^=ea)D&eKI~hu7Oq52JJd{RuQV7{e24l_GdT0u7Ga4!pdTQ)j#0<uo
zEwYqthOs8=%-FMy<sEwdc>j3c_s{ow&vl)1e&=`H_kHf)IludJeeW0(BfS&HgpUCL
zfD`bWx@G_XJCHSgc9flU4Re1h%({V03@oni?d`FKi@#<vKL^CKMh9nIUEST{U`y8H
zQGYWda{$X||LAM8xCj6MAHsFDErQt?spEk|`6sUvvE(+U*0Q0a2$)A4rDl(EGigJJ
z0RK2DHVdIu7PeLvdX^N@)Rgmai8sy8z*lgN@pxTa=Gi7mcnsLkI93~X8lIfS7X_BV
zsc5i66>4>GXI?Q{ii8m!uEYYIf17W!OVJ;nu-r(&czlW|>B4+X;O3W~AH1}yz_Zcm
zKJzK!^T!2-LKaCFIL?XayYgaQY$p-)S+ra<<!cUavo7w8<0nD!3WY~zKq?_lsy2L+
z$x6W{NswvG%7OTdn-u>N_p_YeTN<5PwZJjZwyR03Ek$|LhKl|2pv)iD^ORb`zz=(;
zP>cS&jF4#XrQWv$P6mwK_ocHYVgk`?mG~3QuQL$X*fKgOWA9uE8xIQOGK1Y;th>=G
zJ4R9-`Oq=9^krA0*;A&%msY=^Cfj;qBKvq_6ym!~%B@UfpgiY_HC3w~63`zjHCSSs
zYis8ElzK0d98-4+juf>Lx(ji;g==W+Nq2JH#)DNc>OoX%j{v*qOe*i&<6+li1{`u9
z+Xw|a=U;{e5-f2dMDguHC*03-U7q@Z=g`SV!b)I*?E|F4XE|Tr3V82oMG<m@HlCuY
zSTA=AEnMtRN9A&ur+(1X%$Mkd5<917C^sb0i~V+t9qoE9oid=cMNWAA+T)FI)f4je
z64AU+_3*{37`R!(NGM5xVMz^{OHee(tlYW>B;|AuI6^7G;#m^a5Tm%x4MM>qXK7Av
z4}~Ls!-MeWdbpvF^ZiICRq~gla)REC$MFKN2TxXGE~-np-(J%I4>)wJtGa6d)pTfK
ze9_l{<b#Fu7O!JQ?!XaO*pmEbs{O~+`J?3Ay!_nNbohp|J-1T(9vY6D02#C<V_u7a
zcm7Y1$5Gy+Lg1YGSSfdhspk60F5@d!s>iNLC@CVPAMQynu*>MBj(?6C4KTooT=FT*
zK}4|Ld{rmHzt?ij#R&LRpE=d%@$pncwy>sv&RNo$?2A3_#&7(!@{URcRmR%W@9}El
zRf{))UNi4`t6G<BewmwzMZJv+=`#VwIqMZQ+yx3ABtEpbDUd8dHuo@XIWsWcxY(l}
zXp@qK5+qi)md_!JLI;G?ykfMl({9+BL177vqB4KcQ&W*p&!9v<PU!i9Zt$A{x}xUM
zPh2mC-MiHKRiHkFK|&8kKk!G@#&J`Yl6TC-B-Y6wly@3IYjH42Yl1TK=xgjq6<9er
z*CXMbtT`7#o)aFT!&w}UhZ=j~oSVIP5e>8Rs7#51@OoRBH%sTEUel|FP;lX;LPv`J
zpk1fT?6CvG9@%a5CkENT9{CfG)bCcb<Ef%yhOg4^D#9Z^Q-fGh*^^&y*&JTrmpcQ8
zOz(9U|6RdyoN#@xM~E4aRqoxZco10b1%4I|-7o!~6-9J_E!o+Ye94L&kP3?A7)xJ1
z91j2kloK2QHvz8GH2FRjfeegd*(BMLQoR-N!hq9}6>uoagiG#lB*%SLTmV-cD=cfC
z6_qvLbKuIt$-blUfnypU`?W(#8giWfGl#vmE>^FctzOAky>fXYBoN8LO8@nL%0lSb
zIBHoJ{B>>O&Iz)2-jA*c9gOk?R9}H6akMD7@ccgFPF8aqow>lR1b!x1$E7tsq^dC_
zs8GI@Z4Bcaqj(L4;!%29GH9hEb_!@y1HhSZEq{B6I?`$x4<dL8>WHJbczn!(0HRXS
za(XP=n81>QV9Dt^U-=PPq1@$~X+lYD7X!i=p{h+^vRM;N3BTj@%PpPiiQAFKO{TfJ
z1YBbOX5u%P<_&@J+<{L`Tz2*Ids*(-7tuzL*8KHz7-?AZ#ozC<c=_B&_|C@T=h=oP
z*u|^Z%Xux*5-Cm#H0!$OdDyK)r$~`zQ^99PhTk{lu5_mk$JSR_%1tsLnav{5ji7l(
z=@jP8{r+2pMjRNx70gb(Mt)cwkk>c@vpzJ)M!&K=<mH*cKT@Jq1gk$%MB=;uG>6l6
zLj=2>KoPxabG+R5muWf@SZA6>PNbUvFL4_b-mpvlbZb5t99Us-_Q9(ssZxA8ybcSd
zq8;VT)x4)q>Mmu!Fpm^k^GV0J38Ey?Gp+$dk2>xu(Oj2r@AZF)ptZ6ssD<*LY^sHt
zbLJQ}6?zBpYd4~-Agg6S8Zx}=2c>7~yTvt`{Fv?j8hDZTakc3JqC=Xsm_8?160Luw
zBPUX%Kf@ZKHce&GjqvzrlZm`DU&dJUyW0cn0Q$$NiA7S@+||F~h86z>YXPX~$ClO{
z`ZsKImZSp>VKo$?L2_KWY<7wE?6FCKwUHWSfXZDchhqLn`|kQ6*IC*Pwi)*3KSdmv
z5|1R#!RCO|zrXx%t^uw-beq9qklhqdc0QFNqp0Vg&rD!@YK&Al{O2A!)W2yV7GxkV
z!4={^-+CO|`0dGsD^katW^Dl&?au4f56+<v(`W2e1sXO#XikF0&|SoDp^zt@jvp&*
z`X$8N*ZmiM5LAWk*v>PmN!zF-c{GMZjb`q2cOD7=_08vTD?6M_ieg}Xv`XH{xGfB6
zclBP<PBMH(zk%v6&WyqNRev>MiWh*kZA0q}Hbl6wSZ3by>LSl5c8CV+4?IsJ=FfDn
zyQ<vok<~WLJUwIy1bBZjpRXP3BpQ~V$RaJg2`}B6Twv~FY`c#hdI$PYhLO2$>~*L;
zcrbd@hp>}8dkgc{!YI<FN-~%%Mhc=73y&EGGdlr`oGPZfHrf%_V*yof_inZPcd&F3
zL9bk_aKEeE#gRpyh&I7%hvEV42ESQVRAjLa9oPYM0&B|RAFzNnCA&{0FrM%Ki&p;%
z&~3l|0NVr>l_Ofozm?h+x5G=8Kx2ur*Z&Ran+69`ZTHzEQxDfnm!CUd8@?h<_}+z3
zuHRmpFc9;*<2_uEh;Lbadb2xgU-Tu}^JWEN_#vknyb0Wv5(#TgrHhk}<z?2mkvG^=
zI*Q*%;bkwshs`t7x7Ld(p%57|*^XITUum7ic)wE`RzGFvI~kN~Kp8lXekWklCsww#
zL88d%v2@5h9JQ&}YF87qo8lg3u&}`gP3%n&P%d>>YF{5!@ZDQFyz?-XrrU?`SxqzV
zAYP;@`odisO)TyTUeAJ;G*tAX#&h+ly_~yDcX&5x1@7pRoXtzXq@6$8T_;I4unU}B
zz#_Uwa#}hr;6w{r*rBBY6OD9rAl4U25xKXixVq<;xH#)bu}3Z})^s8mBNksxfYY==
z;W=cxH|!qlq5@Bp)v}F0iT23c5;)?Rm|6|G=K~%X=P<E2m3mo43ck>MHtw%iC7H0K
z(xY+V^62lC#h^c3f8=^XID-a1bbh;+%Xq4dM2lDMHKqQwPQos=s5~`3-Czo1Zqs|*
z?K7^|f4po=e#4(Jb`pCsL5@equvk`3B!;_@CnJbvzS#jfhW9Z9E<MJrB0^(9;UVk0
ziBwPTM<LsR>PRnoOOS`qKT0CX3)Aikh-K}BDpe4TQ@q3b{W)J_Qb8C)!Z~tJTLAOn
z<vB&yL(uXQW#PSXTcon(7x<t_r$$M5&_?2sL_Du-MJ9L$W*+;Or6YVxw<d1AtE<UI
zJWs~Mb&3w$TxJP^5+|brB>+EA{rU$Y!R&WKfIHZ1i5Ad&TBYpozJb=b%^g#CnMXOJ
Tpo7(m0N~e+bPNBu|K~pemf;i)

diff --git a/docs/structcutlass_1_1TileLoadStream-members.html b/docs/structcutlass_1_1TileLoadStream-members.html
new file mode 100644
index 000000000..463ff2144
--- /dev/null
+++ b/docs/structcutlass_1_1TileLoadStream-members.html
@@ -0,0 +1,106 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">commit</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23">copy</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">fetched_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">fragment</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">intermediate_fragment</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3">TileLoadStream</a>(Params const &amp;_params, TensorRef const &amp;_ref)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7">TileLoadStream</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">transformed_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">transformer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileLoadStream.html b/docs/structcutlass_1_1TileLoadStream.html
new file mode 100644
index 000000000..ca065a3d7
--- /dev/null
+++ b/docs/structcutlass_1_1TileLoadStream.html
@@ -0,0 +1,525 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1TileLoadStream-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Generic stream for loading and transforming fragments.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__stream_8h_source.html">tile_stream.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1TileLoadStream.png" usemap="#cutlass::TileLoadStream_3C_20Iterator_5F_2C_20Transformer_5F_20_3E_map" alt=""/>
+  <map id="cutlass::TileLoadStream_3C_20Iterator_5F_2C_20Transformer_5F_20_3E_map" name="cutlass::TileLoadStream_3C_20Iterator_5F_2C_20Transformer_5F_20_3E_map">
+<area href="structcutlass_1_1PredicatedTileLoadStream.html" title="Generic stream for loading and transforming fragments. " alt="cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;" shape="rect" coords="0,56,475,80"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object used to construct generic load stream.  <a href="structcutlass_1_1TileLoadStream_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html">PredicateVector</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Empty predicate vector struct.  <a href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a21234ea1d4e0ff5cd599c763035b967b"><td class="memItemLeft" align="right" valign="top">typedef Iterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a></td></tr>
+<tr class="memdesc:a21234ea1d4e0ff5cd599c763035b967b"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1TileLoadIterator.html" title="An iterator implementing Tile Load Iterator Concept for loading a tile from memory. ">TileLoadIterator</a>.  <a href="#a21234ea1d4e0ff5cd599c763035b967b">More...</a><br /></td></tr>
+<tr class="separator:a21234ea1d4e0ff5cd599c763035b967b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad531770d336b2541c303c19148ef5cd7"><td class="memItemLeft" align="right" valign="top">typedef Transformer_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a></td></tr>
+<tr class="memdesc:ad531770d336b2541c303c19148ef5cd7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformer.  <a href="#ad531770d336b2541c303c19148ef5cd7">More...</a><br /></td></tr>
+<tr class="separator:ad531770d336b2541c303c19148ef5cd7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea86cbd64781caabeee293cfa2070e81"><td class="memItemLeft" align="right" valign="top">typedef Iterator::Fragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a></td></tr>
+<tr class="memdesc:aea86cbd64781caabeee293cfa2070e81"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> fetched from source memory.  <a href="#aea86cbd64781caabeee293cfa2070e81">More...</a><br /></td></tr>
+<tr class="separator:aea86cbd64781caabeee293cfa2070e81"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a94cde8bcdcedc934cc14de19e43375d1"><td class="memItemLeft" align="right" valign="top">typedef Transformer::OutputFragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a></td></tr>
+<tr class="memdesc:a94cde8bcdcedc934cc14de19e43375d1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Output fragment from transformer.  <a href="#a94cde8bcdcedc934cc14de19e43375d1">More...</a><br /></td></tr>
+<tr class="separator:a94cde8bcdcedc934cc14de19e43375d1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8c9256c5cdd1fd129dbcc6536375aca7"><td class="memItemLeft" align="right" valign="top">typedef Iterator::TensorRef&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a></td></tr>
+<tr class="memdesc:a8c9256c5cdd1fd129dbcc6536375aca7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference expected by the stream.  <a href="#a8c9256c5cdd1fd129dbcc6536375aca7">More...</a><br /></td></tr>
+<tr class="separator:a8c9256c5cdd1fd129dbcc6536375aca7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a90ca6bbd882e39b5624ee0cd17e0d652"><td class="memItemLeft" align="right" valign="top">typedef Iterator::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">Index</a></td></tr>
+<tr class="memdesc:a90ca6bbd882e39b5624ee0cd17e0d652"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#a90ca6bbd882e39b5624ee0cd17e0d652">More...</a><br /></td></tr>
+<tr class="separator:a90ca6bbd882e39b5624ee0cd17e0d652"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a40a9b1a87cda0f3eb6f4b3e73a4fade3"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3">TileLoadStream</a> (<a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a> const &amp;_ref)</td></tr>
+<tr class="memdesc:a40a9b1a87cda0f3eb6f4b3e73a4fade3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a40a9b1a87cda0f3eb6f4b3e73a4fade3">More...</a><br /></td></tr>
+<tr class="separator:a40a9b1a87cda0f3eb6f4b3e73a4fade3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6b8b65772d95c30d29e7833348d06ba7"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7">TileLoadStream</a> (<a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;threadblock_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:a6b8b65772d95c30d29e7833348d06ba7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a6b8b65772d95c30d29e7833348d06ba7">More...</a><br /></td></tr>
+<tr class="separator:a6b8b65772d95c30d29e7833348d06ba7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aed4e6a6f1bc125ea40ae04fb120d6a23"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23">copy</a> ()</td></tr>
+<tr class="memdesc:aed4e6a6f1bc125ea40ae04fb120d6a23"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a tile and increments the iterator.  <a href="#aed4e6a6f1bc125ea40ae04fb120d6a23">More...</a><br /></td></tr>
+<tr class="separator:aed4e6a6f1bc125ea40ae04fb120d6a23"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac004fc2e078591ced5d4e5521dfd8627"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">commit</a> ()</td></tr>
+<tr class="memdesc:ac004fc2e078591ced5d4e5521dfd8627"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commits the fetched fragment and applies a transformation.  <a href="#ac004fc2e078591ced5d4e5521dfd8627">More...</a><br /></td></tr>
+<tr class="separator:ac004fc2e078591ced5d4e5521dfd8627"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af2727fc0ddeffd1cdaef751140aa6093"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">intermediate_fragment</a> ()</td></tr>
+<tr class="memdesc:af2727fc0ddeffd1cdaef751140aa6093"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the loaded, transformed fragment.  <a href="#af2727fc0ddeffd1cdaef751140aa6093">More...</a><br /></td></tr>
+<tr class="separator:af2727fc0ddeffd1cdaef751140aa6093"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5b7161b2b97100c13c2c5009edd2a6be"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">fragment</a> ()</td></tr>
+<tr class="memdesc:a5b7161b2b97100c13c2c5009edd2a6be"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the loaded, transformed fragment.  <a href="#a5b7161b2b97100c13c2c5009edd2a6be">More...</a><br /></td></tr>
+<tr class="separator:a5b7161b2b97100c13c2c5009edd2a6be"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:ab6d8716c166d071615f4e78d9ac6efb8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a></td></tr>
+<tr class="memdesc:ab6d8716c166d071615f4e78d9ac6efb8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterator to load tiles.  <a href="#ab6d8716c166d071615f4e78d9ac6efb8">More...</a><br /></td></tr>
+<tr class="separator:ab6d8716c166d071615f4e78d9ac6efb8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a89b0f92764b5492a8d1de2c1ada60869"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">fetched_fragment</a></td></tr>
+<tr class="memdesc:a89b0f92764b5492a8d1de2c1ada60869"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> loaded via iterator.  <a href="#a89b0f92764b5492a8d1de2c1ada60869">More...</a><br /></td></tr>
+<tr class="separator:a89b0f92764b5492a8d1de2c1ada60869"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54399d7a42c1330ef0e756949483c552"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">transformer</a></td></tr>
+<tr class="memdesc:a54399d7a42c1330ef0e756949483c552"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformation applied to fragments.  <a href="#a54399d7a42c1330ef0e756949483c552">More...</a><br /></td></tr>
+<tr class="separator:a54399d7a42c1330ef0e756949483c552"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac61d45d91faf9d060509cf1e5c34fe01"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">transformed_fragment</a></td></tr>
+<tr class="memdesc:ac61d45d91faf9d060509cf1e5c34fe01"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformed fragment from transformer.  <a href="#ac61d45d91faf9d060509cf1e5c34fe01">More...</a><br /></td></tr>
+<tr class="separator:ac61d45d91faf9d060509cf1e5c34fe01"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="aea86cbd64781caabeee293cfa2070e81"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea86cbd64781caabeee293cfa2070e81">&#9670;&nbsp;</a></span>Fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator::Fragment <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a90ca6bbd882e39b5624ee0cd17e0d652"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a90ca6bbd882e39b5624ee0cd17e0d652">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator::Index <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a21234ea1d4e0ff5cd599c763035b967b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a21234ea1d4e0ff5cd599c763035b967b">&#9670;&nbsp;</a></span>Iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator_ <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8c9256c5cdd1fd129dbcc6536375aca7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8c9256c5cdd1fd129dbcc6536375aca7">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator::TensorRef <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a94cde8bcdcedc934cc14de19e43375d1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a94cde8bcdcedc934cc14de19e43375d1">&#9670;&nbsp;</a></span>TransformedFragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Transformer::OutputFragment <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad531770d336b2541c303c19148ef5cd7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad531770d336b2541c303c19148ef5cd7">&#9670;&nbsp;</a></span>Transformer</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Transformer_ <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a40a9b1a87cda0f3eb6f4b3e73a4fade3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a40a9b1a87cda0f3eb6f4b3e73a4fade3">&#9670;&nbsp;</a></span>TileLoadStream() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_ref</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6b8b65772d95c30d29e7833348d06ba7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6b8b65772d95c30d29e7833348d06ba7">&#9670;&nbsp;</a></span>TileLoadStream() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>threadblock_offset</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;0,&#160;0)</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ac004fc2e078591ced5d4e5521dfd8627"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac004fc2e078591ced5d4e5521dfd8627">&#9670;&nbsp;</a></span>commit()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::commit </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aed4e6a6f1bc125ea40ae04fb120d6a23"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aed4e6a6f1bc125ea40ae04fb120d6a23">&#9670;&nbsp;</a></span>copy()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::copy </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5b7161b2b97100c13c2c5009edd2a6be"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5b7161b2b97100c13c2c5009edd2a6be">&#9670;&nbsp;</a></span>fragment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a>&amp; <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::fragment </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af2727fc0ddeffd1cdaef751140aa6093"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af2727fc0ddeffd1cdaef751140aa6093">&#9670;&nbsp;</a></span>intermediate_fragment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a>&amp; <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::intermediate_fragment </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a89b0f92764b5492a8d1de2c1ada60869"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a89b0f92764b5492a8d1de2c1ada60869">&#9670;&nbsp;</a></span>fetched_fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a> <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::fetched_fragment</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab6d8716c166d071615f4e78d9ac6efb8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab6d8716c166d071615f4e78d9ac6efb8">&#9670;&nbsp;</a></span>iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a> <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::iterator</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac61d45d91faf9d060509cf1e5c34fe01"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac61d45d91faf9d060509cf1e5c34fe01">&#9670;&nbsp;</a></span>transformed_fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a> <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::transformed_fragment</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a54399d7a42c1330ef0e756949483c552"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a54399d7a42c1330ef0e756949483c552">&#9670;&nbsp;</a></span>transformer</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a> <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::transformer</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__stream_8h_source.html">tile_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileLoadStream.png b/docs/structcutlass_1_1TileLoadStream.png
new file mode 100644
index 0000000000000000000000000000000000000000..3f78724914554a24b7c05a1165f6a7bd9b6f9630
GIT binary patch
literal 1352
zcmb7^YfzF|7{_1KGVdQ+YlX;aG95Q#yXd-7G>Y23rC^GdDW(zXDB1-P3^mu*OKnAq
zrWGn%c?nHG)R$e9qPDG+!rD?$Qp~gqimN7G6ZduZOJDl1XXZKQe`fykoO$N=pK~^Z
zu*c3CX$=5?9r%NPC;%X|unt*a4)5`m7y*2I9TG$eSX^9$<(Tn(^?k-ASp8cHh2mfX
zD+0c*NDC!|0kCOlb+(hX0f2=X^!FvP5Qg&Mi*MH1=Itg_W-RXM^RhzFLCm!@Ci%dc
z3;8)07UDjZ7Kd6_6?3t_0Dge#D;grxU1K&w5-%GQ#M<<S@u}>OjDamFyIYcECQ}?a
zJ89*&lvBBM)NCR^DbKc;X*Ib(;rV<@OEx=krQ4fei1XU~6Gc{*BDl?~t9P6JeW8|T
zbNGeCGh?KUXI;fe<=tBCY1d!KB+D^7y%>!^pf-BwZK}JaxTARC&so9#9A#Rw5>1@l
zK2!6gi&j^T$3|_dn|kGOsOYZf7Sb>BIjuGUar@l$BYc0SuB3F__PHO|nyjGZ!B^d)
z^BLHqQKbxUf8FSYtE+UEu5_4niXWvoT*(RKoR1+)i^TF~0e2#jcn72JE@{IlGxkL`
z8TAi+8?tshUESS-w-p^2Kip!bKe4s<?mehh2Bq<2Xs5(|)dhcHQJpDaDHw5c!F$fL
z*}vzDcrp)%!AW@*<jQ;-cosdFKGkP3(^{@d2t>C^rz@HYB#3Ty{KK$Ahn9ykQ?&_=
z-&5SwL*vGSFUe&z_HZ$ypcl*BrM=8Ew6O<*h{9=}Wn#1xDAk{YfW-#WyAg}1973{G
z!!uWi+)&GAe#-U8Aufvo_|_1BbNn0>O8Xzf?+}@sY#8Gxj4@jO&b8l+1%o^;K=tI<
z^oQJArKro@{Dl@vtYJgV7vK0_hAby7HL^tXyhE~CsV)rQ`f&$??nQ9nXzk^~BY+cv
z*l$3bXB@9<J&3QGCvuS&pzgCx2D!m2xkfeWoSu+i$t7_<j5}*s7~!sUpq??h)fLZu
z=(FGk(&cUGC-q=VJeE)4Ni%Z|Q76igSuDNfn9GM?N2toXtEb&DY?Qz_b8!uAh?%LQ
zp9&h}#OGB}lO=tTQ9ExtogT8_>Kg)%Z(a%@S3e#TZ4B>Kd0Q<GUL@HoO_b^p%<Bqd
zGmUcw6d?B^Icw@8J5z@ZO|-h^Kk!Fg@u%m{Wm4M>+aWDJqLKTAh227*^PQ+(>i})q
z;Bq<c&Ewaq^AU?EXj2RIMkT~9byxSQ)+=f>T~xCDtJ;>lYSE62s~z?_t$Lt`$v|E6
zR#jNB19`?k&VBER<0>!bQ<@?rTBoJ*&QSV<Vw%#Gj(<A0Dd3Snk4haCHDoo3T{U;m
zYVmMudsqIh)@LpQKHi{FLqE|DxtHN4eXlbdcbC1_ryso;9Lm38s=O&P{5+Nci5?hH
zH0@NEanNf3DzE5FnU~r2X+e8o=CM6A%K~i1F<rvEo}Fy7V8x+B4o9vyq2<!)4Z6Dq
z;uP*cp>0gXtG%`5#s^vPcG8&V&wS>RrHwuT!hOTXJaxD{M#*s9OLV+qQvO@JP$D@u
z@{*!0k`~gIl0AJgT51k)C+mH{OB>0*5?P;;pk(Rer~ce6YL~T*`@wks-p`}qNONhc
s$*tcwOA=q+$d@&cOQ=>JN(t+Qv&cM_5H7E{1Alt}7(nnB`o-q{1I$C6sQ>@~

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1TileLoadStream_1_1Params-members.html b/docs/structcutlass_1_1TileLoadStream_1_1Params-members.html
new file mode 100644
index 000000000..bafa4e14a
--- /dev/null
+++ b/docs/structcutlass_1_1TileLoadStream_1_1Params-members.html
@@ -0,0 +1,93 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57">iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a90772ac34f8c49f049eb62fada0a2165">Params</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a50f136516b139f011939015c8c417ddd">Params</a>(typename Iterator::Params const &amp;_iterator)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileLoadStream_1_1Params.html b/docs/structcutlass_1_1TileLoadStream_1_1Params.html
new file mode 100644
index 000000000..34eec4d30
--- /dev/null
+++ b/docs/structcutlass_1_1TileLoadStream_1_1Params.html
@@ -0,0 +1,188 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1TileLoadStream_1_1Params-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Parameters object used to construct generic load stream.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__stream_8h_source.html">tile_stream.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a90772ac34f8c49f049eb62fada0a2165"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a90772ac34f8c49f049eb62fada0a2165">Params</a> ()</td></tr>
+<tr class="memdesc:a90772ac34f8c49f049eb62fada0a2165"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#a90772ac34f8c49f049eb62fada0a2165">More...</a><br /></td></tr>
+<tr class="separator:a90772ac34f8c49f049eb62fada0a2165"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a50f136516b139f011939015c8c417ddd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a50f136516b139f011939015c8c417ddd">Params</a> (typename Iterator::Params const &amp;_iterator)</td></tr>
+<tr class="memdesc:a50f136516b139f011939015c8c417ddd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor with iterator params.  <a href="#a50f136516b139f011939015c8c417ddd">More...</a><br /></td></tr>
+<tr class="separator:a50f136516b139f011939015c8c417ddd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a0430f377595718291f84ef62eb6f4e57"><td class="memItemLeft" align="right" valign="top">Iterator::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57">iterator</a></td></tr>
+<tr class="memdesc:a0430f377595718291f84ef62eb6f4e57"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters to the iterator.  <a href="#a0430f377595718291f84ef62eb6f4e57">More...</a><br /></td></tr>
+<tr class="separator:a0430f377595718291f84ef62eb6f4e57"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a90772ac34f8c49f049eb62fada0a2165"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a90772ac34f8c49f049eb62fada0a2165">&#9670;&nbsp;</a></span>Params() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a50f136516b139f011939015c8c417ddd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a50f136516b139f011939015c8c417ddd">&#9670;&nbsp;</a></span>Params() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype">typename Iterator::Params const &amp;&#160;</td>
+          <td class="paramname"><em>_iterator</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a0430f377595718291f84ef62eb6f4e57"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0430f377595718291f84ef62eb6f4e57">&#9670;&nbsp;</a></span>iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">Iterator::Params <a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a>&lt; Iterator_, Transformer_ &gt;::Params::iterator</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__stream_8h_source.html">tile_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileLoadStream_1_1PredicateVector.html b/docs/structcutlass_1_1TileLoadStream_1_1PredicateVector.html
new file mode 100644
index 000000000..2ff76de11
--- /dev/null
+++ b/docs/structcutlass_1_1TileLoadStream_1_1PredicateVector.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::PredicateVector Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html">PredicateVector</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::PredicateVector Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Empty predicate vector struct.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__stream_8h_source.html">tile_stream.h</a>&gt;</code></p>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__stream_8h_source.html">tile_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileStoreIterator-members.html b/docs/structcutlass_1_1TileStoreIterator-members.html
index f24d2dcd7..9499cf972 100644
--- a/docs/structcutlass_1_1TileStoreIterator-members.html
+++ b/docs/structcutlass_1_1TileStoreIterator-members.html
@@ -73,59 +73,70 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Member List</div>  </div>
+<div class="title">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a0e79ed59263ebc3478c43f2f9a50cb5a">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0">BaseParams</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0">data</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a1c433ba0eea5e6a46f36101d8de98ed0">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a48de0db7ee2ee9699b946a9d5a0364c7">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a2b13136a970fae187fcb377c9be28fac">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a0843b2d82422e7178f324a8d3be9d705">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a3b872e85844c9e009fa480a71a829136">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a187e0852ec4862f6d3cb6249bedc3bb3">inc_stage</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5ac2280dfcac08cec17b8c0db1c4593e">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#af92ba20db048a9ec96976a1673f0f7c2">initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a552a67fb03c28e985d143f6193f88308">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a8059c57030df99b73309e9210ec5f624">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a94c0567316118abfb84fc28560a5a46a">kIteratorFragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adaebec9eacf767f63f048033de73ea5b">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5aa507eaeb63951f8e69fb223ec41809">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a57348779bb004ed1ea0fd9cc252e895d">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">stage</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a53820de506cecb1f5fb07b3385d8272a">store</a>(Fragment &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a60258b7c1a1708f97e28f8f6c292bfe4">store</a>(Fragment &amp;fragment) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526">store_post_increment</a>(Fragment &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ae63949f58c1b32959bbfa5b64d521f0f">store_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a8a87c8ef986e110a01a9226012594a61">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aac4d49854d63f632627b6974f9b59dbb">TileStoreIterator</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a037ccd942359e6bc8640a240b13cd330">TileStoreIterator</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a4f89c5182659de94605300e15c3651b2">TileStoreIterator</a>(Params const &amp;, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a6f50a8aec2d7045e9057b93df08172a8">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a10431ed94c0dd66a8c1d01ba7c8b5aa2">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa6977ded39ead005b3435f13f0e51116">add_pointer_offset</a>(Index offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66">BaseParams</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#afdb38f790d9c7cf1ac238643103b45ce">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adfcd8a2e63bd0c515ef03760cc1c4283">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ace8a65d90db264a0ee93a810be38918f">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a82ceeea55603dbb0c6e5bf9c22ac692e">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad61206a742c8c5ab5bcd64b76ece9f74">inc_stage</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aae07fdedeef68abd4e6c099924c70910">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#acb6bc889b93d25c9e483a0b7297d7c89">initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a890a7239a89679662aeaea797ba32d32">initialize_predicates</a>(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a8628ea7116f736b59c644fc0d85d395f">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a44200854ad5b35c1863f73c435b8750b">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f">kFragmentElementType</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6">load</a>(Fragment &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a8c42ab8699c3fd74dc7b59d559364b9a">load</a>(Fragment &amp;fragment) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad33c46a584deb1c7968e08e349382af3">load</a>(Fragment &amp;fragment, int d)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c">load_element</a>(AccessType &amp;value, int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214">load_post_increment</a>(Fragment &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adfbd262dfb19fffd91e0712190d9712d">load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a57b284e6cbff892d45e5cfeb0ae1e3ed">operator+=</a>(Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a6157fe8a2ffefd45eba6f3953f0e2994">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a18248da35dc9a0ae2411121bee323085">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">stage</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e">store</a>(Fragment const &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa27a456bf12d0e44adc89a1c2ca7bc3b">store</a>(Fragment const &amp;fragment) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08">store_element</a>(AccessType const &amp;value, int d, int h, int w, int c)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44">store_post_increment</a>(Fragment const &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a35ab2595b09912d31a60c2a4e5847c88">store_post_increment</a>(Fragment const &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad18ee6f519b03e1dbf711339b63e16d6">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a9f4501c6e8ba0f4511919c1b63c14e69">TileStoreIterator</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa563bb10f8e58d97e81959556923e210">TileStoreIterator</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a2b58a21331cf3255f5d3938a39babf20">TileStoreIterator</a>(Params const &amp;, Scalar *ptr, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5016bd7b24938026a2879ec0054eb3b6">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileStoreIterator.html b/docs/structcutlass_1_1TileStoreIterator.html
index 4fe6f216b..e1b7f0bd7 100644
--- a/docs/structcutlass_1_1TileStoreIterator.html
+++ b/docs/structcutlass_1_1TileStoreIterator.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -80,7 +80,7 @@ $(function() {
 <a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1TileStoreIterator-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Struct Template Reference<div class="ingroups"><a class="el" href="group__tile__store__iterator__concept.html">Tile Store Iterator Concept</a></div></div>  </div>
+<div class="title">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Struct Template Reference<div class="ingroups"><a class="el" href="group__tile__store__iterator__concept.html">Tile Store Iterator Concept</a></div></div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -89,12 +89,12 @@ $(function() {
 
 <p><code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;:</div>
+Inheritance diagram for cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1TileStoreIterator.png" usemap="#cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E_map" alt=""/>
-  <map id="cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E_map" name="cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E_map">
-<area href="structcutlass_1_1TileIteratorBase.html" title="Iterator for accessing a stripmined tile in memory. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;" shape="rect" coords="0,0,734,24"/>
+  <img src="structcutlass_1_1TileStoreIterator.png" usemap="#cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E_map" alt=""/>
+  <map id="cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E_map" name="cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E_map">
+<area href="structcutlass_1_1TileIteratorBase.html" title="Iterator for accessing a stripmined tile in memory. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;" shape="rect" coords="0,0,766,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
@@ -106,498 +106,572 @@ Classes</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:af4576dca736bab8ac73b308522cb4a67"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67">Base</a></td></tr>
-<tr class="memdesc:af4576dca736bab8ac73b308522cb4a67"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base class.  <a href="#af4576dca736bab8ac73b308522cb4a67">More...</a><br /></td></tr>
-<tr class="separator:af4576dca736bab8ac73b308522cb4a67"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6f50a8aec2d7045e9057b93df08172a8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Base::Traits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a6f50a8aec2d7045e9057b93df08172a8">Traits</a></td></tr>
-<tr class="memdesc:a6f50a8aec2d7045e9057b93df08172a8"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="#a6f50a8aec2d7045e9057b93df08172a8">More...</a><br /></td></tr>
-<tr class="separator:a6f50a8aec2d7045e9057b93df08172a8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad52318b430437575b55099ca992ca3a7"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Base::Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a></td></tr>
-<tr class="memdesc:ad52318b430437575b55099ca992ca3a7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="#ad52318b430437575b55099ca992ca3a7">More...</a><br /></td></tr>
-<tr class="separator:ad52318b430437575b55099ca992ca3a7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2b13136a970fae187fcb377c9be28fac"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">Base::FragmentElement</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a2b13136a970fae187fcb377c9be28fac">FragmentElement</a></td></tr>
-<tr class="memdesc:a2b13136a970fae187fcb377c9be28fac"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="#a2b13136a970fae187fcb377c9be28fac">More...</a><br /></td></tr>
-<tr class="separator:a2b13136a970fae187fcb377c9be28fac"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5ac2280dfcac08cec17b8c0db1c4593e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Base::Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5ac2280dfcac08cec17b8c0db1c4593e">Index</a></td></tr>
-<tr class="memdesc:a5ac2280dfcac08cec17b8c0db1c4593e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#a5ac2280dfcac08cec17b8c0db1c4593e">More...</a><br /></td></tr>
-<tr class="separator:a5ac2280dfcac08cec17b8c0db1c4593e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a57348779bb004ed1ea0fd9cc252e895d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Base::Skew</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a57348779bb004ed1ea0fd9cc252e895d">Skew</a></td></tr>
-<tr class="memdesc:a57348779bb004ed1ea0fd9cc252e895d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="#a57348779bb004ed1ea0fd9cc252e895d">More...</a><br /></td></tr>
-<tr class="separator:a57348779bb004ed1ea0fd9cc252e895d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8a87c8ef986e110a01a9226012594a61"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Base::Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a8a87c8ef986e110a01a9226012594a61">Tile</a></td></tr>
-<tr class="memdesc:a8a87c8ef986e110a01a9226012594a61"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="#a8a87c8ef986e110a01a9226012594a61">More...</a><br /></td></tr>
-<tr class="separator:a8a87c8ef986e110a01a9226012594a61"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1c433ba0eea5e6a46f36101d8de98ed0"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Base::Delta</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a1c433ba0eea5e6a46f36101d8de98ed0">Delta</a></td></tr>
-<tr class="memdesc:a1c433ba0eea5e6a46f36101d8de98ed0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Delta.  <a href="#a1c433ba0eea5e6a46f36101d8de98ed0">More...</a><br /></td></tr>
-<tr class="separator:a1c433ba0eea5e6a46f36101d8de98ed0"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a552a67fb03c28e985d143f6193f88308"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Base::Iterations</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a552a67fb03c28e985d143f6193f88308">Iterations</a></td></tr>
-<tr class="memdesc:a552a67fb03c28e985d143f6193f88308"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="#a552a67fb03c28e985d143f6193f88308">More...</a><br /></td></tr>
-<tr class="separator:a552a67fb03c28e985d143f6193f88308"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6a6f51f459f98c0cddeacf476660cd27"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">Base::ThreadOffset</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27">ThreadOffset</a></td></tr>
-<tr class="memdesc:a6a6f51f459f98c0cddeacf476660cd27"><td class="mdescLeft">&#160;</td><td class="mdescRight">ThreadOffset functor.  <a href="#a6a6f51f459f98c0cddeacf476660cd27">More...</a><br /></td></tr>
-<tr class="separator:a6a6f51f459f98c0cddeacf476660cd27"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3b872e85844c9e009fa480a71a829136"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">Base::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a3b872e85844c9e009fa480a71a829136">FragmentShape</a></td></tr>
-<tr class="memdesc:a3b872e85844c9e009fa480a71a829136"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> type.  <a href="#a3b872e85844c9e009fa480a71a829136">More...</a><br /></td></tr>
-<tr class="separator:a3b872e85844c9e009fa480a71a829136"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0e79ed59263ebc3478c43f2f9a50cb5a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">Base::AccessType</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a0e79ed59263ebc3478c43f2f9a50cb5a">AccessType</a></td></tr>
-<tr class="memdesc:a0e79ed59263ebc3478c43f2f9a50cb5a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory access type.  <a href="#a0e79ed59263ebc3478c43f2f9a50cb5a">More...</a><br /></td></tr>
-<tr class="separator:a0e79ed59263ebc3478c43f2f9a50cb5a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a95da23108b74ad085024ab45e84083e1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">Fragment</a></td></tr>
-<tr class="memdesc:a95da23108b74ad085024ab45e84083e1"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> definition.  <a href="#a95da23108b74ad085024ab45e84083e1">More...</a><br /></td></tr>
-<tr class="separator:a95da23108b74ad085024ab45e84083e1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0843b2d82422e7178f324a8d3be9d705"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">Base::FragmentIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a0843b2d82422e7178f324a8d3be9d705">FragmentIterator</a></td></tr>
-<tr class="memdesc:a0843b2d82422e7178f324a8d3be9d705"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> iterator definition.  <a href="#a0843b2d82422e7178f324a8d3be9d705">More...</a><br /></td></tr>
-<tr class="separator:a0843b2d82422e7178f324a8d3be9d705"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a48de0db7ee2ee9699b946a9d5a0364c7"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">Base::FragmentConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a48de0db7ee2ee9699b946a9d5a0364c7">FragmentConstIterator</a></td></tr>
-<tr class="memdesc:a48de0db7ee2ee9699b946a9d5a0364c7"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> const iterator definition.  <a href="#a48de0db7ee2ee9699b946a9d5a0364c7">More...</a><br /></td></tr>
-<tr class="separator:a48de0db7ee2ee9699b946a9d5a0364c7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5aa507eaeb63951f8e69fb223ec41809"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">Base::PredicateVector</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5aa507eaeb63951f8e69fb223ec41809">PredicateVector</a></td></tr>
-<tr class="memdesc:a5aa507eaeb63951f8e69fb223ec41809"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="#a5aa507eaeb63951f8e69fb223ec41809">More...</a><br /></td></tr>
-<tr class="separator:a5aa507eaeb63951f8e69fb223ec41809"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab7922305d47b67e6cfb439e4e8d9f09b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Base::Storage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a></td></tr>
-<tr class="memdesc:ab7922305d47b67e6cfb439e4e8d9f09b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage object which may be stored to.  <a href="#ab7922305d47b67e6cfb439e4e8d9f09b">More...</a><br /></td></tr>
-<tr class="separator:ab7922305d47b67e6cfb439e4e8d9f09b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5484b46ac2646edb7a185b51137f70c0"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0">BaseParams</a></td></tr>
-<tr class="memdesc:a5484b46ac2646edb7a185b51137f70c0"><td class="mdescLeft">&#160;</td><td class="mdescRight">IteratorBase parameters.  <a href="#a5484b46ac2646edb7a185b51137f70c0">More...</a><br /></td></tr>
-<tr class="separator:a5484b46ac2646edb7a185b51137f70c0"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
-<tr class="memitem:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a></td></tr>
-<tr class="memdesc:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">More...</a><br /></td></tr>
-<tr class="separator:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a></td></tr>
-<tr class="memdesc:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">More...</a><br /></td></tr>
-<tr class="separator:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a></td></tr>
-<tr class="memdesc:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">More...</a><br /></td></tr>
-<tr class="separator:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a></td></tr>
-<tr class="memdesc:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">More...</a><br /></td></tr>
-<tr class="separator:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Skew_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a></td></tr>
-<tr class="memdesc:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">More...</a><br /></td></tr>
-<tr class="separator:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a></td></tr>
-<tr class="memdesc:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">More...</a><br /></td></tr>
-<tr class="separator:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a></td></tr>
-<tr class="memdesc:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">More...</a><br /></td></tr>
-<tr class="separator:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a></td></tr>
-<tr class="memdesc:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">More...</a><br /></td></tr>
-<tr class="separator:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a></td></tr>
-<tr class="memdesc:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">More...</a><br /></td></tr>
-<tr class="separator:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a></td></tr>
-<tr class="memdesc:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">More...</a><br /></td></tr>
-<tr class="separator:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a></td></tr>
-<tr class="memdesc:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">More...</a><br /></td></tr>
-<tr class="separator:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a></td></tr>
-<tr class="memdesc:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">More...</a><br /></td></tr>
-<tr class="separator:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a></td></tr>
-<tr class="memdesc:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">More...</a><br /></td></tr>
-<tr class="separator:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a></td></tr>
-<tr class="memdesc:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">More...</a><br /></td></tr>
-<tr class="separator:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a></td></tr>
-<tr class="memdesc:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">More...</a><br /></td></tr>
-<tr class="separator:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a></td></tr>
-<tr class="memdesc:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">More...</a><br /></td></tr>
-<tr class="separator:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a></td></tr>
-<tr class="memdesc:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">More...</a><br /></td></tr>
-<tr class="separator:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24fa369165de783a72311d8ec3115c48"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48">Base</a></td></tr>
+<tr class="memdesc:a24fa369165de783a72311d8ec3115c48"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base class.  <a href="#a24fa369165de783a72311d8ec3115c48">More...</a><br /></td></tr>
+<tr class="separator:a24fa369165de783a72311d8ec3115c48"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5016bd7b24938026a2879ec0054eb3b6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Base::Traits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5016bd7b24938026a2879ec0054eb3b6">Traits</a></td></tr>
+<tr class="memdesc:a5016bd7b24938026a2879ec0054eb3b6"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="#a5016bd7b24938026a2879ec0054eb3b6">More...</a><br /></td></tr>
+<tr class="separator:a5016bd7b24938026a2879ec0054eb3b6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac3273690cdd0a1c2e61d29b289daf5b5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Base::Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a></td></tr>
+<tr class="memdesc:ac3273690cdd0a1c2e61d29b289daf5b5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="#ac3273690cdd0a1c2e61d29b289daf5b5">More...</a><br /></td></tr>
+<tr class="separator:ac3273690cdd0a1c2e61d29b289daf5b5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a96e55c1ce2475115e6e834f3996c9ee8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">Base::FragmentElement</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">FragmentElement</a></td></tr>
+<tr class="memdesc:a96e55c1ce2475115e6e834f3996c9ee8"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="#a96e55c1ce2475115e6e834f3996c9ee8">More...</a><br /></td></tr>
+<tr class="separator:a96e55c1ce2475115e6e834f3996c9ee8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aae07fdedeef68abd4e6c099924c70910"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Base::Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aae07fdedeef68abd4e6c099924c70910">Index</a></td></tr>
+<tr class="memdesc:aae07fdedeef68abd4e6c099924c70910"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#aae07fdedeef68abd4e6c099924c70910">More...</a><br /></td></tr>
+<tr class="separator:aae07fdedeef68abd4e6c099924c70910"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a18248da35dc9a0ae2411121bee323085"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Base::Skew</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a18248da35dc9a0ae2411121bee323085">Skew</a></td></tr>
+<tr class="memdesc:a18248da35dc9a0ae2411121bee323085"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="#a18248da35dc9a0ae2411121bee323085">More...</a><br /></td></tr>
+<tr class="separator:a18248da35dc9a0ae2411121bee323085"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad18ee6f519b03e1dbf711339b63e16d6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Base::Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad18ee6f519b03e1dbf711339b63e16d6">Tile</a></td></tr>
+<tr class="memdesc:ad18ee6f519b03e1dbf711339b63e16d6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="#ad18ee6f519b03e1dbf711339b63e16d6">More...</a><br /></td></tr>
+<tr class="separator:ad18ee6f519b03e1dbf711339b63e16d6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afdb38f790d9c7cf1ac238643103b45ce"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Base::Delta</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#afdb38f790d9c7cf1ac238643103b45ce">Delta</a></td></tr>
+<tr class="memdesc:afdb38f790d9c7cf1ac238643103b45ce"><td class="mdescLeft">&#160;</td><td class="mdescRight">Delta.  <a href="#afdb38f790d9c7cf1ac238643103b45ce">More...</a><br /></td></tr>
+<tr class="separator:afdb38f790d9c7cf1ac238643103b45ce"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8628ea7116f736b59c644fc0d85d395f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Base::Iterations</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a8628ea7116f736b59c644fc0d85d395f">Iterations</a></td></tr>
+<tr class="memdesc:a8628ea7116f736b59c644fc0d85d395f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="#a8628ea7116f736b59c644fc0d85d395f">More...</a><br /></td></tr>
+<tr class="separator:a8628ea7116f736b59c644fc0d85d395f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a076357a165302f01f449fd91f9ed402a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">Base::ThreadOffset</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a">ThreadOffset</a></td></tr>
+<tr class="memdesc:a076357a165302f01f449fd91f9ed402a"><td class="mdescLeft">&#160;</td><td class="mdescRight">ThreadOffset functor.  <a href="#a076357a165302f01f449fd91f9ed402a">More...</a><br /></td></tr>
+<tr class="separator:a076357a165302f01f449fd91f9ed402a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a82ceeea55603dbb0c6e5bf9c22ac692e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">Base::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a82ceeea55603dbb0c6e5bf9c22ac692e">FragmentShape</a></td></tr>
+<tr class="memdesc:a82ceeea55603dbb0c6e5bf9c22ac692e"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> type.  <a href="#a82ceeea55603dbb0c6e5bf9c22ac692e">More...</a><br /></td></tr>
+<tr class="separator:a82ceeea55603dbb0c6e5bf9c22ac692e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a10431ed94c0dd66a8c1d01ba7c8b5aa2"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a10431ed94c0dd66a8c1d01ba7c8b5aa2">AccessType</a></td></tr>
+<tr class="memdesc:a10431ed94c0dd66a8c1d01ba7c8b5aa2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory access type.  <a href="#a10431ed94c0dd66a8c1d01ba7c8b5aa2">More...</a><br /></td></tr>
+<tr class="separator:a10431ed94c0dd66a8c1d01ba7c8b5aa2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa5386367e805cdaf47a5e7564bedc2fb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">Fragment</a></td></tr>
+<tr class="memdesc:aa5386367e805cdaf47a5e7564bedc2fb"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> definition.  <a href="#aa5386367e805cdaf47a5e7564bedc2fb">More...</a><br /></td></tr>
+<tr class="separator:aa5386367e805cdaf47a5e7564bedc2fb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ace8a65d90db264a0ee93a810be38918f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ace8a65d90db264a0ee93a810be38918f">FragmentIterator</a></td></tr>
+<tr class="memdesc:ace8a65d90db264a0ee93a810be38918f"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> iterator definition.  <a href="#ace8a65d90db264a0ee93a810be38918f">More...</a><br /></td></tr>
+<tr class="separator:ace8a65d90db264a0ee93a810be38918f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adfcd8a2e63bd0c515ef03760cc1c4283"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">Base::FragmentConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adfcd8a2e63bd0c515ef03760cc1c4283">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:adfcd8a2e63bd0c515ef03760cc1c4283"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> const iterator definition.  <a href="#adfcd8a2e63bd0c515ef03760cc1c4283">More...</a><br /></td></tr>
+<tr class="separator:adfcd8a2e63bd0c515ef03760cc1c4283"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6157fe8a2ffefd45eba6f3953f0e2994"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">Base::PredicateVector</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a6157fe8a2ffefd45eba6f3953f0e2994">PredicateVector</a></td></tr>
+<tr class="memdesc:a6157fe8a2ffefd45eba6f3953f0e2994"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="#a6157fe8a2ffefd45eba6f3953f0e2994">More...</a><br /></td></tr>
+<tr class="separator:a6157fe8a2ffefd45eba6f3953f0e2994"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af6c297bb43573a13f6b721cc8ff730ca"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Base::Storage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">SharedStorage</a></td></tr>
+<tr class="memdesc:af6c297bb43573a13f6b721cc8ff730ca"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage object which may be stored to.  <a href="#af6c297bb43573a13f6b721cc8ff730ca">More...</a><br /></td></tr>
+<tr class="separator:af6c297bb43573a13f6b721cc8ff730ca"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5dd2a31d41d9098e928c559af12cbe66"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66">BaseParams</a></td></tr>
+<tr class="memdesc:a5dd2a31d41d9098e928c559af12cbe66"><td class="mdescLeft">&#160;</td><td class="mdescRight">IteratorBase parameters.  <a href="#a5dd2a31d41d9098e928c559af12cbe66">More...</a><br /></td></tr>
+<tr class="separator:a5dd2a31d41d9098e928c559af12cbe66"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adc4182adb78e34b7741f297eca86fe35"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35">Pointer</a></td></tr>
+<tr class="memdesc:adc4182adb78e34b7741f297eca86fe35"><td class="mdescLeft">&#160;</td><td class="mdescRight">Pointer to underlying type.  <a href="#adc4182adb78e34b7741f297eca86fe35">More...</a><br /></td></tr>
+<tr class="separator:adc4182adb78e34b7741f297eca86fe35"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acd3c170dd70bee777cb9e9dc662c5eac"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef</a></td></tr>
+<tr class="memdesc:acd3c170dd70bee777cb9e9dc662c5eac"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference for the store iterator.  <a href="#acd3c170dd70bee777cb9e9dc662c5eac">More...</a><br /></td></tr>
+<tr class="separator:acd3c170dd70bee777cb9e9dc662c5eac"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td></tr>
+<tr class="memdesc:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept <a class="el" href="structcutlass_1_1TileTraits.html" title="A template defining Tile Traits Concept. ">TileTraits</a>  <a href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">More...</a><br /></td></tr>
+<tr class="separator:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td></tr>
+<tr class="memdesc:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">More...</a><br /></td></tr>
+<tr class="separator:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef FragmentElement_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td></tr>
+<tr class="memdesc:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> element.  <a href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">More...</a><br /></td></tr>
+<tr class="separator:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td></tr>
+<tr class="memdesc:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">More...</a><br /></td></tr>
+<tr class="separator:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Skew_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td></tr>
+<tr class="memdesc:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">More...</a><br /></td></tr>
+<tr class="separator:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td></tr>
+<tr class="memdesc:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">More...</a><br /></td></tr>
+<tr class="separator:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td></tr>
+<tr class="memdesc:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">More...</a><br /></td></tr>
+<tr class="separator:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">More...</a><br /></td></tr>
+<tr class="separator:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td></tr>
+<tr class="memdesc:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">More...</a><br /></td></tr>
+<tr class="separator:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td></tr>
+<tr class="memdesc:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">More...</a><br /></td></tr>
+<tr class="separator:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td></tr>
+<tr class="memdesc:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">More...</a><br /></td></tr>
+<tr class="separator:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a></td></tr>
+<tr class="memdesc:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">More...</a><br /></td></tr>
+<tr class="separator:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td></tr>
+<tr class="memdesc:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">More...</a><br /></td></tr>
+<tr class="separator:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td></tr>
+<tr class="memdesc:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">More...</a><br /></td></tr>
+<tr class="separator:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">More...</a><br /></td></tr>
+<tr class="separator:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td></tr>
+<tr class="memdesc:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">More...</a><br /></td></tr>
+<tr class="separator:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td></tr>
+<tr class="memdesc:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">More...</a><br /></td></tr>
+<tr class="separator:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:af92ba20db048a9ec96976a1673f0f7c2"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator &gt; </td></tr>
-<tr class="memitem:af92ba20db048a9ec96976a1673f0f7c2"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#af92ba20db048a9ec96976a1673f0f7c2">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
-<tr class="memdesc:af92ba20db048a9ec96976a1673f0f7c2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="#af92ba20db048a9ec96976a1673f0f7c2">More...</a><br /></td></tr>
-<tr class="separator:af92ba20db048a9ec96976a1673f0f7c2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aac4d49854d63f632627b6974f9b59dbb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aac4d49854d63f632627b6974f9b59dbb">TileStoreIterator</a> ()</td></tr>
-<tr class="memdesc:aac4d49854d63f632627b6974f9b59dbb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#aac4d49854d63f632627b6974f9b59dbb">More...</a><br /></td></tr>
-<tr class="separator:aac4d49854d63f632627b6974f9b59dbb"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a037ccd942359e6bc8640a240b13cd330"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a037ccd942359e6bc8640a240b13cd330">TileStoreIterator</a> (<a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>())</td></tr>
-<tr class="memdesc:a037ccd942359e6bc8640a240b13cd330"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile store iterator.  <a href="#a037ccd942359e6bc8640a240b13cd330">More...</a><br /></td></tr>
-<tr class="separator:a037ccd942359e6bc8640a240b13cd330"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4f89c5182659de94605300e15c3651b2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a4f89c5182659de94605300e15c3651b2">TileStoreIterator</a> (<a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> const &amp;, <a class="el" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a> &amp;shared_storage, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>())</td></tr>
-<tr class="memdesc:a4f89c5182659de94605300e15c3651b2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile store iterator.  <a href="#a4f89c5182659de94605300e15c3651b2">More...</a><br /></td></tr>
-<tr class="separator:a4f89c5182659de94605300e15c3651b2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5ebab59862d5f50ad980871515d999b0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0">data</a> () const</td></tr>
-<tr class="memdesc:a5ebab59862d5f50ad980871515d999b0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the current pointer.  <a href="#a5ebab59862d5f50ad980871515d999b0">More...</a><br /></td></tr>
-<tr class="separator:a5ebab59862d5f50ad980871515d999b0"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a74dffe1ddcc84935ab170117e939b7e3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3">inc_d</a> ()</td></tr>
-<tr class="memdesc:a74dffe1ddcc84935ab170117e939b7e3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the D dimension.  <a href="#a74dffe1ddcc84935ab170117e939b7e3">More...</a><br /></td></tr>
-<tr class="separator:a74dffe1ddcc84935ab170117e939b7e3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3793f5d5846862f22f1de736e36ae7c1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1">inc_h</a> ()</td></tr>
-<tr class="memdesc:a3793f5d5846862f22f1de736e36ae7c1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the H dimension.  <a href="#a3793f5d5846862f22f1de736e36ae7c1">More...</a><br /></td></tr>
-<tr class="separator:a3793f5d5846862f22f1de736e36ae7c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa573a47a9ffc3e07239a09e2bc470cf1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1">inc_w</a> ()</td></tr>
-<tr class="memdesc:aa573a47a9ffc3e07239a09e2bc470cf1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the W dimension.  <a href="#aa573a47a9ffc3e07239a09e2bc470cf1">More...</a><br /></td></tr>
-<tr class="separator:aa573a47a9ffc3e07239a09e2bc470cf1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1614b27755cf82c0e1f3e7852c5a4c75"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75">inc_advance</a> ()</td></tr>
-<tr class="memdesc:a1614b27755cf82c0e1f3e7852c5a4c75"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the next dimension.  <a href="#a1614b27755cf82c0e1f3e7852c5a4c75">More...</a><br /></td></tr>
-<tr class="separator:a1614b27755cf82c0e1f3e7852c5a4c75"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a187e0852ec4862f6d3cb6249bedc3bb3"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a187e0852ec4862f6d3cb6249bedc3bb3">inc_stage</a> ()</td></tr>
-<tr class="memdesc:a187e0852ec4862f6d3cb6249bedc3bb3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the stage.  <a href="#a187e0852ec4862f6d3cb6249bedc3bb3">More...</a><br /></td></tr>
-<tr class="separator:a187e0852ec4862f6d3cb6249bedc3bb3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a57aa2c36eb6ad9d2500c1f5396b3a526"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
-<tr class="memitem:a57aa2c36eb6ad9d2500c1f5396b3a526"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526">store_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it)</td></tr>
-<tr class="memdesc:a57aa2c36eb6ad9d2500c1f5396b3a526"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and advances to the next tile.  <a href="#a57aa2c36eb6ad9d2500c1f5396b3a526">More...</a><br /></td></tr>
-<tr class="separator:a57aa2c36eb6ad9d2500c1f5396b3a526"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae63949f58c1b32959bbfa5b64d521f0f"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
-<tr class="memitem:ae63949f58c1b32959bbfa5b64d521f0f"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ae63949f58c1b32959bbfa5b64d521f0f">store_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment)</td></tr>
-<tr class="memdesc:ae63949f58c1b32959bbfa5b64d521f0f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and advances to the next tile.  <a href="#ae63949f58c1b32959bbfa5b64d521f0f">More...</a><br /></td></tr>
-<tr class="separator:ae63949f58c1b32959bbfa5b64d521f0f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a53820de506cecb1f5fb07b3385d8272a"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
-<tr class="memitem:a53820de506cecb1f5fb07b3385d8272a"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a53820de506cecb1f5fb07b3385d8272a">store</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it) const</td></tr>
-<tr class="memdesc:a53820de506cecb1f5fb07b3385d8272a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment without advancing the iterator.  <a href="#a53820de506cecb1f5fb07b3385d8272a">More...</a><br /></td></tr>
-<tr class="separator:a53820de506cecb1f5fb07b3385d8272a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a60258b7c1a1708f97e28f8f6c292bfe4"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
-<tr class="memitem:a60258b7c1a1708f97e28f8f6c292bfe4"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a60258b7c1a1708f97e28f8f6c292bfe4">store</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment) const</td></tr>
-<tr class="memdesc:a60258b7c1a1708f97e28f8f6c292bfe4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment without advancing the iterator.  <a href="#a60258b7c1a1708f97e28f8f6c292bfe4">More...</a><br /></td></tr>
-<tr class="separator:a60258b7c1a1708f97e28f8f6c292bfe4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
-<tr class="memitem:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">More...</a><br /></td></tr>
-<tr class="separator:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acb6bc889b93d25c9e483a0b7297d7c89"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:acb6bc889b93d25c9e483a0b7297d7c89"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#acb6bc889b93d25c9e483a0b7297d7c89">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:acb6bc889b93d25c9e483a0b7297d7c89"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using a <a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html" title="Functor computing a predicate given the logical position of an access. ">RegularTilePredicateFunctor</a>.  <a href="#acb6bc889b93d25c9e483a0b7297d7c89">More...</a><br /></td></tr>
+<tr class="separator:acb6bc889b93d25c9e483a0b7297d7c89"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a890a7239a89679662aeaea797ba32d32"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </td></tr>
+<tr class="memitem:a890a7239a89679662aeaea797ba32d32"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a890a7239a89679662aeaea797ba32d32">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;functor, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset)</td></tr>
+<tr class="memdesc:a890a7239a89679662aeaea797ba32d32"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using an arbitrary predicate functor.  <a href="#a890a7239a89679662aeaea797ba32d32">More...</a><br /></td></tr>
+<tr class="separator:a890a7239a89679662aeaea797ba32d32"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f4501c6e8ba0f4511919c1b63c14e69"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a9f4501c6e8ba0f4511919c1b63c14e69">TileStoreIterator</a> ()</td></tr>
+<tr class="memdesc:a9f4501c6e8ba0f4511919c1b63c14e69"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#a9f4501c6e8ba0f4511919c1b63c14e69">More...</a><br /></td></tr>
+<tr class="separator:a9f4501c6e8ba0f4511919c1b63c14e69"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa563bb10f8e58d97e81959556923e210"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa563bb10f8e58d97e81959556923e210">TileStoreIterator</a> (<a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:aa563bb10f8e58d97e81959556923e210"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile store iterator.  <a href="#aa563bb10f8e58d97e81959556923e210">More...</a><br /></td></tr>
+<tr class="separator:aa563bb10f8e58d97e81959556923e210"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2b58a21331cf3255f5d3938a39babf20"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a2b58a21331cf3255f5d3938a39babf20">TileStoreIterator</a> (<a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> const &amp;, <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> *ptr, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a2b58a21331cf3255f5d3938a39babf20"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile store iterator.  <a href="#a2b58a21331cf3255f5d3938a39babf20">More...</a><br /></td></tr>
+<tr class="separator:a2b58a21331cf3255f5d3938a39babf20"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abcb7af7b35e605dfda5ce6a37a02f975"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975">inc_d</a> ()</td></tr>
+<tr class="memdesc:abcb7af7b35e605dfda5ce6a37a02f975"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the D dimension.  <a href="#abcb7af7b35e605dfda5ce6a37a02f975">More...</a><br /></td></tr>
+<tr class="separator:abcb7af7b35e605dfda5ce6a37a02f975"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaec63ca7faf0cf4f54cac31c7d6e0d3d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d">inc_h</a> ()</td></tr>
+<tr class="memdesc:aaec63ca7faf0cf4f54cac31c7d6e0d3d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the H dimension.  <a href="#aaec63ca7faf0cf4f54cac31c7d6e0d3d">More...</a><br /></td></tr>
+<tr class="separator:aaec63ca7faf0cf4f54cac31c7d6e0d3d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa676184bbd4c2e3f6c09dbc548e6c4e1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1">inc_w</a> ()</td></tr>
+<tr class="memdesc:aa676184bbd4c2e3f6c09dbc548e6c4e1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the W dimension.  <a href="#aa676184bbd4c2e3f6c09dbc548e6c4e1">More...</a><br /></td></tr>
+<tr class="separator:aa676184bbd4c2e3f6c09dbc548e6c4e1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3ecd73de1202f7e4a0db86d9fe9de38d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d">inc_advance</a> ()</td></tr>
+<tr class="memdesc:a3ecd73de1202f7e4a0db86d9fe9de38d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the next dimension.  <a href="#a3ecd73de1202f7e4a0db86d9fe9de38d">More...</a><br /></td></tr>
+<tr class="separator:a3ecd73de1202f7e4a0db86d9fe9de38d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad61206a742c8c5ab5bcd64b76ece9f74"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad61206a742c8c5ab5bcd64b76ece9f74">inc_stage</a> ()</td></tr>
+<tr class="memdesc:ad61206a742c8c5ab5bcd64b76ece9f74"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the stage.  <a href="#ad61206a742c8c5ab5bcd64b76ece9f74">More...</a><br /></td></tr>
+<tr class="separator:ad61206a742c8c5ab5bcd64b76ece9f74"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a57b284e6cbff892d45e5cfeb0ae1e3ed"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a57b284e6cbff892d45e5cfeb0ae1e3ed">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a57b284e6cbff892d45e5cfeb0ae1e3ed"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a vector offset to the iterator.  <a href="#a57b284e6cbff892d45e5cfeb0ae1e3ed">More...</a><br /></td></tr>
+<tr class="separator:a57b284e6cbff892d45e5cfeb0ae1e3ed"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa6977ded39ead005b3435f13f0e51116"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa6977ded39ead005b3435f13f0e51116">add_pointer_offset</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> offset)</td></tr>
+<tr class="memdesc:aa6977ded39ead005b3435f13f0e51116"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a raw offset to the pointer.  <a href="#aa6977ded39ead005b3435f13f0e51116">More...</a><br /></td></tr>
+<tr class="separator:aa6977ded39ead005b3435f13f0e51116"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1f7c4143443d2bee4a69d1b380576f08"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08">store_element</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> const &amp;value, int d, int h, int w, int c)</td></tr>
+<tr class="memdesc:a1f7c4143443d2bee4a69d1b380576f08"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a single fragment element into memory.  <a href="#a1f7c4143443d2bee4a69d1b380576f08">More...</a><br /></td></tr>
+<tr class="separator:a1f7c4143443d2bee4a69d1b380576f08"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbb7fdb5710295cdfb86e090a8c40f44"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:adbb7fdb5710295cdfb86e090a8c40f44"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44">store_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> const &amp;fragment, PredicateIterator pred_it)</td></tr>
+<tr class="memdesc:adbb7fdb5710295cdfb86e090a8c40f44"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and advances to the next tile.  <a href="#adbb7fdb5710295cdfb86e090a8c40f44">More...</a><br /></td></tr>
+<tr class="separator:adbb7fdb5710295cdfb86e090a8c40f44"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a35ab2595b09912d31a60c2a4e5847c88"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a35ab2595b09912d31a60c2a4e5847c88"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a35ab2595b09912d31a60c2a4e5847c88">store_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> const &amp;fragment)</td></tr>
+<tr class="memdesc:a35ab2595b09912d31a60c2a4e5847c88"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and advances to the next tile.  <a href="#a35ab2595b09912d31a60c2a4e5847c88">More...</a><br /></td></tr>
+<tr class="separator:a35ab2595b09912d31a60c2a4e5847c88"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0218adf569557b17d8e36a3d97fb185e"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:a0218adf569557b17d8e36a3d97fb185e"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e">store</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> const &amp;fragment, PredicateIterator pred_it) const</td></tr>
+<tr class="memdesc:a0218adf569557b17d8e36a3d97fb185e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment without advancing the iterator.  <a href="#a0218adf569557b17d8e36a3d97fb185e">More...</a><br /></td></tr>
+<tr class="separator:a0218adf569557b17d8e36a3d97fb185e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa27a456bf12d0e44adc89a1c2ca7bc3b"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:aa27a456bf12d0e44adc89a1c2ca7bc3b"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa27a456bf12d0e44adc89a1c2ca7bc3b">store</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> const &amp;fragment) const</td></tr>
+<tr class="memdesc:aa27a456bf12d0e44adc89a1c2ca7bc3b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment without advancing the iterator.  <a href="#aa27a456bf12d0e44adc89a1c2ca7bc3b">More...</a><br /></td></tr>
+<tr class="separator:aa27a456bf12d0e44adc89a1c2ca7bc3b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a320c917d585df901e66257c7d9b4780c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c">load_element</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a320c917d585df901e66257c7d9b4780c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a single fragment element from memory.  <a href="#a320c917d585df901e66257c7d9b4780c">More...</a><br /></td></tr>
+<tr class="separator:a320c917d585df901e66257c7d9b4780c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a57c56e2fe02fc5c771283e35d59b9214"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:a57c56e2fe02fc5c771283e35d59b9214"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it)</td></tr>
+<tr class="memdesc:a57c56e2fe02fc5c771283e35d59b9214"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="#a57c56e2fe02fc5c771283e35d59b9214">More...</a><br /></td></tr>
+<tr class="separator:a57c56e2fe02fc5c771283e35d59b9214"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adfbd262dfb19fffd91e0712190d9712d"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:adfbd262dfb19fffd91e0712190d9712d"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adfbd262dfb19fffd91e0712190d9712d">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="memdesc:adfbd262dfb19fffd91e0712190d9712d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="#adfbd262dfb19fffd91e0712190d9712d">More...</a><br /></td></tr>
+<tr class="separator:adfbd262dfb19fffd91e0712190d9712d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa3ce9690a0e8c6457e570607474af7a6"><td class="memTemplParams" colspan="2">template&lt;typename Fragment , typename PredicateIterator &gt; </td></tr>
+<tr class="memitem:aa3ce9690a0e8c6457e570607474af7a6"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it) const</td></tr>
+<tr class="memdesc:aa3ce9690a0e8c6457e570607474af7a6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="#aa3ce9690a0e8c6457e570607474af7a6">More...</a><br /></td></tr>
+<tr class="separator:aa3ce9690a0e8c6457e570607474af7a6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8c42ab8699c3fd74dc7b59d559364b9a"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a8c42ab8699c3fd74dc7b59d559364b9a"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a8c42ab8699c3fd74dc7b59d559364b9a">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment) const</td></tr>
+<tr class="memdesc:a8c42ab8699c3fd74dc7b59d559364b9a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="#a8c42ab8699c3fd74dc7b59d559364b9a">More...</a><br /></td></tr>
+<tr class="separator:a8c42ab8699c3fd74dc7b59d559364b9a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad33c46a584deb1c7968e08e349382af3"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:ad33c46a584deb1c7968e08e349382af3"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad33c46a584deb1c7968e08e349382af3">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, int d)</td></tr>
+<tr class="memdesc:ad33c46a584deb1c7968e08e349382af3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="#ad33c46a584deb1c7968e08e349382af3">More...</a><br /></td></tr>
+<tr class="separator:ad33c46a584deb1c7968e08e349382af3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">More...</a><br /></td></tr>
+<tr class="separator:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:a5e6c00b99e0f752137b07f7059f6ee0f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a></td></tr>
-<tr class="memdesc:a5e6c00b99e0f752137b07f7059f6ee0f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters structure.  <a href="#a5e6c00b99e0f752137b07f7059f6ee0f">More...</a><br /></td></tr>
-<tr class="separator:a5e6c00b99e0f752137b07f7059f6ee0f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a350f5beea87d811f43c55519bc0b9035"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">thread_offset</a></td></tr>
-<tr class="memdesc:a350f5beea87d811f43c55519bc0b9035"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="#a350f5beea87d811f43c55519bc0b9035">More...</a><br /></td></tr>
-<tr class="separator:a350f5beea87d811f43c55519bc0b9035"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae435b72b15eca46eb871446d92bd316e"><td class="memItemLeft" align="right" valign="top">int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">stage</a></td></tr>
-<tr class="memdesc:ae435b72b15eca46eb871446d92bd316e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stage.  <a href="#ae435b72b15eca46eb871446d92bd316e">More...</a><br /></td></tr>
-<tr class="separator:ae435b72b15eca46eb871446d92bd316e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64e0c9fb1f7d8fcc77bf0a915445ee6d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a></td></tr>
+<tr class="memdesc:a64e0c9fb1f7d8fcc77bf0a915445ee6d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters structure.  <a href="#a64e0c9fb1f7d8fcc77bf0a915445ee6d">More...</a><br /></td></tr>
+<tr class="separator:a64e0c9fb1f7d8fcc77bf0a915445ee6d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a00a33d258b9d60c8f9d4bfc48e2c6825"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a></td></tr>
+<tr class="memdesc:a00a33d258b9d60c8f9d4bfc48e2c6825"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="#a00a33d258b9d60c8f9d4bfc48e2c6825">More...</a><br /></td></tr>
+<tr class="separator:a00a33d258b9d60c8f9d4bfc48e2c6825"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff36e4a3de7e27667542564e0ec96a7e"><td class="memItemLeft" align="right" valign="top">int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">stage</a></td></tr>
+<tr class="memdesc:aff36e4a3de7e27667542564e0ec96a7e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stage.  <a href="#aff36e4a3de7e27667542564e0ec96a7e">More...</a><br /></td></tr>
+<tr class="separator:aff36e4a3de7e27667542564e0ec96a7e"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
-<tr class="memitem:a8059c57030df99b73309e9210ec5f624"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a8059c57030df99b73309e9210ec5f624">kAdvance</a> = Base::kAdvance</td></tr>
-<tr class="memdesc:a8059c57030df99b73309e9210ec5f624"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies in which dimension post-increment accesses advance.  <a href="#a8059c57030df99b73309e9210ec5f624">More...</a><br /></td></tr>
-<tr class="separator:a8059c57030df99b73309e9210ec5f624"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a94c0567316118abfb84fc28560a5a46a"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a94c0567316118abfb84fc28560a5a46a">kIteratorFragment</a> = Base::kIteratorFragment</td></tr>
-<tr class="memdesc:a94c0567316118abfb84fc28560a5a46a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies type of iterator fragment storage (Salar or WmmaMatrix)  <a href="#a94c0567316118abfb84fc28560a5a46a">More...</a><br /></td></tr>
-<tr class="separator:a94c0567316118abfb84fc28560a5a46a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adaebec9eacf767f63f048033de73ea5b"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#adaebec9eacf767f63f048033de73ea5b">kMemorySpace</a> = Base::kMemorySpace</td></tr>
-<tr class="memdesc:adaebec9eacf767f63f048033de73ea5b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="#adaebec9eacf767f63f048033de73ea5b">More...</a><br /></td></tr>
-<tr class="separator:adaebec9eacf767f63f048033de73ea5b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_static_attribs_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
-<tr class="memitem:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a> = Advance_</td></tr>
-<tr class="memdesc:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">More...</a><br /></td></tr>
-<tr class="separator:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a> = IteratorFragment_</td></tr>
-<tr class="memdesc:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">More...</a><br /></td></tr>
-<tr class="separator:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a> = <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a></td></tr>
-<tr class="memdesc:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">More...</a><br /></td></tr>
-<tr class="separator:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> = Tile::kC</td></tr>
-<tr class="memdesc:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">More...</a><br /></td></tr>
-<tr class="separator:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td></tr>
-<tr class="memdesc:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">More...</a><br /></td></tr>
-<tr class="separator:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a44200854ad5b35c1863f73c435b8750b"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a44200854ad5b35c1863f73c435b8750b">kAdvance</a> = Base::kAdvance</td></tr>
+<tr class="memdesc:a44200854ad5b35c1863f73c435b8750b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies in which dimension post-increment accesses advance.  <a href="#a44200854ad5b35c1863f73c435b8750b">More...</a><br /></td></tr>
+<tr class="separator:a44200854ad5b35c1863f73c435b8750b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9fb3af1ab0eeb5b17b42bb990edf0e4f"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f">kFragmentElementType</a> = Base::kFragmentElementType</td></tr>
+<tr class="memdesc:a9fb3af1ab0eeb5b17b42bb990edf0e4f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies type of iterator fragment storage (Salar or WmmaMatrix)  <a href="#a9fb3af1ab0eeb5b17b42bb990edf0e4f">More...</a><br /></td></tr>
+<tr class="separator:a9fb3af1ab0eeb5b17b42bb990edf0e4f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a993e1e7d8cc461a9cfa009b61b42621f"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f">kMemorySpace</a> = Base::kMemorySpace</td></tr>
+<tr class="memdesc:a993e1e7d8cc461a9cfa009b61b42621f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="#a993e1e7d8cc461a9cfa009b61b42621f">More...</a><br /></td></tr>
+<tr class="separator:a993e1e7d8cc461a9cfa009b61b42621f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a39cecf8198d1286f497930cce632c671"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">kAccessSize</a> = Base::kAccessSize</td></tr>
+<tr class="memdesc:a39cecf8198d1286f497930cce632c671"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="#a39cecf8198d1286f497930cce632c671">More...</a><br /></td></tr>
+<tr class="separator:a39cecf8198d1286f497930cce632c671"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a> = Advance_</td></tr>
+<tr class="memdesc:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">More...</a><br /></td></tr>
+<tr class="separator:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a> = FragmentElementType_</td></tr>
+<tr class="memdesc:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">More...</a><br /></td></tr>
+<tr class="separator:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a> = <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a></td></tr>
+<tr class="memdesc:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">More...</a><br /></td></tr>
+<tr class="separator:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> = Traits::kAccessSize</td></tr>
+<tr class="memdesc:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">More...</a><br /></td></tr>
+<tr class="separator:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td></tr>
+<tr class="memdesc:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">More...</a><br /></td></tr>
+<tr class="separator:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_static_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
-<tr class="memitem:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator &gt; </td></tr>
-<tr class="memitem:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memTemplItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
-<tr class="memdesc:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">More...</a><br /></td></tr>
-<tr class="separator:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memTemplParams" colspan="2">template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memTemplItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">More...</a><br /></td></tr>
+<tr class="separator:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a0e79ed59263ebc3478c43f2f9a50cb5a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0e79ed59263ebc3478c43f2f9a50cb5a">&#9670;&nbsp;</a></span>AccessType</h2>
+<a id="a10431ed94c0dd66a8c1d01ba7c8b5aa2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a10431ed94c0dd66a8c1d01ba7c8b5aa2">&#9670;&nbsp;</a></span>AccessType</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">Base::AccessType</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="af4576dca736bab8ac73b308522cb4a67"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af4576dca736bab8ac73b308522cb4a67">&#9670;&nbsp;</a></span>Base</h2>
+<a id="a24fa369165de783a72311d8ec3115c48"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a24fa369165de783a72311d8ec3115c48">&#9670;&nbsp;</a></span>Base</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_&gt; <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67">Base</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_&gt; <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48">Base</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a5484b46ac2646edb7a185b51137f70c0"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5484b46ac2646edb7a185b51137f70c0">&#9670;&nbsp;</a></span>BaseParams</h2>
+<a id="a5dd2a31d41d9098e928c559af12cbe66"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5dd2a31d41d9098e928c559af12cbe66">&#9670;&nbsp;</a></span>BaseParams</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0">BaseParams</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66">BaseParams</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a1c433ba0eea5e6a46f36101d8de98ed0"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1c433ba0eea5e6a46f36101d8de98ed0">&#9670;&nbsp;</a></span>Delta</h2>
+<a id="afdb38f790d9c7cf1ac238643103b45ce"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afdb38f790d9c7cf1ac238643103b45ce">&#9670;&nbsp;</a></span>Delta</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Base::Delta</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Base::Delta</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a95da23108b74ad085024ab45e84083e1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a95da23108b74ad085024ab45e84083e1">&#9670;&nbsp;</a></span>Fragment</h2>
+<a id="aa5386367e805cdaf47a5e7564bedc2fb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa5386367e805cdaf47a5e7564bedc2fb">&#9670;&nbsp;</a></span>Fragment</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Base::Fragment</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Base::Fragment</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a48de0db7ee2ee9699b946a9d5a0364c7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a48de0db7ee2ee9699b946a9d5a0364c7">&#9670;&nbsp;</a></span>FragmentConstIterator</h2>
+<a id="adfcd8a2e63bd0c515ef03760cc1c4283"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adfcd8a2e63bd0c515ef03760cc1c4283">&#9670;&nbsp;</a></span>FragmentConstIterator</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">Base::FragmentConstIterator</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">Base::FragmentConstIterator</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a2b13136a970fae187fcb377c9be28fac"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2b13136a970fae187fcb377c9be28fac">&#9670;&nbsp;</a></span>FragmentElement</h2>
+<a id="a96e55c1ce2475115e6e834f3996c9ee8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a96e55c1ce2475115e6e834f3996c9ee8">&#9670;&nbsp;</a></span>FragmentElement</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">Base::FragmentElement</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">Base::FragmentElement</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a0843b2d82422e7178f324a8d3be9d705"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0843b2d82422e7178f324a8d3be9d705">&#9670;&nbsp;</a></span>FragmentIterator</h2>
+<a id="ace8a65d90db264a0ee93a810be38918f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ace8a65d90db264a0ee93a810be38918f">&#9670;&nbsp;</a></span>FragmentIterator</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">Base::FragmentIterator</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a3b872e85844c9e009fa480a71a829136"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3b872e85844c9e009fa480a71a829136">&#9670;&nbsp;</a></span>FragmentShape</h2>
+<a id="a82ceeea55603dbb0c6e5bf9c22ac692e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a82ceeea55603dbb0c6e5bf9c22ac692e">&#9670;&nbsp;</a></span>FragmentShape</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">Base::FragmentShape</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">Base::FragmentShape</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a5ac2280dfcac08cec17b8c0db1c4593e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5ac2280dfcac08cec17b8c0db1c4593e">&#9670;&nbsp;</a></span>Index</h2>
+<a id="aae07fdedeef68abd4e6c099924c70910"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aae07fdedeef68abd4e6c099924c70910">&#9670;&nbsp;</a></span>Index</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Base::Index</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Base::Index</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a552a67fb03c28e985d143f6193f88308"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a552a67fb03c28e985d143f6193f88308">&#9670;&nbsp;</a></span>Iterations</h2>
+<a id="a8628ea7116f736b59c644fc0d85d395f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8628ea7116f736b59c644fc0d85d395f">&#9670;&nbsp;</a></span>Iterations</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Base::Iterations</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Base::Iterations</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a5aa507eaeb63951f8e69fb223ec41809"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5aa507eaeb63951f8e69fb223ec41809">&#9670;&nbsp;</a></span>PredicateVector</h2>
+<a id="adc4182adb78e34b7741f297eca86fe35"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adc4182adb78e34b7741f297eca86fe35">&#9670;&nbsp;</a></span>Pointer</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">Base::PredicateVector</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>* <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35">Pointer</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ad52318b430437575b55099ca992ca3a7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad52318b430437575b55099ca992ca3a7">&#9670;&nbsp;</a></span>Scalar</h2>
+<a id="a6157fe8a2ffefd45eba6f3953f0e2994"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6157fe8a2ffefd45eba6f3953f0e2994">&#9670;&nbsp;</a></span>PredicateVector</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Base::Scalar</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">Base::PredicateVector</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ab7922305d47b67e6cfb439e4e8d9f09b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab7922305d47b67e6cfb439e4e8d9f09b">&#9670;&nbsp;</a></span>SharedStorage</h2>
+<a id="ac3273690cdd0a1c2e61d29b289daf5b5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac3273690cdd0a1c2e61d29b289daf5b5">&#9670;&nbsp;</a></span>Scalar</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Base::Storage</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Base::Scalar</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a57348779bb004ed1ea0fd9cc252e895d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a57348779bb004ed1ea0fd9cc252e895d">&#9670;&nbsp;</a></span>Skew</h2>
+<a id="af6c297bb43573a13f6b721cc8ff730ca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af6c297bb43573a13f6b721cc8ff730ca">&#9670;&nbsp;</a></span>SharedStorage</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Base::Skew</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Base::Storage</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">SharedStorage</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a6a6f51f459f98c0cddeacf476660cd27"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6a6f51f459f98c0cddeacf476660cd27">&#9670;&nbsp;</a></span>ThreadOffset</h2>
+<a id="a18248da35dc9a0ae2411121bee323085"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a18248da35dc9a0ae2411121bee323085">&#9670;&nbsp;</a></span>Skew</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">Base::ThreadOffset</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Base::Skew</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a8a87c8ef986e110a01a9226012594a61"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8a87c8ef986e110a01a9226012594a61">&#9670;&nbsp;</a></span>Tile</h2>
+<a id="acd3c170dd70bee777cb9e9dc662c5eac"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acd3c170dd70bee777cb9e9dc662c5eac">&#9670;&nbsp;</a></span>TensorRef</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Base::Tile</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef</a>&lt;<a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, 4&gt; <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a6f50a8aec2d7045e9057b93df08172a8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6f50a8aec2d7045e9057b93df08172a8">&#9670;&nbsp;</a></span>Traits</h2>
+<a id="a076357a165302f01f449fd91f9ed402a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a076357a165302f01f449fd91f9ed402a">&#9670;&nbsp;</a></span>ThreadOffset</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Base::Traits</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">Base::ThreadOffset</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad18ee6f519b03e1dbf711339b63e16d6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad18ee6f519b03e1dbf711339b63e16d6">&#9670;&nbsp;</a></span>Tile</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Base::Tile</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5016bd7b24938026a2879ec0054eb3b6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5016bd7b24938026a2879ec0054eb3b6">&#9670;&nbsp;</a></span>Traits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Base::Traits</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -605,19 +679,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="aac4d49854d63f632627b6974f9b59dbb"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aac4d49854d63f632627b6974f9b59dbb">&#9670;&nbsp;</a></span>TileStoreIterator() <span class="overload">[1/3]</span></h2>
+<a id="a9f4501c6e8ba0f4511919c1b63c14e69"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9f4501c6e8ba0f4511919c1b63c14e69">&#9670;&nbsp;</a></span>TileStoreIterator() <span class="overload">[1/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -632,19 +706,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="a037ccd942359e6bc8640a240b13cd330"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a037ccd942359e6bc8640a240b13cd330">&#9670;&nbsp;</a></span>TileStoreIterator() <span class="overload">[2/3]</span></h2>
+<a id="aa563bb10f8e58d97e81959556923e210"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa563bb10f8e58d97e81959556923e210">&#9670;&nbsp;</a></span>TileStoreIterator() <span class="overload">[2/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> const &amp;&#160;</td>
           <td class="paramname"><em>_params</em>, </td>
@@ -658,8 +732,8 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>&#160;</td>
-          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>()</code>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>&#160;</td>
+          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>()</code>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -676,19 +750,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="a4f89c5182659de94605300e15c3651b2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4f89c5182659de94605300e15c3651b2">&#9670;&nbsp;</a></span>TileStoreIterator() <span class="overload">[3/3]</span></h2>
+<a id="a2b58a21331cf3255f5d3938a39babf20"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2b58a21331cf3255f5d3938a39babf20">&#9670;&nbsp;</a></span>TileStoreIterator() <span class="overload">[3/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::<a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> const &amp;&#160;</td>
           <td class="paramname">, </td>
@@ -696,20 +770,14 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a> &amp;&#160;</td>
-          <td class="paramname"><em>shared_storage</em>, </td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>block_offset</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;0,&#160;0)</code>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>&#160;</td>
-          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>()</code>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>&#160;</td>
+          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>()</code>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -727,22 +795,23 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a5ebab59862d5f50ad980871515d999b0"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5ebab59862d5f50ad980871515d999b0">&#9670;&nbsp;</a></span>data()</h2>
+<a id="aa6977ded39ead005b3435f13f0e51116"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa6977ded39ead005b3435f13f0e51116">&#9670;&nbsp;</a></span>add_pointer_offset()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a>* <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::data </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::add_pointer_offset </td>
           <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
         </tr>
       </table>
   </td>
@@ -754,19 +823,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="a1614b27755cf82c0e1f3e7852c5a4c75"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1614b27755cf82c0e1f3e7852c5a4c75">&#9670;&nbsp;</a></span>inc_advance()</h2>
+<a id="a3ecd73de1202f7e4a0db86d9fe9de38d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3ecd73de1202f7e4a0db86d9fe9de38d">&#9670;&nbsp;</a></span>inc_advance()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_advance </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_advance </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -781,19 +850,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="a74dffe1ddcc84935ab170117e939b7e3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a74dffe1ddcc84935ab170117e939b7e3">&#9670;&nbsp;</a></span>inc_d()</h2>
+<a id="abcb7af7b35e605dfda5ce6a37a02f975"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abcb7af7b35e605dfda5ce6a37a02f975">&#9670;&nbsp;</a></span>inc_d()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_d </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_d </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -808,19 +877,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="a3793f5d5846862f22f1de736e36ae7c1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3793f5d5846862f22f1de736e36ae7c1">&#9670;&nbsp;</a></span>inc_h()</h2>
+<a id="aaec63ca7faf0cf4f54cac31c7d6e0d3d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aaec63ca7faf0cf4f54cac31c7d6e0d3d">&#9670;&nbsp;</a></span>inc_h()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_h </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_h </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -835,19 +904,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="a187e0852ec4862f6d3cb6249bedc3bb3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a187e0852ec4862f6d3cb6249bedc3bb3">&#9670;&nbsp;</a></span>inc_stage()</h2>
+<a id="ad61206a742c8c5ab5bcd64b76ece9f74"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad61206a742c8c5ab5bcd64b76ece9f74">&#9670;&nbsp;</a></span>inc_stage()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_stage </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_stage </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -862,19 +931,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="aa573a47a9ffc3e07239a09e2bc470cf1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa573a47a9ffc3e07239a09e2bc470cf1">&#9670;&nbsp;</a></span>inc_w()</h2>
+<a id="aa676184bbd4c2e3f6c09dbc548e6c4e1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa676184bbd4c2e3f6c09dbc548e6c4e1">&#9670;&nbsp;</a></span>inc_w()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::inc_w </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::inc_w </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -889,13 +958,13 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="af92ba20db048a9ec96976a1673f0f7c2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af92ba20db048a9ec96976a1673f0f7c2">&#9670;&nbsp;</a></span>initialize_predicates()</h2>
+<a id="acb6bc889b93d25c9e483a0b7297d7c89"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acb6bc889b93d25c9e483a0b7297d7c89">&#9670;&nbsp;</a></span>initialize_predicates() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename PredicateIterator &gt; </div>
 <table class="mlabels">
@@ -903,7 +972,7 @@ template&lt;typename PredicateIterator &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::initialize_predicates </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::initialize_predicates </td>
           <td>(</td>
           <td class="paramtype">PredicateIterator&#160;</td>
           <td class="paramname"><em>predicate_it</em>, </td>
@@ -935,13 +1004,59 @@ template&lt;typename PredicateIterator &gt; </div>
 
 </div>
 </div>
-<a id="a53820de506cecb1f5fb07b3385d8272a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a53820de506cecb1f5fb07b3385d8272a">&#9670;&nbsp;</a></span>store() <span class="overload">[1/2]</span></h2>
+<a id="a890a7239a89679662aeaea797ba32d32"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a890a7239a89679662aeaea797ba32d32">&#9670;&nbsp;</a></span>initialize_predicates() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename PredicateIterator , typename PredicateFunctor &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::initialize_predicates </td>
+          <td>(</td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>predicate_it</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">PredicateFunctor const &amp;&#160;</td>
+          <td class="paramname"><em>functor</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>block_offset</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa3ce9690a0e8c6457e570607474af7a6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa3ce9690a0e8c6457e570607474af7a6">&#9670;&nbsp;</a></span>load() <span class="overload">[1/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename Fragment , typename PredicateIterator &gt; </div>
 <table class="mlabels">
@@ -949,9 +1064,9 @@ template&lt;typename Fragment , typename PredicateIterator &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::store </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
           <td class="paramname"><em>fragment</em>, </td>
         </tr>
         <tr>
@@ -975,13 +1090,13 @@ template&lt;typename Fragment , typename PredicateIterator &gt; </div>
 
 </div>
 </div>
-<a id="a60258b7c1a1708f97e28f8f6c292bfe4"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a60258b7c1a1708f97e28f8f6c292bfe4">&#9670;&nbsp;</a></span>store() <span class="overload">[2/2]</span></h2>
+<a id="a8c42ab8699c3fd74dc7b59d559364b9a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8c42ab8699c3fd74dc7b59d559364b9a">&#9670;&nbsp;</a></span>load() <span class="overload">[2/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename Fragment &gt; </div>
 <table class="mlabels">
@@ -989,9 +1104,9 @@ template&lt;typename Fragment &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::store </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
           <td class="paramname"><em>fragment</em></td><td>)</td>
           <td> const</td>
         </tr>
@@ -1005,13 +1120,109 @@ template&lt;typename Fragment &gt; </div>
 
 </div>
 </div>
-<a id="a57aa2c36eb6ad9d2500c1f5396b3a526"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a57aa2c36eb6ad9d2500c1f5396b3a526">&#9670;&nbsp;</a></span>store_post_increment() <span class="overload">[1/2]</span></h2>
+<a id="ad33c46a584deb1c7968e08e349382af3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad33c46a584deb1c7968e08e349382af3">&#9670;&nbsp;</a></span>load() <span class="overload">[3/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a320c917d585df901e66257c7d9b4780c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a320c917d585df901e66257c7d9b4780c">&#9670;&nbsp;</a></span>load_element()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load_element </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>c</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a57c56e2fe02fc5c771283e35d59b9214"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a57c56e2fe02fc5c771283e35d59b9214">&#9670;&nbsp;</a></span>load_post_increment() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename Fragment , typename PredicateIterator &gt; </div>
 <table class="mlabels">
@@ -1019,9 +1230,9 @@ template&lt;typename Fragment , typename PredicateIterator &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::store_post_increment </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load_post_increment </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
           <td class="paramname"><em>fragment</em>, </td>
         </tr>
         <tr>
@@ -1045,13 +1256,13 @@ template&lt;typename Fragment , typename PredicateIterator &gt; </div>
 
 </div>
 </div>
-<a id="ae63949f58c1b32959bbfa5b64d521f0f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae63949f58c1b32959bbfa5b64d521f0f">&#9670;&nbsp;</a></span>store_post_increment() <span class="overload">[2/2]</span></h2>
+<a id="adfbd262dfb19fffd91e0712190d9712d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adfbd262dfb19fffd91e0712190d9712d">&#9670;&nbsp;</a></span>load_post_increment() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename Fragment &gt; </div>
 <table class="mlabels">
@@ -1059,9 +1270,233 @@ template&lt;typename Fragment &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::store_post_increment </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::load_post_increment </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a57b284e6cbff892d45e5cfeb0ae1e3ed"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a57b284e6cbff892d45e5cfeb0ae1e3ed">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&amp; <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0218adf569557b17d8e36a3d97fb185e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0218adf569557b17d8e36a3d97fb185e">&#9670;&nbsp;</a></span>store() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment , typename PredicateIterator &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>pred_it</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa27a456bf12d0e44adc89a1c2ca7bc3b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa27a456bf12d0e44adc89a1c2ca7bc3b">&#9670;&nbsp;</a></span>store() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::store </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1f7c4143443d2bee4a69d1b380576f08"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1f7c4143443d2bee4a69d1b380576f08">&#9670;&nbsp;</a></span>store_element()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::store_element </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> const &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>c</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="adbb7fdb5710295cdfb86e090a8c40f44"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adbb7fdb5710295cdfb86e090a8c40f44">&#9670;&nbsp;</a></span>store_post_increment() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment , typename PredicateIterator &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::store_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">PredicateIterator&#160;</td>
+          <td class="paramname"><em>pred_it</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a35ab2595b09912d31a60c2a4e5847c88"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a35ab2595b09912d31a60c2a4e5847c88">&#9670;&nbsp;</a></span>store_post_increment() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::store_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> const &amp;&#160;</td>
           <td class="paramname"><em>fragment</em></td><td>)</td>
           <td></td>
         </tr>
@@ -1076,19 +1511,19 @@ template&lt;typename Fragment &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="a8059c57030df99b73309e9210ec5f624"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8059c57030df99b73309e9210ec5f624">&#9670;&nbsp;</a></span>kAdvance</h2>
+<a id="a39cecf8198d1286f497930cce632c671"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a39cecf8198d1286f497930cce632c671">&#9670;&nbsp;</a></span>kAccessSize</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kAdvance = Base::kAdvance</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kAccessSize = Base::kAccessSize</td>
         </tr>
       </table>
   </td>
@@ -1100,19 +1535,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="a94c0567316118abfb84fc28560a5a46a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a94c0567316118abfb84fc28560a5a46a">&#9670;&nbsp;</a></span>kIteratorFragment</h2>
+<a id="a44200854ad5b35c1863f73c435b8750b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a44200854ad5b35c1863f73c435b8750b">&#9670;&nbsp;</a></span>kAdvance</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kIteratorFragment = Base::kIteratorFragment</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kAdvance = Base::kAdvance</td>
         </tr>
       </table>
   </td>
@@ -1124,19 +1559,19 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="adaebec9eacf767f63f048033de73ea5b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#adaebec9eacf767f63f048033de73ea5b">&#9670;&nbsp;</a></span>kMemorySpace</h2>
+<a id="a9fb3af1ab0eeb5b17b42bb990edf0e4f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9fb3af1ab0eeb5b17b42bb990edf0e4f">&#9670;&nbsp;</a></span>kFragmentElementType</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::kMemorySpace = Base::kMemorySpace</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kFragmentElementType = Base::kFragmentElementType</td>
         </tr>
       </table>
   </td>
@@ -1148,48 +1583,72 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="a5e6c00b99e0f752137b07f7059f6ee0f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5e6c00b99e0f752137b07f7059f6ee0f">&#9670;&nbsp;</a></span>params</h2>
+<a id="a993e1e7d8cc461a9cfa009b61b42621f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a993e1e7d8cc461a9cfa009b61b42621f">&#9670;&nbsp;</a></span>kMemorySpace</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::params</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::kMemorySpace = Base::kMemorySpace</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a64e0c9fb1f7d8fcc77bf0a915445ee6d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a64e0c9fb1f7d8fcc77bf0a915445ee6d">&#9670;&nbsp;</a></span>params</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::params</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ae435b72b15eca46eb871446d92bd316e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae435b72b15eca46eb871446d92bd316e">&#9670;&nbsp;</a></span>stage</h2>
+<a id="aff36e4a3de7e27667542564e0ec96a7e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aff36e4a3de7e27667542564e0ec96a7e">&#9670;&nbsp;</a></span>stage</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::stage</td>
+          <td class="memname">int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::stage</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a350f5beea87d811f43c55519bc0b9035"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a350f5beea87d811f43c55519bc0b9035">&#9670;&nbsp;</a></span>thread_offset</h2>
+<a id="a00a33d258b9d60c8f9d4bfc48e2c6825"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a00a33d258b9d60c8f9d4bfc48e2c6825">&#9670;&nbsp;</a></span>thread_offset</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;4&gt; <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::thread_offset</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;4&gt; <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::thread_offset</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -1202,7 +1661,7 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileStoreIterator.png b/docs/structcutlass_1_1TileStoreIterator.png
index a20f18cfe5132b95f7238f8db747c862f04b5455..c86ef843d3db3f93dca9f1cac100ead5a6aa3d93 100644
GIT binary patch
literal 2318
zcmd5;dpOhkAK%PzjY;VuETK}zH6gd{RA`DLq#~Ck5hA%Orbg0{X|9pq+{?YD+KI9q
zmyuh3E}PqIOekjVHk<FxI_EsU-(SD~f1l@hf8OuU>-GNY^*pcF^GR`Zu$7ZhmH~l4
za>#RMoj@QlKr}l_K}5H!;R6d%+vj+}#abv7ipHh&x$@?SbkX!zk;&vMZ=zjAPpNPx
z2WOCI>BkxBbTJe`1<13%xI}~51@pM^YI*A%V$}+Oy?=9*a_-=G<PlcgOkrZdZ<5G^
zI;EuQ`G#_8gopEdLv2{fC7cs36Ic2?lY8FD4tLmPN)M@x%yUd3X_jf;I;{o#Af-<>
zqhoZCPu>QR1hqxT)rb>WrOsLVa(-26h=X-_AaKEzS3KS}Me;hnn%5un!i5)e!WV5q
z*bn94s``fzxa(|pj?(f8K})3<MQHf*zsrkI3mbOXLPcTE!u991UVs&V3qN0e9X6?l
zB!-(a*A;yE?OYmdH8y&T^uBTwj=9rz_a2o$vt2O;e_z-BNqM$}>R~ygfE#?}6r?(8
zikS^(x(Bm@2V*j)v)hFF$9c=d$RX@ClbxP?tfneh!aLV5NU;e<!TYbeJz1DHm^l8q
zMpDexwILHp=;B7CnBk?A(9U>v9TUD@)dn{lsqG6s)g<4eGPZu^jso)TF%^jk>@aTn
zhT$|TR}U!BB+88RR>xhSYoDgw7LQ7_D#9%oav1C#4mUm;558b$O;aIYRX|4@*KO7r
zk{A7$^p(uw%vHdST}EwUm!oKJy+~>^p<=TieFobteHr0Qf2#bw1oPan*$NfD)Dkp=
z&4_{>eXM^UhA{}=kx#zAH128B;z>I)IhoMJ$4{YmFw>@jqwE<61e>yIVLB9s=d0<`
z?uvbhy}X;$%poSn@+mB#!ny!Ga~3yFXs^*}QKoh0`i(tGRaDoxTS@QVe27Z)RvC#s
zN9bzcg!KJO-=D(%R-$R4(&tE>LEzljCyJwVKG#f5s-Oo5qu{=9;an`+IbbQO_xM|N
z;P#eH+nm`geQdMj9*6EG{&^>j-_ZKy-A^%Hcw5tv%`{5Wd|JkUR`Bb~ICrS{&+939
zk2UK9uG78g@#hJFgWFxl7uqjwrYQ@)NC2k*`kAU<B)It98Y;xS%O)5L6(R%{5&&;T
z8*!59Bx4&0<tOEm7^BkAXA9rGCR+ZM_WO!O<j15XcL7O~0t~R_`9be@`5I-X;e%Q}
z%eQjs`E~7U0WYvJ0hU<`sGX_qfuXI^sojvUEBk#o29c8{c`~`zT)vpMT1hU>sUCW-
zrUL-FR;aSPxQb5bW<ct%A$I)x2=hI+J1Jk`)wf|8rH&G4<W`bdV}WMUR>wKqRicL}
z#(Dl;ErSh6MrGZgvcR^hiyX|hn}DcGAO;~Dim|Dh&)46`hTORs-?LtZ`8Xes3%`Vw
z3{spLYp*fPq~oU7_>CmZZLyOdgqx~PxY#7?oKk#0RD4_&Xth>EBkhp=iFN`lZ7t-k
zW6L?EnVR;mTD?S;H7fdt+-gR9&`!RqozHWlMHJY9v=f9jXpobrf5_xQN<lLNc=%^H
zLdM%n3lM?4HEZ+=G+iv$KII2!rzH@9(pf(?Mc)5GIQ~V5od5qo2%_AweUUm{gwkx^
zt22tS2$_RF>1QaS6LynDvVfgHB2^^MfiJvjg^7qF2`)O$B4$t5M%BprmJ#8AnM$(u
zMO}Q=Sll9sv3&K&QP;gSEzV-%-*ut-F6nv+yW(DknZyR}4dQ-F*a-%`ao|Cu)^-A@
z9xtI;i9i>?z~tpR!Jzuu8$7*bMz?OZwv`s5FrNz<$5nLNidsKAfp+G_s-(iJJ*1`r
zTKyRCZfFqLFCJDGd~c+&4H$*ux1kMn2oLis4-O>QWKG?jV4c<wZUh$G+;E^?;>o`5
znnLGh?HKB4oORpoh}bpxPS^qL^aeeOp&YK@qXa3&b!FXcrdDxu+27X@WLBlFlHXUN
zqiZo(Otsx$XatY}oJnqi;|96{K<n<XkbKJju-)8DY76r)74Dt=IUVcM#Kk7KCk6RY
zt;(0O<31jKXnq=RMAlse=)KIdl)y7RBc5bY7@7&<PJxMOEBVH1QykC<u6gA5WV=hl
z+f~99&%K2gA;sq(@JGMo#&2>BOrj!ak9)Slj7`w<8f19GReZT_n>sMb-<MkCGb}!X
zncXl{j%>7&hDxr{g}a45peU87M(kPvi{!=04KM(-q}9JH5_|)nqv#vu)e>kD|3==B
z+aS-cSS)x%V<;Q-G%&c^dMtf0UPBN_T;uJxk)k}Sk@C)oU@!_TQGKan1GdO$)56K>
z9x$Q`Qbaw;%s!w55!kl`NFoNdSuuSPreW(FMW4R?C#b^y2`Y#Yfh*}#InfQQx+P}B
zar_q=7fnxjOiA1W6V;^rwN+uQISdqWTVml!BRU4Nt^eKgB9t!;lmzc%-BKfigc;Wp
zSsRCdo9W4{NG8jkZOg^ZY`^ByDE{Q%5k5xPM@G8dmxU{8@^ece`G$@;vwCx6OM!%t
z6Z%FN)cA+hbGF5PxiYhmPIVn*vd0ppj?r_uP<P<lCcVx6N@A>nU+6UreM4wB$~W~>
z`*0G&|Co13Wb}l(@ynn?YmbMYyyfy6xrte^#z!i(cvij3ubT(*S1e(DY1a9KP#!dJ
ztQ~adrwlOD<XefX0OQVxoZR71!}$<T<l`@MmlH~2Hfevv>jCb2Kg0moR8YND<fL40
zcio4k@N^S8lu1y74r{g&vF^S{8^J^X+5ji(IcChh>{nA#Wwx(Dz){KYJJ0^M+yC@o
i(~{SJZCl<i1o6sV@Fudx%S4|S5YpP=Z0%|9hkpWNJe36i

literal 2309
zcmchZX;2eL8itc_CxQYh6S)>lI0O_CQRI?CB%BJ7W94?D2qEDRB9Ti#5oa`PgeU>z
z2qGDfLqX&S5TXde1W1tEghOsHC=nRKF_E3xs{OIM|F)~T`|Gant9rYu-={k5g7bN4
z@F6e&0FXx5*|-7#AdWD;ASogoq1dEF;q=o5N94JkogHDg{C&2#H7Z>g?e><I7SF1i
z?!u+y4OeG3fH3Jt`}hHAAl%A8*jOTO0+(_ZA_kA_NwKK7wy{l!C9WrlwzgrM&jj=Z
zWgnyn)VEMR11GD>7s#FiQMr&ZVn%vV3heikqFNXncHIg_gKMiH<kjc&5K;*8J_HtF
zZ^ufR?Y;Gf9O8Z@I$`rgxqVbU)t&{HQDt1bbCsuDCkmTWlX+peRQ37rBV4d04K@eL
zn;Ol;d{2T94s9FiBO(SvO+#2F_*5TdX7rOi0VLvnH6xRr*DD_!@YvwwEk&1YV;X!;
z*75ze2i}2o_$^c1Q@bOr02iaIs>iimiGRJujOwX3F|0MN^y6Gh-U=}>Gx3J<9&iGw
zZ_<mvcb@g<e`m)W)ifiZy=@<yLpbZwTxuxh<{{^wx8Il=U)c64Vq4CnJ-HSPZjzWh
zJY1&Yw7NCR&HViNA|p>+qa#hK@4y7UPywI4fo)FO$#8Sv*`Xk>nj)S?e^kPCTJF0C
zGgdN%l;t(SJLt%E!Ew#)3&cmsb<Qv1b)EJX%nc_)3iL`~I@56t*_JkK!SBeW4a6MN
z;B|HjtYaKq0c};Ih31*jlubTZjys*EUBSOUIjF*c-af$z>k-gCzs}0<U0rMnS9sDe
z<26t#+hfu-+|2F2I9AZP!#rfHc{QIC<Lqbu$*ce1coJt#IzjFU?9!mZ&kWXdw05^N
zZLNhFC&wOfpKYHSJRMF^oXr0FM<Z)2mg*Ab#(3H6XhX~y4C}P3{P4_R+N=L4#mep%
zr7mLh3m#swKW!-$rqdsrZK)ifPg|I!sEhJdLVgIR(#^Reo^WGh@C_&IiHLciuM@At
zx3~No`5jsfWyh;mrF|N8Z1rzU*{d~rbBRwX0+Tp&@^Pp{hu^I?Zw7SEUe?!(kSm|{
z<<m!gEnYjjd({Z-oXfEz1egwOF0QdC8fC~UDqQ<$)l`gINx%O{hQ|AbeX+N9M7M{8
zJZghDhr#z#a9B;;a~u?d>E*IahBbZg$B3D$sCRsopdT`gzs5p-mymziBZwU1`JLhl
zzEmsHPvg*Mn$aO`M+>{7*V&O`9&NXzUy)=K0z4jgm4<IfWps%|R3HDq2}HO087k}7
zXpwNljYDsG6q!Tuef-tB^(5s_=*v;Dx*<*SwCkY@VP)f3&_c~xV=wt}5%?~L$cKby
z=ECmWd<N@izasBE?kdQdYZ&3Cm%<KnQDN;&uCbto&uL?tN5HR(R%F1SF`=zG-c&-C
z3ivao9>LOTD!4g$+blAAlmtuVS_ogiLjG@CwFD#rywAvoxP3BSqw>Ex(hl$7YDLs|
zD?uBG@{wPtFHei|8K4R=u@2n?+5upIX)BiE-+=n6+nb1Z5g4G@`kzbl!Q4%8J3!an
zqElx<{`Rmspd3KxcIkA$6QS7?MO#wr@WONro85FZA_pLqDD@A%u*C7+Zi$c(|JRb`
zNKX<9q1*WqMnZW_gCJ)?!c)orM_q;1JOTqUd~76dzJK7NOGQW}Z+h84$s<xQ9Di%_
zlY>RIcnw1f2r}#txgpyJ8T%KiC{A$)eoAD(n*pH4Lfjy`BEbi~nZcpy0@am(09*0l
zXx|tF&ndJrAv^;BRADKO$vS!nc_m_MwTMo9oS4ZP{bpp&eBIlax0D;X^@=%KI&4cX
zuOg(fuL=r`#qKY@mFfZ@wRFuU%;e{XYM-MNhjPlOlM4RtSOTQU5u_=P1j$urXQoyN
zu6=ir$khydO4XiM`IQj#3Sa%lg@=@5IH2aP%CWbi^WbpfUKeih#z@7O#Z(`wLBF+*
z>!O~#BylZ&Sh65X=c!nhryx<*O^x?HXWhD`gYNy@-GZdw+3z<+zteM2x-yVc+W@us
zxy-$+t{!q48aiLv0#IVEl8-B~Mr7N2M#3pd`}<Sa4TBbKQy^qX#KQ%7-o4f6ohtXb
zdc(jPBj%Bn%Zfl6rEA#WBwS`r`CIcVTV@)x1oxEv*cC^vIrk<Xx5mHZ4>+(YHndz_
z7e|^Qb8dOg7^Tg{i6&%{oAGGMH2w#s5(I&YnTJSQs78=8+71QtoN`rs6tu*e8lcpA
zvC7ST_R`N(DFe$qS3<?3Qt1403gP~~9zi*k2NDSib1iy!AZ)@mE|qh2tWTto%=v1H
z)ySZts^1?i#(g4iFc^&hecx7z{g}pRya=+AFVpYX(X}1f#dt^a1r8@wjlsNGwAtiZ
zs1t9YxCy)`%oRKnRI>$epAZs?5*=VzQ3PKRqg9Zi94xGtcL|lOT3G9quSXpXk+?s~
zFFViUIDc{G8H|n=Hb28vyVUc2TkHid1Mz;RzF+cBl<%(SiFLwQ^SZ;E6GlvV+3YVO
z-IEi=i@$6Qhr2GS3?Ws`<9~C@zn9e~SYkL1ew4e%KFyZ=cScoa<q8=^*3#LlH-kPO
zj2C#v(jUgV%Vv^dL;u*gJcAhvE1_2W#VCnoNez=0Y-_1#liI?2jhxnJt0&mF+GZMK
z7fyc00@@EaG1mRGfwsQc%V3ZBE5)gxx-1NUv3_^rfy8RpP`F~40i7?tE><$X>4qYZ
vWtO|Y9=;9#ALciorRjDO|8lJ3ogKh*F)8LYLOntFX8|D2Iop(5`6vAep@d<`

diff --git a/docs/structcutlass_1_1TileStoreIterator_1_1Params-members.html b/docs/structcutlass_1_1TileStoreIterator_1_1Params-members.html
index 5d34eba8f..9a12c4821 100644
--- a/docs/structcutlass_1_1TileStoreIterator_1_1Params-members.html
+++ b/docs/structcutlass_1_1TileStoreIterator_1_1Params-members.html
@@ -73,30 +73,39 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params Member List</div>  </div>
+<div class="title">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a71f5238a712f7b2f377fb58938ac829b">initialize</a>(SharedStorage &amp;storage)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#af0d26a2df2a1a5ba3c3169b736bd5d43">initialize</a>(Scalar *ptr, Index stride_d, Index stride_h, Index stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ac1cfe92f1543ba445fa10f1859a0db98">initialize</a>(Scalar *ptr, Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#af884f720d36aa82e7f972932686ae986">initialize</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">cutlass::TileIteratorBase::Params::initialize</a>(Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">cutlass::TileIteratorBase::Params::initialize</a>(Index _stride_d, Index _stride_h, Index _stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#aca14058b112b7d5105658457341726cb">initialize</a>(SharedStorage &amp;storage)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a0d36c05a4a757db5ebfe5f180b174b8c">initialize</a>(Scalar *ptr)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a23c9e9d1d2bed7e5d8579df9cc42dda3">initialize</a>(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6a7702de0e88449b3d1864b208adf87a">initialize</a>(Scalar *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ad90642d96a3b5354813fbf4d9b04b83f">initialize</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">cutlass::TileIteratorBase::Params::initialize</a>(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">cutlass::TileIteratorBase::Params::initialize</a>(Coord&lt; 4 &gt; const &amp;stride)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">cutlass::TileIteratorBase::Params::initialize</a>(long long _stride_d, Index _stride_h, Index _stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a79304c022d2466c97cd671a98128815a">Params</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ae1cb260e7b05034ec9b7fa61c92bbc80">Params</a>(Scalar *ptr)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#afae37ebc78884290300f38fce7c021b1">Params</a>(TensorRef const &amp;ref)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#aa131e0ef02ce37038c1a17bea7088ef6">Params</a>(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9cf4cd4ecb0a81cf3c03a70c7bfc4e09">Params</a>(Scalar *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">cutlass::TileIteratorBase::Params::Params</a>(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">cutlass::TileIteratorBase::Params::Params</a>(Coord&lt; 4 &gt; const &amp;stride)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileStoreIterator_1_1Params.html b/docs/structcutlass_1_1TileStoreIterator_1_1Params.html
index 3da80d41b..909a87cc9 100644
--- a/docs/structcutlass_1_1TileStoreIterator_1_1Params.html
+++ b/docs/structcutlass_1_1TileStoreIterator_1_1Params.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params Struct Reference</title>
+<title>Cutlass: cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params Struct Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,7 +77,7 @@ $(function() {
 <a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="structcutlass_1_1TileStoreIterator_1_1Params-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params Struct Reference</div>  </div>
+<div class="title">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params Struct Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -86,76 +86,103 @@ $(function() {
 
 <p><code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">tile_iterator.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params:</div>
+Inheritance diagram for cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1TileStoreIterator_1_1Params.png" usemap="#cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E::Params_map" alt=""/>
-  <map id="cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E::Params_map" name="cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20IteratorFragment_5F_2C_20Skew_5F_20_3E::Params_map">
-<area href="structcutlass_1_1TileIteratorBase_1_1Params.html" title="Parameters to the iterator. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params" shape="rect" coords="0,0,782,24"/>
+  <img src="structcutlass_1_1TileStoreIterator_1_1Params.png" usemap="#cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E::Params_map" alt=""/>
+  <map id="cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E::Params_map" name="cutlass::TileStoreIterator_3C_20Traits_5F_2C_20Scalar_5F_2C_20Advance_5F_2C_20MemorySpace_2C_20Index_5F_2C_20FragmentElement_5F_2C_20FragmentElementType_5F_2C_20Skew_5F_20_3E::Params_map">
+<area href="structcutlass_1_1TileIteratorBase_1_1Params.html" title="Parameters to the iterator. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params" shape="rect" coords="0,0,814,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a71f5238a712f7b2f377fb58938ac829b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a71f5238a712f7b2f377fb58938ac829b">initialize</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a> &amp;storage)</td></tr>
-<tr class="memdesc:a71f5238a712f7b2f377fb58938ac829b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#a71f5238a712f7b2f377fb58938ac829b">More...</a><br /></td></tr>
-<tr class="separator:a71f5238a712f7b2f377fb58938ac829b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af0d26a2df2a1a5ba3c3169b736bd5d43"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#af0d26a2df2a1a5ba3c3169b736bd5d43">initialize</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a> *ptr, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>)</td></tr>
-<tr class="memdesc:af0d26a2df2a1a5ba3c3169b736bd5d43"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to access a raw pointer.  <a href="#af0d26a2df2a1a5ba3c3169b736bd5d43">More...</a><br /></td></tr>
-<tr class="separator:af0d26a2df2a1a5ba3c3169b736bd5d43"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac1cfe92f1543ba445fa10f1859a0db98"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ac1cfe92f1543ba445fa10f1859a0db98">initialize</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a> *ptr, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance)</td></tr>
-<tr class="memdesc:ac1cfe92f1543ba445fa10f1859a0db98"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="#ac1cfe92f1543ba445fa10f1859a0db98">More...</a><br /></td></tr>
-<tr class="separator:ac1cfe92f1543ba445fa10f1859a0db98"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af884f720d36aa82e7f972932686ae986"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#af884f720d36aa82e7f972932686ae986">initialize</a> ()</td></tr>
-<tr class="memdesc:af884f720d36aa82e7f972932686ae986"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to default values.  <a href="#af884f720d36aa82e7f972932686ae986">More...</a><br /></td></tr>
-<tr class="separator:af884f720d36aa82e7f972932686ae986"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
-<tr class="memitem:ad2631ffcc963638aa5b016c66a2e2c55 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">initialize</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance)</td></tr>
-<tr class="memdesc:ad2631ffcc963638aa5b016c66a2e2c55 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">More...</a><br /></td></tr>
-<tr class="separator:ad2631ffcc963638aa5b016c66a2e2c55 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3ba93370bd4b2ede4bd4eb97ac0881be inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">initialize</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w)</td></tr>
-<tr class="separator:a3ba93370bd4b2ede4bd4eb97ac0881be inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af496afebb8983e5d346c681334955224 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">initialize</a> ()</td></tr>
-<tr class="separator:af496afebb8983e5d346c681334955224 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a79304c022d2466c97cd671a98128815a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a79304c022d2466c97cd671a98128815a">Params</a> ()</td></tr>
+<tr class="separator:a79304c022d2466c97cd671a98128815a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae1cb260e7b05034ec9b7fa61c92bbc80"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ae1cb260e7b05034ec9b7fa61c92bbc80">Params</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr)</td></tr>
+<tr class="separator:ae1cb260e7b05034ec9b7fa61c92bbc80"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afae37ebc78884290300f38fce7c021b1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#afae37ebc78884290300f38fce7c021b1">Params</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef</a> const &amp;ref)</td></tr>
+<tr class="memdesc:afae37ebc78884290300f38fce7c021b1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs with a CompactTensorRef&lt;&gt;  <a href="#afae37ebc78884290300f38fce7c021b1">More...</a><br /></td></tr>
+<tr class="separator:afae37ebc78884290300f38fce7c021b1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa131e0ef02ce37038c1a17bea7088ef6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#aa131e0ef02ce37038c1a17bea7088ef6">Params</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr, long long <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</td></tr>
+<tr class="separator:aa131e0ef02ce37038c1a17bea7088ef6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9cf4cd4ecb0a81cf3c03a70c7bfc4e09"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9cf4cd4ecb0a81cf3c03a70c7bfc4e09">Params</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr, long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance)</td></tr>
+<tr class="separator:a9cf4cd4ecb0a81cf3c03a70c7bfc4e09"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aca14058b112b7d5105658457341726cb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#aca14058b112b7d5105658457341726cb">initialize</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">SharedStorage</a> &amp;storage)</td></tr>
+<tr class="memdesc:aca14058b112b7d5105658457341726cb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#aca14058b112b7d5105658457341726cb">More...</a><br /></td></tr>
+<tr class="separator:aca14058b112b7d5105658457341726cb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0d36c05a4a757db5ebfe5f180b174b8c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a0d36c05a4a757db5ebfe5f180b174b8c">initialize</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr)</td></tr>
+<tr class="memdesc:a0d36c05a4a757db5ebfe5f180b174b8c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="#a0d36c05a4a757db5ebfe5f180b174b8c">More...</a><br /></td></tr>
+<tr class="separator:a0d36c05a4a757db5ebfe5f180b174b8c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a23c9e9d1d2bed7e5d8579df9cc42dda3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a23c9e9d1d2bed7e5d8579df9cc42dda3">initialize</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr, long long <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</td></tr>
+<tr class="memdesc:a23c9e9d1d2bed7e5d8579df9cc42dda3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to access a raw pointer.  <a href="#a23c9e9d1d2bed7e5d8579df9cc42dda3">More...</a><br /></td></tr>
+<tr class="separator:a23c9e9d1d2bed7e5d8579df9cc42dda3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6a7702de0e88449b3d1864b208adf87a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6a7702de0e88449b3d1864b208adf87a">initialize</a> (<a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr, long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance)</td></tr>
+<tr class="memdesc:a6a7702de0e88449b3d1864b208adf87a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="#a6a7702de0e88449b3d1864b208adf87a">More...</a><br /></td></tr>
+<tr class="separator:a6a7702de0e88449b3d1864b208adf87a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad90642d96a3b5354813fbf4d9b04b83f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ad90642d96a3b5354813fbf4d9b04b83f">initialize</a> ()</td></tr>
+<tr class="memdesc:ad90642d96a3b5354813fbf4d9b04b83f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to default values.  <a href="#ad90642d96a3b5354813fbf4d9b04b83f">More...</a><br /></td></tr>
+<tr class="separator:ad90642d96a3b5354813fbf4d9b04b83f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:acc0341b88143aac4ffd9bc1dcfaafa71 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">Params</a> ()</td></tr>
+<tr class="memdesc:acc0341b88143aac4ffd9bc1dcfaafa71 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">More...</a><br /></td></tr>
+<tr class="separator:acc0341b88143aac4ffd9bc1dcfaafa71 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab04617136a3bf909ef27eb97ea5ef81c inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">Params</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, long long _inc_advance)</td></tr>
+<tr class="memdesc:ab04617136a3bf909ef27eb97ea5ef81c inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">More...</a><br /></td></tr>
+<tr class="separator:ab04617136a3bf909ef27eb97ea5ef81c inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac030ea4568fa2cb6d6661df75062cd1a inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">Params</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;stride)</td></tr>
+<tr class="memdesc:ac030ea4568fa2cb6d6661df75062cd1a inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params with a stride vector.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">More...</a><br /></td></tr>
+<tr class="separator:ac030ea4568fa2cb6d6661df75062cd1a inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a802c270449da579ed8661e915d27ce60 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">initialize</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, long long _inc_advance)</td></tr>
+<tr class="memdesc:a802c270449da579ed8661e915d27ce60 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">More...</a><br /></td></tr>
+<tr class="separator:a802c270449da579ed8661e915d27ce60 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2ef70d9e13b5aa7e4a53233b153d7edd inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">initialize</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;stride)</td></tr>
+<tr class="memdesc:a2ef70d9e13b5aa7e4a53233b153d7edd inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes the parameters object from a vector of strides.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">More...</a><br /></td></tr>
+<tr class="separator:a2ef70d9e13b5aa7e4a53233b153d7edd inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a44870d45442ec45c8eaba46ab47a3ad9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">initialize</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w)</td></tr>
+<tr class="memdesc:a44870d45442ec45c8eaba46ab47a3ad9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes the parameters object from a vector of strides.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">More...</a><br /></td></tr>
+<tr class="separator:a44870d45442ec45c8eaba46ab47a3ad9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1776bf51e1e23cde6c58529be58aafb9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">initialize</a> ()</td></tr>
+<tr class="memdesc:a1776bf51e1e23cde6c58529be58aafb9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gotta have this.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">More...</a><br /></td></tr>
+<tr class="separator:a1776bf51e1e23cde6c58529be58aafb9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:a6bbadae6b13aef8f31a77cacd88b068b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a></td></tr>
-<tr class="memdesc:a6bbadae6b13aef8f31a77cacd88b068b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Pointer to memory.  <a href="#a6bbadae6b13aef8f31a77cacd88b068b">More...</a><br /></td></tr>
-<tr class="separator:a6bbadae6b13aef8f31a77cacd88b068b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
-<tr class="memitem:ad67234ec264354a22032bb2519575dc1 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a></td></tr>
-<tr class="separator:ad67234ec264354a22032bb2519575dc1 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a58e8c883aea4cfdfa5a84c25a4704ebc inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a></td></tr>
-<tr class="separator:a58e8c883aea4cfdfa5a84c25a4704ebc inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a313984457c78eea66c980f6813047b9c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a></td></tr>
-<tr class="separator:a313984457c78eea66c980f6813047b9c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af95fa1b5102176a0fa9b17713fd48150 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a></td></tr>
-<tr class="separator:af95fa1b5102176a0fa9b17713fd48150 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aea591d4278a8338ae8b50fa0b8f3a366 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a></td></tr>
-<tr class="separator:aea591d4278a8338ae8b50fa0b8f3a366 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac6e81450a2d78555a6c2415dcc42b178 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a></td></tr>
-<tr class="separator:ac6e81450a2d78555a6c2415dcc42b178 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1187258cd4068a627e73bee0302f1fc2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a></td></tr>
-<tr class="separator:a1187258cd4068a627e73bee0302f1fc2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9e50043acd3b851cce169310a04c6827"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a></td></tr>
+<tr class="memdesc:a9e50043acd3b851cce169310a04c6827"><td class="mdescLeft">&#160;</td><td class="mdescRight">Pointer to memory.  <a href="#a9e50043acd3b851cce169310a04c6827">More...</a><br /></td></tr>
+<tr class="separator:a9e50043acd3b851cce169310a04c6827"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:a235647baff946e483dd61a2069aa01d2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a></td></tr>
+<tr class="separator:a235647baff946e483dd61a2069aa01d2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4f029a268387bd63112d9074c185c623 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a></td></tr>
+<tr class="separator:a4f029a268387bd63112d9074c185c623 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af7e7a71a9fa41cc3f6d0e5963963339d inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a></td></tr>
+<tr class="separator:af7e7a71a9fa41cc3f6d0e5963963339d inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7b4293bf8291b0383dee695a60f2e0fd inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a></td></tr>
+<tr class="separator:a7b4293bf8291b0383dee695a60f2e0fd inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a15227102466522445261b6ea65c89c06 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a></td></tr>
+<tr class="separator:a15227102466522445261b6ea65c89c06 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af0be1271cfe6d6c03a9a76ff992d8a5c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a></td></tr>
+<tr class="separator:af0be1271cfe6d6c03a9a76ff992d8a5c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6d8f1e07f286ed8d5761e2a878b807d3 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a></td></tr>
+<tr class="separator:a6d8f1e07f286ed8d5761e2a878b807d3 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
-<h2 class="groupheader">Member Function Documentation</h2>
-<a id="a71f5238a712f7b2f377fb58938ac829b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a71f5238a712f7b2f377fb58938ac829b">&#9670;&nbsp;</a></span>initialize() <span class="overload">[1/4]</span></h2>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a79304c022d2466c97cd671a98128815a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a79304c022d2466c97cd671a98128815a">&#9670;&nbsp;</a></span>Params() <span class="overload">[1/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a> &amp;&#160;</td>
-          <td class="paramname"><em>storage</em></td><td>)</td>
+          <td class="paramname"></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -168,39 +195,95 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="af0d26a2df2a1a5ba3c3169b736bd5d43"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af0d26a2df2a1a5ba3c3169b736bd5d43">&#9670;&nbsp;</a></span>initialize() <span class="overload">[2/4]</span></h2>
+<a id="ae1cb260e7b05034ec9b7fa61c92bbc80"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae1cb260e7b05034ec9b7fa61c92bbc80">&#9670;&nbsp;</a></span>Params() <span class="overload">[2/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a> *&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="afae37ebc78884290300f38fce7c021b1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afae37ebc78884290300f38fce7c021b1">&#9670;&nbsp;</a></span>Params() <span class="overload">[3/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa131e0ef02ce37038c1a17bea7088ef6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa131e0ef02ce37038c1a17bea7088ef6">&#9670;&nbsp;</a></span>Params() <span class="overload">[4/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *&#160;</td>
           <td class="paramname"><em>ptr</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype">long long&#160;</td>
           <td class="paramname"><em>stride_d</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>stride_h</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>stride_w</em>&#160;</td>
         </tr>
         <tr>
@@ -218,63 +301,63 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="ac1cfe92f1543ba445fa10f1859a0db98"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac1cfe92f1543ba445fa10f1859a0db98">&#9670;&nbsp;</a></span>initialize() <span class="overload">[3/4]</span></h2>
+<a id="a9cf4cd4ecb0a81cf3c03a70c7bfc4e09"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9cf4cd4ecb0a81cf3c03a70c7bfc4e09">&#9670;&nbsp;</a></span>Params() <span class="overload">[5/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::Params </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a> *&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *&#160;</td>
           <td class="paramname"><em>ptr</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype">long long&#160;</td>
           <td class="paramname"><em>_stride_d</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_stride_h</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_stride_w</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype">long long&#160;</td>
           <td class="paramname"><em>_inc_d</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_inc_h</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_inc_w</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
           <td class="paramname"><em>_inc_advance</em>&#160;</td>
         </tr>
         <tr>
@@ -292,19 +375,200 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 
 </div>
 </div>
-<a id="af884f720d36aa82e7f972932686ae986"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af884f720d36aa82e7f972932686ae986">&#9670;&nbsp;</a></span>initialize() <span class="overload">[4/4]</span></h2>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="aca14058b112b7d5105658457341726cb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aca14058b112b7d5105658457341726cb">&#9670;&nbsp;</a></span>initialize() <span class="overload">[1/5]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">SharedStorage</a> &amp;&#160;</td>
+          <td class="paramname"><em>storage</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0d36c05a4a757db5ebfe5f180b174b8c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0d36c05a4a757db5ebfe5f180b174b8c">&#9670;&nbsp;</a></span>initialize() <span class="overload">[2/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a23c9e9d1d2bed7e5d8579df9cc42dda3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a23c9e9d1d2bed7e5d8579df9cc42dda3">&#9670;&nbsp;</a></span>initialize() <span class="overload">[3/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>stride_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>stride_h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>stride_w</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6a7702de0e88449b3d1864b208adf87a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6a7702de0e88449b3d1864b208adf87a">&#9670;&nbsp;</a></span>initialize() <span class="overload">[4/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *&#160;</td>
+          <td class="paramname"><em>ptr</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_stride_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_stride_h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_stride_w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_inc_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_inc_h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_inc_w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td>
+          <td class="paramname"><em>_inc_advance</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad90642d96a3b5354813fbf4d9b04b83f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad90642d96a3b5354813fbf4d9b04b83f">&#9670;&nbsp;</a></span>initialize() <span class="overload">[5/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::initialize </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -320,16 +584,16 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="a6bbadae6b13aef8f31a77cacd88b068b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6bbadae6b13aef8f31a77cacd88b068b">&#9670;&nbsp;</a></span>pointer</h2>
+<a id="a9e50043acd3b851cce169310a04c6827"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9e50043acd3b851cce169310a04c6827">&#9670;&nbsp;</a></span>pointer</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, IteratorFragment::Kind IteratorFragment_ = IteratorFragment::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
+template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_ = IteratorAdvance::kH, MemorySpace::Kind MemorySpace = MemorySpace::kGeneric, typename Index_  = int, typename FragmentElement_  = Scalar_, FragmentElementType::Kind FragmentElementType_ = FragmentElementType::kScalar, typename Skew_  = Shape&lt;0, 0, 0, 0&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a>* <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params::pointer</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a>* <a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a>&lt; Traits_, Scalar_, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params::pointer</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -342,7 +606,7 @@ template&lt;typename Traits_ , typename Scalar_ , IteratorAdvance::Kind Advance_
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileStoreIterator_1_1Params.png b/docs/structcutlass_1_1TileStoreIterator_1_1Params.png
index aabb9a31b62d0c368676729782cd1d8ca3f55c4f..1e0529a4532d6653720cd57dac7402f452ff4dee 100644
GIT binary patch
literal 2515
zcmdUxdo<MR9>#xE?w1`MlG>!9P5dhNkV^?;CPZ!-hKS^{YeaG#_Aa|MxebwRQgSOA
zRAw|YE|bfQq*3m|pka_Z4PnNd+4f%NthLuUYn^}3yVm=@&+}dHKhL|?_w&B@oE&VW
zB@Rdc03Z#uvvvl6U7$caiR}`sZTL?F!M5KCe(@Zi&lkug&U9&0WQIWPOe&S?@iN*?
zV8w1aJGcOXLw}6k_KUgzAbuHYZFMnPX#UYSiuse&IoW=_c)l$YVrV1$HYoAD*@rYD
zE}W$*{%hs8+^`{Hzz|VqkQfFdh7AQ)L!H&2_aN%neOai?Vr#4%^b+>J3*9W(#wF~&
z3u}CC<#XtIq|t+7bpzU@%bjqfC`vJ-IR9b=rmr7VA;n!$n1Epw;!0Of!~`pbexE^K
z*kkA1@sh(n!mMkGMTu8Tyh4DA?lr;J_EYLtv=TLQN9HbfRUx+<5Re%Kb}JK$fsA~K
zqRt-vx<)~f6kFR$p0C0Nwi?&8suM-&6*;j(#)c~RmTf}fX~%(6k5limpWn$SPIKe*
z6{hNCj(RR|3>R#Ev4w_vl5l|r7TbN5m(=>bf34yLVHrTyQNve8;ubP2$C_At`rN30
zgFDtsc6TU2w-}D~rd7duF!%KK6&)k4B8m_lu?u|3gsVtALM@Be&dXVy?db?Ej2Dwp
zgQi`oO<LC@LQcVL;t#I2CT35#xhCt)wi@BoZjRVqx7{zV^$zSlKFk=iriHj)si?;e
z$EZHZf+01r9VU-Q^?6Pp-hp=cru)gM@*nFE2m(PCFVj3D_rA5HHG%hW!IQ+;aOyT+
za6VSrZ2LO#v;XkhVRK|_gh~>k$!ja&gouP1oTIN45tJg;add^N`}-R0q`0i;x9%&N
zxe-)ZSF<_dp+QA|k5Jn79fVBK6fSl0vb+<kpQNP77>hHSZKt-i#{MozL%jLmAE5>f
zA7l}80#dyK;elHj7u1T?Y-ec=x8O&1vltC25Xy_KWf7kEFM*?v&F!0-g;LlS@gk;a
zw*A;)l-$WlU4?wd^-Ex>`r5A2eDH!v%uFQe2E!{e1vS%sI<~IRMRXP17hwFBKBERb
z<OaUouWuv+Hl|e%te3~oE6p7l8E@YCK*LY}P~G6za}$!+D>o~$zHN*3jw0W8|INl_
zggxo(YMw^7Dtm+oJj5X&MEurn-3wnj1D>^@sO1{cSj!g6%TL_`Q8O-z=a#_E$MD16
z&zM)4=PPRMqEhYSjsLv(&nq0`9xv^j5Y)-CaMZ>@tCU(EV{7lMqk)65M(5~UbC=9?
zCuOs0N`D^LDM5`XKip)i7mjaL3c{8|jC~fpMq{!t*7^H9&nj0e%%H~7%(JuO(|y2g
z(A<w>KrbtAH1qLKh*_=a6s_^^FAd%1mJ#M-u|3@!Z!ZXbfH9FS=r3d&L>a3;rE>%t
zI1)83mD9J5X#C8RzV#rWk0lhe`Yk9K+I1g!EVmwZ=!g}zaw#Vh@|qbnF73wdM<7kw
zo>J_)bbgc_P;aTt_v&=I1?xgCZ<S#nJYjNeOu1$PEYq&bH9>W3d}$nG*Jas$PSDr(
zkYMQlAl{`Q1YE%W8x#2g0CByzLUw>0dbh7l`yN$+bmMMh#q5;!Xey$2s|tB67v}Ux
zS_)?X9Z(Vg0mP}2&f0*urEoQ5Qc#2dFlX@p$}TNlu-AlYmOx6fvDwb;QWAe;g8(Q0
zii<_<q*wo&l_$l;A=;kJ@gpe><{#!tWv2YDWxt;~5LLxXH)YNq?EU&QGTI)E9$x`m
zlH-K5zr&~ezIA~EOWi_662NbseJYl1^~dVebE|C{wh7Ly-XwU!DT8OCKnM9>kYu?C
z?;g&Ur0R53)Tt|?y@q9?%dk~FI%t+pwww0(eB>)8pU{uynHu9<ILuQrn4)}~IUOm5
zOd_V8ks1bW)|6LGoj$I=`g0>OICwF@yO%E%wL{6XIxFKOSJ(s@vqa!`Y%BS$wAid^
zJg56{??qK{@+xk`Z4wo)&nBU#T)nm2I)BEza@DuAll-A~?slaQ$TnE#@3E+<as%;A
z!#C28XErY@GOUbVo-wK*ONU?P?F!7hziG_I@WtM^J{aqWS-w+ykQKRicrUG3C@L>u
zJWAxKt`9}aYktoTBr%B&RQ&43`61cKFA}{R-hvhzQD%Q1fxrtODbYOB#c<iO5;7q-
zMQTPM=}LwR1%{HQY;I`5+QVhs$Oq)6*o53jD7-u4ixXH_py9tTmyxt#U4XRdUNF`e
zA4eyUwI@+B-wV@HMu<oHO*`zn2dgGgZ%oQUwG~yWtK{-=WCEkdFV<be225B-oM1PF
z{h0p@?X_lySNCM)C`WuUFQ$ybLA>%7_fJHM`Q}DiFrQfXeVp6swuMF;kA38pb^6km
zrw?3z4{gbQ?-2@)z(^184#++XC%3EyPCu!?U*(u<KJuEbY!Z2*`;66H`8XU1?BFrf
z=rzAi!SCgwD<{o6z5sXlMpivq@JPK_ls7m;eUang9<`-H1x>wa$E=IqeV<*Fm!eyh
z6d5a^@*;=c;8G~o;XZ9wri0ukx@gg6+egiPdfMUO*_C85=Hy0}X0c?i@&`&VN1;08
z;@4)OM~F=gnVQMj<I@9~9+mG}wKj&4Wdk=@JT#~5fcimf*mf^$u-$Y%85zf&X%G%m
zx}rj<$Y1*O*$UTsI~AJ4ND5JTrWBigTrLb7ARYFCOfPtaIgyhcpZOOVPgCRxM>otE
znk`G;*c%11SLv1K2e})LAw%mx47ni$Q~ZyiJgyH2G-7MPCF$CR`6eZ8{30oVur-AI
zzKni-dsFW%puzPa&3S)iZ;a{+cf<_cG4jYmM#RskViqK>W9Yl0#FyvUeR@43Kw>lB
zmke-)$z~Q0))s$~L%-)*Qk%yuoSy%!WB;>VIh^Zk54G1+*DT2{&UV(|iozUAN$~ac
RDZvj6fSz-(t~}$L{7<5GwH^Qf

literal 2388
zcmb7G2{hDeAO71J8kIGSNp}bpvP>FD87_ajC~gRem}G0l5{5x064M}CWg8<GLzIxq
zFc)Qy>}#nQ`x;rlse8`1ob%mtzVAKfec#{nyuWjv-+Rvcd(InUVP<duA^`ya-~ec-
zcL@MEpsd(}mxHwum%3e9o4AFEwf_G8J}X>WpQbk8NUZ4Rq|@oPF9NTyATRcknH9iF
z`Z0Q2tW{amB&c`MI*@Jt>8#&KB{WLs)$c2N2_e^Kb;CI|x{J<8!UN*swWU7k0ta?n
z9r}B1`*9k5IEOH#t?WAz0!_xNn(%<Ch<7S51Pe2;KRAJ&i(~;%l{Q@(5{tNOTM_oX
z&pJ<Q)LNE#n3ynZne67MWh6+V5H(+VVa9_)Tvw8>K2ip&=?18Pyp+3*_YAngBvKKw
zb4Y1XX7=pHw1t2D{M?AwGu0Dh>uh9jZrfDy8D?q0sL9rDvrc{_LR<IwK%Ef}csFWj
z@F6XU5@qn+4C_9(J$h_-dc5=7)%@7zC20HYj=7YLL81L&vrb;E$@2GOCpE;#AF^>c
zb@5%3X<WtXa{5|MeGUcj2%10iD064#13sDA!I;`r1M?%n7>;6e!-kWeUPf>3+bZeR
zH)QfT#myc%LY9v})vFm0N0;Zhp+Xa|yz4`F5%`b?1)W!>U0CP$%&hlP$?M2t2SFpv
zt+G=5)?-Q(>HXaCC!f(E7;k2d(XNV?H|qI=DBO^00a`YkGd%O)enc;=m9}7HwDNqy
zoFkDERbJ!lo`Q7`RYBT8WH!&Ayn&*4VR(u=Tjni#vO5Nwddk%jm$Pq{j~gpR@j2XH
zWeR|Vyx=P1DI^4yRMHUwhlxm2L(+;0?y!r_2yKNbn%*2wjp9euC~YRv5e1CeaH0~-
zt2rh;qu7(0wI2a}^WsijFZTWs?H#yesaIV6Cbcj5Y?q8(y3nz6mGeCZA5jpeN05Fw
zeyt{NJr~Q2qF%~po4y-Sv=VHrj$J1S%cjE}y9{hSiRZTz`M6*UB0C;VWOb);xJwb4
zjDSS>i|4j6Yp7^(kKKsr3Uu-~Ccv%TtwO^WB-Y|_zOkTPTnX9d3%B&^NCfUaR=&?R
z(06(BmY~>%8=trkRUd5nED)11lAQF}vOberP60Hwzgje$K#}*=ilY_w`q{T)HB(Wv
zQUVbMa}!$DfN_6X_b#}$6ai%bHE3dKSF@anj1gufr%4U9R#15EM&eYyXg)<QkyiMv
zHwpSc*!9MBQ=;ULhe$zGjT^15#webWC^fW1p+bsCqeG&zwXKuUkb3HZR^4FVHTyXD
zm)87d|M`cV5UEozr4}V#x7;S?O>*8H=V&B<%iyO6dPHIU#_8G0o-ar5onLb=GB79Z
zJbqG|o9<E&ue^b2%N5Ln!NyK(Y7yF7g2%+$jUnCb?E{>}X&s;Au_TK3eGrN8h<}}g
z;0p3QreKfJQQMvQCRTI#5~)Nru(cz_KpC_Ou|s*f+=esBSRQW$5VBGcQ{<C}?_4Xs
zphV3_Xg7!<7V%D<PhhWQnedO>-aOzI_cUfbKYA=hJq8h~vDZQW+h+djKy$j3Hj62m
zt(KUrrs+rk-1M*qjsSN!+funR3J?dHN*up(u+ZdR$Qzj|$jUJ%G65$*93BOz00QBe
z2YT4(fQktZz(H4m0RjL6`-A^K$#6L;OUNk|%2NL+7X4G>e<YV|oPT@VX#3dp^kdiG
z@JL%$6&w@C|7#(W5zsn8W%n}A{c5{R1GPU2>Z>vst@D-9!~NfyB^OPj(X&+lBeE9=
zAD00u;qUB~|Fp3;`k^OO!lPRE*yWeo*6pzJ!4s<`g`C=XjFTq-k$52d=$V#~Ye9+7
zjG=Z)za_hHpdnAV0q^DSHcViN_f@%MC?9D_emwh##0Ea|c5ax?@QJ50ut?*g(O=tX
zFA_3)zHT=9K-32%i&Z$fvT^H&7Qbhu?FJ52ID}ZK<966{^iWSQ2GQwLqkgyQTCh_e
zSNGC(d+I5F68dBcf>qAuw9i<6MOVewj&hMlPR-a6*g)MZg+t27rnJJc<L2YqFx^)b
zj*Ucr31$~c{@$BRYwl)cGQn#y$&I#E76`r+<m5Zjj&A_ZbCRW=KKpRjFS$f&7bks*
z*QGmL-dUQGp|4ku>36jWARq!BY+Z2z_-+O<29%g2iPP=#N>LNrH!fzOXY%~Js*6UT
zr=Gb;DPJHe8Q{*(!qmr}K_e@vD_&1KNT)j%z9`=o#y-D>q<R>#41%njsDU%1>xSyq
znddRrBolou5}8a^`Pc!mrLKI&yr!k#c)5Jyo(9a{YRbQmNrLqiytPS~*R)@3k(wrX
zck&&Q9{J|61VO~eym};*Z0FU04o+c)s-a#gq^+v0TND-A9y)5Iu2Y+pP&xn&UAuf3
zf~rxR2_~=!XxdQ{L=4ID2Zx;FRP$EJQ0J_5{+waxdabyelX=hfaCV8K!;|aXqLYOP
z`zk{7JkTZ6oo(wf@4DO>EUmQAepp2=?jFL$FZxf@1$J;jbiJ4!jyUC8P+S2&YBU1P
zoyEN33=WNm<wBPFc<%9|+NiFhG=`m`n)0-Y09^~q%OC35pbiU{Q^uUjWsqtb(8wS>
z#+Thx&cSBBPyr@-Usd%5m4UMyhX@#ww+q#E$RDL)$0R$qn?;9y89fs;VqUe#_?=JE
zJ^034kyXj&rw#J}h&o@}s5jiLMai9jc({5b@#Ir}HN8Vg<&9!7P%t+3eZTMVUk8K4
zgVnE4^3ix>vjNLarJO6|1Rt}U<oCpthfr@3)<xXDXnV(fB^(_ci8Jj=XPS7K^MrfH
zyp~?#D#8EDv{Gy~3kAl?Rt>gSx4WGsZwXF@8T0Y}hglt`{}OU>Wr62g+n}%HMCQc4
zlNJ!dfeqTT^4O1+W83uGNhYNIZR`7X{d;$-@9~JYWSy1P7WHC%fdEk7Opm7P6!8xq
CU0MPF

diff --git a/docs/structcutlass_1_1TileStoreStream-members.html b/docs/structcutlass_1_1TileStoreStream-members.html
new file mode 100644
index 000000000..03cb5045a
--- /dev/null
+++ b/docs/structcutlass_1_1TileStoreStream-members.html
@@ -0,0 +1,107 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579">commit</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009">copy</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978">copy</a>(Fragment const &amp;frag)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">fragment</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">intermediate_fragment</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">source_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">TileStoreStream</a>(Params const &amp;_params, TensorRef const &amp;_ref)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084">TileStoreStream</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">transformed_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">transformer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileStoreStream.html b/docs/structcutlass_1_1TileStoreStream.html
new file mode 100644
index 000000000..06c454fc2
--- /dev/null
+++ b/docs/structcutlass_1_1TileStoreStream.html
@@ -0,0 +1,556 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1TileStoreStream-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Generic stream for transforming and storing fragments.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__stream_8h_source.html">tile_stream.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1TileStoreStream.png" usemap="#cutlass::TileStoreStream_3C_20Iterator_5F_2C_20Transformer_5F_20_3E_map" alt=""/>
+  <map id="cutlass::TileStoreStream_3C_20Iterator_5F_2C_20Transformer_5F_20_3E_map" name="cutlass::TileStoreStream_3C_20Iterator_5F_2C_20Transformer_5F_20_3E_map">
+<area href="structcutlass_1_1PredicatedTileStoreStream.html" title="Generic stream for transforming and storing fragments. " alt="cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;" shape="rect" coords="0,56,477,80"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters used to construct the stream.  <a href="structcutlass_1_1TileStoreStream_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html">PredicateVector</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Empty predicate vector struct.  <a href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a35009c9a697f20fd5a7ee634de4d6c97"><td class="memItemLeft" align="right" valign="top">typedef Iterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a></td></tr>
+<tr class="memdesc:a35009c9a697f20fd5a7ee634de4d6c97"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1TileLoadIterator.html" title="An iterator implementing Tile Load Iterator Concept for loading a tile from memory. ">TileLoadIterator</a>.  <a href="#a35009c9a697f20fd5a7ee634de4d6c97">More...</a><br /></td></tr>
+<tr class="separator:a35009c9a697f20fd5a7ee634de4d6c97"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa8c192da812ec83329350e5838838f5e"><td class="memItemLeft" align="right" valign="top">typedef Transformer_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a></td></tr>
+<tr class="memdesc:aa8c192da812ec83329350e5838838f5e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformer.  <a href="#aa8c192da812ec83329350e5838838f5e">More...</a><br /></td></tr>
+<tr class="separator:aa8c192da812ec83329350e5838838f5e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea4357a67b8abef10f91a45e64840878"><td class="memItemLeft" align="right" valign="top">typedef Transformer::InputFragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a></td></tr>
+<tr class="memdesc:aea4357a67b8abef10f91a45e64840878"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source fragment.  <a href="#aea4357a67b8abef10f91a45e64840878">More...</a><br /></td></tr>
+<tr class="separator:aea4357a67b8abef10f91a45e64840878"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae14c71f6bb331030429d346f0140c993"><td class="memItemLeft" align="right" valign="top">typedef Transformer::OutputFragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a></td></tr>
+<tr class="memdesc:ae14c71f6bb331030429d346f0140c993"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformed fragment, compatible with Iterator::Fragment.  <a href="#ae14c71f6bb331030429d346f0140c993">More...</a><br /></td></tr>
+<tr class="separator:ae14c71f6bb331030429d346f0140c993"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2255d760e812cfe8e31f114cdb5793fe"><td class="memItemLeft" align="right" valign="top">typedef Iterator::TensorRef&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a></td></tr>
+<tr class="memdesc:a2255d760e812cfe8e31f114cdb5793fe"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference expected by the underlying iterator.  <a href="#a2255d760e812cfe8e31f114cdb5793fe">More...</a><br /></td></tr>
+<tr class="separator:a2255d760e812cfe8e31f114cdb5793fe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa0e894a30d3a979ac56e5134360a08f4"><td class="memItemLeft" align="right" valign="top">typedef Iterator::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">Index</a></td></tr>
+<tr class="memdesc:aa0e894a30d3a979ac56e5134360a08f4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="#aa0e894a30d3a979ac56e5134360a08f4">More...</a><br /></td></tr>
+<tr class="separator:aa0e894a30d3a979ac56e5134360a08f4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:af85b3acfc29e41ee605df64b09698a8b"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">TileStoreStream</a> (<a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a> const &amp;_ref)</td></tr>
+<tr class="memdesc:af85b3acfc29e41ee605df64b09698a8b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#af85b3acfc29e41ee605df64b09698a8b">More...</a><br /></td></tr>
+<tr class="separator:af85b3acfc29e41ee605df64b09698a8b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a08e7e7bf74e1e0d670dd6a4e65d14084"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084">TileStoreStream</a> (<a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;threadblock_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:a08e7e7bf74e1e0d670dd6a4e65d14084"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a08e7e7bf74e1e0d670dd6a4e65d14084">More...</a><br /></td></tr>
+<tr class="separator:a08e7e7bf74e1e0d670dd6a4e65d14084"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a50b6b5bd08fd83baa36c3dc4461ca009"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009">copy</a> ()</td></tr>
+<tr class="memdesc:a50b6b5bd08fd83baa36c3dc4461ca009"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and increments the iterator.  <a href="#a50b6b5bd08fd83baa36c3dc4461ca009">More...</a><br /></td></tr>
+<tr class="separator:a50b6b5bd08fd83baa36c3dc4461ca009"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa0f3c75e59054d6229de159474c9c978"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978">copy</a> (<a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> const &amp;frag)</td></tr>
+<tr class="memdesc:aa0f3c75e59054d6229de159474c9c978"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a fragment and increments the iterator.  <a href="#aa0f3c75e59054d6229de159474c9c978">More...</a><br /></td></tr>
+<tr class="separator:aa0f3c75e59054d6229de159474c9c978"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab5176fc539364fdf63647dc33020f579"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579">commit</a> ()</td></tr>
+<tr class="memdesc:ab5176fc539364fdf63647dc33020f579"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commits the store operation.  <a href="#ab5176fc539364fdf63647dc33020f579">More...</a><br /></td></tr>
+<tr class="separator:ab5176fc539364fdf63647dc33020f579"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad6ff1786f85d64053ece0ac8ae9a92b5"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">fragment</a> ()</td></tr>
+<tr class="memdesc:ad6ff1786f85d64053ece0ac8ae9a92b5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the transformed fragment.  <a href="#ad6ff1786f85d64053ece0ac8ae9a92b5">More...</a><br /></td></tr>
+<tr class="separator:ad6ff1786f85d64053ece0ac8ae9a92b5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff77aed0f1b1583b01a427fc935c5d71"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">intermediate_fragment</a> ()</td></tr>
+<tr class="memdesc:aff77aed0f1b1583b01a427fc935c5d71"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accesses the fragment after trasnforming.  <a href="#aff77aed0f1b1583b01a427fc935c5d71">More...</a><br /></td></tr>
+<tr class="separator:aff77aed0f1b1583b01a427fc935c5d71"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a601a296ec830e9b98aca9d5cf4b4010c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a></td></tr>
+<tr class="memdesc:a601a296ec830e9b98aca9d5cf4b4010c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterator to store tiles.  <a href="#a601a296ec830e9b98aca9d5cf4b4010c">More...</a><br /></td></tr>
+<tr class="separator:a601a296ec830e9b98aca9d5cf4b4010c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a61d57147150bffda0c1662d6131a3934"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">transformer</a></td></tr>
+<tr class="memdesc:a61d57147150bffda0c1662d6131a3934"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformation applied to inputs.  <a href="#a61d57147150bffda0c1662d6131a3934">More...</a><br /></td></tr>
+<tr class="separator:a61d57147150bffda0c1662d6131a3934"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0880c28b3ec82d38571ed332451c8d6a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">source_fragment</a></td></tr>
+<tr class="memdesc:a0880c28b3ec82d38571ed332451c8d6a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source fragment.  <a href="#a0880c28b3ec82d38571ed332451c8d6a">More...</a><br /></td></tr>
+<tr class="separator:a0880c28b3ec82d38571ed332451c8d6a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb5be2edcc35c7876abe5234663f9c48"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">transformed_fragment</a></td></tr>
+<tr class="memdesc:aeb5be2edcc35c7876abe5234663f9c48"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformed fragment from transformer.  <a href="#aeb5be2edcc35c7876abe5234663f9c48">More...</a><br /></td></tr>
+<tr class="separator:aeb5be2edcc35c7876abe5234663f9c48"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="aea4357a67b8abef10f91a45e64840878"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea4357a67b8abef10f91a45e64840878">&#9670;&nbsp;</a></span>Fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Transformer::InputFragment <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa0e894a30d3a979ac56e5134360a08f4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa0e894a30d3a979ac56e5134360a08f4">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator::Index <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a35009c9a697f20fd5a7ee634de4d6c97"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a35009c9a697f20fd5a7ee634de4d6c97">&#9670;&nbsp;</a></span>Iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator_ <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a2255d760e812cfe8e31f114cdb5793fe"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2255d760e812cfe8e31f114cdb5793fe">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator::TensorRef <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae14c71f6bb331030429d346f0140c993"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae14c71f6bb331030429d346f0140c993">&#9670;&nbsp;</a></span>TransformedFragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Transformer::OutputFragment <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa8c192da812ec83329350e5838838f5e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa8c192da812ec83329350e5838838f5e">&#9670;&nbsp;</a></span>Transformer</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Transformer_ <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="af85b3acfc29e41ee605df64b09698a8b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af85b3acfc29e41ee605df64b09698a8b">&#9670;&nbsp;</a></span>TileStoreStream() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_ref</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a08e7e7bf74e1e0d670dd6a4e65d14084"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a08e7e7bf74e1e0d670dd6a4e65d14084">&#9670;&nbsp;</a></span>TileStoreStream() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>threadblock_offset</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;0,&#160;0)</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ab5176fc539364fdf63647dc33020f579"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab5176fc539364fdf63647dc33020f579">&#9670;&nbsp;</a></span>commit()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::commit </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a50b6b5bd08fd83baa36c3dc4461ca009"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a50b6b5bd08fd83baa36c3dc4461ca009">&#9670;&nbsp;</a></span>copy() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::copy </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa0f3c75e59054d6229de159474c9c978"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa0f3c75e59054d6229de159474c9c978">&#9670;&nbsp;</a></span>copy() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::copy </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>frag</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad6ff1786f85d64053ece0ac8ae9a92b5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad6ff1786f85d64053ece0ac8ae9a92b5">&#9670;&nbsp;</a></span>fragment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a>&amp; <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::fragment </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aff77aed0f1b1583b01a427fc935c5d71"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aff77aed0f1b1583b01a427fc935c5d71">&#9670;&nbsp;</a></span>intermediate_fragment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a>&amp; <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::intermediate_fragment </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a601a296ec830e9b98aca9d5cf4b4010c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a601a296ec830e9b98aca9d5cf4b4010c">&#9670;&nbsp;</a></span>iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a> <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::iterator</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0880c28b3ec82d38571ed332451c8d6a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0880c28b3ec82d38571ed332451c8d6a">&#9670;&nbsp;</a></span>source_fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::source_fragment</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aeb5be2edcc35c7876abe5234663f9c48"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeb5be2edcc35c7876abe5234663f9c48">&#9670;&nbsp;</a></span>transformed_fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a> <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::transformed_fragment</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a61d57147150bffda0c1662d6131a3934"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a61d57147150bffda0c1662d6131a3934">&#9670;&nbsp;</a></span>transformer</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a> <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::transformer</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__stream_8h_source.html">tile_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileStoreStream.png b/docs/structcutlass_1_1TileStoreStream.png
new file mode 100644
index 0000000000000000000000000000000000000000..c673a40f9d9f90fa675be57b30b9159281d18587
GIT binary patch
literal 1351
zcmb7EZBUX~7=6(`t=6p>HK}ZBF|txCGFn_ED@HLxLc!G3K6T0!%K%NYm|CZ8bhPjz
zlPFB3)CDp{3e+ewGNd&TTp+5ARLFpYWDODb-DdjPkG(U`z30w7^W10VoH>{9xX48w
zP!9kA7Ga}y5dZ+912KM{JGf_x(#+to6dx0hnVFdZ;im}$=P~s%h`yFYBH7oHM*^?&
zC<I&_0FwS&%IEQ$0brI2yDK6-4`O1Os<i7CVvy2I`4rl^=g`LAJ;hjNTf$zS+lZe^
zwrirC{tXp70vg`qVe}vAp|eu}zJ~}%^`byJ)*0OLlo`g?c9c5EG$Z2safU^<M0%<W
zaeZp-Mfd74%96J>$5q2tUtU_+*-&_n(d&*LBO027xHfgN$Xu?LRB$jox$EP|b75Ny
zG2FFw%rC8^Re7clhc`=?7A_(Ib-HvKf7OxQDQQSF)#KCF&H`Bp+g0t{%MH}&2^IBF
z**0yBtSr)D^VySJJq7J_Gu<g|I=6(nkAKuwsqmy&WBWrcH`nG|Q;`GZgogPBVn!(9
z5=s+Ox<N%^``RV;pol~Ll?tJ4dOanZ+r&Aeyk=R+J%xS&wYlm_&K5r{IL3+{2qO)O
z%jvjsE}hnK&GLq=9ZX5<N-+iH3noGzZ6+g|b-Z^s*xHbCVur8Kt>*7rG?`cU>D(dK
zm*03SR(&V+oNDgba&wWiGH$NL+!;KKr#*g<?fu$L6tq2ezI<BTGs$gLbzDpjjvWsl
z7yM&Up(?JM`hKQz5W+F}&Mo{Dy6}UE0&xvF(4%mJTMQ-J<AD@#`g+|4ZsPlAe`;bc
zcuS1%ku;wVq9=S4iCV`bMAudjtZ;hpfamskl3MUJZrV936}SnCh@)OumIv7n$~Z~9
z`<)iwbS8f9kN-!=t`lcz?O_ged)Aa+3ziVYcokrXW`Gl8txfFpSkPDgz0KYf#o?%d
zc%v(pfs$7x?$ivuCTX)<yL&jJt&G7;UrABf&}!K#?7$t{irpyKF`fd8O&Y_9isOQ<
z_mb50qczWZuD}HPqoQC8?Zap5pwFbg5knLSe({?S%(TB@+RrgBbj~XKa$V7lUnBRa
zs%nh3oup=^%S$H~GBhpHjSlD^49$4b5ffGS=lv*2Z{VhJRY?YD!|pKZaiibdasr}a
z%S!(w8}Z?<pB0KQa{T<4`<|-F(vPkCnfdOKmhO|BK+Ev6m?dyyvN^9mWN|>_56dFw
z=MJ}h(SCI#hnB~x;a;rV$tX(>uVs2FBN2VHbbsYb>eUxR8dPEK&EgGwsP|_ii7`j*
zw2zh7;}Q-oKfUdC@(*FAzKN>QD)s2wyV~FlI)?n1S(<p5w``D{UKo;yOye87maE$!
z;k$>{9M5mae3Es7p}BJEWVA4VwTW`7#hZu@Stt-2l&T3BR-c$52=#u)R}`+fhmH_t
z=M<-Ioda+5wP{Rms(Z!aXOAphVmQV0@!sJZ55*wOt`qdQ7KHMQsZZ|apbBy=MK?yR
z3RYHS@B8ThQ+=WuYOadBZ}M5e)oTfb@@^zkFfuh~y8N$^2ezYSh+0R|5h`)oI_Wqh
z?Lt@<t6#k0AuS^vG&sfISU_d0#^zrLZ_!^>bRvshv0+B{d|7EvBMfni2KwSW4|bZ^
xUkL*fi1D5nk-z{W2sDq*K-RVwwP$IaMs(YW1MSnvPCb}<02YJW#oKY<{J-?PwU__^

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1TileStoreStream_1_1Params-members.html b/docs/structcutlass_1_1TileStoreStream_1_1Params-members.html
new file mode 100644
index 000000000..2f4e2f61f
--- /dev/null
+++ b/docs/structcutlass_1_1TileStoreStream_1_1Params-members.html
@@ -0,0 +1,93 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088">iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#adfa2399bf13cdff16b7bfe1cb0dd2bd9">Params</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#acc400568f7694f818b5afbb109bd2e63">Params</a>(typename Iterator::Params const &amp;_iterator)</td><td class="entry"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileStoreStream_1_1Params.html b/docs/structcutlass_1_1TileStoreStream_1_1Params.html
new file mode 100644
index 000000000..e4b3edcaf
--- /dev/null
+++ b/docs/structcutlass_1_1TileStoreStream_1_1Params.html
@@ -0,0 +1,188 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1TileStoreStream_1_1Params-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Parameters used to construct the stream.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__stream_8h_source.html">tile_stream.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:adfa2399bf13cdff16b7bfe1cb0dd2bd9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#adfa2399bf13cdff16b7bfe1cb0dd2bd9">Params</a> ()</td></tr>
+<tr class="memdesc:adfa2399bf13cdff16b7bfe1cb0dd2bd9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#adfa2399bf13cdff16b7bfe1cb0dd2bd9">More...</a><br /></td></tr>
+<tr class="separator:adfa2399bf13cdff16b7bfe1cb0dd2bd9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acc400568f7694f818b5afbb109bd2e63"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#acc400568f7694f818b5afbb109bd2e63">Params</a> (typename Iterator::Params const &amp;_iterator)</td></tr>
+<tr class="memdesc:acc400568f7694f818b5afbb109bd2e63"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor with iterator params.  <a href="#acc400568f7694f818b5afbb109bd2e63">More...</a><br /></td></tr>
+<tr class="separator:acc400568f7694f818b5afbb109bd2e63"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:acd106661221997d7c5943daac8eb5088"><td class="memItemLeft" align="right" valign="top">Iterator::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088">iterator</a></td></tr>
+<tr class="memdesc:acd106661221997d7c5943daac8eb5088"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters to the iterator.  <a href="#acd106661221997d7c5943daac8eb5088">More...</a><br /></td></tr>
+<tr class="separator:acd106661221997d7c5943daac8eb5088"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="adfa2399bf13cdff16b7bfe1cb0dd2bd9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adfa2399bf13cdff16b7bfe1cb0dd2bd9">&#9670;&nbsp;</a></span>Params() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="acc400568f7694f818b5afbb109bd2e63"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acc400568f7694f818b5afbb109bd2e63">&#9670;&nbsp;</a></span>Params() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype">typename Iterator::Params const &amp;&#160;</td>
+          <td class="paramname"><em>_iterator</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="acd106661221997d7c5943daac8eb5088"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acd106661221997d7c5943daac8eb5088">&#9670;&nbsp;</a></span>iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">Iterator::Params <a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a>&lt; Iterator_, Transformer_ &gt;::Params::iterator</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__stream_8h_source.html">tile_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileStoreStream_1_1PredicateVector.html b/docs/structcutlass_1_1TileStoreStream_1_1PredicateVector.html
new file mode 100644
index 000000000..283d739ee
--- /dev/null
+++ b/docs/structcutlass_1_1TileStoreStream_1_1PredicateVector.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::PredicateVector Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a></li><li class="navelem"><a class="el" href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html">PredicateVector</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::PredicateVector Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Empty predicate vector struct.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__stream_8h_source.html">tile_stream.h</a>&gt;</code></p>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__stream_8h_source.html">tile_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1TileTraits-members.html b/docs/structcutlass_1_1TileTraits-members.html
index c4d8ddf52..7f5bea37a 100644
--- a/docs/structcutlass_1_1TileTraits-members.html
+++ b/docs/structcutlass_1_1TileTraits-members.html
@@ -73,20 +73,22 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt; Member List</div>  </div>
+<div class="title">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#a0a494c2eacb51b65487f8405908a0214">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraits.html b/docs/structcutlass_1_1TileTraits.html
index b81a51941..b95fdf273 100644
--- a/docs/structcutlass_1_1TileTraits.html
+++ b/docs/structcutlass_1_1TileTraits.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -74,9 +74,10 @@ $(function() {
 <div class="header">
   <div class="summary">
 <a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1TileTraits-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt; Struct Template Reference<div class="ingroups"><a class="el" href="group__tile__traits__concept.html">Tile Traits Concept</a></div></div>  </div>
+<div class="title">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt; Struct Template Reference<div class="ingroups"><a class="el" href="group__tile__traits__concept.html">Tile Traits Concept</a></div></div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -87,82 +88,132 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:ab831be0adb255eece4f2e12fd9713831"><td class="memItemLeft" align="right" valign="top">typedef Tile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831">Tile</a></td></tr>
-<tr class="memdesc:ab831be0adb255eece4f2e12fd9713831"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Shape.html" title="A Shape implementing Layout Concept describing the dimensions of a cube. ">Shape</a> of the tile.  <a href="#ab831be0adb255eece4f2e12fd9713831">More...</a><br /></td></tr>
-<tr class="separator:ab831be0adb255eece4f2e12fd9713831"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af88f5cea9f452d83004ea0fa0f9d56eb"><td class="memItemLeft" align="right" valign="top">typedef Delta_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb">Delta</a></td></tr>
-<tr class="memdesc:af88f5cea9f452d83004ea0fa0f9d56eb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of steps between accesses along each dimension.  <a href="#af88f5cea9f452d83004ea0fa0f9d56eb">More...</a><br /></td></tr>
-<tr class="separator:af88f5cea9f452d83004ea0fa0f9d56eb"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af7ae2fdb4c8f1702169cc7d437d2b469"><td class="memItemLeft" align="right" valign="top">typedef Iterations_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469">Iterations</a></td></tr>
-<tr class="memdesc:af7ae2fdb4c8f1702169cc7d437d2b469"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of accesses performed.  <a href="#af7ae2fdb4c8f1702169cc7d437d2b469">More...</a><br /></td></tr>
-<tr class="separator:af7ae2fdb4c8f1702169cc7d437d2b469"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af9c0fc178dac7f9dac8d254da34e04dd"><td class="memItemLeft" align="right" valign="top">typedef ThreadOffset_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd">ThreadOffset</a></td></tr>
-<tr class="memdesc:af9c0fc178dac7f9dac8d254da34e04dd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Functor that returns the logical coordinate of each entity's initial offset in the tile.  <a href="#af9c0fc178dac7f9dac8d254da34e04dd">More...</a><br /></td></tr>
-<tr class="separator:af9c0fc178dac7f9dac8d254da34e04dd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3632c351a28f71f6c140dd33089d80b0"><td class="memItemLeft" align="right" valign="top">typedef Tile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0">Tile</a></td></tr>
+<tr class="memdesc:a3632c351a28f71f6c140dd33089d80b0"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Shape.html" title="A Shape implementing Layout Concept describing the dimensions of a cube. ">Shape</a> of the tile.  <a href="#a3632c351a28f71f6c140dd33089d80b0">More...</a><br /></td></tr>
+<tr class="separator:a3632c351a28f71f6c140dd33089d80b0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad6d99ccf2fcd2bd47e45d068f4d99c82"><td class="memItemLeft" align="right" valign="top">typedef Delta_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82">Delta</a></td></tr>
+<tr class="memdesc:ad6d99ccf2fcd2bd47e45d068f4d99c82"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of steps between accesses along each dimension.  <a href="#ad6d99ccf2fcd2bd47e45d068f4d99c82">More...</a><br /></td></tr>
+<tr class="separator:ad6d99ccf2fcd2bd47e45d068f4d99c82"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a46b9e04bb8d33fcf8fc116cc48a555fc"><td class="memItemLeft" align="right" valign="top">typedef Iterations_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc">Iterations</a></td></tr>
+<tr class="memdesc:a46b9e04bb8d33fcf8fc116cc48a555fc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of accesses performed.  <a href="#a46b9e04bb8d33fcf8fc116cc48a555fc">More...</a><br /></td></tr>
+<tr class="separator:a46b9e04bb8d33fcf8fc116cc48a555fc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a671ef48f4141a9de30b6ec6fb0be1feb"><td class="memItemLeft" align="right" valign="top">typedef ThreadOffset_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb">ThreadOffset</a></td></tr>
+<tr class="memdesc:a671ef48f4141a9de30b6ec6fb0be1feb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Functor that returns the logical coordinate of each entity's initial offset in the tile.  <a href="#a671ef48f4141a9de30b6ec6fb0be1feb">More...</a><br /></td></tr>
+<tr class="separator:a671ef48f4141a9de30b6ec6fb0be1feb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3db8202befa891bbc7c0a53c535cd21f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:a3db8202befa891bbc7c0a53c535cd21f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Strides for immediate offset computation.  <a href="#a3db8202befa891bbc7c0a53c535cd21f">More...</a><br /></td></tr>
+<tr class="separator:a3db8202befa891bbc7c0a53c535cd21f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a0a494c2eacb51b65487f8405908a0214"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html#a0a494c2eacb51b65487f8405908a0214">kAccessSize</a> = AccessSize</td></tr>
+<tr class="memdesc:a0a494c2eacb51b65487f8405908a0214"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access size.  <a href="#a0a494c2eacb51b65487f8405908a0214">More...</a><br /></td></tr>
+<tr class="separator:a0a494c2eacb51b65487f8405908a0214"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="af88f5cea9f452d83004ea0fa0f9d56eb"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af88f5cea9f452d83004ea0fa0f9d56eb">&#9670;&nbsp;</a></span>Delta</h2>
+<a id="ad6d99ccf2fcd2bd47e45d068f4d99c82"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad6d99ccf2fcd2bd47e45d068f4d99c82">&#9670;&nbsp;</a></span>Delta</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ &gt; </div>
+template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ , int AccessSize&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Delta_ <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;::<a class="el" href="structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb">Delta</a></td>
+          <td class="memname">typedef Delta_ <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;::<a class="el" href="structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82">Delta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="af7ae2fdb4c8f1702169cc7d437d2b469"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af7ae2fdb4c8f1702169cc7d437d2b469">&#9670;&nbsp;</a></span>Iterations</h2>
+<a id="a3db8202befa891bbc7c0a53c535cd21f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3db8202befa891bbc7c0a53c535cd21f">&#9670;&nbsp;</a></span>ImmediateOffsetStrides</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ &gt; </div>
+template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ , int AccessSize&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Iterations_ <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;::<a class="el" href="structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469">Iterations</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;0, 0, 0, 0&gt; <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;::<a class="el" href="structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f">ImmediateOffsetStrides</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="af9c0fc178dac7f9dac8d254da34e04dd"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af9c0fc178dac7f9dac8d254da34e04dd">&#9670;&nbsp;</a></span>ThreadOffset</h2>
+<a id="a46b9e04bb8d33fcf8fc116cc48a555fc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a46b9e04bb8d33fcf8fc116cc48a555fc">&#9670;&nbsp;</a></span>Iterations</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ &gt; </div>
+template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ , int AccessSize&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef ThreadOffset_ <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;::<a class="el" href="structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd">ThreadOffset</a></td>
+          <td class="memname">typedef Iterations_ <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;::<a class="el" href="structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc">Iterations</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ab831be0adb255eece4f2e12fd9713831"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab831be0adb255eece4f2e12fd9713831">&#9670;&nbsp;</a></span>Tile</h2>
+<a id="a671ef48f4141a9de30b6ec6fb0be1feb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a671ef48f4141a9de30b6ec6fb0be1feb">&#9670;&nbsp;</a></span>ThreadOffset</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ &gt; </div>
+template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ , int AccessSize&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Tile_ <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;::<a class="el" href="structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831">Tile</a></td>
+          <td class="memname">typedef ThreadOffset_ <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;::<a class="el" href="structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb">ThreadOffset</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a3632c351a28f71f6c140dd33089d80b0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3632c351a28f71f6c140dd33089d80b0">&#9670;&nbsp;</a></span>Tile</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ , int AccessSize&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Tile_ <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;::<a class="el" href="structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0">Tile</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a0a494c2eacb51b65487f8405908a0214"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0a494c2eacb51b65487f8405908a0214">&#9670;&nbsp;</a></span>kAccessSize</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename ThreadOffset_ , int AccessSize&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a>&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;::kAccessSize = AccessSize</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
@@ -171,7 +222,7 @@ template&lt;typename Tile_ , typename Delta_ , typename Iterations_ , typename T
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsContiguousMajor-members.html b/docs/structcutlass_1_1TileTraitsContiguousMajor-members.html
index e33d56558..ea0af2c7e 100644
--- a/docs/structcutlass_1_1TileTraitsContiguousMajor-members.html
+++ b/docs/structcutlass_1_1TileTraitsContiguousMajor-members.html
@@ -88,7 +88,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsContiguousMajor.html b/docs/structcutlass_1_1TileTraitsContiguousMajor.html
index 777f6136a..667bce4d0 100644
--- a/docs/structcutlass_1_1TileTraitsContiguousMajor.html
+++ b/docs/structcutlass_1_1TileTraitsContiguousMajor.html
@@ -224,7 +224,7 @@ template&lt;typename Tile_ , int Threads&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsStandard-members.html b/docs/structcutlass_1_1TileTraitsStandard-members.html
index 4732a54bc..40677b265 100644
--- a/docs/structcutlass_1_1TileTraitsStandard-members.html
+++ b/docs/structcutlass_1_1TileTraitsStandard-members.html
@@ -79,14 +79,15 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">kWarpCount</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#a5e04777205c7a292602880c59d6b43c8">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">kWarpCount</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard&lt; Tile_, Threads &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsStandard.html b/docs/structcutlass_1_1TileTraitsStandard.html
index 7806ece42..a7a26e38a 100644
--- a/docs/structcutlass_1_1TileTraitsStandard.html
+++ b/docs/structcutlass_1_1TileTraitsStandard.html
@@ -103,6 +103,9 @@ Static Public Attributes</h2></td></tr>
 <tr class="memitem:a1e8f90991e179d13971b84494c989d25"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">kWarpCount</a> = <a class="el" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">kThreads</a> / <a class="el" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a></td></tr>
 <tr class="memdesc:a1e8f90991e179d13971b84494c989d25"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of participating warps.  <a href="#a1e8f90991e179d13971b84494c989d25">More...</a><br /></td></tr>
 <tr class="separator:a1e8f90991e179d13971b84494c989d25"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5e04777205c7a292602880c59d6b43c8"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraitsStandard.html#a5e04777205c7a292602880c59d6b43c8">kAccessSize</a> = 1</td></tr>
+<tr class="memdesc:a5e04777205c7a292602880c59d6b43c8"><td class="mdescLeft">&#160;</td><td class="mdescRight">By default, do not do scalar loads.  <a href="#a5e04777205c7a292602880c59d6b43c8">More...</a><br /></td></tr>
+<tr class="separator:a5e04777205c7a292602880c59d6b43c8"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="aee3fee526bc4d4820c03665a2f5f166b"></a>
@@ -122,6 +125,30 @@ template&lt;typename Tile_ , int Threads&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
+<a id="a5e04777205c7a292602880c59d6b43c8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5e04777205c7a292602880c59d6b43c8">&#9670;&nbsp;</a></span>kAccessSize</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Tile_ , int Threads&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard</a>&lt; Tile_, Threads &gt;::kAccessSize = 1</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
 <a id="a9cbcbe09aa6e9465b63dd22d59435af1"></a>
 <h2 class="memtitle"><span class="permalink"><a href="#a9cbcbe09aa6e9465b63dd22d59435af1">&#9670;&nbsp;</a></span>kThreads</h2>
 
@@ -200,7 +227,7 @@ template&lt;typename Tile_ , int Threads&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsStrideMajor-members.html b/docs/structcutlass_1_1TileTraitsStrideMajor-members.html
index 2ae519088..76a8c0323 100644
--- a/docs/structcutlass_1_1TileTraitsStrideMajor-members.html
+++ b/docs/structcutlass_1_1TileTraitsStrideMajor-members.html
@@ -88,7 +88,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsStrideMajor.html b/docs/structcutlass_1_1TileTraitsStrideMajor.html
index d24bc59b0..40c37b8dc 100644
--- a/docs/structcutlass_1_1TileTraitsStrideMajor.html
+++ b/docs/structcutlass_1_1TileTraitsStrideMajor.html
@@ -224,7 +224,7 @@ template&lt;typename Tile_ , int Threads&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsWarpRake-members.html b/docs/structcutlass_1_1TileTraitsWarpRake-members.html
index e76c228b1..24bef8e49 100644
--- a/docs/structcutlass_1_1TileTraitsWarpRake-members.html
+++ b/docs/structcutlass_1_1TileTraitsWarpRake-members.html
@@ -91,7 +91,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsWarpRake.html b/docs/structcutlass_1_1TileTraitsWarpRake.html
index 771a8e410..dfe8d8976 100644
--- a/docs/structcutlass_1_1TileTraitsWarpRake.html
+++ b/docs/structcutlass_1_1TileTraitsWarpRake.html
@@ -318,7 +318,7 @@ template&lt;typename Tile_ , int Threads&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset-members.html b/docs/structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset-members.html
index e816dc744..942245c81 100644
--- a/docs/structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html b/docs/structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html
index cc0d9db2c..26010fb81 100644
--- a/docs/structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html
@@ -125,7 +125,7 @@ template&lt;typename Tile_ , int Threads&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TiledThreadOffset-members.html b/docs/structcutlass_1_1TiledThreadOffset-members.html
index bc28ca5dd..9088eaddb 100644
--- a/docs/structcutlass_1_1TiledThreadOffset-members.html
+++ b/docs/structcutlass_1_1TiledThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TiledThreadOffset.html b/docs/structcutlass_1_1TiledThreadOffset.html
index dbbccc1f2..574a6f546 100644
--- a/docs/structcutlass_1_1TiledThreadOffset.html
+++ b/docs/structcutlass_1_1TiledThreadOffset.html
@@ -125,7 +125,7 @@ template&lt;typename ThreadShape &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TrivialPredicateTileAdapter-members.html b/docs/structcutlass_1_1TrivialPredicateTileAdapter-members.html
index 1bb156f6f..65eb939f1 100644
--- a/docs/structcutlass_1_1TrivialPredicateTileAdapter-members.html
+++ b/docs/structcutlass_1_1TrivialPredicateTileAdapter-members.html
@@ -84,7 +84,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1TrivialPredicateTileAdapter.html b/docs/structcutlass_1_1TrivialPredicateTileAdapter.html
index f93bb89cf..1a8178abe 100644
--- a/docs/structcutlass_1_1TrivialPredicateTileAdapter.html
+++ b/docs/structcutlass_1_1TrivialPredicateTileAdapter.html
@@ -175,7 +175,7 @@ Public Member Functions</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1VectorTraits-members.html b/docs/structcutlass_1_1VectorTraits-members.html
index 011de7e91..f19499038 100644
--- a/docs/structcutlass_1_1VectorTraits-members.html
+++ b/docs/structcutlass_1_1VectorTraits-members.html
@@ -86,7 +86,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1VectorTraits.html b/docs/structcutlass_1_1VectorTraits.html
index 80070a5b1..b19316ae7 100644
--- a/docs/structcutlass_1_1VectorTraits.html
+++ b/docs/structcutlass_1_1VectorTraits.html
@@ -192,7 +192,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4-members.html b/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4-members.html
index e5e2d7801..d5a0cb27d 100644
--- a/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4-members.html
+++ b/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4-members.html
@@ -86,7 +86,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html b/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html
index 39561291c..d029b5663 100644
--- a/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html
+++ b/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html
@@ -192,7 +192,7 @@ template&lt;typename T , int Lanes&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4-members.html b/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4-members.html
index a038a4312..3ef83c65c 100644
--- a/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4-members.html
+++ b/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4-members.html
@@ -86,7 +86,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html b/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html
index 7f9a57431..d0a8efc2d 100644
--- a/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html
+++ b/docs/structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html
@@ -192,7 +192,7 @@ template&lt;typename T , int Lanes&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Vectorize-members.html b/docs/structcutlass_1_1Vectorize-members.html
index 2f3903bd3..3a8634e08 100644
--- a/docs/structcutlass_1_1Vectorize-members.html
+++ b/docs/structcutlass_1_1Vectorize-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Vectorize.html b/docs/structcutlass_1_1Vectorize.html
index d728c0a27..9d5c1b22d 100644
--- a/docs/structcutlass_1_1Vectorize.html
+++ b/docs/structcutlass_1_1Vectorize.html
@@ -110,7 +110,7 @@ template&lt;typename Element_, int kLanes_ = 1&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4-members.html b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4-members.html
new file mode 100644
index 000000000..f49dfa17c
--- /dev/null
+++ b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4-members.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html">cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186">Type</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html">cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html
new file mode 100644
index 000000000..8f743cbe9
--- /dev/null
+++ b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html
@@ -0,0 +1,118 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="vector_8h_source.html">vector.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a5c32d50c6c97d7489034efb7188c8186"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, kLanes_ *32 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186">Type</a></td></tr>
+<tr class="separator:a5c32d50c6c97d7489034efb7188c8186"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a5c32d50c6c97d7489034efb7188c8186"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5c32d50c6c97d7489034efb7188c8186">&#9670;&nbsp;</a></span>Type</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, kLanes_ * 32&gt; <a class="el" href="structcutlass_1_1Vectorize.html">cutlass::Vectorize</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, 32 &gt;, kLanes_ &gt;::<a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186">Type</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="vector_8h_source.html">vector.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4-members.html b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4-members.html
new file mode 100644
index 000000000..ec223dacd
--- /dev/null
+++ b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4-members.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html">cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06">Type</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html">cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html
new file mode 100644
index 000000000..c5dc1793d
--- /dev/null
+++ b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html
@@ -0,0 +1,118 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="vector_8h_source.html">vector.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a40dac8fb50ddccb5c1e2a98200ac3a06"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, kLanes_ *8 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06">Type</a></td></tr>
+<tr class="separator:a40dac8fb50ddccb5c1e2a98200ac3a06"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a40dac8fb50ddccb5c1e2a98200ac3a06"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a40dac8fb50ddccb5c1e2a98200ac3a06">&#9670;&nbsp;</a></span>Type</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, kLanes_ * 8&gt; <a class="el" href="structcutlass_1_1Vectorize.html">cutlass::Vectorize</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, 8 &gt;, kLanes_ &gt;::<a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06">Type</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="vector_8h_source.html">vector.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4-members.html b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4-members.html
new file mode 100644
index 000000000..82b79ce57
--- /dev/null
+++ b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4-members.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html">cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca">Type</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html">cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html
new file mode 100644
index 000000000..5122f26e3
--- /dev/null
+++ b/docs/structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html
@@ -0,0 +1,118 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html">Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="vector_8h_source.html">vector.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a9db5873c0d4df1452129022a280247ca"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, kLanes_ *8 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca">Type</a></td></tr>
+<tr class="separator:a9db5873c0d4df1452129022a280247ca"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a9db5873c0d4df1452129022a280247ca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9db5873c0d4df1452129022a280247ca">&#9670;&nbsp;</a></span>Type</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, kLanes_ * 8&gt; <a class="el" href="structcutlass_1_1Vectorize.html">cutlass::Vectorize</a>&lt; <a class="el" href="unioncutlass_1_1Vector.html">Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, 8 &gt;, kLanes_ &gt;::<a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca">Type</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="vector_8h_source.html">vector.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipConvert-members.html b/docs/structcutlass_1_1ZipConvert-members.html
new file mode 100644
index 000000000..d4e9d72fb
--- /dev/null
+++ b/docs/structcutlass_1_1ZipConvert-members.html
@@ -0,0 +1,99 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipConvert.html">ZipConvert</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::ZipConvert&lt; First_, Second_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f">first</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">InputFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">OutputFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9">second</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html#a7e6398ad8ecd8757744a42f3ab8ef955">transform</a>(InputFragment const &amp;src, OutputFragment &amp;dst)</td><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html#a7aa56d3ea300ebc58493c4d66339fff5">ZipConvert</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html#a3322c88b418c365423480a481e29df29">ZipConvert</a>(First const &amp;_first, Second const &amp;_second)</td><td class="entry"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipConvert.html b/docs/structcutlass_1_1ZipConvert.html
new file mode 100644
index 000000000..f2189b54a
--- /dev/null
+++ b/docs/structcutlass_1_1ZipConvert.html
@@ -0,0 +1,340 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::ZipConvert&lt; First_, Second_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipConvert.html">ZipConvert</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1ZipConvert-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::ZipConvert&lt; First_, Second_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Zips two convert operations.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="zip__fragment_8h_source.html">zip_fragment.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a215173f8ac00f67848cae872db94c2f4"><td class="memItemLeft" align="right" valign="top">typedef First_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a></td></tr>
+<tr class="memdesc:a215173f8ac00f67848cae872db94c2f4"><td class="mdescLeft">&#160;</td><td class="mdescRight">First convert operator.  <a href="#a215173f8ac00f67848cae872db94c2f4">More...</a><br /></td></tr>
+<tr class="separator:a215173f8ac00f67848cae872db94c2f4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a525a08b41696d53d6e542aea9c8e2f10"><td class="memItemLeft" align="right" valign="top">typedef Second_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a></td></tr>
+<tr class="memdesc:a525a08b41696d53d6e542aea9c8e2f10"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second convert operator.  <a href="#a525a08b41696d53d6e542aea9c8e2f10">More...</a><br /></td></tr>
+<tr class="separator:a525a08b41696d53d6e542aea9c8e2f10"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a20d8f64fce1ad330969323f6959209d3"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt; typename First::InputFragment, typename Second::InputFragment &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">InputFragment</a></td></tr>
+<tr class="memdesc:a20d8f64fce1ad330969323f6959209d3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines the input zip fragment.  <a href="#a20d8f64fce1ad330969323f6959209d3">More...</a><br /></td></tr>
+<tr class="separator:a20d8f64fce1ad330969323f6959209d3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae0276951ad92b253de673c63ec88c584"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt; typename First::OutputFragment, typename Second::OutputFragment &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">OutputFragment</a></td></tr>
+<tr class="memdesc:ae0276951ad92b253de673c63ec88c584"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines the output zip fragment.  <a href="#ae0276951ad92b253de673c63ec88c584">More...</a><br /></td></tr>
+<tr class="separator:ae0276951ad92b253de673c63ec88c584"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a7aa56d3ea300ebc58493c4d66339fff5"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html#a7aa56d3ea300ebc58493c4d66339fff5">ZipConvert</a> ()</td></tr>
+<tr class="memdesc:a7aa56d3ea300ebc58493c4d66339fff5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a7aa56d3ea300ebc58493c4d66339fff5">More...</a><br /></td></tr>
+<tr class="separator:a7aa56d3ea300ebc58493c4d66339fff5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3322c88b418c365423480a481e29df29"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html#a3322c88b418c365423480a481e29df29">ZipConvert</a> (<a class="el" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a> const &amp;_first, <a class="el" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a> const &amp;_second)</td></tr>
+<tr class="memdesc:a3322c88b418c365423480a481e29df29"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a3322c88b418c365423480a481e29df29">More...</a><br /></td></tr>
+<tr class="separator:a3322c88b418c365423480a481e29df29"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7e6398ad8ecd8757744a42f3ab8ef955"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html#a7e6398ad8ecd8757744a42f3ab8ef955">transform</a> (<a class="el" href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">InputFragment</a> const &amp;src, <a class="el" href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">OutputFragment</a> &amp;dst)</td></tr>
+<tr class="memdesc:a7e6398ad8ecd8757744a42f3ab8ef955"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transform a fragment.  <a href="#a7e6398ad8ecd8757744a42f3ab8ef955">More...</a><br /></td></tr>
+<tr class="separator:a7e6398ad8ecd8757744a42f3ab8ef955"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a6c59c5bda43da84da92f244103dfab6f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f">first</a></td></tr>
+<tr class="memdesc:a6c59c5bda43da84da92f244103dfab6f"><td class="mdescLeft">&#160;</td><td class="mdescRight">First transformer.  <a href="#a6c59c5bda43da84da92f244103dfab6f">More...</a><br /></td></tr>
+<tr class="separator:a6c59c5bda43da84da92f244103dfab6f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad0daa6c3b89db0a058958a6eba72c6b9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9">second</a></td></tr>
+<tr class="memdesc:ad0daa6c3b89db0a058958a6eba72c6b9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second transformer.  <a href="#ad0daa6c3b89db0a058958a6eba72c6b9">More...</a><br /></td></tr>
+<tr class="separator:ad0daa6c3b89db0a058958a6eba72c6b9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a215173f8ac00f67848cae872db94c2f4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a215173f8ac00f67848cae872db94c2f4">&#9670;&nbsp;</a></span>First</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef First_ <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a20d8f64fce1ad330969323f6959209d3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a20d8f64fce1ad330969323f6959209d3">&#9670;&nbsp;</a></span>InputFragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt;typename First::InputFragment, typename Second::InputFragment&gt; <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">InputFragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae0276951ad92b253de673c63ec88c584"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae0276951ad92b253de673c63ec88c584">&#9670;&nbsp;</a></span>OutputFragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt;typename First::OutputFragment, typename Second::OutputFragment&gt; <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">OutputFragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a525a08b41696d53d6e542aea9c8e2f10"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a525a08b41696d53d6e542aea9c8e2f10">&#9670;&nbsp;</a></span>Second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Second_ <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a7aa56d3ea300ebc58493c4d66339fff5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7aa56d3ea300ebc58493c4d66339fff5">&#9670;&nbsp;</a></span>ZipConvert() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipConvert.html">ZipConvert</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3322c88b418c365423480a481e29df29"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3322c88b418c365423480a481e29df29">&#9670;&nbsp;</a></span>ZipConvert() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipConvert.html">ZipConvert</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_first</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_second</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a7e6398ad8ecd8757744a42f3ab8ef955"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7e6398ad8ecd8757744a42f3ab8ef955">&#9670;&nbsp;</a></span>transform()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a>&lt; First_, Second_ &gt;::transform </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">InputFragment</a> const &amp;&#160;</td>
+          <td class="paramname"><em>src</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">OutputFragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>dst</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a6c59c5bda43da84da92f244103dfab6f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6c59c5bda43da84da92f244103dfab6f">&#9670;&nbsp;</a></span>first</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a> <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a>&lt; First_, Second_ &gt;::first</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad0daa6c3b89db0a058958a6eba72c6b9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad0daa6c3b89db0a058958a6eba72c6b9">&#9670;&nbsp;</a></span>second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a> <a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a>&lt; First_, Second_ &gt;::second</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="zip__fragment_8h_source.html">zip_fragment.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipFragment-members.html b/docs/structcutlass_1_1ZipFragment-members.html
new file mode 100644
index 000000000..51049f254
--- /dev/null
+++ b/docs/structcutlass_1_1ZipFragment-members.html
@@ -0,0 +1,98 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::ZipFragment&lt; First_, Second_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html#aa978dd7fca15ca20e9f52d15e6f8f9c1">clear</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html#aeb654423884324b14130a8fa8bc1ab83">ZipFragment</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html#a520318d060123c5870c4153b99cf0427">ZipFragment</a>(First const &amp;_first, Second const &amp;_second)</td><td class="entry"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipFragment.html b/docs/structcutlass_1_1ZipFragment.html
new file mode 100644
index 000000000..8311f018b
--- /dev/null
+++ b/docs/structcutlass_1_1ZipFragment.html
@@ -0,0 +1,310 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::ZipFragment&lt; First_, Second_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1ZipFragment-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::ZipFragment&lt; First_, Second_ &gt; Struct Template Reference<div class="ingroups"><a class="el" href="group__fragment__concept.html">Fragment Concept</a></div></div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>A template defining <a class="el" href="group__fragment__concept.html">Fragment Concept</a>.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="zip__fragment_8h_source.html">zip_fragment.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a97332506a4834bcced49301b1ac7a4c4"><td class="memItemLeft" align="right" valign="top">typedef First_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a></td></tr>
+<tr class="memdesc:a97332506a4834bcced49301b1ac7a4c4"><td class="mdescLeft">&#160;</td><td class="mdescRight">First fragment object.  <a href="#a97332506a4834bcced49301b1ac7a4c4">More...</a><br /></td></tr>
+<tr class="separator:a97332506a4834bcced49301b1ac7a4c4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af93e3396f0f2ca8d5e439ca5803af92a"><td class="memItemLeft" align="right" valign="top">typedef Second_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a></td></tr>
+<tr class="memdesc:af93e3396f0f2ca8d5e439ca5803af92a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second fragment object.  <a href="#af93e3396f0f2ca8d5e439ca5803af92a">More...</a><br /></td></tr>
+<tr class="separator:af93e3396f0f2ca8d5e439ca5803af92a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2f038ddb37879cbc54dbadaeb7085fb1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt; <a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a>, <a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1">This_</a></td></tr>
+<tr class="memdesc:a2f038ddb37879cbc54dbadaeb7085fb1"><td class="mdescLeft">&#160;</td><td class="mdescRight">This class.  <a href="#a2f038ddb37879cbc54dbadaeb7085fb1">More...</a><br /></td></tr>
+<tr class="separator:a2f038ddb37879cbc54dbadaeb7085fb1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:aeb654423884324b14130a8fa8bc1ab83"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html#aeb654423884324b14130a8fa8bc1ab83">ZipFragment</a> ()</td></tr>
+<tr class="memdesc:aeb654423884324b14130a8fa8bc1ab83"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor.  <a href="#aeb654423884324b14130a8fa8bc1ab83">More...</a><br /></td></tr>
+<tr class="separator:aeb654423884324b14130a8fa8bc1ab83"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a520318d060123c5870c4153b99cf0427"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html#a520318d060123c5870c4153b99cf0427">ZipFragment</a> (<a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a> const &amp;_first, <a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a> const &amp;_second)</td></tr>
+<tr class="memdesc:a520318d060123c5870c4153b99cf0427"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Copy.html">Copy</a> ctor.  <a href="#a520318d060123c5870c4153b99cf0427">More...</a><br /></td></tr>
+<tr class="separator:a520318d060123c5870c4153b99cf0427"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa978dd7fca15ca20e9f52d15e6f8f9c1"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html#aa978dd7fca15ca20e9f52d15e6f8f9c1">clear</a> ()</td></tr>
+<tr class="memdesc:aa978dd7fca15ca20e9f52d15e6f8f9c1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear a fragment.  <a href="#aa978dd7fca15ca20e9f52d15e6f8f9c1">More...</a><br /></td></tr>
+<tr class="separator:aa978dd7fca15ca20e9f52d15e6f8f9c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:aea444ab3b52b6f0e994401cf2e0b7f3c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a></td></tr>
+<tr class="memdesc:aea444ab3b52b6f0e994401cf2e0b7f3c"><td class="mdescLeft">&#160;</td><td class="mdescRight">First fragment object.  <a href="#aea444ab3b52b6f0e994401cf2e0b7f3c">More...</a><br /></td></tr>
+<tr class="separator:aea444ab3b52b6f0e994401cf2e0b7f3c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1812254d5fd77cd6dfdf7d7f2e81130c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a></td></tr>
+<tr class="memdesc:a1812254d5fd77cd6dfdf7d7f2e81130c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second fragment object.  <a href="#a1812254d5fd77cd6dfdf7d7f2e81130c">More...</a><br /></td></tr>
+<tr class="separator:a1812254d5fd77cd6dfdf7d7f2e81130c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a97332506a4834bcced49301b1ac7a4c4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a97332506a4834bcced49301b1ac7a4c4">&#9670;&nbsp;</a></span>First</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef First_ <a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af93e3396f0f2ca8d5e439ca5803af92a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af93e3396f0f2ca8d5e439ca5803af92a">&#9670;&nbsp;</a></span>Second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Second_ <a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a2f038ddb37879cbc54dbadaeb7085fb1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2f038ddb37879cbc54dbadaeb7085fb1">&#9670;&nbsp;</a></span>This_</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a>&lt;<a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a>, <a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a>&gt; <a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1">This_</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="aeb654423884324b14130a8fa8bc1ab83"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeb654423884324b14130a8fa8bc1ab83">&#9670;&nbsp;</a></span>ZipFragment() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a520318d060123c5870c4153b99cf0427"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a520318d060123c5870c4153b99cf0427">&#9670;&nbsp;</a></span>ZipFragment() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipFragment.html">ZipFragment</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_first</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_second</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="aa978dd7fca15ca20e9f52d15e6f8f9c1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa978dd7fca15ca20e9f52d15e6f8f9c1">&#9670;&nbsp;</a></span>clear()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a>&lt; First_, Second_ &gt;::clear </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="aea444ab3b52b6f0e994401cf2e0b7f3c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea444ab3b52b6f0e994401cf2e0b7f3c">&#9670;&nbsp;</a></span>first</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a> <a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a>&lt; First_, Second_ &gt;::first</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1812254d5fd77cd6dfdf7d7f2e81130c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1812254d5fd77cd6dfdf7d7f2e81130c">&#9670;&nbsp;</a></span>second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a> <a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a>&lt; First_, Second_ &gt;::second</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="zip__fragment_8h_source.html">zip_fragment.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipTensorRef-members.html b/docs/structcutlass_1_1ZipTensorRef-members.html
new file mode 100644
index 000000000..41d9fa276
--- /dev/null
+++ b/docs/structcutlass_1_1ZipTensorRef-members.html
@@ -0,0 +1,96 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::ZipTensorRef&lt; First_, Second_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c">first</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451">second</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a9b4e616da5b0a71ac2d9bd03b4e07b86">ZipTensorRef</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a6905b853de0521e2f2fedac407a920e1">ZipTensorRef</a>(First const &amp;_first, Second const &amp;_second)</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipTensorRef.html b/docs/structcutlass_1_1ZipTensorRef.html
new file mode 100644
index 000000000..e9943f274
--- /dev/null
+++ b/docs/structcutlass_1_1ZipTensorRef.html
@@ -0,0 +1,255 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::ZipTensorRef&lt; First_, Second_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1ZipTensorRef-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::ZipTensorRef&lt; First_, Second_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="zip__tensor__ref_8h_source.html">zip_tensor_ref.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a44deb7a83049ee80dfd0419d4a0206d9"><td class="memItemLeft" align="right" valign="top">typedef First_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a></td></tr>
+<tr class="memdesc:a44deb7a83049ee80dfd0419d4a0206d9"><td class="mdescLeft">&#160;</td><td class="mdescRight">First tensor ref.  <a href="#a44deb7a83049ee80dfd0419d4a0206d9">More...</a><br /></td></tr>
+<tr class="separator:a44deb7a83049ee80dfd0419d4a0206d9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3e77904f83d1b33f0bac054355f3432e"><td class="memItemLeft" align="right" valign="top">typedef Second_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a></td></tr>
+<tr class="memdesc:a3e77904f83d1b33f0bac054355f3432e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second tensor ref.  <a href="#a3e77904f83d1b33f0bac054355f3432e">More...</a><br /></td></tr>
+<tr class="separator:a3e77904f83d1b33f0bac054355f3432e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a9b4e616da5b0a71ac2d9bd03b4e07b86"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a9b4e616da5b0a71ac2d9bd03b4e07b86">ZipTensorRef</a> ()</td></tr>
+<tr class="separator:a9b4e616da5b0a71ac2d9bd03b4e07b86"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6905b853de0521e2f2fedac407a920e1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a6905b853de0521e2f2fedac407a920e1">ZipTensorRef</a> (<a class="el" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a> const &amp;_first, <a class="el" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a> const &amp;_second)</td></tr>
+<tr class="separator:a6905b853de0521e2f2fedac407a920e1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a535f0e6fc79d0e305f651efed099275c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c">first</a></td></tr>
+<tr class="memdesc:a535f0e6fc79d0e305f651efed099275c"><td class="mdescLeft">&#160;</td><td class="mdescRight">First <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="#a535f0e6fc79d0e305f651efed099275c">More...</a><br /></td></tr>
+<tr class="separator:a535f0e6fc79d0e305f651efed099275c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad981b056cc96709a23e6d51dba4cd451"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451">second</a></td></tr>
+<tr class="memdesc:ad981b056cc96709a23e6d51dba4cd451"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>.  <a href="#ad981b056cc96709a23e6d51dba4cd451">More...</a><br /></td></tr>
+<tr class="separator:ad981b056cc96709a23e6d51dba4cd451"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a44deb7a83049ee80dfd0419d4a0206d9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a44deb7a83049ee80dfd0419d4a0206d9">&#9670;&nbsp;</a></span>First</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef First_ <a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3e77904f83d1b33f0bac054355f3432e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3e77904f83d1b33f0bac054355f3432e">&#9670;&nbsp;</a></span>Second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Second_ <a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a9b4e616da5b0a71ac2d9bd03b4e07b86"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9b4e616da5b0a71ac2d9bd03b4e07b86">&#9670;&nbsp;</a></span>ZipTensorRef() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6905b853de0521e2f2fedac407a920e1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6905b853de0521e2f2fedac407a920e1">&#9670;&nbsp;</a></span>ZipTensorRef() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_first</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_second</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a535f0e6fc79d0e305f651efed099275c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a535f0e6fc79d0e305f651efed099275c">&#9670;&nbsp;</a></span>first</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a> <a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a>&lt; First_, Second_ &gt;::first</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad981b056cc96709a23e6d51dba4cd451"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad981b056cc96709a23e6d51dba4cd451">&#9670;&nbsp;</a></span>second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_, typename Second_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a> <a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a>&lt; First_, Second_ &gt;::second</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="zip__tensor__ref_8h_source.html">zip_tensor_ref.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipTileAllocation-members.html b/docs/structcutlass_1_1ZipTileAllocation-members.html
new file mode 100644
index 000000000..f7489bd00
--- /dev/null
+++ b/docs/structcutlass_1_1ZipTileAllocation-members.html
@@ -0,0 +1,98 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">ZipTileAllocation</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::ZipTileAllocation&lt; First_, Second_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">ConstTensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">First</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014">first</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#a0d00001220df7f2bdb1f09ae3f37c585">reference</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#af9964904e789b3ab58334f1ec1ceee56">reference</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">Second</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc">second</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipTileAllocation.html b/docs/structcutlass_1_1ZipTileAllocation.html
new file mode 100644
index 000000000..844ff780f
--- /dev/null
+++ b/docs/structcutlass_1_1ZipTileAllocation.html
@@ -0,0 +1,287 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::ZipTileAllocation&lt; First_, Second_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">ZipTileAllocation</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1ZipTileAllocation-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::ZipTileAllocation&lt; First_, Second_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Manages a pair of tile allocations as if they are one allocation.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="tile__allocation_8h_source.html">tile_allocation.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:acbdbed808b27997a0e8c22adfa9cc9b2"><td class="memItemLeft" align="right" valign="top">typedef First_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">First</a></td></tr>
+<tr class="memdesc:acbdbed808b27997a0e8c22adfa9cc9b2"><td class="mdescLeft">&#160;</td><td class="mdescRight">First tensor allocation.  <a href="#acbdbed808b27997a0e8c22adfa9cc9b2">More...</a><br /></td></tr>
+<tr class="separator:acbdbed808b27997a0e8c22adfa9cc9b2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac6b988a7e6cd8ec83fae642342209527"><td class="memItemLeft" align="right" valign="top">typedef Second_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">Second</a></td></tr>
+<tr class="memdesc:ac6b988a7e6cd8ec83fae642342209527"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second tensor allocation.  <a href="#ac6b988a7e6cd8ec83fae642342209527">More...</a><br /></td></tr>
+<tr class="separator:ac6b988a7e6cd8ec83fae642342209527"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1c274bfb4401beabaf62fed9c2054ddf"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt; typename First::TensorRef, typename Second::TensorRef &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">TensorRef</a></td></tr>
+<tr class="memdesc:a1c274bfb4401beabaf62fed9c2054ddf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines the tensor reference for this allocation.  <a href="#a1c274bfb4401beabaf62fed9c2054ddf">More...</a><br /></td></tr>
+<tr class="separator:a1c274bfb4401beabaf62fed9c2054ddf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aba6d5cfb32cfed340d8af2971ec50af4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt; typename First::ConstTensorRef, typename Second::ConstTensorRef &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">ConstTensorRef</a></td></tr>
+<tr class="memdesc:aba6d5cfb32cfed340d8af2971ec50af4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines the tensor reference for this allocation.  <a href="#aba6d5cfb32cfed340d8af2971ec50af4">More...</a><br /></td></tr>
+<tr class="separator:aba6d5cfb32cfed340d8af2971ec50af4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a0d00001220df7f2bdb1f09ae3f37c585"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#a0d00001220df7f2bdb1f09ae3f37c585">reference</a> ()</td></tr>
+<tr class="memdesc:a0d00001220df7f2bdb1f09ae3f37c585"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> object pointing to the data.  <a href="#a0d00001220df7f2bdb1f09ae3f37c585">More...</a><br /></td></tr>
+<tr class="separator:a0d00001220df7f2bdb1f09ae3f37c585"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af9964904e789b3ab58334f1ec1ceee56"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">ConstTensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#af9964904e789b3ab58334f1ec1ceee56">reference</a> () const</td></tr>
+<tr class="memdesc:af9964904e789b3ab58334f1ec1ceee56"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns a <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> object pointing to the data.  <a href="#af9964904e789b3ab58334f1ec1ceee56">More...</a><br /></td></tr>
+<tr class="separator:af9964904e789b3ab58334f1ec1ceee56"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a6c0f139eef549521763b36cb1e45a014"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">First</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014">first</a></td></tr>
+<tr class="memdesc:a6c0f139eef549521763b36cb1e45a014"><td class="mdescLeft">&#160;</td><td class="mdescRight">First tensor allocation.  <a href="#a6c0f139eef549521763b36cb1e45a014">More...</a><br /></td></tr>
+<tr class="separator:a6c0f139eef549521763b36cb1e45a014"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a94abc7e74632b14718fd2d5b78cceafc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">Second</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc">second</a></td></tr>
+<tr class="memdesc:a94abc7e74632b14718fd2d5b78cceafc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Second tensor allocation.  <a href="#a94abc7e74632b14718fd2d5b78cceafc">More...</a><br /></td></tr>
+<tr class="separator:a94abc7e74632b14718fd2d5b78cceafc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="aba6d5cfb32cfed340d8af2971ec50af4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aba6d5cfb32cfed340d8af2971ec50af4">&#9670;&nbsp;</a></span>ConstTensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt;typename First::ConstTensorRef, typename Second::ConstTensorRef&gt; <a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">ConstTensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="acbdbed808b27997a0e8c22adfa9cc9b2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acbdbed808b27997a0e8c22adfa9cc9b2">&#9670;&nbsp;</a></span>First</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef First_ <a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">First</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac6b988a7e6cd8ec83fae642342209527"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac6b988a7e6cd8ec83fae642342209527">&#9670;&nbsp;</a></span>Second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Second_ <a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">Second</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1c274bfb4401beabaf62fed9c2054ddf"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1c274bfb4401beabaf62fed9c2054ddf">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt;typename First::TensorRef, typename Second::TensorRef&gt; <a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a>&lt; First_, Second_ &gt;::<a class="el" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a0d00001220df7f2bdb1f09ae3f37c585"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0d00001220df7f2bdb1f09ae3f37c585">&#9670;&nbsp;</a></span>reference() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">TensorRef</a> <a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a>&lt; First_, Second_ &gt;::reference </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af9964904e789b3ab58334f1ec1ceee56"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af9964904e789b3ab58334f1ec1ceee56">&#9670;&nbsp;</a></span>reference() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">ConstTensorRef</a> <a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a>&lt; First_, Second_ &gt;::reference </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a6c0f139eef549521763b36cb1e45a014"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6c0f139eef549521763b36cb1e45a014">&#9670;&nbsp;</a></span>first</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">First</a> <a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a>&lt; First_, Second_ &gt;::first</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a94abc7e74632b14718fd2d5b78cceafc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a94abc7e74632b14718fd2d5b78cceafc">&#9670;&nbsp;</a></span>second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">Second</a> <a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a>&lt; First_, Second_ &gt;::second</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="tile__allocation_8h_source.html">tile_allocation.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipTileIterator_1_1Params-members.html b/docs/structcutlass_1_1ZipTileIterator_1_1Params-members.html
new file mode 100644
index 000000000..a197a4a8c
--- /dev/null
+++ b/docs/structcutlass_1_1ZipTileIterator_1_1Params-members.html
@@ -0,0 +1,94 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e">first</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a4ed93b5319fe96457caf53e9384722d4">Params</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#ad38f6a2cc5800c0ec82b12d183040390">Params</a>(typename First::Params const &amp;_first, typename Second::Params const &amp;_second)</td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26">second</a></td><td class="entry"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1ZipTileIterator_1_1Params.html b/docs/structcutlass_1_1ZipTileIterator_1_1Params.html
new file mode 100644
index 000000000..8034c42aa
--- /dev/null
+++ b/docs/structcutlass_1_1ZipTileIterator_1_1Params.html
@@ -0,0 +1,217 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a></li><li class="navelem"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1ZipTileIterator_1_1Params-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html" title="Params object. ">Params</a> object.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="zip__tile__iterator_8h_source.html">zip_tile_iterator.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a4ed93b5319fe96457caf53e9384722d4"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a4ed93b5319fe96457caf53e9384722d4">Params</a> ()</td></tr>
+<tr class="memdesc:a4ed93b5319fe96457caf53e9384722d4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a parameters object.  <a href="#a4ed93b5319fe96457caf53e9384722d4">More...</a><br /></td></tr>
+<tr class="separator:a4ed93b5319fe96457caf53e9384722d4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad38f6a2cc5800c0ec82b12d183040390"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#ad38f6a2cc5800c0ec82b12d183040390">Params</a> (typename First::Params const &amp;_first, typename Second::Params const &amp;_second)</td></tr>
+<tr class="memdesc:ad38f6a2cc5800c0ec82b12d183040390"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a parameters object.  <a href="#ad38f6a2cc5800c0ec82b12d183040390">More...</a><br /></td></tr>
+<tr class="separator:ad38f6a2cc5800c0ec82b12d183040390"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a5dd69883d6b3f16fe28ebfe79235743e"><td class="memItemLeft" align="right" valign="top">First::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e">first</a></td></tr>
+<tr class="memdesc:a5dd69883d6b3f16fe28ebfe79235743e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters of first iterator.  <a href="#a5dd69883d6b3f16fe28ebfe79235743e">More...</a><br /></td></tr>
+<tr class="separator:a5dd69883d6b3f16fe28ebfe79235743e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6eb742dc39b1d776cf5d62719835fe26"><td class="memItemLeft" align="right" valign="top">Second::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26">second</a></td></tr>
+<tr class="memdesc:a6eb742dc39b1d776cf5d62719835fe26"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters of second iterator.  <a href="#a6eb742dc39b1d776cf5d62719835fe26">More...</a><br /></td></tr>
+<tr class="separator:a6eb742dc39b1d776cf5d62719835fe26"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a4ed93b5319fe96457caf53e9384722d4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4ed93b5319fe96457caf53e9384722d4">&#9670;&nbsp;</a></span>Params() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad38f6a2cc5800c0ec82b12d183040390"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad38f6a2cc5800c0ec82b12d183040390">&#9670;&nbsp;</a></span>Params() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype">typename First::Params const &amp;&#160;</td>
+          <td class="paramname"><em>_first</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">typename Second::Params const &amp;&#160;</td>
+          <td class="paramname"><em>_second</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a5dd69883d6b3f16fe28ebfe79235743e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5dd69883d6b3f16fe28ebfe79235743e">&#9670;&nbsp;</a></span>first</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">First::Params <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::Params::first</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6eb742dc39b1d776cf5d62719835fe26"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6eb742dc39b1d776cf5d62719835fe26">&#9670;&nbsp;</a></span>second</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename First_ , typename Second_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">Second::Params <a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a>&lt; First_, Second_ &gt;::Params::second</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="zip__tile__iterator_8h_source.html">zip_tile_iterator.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1bin1__t.html b/docs/structcutlass_1_1bin1__t.html
new file mode 100644
index 000000000..c3f4a9844
--- /dev/null
+++ b/docs/structcutlass_1_1bin1__t.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::bin1_t Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::bin1_t Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="numeric__types_8h_source.html">numeric_types.h</a>&gt;</code></p>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="numeric__types_8h_source.html">numeric_types.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1divide__assert-members.html b/docs/structcutlass_1_1divide__assert-members.html
index 59e5af796..8ddcbdf9d 100644
--- a/docs/structcutlass_1_1divide__assert-members.html
+++ b/docs/structcutlass_1_1divide__assert-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1divide__assert.html b/docs/structcutlass_1_1divide__assert.html
index f7dd66900..e7741e471 100644
--- a/docs/structcutlass_1_1divide__assert.html
+++ b/docs/structcutlass_1_1divide__assert.html
@@ -119,7 +119,7 @@ template&lt;int Dividend, int Divisor&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ClearAccumulators-members.html b/docs/structcutlass_1_1gemm_1_1ClearAccumulators-members.html
index c3f2e3e92..647a7ed98 100644
--- a/docs/structcutlass_1_1gemm_1_1ClearAccumulators-members.html
+++ b/docs/structcutlass_1_1gemm_1_1ClearAccumulators-members.html
@@ -81,10 +81,11 @@ $(function() {
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">clear</a>(Fragment_ &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef">ClearAccumulators</a>(SharedStorage &amp;shared_storage)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#aef1832b62ae8caef5e6d34cb1d1564e3">ClearAccumulators</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">cutlass::gemm::ClearAccumulators&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ClearAccumulators.html b/docs/structcutlass_1_1gemm_1_1ClearAccumulators.html
index e815e57d6..314cffc66 100644
--- a/docs/structcutlass_1_1gemm_1_1ClearAccumulators.html
+++ b/docs/structcutlass_1_1gemm_1_1ClearAccumulators.html
@@ -94,6 +94,9 @@ Public Member Functions</h2></td></tr>
 <tr class="memitem:a4ba07ea6d6fef961de1cb95b13c672ef"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#a4ba07ea6d6fef961de1cb95b13c672ef">ClearAccumulators</a> (<a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">SharedStorage</a> &amp;shared_storage)</td></tr>
 <tr class="memdesc:a4ba07ea6d6fef961de1cb95b13c672ef"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a4ba07ea6d6fef961de1cb95b13c672ef">More...</a><br /></td></tr>
 <tr class="separator:a4ba07ea6d6fef961de1cb95b13c672ef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aef1832b62ae8caef5e6d34cb1d1564e3"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#aef1832b62ae8caef5e6d34cb1d1564e3">ClearAccumulators</a> ()</td></tr>
+<tr class="memdesc:aef1832b62ae8caef5e6d34cb1d1564e3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#aef1832b62ae8caef5e6d34cb1d1564e3">More...</a><br /></td></tr>
+<tr class="separator:aef1832b62ae8caef5e6d34cb1d1564e3"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:adb8026a19b09e9a581ec767c2c2da4ab"><td class="memTemplParams" colspan="2">template&lt;typename Fragment_ &gt; </td></tr>
 <tr class="memitem:adb8026a19b09e9a581ec767c2c2da4ab"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html#adb8026a19b09e9a581ec767c2c2da4ab">clear</a> (Fragment_ &amp;fragment)</td></tr>
 <tr class="memdesc:adb8026a19b09e9a581ec767c2c2da4ab"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear the fragment.  <a href="#adb8026a19b09e9a581ec767c2c2da4ab">More...</a><br /></td></tr>
@@ -101,7 +104,7 @@ Public Member Functions</h2></td></tr>
 </table>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
 <a id="a4ba07ea6d6fef961de1cb95b13c672ef"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4ba07ea6d6fef961de1cb95b13c672ef">&#9670;&nbsp;</a></span>ClearAccumulators()</h2>
+<h2 class="memtitle"><span class="permalink"><a href="#a4ba07ea6d6fef961de1cb95b13c672ef">&#9670;&nbsp;</a></span>ClearAccumulators() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -126,6 +129,33 @@ template&lt;typename Scalar_ , int kLanes_ = 1&gt; </div>
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="aef1832b62ae8caef5e6d34cb1d1564e3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aef1832b62ae8caef5e6d34cb1d1564e3">&#9670;&nbsp;</a></span>ClearAccumulators() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , int kLanes_ = 1&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">cutlass::gemm::ClearAccumulators</a>&lt; Scalar_, kLanes_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators.html">ClearAccumulators</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
@@ -165,7 +195,7 @@ template&lt;typename Fragment_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html b/docs/structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html
index b97be88f3..c30f55220 100644
--- a/docs/structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html
+++ b/docs/structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html
@@ -87,7 +87,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle-members.html b/docs/structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle-members.html
new file mode 100644
index 000000000..698bd4d6c
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle-members.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">ColumnMajorBlockSwizzle</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a6d0ee4e76371af26030ab4922e6c915a">ColumnMajorBlockSwizzle</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#abb21a72e2cef3217f446f70758c59c1e">get_batch_id</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a927ce3eed4cd22554f9e6fe20a1ccc6e">get_grid_layout</a>(GemmCoord const &amp;problem_size, Coord&lt; 3 &gt; const &amp;OutputTile)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a380fb7f905548c52933ea411166424b4">get_threadblock_offset</a>(Coord&lt; 3 &gt; const &amp;OutputTile)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b">swizzle</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html b/docs/structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html
new file mode 100644
index 000000000..19c0d5e2e
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html
@@ -0,0 +1,260 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">ColumnMajorBlockSwizzle</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="threadblock__swizzle_8h_source.html">threadblock_swizzle.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a6d0ee4e76371af26030ab4922e6c915a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a6d0ee4e76371af26030ab4922e6c915a">ColumnMajorBlockSwizzle</a> ()</td></tr>
+<tr class="memdesc:a6d0ee4e76371af26030ab4922e6c915a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a6d0ee4e76371af26030ab4922e6c915a">More...</a><br /></td></tr>
+<tr class="separator:a6d0ee4e76371af26030ab4922e6c915a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaeb1e1167144352521651547815e003b"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b">swizzle</a> ()</td></tr>
+<tr class="memdesc:aaeb1e1167144352521651547815e003b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Swizzle the block index.  <a href="#aaeb1e1167144352521651547815e003b">More...</a><br /></td></tr>
+<tr class="separator:aaeb1e1167144352521651547815e003b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a927ce3eed4cd22554f9e6fe20a1ccc6e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a927ce3eed4cd22554f9e6fe20a1ccc6e">get_grid_layout</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> const &amp;problem_size, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;OutputTile)</td></tr>
+<tr class="separator:a927ce3eed4cd22554f9e6fe20a1ccc6e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a380fb7f905548c52933ea411166424b4"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a380fb7f905548c52933ea411166424b4">get_threadblock_offset</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;OutputTile)</td></tr>
+<tr class="separator:a380fb7f905548c52933ea411166424b4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abb21a72e2cef3217f446f70758c59c1e"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#abb21a72e2cef3217f446f70758c59c1e">get_batch_id</a> ()</td></tr>
+<tr class="separator:abb21a72e2cef3217f446f70758c59c1e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a6d0ee4e76371af26030ab4922e6c915a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6d0ee4e76371af26030ab4922e6c915a">&#9670;&nbsp;</a></span>ColumnMajorBlockSwizzle()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupCols, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle</a>&lt; groupCols, swDirection &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">ColumnMajorBlockSwizzle</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="abb21a72e2cef3217f446f70758c59c1e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abb21a72e2cef3217f446f70758c59c1e">&#9670;&nbsp;</a></span>get_batch_id()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupCols, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE int <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle</a>&lt; groupCols, swDirection &gt;::get_batch_id </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a927ce3eed4cd22554f9e6fe20a1ccc6e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a927ce3eed4cd22554f9e6fe20a1ccc6e">&#9670;&nbsp;</a></span>get_grid_layout()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupCols, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dim3 <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle</a>&lt; groupCols, swDirection &gt;::get_grid_layout </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>problem_size</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>OutputTile</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a380fb7f905548c52933ea411166424b4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a380fb7f905548c52933ea411166424b4">&#9670;&nbsp;</a></span>get_threadblock_offset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupCols, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle</a>&lt; groupCols, swDirection &gt;::get_threadblock_offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>OutputTile</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aaeb1e1167144352521651547815e003b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aaeb1e1167144352521651547815e003b">&#9670;&nbsp;</a></span>swizzle()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupCols, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE dim3 <a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle</a>&lt; groupCols, swDirection &gt;::swizzle </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="threadblock__swizzle_8h_source.html">threadblock_swizzle.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1DgemmConfig-members.html b/docs/structcutlass_1_1gemm_1_1DgemmConfig-members.html
index 256b383d1..74a8b9395 100644
--- a/docs/structcutlass_1_1gemm_1_1DgemmConfig-members.html
+++ b/docs/structcutlass_1_1gemm_1_1DgemmConfig-members.html
@@ -73,41 +73,44 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::DgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::DgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html">cutlass::gemm::DgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1DgemmConfig.html">cutlass::gemm::DgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1DgemmConfig.html b/docs/structcutlass_1_1gemm_1_1DgemmConfig.html
index 7ac041128..cb727aca5 100644
--- a/docs/structcutlass_1_1gemm_1_1DgemmConfig.html
+++ b/docs/structcutlass_1_1gemm_1_1DgemmConfig.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::DgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::DgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -75,93 +75,102 @@ $(function() {
   <div class="summary">
 <a href="structcutlass_1_1gemm_1_1DgemmConfig-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::DgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::DgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="dgemm__traits_8h_source.html">dgemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::DgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::DgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1DgemmConfig.png" usemap="#cutlass::gemm::DgemmConfig_3C_20OutputTile_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::DgemmConfig_3C_20OutputTile_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" name="cutlass::gemm::DgemmConfig_3C_20OutputTile_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;" shape="rect" coords="0,0,1529,24"/>
+  <img src="structcutlass_1_1gemm_1_1DgemmConfig.png" usemap="#cutlass::gemm::DgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::DgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" name="cutlass::gemm::DgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;" shape="rect" coords="0,0,1610,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td></tr>
-<tr class="memitem:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef double&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a></td></tr>
-<tr class="memdesc:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">More...</a><br /></td></tr>
-<tr class="separator:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef double&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a></td></tr>
-<tr class="memdesc:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">More...</a><br /></td></tr>
-<tr class="separator:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef double&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a></td></tr>
-<tr class="memdesc:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">More...</a><br /></td></tr>
-<tr class="separator:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef double&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a></td></tr>
-<tr class="memdesc:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">More...</a><br /></td></tr>
-<tr class="separator:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a></td></tr>
-<tr class="memdesc:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">More...</a><br /></td></tr>
-<tr class="separator:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, double, double, double &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a></td></tr>
-<tr class="memdesc:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">More...</a><br /></td></tr>
-<tr class="separator:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a></td></tr>
-<tr class="memdesc:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">More...</a><br /></td></tr>
-<tr class="separator:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a></td></tr>
-<tr class="memdesc:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">More...</a><br /></td></tr>
-<tr class="separator:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a></td></tr>
-<tr class="memdesc:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">More...</a><br /></td></tr>
-<tr class="separator:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a></td></tr>
-<tr class="memdesc:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">More...</a><br /></td></tr>
-<tr class="separator:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2 &gt;</a></td></tr>
-<tr class="memitem:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td></tr>
-<tr class="memdesc:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">More...</a><br /></td></tr>
-<tr class="separator:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a></td></tr>
-<tr class="memdesc:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">More...</a><br /></td></tr>
-<tr class="separator:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a></td></tr>
-<tr class="memdesc:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">More...</a><br /></td></tr>
-<tr class="separator:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:accc95abc55880abdab92253367b4b186 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a></td></tr>
-<tr class="separator:accc95abc55880abdab92253367b4b186 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa1b75484138923a52b32888fef608d9b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a></td></tr>
-<tr class="separator:aa1b75484138923a52b32888fef608d9b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a></td></tr>
-<tr class="memdesc:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">More...</a><br /></td></tr>
-<tr class="separator:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac0c8c027e3ede14b62d7c7d519551f21 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a></td></tr>
-<tr class="separator:ac0c8c027e3ede14b62d7c7d519551f21 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a86470d3a44e2b50ee31ec3c9f79927ef inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a></td></tr>
-<tr class="separator:a86470d3a44e2b50ee31ec3c9f79927ef inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a></td></tr>
-<tr class="memdesc:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">More...</a><br /></td></tr>
-<tr class="separator:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a></td></tr>
-<tr class="memdesc:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">More...</a><br /></td></tr>
-<tr class="separator:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3087cdd38e2c65ad0dffdd0587d2cce0 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a></td></tr>
-<tr class="separator:a3087cdd38e2c65ad0dffdd0587d2cce0 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adaf2ee5b8e6f7bdb9939cd45a186ca56 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a></td></tr>
-<tr class="separator:adaf2ee5b8e6f7bdb9939cd45a186ca56 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a></td></tr>
-<tr class="memdesc:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">More...</a><br /></td></tr>
-<tr class="separator:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9dd092bca2f1f2c039f367b23bafa9c1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a></td></tr>
-<tr class="separator:a9dd092bca2f1f2c039f367b23bafa9c1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a></td></tr>
-<tr class="memdesc:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">More...</a><br /></td></tr>
-<tr class="separator:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td></tr>
+<tr class="memitem:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef double&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a></td></tr>
+<tr class="memdesc:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">More...</a><br /></td></tr>
+<tr class="separator:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef double&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a></td></tr>
+<tr class="memdesc:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">More...</a><br /></td></tr>
+<tr class="separator:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef double&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a></td></tr>
+<tr class="memdesc:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">More...</a><br /></td></tr>
+<tr class="separator:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef double&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a></td></tr>
+<tr class="memdesc:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">More...</a><br /></td></tr>
+<tr class="separator:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a></td></tr>
+<tr class="memdesc:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">More...</a><br /></td></tr>
+<tr class="separator:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, double, double, double &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a></td></tr>
+<tr class="memdesc:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">More...</a><br /></td></tr>
+<tr class="separator:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a></td></tr>
+<tr class="memdesc:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">More...</a><br /></td></tr>
+<tr class="separator:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of warp-level GEMM.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">More...</a><br /></td></tr>
+<tr class="separator:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a></td></tr>
+<tr class="memdesc:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">More...</a><br /></td></tr>
+<tr class="separator:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a></td></tr>
+<tr class="memdesc:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">More...</a><br /></td></tr>
+<tr class="separator:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; double, double, double, double, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, double, double, double &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 2, kScalarsPerLdgB_, kScalarsPerLdgB_, 2, 1, 2, 1, 2, false, false, false &gt;</a></td></tr>
+<tr class="memitem:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td></tr>
+<tr class="memdesc:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">More...</a><br /></td></tr>
+<tr class="separator:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td></tr>
+<tr class="memdesc:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">More...</a><br /></td></tr>
+<tr class="separator:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td></tr>
+<tr class="memdesc:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">More...</a><br /></td></tr>
+<tr class="separator:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td></tr>
+<tr class="separator:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td></tr>
+<tr class="separator:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td></tr>
+<tr class="memdesc:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">More...</a><br /></td></tr>
+<tr class="separator:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td></tr>
+<tr class="separator:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td></tr>
+<tr class="separator:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td></tr>
+<tr class="memdesc:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">More...</a><br /></td></tr>
+<tr class="separator:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td></tr>
+<tr class="memdesc:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">More...</a><br /></td></tr>
+<tr class="separator:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td></tr>
+<tr class="separator:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td></tr>
+<tr class="separator:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td></tr>
+<tr class="memdesc:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">More...</a><br /></td></tr>
+<tr class="separator:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td></tr>
+<tr class="separator:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td></tr>
+<tr class="memdesc:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">More...</a><br /></td></tr>
+<tr class="separator:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td></tr>
+<tr class="memdesc:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, mainloop is instantiated twice. The first instantiation contains no predicate.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">More...</a><br /></td></tr>
+<tr class="separator:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td></tr>
+<tr class="memdesc:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, residue is computed in the prologue.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">More...</a><br /></td></tr>
+<tr class="separator:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td></tr>
+<tr class="memdesc:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, kernel is launched with launch bounds specified.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">More...</a><br /></td></tr>
+<tr class="separator:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <hr/>The documentation for this struct was generated from the following file:<ul>
 <li><a class="el" href="dgemm__traits_8h_source.html">dgemm_traits.h</a></li>
@@ -169,7 +178,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1DgemmConfig.png b/docs/structcutlass_1_1gemm_1_1DgemmConfig.png
index 0769b899383659943236dd21acd6a0b3aa2a6779..f8e438ab6281dbc3e9837926907a71116a47de48 100644
GIT binary patch
literal 3040
zcmd5;c{p3?9;Vuw7Gs7^>ChUNP_5F^u`iwJLhP3g)mSUhB|)uGOLUv!rcKNdB50`6
z#acpaA*Qybp{9$HMnVLs5<v)Qgd6S5z4JWt&z=A7d7g8=_k7=b-t(Q`@A<vIlj-H*
zq_XqdopN$=Dq!am-g0u=U1Zqn3kBIVRK$?V22C%w(<e7JHe_&q`Tc{Z@mVtT>Fns}
zI8&SGE4%$7&fCLBPDa{12A`iclao`50-yNdbfP?;#f;(F)!gJbRh7qY;3;Mc9uNo-
zti2Iz(>+vs(o0TWE%lOiZ|!ZaRc^F)uNj7WrYBmPZiNZk(;J;~`v}+t!08)-y@67F
zFc@$;?eZA_`XJegcB%Jg@R>64T@LVHE}*aY7`OS*9~A3n7@TsE9(X;I!!-qq806JN
zGBxu1Skx2J_?<qD0@fKx?>P2l+nOf=fTq*5B5yrRCyhclh&j#^rUJ}S%Pzi)7)0{R
zXG#Dlw$TRWT2VEO^c;yfx0w8J-ElU?KVP5}N}oS(SB>Q^^0I}EMM#@z4F=_yi$^L5
zEE*<T{Z_TEQ3h>h@EhRr&VV&mUE=?1cK5{XLv$Mr^5nf{onWA{IYFYwag6OE29ly1
z{2*zX++-J;IzF5p$J^@hVPm@qFMRZyr);ov50+$an!{m;6<A9Z2w(4*opW79f}&9m
zc~8fhp+$=gajFP*9Bs+BFm`~9!IDzn?#2wTCPnb7{-`k2%<k9vrgaVi!VJpFHjCF%
z2;~OccYQqNZMI{sa1C9PNv{xl%wb#X14J_w2Hm5~B_Z6`QqqK@3>p<E+PlviOI}No
zs@5A~-NUO1g&IlJ8tS{rv(fDbZ`$6GcJCX)>g;{rD&%<?%GX5E{1}y`P_}<$vo^p#
zLfD`vl1$OwBejsT#%t^rPD79R4RN_j1nQuWfI~zk8h~2)a|ihN#p(*=B~SGB_DXhF
zZ+%q+Z@r1>1Pjg>317&D_SAk)zkn=*Ch6o_aw9PPHc#L?5~^qGk7lbk<Pp-3<kagE
z78FeISgPsGRHG{my;Z_|s0}f{D2SJ=G94UYU>IirqQkP+5H`a(`I&=jZ<T51W+|8b
z@d^o&%tRgG-U4bipx=4Ddqz|SO+Dnx3nxgpkvcijMYePjTsOXuA74+}-X1?hP7-PD
zEjSrM(y}AuvxW$D#9gtiA&_NHGcCuln4emrlsM<|pcX-b=)0L|l2lel$&IMMtTa+{
zB(EJ8pmucd{o}!lDCgZ_AD<^DIF&*N_ss=%p1j9?u?99`*dk|$sH!)0=~2$TJ%T~l
z@H44;Bvu<s*y4s41d*NK<Pw%IrpnelN;4`B@!(p2^;p$tpiguKhoWQxVVw$2d-GE;
zFNOh<g@O6AtJ$8Kl_nI~?MHyo<e1j>8h_PtQ3|tos3VJHNsI9Ed3U|zxnV}2PaE;+
z6jg@;(}}i1!!ms^`OM1F-Hd&%G#WIhf<NNO5jisiP!n*j_E{2$m2KPp^0&s_?XPS7
zw<pYmF#Qt#nVT7Difr?#*C#FLnPj{5Sf<Z^bk`Xce$dvZ-IfTmzrwF9pd+d`^T0b1
zakMa=NBwZxtg`1QrZoZkZI|^6coV!ABJZgnONPH;dmgJ2SqdeQB1KE_`z5e8>2MYR
zM!<CkvW)%T%!D$K<tXH9#UbPSthPuWOCd^nsyF=L6I*<EU@i;}Ioi?vl1Y=OHo3)U
zjcPxgv6RLbG3+xo5a!nR{EWnjiSMS)!>v<M4y_hBt_4=ef6-ISW^d1Y3~U`BR7}=g
z&@fd}p|s7b&DP)OhcEk14fT6uQ=WYsmm5f;-6f*Xq2BF`=5{;(lh*bu(yO_p@$^Vl
zoU}0GV#$N%;gKbE_=AIn1Nd&{P(ISi0&*>ITO4`D^+05NUeJ)3?_e17(|bNtnnedc
zrdr>exs$?puwrK-qPPu^gcVmceog(^9hh#CnVDVZTP8387u%Y8R)4e>J`7s^dC#ct
zBYm+oncJkp;tu0?2m9U;Sfp_RnMqQurj*n#90dy%X@)eQrVebjH_Z?fo9YG##%kKu
z2KLix%ZcmlM>*NZHZ;(uVBIvG{;MAtnD`RyD%zWVh=$OP6SsU7M4i5$ysqO7P;r3c
zV`m_0>iZyI;^FFJsr#4l0A*X6IxS6_qEE9FD&S{T=9XuUuMSv}WaK}aF%|0q{<D?e
z_<L3^&I10@9*ntG7?^hNg05Hbv1_0W#cexx?e{9~2s;4UoY=ArvyisocSr_g^OrMR
zc5JR5yB3zRAKb9@Gxh5~s9*Z%{?5z#gD2bICzYMDF7rvkYwWumwNDaTWSwR61v__H
zIhXw|^}~Opyp8_<rJi&jRzAMxR_OlD!^$wtTlbVZ592~LZ<#4~&TA@sj?)(GqyO<E
zaaf;ufnw;YP!Y=@uO*TjQMDm3QSIUq5_wQvYnT%&;sm|eK2XX>w2D9UuOMJ?i^&!Z
zd!MZ|r<A<&8gq0j+xmRSnTB%ej6*=!{w)Dd+C+;>LCT8PDF?cKS+O$(c_L8sI71~{
zOR*$iUya4CRZ}0MYr(X`0cWRrbyru{#e5;7m&)XICz^fgdJOWuJkQ(!<MqB2)QE3Q
zGJ|hlWPn!bV@j?ZJj_MJvd14T!&>oy1D4AnszZM633WVa{gRD&teyLYQTfGIVqd`C
z;FuJanz7gcFH3rk+G>9xvxh(0gT2Pg>r1ofW8lG^HsKDc=O)+J${|#uD{ZQTfb07P
z4gy)eeCOPia1(9s7FNh##;mvw6<wJ7$Mow*2CZlN0*D?!L*u9*wiyJnT~yh&-g(+(
z%rXY9YOb3HeyYbJ94d6B>A~Jz5!7X}vVp-8!_uvt*W;CA@9oLMxL%deLtnUmtFfK5
z<msDs^Kh&g(!%vE5tmXxN9!8gKevVYi_4C+Qx;_tuTFVL6WGtASYaVY5=x;1YZ<t{
zq*uYtwD9{(95C~M_bM7nH|G?XjEWov-dE9r{n#z5lx0(i<Q8src104vHp9>!<#h<|
zd&@)*88tWDndVV4jb{ZeG@|%xBY!X>+j|S7vJBej>A>y`nzdznHb%6>9Ga?Nc_=Md
z1@-k<wgz0O%<71el@Ik7u&uufEu8KM*@L(pk8h7!f23NZ^{UD=f|8^r!r&15`0hsj
zw$uxZxqS)b%R>@{ug^Nw&+^dK)Zum2rhr75kYG~?;KT_W9X#7OZ|qE|CaIiPk&!~>
zWbVLdS=orWBY}NA57|V&G}1FZSX6{oF}9hitYWp-luqPkTr@CoTv@q{dB1z<yz@{o
znG(Dl9v<g^MJY62dZqRS>O81<M@JV=DImyo%Qlp`EbH@E4OO30?^Y;O6vfP!`?T|U
z1#MAn>xuzCUJC}x>VAYXpnGM!*zO``+N$Ye#tqKWO3QJF*rlBUG_;L9*{!#0wM=Fr
z9ri@T?v1w)OcjcLL-Mg0ReZ<Kx;Vt_ZyJV<x2!t7ZiQ+-|4ZrGO>D@w{cx;q`I7x{
R+3&a<_@u{)>K{X{{~HwA+7|!-

literal 2957
zcmdT_c|6ox8z0vVp=ePlmkJq6qjb9}%OKGpTgGneTuaEl&Ln9gW5yPfEko83k)ko9
zo29W`YD~<vL}M^98ta6a_m{Ws=Y2o#U+??hdp@7@JI{H}_dLIIp5=S)S(+Q~5<M&m
z0)ckHE*n~dKs&gAY$+lLeDkU34q!NBX=ZbY&*uZ;;>t|f>xgtf+U{gB*}g8?7MO~J
zTbo}60ibV<O0m%Zfy88BhWa+q0`vL9*eMlBLy3yJ8~nm}dWvBkjI$i=S)VlZy!56c
z7;Bg9?a))Nmg11@eY(3|&Br0TU9G#`Of*G78m58uQh0kAi@__`aZIro1$meeHdUcF
zHOmzk{<-YuQ@!~e1uUQOWaNBDNyGAT6FE;<>3CNRlBeKjHa^K5jz%m^^W08NCG}K!
zX@#jDI9NjbDtrWXSkkuZcGI19HsahLGO{!G5;KnPgt<TJGsTK71mvTG8UkW;V28h0
z?Xq`T@qo4n4ut%9I5^TFxOd55M!L1rlb$x;hS}dSu)$R2N8Fpb7#^})QEDn6i)8*B
z+C&Y2sho#=jt~w$;6Bc}c9LB@PXphPha(NSXtATPlle`o>St{c<{nqG{+L6RaiAdu
zv1LiqGM_ha&e=ZwqVDhSv%lDXa&Baou#YfES6*D_BDW%)6p%s2iX;+Jy)~ThjNsBa
zS!vH=Me<cU*Y*{ns1B&~7~QtIE;!Zn7uNU?t~bFoNCh=s5>aKskZ2oCA$=8vXfEl`
zC&5CpbNW)+7neE@_y;bnPkSM-_c3gW2En5eubr0^jo?Bn1*&kmw?=~oa)0@t;;>4#
zzwJ6-Pdr*6^*U`g>4WFSdU>(LkycBdwMZxuHius1jo{jIDz&vD8!s_5Q)sqpuZtd0
zol$Z=2rx?XqXGBM-iFaPYpt`N$5c9!6=*GX_apKR;2Ry)eOhe4CkY<q$EfSmfe5UP
zCF1%hLS^rHOCI=XBMCiQ{@c@<=%jb?9>NAGw?ok*i@PAK&VDiX>do5K4=g*_^+!m#
z<}yp(@ht0d$365G>6`H3x3J0%w>Dd;-Sa{o8&=bTIOtU*tm3g_Q1#}usz`65<ijDW
zcc<YHc_msaI4ydnPNAYq+yral|MJ7N$FZ0XcTe9ac!RVwh9^qd8N3W&n9qOKdsez~
z1QzqE&HGt|g_!%<Oq*0%T%hU~+&C^Jf#I5zMssdxCR$jZoy5jP`eu^O*T)%`sEl>y
zLd!Qx5Wh=>(ks4}&4Uw|QSXZKM-HBNk_iopTUej$$_yyzHpLzm#h@>};8jvy$S>y$
z=hN92FQ^FFKI*d{<AB)<WWC#H!^H>)YaWFV;i{R4POZq&eIxcLNO|(Nbdp>cwP{{<
z<@B&|D;{Q4n!!e#FDW^uoQ6Jwvg9gO7+0ky-A&8l`&chfU#wCi7gSM8H7fdn6&Oxb
zgub;*u}4y#t%}3WEj?7+K4?YB9JzjCd2Ra5?o_D?*EP)-nfp63E=DH|Duo7p)x(Oe
zjs?411@m>*dB+I1Vq2#0?^7RsB8(0c6FXlf(=ROSaQ=%T=ZTmZ@z1Uiri{b+1cT?r
zsZD43Gho!+n#!#{h@vuDhoO$cYb!H3SesP+eblpokh+g>$$mfYucv>ZiUl&Y^XZ92
zc5u7h3bVT)ii|IxBoT$n8ClTq-m*=oL@=S&BxK{2E<KID5_Sbb${BPET)GoU)5LkZ
zbWu$sycs)aZcTqaXUh4tDjrF3h7<iOC*$oX@CGaJ)boT(wKW!bV9!n|CnuV2UZ!qV
zrg3<y_aRe^PUj`ruBwVoBB5@fuA!vFN*&($UPrg^Pb(t%`37MG=cF9EBPwb_qh&S`
zSvU4cBXA|-;)mU=Zmeufbts`bY?X*VSI;pWln+0UfhYA8#>9jSZS=@F&Z*nJLKR;g
zJXj~Ue%-OL-IZSMiz6)_TFvHza%v?$ZporHoUCO~Wt$8sd077hni&6JvCxqf>&yRZ
z1odpfy{2{_FJt9gPxoten3fHbEu8?aIHcs#3b{p7O8AZGD$18r;VWvxVl`^N9EY(d
zUAW0c8F=YjVuZr%+gBeq6UZ1;f=DpztHi(1=-bPKo&Uz2(yFAt33#x_o~!tchqtNK
zr-P!t&BNaa_}4Q~3Q4Wo<3C8;+Z-f*Lty>Mx&#??2qfqR5+~#BxdMRh6iCR;gSXK?
zC;=$HO_w|v!hjOM-MGiygEWP1W5^)0lq|XLo2NUPf1m-1|AEe};|PAY4V>_YZQw!J
zHU<(rb;cG665RgFLuu6?W_wcqHVa(k|Jf{GR=L#6+T<-h6AM#T%&;~&QJQ%o`RDI$
z6>>BA?>up8A9RDeaq>zI^oHlxY-qpHQq|4}!~H$<ad#DoPq|lGGA?j$9|Z|5TaQ<C
zJ1_^HMpMz#F%Y@me+CIIN&x}znPh|ce(v*53uZM+%S?jBnnyG~3Z2P6xA#VNF$Zdy
zQ!rbkmy}t^<iyJZ(Pon=5{nFc`0$$}Ic!=m%@@k&F#To5TuBFA{guz3lDKM{(v4#o
z7mUuCBAEWxis@2H_@6AF5{RXF2bBd=S)b5UaI@-IwT0N!L}i9cT5Q~aQB(&va;b(f
zep8@4rodDcN=^k%)`|lMS?$=nY#fcEHcpyKV#21qB_C|S^8r@Mw*jMK+J5zGn$;AD
zG^xMu)YBCEOt&}3{>h*V1Ko5jIL!Q<gturxM`?6+cL7HN;_>~ut+;qEu~EqW&6zy#
ziEIig93wt-Ejhe;vlnlig|bZcA28Y(R+d9r^<&=j+XuRjQGZD(5}6{$WL()2>Y9py
z*j+p-9sngr0U5m>)J!4C&f{XUC^(DooBraNC@-WDS1f;BkiouhQGoy+iRtu4f@F7S
zuPwK!a?EZ7&U>uqZW3}jT-TE4u3W&-2o{pO-6%JK1F9lkQ?NIMLxs=S%6C$r8qku>
z-rl7mj$p(7V+B^cX(uUDwRe}fEwSQnu4`EzOYCcmpNUudBRFI@x?us>Y>T|XJ|Xj^
zbpkG$&~$u2T7Qo%&SeR#Nkm0qx*P`_F5J?w<Pk<5Xdi@wkx`jX&0f9lB5>B~1vw(B
zktJFT?YrUdT>X;;v-O<cM}^lTfjo3IZ_aNo?5D>N3#R62v9@+QyV%DbbTEQ-rsJkH
z-^mzOTwnzrMf=aPe6#dQJ(AxW4ycUfz{@$kiZADeM}HkEQ}cG^mQ*><nY*p+{q5>x
z-{%Xinr^D7Ar`IquShX6s3$Q?ZbELV?Ihpj&ZCE0=}G8$nv(F46K@wpK%AWO&B=FO
z1g;4>@ruq%cD^0<mBG`;nT;&fpQ`58V{@vEfv~Osxx!PF)h3g)*i4_69RjP-Npp@f
w0@LmP8&N<hh1*qWW}=*%X|1tcu72h`;Vt6n1AB&yHbFpxT{1T$7`Wa12Y_ydlK=n!

diff --git a/docs/structcutlass_1_1gemm_1_1DgemmTraits-members.html b/docs/structcutlass_1_1gemm_1_1DgemmTraits-members.html
index 2fd59e58d..c6c1bfd99 100644
--- a/docs/structcutlass_1_1gemm_1_1DgemmTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1DgemmTraits-members.html
@@ -73,19 +73,21 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1DgemmTraits.html">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
@@ -98,12 +100,13 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1DgemmTraits.html b/docs/structcutlass_1_1gemm_1_1DgemmTraits.html
index 2832466c1..3d2d5a785 100644
--- a/docs/structcutlass_1_1gemm_1_1DgemmTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1DgemmTraits.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -75,17 +75,17 @@ $(function() {
   <div class="summary">
 <a href="structcutlass_1_1gemm_1_1DgemmTraits-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="dgemm__traits_8h_source.html">dgemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1DgemmTraits.png" usemap="#cutlass::gemm::DgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::DgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" name="cutlass::gemm::DgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map">
+  <img src="structcutlass_1_1gemm_1_1DgemmTraits.png" usemap="#cutlass::gemm::DgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::DgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" name="cutlass::gemm::DgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map">
 <area href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" alt="cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, Index_ &gt;" shape="rect" coords="0,56,4915,80"/>
 <area href="structcutlass_1_1gemm_1_1GemmTraits.html" alt="cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;" shape="rect" coords="0,0,4915,24"/>
 </map>
@@ -94,10 +94,16 @@ Inheritance diagram for cutlass::gemm::DgemmTraits&lt; kLayoutA_, kLayoutB_, Out
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
+<tr class="memitem:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt; GemmConfig_, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>, Index_, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a></td></tr>
+<tr class="memdesc:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">This traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">More...</a><br /></td></tr>
+<tr class="separator:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a></td></tr>
+<tr class="memdesc:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The struct that consumes this Traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">More...</a><br /></td></tr>
+<tr class="separator:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a></td></tr>
 <tr class="memdesc:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The configuration.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">More...</a><br /></td></tr>
 <tr class="separator:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
+<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
 <tr class="memdesc:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">More...</a><br /></td></tr>
 <tr class="separator:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a></td></tr>
@@ -118,13 +124,7 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a></td></tr>
 <tr class="memdesc:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for B to load from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">More...</a><br /></td></tr>
 <tr class="separator:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamA::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a></td></tr>
-<tr class="memdesc:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for A.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">More...</a><br /></td></tr>
-<tr class="separator:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamB::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a></td></tr>
-<tr class="memdesc:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">More...</a><br /></td></tr>
-<tr class="separator:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
+<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
 <tr class="memdesc:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">More...</a><br /></td></tr>
 <tr class="separator:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a></td></tr>
@@ -144,6 +144,15 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a></td></tr>
 <tr class="memdesc:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear the accumulators.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">More...</a><br /></td></tr>
 <tr class="separator:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, GemmConfig::kResidueInProlog &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a></td></tr>
+<tr class="memdesc:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">More...</a><br /></td></tr>
+<tr class="separator:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">GlobalLoadStream::ThreadblockTileStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory needed to store the threadblock-scoped GEMM tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">More...</a><br /></td></tr>
+<tr class="separator:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a></td></tr>
+<tr class="memdesc:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">More...</a><br /></td></tr>
+<tr class="separator:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
 <tr class="memitem:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a> (bool in_loop)</td></tr>
 <tr class="memdesc:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">More...</a><br /></td></tr>
@@ -165,7 +174,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1DgemmTraits.png b/docs/structcutlass_1_1gemm_1_1DgemmTraits.png
index 151b3c5ab08b7f2e1711f5e93244f8c69d12d45e..6307a7cdafa55844447cae03c970099a09a988e8 100644
GIT binary patch
delta 1775
zcmYk6e^gWF8OPVsBeEiNvy@~}Qe}nXilmlJssS=>m2n)Tij;MRMCG6z3PBtskRNy0
z&K??p+N|OMO)8!i0ZEEdk`R(qI2xM>DT9zmNP<8J5R#BwF8O(HMh%{`&tLCf@B5tZ
z_w&5B54IfqlJrtXPtkADz!^%TnL?;*5&|oYRH(dEK2hf+u-{xd5l7fM2OXFq(T^_D
zf2VJ~Uz6tboJB^?%SK<#Xy(K`cw1h?qS+JPW}a!yn2=%oNU6D_)&(#9_rwu6xrJF4
zM_w+b4+U~66_4<0FIlfCmuh~$D>_UtNjY*FwGMzndDG<E6bkms0B5D=9Z#uI1_qk2
zoBet(F0!WTHBmfyT++ExTZ|J9jP<1B6!<%_DJor;^P|AgXK9AH(<Z0p4S`D5Dg3K1
za0G5`WtLqQ0RAmDSN#aEbGcn)O#bTiO<~yF;<I};2H2}~K~G=@V6#&Ba(K;R_d(ef
zj?J7!VR<in5u&q1{wAG}5WKSr!S{x-akxqGGN}Gd#-`8C@uS?Vg$lc?-Fl1J#b}R=
z|C)Sd{@pcjSeF(WA1pERlGYaGSP=T-r^0AN`K|R2#9U)9JrgfFS3PFult?#UR##>^
zbz3Mgeg+^+J>zt%z<WjI-A%h8=XrNSgDc}z%~f&-;;NVPX4<b49yM{?ix2}auy*F0
zI{BRGbYFGq(2rq+{@Q7_D_Ct+Ke#9nBNj1IeVPE!`{DPs{7w@Ubg7DamA|G1f^K_u
zK}NIY70E&ZPYoL5tElaO-Dhdb7N-ys@!}L(l4GaikkWZqOY>Yt^tZ5DN29l`A$?+b
zPcRpBMnfG?Vf9prF!j5Yc~ujI9|(*b3)Lr?^{Dt!vg0k%e>}<lyoP4mzq{P7@3E$8
zXY%4j8;zE*Q95%{l)wE&724Ul0A%MxIW4Zwo%~ed9M_9E2rOv3n{$met)-u|HseT{
z>CDKT8@s6kLv7jV@5}zNT>ZTe2k}4oB_vfIvkW8494%a2Ev+D3i~S5<?qlF`TqH+h
z+{PnWHZkM17bzuYCWt9!xtF|+g2-ho=_)fRbO(a{4{{~ZzQpm?^{f!!6R;zq(4JLg
zSu~UwZI2Rg6jLzmfS}WKQ`ovoTFa=dNyrkY^3zj?rqF6j&^T4G$EF+l7ltUSb@x6d
zTp}D|(CTp~r2X*Mx5)Ny;=xd_k+($tNP?b#7R(<n5k}`Qm|4fYBIj)LKKJAYlyAq*
zoroy3%$_0)*iCuBF>$3Q`<J~~$9rRT@h_j(g`up_r`fE)Oh*R7_SF{HT!sfF>vM0j
zHY{me!u>0=f&9lf3Ljr}G~^$Nf2rc*tnG8<SDJ4#E`XrgGBDj1^!iLs%u#gb<#;Y*
zUl!?FJK1<#8gK9ZlN6=z%6wQLx$dz6&q!2}?ba09je#E)_=a*#W)!tMI#nH+>}P|8
zyS}h)6#LdLp8C+E!3_a5crtJBoiHmkl-Mbp{F+kKW#-94cY=RYKg+9$@g29?m(0$Z
zyVDf~a>SjuP_R`4Q5^&QaRS!<$2U=)!?ZmY3jrE=I7y%ydmNLh&P^Av2Navr?NheZ
zDiQTCb9BZdq;@}j_+zTsgjurDD#ewV<AzhR8!e&3Twx#meyp4-&|M4J=jcCx&n4`E
z0#EuFgd9Fbp@71Rb8`BAqah#l!a~&rCjO#gfL#+p{C1HOFv}^v+II<LdjE*)?>@f=
z6&PM>!Zl$P1?=;X3*nI2V4}M?#GYcGeT5(>Vg-+X*?xee^kxlkMp@1^XjpTbk$`YU
zGWu5NV3o1GUdmHoX<1sf+{-diH?g1EtWo0YD_uXxgMNPtd|k$w$DN&ae27gf>ZMDj
z0b-GOs!Z1kDw)Q-Vf+y|yM<X&Oxpbu__`_OC+*%^+&;m6K$62Vc>k#<Ql-TI`%ulA
z(y%uuFEKC|1!u>u#%=<nlgdj21-AU+f$resu%cuJSy)yWMzG~D*&AYV`R81;HRsL=
z>ku+p78wCVJV!CFzq%!S48>81R^pAH`FCUZ?!4vMfElkfN&Ht)SoCaHox>RH+Un`K
zIz+A1{tUE1t!Td{-6weiV1(qf`S?NPyE4!1$QNed;qk@T@U;<&`S-G_{tVpP&m5%I
z!}v?VV^^f<p&d`_KQ-G3W<zK&8Yb>m39IM%`sxj_aCisS!rg)1`f}ku?q2kJTyb<X
ncRL!*?LiSR+msiA5lC#Gu1>pSspI6Y*2y`P_krNx$xHtOM$X}g

delta 1924
zcmbtUeN<ET8OCEVv#n5c6{$d|?d+LKQVR}UNV2*zyVja|CQ@g}RboXr8&^TN3AyCX
zQe`eeWDGM&A?N6^STKY@V**Kt0wD@TRHQ%yxj_iwGarP6BsU*x2W<Y|=bz{O>;1jI
z=Y8I%YX8msSLth-r0E-@kR~F|A`!Ld2B|EayfA4GFnezaPkqfP{)cG&f;TRQpt^lN
zdBa@quqw)jB_Nr14O5|XPiHH``EtYPv`+i?vDcvnO5i+n3jbGM)ANB_@`C%KGYhiN
zLaBCagVo&Uf5W=#9_J)g`4+W8^X@Wij<T5L8hO{Ig!i3A{NMREk1<bL23k4hpWa`T
z+JUfznYbLH>ULi0n6rz)VAnE11{eBNa&W!MMt3-~V9t>3X?1<%$GOyP4c+QG$(=4t
zX-rD;{P0V9aPh(|@8fLbjzjbdY&yns*>~~6GDOgvd!+`>Mk4@i*xJSoxTf_WV5k9*
zBW;SnyknpQZ+7tqq52@p@9p4!1fWE{@38$wX%9sceV_R|h3k48S`s!GixkFo%Uhws
zvxld(X9!Fx3X>hQc)DvoD??<#b_28ocefGod7s_W8YNqmXB;U*_0set_xSkdCf?WF
zIV6;RZT43!{YrjfKy^c)v@n%M=r^9O8a6}B8&(7UZRL!ILeid^&9ma`ffGaF)(5l+
z;;YN>sgwt(E49ix8-ZyZ`f4Js&-C0YSnJhC`F&&4uJBZ(u29pf+sS_tyK`jT(IdyF
z+Ub-{6E`?4LLUMF&(zg-%>rKRSW|N8oUv)-x`L;OjL|e7MMv@8N}-(RRLVnZ+8MOo
z{9+W~`e5iI>!bGmBFSI6!V|gD?UC_n^(%o7D!{qxyfZ|36rsDH2HqMb9Ul|4b6E%4
zM4CP^dVKwsWw@_`xP2=#!-ny&2+TRpvzqKBRuQ4kSmD^ZA5pWw0pK#5Z641}hbD3(
z!be&yF@&D}XljazQ5C)?kdcTV3Po-_Omcm<Q@ALLDS$FZ`o2vo9&du<<}#rPj)!N?
zh3>4HZH;cUIda`H3{F-jw+MUAIR|?%muvp1<JZ2M-!IMLl1%SS@IM8QB6W!OW^Zj6
zU4}iYtOW)6lC2yS%y#s>)KXUnwdH(0H#0wNV!IVPXrqc(^D=h{98g||_6`ufw!uHu
zsm(>Ru+w3{CH0kan;cm~w3>n^d;==HSl{c+$f_xLE-ck->Bar`MoP(fP>MwE?pb8V
zgAMP^%hHSM7wnA)-cSyjiS!oit<~MmDxk%Vd&|IL`9l&ANUqeOL_m^F=8_b<1aFGQ
zRfqli0;xDIjJ)hI&F0k-W&qT)ErifhTRc)~&pl7f;c{EPilqMwPep|u(i-ciEhCqx
zD>3KF-j+zb>NiKfRBw6g#QKp&z;ISwYoimcO|(LyEMLyY_~D=A#yFGWl#b6^nvedd
zmTVHOn&w~f+sa@fVy6@S8MUG?#q{E^ZLv}Sj^~4E8gfzaut$2Wqk18F;hRVL0S)T-
z?EY9C>^B{FT)(|$79C;d@1$eruOg(~mQqW`WP?Rj^$ESQwmgP@O_)RXvyh0KAK0?~
z!2zq->$LqSF=J|W9nox>yu^E~*fCh)pZqri^s!UG)AQ<d+dEaTOe>6EC_>eD6AX`p
zX{2D+K@Hy3Pg?N%igJ7m{)uH6e_y6AUiAlMYA@1O-2^Z+Dg^Pn^h+Qrfyq2PF*)7L
z62pGZ75{0cPN3tXJE(WPtY8XJ<B9M{5o(Sm;S2m=1BJWeL4RBW6UG~~Q*99Doislo
zhX+$KV~?{`o>ohLXL=vXCyBDDfRAELTB~`(^T}EPx$PKg9&Xvd(U(W^5Y|}JH$4|y
zn%}1773TMt4#CZK^XuxU&aFx#Khe`&)ADDrIaP5?Tp#0N80h(d++ecYKHVrXl#3n!
zt7pbe`(HHp-WMfT1g9bb_l;m0_Ssc=c2V{fc_pCq$PbR-tBc&n5CwCoJ!lsC=sZm`
zf<#Iwco*OD;cBmMnYD>4iBkfT`P6gUk*43m-6SdBidc_u%rgfv;8Ry5>sld)<j{!j
z4`IQR!OLZ%2MtKu!#<f?k1eSaG_Sdm<{#k6e_M%RVDV2l%4!aLe-57cFmNj0{Uy2)
zI|9ArxwQoX1I?Ro!Ny?wgr6oJloXsMZCrL(U@3Zu2CmHZ0=es>fxyX?rT(9cAOw3#
zDt2$)gpArv_!XDFK!F0C0C}O$>aX=NW#fA%_m(k#1_jmxaZejB1S4;|l0#kz2?_aQ
M%ApS$_MiCTKWb$I^Z)<=

diff --git a/docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig-members.html b/docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig-members.html
new file mode 100644
index 000000000..6941e82eb
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig-members.html
@@ -0,0 +1,118 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">Fp16SgemmConfig</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::Fp16SgemmConfig&lt; OutputTile_, ThreadGemmShape_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">cutlass::gemm::Fp16SgemmConfig&lt; OutputTile_, ThreadGemmShape_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig.html b/docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig.html
new file mode 100644
index 000000000..b377b2896
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig.html
@@ -0,0 +1,186 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::Fp16SgemmConfig&lt; OutputTile_, ThreadGemmShape_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmConfig.html">Fp16SgemmConfig</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="structcutlass_1_1gemm_1_1Fp16SgemmConfig-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::Fp16SgemmConfig&lt; OutputTile_, ThreadGemmShape_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="fp16__sgemm__traits_8h_source.html">fp16_sgemm_traits.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::Fp16SgemmConfig&lt; OutputTile_, ThreadGemmShape_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1Fp16SgemmConfig.png" usemap="#cutlass::gemm::Fp16SgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20ScalarA_5F_2C_20ScalarB_5F_2C_20ScalarC_5F_2C_20ScalarD_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::Fp16SgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20ScalarA_5F_2C_20ScalarB_5F_2C_20ScalarC_5F_2C_20ScalarD_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" name="cutlass::gemm::Fp16SgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20ScalarA_5F_2C_20ScalarB_5F_2C_20ScalarC_5F_2C_20ScalarD_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;" shape="rect" coords="0,0,1576,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td></tr>
+<tr class="memitem:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef ScalarA_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a></td></tr>
+<tr class="memdesc:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">More...</a><br /></td></tr>
+<tr class="separator:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef ScalarB_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a></td></tr>
+<tr class="memdesc:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">More...</a><br /></td></tr>
+<tr class="separator:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef ScalarC_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a></td></tr>
+<tr class="memdesc:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">More...</a><br /></td></tr>
+<tr class="separator:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef ScalarD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a></td></tr>
+<tr class="memdesc:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">More...</a><br /></td></tr>
+<tr class="separator:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a></td></tr>
+<tr class="memdesc:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">More...</a><br /></td></tr>
+<tr class="separator:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a></td></tr>
+<tr class="memdesc:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">More...</a><br /></td></tr>
+<tr class="separator:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a></td></tr>
+<tr class="memdesc:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">More...</a><br /></td></tr>
+<tr class="separator:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of warp-level GEMM.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">More...</a><br /></td></tr>
+<tr class="separator:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a></td></tr>
+<tr class="memdesc:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">More...</a><br /></td></tr>
+<tr class="separator:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a></td></tr>
+<tr class="memdesc:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">More...</a><br /></td></tr>
+<tr class="separator:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, ScalarA_, ScalarB_, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td></tr>
+<tr class="memitem:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td></tr>
+<tr class="memdesc:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">More...</a><br /></td></tr>
+<tr class="separator:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td></tr>
+<tr class="memdesc:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">More...</a><br /></td></tr>
+<tr class="separator:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td></tr>
+<tr class="memdesc:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">More...</a><br /></td></tr>
+<tr class="separator:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td></tr>
+<tr class="separator:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td></tr>
+<tr class="separator:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td></tr>
+<tr class="memdesc:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">More...</a><br /></td></tr>
+<tr class="separator:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td></tr>
+<tr class="separator:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td></tr>
+<tr class="separator:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td></tr>
+<tr class="memdesc:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">More...</a><br /></td></tr>
+<tr class="separator:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td></tr>
+<tr class="memdesc:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">More...</a><br /></td></tr>
+<tr class="separator:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td></tr>
+<tr class="separator:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td></tr>
+<tr class="separator:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td></tr>
+<tr class="memdesc:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">More...</a><br /></td></tr>
+<tr class="separator:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td></tr>
+<tr class="separator:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td></tr>
+<tr class="memdesc:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">More...</a><br /></td></tr>
+<tr class="separator:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td></tr>
+<tr class="memdesc:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, mainloop is instantiated twice. The first instantiation contains no predicate.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">More...</a><br /></td></tr>
+<tr class="separator:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td></tr>
+<tr class="memdesc:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, residue is computed in the prologue.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">More...</a><br /></td></tr>
+<tr class="separator:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td></tr>
+<tr class="memdesc:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, kernel is launched with launch bounds specified.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">More...</a><br /></td></tr>
+<tr class="separator:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="fp16__sgemm__traits_8h_source.html">fp16_sgemm_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig.png b/docs/structcutlass_1_1gemm_1_1Fp16SgemmConfig.png
new file mode 100644
index 0000000000000000000000000000000000000000..b06220083ccec76ff0fe991677e986a81ca73184
GIT binary patch
literal 3199
zcmcIlc{r3^8-J{68f`|XEM?Nj5>m=iUotPFXpC(%V^2a^db5<ZURx9yqAXK{HcMnH
zGbl8cL}D1sOpzIx%$O#U^?URd-*;W#^<CHZ$9JyldCu=S=RW7YpZomI@4kk%G?j#G
zg#Z8`i83?60Dw3G#Apc-@Llmq@+sKKqEFZ$mzI`5I5{;|_$u%wh<-i|4Gq|`5IgWw
z;v&Y<8UT%!TW_0<4gf&cqfCz4ga}RKOc0(NgqkF0Jq}+oWt@<3`62QKev?*A93ILN
zZ71w<Sjh0oRM}_o{&b;N<{Mp$)H{V<I`4HYSnOmJ;W}Inr9(IkZ#5&NsKb5%xH9Us
z@eb4<E3>L@xi`VVUjthpD@(w^lq7UMTN&k-q7X^wc|acK<0vK1BR*xga_;W85NP-D
zu)&V@tja-Jh$UW+P1}kZzd7+#BRdkx#C;?kMy_e}U8B#c{9qGItn$jQ?mtP$468hv
zEL<9)c)e<5{~W_BZg1_Eq8CchPFCFS{byxSA8C<H#xy4Pc4-}a>TGHM^H_I|!9K5+
z7c$>&bE=Exe(YgZ1V5(K!jVZnU)2{$JALkyE9adnW@Z{|f0+)Um47%9Osw=8>KPxa
z6`2W@yo^Cu;_Ip1mdCjAT&IlUHb<#fTylM{dm!t+uO=h-MW|E)&4tAl2;P%Wi@b54
z(53n9hjn{OpO=&kA1X-ivt6jZQqfc)zA)?hrxGe<2WNqhEPEW&x|UPN(+KZ;0~1S>
zD&r=1IXhGto0MjI8uJH2&L?#Eu`W0=GzXs!eoS(xZksI(9upj}?aPr$DAhe1<a1!q
zNru#YXv_JrV!LXYK%OGkH{(W|Bka}No*J5aPU3>E?=%69w9Adph%|5}44j-^yu^ML
zx6{ag(<U9mJntg5{~WRw9>7*f#(rO?<*kmA9-)dDzk6f5F(CqS6=;(DdZV3>-*R{Z
zS<}U#%C*{5-r5ZN%nz=rb;kOS!TM9QnPPGN_pKE=ZGKoewvG#B-ot4d-KmF+i<xtz
z8VA@)EaVMM@WCy|xk|8)h=7C56Z((4yW<YR2sVamEQlSkhBIF>HhQbH5N!TDw-8_R
zVqxSpp~to7vJGPVik2pffH_*`=!_WG+}o6ATV(}C@Lskuu+a?jslPC(%IaZWXHfp|
zI>}SJcZf1-kPlvb9j$b%w=*z<bn4;LZ`G<t`z|vA9lMX0h^h~x$t3I=!%GWn1#@ue
zlXatv7n^b)K1-1+*;bm%YE92iQ0A0iHf%eNN!8|bN+9=&O*J_s;w{HwwRG$3$#iw_
zAX45!1V(zyM{{)+Y6Df8x)BcxhSelbsWROL6ZSc=?w{QkH>%`gz{t5%{k%vm*g=90
zW}r+vX1eyrBxgR{9?|x(H<L3Z>m`BoqsOCdAhwACb<_Tg^$ztO>Zo0c67$(;Gfd)T
zx8Obg>M#KT%L<}d*2sUp?eyT{dZW|UrnU4mH)yjlW$o0cI30zO^Q`MFso!}raI^mY
zG#GKt@xY#7FNyDpmp{BQrQ>}uVYoW++z>J5?X^>Q=UrCjy{U>9g6Z$%BbuMb4mw88
zDsXX2)EOfVF(CWd@$f2>py*-$2icDo$w~cny3somi;E}ce3K0dQz`Ug8wS$eP4iAg
zBqtU)`*vx|LkE*))WoswB<Y;~YrLP_lY6xgr*KeUrN>)~r0#!$o;T~@(6_gSd1m+}
z_Fkx&AgAefdNUpM)(x?YR4(u_5V!bgPn3c;N5NNE&&?6RRUJ9syBp8WtR=OMTf>UR
zC_%DQO-Y+H21gUqozpkGv?p>a2XYvO7Y(|!OHIzb?6?GNo%j^dq*ASJfMA})guLzj
zK@jgquBHXWzIvQ4VnpsWaLz<-9%mR0$t+VsD;nhFSlKvr`Qq9idkBM|^pD}*z(1#k
zHMQfiNHQ-2sSkn{UCQ)3R8h|N<tY&tDP<XIhwUU$kfFYNGWJE43yS`iA|;sLXSl(r
z9|D71iSFH~jLDLW2M6kGumnqfI$xfujH{Q4h4-EgU69U+zXDa5)tcc14ljz6%iWp-
z$$8)5F`iwc;X8&R$KLI$e<W28OSn4;|Ln%)??f#ft-F<3WV-9~$;m9Up;Lr!s5*bg
zrH1I5BhjVXXEXjybw4k~#u%??a4Qz^Q>B0DF!H~s_1BFF|5@?*Yg_<m)TQ|ak>y@U
z3lML>B7P&$oEeI_(65Qt#=ntx%iTCjtm<#8ReL~GT?*U)kOf3s)M397uyYFp9QbLz
zihxb)#QydN$gZNO_!!~8*8|sA5cD5SE583F3MIE(U^!mUo%;$B*;t1D=^u2riiF}<
zgIq;`$!d_R=>HJzMq(O9N44NI#=JE@jet_!m5MP3Ypv)?$|rBGUCqHNQZii4*D6}h
zT!V!nW+9^Ly<jg_e~CmAJD5+N<l{O?pZ5oKt5uNQ&-eiP*X2jSB5IzMl{Bw&&M}>x
z&j~J?D>*4&_sn|Qh~&*4*Uz9^3(H2Wdx{2znmnV0TZl-d@(I(h3K=doUHtsuXdii_
zxEr3m)N<GpqaX6+ZLw@Qx7mm_tHJSYV=*mzNR<`V^JKi^@P!(R5VT<pxDlRWNb!s~
zeB=oEOz1SP{NT^Z*tAXX%sDWC>ahmrF{q&y!7yB+6>-#RCj@xRcFpy?K5Zf4(*21I
z8W93glZaxrD}9dvsxvhGu1o4#?zo7O&S|p2c-(a%b4zS>I9ru&6!y?vt*Ww;YA&3H
zXLlP5`Ri?gM74*|qbBNKXNV4_k|UEylRJjU9$wlZeXao&w$P`LiOS9cH}0c#Z(K#2
z7(I@5OU?g-FtBNhXNx=3lP(}$^KnQx-x)C`LZu%%a1M&r_NBuT@(u-kZ(08?UZb7w
zR8sOM&3tm;0U-XN5#*4jJLlU$R#x?k`+KYu6@rKP8O$!NkdZ0+`~0L%Z*Q&y(&M5r
zBFY9$+2{d3x~Tj5a=2(zi}$k_sV5blhA!luHTPT^WbZXT3_OmoBP-JHpDn*V(xp6C
z9&)8U=&FV^(C3;9)Lbt_tLwStOg48BnY$6hryi;>e#bjIW#dgHjJ?r$dRjiYSgFl1
zu5kII)C+>en)R%#jst~3H#QVk8v-z>oQSU6Glo<`ZX>(chGGXn?zZoH{$*D`M#x`!
zIb&znA}<x-j@4q1sKaRY7<6wF#GXwCsxUyqJ9jMUuaSM<+;}0K=e>oFWLGy*{p3W_
zNZUdbXk3M6m%UlVI29#Bnc5=5Qz}47BX|gMv<^f}-k}QTCuX|D;hnb{pUV>GaPk(k
zKJs9R^CU+8kut1<;SE7fgjqf2%ITZ-Pce+9y>k1j7mN9!RHG4PkK%P!mK?W28C#xc
zSV8-%`yRp{%)zVKm%`c-F>g@)!*DU(?|9-~J<re$kCxPLwflV@M+EoN_c&ua$D6nI
z6PuNe91o~*(~2If4KD%fnNfT9*UHFPdlOt&=S}LpOvXr=eOAY%<A}EorPpR-0@7I<
zYBb|`Xi=QJpn%5paVWp%7wACT+yLM~CHlbAa=OuYizgk_Fq`&Q?Lg54`zs!(_>sqX
zlFArZT&D?=J_h8%qWF<pGdI!MgAj?%dsFd$=`PXxJYK#FWiZPZ^Efzy)3=rdO_^kn
zIT-L~BBQOt>+8Rf)pXA+>^7iGK>bCWWxJ_jQ9PFw8T(%Z?UQi|#$2T!?S#4NofVxi
aTwD|jDmU~y7SulqfDMJTG$}E5x%y9{OS-K9

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits-members.html b/docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits-members.html
new file mode 100644
index 000000000..b133a1dc1
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits-members.html
@@ -0,0 +1,114 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html">Fp16SgemmSgemmTraits</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::Fp16SgemmSgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, Scalar_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html">cutlass::gemm::Fp16SgemmSgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, Scalar_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html b/docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html
new file mode 100644
index 000000000..1d06a26c8
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html
@@ -0,0 +1,182 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::Fp16SgemmSgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, Scalar_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.html">Fp16SgemmSgemmTraits</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::Fp16SgemmSgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, Scalar_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="fp16__sgemm__traits_8h_source.html">fp16_sgemm_traits.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::Fp16SgemmSgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarA_, ScalarB_, ScalarC_, ScalarD_, Scalar_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.png" usemap="#cutlass::gemm::Fp16SgemmSgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20ScalarA_5F_2C_20ScalarB_5F_2C_20ScalarC_5F_2C_20ScalarD_5F_2C_20Scalar_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::Fp16SgemmSgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20ScalarA_5F_2C_20ScalarB_5F_2C_20ScalarC_5F_2C_20ScalarD_5F_2C_20Scalar_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" name="cutlass::gemm::Fp16SgemmSgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20ScalarA_5F_2C_20ScalarB_5F_2C_20ScalarC_5F_2C_20ScalarD_5F_2C_20Scalar_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" alt="cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, Index_ &gt;" shape="rect" coords="0,56,4915,80"/>
+<area href="structcutlass_1_1gemm_1_1GemmTraits.html" alt="cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;" shape="rect" coords="0,0,4915,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
+<tr class="memitem:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt; GemmConfig_, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>, Index_, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a></td></tr>
+<tr class="memdesc:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">This traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">More...</a><br /></td></tr>
+<tr class="separator:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a></td></tr>
+<tr class="memdesc:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The struct that consumes this Traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">More...</a><br /></td></tr>
+<tr class="separator:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a></td></tr>
+<tr class="memdesc:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The configuration.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">More...</a><br /></td></tr>
+<tr class="separator:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
+<tr class="memdesc:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">More...</a><br /></td></tr>
+<tr class="separator:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a></td></tr>
+<tr class="memdesc:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from global memory to shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">More...</a><br /></td></tr>
+<tr class="separator:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a96d64bdc48db4971798b620d6b49b3f6 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> ::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a></td></tr>
+<tr class="memdesc:a96d64bdc48db4971798b620d6b49b3f6 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">More...</a><br /></td></tr>
+<tr class="separator:a96d64bdc48db4971798b620d6b49b3f6 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac393b07e780629fc8254fc22cc6f815b inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a></td></tr>
+<tr class="memdesc:ac393b07e780629fc8254fc22cc6f815b inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from global memory to shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">More...</a><br /></td></tr>
+<tr class="separator:ac393b07e780629fc8254fc22cc6f815b inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa0e8fd28f5247764dfb7843f7670c698 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> ::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a></td></tr>
+<tr class="memdesc:aa0e8fd28f5247764dfb7843f7670c698 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">More...</a><br /></td></tr>
+<tr class="separator:aa0e8fd28f5247764dfb7843f7670c698 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae01371eb31b88fa83c4926564cecafdc inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a></td></tr>
+<tr class="memdesc:ae01371eb31b88fa83c4926564cecafdc inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for A to load from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">More...</a><br /></td></tr>
+<tr class="separator:ae01371eb31b88fa83c4926564cecafdc inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a></td></tr>
+<tr class="memdesc:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for B to load from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">More...</a><br /></td></tr>
+<tr class="separator:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
+<tr class="memdesc:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">More...</a><br /></td></tr>
+<tr class="separator:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a></td></tr>
+<tr class="memdesc:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The epilogue.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">More...</a><br /></td></tr>
+<tr class="separator:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f78d4a68817760099081523aa7fd443 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">Epilogue::ScalarC</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a></td></tr>
+<tr class="memdesc:a8f78d4a68817760099081523aa7fd443 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalars in the epilogue.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">More...</a><br /></td></tr>
+<tr class="separator:a8f78d4a68817760099081523aa7fd443 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3129be75ee087603170f8367e10e070e inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">Epilogue::ScalarD</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a></td></tr>
+<tr class="separator:a3129be75ee087603170f8367e10e070e inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a50672b5fa67d858aeff8f254cf28e941 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a></td></tr>
+<tr class="memdesc:a50672b5fa67d858aeff8f254cf28e941 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The block swizzle to reorganize the grid.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">More...</a><br /></td></tr>
+<tr class="separator:a50672b5fa67d858aeff8f254cf28e941 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae67227cecbe84f5c8497d9a7ff82b367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a></td></tr>
+<tr class="memdesc:ae67227cecbe84f5c8497d9a7ff82b367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">More...</a><br /></td></tr>
+<tr class="separator:ae67227cecbe84f5c8497d9a7ff82b367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a></td></tr>
+<tr class="memdesc:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear the accumulators.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">More...</a><br /></td></tr>
+<tr class="separator:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, GemmConfig::kResidueInProlog &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a></td></tr>
+<tr class="memdesc:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">More...</a><br /></td></tr>
+<tr class="separator:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">GlobalLoadStream::ThreadblockTileStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory needed to store the threadblock-scoped GEMM tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">More...</a><br /></td></tr>
+<tr class="separator:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a></td></tr>
+<tr class="memdesc:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">More...</a><br /></td></tr>
+<tr class="separator:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
+<tr class="memitem:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a> (bool in_loop)</td></tr>
+<tr class="memdesc:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">More...</a><br /></td></tr>
+<tr class="separator:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac3c840a3d90c0da43301761af83c2c9f inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a> (bool in_loop)</td></tr>
+<tr class="memdesc:ac3c840a3d90c0da43301761af83c2c9f inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared stores.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">More...</a><br /></td></tr>
+<tr class="separator:ac3c840a3d90c0da43301761af83c2c9f inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
+<tr class="memitem:ac5bb5931a707ed7672f69267753ba41b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td></tr>
+<tr class="memdesc:ac5bb5931a707ed7672f69267753ba41b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout of A.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">More...</a><br /></td></tr>
+<tr class="separator:ac5bb5931a707ed7672f69267753ba41b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a078e8d9cfa1b182e1b96a2cc8c54b684 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td></tr>
+<tr class="memdesc:a078e8d9cfa1b182e1b96a2cc8c54b684 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout of B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">More...</a><br /></td></tr>
+<tr class="separator:a078e8d9cfa1b182e1b96a2cc8c54b684 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="fp16__sgemm__traits_8h_source.html">fp16_sgemm_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.png b/docs/structcutlass_1_1gemm_1_1Fp16SgemmSgemmTraits.png
new file mode 100644
index 0000000000000000000000000000000000000000..c5dd66deabc132fee34549911b359c94ed06f207
GIT binary patch
literal 8749
zcmeHN3sllsx3B3do9W@5X(pR|Ff&n>sic-qgqf@yDz(Y-{U|NXM9DWA%6wyA)>t}W
zN<PV&r1F)LB7!hxN(w@0K2gaBpaP;I3L<dnb?2L!wQg(Hch|bFeg1GZXZ>OS&)(<!
z_V4V)<s+`n>pt21$+Bh3*1^8tcXZjZ4OUwH(&`o3_k$sSKc($99XWh#zec0cs?)OZ
zl1FjBXth_b-+uees|x9%{kS^zsH^)j?M*MGtL>QOvSnXWVEev1hFmTl?1?8(Hm-cy
z+Oa7`;|zffEE~<46{NEd?jHQ5cJiWc@Rc9_(lztZ72v%OXbS1YYryOeXy~C`m|s7j
zjj{C)V2*u2TS{#D9&_*m8Wgb!R&AYp9jL%eh(WLlB#lxL)gW+atmsB6#Rtev`Q`D-
zKu{hUr5s_-16Vx(Z;=k!FIMW`R7ZIbnFq{|^jykyafvpk)kb11ihOI!=QYpnM-<3`
ziBI>tI_8bguaI*vFg`CRDxcBL<40o>6)Q-TDkm3SNwm9ND+RS98*s20lAr(7WqeyK
zCb7@!*7<Nkf4}eO_m~>VdbH&3*48~~2le6>#G$EmwKwR?N|%>;?uO+QIRX~qrI*c+
zlO>8RmuCl49gBV>M@f!tI)Ev2JpU+btV4Yd3-pZeZ-~~^>%++{D^%R^={9#!sg?3E
zVd=8DpoV&SlfJQ%6so9sE`L1<Vx+GlRAx%E%K-S-R5~(1Q(t95?}v1zyy&jAVDh75
zNTeltv?A!|*N+d|NX4{e-U-6BzkK)&_N^2@mUOBgZXAmNj~GAVg3rRD+lxB}2PpM7
z2tV7{57f<#De8#%J(0Sw>UpM%)cG?WM~57zgkjbsn5-T3in53NI<!hTuNdv5BM=Bd
zPcW}fmdQ@n)!RVwk;oU-O;sIAC551q8u8rrz+k4VyLjntYzFdDf&nvVM^4Pr0F!mx
zm60+od;Y8oMe5{5Q@B=F#GwlK*ZefW>~?=g4fNqX&69fn#2hFE-ZQmN(|*6uIM!%D
zb$)bdab&%PZ$bLX-oq76X?R(n+kDc`yRk3hM!U|?3l1}}$<A+sRZkn<qr_pX33u6i
z?WF5JPL?iDMn~|ysm~Nkrc3AK`Oaprid-=-3CA`*QyY<ft)SAdXAvcbRNw+Z*b$O6
zYLOSTtW?QJI#<e>js8r4?Yxo2WUzs4MBVuLwe`po{%d!_DmJwQ8S6Pv)RtQXmSpv_
zu92pZjJSrO2?Inzd|h>vQAKQhMOEJ8?xO|LFe3|h7SFN`8yY_qYq(G_&Ss&n5lZz3
zdoEfy$Otn`w7)Y6#X<dT>9>*ql%^rhw>dGXZwkUd$99EypR>C!&cTMEYc%0Dg^Fi1
zFAcBO-{}79XzRo%qT}+~wDF!zD4AUvk1Tt#f1|8#;6mhHn_?p1X=Y`6wkb^{BAG7j
z)6QHxWNxPK+IpYq88-Th7*u$%Dj{Go{ULG@RpuFy?0ExIHqa|f=lL03bCYy$xm;b3
zO{Sl~?u_5UygvdKuyAQrHx`<Um=eGAc2W}7w}LGr4=)*jbOpSu(Q7C4l+}qy%&7@v
zL9M04<3S};R6e8R&KI$(mvR+c)VAb^O}?Yv+yhXhsb=2Ae`qEpYH)oVqydhf*KR?Y
zcg;>R((dL}V`dl<>sWy>FI6%{k(AnN*?OI4%x$!hMw?@a9{76$$0AM8fhLvi7Of9=
zpBEBH9}jBh8|Z&ar#mEE7>OGQt)5m)6El4<-idIm`J!W42d@KX->_*4eoWt)pDV2b
zXXxXDf>W{nfu<w->sh|g8eiP^*ChrbQDk(?3cY6@4Adg{iZFO_oQGQBW7aWo<*?Ri
zPD2$o4s^!H$-Bw6y2PK7g95EP1U{Q9tmY0`kv}_8n80pFD-PQ`I#a<{q+Pt_egi*x
zwD+t*kKUVGkza2+K_f<{+2R6fWx*Pnf6ejy=JKz!TN2_*l<a3HSQ5B&%!eyu`-8Tf
z=N)lry??5W^m=)t&9Fqz(1RXZ-C1{DO&(g%=6kP>+4g&=D@~t`h7)pm`Y|b%YjEpc
z;*$6Eo#clBy>UJITfA50V-mgBPFnsQ2L?z((y#gr1oCx)f>(MjWW^1Ml<Kia$7|cU
zw!K}m@O7~}PnxqE)zV#&8DUg>z7-eZSbB#NATdD3>H6aM%0@`Sit}^cRErr96YlWa
zV!-sk5-2*pCI)BJlCAPG9B&Zn-r>02K@2?SiN}aN;!?(ZcxikefA(Uv0*KR<_-L>b
z4=2wi3prHZNH86L>bND(FYhJ%&O&n;|AD+QCV}&{x!K9qHpMT|*FkqYt()(YgAnno
zyyYl4$Jwm4Y@q*+*j1ntbz40<t43$f`R1#c3NO~&$T-4$vZjGL8}@9>iY!CkLP<{O
z0cv%Ua(9)+oYRIjz0oiEuG#!4<zhA6$<1cc-;OTmr1**R8*35YFfMDI*B+|4&SV_8
zUde(-ebe1wZoPC_ffy4J*9NBq+FcD5midFPhcsGeE$LXxg0j$wgVcIBjd0f2-C=Fa
zo?BOc&08ngbV^uT8>izKUsHA6b4vGReu+_h5lwm(Lt{Iv<S<W6CE|NSW3(_ec!8?^
zkxH}17v9jus$7No8rS;B?E)?F`IMw1+BP@ZoRAeKi?`N)e6|?GRv5GBE&lV9DqcUV
zx6Z1PwHW=}ZNLiWavcE>!5b?IBs|Wd0TZG-IyagU0C1>AtK{O{#iLH52j9|#t+96s
z`UA^}wpPkE`u;lbr@DW0XdkvzWjY0vbF12~GuvkI-j(?6fdzf0$?WC)RPK{YI%Kf;
zsfi&JdZpcY=Ig{vMuGvS>-NLd=hX7@{G{9%8aa|)jE?W~5Nn!_lgpMq9q(^Q>YI$^
z+>oJ-+E2y{R(cJDW(cjxAA@$57saHf9oA;60Y7y*36&S*{?aF|)!Vt4Ho<lK8p@Nl
zHz{{cr875Jqc~H|nmwKb+6&Ch2CPO)wMn-hj?Jmca4gzepxe}(4F3V0E5hS4+(~si
z9pfPz^Q$d>^uB(z(GYLp`&bb@rH6!6xQV*0E=SL-RxF<Aapniz)KlgGd)97&L5AZ8
zfC>Q|;-ZDFgpm2nGC|M9nG-@ufp9Q15wk=A$riju_55mpifS!EfS)lpZk6USV6*yp
z+H6yNuK>snH!*INgzYtMy{P2~;L48+fi%A2?}6bnE{CSGhH;l>+VvOx>S#)&JS#>^
z0KgN;KcV5b=beh?(L^1t)(EPlutm2#1p_`yx<{+e3!Ipa=b$6IYJIk~g2J@+a<qoQ
zm81e7?WWeAuh#G^r6d}&l&7@^e`#2n_Y^kk3$eISzD=18!+?|}(}7?PmjYuKW}<~T
zIG|g7(RSD@`%A5Lp&L`Xb-<7@2qSB3gIc*`$w4r^W>n6`PwNnDV36BdJGiHQt{D6t
zY}T0b?riN{FD*WNY4N7kB5LmjdstET1y_uwpZ^((+osK`KvE?~`?Uq)XQwy8j($L!
z6|CC=Gx>m~rkn)Aw*Kd>6=(CWC%!G4_WY#_wCt0&lG4Bat@?W(@Y|mZs;PsKIxF83
z^iU)*^{4lQ7P+AQv%3eTRJy+#daJ1^hM&JDlpp_p@DEP;Kj@I9hZZe&|I&qA{$Ft1
z`|krC0?U^N&z~p62!LtpErSu7e?Y*JJpN1$(02$_8SbYqQPXuwqDx1tzB5m&^|=Bh
z1(92tH*d|&K7Z0PT_$QtNsxzHgIaIF4YJ=mj*~*(M@iP{MJ+_H1bkZCBtkb(=GBa=
zAq+k&<TRnVCIxe9_~`^T)z5HA<sH#e*C`%+zzHt^X38&5>mmX$`@KCD7Zr!!Ia6cb
zN5rtap+G1Ft(MQta5x-=%quZoH7XrxD(+Au2k@S@Q?bWw81tUD0fAh!t;gbOYyA<D
zQ2K3%JEdUy>k}AL#|@{T*MQ#j(9)}$=@VjyMW0^9BSe{8M8~byO!KwGsj1i-M+-kx
z^iE}A&%5BPpxKBExz^Oftt4iJ8{o8h_?%e9yLGUnfN?*+iP(I}{1!mSOxvZKI4M^N
ziy!en2XR>qpd9|pSA^lMc335$|85k?7PgT$^T2as3h5%2v9MxT5;2q*EtI53nqyT-
zjCcI5fd1K26mo||jNvpDzG>lj`Qg6pf}izYGSUi41Cjh`vfZsXHlUCNWgUnm^mLg*
zH;hG$5vDwM#>aTzJ#6UMQvpV+&u@B`x`yUM)pC<iDW-rCy#w&&O#FviKU6}bWfC(F
zrI`?XltTAv6Gol8B}hy87`p^~;%(fdK^k(iB<KeI8jjj7EF$N($J@yTsiyY>OeN*s
zg_|SRiUzzfiHTql{}G4_*=vfGaGJP%6rlGF4RX)eV9q=Fcou#3-Q_onM%dFD?6R9A
z(w_b0O~f6!Snnr0yt5D6VNc(X5;@P<P2P_kQlM8~h=qyk35$#zz2z7tqw_oK;DP+E
z?vVhBHuUtS0AG1}gqJyYA&o{zgt1OrU)TRy&`9*%_Q(9)s=4=WQg78Xgh?6<hBnd)
zseqk;v!~k**rhSApU%~?;kXz%60}H7cjukT%XX4>e(Scyz9+E8Z?_BP4n7tB7<s~j
zz^kXeTnmxCod*xMQpzqm0-DP3xYcNclojKP=3YYerXBBWzw>U{NdtYa7L`{LrpX~L
zsDyNc5~19Q00B;?IObMdUtnN+u+a8L2B}8p8#b$^Eh|x*#vm-zQNR%0BA->IXt|Kt
zvk`#%B>HYm#>~?)*GAVhR)M$6iwAX;7B^*&Dm_r2e$!gE^sPM21`!PKD2*CVB1OCt
znxk~uyPkn<ZM7-^CiV+_wzk?No%=UpspG~m2Z2Mn4AmQMMh*KB`lT9YYxT|#&FcLL
zzcSim2yBgk^q9b?>_UsfN}5C0lwb08Eh#)h8wp%Z?i!PFZUEPCKUdo}3No1<?=4~U
z`-lQe?A`66<)d!ahcJ>^GbcG)Ff;K5ZO@C!RVwx)<39#oI~T(Lh_d4c=Apk-q1D!P
zXFj_5R$k!6Z`I%X7b``-e|W3CkZ{EDN8XcZfjHh_`+Fi6#!Jxe-F#%4E*{dn{l(w=
z7i`XV?@8mD-uK47`~SgreDc5BA&qYNC1Ll&@=CO@_*c86<=fs{p4;Wp5+eFfhK2vy
zVL86Rv4yGz=0nsuKP*52m5&@VyEqFqWypxn(oX&sK{SDE7>hpRxh>&`Fnbr#d<Hyz
z`UyyvNVQL+*Q*Z-)36dgu(F^{X`DQI%CWx>E`9Mcy<_;uaPC9!^JG+ZZHT>+S{J+1
zEaes>oP6$@^jwol*&2V<frA8z2=u93{mrkB7)x1^P><qQJMINwdVZ5~F$@01$vj93
z5^Z-8eKXTp7~$CuuhY!TP-zBZlLp;-=98u-eiAr2^(vskjTayck3p6RK{Y8z#gtiR
zHp9&ZNfA2<7Jm7ZSZcTvoRvecTI@B6INlHqmf)Lh5)!4WlLaX#^|8T0XaOVGshNUO
zRjhq|ywqghWAA?De7Unrr;-pZQAz3eOzzMStCHSE5CU*|fDE^$PWLEH6d)vVCg85K
zu<#WnOhV%_m0nTSECmJRIXr2l%Kb{3SQ%8{R5%%V<%GvXkacM@7~U1VJq_lEYg2V6
z@Tb2G_Bww{7OHHyRp!cz_Fu@4BW2Pr0`x))3j-_4r)D}xZ9xwRMp)wsA0yNHz~rV|
zrtER?ai4;R<qZxzZrH&G^D+KIwm%Av+d9`DRn7b(z<g#0KT3Tg8^0h?SDhcZxa!TU
zer*@*c;oGg1)ZLJDW?T{IVRU1eO{CdR<HoB?a;jdC?H^nCP6#a(2ORBlhUU6**Poh
z{$>xkqsuktCo5_dN6_1zz>&7t7@_x|tOFMqvgOgO0=<c9LFYFC;Y&we#(`qthos2x
z_^XNDg>C6sR8poiz&d*LY$!d>!Gi-fl&-AD=`f}cM(M#p;Mx{~%TO=bJ9MFQ#JHYv
zZ6DzbHZjecM0={g$9!Q;`Yf_HEpt$%-*3O}H6Xv>&d$VMczxnWGlm;w>iLks^-vMC
z9S0ZqY}4l*5vnA9N_ljKEg8A<d8#a@$xm0X<;l`09Fks#Mda(sLVq&Q`zXEIZ$x?y
zi@;<1E}fWo_&sB|42veutSGN+AFgUS*L=Gi>KMUf(DzxpcF2f4iy{eg(7oD6alGre
zr|<3h9G!gQ_36?557K&&*;NcycUD8uM(8u%RbV})rswF?{9YU)koZ%umH{h8RpbPx
zCX(MFm)BcbzQ2>dV%_WNLrT}1DI7+i0SEw=#jXu5SII6P_r3t`E^1&_fIpusPExj|
z6&LMHzH;7rzBAU9%a6kr8k!><pW{BRzFSY?m!1x!6b7(5)7D63_Ui=?Q|W<~d#Ien
zegh-K+I*vM)kIiufCqlI|2~M-f4{Me&C6+O8)33_pTi#zc0lrUO8FcIGPC!5T5w!}
zXQvNK?dr3%4{L)t6T``|qYbEh*EG~6`#Ws*($ZK6N)*X`dSW;!#OW2-H-d6&i}0_L
z=`?x0Zp8x81|Ka?R@dK+lUrMW(ti=`!efKWV*s8`jy?!TOEWNo%XZ_d+>`8v`!ds6
z9vcFolepE@Uj|#}^71OR+a$tbr*wb)4b6b;B>4H_p{pmw&`q`*Psf>5mM>b0CSO$O
zj$DPY*h?+fy!V~A)HPp~x<9w@nT|);M!`2Rl^J^JvrYbyfS-IFQWF!;6%)yU1D{2i
zXQm~~dk4wI!+s$NHg5vqdDxfj{zmtg=vLTBc+<6V@tn#_afET|c7an01%L)OFjMOE
zCZ8qIr`CUQcq4DumCkXu+YYZt_CH>6Y%lXC&6AZ_F*w<@t*oV)YKE$kh3ccrWrIBO
zpbcO9;2_t<Zf_1`PB*r8V5Do}hOADrc*2Ouoia=pn&q0B;_HjLc^yj!u%72Bb^8bG
zqlgHgrw)`0GHnZ1E-<UeXeWmRYVzEhJ&<5%)b+;WZn-6yp*<WSN2!*L5>-T1_JZ-i
z@S_R)PFXa{WD05&kU7jZ3|J>S*AP4xtcSk_u*X5~ECkzMuwO;3|3r|>gh0L+vrRjG
zMLNbetk{eTO(;_DzbXC3On~lh<Sn8~WHol+4y5%n#Q0(#)l)xVb%NJ8ufAw~-)xzo
zFAF<cHzTO!IG`Y=geKCHazzh0ahD_|#m5?-bZPF1NjW~rXkp?KJBP1bQ{Q7fGoA(=
zVjZgM$Lwz#BwsUK1%(0ykfQa<xj$f4v-I=V`$K(~j*CqQhism722|*-qWO!fz9OD=
z+(WN4dxG`R1ohy;8zN)Po)8VH0gm?)l#1aY;v>z1Kcr_gAp@~dsCWQPdP5gq1X{|T
zy{-y^UZ{2~$g`$G+MS&od$xiFuA(qa0=~bnH1jd?jG58qwQ$8zVW4O+ro7U+|L55*
zr}-L1W7bAPm0m-o$2d(gOERJ*qm+%PuSGV7<k8h{u}OASH}uVVGVGjtoH`ZXrM1wt
z70mMuLOcJ0D*!$(|A)HIX%$yU1BgLoPoXtC0u7mm4Bn7b<l~2`@86)?KUX!Or<0Uv
y|2*(or$zothAmw>k9F>L+4I-CxsTL3!sZK&4^}B;+W&SegY9?SSF!iRPyY^Q)id`1

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd-members.html b/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd-members.html
index f03e26ac2..d7c382ac0 100644
--- a/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd-members.html
+++ b/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd-members.html
@@ -73,23 +73,22 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af19e14a22aefd1124f7d31beec6f8c42">FragmentMultiplyAdd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a522301fbe3e276cb5ef9fbe75bb2ab50">multiply</a>(Scalar_ a, Fragment_ const &amp;b, Fragment_ &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a34bbf209967fef6181d3d46dd27fa0c0">multiply_add</a>(Scalar_ a, Fragment_ const &amp;b, Fragment_ const &amp;c, Fragment_ &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ae1fbd0fd103deda51208102f15f896ed">FragmentMultiplyAdd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a934c0d74c70fc87796ecb5cde50fd516">multiply</a>(ScalarAlphaBeta a, FragmentB_ const &amp;b, FragmentCd_ &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aafa37c2e1ffd2f7d7031c24c732157d8">multiply_add</a>(ScalarAlphaBeta a, FragmentB_ const &amp;b, FragmentCd_ const &amp;c, FragmentCd_ &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c">ScalarAccum</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html b/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html
index bde87a6e3..29bd3c074 100644
--- a/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html
+++ b/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,7 +77,7 @@ $(function() {
 <a href="#pub-methods">Public Member Functions</a> &#124;
 <a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::FragmentMultiplyAdd&lt; Scalar_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::FragmentMultiplyAdd&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -85,92 +85,73 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:ac93ba536992debeae86087e638167a13"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, 1, 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13">InstructionShape</a></td></tr>
-<tr class="memdesc:ac93ba536992debeae86087e638167a13"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#ac93ba536992debeae86087e638167a13">More...</a><br /></td></tr>
-<tr class="separator:ac93ba536992debeae86087e638167a13"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6fa76b3e7ac721d47df47eba4e9ef222"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222">ScalarA</a></td></tr>
-<tr class="memdesc:a6fa76b3e7ac721d47df47eba4e9ef222"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for A.  <a href="#a6fa76b3e7ac721d47df47eba4e9ef222">More...</a><br /></td></tr>
-<tr class="separator:a6fa76b3e7ac721d47df47eba4e9ef222"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af4f5c4a79c447e5aaf313878eca022cb"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb">ScalarB</a></td></tr>
-<tr class="memdesc:af4f5c4a79c447e5aaf313878eca022cb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for B.  <a href="#af4f5c4a79c447e5aaf313878eca022cb">More...</a><br /></td></tr>
-<tr class="separator:af4f5c4a79c447e5aaf313878eca022cb"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a92c1ffbfb479cd9fa2c2632ef8e347d3"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3">ScalarC</a></td></tr>
-<tr class="memdesc:a92c1ffbfb479cd9fa2c2632ef8e347d3"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for C and D.  <a href="#a92c1ffbfb479cd9fa2c2632ef8e347d3">More...</a><br /></td></tr>
-<tr class="separator:a92c1ffbfb479cd9fa2c2632ef8e347d3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa101be5d45e2be54bb4056517b6d5e76"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, 1, 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76">InstructionShape</a></td></tr>
+<tr class="memdesc:aa101be5d45e2be54bb4056517b6d5e76"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#aa101be5d45e2be54bb4056517b6d5e76">More...</a><br /></td></tr>
+<tr class="separator:aa101be5d45e2be54bb4056517b6d5e76"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea565efe23b7a5c17eeab5e8cd0d1322"><td class="memItemLeft" align="right" valign="top">typedef ScalarAlphaBeta_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a></td></tr>
+<tr class="memdesc:aea565efe23b7a5c17eeab5e8cd0d1322"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for alpha and beta.  <a href="#aea565efe23b7a5c17eeab5e8cd0d1322">More...</a><br /></td></tr>
+<tr class="separator:aea565efe23b7a5c17eeab5e8cd0d1322"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e854c281072db280ae90c2569b5f64c"><td class="memItemLeft" align="right" valign="top">typedef ScalarAccum_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c">ScalarAccum</a></td></tr>
+<tr class="memdesc:a1e854c281072db280ae90c2569b5f64c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for accumlator.  <a href="#a1e854c281072db280ae90c2569b5f64c">More...</a><br /></td></tr>
+<tr class="separator:a1e854c281072db280ae90c2569b5f64c"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:af19e14a22aefd1124f7d31beec6f8c42"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af19e14a22aefd1124f7d31beec6f8c42">FragmentMultiplyAdd</a> ()</td></tr>
-<tr class="memdesc:af19e14a22aefd1124f7d31beec6f8c42"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#af19e14a22aefd1124f7d31beec6f8c42">More...</a><br /></td></tr>
-<tr class="separator:af19e14a22aefd1124f7d31beec6f8c42"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a522301fbe3e276cb5ef9fbe75bb2ab50"><td class="memTemplParams" colspan="2">template&lt;typename Fragment_ &gt; </td></tr>
-<tr class="memitem:a522301fbe3e276cb5ef9fbe75bb2ab50"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a522301fbe3e276cb5ef9fbe75bb2ab50">multiply</a> (Scalar_ a, Fragment_ const &amp;b, Fragment_ &amp;d)</td></tr>
-<tr class="memdesc:a522301fbe3e276cb5ef9fbe75bb2ab50"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b.  <a href="#a522301fbe3e276cb5ef9fbe75bb2ab50">More...</a><br /></td></tr>
-<tr class="separator:a522301fbe3e276cb5ef9fbe75bb2ab50"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a34bbf209967fef6181d3d46dd27fa0c0"><td class="memTemplParams" colspan="2">template&lt;typename Fragment_ &gt; </td></tr>
-<tr class="memitem:a34bbf209967fef6181d3d46dd27fa0c0"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a34bbf209967fef6181d3d46dd27fa0c0">multiply_add</a> (Scalar_ a, Fragment_ const &amp;b, Fragment_ const &amp;c, Fragment_ &amp;d)</td></tr>
-<tr class="memdesc:a34bbf209967fef6181d3d46dd27fa0c0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b + c.  <a href="#a34bbf209967fef6181d3d46dd27fa0c0">More...</a><br /></td></tr>
-<tr class="separator:a34bbf209967fef6181d3d46dd27fa0c0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae1fbd0fd103deda51208102f15f896ed"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ae1fbd0fd103deda51208102f15f896ed">FragmentMultiplyAdd</a> ()</td></tr>
+<tr class="memdesc:ae1fbd0fd103deda51208102f15f896ed"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ae1fbd0fd103deda51208102f15f896ed">More...</a><br /></td></tr>
+<tr class="separator:ae1fbd0fd103deda51208102f15f896ed"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a934c0d74c70fc87796ecb5cde50fd516"><td class="memTemplParams" colspan="2">template&lt;typename FragmentB_ , typename FragmentCd_ &gt; </td></tr>
+<tr class="memitem:a934c0d74c70fc87796ecb5cde50fd516"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a934c0d74c70fc87796ecb5cde50fd516">multiply</a> (<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a> a, FragmentB_ const &amp;b, FragmentCd_ &amp;d)</td></tr>
+<tr class="memdesc:a934c0d74c70fc87796ecb5cde50fd516"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b.  <a href="#a934c0d74c70fc87796ecb5cde50fd516">More...</a><br /></td></tr>
+<tr class="separator:a934c0d74c70fc87796ecb5cde50fd516"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aafa37c2e1ffd2f7d7031c24c732157d8"><td class="memTemplParams" colspan="2">template&lt;typename FragmentB_ , typename FragmentCd_ &gt; </td></tr>
+<tr class="memitem:aafa37c2e1ffd2f7d7031c24c732157d8"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aafa37c2e1ffd2f7d7031c24c732157d8">multiply_add</a> (<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a> a, FragmentB_ const &amp;b, FragmentCd_ const &amp;c, FragmentCd_ &amp;d)</td></tr>
+<tr class="memdesc:aafa37c2e1ffd2f7d7031c24c732157d8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b + c.  <a href="#aafa37c2e1ffd2f7d7031c24c732157d8">More...</a><br /></td></tr>
+<tr class="separator:aafa37c2e1ffd2f7d7031c24c732157d8"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="ac93ba536992debeae86087e638167a13"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac93ba536992debeae86087e638167a13">&#9670;&nbsp;</a></span>InstructionShape</h2>
+<a id="aa101be5d45e2be54bb4056517b6d5e76"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa101be5d45e2be54bb4056517b6d5e76">&#9670;&nbsp;</a></span>InstructionShape</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ &gt; </div>
+template&lt;typename ScalarAlphaBeta_ , typename ScalarAccum_ , bool fragMul2 = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, 1, 1&gt; <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; Scalar_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#ac93ba536992debeae86087e638167a13">InstructionShape</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, 1, 1&gt; <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aa101be5d45e2be54bb4056517b6d5e76">InstructionShape</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a6fa76b3e7ac721d47df47eba4e9ef222"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6fa76b3e7ac721d47df47eba4e9ef222">&#9670;&nbsp;</a></span>ScalarA</h2>
+<a id="a1e854c281072db280ae90c2569b5f64c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1e854c281072db280ae90c2569b5f64c">&#9670;&nbsp;</a></span>ScalarAccum</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ &gt; </div>
+template&lt;typename ScalarAlphaBeta_ , typename ScalarAccum_ , bool fragMul2 = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Scalar_ <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; Scalar_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a6fa76b3e7ac721d47df47eba4e9ef222">ScalarA</a></td>
+          <td class="memname">typedef ScalarAccum_ <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a1e854c281072db280ae90c2569b5f64c">ScalarAccum</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="af4f5c4a79c447e5aaf313878eca022cb"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af4f5c4a79c447e5aaf313878eca022cb">&#9670;&nbsp;</a></span>ScalarB</h2>
+<a id="aea565efe23b7a5c17eeab5e8cd0d1322"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea565efe23b7a5c17eeab5e8cd0d1322">&#9670;&nbsp;</a></span>ScalarAlphaBeta</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ &gt; </div>
+template&lt;typename ScalarAlphaBeta_ , typename ScalarAccum_ , bool fragMul2 = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Scalar_ <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; Scalar_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#af4f5c4a79c447e5aaf313878eca022cb">ScalarB</a></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a92c1ffbfb479cd9fa2c2632ef8e347d3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a92c1ffbfb479cd9fa2c2632ef8e347d3">&#9670;&nbsp;</a></span>ScalarC</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Scalar_ &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">typedef Scalar_ <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; Scalar_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#a92c1ffbfb479cd9fa2c2632ef8e347d3">ScalarC</a></td>
+          <td class="memname">typedef ScalarAlphaBeta_ <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -178,19 +159,19 @@ template&lt;typename Scalar_ &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="af19e14a22aefd1124f7d31beec6f8c42"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af19e14a22aefd1124f7d31beec6f8c42">&#9670;&nbsp;</a></span>FragmentMultiplyAdd()</h2>
+<a id="ae1fbd0fd103deda51208102f15f896ed"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae1fbd0fd103deda51208102f15f896ed">&#9670;&nbsp;</a></span>FragmentMultiplyAdd()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ &gt; </div>
+template&lt;typename ScalarAlphaBeta_ , typename ScalarAccum_ , bool fragMul2 = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; Scalar_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a> </td>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a> </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -206,35 +187,35 @@ template&lt;typename Scalar_ &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a522301fbe3e276cb5ef9fbe75bb2ab50"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a522301fbe3e276cb5ef9fbe75bb2ab50">&#9670;&nbsp;</a></span>multiply()</h2>
+<a id="a934c0d74c70fc87796ecb5cde50fd516"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a934c0d74c70fc87796ecb5cde50fd516">&#9670;&nbsp;</a></span>multiply()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ &gt; </div>
+template&lt;typename ScalarAlphaBeta_ , typename ScalarAccum_ , bool fragMul2 = true&gt; </div>
 <div class="memtemplate">
-template&lt;typename Fragment_ &gt; </div>
+template&lt;typename FragmentB_ , typename FragmentCd_ &gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; Scalar_ &gt;::multiply </td>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;::multiply </td>
           <td>(</td>
-          <td class="paramtype">Scalar_&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a>&#160;</td>
           <td class="paramname"><em>a</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">Fragment_ const &amp;&#160;</td>
+          <td class="paramtype">FragmentB_ const &amp;&#160;</td>
           <td class="paramname"><em>b</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">Fragment_ &amp;&#160;</td>
+          <td class="paramtype">FragmentCd_ &amp;&#160;</td>
           <td class="paramname"><em>d</em>&#160;</td>
         </tr>
         <tr>
@@ -252,41 +233,41 @@ template&lt;typename Fragment_ &gt; </div>
 
 </div>
 </div>
-<a id="a34bbf209967fef6181d3d46dd27fa0c0"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a34bbf209967fef6181d3d46dd27fa0c0">&#9670;&nbsp;</a></span>multiply_add()</h2>
+<a id="aafa37c2e1ffd2f7d7031c24c732157d8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aafa37c2e1ffd2f7d7031c24c732157d8">&#9670;&nbsp;</a></span>multiply_add()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_ &gt; </div>
+template&lt;typename ScalarAlphaBeta_ , typename ScalarAccum_ , bool fragMul2 = true&gt; </div>
 <div class="memtemplate">
-template&lt;typename Fragment_ &gt; </div>
+template&lt;typename FragmentB_ , typename FragmentCd_ &gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; Scalar_ &gt;::multiply_add </td>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; ScalarAlphaBeta_, ScalarAccum_, fragMul2 &gt;::multiply_add </td>
           <td>(</td>
-          <td class="paramtype">Scalar_&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html#aea565efe23b7a5c17eeab5e8cd0d1322">ScalarAlphaBeta</a>&#160;</td>
           <td class="paramname"><em>a</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">Fragment_ const &amp;&#160;</td>
+          <td class="paramtype">FragmentB_ const &amp;&#160;</td>
           <td class="paramname"><em>b</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">Fragment_ const &amp;&#160;</td>
+          <td class="paramtype">FragmentCd_ const &amp;&#160;</td>
           <td class="paramname"><em>c</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">Fragment_ &amp;&#160;</td>
+          <td class="paramtype">FragmentCd_ &amp;&#160;</td>
           <td class="paramname"><em>d</em>&#160;</td>
         </tr>
         <tr>
@@ -310,7 +291,7 @@ template&lt;typename Fragment_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4-members.html b/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4-members.html
new file mode 100644
index 000000000..9730de1f6
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4-members.html
@@ -0,0 +1,96 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">FragmentMultiplyAdd&lt; half, half, true &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ad35b57b3f0cf5a467a1b0e48cffc3061">FragmentMultiplyAdd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a6bed70e7074931419e9441688aee00ea">multiply</a>(half a, FragmentB_ const &amp;b, FragmentCd_ &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a92edee5611d25b60cdab6a1c8e32141f">multiply_add</a>(half a, FragmentB_ const &amp;b, FragmentCd_ const &amp;c, FragmentCd_ &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2">ScalarAccum</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d">ScalarAlphaBeta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html b/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html
new file mode 100644
index 000000000..85a462d29
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html
@@ -0,0 +1,287 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html">FragmentMultiplyAdd&lt; half, half, true &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::FragmentMultiplyAdd&lt; half, half, true &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="fragment__multiply__add_8h_source.html">fragment_multiply_add.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a7d83cf5bde360251a252c6e728ea80ff"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, 1, 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff">InstructionShape</a></td></tr>
+<tr class="memdesc:a7d83cf5bde360251a252c6e728ea80ff"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#a7d83cf5bde360251a252c6e728ea80ff">More...</a><br /></td></tr>
+<tr class="separator:a7d83cf5bde360251a252c6e728ea80ff"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae7a333f7aa3f52226c76cec9d2da042d"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d">ScalarAlphaBeta</a></td></tr>
+<tr class="memdesc:ae7a333f7aa3f52226c76cec9d2da042d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for alpha and beta.  <a href="#ae7a333f7aa3f52226c76cec9d2da042d">More...</a><br /></td></tr>
+<tr class="separator:ae7a333f7aa3f52226c76cec9d2da042d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab3774e6aa28266b25e3822fc9e72edc2"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2">ScalarAccum</a></td></tr>
+<tr class="memdesc:ab3774e6aa28266b25e3822fc9e72edc2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for accumlator.  <a href="#ab3774e6aa28266b25e3822fc9e72edc2">More...</a><br /></td></tr>
+<tr class="separator:ab3774e6aa28266b25e3822fc9e72edc2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:ad35b57b3f0cf5a467a1b0e48cffc3061"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ad35b57b3f0cf5a467a1b0e48cffc3061">FragmentMultiplyAdd</a> ()</td></tr>
+<tr class="memdesc:ad35b57b3f0cf5a467a1b0e48cffc3061"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ad35b57b3f0cf5a467a1b0e48cffc3061">More...</a><br /></td></tr>
+<tr class="separator:ad35b57b3f0cf5a467a1b0e48cffc3061"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6bed70e7074931419e9441688aee00ea"><td class="memTemplParams" colspan="2">template&lt;typename FragmentB_ , typename FragmentCd_ &gt; </td></tr>
+<tr class="memitem:a6bed70e7074931419e9441688aee00ea"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a6bed70e7074931419e9441688aee00ea">multiply</a> (half a, FragmentB_ const &amp;b, FragmentCd_ &amp;d)</td></tr>
+<tr class="memdesc:a6bed70e7074931419e9441688aee00ea"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b.  <a href="#a6bed70e7074931419e9441688aee00ea">More...</a><br /></td></tr>
+<tr class="separator:a6bed70e7074931419e9441688aee00ea"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a92edee5611d25b60cdab6a1c8e32141f"><td class="memTemplParams" colspan="2">template&lt;typename FragmentB_ , typename FragmentCd_ &gt; </td></tr>
+<tr class="memitem:a92edee5611d25b60cdab6a1c8e32141f"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a92edee5611d25b60cdab6a1c8e32141f">multiply_add</a> (half a, FragmentB_ const &amp;b, FragmentCd_ const &amp;c, FragmentCd_ &amp;d)</td></tr>
+<tr class="memdesc:a92edee5611d25b60cdab6a1c8e32141f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b + c.  <a href="#a92edee5611d25b60cdab6a1c8e32141f">More...</a><br /></td></tr>
+<tr class="separator:a92edee5611d25b60cdab6a1c8e32141f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a7d83cf5bde360251a252c6e728ea80ff"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7d83cf5bde360251a252c6e728ea80ff">&#9670;&nbsp;</a></span>InstructionShape</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, 1, 1&gt; <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; half, half, true &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#a7d83cf5bde360251a252c6e728ea80ff">InstructionShape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab3774e6aa28266b25e3822fc9e72edc2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab3774e6aa28266b25e3822fc9e72edc2">&#9670;&nbsp;</a></span>ScalarAccum</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef half <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; half, half, true &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ab3774e6aa28266b25e3822fc9e72edc2">ScalarAccum</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae7a333f7aa3f52226c76cec9d2da042d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae7a333f7aa3f52226c76cec9d2da042d">&#9670;&nbsp;</a></span>ScalarAlphaBeta</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef half <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; half, half, true &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd_3_01half_00_01half_00_01true_01_4.html#ae7a333f7aa3f52226c76cec9d2da042d">ScalarAlphaBeta</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ad35b57b3f0cf5a467a1b0e48cffc3061"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad35b57b3f0cf5a467a1b0e48cffc3061">&#9670;&nbsp;</a></span>FragmentMultiplyAdd()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; half, half, true &gt;::<a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">FragmentMultiplyAdd</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a6bed70e7074931419e9441688aee00ea"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6bed70e7074931419e9441688aee00ea">&#9670;&nbsp;</a></span>multiply()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename FragmentB_ , typename FragmentCd_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; half, half, true &gt;::multiply </td>
+          <td>(</td>
+          <td class="paramtype">half&#160;</td>
+          <td class="paramname"><em>a</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">FragmentB_ const &amp;&#160;</td>
+          <td class="paramname"><em>b</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">FragmentCd_ &amp;&#160;</td>
+          <td class="paramname"><em>d</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a92edee5611d25b60cdab6a1c8e32141f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a92edee5611d25b60cdab6a1c8e32141f">&#9670;&nbsp;</a></span>multiply_add()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename FragmentB_ , typename FragmentCd_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1FragmentMultiplyAdd.html">cutlass::gemm::FragmentMultiplyAdd</a>&lt; half, half, true &gt;::multiply_add </td>
+          <td>(</td>
+          <td class="paramtype">half&#160;</td>
+          <td class="paramname"><em>a</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">FragmentB_ const &amp;&#160;</td>
+          <td class="paramname"><em>b</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">FragmentCd_ const &amp;&#160;</td>
+          <td class="paramname"><em>c</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">FragmentCd_ &amp;&#160;</td>
+          <td class="paramname"><em>d</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="fragment__multiply__add_8h_source.html">fragment_multiply_add.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1Gemm-members.html b/docs/structcutlass_1_1gemm_1_1Gemm-members.html
index f0424e29a..d22133c4b 100644
--- a/docs/structcutlass_1_1gemm_1_1Gemm-members.html
+++ b/docs/structcutlass_1_1gemm_1_1Gemm-members.html
@@ -79,12 +79,16 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">Gemm</a>(Params const &amp;params_, SharedStorage &amp;shared_storage_)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#af8bb78ae198af4dccb0241da44428053">consume_tile</a>(typename Traits::GlobalLoadStream &amp;global_to_shared_stream, typename Traits::SharedStream &amp;shared_load_stream, typename MultiplyAdd::Accumulators &amp;accumulators, Index outer_k)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">Gemm</a>(Params const &amp;params_, SharedStorage &amp;shared_storage_)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">kWarpGemmSteps</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c">launch</a>(Params const &amp;params, cudaStream_t stream=cudaStreamDefault)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906">launch</a>(CUfunction kernel, Params const &amp;params, CUstream stream=CU_STREAM_LEGACY)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a6fcf9daef57558e1bb932c6eba99721b">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ae6f11bb666c2c8510e99200a2c0fc2f4">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm&lt; GemmTraits_ &gt;</a></td><td class="entry"></td></tr>
@@ -98,7 +102,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1Gemm.html b/docs/structcutlass_1_1gemm_1_1Gemm.html
index c2f993efa..fcb0fa46f 100644
--- a/docs/structcutlass_1_1gemm_1_1Gemm.html
+++ b/docs/structcutlass_1_1gemm_1_1Gemm.html
@@ -73,7 +73,6 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="summary">
-<a href="#nested-classes">Classes</a> &#124;
 <a href="#pub-types">Public Types</a> &#124;
 <a href="#pub-methods">Public Member Functions</a> &#124;
 <a href="#pub-static-methods">Static Public Member Functions</a> &#124;
@@ -87,12 +86,6 @@ $(function() {
 
 <p><code>#include &lt;<a class="el" href="gemm_8h_source.html">gemm.h</a>&gt;</code></p>
 <table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
-Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params.  <a href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
 <tr class="memitem:a26c13e8bbad805760443ef6df475e317"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a>&lt; GemmTraits_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a26c13e8bbad805760443ef6df475e317">This_</a></td></tr>
@@ -122,28 +115,38 @@ Public Types</h2></td></tr>
 <tr class="memitem:a0aca711d07245f3071adeb1111fedd34"><td class="memItemLeft" align="right" valign="top">typedef Traits::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a></td></tr>
 <tr class="memdesc:a0aca711d07245f3071adeb1111fedd34"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="#a0aca711d07245f3071adeb1111fedd34">More...</a><br /></td></tr>
 <tr class="separator:a0aca711d07245f3071adeb1111fedd34"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab806302d059fc7cd113ec0b5ab5a9835"><td class="memItemLeft" align="right" valign="top">typedef Traits::MultiplyAdd&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">MultiplyAdd</a></td></tr>
+<tr class="memdesc:ab806302d059fc7cd113ec0b5ab5a9835"><td class="mdescLeft">&#160;</td><td class="mdescRight">Define the mainloop iteration size.  <a href="#ab806302d059fc7cd113ec0b5ab5a9835">More...</a><br /></td></tr>
+<tr class="separator:ab806302d059fc7cd113ec0b5ab5a9835"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a054d5e87f1985ae7e53fc07f4c16d916"><td class="memItemLeft" align="right" valign="top">typedef Traits::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a></td></tr>
+<tr class="memdesc:a054d5e87f1985ae7e53fc07f4c16d916"><td class="mdescLeft">&#160;</td><td class="mdescRight">Use the params object defined in traits.  <a href="#a054d5e87f1985ae7e53fc07f4c16d916">More...</a><br /></td></tr>
+<tr class="separator:a054d5e87f1985ae7e53fc07f4c16d916"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a8bff0bd32aec05f8c1e282024be0bcfd"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">Gemm</a> (<a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> const &amp;params_, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">SharedStorage</a> &amp;shared_storage_)</td></tr>
+<tr class="memitem:a8bff0bd32aec05f8c1e282024be0bcfd"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a8bff0bd32aec05f8c1e282024be0bcfd">Gemm</a> (<a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> const &amp;params_, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">SharedStorage</a> &amp;shared_storage_)</td></tr>
 <tr class="memdesc:a8bff0bd32aec05f8c1e282024be0bcfd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a8bff0bd32aec05f8c1e282024be0bcfd">More...</a><br /></td></tr>
 <tr class="separator:a8bff0bd32aec05f8c1e282024be0bcfd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af8bb78ae198af4dccb0241da44428053"><td class="memTemplParams" colspan="2">template&lt;bool Residue, bool LastIteration&gt; </td></tr>
+<tr class="memitem:af8bb78ae198af4dccb0241da44428053"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#af8bb78ae198af4dccb0241da44428053">consume_tile</a> (typename Traits::GlobalLoadStream &amp;global_to_shared_stream, typename Traits::SharedStream &amp;shared_load_stream, typename MultiplyAdd::Accumulators &amp;accumulators, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> outer_k)</td></tr>
+<tr class="memdesc:af8bb78ae198af4dccb0241da44428053"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes a warp-level GEMM on data held in shared memory.  <a href="#af8bb78ae198af4dccb0241da44428053">More...</a><br /></td></tr>
+<tr class="separator:af8bb78ae198af4dccb0241da44428053"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a2e844037d2527b842de3590cb783a49f"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a2e844037d2527b842de3590cb783a49f">multiply_add</a> ()</td></tr>
 <tr class="memdesc:a2e844037d2527b842de3590cb783a49f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Do the GEMM.  <a href="#a2e844037d2527b842de3590cb783a49f">More...</a><br /></td></tr>
 <tr class="separator:a2e844037d2527b842de3590cb783a49f"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
 Static Public Member Functions</h2></td></tr>
-<tr class="memitem:a77ae137aec79b4061a9ffa09aabf641c"><td class="memItemLeft" align="right" valign="top">static __host__ cudaError_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c">launch</a> (<a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> const &amp;<a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>, cudaStream_t stream=cudaStreamDefault)</td></tr>
-<tr class="memdesc:a77ae137aec79b4061a9ffa09aabf641c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Launch the kernel.  <a href="#a77ae137aec79b4061a9ffa09aabf641c">More...</a><br /></td></tr>
+<tr class="memitem:a77ae137aec79b4061a9ffa09aabf641c"><td class="memItemLeft" align="right" valign="top">static __host__ cudaError_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a77ae137aec79b4061a9ffa09aabf641c">launch</a> (<a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> const &amp;<a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>, cudaStream_t stream=cudaStreamDefault)</td></tr>
+<tr class="memdesc:a77ae137aec79b4061a9ffa09aabf641c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Support for NVRTC.  <a href="#a77ae137aec79b4061a9ffa09aabf641c">More...</a><br /></td></tr>
 <tr class="separator:a77ae137aec79b4061a9ffa09aabf641c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4f4122a2ae8b9b09a9660e5c2ca9e906"><td class="memItemLeft" align="right" valign="top">static __host__ cudaError_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906">launch</a> (CUfunction kernel, <a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> const &amp;<a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>, CUstream stream=CU_STREAM_LEGACY)</td></tr>
-<tr class="memdesc:a4f4122a2ae8b9b09a9660e5c2ca9e906"><td class="mdescLeft">&#160;</td><td class="mdescRight">Launch the kernel.  <a href="#a4f4122a2ae8b9b09a9660e5c2ca9e906">More...</a><br /></td></tr>
+<tr class="memitem:a4f4122a2ae8b9b09a9660e5c2ca9e906"><td class="memItemLeft" align="right" valign="top">static __host__ cudaError_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a4f4122a2ae8b9b09a9660e5c2ca9e906">launch</a> (CUfunction kernel, <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> const &amp;<a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a>, CUstream stream=CU_STREAM_LEGACY)</td></tr>
+<tr class="memdesc:a4f4122a2ae8b9b09a9660e5c2ca9e906"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html" title="Partial specialization for launching the GEMM kernel with or without launch bounds. ">Launch</a> the kernel.  <a href="#a4f4122a2ae8b9b09a9660e5c2ca9e906">More...</a><br /></td></tr>
 <tr class="separator:a4f4122a2ae8b9b09a9660e5c2ca9e906"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:a3c292637ab0ec8e73856d0cf6efb6da2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a></td></tr>
+<tr class="memitem:a3c292637ab0ec8e73856d0cf6efb6da2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a3c292637ab0ec8e73856d0cf6efb6da2">params</a></td></tr>
 <tr class="memdesc:a3c292637ab0ec8e73856d0cf6efb6da2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params.  <a href="#a3c292637ab0ec8e73856d0cf6efb6da2">More...</a><br /></td></tr>
 <tr class="separator:a3c292637ab0ec8e73856d0cf6efb6da2"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a6b0119ed8d92698dab4de68987c8cc1b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ad10627d508fad0efae1fb91b26d7a6b7">SharedStorage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a6b0119ed8d92698dab4de68987c8cc1b">shared_storage</a></td></tr>
@@ -155,6 +158,8 @@ Static Public Attributes</h2></td></tr>
 <tr class="memitem:a41239809be4ebc730dd8ff28c9efc58b"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a41239809be4ebc730dd8ff28c9efc58b">kThreads</a> = Traits::GemmConfig::kThreads</td></tr>
 <tr class="memdesc:a41239809be4ebc730dd8ff28c9efc58b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of threads.  <a href="#a41239809be4ebc730dd8ff28c9efc58b">More...</a><br /></td></tr>
 <tr class="separator:a41239809be4ebc730dd8ff28c9efc58b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada54b3bc2005ed919dbdda9d500a2356"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ada54b3bc2005ed919dbdda9d500a2356">kWarpGemmSteps</a></td></tr>
+<tr class="separator:ada54b3bc2005ed919dbdda9d500a2356"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="a0aca711d07245f3071adeb1111fedd34"></a>
@@ -171,6 +176,38 @@ template&lt;typename GemmTraits_ &gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="ab806302d059fc7cd113ec0b5ab5a9835"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab806302d059fc7cd113ec0b5ab5a9835">&#9670;&nbsp;</a></span>MultiplyAdd</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmTraits_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Traits::MultiplyAdd <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; GemmTraits_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#ab806302d059fc7cd113ec0b5ab5a9835">MultiplyAdd</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a054d5e87f1985ae7e53fc07f4c16d916"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a054d5e87f1985ae7e53fc07f4c16d916">&#9670;&nbsp;</a></span>Params</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmTraits_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Traits::Params <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; GemmTraits_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a6fcf9daef57558e1bb932c6eba99721b"></a>
@@ -316,7 +353,7 @@ template&lt;typename GemmTraits_ &gt; </div>
         <tr>
           <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; GemmTraits_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a> </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> const &amp;&#160;</td>
           <td class="paramname"><em>params_</em>, </td>
         </tr>
         <tr>
@@ -341,6 +378,58 @@ template&lt;typename GemmTraits_ &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
+<a id="af8bb78ae198af4dccb0241da44428053"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af8bb78ae198af4dccb0241da44428053">&#9670;&nbsp;</a></span>consume_tile()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmTraits_ &gt; </div>
+<div class="memtemplate">
+template&lt;bool Residue, bool LastIteration&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; GemmTraits_ &gt;::consume_tile </td>
+          <td>(</td>
+          <td class="paramtype">typename Traits::GlobalLoadStream &amp;&#160;</td>
+          <td class="paramname"><em>global_to_shared_stream</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">typename Traits::SharedStream &amp;&#160;</td>
+          <td class="paramname"><em>shared_load_stream</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">typename MultiplyAdd::Accumulators &amp;&#160;</td>
+          <td class="paramname"><em>accumulators</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a>&#160;</td>
+          <td class="paramname"><em>outer_k</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
 <a id="a77ae137aec79b4061a9ffa09aabf641c"></a>
 <h2 class="memtitle"><span class="permalink"><a href="#a77ae137aec79b4061a9ffa09aabf641c">&#9670;&nbsp;</a></span>launch() <span class="overload">[1/2]</span></h2>
 
@@ -355,7 +444,7 @@ template&lt;typename GemmTraits_ &gt; </div>
         <tr>
           <td class="memname">static __host__ cudaError_t <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; GemmTraits_ &gt;::launch </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> const &amp;&#160;</td>
           <td class="paramname"><em>params</em>, </td>
         </tr>
         <tr>
@@ -376,6 +465,7 @@ template&lt;typename GemmTraits_ &gt; </div>
   </tr>
 </table>
 </div><div class="memdoc">
+<p><a class="el" href="structcutlass_1_1gemm_1_1Launch.html" title="Partial specialization for launching the GEMM kernel with or without launch bounds. ">Launch</a> the kernel. </p>
 
 </div>
 </div>
@@ -399,7 +489,7 @@ template&lt;typename GemmTraits_ &gt; </div>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> const &amp;&#160;</td>
           <td class="paramname"><em>params</em>, </td>
         </tr>
         <tr>
@@ -447,7 +537,6 @@ template&lt;typename GemmTraits_ &gt; </div>
   </tr>
 </table>
 </div><div class="memdoc">
-<p>Define the mainloop iteration size </p>
 
 </div>
 </div>
@@ -474,6 +563,30 @@ template&lt;typename GemmTraits_ &gt; </div>
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="ada54b3bc2005ed919dbdda9d500a2356"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ada54b3bc2005ed919dbdda9d500a2356">&#9670;&nbsp;</a></span>kWarpGemmSteps</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmTraits_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a0aca711d07245f3071adeb1111fedd34">Index</a> const <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; GemmTraits_ &gt;::kWarpGemmSteps</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<b>Initial value:</b><div class="fragment"><div class="line">=</div><div class="line">      Traits::GemmConfig::AccumulatorsPerWarp::kD / MultiplyAdd::InstructionShape::kD</div></div><!-- fragment -->
 </div>
 </div>
 <a id="a3c292637ab0ec8e73856d0cf6efb6da2"></a>
@@ -485,7 +598,7 @@ template&lt;typename GemmTraits_ &gt; </div>
 template&lt;typename GemmTraits_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1Gemm_1_1Params.html">Params</a> const&amp; <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; GemmTraits_ &gt;::params</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Params</a> const&amp; <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; GemmTraits_ &gt;::params</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -514,7 +627,7 @@ template&lt;typename GemmTraits_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmConfig-members.html b/docs/structcutlass_1_1gemm_1_1GemmConfig-members.html
index 18c258d73..f6bd03c8d 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmConfig-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmConfig-members.html
@@ -73,41 +73,44 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmConfig.html b/docs/structcutlass_1_1gemm_1_1GemmConfig.html
index 3bc9b65f3..4471551bc 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmConfig.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmConfig.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,241 +77,250 @@ $(function() {
 <a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1gemm_1_1GemmConfig-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::GemmConfig&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p><code>#include &lt;<a class="el" href="gemm__traits_8h_source.html">gemm_traits.h</a>&gt;</code></p>
+<p><code>#include &lt;<a class="el" href="gemm__config_8h_source.html">gemm_config.h</a>&gt;</code></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:a9d1e4e364be8fd9de5e1199d93ad76aa"><td class="memItemLeft" align="right" valign="top">typedef ScalarA_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a></td></tr>
-<tr class="memdesc:a9d1e4e364be8fd9de5e1199d93ad76aa"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="#a9d1e4e364be8fd9de5e1199d93ad76aa">More...</a><br /></td></tr>
-<tr class="separator:a9d1e4e364be8fd9de5e1199d93ad76aa"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa13d6f5e5ad907ef09c88ae49e6e8e9b"><td class="memItemLeft" align="right" valign="top">typedef ScalarB_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a></td></tr>
-<tr class="memdesc:aa13d6f5e5ad907ef09c88ae49e6e8e9b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="#aa13d6f5e5ad907ef09c88ae49e6e8e9b">More...</a><br /></td></tr>
-<tr class="separator:aa13d6f5e5ad907ef09c88ae49e6e8e9b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad8f262d7da093d07cdd5c6a4fd9aceea"><td class="memItemLeft" align="right" valign="top">typedef ScalarC_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a></td></tr>
-<tr class="memdesc:ad8f262d7da093d07cdd5c6a4fd9aceea"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="#ad8f262d7da093d07cdd5c6a4fd9aceea">More...</a><br /></td></tr>
-<tr class="separator:ad8f262d7da093d07cdd5c6a4fd9aceea"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a188ef7f4c49ff2830753218343a1b8f8"><td class="memItemLeft" align="right" valign="top">typedef ScalarD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a></td></tr>
-<tr class="memdesc:a188ef7f4c49ff2830753218343a1b8f8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="#a188ef7f4c49ff2830753218343a1b8f8">More...</a><br /></td></tr>
-<tr class="separator:a188ef7f4c49ff2830753218343a1b8f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a53450f4d7444d6a4c0d2353496c0a4fd"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a></td></tr>
-<tr class="memdesc:a53450f4d7444d6a4c0d2353496c0a4fd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="#a53450f4d7444d6a4c0d2353496c0a4fd">More...</a><br /></td></tr>
-<tr class="separator:a53450f4d7444d6a4c0d2353496c0a4fd"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8669096ddbb8c810fb8d2313d62e6ee7"><td class="memItemLeft" align="right" valign="top">typedef MultiplyAdd_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a></td></tr>
-<tr class="memdesc:a8669096ddbb8c810fb8d2313d62e6ee7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="#a8669096ddbb8c810fb8d2313d62e6ee7">More...</a><br /></td></tr>
-<tr class="separator:a8669096ddbb8c810fb8d2313d62e6ee7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3a57d05f50932d718538f0d1ededa95b"><td class="memItemLeft" align="right" valign="top">typedef MultiplyAdd::InstructionShape&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a></td></tr>
-<tr class="memdesc:a3a57d05f50932d718538f0d1ededa95b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#a3a57d05f50932d718538f0d1ededa95b">More...</a><br /></td></tr>
-<tr class="separator:a3a57d05f50932d718538f0d1ededa95b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a51d583dfcd645ad0ecfc23b87b3c5108"><td class="memItemLeft" align="right" valign="top">typedef MultiplyAdd::AccumulatorsPerWarp&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a></td></tr>
-<tr class="memdesc:a51d583dfcd645ad0ecfc23b87b3c5108"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="#a51d583dfcd645ad0ecfc23b87b3c5108">More...</a><br /></td></tr>
-<tr class="separator:a51d583dfcd645ad0ecfc23b87b3c5108"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2fadb0ad2e28109ccfa9195e817a4d54"><td class="memItemLeft" align="right" valign="top">typedef MultiplyAdd::Accumulators&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a></td></tr>
-<tr class="memdesc:a2fadb0ad2e28109ccfa9195e817a4d54"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="#a2fadb0ad2e28109ccfa9195e817a4d54">More...</a><br /></td></tr>
-<tr class="separator:a2fadb0ad2e28109ccfa9195e817a4d54"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb6ba58a2f2d80db0b2c9c1d88454efd"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a></td></tr>
-<tr class="memdesc:abb6ba58a2f2d80db0b2c9c1d88454efd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="#abb6ba58a2f2d80db0b2c9c1d88454efd">More...</a><br /></td></tr>
-<tr class="separator:abb6ba58a2f2d80db0b2c9c1d88454efd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa97b0e7f369f927c4db6d683dbb7f53b"><td class="memItemLeft" align="right" valign="top">typedef ScalarA_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a></td></tr>
+<tr class="memdesc:aa97b0e7f369f927c4db6d683dbb7f53b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="#aa97b0e7f369f927c4db6d683dbb7f53b">More...</a><br /></td></tr>
+<tr class="separator:aa97b0e7f369f927c4db6d683dbb7f53b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a389c0980e978463d3cc126342d8413c6"><td class="memItemLeft" align="right" valign="top">typedef ScalarB_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a></td></tr>
+<tr class="memdesc:a389c0980e978463d3cc126342d8413c6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="#a389c0980e978463d3cc126342d8413c6">More...</a><br /></td></tr>
+<tr class="separator:a389c0980e978463d3cc126342d8413c6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30d9cfbbede42166e4e1964145dfe05d"><td class="memItemLeft" align="right" valign="top">typedef ScalarC_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a></td></tr>
+<tr class="memdesc:a30d9cfbbede42166e4e1964145dfe05d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="#a30d9cfbbede42166e4e1964145dfe05d">More...</a><br /></td></tr>
+<tr class="separator:a30d9cfbbede42166e4e1964145dfe05d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ad231b16f05a58900dca8ff0e0e7bfa"><td class="memItemLeft" align="right" valign="top">typedef ScalarD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a></td></tr>
+<tr class="memdesc:a7ad231b16f05a58900dca8ff0e0e7bfa"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="#a7ad231b16f05a58900dca8ff0e0e7bfa">More...</a><br /></td></tr>
+<tr class="separator:a7ad231b16f05a58900dca8ff0e0e7bfa"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dd9c3efc3dfd9b5c6acd12236697399"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a></td></tr>
+<tr class="memdesc:a9dd9c3efc3dfd9b5c6acd12236697399"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="#a9dd9c3efc3dfd9b5c6acd12236697399">More...</a><br /></td></tr>
+<tr class="separator:a9dd9c3efc3dfd9b5c6acd12236697399"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aedb95febe4a0b2943e233c95c36a22cd"><td class="memItemLeft" align="right" valign="top">typedef MultiplyAdd_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a></td></tr>
+<tr class="memdesc:aedb95febe4a0b2943e233c95c36a22cd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="#aedb95febe4a0b2943e233c95c36a22cd">More...</a><br /></td></tr>
+<tr class="separator:aedb95febe4a0b2943e233c95c36a22cd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad83132bd03f8bd844487d1a9da908c8b"><td class="memItemLeft" align="right" valign="top">typedef MultiplyAdd::InstructionShape&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a></td></tr>
+<tr class="memdesc:ad83132bd03f8bd844487d1a9da908c8b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#ad83132bd03f8bd844487d1a9da908c8b">More...</a><br /></td></tr>
+<tr class="separator:ad83132bd03f8bd844487d1a9da908c8b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a32a8979ff618f069665708c7771c3cc3"><td class="memItemLeft" align="right" valign="top">typedef MultiplyAdd::AccumulatorsPerWarp&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:a32a8979ff618f069665708c7771c3cc3"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of warp-level GEMM.  <a href="#a32a8979ff618f069665708c7771c3cc3">More...</a><br /></td></tr>
+<tr class="separator:a32a8979ff618f069665708c7771c3cc3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f90f91f9e5e40496e8a88eb657fd591"><td class="memItemLeft" align="right" valign="top">typedef MultiplyAdd::Accumulators&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a></td></tr>
+<tr class="memdesc:a9f90f91f9e5e40496e8a88eb657fd591"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="#a9f90f91f9e5e40496e8a88eb657fd591">More...</a><br /></td></tr>
+<tr class="separator:a9f90f91f9e5e40496e8a88eb657fd591"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b987cfb25a32e671a47cb6376a361f3"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a></td></tr>
+<tr class="memdesc:a9b987cfb25a32e671a47cb6376a361f3"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="#a9b987cfb25a32e671a47cb6376a361f3">More...</a><br /></td></tr>
+<tr class="separator:a9b987cfb25a32e671a47cb6376a361f3"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
-<tr class="memitem:a677d6a1711cc756b817095b7437cce0e"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a> = cutlass::kWarpSize</td></tr>
-<tr class="memdesc:a677d6a1711cc756b817095b7437cce0e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="#a677d6a1711cc756b817095b7437cce0e">More...</a><br /></td></tr>
-<tr class="separator:a677d6a1711cc756b817095b7437cce0e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0b2be601de08848afc4418adb97255bf"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a> = <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a>&gt;::kCount * <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td></tr>
-<tr class="memdesc:a0b2be601de08848afc4418adb97255bf"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="#a0b2be601de08848afc4418adb97255bf">More...</a><br /></td></tr>
-<tr class="separator:a0b2be601de08848afc4418adb97255bf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2e0a043c5d4d7959ec1a2214c3ac39ac"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a> = kScalarsPerLdgA_</td></tr>
-<tr class="memdesc:a2e0a043c5d4d7959ec1a2214c3ac39ac"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="#a2e0a043c5d4d7959ec1a2214c3ac39ac">More...</a><br /></td></tr>
-<tr class="separator:a2e0a043c5d4d7959ec1a2214c3ac39ac"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:accc95abc55880abdab92253367b4b186"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a> = kScalarsPerStsA_</td></tr>
-<tr class="separator:accc95abc55880abdab92253367b4b186"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa1b75484138923a52b32888fef608d9b"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a> = kScalarsPerLdsA_</td></tr>
-<tr class="separator:aa1b75484138923a52b32888fef608d9b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a849b21fed39aaac1cdd546334739be97"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a> = kScalarsPerLdgB_</td></tr>
-<tr class="memdesc:a849b21fed39aaac1cdd546334739be97"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="#a849b21fed39aaac1cdd546334739be97">More...</a><br /></td></tr>
-<tr class="separator:a849b21fed39aaac1cdd546334739be97"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac0c8c027e3ede14b62d7c7d519551f21"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a> = kScalarsPerStsB_</td></tr>
-<tr class="separator:ac0c8c027e3ede14b62d7c7d519551f21"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a86470d3a44e2b50ee31ec3c9f79927ef"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a> = kScalarsPerLdsB_</td></tr>
-<tr class="separator:a86470d3a44e2b50ee31ec3c9f79927ef"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aad47c635a73e83bd4b19494864832d31"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a> = kScalarsPerLdgCAndStgD_</td></tr>
-<tr class="memdesc:aad47c635a73e83bd4b19494864832d31"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="#aad47c635a73e83bd4b19494864832d31">More...</a><br /></td></tr>
-<tr class="separator:aad47c635a73e83bd4b19494864832d31"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3633083f4f778215543e376c092745d7"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a> = kScalarsPerLdgCAndStgD_</td></tr>
-<tr class="memdesc:a3633083f4f778215543e376c092745d7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="#a3633083f4f778215543e376c092745d7">More...</a><br /></td></tr>
-<tr class="separator:a3633083f4f778215543e376c092745d7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3087cdd38e2c65ad0dffdd0587d2cce0"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a> = kScalarsPerStsD_</td></tr>
-<tr class="separator:a3087cdd38e2c65ad0dffdd0587d2cce0"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adaf2ee5b8e6f7bdb9939cd45a186ca56"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a> = kScalarsPerLdsD_</td></tr>
-<tr class="separator:adaf2ee5b8e6f7bdb9939cd45a186ca56"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abbdd356f280099269867e614684645cf"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a> = <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a> / InstructionShape::kD</td></tr>
-<tr class="memdesc:abbdd356f280099269867e614684645cf"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="#abbdd356f280099269867e614684645cf">More...</a><br /></td></tr>
-<tr class="separator:abbdd356f280099269867e614684645cf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9dd092bca2f1f2c039f367b23bafa9c1"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a> = <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a> / InstructionShape::kD</td></tr>
-<tr class="separator:a9dd092bca2f1f2c039f367b23bafa9c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a221949c289057e39d439ce03a5b01c52"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a> = kStages_</td></tr>
-<tr class="memdesc:a221949c289057e39d439ce03a5b01c52"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="#a221949c289057e39d439ce03a5b01c52">More...</a><br /></td></tr>
-<tr class="separator:a221949c289057e39d439ce03a5b01c52"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa549183981095a3e604974e909a7d396"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a> = cutlass::kWarpSize</td></tr>
+<tr class="memdesc:aa549183981095a3e604974e909a7d396"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="#aa549183981095a3e604974e909a7d396">More...</a><br /></td></tr>
+<tr class="separator:aa549183981095a3e604974e909a7d396"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acf461f0ba3067cc5d66a04f0a176308f"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a> = <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a>&gt;::kCount * <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td></tr>
+<tr class="memdesc:acf461f0ba3067cc5d66a04f0a176308f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="#acf461f0ba3067cc5d66a04f0a176308f">More...</a><br /></td></tr>
+<tr class="separator:acf461f0ba3067cc5d66a04f0a176308f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64e7d66e0646c7044e754b3b6b91e761"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a> = kScalarsPerLdgA_</td></tr>
+<tr class="memdesc:a64e7d66e0646c7044e754b3b6b91e761"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="#a64e7d66e0646c7044e754b3b6b91e761">More...</a><br /></td></tr>
+<tr class="separator:a64e7d66e0646c7044e754b3b6b91e761"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab2b6167b0165ed544254dc87c2a7db8f"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a> = kScalarsPerStsA_</td></tr>
+<tr class="separator:ab2b6167b0165ed544254dc87c2a7db8f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a82295105d7ccbcce057b4c57632a644b"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a> = kScalarsPerLdsA_</td></tr>
+<tr class="separator:a82295105d7ccbcce057b4c57632a644b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff7409a9d2666159435d3b9db16443bc"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a> = kScalarsPerLdgB_</td></tr>
+<tr class="memdesc:aff7409a9d2666159435d3b9db16443bc"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="#aff7409a9d2666159435d3b9db16443bc">More...</a><br /></td></tr>
+<tr class="separator:aff7409a9d2666159435d3b9db16443bc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2a424063136c56c5ca6345496485afce"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a> = kScalarsPerStsB_</td></tr>
+<tr class="separator:a2a424063136c56c5ca6345496485afce"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ccd14b44a22dfdfeefabe1e643da65e"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a> = kScalarsPerLdsB_</td></tr>
+<tr class="separator:a9ccd14b44a22dfdfeefabe1e643da65e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9c3985d8de485d76a5d72c91c3e3aaff"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a> = kScalarsPerLdgCAndStgD_</td></tr>
+<tr class="memdesc:a9c3985d8de485d76a5d72c91c3e3aaff"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="#a9c3985d8de485d76a5d72c91c3e3aaff">More...</a><br /></td></tr>
+<tr class="separator:a9c3985d8de485d76a5d72c91c3e3aaff"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ade9d3c2aeb0e4d73e04a5e9a06ce5203"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a> = kScalarsPerLdgCAndStgD_</td></tr>
+<tr class="memdesc:ade9d3c2aeb0e4d73e04a5e9a06ce5203"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="#ade9d3c2aeb0e4d73e04a5e9a06ce5203">More...</a><br /></td></tr>
+<tr class="separator:ade9d3c2aeb0e4d73e04a5e9a06ce5203"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e93d0163c0d150d33f4093b4a1ec87f"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a> = kScalarsPerStsD_</td></tr>
+<tr class="separator:a1e93d0163c0d150d33f4093b4a1ec87f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a26942561aa111089b3ba0f12cf233951"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a> = kScalarsPerLdsD_</td></tr>
+<tr class="separator:a26942561aa111089b3ba0f12cf233951"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60ab48db1b87fb6063d194247bc055f5"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a> = <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a> / InstructionShape::kD</td></tr>
+<tr class="memdesc:a60ab48db1b87fb6063d194247bc055f5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="#a60ab48db1b87fb6063d194247bc055f5">More...</a><br /></td></tr>
+<tr class="separator:a60ab48db1b87fb6063d194247bc055f5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb740e4ab9f93f29f1b8ab43ebef68eb"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a> = <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a> / InstructionShape::kD</td></tr>
+<tr class="separator:aeb740e4ab9f93f29f1b8ab43ebef68eb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab26d76515e394118bfc530d6a81b9508"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a> = kStages_</td></tr>
+<tr class="memdesc:ab26d76515e394118bfc530d6a81b9508"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="#ab26d76515e394118bfc530d6a81b9508">More...</a><br /></td></tr>
+<tr class="separator:ab26d76515e394118bfc530d6a81b9508"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64c1e0d794c1bdfa8b2f3a53e387155c"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a> = kResidueSeparate_</td></tr>
+<tr class="memdesc:a64c1e0d794c1bdfa8b2f3a53e387155c"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, mainloop is instantiated twice. The first instantiation contains no predicate.  <a href="#a64c1e0d794c1bdfa8b2f3a53e387155c">More...</a><br /></td></tr>
+<tr class="separator:a64c1e0d794c1bdfa8b2f3a53e387155c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a600746def904eeca46d7f92a4b223b46"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a> = kResidueInProlog_</td></tr>
+<tr class="memdesc:a600746def904eeca46d7f92a4b223b46"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, residue is computed in the prologue.  <a href="#a600746def904eeca46d7f92a4b223b46">More...</a><br /></td></tr>
+<tr class="separator:a600746def904eeca46d7f92a4b223b46"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54e252cedbfee75e7c4ac2f7fe5ce45b"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a> = kLaunchBounds_</td></tr>
+<tr class="memdesc:a54e252cedbfee75e7c4ac2f7fe5ce45b"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, kernel is launched with launch bounds specified.  <a href="#a54e252cedbfee75e7c4ac2f7fe5ce45b">More...</a><br /></td></tr>
+<tr class="separator:a54e252cedbfee75e7c4ac2f7fe5ce45b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a2fadb0ad2e28109ccfa9195e817a4d54"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2fadb0ad2e28109ccfa9195e817a4d54">&#9670;&nbsp;</a></span>Accumulators</h2>
+<a id="a9f90f91f9e5e40496e8a88eb657fd591"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9f90f91f9e5e40496e8a88eb657fd591">&#9670;&nbsp;</a></span>Accumulators</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef MultiplyAdd::Accumulators <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a></td>
+          <td class="memname">typedef MultiplyAdd::Accumulators <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a51d583dfcd645ad0ecfc23b87b3c5108"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a51d583dfcd645ad0ecfc23b87b3c5108">&#9670;&nbsp;</a></span>AccumulatorsPerWarp</h2>
+<a id="a32a8979ff618f069665708c7771c3cc3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a32a8979ff618f069665708c7771c3cc3">&#9670;&nbsp;</a></span>AccumulatorsPerWarp</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef MultiplyAdd::AccumulatorsPerWarp <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a></td>
+          <td class="memname">typedef MultiplyAdd::AccumulatorsPerWarp <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a3a57d05f50932d718538f0d1ededa95b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3a57d05f50932d718538f0d1ededa95b">&#9670;&nbsp;</a></span>InstructionShape</h2>
+<a id="ad83132bd03f8bd844487d1a9da908c8b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad83132bd03f8bd844487d1a9da908c8b">&#9670;&nbsp;</a></span>InstructionShape</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef MultiplyAdd::InstructionShape <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a></td>
+          <td class="memname">typedef MultiplyAdd::InstructionShape <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a8669096ddbb8c810fb8d2313d62e6ee7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8669096ddbb8c810fb8d2313d62e6ee7">&#9670;&nbsp;</a></span>MultiplyAdd</h2>
+<a id="aedb95febe4a0b2943e233c95c36a22cd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aedb95febe4a0b2943e233c95c36a22cd">&#9670;&nbsp;</a></span>MultiplyAdd</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef MultiplyAdd_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a></td>
+          <td class="memname">typedef MultiplyAdd_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a53450f4d7444d6a4c0d2353496c0a4fd"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a53450f4d7444d6a4c0d2353496c0a4fd">&#9670;&nbsp;</a></span>OutputTile</h2>
+<a id="a9dd9c3efc3dfd9b5c6acd12236697399"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9dd9c3efc3dfd9b5c6acd12236697399">&#9670;&nbsp;</a></span>OutputTile</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef OutputTile_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a></td>
+          <td class="memname">typedef OutputTile_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a9d1e4e364be8fd9de5e1199d93ad76aa"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9d1e4e364be8fd9de5e1199d93ad76aa">&#9670;&nbsp;</a></span>ScalarA</h2>
+<a id="aa97b0e7f369f927c4db6d683dbb7f53b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa97b0e7f369f927c4db6d683dbb7f53b">&#9670;&nbsp;</a></span>ScalarA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef ScalarA_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a></td>
+          <td class="memname">typedef ScalarA_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aa13d6f5e5ad907ef09c88ae49e6e8e9b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa13d6f5e5ad907ef09c88ae49e6e8e9b">&#9670;&nbsp;</a></span>ScalarB</h2>
+<a id="a389c0980e978463d3cc126342d8413c6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a389c0980e978463d3cc126342d8413c6">&#9670;&nbsp;</a></span>ScalarB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef ScalarB_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a></td>
+          <td class="memname">typedef ScalarB_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ad8f262d7da093d07cdd5c6a4fd9aceea"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad8f262d7da093d07cdd5c6a4fd9aceea">&#9670;&nbsp;</a></span>ScalarC</h2>
+<a id="a30d9cfbbede42166e4e1964145dfe05d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a30d9cfbbede42166e4e1964145dfe05d">&#9670;&nbsp;</a></span>ScalarC</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef ScalarC_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a></td>
+          <td class="memname">typedef ScalarC_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a188ef7f4c49ff2830753218343a1b8f8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a188ef7f4c49ff2830753218343a1b8f8">&#9670;&nbsp;</a></span>ScalarD</h2>
+<a id="a7ad231b16f05a58900dca8ff0e0e7bfa"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7ad231b16f05a58900dca8ff0e0e7bfa">&#9670;&nbsp;</a></span>ScalarD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef ScalarD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a></td>
+          <td class="memname">typedef ScalarD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="abb6ba58a2f2d80db0b2c9c1d88454efd"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abb6ba58a2f2d80db0b2c9c1d88454efd">&#9670;&nbsp;</a></span>Warps</h2>
+<a id="a9b987cfb25a32e671a47cb6376a361f3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9b987cfb25a32e671a47cb6376a361f3">&#9670;&nbsp;</a></span>Warps</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -319,19 +328,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="abbdd356f280099269867e614684645cf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abbdd356f280099269867e614684645cf">&#9670;&nbsp;</a></span>kAccumulatorsPerLdsA</h2>
+<a id="a60ab48db1b87fb6063d194247bc055f5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a60ab48db1b87fb6063d194247bc055f5">&#9670;&nbsp;</a></span>kAccumulatorsPerLdsA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kAccumulatorsPerLdsA = <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a> / InstructionShape::kD</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kAccumulatorsPerLdsA = <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a> / InstructionShape::kD</td>
         </tr>
       </table>
   </td>
@@ -343,19 +352,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="a9dd092bca2f1f2c039f367b23bafa9c1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9dd092bca2f1f2c039f367b23bafa9c1">&#9670;&nbsp;</a></span>kAccumulatorsPerLdsB</h2>
+<a id="aeb740e4ab9f93f29f1b8ab43ebef68eb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeb740e4ab9f93f29f1b8ab43ebef68eb">&#9670;&nbsp;</a></span>kAccumulatorsPerLdsB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kAccumulatorsPerLdsB = <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a> / InstructionShape::kD</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kAccumulatorsPerLdsB = <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a> / InstructionShape::kD</td>
         </tr>
       </table>
   </td>
@@ -367,19 +376,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="a2e0a043c5d4d7959ec1a2214c3ac39ac"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2e0a043c5d4d7959ec1a2214c3ac39ac">&#9670;&nbsp;</a></span>kScalarsPerLdgA</h2>
+<a id="a54e252cedbfee75e7c4ac2f7fe5ce45b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a54e252cedbfee75e7c4ac2f7fe5ce45b">&#9670;&nbsp;</a></span>kLaunchBounds</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerLdgA = kScalarsPerLdgA_</td>
+          <td class="memname">bool const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kLaunchBounds = kLaunchBounds_</td>
         </tr>
       </table>
   </td>
@@ -391,19 +400,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="a849b21fed39aaac1cdd546334739be97"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a849b21fed39aaac1cdd546334739be97">&#9670;&nbsp;</a></span>kScalarsPerLdgB</h2>
+<a id="a600746def904eeca46d7f92a4b223b46"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a600746def904eeca46d7f92a4b223b46">&#9670;&nbsp;</a></span>kResidueInProlog</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerLdgB = kScalarsPerLdgB_</td>
+          <td class="memname">bool const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kResidueInProlog = kResidueInProlog_</td>
         </tr>
       </table>
   </td>
@@ -415,19 +424,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="aad47c635a73e83bd4b19494864832d31"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aad47c635a73e83bd4b19494864832d31">&#9670;&nbsp;</a></span>kScalarsPerLdgC</h2>
+<a id="a64c1e0d794c1bdfa8b2f3a53e387155c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a64c1e0d794c1bdfa8b2f3a53e387155c">&#9670;&nbsp;</a></span>kResidueSeparate</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerLdgC = kScalarsPerLdgCAndStgD_</td>
+          <td class="memname">bool const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kResidueSeparate = kResidueSeparate_</td>
         </tr>
       </table>
   </td>
@@ -439,19 +448,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="aa1b75484138923a52b32888fef608d9b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa1b75484138923a52b32888fef608d9b">&#9670;&nbsp;</a></span>kScalarsPerLdsA</h2>
+<a id="a64e7d66e0646c7044e754b3b6b91e761"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a64e7d66e0646c7044e754b3b6b91e761">&#9670;&nbsp;</a></span>kScalarsPerLdgA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerLdsA = kScalarsPerLdsA_</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerLdgA = kScalarsPerLdgA_</td>
         </tr>
       </table>
   </td>
@@ -463,19 +472,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="a86470d3a44e2b50ee31ec3c9f79927ef"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a86470d3a44e2b50ee31ec3c9f79927ef">&#9670;&nbsp;</a></span>kScalarsPerLdsB</h2>
+<a id="aff7409a9d2666159435d3b9db16443bc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aff7409a9d2666159435d3b9db16443bc">&#9670;&nbsp;</a></span>kScalarsPerLdgB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerLdsB = kScalarsPerLdsB_</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerLdgB = kScalarsPerLdgB_</td>
         </tr>
       </table>
   </td>
@@ -487,19 +496,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="adaf2ee5b8e6f7bdb9939cd45a186ca56"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#adaf2ee5b8e6f7bdb9939cd45a186ca56">&#9670;&nbsp;</a></span>kScalarsPerLdsD</h2>
+<a id="a9c3985d8de485d76a5d72c91c3e3aaff"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9c3985d8de485d76a5d72c91c3e3aaff">&#9670;&nbsp;</a></span>kScalarsPerLdgC</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerLdsD = kScalarsPerLdsD_</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerLdgC = kScalarsPerLdgCAndStgD_</td>
         </tr>
       </table>
   </td>
@@ -511,19 +520,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="a3633083f4f778215543e376c092745d7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3633083f4f778215543e376c092745d7">&#9670;&nbsp;</a></span>kScalarsPerStgD</h2>
+<a id="a82295105d7ccbcce057b4c57632a644b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a82295105d7ccbcce057b4c57632a644b">&#9670;&nbsp;</a></span>kScalarsPerLdsA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerStgD = kScalarsPerLdgCAndStgD_</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerLdsA = kScalarsPerLdsA_</td>
         </tr>
       </table>
   </td>
@@ -535,19 +544,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="accc95abc55880abdab92253367b4b186"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#accc95abc55880abdab92253367b4b186">&#9670;&nbsp;</a></span>kScalarsPerStsA</h2>
+<a id="a9ccd14b44a22dfdfeefabe1e643da65e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9ccd14b44a22dfdfeefabe1e643da65e">&#9670;&nbsp;</a></span>kScalarsPerLdsB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerStsA = kScalarsPerStsA_</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerLdsB = kScalarsPerLdsB_</td>
         </tr>
       </table>
   </td>
@@ -559,19 +568,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="ac0c8c027e3ede14b62d7c7d519551f21"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac0c8c027e3ede14b62d7c7d519551f21">&#9670;&nbsp;</a></span>kScalarsPerStsB</h2>
+<a id="a26942561aa111089b3ba0f12cf233951"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a26942561aa111089b3ba0f12cf233951">&#9670;&nbsp;</a></span>kScalarsPerLdsD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerStsB = kScalarsPerStsB_</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerLdsD = kScalarsPerLdsD_</td>
         </tr>
       </table>
   </td>
@@ -583,19 +592,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="a3087cdd38e2c65ad0dffdd0587d2cce0"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3087cdd38e2c65ad0dffdd0587d2cce0">&#9670;&nbsp;</a></span>kScalarsPerStsD</h2>
+<a id="ade9d3c2aeb0e4d73e04a5e9a06ce5203"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ade9d3c2aeb0e4d73e04a5e9a06ce5203">&#9670;&nbsp;</a></span>kScalarsPerStgD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kScalarsPerStsD = kScalarsPerStsD_</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerStgD = kScalarsPerLdgCAndStgD_</td>
         </tr>
       </table>
   </td>
@@ -607,19 +616,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="a221949c289057e39d439ce03a5b01c52"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a221949c289057e39d439ce03a5b01c52">&#9670;&nbsp;</a></span>kStages</h2>
+<a id="ab2b6167b0165ed544254dc87c2a7db8f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab2b6167b0165ed544254dc87c2a7db8f">&#9670;&nbsp;</a></span>kScalarsPerStsA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kStages = kStages_</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerStsA = kScalarsPerStsA_</td>
         </tr>
       </table>
   </td>
@@ -631,19 +640,19 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="a0b2be601de08848afc4418adb97255bf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0b2be601de08848afc4418adb97255bf">&#9670;&nbsp;</a></span>kThreads</h2>
+<a id="a2a424063136c56c5ca6345496485afce"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2a424063136c56c5ca6345496485afce">&#9670;&nbsp;</a></span>kScalarsPerStsB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kThreads = <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a>&gt;::kCount * <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerStsB = kScalarsPerStsB_</td>
         </tr>
       </table>
   </td>
@@ -655,19 +664,91 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 
 </div>
 </div>
-<a id="a677d6a1711cc756b817095b7437cce0e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a677d6a1711cc756b817095b7437cce0e">&#9670;&nbsp;</a></span>kWarpSize</h2>
+<a id="a1e93d0163c0d150d33f4093b4a1ec87f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1e93d0163c0d150d33f4093b4a1ec87f">&#9670;&nbsp;</a></span>kScalarsPerStsD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_&gt; </div>
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_ &gt;::kWarpSize = cutlass::kWarpSize</td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kScalarsPerStsD = kScalarsPerStsD_</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab26d76515e394118bfc530d6a81b9508"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab26d76515e394118bfc530d6a81b9508">&#9670;&nbsp;</a></span>kStages</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kStages = kStages_</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="acf461f0ba3067cc5d66a04f0a176308f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acf461f0ba3067cc5d66a04f0a176308f">&#9670;&nbsp;</a></span>kThreads</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kThreads = <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a>&gt;::kCount * <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa549183981095a3e604974e909a7d396"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa549183981095a3e604974e909a7d396">&#9670;&nbsp;</a></span>kWarpSize</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename ScalarD_, typename OutputTile_, typename MultiplyAdd_, int kScalarsPerLdgA_, int kScalarsPerStsA_, int kScalarsPerLdsA_, int kScalarsPerLdgB_, int kScalarsPerStsB_, int kScalarsPerLdsB_, int kScalarsPerLdgCAndStgD_, int kScalarsPerStsD_, int kScalarsPerLdsD_, int kStages_, bool kResidueSeparate_ = false, bool kResidueInProlog_ = false, bool kLaunchBounds_ = true&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig</a>&lt; ScalarA_, ScalarB_, ScalarC_, ScalarD_, OutputTile_, MultiplyAdd_, kScalarsPerLdgA_, kScalarsPerStsA_, kScalarsPerLdsA_, kScalarsPerLdgB_, kScalarsPerStsB_, kScalarsPerLdsB_, kScalarsPerLdgCAndStgD_, kScalarsPerStsD_, kScalarsPerLdsD_, kStages_, kResidueSeparate_, kResidueInProlog_, kLaunchBounds_ &gt;::kWarpSize = cutlass::kWarpSize</td>
         </tr>
       </table>
   </td>
@@ -680,12 +761,12 @@ template&lt;typename ScalarA_, typename ScalarB_, typename ScalarC_, typename Sc
 </div>
 </div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
-<li><a class="el" href="gemm__traits_8h_source.html">gemm_traits.h</a></li>
+<li><a class="el" href="gemm__config_8h_source.html">gemm_config.h</a></li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmCoord-members.html b/docs/structcutlass_1_1gemm_1_1GemmCoord-members.html
new file mode 100644
index 000000000..b3bb6a70b
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GemmCoord-members.html
@@ -0,0 +1,152 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GemmCoord Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">at</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">at</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">at</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#adaf31768b8239f497c0ec9b40bad1cb5">batch</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a>(Coord&lt; kRank &gt; const &amp;max, Coord&lt; kRank &gt; const &amp;min=Coord&lt; kRank &gt;())</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">Coord</a>(Index value=0)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">Coord</a>(Index _idx[])</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">Coord</a>(Coord&lt; kRank &gt; const &amp;coord)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">count</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">dot</a>(Coord const &amp;b, T sum) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">dot</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">GemmCoord</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a03e6bfa95156962be51e190d381c8b5e">GemmCoord</a>(Coord&lt; 3, Index &gt; const &amp;coord, Index _batch=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a65d1ca12c0f27984920cf1700322a746">GemmCoord</a>(Coord&lt; 4, Index &gt; const &amp;coord)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a17da9936dbad99f2402c42b1bd6ea5ea">GemmCoord</a>(Index coord[4])</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac3b1cbdf86bd36d6b4b5e295ef846dfe">GemmCoord</a>(Index k, Index n, Index m, Index batch=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">k</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ae12eb84ec47ddf01b4d459c7aabc22ad">k</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad7b490ce2150e54fccad6b0f11932382">kBatch</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a521d4b8e720d2261c825e05397c92a5e">kK</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#af1f5c03c35eaa406c6a63082da26bec3">kM</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad6c884a5bb6e5edaf371e8af10df367d">km</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a67f08a03dabee497fa5547cff0f1faea">kN</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a16501265d58ddaca0e2d9bb4e21d66ea">kn</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a4062c040208868c75dbc6ba18910bffb">knm</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8199f5e336a20c31e54d68b11e9fa3d3">m</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">N</a></td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a1327b9b4b9379df24df3d4b716952d11">n</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac4550a7e80e1f0265eacecebe54794d9">nm</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">operator bool</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">operator!=</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5a158b5f3c0b1779972b25aa52be1164">operator*</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">Coord&lt; 4, int &gt;::operator*</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a69fb0bb5e73f35d3c8df71a0174d6520">operator*=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">Coord&lt; 4, int &gt;::operator*=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a675efbb9ed360888faf3c333708ae4d5">operator+</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">Coord&lt; 4, int &gt;::operator+</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5465f7308778eac5d14d8020179a65e0">operator+=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">Coord&lt; 4, int &gt;::operator+=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a762fd45e61477d700c82bfd67443c6f9">operator-</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">Coord&lt; 4, int &gt;::operator-</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a12ba250be3d5474b7c6fc4eddd4f58d5">operator-=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">Coord&lt; 4, int &gt;::operator-=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a41770bb99f02f4debbafe95e019ce02b">operator/</a>(Base const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">Coord&lt; 4, int &gt;::operator/</a>(Coord const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#aac1e1bad751237fd76d32a1ea10f6c40">operator/=</a>(Base const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">Coord&lt; 4, int &gt;::operator/=</a>(Coord const &amp;b)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">operator&lt;</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">operator&lt;=</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">operator==</a>(Coord&lt; kRank &gt; const &amp;b) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">operator[]</a>(int dim)</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">operator[]</a>(int dim) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a>(int start=0, Index identity=0) const</td><td class="entry"><a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmCoord.html b/docs/structcutlass_1_1gemm_1_1GemmCoord.html
new file mode 100644
index 000000000..9326fe152
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GemmCoord.html
@@ -0,0 +1,1102 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::GemmCoord Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1GemmCoord-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GemmCoord Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="gemm__coord_8h_source.html">gemm_coord.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::GemmCoord:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1GemmCoord.png" usemap="#cutlass::gemm::GemmCoord_map" alt=""/>
+  <map id="cutlass::gemm::GemmCoord_map" name="cutlass::gemm::GemmCoord_map">
+<area href="structcutlass_1_1Coord.html" alt="cutlass::Coord&lt; 4, int &gt;" shape="rect" coords="0,0,164,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a8e3f0250e2265503862354c729dca892"><td class="memItemLeft" align="right" valign="top">typedef int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a></td></tr>
+<tr class="memdesc:a8e3f0250e2265503862354c729dca892"><td class="mdescLeft">&#160;</td><td class="mdescRight">Integer-valued index.  <a href="#a8e3f0250e2265503862354c729dca892">More...</a><br /></td></tr>
+<tr class="separator:a8e3f0250e2265503862354c729dca892"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a790f6552ad26964fa808b51f4aba433b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a></td></tr>
+<tr class="memdesc:a790f6552ad26964fa808b51f4aba433b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base type is a <a class="el" href="structcutlass_1_1Coord.html" title="Statically-sized array specifying Coords within a tensor. ">Coord</a> of rank=4.  <a href="#a790f6552ad26964fa808b51f4aba433b">More...</a><br /></td></tr>
+<tr class="separator:a790f6552ad26964fa808b51f4aba433b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td></tr>
+<tr class="memitem:a7c73966e94b4f45854f16e33683bc02c inherit pub_types_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top">typedef int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a></td></tr>
+<tr class="memdesc:a7c73966e94b4f45854f16e33683bc02c inherit pub_types_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type used to store elements.  <a href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">More...</a><br /></td></tr>
+<tr class="separator:a7c73966e94b4f45854f16e33683bc02c inherit pub_types_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:abaa87475d518a2e5cdf44c62122b9e01"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#abaa87475d518a2e5cdf44c62122b9e01">GemmCoord</a> ()</td></tr>
+<tr class="memdesc:abaa87475d518a2e5cdf44c62122b9e01"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor.  <a href="#abaa87475d518a2e5cdf44c62122b9e01">More...</a><br /></td></tr>
+<tr class="separator:abaa87475d518a2e5cdf44c62122b9e01"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a03e6bfa95156962be51e190d381c8b5e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a03e6bfa95156962be51e190d381c8b5e">GemmCoord</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &gt; const &amp;coord, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> _batch=0)</td></tr>
+<tr class="memdesc:a03e6bfa95156962be51e190d381c8b5e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> and a batch.  <a href="#a03e6bfa95156962be51e190d381c8b5e">More...</a><br /></td></tr>
+<tr class="separator:a03e6bfa95156962be51e190d381c8b5e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a65d1ca12c0f27984920cf1700322a746"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a65d1ca12c0f27984920cf1700322a746">GemmCoord</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &gt; const &amp;coord)</td></tr>
+<tr class="memdesc:a65d1ca12c0f27984920cf1700322a746"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a>  <a href="#a65d1ca12c0f27984920cf1700322a746">More...</a><br /></td></tr>
+<tr class="separator:a65d1ca12c0f27984920cf1700322a746"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a17da9936dbad99f2402c42b1bd6ea5ea"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a17da9936dbad99f2402c42b1bd6ea5ea">GemmCoord</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> coord[4])</td></tr>
+<tr class="memdesc:a17da9936dbad99f2402c42b1bd6ea5ea"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of coordinate elements.  <a href="#a17da9936dbad99f2402c42b1bd6ea5ea">More...</a><br /></td></tr>
+<tr class="separator:a17da9936dbad99f2402c42b1bd6ea5ea"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac3b1cbdf86bd36d6b4b5e295ef846dfe"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac3b1cbdf86bd36d6b4b5e295ef846dfe">GemmCoord</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">k</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a>=0)</td></tr>
+<tr class="memdesc:ac3b1cbdf86bd36d6b4b5e295ef846dfe"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct from a K, N, M, batch variables.  <a href="#ac3b1cbdf86bd36d6b4b5e295ef846dfe">More...</a><br /></td></tr>
+<tr class="separator:ac3b1cbdf86bd36d6b4b5e295ef846dfe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9167769a2b915eb92fb4ca37b9212793"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a> () const</td></tr>
+<tr class="memdesc:a9167769a2b915eb92fb4ca37b9212793"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the GEMM M coordinate.  <a href="#a9167769a2b915eb92fb4ca37b9212793">More...</a><br /></td></tr>
+<tr class="separator:a9167769a2b915eb92fb4ca37b9212793"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8199f5e336a20c31e54d68b11e9fa3d3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8199f5e336a20c31e54d68b11e9fa3d3">m</a> ()</td></tr>
+<tr class="memdesc:a8199f5e336a20c31e54d68b11e9fa3d3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns reference to the GEMM M coordinate.  <a href="#a8199f5e336a20c31e54d68b11e9fa3d3">More...</a><br /></td></tr>
+<tr class="separator:a8199f5e336a20c31e54d68b11e9fa3d3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7c582518db6860e19286361b162c4fcd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a> () const</td></tr>
+<tr class="memdesc:a7c582518db6860e19286361b162c4fcd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the GEMM N coordinate.  <a href="#a7c582518db6860e19286361b162c4fcd">More...</a><br /></td></tr>
+<tr class="separator:a7c582518db6860e19286361b162c4fcd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1327b9b4b9379df24df3d4b716952d11"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a1327b9b4b9379df24df3d4b716952d11">n</a> ()</td></tr>
+<tr class="memdesc:a1327b9b4b9379df24df3d4b716952d11"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns reference to the GEMM N coordinate.  <a href="#a1327b9b4b9379df24df3d4b716952d11">More...</a><br /></td></tr>
+<tr class="separator:a1327b9b4b9379df24df3d4b716952d11"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a646c71e97ef007bde8c101479c528da7"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a646c71e97ef007bde8c101479c528da7">k</a> () const</td></tr>
+<tr class="memdesc:a646c71e97ef007bde8c101479c528da7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the GEMM K coordinate.  <a href="#a646c71e97ef007bde8c101479c528da7">More...</a><br /></td></tr>
+<tr class="separator:a646c71e97ef007bde8c101479c528da7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae12eb84ec47ddf01b4d459c7aabc22ad"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ae12eb84ec47ddf01b4d459c7aabc22ad">k</a> ()</td></tr>
+<tr class="memdesc:ae12eb84ec47ddf01b4d459c7aabc22ad"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns reference to the GEMM K coordinate.  <a href="#ae12eb84ec47ddf01b4d459c7aabc22ad">More...</a><br /></td></tr>
+<tr class="separator:ae12eb84ec47ddf01b4d459c7aabc22ad"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac441e93411ed6954a93ab36f0c747d26"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a> () const</td></tr>
+<tr class="memdesc:ac441e93411ed6954a93ab36f0c747d26"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the GEMM batch coordinate.  <a href="#ac441e93411ed6954a93ab36f0c747d26">More...</a><br /></td></tr>
+<tr class="separator:ac441e93411ed6954a93ab36f0c747d26"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adaf31768b8239f497c0ec9b40bad1cb5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#adaf31768b8239f497c0ec9b40bad1cb5">batch</a> ()</td></tr>
+<tr class="memdesc:adaf31768b8239f497c0ec9b40bad1cb5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns reference to the GEMM batch coordinate.  <a href="#adaf31768b8239f497c0ec9b40bad1cb5">More...</a><br /></td></tr>
+<tr class="separator:adaf31768b8239f497c0ec9b40bad1cb5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4062c040208868c75dbc6ba18910bffb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a4062c040208868c75dbc6ba18910bffb">knm</a> () const</td></tr>
+<tr class="memdesc:a4062c040208868c75dbc6ba18910bffb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Obtains a <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> from <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>.  <a href="#a4062c040208868c75dbc6ba18910bffb">More...</a><br /></td></tr>
+<tr class="separator:a4062c040208868c75dbc6ba18910bffb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac4550a7e80e1f0265eacecebe54794d9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac4550a7e80e1f0265eacecebe54794d9">nm</a> () const</td></tr>
+<tr class="memdesc:ac4550a7e80e1f0265eacecebe54794d9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Obtains a Coord&lt;2&gt; from <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>.  <a href="#ac4550a7e80e1f0265eacecebe54794d9">More...</a><br /></td></tr>
+<tr class="separator:ac4550a7e80e1f0265eacecebe54794d9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad6c884a5bb6e5edaf371e8af10df367d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad6c884a5bb6e5edaf371e8af10df367d">km</a> () const</td></tr>
+<tr class="memdesc:ad6c884a5bb6e5edaf371e8af10df367d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Obtains a Coord&lt;2&gt; from <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>.  <a href="#ad6c884a5bb6e5edaf371e8af10df367d">More...</a><br /></td></tr>
+<tr class="separator:ad6c884a5bb6e5edaf371e8af10df367d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a16501265d58ddaca0e2d9bb4e21d66ea"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a16501265d58ddaca0e2d9bb4e21d66ea">kn</a> () const</td></tr>
+<tr class="memdesc:a16501265d58ddaca0e2d9bb4e21d66ea"><td class="mdescLeft">&#160;</td><td class="mdescRight">Obtains a Coord&lt;2&gt; from <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>.  <a href="#a16501265d58ddaca0e2d9bb4e21d66ea">More...</a><br /></td></tr>
+<tr class="separator:a16501265d58ddaca0e2d9bb4e21d66ea"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a675efbb9ed360888faf3c333708ae4d5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a675efbb9ed360888faf3c333708ae4d5">operator+</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a675efbb9ed360888faf3c333708ae4d5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise addition.  <a href="#a675efbb9ed360888faf3c333708ae4d5">More...</a><br /></td></tr>
+<tr class="separator:a675efbb9ed360888faf3c333708ae4d5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a762fd45e61477d700c82bfd67443c6f9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a762fd45e61477d700c82bfd67443c6f9">operator-</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a762fd45e61477d700c82bfd67443c6f9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise subtraction.  <a href="#a762fd45e61477d700c82bfd67443c6f9">More...</a><br /></td></tr>
+<tr class="separator:a762fd45e61477d700c82bfd67443c6f9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5a158b5f3c0b1779972b25aa52be1164"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5a158b5f3c0b1779972b25aa52be1164">operator*</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a5a158b5f3c0b1779972b25aa52be1164"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise multiplication.  <a href="#a5a158b5f3c0b1779972b25aa52be1164">More...</a><br /></td></tr>
+<tr class="separator:a5a158b5f3c0b1779972b25aa52be1164"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a41770bb99f02f4debbafe95e019ce02b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a41770bb99f02f4debbafe95e019ce02b">operator/</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a41770bb99f02f4debbafe95e019ce02b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise division.  <a href="#a41770bb99f02f4debbafe95e019ce02b">More...</a><br /></td></tr>
+<tr class="separator:a41770bb99f02f4debbafe95e019ce02b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5465f7308778eac5d14d8020179a65e0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a5465f7308778eac5d14d8020179a65e0">operator+=</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:a5465f7308778eac5d14d8020179a65e0"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place addition.  <a href="#a5465f7308778eac5d14d8020179a65e0">More...</a><br /></td></tr>
+<tr class="separator:a5465f7308778eac5d14d8020179a65e0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a12ba250be3d5474b7c6fc4eddd4f58d5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a12ba250be3d5474b7c6fc4eddd4f58d5">operator-=</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:a12ba250be3d5474b7c6fc4eddd4f58d5"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place subtraction.  <a href="#a12ba250be3d5474b7c6fc4eddd4f58d5">More...</a><br /></td></tr>
+<tr class="separator:a12ba250be3d5474b7c6fc4eddd4f58d5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a69fb0bb5e73f35d3c8df71a0174d6520"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a69fb0bb5e73f35d3c8df71a0174d6520">operator*=</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:a69fb0bb5e73f35d3c8df71a0174d6520"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place multiplication.  <a href="#a69fb0bb5e73f35d3c8df71a0174d6520">More...</a><br /></td></tr>
+<tr class="separator:a69fb0bb5e73f35d3c8df71a0174d6520"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aac1e1bad751237fd76d32a1ea10f6c40"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#aac1e1bad751237fd76d32a1ea10f6c40">operator/=</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;b)</td></tr>
+<tr class="memdesc:aac1e1bad751237fd76d32a1ea10f6c40"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place division.  <a href="#aac1e1bad751237fd76d32a1ea10f6c40">More...</a><br /></td></tr>
+<tr class="separator:aac1e1bad751237fd76d32a1ea10f6c40"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td></tr>
+<tr class="memitem:a422aa7e2d2bf5dd3a60f65427bc0d7c0 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> value=0)</td></tr>
+<tr class="memdesc:a422aa7e2d2bf5dd3a60f65427bc0d7c0 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor initializes uniformly.  <a href="structcutlass_1_1Coord.html#a422aa7e2d2bf5dd3a60f65427bc0d7c0">More...</a><br /></td></tr>
+<tr class="separator:a422aa7e2d2bf5dd3a60f65427bc0d7c0 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a63ad1225ab2c51a68add731e994526b4 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> _idx[])</td></tr>
+<tr class="memdesc:a63ad1225ab2c51a68add731e994526b4 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of integers.  <a href="structcutlass_1_1Coord.html#a63ad1225ab2c51a68add731e994526b4">More...</a><br /></td></tr>
+<tr class="separator:a63ad1225ab2c51a68add731e994526b4 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6110e4cfd090561696a81a8a4068a573 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">Coord</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;coord)</td></tr>
+<tr class="memdesc:a6110e4cfd090561696a81a8a4068a573 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs from an array of integers.  <a href="structcutlass_1_1Coord.html#a6110e4cfd090561696a81a8a4068a573">More...</a><br /></td></tr>
+<tr class="separator:a6110e4cfd090561696a81a8a4068a573 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac8f7a9b0835efc34fd28894b2b45342c inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; Slice &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac8f7a9b0835efc34fd28894b2b45342c">slice</a> (int start=0, <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> identity=0) const</td></tr>
+<tr class="separator:ac8f7a9b0835efc34fd28894b2b45342c inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1781b3c5a2d653b0c1718ec3154ae48f inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">operator bool</a> () const</td></tr>
+<tr class="memdesc:a1781b3c5a2d653b0c1718ec3154ae48f inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if Coord is non-zero.  <a href="structcutlass_1_1Coord.html#a1781b3c5a2d653b0c1718ec3154ae48f">More...</a><br /></td></tr>
+<tr class="separator:a1781b3c5a2d653b0c1718ec3154ae48f inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a232095edae2f74c01a3c8abf68166e02 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">operator!</a> () const</td></tr>
+<tr class="memdesc:a232095edae2f74c01a3c8abf68166e02 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns true if Coord is uniformly zero.  <a href="structcutlass_1_1Coord.html#a232095edae2f74c01a3c8abf68166e02">More...</a><br /></td></tr>
+<tr class="separator:a232095edae2f74c01a3c8abf68166e02 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37672637771a70910df9aa1a0cffddc inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">operator+</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:ab37672637771a70910df9aa1a0cffddc inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise addition.  <a href="structcutlass_1_1Coord.html#ab37672637771a70910df9aa1a0cffddc">More...</a><br /></td></tr>
+<tr class="separator:ab37672637771a70910df9aa1a0cffddc inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6b876f61a85a4a4ef3763b6742bfaa6b inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">operator-</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a6b876f61a85a4a4ef3763b6742bfaa6b inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise subtraction.  <a href="structcutlass_1_1Coord.html#a6b876f61a85a4a4ef3763b6742bfaa6b">More...</a><br /></td></tr>
+<tr class="separator:a6b876f61a85a4a4ef3763b6742bfaa6b inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e94c093f82908ff3dba4f23b5d10033 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">operator*</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a2e94c093f82908ff3dba4f23b5d10033 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise multiplication.  <a href="structcutlass_1_1Coord.html#a2e94c093f82908ff3dba4f23b5d10033">More...</a><br /></td></tr>
+<tr class="separator:a2e94c093f82908ff3dba4f23b5d10033 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9bb07631f09efc80219413ac8309f568 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">operator/</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a9bb07631f09efc80219413ac8309f568 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Element-wise division.  <a href="structcutlass_1_1Coord.html#a9bb07631f09efc80219413ac8309f568">More...</a><br /></td></tr>
+<tr class="separator:a9bb07631f09efc80219413ac8309f568 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae4f2cb12b84411118cb93e7c4cb88b20 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ae4f2cb12b84411118cb93e7c4cb88b20 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place addition.  <a href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">More...</a><br /></td></tr>
+<tr class="separator:ae4f2cb12b84411118cb93e7c4cb88b20 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a304334cbcad636d7b058fdc6310f0e6b inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">operator-=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:a304334cbcad636d7b058fdc6310f0e6b inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place subtraction.  <a href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">More...</a><br /></td></tr>
+<tr class="separator:a304334cbcad636d7b058fdc6310f0e6b inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad4303b578b72b5cb2a0198375290e168 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">operator*=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ad4303b578b72b5cb2a0198375290e168 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place multiplication.  <a href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">More...</a><br /></td></tr>
+<tr class="separator:ad4303b578b72b5cb2a0198375290e168 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac87199c4c9a4e20aac4eb6e3b9a68f28 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">operator/=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b)</td></tr>
+<tr class="memdesc:ac87199c4c9a4e20aac4eb6e3b9a68f28 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">In-place division.  <a href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">More...</a><br /></td></tr>
+<tr class="separator:ac87199c4c9a4e20aac4eb6e3b9a68f28 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6e0967541a1d74edeb93897ea6069e24 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">operator[]</a> (int dim)</td></tr>
+<tr class="memdesc:a6e0967541a1d74edeb93897ea6069e24 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="structcutlass_1_1Coord.html#a6e0967541a1d74edeb93897ea6069e24">More...</a><br /></td></tr>
+<tr class="separator:a6e0967541a1d74edeb93897ea6069e24 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a882e7ac07bbd6983659ef2e574b46454 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">operator[]</a> (int dim) const</td></tr>
+<tr class="memdesc:a882e7ac07bbd6983659ef2e574b46454 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Member access operator.  <a href="structcutlass_1_1Coord.html#a882e7ac07bbd6983659ef2e574b46454">More...</a><br /></td></tr>
+<tr class="separator:a882e7ac07bbd6983659ef2e574b46454 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac8ec94703830ab2c62ee055533ea2184 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b, T sum) const</td></tr>
+<tr class="memdesc:ac8ec94703830ab2c62ee055533ea2184 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two Coord instances.  <a href="structcutlass_1_1Coord.html#ac8ec94703830ab2c62ee055533ea2184">More...</a><br /></td></tr>
+<tr class="separator:ac8ec94703830ab2c62ee055533ea2184 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0acc37908acb6b879c37f54ff7ffc93d inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> T&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">dot</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a> const &amp;b) const</td></tr>
+<tr class="memdesc:a0acc37908acb6b879c37f54ff7ffc93d inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the dot product of two Coord instances.  <a href="structcutlass_1_1Coord.html#a0acc37908acb6b879c37f54ff7ffc93d">More...</a><br /></td></tr>
+<tr class="separator:a0acc37908acb6b879c37f54ff7ffc93d inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9eff24a3b74b68d11839b92324613c93 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a> ()</td></tr>
+<tr class="memdesc:a9eff24a3b74b68d11839b92324613c93 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given Coord element.  <a href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">More...</a><br /></td></tr>
+<tr class="separator:a9eff24a3b74b68d11839b92324613c93 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa253bf69fc819876a7c7770305f1a694 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">at</a> (int dim)</td></tr>
+<tr class="memdesc:aa253bf69fc819876a7c7770305f1a694 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="structcutlass_1_1Coord.html#aa253bf69fc819876a7c7770305f1a694">More...</a><br /></td></tr>
+<tr class="separator:aa253bf69fc819876a7c7770305f1a694 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a177adcc2d0fb5e72ebcb523edd24e6fe inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">at</a> () const</td></tr>
+<tr class="memdesc:a177adcc2d0fb5e72ebcb523edd24e6fe inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gets the index of a given Coord element.  <a href="structcutlass_1_1Coord.html#a177adcc2d0fb5e72ebcb523edd24e6fe">More...</a><br /></td></tr>
+<tr class="separator:a177adcc2d0fb5e72ebcb523edd24e6fe inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b47b1521820c898b03868627c3f8e46 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a> const &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">at</a> (int dim) const</td></tr>
+<tr class="memdesc:a9b47b1521820c898b03868627c3f8e46 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Access via index; may limit unrolling potential.  <a href="structcutlass_1_1Coord.html#a9b47b1521820c898b03868627c3f8e46">More...</a><br /></td></tr>
+<tr class="separator:a9b47b1521820c898b03868627c3f8e46 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f919aeb2a895bc040599971400dec8d inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">operator==</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a7f919aeb2a895bc040599971400dec8d inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Determines if two Coord&lt;&gt; objects are equal.  <a href="structcutlass_1_1Coord.html#a7f919aeb2a895bc040599971400dec8d">More...</a><br /></td></tr>
+<tr class="separator:a7f919aeb2a895bc040599971400dec8d inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a353d847675e5ba2402c407dcd4ae4de3 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">operator!=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a353d847675e5ba2402c407dcd4ae4de3 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Not equal.  <a href="structcutlass_1_1Coord.html#a353d847675e5ba2402c407dcd4ae4de3">More...</a><br /></td></tr>
+<tr class="separator:a353d847675e5ba2402c407dcd4ae4de3 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a404a3b4e00f59cac71d41fb1bbba38ba inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;max, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;min=<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt;())</td></tr>
+<tr class="memdesc:a404a3b4e00f59cac71d41fb1bbba38ba inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clamps a coordinate to a range specified by maximum and minimum values.  <a href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">More...</a><br /></td></tr>
+<tr class="separator:a404a3b4e00f59cac71d41fb1bbba38ba inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac0ac5f2aa2cbea3887d126645025e017 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">count</a> () const</td></tr>
+<tr class="memdesc:ac0ac5f2aa2cbea3887d126645025e017 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the product of all elements.  <a href="structcutlass_1_1Coord.html#ac0ac5f2aa2cbea3887d126645025e017">More...</a><br /></td></tr>
+<tr class="separator:ac0ac5f2aa2cbea3887d126645025e017 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a148851df63840ac63e23b2f170bd1308 inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">operator&lt;</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a148851df63840ac63e23b2f170bd1308 inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Less than operator.  <a href="structcutlass_1_1Coord.html#a148851df63840ac63e23b2f170bd1308">More...</a><br /></td></tr>
+<tr class="separator:a148851df63840ac63e23b2f170bd1308 inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dc9f063be329d475f040afd449d304c inherit pub_methods_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">operator&lt;=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; <a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a> &gt; const &amp;b) const</td></tr>
+<tr class="memdesc:a9dc9f063be329d475f040afd449d304c inherit pub_methods_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Less than or equals operator.  <a href="structcutlass_1_1Coord.html#a9dc9f063be329d475f040afd449d304c">More...</a><br /></td></tr>
+<tr class="separator:a9dc9f063be329d475f040afd449d304c inherit pub_methods_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a521d4b8e720d2261c825e05397c92a5e"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a521d4b8e720d2261c825e05397c92a5e">kK</a> = 0</td></tr>
+<tr class="memdesc:a521d4b8e720d2261c825e05397c92a5e"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM K dimension - inner dimension of the GEMM problem.  <a href="#a521d4b8e720d2261c825e05397c92a5e">More...</a><br /></td></tr>
+<tr class="separator:a521d4b8e720d2261c825e05397c92a5e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a67f08a03dabee497fa5547cff0f1faea"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a67f08a03dabee497fa5547cff0f1faea">kN</a> = 1</td></tr>
+<tr class="memdesc:a67f08a03dabee497fa5547cff0f1faea"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM N dimension - columns of the output C matrix.  <a href="#a67f08a03dabee497fa5547cff0f1faea">More...</a><br /></td></tr>
+<tr class="separator:a67f08a03dabee497fa5547cff0f1faea"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af1f5c03c35eaa406c6a63082da26bec3"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#af1f5c03c35eaa406c6a63082da26bec3">kM</a> = 2</td></tr>
+<tr class="memdesc:af1f5c03c35eaa406c6a63082da26bec3"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM M dimension - rows of the output C matrix.  <a href="#af1f5c03c35eaa406c6a63082da26bec3">More...</a><br /></td></tr>
+<tr class="separator:af1f5c03c35eaa406c6a63082da26bec3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad7b490ce2150e54fccad6b0f11932382"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#ad7b490ce2150e54fccad6b0f11932382">kBatch</a> = 3</td></tr>
+<tr class="memdesc:ad7b490ce2150e54fccad6b0f11932382"><td class="mdescLeft">&#160;</td><td class="mdescRight">Batch dimension - for generalizing to larger problems.  <a href="#ad7b490ce2150e54fccad6b0f11932382">More...</a><br /></td></tr>
+<tr class="separator:ad7b490ce2150e54fccad6b0f11932382"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td></tr>
+<tr class="memitem:a23e1b9a7f5fa8fd4afeadfb85de7c5c3 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a></td></tr>
+<tr class="memdesc:a23e1b9a7f5fa8fd4afeadfb85de7c5c3 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of elements in Coord.  <a href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">More...</a><br /></td></tr>
+<tr class="separator:a23e1b9a7f5fa8fd4afeadfb85de7c5c3 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acfd416eafec51e47b42b8b713ba76030 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">N</a></td></tr>
+<tr class="memdesc:acfd416eafec51e47b42b8b713ba76030 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Number of elements in Coord, aliased for compatibility.  <a href="structcutlass_1_1Coord.html#acfd416eafec51e47b42b8b713ba76030">More...</a><br /></td></tr>
+<tr class="separator:acfd416eafec51e47b42b8b713ba76030 inherit pub_static_attribs_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1Coord"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1Coord')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4, int &gt;</a></td></tr>
+<tr class="memitem:a872e1e0d9cc255fa438c04daaf10ad68 inherit pub_attribs_structcutlass_1_1Coord"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html#a7c73966e94b4f45854f16e33683bc02c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">idx</a> [<a class="el" href="structcutlass_1_1Coord.html#a23e1b9a7f5fa8fd4afeadfb85de7c5c3">kRank</a>]</td></tr>
+<tr class="memdesc:a872e1e0d9cc255fa438c04daaf10ad68 inherit pub_attribs_structcutlass_1_1Coord"><td class="mdescLeft">&#160;</td><td class="mdescRight">Indices.  <a href="structcutlass_1_1Coord.html#a872e1e0d9cc255fa438c04daaf10ad68">More...</a><br /></td></tr>
+<tr class="separator:a872e1e0d9cc255fa438c04daaf10ad68 inherit pub_attribs_structcutlass_1_1Coord"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><p><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> is a structure derived from <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> that specifies a location within the coordinate space of a GEMM problem. </p>
+</div><h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a790f6552ad26964fa808b51f4aba433b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a790f6552ad26964fa808b51f4aba433b">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;4, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">cutlass::gemm::GemmCoord::Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8e3f0250e2265503862354c729dca892"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8e3f0250e2265503862354c729dca892">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef int <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">cutlass::gemm::GemmCoord::Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="abaa87475d518a2e5cdf44c62122b9e01"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abaa87475d518a2e5cdf44c62122b9e01">&#9670;&nbsp;</a></span>GemmCoord() <span class="overload">[1/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::gemm::GemmCoord::GemmCoord </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a03e6bfa95156962be51e190d381c8b5e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a03e6bfa95156962be51e190d381c8b5e">&#9670;&nbsp;</a></span>GemmCoord() <span class="overload">[2/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::gemm::GemmCoord::GemmCoord </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&#160;</td>
+          <td class="paramname"><em>_batch</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a65d1ca12c0f27984920cf1700322a746"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a65d1ca12c0f27984920cf1700322a746">&#9670;&nbsp;</a></span>GemmCoord() <span class="overload">[3/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::gemm::GemmCoord::GemmCoord </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4, <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a17da9936dbad99f2402c42b1bd6ea5ea"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a17da9936dbad99f2402c42b1bd6ea5ea">&#9670;&nbsp;</a></span>GemmCoord() <span class="overload">[4/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::gemm::GemmCoord::GemmCoord </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&#160;</td>
+          <td class="paramname"><em>coord</em>[4]</td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac3b1cbdf86bd36d6b4b5e295ef846dfe"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac3b1cbdf86bd36d6b4b5e295ef846dfe">&#9670;&nbsp;</a></span>GemmCoord() <span class="overload">[5/5]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::gemm::GemmCoord::GemmCoord </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&#160;</td>
+          <td class="paramname"><em>k</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&#160;</td>
+          <td class="paramname"><em>n</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&#160;</td>
+          <td class="paramname"><em>m</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&#160;</td>
+          <td class="paramname"><em>batch</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ac441e93411ed6954a93ab36f0c747d26"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac441e93411ed6954a93ab36f0c747d26">&#9670;&nbsp;</a></span>batch() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> const&amp; cutlass::gemm::GemmCoord::batch </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="adaf31768b8239f497c0ec9b40bad1cb5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adaf31768b8239f497c0ec9b40bad1cb5">&#9670;&nbsp;</a></span>batch() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&amp; cutlass::gemm::GemmCoord::batch </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a646c71e97ef007bde8c101479c528da7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a646c71e97ef007bde8c101479c528da7">&#9670;&nbsp;</a></span>k() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> const&amp; cutlass::gemm::GemmCoord::k </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae12eb84ec47ddf01b4d459c7aabc22ad"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae12eb84ec47ddf01b4d459c7aabc22ad">&#9670;&nbsp;</a></span>k() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&amp; cutlass::gemm::GemmCoord::k </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad6c884a5bb6e5edaf371e8af10df367d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad6c884a5bb6e5edaf371e8af10df367d">&#9670;&nbsp;</a></span>km()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;2&gt; cutlass::gemm::GemmCoord::km </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a16501265d58ddaca0e2d9bb4e21d66ea"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a16501265d58ddaca0e2d9bb4e21d66ea">&#9670;&nbsp;</a></span>kn()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;2&gt; cutlass::gemm::GemmCoord::kn </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4062c040208868c75dbc6ba18910bffb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4062c040208868c75dbc6ba18910bffb">&#9670;&nbsp;</a></span>knm()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; cutlass::gemm::GemmCoord::knm </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9167769a2b915eb92fb4ca37b9212793"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9167769a2b915eb92fb4ca37b9212793">&#9670;&nbsp;</a></span>m() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> const&amp; cutlass::gemm::GemmCoord::m </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8199f5e336a20c31e54d68b11e9fa3d3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8199f5e336a20c31e54d68b11e9fa3d3">&#9670;&nbsp;</a></span>m() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&amp; cutlass::gemm::GemmCoord::m </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7c582518db6860e19286361b162c4fcd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7c582518db6860e19286361b162c4fcd">&#9670;&nbsp;</a></span>n() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a> const&amp; cutlass::gemm::GemmCoord::n </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1327b9b4b9379df24df3d4b716952d11"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1327b9b4b9379df24df3d4b716952d11">&#9670;&nbsp;</a></span>n() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a8e3f0250e2265503862354c729dca892">Index</a>&amp; cutlass::gemm::GemmCoord::n </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac4550a7e80e1f0265eacecebe54794d9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac4550a7e80e1f0265eacecebe54794d9">&#9670;&nbsp;</a></span>nm()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;2&gt; cutlass::gemm::GemmCoord::nm </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5a158b5f3c0b1779972b25aa52be1164"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5a158b5f3c0b1779972b25aa52be1164">&#9670;&nbsp;</a></span>operator*()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> cutlass::gemm::GemmCoord::operator* </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a69fb0bb5e73f35d3c8df71a0174d6520"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a69fb0bb5e73f35d3c8df71a0174d6520">&#9670;&nbsp;</a></span>operator*=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&amp; cutlass::gemm::GemmCoord::operator*= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a675efbb9ed360888faf3c333708ae4d5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a675efbb9ed360888faf3c333708ae4d5">&#9670;&nbsp;</a></span>operator+()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> cutlass::gemm::GemmCoord::operator+ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5465f7308778eac5d14d8020179a65e0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5465f7308778eac5d14d8020179a65e0">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&amp; cutlass::gemm::GemmCoord::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a762fd45e61477d700c82bfd67443c6f9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a762fd45e61477d700c82bfd67443c6f9">&#9670;&nbsp;</a></span>operator-()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> cutlass::gemm::GemmCoord::operator- </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a12ba250be3d5474b7c6fc4eddd4f58d5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a12ba250be3d5474b7c6fc4eddd4f58d5">&#9670;&nbsp;</a></span>operator-=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&amp; cutlass::gemm::GemmCoord::operator-= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a41770bb99f02f4debbafe95e019ce02b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a41770bb99f02f4debbafe95e019ce02b">&#9670;&nbsp;</a></span>operator/()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> cutlass::gemm::GemmCoord::operator/ </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aac1e1bad751237fd76d32a1ea10f6c40"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aac1e1bad751237fd76d32a1ea10f6c40">&#9670;&nbsp;</a></span>operator/=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&amp; cutlass::gemm::GemmCoord::operator/= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html#a790f6552ad26964fa808b51f4aba433b">Base</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="ad7b490ce2150e54fccad6b0f11932382"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad7b490ce2150e54fccad6b0f11932382">&#9670;&nbsp;</a></span>kBatch</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::gemm::GemmCoord::kBatch = 3</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a521d4b8e720d2261c825e05397c92a5e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a521d4b8e720d2261c825e05397c92a5e">&#9670;&nbsp;</a></span>kK</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::gemm::GemmCoord::kK = 0</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af1f5c03c35eaa406c6a63082da26bec3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af1f5c03c35eaa406c6a63082da26bec3">&#9670;&nbsp;</a></span>kM</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::gemm::GemmCoord::kM = 2</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a67f08a03dabee497fa5547cff0f1faea"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a67f08a03dabee497fa5547cff0f1faea">&#9670;&nbsp;</a></span>kN</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const cutlass::gemm::GemmCoord::kN = 1</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm__coord_8h_source.html">gemm_coord.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmCoord.png b/docs/structcutlass_1_1gemm_1_1GemmCoord.png
new file mode 100644
index 0000000000000000000000000000000000000000..225d8b64e15aabc20e9c032dd77e8280713d9266
GIT binary patch
literal 691
zcmeAS@N?(olHy`uVBq!ia0vp^OMp0lgBeIJ$k3|+QW60^A+G=b{|7QZe0{O(Q0W99
z3ycpOI1sV1A`HmoC<*clW&kPzfvcxNj2IZ0oIG6|Ln;{G&b_^DwE~Z;`f0;o|L5;{
zJ+)!M-X+zyi!U8q#bG#;Wzl+`!v-<2Jd;XtS(m6(YAC3lbWWd;nKkK3;I98FE7$%F
zF`Sgo*Sv?@()XKgnekpxTW-tcY1eMdui9MvJAQf6+~^I*ubw?WO{Y}txWw(`Nmnk&
z6)B#Xe$3bKVnr6;9$j@|69sQ~-y3Erf~NdBiqX46oTEfL@278)%1f~0*g3_$e)sMP
zX3wmuIBp)O;W4USKj~+T+VQ1gEcvNM^H;o^xn|XF-ksKym(Q&E;4{nXoanBQoj2cI
z{Wxp(u3hH*lXA50MY4U``D)q{|JOf$D|oj4WBKHHtp4$BUC;V;4O3M3L4JC{XUTK8
zppenxHCsVxE%TGN-&m*IXQ)iyWA`-N!L5|}hlT>9jmQKBIW7+depZ!+b|#?%&WxN7
z7B;Ya2ykGkK$iZyeuC!GlG2F`>()YLS1?z~e`%PnCA?sDa(C*h#S<oXJKL*^S)Zu%
z+<Yzk@+P0(`=w_8Tp3@|CBR;`^=R2l9y7DcH$R!jOPO;P8GnAf>XhG3ard&dFIImx
z)n!ddoXh@f-rXtZx}tK*3@4PW<;^VN+9~t;Zdv}yNJ*g^X|ZxQD;?5yYt1~CZtQ8A
za{is@iAP(uZr5zLzMogU$HU}S*xlR{cW0VRoui$-vS{<&+m;%uX1grTJzxIzQ}w2G
z?_?gY)jy|Sw=%9-=YAoB{MGK6Hh=Fh?s)n2E!z)OnCHt+ObObxqmCh8U0ICL<o{h@
P3S;ne^>bP0l+XkK6Wua*

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1GemmDesc-members.html b/docs/structcutlass_1_1gemm_1_1GemmDesc-members.html
index 5c3b045aa..28c238453 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmDesc-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmDesc-members.html
@@ -73,29 +73,41 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a053c2b529be527f510ee317737fbf7e8">alpha</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332">beta</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447">d_a</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b">d_b</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5">d_c</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216">d_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ac789a7e5d2db65d006f1e8e3df542a6f">k</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789">lda</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe">ldb</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db">ldc</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9">ldd</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a5c2b3e75cb6873762ba3f85487b78579">m</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a">n</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">A</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">alpha</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">AType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">B</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">batch_stride_A</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">batch_stride_B</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">batch_stride_C</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">batch_stride_D</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">beta</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">BType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">C</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">CType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">D</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">DType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ae2708b731cbb99d3e638382ecf599425">GemmDesc</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a948af4a974f1aa74d3b6da9cd3e185de">GemmDesc</a>(Coord&lt; 3 &gt; _problem_size, SType _alpha, TensorRefA const &amp;_A, TensorRefB const &amp;_B, SType _beta, TensorRefC const &amp;_C, TensorRefD const &amp;_D)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7292ac0196f22525b13f223a02271bc3">GemmDesc</a>(GemmCoord _problem_size, SType _alpha, TensorRefA const &amp;_A, TensorRefB const &amp;_B, SType _beta, TensorRefC const &amp;_C, TensorRefD const &amp;_D)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#af96cd9c8f2454ea118dfa7358dd24824">GemmDesc</a>(GemmCoord _problem_size, SType _alpha, TensorRefA const &amp;_A, long long _batch_stride_A, TensorRefB const &amp;_B, long long _batch_stride_B, SType _beta, TensorRefC const &amp;_C, long long _batch_stride_C, TensorRefD const &amp;_D, long long _batch_stride_D)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">problem_size</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmDesc.html b/docs/structcutlass_1_1gemm_1_1GemmDesc.html
index 9f4c8fd0b..e527a78df 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmDesc.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmDesc.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -73,257 +73,692 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
 <a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="structcutlass_1_1gemm_1_1GemmDesc-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmDesc&lt; Scalar_, Index_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::GemmDesc&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p><code>#include &lt;<a class="el" href="gemm_8h_source.html">gemm.h</a>&gt;</code></p>
+<p>GEMM problem description.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="gemm__desc_8h_source.html">gemm_desc.h</a>&gt;</code></p>
 <table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:abd12fea9779ada02c0f2266909602171"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171">Index</a></td></tr>
+<tr class="memdesc:abd12fea9779ada02c0f2266909602171"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type for dimensions and strides.  <a href="#abd12fea9779ada02c0f2266909602171">More...</a><br /></td></tr>
+<tr class="separator:abd12fea9779ada02c0f2266909602171"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a22642bd88ccb24fec3df87230537c037"><td class="memItemLeft" align="right" valign="top">typedef AType_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">AType</a></td></tr>
+<tr class="memdesc:a22642bd88ccb24fec3df87230537c037"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source accumulator matrix type.  <a href="#a22642bd88ccb24fec3df87230537c037">More...</a><br /></td></tr>
+<tr class="separator:a22642bd88ccb24fec3df87230537c037"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea3a523662dc801bf9abf205a8e400fe"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">AType</a> const, 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a></td></tr>
+<tr class="memdesc:aea3a523662dc801bf9abf205a8e400fe"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to A operand.  <a href="#aea3a523662dc801bf9abf205a8e400fe">More...</a><br /></td></tr>
+<tr class="separator:aea3a523662dc801bf9abf205a8e400fe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a23317c22122ea2721a7a3e0c12e07a49"><td class="memItemLeft" align="right" valign="top">typedef BType_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">BType</a></td></tr>
+<tr class="memdesc:a23317c22122ea2721a7a3e0c12e07a49"><td class="mdescLeft">&#160;</td><td class="mdescRight">Destination accumulator type.  <a href="#a23317c22122ea2721a7a3e0c12e07a49">More...</a><br /></td></tr>
+<tr class="separator:a23317c22122ea2721a7a3e0c12e07a49"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7de7de97d237d9dcc0d89de7b04342ab"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">BType</a> const, 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a></td></tr>
+<tr class="memdesc:a7de7de97d237d9dcc0d89de7b04342ab"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to B operand.  <a href="#a7de7de97d237d9dcc0d89de7b04342ab">More...</a><br /></td></tr>
+<tr class="separator:a7de7de97d237d9dcc0d89de7b04342ab"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa46907b69a3b1d0db5c3db1709867704"><td class="memItemLeft" align="right" valign="top">typedef CType_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">CType</a></td></tr>
+<tr class="memdesc:aa46907b69a3b1d0db5c3db1709867704"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source accumulator matrix type.  <a href="#aa46907b69a3b1d0db5c3db1709867704">More...</a><br /></td></tr>
+<tr class="separator:aa46907b69a3b1d0db5c3db1709867704"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a51f77118d545308068b0dc287abf4e8b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">CType</a> const, 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a></td></tr>
+<tr class="memdesc:a51f77118d545308068b0dc287abf4e8b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to C operand.  <a href="#a51f77118d545308068b0dc287abf4e8b">More...</a><br /></td></tr>
+<tr class="separator:a51f77118d545308068b0dc287abf4e8b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a837a1c513f71ddb2729f8d2e6320b8cd"><td class="memItemLeft" align="right" valign="top">typedef DType_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">DType</a></td></tr>
+<tr class="memdesc:a837a1c513f71ddb2729f8d2e6320b8cd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Destination accumulator type.  <a href="#a837a1c513f71ddb2729f8d2e6320b8cd">More...</a><br /></td></tr>
+<tr class="separator:a837a1c513f71ddb2729f8d2e6320b8cd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1f59ad60a529aa1db6e66ade3cb65052"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">DType</a>, 2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a></td></tr>
+<tr class="memdesc:a1f59ad60a529aa1db6e66ade3cb65052"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to D operand.  <a href="#a1f59ad60a529aa1db6e66ade3cb65052">More...</a><br /></td></tr>
+<tr class="separator:a1f59ad60a529aa1db6e66ade3cb65052"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a258e8c008db365b88654f46df3017ec2"><td class="memItemLeft" align="right" valign="top">typedef SType_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a></td></tr>
+<tr class="memdesc:a258e8c008db365b88654f46df3017ec2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar type for alpha and beta.  <a href="#a258e8c008db365b88654f46df3017ec2">More...</a><br /></td></tr>
+<tr class="separator:a258e8c008db365b88654f46df3017ec2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:ae2708b731cbb99d3e638382ecf599425"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ae2708b731cbb99d3e638382ecf599425">GemmDesc</a> ()</td></tr>
+<tr class="memdesc:ae2708b731cbb99d3e638382ecf599425"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default ctor.  <a href="#ae2708b731cbb99d3e638382ecf599425">More...</a><br /></td></tr>
+<tr class="separator:ae2708b731cbb99d3e638382ecf599425"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a948af4a974f1aa74d3b6da9cd3e185de"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a948af4a974f1aa74d3b6da9cd3e185de">GemmDesc</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; _problem_size, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _alpha, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a> const &amp;_A, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a> const &amp;_B, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _beta, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a> const &amp;_C, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a> const &amp;_D)</td></tr>
+<tr class="memdesc:a948af4a974f1aa74d3b6da9cd3e185de"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor for basic GEMM with batch count = 1.  <a href="#a948af4a974f1aa74d3b6da9cd3e185de">More...</a><br /></td></tr>
+<tr class="separator:a948af4a974f1aa74d3b6da9cd3e185de"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7292ac0196f22525b13f223a02271bc3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7292ac0196f22525b13f223a02271bc3">GemmDesc</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> _problem_size, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _alpha, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a> const &amp;_A, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a> const &amp;_B, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _beta, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a> const &amp;_C, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a> const &amp;_D)</td></tr>
+<tr class="memdesc:a7292ac0196f22525b13f223a02271bc3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor for basic GEMM with batch count = 1.  <a href="#a7292ac0196f22525b13f223a02271bc3">More...</a><br /></td></tr>
+<tr class="separator:a7292ac0196f22525b13f223a02271bc3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af96cd9c8f2454ea118dfa7358dd24824"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#af96cd9c8f2454ea118dfa7358dd24824">GemmDesc</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> _problem_size, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _alpha, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a> const &amp;_A, long long _batch_stride_A, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a> const &amp;_B, long long _batch_stride_B, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> _beta, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a> const &amp;_C, long long _batch_stride_C, <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a> const &amp;_D, long long _batch_stride_D)</td></tr>
+<tr class="memdesc:af96cd9c8f2454ea118dfa7358dd24824"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor for strided batch GEMM GEMM.  <a href="#af96cd9c8f2454ea118dfa7358dd24824">More...</a><br /></td></tr>
+<tr class="separator:af96cd9c8f2454ea118dfa7358dd24824"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:a5c2b3e75cb6873762ba3f85487b78579"><td class="memItemLeft" align="right" valign="top">Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a5c2b3e75cb6873762ba3f85487b78579">m</a></td></tr>
-<tr class="memdesc:a5c2b3e75cb6873762ba3f85487b78579"><td class="mdescLeft">&#160;</td><td class="mdescRight">The dimensions of the GEMM.  <a href="#a5c2b3e75cb6873762ba3f85487b78579">More...</a><br /></td></tr>
-<tr class="separator:a5c2b3e75cb6873762ba3f85487b78579"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:acee9727aa6cb612a25cd6ced4829061a"><td class="memItemLeft" align="right" valign="top">Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#acee9727aa6cb612a25cd6ced4829061a">n</a></td></tr>
-<tr class="separator:acee9727aa6cb612a25cd6ced4829061a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac789a7e5d2db65d006f1e8e3df542a6f"><td class="memItemLeft" align="right" valign="top">Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ac789a7e5d2db65d006f1e8e3df542a6f">k</a></td></tr>
-<tr class="separator:ac789a7e5d2db65d006f1e8e3df542a6f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a053c2b529be527f510ee317737fbf7e8"><td class="memItemLeft" align="right" valign="top">Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a053c2b529be527f510ee317737fbf7e8">alpha</a></td></tr>
-<tr class="memdesc:a053c2b529be527f510ee317737fbf7e8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The alpha/beta scaling values.  <a href="#a053c2b529be527f510ee317737fbf7e8">More...</a><br /></td></tr>
-<tr class="separator:a053c2b529be527f510ee317737fbf7e8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab91b702a9932144b388fad3159130332"><td class="memItemLeft" align="right" valign="top">Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab91b702a9932144b388fad3159130332">beta</a></td></tr>
-<tr class="separator:ab91b702a9932144b388fad3159130332"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aae63781de41962f496da469684919447"><td class="memItemLeft" align="right" valign="top">void const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aae63781de41962f496da469684919447">d_a</a></td></tr>
-<tr class="memdesc:aae63781de41962f496da469684919447"><td class="mdescLeft">&#160;</td><td class="mdescRight">The source matrix A.  <a href="#aae63781de41962f496da469684919447">More...</a><br /></td></tr>
-<tr class="separator:aae63781de41962f496da469684919447"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a62ad30ba419ccb661e6700da98221789"><td class="memItemLeft" align="right" valign="top">Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a62ad30ba419ccb661e6700da98221789">lda</a></td></tr>
-<tr class="memdesc:a62ad30ba419ccb661e6700da98221789"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stride for A.  <a href="#a62ad30ba419ccb661e6700da98221789">More...</a><br /></td></tr>
-<tr class="separator:a62ad30ba419ccb661e6700da98221789"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a05915032eba39bc9b085bec5ff17257b"><td class="memItemLeft" align="right" valign="top">void const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a05915032eba39bc9b085bec5ff17257b">d_b</a></td></tr>
-<tr class="memdesc:a05915032eba39bc9b085bec5ff17257b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The source matrix B.  <a href="#a05915032eba39bc9b085bec5ff17257b">More...</a><br /></td></tr>
-<tr class="separator:a05915032eba39bc9b085bec5ff17257b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7591ce0223b0d05c4d6fca6c67b98bfe"><td class="memItemLeft" align="right" valign="top">Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7591ce0223b0d05c4d6fca6c67b98bfe">ldb</a></td></tr>
-<tr class="memdesc:a7591ce0223b0d05c4d6fca6c67b98bfe"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stride for B.  <a href="#a7591ce0223b0d05c4d6fca6c67b98bfe">More...</a><br /></td></tr>
-<tr class="separator:a7591ce0223b0d05c4d6fca6c67b98bfe"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa2b3126c082d04fd31521cb0e84cf4d5"><td class="memItemLeft" align="right" valign="top">void const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa2b3126c082d04fd31521cb0e84cf4d5">d_c</a></td></tr>
-<tr class="memdesc:aa2b3126c082d04fd31521cb0e84cf4d5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The source matrix C.  <a href="#aa2b3126c082d04fd31521cb0e84cf4d5">More...</a><br /></td></tr>
-<tr class="separator:aa2b3126c082d04fd31521cb0e84cf4d5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0f492560cabc45cd492da65b819d09db"><td class="memItemLeft" align="right" valign="top">Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a0f492560cabc45cd492da65b819d09db">ldc</a></td></tr>
-<tr class="memdesc:a0f492560cabc45cd492da65b819d09db"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stride for C.  <a href="#a0f492560cabc45cd492da65b819d09db">More...</a><br /></td></tr>
-<tr class="separator:a0f492560cabc45cd492da65b819d09db"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a30326e2d81c8e154d749f35837903216"><td class="memItemLeft" align="right" valign="top">void *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a30326e2d81c8e154d749f35837903216">d_d</a></td></tr>
-<tr class="memdesc:a30326e2d81c8e154d749f35837903216"><td class="mdescLeft">&#160;</td><td class="mdescRight">The destination matrix D.  <a href="#a30326e2d81c8e154d749f35837903216">More...</a><br /></td></tr>
-<tr class="separator:a30326e2d81c8e154d749f35837903216"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3280e5c5484f5c10d1412bcb70eb77e9"><td class="memItemLeft" align="right" valign="top">Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a3280e5c5484f5c10d1412bcb70eb77e9">ldd</a></td></tr>
-<tr class="memdesc:a3280e5c5484f5c10d1412bcb70eb77e9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stride for D.  <a href="#a3280e5c5484f5c10d1412bcb70eb77e9">More...</a><br /></td></tr>
-<tr class="separator:a3280e5c5484f5c10d1412bcb70eb77e9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a52a5538b1b5208090417cf98d8735e3f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a52a5538b1b5208090417cf98d8735e3f">problem_size</a></td></tr>
+<tr class="memdesc:a52a5538b1b5208090417cf98d8735e3f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The dimensions of the GEMM.  <a href="#a52a5538b1b5208090417cf98d8735e3f">More...</a><br /></td></tr>
+<tr class="separator:a52a5538b1b5208090417cf98d8735e3f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa82600c82e17ea1233f2f74be4aa3785"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa82600c82e17ea1233f2f74be4aa3785">alpha</a></td></tr>
+<tr class="memdesc:aa82600c82e17ea1233f2f74be4aa3785"><td class="mdescLeft">&#160;</td><td class="mdescRight">The alpha scaling values.  <a href="#aa82600c82e17ea1233f2f74be4aa3785">More...</a><br /></td></tr>
+<tr class="separator:aa82600c82e17ea1233f2f74be4aa3785"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a80b0aae6e67b733ae5bf289d979a7c9b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a80b0aae6e67b733ae5bf289d979a7c9b">A</a></td></tr>
+<tr class="memdesc:a80b0aae6e67b733ae5bf289d979a7c9b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The source matrix A.  <a href="#a80b0aae6e67b733ae5bf289d979a7c9b">More...</a><br /></td></tr>
+<tr class="separator:a80b0aae6e67b733ae5bf289d979a7c9b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8b5a86d14eba0d3c5173753212d62599"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a8b5a86d14eba0d3c5173753212d62599">batch_stride_A</a></td></tr>
+<tr class="memdesc:a8b5a86d14eba0d3c5173753212d62599"><td class="mdescLeft">&#160;</td><td class="mdescRight">batch stride for A operand  <a href="#a8b5a86d14eba0d3c5173753212d62599">More...</a><br /></td></tr>
+<tr class="separator:a8b5a86d14eba0d3c5173753212d62599"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af0ac89b161f9cad96307f1ff3c80a774"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#af0ac89b161f9cad96307f1ff3c80a774">B</a></td></tr>
+<tr class="memdesc:af0ac89b161f9cad96307f1ff3c80a774"><td class="mdescLeft">&#160;</td><td class="mdescRight">The source matrix B.  <a href="#af0ac89b161f9cad96307f1ff3c80a774">More...</a><br /></td></tr>
+<tr class="separator:af0ac89b161f9cad96307f1ff3c80a774"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a95e3fe05e4ca0d4019cbef2b1a54419a"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a95e3fe05e4ca0d4019cbef2b1a54419a">batch_stride_B</a></td></tr>
+<tr class="memdesc:a95e3fe05e4ca0d4019cbef2b1a54419a"><td class="mdescLeft">&#160;</td><td class="mdescRight">batch stride for B operand  <a href="#a95e3fe05e4ca0d4019cbef2b1a54419a">More...</a><br /></td></tr>
+<tr class="separator:a95e3fe05e4ca0d4019cbef2b1a54419a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adac41a0baad9e65aa4a6fe12d249a02b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#adac41a0baad9e65aa4a6fe12d249a02b">beta</a></td></tr>
+<tr class="memdesc:adac41a0baad9e65aa4a6fe12d249a02b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The beta scaling values.  <a href="#adac41a0baad9e65aa4a6fe12d249a02b">More...</a><br /></td></tr>
+<tr class="separator:adac41a0baad9e65aa4a6fe12d249a02b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab384a226ab370fa5e25468fb99c63e30"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#ab384a226ab370fa5e25468fb99c63e30">C</a></td></tr>
+<tr class="memdesc:ab384a226ab370fa5e25468fb99c63e30"><td class="mdescLeft">&#160;</td><td class="mdescRight">The source matrix C.  <a href="#ab384a226ab370fa5e25468fb99c63e30">More...</a><br /></td></tr>
+<tr class="separator:ab384a226ab370fa5e25468fb99c63e30"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aad3590dffa2e1ba82c834efae6b35ad2"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aad3590dffa2e1ba82c834efae6b35ad2">batch_stride_C</a></td></tr>
+<tr class="memdesc:aad3590dffa2e1ba82c834efae6b35ad2"><td class="mdescLeft">&#160;</td><td class="mdescRight">batch stride for C operand  <a href="#aad3590dffa2e1ba82c834efae6b35ad2">More...</a><br /></td></tr>
+<tr class="separator:aad3590dffa2e1ba82c834efae6b35ad2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adf95451422c529587d55aac0fecf0d9f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#adf95451422c529587d55aac0fecf0d9f">D</a></td></tr>
+<tr class="memdesc:adf95451422c529587d55aac0fecf0d9f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The destination matrix D.  <a href="#adf95451422c529587d55aac0fecf0d9f">More...</a><br /></td></tr>
+<tr class="separator:adf95451422c529587d55aac0fecf0d9f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7b9afcc7e3105da1d002b1baa68d83de"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7b9afcc7e3105da1d002b1baa68d83de">batch_stride_D</a></td></tr>
+<tr class="memdesc:a7b9afcc7e3105da1d002b1baa68d83de"><td class="mdescLeft">&#160;</td><td class="mdescRight">batch stride for D operand  <a href="#a7b9afcc7e3105da1d002b1baa68d83de">More...</a><br /></td></tr>
+<tr class="separator:a7b9afcc7e3105da1d002b1baa68d83de"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a22642bd88ccb24fec3df87230537c037"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a22642bd88ccb24fec3df87230537c037">&#9670;&nbsp;</a></span>AType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef AType_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">AType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a23317c22122ea2721a7a3e0c12e07a49"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a23317c22122ea2721a7a3e0c12e07a49">&#9670;&nbsp;</a></span>BType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef BType_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">BType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa46907b69a3b1d0db5c3db1709867704"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa46907b69a3b1d0db5c3db1709867704">&#9670;&nbsp;</a></span>CType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef CType_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">CType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a837a1c513f71ddb2729f8d2e6320b8cd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a837a1c513f71ddb2729f8d2e6320b8cd">&#9670;&nbsp;</a></span>DType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef DType_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">DType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="abd12fea9779ada02c0f2266909602171"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abd12fea9779ada02c0f2266909602171">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#abd12fea9779ada02c0f2266909602171">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a258e8c008db365b88654f46df3017ec2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a258e8c008db365b88654f46df3017ec2">&#9670;&nbsp;</a></span>SType</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef SType_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aea3a523662dc801bf9abf205a8e400fe"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea3a523662dc801bf9abf205a8e400fe">&#9670;&nbsp;</a></span>TensorRefA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a22642bd88ccb24fec3df87230537c037">AType</a> const, 2&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7de7de97d237d9dcc0d89de7b04342ab"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7de7de97d237d9dcc0d89de7b04342ab">&#9670;&nbsp;</a></span>TensorRefB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a23317c22122ea2721a7a3e0c12e07a49">BType</a> const, 2&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a51f77118d545308068b0dc287abf4e8b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a51f77118d545308068b0dc287abf4e8b">&#9670;&nbsp;</a></span>TensorRefC</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aa46907b69a3b1d0db5c3db1709867704">CType</a> const, 2&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1f59ad60a529aa1db6e66ade3cb65052"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1f59ad60a529aa1db6e66ade3cb65052">&#9670;&nbsp;</a></span>TensorRefD</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a837a1c513f71ddb2729f8d2e6320b8cd">DType</a>, 2&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ae2708b731cbb99d3e638382ecf599425"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae2708b731cbb99d3e638382ecf599425">&#9670;&nbsp;</a></span>GemmDesc() <span class="overload">[1/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a948af4a974f1aa74d3b6da9cd3e185de"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a948af4a974f1aa74d3b6da9cd3e185de">&#9670;&nbsp;</a></span>GemmDesc() <span class="overload">[2/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td>
+          <td class="paramname"><em>_problem_size</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a>&#160;</td>
+          <td class="paramname"><em>_alpha</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_A</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_B</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a>&#160;</td>
+          <td class="paramname"><em>_beta</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_C</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_D</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7292ac0196f22525b13f223a02271bc3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7292ac0196f22525b13f223a02271bc3">&#9670;&nbsp;</a></span>GemmDesc() <span class="overload">[3/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&#160;</td>
+          <td class="paramname"><em>_problem_size</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a>&#160;</td>
+          <td class="paramname"><em>_alpha</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_A</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_B</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a>&#160;</td>
+          <td class="paramname"><em>_beta</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_C</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_D</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af96cd9c8f2454ea118dfa7358dd24824"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af96cd9c8f2454ea118dfa7358dd24824">&#9670;&nbsp;</a></span>GemmDesc() <span class="overload">[4/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">GemmDesc</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&#160;</td>
+          <td class="paramname"><em>_problem_size</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a>&#160;</td>
+          <td class="paramname"><em>_alpha</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_A</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_batch_stride_A</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_B</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_batch_stride_B</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a>&#160;</td>
+          <td class="paramname"><em>_beta</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_C</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_batch_stride_C</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_D</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>_batch_stride_D</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="a053c2b529be527f510ee317737fbf7e8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a053c2b529be527f510ee317737fbf7e8">&#9670;&nbsp;</a></span>alpha</h2>
+<a id="a80b0aae6e67b733ae5bf289d979a7c9b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a80b0aae6e67b733ae5bf289d979a7c9b">&#9670;&nbsp;</a></span>A</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">Scalar_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::alpha</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#aea3a523662dc801bf9abf205a8e400fe">TensorRefA</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::A</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ab91b702a9932144b388fad3159130332"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab91b702a9932144b388fad3159130332">&#9670;&nbsp;</a></span>beta</h2>
+<a id="aa82600c82e17ea1233f2f74be4aa3785"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa82600c82e17ea1233f2f74be4aa3785">&#9670;&nbsp;</a></span>alpha</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">Scalar_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::beta</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::alpha</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aae63781de41962f496da469684919447"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aae63781de41962f496da469684919447">&#9670;&nbsp;</a></span>d_a</h2>
+<a id="af0ac89b161f9cad96307f1ff3c80a774"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af0ac89b161f9cad96307f1ff3c80a774">&#9670;&nbsp;</a></span>B</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">void const* <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::d_a</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a7de7de97d237d9dcc0d89de7b04342ab">TensorRefB</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::B</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a05915032eba39bc9b085bec5ff17257b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a05915032eba39bc9b085bec5ff17257b">&#9670;&nbsp;</a></span>d_b</h2>
+<a id="a8b5a86d14eba0d3c5173753212d62599"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8b5a86d14eba0d3c5173753212d62599">&#9670;&nbsp;</a></span>batch_stride_A</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">void const* <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::d_b</td>
+          <td class="memname">long long <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::batch_stride_A</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aa2b3126c082d04fd31521cb0e84cf4d5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa2b3126c082d04fd31521cb0e84cf4d5">&#9670;&nbsp;</a></span>d_c</h2>
+<a id="a95e3fe05e4ca0d4019cbef2b1a54419a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a95e3fe05e4ca0d4019cbef2b1a54419a">&#9670;&nbsp;</a></span>batch_stride_B</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">void const* <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::d_c</td>
+          <td class="memname">long long <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::batch_stride_B</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a30326e2d81c8e154d749f35837903216"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a30326e2d81c8e154d749f35837903216">&#9670;&nbsp;</a></span>d_d</h2>
+<a id="aad3590dffa2e1ba82c834efae6b35ad2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aad3590dffa2e1ba82c834efae6b35ad2">&#9670;&nbsp;</a></span>batch_stride_C</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">void* <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::d_d</td>
+          <td class="memname">long long <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::batch_stride_C</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ac789a7e5d2db65d006f1e8e3df542a6f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac789a7e5d2db65d006f1e8e3df542a6f">&#9670;&nbsp;</a></span>k</h2>
+<a id="a7b9afcc7e3105da1d002b1baa68d83de"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7b9afcc7e3105da1d002b1baa68d83de">&#9670;&nbsp;</a></span>batch_stride_D</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::k</td>
+          <td class="memname">long long <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::batch_stride_D</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a62ad30ba419ccb661e6700da98221789"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a62ad30ba419ccb661e6700da98221789">&#9670;&nbsp;</a></span>lda</h2>
+<a id="adac41a0baad9e65aa4a6fe12d249a02b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adac41a0baad9e65aa4a6fe12d249a02b">&#9670;&nbsp;</a></span>beta</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::lda</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a258e8c008db365b88654f46df3017ec2">SType</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::beta</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7591ce0223b0d05c4d6fca6c67b98bfe"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7591ce0223b0d05c4d6fca6c67b98bfe">&#9670;&nbsp;</a></span>ldb</h2>
+<a id="ab384a226ab370fa5e25468fb99c63e30"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab384a226ab370fa5e25468fb99c63e30">&#9670;&nbsp;</a></span>C</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::ldb</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a51f77118d545308068b0dc287abf4e8b">TensorRefC</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::C</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a0f492560cabc45cd492da65b819d09db"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0f492560cabc45cd492da65b819d09db">&#9670;&nbsp;</a></span>ldc</h2>
+<a id="adf95451422c529587d55aac0fecf0d9f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adf95451422c529587d55aac0fecf0d9f">&#9670;&nbsp;</a></span>D</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::ldc</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html#a1f59ad60a529aa1db6e66ade3cb65052">TensorRefD</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::D</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a3280e5c5484f5c10d1412bcb70eb77e9"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3280e5c5484f5c10d1412bcb70eb77e9">&#9670;&nbsp;</a></span>ldd</h2>
+<a id="a52a5538b1b5208090417cf98d8735e3f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a52a5538b1b5208090417cf98d8735e3f">&#9670;&nbsp;</a></span>problem_size</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
+template&lt;typename AType_, typename BType_, typename CType_, typename DType_, typename SType_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::ldd</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a5c2b3e75cb6873762ba3f85487b78579"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5c2b3e75cb6873762ba3f85487b78579">&#9670;&nbsp;</a></span>m</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::m</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="acee9727aa6cb612a25cd6ced4829061a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#acee9727aa6cb612a25cd6ced4829061a">&#9670;&nbsp;</a></span>n</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename Scalar_, typename Index_ = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; Scalar_, Index_ &gt;::n</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmDesc.html">cutlass::gemm::GemmDesc</a>&lt; AType_, BType_, CType_, DType_, SType_, Index_ &gt;::problem_size</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -331,12 +766,12 @@ template&lt;typename Scalar_, typename Index_ = int&gt; </div>
 </div>
 </div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
-<li><a class="el" href="gemm_8h_source.html">gemm.h</a></li>
+<li><a class="el" href="gemm__desc_8h_source.html">gemm_desc.h</a></li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogue-members.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogue-members.html
index 6024711ba..88bf1a749 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogue-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogue-members.html
@@ -80,37 +80,36 @@ $(function() {
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">epilogue</a>(Coord&lt; 3 &gt; const &amp;block, Accumulators &amp;accumulators)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">epilogue_with_or_without_beta</a>(Coord&lt; 3 &gt; const &amp;block, Accumulators &amp;accumulators)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">epilogue</a>(Accumulators &amp;accumulators, Coord&lt; 3 &gt; const &amp;block=make_Coord(0, 0, 0), int batch_id=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">epilogue_with_or_without_beta</a>(Accumulators &amp;accumulators, Coord&lt; 3 &gt; const &amp;block, int batch_id)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">GemmEpilogue</a>(Params const &amp;params_, SharedStorage &amp;shared_storage_, Index m_, Index n_)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">m</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">n</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">GemmEpilogue</a>(Params const &amp;params_, SharedStorage &amp;shared_storage_, Coord&lt; 3 &gt; const &amp;_problem_size)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">shared_store_fence</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">SharedLoadIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">SharedLoadTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">SharedLoadStreamD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogue.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogue.html
index 3f08c9cf7..ec6b33ee4 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogue.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogue.html
@@ -138,12 +138,9 @@ Public Types</h2></td></tr>
 <tr class="memitem:a9063e7fc044a679652d5a3a31aa77e7c"><td class="memItemLeft" align="right" valign="top">typedef Traits::SharedStoreTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a></td></tr>
 <tr class="memdesc:a9063e7fc044a679652d5a3a31aa77e7c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="#a9063e7fc044a679652d5a3a31aa77e7c">More...</a><br /></td></tr>
 <tr class="separator:a9063e7fc044a679652d5a3a31aa77e7c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4a0b439f8a57d8e67174ecbd96183070"><td class="memItemLeft" align="right" valign="top">typedef Traits::SharedLoadIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">SharedLoadIteratorD</a></td></tr>
-<tr class="memdesc:a4a0b439f8a57d8e67174ecbd96183070"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load D in shared memory.  <a href="#a4a0b439f8a57d8e67174ecbd96183070">More...</a><br /></td></tr>
-<tr class="separator:a4a0b439f8a57d8e67174ecbd96183070"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a132cabbc1402c87c7b35dea427001a13"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename SharedLoadIteratorD::Fragment &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">SharedLoadTransformerD</a></td></tr>
-<tr class="memdesc:a132cabbc1402c87c7b35dea427001a13"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared load transformer for D.  <a href="#a132cabbc1402c87c7b35dea427001a13">More...</a><br /></td></tr>
-<tr class="separator:a132cabbc1402c87c7b35dea427001a13"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8e5d38a7795b50a021fc43dc7424288b"><td class="memItemLeft" align="right" valign="top">typedef Traits::SharedLoadStreamD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">SharedLoadStreamD</a></td></tr>
+<tr class="memdesc:a8e5d38a7795b50a021fc43dc7424288b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load D in shared memory.  <a href="#a8e5d38a7795b50a021fc43dc7424288b">More...</a><br /></td></tr>
+<tr class="separator:a8e5d38a7795b50a021fc43dc7424288b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a07c93d583bfddd8f916fba6ef809832e"><td class="memItemLeft" align="right" valign="top">typedef Traits::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a></td></tr>
 <tr class="memdesc:a07c93d583bfddd8f916fba6ef809832e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="#a07c93d583bfddd8f916fba6ef809832e">More...</a><br /></td></tr>
 <tr class="separator:a07c93d583bfddd8f916fba6ef809832e"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -156,15 +153,15 @@ Public Types</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:ab10147070c3a38fca75397f55dc51925"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">GemmEpilogue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> const &amp;params_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> &amp;shared_storage_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> m_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> n_)</td></tr>
-<tr class="memdesc:ab10147070c3a38fca75397f55dc51925"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ab10147070c3a38fca75397f55dc51925">More...</a><br /></td></tr>
-<tr class="separator:ab10147070c3a38fca75397f55dc51925"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae1983e37454ed14272b23b964614c54c"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">epilogue</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators)</td></tr>
-<tr class="memdesc:ae1983e37454ed14272b23b964614c54c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Execute the epilogue.  <a href="#ae1983e37454ed14272b23b964614c54c">More...</a><br /></td></tr>
-<tr class="separator:ae1983e37454ed14272b23b964614c54c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0c24dce365565f75e7edc1de1cb50ea4"><td class="memTemplParams" colspan="2">template&lt;bool kBetaIsZero_&gt; </td></tr>
-<tr class="memitem:a0c24dce365565f75e7edc1de1cb50ea4"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">epilogue_with_or_without_beta</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators)</td></tr>
-<tr class="separator:a0c24dce365565f75e7edc1de1cb50ea4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af91ebe8d2ed73808b9ea8846c140d3f8"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">GemmEpilogue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> const &amp;params_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> &amp;shared_storage_, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;_problem_size)</td></tr>
+<tr class="memdesc:af91ebe8d2ed73808b9ea8846c140d3f8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#af91ebe8d2ed73808b9ea8846c140d3f8">More...</a><br /></td></tr>
+<tr class="separator:af91ebe8d2ed73808b9ea8846c140d3f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6f1f96715425b7196e960907676a7db3"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">epilogue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), int batch_id=0)</td></tr>
+<tr class="memdesc:a6f1f96715425b7196e960907676a7db3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Execute the epilogue.  <a href="#a6f1f96715425b7196e960907676a7db3">More...</a><br /></td></tr>
+<tr class="separator:a6f1f96715425b7196e960907676a7db3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7af2eb421840e037263e6a144cca5c32"><td class="memTemplParams" colspan="2">template&lt;bool kSourceRequired&gt; </td></tr>
+<tr class="memitem:a7af2eb421840e037263e6a144cca5c32"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">epilogue_with_or_without_beta</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block, int batch_id)</td></tr>
+<tr class="separator:a7af2eb421840e037263e6a144cca5c32"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9b5e42f222fec98ff479bc1650221b84"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a> ()</td></tr>
 <tr class="memdesc:a9b5e42f222fec98ff479bc1650221b84"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="#a9b5e42f222fec98ff479bc1650221b84">More...</a><br /></td></tr>
 <tr class="separator:a9b5e42f222fec98ff479bc1650221b84"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -180,11 +177,11 @@ Public Attributes</h2></td></tr>
 <tr class="memitem:a442b5b5688cd658c3b3476650c00281e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a></td></tr>
 <tr class="memdesc:a442b5b5688cd658c3b3476650c00281e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage.  <a href="#a442b5b5688cd658c3b3476650c00281e">More...</a><br /></td></tr>
 <tr class="separator:a442b5b5688cd658c3b3476650c00281e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac344bf5ca318dc343bd6fa6bf52d2e22"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">m</a></td></tr>
-<tr class="memdesc:ac344bf5ca318dc343bd6fa6bf52d2e22"><td class="mdescLeft">&#160;</td><td class="mdescRight">The dimensions of the GEMM.  <a href="#ac344bf5ca318dc343bd6fa6bf52d2e22">More...</a><br /></td></tr>
-<tr class="separator:ac344bf5ca318dc343bd6fa6bf52d2e22"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9cc371cd2f1a9485583afdacbb7403ea"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">n</a></td></tr>
-<tr class="separator:a9cc371cd2f1a9485583afdacbb7403ea"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6bea57249e3645a4b08a11619cb1687e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a></td></tr>
+<tr class="memdesc:a6bea57249e3645a4b08a11619cb1687e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The dimensions of the GEMM.  <a href="#a6bea57249e3645a4b08a11619cb1687e">More...</a><br /></td></tr>
+<tr class="separator:a6bea57249e3645a4b08a11619cb1687e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5aa254702fcf24630e04ceb174aa3d57"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a></td></tr>
+<tr class="separator:a5aa254702fcf24630e04ceb174aa3d57"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="afe6bebd94e3379c94054d04c5196edce"></a>
@@ -396,8 +393,8 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 
 </div>
 </div>
-<a id="a4a0b439f8a57d8e67174ecbd96183070"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4a0b439f8a57d8e67174ecbd96183070">&#9670;&nbsp;</a></span>SharedLoadIteratorD</h2>
+<a id="a8e5d38a7795b50a021fc43dc7424288b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8e5d38a7795b50a021fc43dc7424288b">&#9670;&nbsp;</a></span>SharedLoadStreamD</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -405,23 +402,7 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 template&lt;typename GemmEpilogueTraits_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Traits::SharedLoadIteratorD <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">SharedLoadIteratorD</a></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a132cabbc1402c87c7b35dea427001a13"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a132cabbc1402c87c7b35dea427001a13">&#9670;&nbsp;</a></span>SharedLoadTransformerD</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmEpilogueTraits_ &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename SharedLoadIteratorD::Fragment&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">SharedLoadTransformerD</a></td>
+          <td class="memname">typedef Traits::SharedLoadStreamD <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">SharedLoadStreamD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -493,8 +474,8 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="ab10147070c3a38fca75397f55dc51925"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab10147070c3a38fca75397f55dc51925">&#9670;&nbsp;</a></span>GemmEpilogue()</h2>
+<a id="af91ebe8d2ed73808b9ea8846c140d3f8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af91ebe8d2ed73808b9ea8846c140d3f8">&#9670;&nbsp;</a></span>GemmEpilogue()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -519,14 +500,8 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>&#160;</td>
-          <td class="paramname"><em>m_</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>&#160;</td>
-          <td class="paramname"><em>n_</em>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>_problem_size</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -544,8 +519,8 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="ae1983e37454ed14272b23b964614c54c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae1983e37454ed14272b23b964614c54c">&#9670;&nbsp;</a></span>epilogue()</h2>
+<a id="a6f1f96715425b7196e960907676a7db3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6f1f96715425b7196e960907676a7db3">&#9670;&nbsp;</a></span>epilogue()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -558,14 +533,20 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
         <tr>
           <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;::epilogue </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>block</em>, </td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;&#160;</td>
+          <td class="paramname"><em>accumulators</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;&#160;</td>
-          <td class="paramname"><em>accumulators</em>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>block</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;0,&#160;0)</code>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>batch_id</em> = <code>0</code>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -582,15 +563,15 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 
 </div>
 </div>
-<a id="a0c24dce365565f75e7edc1de1cb50ea4"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0c24dce365565f75e7edc1de1cb50ea4">&#9670;&nbsp;</a></span>epilogue_with_or_without_beta()</h2>
+<a id="a7af2eb421840e037263e6a144cca5c32"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7af2eb421840e037263e6a144cca5c32">&#9670;&nbsp;</a></span>epilogue_with_or_without_beta()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
 template&lt;typename GemmEpilogueTraits_ &gt; </div>
 <div class="memtemplate">
-template&lt;bool kBetaIsZero_&gt; </div>
+template&lt;bool kSourceRequired&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
@@ -598,14 +579,20 @@ template&lt;bool kBetaIsZero_&gt; </div>
         <tr>
           <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;::epilogue_with_or_without_beta </td>
           <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;&#160;</td>
+          <td class="paramname"><em>accumulators</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
           <td class="paramname"><em>block</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;&#160;</td>
-          <td class="paramname"><em>accumulators</em>&#160;</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>batch_id</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -677,8 +664,8 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="ac344bf5ca318dc343bd6fa6bf52d2e22"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac344bf5ca318dc343bd6fa6bf52d2e22">&#9670;&nbsp;</a></span>m</h2>
+<a id="a5aa254702fcf24630e04ceb174aa3d57"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5aa254702fcf24630e04ceb174aa3d57">&#9670;&nbsp;</a></span>functor</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -686,23 +673,7 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 template&lt;typename GemmEpilogueTraits_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;::m</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a9cc371cd2f1a9485583afdacbb7403ea"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9cc371cd2f1a9485583afdacbb7403ea">&#9670;&nbsp;</a></span>n</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmEpilogueTraits_ &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;::n</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;::functor</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -723,6 +694,22 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a6bea57249e3645a4b08a11619cb1687e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6bea57249e3645a4b08a11619cb1687e">&#9670;&nbsp;</a></span>problem_size</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmEpilogueTraits_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;::problem_size</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a442b5b5688cd658c3b3476650c00281e"></a>
@@ -747,7 +734,7 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits-members.html
index 2035e3bf4..894f46bb5 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits-members.html
@@ -73,32 +73,32 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">Functor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">SharedLoadIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">Functor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">SharedLoadStreamD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits.html
index 8d99223d7..c93248547 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,7 +77,7 @@ $(function() {
 <a href="#pub-types">Public Types</a> &#124;
 <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -97,65 +97,65 @@ Classes</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:aed1bd9df5ff579ba3e36ae5ba781c075"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">OutputTile</a></td></tr>
-<tr class="memdesc:aed1bd9df5ff579ba3e36ae5ba781c075"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="#aed1bd9df5ff579ba3e36ae5ba781c075">More...</a><br /></td></tr>
-<tr class="separator:aed1bd9df5ff579ba3e36ae5ba781c075"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af7ff579ccb4269bfa5e9ae297260f7a2"><td class="memItemLeft" align="right" valign="top">typedef Accumulators_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">Accumulators</a></td></tr>
-<tr class="separator:af7ff579ccb4269bfa5e9ae297260f7a2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8409d84ee282a4d6953bd41149d8b9c2"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadIteratorC_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">GlobalLoadIteratorC</a></td></tr>
-<tr class="memdesc:a8409d84ee282a4d6953bd41149d8b9c2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for C in global memory.  <a href="#a8409d84ee282a4d6953bd41149d8b9c2">More...</a><br /></td></tr>
-<tr class="separator:a8409d84ee282a4d6953bd41149d8b9c2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a051f25a4aa3ea71ff400582228adbdaa"><td class="memItemLeft" align="right" valign="top">typedef GlobalTransformerC_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">GlobalTransformerC</a></td></tr>
-<tr class="memdesc:a051f25a4aa3ea71ff400582228adbdaa"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for C.  <a href="#a051f25a4aa3ea71ff400582228adbdaa">More...</a><br /></td></tr>
-<tr class="separator:a051f25a4aa3ea71ff400582228adbdaa"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a261e526c6a8e832bc483bf4e486cc9d7"><td class="memItemLeft" align="right" valign="top">typedef GlobalTransformerD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">GlobalTransformerD</a></td></tr>
-<tr class="memdesc:a261e526c6a8e832bc483bf4e486cc9d7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for D.  <a href="#a261e526c6a8e832bc483bf4e486cc9d7">More...</a><br /></td></tr>
-<tr class="separator:a261e526c6a8e832bc483bf4e486cc9d7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aeef5745d149770c9f79e12f6d97ffce1"><td class="memItemLeft" align="right" valign="top">typedef GlobalStoreIteratorD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">GlobalStoreIteratorD</a></td></tr>
-<tr class="memdesc:aeef5745d149770c9f79e12f6d97ffce1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for D in global memory.  <a href="#aeef5745d149770c9f79e12f6d97ffce1">More...</a><br /></td></tr>
-<tr class="separator:aeef5745d149770c9f79e12f6d97ffce1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a74f4beb86447f6b613e9b60234cb27bc"><td class="memItemLeft" align="right" valign="top">typedef SharedStoreIteratorD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">SharedStoreIteratorD</a></td></tr>
-<tr class="memdesc:a74f4beb86447f6b613e9b60234cb27bc"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D in shared memory.  <a href="#a74f4beb86447f6b613e9b60234cb27bc">More...</a><br /></td></tr>
-<tr class="separator:a74f4beb86447f6b613e9b60234cb27bc"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0b8ac1972b2f2cff48070f8b862ed25c"><td class="memItemLeft" align="right" valign="top">typedef SharedStoreTransformerD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">SharedStoreTransformerD</a></td></tr>
-<tr class="memdesc:a0b8ac1972b2f2cff48070f8b862ed25c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="#a0b8ac1972b2f2cff48070f8b862ed25c">More...</a><br /></td></tr>
-<tr class="separator:a0b8ac1972b2f2cff48070f8b862ed25c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9822fa405b32cc2f471c9fdd37585cb5"><td class="memItemLeft" align="right" valign="top">typedef SharedLoadIteratorD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">SharedLoadIteratorD</a></td></tr>
-<tr class="memdesc:a9822fa405b32cc2f471c9fdd37585cb5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D in shared memory.  <a href="#a9822fa405b32cc2f471c9fdd37585cb5">More...</a><br /></td></tr>
-<tr class="separator:a9822fa405b32cc2f471c9fdd37585cb5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab00969bdda930eeb7b82985c476adf7d"><td class="memItemLeft" align="right" valign="top">typedef Iterations_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">Iterations</a></td></tr>
-<tr class="memdesc:ab00969bdda930eeb7b82985c476adf7d"><td class="mdescLeft">&#160;</td><td class="mdescRight">typedef typename GemmConfig::EpilogueIterations Iterations;  <a href="#ab00969bdda930eeb7b82985c476adf7d">More...</a><br /></td></tr>
-<tr class="separator:ab00969bdda930eeb7b82985c476adf7d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af1f105d4712f01880b0944666e2f81ae"><td class="memItemLeft" align="right" valign="top">typedef Delta_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">Delta</a></td></tr>
-<tr class="memdesc:af1f105d4712f01880b0944666e2f81ae"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterations strides.  <a href="#af1f105d4712f01880b0944666e2f81ae">More...</a><br /></td></tr>
-<tr class="separator:af1f105d4712f01880b0944666e2f81ae"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7cdb30f17692e8fdb3dd4cf4c0b8e9ee"><td class="memItemLeft" align="right" valign="top">typedef Functor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">Functor</a></td></tr>
-<tr class="memdesc:a7cdb30f17692e8fdb3dd4cf4c0b8e9ee"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor in charge of the math.  <a href="#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">More...</a><br /></td></tr>
-<tr class="separator:a7cdb30f17692e8fdb3dd4cf4c0b8e9ee"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab430d05bd17efd60c28077c87b5ca331"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a></td></tr>
-<tr class="memdesc:ab430d05bd17efd60c28077c87b5ca331"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="#ab430d05bd17efd60c28077c87b5ca331">More...</a><br /></td></tr>
-<tr class="separator:ab430d05bd17efd60c28077c87b5ca331"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a006e50cf5fb67407d41c60d6d08b8b66"><td class="memItemLeft" align="right" valign="top">typedef Functor::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">Scalar</a></td></tr>
-<tr class="memdesc:a006e50cf5fb67407d41c60d6d08b8b66"><td class="mdescLeft">&#160;</td><td class="mdescRight">We do not support 3D or 4D shapes.  <a href="#a006e50cf5fb67407d41c60d6d08b8b66">More...</a><br /></td></tr>
-<tr class="separator:a006e50cf5fb67407d41c60d6d08b8b66"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abf97949c238d72854225c1c6131b5cbc"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadIteratorC::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">ScalarC</a></td></tr>
-<tr class="memdesc:abf97949c238d72854225c1c6131b5cbc"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="#abf97949c238d72854225c1c6131b5cbc">More...</a><br /></td></tr>
-<tr class="separator:abf97949c238d72854225c1c6131b5cbc"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1ee74d6f89b044578e1cd6dd210ce5fe"><td class="memItemLeft" align="right" valign="top">typedef GlobalStoreIteratorD::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">ScalarD</a></td></tr>
-<tr class="memdesc:a1ee74d6f89b044578e1cd6dd210ce5fe"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="#a1ee74d6f89b044578e1cd6dd210ce5fe">More...</a><br /></td></tr>
-<tr class="separator:a1ee74d6f89b044578e1cd6dd210ce5fe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af4d17d3774382fc0ba63d329bd12772c"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">OutputTile</a></td></tr>
+<tr class="memdesc:af4d17d3774382fc0ba63d329bd12772c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="#af4d17d3774382fc0ba63d329bd12772c">More...</a><br /></td></tr>
+<tr class="separator:af4d17d3774382fc0ba63d329bd12772c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af27cfae15beafcfbaf6d660781cbe5c4"><td class="memItemLeft" align="right" valign="top">typedef Accumulators_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">Accumulators</a></td></tr>
+<tr class="separator:af27cfae15beafcfbaf6d660781cbe5c4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4de6207ce3843d6c4325abc7d7abcf24"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadIteratorC_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">GlobalLoadIteratorC</a></td></tr>
+<tr class="memdesc:a4de6207ce3843d6c4325abc7d7abcf24"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for C in global memory.  <a href="#a4de6207ce3843d6c4325abc7d7abcf24">More...</a><br /></td></tr>
+<tr class="separator:a4de6207ce3843d6c4325abc7d7abcf24"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a853b7ad3afb06fd720afc4559df2198d"><td class="memItemLeft" align="right" valign="top">typedef GlobalTransformerC_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">GlobalTransformerC</a></td></tr>
+<tr class="memdesc:a853b7ad3afb06fd720afc4559df2198d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for C.  <a href="#a853b7ad3afb06fd720afc4559df2198d">More...</a><br /></td></tr>
+<tr class="separator:a853b7ad3afb06fd720afc4559df2198d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adb4eb47c84dc1c6df2556e72ff5800e6"><td class="memItemLeft" align="right" valign="top">typedef GlobalTransformerD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">GlobalTransformerD</a></td></tr>
+<tr class="memdesc:adb4eb47c84dc1c6df2556e72ff5800e6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for D.  <a href="#adb4eb47c84dc1c6df2556e72ff5800e6">More...</a><br /></td></tr>
+<tr class="separator:adb4eb47c84dc1c6df2556e72ff5800e6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada036c0457773a42fb18bc0463071d02"><td class="memItemLeft" align="right" valign="top">typedef GlobalStoreIteratorD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">GlobalStoreIteratorD</a></td></tr>
+<tr class="memdesc:ada036c0457773a42fb18bc0463071d02"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for D in global memory.  <a href="#ada036c0457773a42fb18bc0463071d02">More...</a><br /></td></tr>
+<tr class="separator:ada036c0457773a42fb18bc0463071d02"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a48dee5c2aafb86e999732a1347c9f668"><td class="memItemLeft" align="right" valign="top">typedef SharedStoreIteratorD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">SharedStoreIteratorD</a></td></tr>
+<tr class="memdesc:a48dee5c2aafb86e999732a1347c9f668"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D in shared memory.  <a href="#a48dee5c2aafb86e999732a1347c9f668">More...</a><br /></td></tr>
+<tr class="separator:a48dee5c2aafb86e999732a1347c9f668"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a685d59ee03a226e62660e83c4c60ca69"><td class="memItemLeft" align="right" valign="top">typedef SharedStoreTransformerD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">SharedStoreTransformerD</a></td></tr>
+<tr class="memdesc:a685d59ee03a226e62660e83c4c60ca69"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="#a685d59ee03a226e62660e83c4c60ca69">More...</a><br /></td></tr>
+<tr class="separator:a685d59ee03a226e62660e83c4c60ca69"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5bb3232a2f15d8263d058c69b0839e2f"><td class="memItemLeft" align="right" valign="top">typedef SharedLoadStreamD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">SharedLoadStreamD</a></td></tr>
+<tr class="memdesc:a5bb3232a2f15d8263d058c69b0839e2f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to store D in shared memory.  <a href="#a5bb3232a2f15d8263d058c69b0839e2f">More...</a><br /></td></tr>
+<tr class="separator:a5bb3232a2f15d8263d058c69b0839e2f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7cf2e703f78b877ad551d0516982da10"><td class="memItemLeft" align="right" valign="top">typedef Iterations_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">Iterations</a></td></tr>
+<tr class="memdesc:a7cf2e703f78b877ad551d0516982da10"><td class="mdescLeft">&#160;</td><td class="mdescRight">typedef typename GemmConfig::EpilogueIterations Iterations;  <a href="#a7cf2e703f78b877ad551d0516982da10">More...</a><br /></td></tr>
+<tr class="separator:a7cf2e703f78b877ad551d0516982da10"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a84b89d856f548a26fa1dc15bfd2940da"><td class="memItemLeft" align="right" valign="top">typedef Delta_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">Delta</a></td></tr>
+<tr class="memdesc:a84b89d856f548a26fa1dc15bfd2940da"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterations strides.  <a href="#a84b89d856f548a26fa1dc15bfd2940da">More...</a><br /></td></tr>
+<tr class="separator:a84b89d856f548a26fa1dc15bfd2940da"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8acbe7bfa905258a964ef56e634d4c99"><td class="memItemLeft" align="right" valign="top">typedef Functor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">Functor</a></td></tr>
+<tr class="memdesc:a8acbe7bfa905258a964ef56e634d4c99"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor in charge of the math.  <a href="#a8acbe7bfa905258a964ef56e634d4c99">More...</a><br /></td></tr>
+<tr class="separator:a8acbe7bfa905258a964ef56e634d4c99"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a23b0e6a448e51f2e0837af95802c23b0"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a></td></tr>
+<tr class="memdesc:a23b0e6a448e51f2e0837af95802c23b0"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="#a23b0e6a448e51f2e0837af95802c23b0">More...</a><br /></td></tr>
+<tr class="separator:a23b0e6a448e51f2e0837af95802c23b0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f15d59a7571d406d5ef593c342f0d4a"><td class="memItemLeft" align="right" valign="top">typedef Functor::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">Scalar</a></td></tr>
+<tr class="memdesc:a8f15d59a7571d406d5ef593c342f0d4a"><td class="mdescLeft">&#160;</td><td class="mdescRight">We do not support 3D or 4D shapes.  <a href="#a8f15d59a7571d406d5ef593c342f0d4a">More...</a><br /></td></tr>
+<tr class="separator:a8f15d59a7571d406d5ef593c342f0d4a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa794b5f04ce736cdba0d778861ce3a9c"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadIteratorC::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">ScalarC</a></td></tr>
+<tr class="memdesc:aa794b5f04ce736cdba0d778861ce3a9c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="#aa794b5f04ce736cdba0d778861ce3a9c">More...</a><br /></td></tr>
+<tr class="separator:aa794b5f04ce736cdba0d778861ce3a9c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad9a81c3ff36a4f3aa376e2cff94cbb50"><td class="memItemLeft" align="right" valign="top">typedef GlobalStoreIteratorD::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a></td></tr>
+<tr class="memdesc:ad9a81c3ff36a4f3aa376e2cff94cbb50"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="#ad9a81c3ff36a4f3aa376e2cff94cbb50">More...</a><br /></td></tr>
+<tr class="separator:ad9a81c3ff36a4f3aa376e2cff94cbb50"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="af7ff579ccb4269bfa5e9ae297260f7a2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af7ff579ccb4269bfa5e9ae297260f7a2">&#9670;&nbsp;</a></span>Accumulators</h2>
+<a id="af27cfae15beafcfbaf6d660781cbe5c4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af27cfae15beafcfbaf6d660781cbe5c4">&#9670;&nbsp;</a></span>Accumulators</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Accumulators_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">Accumulators</a></td>
+          <td class="memname">typedef Accumulators_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">Accumulators</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -163,160 +163,160 @@ template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIte
 
 </div>
 </div>
-<a id="af1f105d4712f01880b0944666e2f81ae"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af1f105d4712f01880b0944666e2f81ae">&#9670;&nbsp;</a></span>Delta</h2>
+<a id="a84b89d856f548a26fa1dc15bfd2940da"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a84b89d856f548a26fa1dc15bfd2940da">&#9670;&nbsp;</a></span>Delta</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Delta_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">Delta</a></td>
+          <td class="memname">typedef Delta_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">Delta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7cdb30f17692e8fdb3dd4cf4c0b8e9ee"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">&#9670;&nbsp;</a></span>Functor</h2>
+<a id="a8acbe7bfa905258a964ef56e634d4c99"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8acbe7bfa905258a964ef56e634d4c99">&#9670;&nbsp;</a></span>Functor</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Functor_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">Functor</a></td>
+          <td class="memname">typedef Functor_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">Functor</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a8409d84ee282a4d6953bd41149d8b9c2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8409d84ee282a4d6953bd41149d8b9c2">&#9670;&nbsp;</a></span>GlobalLoadIteratorC</h2>
+<a id="a4de6207ce3843d6c4325abc7d7abcf24"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4de6207ce3843d6c4325abc7d7abcf24">&#9670;&nbsp;</a></span>GlobalLoadIteratorC</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef GlobalLoadIteratorC_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">GlobalLoadIteratorC</a></td>
+          <td class="memname">typedef GlobalLoadIteratorC_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">GlobalLoadIteratorC</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aeef5745d149770c9f79e12f6d97ffce1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aeef5745d149770c9f79e12f6d97ffce1">&#9670;&nbsp;</a></span>GlobalStoreIteratorD</h2>
+<a id="ada036c0457773a42fb18bc0463071d02"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ada036c0457773a42fb18bc0463071d02">&#9670;&nbsp;</a></span>GlobalStoreIteratorD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef GlobalStoreIteratorD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">GlobalStoreIteratorD</a></td>
+          <td class="memname">typedef GlobalStoreIteratorD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">GlobalStoreIteratorD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a051f25a4aa3ea71ff400582228adbdaa"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a051f25a4aa3ea71ff400582228adbdaa">&#9670;&nbsp;</a></span>GlobalTransformerC</h2>
+<a id="a853b7ad3afb06fd720afc4559df2198d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a853b7ad3afb06fd720afc4559df2198d">&#9670;&nbsp;</a></span>GlobalTransformerC</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef GlobalTransformerC_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">GlobalTransformerC</a></td>
+          <td class="memname">typedef GlobalTransformerC_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">GlobalTransformerC</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a261e526c6a8e832bc483bf4e486cc9d7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a261e526c6a8e832bc483bf4e486cc9d7">&#9670;&nbsp;</a></span>GlobalTransformerD</h2>
+<a id="adb4eb47c84dc1c6df2556e72ff5800e6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adb4eb47c84dc1c6df2556e72ff5800e6">&#9670;&nbsp;</a></span>GlobalTransformerD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef GlobalTransformerD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">GlobalTransformerD</a></td>
+          <td class="memname">typedef GlobalTransformerD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">GlobalTransformerD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ab430d05bd17efd60c28077c87b5ca331"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab430d05bd17efd60c28077c87b5ca331">&#9670;&nbsp;</a></span>Index</h2>
+<a id="a23b0e6a448e51f2e0837af95802c23b0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a23b0e6a448e51f2e0837af95802c23b0">&#9670;&nbsp;</a></span>Index</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a></td>
+          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ab00969bdda930eeb7b82985c476adf7d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab00969bdda930eeb7b82985c476adf7d">&#9670;&nbsp;</a></span>Iterations</h2>
+<a id="a7cf2e703f78b877ad551d0516982da10"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7cf2e703f78b877ad551d0516982da10">&#9670;&nbsp;</a></span>Iterations</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Iterations_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">Iterations</a></td>
+          <td class="memname">typedef Iterations_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">Iterations</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aed1bd9df5ff579ba3e36ae5ba781c075"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aed1bd9df5ff579ba3e36ae5ba781c075">&#9670;&nbsp;</a></span>OutputTile</h2>
+<a id="af4d17d3774382fc0ba63d329bd12772c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af4d17d3774382fc0ba63d329bd12772c">&#9670;&nbsp;</a></span>OutputTile</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef OutputTile_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">OutputTile</a></td>
+          <td class="memname">typedef OutputTile_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">OutputTile</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a006e50cf5fb67407d41c60d6d08b8b66"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a006e50cf5fb67407d41c60d6d08b8b66">&#9670;&nbsp;</a></span>Scalar</h2>
+<a id="a8f15d59a7571d406d5ef593c342f0d4a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8f15d59a7571d406d5ef593c342f0d4a">&#9670;&nbsp;</a></span>Scalar</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Functor::Scalar <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">Scalar</a></td>
+          <td class="memname">typedef Functor::Scalar <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">Scalar</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -324,80 +324,80 @@ template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIte
 
 </div>
 </div>
-<a id="abf97949c238d72854225c1c6131b5cbc"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abf97949c238d72854225c1c6131b5cbc">&#9670;&nbsp;</a></span>ScalarC</h2>
+<a id="aa794b5f04ce736cdba0d778861ce3a9c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa794b5f04ce736cdba0d778861ce3a9c">&#9670;&nbsp;</a></span>ScalarC</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef GlobalLoadIteratorC::Scalar <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">ScalarC</a></td>
+          <td class="memname">typedef GlobalLoadIteratorC::Scalar <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">ScalarC</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a1ee74d6f89b044578e1cd6dd210ce5fe"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1ee74d6f89b044578e1cd6dd210ce5fe">&#9670;&nbsp;</a></span>ScalarD</h2>
+<a id="ad9a81c3ff36a4f3aa376e2cff94cbb50"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad9a81c3ff36a4f3aa376e2cff94cbb50">&#9670;&nbsp;</a></span>ScalarD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef GlobalStoreIteratorD::Scalar <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">ScalarD</a></td>
+          <td class="memname">typedef GlobalStoreIteratorD::Scalar <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a9822fa405b32cc2f471c9fdd37585cb5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9822fa405b32cc2f471c9fdd37585cb5">&#9670;&nbsp;</a></span>SharedLoadIteratorD</h2>
+<a id="a5bb3232a2f15d8263d058c69b0839e2f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5bb3232a2f15d8263d058c69b0839e2f">&#9670;&nbsp;</a></span>SharedLoadStreamD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef SharedLoadIteratorD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">SharedLoadIteratorD</a></td>
+          <td class="memname">typedef SharedLoadStreamD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">SharedLoadStreamD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a74f4beb86447f6b613e9b60234cb27bc"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a74f4beb86447f6b613e9b60234cb27bc">&#9670;&nbsp;</a></span>SharedStoreIteratorD</h2>
+<a id="a48dee5c2aafb86e999732a1347c9f668"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a48dee5c2aafb86e999732a1347c9f668">&#9670;&nbsp;</a></span>SharedStoreIteratorD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef SharedStoreIteratorD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">SharedStoreIteratorD</a></td>
+          <td class="memname">typedef SharedStoreIteratorD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">SharedStoreIteratorD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a0b8ac1972b2f2cff48070f8b862ed25c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0b8ac1972b2f2cff48070f8b862ed25c">&#9670;&nbsp;</a></span>SharedStoreTransformerD</h2>
+<a id="a685d59ee03a226e62660e83c4c60ca69"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a685d59ee03a226e62660e83c4c60ca69">&#9670;&nbsp;</a></span>SharedStoreTransformerD</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef SharedStoreTransformerD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">SharedStoreTransformerD</a></td>
+          <td class="memname">typedef SharedStoreTransformerD_ <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">SharedStoreTransformerD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -410,7 +410,7 @@ template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIte
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper-members.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper-members.html
index 4f04d91f3..83a1f951a 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper-members.html
@@ -91,14 +91,15 @@ $(function() {
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae2b82b9b62aefa15005091bb84ac20e8">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">SharedLoadStreamD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html
index 55d6652f4..642c964a6 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html
@@ -98,28 +98,31 @@ Public Types</h2></td></tr>
 <tr class="memitem:a981134cf87d85aa28570a62d9e878b10"><td class="memItemLeft" align="right" valign="top">typedef EpilogueFunctor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">Functor</a></td></tr>
 <tr class="memdesc:a981134cf87d85aa28570a62d9e878b10"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do the math in the epilogue.  <a href="#a981134cf87d85aa28570a62d9e878b10">More...</a><br /></td></tr>
 <tr class="separator:a981134cf87d85aa28570a62d9e878b10"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3a0fb3a914bfd009ff2e3918bcd231a9"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a>&lt; typename Functor::Scalar, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::kScalarsPerStsD, 128/sizeof(typename GemmConfig_::ScalarD)/GemmConfig_::kScalarsPerStsD/2 *GemmConfig_::kScalarsPerStsD &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">SharedStoreTileTraits</a></td></tr>
-<tr class="memdesc:a3a0fb3a914bfd009ff2e3918bcd231a9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store to shared memory for D.  <a href="#a3a0fb3a914bfd009ff2e3918bcd231a9">More...</a><br /></td></tr>
-<tr class="separator:a3a0fb3a914bfd009ff2e3918bcd231a9"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a02a517fd246fb961727d3bd1b4f954be"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">SharedStoreTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a></td></tr>
+<tr class="memitem:aad9a6190cccbc5c23a86f09c45c0e507"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a>&lt; typename Functor::ScalarAccum, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::kScalarsPerStsD, 128/sizeof(typename GemmConfig_::ScalarD)/GemmConfig_::kScalarsPerStsD/2 *GemmConfig_::kScalarsPerStsD &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">SharedStoreTileTraits</a></td></tr>
+<tr class="memdesc:aad9a6190cccbc5c23a86f09c45c0e507"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store to shared memory for D.  <a href="#aad9a6190cccbc5c23a86f09c45c0e507">More...</a><br /></td></tr>
+<tr class="separator:aad9a6190cccbc5c23a86f09c45c0e507"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a02a517fd246fb961727d3bd1b4f954be"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">SharedStoreTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a></td></tr>
 <tr class="memdesc:a02a517fd246fb961727d3bd1b4f954be"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D to shared memory.  <a href="#a02a517fd246fb961727d3bd1b4f954be">More...</a><br /></td></tr>
 <tr class="separator:a02a517fd246fb961727d3bd1b4f954be"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa5cea8dbebda9a12a503ae1416c4da33"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">SharedStoreIteratorD::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a></td></tr>
+<tr class="memitem:aa5cea8dbebda9a12a503ae1416c4da33"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">SharedStoreIteratorD::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a></td></tr>
 <tr class="memdesc:aa5cea8dbebda9a12a503ae1416c4da33"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="#aa5cea8dbebda9a12a503ae1416c4da33">More...</a><br /></td></tr>
 <tr class="separator:aa5cea8dbebda9a12a503ae1416c4da33"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab8ba28fd1da48fcabbafc0de91281b46"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a>&lt; typename Functor::Scalar, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::OutputTile::kH/<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a> &gt;::kCount, GemmConfig_::kScalarsPerLdsD, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">SharedStoreTileTraits::kSkew</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">SharedLoadTileTraits</a></td></tr>
-<tr class="memdesc:ab8ba28fd1da48fcabbafc0de91281b46"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for D.  <a href="#ab8ba28fd1da48fcabbafc0de91281b46">More...</a><br /></td></tr>
-<tr class="separator:ab8ba28fd1da48fcabbafc0de91281b46"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adbff60de6f90ef4d5ae0c7096692e2c0"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">SharedLoadTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a></td></tr>
+<tr class="memitem:a076ea17d901d22d3b69bf9c621858235"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a>&lt; typename Functor::ScalarAccum, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::OutputTile::kH/<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a> &gt;::kCount, GemmConfig_::kScalarsPerLdsD, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">SharedStoreTileTraits::kSkew</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">SharedLoadTileTraits</a></td></tr>
+<tr class="memdesc:a076ea17d901d22d3b69bf9c621858235"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for D.  <a href="#a076ea17d901d22d3b69bf9c621858235">More...</a><br /></td></tr>
+<tr class="separator:a076ea17d901d22d3b69bf9c621858235"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbff60de6f90ef4d5ae0c7096692e2c0"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">SharedLoadTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a></td></tr>
 <tr class="memdesc:adbff60de6f90ef4d5ae0c7096692e2c0"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load D from shared memory.  <a href="#adbff60de6f90ef4d5ae0c7096692e2c0">More...</a><br /></td></tr>
 <tr class="separator:adbff60de6f90ef4d5ae0c7096692e2c0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9e511e1852668e0a242315c24888dee3"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">SharedLoadStreamD</a></td></tr>
+<tr class="memdesc:a9e511e1852668e0a242315c24888dee3"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load D.  <a href="#a9e511e1852668e0a242315c24888dee3">More...</a><br /></td></tr>
+<tr class="separator:a9e511e1852668e0a242315c24888dee3"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a94f00f94a88588522ca3f9f0197a5a9b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a>&lt; typename GemmConfig_::ScalarC const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kH/<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a> &gt;::kCount, GemmConfig_::OutputTile::kW &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Iterations::kW</a>, GemmConfig_::kScalarsPerLdgC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">GlobalLoadTileTraits</a></td></tr>
 <tr class="memdesc:a94f00f94a88588522ca3f9f0197a5a9b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for C^N.  <a href="#a94f00f94a88588522ca3f9f0197a5a9b">More...</a><br /></td></tr>
 <tr class="separator:a94f00f94a88588522ca3f9f0197a5a9b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:aeea13630bb281834b717f8d9d13a9319"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">GlobalLoadTileTraits</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">GlobalLoadIteratorC</a></td></tr>
 <tr class="memdesc:aeea13630bb281834b717f8d9d13a9319"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load C.  <a href="#aeea13630bb281834b717f8d9d13a9319">More...</a><br /></td></tr>
 <tr class="separator:aeea13630bb281834b717f8d9d13a9319"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0682b61d1a1a951026ff026bff9361bb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalLoadIteratorC::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">GlobalTransformerC</a></td></tr>
+<tr class="memitem:a0682b61d1a1a951026ff026bff9361bb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalLoadIteratorC::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">GlobalTransformerC</a></td></tr>
 <tr class="memdesc:a0682b61d1a1a951026ff026bff9361bb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for C.  <a href="#a0682b61d1a1a951026ff026bff9361bb">More...</a><br /></td></tr>
 <tr class="separator:a0682b61d1a1a951026ff026bff9361bb"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a16d7df2934c3c59d9b8f36f7a2137aee"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a>&lt; typename GemmConfig_::ScalarD, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kH/<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a> &gt;::kCount, GemmConfig_::OutputTile::kW &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Iterations::kW</a>, GemmConfig_::kScalarsPerStgD &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">GlobalStoreTileTraits</a></td></tr>
@@ -128,7 +131,7 @@ Public Types</h2></td></tr>
 <tr class="memitem:a23be7b4b498c17f9235a2b4896f1bffb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">GlobalStoreTileTraits</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">GlobalStoreIteratorD</a></td></tr>
 <tr class="memdesc:a23be7b4b498c17f9235a2b4896f1bffb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D.  <a href="#a23be7b4b498c17f9235a2b4896f1bffb">More...</a><br /></td></tr>
 <tr class="separator:a23be7b4b498c17f9235a2b4896f1bffb"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae96c5a3d58dc7a95543f8749f762ca43"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalStoreIteratorD::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">GlobalTransformerD</a></td></tr>
+<tr class="memitem:ae96c5a3d58dc7a95543f8749f762ca43"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalStoreIteratorD::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">GlobalTransformerD</a></td></tr>
 <tr class="memdesc:ae96c5a3d58dc7a95543f8749f762ca43"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for D.  <a href="#ae96c5a3d58dc7a95543f8749f762ca43">More...</a><br /></td></tr>
 <tr class="separator:ae96c5a3d58dc7a95543f8749f762ca43"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
@@ -238,7 +241,7 @@ template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = i
 template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalLoadIteratorC::Fragment</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">GlobalTransformerC</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalLoadIteratorC::Fragment</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">GlobalTransformerC</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -254,7 +257,7 @@ template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = i
 template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalStoreIteratorD::Fragment</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">GlobalTransformerD</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalStoreIteratorD::Fragment</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">GlobalTransformerD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -318,15 +321,15 @@ template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = i
 template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">SharedLoadTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">SharedLoadTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ab8ba28fd1da48fcabbafc0de91281b46"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab8ba28fd1da48fcabbafc0de91281b46">&#9670;&nbsp;</a></span>SharedLoadTileTraits</h2>
+<a id="a9e511e1852668e0a242315c24888dee3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9e511e1852668e0a242315c24888dee3">&#9670;&nbsp;</a></span>SharedLoadStreamD</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -334,7 +337,23 @@ template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = i
 template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a>&lt; typename Functor::Scalar, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::OutputTile::kH / <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a>&gt;::kCount, GemmConfig_::kScalarsPerLdsD, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">SharedStoreTileTraits::kSkew</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">SharedLoadTileTraits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">SharedLoadStreamD</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a076ea17d901d22d3b69bf9c621858235"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a076ea17d901d22d3b69bf9c621858235">&#9670;&nbsp;</a></span>SharedLoadTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a>&lt; typename Functor::ScalarAccum, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::OutputTile::kH / <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a>&gt;::kCount, GemmConfig_::kScalarsPerLdsD, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a48baee6541e6359753f1bae5bd864029">SharedStoreTileTraits::kSkew</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">SharedLoadTileTraits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -350,15 +369,15 @@ template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = i
 template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">SharedStoreTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">SharedStoreTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a3a0fb3a914bfd009ff2e3918bcd231a9"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3a0fb3a914bfd009ff2e3918bcd231a9">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
+<a id="aad9a6190cccbc5c23a86f09c45c0e507"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aad9a6190cccbc5c23a86f09c45c0e507">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -366,7 +385,7 @@ template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = i
 template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a>&lt; typename Functor::Scalar, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::kScalarsPerStsD, 128 / sizeof(typename GemmConfig_::ScalarD) / GemmConfig_::kScalarsPerStsD / 2 * GemmConfig_::kScalarsPerStsD&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">SharedStoreTileTraits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a>&lt; typename Functor::ScalarAccum, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, GemmConfig_::kScalarsPerStsD, 128 / sizeof(typename GemmConfig_::ScalarD) / GemmConfig_::kScalarsPerStsD / 2 * GemmConfig_::kScalarsPerStsD&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">SharedStoreTileTraits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -382,7 +401,7 @@ template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = i
 template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">SharedStoreIteratorD::Fragment</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">SharedStoreIteratorD::Fragment</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper</a>&lt; GemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -395,7 +414,7 @@ template&lt;typename GemmConfig_, typename EpilogueFunctor_, typename Index_ = i
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params-members.html
index b6a1ec780..3608cbfb7 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params-members.html
@@ -73,24 +73,24 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params Member List</div>  </div>
+<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06">functor</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a3e9d0fd2989fea776b0cab0e0f2813ce">initialize</a>(GemmDesc_ const &amp;desc)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce">iterator_c</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7">iterator_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a1742e43c128665f0ca39cb578291df81">shared_load_iterator_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#af79a0c74a4c30ccec59b393721b5dfc1">shared_store_iterator_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae0fdc7426b22ff2c20f077e251ebc823">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee">functor</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a13395bf81eabdc539c935e179c31d7ca">initialize</a>(GemmDesc_ const &amp;desc)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8">iterator_c</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346">iterator_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a5d3d1abd85f18476a74bcf616a717f9d">shared_load_stream_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adfdf3eca06ea4061fbfe016336a3f276">shared_store_iterator_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a497b91e93d0eb29ca54553f8de4c694f">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html
index c94e55e07..5f2f16c3c 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params Struct Reference</title>
+<title>Cutlass: cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params Struct Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,7 +77,7 @@ $(function() {
 <a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params Struct Reference</div>  </div>
+<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params Struct Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -88,42 +88,42 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a3e9d0fd2989fea776b0cab0e0f2813ce"><td class="memTemplParams" colspan="2">template&lt;typename GemmDesc_ &gt; </td></tr>
-<tr class="memitem:a3e9d0fd2989fea776b0cab0e0f2813ce"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a3e9d0fd2989fea776b0cab0e0f2813ce">initialize</a> (GemmDesc_ const &amp;desc)</td></tr>
-<tr class="memdesc:a3e9d0fd2989fea776b0cab0e0f2813ce"><td class="mdescLeft">&#160;</td><td class="mdescRight">Setup the params.  <a href="#a3e9d0fd2989fea776b0cab0e0f2813ce">More...</a><br /></td></tr>
-<tr class="separator:a3e9d0fd2989fea776b0cab0e0f2813ce"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a13395bf81eabdc539c935e179c31d7ca"><td class="memTemplParams" colspan="2">template&lt;typename GemmDesc_ &gt; </td></tr>
+<tr class="memitem:a13395bf81eabdc539c935e179c31d7ca"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a13395bf81eabdc539c935e179c31d7ca">initialize</a> (GemmDesc_ const &amp;desc)</td></tr>
+<tr class="memdesc:a13395bf81eabdc539c935e179c31d7ca"><td class="mdescLeft">&#160;</td><td class="mdescRight">Setup the params.  <a href="#a13395bf81eabdc539c935e179c31d7ca">More...</a><br /></td></tr>
+<tr class="separator:a13395bf81eabdc539c935e179c31d7ca"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:ae0fdc7426b22ff2c20f077e251ebc823"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae0fdc7426b22ff2c20f077e251ebc823">stride_h</a></td></tr>
-<tr class="memdesc:ae0fdc7426b22ff2c20f077e251ebc823"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides for H and W in the different iterations of the epilogue.  <a href="#ae0fdc7426b22ff2c20f077e251ebc823">More...</a><br /></td></tr>
-<tr class="separator:ae0fdc7426b22ff2c20f077e251ebc823"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a565f6cab8925d632dcf24bd1974caca2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a565f6cab8925d632dcf24bd1974caca2">stride_w</a></td></tr>
-<tr class="separator:a565f6cab8925d632dcf24bd1974caca2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7350ceefcd09a9e3662ca30b780cc2ce"><td class="memItemLeft" align="right" valign="top">GlobalLoadIteratorC::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a7350ceefcd09a9e3662ca30b780cc2ce">iterator_c</a></td></tr>
-<tr class="memdesc:a7350ceefcd09a9e3662ca30b780cc2ce"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the C iterator.  <a href="#a7350ceefcd09a9e3662ca30b780cc2ce">More...</a><br /></td></tr>
-<tr class="separator:a7350ceefcd09a9e3662ca30b780cc2ce"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a987c179a7e73c2572fe8aef3255668f7"><td class="memItemLeft" align="right" valign="top">GlobalStoreIteratorD::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a987c179a7e73c2572fe8aef3255668f7">iterator_d</a></td></tr>
-<tr class="memdesc:a987c179a7e73c2572fe8aef3255668f7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the D global iterator.  <a href="#a987c179a7e73c2572fe8aef3255668f7">More...</a><br /></td></tr>
-<tr class="separator:a987c179a7e73c2572fe8aef3255668f7"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af79a0c74a4c30ccec59b393721b5dfc1"><td class="memItemLeft" align="right" valign="top">SharedStoreIteratorD::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#af79a0c74a4c30ccec59b393721b5dfc1">shared_store_iterator_d</a></td></tr>
-<tr class="memdesc:af79a0c74a4c30ccec59b393721b5dfc1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the D shared store iterator.  <a href="#af79a0c74a4c30ccec59b393721b5dfc1">More...</a><br /></td></tr>
-<tr class="separator:af79a0c74a4c30ccec59b393721b5dfc1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1742e43c128665f0ca39cb578291df81"><td class="memItemLeft" align="right" valign="top">SharedLoadIteratorD::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a1742e43c128665f0ca39cb578291df81">shared_load_iterator_d</a></td></tr>
-<tr class="memdesc:a1742e43c128665f0ca39cb578291df81"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the D shared load iterator.  <a href="#a1742e43c128665f0ca39cb578291df81">More...</a><br /></td></tr>
-<tr class="separator:a1742e43c128665f0ca39cb578291df81"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afa888d993b86ed88950a9e5ab7edeb06"><td class="memItemLeft" align="right" valign="top">Functor::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#afa888d993b86ed88950a9e5ab7edeb06">functor</a></td></tr>
-<tr class="memdesc:afa888d993b86ed88950a9e5ab7edeb06"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor params.  <a href="#afa888d993b86ed88950a9e5ab7edeb06">More...</a><br /></td></tr>
-<tr class="separator:afa888d993b86ed88950a9e5ab7edeb06"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a497b91e93d0eb29ca54553f8de4c694f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a497b91e93d0eb29ca54553f8de4c694f">stride_h</a></td></tr>
+<tr class="memdesc:a497b91e93d0eb29ca54553f8de4c694f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides for H and W in the different iterations of the epilogue.  <a href="#a497b91e93d0eb29ca54553f8de4c694f">More...</a><br /></td></tr>
+<tr class="separator:a497b91e93d0eb29ca54553f8de4c694f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae814ac640d05358a3ce0ea70ed13ea68"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#ae814ac640d05358a3ce0ea70ed13ea68">stride_w</a></td></tr>
+<tr class="separator:ae814ac640d05358a3ce0ea70ed13ea68"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0745d33dd881f6ca78b168e05b133ff8"><td class="memItemLeft" align="right" valign="top">GlobalLoadIteratorC::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a0745d33dd881f6ca78b168e05b133ff8">iterator_c</a></td></tr>
+<tr class="memdesc:a0745d33dd881f6ca78b168e05b133ff8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the C iterator.  <a href="#a0745d33dd881f6ca78b168e05b133ff8">More...</a><br /></td></tr>
+<tr class="separator:a0745d33dd881f6ca78b168e05b133ff8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abbcccb203f9823e621caa4475aa3d346"><td class="memItemLeft" align="right" valign="top">GlobalStoreIteratorD::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#abbcccb203f9823e621caa4475aa3d346">iterator_d</a></td></tr>
+<tr class="memdesc:abbcccb203f9823e621caa4475aa3d346"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the D global iterator.  <a href="#abbcccb203f9823e621caa4475aa3d346">More...</a><br /></td></tr>
+<tr class="separator:abbcccb203f9823e621caa4475aa3d346"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adfdf3eca06ea4061fbfe016336a3f276"><td class="memItemLeft" align="right" valign="top">SharedStoreIteratorD::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adfdf3eca06ea4061fbfe016336a3f276">shared_store_iterator_d</a></td></tr>
+<tr class="memdesc:adfdf3eca06ea4061fbfe016336a3f276"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the D shared store iterator.  <a href="#adfdf3eca06ea4061fbfe016336a3f276">More...</a><br /></td></tr>
+<tr class="separator:adfdf3eca06ea4061fbfe016336a3f276"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5d3d1abd85f18476a74bcf616a717f9d"><td class="memItemLeft" align="right" valign="top">SharedLoadStreamD::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#a5d3d1abd85f18476a74bcf616a717f9d">shared_load_stream_d</a></td></tr>
+<tr class="memdesc:a5d3d1abd85f18476a74bcf616a717f9d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the D shared load stream.  <a href="#a5d3d1abd85f18476a74bcf616a717f9d">More...</a><br /></td></tr>
+<tr class="separator:a5d3d1abd85f18476a74bcf616a717f9d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adb04e5990ab7faae9e8c0b110d2e3bee"><td class="memItemLeft" align="right" valign="top">Functor::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1Params.html#adb04e5990ab7faae9e8c0b110d2e3bee">functor</a></td></tr>
+<tr class="memdesc:adb04e5990ab7faae9e8c0b110d2e3bee"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor params.  <a href="#adb04e5990ab7faae9e8c0b110d2e3bee">More...</a><br /></td></tr>
+<tr class="separator:adb04e5990ab7faae9e8c0b110d2e3bee"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a3e9d0fd2989fea776b0cab0e0f2813ce"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3e9d0fd2989fea776b0cab0e0f2813ce">&#9670;&nbsp;</a></span>initialize()</h2>
+<a id="a13395bf81eabdc539c935e179c31d7ca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a13395bf81eabdc539c935e179c31d7ca">&#9670;&nbsp;</a></span>initialize()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
 <div class="memtemplate">
 template&lt;typename GemmDesc_ &gt; </div>
 <table class="mlabels">
@@ -131,7 +131,7 @@ template&lt;typename GemmDesc_ &gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::initialize </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::initialize </td>
           <td>(</td>
           <td class="paramtype">GemmDesc_ const &amp;&#160;</td>
           <td class="paramname"><em>desc</em></td><td>)</td>
@@ -148,112 +148,112 @@ template&lt;typename GemmDesc_ &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="afa888d993b86ed88950a9e5ab7edeb06"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#afa888d993b86ed88950a9e5ab7edeb06">&#9670;&nbsp;</a></span>functor</h2>
+<a id="adb04e5990ab7faae9e8c0b110d2e3bee"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adb04e5990ab7faae9e8c0b110d2e3bee">&#9670;&nbsp;</a></span>functor</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">Functor::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::functor</td>
+          <td class="memname">Functor::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::functor</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7350ceefcd09a9e3662ca30b780cc2ce"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7350ceefcd09a9e3662ca30b780cc2ce">&#9670;&nbsp;</a></span>iterator_c</h2>
+<a id="a0745d33dd881f6ca78b168e05b133ff8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0745d33dd881f6ca78b168e05b133ff8">&#9670;&nbsp;</a></span>iterator_c</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">GlobalLoadIteratorC::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::iterator_c</td>
+          <td class="memname">GlobalLoadIteratorC::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::iterator_c</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a987c179a7e73c2572fe8aef3255668f7"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a987c179a7e73c2572fe8aef3255668f7">&#9670;&nbsp;</a></span>iterator_d</h2>
+<a id="abbcccb203f9823e621caa4475aa3d346"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abbcccb203f9823e621caa4475aa3d346">&#9670;&nbsp;</a></span>iterator_d</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">GlobalStoreIteratorD::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::iterator_d</td>
+          <td class="memname">GlobalStoreIteratorD::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::iterator_d</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a1742e43c128665f0ca39cb578291df81"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1742e43c128665f0ca39cb578291df81">&#9670;&nbsp;</a></span>shared_load_iterator_d</h2>
+<a id="a5d3d1abd85f18476a74bcf616a717f9d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5d3d1abd85f18476a74bcf616a717f9d">&#9670;&nbsp;</a></span>shared_load_stream_d</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">SharedLoadIteratorD::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::shared_load_iterator_d</td>
+          <td class="memname">SharedLoadStreamD::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::shared_load_stream_d</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="af79a0c74a4c30ccec59b393721b5dfc1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af79a0c74a4c30ccec59b393721b5dfc1">&#9670;&nbsp;</a></span>shared_store_iterator_d</h2>
+<a id="adfdf3eca06ea4061fbfe016336a3f276"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adfdf3eca06ea4061fbfe016336a3f276">&#9670;&nbsp;</a></span>shared_store_iterator_d</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">SharedStoreIteratorD::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::shared_store_iterator_d</td>
+          <td class="memname">SharedStoreIteratorD::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::shared_store_iterator_d</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ae0fdc7426b22ff2c20f077e251ebc823"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae0fdc7426b22ff2c20f077e251ebc823">&#9670;&nbsp;</a></span>stride_h</h2>
+<a id="a497b91e93d0eb29ca54553f8de4c694f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a497b91e93d0eb29ca54553f8de4c694f">&#9670;&nbsp;</a></span>stride_h</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::stride_h</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::stride_h</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a565f6cab8925d632dcf24bd1974caca2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a565f6cab8925d632dcf24bd1974caca2">&#9670;&nbsp;</a></span>stride_w</h2>
+<a id="ae814ac640d05358a3ce0ea70ed13ea68"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae814ac640d05358a3ce0ea70ed13ea68">&#9670;&nbsp;</a></span>stride_w</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::stride_w</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::Params::stride_w</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -266,7 +266,7 @@ template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIte
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage-members.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage-members.html
index 4856ef616..9fdea968c 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage-members.html
@@ -73,17 +73,18 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage Member List</div>  </div>
+<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#ae63b5a52106dbd37ea304196335ec210">shared_stream</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a0e05007f939b27e6a17dce5c2a49e3e0">data</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e">shared_stream</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html
index 4cad48c73..cad6b91da 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage Struct Reference</title>
+<title>Cutlass: cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage Struct Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -73,10 +73,11 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
 <a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage Struct Reference</div>  </div>
+<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage Struct Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -85,22 +86,55 @@ $(function() {
 
 <p><code>#include &lt;<a class="el" href="gemm__epilogue__traits_8h_source.html">gemm_epilogue_traits.h</a>&gt;</code></p>
 <table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a0e05007f939b27e6a17dce5c2a49e3e0"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a> *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a0e05007f939b27e6a17dce5c2a49e3e0">data</a> ()</td></tr>
+<tr class="separator:a0e05007f939b27e6a17dce5c2a49e3e0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:ae63b5a52106dbd37ea304196335ec210"><td class="memItemLeft" align="right" valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#ae63b5a52106dbd37ea304196335ec210">shared_stream</a></td></tr>
-<tr class="separator:ae63b5a52106dbd37ea304196335ec210"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64ecac7d5843c38e55df78dcf609d33e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits_1_1SharedStorage.html#a64ecac7d5843c38e55df78dcf609d33e">shared_stream</a></td></tr>
+<tr class="separator:a64ecac7d5843c38e55df78dcf609d33e"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
-<h2 class="groupheader">Member Data Documentation</h2>
-<a id="ae63b5a52106dbd37ea304196335ec210"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae63b5a52106dbd37ea304196335ec210">&#9670;&nbsp;</a></span>shared_stream</h2>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a0e05007f939b27e6a17dce5c2a49e3e0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0e05007f939b27e6a17dce5c2a49e3e0">&#9670;&nbsp;</a></span>data()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage::shared_stream</td>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a>* <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage::data </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a64ecac7d5843c38e55df78dcf609d33e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a64ecac7d5843c38e55df78dcf609d33e">&#9670;&nbsp;</a></span>shared_stream</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::SharedStorage::shared_stream</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -113,7 +147,7 @@ template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIte
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb-members.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb-members.html
index 7e4746ea8..83f269580 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb-members.html
@@ -79,62 +79,69 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">BaseParams</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3af66b82b1a0cc5bf6141f940553e048">data</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6">add_pointer_offset</a>(Index offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">BaseParams</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a34cb153d311377388e7819296a84d07e">GemmGlobalIteratorAb</a>(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a9dea455aa86bb59517b4a4d0309e424b">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1e42503e5a54cdc01308e9030aebdd35">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aa24336597f4a3316d94df6ab0c20f714">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">inc_stage</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">GemmGlobalIteratorAb</a>(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;threadblock_offset, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">inc_stage</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff">initialize_predicates</a>(const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">kIteratorFragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc">kRequiresLoadFence</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">load</a>(Fragment &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db">load</a>(Fragment &amp;fragment) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">load_post_increment</a>(Fragment &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aab37ea6c47e34466371314ed3971dc7b">residue</a>(Index k)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">TileLoadIterator</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23">TileLoadIterator</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6">TileLoadIterator</a>(Params const &amp;, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ac4d2c293f9312b673ea29bf79b2882fd">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018">initialize_predicates</a>(const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block_offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::initialize_predicates</a>(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">kFragmentElementType</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126">kRequiresLoadFence</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a>(Fragment &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">load</a>(Fragment &amp;fragment) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">load</a>(Fragment &amp;fragment, int d)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">load_element</a>(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7">load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::load_post_increment</a>(Fragment &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">operator+=</a>(Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">residue</a>(Index k)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7">stride_advance</a>(void)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">TileLoadIterator</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">TileLoadIterator</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">TileLoadIterator</a>(Params const &amp;, Scalar const *ptr, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html
index 4210572d7..a795acf02 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html
@@ -92,7 +92,8 @@ Inheritance diagram for cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Ind
   <img src="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.png" usemap="#cutlass::gemm::GemmGlobalIteratorAb_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map" alt=""/>
   <map id="cutlass::gemm::GemmGlobalIteratorAb_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map" name="cutlass::gemm::GemmGlobalIteratorAb_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map">
 <area href="structcutlass_1_1TileLoadIterator.html" alt="cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;" shape="rect" coords="0,56,1003,80"/>
-<area href="structcutlass_1_1TileIteratorBase.html" alt="cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;" shape="rect" coords="0,0,1003,24"/>
+<area href="structcutlass_1_1TileIteratorBase.html" alt="cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;" shape="rect" coords="0,0,1003,24"/>
+<area href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html" alt="cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;" shape="rect" coords="0,168,1003,192"/>
 </map>
  </div></div>
 <table class="memberdecls">
@@ -109,7 +110,10 @@ Public Types</h2></td></tr>
 <tr class="memitem:ae13e0d30a941e16875f196b4844b03ed"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; TileTraits_, typename TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a> :<a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">IteratorAdvance::kW</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">Base</a></td></tr>
 <tr class="memdesc:ae13e0d30a941e16875f196b4844b03ed"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base class.  <a href="#ae13e0d30a941e16875f196b4844b03ed">More...</a><br /></td></tr>
 <tr class="separator:ae13e0d30a941e16875f196b4844b03ed"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2180cfbb482d300472ad2993e4b555d4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a></td></tr>
+<tr class="memitem:a646bd38ab95cdf0379ecb372839a9111"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">Tile</a></td></tr>
+<tr class="memdesc:a646bd38ab95cdf0379ecb372839a9111"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="#a646bd38ab95cdf0379ecb372839a9111">More...</a><br /></td></tr>
+<tr class="separator:a646bd38ab95cdf0379ecb372839a9111"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2180cfbb482d300472ad2993e4b555d4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a></td></tr>
 <tr class="memdesc:a2180cfbb482d300472ad2993e4b555d4"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> type loaded by the iterator.  <a href="#a2180cfbb482d300472ad2993e4b555d4">More...</a><br /></td></tr>
 <tr class="separator:a2180cfbb482d300472ad2993e4b555d4"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a5817b81c7013db9a3f7394ad4b1db79a"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a></td></tr>
@@ -124,7 +128,7 @@ Public Types</h2></td></tr>
 <tr class="memitem:afd09d3b8e5ca04eab7edc2e5723816e5"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a></td></tr>
 <tr class="memdesc:afd09d3b8e5ca04eab7edc2e5723816e5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The thread offset.  <a href="#afd09d3b8e5ca04eab7edc2e5723816e5">More...</a><br /></td></tr>
 <tr class="separator:afd09d3b8e5ca04eab7edc2e5723816e5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3dd74f6e12339a87c0eb8f75fbdc7b9c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">Base::Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a></td></tr>
+<tr class="memitem:a3dd74f6e12339a87c0eb8f75fbdc7b9c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Base::Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a></td></tr>
 <tr class="separator:a3dd74f6e12339a87c0eb8f75fbdc7b9c"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a09268125f1e323874f6c12b50185c517"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Base::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">BaseParams</a></td></tr>
 <tr class="memdesc:a09268125f1e323874f6c12b50185c517"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterator parameters type.  <a href="#a09268125f1e323874f6c12b50185c517">More...</a><br /></td></tr>
@@ -133,188 +137,218 @@ Public Types</h2></td></tr>
 <tr class="memitem:a1f3601c595f12e7083919ece9b1ec84e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"></td></tr>
 <tr class="memdesc:a1f3601c595f12e7083919ece9b1ec84e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Do we require a fence?  <a href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84e">More...</a><br /></td></tr>
 <tr class="separator:a1f3601c595f12e7083919ece9b1ec84e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1bc1bd4893c14b313ee71b71db2903f3 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt; TileTraits_, TileTraits_::Scalar, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">Base</a></td></tr>
-<tr class="memdesc:a1bc1bd4893c14b313ee71b71db2903f3 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base class.  <a href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">More...</a><br /></td></tr>
-<tr class="separator:a1bc1bd4893c14b313ee71b71db2903f3 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7c6182031d9aa41d0e4a64516723e20a inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Base::Traits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">Traits</a></td></tr>
-<tr class="memdesc:a7c6182031d9aa41d0e4a64516723e20a inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">More...</a><br /></td></tr>
-<tr class="separator:a7c6182031d9aa41d0e4a64516723e20a inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae8dff52e619f06fbdbca8cb847c79895 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Base::Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a></td></tr>
-<tr class="memdesc:ae8dff52e619f06fbdbca8cb847c79895 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">More...</a><br /></td></tr>
-<tr class="separator:ae8dff52e619f06fbdbca8cb847c79895 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2edd89863b8035137ccd8dd3ad7be464 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">Base::FragmentElement</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">FragmentElement</a></td></tr>
-<tr class="memdesc:a2edd89863b8035137ccd8dd3ad7be464 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">More...</a><br /></td></tr>
-<tr class="separator:a2edd89863b8035137ccd8dd3ad7be464 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaa83f05e0cb3204053c3ee1da036cd36 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Base::Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36">Index</a></td></tr>
-<tr class="memdesc:aaa83f05e0cb3204053c3ee1da036cd36 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36">More...</a><br /></td></tr>
-<tr class="separator:aaa83f05e0cb3204053c3ee1da036cd36 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a11ec4297c9a1352c8005ac222892b35c inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Base::Skew</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">Skew</a></td></tr>
-<tr class="memdesc:a11ec4297c9a1352c8005ac222892b35c inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">More...</a><br /></td></tr>
-<tr class="separator:a11ec4297c9a1352c8005ac222892b35c inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7f1499ada284c21624487d4d3a5dbd10 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Base::Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">Tile</a></td></tr>
-<tr class="memdesc:a7f1499ada284c21624487d4d3a5dbd10 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">More...</a><br /></td></tr>
-<tr class="separator:a7f1499ada284c21624487d4d3a5dbd10 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac2a7f94723259f0d3c7b8a6d5b8778bf inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Base::Delta</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">Delta</a></td></tr>
-<tr class="memdesc:ac2a7f94723259f0d3c7b8a6d5b8778bf inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Delta.  <a href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">More...</a><br /></td></tr>
-<tr class="separator:ac2a7f94723259f0d3c7b8a6d5b8778bf inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9720b1e4a10c2d5aa85f9a9c66a31bbf inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Base::Iterations</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">Iterations</a></td></tr>
-<tr class="memdesc:a9720b1e4a10c2d5aa85f9a9c66a31bbf inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">More...</a><br /></td></tr>
-<tr class="separator:a9720b1e4a10c2d5aa85f9a9c66a31bbf inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8a1527b4b469ae1f97afde2502ece70d inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">Base::ThreadOffset</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">ThreadOffset</a></td></tr>
-<tr class="memdesc:a8a1527b4b469ae1f97afde2502ece70d inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">ThreadOffset functor.  <a href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">More...</a><br /></td></tr>
-<tr class="separator:a8a1527b4b469ae1f97afde2502ece70d inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7c27a7b0d8593b002eca186c15fdc869 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">Base::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">FragmentShape</a></td></tr>
-<tr class="memdesc:a7c27a7b0d8593b002eca186c15fdc869 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment type.  <a href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">More...</a><br /></td></tr>
-<tr class="separator:a7c27a7b0d8593b002eca186c15fdc869 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4af8eeabe7c1ec0362782687a84466e0 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">Base::AccessType</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">AccessType</a></td></tr>
-<tr class="memdesc:a4af8eeabe7c1ec0362782687a84466e0 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory access type.  <a href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">More...</a><br /></td></tr>
-<tr class="separator:a4af8eeabe7c1ec0362782687a84466e0 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaf72c4897641080b1d84c0bbd8d813cc inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">Fragment</a></td></tr>
-<tr class="memdesc:aaf72c4897641080b1d84c0bbd8d813cc inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment definition.  <a href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">More...</a><br /></td></tr>
-<tr class="separator:aaf72c4897641080b1d84c0bbd8d813cc inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aebbe5a0996dcd362caad618e78dc2591 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">Base::FragmentIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">FragmentIterator</a></td></tr>
-<tr class="memdesc:aebbe5a0996dcd362caad618e78dc2591 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment iterator definition.  <a href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">More...</a><br /></td></tr>
-<tr class="separator:aebbe5a0996dcd362caad618e78dc2591 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4c7a3a4917245de8269b74bdabe16b76 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">Base::FragmentConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">FragmentConstIterator</a></td></tr>
-<tr class="memdesc:a4c7a3a4917245de8269b74bdabe16b76 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment const iterator definition.  <a href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">More...</a><br /></td></tr>
-<tr class="separator:a4c7a3a4917245de8269b74bdabe16b76 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a64ae02b44f275ef2f016949aec769328 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">Base::PredicateVector</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328">PredicateVector</a></td></tr>
-<tr class="memdesc:a64ae02b44f275ef2f016949aec769328 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328">More...</a><br /></td></tr>
-<tr class="separator:a64ae02b44f275ef2f016949aec769328 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab457bd7953af9ef418510f55f52d1f39 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Base::Storage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a></td></tr>
-<tr class="memdesc:ab457bd7953af9ef418510f55f52d1f39 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage object that may be loaded from.  <a href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">More...</a><br /></td></tr>
-<tr class="separator:ab457bd7953af9ef418510f55f52d1f39 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a788bab4fa46dc26854348b751cf1cc76 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef Base::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">BaseParams</a></td></tr>
-<tr class="memdesc:a788bab4fa46dc26854348b751cf1cc76 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">IteratorBase parameters.  <a href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">More...</a><br /></td></tr>
-<tr class="separator:a788bab4fa46dc26854348b751cf1cc76 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5a179e148ccd770e1703f288624fa9b8 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> const *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">Pointer</a></td></tr>
-<tr class="memdesc:a5a179e148ccd770e1703f288624fa9b8 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer type.  <a href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">More...</a><br /></td></tr>
-<tr class="separator:a5a179e148ccd770e1703f288624fa9b8 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
-<tr class="memitem:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a></td></tr>
-<tr class="memdesc:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">More...</a><br /></td></tr>
-<tr class="separator:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a></td></tr>
-<tr class="memdesc:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">More...</a><br /></td></tr>
-<tr class="separator:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a></td></tr>
-<tr class="memdesc:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">More...</a><br /></td></tr>
-<tr class="separator:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a></td></tr>
-<tr class="memdesc:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">More...</a><br /></td></tr>
-<tr class="separator:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a></td></tr>
-<tr class="memdesc:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">More...</a><br /></td></tr>
-<tr class="separator:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a></td></tr>
-<tr class="memdesc:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">More...</a><br /></td></tr>
-<tr class="separator:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a></td></tr>
-<tr class="memdesc:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">More...</a><br /></td></tr>
-<tr class="separator:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a></td></tr>
-<tr class="memdesc:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">More...</a><br /></td></tr>
-<tr class="separator:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a></td></tr>
-<tr class="memdesc:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">More...</a><br /></td></tr>
-<tr class="separator:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a></td></tr>
-<tr class="memdesc:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">More...</a><br /></td></tr>
-<tr class="separator:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a></td></tr>
-<tr class="memdesc:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">More...</a><br /></td></tr>
-<tr class="separator:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a></td></tr>
-<tr class="memdesc:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">More...</a><br /></td></tr>
-<tr class="separator:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a></td></tr>
-<tr class="memdesc:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">More...</a><br /></td></tr>
-<tr class="separator:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a></td></tr>
-<tr class="memdesc:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">More...</a><br /></td></tr>
-<tr class="separator:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a></td></tr>
-<tr class="memdesc:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">More...</a><br /></td></tr>
-<tr class="separator:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a></td></tr>
-<tr class="memdesc:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">More...</a><br /></td></tr>
-<tr class="separator:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a></td></tr>
-<tr class="memdesc:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">More...</a><br /></td></tr>
-<tr class="separator:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1dcbf633eac61ff06980e4992fbe8264 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt; TileTraits_, TileTraits_::Scalar, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">Base</a></td></tr>
+<tr class="memdesc:a1dcbf633eac61ff06980e4992fbe8264 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base class.  <a href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">More...</a><br /></td></tr>
+<tr class="separator:a1dcbf633eac61ff06980e4992fbe8264 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6a5d065939282fa1b9454b28a1e73948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Base::Traits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">Traits</a></td></tr>
+<tr class="memdesc:a6a5d065939282fa1b9454b28a1e73948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">More...</a><br /></td></tr>
+<tr class="separator:a6a5d065939282fa1b9454b28a1e73948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aafbb7a2137a07f0e07a12838b66bd511 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Base::Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a></td></tr>
+<tr class="memdesc:aafbb7a2137a07f0e07a12838b66bd511 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">More...</a><br /></td></tr>
+<tr class="separator:aafbb7a2137a07f0e07a12838b66bd511 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a70dfd0b62feb082d8da34af09d9524a6 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">FragmentElement</a></td></tr>
+<tr class="memdesc:a70dfd0b62feb082d8da34af09d9524a6 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">More...</a><br /></td></tr>
+<tr class="separator:a70dfd0b62feb082d8da34af09d9524a6 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaa5d98b72576478ba04e4ad554faa827 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Base::Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">Index</a></td></tr>
+<tr class="memdesc:aaa5d98b72576478ba04e4ad554faa827 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">More...</a><br /></td></tr>
+<tr class="separator:aaa5d98b72576478ba04e4ad554faa827 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb6cc0e2990c06c83b789b579a03b15f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Base::Skew</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">Skew</a></td></tr>
+<tr class="memdesc:aeb6cc0e2990c06c83b789b579a03b15f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">More...</a><br /></td></tr>
+<tr class="separator:aeb6cc0e2990c06c83b789b579a03b15f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a88eaa581e0b5419b98ee5a71073d0539 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Base::Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">Tile</a></td></tr>
+<tr class="memdesc:a88eaa581e0b5419b98ee5a71073d0539 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">More...</a><br /></td></tr>
+<tr class="separator:a88eaa581e0b5419b98ee5a71073d0539 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afc68649cb9bb32931b27e711c7ce2604 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Base::Delta</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">Delta</a></td></tr>
+<tr class="memdesc:afc68649cb9bb32931b27e711c7ce2604 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Delta.  <a href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">More...</a><br /></td></tr>
+<tr class="separator:afc68649cb9bb32931b27e711c7ce2604 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6c570dfa1cb68d436d8da6bd23cce6ce inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Base::Iterations</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Iterations</a></td></tr>
+<tr class="memdesc:a6c570dfa1cb68d436d8da6bd23cce6ce inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">More...</a><br /></td></tr>
+<tr class="separator:a6c570dfa1cb68d436d8da6bd23cce6ce inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae8cb43a98cd2fa28f6457afbda8ec58a inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">Base::ThreadOffset</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">ThreadOffset</a></td></tr>
+<tr class="memdesc:ae8cb43a98cd2fa28f6457afbda8ec58a inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">ThreadOffset functor.  <a href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">More...</a><br /></td></tr>
+<tr class="separator:ae8cb43a98cd2fa28f6457afbda8ec58a inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a46a2cbf407d3f43a7441323d150d96f1 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">Base::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">FragmentShape</a></td></tr>
+<tr class="memdesc:a46a2cbf407d3f43a7441323d150d96f1 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment type.  <a href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">More...</a><br /></td></tr>
+<tr class="separator:a46a2cbf407d3f43a7441323d150d96f1 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae8f2c93ec43646be70d4b9f32d034125 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">AccessType</a></td></tr>
+<tr class="memdesc:ae8f2c93ec43646be70d4b9f32d034125 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory access type.  <a href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">More...</a><br /></td></tr>
+<tr class="separator:ae8f2c93ec43646be70d4b9f32d034125 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4604b230174b11bc7ddf5f3e9a922139 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">Fragment</a></td></tr>
+<tr class="memdesc:a4604b230174b11bc7ddf5f3e9a922139 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment definition.  <a href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">More...</a><br /></td></tr>
+<tr class="separator:a4604b230174b11bc7ddf5f3e9a922139 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad9c77ca0521d18a90dd3542a3941f016 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">FragmentIterator</a></td></tr>
+<tr class="memdesc:ad9c77ca0521d18a90dd3542a3941f016 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment iterator definition.  <a href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">More...</a><br /></td></tr>
+<tr class="separator:ad9c77ca0521d18a90dd3542a3941f016 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad272502e5a54615584bb037a33ff1dca inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">Base::FragmentConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:ad272502e5a54615584bb037a33ff1dca inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment const iterator definition.  <a href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">More...</a><br /></td></tr>
+<tr class="separator:ad272502e5a54615584bb037a33ff1dca inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad71f865c61f02eba981c056ef71653f5 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">Base::PredicateVector</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">PredicateVector</a></td></tr>
+<tr class="memdesc:ad71f865c61f02eba981c056ef71653f5 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">More...</a><br /></td></tr>
+<tr class="separator:ad71f865c61f02eba981c056ef71653f5 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a57eff980f6b1086abe39dd617de5b948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Base::Storage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a></td></tr>
+<tr class="memdesc:a57eff980f6b1086abe39dd617de5b948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage object that may be loaded from.  <a href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">More...</a><br /></td></tr>
+<tr class="separator:a57eff980f6b1086abe39dd617de5b948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aebb9153659320f1391671c215c519e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef Base::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">BaseParams</a></td></tr>
+<tr class="memdesc:a9aebb9153659320f1391671c215c519e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">IteratorBase parameters.  <a href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">More...</a><br /></td></tr>
+<tr class="separator:a9aebb9153659320f1391671c215c519e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a39acc5c35c8db019a3aeef79e8005b7f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">Pointer</a></td></tr>
+<tr class="memdesc:a39acc5c35c8db019a3aeef79e8005b7f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer type.  <a href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">More...</a><br /></td></tr>
+<tr class="separator:a39acc5c35c8db019a3aeef79e8005b7f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a146adfb1951efd70995b05a7a31fd548 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const, 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a></td></tr>
+<tr class="memdesc:a146adfb1951efd70995b05a7a31fd548 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference for the load iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">More...</a><br /></td></tr>
+<tr class="separator:a146adfb1951efd70995b05a7a31fd548 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
+<tr class="memitem:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td></tr>
+<tr class="memdesc:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">More...</a><br /></td></tr>
+<tr class="separator:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td></tr>
+<tr class="memdesc:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">More...</a><br /></td></tr>
+<tr class="separator:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td></tr>
+<tr class="memdesc:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">More...</a><br /></td></tr>
+<tr class="separator:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td></tr>
+<tr class="memdesc:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">More...</a><br /></td></tr>
+<tr class="separator:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td></tr>
+<tr class="memdesc:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">More...</a><br /></td></tr>
+<tr class="separator:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td></tr>
+<tr class="memdesc:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">More...</a><br /></td></tr>
+<tr class="separator:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td></tr>
+<tr class="memdesc:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">More...</a><br /></td></tr>
+<tr class="separator:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">More...</a><br /></td></tr>
+<tr class="separator:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td></tr>
+<tr class="memdesc:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">More...</a><br /></td></tr>
+<tr class="separator:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td></tr>
+<tr class="memdesc:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">More...</a><br /></td></tr>
+<tr class="separator:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td></tr>
+<tr class="memdesc:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">More...</a><br /></td></tr>
+<tr class="separator:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a></td></tr>
+<tr class="memdesc:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">More...</a><br /></td></tr>
+<tr class="separator:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td></tr>
+<tr class="memdesc:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">More...</a><br /></td></tr>
+<tr class="separator:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td></tr>
+<tr class="memdesc:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">More...</a><br /></td></tr>
+<tr class="separator:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">More...</a><br /></td></tr>
+<tr class="separator:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td></tr>
+<tr class="memdesc:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">More...</a><br /></td></tr>
+<tr class="separator:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td></tr>
+<tr class="memdesc:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">More...</a><br /></td></tr>
+<tr class="separator:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:ab9375d9e779dcda79a5cd561bb3762ff"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab9375d9e779dcda79a5cd561bb3762ff">initialize_predicates</a> (const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block)</td></tr>
-<tr class="separator:ab9375d9e779dcda79a5cd561bb3762ff"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a34cb153d311377388e7819296a84d07e"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a34cb153d311377388e7819296a84d07e">GemmGlobalIteratorAb</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> const &amp;_params, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>())</td></tr>
-<tr class="memdesc:a34cb153d311377388e7819296a84d07e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a34cb153d311377388e7819296a84d07e">More...</a><br /></td></tr>
-<tr class="separator:a34cb153d311377388e7819296a84d07e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa24336597f4a3316d94df6ab0c20f714"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aa24336597f4a3316d94df6ab0c20f714">inc_h</a> ()</td></tr>
-<tr class="memdesc:aa24336597f4a3316d94df6ab0c20f714"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the H dimension.  <a href="#aa24336597f4a3316d94df6ab0c20f714">More...</a><br /></td></tr>
-<tr class="separator:aa24336597f4a3316d94df6ab0c20f714"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1e42503e5a54cdc01308e9030aebdd35"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1e42503e5a54cdc01308e9030aebdd35">inc_d</a> ()</td></tr>
-<tr class="memdesc:a1e42503e5a54cdc01308e9030aebdd35"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the D dimension.  <a href="#a1e42503e5a54cdc01308e9030aebdd35">More...</a><br /></td></tr>
-<tr class="separator:a1e42503e5a54cdc01308e9030aebdd35"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9dea455aa86bb59517b4a4d0309e424b"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a9dea455aa86bb59517b4a4d0309e424b">inc_advance</a> ()</td></tr>
-<tr class="memdesc:a9dea455aa86bb59517b4a4d0309e424b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer to move to the next iteration.  <a href="#a9dea455aa86bb59517b4a4d0309e424b">More...</a><br /></td></tr>
-<tr class="separator:a9dea455aa86bb59517b4a4d0309e424b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3af66b82b1a0cc5bf6141f940553e048"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3af66b82b1a0cc5bf6141f940553e048">data</a> () const</td></tr>
-<tr class="memdesc:a3af66b82b1a0cc5bf6141f940553e048"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the current pointer.  <a href="#a3af66b82b1a0cc5bf6141f940553e048">More...</a><br /></td></tr>
-<tr class="separator:a3af66b82b1a0cc5bf6141f940553e048"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aab37ea6c47e34466371314ed3971dc7b"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aab37ea6c47e34466371314ed3971dc7b">residue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> k)</td></tr>
-<tr class="memdesc:aab37ea6c47e34466371314ed3971dc7b"><td class="mdescLeft">&#160;</td><td class="mdescRight">That's the residue! Update the predicates.  <a href="#aab37ea6c47e34466371314ed3971dc7b">More...</a><br /></td></tr>
-<tr class="separator:aab37ea6c47e34466371314ed3971dc7b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac4d2c293f9312b673ea29bf79b2882fd"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ac4d2c293f9312b673ea29bf79b2882fd">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:ac4d2c293f9312b673ea29bf79b2882fd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="#ac4d2c293f9312b673ea29bf79b2882fd">More...</a><br /></td></tr>
-<tr class="separator:ac4d2c293f9312b673ea29bf79b2882fd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aba8142a7a3b43da97f7968d98f3ba018"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018">initialize_predicates</a> (const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block_offset)</td></tr>
+<tr class="separator:aba8142a7a3b43da97f7968d98f3ba018"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab61ce6b04d72d2652ee3bffca3885fe5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">GemmGlobalIteratorAb</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> const &amp;_params, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;threadblock_offset, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:ab61ce6b04d72d2652ee3bffca3885fe5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ab61ce6b04d72d2652ee3bffca3885fe5">More...</a><br /></td></tr>
+<tr class="separator:ab61ce6b04d72d2652ee3bffca3885fe5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a760404b7879a38364d7eef47fc1fe209"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">inc_w</a> ()</td></tr>
+<tr class="memdesc:a760404b7879a38364d7eef47fc1fe209"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the W dimension.  <a href="#a760404b7879a38364d7eef47fc1fe209">More...</a><br /></td></tr>
+<tr class="separator:a760404b7879a38364d7eef47fc1fe209"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1d86f7e16bd11e10c94b0c14111c8c14"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">inc_h</a> ()</td></tr>
+<tr class="memdesc:a1d86f7e16bd11e10c94b0c14111c8c14"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the H dimension.  <a href="#a1d86f7e16bd11e10c94b0c14111c8c14">More...</a><br /></td></tr>
+<tr class="separator:a1d86f7e16bd11e10c94b0c14111c8c14"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2ad473e8f2fa2694617ee39ead5c41b3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">inc_d</a> ()</td></tr>
+<tr class="memdesc:a2ad473e8f2fa2694617ee39ead5c41b3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the D dimension.  <a href="#a2ad473e8f2fa2694617ee39ead5c41b3">More...</a><br /></td></tr>
+<tr class="separator:a2ad473e8f2fa2694617ee39ead5c41b3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae3ecef6501f0761051f298eb7cefcacf"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">inc_advance</a> ()</td></tr>
+<tr class="memdesc:ae3ecef6501f0761051f298eb7cefcacf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer to move to the next iteration.  <a href="#ae3ecef6501f0761051f298eb7cefcacf">More...</a><br /></td></tr>
+<tr class="separator:ae3ecef6501f0761051f298eb7cefcacf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a85afb31647e5cac591b76959a102cd06"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">load_element</a> (typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">Base::AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a85afb31647e5cac591b76959a102cd06"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a single fragment element from memory.  <a href="#a85afb31647e5cac591b76959a102cd06">More...</a><br /></td></tr>
+<tr class="separator:a85afb31647e5cac591b76959a102cd06"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab2bad39cd9e9d27382cf8fb9e05ed593"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">residue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> k)</td></tr>
+<tr class="memdesc:ab2bad39cd9e9d27382cf8fb9e05ed593"><td class="mdescLeft">&#160;</td><td class="mdescRight">That's the residue! Update the predicates.  <a href="#ab2bad39cd9e9d27382cf8fb9e05ed593">More...</a><br /></td></tr>
+<tr class="separator:ab2bad39cd9e9d27382cf8fb9e05ed593"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6ebdbdce88f040fffd3eb60622c6d7e0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a6ebdbdce88f040fffd3eb60622c6d7e0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the valid?  <a href="#a6ebdbdce88f040fffd3eb60622c6d7e0">More...</a><br /></td></tr>
+<tr class="separator:a6ebdbdce88f040fffd3eb60622c6d7e0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a32cd0a03868f52b172d031f23e2c08af"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a32cd0a03868f52b172d031f23e2c08af"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a vector offset to the iterator.  <a href="#a32cd0a03868f52b172d031f23e2c08af">More...</a><br /></td></tr>
+<tr class="separator:a32cd0a03868f52b172d031f23e2c08af"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5940e491967e265630dc0a4b448791d6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6">add_pointer_offset</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> offset)</td></tr>
+<tr class="separator:a5940e491967e265630dc0a4b448791d6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adfb9a7df1b900e4f6ee59c72aabdebd7"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7">stride_advance</a> (void)</td></tr>
+<tr class="separator:adfb9a7df1b900e4f6ee59c72aabdebd7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07989416829cbe7efecb56456c99adf7"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a07989416829cbe7efecb56456c99adf7"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7">load_post_increment</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a> &amp;fragment)</td></tr>
+<tr class="separator:a07989416829cbe7efecb56456c99adf7"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_methods_structcutlass_1_1TileLoadIterator"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileLoadIterator')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:a8291a51bf96f86bc77d0e3453345dbd5 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td></tr>
-<tr class="memdesc:a8291a51bf96f86bc77d0e3453345dbd5 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">More...</a><br /></td></tr>
-<tr class="separator:a8291a51bf96f86bc77d0e3453345dbd5 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a81c9c0b17bf5f214230ecf10e0690a4e inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">TileLoadIterator</a> ()</td></tr>
-<tr class="memdesc:a81c9c0b17bf5f214230ecf10e0690a4e inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">More...</a><br /></td></tr>
-<tr class="separator:a81c9c0b17bf5f214230ecf10e0690a4e inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a93e166575be3b2f7489833ae5da23f23 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23">TileLoadIterator</a> (Params const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>())</td></tr>
-<tr class="memdesc:a93e166575be3b2f7489833ae5da23f23 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23">More...</a><br /></td></tr>
-<tr class="separator:a93e166575be3b2f7489833ae5da23f23 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a53282fa4cb33cfcec79033d26e418af6 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6">TileLoadIterator</a> (Params const &amp;, <a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> &amp;shared_storage, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>())</td></tr>
-<tr class="memdesc:a53282fa4cb33cfcec79033d26e418af6 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6">More...</a><br /></td></tr>
-<tr class="separator:a53282fa4cb33cfcec79033d26e418af6 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afb6320b600f1f561594a9fb543b954e4 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> const *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">data</a> () const</td></tr>
-<tr class="memdesc:afb6320b600f1f561594a9fb543b954e4 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the current pointer.  <a href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">More...</a><br /></td></tr>
-<tr class="separator:afb6320b600f1f561594a9fb543b954e4 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0a93f37fd366a48c4ed6cc39aa850eb5 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">inc_d</a> ()</td></tr>
-<tr class="memdesc:a0a93f37fd366a48c4ed6cc39aa850eb5 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the D dimension.  <a href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">More...</a><br /></td></tr>
-<tr class="separator:a0a93f37fd366a48c4ed6cc39aa850eb5 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a228a95cf2c9c6089287984fcbf5cface inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">inc_h</a> ()</td></tr>
-<tr class="memdesc:a228a95cf2c9c6089287984fcbf5cface inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the H dimension.  <a href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">More...</a><br /></td></tr>
-<tr class="separator:a228a95cf2c9c6089287984fcbf5cface inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a49cf3ee608debebf451cdd8c2125d073 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">inc_w</a> ()</td></tr>
-<tr class="memdesc:a49cf3ee608debebf451cdd8c2125d073 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the W dimension.  <a href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">More...</a><br /></td></tr>
-<tr class="separator:a49cf3ee608debebf451cdd8c2125d073 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a91e13a7aad4b0acac002b6dd125abc37 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">inc_advance</a> ()</td></tr>
-<tr class="memdesc:a91e13a7aad4b0acac002b6dd125abc37 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the next dimension.  <a href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">More...</a><br /></td></tr>
-<tr class="separator:a91e13a7aad4b0acac002b6dd125abc37 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aeb3faf5e8f976f5a4d158ceb41a1cc64 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">inc_stage</a> ()</td></tr>
-<tr class="memdesc:aeb3faf5e8f976f5a4d158ceb41a1cc64 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the stage.  <a href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">More...</a><br /></td></tr>
-<tr class="separator:aeb3faf5e8f976f5a4d158ceb41a1cc64 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2716b9010d2902b90e63abb0531ee915 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it)</td></tr>
-<tr class="memdesc:a2716b9010d2902b90e63abb0531ee915 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">More...</a><br /></td></tr>
-<tr class="separator:a2716b9010d2902b90e63abb0531ee915 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a195993d58ae0eeb53203116ac02ab38d inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment)</td></tr>
-<tr class="memdesc:a195993d58ae0eeb53203116ac02ab38d inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">More...</a><br /></td></tr>
-<tr class="separator:a195993d58ae0eeb53203116ac02ab38d inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9c4b332857f419e6f789a93404dc2140 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it) const</td></tr>
-<tr class="memdesc:a9c4b332857f419e6f789a93404dc2140 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">More...</a><br /></td></tr>
-<tr class="separator:a9c4b332857f419e6f789a93404dc2140 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1058cdec33393db9c16b28c21d8957db inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment) const</td></tr>
-<tr class="memdesc:a1058cdec33393db9c16b28c21d8957db inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db">More...</a><br /></td></tr>
-<tr class="separator:a1058cdec33393db9c16b28c21d8957db inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
-<tr class="memitem:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">More...</a><br /></td></tr>
-<tr class="separator:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60bbb4d4a6a5b8fb32e176e7d33f9e82 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td></tr>
+<tr class="memdesc:a60bbb4d4a6a5b8fb32e176e7d33f9e82 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using a RegularTilePredicateFunctor.  <a href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">More...</a><br /></td></tr>
+<tr class="separator:a60bbb4d4a6a5b8fb32e176e7d33f9e82 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa566cf603a5c19c59946a41b04642e49 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;functor, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset)</td></tr>
+<tr class="memdesc:aa566cf603a5c19c59946a41b04642e49 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using an arbitrary predicate functor.  <a href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">More...</a><br /></td></tr>
+<tr class="separator:aa566cf603a5c19c59946a41b04642e49 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:add962655973d5b8eff5673c04e053e4e inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">TileLoadIterator</a> ()</td></tr>
+<tr class="memdesc:add962655973d5b8eff5673c04e053e4e inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">More...</a><br /></td></tr>
+<tr class="separator:add962655973d5b8eff5673c04e053e4e inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4ffe90c974b260220fe0b44274095322 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">TileLoadIterator</a> (Params const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a4ffe90c974b260220fe0b44274095322 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">More...</a><br /></td></tr>
+<tr class="separator:a4ffe90c974b260220fe0b44274095322 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1636f4e15ca7f9f56bfccb93a2826c30 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">TileLoadIterator</a> (Params const &amp;, <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const *ptr, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a1636f4e15ca7f9f56bfccb93a2826c30 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">More...</a><br /></td></tr>
+<tr class="separator:a1636f4e15ca7f9f56bfccb93a2826c30 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb92092230ae933ff6cc4a36960d0674 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">inc_d</a> ()</td></tr>
+<tr class="memdesc:aeb92092230ae933ff6cc4a36960d0674 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the D dimension.  <a href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">More...</a><br /></td></tr>
+<tr class="separator:aeb92092230ae933ff6cc4a36960d0674 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1b94be88a160b21347c0eb58ed8e1b51 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">inc_h</a> ()</td></tr>
+<tr class="memdesc:a1b94be88a160b21347c0eb58ed8e1b51 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the H dimension.  <a href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">More...</a><br /></td></tr>
+<tr class="separator:a1b94be88a160b21347c0eb58ed8e1b51 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af4f964364fc54a2b9a431fa529f6c44c inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">inc_w</a> ()</td></tr>
+<tr class="memdesc:af4f964364fc54a2b9a431fa529f6c44c inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the W dimension.  <a href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">More...</a><br /></td></tr>
+<tr class="separator:af4f964364fc54a2b9a431fa529f6c44c inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9bda55335fb2e90af2ee7d20571f3d9b inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">inc_advance</a> ()</td></tr>
+<tr class="memdesc:a9bda55335fb2e90af2ee7d20571f3d9b inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the next dimension.  <a href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">More...</a><br /></td></tr>
+<tr class="separator:a9bda55335fb2e90af2ee7d20571f3d9b inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6f74b87df129693ee6ac9a6fcc0c8910 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">load_element</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a6f74b87df129693ee6ac9a6fcc0c8910 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a single fragment element from memory.  <a href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">More...</a><br /></td></tr>
+<tr class="separator:a6f74b87df129693ee6ac9a6fcc0c8910 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64ce59c5deb58e208529761a44c7661d inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">inc_stage</a> ()</td></tr>
+<tr class="memdesc:a64ce59c5deb58e208529761a44c7661d inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the stage.  <a href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">More...</a><br /></td></tr>
+<tr class="separator:a64ce59c5deb58e208529761a44c7661d inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a723041057b1e8212e075959a22c0c120 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a723041057b1e8212e075959a22c0c120 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a vector offset to the iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">More...</a><br /></td></tr>
+<tr class="separator:a723041057b1e8212e075959a22c0c120 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad65b7a0a5b4f42c590642ef7b269f232 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">add_pointer_offset</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> offset)</td></tr>
+<tr class="memdesc:ad65b7a0a5b4f42c590642ef7b269f232 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a raw offset to the pointer.  <a href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">More...</a><br /></td></tr>
+<tr class="separator:ad65b7a0a5b4f42c590642ef7b269f232 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a31a021d6c099e8027fa9bcb5fdc21c11 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11">stride_advance</a> (void)</td></tr>
+<tr class="separator:a31a021d6c099e8027fa9bcb5fdc21c11 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4d437597ae736c581a9ba0764f9d955f inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it)</td></tr>
+<tr class="memdesc:a4d437597ae736c581a9ba0764f9d955f inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">More...</a><br /></td></tr>
+<tr class="separator:a4d437597ae736c581a9ba0764f9d955f inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5c8a4318ffd400363d9c7572c07ff32a inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="memdesc:a5c8a4318ffd400363d9c7572c07ff32a inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">More...</a><br /></td></tr>
+<tr class="separator:a5c8a4318ffd400363d9c7572c07ff32a inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa856180123f8d50a00222542fa6345cf inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it) const</td></tr>
+<tr class="memdesc:aa856180123f8d50a00222542fa6345cf inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">More...</a><br /></td></tr>
+<tr class="separator:aa856180123f8d50a00222542fa6345cf inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a83dadcea858a5e426dcea54400138480 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment) const</td></tr>
+<tr class="memdesc:a83dadcea858a5e426dcea54400138480 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">More...</a><br /></td></tr>
+<tr class="separator:a83dadcea858a5e426dcea54400138480 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1b070fc66109d372f5a45a5857594ac6 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, int d)</td></tr>
+<tr class="memdesc:a1b070fc66109d372f5a45a5857594ac6 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">More...</a><br /></td></tr>
+<tr class="separator:a1b070fc66109d372f5a45a5857594ac6 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
+<tr class="memitem:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">More...</a><br /></td></tr>
+<tr class="separator:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
@@ -328,15 +362,15 @@ Public Attributes</h2></td></tr>
 <tr class="memdesc:af323c9db74f0de3376edd35eb377bc9c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The predicates.  <a href="#af323c9db74f0de3376edd35eb377bc9c">More...</a><br /></td></tr>
 <tr class="separator:af323c9db74f0de3376edd35eb377bc9c"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_attribs_structcutlass_1_1TileLoadIterator"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileLoadIterator')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:aaafe35622751532971c1b7efc54c888b inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a></td></tr>
-<tr class="memdesc:aaafe35622751532971c1b7efc54c888b inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters structure.  <a href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">More...</a><br /></td></tr>
-<tr class="separator:aaafe35622751532971c1b7efc54c888b inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7726cdd4fe056c59bb04adb9e5504457 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">thread_offset</a></td></tr>
-<tr class="memdesc:a7726cdd4fe056c59bb04adb9e5504457 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">More...</a><br /></td></tr>
-<tr class="separator:a7726cdd4fe056c59bb04adb9e5504457 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa3fd9859de68d76e07ebee06c6ccee92 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a></td></tr>
-<tr class="memdesc:aa3fd9859de68d76e07ebee06c6ccee92 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stage argument enables wrapping after some number of tiles have been loaded.  <a href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">More...</a><br /></td></tr>
-<tr class="separator:aa3fd9859de68d76e07ebee06c6ccee92 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5561e676148200c2fc85a603847cc596 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a></td></tr>
+<tr class="memdesc:a5561e676148200c2fc85a603847cc596 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters structure.  <a href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">More...</a><br /></td></tr>
+<tr class="separator:a5561e676148200c2fc85a603847cc596 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7808588ce0b12017379dcbe1ba9c511f inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a></td></tr>
+<tr class="memdesc:a7808588ce0b12017379dcbe1ba9c511f inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">More...</a><br /></td></tr>
+<tr class="separator:a7808588ce0b12017379dcbe1ba9c511f inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad8e730768c1805d98e23886a492389d3 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a></td></tr>
+<tr class="memdesc:ad8e730768c1805d98e23886a492389d3 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stage argument enables wrapping after some number of tiles have been loaded.  <a href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">More...</a><br /></td></tr>
+<tr class="separator:ad8e730768c1805d98e23886a492389d3 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
@@ -347,38 +381,41 @@ Static Public Attributes</h2></td></tr>
 <tr class="memdesc:a8c1e871f17685b16a7a41fcc888f0125"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies in which dimension post-increment accesses advance.  <a href="#a8c1e871f17685b16a7a41fcc888f0125">More...</a><br /></td></tr>
 <tr class="separator:a8c1e871f17685b16a7a41fcc888f0125"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_attribs_structcutlass_1_1TileLoadIterator"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileLoadIterator')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:a69d2f21c8188fb3229af8c2dbe0a23b6 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">kAdvance</a></td></tr>
-<tr class="memdesc:a69d2f21c8188fb3229af8c2dbe0a23b6 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies in which dimension post-increment accesses advance.  <a href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">More...</a><br /></td></tr>
-<tr class="separator:a69d2f21c8188fb3229af8c2dbe0a23b6 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aba1d75a0cd5f11dee2aecf89b2b13d98 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">kIteratorFragment</a></td></tr>
-<tr class="memdesc:aba1d75a0cd5f11dee2aecf89b2b13d98 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies type of iterator fragment storage (Salar or WmmaMatrix)  <a href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">More...</a><br /></td></tr>
-<tr class="separator:aba1d75a0cd5f11dee2aecf89b2b13d98 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac21bd78b31c99c826f0eddb5aa033bf1 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">kMemorySpace</a></td></tr>
-<tr class="memdesc:ac21bd78b31c99c826f0eddb5aa033bf1 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">More...</a><br /></td></tr>
-<tr class="separator:ac21bd78b31c99c826f0eddb5aa033bf1 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_static_attribs_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
-<tr class="memitem:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a></td></tr>
-<tr class="memdesc:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">More...</a><br /></td></tr>
-<tr class="separator:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a></td></tr>
-<tr class="memdesc:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">More...</a><br /></td></tr>
-<tr class="separator:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a></td></tr>
-<tr class="memdesc:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">More...</a><br /></td></tr>
-<tr class="separator:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a></td></tr>
-<tr class="memdesc:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">More...</a><br /></td></tr>
-<tr class="separator:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td></tr>
-<tr class="memdesc:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">More...</a><br /></td></tr>
-<tr class="separator:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea9fbc738003a7424cfa9b0527d4a352 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">kAdvance</a></td></tr>
+<tr class="memdesc:aea9fbc738003a7424cfa9b0527d4a352 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies in which dimension post-increment accesses advance.  <a href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">More...</a><br /></td></tr>
+<tr class="separator:aea9fbc738003a7424cfa9b0527d4a352 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2af872794b35a631f9c1a97df0c6d177 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">kFragmentElementType</a></td></tr>
+<tr class="memdesc:a2af872794b35a631f9c1a97df0c6d177 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies type of iterator fragment storage (Salar or WmmaMatrix)  <a href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">More...</a><br /></td></tr>
+<tr class="separator:a2af872794b35a631f9c1a97df0c6d177 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a44424164c9347f9916b2b86858706043 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">kMemorySpace</a></td></tr>
+<tr class="memdesc:a44424164c9347f9916b2b86858706043 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">More...</a><br /></td></tr>
+<tr class="separator:a44424164c9347f9916b2b86858706043 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a84f2f19069c3b003b1fcad438f690bc8 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">kAccessSize</a></td></tr>
+<tr class="memdesc:a84f2f19069c3b003b1fcad438f690bc8 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">More...</a><br /></td></tr>
+<tr class="separator:a84f2f19069c3b003b1fcad438f690bc8 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
+<tr class="memitem:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a></td></tr>
+<tr class="memdesc:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">More...</a><br /></td></tr>
+<tr class="separator:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a></td></tr>
+<tr class="memdesc:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">More...</a><br /></td></tr>
+<tr class="separator:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a></td></tr>
+<tr class="memdesc:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">More...</a><br /></td></tr>
+<tr class="separator:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a></td></tr>
+<tr class="memdesc:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">More...</a><br /></td></tr>
+<tr class="separator:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td></tr>
+<tr class="memdesc:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">More...</a><br /></td></tr>
+<tr class="separator:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_static_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, IteratorFragment::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
-<tr class="memitem:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset=make_Coord(0, 0, 0))</td></tr>
-<tr class="memdesc:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">More...</a><br /></td></tr>
-<tr class="separator:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">More...</a><br /></td></tr>
+<tr class="separator:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="ae13e0d30a941e16875f196b4844b03ed"></a>
@@ -422,7 +459,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">Base::Fragment</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">Base::Fragment</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -454,7 +491,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a>&lt;<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">Base::Iterations</a>&gt;::kCount&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a>&lt;<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Base::Iterations</a>&gt;::kCount&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -523,11 +560,27 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a646bd38ab95cdf0379ecb372839a9111"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a646bd38ab95cdf0379ecb372839a9111">&#9670;&nbsp;</a></span>Tile</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef TileTraits_::Tile <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">Tile</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a34cb153d311377388e7819296a84d07e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a34cb153d311377388e7819296a84d07e">&#9670;&nbsp;</a></span>GemmGlobalIteratorAb()</h2>
+<a id="ab61ce6b04d72d2652ee3bffca3885fe5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab61ce6b04d72d2652ee3bffca3885fe5">&#9670;&nbsp;</a></span>GemmGlobalIteratorAb()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -538,7 +591,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a> </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> const &amp;&#160;</td>
           <td class="paramname"><em>_params</em>, </td>
@@ -553,7 +606,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
           <td class="paramkey"></td>
           <td></td>
           <td class="paramtype">const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;&#160;</td>
-          <td class="paramname"><em>block</em>, </td>
+          <td class="paramname"><em>threadblock_offset</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
@@ -577,8 +630,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a3af66b82b1a0cc5bf6141f940553e048"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3af66b82b1a0cc5bf6141f940553e048">&#9670;&nbsp;</a></span>data()</h2>
+<a id="a5940e491967e265630dc0a4b448791d6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5940e491967e265630dc0a4b448791d6">&#9670;&nbsp;</a></span>add_pointer_offset()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -589,10 +642,11 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> const* <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::data </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::add_pointer_offset </td>
           <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a>&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
         </tr>
       </table>
   </td>
@@ -604,8 +658,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="a9dea455aa86bb59517b4a4d0309e424b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9dea455aa86bb59517b4a4d0309e424b">&#9670;&nbsp;</a></span>inc_advance()</h2>
+<a id="ae3ecef6501f0761051f298eb7cefcacf"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae3ecef6501f0761051f298eb7cefcacf">&#9670;&nbsp;</a></span>inc_advance()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -616,7 +670,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::inc_advance </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::inc_advance </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -631,8 +685,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="a1e42503e5a54cdc01308e9030aebdd35"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1e42503e5a54cdc01308e9030aebdd35">&#9670;&nbsp;</a></span>inc_d()</h2>
+<a id="a2ad473e8f2fa2694617ee39ead5c41b3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2ad473e8f2fa2694617ee39ead5c41b3">&#9670;&nbsp;</a></span>inc_d()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -643,7 +697,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::inc_d </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::inc_d </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -658,8 +712,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="aa24336597f4a3316d94df6ab0c20f714"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa24336597f4a3316d94df6ab0c20f714">&#9670;&nbsp;</a></span>inc_h()</h2>
+<a id="a1d86f7e16bd11e10c94b0c14111c8c14"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1d86f7e16bd11e10c94b0c14111c8c14">&#9670;&nbsp;</a></span>inc_h()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -670,7 +724,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::inc_h </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::inc_h </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -685,8 +739,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="ab9375d9e779dcda79a5cd561bb3762ff"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab9375d9e779dcda79a5cd561bb3762ff">&#9670;&nbsp;</a></span>initialize_predicates()</h2>
+<a id="a760404b7879a38364d7eef47fc1fe209"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a760404b7879a38364d7eef47fc1fe209">&#9670;&nbsp;</a></span>inc_w()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -697,7 +751,34 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::initialize_predicates </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::inc_w </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aba8142a7a3b43da97f7968d98f3ba018"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aba8142a7a3b43da97f7968d98f3ba018">&#9670;&nbsp;</a></span>initialize_predicates()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::initialize_predicates </td>
           <td>(</td>
           <td class="paramtype">const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;&#160;</td>
           <td class="paramname"><em>bounds</em>, </td>
@@ -706,7 +787,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
           <td class="paramkey"></td>
           <td></td>
           <td class="paramtype">const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;&#160;</td>
-          <td class="paramname"><em>block</em>&#160;</td>
+          <td class="paramname"><em>block_offset</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -723,8 +804,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="aab37ea6c47e34466371314ed3971dc7b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aab37ea6c47e34466371314ed3971dc7b">&#9670;&nbsp;</a></span>residue()</h2>
+<a id="a85afb31647e5cac591b76959a102cd06"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a85afb31647e5cac591b76959a102cd06">&#9670;&nbsp;</a></span>load_element()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -735,7 +816,121 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::residue </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::load_element </td>
+          <td>(</td>
+          <td class="paramtype">typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">Base::AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>c</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a07989416829cbe7efecb56456c99adf7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a07989416829cbe7efecb56456c99adf7">&#9670;&nbsp;</a></span>load_post_increment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::load_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a32cd0a03868f52b172d031f23e2c08af"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a32cd0a03868f52b172d031f23e2c08af">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&amp; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab2bad39cd9e9d27382cf8fb9e05ed593"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab2bad39cd9e9d27382cf8fb9e05ed593">&#9670;&nbsp;</a></span>residue()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::residue </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a>&#160;</td>
           <td class="paramname"><em>k</em></td><td>)</td>
@@ -751,8 +946,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="ac4d2c293f9312b673ea29bf79b2882fd"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac4d2c293f9312b673ea29bf79b2882fd">&#9670;&nbsp;</a></span>valid()</h2>
+<a id="adfb9a7df1b900e4f6ee59c72aabdebd7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adfb9a7df1b900e4f6ee59c72aabdebd7">&#9670;&nbsp;</a></span>stride_advance()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -763,7 +958,35 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE bool <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::valid </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::stride_advance </td>
+          <td>(</td>
+          <td class="paramtype">void&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6ebdbdce88f040fffd3eb60622c6d7e0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6ebdbdce88f040fffd3eb60622c6d7e0">&#9670;&nbsp;</a></span>valid()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::valid </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -904,7 +1127,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.png b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.png
index f6dfb5958383efeffe81aab5acd3787ea820e1cd..06b073c800b8ea067284659193fdd135b2e328c7 100644
GIT binary patch
literal 4486
zcmdUzd0dj&zsIqfY*ky#$+a1$WvtYi%u!QX#w{l`H*y3m8#7nj02PIrO3fu}%B4sd
zGnYUxR}=&-w^1gYBp^Y-EYd*4rAHJ*FINBj?w!|N{<`;`*Xwzn?{i+~`#R70p7VX5
z&v|Zox;t;)puYhG0&RA6`N<0eS}jrAZR=L6?{2VF+tiP*J%9FbTwY#Qn^VAe`E$f=
zwe{(0Yim1Kljx^@U6<hH?hR5mS}E*apTi)~7G2k$PWU8hNQ)$KqqaJ0`BFmava`d1
z^8vqySYG{Aez|pf(Hei_;c_eN{jnsi*<<||ipOmJnmwkyzAoHzGvNf{_$YP7c)OMB
zdoA44sGy0g?{iJu)PZ3Cq3_cz+Rd$yI5%`BD4(E>7z6c!K;Kjscy^ie-Oobpmqp^z
z92=G^a79GA3&-<&0{`4wt(xjXd`ol~k+;bUiWw;Xu33#q?I61;v}`u??`UC`(AQ)7
z1efNY!~<A8L(D}%*4}r@Uow__a?@$O)A<q#*WGw}p(uq7m<XD=)<l=aZDjm7LO9Q@
zNPXY<y@JAD=tZ&PkHx3bO38X}q^$v*yjD92RL}yellRGqltn}YOkTGh6NC4=7#UjI
z1x@!Io({~YEw>8rsfv>+{I*D>gEzd09v>76UTtRbMq;GwMzmAYTo5Y7XvFh6eyDjg
z?LeG}@iAFNu{yBeUoj9X3@&0j)aQvKSmd|Bqva5?-a;Ljrt*q(xwC-|iKY!9{R6av
zh%=YKPJ>T=uwg%_PCIvZF$Uf{_F{0Tt~H4`TqU@!mqX<8a2KsptP}ReHe!^lv!wZ+
zqW#;63M40}s$}QXSz#9tEyxEZCa$97%a*0WSi0f-A7uLb<c3~SNz1ET?~=iL!>Rs5
zw?$&&3+dzI;9=glGZAao;kW(4PE-QP&mU2#dyG+QM@CVe_LZuRt2#aet<}6gd)JOq
z{!_OwHJ@btOiKD8l}}}~Zl>HzdDEsXZ*8T^*Z?GQIa4D4p~<A<PP(Yrq8o`VZGK0n
z`u>_QFe3k{N$F{dtztG?m7H-<oAcbeDz2c`0N52G*sd37=Ld%%YJ=Sd6g%t<FH|2#
zG!b;c&GDk(IVF42xq?hVHwb5fZKP}K=N^Km+EqcNvWH0$Wf;G8B>60uHz0s2>Dw;L
za=HMsL<G?|_pJM4dth=@xbdtz5M%#B%g;mZ%UD;&^P~#CFYcT}AZMo6X)9E_?I^8(
z?Kucmy3o#QDWX{uumY8ly^VB|G53R_njm44UROOGZg)2`%)^h7Wzl)baNd~a2jt<4
zL7QR|3q4>K;*kq`K1vj&P;eaGK3%X5@h1>aV;Vlauu#NLFRovlFg1GY)lKaMj*f{7
ztIwc?%9SZm>9X)t%*_~_lJxWdtu`eft#U5fe?al>^z@=4nU%bNx(WG8XmK9w<m)u~
zvfu)`c~+#u-!GcrOiG5BFE?y6OV6Z;J(cSrsNfo*C`)wC4S(qr(MEP}pEd=d@|c7g
zCA)T{<{#9S-ArhKIQr%1QF+yK$%!F6{t~>@e7*3+_<NT=3?wxtluXomu7`2~Hm01f
zFF5s)`6!$jQL;=fQZ7b5Af5pb#;wc8lKF23QEcwlLV$k;Tm6JkU3cBnzDLsu?E$1$
z<2S1GCZT7ueZlPqM{pPLElWofa^jK&8^OL4R{JJ2t48cGHQHIC$VRuxhO1lO9QjXa
zv71a>%l^aGT#q}JRNQ{7KfdrYb4*w1fR=V+G}c@J>44I{Bd=B)mIqofj>we?r`=yF
z^w_3$$3g2r*S2ysRvia@eZNpk2ehh9&7zfNU0<4+#~SSdt+^6=Qv%Z11<H1VYOVum
zoQICuuDGf(_Q|!N>3`W3dn>7U%(8#h@cpMq%-*(K35~vw=67FW6brMeT+3FEf^fpB
z@|GJEvI1kM78Fl5VH>lg6_be9%N*kJeBy1v*KYit`wWv{F7WK3&^RiL)L1_}s#y`2
zgp6+Cb0xB<azF^nK-gClyo^XXf^JZ3uR9=AK8w}6rR@UTj-IJ(tcrzO7@nb7=N0Vv
zxSN~1)f>^zg@Rx61sijt%P1#b**<K-3k;;iA>Gkn8`e^SJPL6XJU$QrnO^QOr3YfM
zZ2+ZvxS3(Mi*2gqajM}_OOVOEer+lPX2w;-C}oZ08C2cxBuK2CFE*M^4k~DjVDUT~
z3H(rS7jmlv9dVg$B)f50;$P!9Y}0DP%Reo@z_~WB>No$mBbq<%{gzY!KQt2cO7sfX
zE~8=QTngj`Wv^UWzq*CylO*7ylcrp*CG!c~RBvy?&rM^F*fQ-)gX3JoMb#RU`>oW#
z_g-})t~if84#1m><;5V5LP)e)4$_Pj5B>~elI;*~W+BvR|KS8KVqnI5>4~lVPPnzF
zy%5=A7K2t5*$@0ih1e_mYAI_h%yB0Almefk)zl4Kyhl7rmL{(L*mHpC;9OC*13x-t
z#wFGZ^pPmZdM?ftCF^yM*xkPxq0l|u@LsAT&EdhuL!Hp?6wipXcQ#gmFn@w%!g4>p
zd1=Ij_EKI4rz8}KWO!tc&|#8(5*$yrj*E4)Vx_bUJo?e3Z((Xgo8TdOb&)IMw?ryW
z{31-YBEHtoQjQr%+jJmt#`k(eZCQ&|riPV@J30|gQ4wZ-Gf!UT8!S~xq*^j4SRY<=
zZm%ixkyjVo7mR+4C}8LHO=OXCG>Rlrez%myF!Ho{F96(g%-3RS2a4M|iJD{xfgl<a
z%>NCHrimky?xJa+ZdYonci$_Z-K-urRB`f^yWxw4Yo+v2#fb&`Ljo_n?Tty-7kt{%
zM;GRH^M`hZ5fDcu87pt1&qirghW4t~^|BI^%ABo~VK5;I?a3{$lkDrf1;gI{jTVy&
zt(NphXSe%IlBQKU>D`Dvz#<#@G>Wc2Fsxn*x<TmBx*W(?e$4(sQ<7IA?#+dx@=Jp#
zRY13WjH)utK2G)Q2_h2<tMX`O6#3oJuw!lHTI9He(CHY1<b}o--^mW!QE871f7pG?
z<@=t^AGmv?h}6`%i$0;)+^5&0gHrZ)%=PlBCm7_(yQRMOe~ILi9^P}U#l28;-JR~e
zdUR*zcl%HIu763Agx;!eLW_4Et+SYGwqrUC%Zw?T2bvhzQhFHoT{C`oPsemdfEN&W
zP?mm;Wvdf5MiuWeB>Mqx7uzm_X}j1{U6T-tl#dgF4M%^Mv|0=(hbtAj`8tHX3pZbm
zQpF~t_H1x6axB=WjC~scL+n%6Enk2Cbg8&5>tDI>&)9`R@&6*~a@QRP%@@pnrKYAD
zpTB=*;L}Bg?%*dV=6$Jv`s7ZmuyfPt&+Pm)`2Q9=|0l3tvMCRH@chUb@51u14Xh()
zPCZ}qdGxpcs~tet83G5_&{-nQkwSDX2{OEVG#8VdDj}7zFv=$<4@QMT=#uq1AVyJ>
z))XwI3y8=_kIgqWiB%PE9TvD<TzJYoL|(lZqTZdfYjs~UIfBd)x^yN~Nl!2@uKucy
z{7{6|R5h9fAgQ@XSq$!lZQds+Mw6{YRJu=o9Ah!?ZPh7_BSWDB=1U8Rwd$^ZhHB0m
z68$Z8P4;Lxbj}jju)zo$%&Y1uq2o~B->7E~LL($(x7|^16v;i2MaiWaqKXGR%no*$
z`a2y?tvJhvheD?I^v!0KRLoyJeFJGnlav?`iOiDlqAQumE=@9Ji!!MJcL7!ST5Bq7
z)V6JGoQj!_aT_Z?9mov$CR_+~s~U}sZipfIPlhge3AF<xoWJM&s2CZ98t6O`!Vv)B
z@mFTH@iiPASNgN(Qcm*j&3!AO?WQ4AmBJc{^jM~tFL3tl1e-OTfx&n9I#1-!O>QDC
z2ivxxbhsK0&UYqB5?GduUO1l8Td1wnwdceo{g}{RBEi)HK0JeoHlUa;eaL}3{!yqk
zWwa9C!^3eOXO#JWS#K_YyJ=atGVIeojMOo(ui*wI<Mr8d$`d6VdUK*5We0+OG2o42
z#>>B*@{%L+>ujYz<X9T1ML}Cdh6IGYjr~=5Hw1*uSI=qsYw^Ce3~1(@41bphO;(GN
zT(x>w+U^>81vI7lZ;1|bvIpzPjj#vhmS<So)eF&S%`VWQ+u|y<B2lN8>*w@3hf!sI
z%D3z<`F75n;QUGXto<Ts4j=meAZh+NEtd^HA1W72M!BCA-%|Q{Ked>#s?>7%qH6w`
zUg{$zJeZ2{5svs=|1jeXkc8ATk4?ga$q^swg&2aT8-FlFmP}a7hVLa4G26iJ6%8I%
zJOgr2h{HJjNWM1O=q*(o<OGGN3<FZ>`{IdL<&8|dR6fw0$lx%kF#`0li6-B{T2^Wk
zI-Q@uX@=rBX|;%W`uALES?#@9kz7C2=ybyyhr39io01jonTl&7D-QY9B$zq48>eKB
zK{N^2!0~e&*&}S|glMJ`Pa@IG^XhL%B)jVn;+*n)e0aFh--l8j?y1@o3j;0=&BhnB
z;jH^D()P>}jos(K5lK}_zwmrN$TK3xm2|lxWhB|4raByMrMwVK6IZCkpGm1i;n;o<
zhx;~(6n&#Y8wM6P@i^X<n2`I-C^JCyv>|$P4!lev$CODB9mNDRmpFWu=@AK0ZC~l}
zBUC89?9I!1Ec2TvHgYagwE@U)9f2r|$AnQ6-Jx=_HIZP7bVH-k*w{lbz%FB@$3N#d
z0HaeihUS`}pbrl)MQ>hjPA9{Aqx-DL)(BNhnI;*YWwxp_fi2smj{L0;`Hu>O6ez>L
zDJ8%wv1eM^?B0zJHKKfz>CTL4HQ63MjLQl|M4aW?HR_TrEb^>U45DCg-$gz%Y%^;`
z=VCI|fgSs?NVpuoWwb_&SDzD>b~YX+D6X)Ke3#A49hLI_o<R$`?=`WrIwsf*R+5p1
o`Y#0c->Kt&UPu377yJ|Z-6rR6z>ObxAa!wdbpMHb^89cA2H@4>NB{r;

literal 3492
zcmdUxdo+~m9>>Rac4(JstAvnp31R0FC6tIU?$;WZB$I|1WM(kN=z<fX#$`fAxkQ-}
zW5&3RsWx2<Cb!pRL=l6*<T6AqXR3YHI_ICW_gd$#{jBx8@Atdj-}C&Q_xC>UXFaza
z?X9+NmE8&gfwqIKEu29hQJzr$Q(RPdEp<=&Re0OyXzOaZxw$Enp9K?-Un1`c)%X7V
z`SWv?k?uk(9^q{70uly&YdtNly2APNz!s-nBSmKNI4I7EZ5H%|Ai<{DN)52R;Vq@O
z#$?(buC~karvv{~@&T)>q&wTF7H8PnsBf15<5QGnz`A(-13=vmq5VGufof`^2o5~j
zX0}3_#rsA0Xn+%`F{DdshZrFRGE+`|?Y8(LN#4`+GB%6?n{TG*1k92<qcp29i~0K}
zbic-=vKAXww84sVH=zjku}M*5?^bdPLhGbbBiojGW~LsKG>QkfFg3`B7}epPRf68K
z`=oUzJZT})m?UNMhD(@?=6d5zN4?2>bYG!A*BHx)9O0i;05aK39-jL;_&`d?igpTm
zmecw=_Hu4p8(G=SOK%qjdas~@1?6F^TDx4b@fjvgJPrjZ9kun$_G&w61>yod1tD3t
z+-&$Q-)^O=Z`&92`AGJQHNpD|=!zC)9oHRQny;lZ2C+VOI3B<s?;6Vprq&-R%N?+K
z&@FC{4>vWa+!JMJIEM*CK?KreE&jBhd|(f>G!dyS*sh4eilr#Qq_y*_?+NtHuY6LU
zMl!e~u;}?yxhpg7(|gEPuk#vJ!1AW=qO;<$2Yja1oe$#y(^o5|M?yH$qqX6h<YmgW
z{wCBMVVB{joEhERyO0W8u_1NH_M%S!tq^sQrgPIChSj@<AlN&ZrSHx^@!sh!V*eFG
z=FFlukLS@Hn+OmFwIyaJLy4IT68%b;#AP?BJ8V{x7GO#VXOWrZeQdjFB*h@3f)#51
zb>eaV)gIz_=*P@P==n@l*tF#X$RpmPtkb9(e8yZ`E5q#sQaooj(Y+1=CZ2p35^HFd
zsjAJuk(T7B3aeKA1Ia<m81)uPv7j{)#aqHQoeJmW&4#yGY@^lZAH3P$TgMV}!MpCH
z4P7BBVei-~V2tiB8~V@2Om@5It7F2`c$n<Ubg_X}&w9U24=k1;le{e>>S~7hv-Jib
z8d>(KR+EWtnelIKgco4?bZ82zzI5jS?0RVe2CBn;G^S)&%ZN|0-pVHEp&KJ)m2913
zWRp@ZHliO2rbC*2I#%}-Gs%L)#3;nIOXr`$F`j3{B{=j3Y}BufW(4WNG@J(}doKDW
zEsb>N2;f1_oGQQHM`)U;p7fmV@N_hP{HQ|1&`s>Y9@HDO*FG%yTGFk{M?IiviJpP$
zX|P$Z$xknuowXLI9{#aEH%I}*;rH{hZdHEC8TnX3QBXq}5-fWwSNAYjt>y)XqdK*5
z2&^@vx6Wh@I#^(@&eE#FUzMT3b+4Eug5loJ;bxFdHIl0Gq_SaTy{h2%F|O?<UzZ?P
z>v2+t#E4kJKG|epz42!smuB&gT>`J>MlRgAR|HwR(_am!ytT&PD+;Up3nJ=@$#*Jb
zXE^Js7waDcZTWCvL^@97H_#SeYZ4M9>I+I3>(xn?e-7Fg=Tr%ZY>N}wmzCJ9h5Ghr
zOEXmLTckfJ;+uW-hxPg~@NZ+kaIOCjK+2OH*j9L`?Sg}8nK6#ovoVP7oUcsHOIfVD
z9XNHmmB1hup0{D`R(#Mh$~lf(;4LgGz&Gf+l{4JMW6(oZ9gr5{PMFuSB~x=<6knv>
zHgc~B-!|LuP#UF~LH}vhn#XvVQIx}`4!sQydeK3Scx$1ZD7D;WfPiEQXzL@koR7ez
zC<8@X_>ATnZr(b-cUbY=DvX&4lnJL(c;9umC?%4qKxNC(8ZT(DH-6hR<ZEtdqbTgH
zbeE+7q9DfmHSrAR)c#DW87*yHxf+=Z2S2U3TreG=WZ8CKCz=C+hgHcp@o^em^|dA)
zC2PS1M5qzQ+ks)URt>NfChKC~+xX~P()0_C&^8R1R?y*AQb{95QjNA{u+tJ#BIdMr
zUQ;sm_=`hh2xuD3^=c$ONllX%gP`Sgdik{VU+Do_z?CO?AC%R(E>gKq>uPTg^XK+z
zP;*Xz=WgRDV4XF$)cHsVF8kyBsxhYMdW^dQ_7VqkJ&`pIiS@MXF?v|?VPI}I8a?)u
z(IxHl>Nukdznd5unGIA?hQyxM3vL0)4|CD5OZrmm>k$L;Hu!Mu+{1|O@w5CnRFR;)
z^J%303d<OR%0rgTX97D?sc=SWqwVD0F@AnH%WM`s`R*BYXnucr>A}{~yoB+=JGGe4
zd9&&8sdGF?PA?VR5>0fQ_EX%p%=Qa0Y0|Y53l2B=?3iC0pX!P@TItr^SW=N*-#|88
zJ5MIalv9Tm=syFcZ~9yd)}5yU()9Bw@Zw$A`_RJ=!x-x|!_~mDXp(6V*)TdHbj`0s
zOC+&ao*dwuxjP^B*^&1#A+V^Sl+kjEY0Wbpv%SDaJ<_PDxBZke(Hv7qM^lI3Otm%g
z`jd_cpT!0!PbW=3EA*XLuSbt12f7Jok{7fjON%qc#7E!_j4mH`Y=18gE+&L+RkRAw
zyLwu}eLR&)T+VN?qGxzw8bS&%UR>(Nb-Mik)TAhT!e!%S5br7qmwgdDcN|l6UV^_1
zRaUzP=E*agq8AE$b{KcAzIbAggBv0_z_DgzN0H3Vn}FiYpnyCAyS$f<bZc!I58Igk
zsx}~z0L1xq=3i)W0)KV+`lda$vLZ)Y+DErir+>V8k~2HInB^8|%^9@!yXV?*RnzB7
zaw_WRt%J#rDL1Yx3G}RFXNf0Y9$dZ4y_^vrfg3=;i{3>u3L4<_k@M{#(iX#`KCa~A
zx!8#Z?pD^BfC_wPU43Q|XXOT+A7YJfjh_zqCB&p2^6G5oDnB`*R!(J7%3TT{fk#AE
z0V<O_!tAE##P`QN85CK{Gf1c7IUat|?2!?P$(<%4g{LQfWw?-Ye=ZcD4*vm{JK}L7
zUkG1*_62<d>90ZGxq5L$!1DVJQrCYYR|)w8xu^d?u8ijQNFmd|6IlAkz`u>%IQ|%(
z)2eTmp8XiE+of-J=H)+rRAA?yy~u}>$WKeDi}q=Xai**kth*^LwJ^9)A<s&7biv_r
zpuBNCFHluj(=ZY;E`LOUY-YEA;C#SffuLA9r>ghGmr8>UsMr@)1t1dQkElrNZnq1S
z!L0S;o~8f3Oujgtr?=6YO-J_|!RM-N?-%x)M@a^YhDG#7ca*aruwX8a-_}09^`Y<W
zqQNyDZ`*TFObSghR56$0yLE?Do>~kp>A+Vt#A~YszfDP$T)Fi1J;T)<fi|iG4+S&$
zel=Qy$lP1=vcfmob|BHv9l(j_*dzTUjY#QsUh*TAxzvms(;7%_`7dq(gfquZh{(X2
z<jI7+9Hg6NU&JMv=-{1i$?V8x5jBKs9V+=VTH-XaU^MD$O2Vyqm7v4dlvma((q={D
zhYA2floPME*&WscW#dJgUI&WR{1PPp!4wJ|mV<W;oar(2L_HA<H8cV&BlBe~ej#ae
zSvI7jH`#7%Z!Vc3b8#s@Q}VOaIUZ<vR|}&%+NGIwL{-*-8fB!@+BX2}MV|KH)%!0v
zw#bnR1zFLo`_**cH#TBlB!qRB%O01-t`U=?vOca>1D~OvzM}7+U{^O9BbIlnl80h(
z;+@ch-{~>>i-LrK8$hpRWg>s5dggK)v*E!pz3pVteR1`|543S$(|Xk#2Ey$XE__Gj
zvQylyDE*mXGc|N=`<CB8bU(7_nz~n?@QA|wOTPgj5h(euU3X|+F~KL^@>!3;Es(H*
ME$uDJ&3$kD3!?3^umAu6

diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params-members.html
index 71243aedf..af3680b9c 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params-members.html
@@ -79,25 +79,35 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#a73091e07b6d4c99f6e0319fbf6bd1709">initialize</a>(Scalar const *ptr, Index stride_h)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">cutlass::TileLoadIterator::Params::initialize</a>(SharedStorage const &amp;storage)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2">cutlass::TileLoadIterator::Params::initialize</a>(Scalar const *ptr, Index stride_d, Index stride_h, Index stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1">cutlass::TileLoadIterator::Params::initialize</a>(Scalar const *ptr, Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8">cutlass::TileLoadIterator::Params::initialize</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">cutlass::TileIteratorBase::Params::initialize</a>(Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">cutlass::TileIteratorBase::Params::initialize</a>(Index _stride_d, Index _stride_h, Index _stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#ad0602cf5d322e98e3e5990c84ae1e3f3">initialize</a>(Scalar const *ptr, long long stride_d, Index stride_h)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803">cutlass::TileLoadIterator::Params::initialize</a>(TensorRef const &amp;ref)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0">cutlass::TileLoadIterator::Params::initialize</a>(SharedStorage const &amp;storage)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf">cutlass::TileLoadIterator::Params::initialize</a>(Scalar const *ptr)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662">cutlass::TileLoadIterator::Params::initialize</a>(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d">cutlass::TileLoadIterator::Params::initialize</a>(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d">cutlass::TileLoadIterator::Params::initialize</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">cutlass::TileIteratorBase::Params::initialize</a>(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">cutlass::TileIteratorBase::Params::initialize</a>(Coord&lt; 4 &gt; const &amp;stride)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">cutlass::TileIteratorBase::Params::initialize</a>(long long _stride_d, Index _stride_h, Index _stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5">Params</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282">Params</a>(Scalar const *ptr)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192">Params</a>(TensorRef const &amp;ref)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e">Params</a>(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a">Params</a>(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">cutlass::TileIteratorBase::Params::Params</a>(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">cutlass::TileIteratorBase::Params::Params</a>(Coord&lt; 4 &gt; const &amp;stride)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html
index d4517b31e..8f3134b39 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html
@@ -87,62 +87,97 @@ Inheritance diagram for cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Ind
  <div class="center">
   <img src="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.png" usemap="#cutlass::gemm::GemmGlobalIteratorAb_3C_20TileTraits_5F_2C_20Index_5F_20_3E::Params_map" alt=""/>
   <map id="cutlass::gemm::GemmGlobalIteratorAb_3C_20TileTraits_5F_2C_20Index_5F_20_3E::Params_map" name="cutlass::gemm::GemmGlobalIteratorAb_3C_20TileTraits_5F_2C_20Index_5F_20_3E::Params_map">
-<area href="structcutlass_1_1TileLoadIterator_1_1Params.html" title="Parameters. " alt="cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params" shape="rect" coords="0,56,780,80"/>
-<area href="structcutlass_1_1TileIteratorBase_1_1Params.html" title="Parameters to the iterator. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params" shape="rect" coords="0,0,780,24"/>
+<area href="structcutlass_1_1TileLoadIterator_1_1Params.html" title="Parameters. " alt="cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params" shape="rect" coords="0,56,812,80"/>
+<area href="structcutlass_1_1TileIteratorBase_1_1Params.html" title="Parameters to the iterator. " alt="cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params" shape="rect" coords="0,0,812,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a73091e07b6d4c99f6e0319fbf6bd1709"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#a73091e07b6d4c99f6e0319fbf6bd1709">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> const *ptr, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>)</td></tr>
-<tr class="memdesc:a73091e07b6d4c99f6e0319fbf6bd1709"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to load a strip-mined tile, given pointer and stride_h.  <a href="#a73091e07b6d4c99f6e0319fbf6bd1709">More...</a><br /></td></tr>
-<tr class="separator:a73091e07b6d4c99f6e0319fbf6bd1709"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileLoadIterator_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
-<tr class="memitem:aeeea0f8bdee876553a4908b9b7cbaf76 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> const &amp;storage)</td></tr>
-<tr class="memdesc:aeeea0f8bdee876553a4908b9b7cbaf76 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">More...</a><br /></td></tr>
-<tr class="separator:aeeea0f8bdee876553a4908b9b7cbaf76 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afd9e82df76ad35fe883b7834457242b2 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> const *ptr, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>)</td></tr>
-<tr class="memdesc:afd9e82df76ad35fe883b7834457242b2 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to access a raw pointer.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2">More...</a><br /></td></tr>
-<tr class="separator:afd9e82df76ad35fe883b7834457242b2 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa3922946bb0da0c0040dec44aa389ec1 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> const *ptr, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance)</td></tr>
-<tr class="memdesc:aa3922946bb0da0c0040dec44aa389ec1 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1">More...</a><br /></td></tr>
-<tr class="separator:aa3922946bb0da0c0040dec44aa389ec1 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aebaecd0f971245ffc5a50fe5f7a9b4e8 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8">initialize</a> ()</td></tr>
-<tr class="separator:aebaecd0f971245ffc5a50fe5f7a9b4e8 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
-<tr class="memitem:ad2631ffcc963638aa5b016c66a2e2c55 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">initialize</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance)</td></tr>
-<tr class="memdesc:ad2631ffcc963638aa5b016c66a2e2c55 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">More...</a><br /></td></tr>
-<tr class="separator:ad2631ffcc963638aa5b016c66a2e2c55 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3ba93370bd4b2ede4bd4eb97ac0881be inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">initialize</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w)</td></tr>
-<tr class="separator:a3ba93370bd4b2ede4bd4eb97ac0881be inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af496afebb8983e5d346c681334955224 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">initialize</a> ()</td></tr>
-<tr class="separator:af496afebb8983e5d346c681334955224 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad0602cf5d322e98e3e5990c84ae1e3f3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html#ad0602cf5d322e98e3e5990c84ae1e3f3">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> const *ptr, long long <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>)</td></tr>
+<tr class="memdesc:ad0602cf5d322e98e3e5990c84ae1e3f3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to load a strip-mined tile, given pointer and stride_h.  <a href="#ad0602cf5d322e98e3e5990c84ae1e3f3">More...</a><br /></td></tr>
+<tr class="separator:ad0602cf5d322e98e3e5990c84ae1e3f3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileLoadIterator_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:a9a1098e6c7b8c7c377031fe59a18fbf5 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5">Params</a> ()</td></tr>
+<tr class="memdesc:a9a1098e6c7b8c7c377031fe59a18fbf5 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5">More...</a><br /></td></tr>
+<tr class="separator:a9a1098e6c7b8c7c377031fe59a18fbf5 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a88a90437f11d029ef109ebb4f828f282 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282">Params</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr)</td></tr>
+<tr class="memdesc:a88a90437f11d029ef109ebb4f828f282 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282">More...</a><br /></td></tr>
+<tr class="separator:a88a90437f11d029ef109ebb4f828f282 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2de32338814d0554b05ca985dbb7e192 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192">Params</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> const &amp;ref)</td></tr>
+<tr class="memdesc:a2de32338814d0554b05ca985dbb7e192 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs with a CompactTensorRef&lt;&gt;  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192">More...</a><br /></td></tr>
+<tr class="separator:a2de32338814d0554b05ca985dbb7e192 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a78380e92553010656516400d51e14c7e inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e">Params</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr, long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance)</td></tr>
+<tr class="memdesc:a78380e92553010656516400d51e14c7e inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e">More...</a><br /></td></tr>
+<tr class="separator:a78380e92553010656516400d51e14c7e inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8c9856709d3392d8b70dce9a13fa529a inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a">Params</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr, long long <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</td></tr>
+<tr class="memdesc:a8c9856709d3392d8b70dce9a13fa529a inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a">More...</a><br /></td></tr>
+<tr class="separator:a8c9856709d3392d8b70dce9a13fa529a inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac22d9229f3f8993d52b808dced173803 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> const &amp;ref)</td></tr>
+<tr class="memdesc:ac22d9229f3f8993d52b808dced173803 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to access a raw pointer.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803">More...</a><br /></td></tr>
+<tr class="separator:ac22d9229f3f8993d52b808dced173803 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a61b898051d0397b013407a4c90409aa0 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a> const &amp;storage)</td></tr>
+<tr class="memdesc:a61b898051d0397b013407a4c90409aa0 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0">More...</a><br /></td></tr>
+<tr class="separator:a61b898051d0397b013407a4c90409aa0 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8869188d1c3b867fe6389aadf04837bf inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr)</td></tr>
+<tr class="memdesc:a8869188d1c3b867fe6389aadf04837bf inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize params to access storage object.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf">More...</a><br /></td></tr>
+<tr class="separator:a8869188d1c3b867fe6389aadf04837bf inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9a40662ff01a14e0616ce1a0fbb70662 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr, long long <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</td></tr>
+<tr class="memdesc:a9a40662ff01a14e0616ce1a0fbb70662 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params to access a raw pointer.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662">More...</a><br /></td></tr>
+<tr class="separator:a9a40662ff01a14e0616ce1a0fbb70662 inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a53917e002fd29a5650752c65f96b353d inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d">initialize</a> (<a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const *ptr, long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance)</td></tr>
+<tr class="memdesc:a53917e002fd29a5650752c65f96b353d inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d">More...</a><br /></td></tr>
+<tr class="separator:a53917e002fd29a5650752c65f96b353d inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3175746438646453e93e6e08e954bc8d inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d">initialize</a> ()</td></tr>
+<tr class="separator:a3175746438646453e93e6e08e954bc8d inherit pub_methods_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:acc0341b88143aac4ffd9bc1dcfaafa71 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">Params</a> ()</td></tr>
+<tr class="memdesc:acc0341b88143aac4ffd9bc1dcfaafa71 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">More...</a><br /></td></tr>
+<tr class="separator:acc0341b88143aac4ffd9bc1dcfaafa71 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab04617136a3bf909ef27eb97ea5ef81c inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">Params</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, long long _inc_advance)</td></tr>
+<tr class="memdesc:ab04617136a3bf909ef27eb97ea5ef81c inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">More...</a><br /></td></tr>
+<tr class="separator:ab04617136a3bf909ef27eb97ea5ef81c inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac030ea4568fa2cb6d6661df75062cd1a inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">Params</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;stride)</td></tr>
+<tr class="memdesc:ac030ea4568fa2cb6d6661df75062cd1a inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs params with a stride vector.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">More...</a><br /></td></tr>
+<tr class="separator:ac030ea4568fa2cb6d6661df75062cd1a inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a802c270449da579ed8661e915d27ce60 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">initialize</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w, long long _inc_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w, long long _inc_advance)</td></tr>
+<tr class="memdesc:a802c270449da579ed8661e915d27ce60 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes params.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">More...</a><br /></td></tr>
+<tr class="separator:a802c270449da579ed8661e915d27ce60 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2ef70d9e13b5aa7e4a53233b153d7edd inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">initialize</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt; const &amp;stride)</td></tr>
+<tr class="memdesc:a2ef70d9e13b5aa7e4a53233b153d7edd inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes the parameters object from a vector of strides.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">More...</a><br /></td></tr>
+<tr class="separator:a2ef70d9e13b5aa7e4a53233b153d7edd inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a44870d45442ec45c8eaba46ab47a3ad9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">initialize</a> (long long _stride_d, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w)</td></tr>
+<tr class="memdesc:a44870d45442ec45c8eaba46ab47a3ad9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes the parameters object from a vector of strides.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">More...</a><br /></td></tr>
+<tr class="separator:a44870d45442ec45c8eaba46ab47a3ad9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1776bf51e1e23cde6c58529be58aafb9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">initialize</a> ()</td></tr>
+<tr class="memdesc:a1776bf51e1e23cde6c58529be58aafb9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Gotta have this.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">More...</a><br /></td></tr>
+<tr class="separator:a1776bf51e1e23cde6c58529be58aafb9 inherit pub_methods_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
-<tr class="memitem:a6608f7027994aaebdefd004fe94153d9 inherit pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a></td></tr>
-<tr class="memdesc:a6608f7027994aaebdefd004fe94153d9 inherit pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Pointer to memory.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">More...</a><br /></td></tr>
-<tr class="separator:a6608f7027994aaebdefd004fe94153d9 inherit pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
-<tr class="memitem:ad67234ec264354a22032bb2519575dc1 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a></td></tr>
-<tr class="separator:ad67234ec264354a22032bb2519575dc1 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a58e8c883aea4cfdfa5a84c25a4704ebc inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a></td></tr>
-<tr class="separator:a58e8c883aea4cfdfa5a84c25a4704ebc inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a313984457c78eea66c980f6813047b9c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a></td></tr>
-<tr class="separator:a313984457c78eea66c980f6813047b9c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af95fa1b5102176a0fa9b17713fd48150 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a></td></tr>
-<tr class="separator:af95fa1b5102176a0fa9b17713fd48150 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aea591d4278a8338ae8b50fa0b8f3a366 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a></td></tr>
-<tr class="separator:aea591d4278a8338ae8b50fa0b8f3a366 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac6e81450a2d78555a6c2415dcc42b178 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a></td></tr>
-<tr class="separator:ac6e81450a2d78555a6c2415dcc42b178 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1187258cd4068a627e73bee0302f1fc2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a></td></tr>
-<tr class="separator:a1187258cd4068a627e73bee0302f1fc2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:a388d464c35cc1bcd509d22937f38dcf6 inherit pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> const  *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a></td></tr>
+<tr class="memdesc:a388d464c35cc1bcd509d22937f38dcf6 inherit pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Pointer to memory.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">More...</a><br /></td></tr>
+<tr class="separator:a388d464c35cc1bcd509d22937f38dcf6 inherit pub_attribs_structcutlass_1_1TileLoadIterator_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:a235647baff946e483dd61a2069aa01d2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a></td></tr>
+<tr class="separator:a235647baff946e483dd61a2069aa01d2 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4f029a268387bd63112d9074c185c623 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a></td></tr>
+<tr class="separator:a4f029a268387bd63112d9074c185c623 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af7e7a71a9fa41cc3f6d0e5963963339d inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a></td></tr>
+<tr class="separator:af7e7a71a9fa41cc3f6d0e5963963339d inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7b4293bf8291b0383dee695a60f2e0fd inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a></td></tr>
+<tr class="separator:a7b4293bf8291b0383dee695a60f2e0fd inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a15227102466522445261b6ea65c89c06 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a></td></tr>
+<tr class="separator:a15227102466522445261b6ea65c89c06 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af0be1271cfe6d6c03a9a76ff992d8a5c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a></td></tr>
+<tr class="separator:af0be1271cfe6d6c03a9a76ff992d8a5c inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6d8f1e07f286ed8d5761e2a878b807d3 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a></td></tr>
+<tr class="separator:a6d8f1e07f286ed8d5761e2a878b807d3 inherit pub_attribs_structcutlass_1_1TileIteratorBase_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a73091e07b6d4c99f6e0319fbf6bd1709"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a73091e07b6d4c99f6e0319fbf6bd1709">&#9670;&nbsp;</a></span>initialize()</h2>
+<a id="ad0602cf5d322e98e3e5990c84ae1e3f3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad0602cf5d322e98e3e5990c84ae1e3f3">&#9670;&nbsp;</a></span>initialize()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -158,6 +193,12 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
           <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> const *&#160;</td>
           <td class="paramname"><em>ptr</em>, </td>
         </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>stride_d</em>, </td>
+        </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
@@ -185,7 +226,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.png b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.png
index 0a3e71c3ee24ee5edd4126f66f62994cebeb4425..9cce10a9a9bf22adea503f8fe411bde9b8fdd10c 100644
GIT binary patch
literal 3459
zcmd7Udo)zv9sux(s8kX|g#4<BFcEo$%#ZjnCgeSN8zg>Fp5rkdB{YaS7{%b1Mv^>+
zL8u|m7>{cz@|?n$yx)Xj?%>|Ferw&wx_{iY?%ivhv-dvxan9Lme?MzuuN&(h<vGa%
z0)dXg4Rp;wAWkT|{O}+r`>v>*-Nw#@uV1s!W3gE5;{3{wm-PXU*`?j9uC5MA46<TZ
z5Bi%Kn}gV$cG8zN3q|&P{BT`ui=cfonKOa51-yC;htLEv>nu%alk?F23O^fKGCoyt
zXn)jx9mEEOJXh1V7N)vMp1Vm~dmm#DBtS&qihzYP(ExY?ISW4w6=GLiAs+Xd&cJ_T
zw_YegLR#5v1TF#M?d+?7OvR{Fak}@!&7?wrG`6^~oNri`B%XWNfEsUClQp<CNS94c
zst{ZN2wb%d!QLTni;?q{;#MNRz?B))6A}yMvKTnjEm89VF3-HcMrjC{5jJkL{T!L-
zWfH?&r_{;`!9%d~C`bNy$oobLZ#LTJLWCt$KG*~0(Z&R?EDSv1Tqsi;EMGb=!Wbz_
zXiRch)pB&l^a!Qrj_UyGHl6xW-CepEbg5${T=gW>(C};=eK@d5il$CCbgN#PuiECN
z&NwaBX)mAt#&BN5@)q=-Wvo3dPEBbR6|1ll(UFu+bW-J-)UFf(6wVEV6*)k^D<`qy
zVEwnjh;sVdyR~CkncfJ)TLMkm5NRJbFXye*3veu7*R)jo7#!|lr*1G1GI2ETywTbz
z>hb1C!??2+@uX5U(~^GrSI<I%((t#7*xW8K+<CA|!Z2JKhm&$qd|B|oFH;CWniZ8}
zanWw>`Axumes`FED8oxp%hi9i#=`K`tYvR@Pnv%TNsci;_}gjRVo%k{ghZZW=E_Dk
zgZAR_GXg&0-sx7&3J325KGmR@LD7B^r9nvXDIeoz#lHT@a-^|2I<~Nhzc?beR{dtC
zO4NdjZQ6cqXdl&1?t68iK&$}V@a(C|)E957^duY0(Kons`crPDs#z!I$L4%#T6+xE
zSAq@y0dqF}vH8hbJE*MT`MgQ?>57qV5<v<0Ri`?k6<7Zrj5r?~<~N~^5KM3g%0vPS
zxRG4shErFT_baMiu`C_AI!i1wFw+Mkx;Yvi#Z!u}KzpvV4H0v?qAu<CF10c{dFO7>
zdlO4vNOU(xM*8Z4iJ2I&EW!F!KeY;qrJMcyDtzEkAnKXrrxuimYaflE&f+8<DW4W0
zlDHjIx3P~7JW~`vNL067RS9MZQh#6v3qyvK(5ljjrg`jzX{5Tx5mbD&c-O5E^vgt&
zISsWwgfX^ld6dNI5Ml4o#vL5tM{50=9zj#;8V(~}(hA+aHQ{Tjb>pHadN5p4q1x69
zlT~rq7Q;8rm-AL(qq@gm!9ZVvUxutNkHe&il}stO<W-Y39bLjV=1FsCVO#Gbea!W_
zA>t(5%)~mt1t7WBMA72)0P^W%qyZH#?*)LHDU#F}`fTqtn9bIKSsCesN)7x9wRZFx
zAc?UiiV05MJ^(BqaqNdkC&*`f6tx=2zO?mOTPW2Ma2T24t%)2%Em1Go6`Y&Mo}bZ(
zhlFufr-fK+GX<p2z)hA;h-GopFvsDO#J@+fQ2cJtlj=}AA^#g7goLs~zSV%r!Tzir
z5Nzg8<HBg@vbjy~)i7EIc`o!&<i4NQ3y14K!XVD;F2tSeBBNKnfQ$VkQd;P6<i3j_
zKP?ife7B_m#jbKYVRJd0Ku790;&*#-?e$^{1LAZ7vEK>et^+|!kf0-x`;bn%Q<l{2
z4ZPR%zZ>|?vE{#nWD(5ji(^-&omQ6Cmy!^#2)l)#LdeRFlJ;3<08b1BK}|X10Fb_+
z)w+z1tqC69u4s_qgyfIgZH$~H2S&?dbK9T5pt#mFS^1{Qu6M04FoihN`nWeQg>e4_
z+h_UX4s-<S2_Y@0@B5Nm5xqE$eoo#9YV<5SM=M;z_m^;?SV}s1%`QXBTAV(H*Faoj
z8hB)I^joQ30zP;9YHcK?J$*Q5ygH@g?1xUJ{>n#rKNDxNgt76iGJ7_wiNE)Ii$<{{
z>@Hu}!AZew|D1-&m5;sS8_Qn1jLnlhd738IT?{KQI07*Khe?P3E|zmve_<UD(d9#Q
zMs*wCnN63zSq2%<_2GjX+HJ;%>TUw{2N&AI7h7M5!+rL&Osy2#3OMCEAA^AJXnC4B
zgk4N-6tgYdMOl(K#z;wN-eNu<OG9}C^S`sm7wHVJF+jnqdL(UxaGAMa#EHk49B_$}
zMqshe3h6q5TU8^4a4~0z$zKqEg%1%>R-vIZe;^P4+JibWJE?Xw!n8HfzU$5I^y8hS
zV9L;7EcBFBO9*Dj8JF(CvVrF1*EIB?s*1Cz@`3fF`Pr(gh5>NCM!>p@&R;aZJWvc!
zAL@J3Z>eD<dWYR49-2W5`K?W5G{J>(<XD1Q&bm5tBEMOOmQCiV&k*O0j@URt6ij+~
zF89fPeyZEG3h-<$Qs?q?2BP<d45yp>MB93DX6~`o=?U%*p{+M5E`2pEooC?Urck}Z
zw^ie7wHVICS<_kLdPi>egM+Sn>mQQ+ddz_51(%BQ%xE@24dpIUe4Rf1XC<ZQ)D<fE
z5kAS2%wvs;pG(~vsV9G0%wMXFzxE94cF_L&bDq(mO^CEY>(J|7BR_QVh_K^Y2X8WR
zgF`O=5k4vGr4eBfkL=ICLu7hu<rR)Lx9lsfm6Lai(j-@@_YED&crF{Ga2i%S;eM|C
zxJ6hIxjn^1NUTMC4gOE1G&TIQlziK>4|>xW1sx`|o^1)SW}N6%m5A+7^qUai^C!!p
zr;rPMv)|U(`}@vEh!CK}Kx9Co7fP`t=c-NRPf1p+do_kUqcgnj@0aJ)k_m@smQej@
z^?`ekD-CHXaGp_$<YLU1RmL?~z+*kPRCbWmG|2r@_4VEIkzP;uh7@L#y}-1{+1z1E
zK9+8r0reA;D>m<gs-rFt@~;m;|3D|^p&M;&XnK>Ju?MCDTdr+OCI{QUI?(4m<l5I)
zD4x3_#_hp|KURpmu+yRaZ~US1cijAc;BUwC|4{0my+p5pn-yLI?G;`beHC5>&YZh{
zZSn7D{}6E%DuHGS^bTr;gU0c){jc9`tLb~W;IG__TOXBrRz05eex-!}o5Bl$NEVOK
z;W|G|I<mjYig}!fH!&|FOOB>}sfWqo(yTa{knlH18!YSXh-pk$RT8V8QLcuGNSn5+
z8NHJnP}td`msjcc!6$w5e75<TF5U|z?HO!Ax11{O8t9zi`D0WQ9<i>EdRr^eDUq|{
z653@VNXbkuiT=>+`d|)Lc76*Gt@pH_bnWo|zR_MaTN4_H1b~YV=~f=L7Qvh&2Ku5V
zPhK0-z*3B^ZjPTGOjjbLgM>xKrnS9RQfzH{Tp6WVI%O;bxAzF-<ln+dp(ZZ$%xU0D
z{FBFgRX%POFEU})(kx{nUOr3{ZJh`E-R0x54Rk6X?5OeOr<Hd4Rf;8i2;|}oQtXtQ
zxhb>{wNn2AX?8bK4fxgji^cFuNf23sb&g0f`>LGwSjFwrk0wQ1)f0&B1harsO~AV=
zlhC2ujc^-HpWyms+o2oHen|@3#16VtJpJ`Mm+eH4z#`NO;qGx?d!)~a>HI0hJ{}?o
zJPlOH?h_zdOwh6?wq=E7cEaB?7DUU;mcb>dYMt6%y5GWJ3_cTOFjCLWgnpGA9fsNW
zYCh0QtE4$T7}U&bKnJV%<5G&EkVQtsSE_f`0$Oe#n<RIDQE*Y4Fpm=*=qWnay!lTe
zYF|(^%Rrdf4{~fo!BfS)NiCW(BUqZjl;4#jiO9%{coFsy;y*bF{N$tTZNN(d6<#+7
bDhkIUzyytTPKPov5Ie#3jCG52obLY>Ve3ws

literal 3308
zcmd7VcTiK=8UXOH*w9dIp-4mmDAiD;EyaQoX$Gm%BS;Sl(o0m7s+52Msmr4mK@f<5
zp$HfeVO?q<^e8oiAVLBm@Gd@Q-@ciB|Gs&dNzTcc@631S-1Gg;y|FipuW=t1It&7V
zxDonSOhF({Fwl=V#0mU{yJZOh4djNQncnX1F3_c~&lkP(PXc;BzOAjTR@Ffkz~4jn
zO^t7YfS|q4;72n>5C|NKxN^}fh+{c>x}H*h_=%2BmCDNQ2SyeNr+X<OyC^#|rnI@9
zqJM}(c&DavDWhVkQF5uVQmI`U5et*RDl42jfVd8G4>1K}Q}z447eHX=k_#3PaDCG=
zh<+u$_HS0$W7S@m?aJxo*`)w8tg$-n4b|LjV^fdDfxVwX8R+aE7KOeD3y_UTgJsi&
zd)c4+{o0~zxLTIdVd??GswwwZ7SlTThFZUpY~{1hOJa}lXA+XW)O^*0dlBWMwznuN
z@fWdZC&i7bIH2Ws2*{I`=(;B}aTRPHth2wSj?E_LxTpCnjotHIg0p4`D<q7!Lp<i$
zD$=G3w|E>oaKm#{sFnflFpt{|dKQXwMPh9%z+XxH&|MG9u;hi=DB_Mlfp6RCwyOh@
zQ%y<}`8|ut&bf)J_6YR&b*3E=*5D%I|1d~Vt`X(eX+}eLIs!?hm<DW*PQFtkqJ!vj
z4$(y0!eQQr;@B^0Ws0xtX*gJPY;g-QY!xce;6KoyIdr{z?TqsH#FXtkr*xNmKlfN~
ztN87@((2a)>{#P-dQ$=dn_n<oOT7WE<Jm&_$)`639x(=2;ufQCxlB99bn;#E>US$O
zaD7{Dg;^;TFbqtXWxm3w5y!M0@^1@2guJs1tz(?ruL>Sigdhu9`-ul<LPdlEnzau}
zp@MSgnh6NgcI~hx>E!@&#A3XhY*8c27Ti>-ID&$cf<*Dq*9!9Sz080LL=Ar=UKtk|
zjLt52FOEQ42YNPDM|(OO+LC4Rb@k&#>Mn0x5}e?BDxJxT2(VsbAGyUF+4VUDx?ha1
zz3%a(zads*W8@E(beEhI=q3*#O+Kp_b$+?x6i<(H%s+&Uj4(ABFC|3c@_OvEGJfkm
z@KPq#MlF=pbsE8K0d6~_q`)JJiD>U?MuN5;xF_38GoiuIv+5b(lL8ULa0Gg=wIQ#O
zE#4)sDY#XhUtQzlhf*^e<*hP~d<MBXPH%u{jMOQ_Zez|wRc_kxM+$xo=h8SSF}MzE
z7l+s8#iQwx-IHax*hQfMTjla7lohNg<kWlAo20!P;M+ZH;}$VyQmA(--Z|}P`wE@p
z?VUrrIo2ylDJv&@>%Ksz>Tet6?1p?A9Acg&4E5d9v*LVTp@pOgc9cB5e$#pO6`l$E
zBza}yH^LIBzoWHb!n~yCn#_US6VO-Unc-y#P=?o2f@<lq!do2OQbf2APo3{EP%K}_
zs6XTZe?C=@N-E%W<~xEATI&--+!?<x&6AbW?7B5VQ+;cWwO&yS>gpvE(hB%<rK4UJ
zE-%|+E9rZI1h02cHO+{g?-JLHHHu;5Gu&-WG!mgZVI2G2gvkUJ7pj|5x?46)$iD(x
zSl)KfzyX=AV2h+WPXkqMWC9eH03svjSma*CYyGVFh>lnP_TVUI5@_3e2LuCgwSFpq
zfCL_lY_3TS0st8r$8ntINY94K6$k;t4G8#N(7F8&_BjG*0O5ccz&Jn#Fy5bn0_lT*
zyn7Q(eoV|c#;N<uc_8WkYyu|R-)`91Zdk>7*gsp)0^kiGE%+yCDSx{%4<R@rwjjoZ
zMG53)_%zMr64OKiZ8yru;pmph)vzj9ok+2K4i6!<-~nwFs|@=O>&g+~U2udi^#WRQ
zVPa4rR;=QoYP{32qlmbm?a%BGu`ZYHcoZqY4jfD^gzX;#?!x#x=dTXOf%Z%@^^*B@
zEXCsOGf3IDh{MjFEEZm?Uw(2(y=ugFR_!~fZatSxo=Bm#*jhKH4~!2!g{cf=)HBG}
zetM@q_NxTVYF!8LE;nQi-EhLexv{~C*Vf+$6OrX8?s0TLe7ko~yf2iy)bMecu9yG1
zT(sadyVE&_@dD+&27!Sx2U1@4eI&P}i~4j-t&Nf0drmn#s<QW8zdRKKQ%_iH)2s+b
z+<6hS75a8=C;`@#pb<#C<^H6Ky5fnZw=IcE?3vd{R~6k%B?)Pg|IFf>`aJ`8DlTv6
zVd>xp13w13Ew*jYlzpRIHVd2w$v706IOF!dzj#v1Yad$oSr*nAM;J?^jI`&(h=o{d
zc^{x3RfzTwd|J}Sj+*Ax7z|ka2%v3ev}o{G??T43zV&76oNPyz8P;2YC2}g?Qel3=
z-L}-3A=pSv+lpv++pqWuAN2DtIRDc6%-+olmCMh)PhWx$@CfRidm{!hzW~KjYi23*
zCbRXFymjrvmrh5yBEoy%h{dxKeOrHv9r$rdo;&fR)a6Wqn##pA?pu~;@pm^iQZ8bJ
zDj<*eEgbIbGDf+jSXVjbIg9krPbio#;lF)xQ_PZDmjI3&bI!S_#f?N*6V-XXD#62d
za<=1cNiEbq`+zX~@rq!&=F!V^?1x<`)O^O|ad<jXTj2ZrL<%^u<MR{wH)4lxzp%r8
zf&8i57WF+!&17#`ekj+R_D%&pa3mfQ5luvUuHDa_3Ai9=X}7%mx@ntn-V%Ju2fv@e
zEM!ZU%IA-UGn^zVIQ*)$kiY(Lj`BpEDyPl$nk!k$ZAD{48R=UYc-&*{kGQs$&V!#G
zx2)2c_kJHGu^Lt1&`nJpe7#a9YVuVTx+;o1N6(aWnmr-|+-N6Vl!du}GKhw~@Fzdk
zyc@EWv*6k^Nw)wr>z<O(^kLXzuZERD>T&gWKSblZy}<PvF3c2_snVY&qP~!Yy&tc-
zZ>8}zLtZn$pigI-A{7Y>2N@OZlt(cV1d<EzYnTPAzlH5TA7wWA+Z!uAe?IycgLQwQ
zTW$i_!9YqsthzJzd#>4@Q0hN~3W%sp@&E{%mE0o?R&eb9i?+XNyX}v2vBtVs<D9K=
zE_bYe3*F~v|KCKO)9j?L6$Sq4xw*-C{>~&aaFd-0t$wz%v?0N4X5TAH@Ue6lU)~pF
zjNxj<V^N@(;B>V*KWb1sWW(%nQ)1!<(Tzgxyz8mjDz&D9Dv{foL)Zw9x3IU1cUUB^
z2nD%ehCK@t8D3{XHez|RqIxoCK2mOOI<{EA_Yp{CwE00|OMJHPaou(rg2i<0w2xTX
zR{diuV`Nnhb++(eytOPCx5-9I&@f?_b;xs)$U0$L!m!zz&E}~0J-s^}H_WV5_3#`4
z>cb%lwwCVEqpcXI+yj%j%#JB#qz*|tq%2FHGxC;_|H$)}md10T#i9&<4w08cPI&DJ
zN?3qs)UcX5m9uhN?)z?NDt#G6Qfe>>nsmkA^J#QB8?_eh&Fil+n<!E#a{NS0n^&;%
zI4yW0^>`#6;!=Au@(7P(+EHDk-hJ}teXYf-J*bkG6@olPvhRu}<D6=JWTPC@-_S<m
z+r~G%6qOS_=A4rHK3`^FR-NbBwA<S%?bDeZcklN$YqJzb1FQLD_X=_ZDMX_$zDoZE
zJ|N&3SCh=t1tWv;+Rs}AFF!n187tPzH`UKP0pISWX+5{8$7^Wq1i%`2HYkBs2g<Xc
zv~tySBcgYUPWmWWCv$S!Qc2KOJpiS~Gg4&hBlG)m`A7*qovUMtXJ7{jU7Q^HcyQ|G
zrVt!7=7e=M$*_CCGCUVG8q3j~oIA^A&CSRpj)Rnx=A1u#;)Ff0^V>VN_4hWCF0c{w
wLD;<mJn6?FUl8YHjgtVj8v@vRlCv11hQi#zSFMe}s|g69XMCmdlH;R)0v1s|z5oCK

diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd-members.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd-members.html
index e77b99eb6..f19fdc17c 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd-members.html
@@ -79,51 +79,55 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a0d3c1a58f23957f9850d1b22992a981a">data</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6fd4e62eb280a5b8c17eb79141414581">data</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6dae81995ab94c0b7f28eeeeb84a6c8d">GemmGlobalIteratorCd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a64f1df43acb37a1901f0b55becaa9557">GemmGlobalIteratorCd</a>(Params const &amp;params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab4b8150f19c9f8649d75c69ec0a76e1a">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a12ead84ea9634e963d10c6df7b7792c9">inc_c</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad26ab8d8010c9a1d7f3b91f60940b460">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ae07fa10a53d44471a04275145201299e">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a622a4dd27162854ec96efea93cdd4380">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">add_pointer_offset</a>(Index offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">GemmGlobalIteratorCd</a>(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block_offset, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6">GemmGlobalIteratorCd</a>(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">inc_c</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a>(PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">load_element</a>(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">operator+=</a>(Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">store_element</a>(typename Base::AccessType const &amp;value, int d, int h, int w, int c)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">store_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6594acc213fc8d4289c6c73631f60120">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html
index 6af473203..8159a864e 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html
@@ -92,6 +92,7 @@ Inheritance diagram for cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Ind
   <img src="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.png" usemap="#cutlass::gemm::GemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map" alt=""/>
   <map id="cutlass::gemm::GemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map" name="cutlass::gemm::GemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map">
 <area href="structcutlass_1_1TileIteratorBase.html" alt="cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;" shape="rect" coords="0,0,643,24"/>
+<area href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html" alt="cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;" shape="rect" coords="0,112,643,136"/>
 </map>
  </div></div>
 <table class="memberdecls">
@@ -125,97 +126,112 @@ Public Types</h2></td></tr>
 <tr class="memdesc:a6d985f8e93be21e56f72ec1400d73df1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The thread offset.  <a href="#a6d985f8e93be21e56f72ec1400d73df1">More...</a><br /></td></tr>
 <tr class="separator:a6d985f8e93be21e56f72ec1400d73df1"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a></td></tr>
-<tr class="memdesc:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">More...</a><br /></td></tr>
-<tr class="separator:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a></td></tr>
-<tr class="memdesc:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">More...</a><br /></td></tr>
-<tr class="separator:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a></td></tr>
-<tr class="memdesc:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">More...</a><br /></td></tr>
-<tr class="separator:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a></td></tr>
-<tr class="memdesc:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">More...</a><br /></td></tr>
-<tr class="separator:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a></td></tr>
-<tr class="memdesc:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">More...</a><br /></td></tr>
-<tr class="separator:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a></td></tr>
-<tr class="memdesc:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">More...</a><br /></td></tr>
-<tr class="separator:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a></td></tr>
-<tr class="memdesc:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">More...</a><br /></td></tr>
-<tr class="separator:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a></td></tr>
-<tr class="memdesc:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">More...</a><br /></td></tr>
-<tr class="separator:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a></td></tr>
-<tr class="memdesc:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">More...</a><br /></td></tr>
-<tr class="separator:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a></td></tr>
-<tr class="memdesc:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">More...</a><br /></td></tr>
-<tr class="separator:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a></td></tr>
-<tr class="memdesc:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">More...</a><br /></td></tr>
-<tr class="separator:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a></td></tr>
-<tr class="memdesc:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">More...</a><br /></td></tr>
-<tr class="separator:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a></td></tr>
-<tr class="memdesc:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">More...</a><br /></td></tr>
-<tr class="separator:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a></td></tr>
-<tr class="memdesc:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">More...</a><br /></td></tr>
-<tr class="separator:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a></td></tr>
-<tr class="memdesc:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">More...</a><br /></td></tr>
-<tr class="separator:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a></td></tr>
-<tr class="memdesc:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">More...</a><br /></td></tr>
-<tr class="separator:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a></td></tr>
-<tr class="memdesc:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">More...</a><br /></td></tr>
-<tr class="separator:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td></tr>
+<tr class="memdesc:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">More...</a><br /></td></tr>
+<tr class="separator:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td></tr>
+<tr class="memdesc:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">More...</a><br /></td></tr>
+<tr class="separator:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td></tr>
+<tr class="memdesc:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">More...</a><br /></td></tr>
+<tr class="separator:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td></tr>
+<tr class="memdesc:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">More...</a><br /></td></tr>
+<tr class="separator:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td></tr>
+<tr class="memdesc:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">More...</a><br /></td></tr>
+<tr class="separator:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td></tr>
+<tr class="memdesc:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">More...</a><br /></td></tr>
+<tr class="separator:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td></tr>
+<tr class="memdesc:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">More...</a><br /></td></tr>
+<tr class="separator:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">More...</a><br /></td></tr>
+<tr class="separator:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td></tr>
+<tr class="memdesc:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">More...</a><br /></td></tr>
+<tr class="separator:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td></tr>
+<tr class="memdesc:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">More...</a><br /></td></tr>
+<tr class="separator:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td></tr>
+<tr class="memdesc:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">More...</a><br /></td></tr>
+<tr class="separator:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a></td></tr>
+<tr class="memdesc:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">More...</a><br /></td></tr>
+<tr class="separator:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td></tr>
+<tr class="memdesc:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">More...</a><br /></td></tr>
+<tr class="separator:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td></tr>
+<tr class="memdesc:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">More...</a><br /></td></tr>
+<tr class="separator:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">More...</a><br /></td></tr>
+<tr class="separator:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td></tr>
+<tr class="memdesc:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">More...</a><br /></td></tr>
+<tr class="separator:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td></tr>
+<tr class="memdesc:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">More...</a><br /></td></tr>
+<tr class="separator:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a6dae81995ab94c0b7f28eeeeb84a6c8d"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6dae81995ab94c0b7f28eeeeb84a6c8d">GemmGlobalIteratorCd</a> ()</td></tr>
-<tr class="memdesc:a6dae81995ab94c0b7f28eeeeb84a6c8d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a6dae81995ab94c0b7f28eeeeb84a6c8d">More...</a><br /></td></tr>
-<tr class="separator:a6dae81995ab94c0b7f28eeeeb84a6c8d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a64f1df43acb37a1901f0b55becaa9557"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a64f1df43acb37a1901f0b55becaa9557">GemmGlobalIteratorCd</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> const &amp;<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>())</td></tr>
-<tr class="memdesc:a64f1df43acb37a1901f0b55becaa9557"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a64f1df43acb37a1901f0b55becaa9557">More...</a><br /></td></tr>
-<tr class="separator:a64f1df43acb37a1901f0b55becaa9557"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a12ead84ea9634e963d10c6df7b7792c9"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a12ead84ea9634e963d10c6df7b7792c9">inc_c</a> ()</td></tr>
-<tr class="memdesc:a12ead84ea9634e963d10c6df7b7792c9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the C dimension.  <a href="#a12ead84ea9634e963d10c6df7b7792c9">More...</a><br /></td></tr>
-<tr class="separator:a12ead84ea9634e963d10c6df7b7792c9"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a622a4dd27162854ec96efea93cdd4380"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a622a4dd27162854ec96efea93cdd4380">inc_w</a> ()</td></tr>
-<tr class="memdesc:a622a4dd27162854ec96efea93cdd4380"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the W dimension.  <a href="#a622a4dd27162854ec96efea93cdd4380">More...</a><br /></td></tr>
-<tr class="separator:a622a4dd27162854ec96efea93cdd4380"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae07fa10a53d44471a04275145201299e"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ae07fa10a53d44471a04275145201299e">inc_h</a> ()</td></tr>
-<tr class="memdesc:ae07fa10a53d44471a04275145201299e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the H dimension.  <a href="#ae07fa10a53d44471a04275145201299e">More...</a><br /></td></tr>
-<tr class="separator:ae07fa10a53d44471a04275145201299e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad26ab8d8010c9a1d7f3b91f60940b460"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad26ab8d8010c9a1d7f3b91f60940b460">inc_d</a> ()</td></tr>
-<tr class="memdesc:ad26ab8d8010c9a1d7f3b91f60940b460"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the D dimension.  <a href="#ad26ab8d8010c9a1d7f3b91f60940b460">More...</a><br /></td></tr>
-<tr class="separator:ad26ab8d8010c9a1d7f3b91f60940b460"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab4b8150f19c9f8649d75c69ec0a76e1a"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab4b8150f19c9f8649d75c69ec0a76e1a">inc_advance</a> ()</td></tr>
-<tr class="memdesc:ab4b8150f19c9f8649d75c69ec0a76e1a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer to move to the next iteration.  <a href="#ab4b8150f19c9f8649d75c69ec0a76e1a">More...</a><br /></td></tr>
-<tr class="separator:ab4b8150f19c9f8649d75c69ec0a76e1a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6594acc213fc8d4289c6c73631f60120"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6594acc213fc8d4289c6c73631f60120">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:a6594acc213fc8d4289c6c73631f60120"><td class="mdescLeft">&#160;</td><td class="mdescRight">Test the validity of the iterator.  <a href="#a6594acc213fc8d4289c6c73631f60120">More...</a><br /></td></tr>
-<tr class="separator:a6594acc213fc8d4289c6c73631f60120"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0d3c1a58f23957f9850d1b22992a981a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a0d3c1a58f23957f9850d1b22992a981a">data</a> ()</td></tr>
-<tr class="memdesc:a0d3c1a58f23957f9850d1b22992a981a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the raw pointer.  <a href="#a0d3c1a58f23957f9850d1b22992a981a">More...</a><br /></td></tr>
-<tr class="separator:a0d3c1a58f23957f9850d1b22992a981a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6fd4e62eb280a5b8c17eb79141414581"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6fd4e62eb280a5b8c17eb79141414581">data</a> () const</td></tr>
-<tr class="separator:a6fd4e62eb280a5b8c17eb79141414581"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeeed9a3582a879d9da77191df88e83ff"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">GemmGlobalIteratorCd</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> const &amp;_params, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block_offset, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:aeeed9a3582a879d9da77191df88e83ff"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#aeeed9a3582a879d9da77191df88e83ff">More...</a><br /></td></tr>
+<tr class="separator:aeeed9a3582a879d9da77191df88e83ff"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a15d3244546d1c8f4727e84b27a8b7fc6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6">GemmGlobalIteratorCd</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> const &amp;_params, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a15d3244546d1c8f4727e84b27a8b7fc6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a15d3244546d1c8f4727e84b27a8b7fc6">More...</a><br /></td></tr>
+<tr class="separator:a15d3244546d1c8f4727e84b27a8b7fc6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a365eb7c90a79c9ab32f603c6985a0316"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">inc_c</a> ()</td></tr>
+<tr class="memdesc:a365eb7c90a79c9ab32f603c6985a0316"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the C dimension.  <a href="#a365eb7c90a79c9ab32f603c6985a0316">More...</a><br /></td></tr>
+<tr class="separator:a365eb7c90a79c9ab32f603c6985a0316"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab1d9e606a89d3dd315df3d3efa48bcc2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">inc_w</a> ()</td></tr>
+<tr class="memdesc:ab1d9e606a89d3dd315df3d3efa48bcc2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the W dimension.  <a href="#ab1d9e606a89d3dd315df3d3efa48bcc2">More...</a><br /></td></tr>
+<tr class="separator:ab1d9e606a89d3dd315df3d3efa48bcc2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a40144d869b56b46cf1dd8f9941e61e77"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">inc_h</a> ()</td></tr>
+<tr class="memdesc:a40144d869b56b46cf1dd8f9941e61e77"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the H dimension.  <a href="#a40144d869b56b46cf1dd8f9941e61e77">More...</a><br /></td></tr>
+<tr class="separator:a40144d869b56b46cf1dd8f9941e61e77"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a49d7db2dab7a6d1e496ebff0e67039bc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">inc_d</a> ()</td></tr>
+<tr class="memdesc:a49d7db2dab7a6d1e496ebff0e67039bc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the D dimension.  <a href="#a49d7db2dab7a6d1e496ebff0e67039bc">More...</a><br /></td></tr>
+<tr class="separator:a49d7db2dab7a6d1e496ebff0e67039bc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeac77cdc31ce151634b7c27ccdaf5552"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">inc_advance</a> ()</td></tr>
+<tr class="memdesc:aeac77cdc31ce151634b7c27ccdaf5552"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer to move to the next iteration.  <a href="#aeac77cdc31ce151634b7c27ccdaf5552">More...</a><br /></td></tr>
+<tr class="separator:aeac77cdc31ce151634b7c27ccdaf5552"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa6845b5a0fa36eb185caafea791e53ec"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:aa6845b5a0fa36eb185caafea791e53ec"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a vector offset to the iterator.  <a href="#aa6845b5a0fa36eb185caafea791e53ec">More...</a><br /></td></tr>
+<tr class="separator:aa6845b5a0fa36eb185caafea791e53ec"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6034b7229e4aca05f63c39560f219433"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">load_element</a> (typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a6034b7229e4aca05f63c39560f219433"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a single fragment element from memory.  <a href="#a6034b7229e4aca05f63c39560f219433">More...</a><br /></td></tr>
+<tr class="separator:a6034b7229e4aca05f63c39560f219433"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5de982aed44932da3b265f8bb520249d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">store_element</a> (typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> const &amp;value, int d, int h, int w, int c)</td></tr>
+<tr class="memdesc:a5de982aed44932da3b265f8bb520249d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a single fragment element into memory.  <a href="#a5de982aed44932da3b265f8bb520249d">More...</a><br /></td></tr>
+<tr class="separator:a5de982aed44932da3b265f8bb520249d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab224a0a6ab8ce7fc4e76b06fb7679fa0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ab224a0a6ab8ce7fc4e76b06fb7679fa0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Test the validity of the.  <a href="#ab224a0a6ab8ce7fc4e76b06fb7679fa0">More...</a><br /></td></tr>
+<tr class="separator:ab224a0a6ab8ce7fc4e76b06fb7679fa0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8fd617565db6eb9c6fb99de868c389db"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">add_pointer_offset</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> offset)</td></tr>
+<tr class="memdesc:a8fd617565db6eb9c6fb99de868c389db"><td class="mdescLeft">&#160;</td><td class="mdescRight">add pointer offset  <a href="#a8fd617565db6eb9c6fb99de868c389db">More...</a><br /></td></tr>
+<tr class="separator:a8fd617565db6eb9c6fb99de868c389db"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1a587af6edd528a02679c0decc31cdd1"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a1a587af6edd528a02679c0decc31cdd1"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="memdesc:a1a587af6edd528a02679c0decc31cdd1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads and increments iterator.  <a href="#a1a587af6edd528a02679c0decc31cdd1">More...</a><br /></td></tr>
+<tr class="separator:a1a587af6edd528a02679c0decc31cdd1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aafa962f7e63da77c9904d438ab94347a"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:aafa962f7e63da77c9904d438ab94347a"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">store_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="separator:aafa962f7e63da77c9904d438ab94347a"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">More...</a><br /></td></tr>
-<tr class="separator:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">More...</a><br /></td></tr>
+<tr class="separator:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
 <tr class="memitem:ac368b1ea1c5ad2209a6ac6bec597600f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a></td></tr>
+<tr class="memdesc:ac368b1ea1c5ad2209a6ac6bec597600f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters.  <a href="#ac368b1ea1c5ad2209a6ac6bec597600f">More...</a><br /></td></tr>
 <tr class="separator:ac368b1ea1c5ad2209a6ac6bec597600f"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a56601dc34e8f9a070db5dc48c37d55a0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a></td></tr>
 <tr class="memdesc:a56601dc34e8f9a070db5dc48c37d55a0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="#a56601dc34e8f9a070db5dc48c37d55a0">More...</a><br /></td></tr>
@@ -230,28 +246,28 @@ Static Public Attributes</h2></td></tr>
 <tr class="memdesc:a27b88818f5b094372bf2c6e090c9148a"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="#a27b88818f5b094372bf2c6e090c9148a">More...</a><br /></td></tr>
 <tr class="separator:a27b88818f5b094372bf2c6e090c9148a"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_attribs_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a></td></tr>
-<tr class="memdesc:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">More...</a><br /></td></tr>
-<tr class="separator:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a></td></tr>
-<tr class="memdesc:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">More...</a><br /></td></tr>
-<tr class="separator:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a></td></tr>
-<tr class="memdesc:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">More...</a><br /></td></tr>
-<tr class="separator:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a></td></tr>
-<tr class="memdesc:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">More...</a><br /></td></tr>
-<tr class="separator:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td></tr>
-<tr class="memdesc:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">More...</a><br /></td></tr>
-<tr class="separator:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a></td></tr>
+<tr class="memdesc:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">More...</a><br /></td></tr>
+<tr class="separator:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a></td></tr>
+<tr class="memdesc:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">More...</a><br /></td></tr>
+<tr class="separator:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a></td></tr>
+<tr class="memdesc:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">More...</a><br /></td></tr>
+<tr class="separator:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a></td></tr>
+<tr class="memdesc:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">More...</a><br /></td></tr>
+<tr class="separator:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td></tr>
+<tr class="memdesc:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">More...</a><br /></td></tr>
+<tr class="separator:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
 <tr class="inherit_header pub_static_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset=make_Coord(0, 0, 0))</td></tr>
-<tr class="memdesc:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">More...</a><br /></td></tr>
-<tr class="separator:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">More...</a><br /></td></tr>
+<tr class="separator:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="a8f8fbb65070589769468c6b1ac6ba7a5"></a>
@@ -367,8 +383,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a6dae81995ab94c0b7f28eeeeb84a6c8d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6dae81995ab94c0b7f28eeeeb84a6c8d">&#9670;&nbsp;</a></span>GemmGlobalIteratorCd() <span class="overload">[1/2]</span></h2>
+<a id="aeeed9a3582a879d9da77191df88e83ff"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeeed9a3582a879d9da77191df88e83ff">&#9670;&nbsp;</a></span>GemmGlobalIteratorCd() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -379,10 +395,33 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> </td>
           <td>(</td>
-          <td class="paramname"></td><td>)</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
           <td></td>
+          <td class="paramtype">const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;&#160;</td>
+          <td class="paramname"><em>bounds</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;&#160;</td>
+          <td class="paramname"><em>block_offset</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>&#160;</td>
+          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>()</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
         </tr>
       </table>
   </td>
@@ -394,8 +433,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="a64f1df43acb37a1901f0b55becaa9557"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a64f1df43acb37a1901f0b55becaa9557">&#9670;&nbsp;</a></span>GemmGlobalIteratorCd() <span class="overload">[2/2]</span></h2>
+<a id="a15d3244546d1c8f4727e84b27a8b7fc6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a15d3244546d1c8f4727e84b27a8b7fc6">&#9670;&nbsp;</a></span>GemmGlobalIteratorCd() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -406,10 +445,10 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> const &amp;&#160;</td>
-          <td class="paramname"><em>params</em>, </td>
+          <td class="paramname"><em>_params</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
@@ -457,8 +496,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a0d3c1a58f23957f9850d1b22992a981a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0d3c1a58f23957f9850d1b22992a981a">&#9670;&nbsp;</a></span>data() <span class="overload">[1/2]</span></h2>
+<a id="a8fd617565db6eb9c6fb99de868c389db"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8fd617565db6eb9c6fb99de868c389db">&#9670;&nbsp;</a></span>add_pointer_offset()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -469,7 +508,35 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::data </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::add_pointer_offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aeac77cdc31ce151634b7c27ccdaf5552"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeac77cdc31ce151634b7c27ccdaf5552">&#9670;&nbsp;</a></span>inc_advance()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_advance </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -484,8 +551,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="a6fd4e62eb280a5b8c17eb79141414581"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6fd4e62eb280a5b8c17eb79141414581">&#9670;&nbsp;</a></span>data() <span class="overload">[2/2]</span></h2>
+<a id="a365eb7c90a79c9ab32f603c6985a0316"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a365eb7c90a79c9ab32f603c6985a0316">&#9670;&nbsp;</a></span>inc_c()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -496,34 +563,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> const <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::data </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="ab4b8150f19c9f8649d75c69ec0a76e1a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab4b8150f19c9f8649d75c69ec0a76e1a">&#9670;&nbsp;</a></span>inc_advance()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_advance </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_c </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -538,8 +578,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="a12ead84ea9634e963d10c6df7b7792c9"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a12ead84ea9634e963d10c6df7b7792c9">&#9670;&nbsp;</a></span>inc_c()</h2>
+<a id="a49d7db2dab7a6d1e496ebff0e67039bc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a49d7db2dab7a6d1e496ebff0e67039bc">&#9670;&nbsp;</a></span>inc_d()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -550,7 +590,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_c </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_d </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -565,8 +605,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="ad26ab8d8010c9a1d7f3b91f60940b460"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad26ab8d8010c9a1d7f3b91f60940b460">&#9670;&nbsp;</a></span>inc_d()</h2>
+<a id="a40144d869b56b46cf1dd8f9941e61e77"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a40144d869b56b46cf1dd8f9941e61e77">&#9670;&nbsp;</a></span>inc_h()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -577,7 +617,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_d </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_h </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -592,8 +632,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="ae07fa10a53d44471a04275145201299e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae07fa10a53d44471a04275145201299e">&#9670;&nbsp;</a></span>inc_h()</h2>
+<a id="ab1d9e606a89d3dd315df3d3efa48bcc2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab1d9e606a89d3dd315df3d3efa48bcc2">&#9670;&nbsp;</a></span>inc_w()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -604,7 +644,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_h </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_w </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -619,8 +659,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="a622a4dd27162854ec96efea93cdd4380"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a622a4dd27162854ec96efea93cdd4380">&#9670;&nbsp;</a></span>inc_w()</h2>
+<a id="a6034b7229e4aca05f63c39560f219433"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6034b7229e4aca05f63c39560f219433">&#9670;&nbsp;</a></span>load_element()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -631,9 +671,68 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_w </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::load_element </td>
           <td>(</td>
-          <td class="paramname"></td><td>)</td>
+          <td class="paramtype">typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>c</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1a587af6edd528a02679c0decc31cdd1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1a587af6edd528a02679c0decc31cdd1">&#9670;&nbsp;</a></span>load_post_increment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::load_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -646,8 +745,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 
 </div>
 </div>
-<a id="a6594acc213fc8d4289c6c73631f60120"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6594acc213fc8d4289c6c73631f60120">&#9670;&nbsp;</a></span>valid()</h2>
+<a id="aa6845b5a0fa36eb185caafea791e53ec"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa6845b5a0fa36eb185caafea791e53ec">&#9670;&nbsp;</a></span>operator+=()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -658,7 +757,121 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE bool <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::valid </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&amp; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5de982aed44932da3b265f8bb520249d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5de982aed44932da3b265f8bb520249d">&#9670;&nbsp;</a></span>store_element()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::store_element </td>
+          <td>(</td>
+          <td class="paramtype">typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> const &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>c</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aafa962f7e63da77c9904d438ab94347a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aafa962f7e63da77c9904d438ab94347a">&#9670;&nbsp;</a></span>store_post_increment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::store_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab224a0a6ab8ce7fc4e76b06fb7679fa0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab224a0a6ab8ce7fc4e76b06fb7679fa0">&#9670;&nbsp;</a></span>valid()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::valid </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
@@ -775,7 +988,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.png b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.png
index 13e8ac2aa98ea568784f961bfbb610a30a1d8515..24971967c70a919636f502a9f7bc2687b15624a9 100644
GIT binary patch
literal 2546
zcmc(hdpy(s9>>3nUlW>iek5(W7$ukFm-`UaFPGegj9QT*xi>bEOU+!O)QF#Zelhpu
zQZwvVZgEI<vN0@e5#}zJ(9F*2obx!H%irgG9*@uG{d_$h@Avzk&-?v&zmpv7&hC^{
zlmq}^r<LVtBmiu~i#Sn2O!QXpWY3F?g2OrIGeV(Igo~>@Qft^l5q-bS&CRHq@NYg6
zp-4L?K;-o8^mjY!0KkqrR;SIK!$EU-?3-go(&87|$~T3F_jeBbRAlLvgxO|jthTCZ
z^N3sZ6AfvtMoLGXQ!9p_d<0jv`jr?BGd?0RwbgjyRk)hek0SXFo*{Ttq{J92nb(E(
zJvWWF?mPI0VFo2lJ<8-XuB>g!PU&R-%~5#v%g-F6jxN+>uUSWww1Q@1eflv?-USGD
zEo!)hQ8AMj5X61QT0$mnAur<=x7;?L;4zFnJzu*wj)_ILwAg-O%bL`7zSmnI4|`o4
z)LGh!+<P;oK`(A#RXUrC_ji0-Gt#Vx$vaQP(&P_$(<c&JweW5w5RZM7ao$%2oYSve
zsj!Q9jmT#*rlrh+>nAuZiu*Jvne0Tb1y^vJB&&ffj5|YkGq<zh+0zKe7mx%O)!E6!
zJfq~aqU?ou)C*X??QPDbq0b<Hp>HH1V=FAqYq+?dw>&A(k6w^B$u2eHr0I5;ve!ps
zXU%f+@ckh{JNf8>;Ody;sWM)9uOvS-F&~`_Siyf?cTfCc^9({#!h8Xy8Kn^mT9gbA
zE7OnSU<g*`<yP++12Q4i<xd@bP!h(vlyxEd0W4QP@?!F&a@kg${M{|b*}G=(x>6%_
z#~sdRW89N3OVoUQE}ubt)6r4_b_m;1Y<QYOR-UF@h;{*taR+V7d7qwZ&!ufdTp<*S
zfz=7{*FJ%W&}v&jm?=-SXK`cA+R>zT_;OBRBxbg6Lfc+wnMh@Rj5fNp*bZXe=T|C_
z-j6pagN?gPpb?XsbUMy~n!3z=$u?K2>|Q@m7gH!-a5LD4uh$iF&;<2<$bD0zeX%j$
zAbb>Pbz{jjUhc*c>p3@qlI)>~zm%tG%zVOjw`f)+U^sgfptqTu{HD%D!=d=JdzkaA
zx|g@$9MrVw9*6os-5SVC+;y|F7c3_iV(ufaHM&|bRdB{R4gAJ02J9)Z!S=Gi!>6B>
zR1(U~3Oib&gi)Z&<z5CG)y*Tf`@JJi<rIqtuw-H2Hu}U9xIi|(>2cBiNt{pQwNbqQ
zn?Cv?vij90u1T9#!x`es-rW{NyCst37O#>1S`jv1(DSX*UF<O%zMKbemqBwY9b!5G
zmM-cBxBntuzimNUA1_Y7Vy!m52GRyN<6_N#Lag}gfmo2`=vdqCZ3?l_zX{S46>)7q
zZO|MLdzi3Ogra;RB*6a97@PSU$ybMQ!qz*Rqy|z2#5@2|*GqT+qNWG7ACUSdCa;Ao
zQhEze)1iEj!Y^xs5&eSwGrZ2h7x6>cM^X!pGW)PtR#QF@^ygO-T$6Us+~Q7q0|g&8
ze`qgL$`1^x9o*d)kd<0=ynZA)K&X}1#@B6OW~pxJ^6IY@5BlZ@%rBzeHl{~1hIhG-
z`HO)w-6r!igyfKcGC*<S@$;ORtt`;RM0I282ZM7TJ+Cart*yN&+bU(S9A6z>2n;cH
zqVM6*D%@G9x=U}@9Aw;~(4Ot>CGNw~a{Zms!7k)^kK)mRU3DFW)h4UkU7?|aZm#wt
zgB10?xg6`BUmz6OgvT-UGlCPW`o%dYZKDQ;Npn$>)A$rm#&-%RN_iDk2^uz8Gb>Ku
zeKNn}F{L~YSO_Y4CJrV8PNauv-qr`#R|FtEsrLi#`N5#8`-~0BAGA<imptmq^!PG2
zKF_<ZW-cFSR*&<$4x1egLwQwPxy?Mbf?~W0o{pzjxR#N_K2qgn^o@dp+0GIxknNY)
zE%afX0`Azu$-7ka6jI73C}T}~XMWgbHAn9h?|ILcjYAi2l@=^Fk;1e}XGUY^c0jc7
z+3pBBW$(rQgo&qaZJ|(cs#Yd;7gv3=unI_7_hWDV0wIq}bM2S1oH8{a!99KZxTBkS
zh;>yk#3OcY!|8=WGeDEW?rH|EdV)dHC*^-YeQ=3ycFzghv@DYE*C;@`8Mgswi;4vF
ztw@OL>(y~00sbziYS(v&q9wmYfASRjw?seW{9hwi#aiukI<i}T<4Ez(PS$FixI>}|
zmjV|UVI4%~nkQJL%MvO7FTyn}xY3NbvaLW?9$rQd<v%Jqj!CU@9TC<HM5mzreyd7a
zS}(KE4Dhk{W;qeHQem`Li2kv|(3HA4!L0N&;RT+!5>u^`b3rE@9@jAU#gC7hf_`|`
z^|bfUyB51l^v!+k!?nm+=Y;UeaP<5iz5x<dA(T7#H<inQnK3Mb8D}C>`&p66lgWZC
zcyR~}%wngL7O(elcPuP`FALtK%;CyrKA2Y?)epkpGV0F_*zNz`1-21YU`+_bJMHI!
z8@_xO=lwJ|8t-R_Dx>PQrvxAIk9?oXWGwVg<SKJmN~^TTI`1gxM}ZvYEBPVS_YEpH
zo6?5tF}hO6=DBn8^~(M_9Z!u23tPz$vR6U-a6~AXqExGaBQxw_{)j|KZ{hFwuy#*P
z@}IDXlUAP_?h#nn;3kTy+yEhzm|bG4pUu4G-qr!*LmrfSY0p1K4EocmcH!M=d>6qu
z;)s=Ut1J#N#Od)AAQrecS`E(gYDk$MmlTI3(Z!7egfVvnBIORAO|p10vo~A?Y&O$z
z+bC5mH+ck$w#m!MLw&Gea1BF)lhA?;(nwv^p-}hpCs<#{yH5#nIl5ICbF}^e-^f<$
zOmkb!d>^(n`G)24yGl<Zh;^R}^`Yp0<j9ew#FYx#nj@_Y?-!j`6q7;EZM+&{W#m1j
zX_YyOUgoOEIEgAGDoLOGS~Mi4-q!r*R`mB3iE4=Y$11gHDg@n&638~2h|7r<G{EYN
L-D$Fg$KAgIeX_5-

literal 1734
zcmcgteKgx=6#gYNQB6}tRf=jmMn@}RR2wCV5bZQYgd)pUG9Q)In#@P)qkh{_iV#XE
zv2{L5tL2!`d=Q$7Zf#|Xs?S(enN}GQqGajz@AmKBbMAYed(U&vz305oJ#QA#&wIP>
z9$f$cwiA3j{Q&?9YA{hpOLLRHXB%pqG4WKOms+jXzy-xjO&2p?gZ?(LSRCAx7^Dex
z82)|%fQIzp4Ez#^0RR|@;OQQi2zgsELSGUhJxjX9%1yTLnFQ_+mu>_EMz3gdtFBpc
zZWi~17DtBMi3~A{4JnSy2)1~{u{g;|4W|(~wuCZE2WvvH#S;#yNRy;JLilnl3C*8U
z8%NCvf7H3SCJkO7II4m_A=Lh{Hq?C>ui|IXZ+Rr_Hps^xj<{K7($SoIm3Q}*+i;4l
z@s_b|uR<XkRxrVO`(yd5ndJL#54i{q*_F;@s*Zum*hLU=*JEPe9CmHO=sgsKziBl*
zUN1eyn?L;49>!}Bs_7@^?Ua|%{MSEVTyGgYlEy;?PsSQ79Fw1T-r<t6yAErGl;~fu
z#l|rF&b`E(NPQ}&M~txiF5&9lMNPf4=+?dZ@>SFC<?9uldXw{lO)KqP$kx`Wz23<M
z_{?ARw>Gey>kP^*A~(neSl)wCiBeHeVI^O!<?h0(q&xfiiw1g@p0ANF9dT!yDmIR1
z**`rxc;sM|o!<khuhL#NuY!UbU{YAlSQ=&=+rJanqA1*4Ez45X)Jmot$p-n&1+*jZ
z8~cZ{Pxr{vJL$hK9sha^`TqMaopRb9M01B@FOJBLf^)Q9)?yiFxp!PgRTq`xR!q9g
zbJfSaP(7o(&&aB%6*Wo1gAlHt;mY*SUTjP?^_Dbjb#oLy4e{|JRFoNwx-LG~vavNo
zU)SRpRx%fgI{C}5lVyjlPpXt>&rnKN$mAI=yXHJ{Zkc`k%8y9pvpR6Mem;Dp-Z;!j
zF`v`v7r%q>Zc5GXDC|z5z(=C3nCO;8_eeF~u3bX)Sf88{7I3u_T6ViR*t^`dLQs5g
zJ<NI8M$jORGBH58a@yFXvp&G~V!S{iKQrhtZUWT;+1#`=WpKOENPgXngIVw9^qEWN
zZm;X^WA8m~Z}K%NCZ#`@AyNyj1<q3J3qt1$ZZK7QS<BxZg}|L>85xQ<7_Dpfh!3gQ
zjyQQ}0-|&W#A&mS#yWYM2<5G3Bf-gwXlsJ`%}KiDtW+Twr^JVq#1T{|QN)`<V<CB{
zf#=hwY$?sJx~lp~XESQ_`T1PVdI9r;xM%B-X~Sa$RTlrI@d%jZBTiKa2INE#`fSIH
z!-^xD{@Ih_iQVa27Cu+(5JMY*k9!c%V4!gMUFCl5Mqv7%h~XjA(_{l8U=Z8%B+O;N
zNNii`4s4?qKi-$V1$~mHCx%|PbkLzf9&=EdGR<CT=*@rAH68yCdU{Eq@4=vh)xp(8
z7<WTpn;5#v{Erd)CcaoOdVTu4vvl+Hra_eSj*EJy_XOTykB}6!w=yEeM8Kb;eJnQb
zSDSzd2DRVvP;Q;n<-tE+g!DVa!XUI+YoAuMxz{-}!G`I?$kalr9r}Ksqyx5;S8r(5
zFh01I9koK7_gKdn=Z?b=bjtIJ^Am!Kv0b=oM^5rm?>&^*WVQk|dfL=C(Hg;B*i3bv
zWrwvtov!AyhTgVOcC;s#;1fb^C<7@ySDj$+@$}Uy*|2qABrK6E!h%~Lp4%6c8$e~v
zY|nF+%ZMf6<ewcs<EIvig<aIR_@T8M;jQ%X$}TslJeU2^6A~$j(MUAmBe=a-8Y9oi
z?!}3a_2mGV4e|hZyRL`IbAI#iK2<seEGB)ftKI`je+#Ncm*ZO{1BkroT$CwOiW{|I
zHVy}dZ@@)uYlO7>NT~4U1%x9Q&i7-TkLmtusVhe$M1+&;v5Zfcj@w>~65D=*fYO?b
zA3Jbzmc!~m=pe$CBXp9y^l7EEebX$;#3ZgL9wcREqNA5q6bDR`W-8|dF^srdtPA2r
zZCI-p$&Mm2)2`hlhL??<%5+ax4um@BESROpf&jeg=eSe^$iix^`lJl>H)Ly-$KKe!
zFs&*-w(6~qq(Y=iXGF%D#}D`q*;Si>)kR-k^Uo&v9_+ZMhKR|Rvt@*6n&#612wr}k
JcTZ3={sN_NFcbg)

diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params-members.html
index aa6c60c85..2492594fe 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params-members.html
@@ -81,16 +81,17 @@ $(function() {
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#af5a496f1b6a46ea6a9894512029add6a">initialize</a>(Pointer pointer, Index ld, Index bound, Index epilogue_stride_w, Index epilogue_delta_w)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5">initialize</a>(Pointer pointer, long long batch_stride, Index ldm, Index bound, Index epilogue_stride_w, Index epilogue_delta_w)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">predicate_inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">predicate_inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html
index 9b30fd784..7c1b10579 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html
@@ -85,18 +85,30 @@ $(function() {
 </p>
 
 <p><code>#include &lt;<a class="el" href="gemm__global__tile_8h_source.html">gemm_global_tile.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.png" usemap="#cutlass::gemm::GemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E::Params_map" alt=""/>
+  <map id="cutlass::gemm::GemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E::Params_map" name="cutlass::gemm::GemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E::Params_map">
+<area href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html" title="The params. " alt="cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params" shape="rect" coords="0,56,433,80"/>
+</map>
+ </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:af5a496f1b6a46ea6a9894512029add6a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#af5a496f1b6a46ea6a9894512029add6a">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> ld, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> bound, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_stride_w, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_delta_w)</td></tr>
-<tr class="memdesc:af5a496f1b6a46ea6a9894512029add6a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Setup the params.  <a href="#af5a496f1b6a46ea6a9894512029add6a">More...</a><br /></td></tr>
-<tr class="separator:af5a496f1b6a46ea6a9894512029add6a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae24453fcdf9f21385b2637476746bbe5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>, long long batch_stride, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> ldm, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> bound, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_stride_w, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_delta_w)</td></tr>
+<tr class="memdesc:ae24453fcdf9f21385b2637476746bbe5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Setup the params.  <a href="#ae24453fcdf9f21385b2637476746bbe5">More...</a><br /></td></tr>
+<tr class="separator:ae24453fcdf9f21385b2637476746bbe5"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
 <tr class="memitem:ad764f98e770d4685006e6888214dcd4d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a></td></tr>
 <tr class="memdesc:ad764f98e770d4685006e6888214dcd4d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="#ad764f98e770d4685006e6888214dcd4d">More...</a><br /></td></tr>
 <tr class="separator:ad764f98e770d4685006e6888214dcd4d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1a53695ce7f3cb267225d3ab86a0d5aa"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">stride_d</a></td></tr>
+<tr class="memdesc:a1a53695ce7f3cb267225d3ab86a0d5aa"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stride in the D dimension.  <a href="#a1a53695ce7f3cb267225d3ab86a0d5aa">More...</a><br /></td></tr>
+<tr class="separator:a1a53695ce7f3cb267225d3ab86a0d5aa"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a0c6b03c635e14ad4424a83f8c7f8025e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a></td></tr>
 <tr class="memdesc:a0c6b03c635e14ad4424a83f8c7f8025e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stride in the H dimension to setup the thread in the block.  <a href="#a0c6b03c635e14ad4424a83f8c7f8025e">More...</a><br /></td></tr>
 <tr class="separator:a0c6b03c635e14ad4424a83f8c7f8025e"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -115,8 +127,8 @@ Public Attributes</h2></td></tr>
 <tr class="separator:a3e8f6cf08d23318f3e3263b55cf3b84a"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="af5a496f1b6a46ea6a9894512029add6a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af5a496f1b6a46ea6a9894512029add6a">&#9670;&nbsp;</a></span>initialize()</h2>
+<a id="ae24453fcdf9f21385b2637476746bbe5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae24453fcdf9f21385b2637476746bbe5">&#9670;&nbsp;</a></span>initialize()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -132,11 +144,17 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
           <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a>&#160;</td>
           <td class="paramname"><em>pointer</em>, </td>
         </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>batch_stride</em>, </td>
+        </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td>
-          <td class="paramname"><em>ld</em>, </td>
+          <td class="paramname"><em>ldm</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
@@ -266,6 +284,22 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a1a53695ce7f3cb267225d3ab86a0d5aa"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1a53695ce7f3cb267225d3ab86a0d5aa">&#9670;&nbsp;</a></span>stride_d</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">long long <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::Params::stride_d</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a0c6b03c635e14ad4424a83f8c7f8025e"></a>
@@ -290,7 +324,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.png b/docs/structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.png
new file mode 100644
index 0000000000000000000000000000000000000000..a31a8a5a82b67d16f406f3c8ba503260c422ef38
GIT binary patch
literal 1464
zcmb`{dsNbA7zgklx|~^Fvh)ZZBo&t~FR`ZUB9JE954?>^P-7)*c5!N@dC7&=nu%8C
zPc+QPW|-v#M=7M3xTdCNdXzL0&Ad!ALuiVmq>gsBo!Z}f&v~EsdC&WO{`;Jl6&&bi
zY=kfZ0KgdB<wFJlm_XMD8|v%o^$4+<?yw5>-$PhlUe>iL^~;+NPF&J;f9=M`Myenw
zM0YieCkO5ZbfNdFw|&nS0I<Rj^zqu01XFP3(C9Wp!ewFk!ZLoI#~>Ndu0HxU(ge$^
z&Sjs63DC1drxG5~$sxlLa7r^H(t#Xy6JY1Wg87im^)q;-ticZ4ufhQw5QVfX%@YmH
zaI{vD0o9$4mX7gX4cslaafaDMt=3c3FKrTtvq<>fk+n_VSLck6l@!Rc*QT@~8mBU4
zwa;QhwCSGXG5Co@caJXlxLPb*3YT%WKSv<DO@71{=C_|J3*dxWM|)NHVnfK1!Xitf
z>(U%h^48C%f5tX-cV*V@B(I9zPcz}`EPwNqxHT`n@f&UL<W5SJ=vjekx}Y$+!Nh8C
z`i<LOde)&dq-zakl}N3f`=xb=vg*JSeY(lO)`-M0hv)EH1TX(L2EMrXhmnUaFRrCr
zJ(!`kxr|Mss;ycuQ%b?%CDZ953JW=$&X*;yoHSQuH8hDe&Gy|!_q?!lzot6xFnUc!
zI!ANwb!G!xHUcDUAsP=l_xCi1H+6c)KkOL8VR2YN-ryBkSr8m2Io?u7P;<ZQwm65<
z#4=l2>K`H`Ll(5$h9k<mA-Jt$(yW6g+_A~oF06UR>;tUF?O}WRMDh6>E2}0l?k8s}
zG;K^&pHjPT;|^@EU!EN46M^g3lEj<OV9L51P#nF2zy!~!$f(iVZLo<=O|M8aif1vm
z{v1^3GR}XQ{IxcK>H4Hfq2L>;Al$^t7pdiv`i`JAaT<fhY^f%>5~=qhtQYa(?t%=i
z#ZJO_X>mW?*{H_@n5B@_4zvR%ZP!00CVeZ|WO51Hd?$b>@7HNruX{N?tIlf$MjTnN
zPkM~0cKU`l&<19twpHt)|BnAlN*4gZ)&EC;=_-hp3yW@5y|0cQAQ2=RI$*#|9{Mv-
z#~AGdK^!!p=M1&h6kJ$wD&-c$t8G`<gMU+w<9<Xr5AN(RDQH;_Rrl=QkdXS8-Mk^=
z*&+MKZKTa2)P^}o4Za>|6<rX<3K`RLaZCzhraszVveQMtYCC$=vY`_hd!arHJDNZJ
zA?5J*l!?$bWWnr;lRi8w>W{?VU$JUxNX@G)T+)-7LDI#^=iI`#Ch^0MxZ2Hg==+EY
z)7Z$uDt+I?_(f8l%<c+$`@SO#Oa7WUMMO?2rTZF3KQT}?n7|SR#SHbul{4}C6&E9i
zN9)|>7N&~hFS~?Wy3D4qt|_YE0?c_v-w;Fkj@B4OS9dDKbUExMyUILDiBt6|eJO^^
z!~jwL@EQUCQa;tC*mfN2DlU#S5T-$|kFpVUp<hmnK(gA_Y0i9p2rp(fJd}{zJwvtb
zWK}M(#rVDG($X%fNY$Wqt{YKFPb@!!ThG{R?GP77HBu^5`fd){dq|Q(DAHVw4C3H@
z-3A!B2%KGlYx|Zfs*@LGV>WVS<|4m*NK-4kcaolMB-9cJGsnP+g#-y1-cs-rrVNgx
zi7Z>=?~I0i6>c3wOXJ0H{HHz^KL7YB>TKN4%xEd!5p+AuoG13+OYvcunvB}*UeFSF
zs_1FIEqXGnHw<DDVy_8;&gS#j==(g4xENi6p6vRZ1(J2lKSUGLB#f4m<-%ypEXurr
Wy7bM(b>6yf761u>K78*3XZ{2R0LLi+

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits-members.html
index 92fd6a4c0..2cf66086a 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits-members.html
@@ -93,11 +93,12 @@ $(function() {
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">ThreadsDelta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html
index 3aed66b5b..9de76685a 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html
@@ -107,11 +107,11 @@ Public Types</h2></td></tr>
 <tr class="memitem:aba61fb6e93a6423ab72c082c280f5db4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Base::Delta::kW</a>, <a class="el" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">Base::Delta::kC</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#aba61fb6e93a6423ab72c082c280f5db4">Delta</a></td></tr>
 <tr class="memdesc:aba61fb6e93a6423ab72c082c280f5db4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Override the strides in each dimension between different loads/stores.  <a href="#aba61fb6e93a6423ab72c082c280f5db4">More...</a><br /></td></tr>
 <tr class="separator:aba61fb6e93a6423ab72c082c280f5db4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a72eebc18d31900db57fa77508016f64a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Base::Iterations</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">Iterations</a></td></tr>
+<tr class="memitem:a72eebc18d31900db57fa77508016f64a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Base::Iterations</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">Iterations</a></td></tr>
 <tr class="separator:a72eebc18d31900db57fa77508016f64a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9aff3e2ff0db5a5169257e964e5895c6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Base::Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">Threads</a></td></tr>
+<tr class="memitem:a9aff3e2ff0db5a5169257e964e5895c6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Base::Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">Threads</a></td></tr>
 <tr class="separator:a9aff3e2ff0db5a5169257e964e5895c6"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae2f8331619e735e620f8a8cf2cdde077"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">Base::ThreadsDelta</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">ThreadsDelta</a></td></tr>
+<tr class="memitem:ae2f8331619e735e620f8a8cf2cdde077"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">Base::ThreadsDelta</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">ThreadsDelta</a></td></tr>
 <tr class="separator:ae2f8331619e735e620f8a8cf2cdde077"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a14e9713b0cd34af433c3cae9b283b54c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">Base::ImmediateOffsetStrides</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a14e9713b0cd34af433c3cae9b283b54c">ImmediateOffsetStrides</a></td></tr>
 <tr class="separator:a14e9713b0cd34af433c3cae9b283b54c"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -122,25 +122,28 @@ Public Types</h2></td></tr>
 <tr class="memitem:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef Scalar_ *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a></td></tr>
 <tr class="memdesc:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">More...</a><br /></td></tr>
 <tr class="separator:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aebbf8834d0d88f0e5b3e1926db5e6758 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt; Tile_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a></td></tr>
-<tr class="memdesc:aebbf8834d0d88f0e5b3e1926db5e6758 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">More...</a><br /></td></tr>
-<tr class="separator:aebbf8834d0d88f0e5b3e1926db5e6758 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a29bd05960cc541bb67098f5483c84cf6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, Threads_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a></td></tr>
-<tr class="memdesc:a29bd05960cc541bb67098f5483c84cf6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">More...</a><br /></td></tr>
-<tr class="separator:a29bd05960cc541bb67098f5483c84cf6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a65f9ccd630dde0c9db5358cfc951583d inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, Tile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">ThreadsDelta</a></td></tr>
-<tr class="memdesc:a65f9ccd630dde0c9db5358cfc951583d inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The relative offset between two elements in the H/W dimension in adjacent threads.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">More...</a><br /></td></tr>
-<tr class="separator:a65f9ccd630dde0c9db5358cfc951583d inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef Tile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a></td></tr>
+<tr class="memdesc:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">More...</a><br /></td></tr>
+<tr class="separator:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt; Tile_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a></td></tr>
+<tr class="memdesc:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The vectorized tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">More...</a><br /></td></tr>
+<tr class="separator:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a>, Threads_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a></td></tr>
+<tr class="memdesc:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">More...</a><br /></td></tr>
+<tr class="separator:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, VectorizedTile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a></td></tr>
+<tr class="memdesc:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The relative offset between two elements in the H/W dimension in adjacent threads.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">More...</a><br /></td></tr>
+<tr class="separator:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, Threads::kH, Threads::kW *<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">Delta</a></td></tr>
 <tr class="memdesc:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">More...</a><br /></td></tr>
 <tr class="separator:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, Threads::kW *ThreadsDelta::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a></td></tr>
 <tr class="memdesc:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Strides for immediate offset computation.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">More...</a><br /></td></tr>
 <tr class="separator:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaf6410f99d7f995792d0ac34efd3a82f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, Tile::kH/Threads::kH, Tile::kW/Threads::kW, Tile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Iterations</a></td></tr>
-<tr class="memdesc:aaf6410f99d7f995792d0ac34efd3a82f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">More...</a><br /></td></tr>
-<tr class="separator:aaf6410f99d7f995792d0ac34efd3a82f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td></tr>
+<tr class="memitem:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, VectorizedTile::kH/Threads::kH, VectorizedTile::kW/Threads::kW, VectorizedTile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a></td></tr>
+<tr class="memdesc:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">More...</a><br /></td></tr>
+<tr class="separator:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td></tr>
 <tr class="separator:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
@@ -220,7 +223,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kStrideH
 template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kStrideH_, int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Base::Iterations</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a>&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">Iterations</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Base::Iterations</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a>&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a72eebc18d31900db57fa77508016f64a">Iterations</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -236,7 +239,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kStrideH
 template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kStrideH_, int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Base::Threads</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a>&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">Threads</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Base::Threads</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a>&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#a9aff3e2ff0db5a5169257e964e5895c6">Threads</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -252,7 +255,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kStrideH
 template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kStrideH_, int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">Base::ThreadsDelta</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a>&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">ThreadsDelta</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">Base::ThreadsDelta</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">cutlass::gemm::GemmGlobalTileCdTraits</a>&lt; Scalar_, Tile_, Threads_, kStrideH_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html#ae2f8331619e735e620f8a8cf2cdde077">ThreadsDelta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -290,7 +293,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kStrideH
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset-members.html
index 1510bcf26..192e27a01 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html
index 524a06aa4..8feee54ba 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits_1_1ThreadOffset.html
@@ -124,7 +124,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kStrideH
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits-members.html
index 6225081e8..652e9a86e 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits-members.html
@@ -81,7 +81,7 @@ $(function() {
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
@@ -89,13 +89,14 @@ $(function() {
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">ThreadsDelta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html
index 4e61285eb..7f8c05e72 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html
@@ -90,7 +90,7 @@ Inheritance diagram for cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayo
   <img src="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.png" usemap="#cutlass::gemm::GemmGlobalTileTraits_3C_20kOperand_5F_2C_20kLayout_5F_2C_20Scalar_5F_2C_20Tile_5F_2C_20Threads_5F_2C_20kAccessSize_5F_20_3E_map" alt=""/>
   <map id="cutlass::gemm::GemmGlobalTileTraits_3C_20kOperand_5F_2C_20kLayout_5F_2C_20Scalar_5F_2C_20Tile_5F_2C_20Threads_5F_2C_20kAccessSize_5F_20_3E_map" name="cutlass::gemm::GemmGlobalTileTraits_3C_20kOperand_5F_2C_20kLayout_5F_2C_20Scalar_5F_2C_20Tile_5F_2C_20Threads_5F_2C_20kAccessSize_5F_20_3E_map">
 <area href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html" alt="cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;" shape="rect" coords="0,56,667,80"/>
-<area href="structcutlass_1_1gemm_1_1IgemmContiguousGlobalTileTraits.html" alt="cutlass::gemm::IgemmContiguousGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;" shape="rect" coords="677,56,1344,80"/>
+<area href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html" alt="cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;" shape="rect" coords="677,56,1344,80"/>
 </map>
  </div></div>
 <table class="memberdecls">
@@ -108,25 +108,28 @@ Public Types</h2></td></tr>
 <tr class="memitem:a3ff6f630b6b317ace1cf6e13fdf3a0cd"><td class="memItemLeft" align="right" valign="top">typedef Scalar_ *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a></td></tr>
 <tr class="memdesc:a3ff6f630b6b317ace1cf6e13fdf3a0cd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="#a3ff6f630b6b317ace1cf6e13fdf3a0cd">More...</a><br /></td></tr>
 <tr class="separator:a3ff6f630b6b317ace1cf6e13fdf3a0cd"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aebbf8834d0d88f0e5b3e1926db5e6758"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt; Tile_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a></td></tr>
-<tr class="memdesc:aebbf8834d0d88f0e5b3e1926db5e6758"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile shape.  <a href="#aebbf8834d0d88f0e5b3e1926db5e6758">More...</a><br /></td></tr>
-<tr class="separator:aebbf8834d0d88f0e5b3e1926db5e6758"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a29bd05960cc541bb67098f5483c84cf6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, Threads_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a></td></tr>
-<tr class="memdesc:a29bd05960cc541bb67098f5483c84cf6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads shape.  <a href="#a29bd05960cc541bb67098f5483c84cf6">More...</a><br /></td></tr>
-<tr class="separator:a29bd05960cc541bb67098f5483c84cf6"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a65f9ccd630dde0c9db5358cfc951583d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, Tile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">ThreadsDelta</a></td></tr>
-<tr class="memdesc:a65f9ccd630dde0c9db5358cfc951583d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The relative offset between two elements in the H/W dimension in adjacent threads.  <a href="#a65f9ccd630dde0c9db5358cfc951583d">More...</a><br /></td></tr>
-<tr class="separator:a65f9ccd630dde0c9db5358cfc951583d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a52ba72984ea8ce84eda28d07c6c8ec19"><td class="memItemLeft" align="right" valign="top">typedef Tile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a></td></tr>
+<tr class="memdesc:a52ba72984ea8ce84eda28d07c6c8ec19"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile shape.  <a href="#a52ba72984ea8ce84eda28d07c6c8ec19">More...</a><br /></td></tr>
+<tr class="separator:a52ba72984ea8ce84eda28d07c6c8ec19"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6cb3196f1fe3958d1656ba8b493c82ac"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt; Tile_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a></td></tr>
+<tr class="memdesc:a6cb3196f1fe3958d1656ba8b493c82ac"><td class="mdescLeft">&#160;</td><td class="mdescRight">The vectorized tile shape.  <a href="#a6cb3196f1fe3958d1656ba8b493c82ac">More...</a><br /></td></tr>
+<tr class="separator:a6cb3196f1fe3958d1656ba8b493c82ac"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aae7128f5522383c857d2639031b64c30"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a>, Threads_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a></td></tr>
+<tr class="memdesc:aae7128f5522383c857d2639031b64c30"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads shape.  <a href="#aae7128f5522383c857d2639031b64c30">More...</a><br /></td></tr>
+<tr class="separator:aae7128f5522383c857d2639031b64c30"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a428750e54eabd15b2a3f7ac2a96af0a9"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, VectorizedTile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a></td></tr>
+<tr class="memdesc:a428750e54eabd15b2a3f7ac2a96af0a9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The relative offset between two elements in the H/W dimension in adjacent threads.  <a href="#a428750e54eabd15b2a3f7ac2a96af0a9">More...</a><br /></td></tr>
+<tr class="separator:a428750e54eabd15b2a3f7ac2a96af0a9"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a07bb48f99000256f04f00564a4371c2f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, Threads::kH, Threads::kW *<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">Delta</a></td></tr>
 <tr class="memdesc:a07bb48f99000256f04f00564a4371c2f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a07bb48f99000256f04f00564a4371c2f">More...</a><br /></td></tr>
 <tr class="separator:a07bb48f99000256f04f00564a4371c2f"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:abc47717230ddde3edc88d2770f6841bf"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, Threads::kW *<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a></td></tr>
 <tr class="memdesc:abc47717230ddde3edc88d2770f6841bf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Strides for immediate offset computation.  <a href="#abc47717230ddde3edc88d2770f6841bf">More...</a><br /></td></tr>
 <tr class="separator:abc47717230ddde3edc88d2770f6841bf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaf6410f99d7f995792d0ac34efd3a82f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, Tile::kH/Threads::kH, Tile::kW/Threads::kW, Tile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Iterations</a></td></tr>
-<tr class="memdesc:aaf6410f99d7f995792d0ac34efd3a82f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="#aaf6410f99d7f995792d0ac34efd3a82f">More...</a><br /></td></tr>
-<tr class="separator:aaf6410f99d7f995792d0ac34efd3a82f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a21a3524edaf002b5e5878df3c7eae7e7"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td></tr>
+<tr class="memitem:a893cb2cc67676b44c1f3ad5908a4ab0c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, VectorizedTile::kH/Threads::kH, VectorizedTile::kW/Threads::kW, VectorizedTile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a></td></tr>
+<tr class="memdesc:a893cb2cc67676b44c1f3ad5908a4ab0c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="#a893cb2cc67676b44c1f3ad5908a4ab0c">More...</a><br /></td></tr>
+<tr class="separator:a893cb2cc67676b44c1f3ad5908a4ab0c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a21a3524edaf002b5e5878df3c7eae7e7"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td></tr>
 <tr class="separator:a21a3524edaf002b5e5878df3c7eae7e7"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
@@ -177,8 +180,8 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 
 </div>
 </div>
-<a id="aaf6410f99d7f995792d0ac34efd3a82f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aaf6410f99d7f995792d0ac34efd3a82f">&#9670;&nbsp;</a></span>Iterations</h2>
+<a id="a893cb2cc67676b44c1f3ad5908a4ab0c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a893cb2cc67676b44c1f3ad5908a4ab0c">&#9670;&nbsp;</a></span>Iterations</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -186,7 +189,7 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_, typename Tile_, typename Threads_, int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, Tile::kH / Threads::kH, Tile::kW / Threads::kW, Tile::kC / <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Iterations</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, VectorizedTile::kH / Threads::kH, VectorizedTile::kW / Threads::kW, VectorizedTile::kC / <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -202,7 +205,7 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_, typename Tile_, typename Threads_, int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -241,8 +244,8 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 
 </div>
 </div>
-<a id="a29bd05960cc541bb67098f5483c84cf6"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a29bd05960cc541bb67098f5483c84cf6">&#9670;&nbsp;</a></span>Threads</h2>
+<a id="aae7128f5522383c857d2639031b64c30"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aae7128f5522383c857d2639031b64c30">&#9670;&nbsp;</a></span>Threads</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -250,15 +253,15 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_, typename Tile_, typename Threads_, int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, Threads_&gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a>, Threads_&gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a65f9ccd630dde0c9db5358cfc951583d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a65f9ccd630dde0c9db5358cfc951583d">&#9670;&nbsp;</a></span>ThreadsDelta</h2>
+<a id="a428750e54eabd15b2a3f7ac2a96af0a9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a428750e54eabd15b2a3f7ac2a96af0a9">&#9670;&nbsp;</a></span>ThreadsDelta</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -266,15 +269,15 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_, typename Tile_, typename Threads_, int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, Tile::kC&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">ThreadsDelta</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, VectorizedTile::kC&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aebbf8834d0d88f0e5b3e1926db5e6758"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aebbf8834d0d88f0e5b3e1926db5e6758">&#9670;&nbsp;</a></span>Tile</h2>
+<a id="a52ba72984ea8ce84eda28d07c6c8ec19"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a52ba72984ea8ce84eda28d07c6c8ec19">&#9670;&nbsp;</a></span>Tile</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -282,7 +285,23 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_, typename Tile_, typename Threads_, int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt;Tile_, kAccessSize_&gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a></td>
+          <td class="memname">typedef Tile_ <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6cb3196f1fe3958d1656ba8b493c82ac"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6cb3196f1fe3958d1656ba8b493c82ac">&#9670;&nbsp;</a></span>VectorizedTile</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_, typename Tile_, typename Threads_, int kAccessSize_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt;Tile_, kAccessSize_&gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -392,7 +411,7 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits.png b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits.png
index 4c9bada4639d8a2173d684662ed65cdcc38edc1f..739d64830bac6a45c846a08eb6729f6787addc7f 100644
GIT binary patch
literal 2833
zcmd5-XIN9&7QKLE5D2LFLLvhUBd8!CB~%L$0SzEB0Sh2RkWM5<iXcT|!2%M^_(D??
zr3(@z6d_=c7HJYdq(nrD^cWDO#lYOe_sx6%=I=Y-ckkI}-*e77XYIY$z2)q57%IC>
z761S!`iKn%0Hjf%?JOe&zWJtmOu!EA?C5H{zP=8cbKfU(>mu%gmiVcytv&T3>I68H
z3CB3O0N^B1>uGT{0svVW+UB5ZlmzeL@P*N$EjFYK9oG8xp$1Ar!rf%miFiiA$IpE!
z$Xa=1I~I_dGo<*rwUy{5xl#Pk8xkZ80E-un67nehB1b^#F1&SXEihKsvcUkj_0R6K
z3g6Y9DW$Jouht|UFznvto5olE63cE#E)Ot9;1#KP7i#=Thm{T`TPOaBC7C=`33R_H
zVLn_fDBNO!gVhT9P$00++99bLMS{g!7$KC_DMjtyit1RMi`HQU(ng!9DWX*aHlD|z
z-_oU62FkTaQ)lp;X>RHItry3x@`skNO95Ey_b@pHKA)ATE^G@R#Ml`3S#s4jc}BJe
zE;0D*7?waCg(JoH*m36to2}2GaP8*pKB}n-f$n+?x}LuT$3O(~zGlx3++fyT6#GPn
zY0MB~NN{EnyN6yP8I=MBS<&>z<j!m?z+Sb2<?B_m)IW_M9yLuRw7V6LCWb$`SDHJZ
z+4;7LI@^P)>%>EXTV={5j?S>B$g>!Tk6iIkK<pQMeHAg6xA<P!g&CRInd<tddBF}}
zj+a+fkr%;LWmkg4kv2KVz=J2BEN&3qD)zrNJGM{%QOi}oNEa+TaFnGnl`%USu-B)w
zIO{5@w+Io?H(H14{lfm}2}1=gKxB1Q85VagMR@#LQQDv2ePRI?EF}$wape{<KAk&S
zcrnLhdOn_5+^9hx32x}@kDNJ|?AyLeZPt8wfAhEu6)}0j-MFrlSRUq-c6>pnO}PXJ
zg!e#^yg-`Z(e;d`;&Mb_W<&fhca~mNHa5AnyXT8p8UF?1PCEVrr<awat}^NNp_15y
zcyjO8rZ2kdpOhWK8?xH(K+liK4w~<Ffozk7pT@XAWDQ0FX*X1-7eh~DGCh@sAV`QT
z$2f#4j%<dqeE9yN8lu88!W|!P&PZA+LBmJRvM&g)IXtT-Upf$Y{!OmS-nBm9uo~xG
zq(9B$1q%0Yp*o0mmbncv`8ch+w8~*tw|P_a%fbZCIIkNbdj`N5@9zHmSV-?+7sR}5
zU+j%EEzdeWRDYpsaV?J!k+`X}eNp(tjHB0j{z}N$pw8-r!lU%j#CgT-4Fgr5xfeVb
zA7oYZ2fe43ngs*aD{SGmo;a9N=q>ZZgZT&fm!y$l->~yxL+mPffbad2biMSotgn|%
zcr(k?YH7GZ_f$X#)o%hv10cT{vNXE+hU?`-ebQyT#n@@=Z{_Juc<7JEAAz&w1PQM?
z(TTS#>^6#<sRe#a#2VrE0=3+z6#%RiT^BI<<#sE9>DXihMz`|0k*I|J+3oK}Y1C~k
zN%M1~*Z^=q>I|@kG!u35A_?dfRiem%e6py>R0XqLJmry(=rRy+lrRyylJ{S~_>yA3
zHjXNu07w}SMfo6Jx8pfcQf$cAZV&}kjFMI>x|bM5>2J6*lA^p9V>q7q8*HP9C-GkY
z*)+kbofpYW=kg+rE4Vz0l4#2<-sdFY38km9K}uEL?*OYO$rc1C`9E~4XWhp*YUjiz
zcxdOOVeD4`SP(e+HL3JI=76*<Iaw2dwm*b)MjMfRHMOCpBI7<(C12!Dg1Um={puk)
zXghM3kJP_4x1;-?6Ya_OvP=6=TFpl=rZ}2tnchxF)rU+?VFFvmWmFftt~rHZ)5-$k
zIumu568LGSx)yP{W4vM9?Eu?j^rl_D<}2S%WmRdJ=rtVa+Bh*dVN}_ti?;ln2U$J1
z*`Z4s_E;0TykxrzeR9lz6Vv9Q6uQ5oOy%>EqXzjM<3OxlqhiR#eJkBB>>?b3Me<xG
zaQuM}U9dV!16MwrBPBVLi}NAwaVzoO2jce^KUl7mzOf{b?jA%&R6M%I)*m9Rx*hTv
zj_zh4UMb#`9188^g;Du`M7a2wCmw&zTNcWA6Eqv&CwCVu5_noB&nW%9Fvi{N#6Jef
z8RZfDq>W5xWls#wV?TE`uET5Jux?yUb<4D;lu&hZM@#ST_p?(jpT0&8Zw#f)^nDMR
zWB=X*`#9u)kG~d|AxF<pYa4(EQr#KJ5xMY9i_d!&nq%A1h25kkzN}o2eXzTgQ|cHk
zw+ZfKHg(#)9%SiRO^#jjwJTbU<-z3^*YoUUgY3M&jV9WAnQ?|T&zHvPS)-?y*&@1-
zkbyRJI&)moQaSkKSjB5A{dYTu2jeb3h`8r7V`ToctW{{u6t-7?$L+6CH+(uC71d-E
z)Pz`k$qBs}V@k{`i9N_9Q&RdL*ws|21|tnKTrlSZ1FQfV6*m7MR<F)V#~NKVGJsNF
ztI!j?o_K1dkHHb%L|Ht#rU*s8y;ObhipfQ;3zIKFQ0yg-WHgnko%9TQ>r~2ob`(_i
zNUp`s@UCjvh3mSS1>UX|*}1A^O#G$%Al>|<%yU}=^Xf@?hIa`kW*CZyNs{fpo!F$g
zW4FOrzC>~|obkg#9^=T1hww?a<vvuVgxWe+gQ@)%-}Pn7tWGeA>s|O|;Su)6S>7Gf
zY}Rk;jzMNy4GeDfw_?c(@_W_~IdwQpFJ*Jz`5Qlt)G7$T3OeAE9sh$7C?C$;nGy`o
z5B{;%hN9OWmWz^st0f6vDO7wl=0&Eizif$<R@7EtOjAONSXWmS1_mi;3~n%&RWR7x
zdfBxt$X%EdN%p<DukTtmr>?68Bu#n#K1do%8zjxgj6-)KJ?6KrELU4`D@N8TwT=%t
zv_=;S;{FwXS;-YP&ONY~_2KH`*7`Y<Plo51-#u8*!#u{~Qdi3gyF&|*8^gn{2WN)(
zrcPV7Wh}-!50vo*@5O(F8&36A9X@pucf#I1Q~6e$M^DdMzfEOIP8%KRy4wr=mTI$a
zJIEwn#AH5L%JjLBY^yhakiX6aYxK@rMejyS`CAHcW^2b{RuYN!UArAmk{w^cyeX>D
z9jKWyE%dQy!_(xiMs9C}6fE8ez0Ej&Z|_MA&iLWSZOeyhw1V19i?efuB}At}qsQQV
z*HdM*rfx6Ee~Yn1XMBFxrm4N1S~SKlx~&<Pfi>ksA0Pjd4kjxis#_!>pq5~VE5t&B
zKwpv*3r|a;c%0KH7M>DsvG4@F5DO3Pr|`J{6dskIdPUhIrI)kS#a=u2KIZEtc~IIw
e#RJ8zxqcluIR!I%9h;H>fDLWyWK(Q?=E`3vu@q(i

literal 2856
zcmc&$c{E#T8^0!>P(){1HL9j&deDj5s-dVQdI%x0WE!Mt>?3wfi`p78oifu<Z78*y
zu@8!>q}3ur(bh1Q5|T;vP$5l&(o$RU-RR7mIp1IN-}jz#@AEwO{O<F-@9$ae{n5kC
z38ti}1ONaG?d*U90C^;+dniJ{`;xh_87MS7FlQX4QYok|zh9{Cj=KSByBC|y_GwA*
z0!_tOoZB}52$HSwXJ<?SK#7HRus@R^CoU1?%{Hhyu;^_olI)cB*`n_$7$chu<NBmY
zbf5Z{_MY4FCV+NOVf9nY7@{Dou$l&#08oF7!8ZWJMBPg-O-@5&K#dJ#UcI%)AAt6m
zg7Bb#Z$HsUqqSh<RM<W~1t8r2AMo4x!JA{k{VSzZ2{1%BvR12Q$A?gZ0#TyY(o9YU
zr_S29b;Gm&)5aTuSK0mH<FHEgK)}snNz&k;S|q=0W$pn+Hjz3(I`+OjUu-t>2eLxJ
zcS;R8xUy_@%MLNT_9{Q9?KKo9suhhQo3uXs_yA~cp~*HRyd^~JpoX?3ozix@tqran
z=jF0Qa%!iRY)j`I8TB8CBqC#{bSnmbr)tOSEK219i?+n(h5b!VifwW&Rg}@dFY;BL
zql{bc7>3B*2nBb>jBldvA)dUXQ0pTikeiYxlC@QK=I1IJfIEMN%oScZz1Gy1sy9hY
zNVQ`Noh}q*P=p3cv+1!v-wgf+i+)95<#cE`TWp4vpF`EcoEs0<xZHI)_=DknYRTIN
zU1lOEj`ya~C}inu6pA!j`WS8Y)s>XQw!2Avo>Ap8YD-OqW3PQTuhnO17pyRC{q}x>
z{@y$Sc8873k)~I!2hW!!J`N>0Da14pG;5}2X*45#c1OKI+VCb!?Y4f>#qjsPFfF3P
zxM?9?JL=&OFn^HM>om!2-ZuW>=svTqvhr}s6DLaY<B=(I5f*hfSZ!~-)^=&IRW}*h
zo|lJOFdw!iXAr8q13GWWBY(!9yulqovTT&i+DK7m!^Mx|724Kq`GMkwB*W)WC9p;W
zFbF>zzx`XDXD<u(&S3Em<gChwvucocUg|O(ZZ$I^;6f)aTn#V2Y6OAFBaG^dAo8IU
z#Bh%)KAB?#C+E*xM4Eb}75Z-7lcn{i#BOAM&)GwvW19J2>uDNZ-!L(9Xs}l})tIGI
z%)dfgG}qKJje9oBf;G>{)iF;%NObwY`r>&<NE8o0fZW?#T#Y9MlF{i;dPwr$PsEh%
z78s(#v?N3<O&O|*jxTzjDw^`io{$`_&SAc{%i@t0?M0DY#^DfBtIE-Y>_<dL(qi=3
z!2N*j9>o@B_{PK^c?O*BLf1<^n^7z6Ob-dA>ug+E@At$bLoG39D%Pp;m6orYK0FZ5
zcB%kP0UtT{Hr>g7CY`#c-QTsUUT*JRvpzx1Eot4Y+zsUd$@L9B)M_x**fQA9?@MN>
zn=x$rrx!rf1Vyg2`y;RJ!JDHrxer~dPalZ^z<72J0_HNP0OY8p*%a(Wwof%!Fa`}6
zSp((4!PZqiwx12CWPS^#rLX(hfBpylvE%hlV8;-j0#G)fk=7)D`U5Iya^MJfd0fWR
zu617!-+JW}ja`ea`;W){c4DwZ!50C@`KvH+O6+3Vn=k(fMk@RbUSP}4u<QDZNu=Dz
z80C;dU+)HE1F`-xmSn!tR3ra#I!yc9sZ}#b6aWET{N=Q>kSC5m!QzQSqFKBsjLf%&
zVub9xbVo20s)q}nw<qu>NY6;KIY>{lPbEkXq5%uiW1udh2loGkYggprFz~9BG$Op}
zHqK=OP!9twE&9D&oUObgBU9%fS~ESgoDr<^)Oplo5~&M{(2t_|-&@5R3$ZbbchFTu
z(k#X<l@Z%}JXH9g>&aJRHZM==<=wLt!4oe}7R?Yw`1K=7VQ!Ly1}{DXr+l0d+nu=H
zi8&mZr&Ds_+j4ESIvtyrksGIKSSa1PUsL@mu4pXS2&(pQO6O-XH`^I$I^za=%Us{~
z%tX3VExqca(RFdp<KRQb;=1k+_Gm272V%0QT_~_)`;xmpoA+BS*(aOO)Q9%J)CW&r
zr!P;=t$W%;I2%~I+l(#8A<rx)VegdjQZA0yJv)!N^rPUd=(Fw_=WB*pIbK`$*BCh7
zKtlwb;Eekj&#HVru^4we;PW-dd^O(L->s7Qt?KR;1|pkO#&`iulI6TLcW^DS%(icQ
zD?E$JLS2H8td{(;q?pkc-CM~~LZ`_eI+sbSS%e(gL|s)JmwZhwAm^^XyTJ7*rL5D8
ziubAY!iB%Lz%#N61Lw~l#2+k+s3Cx1R}9Bp^wbRCOvhZ|?Gk-><-x0-*@yHkH5aCT
zxJNAQzib<8iyqe8!DWR&u=^ix8SqW!Pv4P0AthxfKnAaP>z%X7UY`iaOW7*E*4mlG
zDV-V<eO6&`y{4k^3c{_mA42is1SwgM^Y_o>BJl47&tK!k9-|HsZs=s*L}yfanL7BX
zO?fj-J{6WlZ9y5U#IAM4k@niMwq|vD)iW|#)98dT<ZMI#u_HbgiO*aY6(~l!y^i#-
z!Ak_IjH5H>IC@#bhC|?l|8%t8#P7*z#=gdO-Ku!Cd8Y8E>PI?l78m#NHlpcAEgeqP
z&k<^9ora^)iMA2tBc2T-P0tsCAXr|Rb$h3;9-O%!Vxt^$C{)v5lAn?C^^gTQZUBE^
zZZ=_(zV&E+okTp>c%UhUU0_5>|3niyn*7jplqL{Up9tG4liYv7VvBA@C!k#-Bc{pa
zOLUMs_d}sxx6Jg>2c#5`Jd*Kuv+*a-aHy#v<=H*NW3h^%hl|9gRXK~dEb4h3q&cQT
zhFTE;KQOL7Y458*xig>xXNG(GsgdW!FZ2b7#!cKQw5h}46eKP*K*)t|Cf<x6SZ%l~
z&=`jjD*Wn3_{h}Kq037mv(y)5Q4yD==g9nN*Re$2$#<R~cCa@*Z^!I3Y+q33;#7K;
z<W}z`#&D<s5fe|g%%2xEyFaXE?5h<hjaNqmkIk6=##oErx5DLIUVkd$p5DlC8*KkQ
zuzOGD#WzIGLWgz}!fEG#-AVa317D)C*P)wEN5uK_nm4@#CaAXXi3LtLLZep4rl-PF
zw{GU?d9-E@SvgTlIz&W=5042u_#d2-r%XK1N$HE2Y5g#ZC}M>)(%tvO@QyE|(zR42
zzY_facty>cPxfW#b7QtPU9L6OjJZNmYgsyNg#KH(+#)Eqv7PnGvXa?2l3F$LIqcmf
zYxL_mS*SdBuN9m6Bj_>#79#fM6IZl6c@wodJNtbR9%xf=5((WCII=;+xLIlUD^wqi
zVxW3<MSAbQw&wbguJGPm+%<SrE=3V~)&*X@I|ws-q`)}rK*7-|1sDJ>w4<BDozwo`
F{TFyEAVdHF

diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset-members.html
index 634804a60..4937c4fcc 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html
index 7b47addb6..50dc0a99f 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmGlobalTileTraits_1_1ThreadOffset.html
@@ -124,7 +124,7 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmMultiplicandTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmMultiplicandTraits-members.html
index db9bc1bc7..bb8315731 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmMultiplicandTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmMultiplicandTraits-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html b/docs/structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html
index 121fe8cce..ca9cf5371 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html
@@ -220,7 +220,7 @@ template&lt;typename ThreadBlockTile_ , GemmOperand::Kind Usage, MatrixLayout::K
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmOperandTraitsAb-members.html b/docs/structcutlass_1_1gemm_1_1GemmOperandTraitsAb-members.html
index 03950b5a9..8ea3efa96 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmOperandTraitsAb-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmOperandTraitsAb-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html b/docs/structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html
index 39721d954..68f5c1a44 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmOperandTraitsAb.html
@@ -121,7 +121,7 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits-members.html
index a317e544f..6cda4b9ed 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits-members.html
@@ -79,8 +79,8 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4456e4c8048bfb378e5b80833a0d19e5">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
@@ -99,7 +99,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html
index 27c32f35e..d309569a2 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html
@@ -119,12 +119,11 @@ Public Types</h2></td></tr>
 <tr class="memitem:ae96e490d38ade6db4d853fb6c8f3378b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, TileWithoutSkew::kW/<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a>/<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ae96e490d38ade6db4d853fb6c8f3378b">Iterations</a></td></tr>
 <tr class="memdesc:ae96e490d38ade6db4d853fb6c8f3378b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="#ae96e490d38ade6db4d853fb6c8f3378b">More...</a><br /></td></tr>
 <tr class="separator:ae96e490d38ade6db4d853fb6c8f3378b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2ee87510d2deccf8b9633aaa4f6340ea"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a>, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea">Delta</a></td></tr>
-<tr class="memdesc:a2ee87510d2deccf8b9633aaa4f6340ea"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a2ee87510d2deccf8b9633aaa4f6340ea">More...</a><br /></td></tr>
-<tr class="separator:a2ee87510d2deccf8b9633aaa4f6340ea"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8e767b5e2fb95b0b02a0ea3e8ea58368"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a>, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368">ImmediateOffsetStrides</a></td></tr>
-<tr class="memdesc:a8e767b5e2fb95b0b02a0ea3e8ea58368"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a8e767b5e2fb95b0b02a0ea3e8ea58368">More...</a><br /></td></tr>
-<tr class="separator:a8e767b5e2fb95b0b02a0ea3e8ea58368"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad012add21d9393d136720f609467e121"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a> *Warps::kD, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:ad012add21d9393d136720f609467e121"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#ad012add21d9393d136720f609467e121">More...</a><br /></td></tr>
+<tr class="separator:ad012add21d9393d136720f609467e121"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a134a02091bf4360d2cbca56624e52024"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a> *Warps::kD, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024">Delta</a></td></tr>
+<tr class="separator:a134a02091bf4360d2cbca56624e52024"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
@@ -147,8 +146,8 @@ Static Public Attributes</h2></td></tr>
 <tr class="separator:a4246185b8279f245ef5d0650c1eec14f"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a2ee87510d2deccf8b9633aaa4f6340ea"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2ee87510d2deccf8b9633aaa4f6340ea">&#9670;&nbsp;</a></span>Delta</h2>
+<a id="a134a02091bf4360d2cbca56624e52024"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a134a02091bf4360d2cbca56624e52024">&#9670;&nbsp;</a></span>Delta</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -156,15 +155,15 @@ Static Public Attributes</h2></td></tr>
 template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename ThreadsPerWarp_ , typename InstructionShape_ , int kStages_, int kScalarsPerLds_, int kSkew_ = 0&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a>, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>, 0&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a2ee87510d2deccf8b9633aaa4f6340ea">Delta</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a> * Warps::kD, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>, 0&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a134a02091bf4360d2cbca56624e52024">Delta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a8e767b5e2fb95b0b02a0ea3e8ea58368"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8e767b5e2fb95b0b02a0ea3e8ea58368">&#9670;&nbsp;</a></span>ImmediateOffsetStrides</h2>
+<a id="ad012add21d9393d136720f609467e121"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad012add21d9393d136720f609467e121">&#9670;&nbsp;</a></span>ImmediateOffsetStrides</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -172,7 +171,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename ThreadsPerWarp_ , typename InstructionShape_ , int kStages_, int kScalarsPerLds_, int kSkew_ = 0&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a>, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>, 0&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a8e767b5e2fb95b0b02a0ea3e8ea58368">ImmediateOffsetStrides</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a> * Warps::kD, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#af78a275086a297bd93aed920f57a17be">kWarps</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a4246185b8279f245ef5d0650c1eec14f">kThreadsPerWarp</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#a0a33d4289ed45e988d560b5f73ac997e">kAccessSize</a>, 0&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">cutlass::gemm::GemmSharedLoadTileATraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html#ad012add21d9393d136720f609467e121">ImmediateOffsetStrides</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -474,7 +473,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset-members.html
index 3e308db63..11c167a81 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html
index 0731bce87..53deb57df 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits_1_1ThreadOffset.html
@@ -124,7 +124,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits-members.html
index 782aa8415..4a0898999 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits-members.html
@@ -79,8 +79,8 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a7007093a4abf79a0b4bfb3fc85a02620">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
@@ -99,7 +99,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html
index 097ce43ef..a4f04fe77 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html
@@ -119,12 +119,11 @@ Public Types</h2></td></tr>
 <tr class="memitem:a27bc06b72a94e34d5da6fbfb950459b5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, TileWithoutSkew::kW/<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a>/<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a27bc06b72a94e34d5da6fbfb950459b5">Iterations</a></td></tr>
 <tr class="memdesc:a27bc06b72a94e34d5da6fbfb950459b5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="#a27bc06b72a94e34d5da6fbfb950459b5">More...</a><br /></td></tr>
 <tr class="separator:a27bc06b72a94e34d5da6fbfb950459b5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad029d098ba13543bf99c728e6b93006d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a>, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d">Delta</a></td></tr>
-<tr class="memdesc:ad029d098ba13543bf99c728e6b93006d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#ad029d098ba13543bf99c728e6b93006d">More...</a><br /></td></tr>
-<tr class="separator:ad029d098ba13543bf99c728e6b93006d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5e4204b52ee081a37e824ca71c291c03"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a>, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03">ImmediateOffsetStrides</a></td></tr>
-<tr class="memdesc:a5e4204b52ee081a37e824ca71c291c03"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a5e4204b52ee081a37e824ca71c291c03">More...</a><br /></td></tr>
-<tr class="separator:a5e4204b52ee081a37e824ca71c291c03"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a99017ecc737060f53fd9804ea6f9583f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a> *Warps::kD, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:a99017ecc737060f53fd9804ea6f9583f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a99017ecc737060f53fd9804ea6f9583f">More...</a><br /></td></tr>
+<tr class="separator:a99017ecc737060f53fd9804ea6f9583f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adcede218eec980903221feb664cad3a1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a> *Warps::kD, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1">Delta</a></td></tr>
+<tr class="separator:adcede218eec980903221feb664cad3a1"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
@@ -147,8 +146,8 @@ Static Public Attributes</h2></td></tr>
 <tr class="separator:a049b0bcdf8c5318ee84edeb1e42eaf78"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="ad029d098ba13543bf99c728e6b93006d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad029d098ba13543bf99c728e6b93006d">&#9670;&nbsp;</a></span>Delta</h2>
+<a id="adcede218eec980903221feb664cad3a1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adcede218eec980903221feb664cad3a1">&#9670;&nbsp;</a></span>Delta</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -156,15 +155,15 @@ Static Public Attributes</h2></td></tr>
 template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename ThreadsPerWarp_ , typename InstructionShape_ , int kStages_, int kScalarsPerLds_, int kSkew_ = 0&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a>, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>, 0&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#ad029d098ba13543bf99c728e6b93006d">Delta</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a> * Warps::kD, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>, 0&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#adcede218eec980903221feb664cad3a1">Delta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a5e4204b52ee081a37e824ca71c291c03"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5e4204b52ee081a37e824ca71c291c03">&#9670;&nbsp;</a></span>ImmediateOffsetStrides</h2>
+<a id="a99017ecc737060f53fd9804ea6f9583f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a99017ecc737060f53fd9804ea6f9583f">&#9670;&nbsp;</a></span>ImmediateOffsetStrides</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -172,7 +171,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename ThreadsPerWarp_ , typename InstructionShape_ , int kStages_, int kScalarsPerLds_, int kSkew_ = 0&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a>, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>, 0&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a5e4204b52ee081a37e824ca71c291c03">ImmediateOffsetStrides</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">TileWithSkew::kW</a> * Warps::kD, 0, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a8b8d6a26a29d5477f526d9ce8c27e3e2">kWarps</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a049b0bcdf8c5318ee84edeb1e42eaf78">kThreadsPerWarp</a> * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#aa41cc5dc82fe08457d103545f8f63081">kAccessSize</a>, 0&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">cutlass::gemm::GemmSharedLoadTileBTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, InstructionShape_, kStages_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html#a99017ecc737060f53fd9804ea6f9583f">ImmediateOffsetStrides</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -474,7 +473,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset-members.html
index 387441df0..e1be4227f 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html
index 07f462ac6..9fb5f6bf7 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits_1_1ThreadOffset.html
@@ -124,7 +124,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits-members.html
index afc22fe8e..7caaf5c4f 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits-members.html
@@ -79,9 +79,9 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
@@ -90,17 +90,18 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#abb5fdb164b09c8f74f92278f3d68b95f">kScalarsPerThread</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a7e9ce187e12575f0ecd39b2bfe13dddf">kSkew</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">ThreadsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">kSplitK</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8325bc9d56155ecb6f2ddbd56f4ed23d">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#acb16feebdcad5bbebe9d4d3383c37899">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1e72b69cf2147e4d194893a64417b920">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9022ffc49b32503fd3639341e7e291a3">ThreadsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4764f70691cb3fee91ce47653363aa4f">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html
index 043d8c3ae..191deeca6 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html
@@ -108,17 +108,16 @@ Public Types</h2></td></tr>
 <tr class="memdesc:a9022ffc49b32503fd3639341e7e291a3"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads in the warps.  <a href="#a9022ffc49b32503fd3639341e7e291a3">More...</a><br /></td></tr>
 <tr class="separator:a9022ffc49b32503fd3639341e7e291a3"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a63f980fea1ff3dd83ac276cfd83a4ce5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 2, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a>/<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a63f980fea1ff3dd83ac276cfd83a4ce5">Tile</a></td></tr>
-<tr class="memdesc:a63f980fea1ff3dd83ac276cfd83a4ce5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="#a63f980fea1ff3dd83ac276cfd83a4ce5">More...</a><br /></td></tr>
 <tr class="separator:a63f980fea1ff3dd83ac276cfd83a4ce5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a81ca35e0c5d9553d1dccc981cbd89d47"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a>, OutputTile::kW/kWarpSize/<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47">Iterations</a></td></tr>
-<tr class="memdesc:a81ca35e0c5d9553d1dccc981cbd89d47"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to store the tile.  <a href="#a81ca35e0c5d9553d1dccc981cbd89d47">More...</a><br /></td></tr>
-<tr class="separator:a81ca35e0c5d9553d1dccc981cbd89d47"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac5578da2577cddd5a38cb628f894f644"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; OutputTile::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a>, kWarpSize *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644">Delta</a></td></tr>
-<tr class="memdesc:ac5578da2577cddd5a38cb628f894f644"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#ac5578da2577cddd5a38cb628f894f644">More...</a><br /></td></tr>
-<tr class="separator:ac5578da2577cddd5a38cb628f894f644"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9cfb32f902593e7dc018ee802c3520b8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; OutputTile::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a>, kWarpSize *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8">ImmediateOffsetStrides</a></td></tr>
-<tr class="memdesc:a9cfb32f902593e7dc018ee802c3520b8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a9cfb32f902593e7dc018ee802c3520b8">More...</a><br /></td></tr>
-<tr class="separator:a9cfb32f902593e7dc018ee802c3520b8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1b33700f904dd15e3533fec15d9d71bd"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a>, OutputTile::kW/kWarpSize/<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, Warps::kD &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd">Iterations</a></td></tr>
+<tr class="memdesc:a1b33700f904dd15e3533fec15d9d71bd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to store the tile.  <a href="#a1b33700f904dd15e3533fec15d9d71bd">More...</a><br /></td></tr>
+<tr class="separator:a1b33700f904dd15e3533fec15d9d71bd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a57b065abb737bee1c17398c90b5bc39b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; OutputTile::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a>, kWarpSize *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">kSplitK</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:a57b065abb737bee1c17398c90b5bc39b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a57b065abb737bee1c17398c90b5bc39b">More...</a><br /></td></tr>
+<tr class="separator:a57b065abb737bee1c17398c90b5bc39b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2cd23d3b5e2cb64c6d5e9b1d6a78fbce"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; OutputTile::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a>, kWarpSize *<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">kSplitK</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">Delta</a></td></tr>
+<tr class="memdesc:a2cd23d3b5e2cb64c6d5e9b1d6a78fbce"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">More...</a><br /></td></tr>
+<tr class="separator:a2cd23d3b5e2cb64c6d5e9b1d6a78fbce"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
@@ -146,10 +145,12 @@ Static Public Attributes</h2></td></tr>
 <tr class="separator:a3b1a461c1dfbcd3817ab2d57bd0da9f1"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a8663311646210b690bb0c2a1012e82f0"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a> = <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a4b8d66df02ba1653aa6d1f23b967f237">kIterationsInHPerWarp</a> / <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a></td></tr>
 <tr class="separator:a8663311646210b690bb0c2a1012e82f0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a15438a44b588dc4cfd4b47c18af79cd2"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">kSplitK</a> = OutputTile::kW * ThreadsPerWarp::kH / 2 * Warps::kH</td></tr>
+<tr class="separator:a15438a44b588dc4cfd4b47c18af79cd2"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="ac5578da2577cddd5a38cb628f894f644"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac5578da2577cddd5a38cb628f894f644">&#9670;&nbsp;</a></span>Delta</h2>
+<a id="a2cd23d3b5e2cb64c6d5e9b1d6a78fbce"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">&#9670;&nbsp;</a></span>Delta</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -157,15 +158,15 @@ Static Public Attributes</h2></td></tr>
 template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename ThreadsPerWarp_ , int kTileH_, int kScalarsPerLds_, int kSkew_ = 0&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;OutputTile::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a>, kWarpSize * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#ac5578da2577cddd5a38cb628f894f644">Delta</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;OutputTile::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a>, kWarpSize * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">kSplitK</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a2cd23d3b5e2cb64c6d5e9b1d6a78fbce">Delta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a9cfb32f902593e7dc018ee802c3520b8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9cfb32f902593e7dc018ee802c3520b8">&#9670;&nbsp;</a></span>ImmediateOffsetStrides</h2>
+<a id="a57b065abb737bee1c17398c90b5bc39b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a57b065abb737bee1c17398c90b5bc39b">&#9670;&nbsp;</a></span>ImmediateOffsetStrides</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -173,15 +174,15 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename ThreadsPerWarp_ , int kTileH_, int kScalarsPerLds_, int kSkew_ = 0&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;OutputTile::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a>, kWarpSize * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a9cfb32f902593e7dc018ee802c3520b8">ImmediateOffsetStrides</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;OutputTile::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#aa3e378cabce9ed7f199c179c15a12ca4">kScalarsPerRow</a>, kWarpSize * <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a15438a44b588dc4cfd4b47c18af79cd2">kSplitK</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a57b065abb737bee1c17398c90b5bc39b">ImmediateOffsetStrides</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a81ca35e0c5d9553d1dccc981cbd89d47"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a81ca35e0c5d9553d1dccc981cbd89d47">&#9670;&nbsp;</a></span>Iterations</h2>
+<a id="a1b33700f904dd15e3533fec15d9d71bd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1b33700f904dd15e3533fec15d9d71bd">&#9670;&nbsp;</a></span>Iterations</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -189,7 +190,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename ThreadsPerWarp_ , int kTileH_, int kScalarsPerLds_, int kSkew_ = 0&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a>, OutputTile::kW / kWarpSize / <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a81ca35e0c5d9553d1dccc981cbd89d47">Iterations</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8663311646210b690bb0c2a1012e82f0">kIterationsD</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a3b1a461c1dfbcd3817ab2d57bd0da9f1">kIterationsH</a>, OutputTile::kW / kWarpSize / <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a8d308d593b59624abe3e228d588be61d">kAccessSize</a>, Warps::kD&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b33700f904dd15e3533fec15d9d71bd">Iterations</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -273,6 +274,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
         </tr>
       </table>
 </div><div class="memdoc">
+<p>The tile. We have 2 rows of scalars. We use those two rows to make sure we do not have bank conflicts in the epilogue. </p>
 
 </div>
 </div>
@@ -483,6 +485,30 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a15438a44b588dc4cfd4b47c18af79cd2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a15438a44b588dc4cfd4b47c18af79cd2">&#9670;&nbsp;</a></span>kSplitK</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename ThreadsPerWarp_ , int kTileH_, int kScalarsPerLds_, int kSkew_ = 0&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">cutlass::gemm::GemmSharedLoadTileDTraits</a>&lt; Scalar_, OutputTile_, Warps_, ThreadsPerWarp_, kTileH_, kScalarsPerLds_, kSkew_ &gt;::kSplitK = OutputTile::kW * ThreadsPerWarp::kH / 2 * Warps::kH</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a8325bc9d56155ecb6f2ddbd56f4ed23d"></a>
@@ -515,7 +541,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset-members.html
index 1a9ffe26c..56ad54c93 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html
index d68dda08b..16eb03b3f 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits_1_1ThreadOffset.html
@@ -124,7 +124,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits-members.html
index eb2702a3f..1638037a2 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits-members.html
@@ -93,7 +93,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html
index f755f52fc..28ec8e3e8 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html
@@ -336,7 +336,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kScalars
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset-members.html
index 6157a4d39..0d4cc8a96 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html
index 876eea666..6fa883234 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits_1_1ThreadOffset.html
@@ -121,7 +121,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kScalars
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits-members.html
index 5749940ce..7b95fb321 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits-members.html
@@ -97,7 +97,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html
index a5e0b8d6c..73f9f0a04 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html
@@ -437,7 +437,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset-members.html
index 8a28c5190..7f16e8200 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html
index 673f9afb9..e47cf125f 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits_1_1ThreadOffset.html
@@ -124,7 +124,7 @@ template&lt;typename Scalar_ , typename OutputTile_ , typename Warps_ , typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits-members.html
index 0a64b450c..48ea29a01 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits-members.html
@@ -94,7 +94,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html
index ed1fb90bd..daf80596f 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html
@@ -367,7 +367,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kScalars
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset-members.html
index 1298ee529..6c10a6407 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html
index cc55e56e8..f5067a351 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits_1_1ThreadOffset.html
@@ -121,7 +121,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kScalars
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html
index 8c1ffaf9e..942c110db 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html
index 9bca290fb..a8bf4cb25 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html
@@ -88,7 +88,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html
index 7affa6ef6..598712028 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html
@@ -88,7 +88,7 @@ Inheritance diagram for cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::k
  <div class="center">
   <img src="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.png" usemap="#cutlass::gemm::GemmTileTraitsHelperA_3C_20MatrixLayout::kColumnMajor_2C_20GemmConfig_5F_20_3E_map" alt=""/>
   <map id="cutlass::gemm::GemmTileTraitsHelperA_3C_20MatrixLayout::kColumnMajor_2C_20GemmConfig_5F_20_3E_map" name="cutlass::gemm::GemmTileTraitsHelperA_3C_20MatrixLayout::kColumnMajor_2C_20GemmConfig_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" alt="cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;" shape="rect" coords="0,56,499,80"/>
+<area href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html" alt="cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;" shape="rect" coords="0,56,545,80"/>
 </map>
  </div></div>
 <table class="memberdecls">
@@ -103,7 +103,7 @@ Public Types</h2></td></tr>
 <tr class="memitem:adc95f4a8617cdf28e5b5d7d2d1aefec2"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">Scalar</a> const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">GlobalTileTraits</a></td></tr>
 <tr class="memdesc:adc95f4a8617cdf28e5b5d7d2d1aefec2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for A^N.  <a href="#adc95f4a8617cdf28e5b5d7d2d1aefec2">More...</a><br /></td></tr>
 <tr class="separator:adc95f4a8617cdf28e5b5d7d2d1aefec2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaa198fed841af6bf26bf2e9544d0a877"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">SharedStoreTileTraits</a></td></tr>
+<tr class="memitem:aaa198fed841af6bf26bf2e9544d0a877"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">SharedStoreTileTraits</a></td></tr>
 <tr class="memdesc:aaa198fed841af6bf26bf2e9544d0a877"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for A^N.  <a href="#aaa198fed841af6bf26bf2e9544d0a877">More...</a><br /></td></tr>
 <tr class="separator:aaa198fed841af6bf26bf2e9544d0a877"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:af534fc5698513af3c6724b68ae03316d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsA, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">SharedLoadTileTraits</a></td></tr>
@@ -190,7 +190,7 @@ template&lt;typename GemmConfig_ &gt; </div>
 template&lt;typename GemmConfig_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsA&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">SharedStoreTileTraits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsA&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">SharedStoreTileTraits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -228,7 +228,7 @@ template&lt;typename GemmConfig_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.png b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.png
index 9ce259eb1e218a474520353a3cbaf3ddbdfc43ad..f9de5952a5bab84e131df12d3782504510cc9131 100644
GIT binary patch
literal 1846
zcmb`IYgCfy7RO(rG)dAt=-60!P)f<PvKlc%4eiM5JvHy8rpz1?Fsbm8sb@~)SY8NC
z6Z2B3WTqZ(c_GX+@0z12c>y(V<N{Q}TO;XE-_BZdzMW^S{p|m<*WUZn@4uczS7$po
z>_->?0B{g*>jnVZkP7X(6RNn^4KJ)KlD4a($GNSoErncK`Bc<=gP~C0qp7LMyCTw4
z@!Wac&DkALG<`cmT^^<YpwtT5p7n@?NOD9J*=g17cA@!;TOI6V<Lm-M3oyrh5(<U0
z+R`KYS#pQaQq9sD&uZQ%0M7>ufo+BA@!S5+Mr?BhX3}v0EdG((PHPB5#=<p{7u7vB
zHUY==D0y%YcV*(|{uco$!uPUv<*%9H*D(77y8=ZmIeEt-)F$f<`Gc2@4>gJ8bld^E
zM|meQj3=a(IA%;Olhu`S2oT!RZ=?Ds*al^My@@|XT4KTR=y=}wK+-xMJI17j-M!Ul
z2AP11Yl|=T4MvXT$>n^rO}PMCJ(tSGHc6@l%7Gc&Cz7Tc5oVUF!<Ul^E5iC8hD`kY
z{-TS@!o@^#-3PkEk(8Km(m}7AmuVwb@DxI>)zr0swob;VIbEEk`=AG^t+%ovnDr&-
z%ny@vh979@m*3$Stzn8nCDZ5aekW$LG%>zOr@-;u@q7CWLpt8S%YN9L^=s0Q{7E@N
zBVfqnQM&<Wk5SU}JqfX_{<d+EO|qV9oMXQW!c?ADr*<Xw<<-Ow1sY8iCZ|4U;CLKu
zc25~U*AB`N-xtz6k=bTuaXoFv2>i#it;XYx_GPj$9c@jGzD7G_;zlv<-LADeIK^ZN
zPR{R}X7xfcKk-eL8Iwn7)lvuQ4a+O#p(mj28@feFdr?`qvZ5Y;WM_J(rl}D>V1<F<
zRe7jI1vu}um?NS@SGs0&684yBjm@97H*oKmTgM@>S(w7M%cuSmI-24}KXbmWU*w&Z
zxg1`~xUqyy@!h{1RL2pKBX`B=W}N(7vzRwZcdR`rPanDT>cAbz?)LbJ<iFA1W;TV;
z_&Bc)OD}Q)-ahzfL>x)U6UtHAvG$7e`>LS9g#T&CsVDRtK;c#?2X^(gLtb?%>wh6J
zrOOuFuNAm~v&u^bF(ynk;lpK2d_YxA>k4!Uv9`+aIs=VKPo;m}f^DBXG~SRq##Xh4
zETy`_Acg?d9trHQc1CZ{2RhJn00Ed!z=)+aPilB~dA|1m#GGu0tD*}14)Lt01f{?@
z<U7XcVgE|ERp5O48_vg`E<^sCZ}-36{?}&s|2NlW5Pa@V%W95vyY17}0uQ5#83op8
zTP6(bLeueXNYK1cT~S4|5qcmUHS35NIN-pHeY2uM{)&nCTI+)mWlnz?>|W2`GNtTh
zI}D`1;U!pD1ua}+p0QCub>8=T(VAXx`|&g8_11~QC}Y1yDS?hE9JRl4*n)*0Fh7q>
zwdxZ@Uq1?>KRSZ287-mRmK(AJ<@ItcdV}2E$u(U4G7gP7F?_^C^=46<U~@(&Y?KNY
z4?I2<CzkA?uqBqLEJFD|Ev^a#$*I_vKL(S<p&_5KQ}aRlvrX5^+J53od%Wx3PIdgk
zv-dCFEfiAuni^@{o5X>N9$A9l+N_Tan}L-*Wkzkcc^3Pc<8MUP-=9rM6Wf>E&ukGq
zxVi6r&8qa7{-<iE-oyKh+gNyN_XvE}X}s_((uPGFf2;ZqG4nE4C)W_w`1~R!)rF?-
zsonm=*r5M46+g!W)}2L}>}Y_N%eqy#?jVV?*lH17N&qQN5)E^SRgO^z_ilKXxLHCx
z*;$6nuYY`@WA0tAZq;$ey%Em@ufvkcnIieB(m&{Ls}|4Wr(&NoWX*yC^@ul2@o4Os
z3%}`ZM0r;oXK2=dL2xW8@}4nS&h*bw8{0Le`bN5$fDTpyix?&76JB^z0+rqaiwICt
z0dv+En4v1i7HfC+O8-l*vrNCV1zk^Wr8TDvbRsIv8(r}(hn$Nme4Q%4yHq@o`vYb9
zG|!gl=hL4u=zdF^{^HuAlq4Ac<>NwW#7E;lZh1Z@Hk7H_6!`_lc9D)=N^PMf1UD_V
zCE}*8o-BqFPXAFRQ3uI<MD0TA3l{`+hVbv7qzjuux(>G?kw`TQ!yg;ABlD<FaHx6B
zB0GDkh-d>w-&2cTCoO&R>_OQ5g3KrvWSY4Fn9GJAoF`ifKekjDV4az<y*#ZCeQE8q
zP>{kMv8jBDB2IoA&P=UekK3UKnuQ0COyrp|J@5mso&Go0F-9Ri8HL^%1hm2qdRvf?
Xys%o9=r>!%CkKG%oNdc+fxrF<bIWLo

literal 1679
zcmbuAeKga19LIlh(8ZFIiYPs7Zmz7WOrBR^j6$V{8;K_Fu*BMEGo(BnEEcQCEgdQ;
z4Q;HMbs9n*iabAz$s~KQR+edY=blsN-oNknoX_|B{+{#xem?)aU+0_U@9PQD-J}Zu
z00`;jeiQ&SWNPidT2s9{LZfrlhq3>m01uT)rIzzwKR$Sc%Tud=>gCIqr>YZ9sIRLp
z9rZm1s7))YuRUN70BCPPx*rHg&=8eOlIMQYzXrGHX;kgtjajTk9qJLGyWbU77(+nX
z#U?0KdBM>Q-j)#1PCySp(rk5F)5;z8Lw9v*#D${Q<ms*J<iHzuY;2bsgrwe`HP@Sa
znpEsj%ef=#Rld$roDUM>b#9%biMS<_-{TG5PNmmZH2Ye-)N*~ih{~QLA-40^bNZd_
z2M<stBW*S6(+5U3fA;p2Y}wl65?kGjEh>30yj(j~pZL0NM+dZ6l*oFd%%#U1V{Kwd
z`@@r52h!l(8}7l9pFGvr!h)Hnm{7l<xFj5m+-6)+EkEZRb|(BfOTr(GHyXJp$<o`^
zB^x~>x0{{HT{g1MxSgCJ3~nKq4daUHYVV9TY3S!K%sDZmtBS&C53NHyy$~IU*Gc<C
z*P}$r6A^DiEpHnNtr5PdiRLi#?RCe;b#R62S|XuiC4yzgz5siLvbDNUkywp;Xa!uz
zs@RS?&CDp39+XWcPmE8`)HZ1aYg(jW@3;p=HP$-yFHq0GYF6Rv`-!0uFn9y*IB(Y_
zI(y`ORg50#Mf}(PILAn_Jn6dN%2I`3pox8N5!q5MAgOX(Iv>YuRE&0wVP`r{mPjFM
zx$#ObS+%V@eXKy@C1VY{4mdv&RSWj=$K$(6#GF+4v3Uk#1drTi98Xu$lf--beswEb
zocxB65sZ1Jh#K8N8*7tNf#2GF1XAf;3Fw0jb9cqza*TgA&(J^0(TM-9-%k`I^b8?k
z;80HxcYLDuh~3nFEHA&K%{RDG@U(a+(99n-9ohTfun`T_+D3qyK4)9Yn{tC$uIt|~
z9KojWCi-xIq*-UjqHvp1Ecvp4@8qUy%=^tVy<8Jp?yb@IZbR;&s{lenLN}KUENi)L
zXy+B0O&qSL&U_tSLj&fMxjklEH&O)v^JfARqk_FH^~wt<T7ZL8iw5Lr`(RT7z9~-M
z*9?25cCT-QoV~9JUXi9${=XjnjIP=rbgD@6!;0m<z5kab@01KP!YKGQ%)t2kVuw7P
zR|Y;+<a1Pw48&4BhEkyCgGIKdWeKKjz_SJyIc`JAB`gJIL)UU#mmfQ4-PbqugCZ#M
zm_CD4FWW2-Ln>bHzXHZ(TI2UX(B$OG%U<pc^8-aX8E~&XLAe%`OQ2_qQ_?%+aW**Z
zBGH@T7A-ZJekdRg3+=_@Qc-4&Pq-6Lj7|<U$TsC}V#N;p;HGqi8^aZDC>^vib5n6;
zrIguHV-ttko$eqp@dM2T88IdHj7c()z+aUubKW<=MvJ*>c4p1OmnUh&%l)+8hLY(I
z7UYoC^s~IS^EdjyS6wdT3s(<i&VC$}JW$3yW%EAiJMMz)O=mZ^BJ(6y1#T0J_N7}@
zarXlWn1oU$#}~GqoCJ@HE_Xc}JvpnJ5_s-$tL^vYL=q{NAFI-oL*baT1}08EWZ9O3
zXrc?8m?%t4+i^`R%4SV8)~#}JvZ_)MURo&{dw?eee(Yse)=_(pU^#N4t-+`tjAJ3z
z>NGXEStJ+j#oJmn8XoqDL)Fi874LSM^4Xd$QRE9y=*&o#B`;qPPbXDf_8&oYMl`WS
ze=UiPo0GyPZqSu2^Dh{j{%+D^MOdaS+>G~Uu)!3O+j=5jc#E3jFQY!e@)6HCk{O~Z
zp+jU9>4%<+5;^hFE}kB}u@N87!B@>iEyX%Snk{JG&8;!fDO#e2k@25T!(v1o<NOp;
ztCPicnEPIMeTP4~&tJ8Z+NoChow=(Uxpa>SR%**!AVbpUrC|0o1H!lH`6PKffmkO9
z<>Y~{KLkN$&nI?qGf)Pf^1#Y}FalR_v*pgi-V|+T%ueJpJ_@>A^?~xmBB*DXfVo+w
zg;a1t(NLtCq?={x{QpR1BaFwu1P(GVZ&FnNXj?b~kri=U{d)jN4`27HgCVJZ1LBBQ
AXaE2J

diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html
index 09585beb2..e4d88e7b7 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html
@@ -82,14 +82,13 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">GlobalTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">kScalarsIn4B</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9c296924f9a6c6908f09830bbbf6a775">kSkewA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html
index 809d799b1..f325dcd5a 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html
@@ -103,12 +103,6 @@ Public Types</h2></td></tr>
 <tr class="memitem:a8160a260acce2362e90d43bce733c69d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a> const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">GlobalTileTraits</a></td></tr>
 <tr class="memdesc:a8160a260acce2362e90d43bce733c69d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for A^T.  <a href="#a8160a260acce2362e90d43bce733c69d">More...</a><br /></td></tr>
 <tr class="separator:a8160a260acce2362e90d43bce733c69d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad6511b7c2d84a9f6c3ed3639269ac44f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsA, 128/sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>)/GemmConfig_::kScalarsPerStsA/GlobalTileTraits::Threads::kW *<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">kScalarsIn4B</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f">SharedStoreTileTraits</a></td></tr>
-<tr class="memdesc:ad6511b7c2d84a9f6c3ed3639269ac44f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for A^T.  <a href="#ad6511b7c2d84a9f6c3ed3639269ac44f">More...</a><br /></td></tr>
-<tr class="separator:ad6511b7c2d84a9f6c3ed3639269ac44f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1125408805bc697755f2b16594c6c8e1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsA, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">SharedLoadTileTraits</a></td></tr>
-<tr class="memdesc:a1125408805bc697755f2b16594c6c8e1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for A^T.  <a href="#a1125408805bc697755f2b16594c6c8e1">More...</a><br /></td></tr>
-<tr class="separator:a1125408805bc697755f2b16594c6c8e1"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
@@ -118,6 +112,9 @@ Static Public Attributes</h2></td></tr>
 <tr class="memitem:ad77b9084720ad7378e033e54bfb74ce7"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">kScalarsIn4B</a> = sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>) &gt; 4 ? 1 : 4 / sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>)</td></tr>
 <tr class="memdesc:ad77b9084720ad7378e033e54bfb74ce7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars in 4B.  <a href="#ad77b9084720ad7378e033e54bfb74ce7">More...</a><br /></td></tr>
 <tr class="separator:ad77b9084720ad7378e033e54bfb74ce7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9c296924f9a6c6908f09830bbbf6a775"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9c296924f9a6c6908f09830bbbf6a775">kSkewA</a></td></tr>
+<tr class="memdesc:a9c296924f9a6c6908f09830bbbf6a775"><td class="mdescLeft">&#160;</td><td class="mdescRight">The skew for A.  <a href="#a9c296924f9a6c6908f09830bbbf6a775">More...</a><br /></td></tr>
+<tr class="separator:a9c296924f9a6c6908f09830bbbf6a775"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="a8160a260acce2362e90d43bce733c69d"></a>
@@ -166,38 +163,6 @@ template&lt;typename GemmConfig_ &gt; </div>
       </table>
 </div><div class="memdoc">
 
-</div>
-</div>
-<a id="a1125408805bc697755f2b16594c6c8e1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1125408805bc697755f2b16594c6c8e1">&#9670;&nbsp;</a></span>SharedLoadTileTraits</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_ &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsA, SharedStoreTileTraits::kSkew&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">SharedLoadTileTraits</a></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="ad6511b7c2d84a9f6c3ed3639269ac44f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad6511b7c2d84a9f6c3ed3639269ac44f">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_ &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsA, 128 / sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>) / GemmConfig_::kScalarsPerStsA / GlobalTileTraits::Threads::kW * <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">kScalarsIn4B</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f">SharedStoreTileTraits</a></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
@@ -247,6 +212,30 @@ template&lt;typename GemmConfig_ &gt; </div>
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a9c296924f9a6c6908f09830bbbf6a775"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9c296924f9a6c6908f09830bbbf6a775">&#9670;&nbsp;</a></span>kSkewA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">cutlass::gemm::GemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_ &gt;::kSkewA</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<b>Initial value:</b><div class="fragment"><div class="line">= 128 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>) / GemmConfig_::kScalarsPerStsA /</div><div class="line">                            GlobalTileTraits::Threads::kW * <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">kScalarsIn4B</a></div></div><!-- fragment -->
 </div>
 </div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
@@ -255,7 +244,7 @@ template&lt;typename GemmConfig_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html
index 60b2921a4..3ebeac83c 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html
index be5a0a9b1..7ff002906 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html
@@ -82,14 +82,13 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">GlobalTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">kScalarsIn4B</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab35a6b3ff04e4128e4ca4a8cc0459b16">kSkewB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html
index fc90114c0..370667fb6 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html
@@ -103,12 +103,6 @@ Public Types</h2></td></tr>
 <tr class="memitem:a5fee0ed52326c0685e8d8295e40ce064"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a> const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">GlobalTileTraits</a></td></tr>
 <tr class="memdesc:a5fee0ed52326c0685e8d8295e40ce064"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for B^N.  <a href="#a5fee0ed52326c0685e8d8295e40ce064">More...</a><br /></td></tr>
 <tr class="separator:a5fee0ed52326c0685e8d8295e40ce064"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1884cbc21987aec651fa8149d4ed1a06"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsB, 128/sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>)/GemmConfig_::kScalarsPerStsB/GlobalTileTraits::Threads::kW *<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">kScalarsIn4B</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06">SharedStoreTileTraits</a></td></tr>
-<tr class="memdesc:a1884cbc21987aec651fa8149d4ed1a06"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for B^N.  <a href="#a1884cbc21987aec651fa8149d4ed1a06">More...</a><br /></td></tr>
-<tr class="separator:a1884cbc21987aec651fa8149d4ed1a06"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a118bb34a6f58c3e5a989773b4b597d8c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsB, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">SharedLoadTileTraits</a></td></tr>
-<tr class="memdesc:a118bb34a6f58c3e5a989773b4b597d8c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for B^N.  <a href="#a118bb34a6f58c3e5a989773b4b597d8c">More...</a><br /></td></tr>
-<tr class="separator:a118bb34a6f58c3e5a989773b4b597d8c"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
@@ -118,6 +112,9 @@ Static Public Attributes</h2></td></tr>
 <tr class="memitem:a774a052f0f98f50e46dda933c81badd5"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">kScalarsIn4B</a> = sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>) &gt; 4 ? 1 : 4 / sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>)</td></tr>
 <tr class="memdesc:a774a052f0f98f50e46dda933c81badd5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars in 4B.  <a href="#a774a052f0f98f50e46dda933c81badd5">More...</a><br /></td></tr>
 <tr class="separator:a774a052f0f98f50e46dda933c81badd5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab35a6b3ff04e4128e4ca4a8cc0459b16"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab35a6b3ff04e4128e4ca4a8cc0459b16">kSkewB</a></td></tr>
+<tr class="memdesc:ab35a6b3ff04e4128e4ca4a8cc0459b16"><td class="mdescLeft">&#160;</td><td class="mdescRight">The skew for B.  <a href="#ab35a6b3ff04e4128e4ca4a8cc0459b16">More...</a><br /></td></tr>
+<tr class="separator:ab35a6b3ff04e4128e4ca4a8cc0459b16"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="a5fee0ed52326c0685e8d8295e40ce064"></a>
@@ -166,38 +163,6 @@ template&lt;typename GemmConfig_ &gt; </div>
       </table>
 </div><div class="memdoc">
 
-</div>
-</div>
-<a id="a118bb34a6f58c3e5a989773b4b597d8c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a118bb34a6f58c3e5a989773b4b597d8c">&#9670;&nbsp;</a></span>SharedLoadTileTraits</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_ &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsB, SharedStoreTileTraits::kSkew&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">SharedLoadTileTraits</a></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a1884cbc21987aec651fa8149d4ed1a06"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1884cbc21987aec651fa8149d4ed1a06">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_ &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsB, 128 / sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>) / GemmConfig_::kScalarsPerStsB / GlobalTileTraits::Threads::kW * <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">kScalarsIn4B</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06">SharedStoreTileTraits</a></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
@@ -247,6 +212,30 @@ template&lt;typename GemmConfig_ &gt; </div>
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="ab35a6b3ff04e4128e4ca4a8cc0459b16"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab35a6b3ff04e4128e4ca4a8cc0459b16">&#9670;&nbsp;</a></span>kSkewB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_ &gt;::kSkewB</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<b>Initial value:</b><div class="fragment"><div class="line">= 128 / <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>) / GemmConfig_::kScalarsPerStsB /</div><div class="line">                            GlobalTileTraits::Threads::kW * <a class="code" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">kScalarsIn4B</a></div></div><!-- fragment -->
 </div>
 </div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
@@ -255,7 +244,7 @@ template&lt;typename GemmConfig_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html
index 04d0fed09..a3e42a5f0 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html
@@ -88,7 +88,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html
index d2976060d..3b077381d 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html
@@ -88,7 +88,7 @@ Inheritance diagram for cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::k
  <div class="center">
   <img src="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.png" usemap="#cutlass::gemm::GemmTileTraitsHelperB_3C_20MatrixLayout::kRowMajor_2C_20GemmConfig_5F_20_3E_map" alt=""/>
   <map id="cutlass::gemm::GemmTileTraitsHelperB_3C_20MatrixLayout::kRowMajor_2C_20GemmConfig_5F_20_3E_map" name="cutlass::gemm::GemmTileTraitsHelperB_3C_20MatrixLayout::kRowMajor_2C_20GemmConfig_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" alt="cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;" shape="rect" coords="0,56,480,80"/>
+<area href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html" alt="cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;" shape="rect" coords="0,56,526,80"/>
 </map>
  </div></div>
 <table class="memberdecls">
@@ -103,7 +103,7 @@ Public Types</h2></td></tr>
 <tr class="memitem:afbc41e7b98097b153fd27a48f073a877"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">Scalar</a> const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">GlobalTileTraits</a></td></tr>
 <tr class="memdesc:afbc41e7b98097b153fd27a48f073a877"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for B^T.  <a href="#afbc41e7b98097b153fd27a48f073a877">More...</a><br /></td></tr>
 <tr class="separator:afbc41e7b98097b153fd27a48f073a877"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:acbeea56f0ce95ddd632db3482c1021e5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">SharedStoreTileTraits</a></td></tr>
+<tr class="memitem:acbeea56f0ce95ddd632db3482c1021e5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">SharedStoreTileTraits</a></td></tr>
 <tr class="memdesc:acbeea56f0ce95ddd632db3482c1021e5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for B^T.  <a href="#acbeea56f0ce95ddd632db3482c1021e5">More...</a><br /></td></tr>
 <tr class="separator:acbeea56f0ce95ddd632db3482c1021e5"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9335aca8b152ff1167763de8ff8fb882"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsB, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">SharedLoadTileTraits</a></td></tr>
@@ -190,7 +190,7 @@ template&lt;typename GemmConfig_ &gt; </div>
 template&lt;typename GemmConfig_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsB&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">SharedStoreTileTraits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsB&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">cutlass::gemm::GemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">SharedStoreTileTraits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -228,7 +228,7 @@ template&lt;typename GemmConfig_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.png b/docs/structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.png
index f291cad7a3470d5eb65161a5278dcaa23e444e27..b0f8b6c70fb887241e14f25480e6768bf02565f6 100644
GIT binary patch
literal 1731
zcmai#ZB&xk7RMjznqI)iOw%$#TWMU(X4DLsDRU+zMI3a<MWjwjTGl8EW4@=-%p^If
zI9OSld40ihT$!c<nJI>YnQ8fklSqI#X1=7Bnj<3f*lqRYewee?IcJ}>_x_(RzyCRz
z{$wv>xD^}#0Ar%JCj|i3fl%ykv>sXyry291ZHvEe070+UL*eYgc*Uc*Tqyc5#bPn7
zHjxS)jm}cYM*yg3Z45jKa0Y-46r$(X0g15bB6ZGa6WpK^)7z}ysVvHwW@qQUi3%*!
zW}15S`8bABaOqh7<p3<d+@}O62Pm2Azp`fm-Z1GVLw3Ljkh?A`HA51j#EfIp^?=24
zl1@XfYlx`&e$l#Ji(f@)W^W9Ft+1<Bh+|Q#BBXe-ltkh_j0K7(U73j&@Z7z^J;&#;
zU~ARTw|#${nKnjQbdH4sCDjkiQ&##68{6oH%%g7i7LF+{D+*GST%r4`#lhaY)BWL-
zF==Sw1$TYQd6}+3u$fji@bIR}Uo(BlL=WD2{rm9NloQFNR#UUvc=ywWdLg|;)PS<d
zwpunXJLGhjP9M`%9ef|wtnzT@cqsqs=@79iDJ{)=Tv)z_QF+<Is>BJxFfxc~qDVLB
zh`KNrS2r;>?&N9%Scmcxn9L$PI_v#AB4=!3Fk}JFnKLh-yBWlF33e*7Gc<*S-79E6
zW{q1+CbdQsjw_z|^GyCORB1Z9mShvHe!lo+f`Ia3@mukb<9B{54xrAg!0ChqD0yVi
zFlkKHI2|BQGKD7itP(%wtbJ&dub@rcL~><{{xt%EY1H<(JJqqmo(3gzKe9vm;QLk6
zbN@-`Ow8!AEp%UWaTuO<*K9;y`qJ(I*jjUuMT>hajOMV+4If+Eg_s~*I}lIf_c@GQ
z=qoQMWN5OkdE)EkqbQCbU%krZaXJp6UXJ&+1wUtVLq$@0amZc&lpk?@$&K+vvbWl&
zWgCM+TIRRK2MX03g4@YENXZk^`e&?n(G!{0#&<;zD^o@FuTOWU^<QU|_@OcH$cz2K
z36=SdVX|fev9_^pLue&O0vqmsZ=dA+gC|C8wtN!xD9K=U_i~^ecLVzKvusR2Or_35
zwZ|=G|2f`PRn;;Tt1O49b|{uDxF!g;xmaKJi90(GsBDAT7;MpA@>s(YYj-8VL#JJz
zyUu$pMV1tg!fdYKf${^!9Ur0P*dagmkWe2`hC5z`3Lr`IPzQ)=s1GZqK~(!dX?887
zzSa+f{Xg`dF8@a%wnV^?Q{=@Axxl>8mT!x_g7>D_vvSKX+lFQSWXs=VNc15(3&bT&
zzP#112Th->zUqYx^uq@Ob$&FE-I>bTT$`RGXX4wypGEV3?8gw#SAagfSJEswHH^7O
zek`No133j!a%7CEhK9rBmHSt1Jc@o*qBrFfwS2eGCX0yki;sAd>aJM5c9e@~7aYl}
zZuu)|*kW~MW^>^C!67O=o9fr~Z*bqs=B3#gX2GeacWS*VFu%2eEjzA9-rm#Y64k>O
zYi_5-5k<{Q@ImHTRB{CWgf9WHcP8YFf}5~?JDB>)3!{NoP;|@m!7*+2H@KI$rQs~m
zHh~J=sE6}jz%`Sn2D*E~qS>|)-7ym<nZCPF!8>ydH4Eo@|698h*=~lC9yy({(Bzij
z(&e2{rd~SL18?atLq%Bzm2P(U?0T1LaH-|38LK12?yG6A{konnKt@$;*zQ=yHo`sJ
z=KA=0{Jh_3>BVDsB*L=4+Le~wK8wF2Q5;k`W*ls7t@4&i!%3*_2lE@jH<3Q~sMa?}
zR9<nxvI!hFkXGJWA*Vma9jCtIsyyxoNj;(tzgVfgMOR1bw{k*h{a7{2D1(qC`Hl2U
z0ZJ^oV>ql$hHczfBH{e~R9$DyMN6{T>1aXr-V>YD&!h8VQA5WwwC+CWT?p2AfAs?w
zCrg*Fcy+fu+7EkdL4w+)<cIQn;jgl~26;VI>2>p$tMPy0r|K=nK3EI<WUXJ<tQD4@
zgBZA>yS*<qh4B`DJ;7O79uf3EYb8&8R`|H&S^K#2RtPG;dL*{vg*=CMmZa>Q4IjNo
zCMF+(fxP+JH|m-#M|q<Qf-+l$Y|#0DRie=%Z7P{GogS0Hc*(n=Xxd)t&vSXr@FF%=
z#qgJQ8T00I(Nl9e`VJzNxNL%j)B{Frpcs1ki9U89?=mlZ>T^&oU{peE_b<B7UyGC<
Uv;X~P=*Izw1hQxKq0k@y1_DApsQ>@~

literal 1637
zcmchYc{J2(7{`AmgGodqWG&gZn8QVhYl~5qY{`->$(1!U*FIO2Y#EFta>L+~vDL_S
z`w_;zl`O+FB_U0iYYa(qf7iLEb2|6``=0ZB-_LvA=a2V~=X2f^TWfQ^gJK5(0N_Jg
znA!mV2MuCdo&!*BH9K8{Hc{IP4rXjN8^U$waz$6feTeo81VQHpj1zR^3AeMh2cV{Z
z*5rT#3IO1nXj3Bx3<te<HSE3eq1%SDj=!?a4f;hBIlCS*H(mt^RxEe>uAbAeh({|C
zl5*?{k+KQ!gkueyT=}BsJrh#CgQmdt?jo|Qa!ncp3`^owZ;%$|s|xoX#bqwAG^>5r
zD4g7)rD|8}dqPn_CNDl&_{>c}VY>>f6Icq3lJU+oJgU2$qla>c_)~{d>KU^iFm`Ja
za&1?zJ&G}uJ;Qi9uohN8a%Oe78O4jxUygmQn!l>z5qCv8!;pO*`}*r*v`~K8qE#_Z
z(E@#B(%@aGUoRDlQ{=9Rv_g?9)#!x;u+%9&B5ROrEG*k(aR|TjZD3jI3rTEN4?B28
zStpdkoj_%WXoU_rsRj1VI?ja(W_$6fKN_^ZKjb9Zd|U8At(ncwAvw|5dFsbhlFGwR
zEp>j6U*>{zD@~I+-jB;oW#iiKtBv2kWnpCMeK#z$aBt+AcJ%WqRU=^LY@q2QX%ucy
zz1A|IuvDdrbsx?--OvORxp?8PpE9gcBaLdG>nYM5|In#ksY(X}myy`BNAf4-#Sg}e
zOz>fATq<F^1tNZ8+7~Z<nI^V$S~ZeNHV<<!iO6kx{}1M;Jf=$BN9k~Wm+<0cuSQ<1
zx$4<liIgm1i9wg{h}1}=rqOev%Vx*1xlzXP-&wjrUt2)mR-H<eg_JxmJT8&&S!lkX
zb5~;8e0PJzBy#E&I;&R=@gLbx{$|ovvE`N@Jia3@;Va4v7(*Q%ZjPLyr;P+%p`o&e
z_R{kGC1V-71v-r^S|P#CI6j154S*HJaf-epN`p<?ZgMu~GDgHfB*u-_>B+s#yX`EO
z$rVIV1d)BkSJ@nxx%N&k)r99*n_LDumP4wmMVRHP1;RkXbU6*M+ZlG?LfUr-#@bu@
zpCIH^aDsJRB2ZHibU&0@S4YqQpX_6BY+e`8<c&C_p^a|`kUkJ-;=%s~7N!vGft0NW
z>rbIf1?ADaIIWX-5T^w_;D_LXRZii`+1OPce|Aeax$UCfuF0O1--?gJAhj8xjy8Fc
z#F;XZjmD9WcN2O>ie%F_Zo&Ce?n<&9Xf*o|eYTT3Q~?a_wL*5eK$*ZL;ouEdICZoy
zBc_JY=0>QUj6J0@=FxK_)C=<}Xd?HNVclVJ37cRX@Qra+d1#!`Zy=~krWDu2>IEgI
zJrs*ZSe8mWp4IM`ctp}NnNHaEBs41(Oj1!QAe48a-gqG9U$iA#(;D*ztlW$)RkI8w
ztcs$%B_K_>*81<x)Wh?}7L_cnsie7f-5q&ds&HI)pco7aV46{cY)EtXn}HaakZAj%
zvDNNdn=|9fVquOa80!!81*aP^vSR&fxS1HMvbJY7Q`|PV%f6H)m~;=zVKMQh5MH+J
z^u69>Cz{MXe`;@o|G0V;Q-_<-q0Bs|E%{XN8DFeSy*X~^mux<`f!|6pXhyWh?)9Z2
z)1$7NTH*>P=V|h;6x%O%5~8LMUmLUzl;_n2j1!l(VBBi0)|(nLN#IGmR9h$Al-Js~
z_U*iItQUq_x;9LU!*g?VkV6+n;p#6t^m2_D8kZGA^zQiJTkXSrxYm3;OFog`Otrm>
z->i4DIVNc-MpSw6-I9p^Sds%-QuVJTDCN8xK6p#SUZ<WezFf-D6a595=408o8fb!U
zO&ayZpu)nbvMUIEwRKP8c^sLNj0+c+9$ddpBc)qT>??!Dy%-jkNWzu#2a8)yxW_2>
zC@^!&?}Q9&><OzuL$_(;gHT07qyIxJxY7bCq$H@6Hl(HXy=Qa#d$OQE0YIBsn-YyZ
GfBPGaeg`E0

diff --git a/docs/structcutlass_1_1gemm_1_1GemmTraits-members.html b/docs/structcutlass_1_1gemm_1_1GemmTraits-members.html
index 05cab0611..0a2041245 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTraits-members.html
@@ -83,9 +83,11 @@ $(function() {
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
@@ -98,12 +100,13 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTraits.html b/docs/structcutlass_1_1gemm_1_1GemmTraits.html
index 7153c8237..a97a8d4a8 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTraits.html
@@ -87,29 +87,27 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html">GlobalLoadStream</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits_1_1GlobalLoadStream.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">MainLoopSharedStorage</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">Params</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params.  <a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html">SharedLoadStream</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load stream for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits_1_1SharedLoadStream.html#details">More...</a><br /></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object constructable on the host.  <a href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html">SharedStorage</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage in shared memory.  <a href="unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
+<tr class="memitem:aa6214a0ad09d155ed79feadc6647b989"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a></td></tr>
+<tr class="memdesc:aa6214a0ad09d155ed79feadc6647b989"><td class="mdescLeft">&#160;</td><td class="mdescRight">This traits.  <a href="#aa6214a0ad09d155ed79feadc6647b989">More...</a><br /></td></tr>
+<tr class="separator:aa6214a0ad09d155ed79feadc6647b989"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a28c32832f0353f00e93e867373cf6cae"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a></td></tr>
+<tr class="memdesc:a28c32832f0353f00e93e867373cf6cae"><td class="mdescLeft">&#160;</td><td class="mdescRight">The struct that consumes this Traits.  <a href="#a28c32832f0353f00e93e867373cf6cae">More...</a><br /></td></tr>
+<tr class="separator:a28c32832f0353f00e93e867373cf6cae"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a4efe5d156abca056ef8b5334fb574dd5"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a></td></tr>
 <tr class="memdesc:a4efe5d156abca056ef8b5334fb574dd5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The configuration.  <a href="#a4efe5d156abca056ef8b5334fb574dd5">More...</a><br /></td></tr>
 <tr class="separator:a4efe5d156abca056ef8b5334fb574dd5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a97d7ee63e5d180410b370f095648f367"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
+<tr class="memitem:a97d7ee63e5d180410b370f095648f367"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
 <tr class="memdesc:a97d7ee63e5d180410b370f095648f367"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="#a97d7ee63e5d180410b370f095648f367">More...</a><br /></td></tr>
 <tr class="separator:a97d7ee63e5d180410b370f095648f367"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9cd6c3fddfb4315eb52b672900462c47"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamA_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a></td></tr>
@@ -130,13 +128,7 @@ Public Types</h2></td></tr>
 <tr class="memitem:acaeb27063a444e2a3b93f3cb70e3c290"><td class="memItemLeft" align="right" valign="top">typedef SharedLoadStreamB_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a></td></tr>
 <tr class="memdesc:acaeb27063a444e2a3b93f3cb70e3c290"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for B to load from shared memory.  <a href="#acaeb27063a444e2a3b93f3cb70e3c290">More...</a><br /></td></tr>
 <tr class="separator:acaeb27063a444e2a3b93f3cb70e3c290"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8d49ad32fc9d8c14f6141690962c3f9c"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamA::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a></td></tr>
-<tr class="memdesc:a8d49ad32fc9d8c14f6141690962c3f9c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for A.  <a href="#a8d49ad32fc9d8c14f6141690962c3f9c">More...</a><br /></td></tr>
-<tr class="separator:a8d49ad32fc9d8c14f6141690962c3f9c"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a438b80cd8d8df0e74014ae47a162f7ed"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamB::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a></td></tr>
-<tr class="memdesc:a438b80cd8d8df0e74014ae47a162f7ed"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for B.  <a href="#a438b80cd8d8df0e74014ae47a162f7ed">More...</a><br /></td></tr>
-<tr class="separator:a438b80cd8d8df0e74014ae47a162f7ed"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af810544e956b04830c5be7ce41d3b45c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
+<tr class="memitem:af810544e956b04830c5be7ce41d3b45c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
 <tr class="memdesc:af810544e956b04830c5be7ce41d3b45c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="#af810544e956b04830c5be7ce41d3b45c">More...</a><br /></td></tr>
 <tr class="separator:af810544e956b04830c5be7ce41d3b45c"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a424f1ac14e1e7ad37428edd0cf13e7fe"><td class="memItemLeft" align="right" valign="top">typedef Epilogue_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a></td></tr>
@@ -156,6 +148,15 @@ Public Types</h2></td></tr>
 <tr class="memitem:ae1cf7988c9cff79a2c3252aaf91fc165"><td class="memItemLeft" align="right" valign="top">typedef ClearAccumulators_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a></td></tr>
 <tr class="memdesc:ae1cf7988c9cff79a2c3252aaf91fc165"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear the accumulators.  <a href="#ae1cf7988c9cff79a2c3252aaf91fc165">More...</a><br /></td></tr>
 <tr class="separator:ae1cf7988c9cff79a2c3252aaf91fc165"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a367aa0bd4be33d90ffe752274c728ef8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">GemmConfig::kResidueInProlog</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a></td></tr>
+<tr class="memdesc:a367aa0bd4be33d90ffe752274c728ef8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="#a367aa0bd4be33d90ffe752274c728ef8">More...</a><br /></td></tr>
+<tr class="separator:a367aa0bd4be33d90ffe752274c728ef8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abfecd4a57dfbf82e8fa74a50e01fc4ee"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">GlobalLoadStream::ThreadblockTileStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:abfecd4a57dfbf82e8fa74a50e01fc4ee"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory needed to store the threadblock-scoped GEMM tile.  <a href="#abfecd4a57dfbf82e8fa74a50e01fc4ee">More...</a><br /></td></tr>
+<tr class="separator:abfecd4a57dfbf82e8fa74a50e01fc4ee"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7864969e774c0f7155951e1ab599ed17"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a></td></tr>
+<tr class="memdesc:a7864969e774c0f7155951e1ab599ed17"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load streams for A/B.  <a href="#a7864969e774c0f7155951e1ab599ed17">More...</a><br /></td></tr>
+<tr class="separator:a7864969e774c0f7155951e1ab599ed17"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
 Static Public Member Functions</h2></td></tr>
@@ -182,7 +183,7 @@ Static Public Attributes</h2></td></tr>
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef BlockSwizzle_ <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a></td>
@@ -198,7 +199,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef ClearAccumulators_ <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a></td>
@@ -214,7 +215,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef Epilogue_ <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a></td>
@@ -230,7 +231,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef GemmConfig_ <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a></td>
@@ -238,6 +239,22 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a367aa0bd4be33d90ffe752274c728ef8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a367aa0bd4be33d90ffe752274c728ef8">&#9670;&nbsp;</a></span>GlobalLoadStream</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">GemmConfig::kResidueInProlog</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a9cd6c3fddfb4315eb52b672900462c47"></a>
@@ -246,7 +263,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef GlobalLoadStreamA_ <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a></td>
@@ -262,7 +279,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef GlobalLoadStreamB_ <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a></td>
@@ -278,7 +295,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a></td>
@@ -286,6 +303,22 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a28c32832f0353f00e93e867373cf6cae"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a28c32832f0353f00e93e867373cf6cae">&#9670;&nbsp;</a></span>KernelClass</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="af810544e956b04830c5be7ce41d3b45c"></a>
@@ -294,10 +327,10 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -310,10 +343,10 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">GemmConfig::OutputTile</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -326,7 +359,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef GlobalLoadStreamA_::Scalar <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a></td>
@@ -342,7 +375,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef GlobalLoadStreamB_::Scalar <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a></td>
@@ -358,7 +391,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef Epilogue::ScalarC <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a></td>
@@ -374,7 +407,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef Epilogue::ScalarD <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a></td>
@@ -390,7 +423,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef SharedLoadStreamA_ <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a></td>
@@ -406,7 +439,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef SharedLoadStreamB_ <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a></td>
@@ -416,32 +449,48 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 
 </div>
 </div>
-<a id="a8d49ad32fc9d8c14f6141690962c3f9c"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8d49ad32fc9d8c14f6141690962c3f9c">&#9670;&nbsp;</a></span>SharedStoreStorageA</h2>
+<a id="a7864969e774c0f7155951e1ab599ed17"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7864969e774c0f7155951e1ab599ed17">&#9670;&nbsp;</a></span>SharedStream</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef GlobalLoadStreamA::SharedStoreStorage <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a438b80cd8d8df0e74014ae47a162f7ed"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a438b80cd8d8df0e74014ae47a162f7ed">&#9670;&nbsp;</a></span>SharedStoreStorageB</h2>
+<a id="aa6214a0ad09d155ed79feadc6647b989"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa6214a0ad09d155ed79feadc6647b989">&#9670;&nbsp;</a></span>This_</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef GlobalLoadStreamB::SharedStoreStorage <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt;GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="abfecd4a57dfbf82e8fa74a50e01fc4ee"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abfecd4a57dfbf82e8fa74a50e01fc4ee">&#9670;&nbsp;</a></span>ThreadblockTileStorage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">GlobalLoadStream::ThreadblockTileStorage</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -455,7 +504,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
@@ -483,7 +532,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
@@ -512,7 +561,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
@@ -536,7 +585,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
@@ -560,7 +609,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage-members.html b/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage-members.html
index 5f3622036..fd59ce927 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage-members.html
@@ -80,12 +80,12 @@ $(function() {
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a>, including all inherited members.</p>
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">clear</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811">stream_a</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa">stream_b</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a61fcc63cb0df6754eef16f5cf138f3a2">global_to_shared_stream</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#af8f0050e818b788402526857afc7c919">threadblock_tile</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html b/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html
index 95f9a8291..6dd16c31a 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html
@@ -84,11 +84,14 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:a62d3dcf5d97a0a896b2033e55dfb0811"><td class="memItemLeft" align="right" valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a62d3dcf5d97a0a896b2033e55dfb0811">stream_a</a></td></tr>
-<tr class="separator:a62d3dcf5d97a0a896b2033e55dfb0811"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0173fcc8856b17a52cc5eee845f101fa"><td class="memItemLeft" align="right" valign="top"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a0173fcc8856b17a52cc5eee845f101fa">stream_b</a></td></tr>
-<tr class="separator:a0173fcc8856b17a52cc5eee845f101fa"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af8f0050e818b788402526857afc7c919"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#af8f0050e818b788402526857afc7c919">threadblock_tile</a></td></tr>
+<tr class="memdesc:af8f0050e818b788402526857afc7c919"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores the threadblock tile.  <a href="#af8f0050e818b788402526857afc7c919">More...</a><br /></td></tr>
+<tr class="separator:af8f0050e818b788402526857afc7c919"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a61fcc63cb0df6754eef16f5cf138f3a2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">GlobalLoadStream::SharedStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a61fcc63cb0df6754eef16f5cf138f3a2">global_to_shared_stream</a></td></tr>
+<tr class="memdesc:a61fcc63cb0df6754eef16f5cf138f3a2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage for GEMM global stream.  <a href="#a61fcc63cb0df6754eef16f5cf138f3a2">More...</a><br /></td></tr>
+<tr class="separator:a61fcc63cb0df6754eef16f5cf138f3a2"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a5513254af1f9979b6d0b9f236c3e7325"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">ClearAccumulators::SharedStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html#a5513254af1f9979b6d0b9f236c3e7325">clear</a></td></tr>
+<tr class="memdesc:a5513254af1f9979b6d0b9f236c3e7325"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage for clearing accumulators.  <a href="#a5513254af1f9979b6d0b9f236c3e7325">More...</a><br /></td></tr>
 <tr class="separator:a5513254af1f9979b6d0b9f236c3e7325"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Data Documentation</h2>
@@ -98,7 +101,7 @@ Public Attributes</h2></td></tr>
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1ClearAccumulators_1_1SharedStorage.html">ClearAccumulators::SharedStorage</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage::clear</td>
@@ -108,32 +111,32 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 
 </div>
 </div>
-<a id="a62d3dcf5d97a0a896b2033e55dfb0811"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a62d3dcf5d97a0a896b2033e55dfb0811">&#9670;&nbsp;</a></span>stream_a</h2>
+<a id="a61fcc63cb0df6754eef16f5cf138f3a2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a61fcc63cb0df6754eef16f5cf138f3a2">&#9670;&nbsp;</a></span>global_to_shared_stream</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage::stream_a</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">GlobalLoadStream::SharedStorage</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage::global_to_shared_stream</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a0173fcc8856b17a52cc5eee845f101fa"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0173fcc8856b17a52cc5eee845f101fa">&#9670;&nbsp;</a></span>stream_b</h2>
+<a id="af8f0050e818b788402526857afc7c919"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af8f0050e818b788402526857afc7c919">&#9670;&nbsp;</a></span>threadblock_tile</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="unioncutlass_1_1gemm_1_1GemmTraits_1_1StreamSharedStorage.html">StreamSharedStorage</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage::stream_b</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::MainLoopSharedStorage::threadblock_tile</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -146,7 +149,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params-members.html
index 05de1ce4e..dc6d1859f 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params-members.html
@@ -79,19 +79,21 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a>, including all inherited members.</p>
 <table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">block</a></td><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">dynamic_smem</a></td><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">epilogue</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64">global_stream_a</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596">global_stream_b</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3">global_to_shared_stream</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">grid</a></td><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">initialize</a>(GemmDesc_ const &amp;desc)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aae3a008b39f9678a03192f6ff54152d8">k</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aaf27c0f2f4ab730ed5c865e9f7d2373b">m</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a437d4b6f1f149849c5ae635a5993e7ac">n</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978">shared_stream_a</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d">shared_stream_b</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#ac4cd0b74130ffc09e4ccb7b0acba87f8">initialize</a>(Index m, Index n, Index k, typename Epilogue::Scalar alpha, ScalarA const *d_a, Index lda, ScalarB const *d_b, Index ldb, typename Epilogue::Scalar beta, ScalarC const *d_c, Index ldc, ScalarD *d_d, Index ldd)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a95314e9a9279c4870f37f68a2357e064">initialize</a>(Index m, Index n, Index k, typename Epilogue::Scalar alpha, ScalarA const *d_a, Index lda, long long int batch_stride_A, ScalarB const *d_b, Index ldb, long long int batch_stride_B, typename Epilogue::Scalar beta, ScalarC const *d_c, Index ldc, long long int batch_stride_C, ScalarD *d_d, Index ldd, long long int batch_stride_D, Index batch_count)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">KernelLaunchConfiguration</a>(dim3 _grid=dim3(1, 1, 1), dim3 _block=dim3(1, 1, 1), size_t _dynamic_smem=0)</td><td class="entry"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">problem_size</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a50e9cc382a32abd5beab299a79b30b27">shared_stream</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html b/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html
index ffeb872b1..22a9ff40d 100644
--- a/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html
+++ b/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html
@@ -81,10 +81,19 @@ $(function() {
 </div><!--header-->
 <div class="contents">
 
-<p>The params.  
+<p>Parameters object constructable on the host.  
 </p>
 
 <p><code>#include &lt;<a class="el" href="gemm__traits_8h_source.html">gemm_traits.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::GemmTraits&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.png" usemap="#cutlass::gemm::GemmTraits_3C_20GemmConfig_5F_2C_20GlobalLoadStreamA_5F_2C_20GlobalLoadStreamB_5F_2C_20SharedLoadStreamA_5F_2C_20SharedLoadStreamB_5F_2C_20Epilogue_5F_2C_20BlockSwizzle_5F_2C_20Index_5F_2C_20ClearAccumulators_5F_20_3E::Params_map" alt=""/>
+  <map id="cutlass::gemm::GemmTraits_3C_20GemmConfig_5F_2C_20GlobalLoadStreamA_5F_2C_20GlobalLoadStreamB_5F_2C_20SharedLoadStreamA_5F_2C_20SharedLoadStreamB_5F_2C_20Epilogue_5F_2C_20BlockSwizzle_5F_2C_20Index_5F_2C_20ClearAccumulators_5F_20_3E::Params_map" name="cutlass::gemm::GemmTraits_3C_20GemmConfig_5F_2C_20GlobalLoadStreamA_5F_2C_20GlobalLoadStreamB_5F_2C_20SharedLoadStreamA_5F_2C_20SharedLoadStreamB_5F_2C_20Epilogue_5F_2C_20BlockSwizzle_5F_2C_20Index_5F_2C_20ClearAccumulators_5F_20_3E::Params_map">
+<area href="structcutlass_1_1KernelLaunchConfiguration.html" title="Structure containing the basic launch configuration of a CUDA kernel. " alt="cutlass::KernelLaunchConfiguration" shape="rect" coords="0,0,1154,24"/>
+</map>
+ </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
@@ -92,40 +101,50 @@ Public Member Functions</h2></td></tr>
 <tr class="memitem:a40023f0ffdd8bee4ccbcaac28222e983"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a40023f0ffdd8bee4ccbcaac28222e983">initialize</a> (GemmDesc_ const &amp;desc)</td></tr>
 <tr class="memdesc:a40023f0ffdd8bee4ccbcaac28222e983"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize the parameters.  <a href="#a40023f0ffdd8bee4ccbcaac28222e983">More...</a><br /></td></tr>
 <tr class="separator:a40023f0ffdd8bee4ccbcaac28222e983"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac4cd0b74130ffc09e4ccb7b0acba87f8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#ac4cd0b74130ffc09e4ccb7b0acba87f8">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> m, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> n, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> k, typename Epilogue::Scalar alpha, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a> const *d_a, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> lda, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a> const *d_b, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldb, typename Epilogue::Scalar beta, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a> const *d_c, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldc, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a> *d_d, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldd)</td></tr>
+<tr class="memdesc:ac4cd0b74130ffc09e4ccb7b0acba87f8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct a GEMM params using a BLAS-like API.  <a href="#ac4cd0b74130ffc09e4ccb7b0acba87f8">More...</a><br /></td></tr>
+<tr class="separator:ac4cd0b74130ffc09e4ccb7b0acba87f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a95314e9a9279c4870f37f68a2357e064"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a95314e9a9279c4870f37f68a2357e064">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> m, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> n, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> k, typename Epilogue::Scalar alpha, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a> const *d_a, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> lda, long long int batch_stride_A, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a> const *d_b, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldb, long long int batch_stride_B, typename Epilogue::Scalar beta, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a> const *d_c, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldc, long long int batch_stride_C, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a> *d_d, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> ldd, long long int batch_stride_D, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> batch_count)</td></tr>
+<tr class="memdesc:a95314e9a9279c4870f37f68a2357e064"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct a batched GEMM params.  <a href="#a95314e9a9279c4870f37f68a2357e064">More...</a><br /></td></tr>
+<tr class="separator:a95314e9a9279c4870f37f68a2357e064"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1KernelLaunchConfiguration"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1KernelLaunchConfiguration')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td></tr>
+<tr class="memitem:a726db328ccc8f5e186ff8e7cef568eaa inherit pub_methods_structcutlass_1_1KernelLaunchConfiguration"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">KernelLaunchConfiguration</a> (dim3 _grid=dim3(1, 1, 1), dim3 _block=dim3(1, 1, 1), size_t _dynamic_smem=0)</td></tr>
+<tr class="memdesc:a726db328ccc8f5e186ff8e7cef568eaa inherit pub_methods_structcutlass_1_1KernelLaunchConfiguration"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a KernellaunchConfiguration object.  <a href="structcutlass_1_1KernelLaunchConfiguration.html#a726db328ccc8f5e186ff8e7cef568eaa">More...</a><br /></td></tr>
+<tr class="separator:a726db328ccc8f5e186ff8e7cef568eaa inherit pub_methods_structcutlass_1_1KernelLaunchConfiguration"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:aaf27c0f2f4ab730ed5c865e9f7d2373b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aaf27c0f2f4ab730ed5c865e9f7d2373b">m</a></td></tr>
-<tr class="memdesc:aaf27c0f2f4ab730ed5c865e9f7d2373b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The dimensions of the GEMM.  <a href="#aaf27c0f2f4ab730ed5c865e9f7d2373b">More...</a><br /></td></tr>
-<tr class="separator:aaf27c0f2f4ab730ed5c865e9f7d2373b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a437d4b6f1f149849c5ae635a5993e7ac"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a437d4b6f1f149849c5ae635a5993e7ac">n</a></td></tr>
-<tr class="separator:a437d4b6f1f149849c5ae635a5993e7ac"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aae3a008b39f9678a03192f6ff54152d8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aae3a008b39f9678a03192f6ff54152d8">k</a></td></tr>
-<tr class="separator:aae3a008b39f9678a03192f6ff54152d8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a575bcff901d69ae3f46987222f23ab64"><td class="memItemLeft" align="right" valign="top">GlobalLoadStreamA::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a575bcff901d69ae3f46987222f23ab64">global_stream_a</a></td></tr>
-<tr class="memdesc:a575bcff901d69ae3f46987222f23ab64"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the A stream.  <a href="#a575bcff901d69ae3f46987222f23ab64">More...</a><br /></td></tr>
-<tr class="separator:a575bcff901d69ae3f46987222f23ab64"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a46affe35cb16874de5a2b9777aedf596"><td class="memItemLeft" align="right" valign="top">GlobalLoadStreamB::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a46affe35cb16874de5a2b9777aedf596">global_stream_b</a></td></tr>
-<tr class="memdesc:a46affe35cb16874de5a2b9777aedf596"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the B stream.  <a href="#a46affe35cb16874de5a2b9777aedf596">More...</a><br /></td></tr>
-<tr class="separator:a46affe35cb16874de5a2b9777aedf596"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa9937ec51d18aad02398d95095117978"><td class="memItemLeft" align="right" valign="top">SharedLoadStreamA::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#aa9937ec51d18aad02398d95095117978">shared_stream_a</a></td></tr>
-<tr class="memdesc:aa9937ec51d18aad02398d95095117978"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the A stream from shared memory.  <a href="#aa9937ec51d18aad02398d95095117978">More...</a><br /></td></tr>
-<tr class="separator:aa9937ec51d18aad02398d95095117978"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a78f22007632937bbd5f3dab7b097477d"><td class="memItemLeft" align="right" valign="top">SharedLoadStreamB::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a78f22007632937bbd5f3dab7b097477d">shared_stream_b</a></td></tr>
-<tr class="memdesc:a78f22007632937bbd5f3dab7b097477d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the B stream from shared memory.  <a href="#a78f22007632937bbd5f3dab7b097477d">More...</a><br /></td></tr>
-<tr class="separator:a78f22007632937bbd5f3dab7b097477d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af2233a6ebf39788e27f051f8c614ab90"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#af2233a6ebf39788e27f051f8c614ab90">problem_size</a></td></tr>
+<tr class="memdesc:af2233a6ebf39788e27f051f8c614ab90"><td class="mdescLeft">&#160;</td><td class="mdescRight">GEMM problem size.  <a href="#af2233a6ebf39788e27f051f8c614ab90">More...</a><br /></td></tr>
+<tr class="separator:af2233a6ebf39788e27f051f8c614ab90"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8dba1bcd9ddab830bc121afc728296c3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">GlobalLoadStream::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a8dba1bcd9ddab830bc121afc728296c3">global_to_shared_stream</a></td></tr>
+<tr class="memdesc:a8dba1bcd9ddab830bc121afc728296c3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object for the global load stream.  <a href="#a8dba1bcd9ddab830bc121afc728296c3">More...</a><br /></td></tr>
+<tr class="separator:a8dba1bcd9ddab830bc121afc728296c3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a50e9cc382a32abd5beab299a79b30b27"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">SharedStream::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a50e9cc382a32abd5beab299a79b30b27">shared_stream</a></td></tr>
+<tr class="memdesc:a50e9cc382a32abd5beab299a79b30b27"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object for the shared load stream.  <a href="#a50e9cc382a32abd5beab299a79b30b27">More...</a><br /></td></tr>
+<tr class="separator:a50e9cc382a32abd5beab299a79b30b27"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a073430a1e8b124aec8a1f1e00f262bc8"><td class="memItemLeft" align="right" valign="top">Epilogue::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1Params.html#a073430a1e8b124aec8a1f1e00f262bc8">epilogue</a></td></tr>
 <tr class="memdesc:a073430a1e8b124aec8a1f1e00f262bc8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params for the epilogue.  <a href="#a073430a1e8b124aec8a1f1e00f262bc8">More...</a><br /></td></tr>
 <tr class="separator:a073430a1e8b124aec8a1f1e00f262bc8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1KernelLaunchConfiguration')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html">cutlass::KernelLaunchConfiguration</a></td></tr>
+<tr class="memitem:ab86ba1464dd9c6cd15ae0de4a552201b inherit pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td class="memItemLeft" align="right" valign="top">dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">grid</a></td></tr>
+<tr class="memdesc:ab86ba1464dd9c6cd15ae0de4a552201b inherit pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td class="mdescLeft">&#160;</td><td class="mdescRight">CUDA grid dimensions.  <a href="structcutlass_1_1KernelLaunchConfiguration.html#ab86ba1464dd9c6cd15ae0de4a552201b">More...</a><br /></td></tr>
+<tr class="separator:ab86ba1464dd9c6cd15ae0de4a552201b inherit pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a09535026bf08f94c6940c358d95d1edd inherit pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td class="memItemLeft" align="right" valign="top">dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">block</a></td></tr>
+<tr class="memdesc:a09535026bf08f94c6940c358d95d1edd inherit pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td class="mdescLeft">&#160;</td><td class="mdescRight">CUDA threablock dimensions.  <a href="structcutlass_1_1KernelLaunchConfiguration.html#a09535026bf08f94c6940c358d95d1edd">More...</a><br /></td></tr>
+<tr class="separator:a09535026bf08f94c6940c358d95d1edd inherit pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4a6ac693d4284c84301279219623e2bc inherit pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td class="memItemLeft" align="right" valign="top">size_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">dynamic_smem</a></td></tr>
+<tr class="memdesc:a4a6ac693d4284c84301279219623e2bc inherit pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td class="mdescLeft">&#160;</td><td class="mdescRight">Bytes of dynamically allocated SMEM in addition to static SMEM.  <a href="structcutlass_1_1KernelLaunchConfiguration.html#a4a6ac693d4284c84301279219623e2bc">More...</a><br /></td></tr>
+<tr class="separator:a4a6ac693d4284c84301279219623e2bc inherit pub_attribs_structcutlass_1_1KernelLaunchConfiguration"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Function Documentation</h2>
 <a id="a40023f0ffdd8bee4ccbcaac28222e983"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a40023f0ffdd8bee4ccbcaac28222e983">&#9670;&nbsp;</a></span>initialize()</h2>
+<h2 class="memtitle"><span class="permalink"><a href="#a40023f0ffdd8bee4ccbcaac28222e983">&#9670;&nbsp;</a></span>initialize() <span class="overload">[1/3]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename GemmDesc_ &gt; </div>
 <table class="mlabels">
@@ -147,6 +166,244 @@ template&lt;typename GemmDesc_ &gt; </div>
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="ac4cd0b74130ffc09e4ccb7b0acba87f8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac4cd0b74130ffc09e4ccb7b0acba87f8">&#9670;&nbsp;</a></span>initialize() <span class="overload">[2/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>m</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>n</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>k</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">typename Epilogue::Scalar&#160;</td>
+          <td class="paramname"><em>alpha</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a> const *&#160;</td>
+          <td class="paramname"><em>d_a</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>lda</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a> const *&#160;</td>
+          <td class="paramname"><em>d_b</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>ldb</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">typename Epilogue::Scalar&#160;</td>
+          <td class="paramname"><em>beta</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a> const *&#160;</td>
+          <td class="paramname"><em>d_c</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>ldc</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a> *&#160;</td>
+          <td class="paramname"><em>d_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>ldd</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a95314e9a9279c4870f37f68a2357e064"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a95314e9a9279c4870f37f68a2357e064">&#9670;&nbsp;</a></span>initialize() <span class="overload">[3/3]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>m</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>n</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>k</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">typename Epilogue::Scalar&#160;</td>
+          <td class="paramname"><em>alpha</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a> const *&#160;</td>
+          <td class="paramname"><em>d_a</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>lda</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long int&#160;</td>
+          <td class="paramname"><em>batch_stride_A</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a> const *&#160;</td>
+          <td class="paramname"><em>d_b</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>ldb</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long int&#160;</td>
+          <td class="paramname"><em>batch_stride_B</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">typename Epilogue::Scalar&#160;</td>
+          <td class="paramname"><em>beta</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a> const *&#160;</td>
+          <td class="paramname"><em>d_c</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>ldc</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long int&#160;</td>
+          <td class="paramname"><em>batch_stride_C</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a> *&#160;</td>
+          <td class="paramname"><em>d_d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>ldd</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long int&#160;</td>
+          <td class="paramname"><em>batch_stride_D</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a>&#160;</td>
+          <td class="paramname"><em>batch_count</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
@@ -156,7 +413,7 @@ template&lt;typename GemmDesc_ &gt; </div>
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">Epilogue::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::epilogue</td>
@@ -166,112 +423,48 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 
 </div>
 </div>
-<a id="a575bcff901d69ae3f46987222f23ab64"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a575bcff901d69ae3f46987222f23ab64">&#9670;&nbsp;</a></span>global_stream_a</h2>
+<a id="a8dba1bcd9ddab830bc121afc728296c3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8dba1bcd9ddab830bc121afc728296c3">&#9670;&nbsp;</a></span>global_to_shared_stream</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">GlobalLoadStreamA::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::global_stream_a</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">GlobalLoadStream::Params</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::global_to_shared_stream</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a46affe35cb16874de5a2b9777aedf596"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a46affe35cb16874de5a2b9777aedf596">&#9670;&nbsp;</a></span>global_stream_b</h2>
+<a id="af2233a6ebf39788e27f051f8c614ab90"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af2233a6ebf39788e27f051f8c614ab90">&#9670;&nbsp;</a></span>problem_size</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">GlobalLoadStreamB::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::global_stream_b</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::problem_size</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aae3a008b39f9678a03192f6ff54152d8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aae3a008b39f9678a03192f6ff54152d8">&#9670;&nbsp;</a></span>k</h2>
+<a id="a50e9cc382a32abd5beab299a79b30b27"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a50e9cc382a32abd5beab299a79b30b27">&#9670;&nbsp;</a></span>shared_stream</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::k</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aaf27c0f2f4ab730ed5c865e9f7d2373b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aaf27c0f2f4ab730ed5c865e9f7d2373b">&#9670;&nbsp;</a></span>m</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::m</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a437d4b6f1f149849c5ae635a5993e7ac"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a437d4b6f1f149849c5ae635a5993e7ac">&#9670;&nbsp;</a></span>n</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::n</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aa9937ec51d18aad02398d95095117978"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa9937ec51d18aad02398d95095117978">&#9670;&nbsp;</a></span>shared_stream_a</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">SharedLoadStreamA::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::shared_stream_a</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a78f22007632937bbd5f3dab7b097477d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a78f22007632937bbd5f3dab7b097477d">&#9670;&nbsp;</a></span>shared_stream_b</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">SharedLoadStreamB::Params <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::shared_stream_b</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">SharedStream::Params</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::Params::shared_stream</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -284,7 +477,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params.png b/docs/structcutlass_1_1gemm_1_1GemmTraits_1_1Params.png
new file mode 100644
index 0000000000000000000000000000000000000000..6d6c416a379f4af89bb5f1013601b27db29403e3
GIT binary patch
literal 2212
zcmdT`X;4#H76vhcol#IpBMm~72|^Tu4UMr`4NF5%kY<%dq9P!&sq9MvLIVQbGHd|`
zgtVYQ(Me>D5J*^T)5s>GfGi0ZB#a@1J#5MA7p(a)Q#Cce=T*ITzwf)}ojT{cRi|!-
zql3*Ms47%OM&=OK*2+mnW`8n>9S_KXU#AsRAh@VFUUsnt004wb>+{dLBL5Dey|<&I
z<7!=u8%PgCI5{}WfI-sd{c9I}P%^+;VO(Nl1ylT}Nu9&iGuahQb7FYx0^_TQe>NL@
zTRc{9n@&FhdwMij;z{&F68$_f{XB>_J%~@Q68(x(w6K{7WNxKxt|r#s5o!l6QhrPG
zDd}JGDX0G~ms`-ivG@P@#BNZa?pwQu!m%Y<J%4yjgcTvcJX^g;h*r;)898ViW6QjX
z<omS!prZtv3%5k-U>V<%r+$Bn;^=WuAz^Sn=f`s*g;9VOO1q%QjCc^;t|5BG5W)+E
zqq>VTp=hBfO;?zc2i7V4LHe`aV>AUWZ{EuHCmA0*xxhNUUnBmI>7bFR>PX9@`UN>H
zYz~6+(8)130T<PERn2Y6#E2;rAwmXG7mwZARbd^EzY8qSC!BaK4e_$WU{~<pySyp6
zLxH;sgA4ArFkRm?)hP8=%%D$Kmsi5_5#~vI$sWNP7e7mc)ujTV;ed|;(;j2vK}^n_
zHFgF~5?-R!DxMc@$43s;D8FLUJG4Dx=gQ*kKrgpy^1&#zVU*e~z66Kf@w;SBxF-BL
zs%5fe!uQjVP|P`8SvWw-yTmcfAd?n*4vIO9h`r45(#)FJIp<K&I0vxzOhj=noggi_
z8?+bfGcS;Q5G?R9SRf4Rga8$#FB{e%*U$Oia;)>4dfiKPy1h=iz4fr(dfngab$el?
zq<v<C=8hL-A+U4lPKRM2THWN8-`_*SIuML>BO5JOkOD?Ri>#3cpgN?an*5|aYWsy|
z<R|}s(M?0oAo6W;)03u=%n{Eso<SiBs?ydWeI(d^2+Xm=$_^u?mn;9B&RSu@eqmbL
z3k2}eB|`iJH(~Brr$c;OQ@h<qBjG<f<<H#vhNiAyQ@UQH4=@G-8oG&8O6N<&0JP2{
zqZ|i_mgzTWX@a&A0<S?plrx!eRX1Dq4hTA0cCU5(I;-&X{Lzn}x{@Dok5E(8MKMjM
zqO*69kcISa*#M1F1Hfb1?EG$4&^d#Qs??4+yc;H96{qGyW^<mA+#_QM8WnVc2c}%L
z-oNqnDp?@d5!`BFdjf3ZXptT#U5~DPK@bh>u<r`jBrOf|{Oj_ji$79Z%&x_Cb0^D0
z%8|c0y63O6Lx?Qr;JgHem_d-Z8;6yKD+Rh8@<%LpT9}OV`KM8ih~I~a``_W?_{#K2
z9ANg>Hf4W7^vVf&eqc3^s~#NQ)<0Y|X1}qyYO6jFGuxb)$EU~r6!TjqVT2L-3%8b@
zh#Xq-gDnR#S>q;U!I#%upQmV)q{sY98on3sb!&0R*-gqY7h_}NP!6nlw<^NtCK=g!
zl+Hec&*|zRoP4bqn<RM7Vi1mV+ml<BHe;tzH5IALcT6K)zhQT;o>nJ!QC^g^jDC)`
zHjB%v(2RnrI(eyW-!WZ(pA+k_pifB~FyPMeE2$|0Sj4908ytQNKiI7lJi(uTzo;=+
zoP4SeAiOI(?%jR2F=vrmdk3_;!NPldFnd~2x6*4G-`qa+9sfO5!h;&QL(}*dF_t|F
zpWCL^ZPwXso!aRhxUBx(w+BZn){B!D{RAdvYjJJOKP0Z7EEn-%@1k2X!-Lv+o!~*S
z&V=?=Q4^VNH0n;>Q5IsbP*S=zr~p*V_*QbK059n|H&_Hm^%+3a&8?$X%5@%|_v!wa
zsJwaM!6;PK?s;ha73A&7f*_T#bGLajPbvham4FMTL|;901-~K>H4>sr<t&rz3vlu~
z{m}8baE*=WeDk=f!~_XXjW=6qJSoOGrW9j$(U8uva7d(@Xq*4`KIz0*II&~-AqJ!7
z3l~1&LC5hEKbstWLn+!3nChltFti<3aq#)Am<xv6wO3|hnMx3H;G>(dstYm5Y{kFG
zT^nN|S22*uhVRGFa5lk!2kb6#`c|zCi^^UaKn%Bo8nk^%{j}#k^QLB->$>hui}Tpc
zf`FB=GxJMdiI|G8#!=35n%NT)xq^zJe88#W!$sUtJTV@{$B*}{t0azxnH)ep7G7ae
z7v+;p%Wg0a2$5k|vRDRD+z}mGLMVEBgR;N<ILm=I5w@`_db^;|`>PvXe*&_cYFJeK
z5_=LQC`57fh5qnk;u}eevQfQD>=z-egYl{{w4dN|=c~kwBHzcal$e9dKAe7u5AN03
zp-^g9S?Adu^oRcXG?fjlgd&`}eBwh(NJoNXX&1;U6eZf;Ea~=esA?g6uuMQL;a;eX
zzDv~Fa;;u+ziYo0Hzsb4o?$Mf^MK)OfQkM1U3x|3Be$JG)0ez`K#wPzmj-m{`2)t!
z(lT~ak(RQ<7rg)06fs@9*{!W9olE9fUq&-H^7jUE&VNueq-n%+$TP?~i2OCV$*pl@
b943J@Hm-7wXc`>wN+E-_cCeyYTu=TJiq<oz

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1GetExtent.html b/docs/structcutlass_1_1gemm_1_1GetExtent.html
index c955db656..c84e02823 100644
--- a/docs/structcutlass_1_1gemm_1_1GetExtent.html
+++ b/docs/structcutlass_1_1gemm_1_1GetExtent.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4-members.html b/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4-members.html
index 725806f65..351a7645b 100644
--- a/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html b/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html
index 4e613ddc9..2f4be77a3 100644
--- a/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kA_00_01Tile___01_4.html
@@ -118,7 +118,7 @@ template&lt;typename Tile_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4-members.html b/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4-members.html
index d17a7e7c5..1be152115 100644
--- a/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html b/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html
index 172db999e..a982badec 100644
--- a/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1GetExtent_3_01GemmOperand_1_1kB_00_01Tile___01_4.html
@@ -118,7 +118,7 @@ template&lt;typename Tile_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStream-members.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream-members.html
index f3b227eb8..9cdc4c82f 100644
--- a/docs/structcutlass_1_1gemm_1_1GlobalLoadStream-members.html
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream-members.html
@@ -73,38 +73,46 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae">commit</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e">copy</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">fetched_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">FetchedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a4dd11a75375b6b9d7b8dcbd4d402d8d6">GlobalLoadStream</a>(typename Base::Params const &amp;params, typename Base::SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278">GlobalLoadStreamBase</a>(Params const &amp;params, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const bounds, Coord&lt; 3 &gt; const &amp;block)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">load_iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">LoadIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9">residue</a>(Index k, bool skip_clear=false)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa">SharedStoreStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">store_iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">StoreIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">transformed_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">TransformedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">Transformer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">transformer</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab39c82ac1a8138c4b6d69dab9d48bdbc">commit</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a3784dbb3efe0865ffa946419111c824a">copy</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">fetched_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">FetchedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aec86bdf5d7d4ad1f7b6ebebcf2da8395">GlobalLoadStream</a>(Params const &amp;_params, SharedStorage &amp;shared_storage, ThreadblockTileRef const &amp;threadblock_tile_ref, Coord&lt; 3 &gt; const bounds, Coord&lt; 3 &gt; const &amp;_threadblock_offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700">kOperand</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">LoadIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac269a9280a55d3988ca60f571bdf7f29">move_to_residue</a>(Index k, Index kTileK)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">multiplicand_bounds</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a8e79a153de72eef10d90bfd02b5dd27e">operator+=</a>(Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">project_coordinate</a>(Coord&lt; 3 &gt; const &amp;coord, Index d_offset=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17">residue</a>(Index k, bool skip_clear=false)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1e2eecdba1871fc11aa43a06edf6ed34">rollback</a>(void)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">store_iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">StoreIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">threadblock_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">ThreadblockTileRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1">transformed_fragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4">transformer</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">Transformer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStream.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream.html
index 99cbcad5d..b35955957 100644
--- a/docs/structcutlass_1_1gemm_1_1GlobalLoadStream.html
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -73,115 +73,321 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
 <a href="#pub-types">Public Types</a> &#124;
 <a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-static-methods">Static Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1gemm_1_1GlobalLoadStream-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="gemm__global__stream_8h_source.html">gemm_global_stream.h</a>&gt;</code></p>
-<div class="dynheader">
-Inheritance diagram for cutlass::gemm::GlobalLoadStream&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;:</div>
-<div class="dyncontent">
- <div class="center">
-  <img src="structcutlass_1_1gemm_1_1GlobalLoadStream.png" usemap="#cutlass::gemm::GlobalLoadStream_3C_20LoadIterator_5F_2C_20StoreIterator_5F_2C_20Transformer_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::GlobalLoadStream_3C_20LoadIterator_5F_2C_20StoreIterator_5F_2C_20Transformer_5F_20_3E_map" name="cutlass::gemm::GlobalLoadStream_3C_20LoadIterator_5F_2C_20StoreIterator_5F_2C_20Transformer_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html" alt="cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;" shape="rect" coords="0,0,496,24"/>
-</map>
- </div></div>
 <table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The params.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">SharedStorage</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:a507f825824e624d80a34ea9395934160"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">GlobalLoadStreamBase</a>&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160">Base</a></td></tr>
-<tr class="memdesc:a507f825824e624d80a34ea9395934160"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base class.  <a href="#a507f825824e624d80a34ea9395934160">More...</a><br /></td></tr>
-<tr class="separator:a507f825824e624d80a34ea9395934160"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td></tr>
-<tr class="memitem:acff2a1ab180eec672714cd587a28f9fe inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">LoadIterator</a></td></tr>
-<tr class="memdesc:acff2a1ab180eec672714cd587a28f9fe inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load iterator.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">More...</a><br /></td></tr>
-<tr class="separator:acff2a1ab180eec672714cd587a28f9fe inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa24bd9f94bea04a148b49b2a97b63fbe inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef Transformer_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">Transformer</a></td></tr>
-<tr class="memdesc:aa24bd9f94bea04a148b49b2a97b63fbe inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">More...</a><br /></td></tr>
-<tr class="separator:aa24bd9f94bea04a148b49b2a97b63fbe inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a15eee5bf6367a36a5b5c8024437f4834 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef StoreIterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">StoreIterator</a></td></tr>
-<tr class="memdesc:a15eee5bf6367a36a5b5c8024437f4834 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store iterator to write to shared memory.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">More...</a><br /></td></tr>
-<tr class="separator:a15eee5bf6367a36a5b5c8024437f4834 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0a7f6ae85cfb162b1facf24dff8bab36 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator::Fragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">FetchedFragment</a></td></tr>
-<tr class="memdesc:a0a7f6ae85cfb162b1facf24dff8bab36 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment that is copied from shared memory.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">More...</a><br /></td></tr>
-<tr class="separator:a0a7f6ae85cfb162b1facf24dff8bab36 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afe7503a3304eefd633581d6bc73a0108 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef Transformer::OutputFragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">TransformedFragment</a></td></tr>
-<tr class="memdesc:afe7503a3304eefd633581d6bc73a0108 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment that is obtained after the transformation by the transformer.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">More...</a><br /></td></tr>
-<tr class="separator:afe7503a3304eefd633581d6bc73a0108 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a32687e2aa49dfa251eab14d5cd2036be inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be">Fragment</a></td></tr>
-<tr class="memdesc:a32687e2aa49dfa251eab14d5cd2036be inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Make sure the fragments match.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a32687e2aa49dfa251eab14d5cd2036be">More...</a><br /></td></tr>
-<tr class="separator:a32687e2aa49dfa251eab14d5cd2036be inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afbbf15a7b5e4c38e59bf1debf67f04d6 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6">Scalar</a></td></tr>
-<tr class="memdesc:afbbf15a7b5e4c38e59bf1debf67f04d6 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar type of the iterator.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afbbf15a7b5e4c38e59bf1debf67f04d6">More...</a><br /></td></tr>
-<tr class="separator:afbbf15a7b5e4c38e59bf1debf67f04d6 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adcbf24c1b7f45ab5fe8f3ad94154b4d1 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator::Pointer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1">Pointer</a></td></tr>
-<tr class="memdesc:adcbf24c1b7f45ab5fe8f3ad94154b4d1 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#adcbf24c1b7f45ab5fe8f3ad94154b4d1">More...</a><br /></td></tr>
-<tr class="separator:adcbf24c1b7f45ab5fe8f3ad94154b4d1 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6a6e38022606dd8d41cf7264fb059cc2 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">Index</a></td></tr>
-<tr class="memdesc:a6a6e38022606dd8d41cf7264fb059cc2 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">More...</a><br /></td></tr>
-<tr class="separator:a6a6e38022606dd8d41cf7264fb059cc2 inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a69092e298d5723028fc24235d72f87fa inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">typedef StoreIterator::SharedStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa">SharedStoreStorage</a></td></tr>
-<tr class="memdesc:a69092e298d5723028fc24235d72f87fa inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The amount of storage in shared memory needed to store the tile.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a69092e298d5723028fc24235d72f87fa">More...</a><br /></td></tr>
-<tr class="separator:a69092e298d5723028fc24235d72f87fa inherit pub_types_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a905c219287a7342b2ddb58b84e413d64"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">LoadIterator</a></td></tr>
+<tr class="memdesc:a905c219287a7342b2ddb58b84e413d64"><td class="mdescLeft">&#160;</td><td class="mdescRight">The load iterator.  <a href="#a905c219287a7342b2ddb58b84e413d64">More...</a><br /></td></tr>
+<tr class="separator:a905c219287a7342b2ddb58b84e413d64"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa79a27cbe2420882fbaca55e42803f02"><td class="memItemLeft" align="right" valign="top">typedef Transformer_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">Transformer</a></td></tr>
+<tr class="memdesc:aa79a27cbe2420882fbaca55e42803f02"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer.  <a href="#aa79a27cbe2420882fbaca55e42803f02">More...</a><br /></td></tr>
+<tr class="separator:aa79a27cbe2420882fbaca55e42803f02"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac16e31930c346068d7522dd8de9d93d2"><td class="memItemLeft" align="right" valign="top">typedef StoreIterator_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">StoreIterator</a></td></tr>
+<tr class="memdesc:ac16e31930c346068d7522dd8de9d93d2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store iterator to write to shared memory.  <a href="#ac16e31930c346068d7522dd8de9d93d2">More...</a><br /></td></tr>
+<tr class="separator:ac16e31930c346068d7522dd8de9d93d2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7d9b4339129c1ab4f21f1df1144faddf"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator::Fragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">FetchedFragment</a></td></tr>
+<tr class="memdesc:a7d9b4339129c1ab4f21f1df1144faddf"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment that is copied from shared memory.  <a href="#a7d9b4339129c1ab4f21f1df1144faddf">More...</a><br /></td></tr>
+<tr class="separator:a7d9b4339129c1ab4f21f1df1144faddf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9eb2fb49698d0d018c04e7712e239ce9"><td class="memItemLeft" align="right" valign="top">typedef Transformer::OutputFragment&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a></td></tr>
+<tr class="memdesc:a9eb2fb49698d0d018c04e7712e239ce9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment that is obtained after the transformation by the transformer.  <a href="#a9eb2fb49698d0d018c04e7712e239ce9">More...</a><br /></td></tr>
+<tr class="separator:a9eb2fb49698d0d018c04e7712e239ce9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab7e315253b3301c191581bce05644106"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106">Fragment</a></td></tr>
+<tr class="memdesc:ab7e315253b3301c191581bce05644106"><td class="mdescLeft">&#160;</td><td class="mdescRight">Make sure the fragments match.  <a href="#ab7e315253b3301c191581bce05644106">More...</a><br /></td></tr>
+<tr class="separator:ab7e315253b3301c191581bce05644106"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7073b32c2cc62ffcad70a9ca46995c4c"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c">Scalar</a></td></tr>
+<tr class="memdesc:a7073b32c2cc62ffcad70a9ca46995c4c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar type of the iterator.  <a href="#a7073b32c2cc62ffcad70a9ca46995c4c">More...</a><br /></td></tr>
+<tr class="separator:a7073b32c2cc62ffcad70a9ca46995c4c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac4452df991f57f9bb0b86dfd380179b2"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator::Pointer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">Pointer</a></td></tr>
+<tr class="memdesc:ac4452df991f57f9bb0b86dfd380179b2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="#ac4452df991f57f9bb0b86dfd380179b2">More...</a><br /></td></tr>
+<tr class="separator:ac4452df991f57f9bb0b86dfd380179b2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7c46d6eb83b43e099d53784bb2a09f02"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a></td></tr>
+<tr class="memdesc:a7c46d6eb83b43e099d53784bb2a09f02"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="#a7c46d6eb83b43e099d53784bb2a09f02">More...</a><br /></td></tr>
+<tr class="separator:a7c46d6eb83b43e099d53784bb2a09f02"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a260543a618fb187c2da40c9f630925ec"><td class="memItemLeft" align="right" valign="top">typedef LoadIterator::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec">Tile</a></td></tr>
+<tr class="memdesc:a260543a618fb187c2da40c9f630925ec"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="#a260543a618fb187c2da40c9f630925ec">More...</a><br /></td></tr>
+<tr class="separator:a260543a618fb187c2da40c9f630925ec"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a17804b01904a9a4ee7a857905833f7a8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileAllocation.html">TileAllocation</a>&lt; typename StoreIterator::Scalar, typename StoreIterator::Tile &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:a17804b01904a9a4ee7a857905833f7a8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Shared memory allocation for the tile.  <a href="#a17804b01904a9a4ee7a857905833f7a8">More...</a><br /></td></tr>
+<tr class="separator:a17804b01904a9a4ee7a857905833f7a8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a011287c8289b7b026f9993da663abd77"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">ThreadblockTileStorage::TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">ThreadblockTileRef</a></td></tr>
+<tr class="memdesc:a011287c8289b7b026f9993da663abd77"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference to threadblock tile.  <a href="#a011287c8289b7b026f9993da663abd77">More...</a><br /></td></tr>
+<tr class="separator:a011287c8289b7b026f9993da663abd77"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a4dd11a75375b6b9d7b8dcbd4d402d8d6"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a4dd11a75375b6b9d7b8dcbd4d402d8d6">GlobalLoadStream</a> (typename <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">Base::Params</a> const &amp;params, typename <a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">Base::SharedStorage</a> &amp;shared_storage, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block)</td></tr>
-<tr class="memdesc:a4dd11a75375b6b9d7b8dcbd4d402d8d6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a4dd11a75375b6b9d7b8dcbd4d402d8d6">More...</a><br /></td></tr>
-<tr class="separator:a4dd11a75375b6b9d7b8dcbd4d402d8d6"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td></tr>
-<tr class="memitem:a0fdc0f56d1352b5ad41fd4985edd3278 inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278">GlobalLoadStreamBase</a> (<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">Params</a> const &amp;params, <a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">SharedStorage</a> &amp;shared_storage, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block)</td></tr>
-<tr class="memdesc:a0fdc0f56d1352b5ad41fd4985edd3278 inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0fdc0f56d1352b5ad41fd4985edd3278">More...</a><br /></td></tr>
-<tr class="separator:a0fdc0f56d1352b5ad41fd4985edd3278 inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af7a15b4456cda01c1ffbb2fdc532e87e inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e">copy</a> ()</td></tr>
-<tr class="memdesc:af7a15b4456cda01c1ffbb2fdc532e87e inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Load.html">Load</a> the data from shared memory to the fetch fragment.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#af7a15b4456cda01c1ffbb2fdc532e87e">More...</a><br /></td></tr>
-<tr class="separator:af7a15b4456cda01c1ffbb2fdc532e87e inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6ce2c6e81d159d8e9ab736cb263f44ae inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae">commit</a> ()</td></tr>
-<tr class="memdesc:a6ce2c6e81d159d8e9ab736cb263f44ae inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commit the data.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6ce2c6e81d159d8e9ab736cb263f44ae">More...</a><br /></td></tr>
-<tr class="separator:a6ce2c6e81d159d8e9ab736cb263f44ae inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aae1adef6312e069e59a83d38c03116f9 inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9">residue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a6a6e38022606dd8d41cf7264fb059cc2">Index</a> k, bool skip_clear=false)</td></tr>
-<tr class="memdesc:aae1adef6312e069e59a83d38c03116f9 inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Execute the residue code.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aae1adef6312e069e59a83d38c03116f9">More...</a><br /></td></tr>
-<tr class="separator:aae1adef6312e069e59a83d38c03116f9 inherit pub_methods_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aec86bdf5d7d4ad1f7b6ebebcf2da8395"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aec86bdf5d7d4ad1f7b6ebebcf2da8395">GlobalLoadStream</a> (<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a> const &amp;_params, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">SharedStorage</a> &amp;shared_storage, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">ThreadblockTileRef</a> const &amp;threadblock_tile_ref, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;_threadblock_offset)</td></tr>
+<tr class="memdesc:aec86bdf5d7d4ad1f7b6ebebcf2da8395"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#aec86bdf5d7d4ad1f7b6ebebcf2da8395">More...</a><br /></td></tr>
+<tr class="separator:aec86bdf5d7d4ad1f7b6ebebcf2da8395"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3784dbb3efe0865ffa946419111c824a"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a3784dbb3efe0865ffa946419111c824a">copy</a> ()</td></tr>
+<tr class="memdesc:a3784dbb3efe0865ffa946419111c824a"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Load.html">Load</a> the data from shared memory to the fetch fragment.  <a href="#a3784dbb3efe0865ffa946419111c824a">More...</a><br /></td></tr>
+<tr class="separator:a3784dbb3efe0865ffa946419111c824a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab39c82ac1a8138c4b6d69dab9d48bdbc"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab39c82ac1a8138c4b6d69dab9d48bdbc">commit</a> ()</td></tr>
+<tr class="memdesc:ab39c82ac1a8138c4b6d69dab9d48bdbc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commit the data.  <a href="#ab39c82ac1a8138c4b6d69dab9d48bdbc">More...</a><br /></td></tr>
+<tr class="separator:ab39c82ac1a8138c4b6d69dab9d48bdbc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a235adaea5d4f01232c79cb6109dc6d17"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a235adaea5d4f01232c79cb6109dc6d17">residue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> k, bool skip_clear=false)</td></tr>
+<tr class="memdesc:a235adaea5d4f01232c79cb6109dc6d17"><td class="mdescLeft">&#160;</td><td class="mdescRight">Execute the residue code.  <a href="#a235adaea5d4f01232c79cb6109dc6d17">More...</a><br /></td></tr>
+<tr class="separator:a235adaea5d4f01232c79cb6109dc6d17"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac269a9280a55d3988ca60f571bdf7f29"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac269a9280a55d3988ca60f571bdf7f29">move_to_residue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> k, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> kTileK)</td></tr>
+<tr class="memdesc:ac269a9280a55d3988ca60f571bdf7f29"><td class="mdescLeft">&#160;</td><td class="mdescRight">Move to the residue portion.  <a href="#ac269a9280a55d3988ca60f571bdf7f29">More...</a><br /></td></tr>
+<tr class="separator:ac269a9280a55d3988ca60f571bdf7f29"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e2eecdba1871fc11aa43a06edf6ed34"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1e2eecdba1871fc11aa43a06edf6ed34">rollback</a> (void)</td></tr>
+<tr class="memdesc:a1e2eecdba1871fc11aa43a06edf6ed34"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rollback to the beginning of the first tile.  <a href="#a1e2eecdba1871fc11aa43a06edf6ed34">More...</a><br /></td></tr>
+<tr class="separator:a1e2eecdba1871fc11aa43a06edf6ed34"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8e79a153de72eef10d90bfd02b5dd27e"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a8e79a153de72eef10d90bfd02b5dd27e">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a8e79a153de72eef10d90bfd02b5dd27e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a <a class="el" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> to the underlying global load iterator.  <a href="#a8e79a153de72eef10d90bfd02b5dd27e">More...</a><br /></td></tr>
+<tr class="separator:a8e79a153de72eef10d90bfd02b5dd27e"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
-Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td></tr>
-<tr class="memitem:ad2381f2311ee8400a2dc57c19084ef5e inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#acff2a1ab180eec672714cd587a28f9fe">LoadIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">load_iterator</a></td></tr>
-<tr class="memdesc:ad2381f2311ee8400a2dc57c19084ef5e inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#ad2381f2311ee8400a2dc57c19084ef5e">More...</a><br /></td></tr>
-<tr class="separator:ad2381f2311ee8400a2dc57c19084ef5e inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a26aa580a2697ad02c27f868e7779348d inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0a7f6ae85cfb162b1facf24dff8bab36">FetchedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">fetched_fragment</a></td></tr>
-<tr class="memdesc:a26aa580a2697ad02c27f868e7779348d inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment to fetch from shared memory.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a26aa580a2697ad02c27f868e7779348d">More...</a><br /></td></tr>
-<tr class="separator:a26aa580a2697ad02c27f868e7779348d inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a868f82ee87aba37b05721fe8210221c9 inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#aa24bd9f94bea04a148b49b2a97b63fbe">Transformer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">transformer</a></td></tr>
-<tr class="memdesc:a868f82ee87aba37b05721fe8210221c9 inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a868f82ee87aba37b05721fe8210221c9">More...</a><br /></td></tr>
-<tr class="separator:a868f82ee87aba37b05721fe8210221c9 inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afa97cb1cfebca0d6977b1c8318bedddf inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afe7503a3304eefd633581d6bc73a0108">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">transformed_fragment</a></td></tr>
-<tr class="memdesc:afa97cb1cfebca0d6977b1c8318bedddf inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment to convert the data after it has been fetched from shared memory.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#afa97cb1cfebca0d6977b1c8318bedddf">More...</a><br /></td></tr>
-<tr class="separator:afa97cb1cfebca0d6977b1c8318bedddf inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0eafd1e245946bd1b9d228ad7d2d0dae inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a15eee5bf6367a36a5b5c8024437f4834">StoreIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">store_iterator</a></td></tr>
-<tr class="memdesc:a0eafd1e245946bd1b9d228ad7d2d0dae inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store iterator.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a0eafd1e245946bd1b9d228ad7d2d0dae">More...</a><br /></td></tr>
-<tr class="separator:a0eafd1e245946bd1b9d228ad7d2d0dae inherit pub_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">cutlass::gemm::GlobalLoadStreamBase&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;</a></td></tr>
-<tr class="memitem:a807cffc6f69f8d30a2fc94cf49fb904c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c">kLayout</a> = LoadIterator::kLayout</td></tr>
-<tr class="memdesc:a807cffc6f69f8d30a2fc94cf49fb904c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Make sure the transformed fragment is the same as the store fragment.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html#a807cffc6f69f8d30a2fc94cf49fb904c">More...</a><br /></td></tr>
-<tr class="separator:a807cffc6f69f8d30a2fc94cf49fb904c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GlobalLoadStreamBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-methods"></a>
+Static Public Member Functions</h2></td></tr>
+<tr class="memitem:aa634e3f786d5bf5707b94e522a10a001"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa634e3f786d5bf5707b94e522a10a001">project_coordinate</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;coord, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> d_offset=0)</td></tr>
+<tr class="memdesc:aa634e3f786d5bf5707b94e522a10a001"><td class="mdescLeft">&#160;</td><td class="mdescRight">Maps a coordinate in the GEMM's (K, N, M) coordinate system to global memory.  <a href="#aa634e3f786d5bf5707b94e522a10a001">More...</a><br /></td></tr>
+<tr class="separator:aa634e3f786d5bf5707b94e522a10a001"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:ac8ff1a3e10b25c212cd3cf5ed997fc0e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac8ff1a3e10b25c212cd3cf5ed997fc0e">params</a></td></tr>
+<tr class="memdesc:ac8ff1a3e10b25c212cd3cf5ed997fc0e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters.  <a href="#ac8ff1a3e10b25c212cd3cf5ed997fc0e">More...</a><br /></td></tr>
+<tr class="separator:ac8ff1a3e10b25c212cd3cf5ed997fc0e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a386f2f4d2e239075f0fe1489ed7788c1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a386f2f4d2e239075f0fe1489ed7788c1">multiplicand_bounds</a></td></tr>
+<tr class="memdesc:a386f2f4d2e239075f0fe1489ed7788c1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiplicand bounds.  <a href="#a386f2f4d2e239075f0fe1489ed7788c1">More...</a><br /></td></tr>
+<tr class="separator:a386f2f4d2e239075f0fe1489ed7788c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a563961c326d2e55f5b8682a30b64a24a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a563961c326d2e55f5b8682a30b64a24a">threadblock_offset</a></td></tr>
+<tr class="memdesc:a563961c326d2e55f5b8682a30b64a24a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Threadblock offset.  <a href="#a563961c326d2e55f5b8682a30b64a24a">More...</a><br /></td></tr>
+<tr class="separator:a563961c326d2e55f5b8682a30b64a24a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5ef4cc42c7cec73523550e5ea56df88c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">LoadIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a5ef4cc42c7cec73523550e5ea56df88c">load_iterator</a></td></tr>
+<tr class="memdesc:a5ef4cc42c7cec73523550e5ea56df88c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator.  <a href="#a5ef4cc42c7cec73523550e5ea56df88c">More...</a><br /></td></tr>
+<tr class="separator:a5ef4cc42c7cec73523550e5ea56df88c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1c117b87024937f1dc3da128795b6e03"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">FetchedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a1c117b87024937f1dc3da128795b6e03">fetched_fragment</a></td></tr>
+<tr class="memdesc:a1c117b87024937f1dc3da128795b6e03"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment to fetch from shared memory.  <a href="#a1c117b87024937f1dc3da128795b6e03">More...</a><br /></td></tr>
+<tr class="separator:a1c117b87024937f1dc3da128795b6e03"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab68ba57fe69430c557379b3457faebc4"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">Transformer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab68ba57fe69430c557379b3457faebc4">transformer</a></td></tr>
+<tr class="memdesc:ab68ba57fe69430c557379b3457faebc4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer.  <a href="#ab68ba57fe69430c557379b3457faebc4">More...</a><br /></td></tr>
+<tr class="separator:ab68ba57fe69430c557379b3457faebc4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7d7042e60aaab0dd00772b239e1f1db1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d7042e60aaab0dd00772b239e1f1db1">transformed_fragment</a></td></tr>
+<tr class="memdesc:a7d7042e60aaab0dd00772b239e1f1db1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment to convert the data after it has been fetched from shared memory.  <a href="#a7d7042e60aaab0dd00772b239e1f1db1">More...</a><br /></td></tr>
+<tr class="separator:a7d7042e60aaab0dd00772b239e1f1db1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a45a4bceb72fcb856e32eaa20eec11e9d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">StoreIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a45a4bceb72fcb856e32eaa20eec11e9d">store_iterator</a></td></tr>
+<tr class="memdesc:a45a4bceb72fcb856e32eaa20eec11e9d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The store iterator.  <a href="#a45a4bceb72fcb856e32eaa20eec11e9d">More...</a><br /></td></tr>
+<tr class="separator:a45a4bceb72fcb856e32eaa20eec11e9d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a30113b850dfd3de60f8778bc7a66f700"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a30113b850dfd3de60f8778bc7a66f700">kOperand</a> = Operand</td></tr>
+<tr class="memdesc:a30113b850dfd3de60f8778bc7a66f700"><td class="mdescLeft">&#160;</td><td class="mdescRight">Indicates the type of GEMM operand.  <a href="#a30113b850dfd3de60f8778bc7a66f700">More...</a><br /></td></tr>
+<tr class="separator:a30113b850dfd3de60f8778bc7a66f700"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac29cd1ba94e802762d665c300e22e7db"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac29cd1ba94e802762d665c300e22e7db">kLayout</a> = LoadIterator::kLayout</td></tr>
+<tr class="memdesc:ac29cd1ba94e802762d665c300e22e7db"><td class="mdescLeft">&#160;</td><td class="mdescRight">Make sure the transformed fragment is the same as the store fragment.  <a href="#ac29cd1ba94e802762d665c300e22e7db">More...</a><br /></td></tr>
+<tr class="separator:ac29cd1ba94e802762d665c300e22e7db"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a507f825824e624d80a34ea9395934160"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a507f825824e624d80a34ea9395934160">&#9670;&nbsp;</a></span>Base</h2>
+<a id="a7d9b4339129c1ab4f21f1df1144faddf"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7d9b4339129c1ab4f21f1df1144faddf">&#9670;&nbsp;</a></span>FetchedFragment</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename LoadIterator_ , typename StoreIterator_ , typename Transformer_  = Copy&lt;typename LoadIterator_::Fragment&gt;&gt; </div>
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase.html">GlobalLoadStreamBase</a>&lt;LoadIterator_, StoreIterator_, Transformer_&gt; <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a507f825824e624d80a34ea9395934160">Base</a></td>
+          <td class="memname">typedef LoadIterator::Fragment <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">FetchedFragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab7e315253b3301c191581bce05644106"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab7e315253b3301c191581bce05644106">&#9670;&nbsp;</a></span>Fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ab7e315253b3301c191581bce05644106">Fragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<p>The output fragment. </p>
+
+</div>
+</div>
+<a id="a7c46d6eb83b43e099d53784bb2a09f02"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7c46d6eb83b43e099d53784bb2a09f02">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef LoadIterator::Index <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a905c219287a7342b2ddb58b84e413d64"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a905c219287a7342b2ddb58b84e413d64">&#9670;&nbsp;</a></span>LoadIterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef LoadIterator_ <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">LoadIterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac4452df991f57f9bb0b86dfd380179b2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac4452df991f57f9bb0b86dfd380179b2">&#9670;&nbsp;</a></span>Pointer</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef LoadIterator::Pointer <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">Pointer</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7073b32c2cc62ffcad70a9ca46995c4c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7073b32c2cc62ffcad70a9ca46995c4c">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef LoadIterator::Scalar <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7073b32c2cc62ffcad70a9ca46995c4c">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac16e31930c346068d7522dd8de9d93d2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac16e31930c346068d7522dd8de9d93d2">&#9670;&nbsp;</a></span>StoreIterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef StoreIterator_ <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">StoreIterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a011287c8289b7b026f9993da663abd77"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a011287c8289b7b026f9993da663abd77">&#9670;&nbsp;</a></span>ThreadblockTileRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">ThreadblockTileStorage::TensorRef</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">ThreadblockTileRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a17804b01904a9a4ee7a857905833f7a8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a17804b01904a9a4ee7a857905833f7a8">&#9670;&nbsp;</a></span>ThreadblockTileStorage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileAllocation.html">TileAllocation</a>&lt;typename StoreIterator::Scalar, typename StoreIterator::Tile&gt; <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a17804b01904a9a4ee7a857905833f7a8">ThreadblockTileStorage</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a260543a618fb187c2da40c9f630925ec"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a260543a618fb187c2da40c9f630925ec">&#9670;&nbsp;</a></span>Tile</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef LoadIterator::Tile <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a260543a618fb187c2da40c9f630925ec">Tile</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9eb2fb49698d0d018c04e7712e239ce9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9eb2fb49698d0d018c04e7712e239ce9">&#9670;&nbsp;</a></span>TransformedFragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Transformer::OutputFragment <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa79a27cbe2420882fbaca55e42803f02"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa79a27cbe2420882fbaca55e42803f02">&#9670;&nbsp;</a></span>Transformer</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Transformer_ <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">Transformer</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -189,40 +395,46 @@ template&lt;typename LoadIterator_ , typename StoreIterator_ , typename Transfor
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a4dd11a75375b6b9d7b8dcbd4d402d8d6"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4dd11a75375b6b9d7b8dcbd4d402d8d6">&#9670;&nbsp;</a></span>GlobalLoadStream()</h2>
+<a id="aec86bdf5d7d4ad1f7b6ebebcf2da8395"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aec86bdf5d7d4ad1f7b6ebebcf2da8395">&#9670;&nbsp;</a></span>GlobalLoadStream()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename LoadIterator_ , typename StoreIterator_ , typename Transformer_  = Copy&lt;typename LoadIterator_::Fragment&gt;&gt; </div>
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a> </td>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a> </td>
           <td>(</td>
-          <td class="paramtype">typename <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1Params.html">Base::Params</a> const &amp;&#160;</td>
-          <td class="paramname"><em>params</em>, </td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">typename <a class="el" href="unioncutlass_1_1gemm_1_1GlobalLoadStreamBase_1_1SharedStorage.html">Base::SharedStorage</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">SharedStorage</a> &amp;&#160;</td>
           <td class="paramname"><em>shared_storage</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a011287c8289b7b026f9993da663abd77">ThreadblockTileRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>threadblock_tile_ref</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const&#160;</td>
           <td class="paramname"><em>bounds</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
-          <td class="paramname"><em>block</em>&#160;</td>
+          <td class="paramname"><em>_threadblock_offset</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -237,6 +449,409 @@ template&lt;typename LoadIterator_ , typename StoreIterator_ , typename Transfor
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ab39c82ac1a8138c4b6d69dab9d48bdbc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab39c82ac1a8138c4b6d69dab9d48bdbc">&#9670;&nbsp;</a></span>commit()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::commit </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3784dbb3efe0865ffa946419111c824a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3784dbb3efe0865ffa946419111c824a">&#9670;&nbsp;</a></span>copy()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::copy </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac269a9280a55d3988ca60f571bdf7f29"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac269a9280a55d3988ca60f571bdf7f29">&#9670;&nbsp;</a></span>move_to_residue()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::move_to_residue </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a>&#160;</td>
+          <td class="paramname"><em>k</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a>&#160;</td>
+          <td class="paramname"><em>kTileK</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8e79a153de72eef10d90bfd02b5dd27e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8e79a153de72eef10d90bfd02b5dd27e">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&amp; <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa634e3f786d5bf5707b94e522a10a001"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa634e3f786d5bf5707b94e522a10a001">&#9670;&nbsp;</a></span>project_coordinate()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">static CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::project_coordinate </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>coord</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a>&#160;</td>
+          <td class="paramname"><em>d_offset</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a235adaea5d4f01232c79cb6109dc6d17"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a235adaea5d4f01232c79cb6109dc6d17">&#9670;&nbsp;</a></span>residue()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::residue </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a>&#160;</td>
+          <td class="paramname"><em>k</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">bool&#160;</td>
+          <td class="paramname"><em>skip_clear</em> = <code>false</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1e2eecdba1871fc11aa43a06edf6ed34"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1e2eecdba1871fc11aa43a06edf6ed34">&#9670;&nbsp;</a></span>rollback()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::rollback </td>
+          <td>(</td>
+          <td class="paramtype">void&#160;</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a1c117b87024937f1dc3da128795b6e03"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1c117b87024937f1dc3da128795b6e03">&#9670;&nbsp;</a></span>fetched_fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7d9b4339129c1ab4f21f1df1144faddf">FetchedFragment</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::fetched_fragment</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac29cd1ba94e802762d665c300e22e7db"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac29cd1ba94e802762d665c300e22e7db">&#9670;&nbsp;</a></span>kLayout</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::kLayout = LoadIterator::kLayout</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>The layout. </p>
+
+</div>
+</div>
+<a id="a30113b850dfd3de60f8778bc7a66f700"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a30113b850dfd3de60f8778bc7a66f700">&#9670;&nbsp;</a></span>kOperand</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> const <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::kOperand = Operand</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5ef4cc42c7cec73523550e5ea56df88c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5ef4cc42c7cec73523550e5ea56df88c">&#9670;&nbsp;</a></span>load_iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a905c219287a7342b2ddb58b84e413d64">LoadIterator</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::load_iterator</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a386f2f4d2e239075f0fe1489ed7788c1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a386f2f4d2e239075f0fe1489ed7788c1">&#9670;&nbsp;</a></span>multiplicand_bounds</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::multiplicand_bounds</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac8ff1a3e10b25c212cd3cf5ed997fc0e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac8ff1a3e10b25c212cd3cf5ed997fc0e">&#9670;&nbsp;</a></span>params</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::params</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a45a4bceb72fcb856e32eaa20eec11e9d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a45a4bceb72fcb856e32eaa20eec11e9d">&#9670;&nbsp;</a></span>store_iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac16e31930c346068d7522dd8de9d93d2">StoreIterator</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::store_iterator</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a563961c326d2e55f5b8682a30b64a24a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a563961c326d2e55f5b8682a30b64a24a">&#9670;&nbsp;</a></span>threadblock_offset</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::threadblock_offset</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a7d7042e60aaab0dd00772b239e1f1db1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7d7042e60aaab0dd00772b239e1f1db1">&#9670;&nbsp;</a></span>transformed_fragment</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a9eb2fb49698d0d018c04e7712e239ce9">TransformedFragment</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::transformed_fragment</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab68ba57fe69430c557379b3457faebc4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab68ba57fe69430c557379b3457faebc4">&#9670;&nbsp;</a></span>transformer</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#aa79a27cbe2420882fbaca55e42803f02">Transformer</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::transformer</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
@@ -245,7 +860,7 @@ template&lt;typename LoadIterator_ , typename StoreIterator_ , typename Transfor
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair-members.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair-members.html
new file mode 100644
index 000000000..9b6ec8bba
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair-members.html
@@ -0,0 +1,104 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6699714c357f2714df011f58c1c48861">commit</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5c0efc259bb3bd1675f5d395dab71e95">copy</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab97442e24a1d6d64727b6320ab901ad1">GlobalLoadStreamPair</a>(Params const &amp;params, SharedStorage &amp;shared_storage, ThreadblockTileRef const &amp;threadblock_tile_ref, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab94c0c95d6d4e019563ba8a142f9d410">move_to_residue</a>(Index k, Index kTileK)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a769813dcffe1767aab49ac30b838a5f4">operator+=</a>(Coord&lt; 3 &gt; const offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a">residue</a>(Index k, bool skip_clear=false)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6a9287a2cd87ca8a96cbf6b6d29199da">rollback</a>(bool kRollback)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">StreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">StreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">ThreadblockTileRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html
new file mode 100644
index 000000000..7e7384fab
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html
@@ -0,0 +1,519 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Collect the global load streams for multiplicands.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">SharedStorage</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a structure containing shared storage for each pair.  <a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ae2c4829f874ef9e83aaa52c412fa1227"><td class="memItemLeft" align="right" valign="top">typedef StreamA_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">StreamA</a></td></tr>
+<tr class="memdesc:ae2c4829f874ef9e83aaa52c412fa1227"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stream for A multiplicand.  <a href="#ae2c4829f874ef9e83aaa52c412fa1227">More...</a><br /></td></tr>
+<tr class="separator:ae2c4829f874ef9e83aaa52c412fa1227"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a08171f4eae2442c98f81acc88e8bd55c"><td class="memItemLeft" align="right" valign="top">typedef StreamB_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">StreamB</a></td></tr>
+<tr class="memdesc:a08171f4eae2442c98f81acc88e8bd55c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stream for B multiplicand.  <a href="#a08171f4eae2442c98f81acc88e8bd55c">More...</a><br /></td></tr>
+<tr class="separator:a08171f4eae2442c98f81acc88e8bd55c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3e22454d24cadb7d335f2a0152caae2a"><td class="memItemLeft" align="right" valign="top">typedef StreamA::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a></td></tr>
+<tr class="memdesc:a3e22454d24cadb7d335f2a0152caae2a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assumes the A stream defines the index type.  <a href="#a3e22454d24cadb7d335f2a0152caae2a">More...</a><br /></td></tr>
+<tr class="separator:a3e22454d24cadb7d335f2a0152caae2a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5eef540f82acea5d9cb12965707ba158"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipTileAllocation.html">ZipTileAllocation</a>&lt; typename StreamA::ThreadblockTileStorage, typename StreamB::ThreadblockTileStorage &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:a5eef540f82acea5d9cb12965707ba158"><td class="mdescLeft">&#160;</td><td class="mdescRight">Shared memory allocation for threadblock-scoped GEMM tile.  <a href="#a5eef540f82acea5d9cb12965707ba158">More...</a><br /></td></tr>
+<tr class="separator:a5eef540f82acea5d9cb12965707ba158"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a79b783f02eaa4cf8fc8f929448e121be"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">ThreadblockTileStorage::TensorRef</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">ThreadblockTileRef</a></td></tr>
+<tr class="memdesc:a79b783f02eaa4cf8fc8f929448e121be"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a> to threadblock tiles.  <a href="#a79b783f02eaa4cf8fc8f929448e121be">More...</a><br /></td></tr>
+<tr class="separator:a79b783f02eaa4cf8fc8f929448e121be"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:ab97442e24a1d6d64727b6320ab901ad1"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab97442e24a1d6d64727b6320ab901ad1">GlobalLoadStreamPair</a> (<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">Params</a> const &amp;params, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">SharedStorage</a> &amp;shared_storage, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">ThreadblockTileRef</a> const &amp;threadblock_tile_ref, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</td></tr>
+<tr class="memdesc:ab97442e24a1d6d64727b6320ab901ad1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ab97442e24a1d6d64727b6320ab901ad1">More...</a><br /></td></tr>
+<tr class="separator:ab97442e24a1d6d64727b6320ab901ad1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a769813dcffe1767aab49ac30b838a5f4"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a769813dcffe1767aab49ac30b838a5f4">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const offset)</td></tr>
+<tr class="separator:a769813dcffe1767aab49ac30b838a5f4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5c0efc259bb3bd1675f5d395dab71e95"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5c0efc259bb3bd1675f5d395dab71e95">copy</a> ()</td></tr>
+<tr class="memdesc:a5c0efc259bb3bd1675f5d395dab71e95"><td class="mdescLeft">&#160;</td><td class="mdescRight">Trigger the copies from shared memory to registers.  <a href="#a5c0efc259bb3bd1675f5d395dab71e95">More...</a><br /></td></tr>
+<tr class="separator:a5c0efc259bb3bd1675f5d395dab71e95"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6699714c357f2714df011f58c1c48861"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6699714c357f2714df011f58c1c48861">commit</a> ()</td></tr>
+<tr class="memdesc:a6699714c357f2714df011f58c1c48861"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commit the data.  <a href="#a6699714c357f2714df011f58c1c48861">More...</a><br /></td></tr>
+<tr class="separator:a6699714c357f2714df011f58c1c48861"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1b1ec121cbd17ee61d58ea843b900e9a"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a1b1ec121cbd17ee61d58ea843b900e9a">residue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a> k, bool skip_clear=false)</td></tr>
+<tr class="memdesc:a1b1ec121cbd17ee61d58ea843b900e9a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Execute the residue code.  <a href="#a1b1ec121cbd17ee61d58ea843b900e9a">More...</a><br /></td></tr>
+<tr class="separator:a1b1ec121cbd17ee61d58ea843b900e9a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab94c0c95d6d4e019563ba8a142f9d410"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ab94c0c95d6d4e019563ba8a142f9d410">move_to_residue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a> k, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a> kTileK)</td></tr>
+<tr class="memdesc:ab94c0c95d6d4e019563ba8a142f9d410"><td class="mdescLeft">&#160;</td><td class="mdescRight">Move to residue.  <a href="#ab94c0c95d6d4e019563ba8a142f9d410">More...</a><br /></td></tr>
+<tr class="separator:ab94c0c95d6d4e019563ba8a142f9d410"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6a9287a2cd87ca8a96cbf6b6d29199da"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a6a9287a2cd87ca8a96cbf6b6d29199da">rollback</a> (bool kRollback)</td></tr>
+<tr class="memdesc:a6a9287a2cd87ca8a96cbf6b6d29199da"><td class="mdescLeft">&#160;</td><td class="mdescRight">Rollback to beginning of first tile.  <a href="#a6a9287a2cd87ca8a96cbf6b6d29199da">More...</a><br /></td></tr>
+<tr class="separator:a6a9287a2cd87ca8a96cbf6b6d29199da"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a93cde16f4aef554603fcf27fa23d5127"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">StreamA</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a93cde16f4aef554603fcf27fa23d5127">stream_a</a></td></tr>
+<tr class="memdesc:a93cde16f4aef554603fcf27fa23d5127"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stream for A multiplicand.  <a href="#a93cde16f4aef554603fcf27fa23d5127">More...</a><br /></td></tr>
+<tr class="separator:a93cde16f4aef554603fcf27fa23d5127"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aeaeabd4f8af2d864f28c76c6a301d9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">StreamB</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a9aeaeabd4f8af2d864f28c76c6a301d9">stream_b</a></td></tr>
+<tr class="memdesc:a9aeaeabd4f8af2d864f28c76c6a301d9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stream for B multiplicand.  <a href="#a9aeaeabd4f8af2d864f28c76c6a301d9">More...</a><br /></td></tr>
+<tr class="separator:a9aeaeabd4f8af2d864f28c76c6a301d9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a3e22454d24cadb7d335f2a0152caae2a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3e22454d24cadb7d335f2a0152caae2a">&#9670;&nbsp;</a></span>Index</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef StreamA::Index <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae2c4829f874ef9e83aaa52c412fa1227"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae2c4829f874ef9e83aaa52c412fa1227">&#9670;&nbsp;</a></span>StreamA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef StreamA_ <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">StreamA</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a08171f4eae2442c98f81acc88e8bd55c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a08171f4eae2442c98f81acc88e8bd55c">&#9670;&nbsp;</a></span>StreamB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef StreamB_ <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">StreamB</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a79b783f02eaa4cf8fc8f929448e121be"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a79b783f02eaa4cf8fc8f929448e121be">&#9670;&nbsp;</a></span>ThreadblockTileRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">ThreadblockTileStorage::TensorRef</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">ThreadblockTileRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5eef540f82acea5d9cb12965707ba158"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5eef540f82acea5d9cb12965707ba158">&#9670;&nbsp;</a></span>ThreadblockTileStorage</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipTileAllocation.html">ZipTileAllocation</a>&lt;typename StreamA::ThreadblockTileStorage, typename StreamB::ThreadblockTileStorage&gt; <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">ThreadblockTileStorage</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ab97442e24a1d6d64727b6320ab901ad1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab97442e24a1d6d64727b6320ab901ad1">&#9670;&nbsp;</a></span>GlobalLoadStreamPair()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">SharedStorage</a> &amp;&#160;</td>
+          <td class="paramname"><em>shared_storage</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a79b783f02eaa4cf8fc8f929448e121be">ThreadblockTileRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>threadblock_tile_ref</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>bounds</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>block_offset</em> = <code><a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,&#160;0,&#160;0)</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a6699714c357f2714df011f58c1c48861"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6699714c357f2714df011f58c1c48861">&#9670;&nbsp;</a></span>commit()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::commit </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5c0efc259bb3bd1675f5d395dab71e95"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5c0efc259bb3bd1675f5d395dab71e95">&#9670;&nbsp;</a></span>copy()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::copy </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab94c0c95d6d4e019563ba8a142f9d410"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab94c0c95d6d4e019563ba8a142f9d410">&#9670;&nbsp;</a></span>move_to_residue()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::move_to_residue </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a>&#160;</td>
+          <td class="paramname"><em>k</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a>&#160;</td>
+          <td class="paramname"><em>kTileK</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a769813dcffe1767aab49ac30b838a5f4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a769813dcffe1767aab49ac30b838a5f4">&#9670;&nbsp;</a></span>operator+=()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&amp; <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::operator+= </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const&#160;</td>
+          <td class="paramname"><em>offset</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1b1ec121cbd17ee61d58ea843b900e9a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1b1ec121cbd17ee61d58ea843b900e9a">&#9670;&nbsp;</a></span>residue()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::residue </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a3e22454d24cadb7d335f2a0152caae2a">Index</a>&#160;</td>
+          <td class="paramname"><em>k</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">bool&#160;</td>
+          <td class="paramname"><em>skip_clear</em> = <code>false</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6a9287a2cd87ca8a96cbf6b6d29199da"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6a9287a2cd87ca8a96cbf6b6d29199da">&#9670;&nbsp;</a></span>rollback()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::rollback </td>
+          <td>(</td>
+          <td class="paramtype">bool&#160;</td>
+          <td class="paramname"><em>kRollback</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a93cde16f4aef554603fcf27fa23d5127"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a93cde16f4aef554603fcf27fa23d5127">&#9670;&nbsp;</a></span>stream_a</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#ae2c4829f874ef9e83aaa52c412fa1227">StreamA</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::stream_a</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9aeaeabd4f8af2d864f28c76c6a301d9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9aeaeabd4f8af2d864f28c76c6a301d9">&#9670;&nbsp;</a></span>stream_b</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a08171f4eae2442c98f81acc88e8bd55c">StreamB</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::stream_b</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params-members.html
new file mode 100644
index 000000000..9ada3e664
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params-members.html
@@ -0,0 +1,94 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#afb39229d0ad334834cd2ba0c1fcc9412">Params</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#ab26c1aaa2b7709c32bab39801d6c7772">Params</a>(typename StreamA::Params const &amp;_params_A, typename StreamB::Params const &amp;_params_B)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">stream_a</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">stream_b</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html
new file mode 100644
index 000000000..2fbf71e12
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html
@@ -0,0 +1,217 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Parameters object.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:afb39229d0ad334834cd2ba0c1fcc9412"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#afb39229d0ad334834cd2ba0c1fcc9412">Params</a> ()</td></tr>
+<tr class="memdesc:afb39229d0ad334834cd2ba0c1fcc9412"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="#afb39229d0ad334834cd2ba0c1fcc9412">More...</a><br /></td></tr>
+<tr class="separator:afb39229d0ad334834cd2ba0c1fcc9412"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab26c1aaa2b7709c32bab39801d6c7772"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#ab26c1aaa2b7709c32bab39801d6c7772">Params</a> (typename StreamA::Params const &amp;_params_A, typename StreamB::Params const &amp;_params_B)</td></tr>
+<tr class="memdesc:ab26c1aaa2b7709c32bab39801d6c7772"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a global load stream pair <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html" title="Parameters object. ">Params</a> object.  <a href="#ab26c1aaa2b7709c32bab39801d6c7772">More...</a><br /></td></tr>
+<tr class="separator:ab26c1aaa2b7709c32bab39801d6c7772"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a235c77b257b93dace812d2f7b9340705"><td class="memItemLeft" align="right" valign="top">StreamA::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a235c77b257b93dace812d2f7b9340705">stream_a</a></td></tr>
+<tr class="memdesc:a235c77b257b93dace812d2f7b9340705"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object for StreamA.  <a href="#a235c77b257b93dace812d2f7b9340705">More...</a><br /></td></tr>
+<tr class="separator:a235c77b257b93dace812d2f7b9340705"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a12b5e3e21137480047b8b0f55cbf7258"><td class="memItemLeft" align="right" valign="top">StreamB::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1Params.html#a12b5e3e21137480047b8b0f55cbf7258">stream_b</a></td></tr>
+<tr class="memdesc:a12b5e3e21137480047b8b0f55cbf7258"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object for StreamB.  <a href="#a12b5e3e21137480047b8b0f55cbf7258">More...</a><br /></td></tr>
+<tr class="separator:a12b5e3e21137480047b8b0f55cbf7258"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="afb39229d0ad334834cd2ba0c1fcc9412"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afb39229d0ad334834cd2ba0c1fcc9412">&#9670;&nbsp;</a></span>Params() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ab26c1aaa2b7709c32bab39801d6c7772"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab26c1aaa2b7709c32bab39801d6c7772">&#9670;&nbsp;</a></span>Params() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype">typename StreamA::Params const &amp;&#160;</td>
+          <td class="paramname"><em>_params_A</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">typename StreamB::Params const &amp;&#160;</td>
+          <td class="paramname"><em>_params_B</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a235c77b257b93dace812d2f7b9340705"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a235c77b257b93dace812d2f7b9340705">&#9670;&nbsp;</a></span>stream_a</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">StreamA::Params <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params::stream_a</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a12b5e3e21137480047b8b0f55cbf7258"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a12b5e3e21137480047b8b0f55cbf7258">&#9670;&nbsp;</a></span>stream_b</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">StreamB::Params <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::Params::stream_b</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage-members.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage-members.html
new file mode 100644
index 000000000..fb2701151
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage-members.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">SharedStorage</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a87d507b703a0eb654265f4529ed18f66">stream_a</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a6d9444ed13ed544febe196e3e835ea16">stream_b</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html
new file mode 100644
index 000000000..1677548a4
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html
@@ -0,0 +1,139 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html">SharedStorage</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GlobalLoadStreamPair&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Defines a structure containing shared storage for each pair.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a87d507b703a0eb654265f4529ed18f66"><td class="memItemLeft" align="right" valign="top">StreamA::SharedStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a87d507b703a0eb654265f4529ed18f66">stream_a</a></td></tr>
+<tr class="separator:a87d507b703a0eb654265f4529ed18f66"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6d9444ed13ed544febe196e3e835ea16"><td class="memItemLeft" align="right" valign="top">StreamB::SharedStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair_1_1SharedStorage.html#a6d9444ed13ed544febe196e3e835ea16">stream_b</a></td></tr>
+<tr class="separator:a6d9444ed13ed544febe196e3e835ea16"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a87d507b703a0eb654265f4529ed18f66"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a87d507b703a0eb654265f4529ed18f66">&#9670;&nbsp;</a></span>stream_a</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">StreamA::SharedStorage <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage::stream_a</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6d9444ed13ed544febe196e3e835ea16"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6d9444ed13ed544febe196e3e835ea16">&#9670;&nbsp;</a></span>stream_b</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ , bool kResidueInProlog_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">StreamB::SharedStorage <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">cutlass::gemm::GlobalLoadStreamPair</a>&lt; StreamA_, StreamB_, kResidueInProlog_ &gt;::SharedStorage::stream_b</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params-members.html
new file mode 100644
index 000000000..52a1f28b2
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params-members.html
@@ -0,0 +1,94 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a054aee5b4bf288cc1f5945f2521ef835">initialize</a>(Pointer pointer, long long batch_stride, Index ldm, Index _offset_to_residue)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065">load_iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">offset_to_residue</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f">store_iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html
new file mode 100644
index 000000000..58971af3e
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html
@@ -0,0 +1,215 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>The params.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="gemm__global__stream_8h_source.html">gemm_global_stream.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a054aee5b4bf288cc1f5945f2521ef835"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a054aee5b4bf288cc1f5945f2521ef835">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">Pointer</a> pointer, long long batch_stride, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> ldm, <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> _offset_to_residue)</td></tr>
+<tr class="memdesc:a054aee5b4bf288cc1f5945f2521ef835"><td class="mdescLeft">&#160;</td><td class="mdescRight">Setup the params.  <a href="#a054aee5b4bf288cc1f5945f2521ef835">More...</a><br /></td></tr>
+<tr class="separator:a054aee5b4bf288cc1f5945f2521ef835"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a46f2546f9b88f4fc87f1396d0f08b065"><td class="memItemLeft" align="right" valign="top">LoadIterator::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a46f2546f9b88f4fc87f1396d0f08b065">load_iterator</a></td></tr>
+<tr class="separator:a46f2546f9b88f4fc87f1396d0f08b065"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a289ac736c0c098ae6da6a21c9abfe63f"><td class="memItemLeft" align="right" valign="top">StoreIterator::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a289ac736c0c098ae6da6a21c9abfe63f">store_iterator</a></td></tr>
+<tr class="separator:a289ac736c0c098ae6da6a21c9abfe63f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a73bb518f85aee62310b3c886a1fba3f1"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1Params.html#a73bb518f85aee62310b3c886a1fba3f1">offset_to_residue</a></td></tr>
+<tr class="separator:a73bb518f85aee62310b3c886a1fba3f1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a054aee5b4bf288cc1f5945f2521ef835"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a054aee5b4bf288cc1f5945f2521ef835">&#9670;&nbsp;</a></span>initialize()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#ac4452df991f57f9bb0b86dfd380179b2">Pointer</a>&#160;</td>
+          <td class="paramname"><em>pointer</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>batch_stride</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a>&#160;</td>
+          <td class="paramname"><em>ldm</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a>&#160;</td>
+          <td class="paramname"><em>_offset_to_residue</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a46f2546f9b88f4fc87f1396d0f08b065"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a46f2546f9b88f4fc87f1396d0f08b065">&#9670;&nbsp;</a></span>load_iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">LoadIterator::Params <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params::load_iterator</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a73bb518f85aee62310b3c886a1fba3f1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a73bb518f85aee62310b3c886a1fba3f1">&#9670;&nbsp;</a></span>offset_to_residue</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html#a7c46d6eb83b43e099d53784bb2a09f02">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params::offset_to_residue</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a289ac736c0c098ae6da6a21c9abfe63f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a289ac736c0c098ae6da6a21c9abfe63f">&#9670;&nbsp;</a></span>store_iterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind Operand, typename LoadIterator_ , typename StoreIterator_ , typename Transformer_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">StoreIterator::Params <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">cutlass::gemm::GlobalLoadStream</a>&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::Params::store_iterator</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm__global__stream_8h_source.html">gemm_global_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html
new file mode 100644
index 000000000..dfba50420
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html
@@ -0,0 +1,97 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream_1_1SharedStorage.html">SharedStorage</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="gemm__global__stream_8h_source.html">gemm_global_stream.h</a>&gt;</code></p>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;GemmOperand::Kind Operand, typename LoadIterator_, typename StoreIterator_, typename Transformer_&gt;<br />
+struct cutlass::gemm::GlobalLoadStream&lt; Operand, LoadIterator_, StoreIterator_, Transformer_ &gt;::SharedStorage</h3>
+
+<p>Contains private storage in shared memory needed by the objects within this class. Note, this is <em>NOT</em> the shared memory allocation for the GEMM threadblock tile. That necessarily exists outside this class, as it is also needed by the warp-level shared=&gt;RF stream. </p>
+</div><hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm__global__stream_8h_source.html">gemm_global_stream.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmConfig-members.html b/docs/structcutlass_1_1gemm_1_1HgemmConfig-members.html
index 07ccbe6df..92df70717 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmConfig-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmConfig-members.html
@@ -73,41 +73,44 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::HgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::HgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">cutlass::gemm::HgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">cutlass::gemm::HgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmConfig.html b/docs/structcutlass_1_1gemm_1_1HgemmConfig.html
index b5879328f..d3f695cc0 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmConfig.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmConfig.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::HgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::HgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -75,93 +75,102 @@ $(function() {
   <div class="summary">
 <a href="structcutlass_1_1gemm_1_1HgemmConfig-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::HgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::HgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="hgemm__traits_8h_source.html">hgemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::HgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::HgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1HgemmConfig.png" usemap="#cutlass::gemm::HgemmConfig_3C_20OutputTile_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::HgemmConfig_3C_20OutputTile_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" name="cutlass::gemm::HgemmConfig_3C_20OutputTile_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;" shape="rect" coords="0,0,1410,24"/>
+  <img src="structcutlass_1_1gemm_1_1HgemmConfig.png" usemap="#cutlass::gemm::HgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::HgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" name="cutlass::gemm::HgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;" shape="rect" coords="0,0,1486,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td></tr>
-<tr class="memitem:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a></td></tr>
-<tr class="memdesc:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">More...</a><br /></td></tr>
-<tr class="separator:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a></td></tr>
-<tr class="memdesc:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">More...</a><br /></td></tr>
-<tr class="separator:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a></td></tr>
-<tr class="memdesc:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">More...</a><br /></td></tr>
-<tr class="separator:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a></td></tr>
-<tr class="memdesc:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">More...</a><br /></td></tr>
-<tr class="separator:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a></td></tr>
-<tr class="memdesc:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">More...</a><br /></td></tr>
-<tr class="separator:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, half, half, half &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a></td></tr>
-<tr class="memdesc:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">More...</a><br /></td></tr>
-<tr class="separator:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a></td></tr>
-<tr class="memdesc:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">More...</a><br /></td></tr>
-<tr class="separator:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a></td></tr>
-<tr class="memdesc:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">More...</a><br /></td></tr>
-<tr class="separator:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a></td></tr>
-<tr class="memdesc:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">More...</a><br /></td></tr>
-<tr class="separator:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a></td></tr>
-<tr class="memdesc:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">More...</a><br /></td></tr>
-<tr class="separator:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2 &gt;</a></td></tr>
-<tr class="memitem:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td></tr>
-<tr class="memdesc:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">More...</a><br /></td></tr>
-<tr class="separator:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a></td></tr>
-<tr class="memdesc:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">More...</a><br /></td></tr>
-<tr class="separator:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a></td></tr>
-<tr class="memdesc:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">More...</a><br /></td></tr>
-<tr class="separator:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:accc95abc55880abdab92253367b4b186 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a></td></tr>
-<tr class="separator:accc95abc55880abdab92253367b4b186 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa1b75484138923a52b32888fef608d9b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a></td></tr>
-<tr class="separator:aa1b75484138923a52b32888fef608d9b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a></td></tr>
-<tr class="memdesc:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">More...</a><br /></td></tr>
-<tr class="separator:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac0c8c027e3ede14b62d7c7d519551f21 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a></td></tr>
-<tr class="separator:ac0c8c027e3ede14b62d7c7d519551f21 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a86470d3a44e2b50ee31ec3c9f79927ef inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a></td></tr>
-<tr class="separator:a86470d3a44e2b50ee31ec3c9f79927ef inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a></td></tr>
-<tr class="memdesc:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">More...</a><br /></td></tr>
-<tr class="separator:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a></td></tr>
-<tr class="memdesc:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">More...</a><br /></td></tr>
-<tr class="separator:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3087cdd38e2c65ad0dffdd0587d2cce0 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a></td></tr>
-<tr class="separator:a3087cdd38e2c65ad0dffdd0587d2cce0 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adaf2ee5b8e6f7bdb9939cd45a186ca56 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a></td></tr>
-<tr class="separator:adaf2ee5b8e6f7bdb9939cd45a186ca56 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a></td></tr>
-<tr class="memdesc:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">More...</a><br /></td></tr>
-<tr class="separator:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9dd092bca2f1f2c039f367b23bafa9c1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a></td></tr>
-<tr class="separator:a9dd092bca2f1f2c039f367b23bafa9c1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a></td></tr>
-<tr class="memdesc:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">More...</a><br /></td></tr>
-<tr class="separator:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td></tr>
+<tr class="memitem:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a></td></tr>
+<tr class="memdesc:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">More...</a><br /></td></tr>
+<tr class="separator:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a></td></tr>
+<tr class="memdesc:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">More...</a><br /></td></tr>
+<tr class="separator:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a></td></tr>
+<tr class="memdesc:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">More...</a><br /></td></tr>
+<tr class="separator:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a></td></tr>
+<tr class="memdesc:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">More...</a><br /></td></tr>
+<tr class="separator:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a></td></tr>
+<tr class="memdesc:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">More...</a><br /></td></tr>
+<tr class="separator:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, half, half, half &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a></td></tr>
+<tr class="memdesc:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">More...</a><br /></td></tr>
+<tr class="separator:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a></td></tr>
+<tr class="memdesc:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">More...</a><br /></td></tr>
+<tr class="separator:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of warp-level GEMM.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">More...</a><br /></td></tr>
+<tr class="separator:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a></td></tr>
+<tr class="memdesc:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">More...</a><br /></td></tr>
+<tr class="separator:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a></td></tr>
+<tr class="memdesc:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">More...</a><br /></td></tr>
+<tr class="separator:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; half, half, half, half, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, half, half, half &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 8, kScalarsPerLdgB_, kScalarsPerLdgB_, 8, 2, 8, 2, 2, false, true, false &gt;</a></td></tr>
+<tr class="memitem:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td></tr>
+<tr class="memdesc:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">More...</a><br /></td></tr>
+<tr class="separator:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td></tr>
+<tr class="memdesc:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">More...</a><br /></td></tr>
+<tr class="separator:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td></tr>
+<tr class="memdesc:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">More...</a><br /></td></tr>
+<tr class="separator:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td></tr>
+<tr class="separator:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td></tr>
+<tr class="separator:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td></tr>
+<tr class="memdesc:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">More...</a><br /></td></tr>
+<tr class="separator:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td></tr>
+<tr class="separator:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td></tr>
+<tr class="separator:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td></tr>
+<tr class="memdesc:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">More...</a><br /></td></tr>
+<tr class="separator:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td></tr>
+<tr class="memdesc:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">More...</a><br /></td></tr>
+<tr class="separator:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td></tr>
+<tr class="separator:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td></tr>
+<tr class="separator:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td></tr>
+<tr class="memdesc:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">More...</a><br /></td></tr>
+<tr class="separator:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td></tr>
+<tr class="separator:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td></tr>
+<tr class="memdesc:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">More...</a><br /></td></tr>
+<tr class="separator:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td></tr>
+<tr class="memdesc:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, mainloop is instantiated twice. The first instantiation contains no predicate.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">More...</a><br /></td></tr>
+<tr class="separator:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td></tr>
+<tr class="memdesc:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, residue is computed in the prologue.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">More...</a><br /></td></tr>
+<tr class="separator:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td></tr>
+<tr class="memdesc:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, kernel is launched with launch bounds specified.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">More...</a><br /></td></tr>
+<tr class="separator:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <hr/>The documentation for this struct was generated from the following file:<ul>
 <li><a class="el" href="hgemm__traits_8h_source.html">hgemm_traits.h</a></li>
@@ -169,7 +178,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmConfig.png b/docs/structcutlass_1_1gemm_1_1HgemmConfig.png
index cf90457b12c8073e9e18c92e0ed62ac6a8973694..6854e679f050337811bd8a9dd73380608afef452 100644
GIT binary patch
literal 2958
zcmd^Ac{tnI8jdl8Qp>2?hN5bzmbPdS6>VyZt*UAl)ls2Hill82T4SlDm~@0zBXesT
zG_jN_LQJ)msH781ijrw9kq|+KwALGa+B@^_z5m|xJm>u0?>z7K`@Zvi&v{R#hr6S!
zw7N6^0FZ?^*?9s0-_b<aLrPq<s;nz#h(4+wu3q*#J3At{v^rPu0+la9pJ!)hr*Hi&
zZ;>g5^mM-n5RrDrFxATx0Fcpy*q!ydCC0;##*PCOzWYJ)l5ofNlhKFtg6wEdhuFXc
zJ4Kw@-rKWBPIQM~$@$}@YH8*PhkZZh=y$6+rWisTusMg+Ag0*RLlGKJ;y!~uC+yE<
z@9SuKyWo(nh?3p~Ec^_1x$1KBfqy$$0)g^;M{I}vtu2Tr;YJ=4!HfA+o7_>}#g8N^
z5*Z0sPjB%?OgOp_O|06p+`+t2p*K)adBqCWRr0o>rK@}@2JKo(ewBzF`am=DSdCJy
zu?nrGludK&CvDcxryre943;M55;A@9M1HcZ;mUHm<%w7OfP_tLh|QSI`nhVE<~YOT
zh9>7me4KFzglc6%wO$|6wNg*mWAGTx-9)~fg1clK>6zjdb>Dk}n=GF17KI^Sj}Hj4
z?x_-tY<cvO$Ab?4l{*1Dh>P4_6e75ruaydDmDc9VY{AAL@*X3ZIp5Sov4v@=*S-j&
zIOH``akJbaH%-Rkt12?_Wcz!UJ6TyXlU(v<At<g9G69)J|B*>!XEK9EKj`Z)7kRCC
zxrF$BZhVvdBgzadx2k!IOydK^o4Cz4!$I(kkO}JW0Z6|;E|Iwo-#XLl>1I)0r^{sP
zdfW0jttZ{|sYCaRou3}A3;@BHa8S`>1{!{sm~-};Eo5UuJya_z=q<-*&F}-<+hrA}
zhieaAyk?A?bUihQ_OY6;i5Y#^x*}MdRWv?Ac<JP;p52O<PiVaQD!Za32K!44-1R}U
z51Zp>a(>kY_G?zd@YA@P44^?zX}DjK+YMqs7yBHJ_WW2{M<5~h?NX?4L38{xrP#)z
zv38ns7@KN}FYLlH%*Bx?LKu3<f6mnx4%vb)I0-vOXnyMtX?kfXS6Vx0^Miprv|qCz
zB=1?&gJ#=6tWj>y&}aoKKH*Z;8p+JVu8-t7MkGTb2lQndYgl8hkWoQq{!A0aIIX<2
zY~j<Hmm{3EH<OVACLS!N4W56#o)j9)c8O;AgpNgCllNRMySTV&T`J%{L}ad#rfi5R
zs7Wgm*;>*i6PvL&H>VO%=|7;_6xLpkgekjc2$eCG6$Q~k3Dn6rzFK&{jdA}oQuMjl
zeFd!%?Wyvw*Dm)a;gc=Xcxz71CGvJrn$Ki-#BIM9_u>nI2y-p>6PVFq^a`WjY`}z)
zLaiJ^*Rs^`7A)OYZQP$nvVnzV%1u6Pdo(zSTr9ICs97e29_5Fq0cL|vR?u!(SL3Hx
zs<+0~3`?VwBUt#y-F?}0fnb>Ap{sO9uriQhk;YcRTpPe**{%sS$y2c?l*wUCZl$k0
ztU}P@AR9BZ7R1```CEy3-b9k43WgTvCcFrwM?F^x4}dtb-P%sJ`x^rhz0X277;n(n
zfUSdG`OaDXT5vyD&kYq!tf=2YTv<r$z$8jS{lXeF8g<X5T}jc1cA@gFmXu%hJWZ)2
z_^&A-BKUqI{cK!h*7S7}FnP<8xJ10mVF?j68n}57>tlJ4G#;kO;tAn?3Al|Wy9naK
zgx4Y!LkxHvA-WFx*(Mh|bA6hr2IchJsg?c}o$LZ=Pt!Y1tpn*c^;hF`sPX0FzQ*e>
zijbiz2^~M&(-GqD;0-@<Cc26CZhW_-f!S)Wwh`zj7`Q?g;U3Zs%`<M@SMMJedxPHS
z!|G2hj*D_}8j1;%hH##80<okw58bdyxQiFotS5%!s{ppX#I*o07UXE1$M@<Oo|<o4
zo^U--eKT@BSYhRp5=d*glH%gocb0HW>3t-S4)wtzWniU=-Lq`Z;_akH-@ZV~t6B6x
z0~JisCgrN&LnA9DR@9)re0urP=3_buy|*~|0z0`{8)6}FRf4Qb6R5^k+1S61e00{Q
zpb>hU2+;Mh<lnzb0Hv{__e0i!!9y)yg!Z$((l6s(zNl-?A=wO+$$ymCTw~;KCgZv<
zTcpijl(=h|fzCPcQ1wUie~5Ya9l&vb#Gi;6TY&gwz~0+p#{s$_cyZOwR%iI8kbsf<
zvj5XR_Q_Fj!dH^7FB>4y2@ts)*Tz}x{y}8z%|Lzi>-yVIl+RbH#>oE#bvq0!^?Ry9
z${w9>_kpGKQx#mLbaK8G`&=$jT{|uRyNV=>*J3uez1__oJv1P117e|+RR<OEYIyC>
zgRDhQEC`@EN#yOF&msL1y*U1;)r$U$asKH(;gc$SFGeRoQ*3YNT~WYfaryZ~Mg4pm
zYu$b^UVVRU!r{hq;^R;K*I%DzqLM<Ei6p!ca`6L3=e&}lsF!z8a>osIj*i7gPtA)S
zwT)(G@;JqXUADDlwc$}c^=pD@C}+8HW{ZBRb*=9dz0IZmc3{206JR<E5-76T3ujDf
zXey|>bX0YyUi;kOn<hP(N4R9F(WNj(g9P*%*<{bJ(;fLER-LR=Q6zoA@Wggx;+{Gi
z$VPzwXoj6SyOj;`de5#p1)BvT<fzCJ%1I+U;#jVO&X}5Vq*L7Mk=A{f6Nr_`BUvS3
z1y8DXAD^t@0KVwRKt35PI(2O~P*U|iFDuNH)|fcG9rY)ne{<V<5!%<V8q7_vpw*mJ
zLCU4305cK~i!or3I$I5GSc1)d&4v|&Qg*zecBxTNFuOS|5co~skN*<S$=prT4S&oB
z9SbE5@+2e;OORCV3(4OI=kPG-#}ry|Lj*T52)V2ete;+(xi5!sq#tR`yrJ3hz?_NT
zyiKQB&$l0&_Kwj;A4T5&zMdx5T~;pOaVvIaRa)jKH3F#63|I>_P(jJPc|3w<Uh0XQ
zo0-f6O%x(Sx4=a2V))CLjx%fTG#awPAACutufPN~IkfmL`^;1os)M!FoAy-cltq~$
zbY&uJVUCQpEC$y8bc}z0Q61>=_FmG`!Qae`@cu>3zT1*u<?oH-ZeI|kA))7blfTMG
z+8W$3X5rde0zVNo!8@aN&zV~j4V%GgC^gwAx~cX+v+tP@qO0*Z+nF7p!*D(tyb)Ps
zHik{AY}6ml>Hyl#H|D(abgCgBMl>vHVxa46Fe%`h%YbfC8$LQde?H8zRx@x2mR=gN
zitcH#ijQ2EPyO~d;HN8i@lEl~(OH=QOucnJ$iR`XN1=kk&W%u>%bc^XFOhGt6VbYM
zX)=N2I#wHt?XW{F6()LWc~tRamxTYD)R2(}zTV9u1@Lj5)XQM05bbTrNL9l}&jx#$
P0MUThyW5e#ms9=?lBsZf

literal 2911
zcmd5;dpy&7AE(Zg<x<CbBH<LVDVK69*9vJ#G(x#`L`1HIF*Z%n=@d_MKW^!SLUtsZ
z%j|MEqM9+8GGk&bVUua*vU!G{*XjB1dH#ETuh;MQ`&@pX_vichzP_LL=l6@-Stmu{
zZlH{ej3V@u158E+fR@T`TQ^Ie*~wp?N?)pOXFMENS68Lt?AK3~f5!b&Dy`pSGTFNx
z?kQEb-hiETmyv$7b`8ApI4mOr<Ut*dd%$I9STmR+>xPqKzZO+<SCkW7r|Taa6KTuC
z=Xj;`xl7Ky&+=Y~!b`c$1>8i#kBOzfCYEvoH&ol**D)X{Ob7Zv$5AT89;{&NKroL_
zVfI1q>Kwfdi~ieNd;)SrYW(IsTMjB-4_S|``r~)@Bpox6RX~(rg37+!!H#w=d?iVi
z7$ZnuzHXmOQh-{(swSgOEnCOR)YV(gA2m(PqAwDM<lvWW63{oYPtjlGb8~exMrlbl
zt;acDG-u2Xr^qa7*H|aAv3Q1D5+{l7iYv)-{@HZaWQPS}%9T|1ko{U)(>BC9a5aw#
zh5z9rxgt#!)8iAP3#ADj`92D8G7T4k$2wCGKxF011kegW2KqdB{&~uEyyDruN__;)
zG8%F1B(c8U$vz=|sAnG%9Ar2B1SAv=gzT&1uIP<g0Ev;j1Ee}^)Ka)5m76kZB+j4W
z1<v}bWvbt6`ov|lU09t;jTeQr?qM)B+k9?%?wq>)T%g-_e=#$DAVOskLBEeCX(b2b
z?vGTNvrYEJ$DgvGGJns{Xq+_CTJT^R3<(KGusVJ|{uig_vTj=)afkwop3Kw_2<A=?
zzg^Ca9eGVR`b1Q=+aCKYKMe-|sY9S0i9}Yu3mNqREL0^Gj^^C+=|{aUWBpZat=##{
zsrG}RZdmTy{fsu%%+G!hc)_(Qw%@MdfRNE}+b1j3yCv#_x%_9%b?oZMqMya2c$<@P
zp|FTb=`t*_I+LG9&Dv9XNfNCCO>yIvBZrumRf3;(^wcMn7gLepVR(F%?e<u)lBMD8
zl)a@IF|#8q7J{ZQd~X^w>{5a6>0M~O8+r0;M$Bo?2<}a$HWAr3eP^y|q{LBT1JEn<
ztkuM0*)!(qOO4s>=Dk-My{^CC7JH$e2RC27eENB%t3EV|;UpfDdpEr#4j%sWMY<7p
zW0&L026YFxoZ(tpi(WU~c1LW)t#(+G;u(6QvcsMkqQz2zzR;V3f6QEPvHCn@x4(vA
zJJ;9b1tJ_pIR_%R69pp{I|&V$o6oaq2uMH094is=y>D7eoV`CR+ACwZgcZ*(TO1-_
zg6u<>xUKn7HHU4DdD>=sT5UQ{M5dbw!tUaHdNj0b8~T3PyD+tq@9wSSiK$Ha=|gBk
zTOUacC6>5RY6NDcABEeMK?DolPJl9NG;#K^G;OhtHm-Weg<Xio+Amr12O}CmSvv{M
z7jqx7ln_A8(n+0&aDAM6f9@EA=L319+>oTG@xq32E-%~8aDE$S*sHzij@H&@*lazd
z*lsfaWAWpw*m>o6mnt@Y;-y|}@SEk=x`pP?sFPz&A$qe`G(<}oELyL?=Vo5vG#LJ5
zti0Mhn`hOs{{m3~G(3T;V<K-?1zpVo4SQ9Na<J3`(7||fa!Yy<zPm1)X@c9G^hT)a
za23}+OXPB{b<__9T1ASEbu~t2o*7$#YSpr@3=Z#H`8sYk&+!hhGa|8QJsg2~bA?@D
z{E%3}ipeis?uy$Rbxy8<U<>!F8&Ar2U~YP*j~m*~dhZK)%-rN6&#T}IyJzy5j=O4X
z^cG^XJ~Ju?u);9EB1_*#=H)FBjJ1Anu^~>i7^3onF%=QDy+&`@dE>a3X<%`uKd&`^
z{O6-6R@;T%FK_Hro(C-3yEl~)`gPk>VobPK_(VDh$va7b&MBp3?C%cvSOL!3qA{@S
zDJuzV)NBjQo+x9x{v+7*!@{o5t|mvXLQZC_%I>APjtO?G&Lc25aVgqrL9cr+VK>J_
z4r$OhH5y>xDX2yDkc}AQlLQG$4IZ~W^PLB@MHtv6fE_{6u|12*iYrAxNv=O;&zqy?
zFcS$Pk4UO66tn6m3DL{bAyKv{{i%Ee!L6Eo09~y_XMZEtbsimr0QA05FHEN!lJlK+
z0(6@49Wev{lbDSFG=cRlfi>+fYufcgG=cA%4Ry<A0BDx~MGNG1Ocnr&Hm$e>ewexm
zcqDCAa$t+S)Z|8%&q0?<O<=YHQNdR!T`E0H9ftrmoY0)q4W~5w1_bcm5Vv8*>!{K>
zpt=^bNjd@)q=3g{tK5JaFz(=QFw#o?Ut!3kZc`WcLoWRuXZlTd_M5u=wV~cH)m`5z
zFx&gTE8Xrs)@)G_+-y5m!95dz>J@xtj<9Of&D)7Qg2blemAb$;T`8)ivz`8%&ZUgL
zw_0yG1MC@cU3f7yX0Oxc^3*JMV0u|+H;{NwEfkbq8>KpmSpIqr$e$*K0FkBg*WRC>
zRgY6sWI=j+a<aB9o{)c-Du4jml`s8<H0a0;7|gGE9Tl*eM`N-pS7TXzwY2%{F{%N6
z2Pw%=>otp+MzrQ04l=vR`DEdKGn3iCclXnz>%FrLS!_}aYmc+R2eeXLo=~RqYWW(>
zX@7Yn3cz}Wa+PE3+4UTxV3!9oPA+8}o{1?|#aFKGE8smkO2sPjv)|n!U5$03v=><d
z7Ai;2AgshL=rqjm!Tz3vf$Ph0iA4(fHXhN-L+S=S+bBhc%^nDyV?4SZpc6*!xRDcc
z&|`vwAyq1&RrC-dFLEXBl_83j5e2ed8q^#rM_X95)v!zSYc*TW(Zx9a`#O|H0n$qL
zMnodBR_?}CYk6WJwPlO5mElChPrrHon67mUqH0TXqu@>A2TozhoKTnAi_2Y9Xz@E-
z6_BSi9R-Gm-t^Ztf;5%1?<?uKC^o?ZiC&F~Hs#?d^-R5m0|H}FCOTnlg~5k<Uto-r
zi`UB5SbU+WRvmkwCI!G(L^)E5yvRksbOXP;STOv0<EsjT{!(;CpaZk+<)cC}TP!ja
ztxsr``X3bRQr7@J*50Q!z&H!w?BmR(nJ=@#;Vel?8H3Y{^Ka#}TE{q1>}RGOdDXos
zTHvQ;aHE=Xv{Qrhpy(+zARzF|ug?d^hs6YSo$vV3cxCHp%IxNXx{MD~f~07}EuSSb
z@u86+F_R%fQTVh)xTu0FL}@=|vb=|8(#=N)e(<!M>`4yKsv}|l3?n*24FeZ7hZvPc
z9B)d*lZv-#9d(Cr_!n!1V_RG27HVSsyOzU_%i7(68Ly-fny;a7uZ)Jpo~c@`T&1(u
z=0(c4Zf!zts<<S2DQXOgI>;<)@5AllBlnYUh?f(6c=tLy<E-r_4EBL$O~8P5QfHCg
zBu!}~JYmor?UZ~B73?b-`(Mal%$f3cPkz^;{gf50!`sw^aeY6gOaF#tppIu9>P}oj
F{|mW{rD*^F

diff --git a/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits-members.html b/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits-members.html
index f1a365e8e..9de26dca7 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits-members.html
@@ -82,7 +82,7 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#aa9b46937bea47d071d277aa212dd610b">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a2dc8573498bcda33273b86db76dbd511">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
@@ -91,12 +91,13 @@ $(function() {
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a6eee97f03dcea1c441116e143cf58018">ThreadsDelta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a61907b1afa07c12de74545d2e23a4281">ThreadsDelta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html b/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html
index eca01a3cb..3696c4533 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html
@@ -103,18 +103,18 @@ Public Types</h2></td></tr>
 <tr class="memitem:ac0c372c24c4c5340153b11edab874741"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ac0c372c24c4c5340153b11edab874741">Base</a></td></tr>
 <tr class="memdesc:ac0c372c24c4c5340153b11edab874741"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base class.  <a href="#ac0c372c24c4c5340153b11edab874741">More...</a><br /></td></tr>
 <tr class="separator:ac0c372c24c4c5340153b11edab874741"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae7a4f120805421ac0712604723612b7e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Base::Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">Threads</a></td></tr>
+<tr class="memitem:ae7a4f120805421ac0712604723612b7e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Base::Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#ae7a4f120805421ac0712604723612b7e">Threads</a></td></tr>
 <tr class="memdesc:ae7a4f120805421ac0712604723612b7e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads.  <a href="#ae7a4f120805421ac0712604723612b7e">More...</a><br /></td></tr>
 <tr class="separator:ae7a4f120805421ac0712604723612b7e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6eee97f03dcea1c441116e143cf58018"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 2, Base::Tile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a6eee97f03dcea1c441116e143cf58018">ThreadsDelta</a></td></tr>
-<tr class="memdesc:a6eee97f03dcea1c441116e143cf58018"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads strides.  <a href="#a6eee97f03dcea1c441116e143cf58018">More...</a><br /></td></tr>
-<tr class="separator:a6eee97f03dcea1c441116e143cf58018"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a61907b1afa07c12de74545d2e23a4281"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 2, Base::VectorizedTile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a61907b1afa07c12de74545d2e23a4281">ThreadsDelta</a></td></tr>
+<tr class="memdesc:a61907b1afa07c12de74545d2e23a4281"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads strides.  <a href="#a61907b1afa07c12de74545d2e23a4281">More...</a><br /></td></tr>
+<tr class="separator:a61907b1afa07c12de74545d2e23a4281"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a8f8de5a6811b77f0c721cd78a237223e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; Base::Threads::kH *2, 1, Base::Threads::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a8f8de5a6811b77f0c721cd78a237223e">Delta</a></td></tr>
 <tr class="memdesc:a8f8de5a6811b77f0c721cd78a237223e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#a8f8de5a6811b77f0c721cd78a237223e">More...</a><br /></td></tr>
 <tr class="separator:a8f8de5a6811b77f0c721cd78a237223e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa9b46937bea47d071d277aa212dd610b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; Base::Tile::kH/Base::Threads::kH/2, 2, Base::Tile::kW/Base::Threads::kW, Base::Tile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#aa9b46937bea47d071d277aa212dd610b">Iterations</a></td></tr>
-<tr class="memdesc:aa9b46937bea47d071d277aa212dd610b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="#aa9b46937bea47d071d277aa212dd610b">More...</a><br /></td></tr>
-<tr class="separator:aa9b46937bea47d071d277aa212dd610b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2dc8573498bcda33273b86db76dbd511"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; Base::VectorizedTile::kH/Base::Threads::kH/2, 2, Base::VectorizedTile::kW/Base::Threads::kW, Base::VectorizedTile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html#a2dc8573498bcda33273b86db76dbd511">Iterations</a></td></tr>
+<tr class="memdesc:a2dc8573498bcda33273b86db76dbd511"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="#a2dc8573498bcda33273b86db76dbd511">More...</a><br /></td></tr>
+<tr class="separator:a2dc8573498bcda33273b86db76dbd511"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td></tr>
 <tr class="memitem:a6894b653fffa59bcb847bc3295643d6b inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; Scalar_ &gt;::type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">Scalar</a></td></tr>
 <tr class="memdesc:a6894b653fffa59bcb847bc3295643d6b inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">More...</a><br /></td></tr>
@@ -122,25 +122,28 @@ Public Types</h2></td></tr>
 <tr class="memitem:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef Scalar_ *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a></td></tr>
 <tr class="memdesc:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">More...</a><br /></td></tr>
 <tr class="separator:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aebbf8834d0d88f0e5b3e1926db5e6758 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt; Tile_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a></td></tr>
-<tr class="memdesc:aebbf8834d0d88f0e5b3e1926db5e6758 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">More...</a><br /></td></tr>
-<tr class="separator:aebbf8834d0d88f0e5b3e1926db5e6758 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a29bd05960cc541bb67098f5483c84cf6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, Threads_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a></td></tr>
-<tr class="memdesc:a29bd05960cc541bb67098f5483c84cf6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">More...</a><br /></td></tr>
-<tr class="separator:a29bd05960cc541bb67098f5483c84cf6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a65f9ccd630dde0c9db5358cfc951583d inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, Tile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">ThreadsDelta</a></td></tr>
-<tr class="memdesc:a65f9ccd630dde0c9db5358cfc951583d inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The relative offset between two elements in the H/W dimension in adjacent threads.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">More...</a><br /></td></tr>
-<tr class="separator:a65f9ccd630dde0c9db5358cfc951583d inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef Tile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a></td></tr>
+<tr class="memdesc:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">More...</a><br /></td></tr>
+<tr class="separator:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt; Tile_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a></td></tr>
+<tr class="memdesc:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The vectorized tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">More...</a><br /></td></tr>
+<tr class="separator:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a>, Threads_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a></td></tr>
+<tr class="memdesc:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">More...</a><br /></td></tr>
+<tr class="separator:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, VectorizedTile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a></td></tr>
+<tr class="memdesc:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The relative offset between two elements in the H/W dimension in adjacent threads.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">More...</a><br /></td></tr>
+<tr class="separator:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, Threads::kH, Threads::kW *<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">Delta</a></td></tr>
 <tr class="memdesc:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">More...</a><br /></td></tr>
 <tr class="separator:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, Threads::kW *<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a></td></tr>
 <tr class="memdesc:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Strides for immediate offset computation.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">More...</a><br /></td></tr>
 <tr class="separator:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaf6410f99d7f995792d0ac34efd3a82f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, Tile::kH/Threads::kH, Tile::kW/Threads::kW, Tile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Iterations</a></td></tr>
-<tr class="memdesc:aaf6410f99d7f995792d0ac34efd3a82f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">More...</a><br /></td></tr>
-<tr class="separator:aaf6410f99d7f995792d0ac34efd3a82f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td></tr>
+<tr class="memitem:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, VectorizedTile::kH/Threads::kH, VectorizedTile::kW/Threads::kW, VectorizedTile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a></td></tr>
+<tr class="memdesc:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">More...</a><br /></td></tr>
+<tr class="separator:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td></tr>
 <tr class="separator:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
@@ -192,8 +195,8 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 
 </div>
 </div>
-<a id="aa9b46937bea47d071d277aa212dd610b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa9b46937bea47d071d277aa212dd610b">&#9670;&nbsp;</a></span>Iterations</h2>
+<a id="a2dc8573498bcda33273b86db76dbd511"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2dc8573498bcda33273b86db76dbd511">&#9670;&nbsp;</a></span>Iterations</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -201,7 +204,7 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;Base::Tile::kH / Base::Threads::kH / 2, 2, Base::Tile::kW / Base::Threads::kW, Base::Tile::kC / <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Iterations</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;Base::VectorizedTile::kH / Base::Threads::kH / 2, 2, Base::VectorizedTile::kW / Base::Threads::kW, Base::VectorizedTile::kC / <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -217,15 +220,15 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Base::Threads</a> <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Base::Threads</a> <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a6eee97f03dcea1c441116e143cf58018"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6eee97f03dcea1c441116e143cf58018">&#9670;&nbsp;</a></span>ThreadsDelta</h2>
+<a id="a61907b1afa07c12de74545d2e23a4281"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a61907b1afa07c12de74545d2e23a4281">&#9670;&nbsp;</a></span>ThreadsDelta</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -233,7 +236,7 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessSize_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 2, Base::Tile::kC&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">ThreadsDelta</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 2, Base::VectorizedTile::kC&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">cutlass::gemm::HgemmCrosswiseGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -246,7 +249,7 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset-members.html
index 2fa9bb6b9..ab8b8df39 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html
index b9fb35edc..40b60dcc8 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits_1_1ThreadOffset.html
@@ -124,7 +124,7 @@ template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename S
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmSwizzle-members.html b/docs/structcutlass_1_1gemm_1_1HgemmSwizzle-members.html
index 1abd2b909..aac9bd0aa 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmSwizzle-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmSwizzle-members.html
@@ -89,7 +89,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmSwizzle.html b/docs/structcutlass_1_1gemm_1_1HgemmSwizzle.html
index 495f14459..9f09fffe8 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmSwizzle.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmSwizzle.html
@@ -265,7 +265,7 @@ template&lt;typename GlobalIterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html
index 6d21685c9..289cb4bc4 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html
@@ -93,7 +93,7 @@ Inheritance diagram for cutlass::gemm::HgemmTileTraitsHelperA&lt; kLayout_, Gemm
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html
index 854339353..101e43491 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html
@@ -83,14 +83,13 @@ $(function() {
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">GlobalTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">kScalarsIn4B</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a458cbcc16fc296d024f2a1a95fb926c1">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a2aad3b2454d956f20dac1bb0ad75a2f8">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac8da30393042cf6e785bdd54b11d9408">kSkewA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html
index 9e370edb3..b6500a957 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html
@@ -74,6 +74,7 @@ $(function() {
 <div class="header">
   <div class="summary">
 <a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4-members.html">List of all members</a>  </div>
   <div class="headertitle">
 <div class="title">cutlass::gemm::HgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt; Struct Template Reference</div>  </div>
@@ -99,12 +100,6 @@ Public Types</h2></td></tr>
 <tr class="memitem:a36e082b2da22d17eeb73af6bd0632314"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, half const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a36e082b2da22d17eeb73af6bd0632314">GlobalTileTraits</a></td></tr>
 <tr class="memdesc:a36e082b2da22d17eeb73af6bd0632314"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for A^T.  <a href="#a36e082b2da22d17eeb73af6bd0632314">More...</a><br /></td></tr>
 <tr class="separator:a36e082b2da22d17eeb73af6bd0632314"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2aad3b2454d956f20dac1bb0ad75a2f8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; half, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, 2, 128/sizeof(half)/GlobalTileTraits::Threads::kW/2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a2aad3b2454d956f20dac1bb0ad75a2f8">SharedStoreTileTraits</a></td></tr>
-<tr class="memdesc:a2aad3b2454d956f20dac1bb0ad75a2f8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for A^T.  <a href="#a2aad3b2454d956f20dac1bb0ad75a2f8">More...</a><br /></td></tr>
-<tr class="separator:a2aad3b2454d956f20dac1bb0ad75a2f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a458cbcc16fc296d024f2a1a95fb926c1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt; half const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 8, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a458cbcc16fc296d024f2a1a95fb926c1">SharedLoadTileTraits</a></td></tr>
-<tr class="memdesc:a458cbcc16fc296d024f2a1a95fb926c1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for A^T.  <a href="#a458cbcc16fc296d024f2a1a95fb926c1">More...</a><br /></td></tr>
-<tr class="separator:a458cbcc16fc296d024f2a1a95fb926c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td></tr>
 <tr class="memitem:ac618881d66790e4c280dc5692e5ddf95 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::ScalarA&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a></td></tr>
 <tr class="memdesc:ac618881d66790e4c280dc5692e5ddf95 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The input scalar.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">More...</a><br /></td></tr>
@@ -115,15 +110,11 @@ Public Types</h2></td></tr>
 <tr class="memitem:a8160a260acce2362e90d43bce733c69d inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac618881d66790e4c280dc5692e5ddf95">Scalar</a> const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">GlobalTileTraits</a></td></tr>
 <tr class="memdesc:a8160a260acce2362e90d43bce733c69d inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for A^T.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a8160a260acce2362e90d43bce733c69d">More...</a><br /></td></tr>
 <tr class="separator:a8160a260acce2362e90d43bce733c69d inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad6511b7c2d84a9f6c3ed3639269ac44f inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsA, 128/sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>)/GemmConfig_::kScalarsPerStsA/GlobalTileTraits::Threads::kW *<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">kScalarsIn4B</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f">SharedStoreTileTraits</a></td></tr>
-<tr class="memdesc:ad6511b7c2d84a9f6c3ed3639269ac44f inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for A^T.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f">More...</a><br /></td></tr>
-<tr class="separator:ad6511b7c2d84a9f6c3ed3639269ac44f inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1125408805bc697755f2b16594c6c8e1 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsA, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">SharedLoadTileTraits</a></td></tr>
-<tr class="memdesc:a1125408805bc697755f2b16594c6c8e1 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for A^T.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">More...</a><br /></td></tr>
-<tr class="separator:a1125408805bc697755f2b16594c6c8e1 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
-Additional Inherited Members</h2></td></tr>
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:ac8da30393042cf6e785bdd54b11d9408"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ac8da30393042cf6e785bdd54b11d9408">kSkewA</a> = 128 / sizeof(half) / GlobalTileTraits::Threads::kW / 2</td></tr>
+<tr class="separator:ac8da30393042cf6e785bdd54b11d9408"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td></tr>
 <tr class="memitem:aedd49525e2c849baecf88cdfd9e3515c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c">kLayout</a> = <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a></td></tr>
 <tr class="memdesc:aedd49525e2c849baecf88cdfd9e3515c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aedd49525e2c849baecf88cdfd9e3515c">More...</a><br /></td></tr>
@@ -131,6 +122,9 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:ad77b9084720ad7378e033e54bfb74ce7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">kScalarsIn4B</a> = sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>) &gt; 4 ? 1 : 4 / sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afac6f7a62b24396ea6861e6fd10779cc">MultiplyAddScalar</a>)</td></tr>
 <tr class="memdesc:ad77b9084720ad7378e033e54bfb74ce7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars in 4B.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad77b9084720ad7378e033e54bfb74ce7">More...</a><br /></td></tr>
 <tr class="separator:ad77b9084720ad7378e033e54bfb74ce7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9c296924f9a6c6908f09830bbbf6a775 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9c296924f9a6c6908f09830bbbf6a775">kSkewA</a></td></tr>
+<tr class="memdesc:a9c296924f9a6c6908f09830bbbf6a775 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The skew for A.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9c296924f9a6c6908f09830bbbf6a775">More...</a><br /></td></tr>
+<tr class="separator:a9c296924f9a6c6908f09830bbbf6a775 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="a7ec19bf90207a7f598f2ec5166649495"></a>
@@ -165,34 +159,27 @@ template&lt;typename GemmConfig_ &gt; </div>
 
 </div>
 </div>
-<a id="a458cbcc16fc296d024f2a1a95fb926c1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a458cbcc16fc296d024f2a1a95fb926c1">&#9670;&nbsp;</a></span>SharedLoadTileTraits</h2>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="ac8da30393042cf6e785bdd54b11d9408"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac8da30393042cf6e785bdd54b11d9408">&#9670;&nbsp;</a></span>kSkewA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
 template&lt;typename GemmConfig_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt; half const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 8, SharedStoreTileTraits::kSkew&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">cutlass::gemm::HgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a1125408805bc697755f2b16594c6c8e1">SharedLoadTileTraits</a></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a2aad3b2454d956f20dac1bb0ad75a2f8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2aad3b2454d956f20dac1bb0ad75a2f8">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_ &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; half, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW * GemmConfig_::InstructionShape::kD&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, 2, 128 / sizeof(half) / GlobalTileTraits::Threads::kW / 2&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">cutlass::gemm::HgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#ad6511b7c2d84a9f6c3ed3639269ac44f">SharedStoreTileTraits</a></td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">cutlass::gemm::HgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_ &gt;::kSkewA = 128 / sizeof(half) / GlobalTileTraits::Threads::kW / 2</td>
         </tr>
       </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
 </div><div class="memdoc">
 
 </div>
@@ -203,7 +190,7 @@ template&lt;typename GemmConfig_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html
index b331b74bc..e98065e5a 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html
@@ -93,7 +93,7 @@ Inheritance diagram for cutlass::gemm::HgemmTileTraitsHelperB&lt; kLayout_, Gemm
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html
index 273311c27..b7fa3515c 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html
@@ -83,14 +83,13 @@ $(function() {
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">GlobalTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">kScalarsIn4B</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af1bc7f7c26db3399201cd95f35a56790">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab1ae3d51f65f7af60147da1c51a7a0c2">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a6d0f50e83067373b249b38444eb7fe65">kSkewB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html
index 8a59bc287..f15d401f0 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html
@@ -74,6 +74,7 @@ $(function() {
 <div class="header">
   <div class="summary">
 <a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4-members.html">List of all members</a>  </div>
   <div class="headertitle">
 <div class="title">cutlass::gemm::HgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt; Struct Template Reference</div>  </div>
@@ -99,12 +100,6 @@ Public Types</h2></td></tr>
 <tr class="memitem:a1e6356bf5c87271ab9794fcc79edc145"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmCrosswiseGlobalTileTraits.html">HgemmCrosswiseGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, half const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1e6356bf5c87271ab9794fcc79edc145">GlobalTileTraits</a></td></tr>
 <tr class="memdesc:a1e6356bf5c87271ab9794fcc79edc145"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for B^N.  <a href="#a1e6356bf5c87271ab9794fcc79edc145">More...</a><br /></td></tr>
 <tr class="separator:a1e6356bf5c87271ab9794fcc79edc145"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab1ae3d51f65f7af60147da1c51a7a0c2"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; half, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, 2, 128/sizeof(half)/GlobalTileTraits::Threads::kW/2 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab1ae3d51f65f7af60147da1c51a7a0c2">SharedStoreTileTraits</a></td></tr>
-<tr class="memdesc:ab1ae3d51f65f7af60147da1c51a7a0c2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for B^N.  <a href="#ab1ae3d51f65f7af60147da1c51a7a0c2">More...</a><br /></td></tr>
-<tr class="separator:ab1ae3d51f65f7af60147da1c51a7a0c2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af1bc7f7c26db3399201cd95f35a56790"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt; half const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 8, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af1bc7f7c26db3399201cd95f35a56790">SharedLoadTileTraits</a></td></tr>
-<tr class="memdesc:af1bc7f7c26db3399201cd95f35a56790"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for B^N.  <a href="#af1bc7f7c26db3399201cd95f35a56790">More...</a><br /></td></tr>
-<tr class="separator:af1bc7f7c26db3399201cd95f35a56790"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td></tr>
 <tr class="memitem:a8ae7db3f2f0c57779729d500386c004c inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::ScalarB&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a></td></tr>
 <tr class="memdesc:a8ae7db3f2f0c57779729d500386c004c inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The input scalar.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">More...</a><br /></td></tr>
@@ -115,15 +110,11 @@ Public Types</h2></td></tr>
 <tr class="memitem:a5fee0ed52326c0685e8d8295e40ce064 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a8ae7db3f2f0c57779729d500386c004c">Scalar</a> const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::kThreads/GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD &gt;, GemmConfig_::kScalarsPerLdgB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">GlobalTileTraits</a></td></tr>
 <tr class="memdesc:a5fee0ed52326c0685e8d8295e40ce064 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for B^N.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a5fee0ed52326c0685e8d8295e40ce064">More...</a><br /></td></tr>
 <tr class="separator:a5fee0ed52326c0685e8d8295e40ce064 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1884cbc21987aec651fa8149d4ed1a06 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsB, 128/sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>)/GemmConfig_::kScalarsPerStsB/GlobalTileTraits::Threads::kW *<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">kScalarsIn4B</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06">SharedStoreTileTraits</a></td></tr>
-<tr class="memdesc:a1884cbc21987aec651fa8149d4ed1a06 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for B^N.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06">More...</a><br /></td></tr>
-<tr class="separator:a1884cbc21987aec651fa8149d4ed1a06 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a118bb34a6f58c3e5a989773b4b597d8c inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsB, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">SharedLoadTileTraits</a></td></tr>
-<tr class="memdesc:a118bb34a6f58c3e5a989773b4b597d8c inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for B^N.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">More...</a><br /></td></tr>
-<tr class="separator:a118bb34a6f58c3e5a989773b4b597d8c inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
-Additional Inherited Members</h2></td></tr>
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a6d0f50e83067373b249b38444eb7fe65"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a6d0f50e83067373b249b38444eb7fe65">kSkewB</a> = 128 / sizeof(half) / GlobalTileTraits::Threads::kW / 2</td></tr>
+<tr class="separator:a6d0f50e83067373b249b38444eb7fe65"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td></tr>
 <tr class="memitem:afbd350793888a7e7b299548dca854c13 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13">kLayout</a> = <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a></td></tr>
 <tr class="memdesc:afbd350793888a7e7b299548dca854c13 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#afbd350793888a7e7b299548dca854c13">More...</a><br /></td></tr>
@@ -131,6 +122,9 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:a774a052f0f98f50e46dda933c81badd5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">kScalarsIn4B</a> = sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>) &gt; 4 ? 1 : 4 / sizeof(<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a42dd312d4cf5bb53b472389897f9deeb">MultiplyAddScalar</a>)</td></tr>
 <tr class="memdesc:a774a052f0f98f50e46dda933c81badd5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars in 4B.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a774a052f0f98f50e46dda933c81badd5">More...</a><br /></td></tr>
 <tr class="separator:a774a052f0f98f50e46dda933c81badd5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab35a6b3ff04e4128e4ca4a8cc0459b16 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab35a6b3ff04e4128e4ca4a8cc0459b16">kSkewB</a></td></tr>
+<tr class="memdesc:ab35a6b3ff04e4128e4ca4a8cc0459b16 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The skew for B.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ab35a6b3ff04e4128e4ca4a8cc0459b16">More...</a><br /></td></tr>
+<tr class="separator:ab35a6b3ff04e4128e4ca4a8cc0459b16 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="aca63ec1099444c555299dc144282dded"></a>
@@ -165,34 +159,27 @@ template&lt;typename GemmConfig_ &gt; </div>
 
 </div>
 </div>
-<a id="af1bc7f7c26db3399201cd95f35a56790"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af1bc7f7c26db3399201cd95f35a56790">&#9670;&nbsp;</a></span>SharedLoadTileTraits</h2>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a6d0f50e83067373b249b38444eb7fe65"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6d0f50e83067373b249b38444eb7fe65">&#9670;&nbsp;</a></span>kSkewB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
 template&lt;typename GemmConfig_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt; half const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 8, SharedStoreTileTraits::kSkew&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">cutlass::gemm::HgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a118bb34a6f58c3e5a989773b4b597d8c">SharedLoadTileTraits</a></td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="ab1ae3d51f65f7af60147da1c51a7a0c2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab1ae3d51f65f7af60147da1c51a7a0c2">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename GemmConfig_ &gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; half, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH * GemmConfig_::InstructionShape::kD&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">GlobalTileTraits::Threads</a>, 2, 128 / sizeof(half) / GlobalTileTraits::Threads::kW / 2&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">cutlass::gemm::HgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a1884cbc21987aec651fa8149d4ed1a06">SharedStoreTileTraits</a></td>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">cutlass::gemm::HgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_ &gt;::kSkewB = 128 / sizeof(half) / GlobalTileTraits::Threads::kW / 2</td>
         </tr>
       </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
 </div><div class="memdoc">
 
 </div>
@@ -203,7 +190,7 @@ template&lt;typename GemmConfig_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTraits-members.html b/docs/structcutlass_1_1gemm_1_1HgemmTraits-members.html
index 2a51feb22..ec460a2e7 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTraits-members.html
@@ -73,19 +73,21 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraits.html">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
@@ -98,12 +100,13 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTraits.html b/docs/structcutlass_1_1gemm_1_1HgemmTraits.html
index a9e4c2696..35affe754 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTraits.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -75,17 +75,17 @@ $(function() {
   <div class="summary">
 <a href="structcutlass_1_1gemm_1_1HgemmTraits-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="hgemm__traits_8h_source.html">hgemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, Helper_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1HgemmTraits.png" usemap="#cutlass::gemm::HgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::HgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" name="cutlass::gemm::HgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map">
+  <img src="structcutlass_1_1gemm_1_1HgemmTraits.png" usemap="#cutlass::gemm::HgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::HgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" name="cutlass::gemm::HgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map">
 <area href="structcutlass_1_1gemm_1_1GemmTraits.html" alt="cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;" shape="rect" coords="0,0,1447,24"/>
 </map>
  </div></div>
@@ -93,10 +93,16 @@ Inheritance diagram for cutlass::gemm::HgemmTraits&lt; kLayoutA_, kLayoutB_, Out
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td></tr>
+<tr class="memitem:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>, Index_, Helper_::ClearAccumulators &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a></td></tr>
+<tr class="memdesc:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">This traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">More...</a><br /></td></tr>
+<tr class="separator:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a></td></tr>
+<tr class="memdesc:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The struct that consumes this Traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">More...</a><br /></td></tr>
+<tr class="separator:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GemmConfig&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a></td></tr>
 <tr class="memdesc:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The configuration.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">More...</a><br /></td></tr>
 <tr class="separator:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
+<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
 <tr class="memdesc:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">More...</a><br /></td></tr>
 <tr class="separator:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalLoadStreamA&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a></td></tr>
@@ -117,13 +123,7 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedLoadStreamB&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a></td></tr>
 <tr class="memdesc:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for B to load from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">More...</a><br /></td></tr>
 <tr class="separator:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamA::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a></td></tr>
-<tr class="memdesc:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for A.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">More...</a><br /></td></tr>
-<tr class="separator:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamB::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a></td></tr>
-<tr class="memdesc:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">More...</a><br /></td></tr>
-<tr class="separator:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
+<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
 <tr class="memdesc:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">More...</a><br /></td></tr>
 <tr class="separator:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Epilogue&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a></td></tr>
@@ -143,6 +143,15 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::ClearAccumulators&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a></td></tr>
 <tr class="memdesc:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear the accumulators.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">More...</a><br /></td></tr>
 <tr class="separator:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, GemmConfig::kResidueInProlog &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a></td></tr>
+<tr class="memdesc:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">More...</a><br /></td></tr>
+<tr class="separator:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">GlobalLoadStream::ThreadblockTileStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory needed to store the threadblock-scoped GEMM tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">More...</a><br /></td></tr>
+<tr class="separator:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a></td></tr>
+<tr class="memdesc:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">More...</a><br /></td></tr>
+<tr class="separator:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td></tr>
 <tr class="memitem:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a> (bool in_loop)</td></tr>
 <tr class="memdesc:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">More...</a><br /></td></tr>
@@ -164,7 +173,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTraits.png b/docs/structcutlass_1_1gemm_1_1HgemmTraits.png
index 03fc4145b8f33ae36c28b48e33f0e9b0ff602468..96fbe77ed401775709590a20e6bf241888fe3cdf 100644
GIT binary patch
delta 2654
zcmZuxdpr{g8>UW<lvHxfQn7L;8OMZ>7}<oB%TSct=CX$7vgwmL5z8jmMu@pj7@?Uc
zxlJxZj%MYOv0O(}E<1eR`M$rt_pkSTe((D}zxVQce#m~6ed=a^U<q=`%;}!+JZY9N
z@#g3y{J;_RhUv<@2qIly+e<doNDh$o%9aYT*}9!o)Olr4FVjEk%z3*(pCbRP9zDCk
z!#WT`in0>qGU17`97JA-ShY_jr9m9W;h-DEA(4+)c_}Xs(J8ix9#b1_YeRXf;S&*>
z*c@t3^HcNSVdsKiUe_#vnO`MqFcQ$23t6)-PKn%j`+(vX5~>61c-vN~OK%d@ihAF3
zD9aKtWRG-)%%K><DaStSXIzl`Spkl@`>F{9RGri%jpNyMoGTb${8=g`2d4!Q?@GM=
z*}W{yR7vTPxj1tSb|%^-4p=d{hg3=Qlaf4WaBEwVH0~CQDzJ9IlfxouYS`ATO|1JD
z{&g-Np)k(I`kIzHHHP!}i*chIelRxkP7M6$76?uof&YbPS7k^xSj~Os^HhCUVvgo*
zX?H%dJlMv%u31jfwS_of!F1y(C9)%Ol!}rss?W7v7Z>;FwMenMml2#3Ai<Kl-T%y;
zmjJ$1QKrlqr?43vfi7icR?8H_lMVA13d(1`UPzN%acfS~1(taA&;DVouMU|%GR_w3
z!A^}pM}qvX8{K%Lkk%~Hq|tqY-M=oL2);zC{aDzS)bAGiB^0;qBC8qGqfN@YJKx>0
z?38X#g-`qZIgZu+sxJS=L&ia@AatGU^$e_{dORMQ{=V12Z4Q0aMjhpt<Ek4oB>cE;
z-|_B2u=CAp-h4MO>HQ7Gchbm&NZS)eN1rc}Pqt&0`bsy*aNn4;<o6VGV}qznp?wt6
z-?Lc)?Dk^rS_KZ+_U%^(x6rBEp5Op=iW839=-fT(-S$@&1NGgs3)SVeADv3c(q~Uw
zNnw7*GHt835gH*S#TD^d=F+wi*5nzFhsU*QT-EFx6sDgI)gJ%@k`@eXF(77df>ipk
zcI+k*yk#Sn#3HhDhIkV{Ts_i=lRWJXkjBPfNu4=v`s!FU|KmTbe-^zA)7w7ADjC;9
ztEstpk_%JuS2XmMWQIUtzkU`?HD4dQHPH-BPw_PnFC1si<{Q|#1X9eymZHK(#WM|6
zz@NjVCy`<>qwN~-mXjDw_S%f?hcy7(b%WBimf&=J1fo9o2W`uzHT`?M1z1xxc^vml
z5{}@amw#<j3I_=joWfz9m<rX3joSH8H*%Th`yQ3pOsMG@DqOmHn67pg$$G`*tVWuw
zR8IG1SxP6dlG!Gvm_L6E<iKt=R7wP}pJOJya+!o>RLr>{z^FP({zbhaY&{{mX1?!v
z&a5x9YLltz56A|?Wv(7`y*@aMn+4r31yBG_@AOik5eoHtsMqx*=`RLNB^LcZ2UD!h
zrwbT0cgWl*)v$J5dSJR|ios;VlXhf-b>{>ETJD}Gxtw0jCDENQW@4ek;OVOila|pZ
zzzV_HpNsQ=o=>?0D>4owi}=Uan0dQP*7jRsd<aNKCV;ZP-^7mk;`)b=rkxGU!vNl5
z*RqYXBm*tAB!b?sx{h-?_YQOzHk~hx{ML0~-aX=NLGg<?f>YI8tuiTZ+KyoI;jFHo
zXZc=`nS+97D%XIzrY_lhlAQzJ+Pw6;R?x6vgl9e1qkk5#MtCXF_eq0~SBAHs7&Z>s
z5#*B)-}QWVdP#*RBy&mXXI-?Ogn*-KoX!txS^$!^H7^pjHG^R{>0K!lFUaUWshLat
z(b?e?z;>t`Xyvp?$soZ;xzqX|QPXNqDF^vs(UJdG{6vLhh4wB9T5v)lExWFl(8Ct6
zxR=nuSYaKZwk0-BI$#&v31#<j^>#s#7NLV}_$zM3!vD?@@j6^SxC`zS>l}3^J`wpq
zgo<1_y-q(>n0m!VH8a&gSGCZ`!KU+N>cHWr|7pD2BbJyaqKWg?*79p-wKeCW1wvd7
zFoZc%^i}R`SirgYF8}7-6Y<FK8Wk*^mlTBb5iVC!{;lupk8q{S&fA&Dl`3Ro5GA}#
zZ__l2N@XsJj=IGMDDFk8*5?C7y(GD-rUSFd{rkWymjOpGEz<+0rxqtp66yFf=pTEc
z$uf-FX&27G-HGFYS>Y_t;t4zQ^oDIrXott6oq2+%@LaSF@8_ofyN`=wl(Cvz)Bh=I
zm+|XB6P&;#BMB>L&oDETSvz1jB832qw?V^`CtbT3btz^#rKO$EqH~@`U>_g8djRz-
z!+;++>qTDwITTR+K<)H5mg-2kwULG!E=1&A3g1{lA+gz4imLO*C0#S9!rM0Hc1Kdu
ztMHp^%yW3(m(&+Hk2E3FcDP0U<#+R>7sjm{W4&G22ZNz4(dUpKo<zL!o{2zJ3edH4
zuZaa<K*B+jd}u`V{?iw40g~GH(N8V6yE0IF?5o@xY9R2?GYA$a>a}+3Vye70Zu3r=
zg>zo~`|O{yS&O|6bfu{@r~$0AeJ=QWet_Iqx7d<Z71Y<rP$oZ`7<P&FDQR}w@K(+v
z6?l9FMj(g6*pOj=U{Zyi_A_T)VG<nl&`T2G+moz0nj@y8^yQ(U27O+4jVa)yFAaGh
zPD7y6q(a5f7Btq3%!3e5dZ9SP%!upu{O!$28ziX`9XVdZZv!xO$4d7n9DzF<8JV5a
zB_&_3&ls)i0qWNyRqbX%6e1jKejNa_de68+m52MKIFYS^V44OhwD81@i7W9FtI(3s
zL#4myh<cmrw#x|4>bKpg+S@sw%eJ`92s8$;cXWMlhi;+Rav4Wj{M3qdByW5x6PTZp
zq4r9v!t^hc1M6Z^q2PwgWZ?iP2OYdaz~a|Y@8nel6<yRfXY){{QPs?$H&aQ`_YrRl
zr%sV7qYc6uK}~=OSXpgY<Y<#PwODHXre*%QIpf#f<NdR1zdeMzk?L)3jfmAH59~i%
zk#uBVa2>n`x4=PrF7fI{{PiS4mTOClFDlrPDo<;Tct<e6VA}P$wAK;1XSZCe1NynR
z!zdVeL^{0ZJgHLOqYRI8FBCLF1?7Smb=F@Yf@b4v*a8ZxXmt-OQDQnQNxz*#s)_2s
z(4CuBo9*ejAi8A_SFAcFC--d}^n`OEK6@JV7}q15*corG2Vm{_tg#~UJM5YuP4f6h
zUO`4!kP+A6!LYpxJFRkc7_s0Xs%X@w5hmT#<L9yjjDJ10!Z75QAs9P91N8Cr_OY$5
ztGYqR@T|jjU-r{fYRR3!bM;!}p!(bjnlUGO?0W`Lv&<1x7j!a~U@OlrA+eHq-#C7n
z{9Fl)*2F{VHPILNF!?Ws@!5)BM9(sWp|2*5Sf<*YtEUvL0=|RiN*L-%M$U#UmOl4Q
zj?g%LGZs0C_ue&P4L<JC8TOC$e*PJ>$nr^FZ*J|hHOV5<=h0Y`F<f7s!J}F+;ni2f
uKoO8;8y-qdB|ubxL<gHQ|5YdX`vTz~@YD6$zcC>~I|i|YUaB<r`q$s;Ku)Fr

delta 2701
zcmY+Ec{J4f8^>p|R?1DHloATry4D)HN=Zh>mc}+SuB<aM#Sp^RrAW47j5`?14U@)L
zvLy^H$}SDcI$TU<#*%dm#$0~qo^#Ld^Uw2n-sikO&pFTMeO?ns*N#4Ov6T?9xOU}M
z2zZV(NMOH_x>oxhvnl|VsC)b{H$qh<%w7L-&bpd~gFzo7iABCTbUiDt%%ZlNbUmVP
z=2=}Ux}NaOR1f908>!Egl`O8OiZ-X^iRc3m2+7|vHAj)ZWnmY`$i*Zer#3&VlCQGn
zJ}x+K87JiY_S|%VO1;h)qo6Vhp0vA<xMpbzEMLW$CiM*)o((sPp~Qrm9y}SG#2YnZ
zzJ_<sDrmS<V!a&C6nE&0U9+RXe3)&m+WoAogwbAnL39T$%p}sUH*}gPz5Oy`4&bCp
z+n_WinL|}u+ByNMeU}>}yx(W&JAQqu^@U{+|MJhydrC}`URL9QmttnAVOvh*Z<N1P
zMtZoPMIr^h{OqJk29}YaZFLS&&s*lc^IO@(h7x5W5K?@7L}M*tDCLx6XZ(m#5R)Ii
z&#d+}{B^8mS5AH7_FAituN~qGKp-R%II)S@F#XpF0dhsP3pdt94j{X)rdzF*pUClw
zoqzgz23j2IARkJlD33;>Og^+?oG4e!7t1ax6wYm3NA!FMMZyS-r3$>7#gPQqkFp<K
zP`ifL46KL@svSed)K;k<B%lsjqIByOI~r&&7KIWFuGLoqmifnD)Pe!xXCB70YNet9
z7u#K}t@PO*VOkxWly*97v-?q*&(AQ#4K<f{6WADic3y$I0|X&!WO<iLcTlsPvdK{-
z(%4Z`HAjvQAC{;1!I$UFA&8HTr=~QAq*rg8G?H@dwm<vH^Jj?zx9LsynudG=V+QwT
zuWaF$u%xQ8?3iwGy+#0C?eX39ROqF2v^>=ATwA|e)EG^7LS60z?f&eul{u((ipKEQ
z{psxDmiX4Xr^XSNhcum<M31|wqpNxyTG5<?td)_D*;w@w0yGU@w$aWW_Joj*k75ZM
zXdjY;k(Qdv=At!wMORIjZa<dOwai{~jx0fS=K_~Y2WtcufqvCn$Mgw}z`*c>-7r=9
zK%L<~t@}yLjLYNzPY$OF-|q0F#cS%-TN|=q4F8pjc4>T5Mh}`Aw94ztf*@AU;;Tbs
zGh-N)>i(_ouk=rRcRGo+5BYl?=x3P}eo5%X(Sk?D7JJ8lTcz*<Iad|izWcko)h0f^
z3ei*pP>t#;4=Ski{vNJCkwn0kA<=)Z0<Gfb>E9=7V1|rWhJj!W+{U8a?CaF(Z3ibb
zCmCT*{<drzOvTB_IOzu)MTSSV|FSrcWBq$wsU(__9eS_a8r>FB_ZyL&JnL}rz?b1#
zm2fj!%Y{c}vKvH<V<;P6Rcb}@Pk6cSE(M4W3bV@d{TwK!+*#MpN}g1;X?XE?-4nuJ
z{+aWMzZRw!$ZO(J2U#2ScnBu62?IwyH=L|X9ItUL@VIZFa(kgAe%*3#Zc5t$`OI{C
zV59xT$Y)93a>)nYU3)nZ=Ou8RmL{OsfAQ9u`{AIMyMMc1E_}IS=*ZOyFMDGRKzmbh
z$oc(}hh|lYQYDHnlfwM?SL^D#E^O_F=*A>?Z-CZ(Vo^@r64dCMT8MNyD^J;>1fpr-
z{iMO->t=|#=wb`R=CJZKCnkVjP!s9#UUq7@5|f)d)7;Vp`7u9PG=GdVW~*%xCiJd+
zM4-&tL%`flbw`q-l}Qu37ROx=eCjw)Tv9Njb18#+-=2$y31k#31cVH7IcmBUUS8lH
zVN;shH;{63-G`Px8W;zR+)iqU2l{+1bp9in>>U!}e_%^gK4u{&_MD>XV*<HkMfWK3
z&Fs{(O8bwAzQQ1hDDXNkZUPc=+r6F#U3DXgo(G9GgN{c1zP@0xUw>EJX%nM^<aR`m
zkQ*p=!n{bcZ&%!D&x;TE?ut9+qkAc7xuO+mS`wmZ0#Vz4tBB$j<Cz`wY$5(8RE>zY
z(@`t*u!H)F-}v_dx1E}X5LE|gu4LdTK-;d5i!fnri<M9^nr(BlV!gAgil==IVI7CU
zq-zGdUaj-H#YTr(_vDR#q{%pe@xq}VM}%<VkrBrG)Q#kf4K*T%GNa*-X7AeQ{tZH~
z)%fTud!CfTnykr2*JWpL-m=!L6|b;Mo<0%=IJrDGYce=&Rwl@+9N^-@n*5>&r7&!W
z@Y5s2;NUyJKCOd;m_LH##_ed<Wcv;3diMf%xOTWQ7Z~Unys*h%Yh1UJ94h5)@iyHI
zHu#1qM71A(MLKog6>(8nDNiHm))E3L59qWeW}=~Ia#5;AP1jljUF7N;47nJV8+o0_
zl2TBoNf286Mr45MbnuU|y8ANd91#W7G(mV!elKm_=eMBGMdR(yj_X#=-yRsHa^8OD
zx|cQC7J&BAN=10Ro!%F&>>_s3KD;ft8NA%0mrP_FBFYF~tQGkA^#7`29t2U>S$@vJ
zsbtL-q&dRByy?UeLdxNlULd?Q+-}*r2Iv*n@b4G^@Zb!iOS=A+d!Fj|TsaH-5##+Z
z)odtdXO|;iSwBH{B|d$M(od3jaAI7LQP#(DceOlyPNi6h-QUU|*=PdHJ3D@<ruc2^
zXo^2tdI`(Dx1<WrQ|M#eww9d1(F;ha%tX`GvEqj9Ux!wcd!Q3PI)};cf`0K3o5D0c
zQIAmsl1SqdUG=&mW#V<e>XJ?;Ehn74^DwRnR!pUHd3BOZ{;Vh3sq;=WdRi-M(aMIp
z^u+sm?Vl~P=~6C3HRgE_kgyBIXZU+b$(3zdDpDNwKHTQ}W2EjX<};Z2XmJ5`Wstq1
zV@8|-wVaEi3}$*t8OA)og$3?I9tybQ1%U(p=KV2&_Kd#E6||c>Gh2x5CLI-i)*&eJ
zCX*t7o|diFS}VM1@bEj-FB}Pj)LkcoonbS$g~yW+gkResl0VJi5B4KP(!u`2t?-&N
zp26PHT(jj<kBkfGNegq0=TQ5R8#?LRcBDuNpKw=okx0kq;<t@_jF|EyWQvmkklB@w
zRt~1RaT>DkeNAr|Y+$*XlQ*MLHH}tE#)bWK8@H$+Gq`s-$CF1L4tUWKl@Bw_k8)4%
z8Y?M2Wqh~_eLT2m{K)B@7?0K`hnB;qi}V)4Nl+jkCh%K|K>DXMOt3wKn4ryUvIk$@
z4(Jl9zKcA$n6+q(?@}G(0!%Kp3wvm}Cffbaj+o#tZ698(-LG`jdVbMuHQ<a;{tK6=
zEVIG!PJ4ROv?DWa&9-yHUs_{0wQ#tO;tqV9@AKze%e3lDSKgnFy;*+7(mDaYWHBPK
z6JdvspQIa<J-of1jygZcAEJ&Ssk%~g=bL4hA|MCu#isE?eT^g`0K>qD>CwTymDGDc
z*e1|oGFF}`t0Gee0Ih+C3`?jMmn%x>pi3ve88sh*WeR1xe}3>*aOn&^F8oAs1?Q!T
zT94km<1`4%l#h4ldbn#!ajb3X!h*w<27IHmRLm!<({S+%>e<HAO5wb$6oqE{tr%wG
xg@QP+Dq)9hX+mPU8j(22|8uIX0RL5dOA<MyI1#BlR|48O7G|((rKWDt{{Z@*Ycc=;

diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTraitsHelper-members.html b/docs/structcutlass_1_1gemm_1_1HgemmTraitsHelper-members.html
index 78f078257..504d83108 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTraitsHelper-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTraitsHelper-members.html
@@ -73,35 +73,35 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">GemmEpilogueTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417">GemmTileTraitsHelperA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89">GemmTileTraitsHelperB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">GlobalLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">GlobalLoadIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">GlobalTransformerA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">GlobalTransformerB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">SharedLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">SharedLoadIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">SharedStoreIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">SharedStoreIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">GemmEpilogueTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02">GemmTileTraitsHelperA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d">GemmTileTraitsHelperB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">GlobalLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">GlobalLoadIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">GlobalTransformerA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">GlobalTransformerB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">SharedLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">SharedLoadIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">SharedStoreIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">SharedStoreIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTraitsHelper.html b/docs/structcutlass_1_1gemm_1_1HgemmTraitsHelper.html
index 1ec8904e7..e7fabe587 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTraitsHelper.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTraitsHelper.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -76,7 +76,7 @@ $(function() {
 <a href="#pub-types">Public Types</a> &#124;
 <a href="structcutlass_1_1gemm_1_1HgemmTraitsHelper-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::HgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -84,362 +84,362 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:a1597c776238f35bcb1acc0a8f8f9c118"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig</a>&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a></td></tr>
-<tr class="memdesc:a1597c776238f35bcb1acc0a8f8f9c118"><td class="mdescLeft">&#160;</td><td class="mdescRight">The HGEMM config.  <a href="#a1597c776238f35bcb1acc0a8f8f9c118">More...</a><br /></td></tr>
-<tr class="separator:a1597c776238f35bcb1acc0a8f8f9c118"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5557c86a530f5d20a35d3fa620adf417"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a>&lt; kLayoutA_, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417">GemmTileTraitsHelperA</a></td></tr>
-<tr class="memdesc:a5557c86a530f5d20a35d3fa620adf417"><td class="mdescLeft">&#160;</td><td class="mdescRight">The GEMM config for A.  <a href="#a5557c86a530f5d20a35d3fa620adf417">More...</a><br /></td></tr>
-<tr class="separator:a5557c86a530f5d20a35d3fa620adf417"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8768c2b03bea0c3601c47dde2bc7ca89"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a>&lt; kLayoutB_, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89">GemmTileTraitsHelperB</a></td></tr>
-<tr class="memdesc:a8768c2b03bea0c3601c47dde2bc7ca89"><td class="mdescLeft">&#160;</td><td class="mdescRight">The GEMM config for B.  <a href="#a8768c2b03bea0c3601c47dde2bc7ca89">More...</a><br /></td></tr>
-<tr class="separator:a8768c2b03bea0c3601c47dde2bc7ca89"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab8a3def34300afb5745453d0b33204aa"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; typename GemmTileTraitsHelperA::GlobalTileTraits, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">GlobalLoadIteratorA</a></td></tr>
-<tr class="memdesc:ab8a3def34300afb5745453d0b33204aa"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load A from global memory.  <a href="#ab8a3def34300afb5745453d0b33204aa">More...</a><br /></td></tr>
-<tr class="separator:ab8a3def34300afb5745453d0b33204aa"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3fb86b6d3e353df6b752510d64c5e647"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt; GemmTileTraitsHelperA::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">GlobalLoadIteratorA</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">GlobalTransformerA</a></td></tr>
-<tr class="memdesc:a3fb86b6d3e353df6b752510d64c5e647"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default transformer for A.  <a href="#a3fb86b6d3e353df6b752510d64c5e647">More...</a><br /></td></tr>
-<tr class="separator:a3fb86b6d3e353df6b752510d64c5e647"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7f022d423d42d4081cefa7eb26b4d5b4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">SharedStoreIteratorA</a></td></tr>
-<tr class="memdesc:a7f022d423d42d4081cefa7eb26b4d5b4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store A to shared memory.  <a href="#a7f022d423d42d4081cefa7eb26b4d5b4">More...</a><br /></td></tr>
-<tr class="separator:a7f022d423d42d4081cefa7eb26b4d5b4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2aaece6093100c71c4d587994200e3bb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">GlobalTransformerA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb">GlobalLoadStreamA</a></td></tr>
-<tr class="memdesc:a2aaece6093100c71c4d587994200e3bb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from global memory to shared memory.  <a href="#a2aaece6093100c71c4d587994200e3bb">More...</a><br /></td></tr>
-<tr class="separator:a2aaece6093100c71c4d587994200e3bb"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a95559f28cab076da723e4cb24351116e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; typename GemmTileTraitsHelperB::GlobalTileTraits, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">GlobalLoadIteratorB</a></td></tr>
-<tr class="memdesc:a95559f28cab076da723e4cb24351116e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load B from global memory.  <a href="#a95559f28cab076da723e4cb24351116e">More...</a><br /></td></tr>
-<tr class="separator:a95559f28cab076da723e4cb24351116e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7b4de712868095200a338802c1fbb3de"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt; GemmTileTraitsHelperB::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">GlobalLoadIteratorB</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">GlobalTransformerB</a></td></tr>
-<tr class="separator:a7b4de712868095200a338802c1fbb3de"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abe3383e7338c08841fd8f0bfb1090448"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">SharedStoreIteratorB</a></td></tr>
-<tr class="memdesc:abe3383e7338c08841fd8f0bfb1090448"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store B to shared memory.  <a href="#abe3383e7338c08841fd8f0bfb1090448">More...</a><br /></td></tr>
-<tr class="separator:abe3383e7338c08841fd8f0bfb1090448"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abaf5f16ab0b215b406766ecadab29394"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">GlobalTransformerB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394">GlobalLoadStreamB</a></td></tr>
-<tr class="memdesc:abaf5f16ab0b215b406766ecadab29394"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from global memory to shared memory.  <a href="#abaf5f16ab0b215b406766ecadab29394">More...</a><br /></td></tr>
-<tr class="separator:abaf5f16ab0b215b406766ecadab29394"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1bbb198a50b5f01a0502df44bb678620"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">SharedLoadIteratorA</a></td></tr>
-<tr class="memdesc:a1bbb198a50b5f01a0502df44bb678620"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load A from shared memory.  <a href="#a1bbb198a50b5f01a0502df44bb678620">More...</a><br /></td></tr>
-<tr class="separator:a1bbb198a50b5f01a0502df44bb678620"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a21c860cc877df13d22dd30eeb5e2b06b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">SharedLoadIteratorA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b">SharedLoadStreamA</a></td></tr>
-<tr class="memdesc:a21c860cc877df13d22dd30eeb5e2b06b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from shared memory.  <a href="#a21c860cc877df13d22dd30eeb5e2b06b">More...</a><br /></td></tr>
-<tr class="separator:a21c860cc877df13d22dd30eeb5e2b06b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8d09409973094ca2a17633776a64a303"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">SharedLoadIteratorB</a></td></tr>
-<tr class="memdesc:a8d09409973094ca2a17633776a64a303"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load B from shared memory.  <a href="#a8d09409973094ca2a17633776a64a303">More...</a><br /></td></tr>
-<tr class="separator:a8d09409973094ca2a17633776a64a303"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac5eeca1e91f0e0d4dd48d432d5213215"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">SharedLoadIteratorB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215">SharedLoadStreamB</a></td></tr>
-<tr class="memdesc:ac5eeca1e91f0e0d4dd48d432d5213215"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from shared memory.  <a href="#ac5eeca1e91f0e0d4dd48d432d5213215">More...</a><br /></td></tr>
-<tr class="separator:ac5eeca1e91f0e0d4dd48d432d5213215"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae9facf63912d98e597883bf7efb56cc8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8">MultiplyAdd</a></td></tr>
-<tr class="memdesc:ae9facf63912d98e597883bf7efb56cc8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do the multiply-add in the main loop.  <a href="#ae9facf63912d98e597883bf7efb56cc8">More...</a><br /></td></tr>
-<tr class="separator:ae9facf63912d98e597883bf7efb56cc8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aba2366bec386c74df47dfd0426b07041"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">ClearAccumulators</a>&lt; typename <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">MultiplyAdd::ScalarC</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">ClearAccumulators</a></td></tr>
-<tr class="memdesc:aba2366bec386c74df47dfd0426b07041"><td class="mdescLeft">&#160;</td><td class="mdescRight">The object to clear accumulators.  <a href="#aba2366bec386c74df47dfd0426b07041">More...</a><br /></td></tr>
-<tr class="separator:aba2366bec386c74df47dfd0426b07041"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4a0f361b5c47d0ab5f3308cd3b3b6ef6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a>, EpilogueFunctor_, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">GemmEpilogueTraits</a></td></tr>
-<tr class="memdesc:a4a0f361b5c47d0ab5f3308cd3b3b6ef6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class for the epilogue.  <a href="#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">More...</a><br /></td></tr>
-<tr class="separator:a4a0f361b5c47d0ab5f3308cd3b3b6ef6"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a234ae6065d5ab56135e10119d3ad2d98"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">GemmEpilogueTraits</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98">Epilogue</a></td></tr>
-<tr class="memdesc:a234ae6065d5ab56135e10119d3ad2d98"><td class="mdescLeft">&#160;</td><td class="mdescRight">The epilogue.  <a href="#a234ae6065d5ab56135e10119d3ad2d98">More...</a><br /></td></tr>
-<tr class="separator:a234ae6065d5ab56135e10119d3ad2d98"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0cb18b7857c88f600c6977a1bdb3f4e4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig</a>&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a></td></tr>
+<tr class="memdesc:a0cb18b7857c88f600c6977a1bdb3f4e4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The HGEMM config.  <a href="#a0cb18b7857c88f600c6977a1bdb3f4e4">More...</a><br /></td></tr>
+<tr class="separator:a0cb18b7857c88f600c6977a1bdb3f4e4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4f3afb4b1f37a2c43a1935a3000b2a02"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a>&lt; kLayoutA_, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02">GemmTileTraitsHelperA</a></td></tr>
+<tr class="memdesc:a4f3afb4b1f37a2c43a1935a3000b2a02"><td class="mdescLeft">&#160;</td><td class="mdescRight">The GEMM config for A.  <a href="#a4f3afb4b1f37a2c43a1935a3000b2a02">More...</a><br /></td></tr>
+<tr class="separator:a4f3afb4b1f37a2c43a1935a3000b2a02"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada910ee63493bc3c70f7395127268a1d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a>&lt; kLayoutB_, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d">GemmTileTraitsHelperB</a></td></tr>
+<tr class="memdesc:ada910ee63493bc3c70f7395127268a1d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The GEMM config for B.  <a href="#ada910ee63493bc3c70f7395127268a1d">More...</a><br /></td></tr>
+<tr class="separator:ada910ee63493bc3c70f7395127268a1d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac6eac542d9d994509f931804b8b85ff5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; typename GemmTileTraitsHelperA::GlobalTileTraits, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">GlobalLoadIteratorA</a></td></tr>
+<tr class="memdesc:ac6eac542d9d994509f931804b8b85ff5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load A from global memory.  <a href="#ac6eac542d9d994509f931804b8b85ff5">More...</a><br /></td></tr>
+<tr class="separator:ac6eac542d9d994509f931804b8b85ff5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae324b03601b97a22f2ac6db077280c60"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt; GemmTileTraitsHelperA::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">GlobalLoadIteratorA</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">GlobalTransformerA</a></td></tr>
+<tr class="memdesc:ae324b03601b97a22f2ac6db077280c60"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default transformer for A.  <a href="#ae324b03601b97a22f2ac6db077280c60">More...</a><br /></td></tr>
+<tr class="separator:ae324b03601b97a22f2ac6db077280c60"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a366c89f8ecfbf0aef894cfb6fae25be9"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">SharedStoreIteratorA</a></td></tr>
+<tr class="memdesc:a366c89f8ecfbf0aef894cfb6fae25be9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store A to shared memory.  <a href="#a366c89f8ecfbf0aef894cfb6fae25be9">More...</a><br /></td></tr>
+<tr class="separator:a366c89f8ecfbf0aef894cfb6fae25be9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a80e36b583ccd9aa9b37d52faa090cbca"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">GlobalTransformerA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca">GlobalLoadStreamA</a></td></tr>
+<tr class="memdesc:a80e36b583ccd9aa9b37d52faa090cbca"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from global memory to shared memory.  <a href="#a80e36b583ccd9aa9b37d52faa090cbca">More...</a><br /></td></tr>
+<tr class="separator:a80e36b583ccd9aa9b37d52faa090cbca"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa190538ab678c82e379db4038af665ee"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; typename GemmTileTraitsHelperB::GlobalTileTraits, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">GlobalLoadIteratorB</a></td></tr>
+<tr class="memdesc:aa190538ab678c82e379db4038af665ee"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load B from global memory.  <a href="#aa190538ab678c82e379db4038af665ee">More...</a><br /></td></tr>
+<tr class="separator:aa190538ab678c82e379db4038af665ee"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2ca7dcd4b5157db9b9c2f92740e44184"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt; GemmTileTraitsHelperB::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">GlobalLoadIteratorB</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">GlobalTransformerB</a></td></tr>
+<tr class="separator:a2ca7dcd4b5157db9b9c2f92740e44184"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a463dddee069606fd4ecf7c386ff23fce"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">SharedStoreIteratorB</a></td></tr>
+<tr class="memdesc:a463dddee069606fd4ecf7c386ff23fce"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store B to shared memory.  <a href="#a463dddee069606fd4ecf7c386ff23fce">More...</a><br /></td></tr>
+<tr class="separator:a463dddee069606fd4ecf7c386ff23fce"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2c46c11f5fddb865645f555547c823ba"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">GlobalTransformerB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba">GlobalLoadStreamB</a></td></tr>
+<tr class="memdesc:a2c46c11f5fddb865645f555547c823ba"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from global memory to shared memory.  <a href="#a2c46c11f5fddb865645f555547c823ba">More...</a><br /></td></tr>
+<tr class="separator:a2c46c11f5fddb865645f555547c823ba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8978603203221020113ec79e3f2c0d64"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">SharedLoadIteratorA</a></td></tr>
+<tr class="memdesc:a8978603203221020113ec79e3f2c0d64"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load A from shared memory.  <a href="#a8978603203221020113ec79e3f2c0d64">More...</a><br /></td></tr>
+<tr class="separator:a8978603203221020113ec79e3f2c0d64"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaa35c4d2a90f137f50c9ccd24d5c4f5c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">SharedLoadIteratorA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c">SharedLoadStreamA</a></td></tr>
+<tr class="memdesc:aaa35c4d2a90f137f50c9ccd24d5c4f5c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from shared memory.  <a href="#aaa35c4d2a90f137f50c9ccd24d5c4f5c">More...</a><br /></td></tr>
+<tr class="separator:aaa35c4d2a90f137f50c9ccd24d5c4f5c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a14b4720b7522684a98b653d70353233a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">SharedLoadIteratorB</a></td></tr>
+<tr class="memdesc:a14b4720b7522684a98b653d70353233a"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load B from shared memory.  <a href="#a14b4720b7522684a98b653d70353233a">More...</a><br /></td></tr>
+<tr class="separator:a14b4720b7522684a98b653d70353233a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1d458fe1e416ddc4565f2b802592268b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">SharedLoadIteratorB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b">SharedLoadStreamB</a></td></tr>
+<tr class="memdesc:a1d458fe1e416ddc4565f2b802592268b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from shared memory.  <a href="#a1d458fe1e416ddc4565f2b802592268b">More...</a><br /></td></tr>
+<tr class="separator:a1d458fe1e416ddc4565f2b802592268b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae82826fde376748cf67ff2e1bcaa8cef"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef">MultiplyAdd</a></td></tr>
+<tr class="memdesc:ae82826fde376748cf67ff2e1bcaa8cef"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do the multiply-add in the main loop.  <a href="#ae82826fde376748cf67ff2e1bcaa8cef">More...</a><br /></td></tr>
+<tr class="separator:ae82826fde376748cf67ff2e1bcaa8cef"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8574faffd18e4aa8420a4e32e07b62d6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">ClearAccumulators</a>&lt; typename <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">MultiplyAdd::ScalarC</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">ClearAccumulators</a></td></tr>
+<tr class="memdesc:a8574faffd18e4aa8420a4e32e07b62d6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The object to clear accumulators.  <a href="#a8574faffd18e4aa8420a4e32e07b62d6">More...</a><br /></td></tr>
+<tr class="separator:a8574faffd18e4aa8420a4e32e07b62d6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb825b6575955a714ff24df2e142c047"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a>, EpilogueFunctor_, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">GemmEpilogueTraits</a></td></tr>
+<tr class="memdesc:aeb825b6575955a714ff24df2e142c047"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class for the epilogue.  <a href="#aeb825b6575955a714ff24df2e142c047">More...</a><br /></td></tr>
+<tr class="separator:aeb825b6575955a714ff24df2e142c047"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada2812153440cf1e678ca4c795a6e8ae"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">GemmEpilogueTraits</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae">Epilogue</a></td></tr>
+<tr class="memdesc:ada2812153440cf1e678ca4c795a6e8ae"><td class="mdescLeft">&#160;</td><td class="mdescRight">The epilogue.  <a href="#ada2812153440cf1e678ca4c795a6e8ae">More...</a><br /></td></tr>
+<tr class="separator:ada2812153440cf1e678ca4c795a6e8ae"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="aba2366bec386c74df47dfd0426b07041"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aba2366bec386c74df47dfd0426b07041">&#9670;&nbsp;</a></span>ClearAccumulators</h2>
+<a id="a8574faffd18e4aa8420a4e32e07b62d6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8574faffd18e4aa8420a4e32e07b62d6">&#9670;&nbsp;</a></span>ClearAccumulators</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">ClearAccumulators</a>&lt;typename <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">MultiplyAdd::ScalarC</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aba2366bec386c74df47dfd0426b07041">ClearAccumulators</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">ClearAccumulators</a>&lt;typename <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">MultiplyAdd::ScalarC</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8574faffd18e4aa8420a4e32e07b62d6">ClearAccumulators</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a234ae6065d5ab56135e10119d3ad2d98"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a234ae6065d5ab56135e10119d3ad2d98">&#9670;&nbsp;</a></span>Epilogue</h2>
+<a id="ada2812153440cf1e678ca4c795a6e8ae"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ada2812153440cf1e678ca4c795a6e8ae">&#9670;&nbsp;</a></span>Epilogue</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">GemmEpilogueTraits</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a234ae6065d5ab56135e10119d3ad2d98">Epilogue</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">GemmEpilogueTraits</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada2812153440cf1e678ca4c795a6e8ae">Epilogue</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a1597c776238f35bcb1acc0a8f8f9c118"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1597c776238f35bcb1acc0a8f8f9c118">&#9670;&nbsp;</a></span>GemmConfig</h2>
+<a id="a0cb18b7857c88f600c6977a1bdb3f4e4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0cb18b7857c88f600c6977a1bdb3f4e4">&#9670;&nbsp;</a></span>GemmConfig</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig</a>&lt;OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmConfig.html">HgemmConfig</a>&lt;OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a4a0f361b5c47d0ab5f3308cd3b3b6ef6"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">&#9670;&nbsp;</a></span>GemmEpilogueTraits</h2>
+<a id="aeb825b6575955a714ff24df2e142c047"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aeb825b6575955a714ff24df2e142c047">&#9670;&nbsp;</a></span>GemmEpilogueTraits</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a>, EpilogueFunctor_, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4a0f361b5c47d0ab5f3308cd3b3b6ef6">GemmEpilogueTraits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">SimplifiedGemmEpilogueTraits</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a>, EpilogueFunctor_, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aeb825b6575955a714ff24df2e142c047">GemmEpilogueTraits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a5557c86a530f5d20a35d3fa620adf417"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5557c86a530f5d20a35d3fa620adf417">&#9670;&nbsp;</a></span>GemmTileTraitsHelperA</h2>
+<a id="a4f3afb4b1f37a2c43a1935a3000b2a02"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4f3afb4b1f37a2c43a1935a3000b2a02">&#9670;&nbsp;</a></span>GemmTileTraitsHelperA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a>&lt;kLayoutA_, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a5557c86a530f5d20a35d3fa620adf417">GemmTileTraitsHelperA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperA.html">HgemmTileTraitsHelperA</a>&lt;kLayoutA_, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a4f3afb4b1f37a2c43a1935a3000b2a02">GemmTileTraitsHelperA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a8768c2b03bea0c3601c47dde2bc7ca89"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8768c2b03bea0c3601c47dde2bc7ca89">&#9670;&nbsp;</a></span>GemmTileTraitsHelperB</h2>
+<a id="ada910ee63493bc3c70f7395127268a1d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ada910ee63493bc3c70f7395127268a1d">&#9670;&nbsp;</a></span>GemmTileTraitsHelperB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a>&lt;kLayoutB_, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1597c776238f35bcb1acc0a8f8f9c118">GemmConfig</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8768c2b03bea0c3601c47dde2bc7ca89">GemmTileTraitsHelperB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTileTraitsHelperB.html">HgemmTileTraitsHelperB</a>&lt;kLayoutB_, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a0cb18b7857c88f600c6977a1bdb3f4e4">GemmConfig</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ada910ee63493bc3c70f7395127268a1d">GemmTileTraitsHelperB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ab8a3def34300afb5745453d0b33204aa"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab8a3def34300afb5745453d0b33204aa">&#9670;&nbsp;</a></span>GlobalLoadIteratorA</h2>
+<a id="ac6eac542d9d994509f931804b8b85ff5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac6eac542d9d994509f931804b8b85ff5">&#9670;&nbsp;</a></span>GlobalLoadIteratorA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;typename GemmTileTraitsHelperA::GlobalTileTraits, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">GlobalLoadIteratorA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;typename GemmTileTraitsHelperA::GlobalTileTraits, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">GlobalLoadIteratorA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a95559f28cab076da723e4cb24351116e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a95559f28cab076da723e4cb24351116e">&#9670;&nbsp;</a></span>GlobalLoadIteratorB</h2>
+<a id="aa190538ab678c82e379db4038af665ee"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa190538ab678c82e379db4038af665ee">&#9670;&nbsp;</a></span>GlobalLoadIteratorB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;typename GemmTileTraitsHelperB::GlobalTileTraits, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">GlobalLoadIteratorB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;typename GemmTileTraitsHelperB::GlobalTileTraits, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">GlobalLoadIteratorB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a2aaece6093100c71c4d587994200e3bb"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2aaece6093100c71c4d587994200e3bb">&#9670;&nbsp;</a></span>GlobalLoadStreamA</h2>
+<a id="a80e36b583ccd9aa9b37d52faa090cbca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a80e36b583ccd9aa9b37d52faa090cbca">&#9670;&nbsp;</a></span>GlobalLoadStreamA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">GlobalTransformerA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2aaece6093100c71c4d587994200e3bb">GlobalLoadStreamA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">GlobalTransformerA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a80e36b583ccd9aa9b37d52faa090cbca">GlobalLoadStreamA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="abaf5f16ab0b215b406766ecadab29394"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abaf5f16ab0b215b406766ecadab29394">&#9670;&nbsp;</a></span>GlobalLoadStreamB</h2>
+<a id="a2c46c11f5fddb865645f555547c823ba"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2c46c11f5fddb865645f555547c823ba">&#9670;&nbsp;</a></span>GlobalLoadStreamB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">GlobalTransformerB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abaf5f16ab0b215b406766ecadab29394">GlobalLoadStreamB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">GlobalTransformerB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2c46c11f5fddb865645f555547c823ba">GlobalLoadStreamB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a3fb86b6d3e353df6b752510d64c5e647"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3fb86b6d3e353df6b752510d64c5e647">&#9670;&nbsp;</a></span>GlobalTransformerA</h2>
+<a id="ae324b03601b97a22f2ac6db077280c60"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae324b03601b97a22f2ac6db077280c60">&#9670;&nbsp;</a></span>GlobalTransformerA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt;GemmTileTraitsHelperA::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ab8a3def34300afb5745453d0b33204aa">GlobalLoadIteratorA</a>&gt;::Transformer <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a3fb86b6d3e353df6b752510d64c5e647">GlobalTransformerA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerA.html">HgemmTransformerA</a>&lt;GemmTileTraitsHelperA::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac6eac542d9d994509f931804b8b85ff5">GlobalLoadIteratorA</a>&gt;::Transformer <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae324b03601b97a22f2ac6db077280c60">GlobalTransformerA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7b4de712868095200a338802c1fbb3de"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7b4de712868095200a338802c1fbb3de">&#9670;&nbsp;</a></span>GlobalTransformerB</h2>
+<a id="a2ca7dcd4b5157db9b9c2f92740e44184"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2ca7dcd4b5157db9b9c2f92740e44184">&#9670;&nbsp;</a></span>GlobalTransformerB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt;GemmTileTraitsHelperB::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a95559f28cab076da723e4cb24351116e">GlobalLoadIteratorB</a>&gt;::Transformer <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7b4de712868095200a338802c1fbb3de">GlobalTransformerB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1HgemmTransformerB.html">HgemmTransformerB</a>&lt;GemmTileTraitsHelperB::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aa190538ab678c82e379db4038af665ee">GlobalLoadIteratorB</a>&gt;::Transformer <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a2ca7dcd4b5157db9b9c2f92740e44184">GlobalTransformerB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ae9facf63912d98e597883bf7efb56cc8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae9facf63912d98e597883bf7efb56cc8">&#9670;&nbsp;</a></span>MultiplyAdd</h2>
+<a id="ae82826fde376748cf67ff2e1bcaa8cef"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae82826fde376748cf67ff2e1bcaa8cef">&#9670;&nbsp;</a></span>MultiplyAdd</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a> <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae9facf63912d98e597883bf7efb56cc8">MultiplyAdd</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a> <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ae82826fde376748cf67ff2e1bcaa8cef">MultiplyAdd</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a1bbb198a50b5f01a0502df44bb678620"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1bbb198a50b5f01a0502df44bb678620">&#9670;&nbsp;</a></span>SharedLoadIteratorA</h2>
+<a id="a8978603203221020113ec79e3f2c0d64"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8978603203221020113ec79e3f2c0d64">&#9670;&nbsp;</a></span>SharedLoadIteratorA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">SharedLoadIteratorA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">SharedLoadIteratorA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a8d09409973094ca2a17633776a64a303"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8d09409973094ca2a17633776a64a303">&#9670;&nbsp;</a></span>SharedLoadIteratorB</h2>
+<a id="a14b4720b7522684a98b653d70353233a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a14b4720b7522684a98b653d70353233a">&#9670;&nbsp;</a></span>SharedLoadIteratorB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">SharedLoadIteratorB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">SharedLoadIteratorB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a21c860cc877df13d22dd30eeb5e2b06b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a21c860cc877df13d22dd30eeb5e2b06b">&#9670;&nbsp;</a></span>SharedLoadStreamA</h2>
+<a id="aaa35c4d2a90f137f50c9ccd24d5c4f5c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aaa35c4d2a90f137f50c9ccd24d5c4f5c">&#9670;&nbsp;</a></span>SharedLoadStreamA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1bbb198a50b5f01a0502df44bb678620">SharedLoadIteratorA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a21c860cc877df13d22dd30eeb5e2b06b">SharedLoadStreamA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8978603203221020113ec79e3f2c0d64">SharedLoadIteratorA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#aaa35c4d2a90f137f50c9ccd24d5c4f5c">SharedLoadStreamA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ac5eeca1e91f0e0d4dd48d432d5213215"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac5eeca1e91f0e0d4dd48d432d5213215">&#9670;&nbsp;</a></span>SharedLoadStreamB</h2>
+<a id="a1d458fe1e416ddc4565f2b802592268b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1d458fe1e416ddc4565f2b802592268b">&#9670;&nbsp;</a></span>SharedLoadStreamB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a8d09409973094ca2a17633776a64a303">SharedLoadIteratorB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#ac5eeca1e91f0e0d4dd48d432d5213215">SharedLoadStreamB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a14b4720b7522684a98b653d70353233a">SharedLoadIteratorB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a1d458fe1e416ddc4565f2b802592268b">SharedLoadStreamB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7f022d423d42d4081cefa7eb26b4d5b4"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7f022d423d42d4081cefa7eb26b4d5b4">&#9670;&nbsp;</a></span>SharedStoreIteratorA</h2>
+<a id="a366c89f8ecfbf0aef894cfb6fae25be9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a366c89f8ecfbf0aef894cfb6fae25be9">&#9670;&nbsp;</a></span>SharedStoreIteratorA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a7f022d423d42d4081cefa7eb26b4d5b4">SharedStoreIteratorA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a366c89f8ecfbf0aef894cfb6fae25be9">SharedStoreIteratorA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="abe3383e7338c08841fd8f0bfb1090448"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abe3383e7338c08841fd8f0bfb1090448">&#9670;&nbsp;</a></span>SharedStoreIteratorB</h2>
+<a id="a463dddee069606fd4ecf7c386ff23fce"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a463dddee069606fd4ecf7c386ff23fce">&#9670;&nbsp;</a></span>SharedStoreIteratorB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename EpilogueFunctor_ , typename ThreadGemmShape_ , int kScalarsPerLdgA_ = 2, int kScalarsPerLdgB_ = 2, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#abe3383e7338c08841fd8f0bfb1090448">SharedStoreIteratorB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html">cutlass::gemm::HgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1HgemmTraitsHelper.html#a463dddee069606fd4ecf7c386ff23fce">SharedStoreIteratorB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -452,7 +452,7 @@ template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA.html
index 505f08a55..971b59270 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
index 7846aeebf..13fdca496 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
index 092d948b9..162e5cd23 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Iterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
index 4877f0011..69a96f49f 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
index 8837b6996..540f7a7d1 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Iterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB.html
index 99325439a..acddad07a 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
index fdfc6a003..007e2fd31 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
index 93727e276..73c853d11 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Iterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
index e655326e5..1f1b6e245 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
index 013566c2f..d1d5706b1 100644
--- a/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1HgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Iterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IdentityBlockSwizzle-members.html b/docs/structcutlass_1_1gemm_1_1IdentityBlockSwizzle-members.html
index 748a3a495..120fa5588 100644
--- a/docs/structcutlass_1_1gemm_1_1IdentityBlockSwizzle-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IdentityBlockSwizzle-members.html
@@ -79,12 +79,15 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#abfde9b316173b1c0b8622cf22ffb6d68">IdentityBlockSwizzle</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">swizzle</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a8f84a2b830caecff3edd052dc24635e6">get_batch_id</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#afc20f302a5cc5b736cfc1c91dfcaa57c">get_grid_layout</a>(GemmCoord const &amp;problem_size, Coord&lt; 3 &gt; const &amp;OutputTile)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a386e5cf702b0dcc3d57f9fdb4ab5d236">get_threadblock_offset</a>(Coord&lt; 3 &gt; const &amp;OutputTile)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a046a5dfd01164df2abd514e9a52987c3">IdentityBlockSwizzle</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">swizzle</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html b/docs/structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html
index 68a70c7b3..02f1b0715 100644
--- a/docs/structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html
+++ b/docs/structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html
@@ -80,20 +80,26 @@ $(function() {
 </div><!--header-->
 <div class="contents">
 
-<p><code>#include &lt;<a class="el" href="identity__block__swizzle_8h_source.html">identity_block_swizzle.h</a>&gt;</code></p>
+<p><code>#include &lt;<a class="el" href="threadblock__swizzle_8h_source.html">threadblock_swizzle.h</a>&gt;</code></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:abfde9b316173b1c0b8622cf22ffb6d68"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#abfde9b316173b1c0b8622cf22ffb6d68">IdentityBlockSwizzle</a> ()</td></tr>
-<tr class="memdesc:abfde9b316173b1c0b8622cf22ffb6d68"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#abfde9b316173b1c0b8622cf22ffb6d68">More...</a><br /></td></tr>
-<tr class="separator:abfde9b316173b1c0b8622cf22ffb6d68"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a046a5dfd01164df2abd514e9a52987c3"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a046a5dfd01164df2abd514e9a52987c3">IdentityBlockSwizzle</a> ()</td></tr>
+<tr class="memdesc:a046a5dfd01164df2abd514e9a52987c3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor. aka ColumnMajorBlockSwizzle&lt;1&gt;  <a href="#a046a5dfd01164df2abd514e9a52987c3">More...</a><br /></td></tr>
+<tr class="separator:a046a5dfd01164df2abd514e9a52987c3"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a0a366c072ee66bbcb390acd7b8bbe5f8"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">swizzle</a> ()</td></tr>
 <tr class="memdesc:a0a366c072ee66bbcb390acd7b8bbe5f8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Swizzle the block index.  <a href="#a0a366c072ee66bbcb390acd7b8bbe5f8">More...</a><br /></td></tr>
 <tr class="separator:a0a366c072ee66bbcb390acd7b8bbe5f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afc20f302a5cc5b736cfc1c91dfcaa57c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#afc20f302a5cc5b736cfc1c91dfcaa57c">get_grid_layout</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> const &amp;problem_size, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;OutputTile)</td></tr>
+<tr class="separator:afc20f302a5cc5b736cfc1c91dfcaa57c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a386e5cf702b0dcc3d57f9fdb4ab5d236"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a386e5cf702b0dcc3d57f9fdb4ab5d236">get_threadblock_offset</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;OutputTile)</td></tr>
+<tr class="separator:a386e5cf702b0dcc3d57f9fdb4ab5d236"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f84a2b830caecff3edd052dc24635e6"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a8f84a2b830caecff3edd052dc24635e6">get_batch_id</a> ()</td></tr>
+<tr class="separator:a8f84a2b830caecff3edd052dc24635e6"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="abfde9b316173b1c0b8622cf22ffb6d68"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#abfde9b316173b1c0b8622cf22ffb6d68">&#9670;&nbsp;</a></span>IdentityBlockSwizzle()</h2>
+<a id="a046a5dfd01164df2abd514e9a52987c3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a046a5dfd01164df2abd514e9a52987c3">&#9670;&nbsp;</a></span>IdentityBlockSwizzle()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -102,7 +108,7 @@ Public Member Functions</h2></td></tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE cutlass::gemm::IdentityBlockSwizzle::IdentityBlockSwizzle </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> cutlass::gemm::IdentityBlockSwizzle::IdentityBlockSwizzle </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -118,6 +124,93 @@ Public Member Functions</h2></td></tr>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
+<a id="a8f84a2b830caecff3edd052dc24635e6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8f84a2b830caecff3edd052dc24635e6">&#9670;&nbsp;</a></span>get_batch_id()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE int cutlass::gemm::IdentityBlockSwizzle::get_batch_id </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="afc20f302a5cc5b736cfc1c91dfcaa57c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afc20f302a5cc5b736cfc1c91dfcaa57c">&#9670;&nbsp;</a></span>get_grid_layout()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dim3 cutlass::gemm::IdentityBlockSwizzle::get_grid_layout </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>problem_size</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>OutputTile</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a386e5cf702b0dcc3d57f9fdb4ab5d236"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a386e5cf702b0dcc3d57f9fdb4ab5d236">&#9670;&nbsp;</a></span>get_threadblock_offset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; cutlass::gemm::IdentityBlockSwizzle::get_threadblock_offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>OutputTile</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
 <a id="a0a366c072ee66bbcb390acd7b8bbe5f8"></a>
 <h2 class="memtitle"><span class="permalink"><a href="#a0a366c072ee66bbcb390acd7b8bbe5f8">&#9670;&nbsp;</a></span>swizzle()</h2>
 
@@ -144,12 +237,12 @@ Public Member Functions</h2></td></tr>
 </div>
 </div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
-<li><a class="el" href="identity__block__swizzle_8h_source.html">identity_block_swizzle.h</a></li>
+<li><a class="el" href="threadblock__swizzle_8h_source.html">threadblock_swizzle.h</a></li>
 </ul>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmConfig-members.html b/docs/structcutlass_1_1gemm_1_1IgemmConfig-members.html
index bb78c951e..a3ae8ada2 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmConfig-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmConfig-members.html
@@ -73,41 +73,44 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmConfig.html b/docs/structcutlass_1_1gemm_1_1IgemmConfig.html
index cbcfef456..89ac24e89 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmConfig.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmConfig.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -75,93 +75,102 @@ $(function() {
   <div class="summary">
 <a href="structcutlass_1_1gemm_1_1IgemmConfig-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::IgemmConfig&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1IgemmConfig.png" usemap="#cutlass::gemm::IgemmConfig_3C_20OutputTile_5F_2C_20ScalarD_5F_2C_20AccumulatorsPerThread_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::IgemmConfig_3C_20OutputTile_5F_2C_20ScalarD_5F_2C_20AccumulatorsPerThread_5F_20_3E_map" name="cutlass::gemm::IgemmConfig_3C_20OutputTile_5F_2C_20ScalarD_5F_2C_20AccumulatorsPerThread_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;" shape="rect" coords="0,0,1122,24"/>
+  <img src="structcutlass_1_1gemm_1_1IgemmConfig.png" usemap="#cutlass::gemm::IgemmConfig_3C_20OutputTile_5F_2C_20ScalarD_5F_2C_20ThreadGemmShape_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::IgemmConfig_3C_20OutputTile_5F_2C_20ScalarD_5F_2C_20ThreadGemmShape_5F_20_3E_map" name="cutlass::gemm::IgemmConfig_3C_20OutputTile_5F_2C_20ScalarD_5F_2C_20ThreadGemmShape_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;" shape="rect" coords="0,0,1203,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td></tr>
-<tr class="memitem:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a></td></tr>
-<tr class="memdesc:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">More...</a><br /></td></tr>
-<tr class="separator:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a></td></tr>
-<tr class="memdesc:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">More...</a><br /></td></tr>
-<tr class="separator:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef ScalarD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a></td></tr>
-<tr class="memdesc:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">More...</a><br /></td></tr>
-<tr class="separator:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef ScalarD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a></td></tr>
-<tr class="memdesc:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">More...</a><br /></td></tr>
-<tr class="separator:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a></td></tr>
-<tr class="memdesc:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">More...</a><br /></td></tr>
-<tr class="separator:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a></td></tr>
-<tr class="memdesc:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">More...</a><br /></td></tr>
-<tr class="separator:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a></td></tr>
-<tr class="memdesc:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">More...</a><br /></td></tr>
-<tr class="separator:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a></td></tr>
-<tr class="memdesc:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">More...</a><br /></td></tr>
-<tr class="separator:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a></td></tr>
-<tr class="memdesc:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">More...</a><br /></td></tr>
-<tr class="separator:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a></td></tr>
-<tr class="memdesc:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">More...</a><br /></td></tr>
-<tr class="separator:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2 &gt;</a></td></tr>
-<tr class="memitem:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td></tr>
-<tr class="memdesc:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">More...</a><br /></td></tr>
-<tr class="separator:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a></td></tr>
-<tr class="memdesc:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">More...</a><br /></td></tr>
-<tr class="separator:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a></td></tr>
-<tr class="memdesc:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">More...</a><br /></td></tr>
-<tr class="separator:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:accc95abc55880abdab92253367b4b186 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a></td></tr>
-<tr class="separator:accc95abc55880abdab92253367b4b186 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa1b75484138923a52b32888fef608d9b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a></td></tr>
-<tr class="separator:aa1b75484138923a52b32888fef608d9b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a></td></tr>
-<tr class="memdesc:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">More...</a><br /></td></tr>
-<tr class="separator:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac0c8c027e3ede14b62d7c7d519551f21 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a></td></tr>
-<tr class="separator:ac0c8c027e3ede14b62d7c7d519551f21 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a86470d3a44e2b50ee31ec3c9f79927ef inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a></td></tr>
-<tr class="separator:a86470d3a44e2b50ee31ec3c9f79927ef inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a></td></tr>
-<tr class="memdesc:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">More...</a><br /></td></tr>
-<tr class="separator:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a></td></tr>
-<tr class="memdesc:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">More...</a><br /></td></tr>
-<tr class="separator:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3087cdd38e2c65ad0dffdd0587d2cce0 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a></td></tr>
-<tr class="separator:a3087cdd38e2c65ad0dffdd0587d2cce0 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adaf2ee5b8e6f7bdb9939cd45a186ca56 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a></td></tr>
-<tr class="separator:adaf2ee5b8e6f7bdb9939cd45a186ca56 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a></td></tr>
-<tr class="memdesc:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">More...</a><br /></td></tr>
-<tr class="separator:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9dd092bca2f1f2c039f367b23bafa9c1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a></td></tr>
-<tr class="separator:a9dd092bca2f1f2c039f367b23bafa9c1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a></td></tr>
-<tr class="memdesc:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">More...</a><br /></td></tr>
-<tr class="separator:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td></tr>
+<tr class="memitem:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a></td></tr>
+<tr class="memdesc:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">More...</a><br /></td></tr>
+<tr class="separator:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a></td></tr>
+<tr class="memdesc:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">More...</a><br /></td></tr>
+<tr class="separator:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef ScalarD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a></td></tr>
+<tr class="memdesc:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">More...</a><br /></td></tr>
+<tr class="separator:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef ScalarD_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a></td></tr>
+<tr class="memdesc:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">More...</a><br /></td></tr>
+<tr class="separator:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a></td></tr>
+<tr class="memdesc:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">More...</a><br /></td></tr>
+<tr class="separator:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a></td></tr>
+<tr class="memdesc:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">More...</a><br /></td></tr>
+<tr class="separator:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a></td></tr>
+<tr class="memdesc:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">More...</a><br /></td></tr>
+<tr class="separator:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of warp-level GEMM.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">More...</a><br /></td></tr>
+<tr class="separator:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a></td></tr>
+<tr class="memdesc:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">More...</a><br /></td></tr>
+<tr class="separator:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a></td></tr>
+<tr class="memdesc:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">More...</a><br /></td></tr>
+<tr class="separator:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, ScalarD_, ScalarD_, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 1, 4, 1, 2, false, false, false &gt;</a></td></tr>
+<tr class="memitem:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td></tr>
+<tr class="memdesc:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">More...</a><br /></td></tr>
+<tr class="separator:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td></tr>
+<tr class="memdesc:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">More...</a><br /></td></tr>
+<tr class="separator:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td></tr>
+<tr class="memdesc:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">More...</a><br /></td></tr>
+<tr class="separator:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td></tr>
+<tr class="separator:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td></tr>
+<tr class="separator:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td></tr>
+<tr class="memdesc:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">More...</a><br /></td></tr>
+<tr class="separator:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td></tr>
+<tr class="separator:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td></tr>
+<tr class="separator:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td></tr>
+<tr class="memdesc:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">More...</a><br /></td></tr>
+<tr class="separator:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td></tr>
+<tr class="memdesc:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">More...</a><br /></td></tr>
+<tr class="separator:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td></tr>
+<tr class="separator:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td></tr>
+<tr class="separator:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td></tr>
+<tr class="memdesc:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">More...</a><br /></td></tr>
+<tr class="separator:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td></tr>
+<tr class="separator:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td></tr>
+<tr class="memdesc:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">More...</a><br /></td></tr>
+<tr class="separator:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td></tr>
+<tr class="memdesc:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, mainloop is instantiated twice. The first instantiation contains no predicate.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">More...</a><br /></td></tr>
+<tr class="separator:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td></tr>
+<tr class="memdesc:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, residue is computed in the prologue.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">More...</a><br /></td></tr>
+<tr class="separator:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td></tr>
+<tr class="memdesc:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, kernel is launched with launch bounds specified.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">More...</a><br /></td></tr>
+<tr class="separator:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <hr/>The documentation for this struct was generated from the following file:<ul>
 <li><a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a></li>
@@ -169,7 +178,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmConfig.png b/docs/structcutlass_1_1gemm_1_1IgemmConfig.png
index 13377f8425277abc8597ac1ea80ae7bae781163c..75e0a6a4e4602a379b7c4e067882914814e96eb9 100644
GIT binary patch
literal 2581
zcmds(_g5478pa0^R8Y}H0jaWtrXXMvQKQ%>hHj)7BY~x4X(1>qN)gLNBQ3}X2tgDD
zqLKg`BGQwfAT<P~2@ydlQlv(Dy92KGr~M1=oHO&jGxMC8Gtc{cKW8Fst<APc$V&hK
zunm3I7y|$sSx|4gSrj_9zO5!fMb6gJ&SZ6U6>2A@2WfBqx({{hJD1D7z`W)Foo)`q
zSf2+V(c0EpXLk?)wq&A>PuX1)8BH4jdl}nJWK*+)SIvxuDrIvGC|%M6VW_HMirbcm
z`-g5s8kkDE#b~^fvx+gG%DFw-^$fNLeGqhq)t>#3aDfFCFdn9chP&}VsF;E=FkTGO
z0xD}N1iVe>m$)GivHutu=Jfk9Be3N;adIwav~YDns4KKm66bZ&WjRY918*1iIh8m%
z#3_~;k!;kM@tNCew_^SBQ-m!E-BV(BA1Z0xuIjO?NSpD>EKIfmFMh%Wqy<`-o6cwJ
zWLwufDOPf)oqG??Fi*@F20r9DH!&P*%`tJWt7<-2M3|{hwE22Yk7?uvJCZu#t>$Xz
zBh_Bvv_Et^##Fz()V3JB9tPU6vch3YaIvdx&);{qw#9ub$rv!rF2f{FJtLBr;st*Y
z%p-@rCsISFHB!x4Gtnc#70(Mz7Oo1~S61eaFJhdul}hhcu}a(8TaT}VF+1Ji39^E8
zZ203)i8fKZnrGjn%=mFN{@G}FO)Bd^9^=-miSS+$LW5dhS(YYb`{nl$J{v`T@gPUL
zr0&zc^O?q9w7Y{~U<=zXVfsP4a|0!<VmwrzTH${h6tC$-+L&{UZkGD)<JCn6DM$>*
z^eqc_<m=6=&o$=0(rW8cAfhHKY1$`y34$N7<)oC6>_+4`hD8<d5p;p0AQn8(nOtNS
zHKo(sGy>PQb`9&u_+6{z6;=XFFc>&*x=5?I+MI7QmQ(zRQSkZixm^^MlC*XPt#gyM
zQvYK;0qoqLRQnQjtJX{DbgxKze8Z`IrhmT4pKZovmyhP_i#N0t*Zcf!={oxxyQiy#
z;k~Gdu)t_((MEh6bPMfwCu$n7zn|Ng8SGnXfvIBJC=q+pr+U3#)|4Y1ACYd9j|E)D
zT?$0iS*ESLz8dssTXB&e%VVgVa6F25V(IIL5WJiZQe0bUC}I4&DT2-@3q{h4CSMO+
zJQSXel`T8b#PGO?u6t4ChAPD9$ji50vnC8au8j0Bi&B3;Z7DAtI`hQg6*1ELFWc)o
zm!A;|Lg*?!@$)`@<di)jmKG<pBLqae6bVW9ElH|GkoXu@NRS%UUU{&5`h2Bhks=+k
zGJvX%*7cqogiT*y;Wg%K3v9kt=Bt@Bp_UqH<gj7S*{`HP%U;t}3#vVWpp4t?W5zNH
zKs7YrMwTY(GuRyj$^FfYX`}Hj&dbUK!=l?W@$V+v#$L=M9WM00VZ)*x@VW;kT;`$Z
z>B#<2zoXQ@4xbO6nGZ}m^I1innpo-3rGl|Fxg0_^X{zlNSV=7;yr01#=bw6ZIJYyd
zlvDH-qxodNad?0=tCJi=wgR)PSmC>Zf@hB|JLcrr(A$qTuiz!pnDbXh@g?j$yz|KN
zLNMs0Q!8HG5Y_t7zd1I~&_>vj8%!GWs*8qeQQ@4p#jo*ZudE-+=WrO#`31l6I;Bd^
zcarP3@2UXr9WQcJX7vSKIq~&D2<?t-qo%fkX7rF6iz1(3=rmcD#JkmzE;vPqn)NxQ
zxmat#VZO6hKo5O{XwleIHl;q~(3o@3^SbVjZlMuU7&}k0cnZ577o<3zfufYZD*A%(
zgQKEy;BTF;pdJ*L5@A`raGv=c2QZw>w151@+35(BT2Bo$v29EE`_RD{y*sLCWWUmW
zbhn12yMHseqFWuyITw(mgO>jS=PexBhF<VkY1{`QHg$K7vd50iufV`nhk~;oZh%t%
z1DHE(sGUhbuOrSBB)o$LzJ|CxXzCuHq<=u@MPOjpc?ia5rUZLBtaB1!@XpgU=6$7H
z?;}7C5cOBN0c^b~q7R6>U>I0HoD0a^jGPx%KNE9VyPhoTBlGjFt1{^EegmZA0+!K8
zNk|8X>Ki)f0HTnP+i-#P^Dz)^e~KDneu*H|{y&JgyoepQx2SHEKD}8ZVu$5sRZ9tx
zbr)O!S|#-#yY~FD3$h*%Uo$g>Nf3doasi+jiRtf-6D<zcI0KKU-n94IB#vL||Dr+p
zaUQ=ygDNS@DH{-}K|2706Jdgsr%`WpfeF3~Z$okvhlb5#i|0>Tdq>R@yQkY%jL%3G
z#!~QE8e{_f77plnQb84)AkK`eTvm=7=acx|%BwRR`sJxL^n*XXhrX@6RxlSVTw;Z`
zKg;I}5!$Eui7p)*?^8w#iE#qOdMTXKA$mYThp#X)sYzjR#2tcs?HRowKy(5LeTXw*
z=*hBkuPWCFoaJw?XFt+!c$g=HcXuO=USd(LQwaSZl571)-E_RNPg`zIY-H!+{)6|&
z^y}?3gQDfQP*6p}Qk=GepRMfnqB1C44@wqgqbH>?CM&G0nNjCu%u4cl;MhTv<``1N
zB5sFlDt;z*)=b_^pj30$Ub3ei3K!e*JWF}>wU6mj#S<ENvm#OFrty4#V^+TM@<~>b
z6_5bi>ATY})rgM8<zI=FN88i*FGEp5bQ!MW`rDHTi9`V=`3*Y*d;INAUUth=CPAbH
zCbKPP#h4YMu&3rE>Dy>xmoCs<1zG6<(sYsZ9MjR+0z$drG4GD7Q?o`^1+KAyPna3l
z*oEN(mxgRh52sS?$!v2!L(#OuB}^O>U{jEiJ%R{F!(%J#kbzd>NOPyIkJ{+C>W}L9
zFGAh|$9t(&;bZmiebb8(c&$@y1Eq5wl6p8R!}5>rBHyJF3H{Q<r+RVATXihH<HD=r
z#Wq2)SsQJhK^UQZ`&I5@%Lb0}Hm=8~9e^~n(B>Y_9m#tNS2(osh1?Hi?A|gX74ZO`
zLJzFt^vEzE-m?f9x1xO)H+V5GHh5LVAx>d~i|fAz^XFp!m-Ir|*sPko<FvkNgv;s8
f6%jk$JX(_SkeRSU9W7e>=>yOv*2cM~U2gvub*sTY

literal 2603
zcmd5-c{r47AAUQeNa~D^ED`2SDNECc4vJ`)VKTDit573TVj`3ZQCdt{GGmz~+p(2x
zXfl?OnM7kNC(1U~#*#FdB1?n$M*6;gzw7+>J=gU<@BQ4*@4c_<exK`iKLkey+l_Ln
zasU8qL?Mqj0f01Cf*sdONoJqTP-V$W*%9r65R1hUDE$60ukP|g3HtePI2`w~t8S9z
z`Vc1vXFyW4GTt}4>;nMVYSfX#E?3tG(uRqXyXc6mJlE;vgvDG^x8|C%4z1v^K9+OQ
zm--aT^}f@oc%Cr>&%-hCyjCWj*2Bb~l%jzusC~q<U=y-kP7n4I5EFCmxML*@F%g8K
zHk8$`0vn<dmaxLu5Mx38v)ZuHL*N9oSpY=^zf!6==gs~xGk#KtS2v)>9mim9`0Km~
zA4%&sD?F*7k&&AJwj0@g8+Z31ZErC8=<=0nR}>ZYuMtFw!IVAmx3;PhTa(6cDu!rN
zq|YURabBa(j#@3J@lZIK1_Km<Zr2)dKXp1*zeH~-R`}W7lj?CIqMFcF!!qGhuAh0B
z(|C<K<=fqI{(2*9KbKCae^f3ug9N7os81>$n1IfyOm$Y#qqg$Dw$Y6&>GjdiXSBr4
z0wegu66oxTEtnmox48xK*xVD}moB}|6EPQz%hcTaXlEk(UB50hTvWt0hQ35F$b9Op
zgA-xWj1$Z6Shx`lU(@LBy^P5aug~sAHZy2%D6EZ;5L_~8Y_BoKC!Ig~ZMH+UVz|q~
z_Hi-!S%AS8dnaYrB=1u%T%FWC;yhBwqodtMQQ+kf^#s+CI(*<;0SMn}eyhG-)$Hzl
zo$PCo81y`3D)IQ09_?aU$-r6oy9bjv?o9OaskHrDCEgkJ@)g@b+=)r<+P@7<$p;F<
z4z)a%TR^v?LU3Qb!s?>27p(Ej-rA~aLzLVReRVgtn!Om+C%PFm1HD19xa{u+eu$vO
zT%HI5Z+3Y|cHCRGuKH|EQs%4ODK?4iWOVn|zD%gK%R;FESr9x<%kj(VIXHWB&JkNJ
zU~9pMcG^cxQpvTVdp~}+EA@I@nDH#NM|*DfpH7sgZlDj=k+?-RI4#*FJx9OAIO<pj
zU7u^<!T6rXCh0|fyplpWv~=d}64#H=gISKz)UD%3B(|T=5BCX0V1xD-C6hyZ-<iRa
zCn{4cgv)p8&GVCUEC=s%t9)*5M>Y?Ic1=f<*6XB#dHT1gw9NKPZ~R2WocK%~Jmd?z
z+U!QbuIP0r99s{T&7^UuL9-N|FU}$I&<%DHxep3Oe6+uy34^otKuDyTS+sNbbeJ1a
zdqd42Ng1UIs}b0u4yKatq0Fl$P$9fXT^N56OnyVMM<ibKBG#Qx@OjjcqxdB8DKY<B
zlgFG7fsmEcUG2UTGHq7T(OUDYByk;~C!nQA(7D^HcDt*KZJ4Q{;LWFDmGR%d%z?OG
z>GF;p<$U;5U_n^3-$flru&J|sXb!`=#6kwrQJ>=Qp@H(pllbEhMSGlPE5hloJ)2OM
z(eb$~Bkqo`Kfb-0j5vvv5w&1`#N18(W>(Qfx#rV<<OZ@e0eNunpu<SkCK0{g4`Ur+
znA~(=G5^XY-=e~~)UieMlr&x;_j-d~@v?kH|GdG#OZ1Jgh{_6G%(;iExS+W!#mdm$
ze80HaoubrIH{J*Cn)t#(**%?@f+TA4n5C6#gLb&L7sLBWSj0B_7$+z7*B5lN@aSyo
zQzzr!`nT6Cys=}?-8Y4?K3*YGW@-z+OQK{(;pGNbV#>FH-CK(-HY|k=1iY@<EA}2G
z=CEVBZe|2bj-;o$aC=Qf=FBE}F_DK_WRu8&)5!MYmCR-jGqd+8IUEEWrOLnv5mS4d
zBbDxg-$(rHh|5X_WBd@W!YyNJqw~l2v>NUh+i6Xl@mWrD1t-`qGJ5eIb7KEmapWIF
zaOvE9?tkMe7WDZi2{)nx<1z6#9`m(7k4agLPNp;<bsBiHu#N*Lub|G;gf)8s84ggy
z&xkC7tsvznA9pMuA0^=@D|KV{uTX$gshs^!O6Ih#($6pDIaYeV>Lp>jS}%#(Rar^U
zuFC4wL!?fxY`Vwn_$9RYKSEk5|KCDGs<}y6JKcsPr~A6OTb%85{W4eG$#Wz(4X|P-
z>VH@l?zs45$()sn+f}j2a%9$jENz=9gEr0&eo7dwn`rXZh)Os4=6v*?L$oVZA3z66
z0pXkM<vFSIUEtV7_(Rz!t)4TVSr%!S5Z~dlx4h9%9oV=C_;~48ovDV&MD)^c5d$TH
z!T!o?kz$S7cM1n!{;{DCGEC+y-m|6(OxyawJDws&kM!U1{GKwdcl>yCcAZYOFubQK
zUr>JRodxTdn*UXX#l}~!oud0BmJkPC0xjoRSt?srGCbh6aCGC#%J2%|K%*i-#dIx!
zV5j5~#GLXN@I<1an!bXX=ZAOm7HBa%6H!M&c{Gx-Sgi$go*}Gpw-NL+g|q-XbLaIf
z+iZ*1<*JcXMCmkp^mqsYo8Dneugg<o!wHnLhIihf&}rgvxMw*)A**F7Jdo$?ll<Zq
zWxG~S5jT!1J^Z!SQZ-GXRi2JSf24UKTZ0t=iq0))op%R)M_ySq2*b;K>N`C8;nDN@
zZTXju$Zalb1oY}4Ql+sd(rp7ZS*t-8D1oBlnMii%8%R=)N`HmbEItPbuBqG&<1dh!
zN1L)XPwZQ3^zt{UQhCV{?4xQZha!~{zKT4to@&grLqF#Hsl8_SaY16I%1#JekuZF}
zs?gR)3C!D2X{k;Jb#(kS{nsKxs>(P(xRgY}v^m=<AaeWrFvC%Pm*<PHxUM<JF@CFX
z87Cg}dW#9jjPK8iGrE&54L<XHUr;IxE)?Wt7;8njZLIqY3-c9S?qm&_ALTuI1y#03
z$A*yABuyxNPI;*9(x0LX^^Ubu6-x8hjR2V;Iu{}(Jhwj7kQ3W-7f|2&oURwh`Vo1E
zEk6bih%zi&CvzHblQiVK^(lkNwohVe#U#K1^cwzAXZC@4Nls|pT(XlL>}Ol}$cm*N
W)elt?vV2Ve$v`0-j+9uPzV&a$MyQDZ

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4-members.html
new file mode 100644
index 000000000..3dde63bd1
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4-members.html
@@ -0,0 +1,118 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html">IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html">cutlass::gemm::IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html
new file mode 100644
index 000000000..d5162c70a
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html
@@ -0,0 +1,186 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.html">IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::IgemmConfig&lt; OutputTile_, int8_t, ThreadGemmShape_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.png" usemap="#cutlass::gemm::IgemmConfig_3C_20OutputTile_5F_2C_20int8_5Ft_2C_20ThreadGemmShape_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::IgemmConfig_3C_20OutputTile_5F_2C_20int8_5Ft_2C_20ThreadGemmShape_5F_20_3E_map" name="cutlass::gemm::IgemmConfig_3C_20OutputTile_5F_2C_20int8_5Ft_2C_20ThreadGemmShape_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;" shape="rect" coords="0,0,1152,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td></tr>
+<tr class="memitem:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a></td></tr>
+<tr class="memdesc:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">More...</a><br /></td></tr>
+<tr class="separator:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a></td></tr>
+<tr class="memdesc:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">More...</a><br /></td></tr>
+<tr class="separator:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a></td></tr>
+<tr class="memdesc:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">More...</a><br /></td></tr>
+<tr class="separator:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a></td></tr>
+<tr class="memdesc:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">More...</a><br /></td></tr>
+<tr class="separator:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a></td></tr>
+<tr class="memdesc:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">More...</a><br /></td></tr>
+<tr class="separator:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a></td></tr>
+<tr class="memdesc:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">More...</a><br /></td></tr>
+<tr class="separator:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a></td></tr>
+<tr class="memdesc:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">More...</a><br /></td></tr>
+<tr class="separator:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of warp-level GEMM.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">More...</a><br /></td></tr>
+<tr class="separator:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a></td></tr>
+<tr class="memdesc:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">More...</a><br /></td></tr>
+<tr class="separator:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a></td></tr>
+<tr class="memdesc:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">More...</a><br /></td></tr>
+<tr class="separator:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; int8_t, int8_t, int8_t, int8_t, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, int8_t, int8_t, int &gt;, 4, 4, 16, 4, 4, 16, 4, 4, 4, 2, false, true, false &gt;</a></td></tr>
+<tr class="memitem:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td></tr>
+<tr class="memdesc:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">More...</a><br /></td></tr>
+<tr class="separator:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td></tr>
+<tr class="memdesc:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">More...</a><br /></td></tr>
+<tr class="separator:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td></tr>
+<tr class="memdesc:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">More...</a><br /></td></tr>
+<tr class="separator:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td></tr>
+<tr class="separator:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td></tr>
+<tr class="separator:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td></tr>
+<tr class="memdesc:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">More...</a><br /></td></tr>
+<tr class="separator:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td></tr>
+<tr class="separator:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td></tr>
+<tr class="separator:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td></tr>
+<tr class="memdesc:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">More...</a><br /></td></tr>
+<tr class="separator:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td></tr>
+<tr class="memdesc:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">More...</a><br /></td></tr>
+<tr class="separator:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td></tr>
+<tr class="separator:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td></tr>
+<tr class="separator:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td></tr>
+<tr class="memdesc:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">More...</a><br /></td></tr>
+<tr class="separator:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td></tr>
+<tr class="separator:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td></tr>
+<tr class="memdesc:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">More...</a><br /></td></tr>
+<tr class="separator:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td></tr>
+<tr class="memdesc:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, mainloop is instantiated twice. The first instantiation contains no predicate.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">More...</a><br /></td></tr>
+<tr class="separator:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td></tr>
+<tr class="memdesc:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, residue is computed in the prologue.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">More...</a><br /></td></tr>
+<tr class="separator:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td></tr>
+<tr class="memdesc:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, kernel is launched with launch bounds specified.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">More...</a><br /></td></tr>
+<tr class="separator:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.png b/docs/structcutlass_1_1gemm_1_1IgemmConfig_3_01OutputTile___00_01int8__t_00_01ThreadGemmShape___01_4.png
new file mode 100644
index 0000000000000000000000000000000000000000..b4981222d5b6c30091e79255879b1b11aa49451a
GIT binary patch
literal 2442
zcmd6ndo<MD9>#w&2IKbPO+^`(%!@Fo6y-W8UL%I&7RpHO;)rn>WL~d0Ntj_sa!E5N
zx7-h!jGTx!<bJ<oh#5l0xKGaTcGfy)t@Fn@|DC<o-uu~mJ^NW}uf4yYhnDDHMFfut
z0stU_GPz;}01!M^TS9rbqb>h;YwjdzX=ZJ-x3|ZYEA09Fci3dEI_NYS&AvR;mb-)o
zS)s23T+@E*Z?`@R00L5|E0?T8L0_}J-fLDCHWE$Gh}`>iqOZK8)_f#3D8w%=rKKDK
zMx{6YUGl}lGscHp6BJt{%@fX);+0Xx#00n$>MU{Xz8aEv2i|5vB#_<g@dpB~fcoP#
zfFcsO!kC!m0wNxW1USM~4(W27xTf%qZb58WL&!9;IXz|0lY*0DpB3CY+@B(JgW0<c
zx|1J`iF|i7B)%QiIC}k@L2Z)-LWeLgK1KN%H(U_-rayw%N6(s-N5PnO{VZ0w$d;a;
zmJ&%u32jMqP|UZNM|OFW$l{TYGAJ9+<%-6h;t8`T=MrBNt2R#4-RIJ5Ei=bqCG0h)
zRwWc-Zr$Tu6eZ>sn-O%glD$)RpQ;Ogc^T$=cws*n;TNKWwP{L$X=@lMAQ|A1Q%ol|
zt1D25!3leArxm__7c*EsbZjAXe5`f!QFH#2=WlcMZ`(>N^ww+lSM(a!uK5K@3<W5L
z8JdDdl=L;y2RhPpJ9a#DsEa`kT`wzU5;ZyX7T1sUg4bGBlgVk@#o^d-s@TM|W_tvo
z&$>1XvIu*Mrm(i%<Bjp{IK8-NK85hctf+64Hy=wEy&rjxGl^xs+MK;>m8&(2cMHXG
zT~eM!N0G}qI&Xp8MhA!620mQ4W$U5SxOme+)oW4Fjwtvgg6XL~qLwj0+Us1MFVQN2
zljxaa4j`s!Nb+iTAI?#(_xc^sQLuG`8>jCkM%gkfRm)KG$?N&7y!m$M4tw)tC4s#G
zF|jHv%s(z<S!s+g{5ssJ9-cnnI#J#LKR>op)jfdn#^ovr_^Txqv17YPYmLKqPn)x>
z$$`bE6+rdb)4I7nAY9*#_HgW$@4G08+sUg0i!e7W1thkclLPTIa7L+klBPah8Q+36
zF?2mNguB)sxOwzA&l@l4kF1qgsE@pzSaVPe4{Ze4^={HW*wtmMPXVK7By2ZKJ^@n5
z+76DNYo-7cdsbIPd_ye;fmCRa0=){{iuzd&#q3sTntHOtJMU%nB`>N*T}>xt;F>mn
zX7;Mr3-eiBPeLLc40`2Il2Gyxn+snKSje`vsMmQZBbZE%7_$g4wuF8PP)}Owc2Z|%
z+F$aT32+)2CymR@Ni8`a$<32aylmD0gId<gHkf{rHrvWGam39-Esr>c+o+nHx6$|O
z)&9Vo%~y(Kdd6vmy*2Bv@jsf2qh3m%RBqcD({|IbPP*T7FEewHda{B?n|J=I)J90x
zjU2aNUD&NwGX_<HkG>{5qQ|~aGI6Vm-ZQM6sy8~N^s&c%^>Q(~npxFk)2Do?9i5hK
zsF>)SsQ%s|1EBPYXm17&Kdf5fCq$2;r*$7K<vXvm>9Owgu}~^4@vD+m!BUQ_h}4e9
z!|HXUE@yt{!po-L0{YMSkQdIC#k@QTpH&b@hEokUm}z9^*=ifblEDnB#CP><Pv=26
zBXEuWx5Op=^@cybr_2T%9mT{N`IS8zBX?+-ehmkw3gyG8adkGDApa!*rLy_gVJEAN
zy8A5T!YG=kZ!Z2}Cg1<}Jp^ZK_Kjl{+$(lj;FH}6IHRNZh7ob%eZjQF!uPC0yJ+|x
zd-p0AGvbpHa$NHKfX?85CQUOK{)15tvAiZfU{#e62fY7xmYo7<fFwSBi=R6IJQ%<h
z0|K80_-H`!bWT(;a$iZ}jqLG&FdlRoC<>iVIt)FqzUC7W+u!2D$fwByJQzTjc2@0&
zp9{i2{ag%!4q~|w{4-Xq84Tfi@gVzH-XB52{|u5kBKLnCH02m07A+tTIb;Y`j1e<~
z$`|8-gS(stmRtYJYsr2gMCW+8c*m}6@+gPxYOa<_AFGU;V=dzjF**ioZ+GtcJQc*y
z)@vFGnt!p=qRF;^AuBFv0-q{Fe!J}yI`C8EBz>?=%+y6WYg-)b^=!$`J?^)n<5Qxp
zAh5kfeU7ZukUEEB)ny<`U*xP)H;L@oY8Uqi`v~f=J~2eq+$+0-EJ$5kk359buSsvc
zZKO=%==a~}%bX05X)RA}cstCzXjAj~TJrwG9+AV(F6t4#V`ac(0(G*!aC0@<r7og!
zrFYu5%K=}HegKfP?Vy(KmW8UxEhpbLoCrq0Y9x3UZP~^vNI|@ez?;B+2D!8In3fOY
zgep(9inPx)=qK3kQmmSfxN=qG<6bf#;)?@AV&XOXtg^u~^r6-vm~!kdP|U^sqd~m$
z-Bu_-MQW&Y`NbS~<^`jS@HqiE9Jwh18qosH(D}hZ*`_BiXn0r^dN1iidrE-UM})*^
z_i*6U?X!Dovw7j4H%@Jqa?hOa*~kMxRl7*MvABgVw(7lKa+)lDmit%JQn0QFWTY3P
z(VusIWTh0bp=d^Zvd|>%^)x^ZnH9gC0aTxnF}ygu5kAq)Un8W{3Ad!=}@b*@r9
z8-~?|!2-@*#fiG;E(zCaweIEDiTcYuZkA7~5~MQM^GHd{B)%EVf&@0Na+dXd>sESb
zQTUXXzvGO@Vkr)9fairyEo)>^awviCb|}1xkL~(%ePB}-+@jeWm9D)&`=vJ)5J{QP
z5Q>?bq<nR$v^pC9paS5Q+&yl|MLlC^Zrw2G2-{0vcwha~O2PkDbfO@^fBDi+#0>3e
Yjir~q$USn+rUBfBGD2S|HN-^!16Axr0ssI2

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogue-members.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogue-members.html
index 73d16eaeb..d3a37d1fc 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogue-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogue-members.html
@@ -81,38 +81,37 @@ $(function() {
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a07f9a934f04610db41aa1aac2f4cdf04">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">epilogue</a>(Coord&lt; 3 &gt; const &amp;block, Accumulators &amp;accumulators)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">epilogue_with_or_without_beta</a>(Coord&lt; 3 &gt; const &amp;block, Accumulators &amp;accumulators)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">epilogue</a>(Accumulators &amp;accumulators, Coord&lt; 3 &gt; const &amp;block=make_Coord(0, 0, 0), int batch_id=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">epilogue_with_or_without_beta</a>(Accumulators &amp;accumulators, Coord&lt; 3 &gt; const &amp;block, int batch_id)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">GemmEpilogue</a>(Params const &amp;params_, SharedStorage &amp;shared_storage_, Index m_, Index n_)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#ab7a51121d24250d6441ee538e6521dc2">IgemmEpilogue</a>(typename Base::Params const &amp;params_, typename Base::SharedStorage &amp;shared_storage_, typename Base::Index m_, typename Base::Index n_)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">m</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">n</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">GemmEpilogue</a>(Params const &amp;params_, SharedStorage &amp;shared_storage_, Coord&lt; 3 &gt; const &amp;_problem_size)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a599a50becefed561d063c1b834188aca">IgemmEpilogue</a>(typename Base::Params const &amp;params_, typename Base::SharedStorage &amp;shared_storage_, Coord&lt; 3 &gt; const &amp;_problem_size)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, bool &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">shared_store_fence</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">SharedLoadIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">SharedLoadTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">SharedLoadStreamD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogue.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogue.html
index fdd93ee44..4c0d3cd5f 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogue.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogue.html
@@ -140,12 +140,9 @@ Public Types</h2></td></tr>
 <tr class="memitem:a9063e7fc044a679652d5a3a31aa77e7c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef Traits::SharedStoreTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a></td></tr>
 <tr class="memdesc:a9063e7fc044a679652d5a3a31aa77e7c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">More...</a><br /></td></tr>
 <tr class="separator:a9063e7fc044a679652d5a3a31aa77e7c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4a0b439f8a57d8e67174ecbd96183070 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef Traits::SharedLoadIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">SharedLoadIteratorD</a></td></tr>
-<tr class="memdesc:a4a0b439f8a57d8e67174ecbd96183070 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">More...</a><br /></td></tr>
-<tr class="separator:a4a0b439f8a57d8e67174ecbd96183070 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a132cabbc1402c87c7b35dea427001a13 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename SharedLoadIteratorD::Fragment &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">SharedLoadTransformerD</a></td></tr>
-<tr class="memdesc:a132cabbc1402c87c7b35dea427001a13 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared load transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">More...</a><br /></td></tr>
-<tr class="separator:a132cabbc1402c87c7b35dea427001a13 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8e5d38a7795b50a021fc43dc7424288b inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef Traits::SharedLoadStreamD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">SharedLoadStreamD</a></td></tr>
+<tr class="memdesc:a8e5d38a7795b50a021fc43dc7424288b inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">More...</a><br /></td></tr>
+<tr class="separator:a8e5d38a7795b50a021fc43dc7424288b inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a07c93d583bfddd8f916fba6ef809832e inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef Traits::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a></td></tr>
 <tr class="memdesc:a07c93d583bfddd8f916fba6ef809832e inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">More...</a><br /></td></tr>
 <tr class="separator:a07c93d583bfddd8f916fba6ef809832e inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -158,19 +155,19 @@ Public Types</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:ab7a51121d24250d6441ee538e6521dc2"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#ab7a51121d24250d6441ee538e6521dc2">IgemmEpilogue</a> (typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Base::Params</a> const &amp;params_, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">Base::SharedStorage</a> &amp;shared_storage_, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a> m_, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a> n_)</td></tr>
-<tr class="memdesc:ab7a51121d24250d6441ee538e6521dc2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ab7a51121d24250d6441ee538e6521dc2">More...</a><br /></td></tr>
-<tr class="separator:ab7a51121d24250d6441ee538e6521dc2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a599a50becefed561d063c1b834188aca"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html#a599a50becefed561d063c1b834188aca">IgemmEpilogue</a> (typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Base::Params</a> const &amp;params_, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">Base::SharedStorage</a> &amp;shared_storage_, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;_problem_size)</td></tr>
+<tr class="memdesc:a599a50becefed561d063c1b834188aca"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a599a50becefed561d063c1b834188aca">More...</a><br /></td></tr>
+<tr class="separator:a599a50becefed561d063c1b834188aca"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td></tr>
-<tr class="memitem:ab10147070c3a38fca75397f55dc51925 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">GemmEpilogue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> const &amp;params_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> &amp;shared_storage_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> m_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> n_)</td></tr>
-<tr class="memdesc:ab10147070c3a38fca75397f55dc51925 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">More...</a><br /></td></tr>
-<tr class="separator:ab10147070c3a38fca75397f55dc51925 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae1983e37454ed14272b23b964614c54c inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">epilogue</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators)</td></tr>
-<tr class="memdesc:ae1983e37454ed14272b23b964614c54c inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">Execute the epilogue.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">More...</a><br /></td></tr>
-<tr class="separator:ae1983e37454ed14272b23b964614c54c inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0c24dce365565f75e7edc1de1cb50ea4 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memTemplParams" colspan="2">template&lt;bool kBetaIsZero_&gt; </td></tr>
-<tr class="memitem:a0c24dce365565f75e7edc1de1cb50ea4 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">epilogue_with_or_without_beta</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators)</td></tr>
-<tr class="separator:a0c24dce365565f75e7edc1de1cb50ea4 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af91ebe8d2ed73808b9ea8846c140d3f8 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">GemmEpilogue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> const &amp;params_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> &amp;shared_storage_, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;_problem_size)</td></tr>
+<tr class="memdesc:af91ebe8d2ed73808b9ea8846c140d3f8 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">More...</a><br /></td></tr>
+<tr class="separator:af91ebe8d2ed73808b9ea8846c140d3f8 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6f1f96715425b7196e960907676a7db3 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">epilogue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), int batch_id=0)</td></tr>
+<tr class="memdesc:a6f1f96715425b7196e960907676a7db3 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">Execute the epilogue.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">More...</a><br /></td></tr>
+<tr class="separator:a6f1f96715425b7196e960907676a7db3 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7af2eb421840e037263e6a144cca5c32 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memTemplParams" colspan="2">template&lt;bool kSourceRequired&gt; </td></tr>
+<tr class="memitem:a7af2eb421840e037263e6a144cca5c32 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">epilogue_with_or_without_beta</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block, int batch_id)</td></tr>
+<tr class="separator:a7af2eb421840e037263e6a144cca5c32 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9b5e42f222fec98ff479bc1650221b84 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a> ()</td></tr>
 <tr class="memdesc:a9b5e42f222fec98ff479bc1650221b84 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">More...</a><br /></td></tr>
 <tr class="separator:a9b5e42f222fec98ff479bc1650221b84 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -187,11 +184,11 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:a442b5b5688cd658c3b3476650c00281e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a></td></tr>
 <tr class="memdesc:a442b5b5688cd658c3b3476650c00281e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">More...</a><br /></td></tr>
 <tr class="separator:a442b5b5688cd658c3b3476650c00281e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac344bf5ca318dc343bd6fa6bf52d2e22 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">m</a></td></tr>
-<tr class="memdesc:ac344bf5ca318dc343bd6fa6bf52d2e22 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The dimensions of the GEMM.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">More...</a><br /></td></tr>
-<tr class="separator:ac344bf5ca318dc343bd6fa6bf52d2e22 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9cc371cd2f1a9485583afdacbb7403ea inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">n</a></td></tr>
-<tr class="separator:a9cc371cd2f1a9485583afdacbb7403ea inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6bea57249e3645a4b08a11619cb1687e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a></td></tr>
+<tr class="memdesc:a6bea57249e3645a4b08a11619cb1687e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The dimensions of the GEMM.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">More...</a><br /></td></tr>
+<tr class="separator:a6bea57249e3645a4b08a11619cb1687e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5aa254702fcf24630e04ceb174aa3d57 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a></td></tr>
+<tr class="separator:a5aa254702fcf24630e04ceb174aa3d57 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="a07f9a934f04610db41aa1aac2f4cdf04"></a>
@@ -211,8 +208,8 @@ template&lt;typename GemmEpilogueTraits_ , bool  = GemmEpilogueTraits_::kInt8Out
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="ab7a51121d24250d6441ee538e6521dc2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab7a51121d24250d6441ee538e6521dc2">&#9670;&nbsp;</a></span>IgemmEpilogue()</h2>
+<a id="a599a50becefed561d063c1b834188aca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a599a50becefed561d063c1b834188aca">&#9670;&nbsp;</a></span>IgemmEpilogue()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -237,14 +234,8 @@ template&lt;typename GemmEpilogueTraits_ , bool  = GemmEpilogueTraits_::kInt8Out
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a>&#160;</td>
-          <td class="paramname"><em>m_</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a>&#160;</td>
-          <td class="paramname"><em>n_</em>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>_problem_size</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -267,7 +258,7 @@ template&lt;typename GemmEpilogueTraits_ , bool  = GemmEpilogueTraits_::kInt8Out
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar-members.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar-members.html
index 9d49d21c8..5e14e09e2 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html
index 9ae00dbd4..aef95638f 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar.html
@@ -110,7 +110,7 @@ template&lt;typename ScalarD_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4-members.html
index b7179e432..d21ec8326 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html
index ab260d708..660d766b8 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueScalar_3_01int_01_4.html
@@ -108,7 +108,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits-members.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits-members.html
index fc77b4b7b..138a0c2dc 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits-members.html
@@ -79,27 +79,27 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">cutlass::gemm::IgemmEpilogueTraits&lt; IgemmConfig_, EpilogueFunctor_, Index_, Helper_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">Functor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">Functor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html#a8609af98d1e43cd25688bae6f33feed4">kInt8Output</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">cutlass::gemm::IgemmEpilogueTraits&lt; IgemmConfig_, EpilogueFunctor_, Index_, Helper_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">SharedLoadIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">SharedLoadStreamD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html
index 16b5df043..d36c461ac 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html
@@ -87,7 +87,7 @@ Inheritance diagram for cutlass::gemm::IgemmEpilogueTraits&lt; IgemmConfig_, Epi
  <div class="center">
   <img src="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.png" usemap="#cutlass::gemm::IgemmEpilogueTraits_3C_20IgemmConfig_5F_2C_20EpilogueFunctor_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" alt=""/>
   <map id="cutlass::gemm::IgemmEpilogueTraits_3C_20IgemmConfig_5F_2C_20EpilogueFunctor_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" name="cutlass::gemm::IgemmEpilogueTraits_3C_20IgemmConfig_5F_2C_20EpilogueFunctor_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" alt="cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;" shape="rect" coords="0,0,2164,24"/>
+<area href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" alt="cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;" shape="rect" coords="0,0,2163,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
@@ -99,54 +99,54 @@ Static Public Attributes</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td></tr>
-<tr class="memitem:aed1bd9df5ff579ba3e36ae5ba781c075 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef IgemmConfig_::OutputTile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">OutputTile</a></td></tr>
-<tr class="memdesc:aed1bd9df5ff579ba3e36ae5ba781c075 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">More...</a><br /></td></tr>
-<tr class="separator:aed1bd9df5ff579ba3e36ae5ba781c075 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af7ff579ccb4269bfa5e9ae297260f7a2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef IgemmConfig_::Accumulators&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">Accumulators</a></td></tr>
-<tr class="separator:af7ff579ccb4269bfa5e9ae297260f7a2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8409d84ee282a4d6953bd41149d8b9c2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalLoadIteratorC&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">GlobalLoadIteratorC</a></td></tr>
-<tr class="memdesc:a8409d84ee282a4d6953bd41149d8b9c2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for C in global memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">More...</a><br /></td></tr>
-<tr class="separator:a8409d84ee282a4d6953bd41149d8b9c2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a051f25a4aa3ea71ff400582228adbdaa inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalTransformerC&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">GlobalTransformerC</a></td></tr>
-<tr class="memdesc:a051f25a4aa3ea71ff400582228adbdaa inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">More...</a><br /></td></tr>
-<tr class="separator:a051f25a4aa3ea71ff400582228adbdaa inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a261e526c6a8e832bc483bf4e486cc9d7 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">GlobalTransformerD</a></td></tr>
-<tr class="memdesc:a261e526c6a8e832bc483bf4e486cc9d7 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">More...</a><br /></td></tr>
-<tr class="separator:a261e526c6a8e832bc483bf4e486cc9d7 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aeef5745d149770c9f79e12f6d97ffce1 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalStoreIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">GlobalStoreIteratorD</a></td></tr>
-<tr class="memdesc:aeef5745d149770c9f79e12f6d97ffce1 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for D in global memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">More...</a><br /></td></tr>
-<tr class="separator:aeef5745d149770c9f79e12f6d97ffce1 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a74f4beb86447f6b613e9b60234cb27bc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedStoreIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">SharedStoreIteratorD</a></td></tr>
-<tr class="memdesc:a74f4beb86447f6b613e9b60234cb27bc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">More...</a><br /></td></tr>
-<tr class="separator:a74f4beb86447f6b613e9b60234cb27bc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0b8ac1972b2f2cff48070f8b862ed25c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedStoreTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">SharedStoreTransformerD</a></td></tr>
-<tr class="memdesc:a0b8ac1972b2f2cff48070f8b862ed25c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">More...</a><br /></td></tr>
-<tr class="separator:a0b8ac1972b2f2cff48070f8b862ed25c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9822fa405b32cc2f471c9fdd37585cb5 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedLoadIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">SharedLoadIteratorD</a></td></tr>
-<tr class="memdesc:a9822fa405b32cc2f471c9fdd37585cb5 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">More...</a><br /></td></tr>
-<tr class="separator:a9822fa405b32cc2f471c9fdd37585cb5 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab00969bdda930eeb7b82985c476adf7d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">Iterations</a></td></tr>
-<tr class="memdesc:ab00969bdda930eeb7b82985c476adf7d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">typedef typename GemmConfig::EpilogueIterations Iterations;  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">More...</a><br /></td></tr>
-<tr class="separator:ab00969bdda930eeb7b82985c476adf7d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af1f105d4712f01880b0944666e2f81ae inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">Delta</a></td></tr>
-<tr class="memdesc:af1f105d4712f01880b0944666e2f81ae inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterations strides.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">More...</a><br /></td></tr>
-<tr class="separator:af1f105d4712f01880b0944666e2f81ae inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7cdb30f17692e8fdb3dd4cf4c0b8e9ee inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef EpilogueFunctor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">Functor</a></td></tr>
-<tr class="memdesc:a7cdb30f17692e8fdb3dd4cf4c0b8e9ee inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor in charge of the math.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">More...</a><br /></td></tr>
-<tr class="separator:a7cdb30f17692e8fdb3dd4cf4c0b8e9ee inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab430d05bd17efd60c28077c87b5ca331 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a></td></tr>
-<tr class="memdesc:ab430d05bd17efd60c28077c87b5ca331 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">More...</a><br /></td></tr>
-<tr class="separator:ab430d05bd17efd60c28077c87b5ca331 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a006e50cf5fb67407d41c60d6d08b8b66 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Functor::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">Scalar</a></td></tr>
-<tr class="memdesc:a006e50cf5fb67407d41c60d6d08b8b66 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">We do not support 3D or 4D shapes.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">More...</a><br /></td></tr>
-<tr class="separator:a006e50cf5fb67407d41c60d6d08b8b66 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abf97949c238d72854225c1c6131b5cbc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadIteratorC::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">ScalarC</a></td></tr>
-<tr class="memdesc:abf97949c238d72854225c1c6131b5cbc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">More...</a><br /></td></tr>
-<tr class="separator:abf97949c238d72854225c1c6131b5cbc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1ee74d6f89b044578e1cd6dd210ce5fe inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalStoreIteratorD::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">ScalarD</a></td></tr>
-<tr class="memdesc:a1ee74d6f89b044578e1cd6dd210ce5fe inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">More...</a><br /></td></tr>
-<tr class="separator:a1ee74d6f89b044578e1cd6dd210ce5fe inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; IgemmConfig_::OutputTile, IgemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td></tr>
+<tr class="memitem:af4d17d3774382fc0ba63d329bd12772c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef IgemmConfig_::OutputTile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">OutputTile</a></td></tr>
+<tr class="memdesc:af4d17d3774382fc0ba63d329bd12772c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">More...</a><br /></td></tr>
+<tr class="separator:af4d17d3774382fc0ba63d329bd12772c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af27cfae15beafcfbaf6d660781cbe5c4 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef IgemmConfig_::Accumulators&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">Accumulators</a></td></tr>
+<tr class="separator:af27cfae15beafcfbaf6d660781cbe5c4 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4de6207ce3843d6c4325abc7d7abcf24 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalLoadIteratorC&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">GlobalLoadIteratorC</a></td></tr>
+<tr class="memdesc:a4de6207ce3843d6c4325abc7d7abcf24 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for C in global memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">More...</a><br /></td></tr>
+<tr class="separator:a4de6207ce3843d6c4325abc7d7abcf24 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a853b7ad3afb06fd720afc4559df2198d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalTransformerC&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">GlobalTransformerC</a></td></tr>
+<tr class="memdesc:a853b7ad3afb06fd720afc4559df2198d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">More...</a><br /></td></tr>
+<tr class="separator:a853b7ad3afb06fd720afc4559df2198d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adb4eb47c84dc1c6df2556e72ff5800e6 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">GlobalTransformerD</a></td></tr>
+<tr class="memdesc:adb4eb47c84dc1c6df2556e72ff5800e6 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">More...</a><br /></td></tr>
+<tr class="separator:adb4eb47c84dc1c6df2556e72ff5800e6 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada036c0457773a42fb18bc0463071d02 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalStoreIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">GlobalStoreIteratorD</a></td></tr>
+<tr class="memdesc:ada036c0457773a42fb18bc0463071d02 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for D in global memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">More...</a><br /></td></tr>
+<tr class="separator:ada036c0457773a42fb18bc0463071d02 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a48dee5c2aafb86e999732a1347c9f668 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedStoreIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">SharedStoreIteratorD</a></td></tr>
+<tr class="memdesc:a48dee5c2aafb86e999732a1347c9f668 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">More...</a><br /></td></tr>
+<tr class="separator:a48dee5c2aafb86e999732a1347c9f668 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a685d59ee03a226e62660e83c4c60ca69 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedStoreTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">SharedStoreTransformerD</a></td></tr>
+<tr class="memdesc:a685d59ee03a226e62660e83c4c60ca69 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">More...</a><br /></td></tr>
+<tr class="separator:a685d59ee03a226e62660e83c4c60ca69 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5bb3232a2f15d8263d058c69b0839e2f inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedLoadStreamD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">SharedLoadStreamD</a></td></tr>
+<tr class="memdesc:a5bb3232a2f15d8263d058c69b0839e2f inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to store D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">More...</a><br /></td></tr>
+<tr class="separator:a5bb3232a2f15d8263d058c69b0839e2f inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7cf2e703f78b877ad551d0516982da10 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">Iterations</a></td></tr>
+<tr class="memdesc:a7cf2e703f78b877ad551d0516982da10 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">typedef typename GemmConfig::EpilogueIterations Iterations;  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">More...</a><br /></td></tr>
+<tr class="separator:a7cf2e703f78b877ad551d0516982da10 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a84b89d856f548a26fa1dc15bfd2940da inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">Delta</a></td></tr>
+<tr class="memdesc:a84b89d856f548a26fa1dc15bfd2940da inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterations strides.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">More...</a><br /></td></tr>
+<tr class="separator:a84b89d856f548a26fa1dc15bfd2940da inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8acbe7bfa905258a964ef56e634d4c99 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef EpilogueFunctor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">Functor</a></td></tr>
+<tr class="memdesc:a8acbe7bfa905258a964ef56e634d4c99 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor in charge of the math.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">More...</a><br /></td></tr>
+<tr class="separator:a8acbe7bfa905258a964ef56e634d4c99 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a23b0e6a448e51f2e0837af95802c23b0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a></td></tr>
+<tr class="memdesc:a23b0e6a448e51f2e0837af95802c23b0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">More...</a><br /></td></tr>
+<tr class="separator:a23b0e6a448e51f2e0837af95802c23b0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f15d59a7571d406d5ef593c342f0d4a inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Functor::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">Scalar</a></td></tr>
+<tr class="memdesc:a8f15d59a7571d406d5ef593c342f0d4a inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">We do not support 3D or 4D shapes.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">More...</a><br /></td></tr>
+<tr class="separator:a8f15d59a7571d406d5ef593c342f0d4a inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa794b5f04ce736cdba0d778861ce3a9c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadIteratorC::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">ScalarC</a></td></tr>
+<tr class="memdesc:aa794b5f04ce736cdba0d778861ce3a9c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">More...</a><br /></td></tr>
+<tr class="separator:aa794b5f04ce736cdba0d778861ce3a9c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad9a81c3ff36a4f3aa376e2cff94cbb50 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalStoreIteratorD::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a></td></tr>
+<tr class="memdesc:ad9a81c3ff36a4f3aa376e2cff94cbb50 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">More...</a><br /></td></tr>
+<tr class="separator:ad9a81c3ff36a4f3aa376e2cff94cbb50 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Data Documentation</h2>
 <a id="a8609af98d1e43cd25688bae6f33feed4"></a>
@@ -179,7 +179,7 @@ template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits.png b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraits.png
index ed357320db770ca2f39e0d47e47679730950ec24..e06e833365ea940306d35bd21e1a104f82687ffb 100644
GIT binary patch
literal 3632
zcmdT{d03L!8n1DRGR@m<vBdImB4~9_GZ!jbWOCH8%q_KYO%xjqHxh3-(JfOOEwxEe
zGp)%5jTBJ<)6}qlN^@h=M9>6L5fu@+pYz!C+@7a<|G0nM-}`*L=ljk%?|IjA4mVw$
zPiSlEX)ar~OdH{N)NR?aRnb7(b(IG2`#9KVHNZBzI-NeIR;z*LxO}*z34I4>{rNOD
zHhNaYodI4~U3POmwG0@vh!5?j%>a2c#L>g2<CaUf9;iX@zpZHeXjq^!R#@*e*{xN6
zW1_!jFK7Zstx8HAJkWI@E#O;hTcA_Mk6)3)@qmoeUy;6<Ugo2We<#76cR7%IU(t=*
zt&l&yBI`g4DE<Ao96~p2Zu7_xE3UwIO;mPECuL@sd-z*PHjU}57^HDnS$pDXI}mwm
z&x59fAad|}Jj8~|xA#fdHs@E4IXSOFDdh=x-BVNeb0o{N8T9C+WOZw(ReFz&WmDa&
zQ#L^pBdlLBR(F%Eg|v$-Tblxm)vM^#d8fviEalH~_y{TwV@Z68v_^Xw(gpFSt>}_?
zGf-+P#4F*#`wYQV0(1-|g4~bq89j4V(tH=96Aqd+`G~kGY0q{c)f~;R9Z&GgUkyXx
zC&kCrMaY0^%o+A1FLgp(Ou;|2TA}3V@1Wb!cK4xeq?}a*KKu2&YW)CDXDB~SA?-CM
zXzxU1;WvwQK=Yi4dyq9Cp$I!;Eb0Ws??A*va1J4&_@ND_H`|w9QO+wz2?UlsmW%b%
zbm1kb?34lb*fH(gC|R*Ao{)J#q(eZ;6`$UJ5=k#!?!Kne#91}|Ui@gfwT!1Xx0{$l
zR<zQ-Utm@;?>&x=U2~B)Zt;|zK6)Evkb;aBRWWx*jMeqd3JraA6M3E1?WsAIKX7e4
z;oHPaTz&2h8LXqRVumM8i|JEhteU28(P}qhcXG<3N=JwJw-i#gIcsgGXytvam^0CX
zX?FVK3sI30r2%=lP}?Qz7tAIDQK!#!^oG)j9rx{tlbJ7{<#HgT5DTLOCmcP~(1s;Y
zd60<kVEPb>EL)4f(TVTcKDu$!P<78(*U4I!wl+49N8mD}65WxZw(w+{X<2a#;bJp*
z4~Dl#w*SG{1f^<>$$B`0PJaMKku|zXZIu>4Fi%zbfKiSmEZfSKv+BN3^^Md^f1o2<
z^0}IzW(qEf)SYA|q=m3-?G|$)uoA2Y_@!+dU*IB6R#0MQog|W)_-124C!&c%A?QxL
z`K})Q49)OA$y+c;CAyN_ny2T&LsahV9PgWmyZQb$C#&ViEpMK6Fv1)7s<F75P0{uz
zeH0k1Op3ahuY-&+74H>>Wk#Icg@CeVK5@2;I_rb!LEE>M+q3Sl&5;Y|A4%85V44{&
zElsp_l5iGvPhWJFBd)BWX5(6%&FUaB+~b`(z*KFA5sob9)*sGF4fln!ttIJ}3d#`A
zS<=SrJU-T|-?qkDeij>>Cavi9i}@Y$v9}M4O>I?K$Tu>pr)=|G9&XKOA?6lQqB4Wp
z@34t*(+-ANgnUn3?;#KLjX+gH4ktE45LIpjFS$xHFYBfDdc8TeCgs;l_uonEsCy~H
zD5Ymv%)q16k?WPe94TQ$9<Qq^;;$D^<LbAT8q%8*v}mS%E%-#2=j_$-F-CX};A~$m
zA#)^$H3-+0@rfb$ZEq>yz|!A_<k1lyXQ4C_C$?j}(7gK9mDk_Pyq$eLa##}!`(j`&
zED(m_=1)65$hFw-lUp8G>x?A2&Ag_Vz)O$odL>m?*mPJyIz%l3s`pLFA!B$+VgtNP
zagmeLRi2}36Q<lS_UporPrWL-DBUR$RcL=G{mp}GT;3%auO?E^vN^*EPlNZVk=w-;
z5~R-ntcmNm-X~<lAVp!!Hh0k(ezB{kob0rv?K>)o<3m)O3JIe;O4%U40%+Kyg&f>e
z&lVn>e+?`8W#h+~G;c_A^dDNiaV15y9%BbNhWG7L981jW(T9TBp=Q^0nmN27*)m{7
zq*m!TG%q4=vc+E2TbZT%l6ir-z^7i1NpCqL&kL*@4k&Fa-$(6>jWv>t_{AYBl~$9<
zu1S&4OV9D^*7<3Pe;TlNj2#_RNng&-i0^l=e4dmn<{}-;60wke7&H_u+nSdz3CgjW
zKjNGReM5OdV$CwAbihO#hF8(V+(0aypvQ;P?CXWKg#7H_NNMJI5xI+RJR_HH94ebY
zKx7pqAOUACsM05X_V5gUIcFt}BNovgFvqG}FF)L5PU@Kzk)&G4D5TRKza!pz*%3iB
z7%F3vN1?M1WnX8Mt4wh}{fhUHt%FFng9R(BxX^cN%JP_08%S+m^G^~P8mlOO=hr1t
zz4NnbN@&UFYr@x$?YN6*895YuV;a~^jQfDyWSFOI1{RkIhvvvZ_@d=}pD`~7Qm<_%
z7c#RqhP@v&f7qEaZEjsj%6^TB)l;4EJ~%_!nJ<_I4jP3<{ZCMO%5>k{Rr|F46HXFQ
zg6G|YBu~U-$k_7*URtKWowmE@_ydS^@^zD{+7w2w@V6>ZTlbUDq%u`&ZbId6z!7FV
zC!U1q29}l^3=ev)=U3m55+J=3r*%4xs9gY2C;Y&pU=2jZ39Nf%swILqlzm-^3~<iy
zrJ)X~qZ=bfQSQTAt>u4bMMsE_!S#SO;SE1qf|Y-&^tdz+600&kzk{BxES1(nh$4>_
z?9fbsFV?G;W+{a9%12jD!9nvxE@jVSDBZNk6tVj&TDv6`;r10py$b!G&h7tjBLHp-
zgNI!KT;i|RT*BIehnMie^l`_R&(?X)iz63t>E(!Q&0pgWBx3)XVF=r~gagChuUG;o
zuV4xN1?x8~LI3i#&q)3v`0bbVzNm5d|5xaYcC$&RiI&5+n10|tK6}9dmmc|-^DfNJ
z;y!n5|1TYJy={jNVzcm}=V#{<sO+VimR{r2YT4u1Fq)q1*>_M@QC+QFI&MmZ-2?^#
zFrS0bT>)@$LayV$RhYM@ZoKEk(#GK8kd@=^!S3T&Ms@&IIage_IA!6?(-}ix&hx?$
zElo{76RrHmBDRR{pOlz5Jux~hbBmi?7?t)KkZ#Wu^cRnZWb@U``n(M`NpXzQe1cIq
zb^(u@37hFCVJ5kR1<W<*%gUR`Q^mv81Q`fSVYKu6Y_r?MWX9WSkyj*TdtpKU6Fd;{
zxEB_Q&fAjnLM9jX5Eu(_h5gn;=1%z3y6n3N%u@D19-s4G9?f<6u}q^;9B(Z|9Af94
z<we9=j)b^tcZh5?zyo4=)dv`0X1KEMIFNz;RkC+p#m{|={5SBN=TeR?Jn0{oR~uC-
zky{wgx)Ey=OO)K@jJlTsKw7jSHCu+QK@qqGPz_&P&20(R;DI)f=Pz*QWt~R=-o9^z
zbLIzYFDy*ybub^&akYimo{d>y9F+fxFY;u%GuLswRhp4maQ|WK<JSy*Rl=K5%}gpx
z70&gmmzjV+**+ioXUK<h=ZU+3uzPN?bXly7GLBop3(5VGS;hv+PMV`2U6Xo;<`Iwf
z8<|u~G~)`DDkCe@-RuBA56>0V-Q5(+SO<346+I0oE3kFZ#EQ?_L6T9B_vl;p*=9X)
z!PX0YFOa+SbL>-Gp*Iy-9<fdJ!nd$GT1_o;l+>4FXWVA19ZJlk$C+Siey5(jJUZD;
z?)7Fc>}yu80*aW;Jh2Wa_icLA4ptjW>LkBcSfTcP-?1Z+%QF|lb=F`L6Ss1`Ml)T7
zKRHc)+R<?Gf^Tt08#f7b39Pcf`AEEusFQOD5xF6<zB#g>dhCZ;ne>>2h#E2kD;A~t
z7jZsm0P_9J>kSue0NEvW;dj+~2tjM7s-V#7Y;B6E&;v|9Rp;>okcUqSK|mhz1hQN^
zbQgYKt-El<`5e0nN=54M{YPVX>tv{q%1NgYdHu<KfM?_05l?Jfls<WxneePXxX{4y
zcH8f@{z_ldX4c3(z&?1`@bcuPYBMmoa>e2E{<p5V&1x|yi_kayX2)jS`6uT$<Mh74
d4h+NJ?0tGdx@l7c@b_*R;+XT%iX-Q){R>NxC4~S0

literal 3581
zcmdT{dsI@{8h55~Y%;ZOW)IWqUX#kwv4?LV#~dR~v(ijcG)l{SlrQ9=G&<=trZ$jC
z8BkgFP%~3RL8P)Id|+vUgh1xA5KvJO5V@yT)4kJLt-J2Jf8F1=&i?i}d!O%o`+Mwf
zpL2Wtyp0yDT%f0?X9V4~bDy5x{A8fNcm6z}^`h-K1+e9NeGho)bUL6rHZ@ZEB;^9o
z`*=Ni^eDJ0EeN=spS;g+zaB8@1G-xdYysq*hwk(^koJvKIGk9rd--=SJon#HVh1GG
zc3iyWMWcvfiu>1CZ~L)L$#cqw=k+^rzry+hnyv1BLC#UztfA}vN^JWQd+5e5D1SvB
zbl(@0*mm3(xBCl%{|v`%GJ<*IR&Bvx*0D()3cMMFqZVd}qAI&QRn&PIm|6k)CA?c!
zB5@u_ec<>EHFUZ?J`FcI1J)duASW5&O3QI&y|hcBX{hs(|3Ig_!TIKE3}+ong_vie
zszuyAmLVH*{b5U#@fWeq3UN)8CF9z`(KU8ZOu|DlO~+1_ysbWDO|rSyY7Dhz`KRN1
z^9^!e0J`2Xh!4TdzB&0DUE&Ol%D9?R_IO%w(F)RIJOh6V&60A8{Hd3A0y9*><fR~}
z<;2KOx{`D_1r^jfu{5+<ZN}Iz3RkX&%2a_Tc>N7YYu%U$c4aJ^x1xdx|L8e1w=HSe
zMJpfw(KVI3XM0i$tqcv~UufTvZSO%$FIn*^Rr>4L=_TWxku#$cQiZ&d*$CFmq-c;Q
z+?;h&%F%+r(}EKS8%_~>xZ3Xu5z+uI>)2lu0Kxiqg_+MSO8Uo}V?9uL9vx*qQr7;K
z(+(s1j3Js`5F`;j^rq@j*8%Eko-0ioayZ8oCMoY4x>p<~cI%wF-jU;SyZ3p`AIb7(
zC}a;&AAwxWA^T>9Ayi^ws*47_?8)>JY~qH7^|By(cj{!qu{jO5tz_9`rp3Uiw_0|s
z*_==98Py~Fa9z4N*7hFNSYlcx@!8@YB?T28LnZ;{eOX7aUt#T?J-Q07fOT=^2!Ta(
zDW?py!kX2*DmN^}RXE88n<cF{Wf1}Hog}MFyNHt$@RhT~s!L|f(s>DPd_~A*NcFpw
zVmeo-sV1bm_YY-;-aj+7pOk*(Xkx>LQEsL=?w!3!Z5@y4Ak{rsWXq7bk9!wAd0fX^
zkBHWSw(8tZ4)qzLgvN=OLdb(fLsiDi1L)Q`@YoWslzsLH$5AiRp$7u1P|Yl5P^x?B
zluHXVuO)Y+@?qU=6(D=4N<~rJsm<8jv<W2K#L{%h!#lW5SH-s~z6Fcbh@z(wczbF#
zF{eJ{s5yE!jy<kTmK~P(<>$SB7*G&Ij(#pB80p}h%Co}oQwr*lKJhNs&}#W^^!;<}
z3x&g%06p>RTc_%G>k5v2h?AyelQfHgnT<?Gerg<KdS9F=xm}WW;|@t67Y)!&Vk_PD
zY#bl$%gD%U*1AkB9e#}pe*rp?bM*8k`O9!R8{Tq3P=$q;<{oo-e~`vMdtYtLR;N9r
z$;-zFt7)@@@3GP4d>S7~$X#r<v@g+{%A0vOb%ZA69ic1$!F|PZd5%Y2W}`aumTE~4
z1ctKd5F@A=mp5kKWy>8!cg7cG@zLXN_Bky_P?&!4tXc3}(q$cKyJAeA5pUq!*dpJP
zN;O`Mx@&eT;ZP)yXcA*ZaRW0?xZ#x|mvQNCC9GsTo_NLmYDG-l{gc%}N`d=nY*3bM
z%iQ~VS#RUo%a;B@%5Hp*F-m1m?AKNeRrWW>30oS10|W_uev{EL?Gq=2u8d%_Q1d8U
z8{qxv%;Jt(#yY$EYuN)cnyxvRVWg4|rkaK?MwIx*GJJHwL(JHAH;jiJ-y<K?=*Z_v
zG2K3tjMChdQ)vNVh@SJ5syv}Zl7()9ef+RjukF6vn6&u9wdSnJjWP;7Tz0{?zzg?|
zC`5UdW`$M8b|ZF~u{c}E2D`R6-(L|lZjFy)4CSV%UkA5Z92t(}%!xA=BVf4|GS}{8
zdlvV6s1JrBlf|y+qKt7LXhJ7U0<a0M1AC~pzk;$D8)PO^@miG5^`i-U^(}fm!V719
zajki+&KF&i4*$4%=G+aJ3Ih5r6*eKg4k?$*YL4eMOLD}UnJA2IRy`Ur(3laP%^><`
z6Z>CdnL-}#U<>~Z-b!(|G~qdNvh`W~(zmNib;hUYGlMY@al<<yW11kk^NbkU03NQE
zpWn`RD7CQr!>m9$eUzEdd(-y*4L@&&`<+3rc6rBa%k3}@Vgz$Ut+IN*u`8%kuo;!m
zBh^Q2zDw=k(FF;6&`7Y{A00Md0-BrIm$s+Z=OUE#?rdB5Ypjg|_Ltq4zk@139;ZRa
z4{f5JTs)I?14WFUXcqa|I*LxHD`?3i^h+>Xx;zg$VUU{RivvmXrZS!LjmCG$Sy90?
zC~UcvYAfPrto$i-q8zrg_5^+)EaOlwtk@Zvs%<n>lb0~#XvgG^X5Cp?=bNpNox>L^
zF>6BMjEH==Cq`-6$iy9Gd2aPJ*Fvgr0|jn~iiCwYD~KvEve*GC8Z3IIrCi1z<;m&S
zbk5^~($MWF?*PUCGWI-U5-543skem>oqG(2oE)B#!BVSw3HDr}m7VfnLK-xRRk=V=
z1D&vCZjx2DU$vrVi1oD{=U}cv`tLEgRa;l$Z{q$+1B90ZtHLjc1!(=hl;E!y_YZ~N
zQvU-WP9C4|H~_T%6P!kpT|Pgyzuoo2f=@7ZPS5x}u=sX|-RC!kzWXQ+XuOHnKH<%s
zC8nRSDkbwzl=$uagj26R3(o)7_x??d_y4y--!w)p&t91wdFN}aWZ`Ekw2h4${b{_M
zg{#G%2cG|jfeuX?KA-7pa{fn5x;t2k&>)K$ekNg$Vrmq(5hzG8lK&09|8`@Y1thFf
zsXF8UI4kWk+FT#-$*86t_r%0<d8BZF<riw?;Od_E4J<CmNUp@VD1=@9Q`&d9#tv~v
zis!GHnFr0)`5qpRw`TV#rc~1^B@YH8r_a)~4ckapb!zl9t71U=Vytr}sYQ+*?)rEZ
zG2?zZi}bs@YLo9M#CQ?G(m%Q}#fjRujloHoi-6Z2(g+B{(*z5uYcdh(5b6kBzuxJd
z90(aVcnAcP^O$4rtPAXk!n(a2JFEcC20x2^_P8(OO4Ek7Qc>ETNxYdvk6_^+P5SON
zX&^Bk{gCZe7EiDoc73ooIw8Np`TDhM5dxmWw}5R;oS3d<S5j?;a+?K#*Z?**#tD;N
zVLmz+QhJEvvf)O7FB9!iy}{m@#KFWfPbY#qxYHE#n8fR?$6I5S!#%6!0}0@;usC5e
zV7qc*%$u4JV%Z>qLhe>Tw_60SD$A_rjdf1{@@)nuQI_bJY(8ZpDnA3Z*K#fvd#P1z
z5@UQlND&(cqbnm*?<$VB+K^JR&b9*@UW+)^gDLsIr9tzI;#oD#3EUAcjn_Ke-M%II
zn84s+qODFmeFju2CMUvukS+>Z)5ce#!^-B~yxQ$E+vZub1_0-HJPvCb3N-|ldJ_LP
zS^$){UESLf(N9>aLK{_5PDP+L-SFM0sCXcIN;i9HP|D1&vmK?1K3ebl*H@1wx)Ury
zJz=S|6pe(zM_nmSiVa%>EH&1Z`8yDfW7U21In3;=Z6Ivjd$sr$IP5)7>ee(j4sWWg
ztVAFj)K)E+-=L9<r}P8dKzA)tE!U%#k)!ISNP&}(=NOBAjALa9IW$~j`-F_O>%2Nl
zqL6DyCK-F`w;KSTaf`0?+ySh?#(nmod*`Xjc0<t!+|w6jXMlnaMH|$2(a?W4HEnqH
zV%fq43q*qoFZ9SUbWLASaSrI0I9B$I%pHTRU?IJSgzSjHKe&>lqVNw|-}HtBeu#Na
zlb7Uic5z<#-W3H#r<qFnmL^HEKM>eOE7h5Q?tV7^P3C<}*PMmfk;`M2XJ7vs%U7G6
Z+;lJPf;{CG@UNx^_43<!|EGw|e*!3Y{NDfo

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper-members.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper-members.html
index 66ddf397d..716396c2c 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper-members.html
@@ -95,15 +95,16 @@ $(function() {
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa">SharedLoadIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">SharedLoadStreamD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html">cutlass::gemm::GemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html
index 555b0ce9b..e5a31537c 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html
@@ -114,7 +114,7 @@ Public Types</h2></td></tr>
 <tr class="memitem:a24826f99d097eea0298e6be12a6327b9"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#aaa009025dcd6360ead1dc18005688821">GlobalLoadTileTraits</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a24826f99d097eea0298e6be12a6327b9">GlobalLoadIteratorC</a></td></tr>
 <tr class="memdesc:a24826f99d097eea0298e6be12a6327b9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store to shared memory.  <a href="#a24826f99d097eea0298e6be12a6327b9">More...</a><br /></td></tr>
 <tr class="separator:a24826f99d097eea0298e6be12a6327b9"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad8e5337f3d19437e9c4cafcfcc3e3d3e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalLoadIteratorC::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">GlobalFragmentC</a></td></tr>
+<tr class="memitem:ad8e5337f3d19437e9c4cafcfcc3e3d3e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalLoadIteratorC::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">GlobalFragmentC</a></td></tr>
 <tr class="memdesc:ad8e5337f3d19437e9c4cafcfcc3e3d3e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment that needs to be produced by the load iterator.  <a href="#ad8e5337f3d19437e9c4cafcfcc3e3d3e">More...</a><br /></td></tr>
 <tr class="separator:ad8e5337f3d19437e9c4cafcfcc3e3d3e"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:ad0116b2e7b2ca1526246e2ff7e73fd2f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html">IgemmGlobalLoadTransformer</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">GlobalFragmentC</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">Scalar</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad0116b2e7b2ca1526246e2ff7e73fd2f">GlobalTransformerC</a></td></tr>
@@ -126,25 +126,25 @@ Public Types</h2></td></tr>
 <tr class="memitem:ad3e937c15bfac443b0e3b94d702f46b2"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a16b06a1611dbd22adaa0c9ee5e1b15bd">GlobalStoreTileTraits</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad3e937c15bfac443b0e3b94d702f46b2">GlobalStoreIteratorD</a></td></tr>
 <tr class="memdesc:ad3e937c15bfac443b0e3b94d702f46b2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store to shared memory.  <a href="#ad3e937c15bfac443b0e3b94d702f46b2">More...</a><br /></td></tr>
 <tr class="separator:ad3e937c15bfac443b0e3b94d702f46b2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a723cd69ee4d5c26579b36e02c531ea88"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalStoreIteratorD::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">GlobalFragmentD</a></td></tr>
+<tr class="memitem:a723cd69ee4d5c26579b36e02c531ea88"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalStoreIteratorD::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">GlobalFragmentD</a></td></tr>
 <tr class="memdesc:a723cd69ee4d5c26579b36e02c531ea88"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment that needs to be passed to that store iterator.  <a href="#a723cd69ee4d5c26579b36e02c531ea88">More...</a><br /></td></tr>
 <tr class="separator:a723cd69ee4d5c26579b36e02c531ea88"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a880293ef6a48a0f4941c8f984c36f591"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html">IgemmGlobalStoreTransformer</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ae4128bba3f1df6ef7824e2db79745b00">Scalar</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">GlobalFragmentD</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a880293ef6a48a0f4941c8f984c36f591">GlobalTransformerD</a></td></tr>
 <tr class="memdesc:a880293ef6a48a0f4941c8f984c36f591"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer from accumulators to shared memory fragments.  <a href="#a880293ef6a48a0f4941c8f984c36f591">More...</a><br /></td></tr>
 <tr class="separator:a880293ef6a48a0f4941c8f984c36f591"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad7659dc0eaa491447ad127ef7098924f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">Base::SharedStoreTileTraits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a></td></tr>
+<tr class="memitem:ad7659dc0eaa491447ad127ef7098924f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">Base::SharedStoreTileTraits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a></td></tr>
 <tr class="memdesc:ad7659dc0eaa491447ad127ef7098924f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class for the shared iterator to store D to shared memory.  <a href="#ad7659dc0eaa491447ad127ef7098924f">More...</a><br /></td></tr>
 <tr class="separator:ad7659dc0eaa491447ad127ef7098924f"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:af7024128202d642d3535e1ae5cf5f43d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#af7024128202d642d3535e1ae5cf5f43d">SharedStoreIteratorD</a></td></tr>
 <tr class="memdesc:af7024128202d642d3535e1ae5cf5f43d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared iterator to store D to shared memory.  <a href="#af7024128202d642d3535e1ae5cf5f43d">More...</a><br /></td></tr>
 <tr class="separator:af7024128202d642d3535e1ae5cf5f43d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5e64440830b36899f9c0ed8b369665c8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">SharedStoreIteratorD::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a></td></tr>
+<tr class="memitem:a5e64440830b36899f9c0ed8b369665c8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">SharedStoreIteratorD::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a></td></tr>
 <tr class="memdesc:a5e64440830b36899f9c0ed8b369665c8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment that needs to be passed to that store iterator.  <a href="#a5e64440830b36899f9c0ed8b369665c8">More...</a><br /></td></tr>
 <tr class="separator:a5e64440830b36899f9c0ed8b369665c8"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a00000e0cd14b9e6e242eafb5133af8cf"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html">IgemmSharedStoreTransformer</a>&lt; typename <a class="el" href="structcutlass_1_1Fragment.html#a9c67fa5bbd0b8b49bd6ec002dee3cbab">IgemmConfig::Accumulators::Element</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a00000e0cd14b9e6e242eafb5133af8cf">SharedStoreTransformerD</a></td></tr>
 <tr class="memdesc:a00000e0cd14b9e6e242eafb5133af8cf"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer from accumulators to shared memory fragments.  <a href="#a00000e0cd14b9e6e242eafb5133af8cf">More...</a><br /></td></tr>
 <tr class="separator:a00000e0cd14b9e6e242eafb5133af8cf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a851113bffb5b656c5c649845852b3b8d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">Base::SharedLoadTileTraits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a></td></tr>
+<tr class="memitem:a851113bffb5b656c5c649845852b3b8d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">Base::SharedLoadTileTraits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a></td></tr>
 <tr class="memdesc:a851113bffb5b656c5c649845852b3b8d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class for the shared iterator to load D from shared memory.  <a href="#a851113bffb5b656c5c649845852b3b8d">More...</a><br /></td></tr>
 <tr class="separator:a851113bffb5b656c5c649845852b3b8d"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:ad33ee44527a7fcfd41b4e677927fd4fa"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad33ee44527a7fcfd41b4e677927fd4fa">SharedLoadIteratorD</a></td></tr>
@@ -165,28 +165,31 @@ Public Types</h2></td></tr>
 <tr class="memitem:a981134cf87d85aa28570a62d9e878b10 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef EpilogueFunctor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">Functor</a></td></tr>
 <tr class="memdesc:a981134cf87d85aa28570a62d9e878b10 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do the math in the epilogue.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a981134cf87d85aa28570a62d9e878b10">More...</a><br /></td></tr>
 <tr class="separator:a981134cf87d85aa28570a62d9e878b10 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3a0fb3a914bfd009ff2e3918bcd231a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a>&lt; typename Functor::Scalar, typename IgemmConfig_ ::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">OutputTile</a>, typename IgemmConfig_ ::Warps, typename IgemmConfig_ ::MultiplyAdd::ThreadsPerWarp, IgemmConfig_ ::kScalarsPerStsD, 128/sizeof(typename IgemmConfig_ ::ScalarD)/IgemmConfig_ ::kScalarsPerStsD/2 *IgemmConfig_ ::kScalarsPerStsD &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">SharedStoreTileTraits</a></td></tr>
-<tr class="memdesc:a3a0fb3a914bfd009ff2e3918bcd231a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store to shared memory for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">More...</a><br /></td></tr>
-<tr class="separator:a3a0fb3a914bfd009ff2e3918bcd231a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a02a517fd246fb961727d3bd1b4f954be inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">SharedStoreTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>, IteratorAdvance::kH, MemorySpace::kShared &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a></td></tr>
+<tr class="memitem:aad9a6190cccbc5c23a86f09c45c0e507 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html">GemmSharedStoreTileDTraits</a>&lt; typename Functor::ScalarAccum, typename IgemmConfig_ ::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">OutputTile</a>, typename IgemmConfig_ ::Warps, typename IgemmConfig_ ::MultiplyAdd::ThreadsPerWarp, IgemmConfig_ ::kScalarsPerStsD, 128/sizeof(typename IgemmConfig_ ::ScalarD)/IgemmConfig_ ::kScalarsPerStsD/2 *IgemmConfig_ ::kScalarsPerStsD &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">SharedStoreTileTraits</a></td></tr>
+<tr class="memdesc:aad9a6190cccbc5c23a86f09c45c0e507 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store to shared memory for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">More...</a><br /></td></tr>
+<tr class="separator:aad9a6190cccbc5c23a86f09c45c0e507 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a02a517fd246fb961727d3bd1b4f954be inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">SharedStoreTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileDTraits.html#a9a2218b570dada2f1e3ccd8004c47856">SharedStoreTileTraits::Scalar</a>, IteratorAdvance::kH, MemorySpace::kShared &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">SharedStoreIteratorD</a></td></tr>
 <tr class="memdesc:a02a517fd246fb961727d3bd1b4f954be inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D to shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a02a517fd246fb961727d3bd1b4f954be">More...</a><br /></td></tr>
 <tr class="separator:a02a517fd246fb961727d3bd1b4f954be inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa5cea8dbebda9a12a503ae1416c4da33 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">SharedStoreIteratorD::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a></td></tr>
+<tr class="memitem:aa5cea8dbebda9a12a503ae1416c4da33 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">SharedStoreIteratorD::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">SharedStoreTransformerD</a></td></tr>
 <tr class="memdesc:aa5cea8dbebda9a12a503ae1416c4da33 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aa5cea8dbebda9a12a503ae1416c4da33">More...</a><br /></td></tr>
 <tr class="separator:aa5cea8dbebda9a12a503ae1416c4da33 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab8ba28fd1da48fcabbafc0de91281b46 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a>&lt; typename Functor::Scalar, typename IgemmConfig_ ::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">OutputTile</a>, typename IgemmConfig_ ::Warps, typename IgemmConfig_ ::MultiplyAdd::ThreadsPerWarp, IgemmConfig_ ::OutputTile::kH/<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a> &gt;::kCount, IgemmConfig_ ::kScalarsPerLdsD, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">SharedLoadTileTraits</a></td></tr>
-<tr class="memdesc:ab8ba28fd1da48fcabbafc0de91281b46 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">More...</a><br /></td></tr>
-<tr class="separator:ab8ba28fd1da48fcabbafc0de91281b46 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adbff60de6f90ef4d5ae0c7096692e2c0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">SharedLoadTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>, IteratorAdvance::kH, MemorySpace::kShared &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a></td></tr>
+<tr class="memitem:a076ea17d901d22d3b69bf9c621858235 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html">GemmSharedLoadTileDTraits</a>&lt; typename Functor::ScalarAccum, typename IgemmConfig_ ::<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ac30a062bed1a65e45961c4f301b69101">OutputTile</a>, typename IgemmConfig_ ::Warps, typename IgemmConfig_ ::MultiplyAdd::ThreadsPerWarp, IgemmConfig_ ::OutputTile::kH/<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a> &gt;::kCount, IgemmConfig_ ::kScalarsPerLdsD, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">SharedLoadTileTraits</a></td></tr>
+<tr class="memdesc:a076ea17d901d22d3b69bf9c621858235 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">More...</a><br /></td></tr>
+<tr class="separator:a076ea17d901d22d3b69bf9c621858235 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbff60de6f90ef4d5ae0c7096692e2c0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">SharedLoadTileTraits</a>, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileDTraits.html#a1b025cb056729706f36469e74a9799dc">SharedLoadTileTraits::Scalar</a>, IteratorAdvance::kH, MemorySpace::kShared &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a></td></tr>
 <tr class="memdesc:adbff60de6f90ef4d5ae0c7096692e2c0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load D from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">More...</a><br /></td></tr>
 <tr class="separator:adbff60de6f90ef4d5ae0c7096692e2c0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9e511e1852668e0a242315c24888dee3 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#adbff60de6f90ef4d5ae0c7096692e2c0">SharedLoadIteratorD</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">SharedLoadStreamD</a></td></tr>
+<tr class="memdesc:a9e511e1852668e0a242315c24888dee3 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a9e511e1852668e0a242315c24888dee3">More...</a><br /></td></tr>
+<tr class="separator:a9e511e1852668e0a242315c24888dee3 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a94f00f94a88588522ca3f9f0197a5a9b inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a>&lt; typename IgemmConfig_ ::ScalarC const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, IgemmConfig_ ::OutputTile::kH/<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a> &gt;::kCount, IgemmConfig_ ::OutputTile::kW &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename IgemmConfig_ ::Warps &gt;::kCount, IgemmConfig_ ::kWarpSize &gt;, Iterations::kW, IgemmConfig_ ::kScalarsPerLdgC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">GlobalLoadTileTraits</a></td></tr>
 <tr class="memdesc:a94f00f94a88588522ca3f9f0197a5a9b inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for C^N.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">More...</a><br /></td></tr>
 <tr class="separator:a94f00f94a88588522ca3f9f0197a5a9b inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:aeea13630bb281834b717f8d9d13a9319 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a94f00f94a88588522ca3f9f0197a5a9b">GlobalLoadTileTraits</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">GlobalLoadIteratorC</a></td></tr>
 <tr class="memdesc:aeea13630bb281834b717f8d9d13a9319 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aeea13630bb281834b717f8d9d13a9319">More...</a><br /></td></tr>
 <tr class="separator:aeea13630bb281834b717f8d9d13a9319 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0682b61d1a1a951026ff026bff9361bb inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalLoadIteratorC::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">GlobalTransformerC</a></td></tr>
+<tr class="memitem:a0682b61d1a1a951026ff026bff9361bb inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalLoadIteratorC::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">GlobalTransformerC</a></td></tr>
 <tr class="memdesc:a0682b61d1a1a951026ff026bff9361bb inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a0682b61d1a1a951026ff026bff9361bb">More...</a><br /></td></tr>
 <tr class="separator:a0682b61d1a1a951026ff026bff9361bb inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a16d7df2934c3c59d9b8f36f7a2137aee inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileCdTraits.html">GemmGlobalTileCdTraits</a>&lt; typename IgemmConfig_ ::ScalarD, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, IgemmConfig_ ::OutputTile::kH/<a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ad7b23352072b1509d3383ee775756d2a">Iterations</a> &gt;::kCount, IgemmConfig_ ::OutputTile::kW &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename IgemmConfig_ ::Warps &gt;::kCount, IgemmConfig_ ::kWarpSize &gt;, Iterations::kW, IgemmConfig_ ::kScalarsPerStgD &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">GlobalStoreTileTraits</a></td></tr>
@@ -195,7 +198,7 @@ Public Types</h2></td></tr>
 <tr class="memitem:a23be7b4b498c17f9235a2b4896f1bffb inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a16d7df2934c3c59d9b8f36f7a2137aee">GlobalStoreTileTraits</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">GlobalStoreIteratorD</a></td></tr>
 <tr class="memdesc:a23be7b4b498c17f9235a2b4896f1bffb inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a23be7b4b498c17f9235a2b4896f1bffb">More...</a><br /></td></tr>
 <tr class="separator:a23be7b4b498c17f9235a2b4896f1bffb inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae96c5a3d58dc7a95543f8749f762ca43 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalStoreIteratorD::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">GlobalTransformerD</a></td></tr>
+<tr class="memitem:ae96c5a3d58dc7a95543f8749f762ca43 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalStoreIteratorD::Fragment</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">GlobalTransformerD</a></td></tr>
 <tr class="memdesc:ae96c5a3d58dc7a95543f8749f762ca43 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ae96c5a3d58dc7a95543f8749f762ca43">More...</a><br /></td></tr>
 <tr class="separator:ae96c5a3d58dc7a95543f8749f762ca43 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
@@ -241,7 +244,7 @@ template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_
 template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalLoadIteratorC::Fragment</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">GlobalFragmentC</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalLoadIteratorC::Fragment</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad8e5337f3d19437e9c4cafcfcc3e3d3e">GlobalFragmentC</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -257,7 +260,7 @@ template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_
 template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">GlobalStoreIteratorD::Fragment</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">GlobalFragmentD</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">GlobalStoreIteratorD::Fragment</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a723cd69ee4d5c26579b36e02c531ea88">GlobalFragmentD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -433,7 +436,7 @@ template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_
 template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#ab8ba28fd1da48fcabbafc0de91281b46">Base::SharedLoadTileTraits</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a076ea17d901d22d3b69bf9c621858235">Base::SharedLoadTileTraits</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a851113bffb5b656c5c649845852b3b8d">SharedLoadTileTraits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -449,7 +452,7 @@ template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_
 template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">SharedStoreIteratorD::Fragment</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">SharedStoreIteratorD::Fragment</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#a5e64440830b36899f9c0ed8b369665c8">SharedStoreFragmentD</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -481,7 +484,7 @@ template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_
 template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#a3a0fb3a914bfd009ff2e3918bcd231a9">Base::SharedStoreTileTraits</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraitsHelper.html#aad9a6190cccbc5c23a86f09c45c0e507">Base::SharedStoreTileTraits</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html">cutlass::gemm::IgemmEpilogueTraitsHelper</a>&lt; IgemmConfig_, EpilogueFunctor_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraitsHelper.html#ad7659dc0eaa491447ad127ef7098924f">SharedStoreTileTraits</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -510,7 +513,7 @@ template&lt;typename IgemmConfig_ , typename EpilogueFunctor_ , typename Index_
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4-members.html
index 7b975671b..de8fb76c5 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4-members.html
@@ -81,38 +81,37 @@ $(function() {
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a98b415dbe6f7b6cb0c41a4e6b3ad5abf">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">epilogue</a>(Coord&lt; 3 &gt; const &amp;block, Accumulators &amp;accumulators)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">epilogue_with_or_without_beta</a>(Coord&lt; 3 &gt; const &amp;block, Accumulators &amp;accumulators)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">epilogue</a>(Accumulators &amp;accumulators, Coord&lt; 3 &gt; const &amp;block=make_Coord(0, 0, 0), int batch_id=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">epilogue_with_or_without_beta</a>(Accumulators &amp;accumulators, Coord&lt; 3 &gt; const &amp;block, int batch_id)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">GemmEpilogue</a>(Params const &amp;params_, SharedStorage &amp;shared_storage_, Index m_, Index n_)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a49ac00bed1532707aacd3ff108c84623">IgemmEpilogue</a>(typename Base::Params const &amp;params_, typename Base::SharedStorage &amp;shared_storage_, typename Base::Index m_, typename Base::Index n_)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">m</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">n</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">GemmEpilogue</a>(Params const &amp;params_, SharedStorage &amp;shared_storage_, Coord&lt; 3 &gt; const &amp;_problem_size)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aecb5429363c7156ee3ad596fe250120a">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a1c766374d900535c944cf2a2de6925f4">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a41edfd24b7dd2759f8b72ae8534182a9">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a32f618ff19d984447fba7355d46a69a7">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a0a1be1aab827127161406871ca75cbe0">IgemmEpilogue</a>(typename Base::Params const &amp;params_, typename Base::SharedStorage &amp;shared_storage_, Coord&lt; 3 &gt; const &amp;_problem_size)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html">cutlass::gemm::IgemmEpilogue&lt; GemmEpilogueTraits_, true &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e3c978da6ed56239783bf4db0a936ae">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a92a135fac401d43a8d2f14982d90274b">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a81b028a18df51d3caa1b0ba0c990e362">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0d38914bf97084e04102e7897aee4295">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac1b2a16b4ccf3e9617faf4d8a2c43691">shared_store_fence</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">SharedLoadIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">SharedLoadTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">SharedLoadStreamD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#aab0a964efe223c5c29bc816c393b5a9a">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a645ab6e9e63163ee6bf536717a30fb1b">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html
index 37e7daa84..a6ad3ab6e 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html
@@ -140,12 +140,9 @@ Public Types</h2></td></tr>
 <tr class="memitem:a9063e7fc044a679652d5a3a31aa77e7c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef Traits::SharedStoreTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">SharedStoreTransformerD</a></td></tr>
 <tr class="memdesc:a9063e7fc044a679652d5a3a31aa77e7c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9063e7fc044a679652d5a3a31aa77e7c">More...</a><br /></td></tr>
 <tr class="separator:a9063e7fc044a679652d5a3a31aa77e7c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4a0b439f8a57d8e67174ecbd96183070 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef Traits::SharedLoadIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">SharedLoadIteratorD</a></td></tr>
-<tr class="memdesc:a4a0b439f8a57d8e67174ecbd96183070 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4a0b439f8a57d8e67174ecbd96183070">More...</a><br /></td></tr>
-<tr class="separator:a4a0b439f8a57d8e67174ecbd96183070 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a132cabbc1402c87c7b35dea427001a13 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename SharedLoadIteratorD::Fragment &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">SharedLoadTransformerD</a></td></tr>
-<tr class="memdesc:a132cabbc1402c87c7b35dea427001a13 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared load transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a132cabbc1402c87c7b35dea427001a13">More...</a><br /></td></tr>
-<tr class="separator:a132cabbc1402c87c7b35dea427001a13 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8e5d38a7795b50a021fc43dc7424288b inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef Traits::SharedLoadStreamD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">SharedLoadStreamD</a></td></tr>
+<tr class="memdesc:a8e5d38a7795b50a021fc43dc7424288b inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a8e5d38a7795b50a021fc43dc7424288b">More...</a><br /></td></tr>
+<tr class="separator:a8e5d38a7795b50a021fc43dc7424288b inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a07c93d583bfddd8f916fba6ef809832e inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">typedef Traits::Index&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a></td></tr>
 <tr class="memdesc:a07c93d583bfddd8f916fba6ef809832e inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">More...</a><br /></td></tr>
 <tr class="separator:a07c93d583bfddd8f916fba6ef809832e inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -158,19 +155,19 @@ Public Types</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a49ac00bed1532707aacd3ff108c84623"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a49ac00bed1532707aacd3ff108c84623">IgemmEpilogue</a> (typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Base::Params</a> const &amp;params_, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">Base::SharedStorage</a> &amp;shared_storage_, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a> m_, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a> n_)</td></tr>
-<tr class="memdesc:a49ac00bed1532707aacd3ff108c84623"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a49ac00bed1532707aacd3ff108c84623">More...</a><br /></td></tr>
-<tr class="separator:a49ac00bed1532707aacd3ff108c84623"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0a1be1aab827127161406871ca75cbe0"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue_3_01GemmEpilogueTraits___00_01true_01_4.html#a0a1be1aab827127161406871ca75cbe0">IgemmEpilogue</a> (typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Base::Params</a> const &amp;params_, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">Base::SharedStorage</a> &amp;shared_storage_, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;_problem_size)</td></tr>
+<tr class="memdesc:a0a1be1aab827127161406871ca75cbe0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a0a1be1aab827127161406871ca75cbe0">More...</a><br /></td></tr>
+<tr class="separator:a0a1be1aab827127161406871ca75cbe0"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">cutlass::gemm::GemmEpilogue&lt; GemmEpilogueTraits_ &gt;</a></td></tr>
-<tr class="memitem:ab10147070c3a38fca75397f55dc51925 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">GemmEpilogue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> const &amp;params_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> &amp;shared_storage_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> m_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a> n_)</td></tr>
-<tr class="memdesc:ab10147070c3a38fca75397f55dc51925 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ab10147070c3a38fca75397f55dc51925">More...</a><br /></td></tr>
-<tr class="separator:ab10147070c3a38fca75397f55dc51925 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae1983e37454ed14272b23b964614c54c inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">epilogue</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators)</td></tr>
-<tr class="memdesc:ae1983e37454ed14272b23b964614c54c inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">Execute the epilogue.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae1983e37454ed14272b23b964614c54c">More...</a><br /></td></tr>
-<tr class="separator:ae1983e37454ed14272b23b964614c54c inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0c24dce365565f75e7edc1de1cb50ea4 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memTemplParams" colspan="2">template&lt;bool kBetaIsZero_&gt; </td></tr>
-<tr class="memitem:a0c24dce365565f75e7edc1de1cb50ea4 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a0c24dce365565f75e7edc1de1cb50ea4">epilogue_with_or_without_beta</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators)</td></tr>
-<tr class="separator:a0c24dce365565f75e7edc1de1cb50ea4 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af91ebe8d2ed73808b9ea8846c140d3f8 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">GemmEpilogue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ae5209fa80705442693833c63d535161e">Params</a> const &amp;params_, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> &amp;shared_storage_, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;_problem_size)</td></tr>
+<tr class="memdesc:af91ebe8d2ed73808b9ea8846c140d3f8 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#af91ebe8d2ed73808b9ea8846c140d3f8">More...</a><br /></td></tr>
+<tr class="separator:af91ebe8d2ed73808b9ea8846c140d3f8 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6f1f96715425b7196e960907676a7db3 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">epilogue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block=<a class="el" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0), int batch_id=0)</td></tr>
+<tr class="memdesc:a6f1f96715425b7196e960907676a7db3 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">Execute the epilogue.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6f1f96715425b7196e960907676a7db3">More...</a><br /></td></tr>
+<tr class="separator:a6f1f96715425b7196e960907676a7db3 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7af2eb421840e037263e6a144cca5c32 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memTemplParams" colspan="2">template&lt;bool kSourceRequired&gt; </td></tr>
+<tr class="memitem:a7af2eb421840e037263e6a144cca5c32 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a7af2eb421840e037263e6a144cca5c32">epilogue_with_or_without_beta</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#afe6bebd94e3379c94054d04c5196edce">Accumulators</a> &amp;accumulators, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block, int batch_id)</td></tr>
+<tr class="separator:a7af2eb421840e037263e6a144cca5c32 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9b5e42f222fec98ff479bc1650221b84 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">shared_load_fence</a> ()</td></tr>
 <tr class="memdesc:a9b5e42f222fec98ff479bc1650221b84 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9b5e42f222fec98ff479bc1650221b84">More...</a><br /></td></tr>
 <tr class="separator:a9b5e42f222fec98ff479bc1650221b84 inherit pub_methods_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -187,11 +184,11 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:a442b5b5688cd658c3b3476650c00281e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac36dad8a7b6bc7fc6ef88e44068468dc">SharedStorage</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">shared_storage</a></td></tr>
 <tr class="memdesc:a442b5b5688cd658c3b3476650c00281e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a442b5b5688cd658c3b3476650c00281e">More...</a><br /></td></tr>
 <tr class="separator:a442b5b5688cd658c3b3476650c00281e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac344bf5ca318dc343bd6fa6bf52d2e22 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">m</a></td></tr>
-<tr class="memdesc:ac344bf5ca318dc343bd6fa6bf52d2e22 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The dimensions of the GEMM.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#ac344bf5ca318dc343bd6fa6bf52d2e22">More...</a><br /></td></tr>
-<tr class="separator:ac344bf5ca318dc343bd6fa6bf52d2e22 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9cc371cd2f1a9485583afdacbb7403ea inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a9cc371cd2f1a9485583afdacbb7403ea">n</a></td></tr>
-<tr class="separator:a9cc371cd2f1a9485583afdacbb7403ea inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6bea57249e3645a4b08a11619cb1687e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">problem_size</a></td></tr>
+<tr class="memdesc:a6bea57249e3645a4b08a11619cb1687e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="mdescLeft">&#160;</td><td class="mdescRight">The dimensions of the GEMM.  <a href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6bea57249e3645a4b08a11619cb1687e">More...</a><br /></td></tr>
+<tr class="separator:a6bea57249e3645a4b08a11619cb1687e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5aa254702fcf24630e04ceb174aa3d57 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a6c30bea1b2a1bd2e981025851d5b12d1">Functor</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a5aa254702fcf24630e04ceb174aa3d57">functor</a></td></tr>
+<tr class="separator:a5aa254702fcf24630e04ceb174aa3d57 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmEpilogue"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="a98b415dbe6f7b6cb0c41a4e6b3ad5abf"></a>
@@ -211,8 +208,8 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a49ac00bed1532707aacd3ff108c84623"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a49ac00bed1532707aacd3ff108c84623">&#9670;&nbsp;</a></span>IgemmEpilogue()</h2>
+<a id="a0a1be1aab827127161406871ca75cbe0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0a1be1aab827127161406871ca75cbe0">&#9670;&nbsp;</a></span>IgemmEpilogue()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -237,14 +234,8 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a>&#160;</td>
-          <td class="paramname"><em>m_</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
-          <td></td>
-          <td class="paramtype">typename <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a07c93d583bfddd8f916fba6ef809832e">Base::Index</a>&#160;</td>
-          <td class="paramname"><em>n_</em>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>_problem_size</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -267,7 +258,7 @@ template&lt;typename GemmEpilogueTraits_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter-members.html b/docs/structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter-members.html
index 95e068d13..0cc8c21c1 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html b/docs/structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html
index 35a75abea..8a66295fc 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmFloatToInt8Converter.html
@@ -257,7 +257,7 @@ template&lt;typename Fragment_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb-members.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb-members.html
new file mode 100644
index 000000000..a24dde73b
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb-members.html
@@ -0,0 +1,151 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6">add_pointer_offset</a>(Index offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a82a9cfc61ecc117592bdb30f57bd35c9">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">BaseParams</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">GemmGlobalIteratorAb</a>(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;threadblock_offset, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a489fe448cd7f7e1f3805d33504f9d336">IgemmGlobalIteratorAb</a>(typename Base::Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;threadblock_offset, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">inc_stage</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018">initialize_predicates</a>(const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block_offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::initialize_predicates</a>(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">kFragmentElementType</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126">kRequiresLoadFence</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a>(Fragment &amp;fragment, PredicateIterator pred_it) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">load</a>(Fragment &amp;fragment) const</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">load</a>(Fragment &amp;fragment, int d)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a5cbda0dea8c87ca55499c97cc80b1ccf">load_element</a>(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7">load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::load_post_increment</a>(Fragment &amp;fragment, PredicateIterator pred_it)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">mask_</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">operator+=</a>(Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">residue</a>(Index k)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7">stride_advance</a>(void)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">TileLoadIterator</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">TileLoadIterator</a>(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">TileLoadIterator</a>(Params const &amp;, Scalar const *ptr, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html
new file mode 100644
index 000000000..ea16c63b2
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html
@@ -0,0 +1,597 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="igemm__global__tile_8h_source.html">igemm_global_tile.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::IgemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.png" usemap="#cutlass::gemm::IgemmGlobalIteratorAb_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::IgemmGlobalIteratorAb_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map" name="cutlass::gemm::IgemmGlobalIteratorAb_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html" alt="cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;" shape="rect" coords="0,112,1003,136"/>
+<area href="structcutlass_1_1TileLoadIterator.html" alt="cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;" shape="rect" coords="0,56,1003,80"/>
+<area href="structcutlass_1_1TileIteratorBase.html" alt="cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;" shape="rect" coords="0,0,1003,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a82a9cfc61ecc117592bdb30f57bd35c9"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a82a9cfc61ecc117592bdb30f57bd35c9">Base</a></td></tr>
+<tr class="memdesc:a82a9cfc61ecc117592bdb30f57bd35c9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base class.  <a href="#a82a9cfc61ecc117592bdb30f57bd35c9">More...</a><br /></td></tr>
+<tr class="separator:a82a9cfc61ecc117592bdb30f57bd35c9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07ff2f97fdd57c4df05ef8e817265b30"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a07ff2f97fdd57c4df05ef8e817265b30">ThreadOffset</a></td></tr>
+<tr class="memdesc:a07ff2f97fdd57c4df05ef8e817265b30"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to compute the thread offset.  <a href="#a07ff2f97fdd57c4df05ef8e817265b30">More...</a><br /></td></tr>
+<tr class="separator:a07ff2f97fdd57c4df05ef8e817265b30"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td></tr>
+<tr class="memitem:a2892be253a3de5bffc3edcef2890d3a8 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">This_</a></td></tr>
+<tr class="memdesc:a2892be253a3de5bffc3edcef2890d3a8 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">This class.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2892be253a3de5bffc3edcef2890d3a8">More...</a><br /></td></tr>
+<tr class="separator:a2892be253a3de5bffc3edcef2890d3a8 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae13e0d30a941e16875f196b4844b03ed inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; TileTraits_, typename TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a> :<a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">IteratorAdvance::kW</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">Base</a></td></tr>
+<tr class="memdesc:ae13e0d30a941e16875f196b4844b03ed inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base class.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">More...</a><br /></td></tr>
+<tr class="separator:ae13e0d30a941e16875f196b4844b03ed inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a646bd38ab95cdf0379ecb372839a9111 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">Tile</a></td></tr>
+<tr class="memdesc:a646bd38ab95cdf0379ecb372839a9111 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a646bd38ab95cdf0379ecb372839a9111">More...</a><br /></td></tr>
+<tr class="separator:a646bd38ab95cdf0379ecb372839a9111 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2180cfbb482d300472ad2993e4b555d4 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a></td></tr>
+<tr class="memdesc:a2180cfbb482d300472ad2993e4b555d4 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Fragment.html" title="A template defining Fragment Concept. ">Fragment</a> type loaded by the iterator.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">More...</a><br /></td></tr>
+<tr class="separator:a2180cfbb482d300472ad2993e4b555d4 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5817b81c7013db9a3f7394ad4b1db79a inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">Scalar</a></td></tr>
+<tr class="memdesc:a5817b81c7013db9a3f7394ad4b1db79a inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5817b81c7013db9a3f7394ad4b1db79a">More...</a><br /></td></tr>
+<tr class="separator:a5817b81c7013db9a3f7394ad4b1db79a inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a33e4dcd4449f324fed5ceaa2cde01b50 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Threads&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">Threads</a></td></tr>
+<tr class="memdesc:a33e4dcd4449f324fed5ceaa2cde01b50 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a33e4dcd4449f324fed5ceaa2cde01b50">More...</a><br /></td></tr>
+<tr class="separator:a33e4dcd4449f324fed5ceaa2cde01b50 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ff9cae930c8a6bb9c8ee6d81cb1953f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a></td></tr>
+<tr class="memdesc:a7ff9cae930c8a6bb9c8ee6d81cb1953f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">More...</a><br /></td></tr>
+<tr class="separator:a7ff9cae930c8a6bb9c8ee6d81cb1953f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afd09d3b8e5ca04eab7edc2e5723816e5 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a></td></tr>
+<tr class="memdesc:afd09d3b8e5ca04eab7edc2e5723816e5 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The thread offset.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">More...</a><br /></td></tr>
+<tr class="separator:afd09d3b8e5ca04eab7edc2e5723816e5 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3dd74f6e12339a87c0eb8f75fbdc7b9c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Base::Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a></td></tr>
+<tr class="separator:a3dd74f6e12339a87c0eb8f75fbdc7b9c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a09268125f1e323874f6c12b50185c517 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Base::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">BaseParams</a></td></tr>
+<tr class="memdesc:a09268125f1e323874f6c12b50185c517 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterator parameters type.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a09268125f1e323874f6c12b50185c517">More...</a><br /></td></tr>
+<tr class="separator:a09268125f1e323874f6c12b50185c517 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1TileLoadIterator"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileLoadIterator')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
+<tr class="memitem:a1f3601c595f12e7083919ece9b1ec84e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"></td></tr>
+<tr class="memdesc:a1f3601c595f12e7083919ece9b1ec84e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Do we require a fence?  <a href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84e">More...</a><br /></td></tr>
+<tr class="separator:a1f3601c595f12e7083919ece9b1ec84e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1dcbf633eac61ff06980e4992fbe8264 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt; TileTraits_, TileTraits_::Scalar, Advance_, <a class="el" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">Base</a></td></tr>
+<tr class="memdesc:a1dcbf633eac61ff06980e4992fbe8264 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base class.  <a href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">More...</a><br /></td></tr>
+<tr class="separator:a1dcbf633eac61ff06980e4992fbe8264 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6a5d065939282fa1b9454b28a1e73948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Base::Traits</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">Traits</a></td></tr>
+<tr class="memdesc:a6a5d065939282fa1b9454b28a1e73948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">More...</a><br /></td></tr>
+<tr class="separator:a6a5d065939282fa1b9454b28a1e73948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aafbb7a2137a07f0e07a12838b66bd511 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Base::Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a></td></tr>
+<tr class="memdesc:aafbb7a2137a07f0e07a12838b66bd511 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">More...</a><br /></td></tr>
+<tr class="separator:aafbb7a2137a07f0e07a12838b66bd511 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a70dfd0b62feb082d8da34af09d9524a6 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">FragmentElement</a></td></tr>
+<tr class="memdesc:a70dfd0b62feb082d8da34af09d9524a6 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">More...</a><br /></td></tr>
+<tr class="separator:a70dfd0b62feb082d8da34af09d9524a6 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaa5d98b72576478ba04e4ad554faa827 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Base::Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">Index</a></td></tr>
+<tr class="memdesc:aaa5d98b72576478ba04e4ad554faa827 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">More...</a><br /></td></tr>
+<tr class="separator:aaa5d98b72576478ba04e4ad554faa827 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb6cc0e2990c06c83b789b579a03b15f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Base::Skew</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">Skew</a></td></tr>
+<tr class="memdesc:aeb6cc0e2990c06c83b789b579a03b15f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">More...</a><br /></td></tr>
+<tr class="separator:aeb6cc0e2990c06c83b789b579a03b15f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a88eaa581e0b5419b98ee5a71073d0539 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Base::Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">Tile</a></td></tr>
+<tr class="memdesc:a88eaa581e0b5419b98ee5a71073d0539 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">More...</a><br /></td></tr>
+<tr class="separator:a88eaa581e0b5419b98ee5a71073d0539 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afc68649cb9bb32931b27e711c7ce2604 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Base::Delta</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">Delta</a></td></tr>
+<tr class="memdesc:afc68649cb9bb32931b27e711c7ce2604 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Delta.  <a href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">More...</a><br /></td></tr>
+<tr class="separator:afc68649cb9bb32931b27e711c7ce2604 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6c570dfa1cb68d436d8da6bd23cce6ce inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Base::Iterations</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Iterations</a></td></tr>
+<tr class="memdesc:a6c570dfa1cb68d436d8da6bd23cce6ce inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">More...</a><br /></td></tr>
+<tr class="separator:a6c570dfa1cb68d436d8da6bd23cce6ce inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae8cb43a98cd2fa28f6457afbda8ec58a inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">Base::ThreadOffset</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">ThreadOffset</a></td></tr>
+<tr class="memdesc:ae8cb43a98cd2fa28f6457afbda8ec58a inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">ThreadOffset functor.  <a href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">More...</a><br /></td></tr>
+<tr class="separator:ae8cb43a98cd2fa28f6457afbda8ec58a inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a46a2cbf407d3f43a7441323d150d96f1 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">Base::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">FragmentShape</a></td></tr>
+<tr class="memdesc:a46a2cbf407d3f43a7441323d150d96f1 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment type.  <a href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">More...</a><br /></td></tr>
+<tr class="separator:a46a2cbf407d3f43a7441323d150d96f1 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae8f2c93ec43646be70d4b9f32d034125 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">AccessType</a></td></tr>
+<tr class="memdesc:ae8f2c93ec43646be70d4b9f32d034125 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory access type.  <a href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">More...</a><br /></td></tr>
+<tr class="separator:ae8f2c93ec43646be70d4b9f32d034125 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4604b230174b11bc7ddf5f3e9a922139 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Base::Fragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">Fragment</a></td></tr>
+<tr class="memdesc:a4604b230174b11bc7ddf5f3e9a922139 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment definition.  <a href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">More...</a><br /></td></tr>
+<tr class="separator:a4604b230174b11bc7ddf5f3e9a922139 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad9c77ca0521d18a90dd3542a3941f016 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">FragmentIterator</a></td></tr>
+<tr class="memdesc:ad9c77ca0521d18a90dd3542a3941f016 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment iterator definition.  <a href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">More...</a><br /></td></tr>
+<tr class="separator:ad9c77ca0521d18a90dd3542a3941f016 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad272502e5a54615584bb037a33ff1dca inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">Base::FragmentConstIterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:ad272502e5a54615584bb037a33ff1dca inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment const iterator definition.  <a href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">More...</a><br /></td></tr>
+<tr class="separator:ad272502e5a54615584bb037a33ff1dca inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad71f865c61f02eba981c056ef71653f5 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">Base::PredicateVector</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">PredicateVector</a></td></tr>
+<tr class="memdesc:ad71f865c61f02eba981c056ef71653f5 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">More...</a><br /></td></tr>
+<tr class="separator:ad71f865c61f02eba981c056ef71653f5 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a57eff980f6b1086abe39dd617de5b948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Base::Storage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a></td></tr>
+<tr class="memdesc:a57eff980f6b1086abe39dd617de5b948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Storage object that may be loaded from.  <a href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">More...</a><br /></td></tr>
+<tr class="separator:a57eff980f6b1086abe39dd617de5b948 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aebb9153659320f1391671c215c519e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef Base::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">BaseParams</a></td></tr>
+<tr class="memdesc:a9aebb9153659320f1391671c215c519e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">IteratorBase parameters.  <a href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">More...</a><br /></td></tr>
+<tr class="separator:a9aebb9153659320f1391671c215c519e inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a39acc5c35c8db019a3aeef79e8005b7f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">Pointer</a></td></tr>
+<tr class="memdesc:a39acc5c35c8db019a3aeef79e8005b7f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer type.  <a href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">More...</a><br /></td></tr>
+<tr class="separator:a39acc5c35c8db019a3aeef79e8005b7f inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a146adfb1951efd70995b05a7a31fd548 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const, 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a></td></tr>
+<tr class="memdesc:a146adfb1951efd70995b05a7a31fd548 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tensor reference for the load iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">More...</a><br /></td></tr>
+<tr class="separator:a146adfb1951efd70995b05a7a31fd548 inherit pub_types_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
+<tr class="memitem:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td></tr>
+<tr class="memdesc:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">More...</a><br /></td></tr>
+<tr class="separator:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td></tr>
+<tr class="memdesc:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">More...</a><br /></td></tr>
+<tr class="separator:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td></tr>
+<tr class="memdesc:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">More...</a><br /></td></tr>
+<tr class="separator:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td></tr>
+<tr class="memdesc:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">More...</a><br /></td></tr>
+<tr class="separator:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td></tr>
+<tr class="memdesc:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">More...</a><br /></td></tr>
+<tr class="separator:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td></tr>
+<tr class="memdesc:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">More...</a><br /></td></tr>
+<tr class="separator:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td></tr>
+<tr class="memdesc:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">More...</a><br /></td></tr>
+<tr class="separator:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">More...</a><br /></td></tr>
+<tr class="separator:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td></tr>
+<tr class="memdesc:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">More...</a><br /></td></tr>
+<tr class="separator:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td></tr>
+<tr class="memdesc:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">More...</a><br /></td></tr>
+<tr class="separator:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td></tr>
+<tr class="memdesc:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">More...</a><br /></td></tr>
+<tr class="separator:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a></td></tr>
+<tr class="memdesc:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">More...</a><br /></td></tr>
+<tr class="separator:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td></tr>
+<tr class="memdesc:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">More...</a><br /></td></tr>
+<tr class="separator:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td></tr>
+<tr class="memdesc:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">More...</a><br /></td></tr>
+<tr class="separator:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">More...</a><br /></td></tr>
+<tr class="separator:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td></tr>
+<tr class="memdesc:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">More...</a><br /></td></tr>
+<tr class="separator:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td></tr>
+<tr class="memdesc:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">More...</a><br /></td></tr>
+<tr class="separator:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a489fe448cd7f7e1f3805d33504f9d336"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a489fe448cd7f7e1f3805d33504f9d336">IgemmGlobalIteratorAb</a> (typename <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Base::Params</a> const &amp;_params, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;threadblock_offset, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a489fe448cd7f7e1f3805d33504f9d336"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor.  <a href="#a489fe448cd7f7e1f3805d33504f9d336">More...</a><br /></td></tr>
+<tr class="separator:a489fe448cd7f7e1f3805d33504f9d336"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5cbda0dea8c87ca55499c97cc80b1ccf"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#a5cbda0dea8c87ca55499c97cc80b1ccf">load_element</a> (typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">Base::AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="separator:a5cbda0dea8c87ca55499c97cc80b1ccf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td></tr>
+<tr class="memitem:aba8142a7a3b43da97f7968d98f3ba018 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#aba8142a7a3b43da97f7968d98f3ba018">initialize_predicates</a> (const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block_offset)</td></tr>
+<tr class="separator:aba8142a7a3b43da97f7968d98f3ba018 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab61ce6b04d72d2652ee3bffca3885fe5 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">GemmGlobalIteratorAb</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a> const &amp;_params, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;threadblock_offset, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:ab61ce6b04d72d2652ee3bffca3885fe5 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab61ce6b04d72d2652ee3bffca3885fe5">More...</a><br /></td></tr>
+<tr class="separator:ab61ce6b04d72d2652ee3bffca3885fe5 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a760404b7879a38364d7eef47fc1fe209 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">inc_w</a> ()</td></tr>
+<tr class="memdesc:a760404b7879a38364d7eef47fc1fe209 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the W dimension.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a760404b7879a38364d7eef47fc1fe209">More...</a><br /></td></tr>
+<tr class="separator:a760404b7879a38364d7eef47fc1fe209 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1d86f7e16bd11e10c94b0c14111c8c14 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">inc_h</a> ()</td></tr>
+<tr class="memdesc:a1d86f7e16bd11e10c94b0c14111c8c14 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the H dimension.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1d86f7e16bd11e10c94b0c14111c8c14">More...</a><br /></td></tr>
+<tr class="separator:a1d86f7e16bd11e10c94b0c14111c8c14 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2ad473e8f2fa2694617ee39ead5c41b3 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">inc_d</a> ()</td></tr>
+<tr class="memdesc:a2ad473e8f2fa2694617ee39ead5c41b3 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the D dimension.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2ad473e8f2fa2694617ee39ead5c41b3">More...</a><br /></td></tr>
+<tr class="separator:a2ad473e8f2fa2694617ee39ead5c41b3 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae3ecef6501f0761051f298eb7cefcacf inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">inc_advance</a> ()</td></tr>
+<tr class="memdesc:ae3ecef6501f0761051f298eb7cefcacf inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer to move to the next iteration.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae3ecef6501f0761051f298eb7cefcacf">More...</a><br /></td></tr>
+<tr class="separator:ae3ecef6501f0761051f298eb7cefcacf inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a85afb31647e5cac591b76959a102cd06 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">load_element</a> (typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">Base::AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a85afb31647e5cac591b76959a102cd06 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a single fragment element from memory.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a85afb31647e5cac591b76959a102cd06">More...</a><br /></td></tr>
+<tr class="separator:a85afb31647e5cac591b76959a102cd06 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab2bad39cd9e9d27382cf8fb9e05ed593 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">residue</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> k)</td></tr>
+<tr class="memdesc:ab2bad39cd9e9d27382cf8fb9e05ed593 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">That's the residue! Update the predicates.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab2bad39cd9e9d27382cf8fb9e05ed593">More...</a><br /></td></tr>
+<tr class="separator:ab2bad39cd9e9d27382cf8fb9e05ed593 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6ebdbdce88f040fffd3eb60622c6d7e0 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a6ebdbdce88f040fffd3eb60622c6d7e0 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the valid?  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a6ebdbdce88f040fffd3eb60622c6d7e0">More...</a><br /></td></tr>
+<tr class="separator:a6ebdbdce88f040fffd3eb60622c6d7e0 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a32cd0a03868f52b172d031f23e2c08af inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a32cd0a03868f52b172d031f23e2c08af inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a vector offset to the iterator.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a32cd0a03868f52b172d031f23e2c08af">More...</a><br /></td></tr>
+<tr class="separator:a32cd0a03868f52b172d031f23e2c08af inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5940e491967e265630dc0a4b448791d6 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a5940e491967e265630dc0a4b448791d6">add_pointer_offset</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a> offset)</td></tr>
+<tr class="separator:a5940e491967e265630dc0a4b448791d6 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adfb9a7df1b900e4f6ee59c72aabdebd7 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a7ff9cae930c8a6bb9c8ee6d81cb1953f">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#adfb9a7df1b900e4f6ee59c72aabdebd7">stride_advance</a> (void)</td></tr>
+<tr class="separator:adfb9a7df1b900e4f6ee59c72aabdebd7 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07989416829cbe7efecb56456c99adf7 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a07989416829cbe7efecb56456c99adf7 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a07989416829cbe7efecb56456c99adf7">load_post_increment</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a2180cfbb482d300472ad2993e4b555d4">Fragment</a> &amp;fragment)</td></tr>
+<tr class="separator:a07989416829cbe7efecb56456c99adf7 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileLoadIterator"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileLoadIterator')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
+<tr class="memitem:a60bbb4d4a6a5b8fb32e176e7d33f9e82 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</td></tr>
+<tr class="memdesc:a60bbb4d4a6a5b8fb32e176e7d33f9e82 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using a RegularTilePredicateFunctor.  <a href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">More...</a><br /></td></tr>
+<tr class="separator:a60bbb4d4a6a5b8fb32e176e7d33f9e82 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa566cf603a5c19c59946a41b04642e49 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;functor, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset)</td></tr>
+<tr class="memdesc:aa566cf603a5c19c59946a41b04642e49 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector using an arbitrary predicate functor.  <a href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">More...</a><br /></td></tr>
+<tr class="separator:aa566cf603a5c19c59946a41b04642e49 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:add962655973d5b8eff5673c04e053e4e inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">TileLoadIterator</a> ()</td></tr>
+<tr class="memdesc:add962655973d5b8eff5673c04e053e4e inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default constructor.  <a href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">More...</a><br /></td></tr>
+<tr class="separator:add962655973d5b8eff5673c04e053e4e inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4ffe90c974b260220fe0b44274095322 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">TileLoadIterator</a> (Params const &amp;_params, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a4ffe90c974b260220fe0b44274095322 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">More...</a><br /></td></tr>
+<tr class="separator:a4ffe90c974b260220fe0b44274095322 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1636f4e15ca7f9f56bfccb93a2826c30 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">TileLoadIterator</a> (Params const &amp;, <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> const *ptr, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a1636f4e15ca7f9f56bfccb93a2826c30 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a tile load iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">More...</a><br /></td></tr>
+<tr class="separator:a1636f4e15ca7f9f56bfccb93a2826c30 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb92092230ae933ff6cc4a36960d0674 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">inc_d</a> ()</td></tr>
+<tr class="memdesc:aeb92092230ae933ff6cc4a36960d0674 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the D dimension.  <a href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">More...</a><br /></td></tr>
+<tr class="separator:aeb92092230ae933ff6cc4a36960d0674 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1b94be88a160b21347c0eb58ed8e1b51 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">inc_h</a> ()</td></tr>
+<tr class="memdesc:a1b94be88a160b21347c0eb58ed8e1b51 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the H dimension.  <a href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">More...</a><br /></td></tr>
+<tr class="separator:a1b94be88a160b21347c0eb58ed8e1b51 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af4f964364fc54a2b9a431fa529f6c44c inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">inc_w</a> ()</td></tr>
+<tr class="memdesc:af4f964364fc54a2b9a431fa529f6c44c inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the W dimension.  <a href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">More...</a><br /></td></tr>
+<tr class="separator:af4f964364fc54a2b9a431fa529f6c44c inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9bda55335fb2e90af2ee7d20571f3d9b inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">inc_advance</a> ()</td></tr>
+<tr class="memdesc:a9bda55335fb2e90af2ee7d20571f3d9b inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment in the next dimension.  <a href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">More...</a><br /></td></tr>
+<tr class="separator:a9bda55335fb2e90af2ee7d20571f3d9b inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6f74b87df129693ee6ac9a6fcc0c8910 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">load_element</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a6f74b87df129693ee6ac9a6fcc0c8910 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a single fragment element from memory.  <a href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">More...</a><br /></td></tr>
+<tr class="separator:a6f74b87df129693ee6ac9a6fcc0c8910 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64ce59c5deb58e208529761a44c7661d inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">inc_stage</a> ()</td></tr>
+<tr class="memdesc:a64ce59c5deb58e208529761a44c7661d inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the stage.  <a href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">More...</a><br /></td></tr>
+<tr class="separator:a64ce59c5deb58e208529761a44c7661d inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a723041057b1e8212e075959a22c0c120 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:a723041057b1e8212e075959a22c0c120 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a vector offset to the iterator.  <a href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">More...</a><br /></td></tr>
+<tr class="separator:a723041057b1e8212e075959a22c0c120 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad65b7a0a5b4f42c590642ef7b269f232 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">add_pointer_offset</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> offset)</td></tr>
+<tr class="memdesc:ad65b7a0a5b4f42c590642ef7b269f232 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a raw offset to the pointer.  <a href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">More...</a><br /></td></tr>
+<tr class="separator:ad65b7a0a5b4f42c590642ef7b269f232 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a31a021d6c099e8027fa9bcb5fdc21c11 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11">stride_advance</a> (void)</td></tr>
+<tr class="separator:a31a021d6c099e8027fa9bcb5fdc21c11 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4d437597ae736c581a9ba0764f9d955f inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it)</td></tr>
+<tr class="memdesc:a4d437597ae736c581a9ba0764f9d955f inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">More...</a><br /></td></tr>
+<tr class="separator:a4d437597ae736c581a9ba0764f9d955f inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5c8a4318ffd400363d9c7572c07ff32a inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="memdesc:a5c8a4318ffd400363d9c7572c07ff32a inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment and advances the iterator to the next tile.  <a href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">More...</a><br /></td></tr>
+<tr class="separator:a5c8a4318ffd400363d9c7572c07ff32a inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa856180123f8d50a00222542fa6345cf inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it) const</td></tr>
+<tr class="memdesc:aa856180123f8d50a00222542fa6345cf inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">More...</a><br /></td></tr>
+<tr class="separator:aa856180123f8d50a00222542fa6345cf inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a83dadcea858a5e426dcea54400138480 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment) const</td></tr>
+<tr class="memdesc:a83dadcea858a5e426dcea54400138480 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">More...</a><br /></td></tr>
+<tr class="separator:a83dadcea858a5e426dcea54400138480 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1b070fc66109d372f5a45a5857594ac6 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">load</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, int d)</td></tr>
+<tr class="memdesc:a1b070fc66109d372f5a45a5857594ac6 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a fragment without advancing the iterator..  <a href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">More...</a><br /></td></tr>
+<tr class="separator:a1b070fc66109d372f5a45a5857594ac6 inherit pub_methods_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
+<tr class="memitem:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">More...</a><br /></td></tr>
+<tr class="separator:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:aa6e76073303f5f5a95053a781ec8b762"><td class="memItemLeft" align="right" valign="top">uint32_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html#aa6e76073303f5f5a95053a781ec8b762">mask_</a></td></tr>
+<tr class="memdesc:aa6e76073303f5f5a95053a781ec8b762"><td class="mdescLeft">&#160;</td><td class="mdescRight">The mask to clean up the values.  <a href="#aa6e76073303f5f5a95053a781ec8b762">More...</a><br /></td></tr>
+<tr class="separator:aa6e76073303f5f5a95053a781ec8b762"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td></tr>
+<tr class="memitem:a1864c5556529afdc8445021cad780b04 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">thread_offset</a></td></tr>
+<tr class="memdesc:a1864c5556529afdc8445021cad780b04 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a1864c5556529afdc8445021cad780b04">More...</a><br /></td></tr>
+<tr class="separator:a1864c5556529afdc8445021cad780b04 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab8c79cb1a8157dd00429c93cb4a41322 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">params</a></td></tr>
+<tr class="memdesc:ab8c79cb1a8157dd00429c93cb4a41322 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The parameters.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ab8c79cb1a8157dd00429c93cb4a41322">More...</a><br /></td></tr>
+<tr class="separator:ab8c79cb1a8157dd00429c93cb4a41322 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af323c9db74f0de3376edd35eb377bc9c inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a3dd74f6e12339a87c0eb8f75fbdc7b9c">PredicateVector</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">predicates</a></td></tr>
+<tr class="memdesc:af323c9db74f0de3376edd35eb377bc9c inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The predicates.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#af323c9db74f0de3376edd35eb377bc9c">More...</a><br /></td></tr>
+<tr class="separator:af323c9db74f0de3376edd35eb377bc9c inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1TileLoadIterator"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1TileLoadIterator')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
+<tr class="memitem:a5561e676148200c2fc85a603847cc596 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a></td></tr>
+<tr class="memdesc:a5561e676148200c2fc85a603847cc596 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters structure.  <a href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">More...</a><br /></td></tr>
+<tr class="separator:a5561e676148200c2fc85a603847cc596 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7808588ce0b12017379dcbe1ba9c511f inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a></td></tr>
+<tr class="memdesc:a7808588ce0b12017379dcbe1ba9c511f inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">More...</a><br /></td></tr>
+<tr class="separator:a7808588ce0b12017379dcbe1ba9c511f inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad8e730768c1805d98e23886a492389d3 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a></td></tr>
+<tr class="memdesc:ad8e730768c1805d98e23886a492389d3 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stage argument enables wrapping after some number of tiles have been loaded.  <a href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">More...</a><br /></td></tr>
+<tr class="separator:ad8e730768c1805d98e23886a492389d3 inherit pub_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_static_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">More...</a><br /></td></tr>
+<tr class="separator:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">cutlass::gemm::GemmGlobalIteratorAb&lt; TileTraits_, Index_ &gt;</a></td></tr>
+<tr class="memitem:afe016e0c6234075a8d69ba7341555ece inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">kLayout</a> = TileTraits_::kLayout</td></tr>
+<tr class="memdesc:afe016e0c6234075a8d69ba7341555ece inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afe016e0c6234075a8d69ba7341555ece">More...</a><br /></td></tr>
+<tr class="separator:afe016e0c6234075a8d69ba7341555ece inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8c1e871f17685b16a7a41fcc888f0125 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">kAdvance</a> = Base::kAdvance</td></tr>
+<tr class="memdesc:a8c1e871f17685b16a7a41fcc888f0125 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies in which dimension post-increment accesses advance.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#a8c1e871f17685b16a7a41fcc888f0125">More...</a><br /></td></tr>
+<tr class="separator:a8c1e871f17685b16a7a41fcc888f0125 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorAb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1TileLoadIterator"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileLoadIterator')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
+<tr class="memitem:aea9fbc738003a7424cfa9b0527d4a352 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">kAdvance</a></td></tr>
+<tr class="memdesc:aea9fbc738003a7424cfa9b0527d4a352 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies in which dimension post-increment accesses advance.  <a href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">More...</a><br /></td></tr>
+<tr class="separator:aea9fbc738003a7424cfa9b0527d4a352 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2af872794b35a631f9c1a97df0c6d177 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">kFragmentElementType</a></td></tr>
+<tr class="memdesc:a2af872794b35a631f9c1a97df0c6d177 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies type of iterator fragment storage (Salar or WmmaMatrix)  <a href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">More...</a><br /></td></tr>
+<tr class="separator:a2af872794b35a631f9c1a97df0c6d177 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a44424164c9347f9916b2b86858706043 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">kMemorySpace</a></td></tr>
+<tr class="memdesc:a44424164c9347f9916b2b86858706043 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">More...</a><br /></td></tr>
+<tr class="separator:a44424164c9347f9916b2b86858706043 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a84f2f19069c3b003b1fcad438f690bc8 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">kAccessSize</a></td></tr>
+<tr class="memdesc:a84f2f19069c3b003b1fcad438f690bc8 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">More...</a><br /></td></tr>
+<tr class="separator:a84f2f19069c3b003b1fcad438f690bc8 inherit pub_static_attribs_structcutlass_1_1TileLoadIterator"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, Advance_, MemorySpace, Index_, TileTraits_::Scalar, FragmentElementType::kScalar, Shape&lt; 0, 0, 0, 0 &gt; &gt;</a></td></tr>
+<tr class="memitem:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a></td></tr>
+<tr class="memdesc:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">More...</a><br /></td></tr>
+<tr class="separator:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a></td></tr>
+<tr class="memdesc:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">More...</a><br /></td></tr>
+<tr class="separator:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a></td></tr>
+<tr class="memdesc:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">More...</a><br /></td></tr>
+<tr class="separator:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a></td></tr>
+<tr class="memdesc:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">More...</a><br /></td></tr>
+<tr class="separator:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td></tr>
+<tr class="memdesc:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">More...</a><br /></td></tr>
+<tr class="separator:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a82a9cfc61ecc117592bdb30f57bd35c9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a82a9cfc61ecc117592bdb30f57bd35c9">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;TileTraits_, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#ae13e0d30a941e16875f196b4844b03ed">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a07ff2f97fdd57c4df05ef8e817265b30"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a07ff2f97fdd57c4df05ef8e817265b30">&#9670;&nbsp;</a></span>ThreadOffset</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef TileTraits_::ThreadOffset <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a489fe448cd7f7e1f3805d33504f9d336"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a489fe448cd7f7e1f3805d33504f9d336">&#9670;&nbsp;</a></span>IgemmGlobalIteratorAb()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a> </td>
+          <td>(</td>
+          <td class="paramtype">typename <a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Base::Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;&#160;</td>
+          <td class="paramname"><em>bounds</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;&#160;</td>
+          <td class="paramname"><em>threadblock_offset</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>&#160;</td>
+          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html#afd09d3b8e5ca04eab7edc2e5723816e5">ThreadOffset</a>()</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a5cbda0dea8c87ca55499c97cc80b1ccf"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5cbda0dea8c87ca55499c97cc80b1ccf">&#9670;&nbsp;</a></span>load_element()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::load_element </td>
+          <td>(</td>
+          <td class="paramtype">typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">Base::AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>c</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="aa6e76073303f5f5a95053a781ec8b762"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa6e76073303f5f5a95053a781ec8b762">&#9670;&nbsp;</a></span>mask_</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">uint32_t <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">cutlass::gemm::IgemmGlobalIteratorAb</a>&lt; TileTraits_, Index_ &gt;::mask_</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="igemm__global__tile_8h_source.html">igemm_global_tile.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.png b/docs/structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.png
new file mode 100644
index 0000000000000000000000000000000000000000..356a20ca225c96213f97fe2391d3b541033a18e1
GIT binary patch
literal 4485
zcmeHKdsI?szs8)#rWti=GMlENX{NNiP~OUW7tPY}l3WS}rzsP4ykvq3f>vMSNgM5A
z+GuLt6-7oxQ4zG#EKvywObHdsR1irGQ5fK0eP^BX&6;)oIRAZXoxRrH`+e5_y?ej!
z@7=%WeV!ZszFvmwx2^{O0EQ<|c$@|R^d-7>=Q@4e)d#ue8{KV-|0#&4R;$%D-^-^f
z9%F9lS|88O&dxLSi7*{p7k}C}5TFZMJ$Stk8vtO#rjs5=Ac=a?0@0m`cB8e<1tfyj
zi)neQ3%hNdzHQ^sSn;6k__I4!k~1m4PbC>Gy0Fg`PC521x)^`a7~yY7I)XV|g5f>f
z3hCL6fUm;fzd+QWGM)gzpQ8CiVGfml%K$?OCqPeauyN%w`n0t?;OBuY)jR&^b8=J#
z@4;Iaol=SVFfKK2<1yo^vdTqkLE?^a%|erYM^KUbH3tGn19R;*Xc{H=auM#xK1Qz$
z?D9R6(mD;2A9@Yl789;^kiOke#C}_Y(2DvPg|#KGe9`KE@LcC9AXQ&f;49ip@+3{{
zSQt*Am)4nzqyn<Ix1)eyZ5uN*D_kbZb5f#9Bi+86GEjt@oOiy<o7xJ)^x&;~3;AVL
zuO?BFAg@|(<K=RgU$q=F(vabF9onP_KDeQ7De~zMAnoY#^FEV<7XmC4<RMju^jtN&
zEju$Rg8)lHJM)HekSa-%wug#($!?P^dELHMvI!R$eKs1*=R66A3TMw}A1~;x<|p&I
z5pUC4_l_M5yG+qsgyq+cUN!v|&K=1=Z_1Rk1s=*5YT_XlM4QXkyY>kNG#RdTdca`^
zgp40G%pTa0cu<>WqR!;AIt>U?dorB<`tx2Nb<3u_ve`M-#IKeKA-idTYt(U(44_mK
zWf~NShP}QW*~IF7m@__qPsqU?ypGu})t7%+ney#6$bjF)Xsa8UL<O{Y^fTJouwMjB
zW``l|PO_-ecyY{6h9{^^no>L^3fmT7*KH%#15gjPh!Y$K<z)}VaPzEY&qF3*_!Lxq
zNJ2gD(MV!Ca?TrDYIK?pz9ed@$DQRpPbZ&{1bx{57`28cBEkN=@UFLic9Hk4lshB{
zmIk7JsRSRcDO@xl-q-R}zP2%HH}Vn)&6oy8MaI;rN57ydj+e@NlQ1<qddy7+3vmgH
zvR3n4TuafOYdirV7ZhCWkd2Vpv3C&)PPt{i@0<fZf32~}rzS5IVgrnRp@lBhv53e0
ztm*kfL{DuXfzWD_zrERUHv4gaDydE`B%hwDAf)(5n^`P*nx>_#KqQ_(m)d_2LsB3T
zFGLKx*t8his@Z2#vYE{ei<aRA7l!dp=H;2<ePo(FT$LO(jF&t~CwfUJ=IUxbXh(Ep
zhked&3l?R!$31$ek0jrsTP68$@xuaU9_~06^AoT%;)ev8&nuKPdAQr5JXjdPtYh4S
znHLZGAE?1Lg~VdaHm_Kl<<xJ^-&4%XOSofhOyenIF4kcgn<kjOIk}3XP6N<@d!dze
z3p|uD#S+ibZpQ3gj`lq06}LnaN4jv^#5<D@93zE{>vK?8PD}>Liqfi~*(g?ccJO?$
z#HCRC8Xq}7tBbu!kqf{nvT72gvBlr@xj_lTOrFMNw`vS*;dbYF?AXi86#_GE5l&02
z*5)eP#Lw(_?;HEi$juVxC;SOdg(Af}Nywq!&`A5L&v}<_@S)ct{I}=+J#0l2K2b|r
zQsLBo_M*!!fZljV7cdp@HDFEWEe{DmZztd@R+0M#=fi+?fYOa*{m)VX`z=kYy=Ff?
z@}?TCMn3bHS%o)!KEakx9sh0M`=ayznuZ_yNJm!Fr}w|7&+)~76D>NWQQYBXG?-C;
zvmkgzWsR*c=KqPMhEl!5^Ct`{<B}4rN2OD8S@WP$JJ8)$#1%~c=7L}#T)X$NlH9i>
zh?Y|!#xt9<B3NRDg9ts$C~v1e1cj@s_CpoPV2MGi6r31u!I&(`d2&NF!$2$cIrEq9
z+DbtQ?lAbG{@qb#y38!=15T~J${)+5bCq+ckgP*4hP?CzBH@LbdzD;zx^*c{Koc-~
zJNkVcY9_EGjj*=PJ-1%+!pT3ABxua4FX(cL!I0bDxSB?}TbzE0T+HV*pKeP#Ydj&#
zEs*pJbEX65`7GMH#EiBFxXa4~a*^v`sHWjw8#*syrnZ5n%<3kT$$9;8;-I$^WjSjV
z@tm=lYfy)UNFxpLYF2hf1f#b6;*+}$eo(%Abcu*az}Uk}>CODD_a<9I9z^uRk+meJ
zKJbdhmXp3-_`5H{ZL*_x`eZxuA&wE%-g^nJE^r;ZIzmDb!UREAOmq8<yQL=3snoiw
z5=vz&J)v0XOlasGd^b&fIkDG>GKhon1)X!zuEp|;93j2I7I9<hO1yHrchkElQ|WIb
z!s)OQ*Foi@m&o}C>F|Ucv6FLcZx|vawhSp#@o0OI@D&9&dPVSN)cJ!gS+UC$4r%P`
zakk1^6y+HkYaXf~dAM3RJ};LF%$E0)bnJ2FwR=JW>-*+#+>1TA`XF)RQtVD%R?8WS
z2ti=|T|dvD=;cO4jBPtt8PJY7SCDR*?>*CTPdWSp84M%G!$R&mte*~!8QVdl$fc>h
z_wnQeT>OUR=f3zg))hO@j5{QRo8nO#0u){4+nYZka6Du^s4j@Bpa8MO!U?y@5`Gsa
z&wY#3gbbvPeKVh<c^Mw>hZ{vn{IaN)qNA77>aj>FMJ~$}IFG$c#d)^^k0fmc$v#wt
zxl1MZMgtueH)eXzo{<=P$4<@N=1Vk<8JEuVGF+LmiT5o7;p#6rMuU9G_d<`NboigM
z1^t^TakV*Y-SE8=gGA@-6|mtUCGDx}3uS;YzD#aV$q(0H8r{m}Qfm78S9=*Rl%cUR
zwX_-93l=35_WKR{32FbB-%MpJ)w1f8QVw<|MYG+GW0n$(GbGrFAnWG6HOO%0+}vFb
z$=hlW8)+7LdluF>khqcZ74=53dBY$S`n8Zre0L&)UWq!_sNBUCLLCOxb1me%$0e$7
zrC|DIwtCj#$TqLn>7;{A?LZ@6$>9^u<Qk*LqG+i5fU$>a*s%K7gAF0z<>_I@<S##x
zwTu(8gi<m5OmJ1<TeA{R38|wCe_A^|T(F3Nz>Y0pc*Xz0hid)MMv^f{`rq^FUufh1
zY4+pR@PDOQT{b&1W|URT?)a6e9hYgZY9mwvC#Bm`Ded;avNW(2@pNDg7goI$(ouj$
z%IV8D`4sCN%CnYkCGwj4#<jVR7DCzk5pZ>nZsFXY@qYs4wc0;Yy_y_bN;qIWN-=Dl
zdoW4Ur;}MZ#}(*=Yk~-Vd2ky4N?be_$E_3igoaPC#(3<l-c2Ir9qb~TV#|A|4AqHl
zcKtq|%85%0<9kO#JpBpPg83il4JoEX=VIBK$Wd~s^IdQ1b^eggMO(3FAgdBFLNwu(
z>xSumj9RC3oLk#gGY&q)2K`#tWn2b%7F{{#6kjS9$5kCSYbrs`U*QL35vu24uMEFw
zsv+j-W_CHgiO3Pb2Ee)P&9tLc1hRXxz|v_WsnXJ?m0ZRIHglpLa)PSmbY!)B<h&mV
zPli7aV3|e0)tfkN;;HFyLSz{@5=3GO8iL5c;q8$Oq!))EP*sVSy$oqHlKzT_EFpgs
zc}{NS4Obhj&M+VwUn8$em%)6og@aSa=#PJn%1tZ&&ZvobvKi%#zqTFCs2s(DC6vbj
z*>%e89ugApLK|;-QbxWXV-rlYvTxtCvV^L<7FLjgrg@s*%t5DwY#MAcHkFAvC6t7h
zFf`$J$kKbOkv1V|g_g?|SCs0!jdHK<+aYh=Pmgoz#j=g$8qLNaAawg}AFf8_*vjfg
z*jEv=bqS%JI9KyIPiFS_KIkvD$Qn`fFLo+x-C@8oXx?Ba;4_`3`H|zaDsi4HO!;+v
z)HGH9rG7lcpVZH_f2tpwfRB-H{t2x=b^N!1e@@-62w%^&1E0&Q*n5g=XZXc8s}tAz
zN#`n8b>Gw72!mCqbCrLEF%x%26pi@aC-EzgW_hjPsIu^X)?hR~?2E4f%mVcG@%-fj
z<d7&5ItHyqZA3~!|41ITy~)?p9MHX#T`$*_M2zcuH|z>cjl7wmi0r8SZb~>&EaHdy
zl;T_HkD?qUh`M8v!;Wp?jPN08c>{HEQYH>FT>Bz6<Ro47MzD4#pdCy#dVc_R?h(Z0
z)HauHRn6xl5NJz|n*N8Z3uT?96gsupR(k}Y35*L4r6{|H$)s{AJV2PIQ@FOer3Jnz
z>_h6sv?UP_*xd^`yPuQ7Upgaz4O&8xj+EnO4@-~>s|BcT6H6}w_e2;h+i{#ad!{4Q
zyPlBq^7kZ3qp$k{Bh=4gp+SB}<=LTDwDOmVCk}0fb~uYBBF&-+g`b7;Q4%ONb>YT{
zo}1_DXmN-!C7L^uQ6j_67CL1jR9E<d>zjl$#w}82%FEb%=IAVG=~a|eXaXB6iBFa7
zL>Me@@ob_YWHl{XB1PWwYsMZHHfal8<S)s;K-(Bj9sMAGQm_L}5I{uc-UiFMnoVUN
z5PE-DP{3FRO{_a|HliYu@y6Ww#lF}t1GZR+G)(g{4A6R%SLzuet0KQp+EmYqf~c4d
z=wb}0k_YzEY5ws*U4lA#W@fcTz(CSh;|VwTdc-vHZ);q}so!_HcbA82)enNzKO24x
zaML+}_dXBmB<lb>0m-_hU#%vc>(E<s7_cSx@1brx{PgQx56`RE59ZqK((0!cd)ai!
SUAO?<anjS*qweTWSN{{Mqs=`4

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer-members.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer-members.html
index 0dc73a822..ecf731e5e 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html
index 43ba1df7d..8b0af2603 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer.html
@@ -110,7 +110,7 @@ template&lt;typename InputFragment_, typename OutputScalar_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4-members.html
index 1e2db9527..6137ff5c1 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html
index 181687128..c4063ee3f 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalLoadTransformer_3_01Fragment_3_01int8__t_00_01kElements___01_4_00_01float_01_4.html
@@ -110,7 +110,7 @@ template&lt;int kElements_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer-members.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer-members.html
index 7d045266b..1c9218d7a 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html
index 134180f5a..96ac1d737 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer.html
@@ -110,7 +110,7 @@ template&lt;typename InputScalar_, typename OutputFragment_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4-members.html
index 4a2355422..ba59d3fb8 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html
index 4d6a68c14..d9a388aa1 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalStoreTransformer_3_01float_00_01Fragment_3_01int8__t_00_01kElements___01_4_01_4.html
@@ -110,7 +110,7 @@ template&lt;int kElements_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits-members.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits-members.html
new file mode 100644
index 000000000..1dcb3ded9
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits-members.html
@@ -0,0 +1,105 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#adab639892c3586464e2ea5f947b9e0f0">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ae1d930fa295d8ddfaa10bda5978258de">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a160d1ecd86de4742f550d11bc281786b">ThreadsDelta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html
new file mode 100644
index 000000000..4da49df4c
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html
@@ -0,0 +1,257 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="igemm__global__tile_8h_source.html">igemm_global_tile.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.png" usemap="#cutlass::gemm::IgemmGlobalTileTraits_3C_20kOperand_5F_2C_20kLayout_5F_2C_20Scalar_5F_2C_20Tile_5F_2C_20Threads_5F_2C_20kAccessSize_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::IgemmGlobalTileTraits_3C_20kOperand_5F_2C_20kLayout_5F_2C_20Scalar_5F_2C_20Tile_5F_2C_20Threads_5F_2C_20kAccessSize_5F_20_3E_map" name="cutlass::gemm::IgemmGlobalTileTraits_3C_20kOperand_5F_2C_20kLayout_5F_2C_20Scalar_5F_2C_20Tile_5F_2C_20Threads_5F_2C_20kAccessSize_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html" alt="cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;" shape="rect" coords="0,0,603,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">ThreadOffset</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Computes the thread offset in (H, W) based on thread ID.  <a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ac14f4ef560bd8068d16c0471af6df82c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c">Base</a></td></tr>
+<tr class="memdesc:ac14f4ef560bd8068d16c0471af6df82c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base class.  <a href="#ac14f4ef560bd8068d16c0471af6df82c">More...</a><br /></td></tr>
+<tr class="separator:ac14f4ef560bd8068d16c0471af6df82c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a72fe2fb9077d072f8266f07374624a1f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Base::Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">Threads</a></td></tr>
+<tr class="memdesc:a72fe2fb9077d072f8266f07374624a1f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads.  <a href="#a72fe2fb9077d072f8266f07374624a1f">More...</a><br /></td></tr>
+<tr class="separator:a72fe2fb9077d072f8266f07374624a1f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adab639892c3586464e2ea5f947b9e0f0"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; Base::Threads::kH *4, 1, Base::Threads::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#adab639892c3586464e2ea5f947b9e0f0">Delta</a></td></tr>
+<tr class="memdesc:adab639892c3586464e2ea5f947b9e0f0"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="#adab639892c3586464e2ea5f947b9e0f0">More...</a><br /></td></tr>
+<tr class="separator:adab639892c3586464e2ea5f947b9e0f0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae1d930fa295d8ddfaa10bda5978258de"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; Base::VectorizedTile::kH/Base::Threads::kH/4, 4, Base::VectorizedTile::kW/Base::Threads::kW, Base::VectorizedTile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ae1d930fa295d8ddfaa10bda5978258de">Iterations</a></td></tr>
+<tr class="memdesc:ae1d930fa295d8ddfaa10bda5978258de"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="#ae1d930fa295d8ddfaa10bda5978258de">More...</a><br /></td></tr>
+<tr class="separator:ae1d930fa295d8ddfaa10bda5978258de"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a160d1ecd86de4742f550d11bc281786b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, Base::VectorizedTile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a160d1ecd86de4742f550d11bc281786b">ThreadsDelta</a></td></tr>
+<tr class="memdesc:a160d1ecd86de4742f550d11bc281786b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads strides.  <a href="#a160d1ecd86de4742f550d11bc281786b">More...</a><br /></td></tr>
+<tr class="separator:a160d1ecd86de4742f550d11bc281786b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td></tr>
+<tr class="memitem:a6894b653fffa59bcb847bc3295643d6b inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1platform_1_1remove__const.html">platform::remove_const</a>&lt; Scalar_ &gt;::type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">Scalar</a></td></tr>
+<tr class="memdesc:a6894b653fffa59bcb847bc3295643d6b inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">More...</a><br /></td></tr>
+<tr class="separator:a6894b653fffa59bcb847bc3295643d6b inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef Scalar_ *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a></td></tr>
+<tr class="memdesc:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">More...</a><br /></td></tr>
+<tr class="separator:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef Tile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a></td></tr>
+<tr class="memdesc:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">More...</a><br /></td></tr>
+<tr class="separator:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt; Tile_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a></td></tr>
+<tr class="memdesc:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The vectorized tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">More...</a><br /></td></tr>
+<tr class="separator:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a>, Threads_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a></td></tr>
+<tr class="memdesc:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">More...</a><br /></td></tr>
+<tr class="separator:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, VectorizedTile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a></td></tr>
+<tr class="memdesc:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The relative offset between two elements in the H/W dimension in adjacent threads.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">More...</a><br /></td></tr>
+<tr class="separator:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, Threads::kH, Threads::kW *<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">Delta</a></td></tr>
+<tr class="memdesc:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">More...</a><br /></td></tr>
+<tr class="separator:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, Threads::kW *<a class="el" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadsDelta::kW</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Strides for immediate offset computation.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">More...</a><br /></td></tr>
+<tr class="separator:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, VectorizedTile::kH/Threads::kH, VectorizedTile::kW/Threads::kW, VectorizedTile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a></td></tr>
+<tr class="memdesc:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">More...</a><br /></td></tr>
+<tr class="separator:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td></tr>
+<tr class="separator:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td></tr>
+<tr class="memitem:ae0bca976b7cfba8561db4cccc16e99e1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a> = kOperand_</td></tr>
+<tr class="memdesc:ae0bca976b7cfba8561db4cccc16e99e1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Identity.html" title="Describes identity elements. ">Identity</a> of the operand.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">More...</a><br /></td></tr>
+<tr class="separator:ae0bca976b7cfba8561db4cccc16e99e1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a74bc07cb021a73513ab2fbacd572be90 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> = kLayout_</td></tr>
+<tr class="memdesc:a74bc07cb021a73513ab2fbacd572be90 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">More...</a><br /></td></tr>
+<tr class="separator:a74bc07cb021a73513ab2fbacd572be90 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa001e09b246fdd8259cbda6a500cad5f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> = kAccessSize_</td></tr>
+<tr class="memdesc:aa001e09b246fdd8259cbda6a500cad5f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STG.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">More...</a><br /></td></tr>
+<tr class="separator:aa001e09b246fdd8259cbda6a500cad5f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af219ece6e66e2866169e06e15cc4472d inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">kMemorySpace</a> = <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a></td></tr>
+<tr class="memdesc:af219ece6e66e2866169e06e15cc4472d inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory space.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">More...</a><br /></td></tr>
+<tr class="separator:af219ece6e66e2866169e06e15cc4472d inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ac14f4ef560bd8068d16c0471af6df82c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac14f4ef560bd8068d16c0471af6df82c">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessSize_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#ac14f4ef560bd8068d16c0471af6df82c">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="adab639892c3586464e2ea5f947b9e0f0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adab639892c3586464e2ea5f947b9e0f0">&#9670;&nbsp;</a></span>Delta</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessSize_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;Base::Threads::kH * 4, 1, Base::Threads::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">Delta</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae1d930fa295d8ddfaa10bda5978258de"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae1d930fa295d8ddfaa10bda5978258de">&#9670;&nbsp;</a></span>Iterations</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessSize_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;Base::VectorizedTile::kH / Base::Threads::kH / 4, 4, Base::VectorizedTile::kW / Base::Threads::kW, Base::VectorizedTile::kC / <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">Base::kAccessSize</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a72fe2fb9077d072f8266f07374624a1f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a72fe2fb9077d072f8266f07374624a1f">&#9670;&nbsp;</a></span>Threads</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessSize_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Base::Threads</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a160d1ecd86de4742f550d11bc281786b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a160d1ecd86de4742f550d11bc281786b">&#9670;&nbsp;</a></span>ThreadsDelta</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessSize_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 4, Base::VectorizedTile::kC&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="igemm__global__tile_8h_source.html">igemm_global_tile.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.png b/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.png
new file mode 100644
index 0000000000000000000000000000000000000000..d3059b3fd53303deaa2e0b1c0baf4059198af5fe
GIT binary patch
literal 2081
zcmd6oeLU0c9>;%^=%(e)V<ePmiLL0)8nKebSPo9j!xW_&#n_gH$WpgbQ~8CoET?C8
z9!Aovd6?98lZP@7$%-)ZoID;jxAQxl*Xz8_{m1$LzFx2Ex<1$S`Tp_!<9dItG#_tw
zxR!|)003};hnpV&sF5M<vuXvj8t>cl8?>$SAs*bnyu1v_$=RVNuVZgQ>c<p`L;<C7
zB<Q&6jGy=40jTKTqrKsvJpgEy5Zv}2jDwAHzk>bSwJzbx3+9&07f$MWsUfi5cp=7L
zqR%Bn?y)fW=R2CId*80>mNZjI=~`1T^X8*Vh^T#ZFHjeJvA!Nf@bqY<BKQdFjRawa
z41~;aaSB<!5uCBi<lzWG{cS@*M{0KKSI0)W&319GjMjDDC$dxBF~N-opIi=6a^$G`
zv=14NR(1@|ZxU?DMihPb7tF@chM%4)6r33T{wxL5r@16<Xb2hTP)**hJ{j*tr(5!F
z%M$iCW17LX$BY8Tl%4Ipo_pgbaRtxgdpI^{?kv1~&)`Zko28r-tI!R=?6i_rc20Hk
zxICiMcyP&GXETOC$~9*O_O}!0$26%W4!#~>oozJ1`&m3uoH-GJCct*)B_zCHmt%r?
zdSi5>U#ML1QqO>U#;ct98#0*@j$J$x%=ygwN%Eysaaa3w-Y3xITZil_V?erHK%na`
zU9#BsJ6M>LdSxxo3)e&jZ;=*qh#2_WE7r3XhFv+U5<^-ZJioJxDp(O&(BjZ)F#me{
ztG;mQq)So=N?>r=v;2jnlwx%KyBWG+NJT`UD-29}tkDtE8hk_+OK8_r=$iJqm&>*O
z&8tRvnp*zBNV@|WmVqxt^JXG7-#oyOUOBl~KF5+3E$G;&l3vn*rud2`RPtcDqd46J
z9RO-HPGt`qA0UPJ^EATb**Xu(6_s<vwF=*M%5B*Q62B;JwgIz#FUtDDAsac_sp})7
zDjJR=Q|)=#7ZAuYZn)VI`a8t-;T|Ew3)CPgI)0XpW+tBT?y+IN+XrU7m0i_Nc*#)O
zCJ6MD7J(zi=?*?eXf};S@i$R*;lDKBtxwIH4wHptkfYi>?RBqCZRCIXlvYOfq}$KU
zZ}oVHeNl?AoEtIWS8K`^ri|ZX1C)n5YvW1z)wdg5IZJ-LywJ>%h@Nem_@^?DB3*V~
zP8yo1LP;l*Cqo&G!`=C9nCnrCF|i+Bnwv3p4C~;fmHv)Y->z##3S!|oX2p&^oU&`=
zBX2J_I0U^}W{mt0c;5O8Tp6^CjJAqMal+$-%H%_WmWuLw{oqUiZO52|HKj)c)eMDW
z*+mE&CfkKxSsw%r=AXB!|5_)AbzW^X%s)nvEf+8?2+Kg;H#Z0jKUWa{XEgAC<|dIg
z`X90~c3toPsL4_nZBW5H00iK$NwD%J@R5y627`g0SXCZW7<AcxEr@`Iibx1PpbIE7
z8r3|2F+5${0#*W%2pJHFkO6V{S1@`VJgu#KJ+0IHJiAtD?NNieg#X_zwW&$YDy)JU
zza=EuyOW&sc3#EU*iK=(7VBuPU>R)YwERzEz<1d>0@{U5J<r+-0{|}-UoiWg_7u*x
zn~6KLmvv?OK0`ewtx3i)|D(0jHd<7lUU`H*Ix&^-ZB2T&cfF)A?)<s4cb5tq29rjM
z-XH&4y4U_r?1ACk#nu689WWnUjX6dr(GfLBi+40CZ<rD3ECYq)b4MJLrRNlLu{=#p
zbTk{&`-mesP8@G`1mfBfM}|Mx8}`Ihd6yI%eh)fEDQoI)s2y%px}TbOxBe=+sW`f?
zlsUFAn5&%PKWY)~<oB5_OcEPew}z1F#;zLw&589fty|4+4L_;25%&qvf%dhRx?GUH
zcZjC^+~n@zvR}`<t-7$y2;nR_&^DV?K0q?v+TMCR9Jvt3o{#axD=1lCu9EM6=k|dP
z(J|UvV9YR1;IAgaS|=yHA>CIAZ;KojH1IEL141)thA90gC@1{&k|h)m2g<0b>v6G;
zq3oFetHT$_TPl4e6~1-w6{~aP@Lk4&_RjW#+5mz4V)!_ATlMM5_=D+XMzRr2{G3>9
z6MEu<!%BQ$%;+&>>Xp8HxIcF6jn81aJ&@aY_Cb7HJ?fU|(S>i#C>BgA*!gD0(aM}F
zo!9E00ty=yBw0&YR(G>NsK+zt&bM13H{idPaoi*9XYl=%cOoaSII**#pdF72Md-`-
zQLD=JD6{Ih?4>HL*6=k^tJfL7TFi}B2r0W2!Q=ji6@!8QSTt)0I$}L%$@X)eQ0^Zf
z!FP<kc{*64^SO$D;?t6jS!84J>GfHQ;?e`=6X;KKbz#)aOSR#gc~1#y>$%d|+_czl
zYnXTy1xMbX+zAlB7O(AfpmrxE0HP3)@N4ks@&HPt&SalI`*b;fQy%TKvlwQ>H-P;C
zr>0J?^EsaaQ@1_ag(8a@Haxsx8vR@&=i%bY+{Cz6xvk1$ZEs#EWp@n<!|J)XWUJu;
zsA?>KaGpM3xJNA%1Ck-uKmTC;Z2vX#<4kbN<4iZ}$76NL0P@T^1$NUk7y8cu!hUbJ
JV%N}=e*xHW@8|#k

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset-members.html
new file mode 100644
index 000000000..15101dbdd
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset-members.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">ThreadOffset</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#a80562f5ceab2049c3b7834c2891a07ee">operator()</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html
new file mode 100644
index 000000000..2c6f8d29f
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html
@@ -0,0 +1,132 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html">ThreadOffset</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmGlobalTileTraits&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Computes the thread offset in (H, W) based on thread ID.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="igemm__global__tile_8h_source.html">igemm_global_tile.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a80562f5ceab2049c3b7834c2891a07ee"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits_1_1ThreadOffset.html#a80562f5ceab2049c3b7834c2891a07ee">operator()</a> () const</td></tr>
+<tr class="separator:a80562f5ceab2049c3b7834c2891a07ee"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a80562f5ceab2049c3b7834c2891a07ee"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a80562f5ceab2049c3b7834c2891a07ee">&#9670;&nbsp;</a></span>operator()()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;GemmOperand::Kind kOperand_, MatrixLayout::Kind kLayout_, typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessSize_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;4&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">cutlass::gemm::IgemmGlobalTileTraits</a>&lt; kOperand_, kLayout_, Scalar_, Tile_, Threads_, kAccessSize_ &gt;::ThreadOffset::operator() </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="igemm__global__tile_8h_source.html">igemm_global_tile.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter-members.html b/docs/structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter-members.html
index 0e462c736..6f75adf6b 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html b/docs/structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html
index 00a382f7c..2d9cb9989 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmInt8ToFloatConverter.html
@@ -257,7 +257,7 @@ template&lt;typename Fragment_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer-members.html b/docs/structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer-members.html
index dcdcd512a..f8c8c71ce 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html b/docs/structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html
index 089013d38..35204507b 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmSharedStoreTransformer.html
@@ -110,7 +110,7 @@ template&lt;typename InputScalar_, typename OutputFragment_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmSwizzle-members.html b/docs/structcutlass_1_1gemm_1_1IgemmSwizzle-members.html
index 801a95301..19c2f951a 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmSwizzle-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmSwizzle-members.html
@@ -89,7 +89,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmSwizzle.html b/docs/structcutlass_1_1gemm_1_1IgemmSwizzle.html
index 6f2c5963f..4c0257d00 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmSwizzle.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmSwizzle.html
@@ -265,7 +265,7 @@ template&lt;typename GlobalIterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html
index e26b4c616..76a19930a 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_, Index_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -73,18 +73,18 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_, Index_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, GemmConfig_, Index_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.png" usemap="#cutlass::gemm::IgemmTileTraitsHelperA_3C_20kLayout_5F_2C_20GemmConfig_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::IgemmTileTraitsHelperA_3C_20kLayout_5F_2C_20GemmConfig_5F_20_3E_map" name="cutlass::gemm::IgemmTileTraitsHelperA_3C_20kLayout_5F_2C_20GemmConfig_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html" alt="cutlass::gemm::GemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;" shape="rect" coords="0,0,390,24"/>
+  <img src="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.png" usemap="#cutlass::gemm::IgemmTileTraitsHelperA_3C_20kLayout_5F_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::IgemmTileTraitsHelperA_3C_20kLayout_5F_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map" name="cutlass::gemm::IgemmTileTraitsHelperA_3C_20kLayout_5F_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html" alt="cutlass::gemm::GemmTileTraitsHelperA&lt; kLayout_, GemmConfig_ &gt;" shape="rect" coords="0,0,436,24"/>
 </map>
  </div></div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
@@ -93,7 +93,7 @@ Inheritance diagram for cutlass::gemm::IgemmTileTraitsHelperA&lt; kLayout_, Gemm
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.png b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.png
index d055e0299931442f5602c239c13e878785d5146e..80f559791ad6beda50c31c8dfdb2ab013a206d68 100644
GIT binary patch
literal 1476
zcmeAS@N?(olHy`uVBq!ia0y~yVB7*^2XHV0NjHyz5FjNH;1lBd|Nnm=^TXE{%MO)J
z0J6aNz<~o18!N(qT#k|;zhDNSA`rNGD#VC^fi>9E#WAFU@$KBVeTxlvT>bSf?fb9%
ze#?X_Kbg4R_U-wkQQmdH^Ua(a|4whx@y>{xcC<f2MN`EyPUM2h$(c;ER4juXCaa`#
zWlVbF^WM?>yrSp!DRuu;G8Y|x-rjmwcmM3l&31eC`Cor;za>~TbH&1wjyl2JrgolH
z@%tIy?mY6(>gVdMQfDiqZ#`I%=V;xRnp5~%f`8%K>nT^u{%$YtKOOWh{JQ%2n-bS8
zljkohvkclC{qs}BTy?v;?&fQMEX}QVtPT4%A?4UE-<@h|_w1@XuUhn_CQM|GFyC?D
zJx7!!gXYYIOHLZxpZ_nEzt&UwR_Fz<C(_ebGS6N9^$%Cu-kh1wEbcvXpCo&HBacp%
z`RrYqp4C>&YrCF)U8Juqd`LO$^Je>|YtP)%c7EM+E13IiMTD%c-;r&cb6U5_d$Z?$
zQ9jw@oHKnv?%J)|{ZEaaT1-lDzwBK0MrX^N6S)sfglB(>(9L>2z4Ptcbqlv%KA&<c
zPDgx!Y|?I~weJ*@_ouP0;VQ|yo)Wb=a`yMXhaarCeJ<VU&FRIJl|r|4rrkfaWt%IH
z*TK_IAAgGAds|ew=i234tFMXPvdy>|5Ax>G7Nb8uo&2M<zuk)X{QvpxO|k22Xa8P$
zN;}i$)Ss2H!Y{?#V&$$U>ux>wEFjXvI%50gZy(IvmOi_ECVO!{*M*%Cr<7_xJrkb1
z<g-<an&<l$wc;u-rFT6)`R|Rt+t1S%)N(^7)j4jrk@T-y_IT-&2}>G%rp?#rzJGE{
zdD*lj>tFS0|JUj9R{!?#lZL0F=dXFFNrBOK(wvv<x1dR;m*HRVUq%kbAAt_cAC}tJ
zH%T>Uvzjo(|4J0Q!eFDhfN@8#0&~H#2DS%2jJyYCGD$TU1Eqn9is78d1%^351s1^$
zR8jC>BFam%HOT8^zXyXNgFc20oLlBk|DGtfe!{i=S-bz_Jv;a7!!NtLOaEW+W0lCN
zQCl0%F!h*Nb`1k_X(5x$%kqVi%Goxvewb}>OxeD`_Ws**ve9qy%Y|=Md57h0udn{T
zL;GocY4xW$y@hj)W*==#?7NZ^zRxD^d1wFqM+;5s&z+UaTRqj5!T4IP8{_wf%vTK(
zeUl_3o-my8WGD-{w_oPwe#O+KLiQ@g9zJb9|J~VEWsx1>s68=1W|>^cx@(`cCBAJ-
zo%Oh3w)}xUt;^|-+r{?Ib}-f2t@mizDZYiF3-`o*2~Bm{aWkhxjPuQnR#-v~<vzP3
zg8g>f1M`JnZ>w#1{KJaj>Wo{xllJbbG0uoie|su<r?+JfOIZouSzcY-Nm;%rY_4U3
zd#1egg;!!mW!Yi--P$KCkc?esx_fKqeS4n1U2kiABUdV$>iav*KKf~=&uk0Bb6d7K
z^JqCncY5-;iC&-ksbcN&t>tUAw^U!)wBNz>6YGrQNlud6+mtibKfP^b_cAm4VBGJl
zfB$R3%T6y%|GZD6Qs{DF$_<yOOZTT8zj{3Abq?QD*Ujyv)~~C6N)>22n0>zW;Wbb7
z&P~$ZkxTsV)d-#4wAV3n&f(RU9hfWJmp_la%kW^%ySE$ce^0*0zkqSi+UyHztWpcE
zWjZ&U-c`xOuy)?d2zB-Yr89Nx_vUP4TUB^*?ZqI5xqi}2F<0m6{%fq3x9{Y?r`jNJ
pV7n-K!nD5-<fS<!$Sd!Qcr9mC(C3c}Zvl&322WQ%mvv4FO#rr^z3Kn}

literal 1401
zcmcJPYfzGD6vtm}YfULEH^a(VD~P-mXewp1ZD_*lZ4F5s*So2k#A2afi9r`})HaoL
zw7lh*y5%aeikBSa)%7y!O6IN?aKtGUH9~9!6U<!pGVOlaZ~M&rpYuCs&d1-J3_oAO
z4&!~s008U&iS8r-FyQLh&uEMOxA8r6USAM?-sE$eo11!E)+|(YCFSVp&p;3qBuEa>
zw?>I1Uw=Tq^v4?=AUgoSRwK~;EIHXgS)$}Aj>6pG%BSlevRP=X>Dw6BD~!grO6%*d
zenjQqi0@-2o9r8@lX7ck&=};E8Qw;=+G2>jwvS+r7@-qK>?_O8fWZrIwULp5wyJ;^
zZ{U2@ptcX*UW4>;ayr=`b4f6d20zsiu&1kWrPVB9fMa$u)|)3vdwIH`wMR&0MNXVw
z8X%kyr2w^?`@4J4{*>p!)L?1;#8A9ua3<*r>-`u|tNo?<lft+f3eh1tyy}*V_MXHm
zzW3TOvn(Fe0qx4oEU!YM9P=6x@^yNTJn}Nqzipe_5K5(X;2azo6G_5SSjJ`7I;OIb
zu44Lwpu3TbsrY;48B3ZdJNecI$r7Kr0&`<?O-fkI#@t}ok**^Wl3l8zJ@X~5z~HAh
z1fB(d;vRO^EAAW5J;@n%AS1DT4H8Ek4J@Vx_6jJTLyyNqr&iJRJ;QC`Pq-B!UqH*5
zDpR+~ta;m7sfU?PT35sUR?y+xm)<YexDc6?=8T60d$B)U)rL8#YZ)XC-%4CWn&M^`
zjl?nC*vZ^g#+~wR+b0(Dt%c;OGX+armZ&HTEvhlg%XE2nLum-^BWS{<NrHJuTGdD+
zD>19Z<DeHuDIBK7$u!bS)Fib89=MVp@){X^GvD(5<BTu_a?#S#+XfVUpOSkZh3z=V
zj}8jK@n#==o%?f18H&#0pcbEbqgIC&J)FGfc}V!w_POy9oJ{b%h=)u=E}9s_c(Zko
z6}a>fbe;9oNpoovmHrvT4rK#)pwt)!$aE`c9DuXM0LhAUd;+k1Ap%(2d(;YO(U1Pu
zC^k6<EA#Nym9y5nzchlrx@iD~{yQeHGsjgkC(8~h*+W<7rfiBgUTRWX2iD4&TMOem
z(5YnLJGptv4S=GJ!g!1&%h#N_U~Dty^t7c;Y=3MCKb4N|57pk0GvTEgwp+{E#dxJa
zY>wul7!4sCza@tr_*~?Kr+iS`?~+Si@8ejkJ2c$sQ{Rj&Y&386w(~TMMFSqAG^fMF
z*qk8P%0_F%O2TM;rysrFwf$~{kx)Zx8ZRyDiYrZcw`Jl5dB$c@76ofi1o*>z68L+g
z?T;4<tEmq|4PAF))p0Gu{Y=9Cr#%t)%lDO&y+w%L7_*5hI}w-)S1VhXR&4Q*G#6^<
z715V7D;@qXQ~hRKyN8=zY4J66STEbNF5LKq07Vv^Rd_j!eLJyoIyOEmth;_-jxsvT
zl!6=WQ7zIuU)bNKUjNHflM@wIq4QCs2QITFOt%i%Q2YJq3!9{6xs>l?)tOjq!4Qn^
z7W!Pu7BCPgV#Q-r*J|)Wv!m)dRoHY&r%tcY#)!m~z7FO=lI@)HglS;x*_(HZhQN3t
zEiGC_^Vp=qvevgf8jW$|WG7M5T2~q_?u28Y{SNsPF4fO#BAxd@j|RCw*=zA`k*O@L
wWbF`*V+yV7Wz@_1PjsC*B+v3Z($!zX#hHE;viFCx^mh^f&-uF7;UjMS4xDVCzW@LL

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html
new file mode 100644
index 000000000..fe2905694
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html
@@ -0,0 +1,99 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504">GlobalLoadIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a66f11407e9f5bf0d6123c81dfee6b330">GlobalTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ad2010686bceb21aec9a1924ae379edc1">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a69775031f651795f697b628677b8e4eb">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aa21c231aa56c9e5f2705cac62b17bbbe">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html
new file mode 100644
index 000000000..a1ffbef24
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html
@@ -0,0 +1,237 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.png" usemap="#cutlass::gemm::IgemmTileTraitsHelperA_3C_20MatrixLayout::kColumnMajor_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::IgemmTileTraitsHelperA_3C_20MatrixLayout::kColumnMajor_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map" name="cutlass::gemm::IgemmTileTraitsHelperA_3C_20MatrixLayout::kColumnMajor_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html" alt="cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;" shape="rect" coords="0,0,545,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:adbbf19c2f86c198bbe4cc596c63e65ae"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae">Base</a></td></tr>
+<tr class="memdesc:adbbf19c2f86c198bbe4cc596c63e65ae"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base config.  <a href="#adbbf19c2f86c198bbe4cc596c63e65ae">More...</a><br /></td></tr>
+<tr class="separator:adbbf19c2f86c198bbe4cc596c63e65ae"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a66f11407e9f5bf0d6123c81dfee6b330"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, int8_t const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a66f11407e9f5bf0d6123c81dfee6b330">GlobalTileTraits</a></td></tr>
+<tr class="memdesc:a66f11407e9f5bf0d6123c81dfee6b330"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for A^N.  <a href="#a66f11407e9f5bf0d6123c81dfee6b330">More...</a><br /></td></tr>
+<tr class="separator:a66f11407e9f5bf0d6123c81dfee6b330"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4237c6c9e33397bc1633182e9c3b6504"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">GlobalTileTraits</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504">GlobalLoadIterator</a></td></tr>
+<tr class="memdesc:a4237c6c9e33397bc1633182e9c3b6504"><td class="mdescLeft">&#160;</td><td class="mdescRight">The global load iterator.  <a href="#a4237c6c9e33397bc1633182e9c3b6504">More...</a><br /></td></tr>
+<tr class="separator:a4237c6c9e33397bc1633182e9c3b6504"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa21c231aa56c9e5f2705cac62b17bbbe"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; int8_t, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kW *4 &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a69775031f651795f697b628677b8e4eb">kScalarsPerStsA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aa21c231aa56c9e5f2705cac62b17bbbe">SharedStoreTileTraits</a></td></tr>
+<tr class="memdesc:aa21c231aa56c9e5f2705cac62b17bbbe"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for A^N.  <a href="#aa21c231aa56c9e5f2705cac62b17bbbe">More...</a><br /></td></tr>
+<tr class="separator:aa21c231aa56c9e5f2705cac62b17bbbe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:af511f0ff83166b2a77d4cad4150c8e8f inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::ScalarA&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">Scalar</a></td></tr>
+<tr class="memdesc:af511f0ff83166b2a77d4cad4150c8e8f inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The input scalar.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">More...</a><br /></td></tr>
+<tr class="separator:af511f0ff83166b2a77d4cad4150c8e8f inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a19fb8c9b9a77aebec507635de7da6f21 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::MultiplyAdd::ScalarA&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a></td></tr>
+<tr class="memdesc:a19fb8c9b9a77aebec507635de7da6f21 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar stored in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">More...</a><br /></td></tr>
+<tr class="separator:a19fb8c9b9a77aebec507635de7da6f21 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adc95f4a8617cdf28e5b5d7d2d1aefec2 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af511f0ff83166b2a77d4cad4150c8e8f">Scalar</a> const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">GlobalTileTraits</a></td></tr>
+<tr class="memdesc:adc95f4a8617cdf28e5b5d7d2d1aefec2 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for A^N.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">More...</a><br /></td></tr>
+<tr class="separator:adc95f4a8617cdf28e5b5d7d2d1aefec2 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaa198fed841af6bf26bf2e9544d0a877 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kW *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">SharedStoreTileTraits</a></td></tr>
+<tr class="memdesc:aaa198fed841af6bf26bf2e9544d0a877 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for A^N.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">More...</a><br /></td></tr>
+<tr class="separator:aaa198fed841af6bf26bf2e9544d0a877 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af534fc5698513af3c6724b68ae03316d inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#a19fb8c9b9a77aebec507635de7da6f21">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsA, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">SharedLoadTileTraits</a></td></tr>
+<tr class="memdesc:af534fc5698513af3c6724b68ae03316d inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for A^N.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#af534fc5698513af3c6724b68ae03316d">More...</a><br /></td></tr>
+<tr class="separator:af534fc5698513af3c6724b68ae03316d inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a69775031f651795f697b628677b8e4eb"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a69775031f651795f697b628677b8e4eb">kScalarsPerStsA</a> = 16</td></tr>
+<tr class="memdesc:a69775031f651795f697b628677b8e4eb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="#a69775031f651795f697b628677b8e4eb">More...</a><br /></td></tr>
+<tr class="separator:a69775031f651795f697b628677b8e4eb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperA&lt; MatrixLayout::kColumnMajor, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:ad2010686bceb21aec9a1924ae379edc1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ad2010686bceb21aec9a1924ae379edc1">kLayout</a> = <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a></td></tr>
+<tr class="memdesc:ad2010686bceb21aec9a1924ae379edc1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#ad2010686bceb21aec9a1924ae379edc1">More...</a><br /></td></tr>
+<tr class="separator:ad2010686bceb21aec9a1924ae379edc1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="adbbf19c2f86c198bbe4cc596c63e65ae"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#adbbf19c2f86c198bbe4cc596c63e65ae">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#adbbf19c2f86c198bbe4cc596c63e65ae">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4237c6c9e33397bc1633182e9c3b6504"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4237c6c9e33397bc1633182e9c3b6504">&#9670;&nbsp;</a></span>GlobalLoadIterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">GlobalTileTraits</a>, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a4237c6c9e33397bc1633182e9c3b6504">GlobalLoadIterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a66f11407e9f5bf0d6123c81dfee6b330"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a66f11407e9f5bf0d6123c81dfee6b330">&#9670;&nbsp;</a></span>GlobalTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, int8_t const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kW&gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;, GemmConfig_::kScalarsPerLdgA&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#adc95f4a8617cdf28e5b5d7d2d1aefec2">GlobalTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa21c231aa56c9e5f2705cac62b17bbbe"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa21c231aa56c9e5f2705cac62b17bbbe">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; int8_t, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kW * 4&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a69775031f651795f697b628677b8e4eb">kScalarsPerStsA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___01_4.html#aaa198fed841af6bf26bf2e9544d0a877">SharedStoreTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a69775031f651795f697b628677b8e4eb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a69775031f651795f697b628677b8e4eb">&#9670;&nbsp;</a></span>kScalarsPerStsA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::kScalarsPerStsA = 16</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.png b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.png
new file mode 100644
index 0000000000000000000000000000000000000000..4ebfb179f4495b0d07d246311d844d6e532c93e4
GIT binary patch
literal 1837
zcmcJQSyYqP7RNtuC`Pa%Aqpt?Nf-iGG!aBWL1UDJA!0ym7;OQmMrKIBAkeF%21!g4
z2&15vfQ2qVDMJ{If&@gM3x&jn0EJj&h$txIh1@T;y-$7ZS?ip=&))m&a~}S`b(o$+
z7af=(3;+Nf0v<;K08J3`J+(GK>yqX9CCKdZboV~3QmG*K{inC3Pvbd|_j!s$qOTq$
z_&{5&I1<qdfQr;(;JG&j05&%ha3{SJG?aH`Y{fw>+#T!wb(O_zoCOgW7gRa+r}OWa
z^DYKQ83dB~p(uVRIX#rj*FX@gkYyaf2^5YCBRof?;YlFjXvuacih2OwM@U1yIre}<
zHQ|0lC?_lkdJ#pDh(W&;ds)v)R8mo;bMo8Bj;^oc33(Xlin8}YPE$6r@AOzHf`T!d
zOiVrnE}Hd93|{j45_~~Id0l4S3${5oj_8fonwxo5OeeTD5d9-Q4CV${g$yX3Qy<mS
z{5;>4N@wZ1?*~Lq9?ENi4%zyfg~qeZYjXQ<duC%-H`fn9uX*v%rDngd_g#m0cYX%i
zZUMnMxp4XLP<+<taEUZx(IJ}oOt<fLiNX~`H_jB9?`cbVJll6X<1Sbm3wv$qjLD6>
zC@m|R-6pY;;l*cUNXPyV#p|fBH%{WHitGMU(m3DJOIz58U?Nur5)K)k>)if8X^*~n
zXp_ND%O`_S$iM-cg4F|#y4D%vPX=u-_&<ev-9Mwta5kT`fElcx9s0t~IZxP5;cg*_
zg|9l@VC24UW-v`L^xYoSZ8nJ!VfxjHv1?*??SPK`S0-ll#?QxOjTDN0<OmnS;9Oym
zmEu_R0ZRqRw92x5aV;t6XQxrkyRtOH9R<(Q4?7`UCTPm|@N1(9>!-5OETmWG`RrV4
z<Rqp6dx^PPVYowf4KW4IcH0EYn)A5P1EF)wQ@4$H%D6oxJXA<*(tVDx`wS_#Ixj?A
zv%3VAxHr03g0?t2IqnNm#+we*I=t<PqDi{n*R8dX%TXq)|1Ar+6}PpGma8256fT{L
zvR#rNIfrlFXkI-IZ^SONUa`h;4e7$wu$K>^miI=Dv*k4{eiEipOCvk6LW>aLZ-wI)
z{<gdy-*3M(Mr<_-@n7Q&CzHX;#XLdKZ*<4ym<$4oC#Zk@d~Ag$_<rfCPGZN;$m>~E
z;crG@IIdH>n|S_%jVUC?HH%EFTCN48TS$FwrWfo70hSx%3Ua;iq~1H&KSliwnQx})
znKNRNs(BCCWtj%R0aVI*CJun5W{|W_XmI9CIb5~%glSj;molB8M8W5TmpTCT12&x?
zqBh<GI#KGw5D%%Edmq3xJpn}~_Ma{uJwvI`uc-B@8T=K{xd&JRnty-&p>v&m-HTbV
zEm*&l-T(;6UNw@}44gmOk1HNJh%%oHM$%fJ4joSo!)v6P)_=v@!a0c4A59-QkI$=1
z8hZ&N?30nMU>x&+0zLg0)x5OKWf4Gq?U8ySBD(csK8$SEP%WQU$`QOK%Z1gz4M}L}
zzihPWf)4p#NYXwdxlN5^s=>mox=oVT@*{m6IYxArd$TxsrH)O=rDq2>$)kI6gzaOu
z!hBr)%ePHT#0*_Xe-f&)J;GQ{rcE0g+r|As<?KaixtdB>h)RY`#I`j`bQmHx^r8JJ
zCfN>$@AAvYjN)fGdLo@Ldx3p}+YKz^VEALEZUL&(<GB4XNR;IPM;3#q`+RnZPiYS_
zX11o?nZtpHS$|O}o1#a%RMlz=(Y0<0c;$dQIDIZ7;L^^BFN?q1)5iFn;REJ7N>X05
z{}MX%AL_ajI?(LGvT{oXj7dp312R|3u)TVVV485l<{7EqIun~D>#Mh;Y#@`2ZlYgt
zM)&h;K7dCZ9)};e`f{Uq-lQ?(GBOui+4#aABxHB#W88)&uHdz%ni=htg{KV-4Ot;V
z;qWA8x&3}TtBd-S-QNYTKHBPu|I(aVhW68$$>A4!gH1IP5K8Q$8bh62>dnHbHbsb%
zz8E?Ead;~&vIQ2|G(tCHO$ssEKfFupp{gOh{(nfXvdwEi4;Oi@{=P2O^w{8<?k6Ue
zEu1OsNv5gh+gX7DV%tagMmw|@eDbpje%ziKmXI*~(>B0({I+px)3R{IqQwlRk&q{W
zV<uyP!tZr70)M9)w>B>dIy9Pld=Qe68{Jfjh_#b~uY-$3Z497l&Tgm5XD?tfcH?qN
vOE*N1%Kq>5J73Hh^tJY-RD4@e+ZlAsC5jqMdQ=VlZ2;jk5m$-5`0xJ#QJh#1

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html
new file mode 100644
index 000000000..ad3885cac
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html
@@ -0,0 +1,98 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e">GlobalLoadIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">GlobalTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a32729d0fad10fcbbcf2643a2fa5671d6">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aedb61c43d8fb9c4ba18ae72601b9f6e1">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html
new file mode 100644
index 000000000..535fbc7ac
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html
@@ -0,0 +1,273 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperA&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:aa37f285c74bb63c8bb8cbfc767378c41"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41">Scalar</a></td></tr>
+<tr class="memdesc:aa37f285c74bb63c8bb8cbfc767378c41"><td class="mdescLeft">&#160;</td><td class="mdescRight">The input scalar.  <a href="#aa37f285c74bb63c8bb8cbfc767378c41">More...</a><br /></td></tr>
+<tr class="separator:aa37f285c74bb63c8bb8cbfc767378c41"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a29c3a5e4ea1fb6d0ea8b234849684daf"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf">MultiplyAddScalar</a></td></tr>
+<tr class="memdesc:a29c3a5e4ea1fb6d0ea8b234849684daf"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar stored in shared memory.  <a href="#a29c3a5e4ea1fb6d0ea8b234849684daf">More...</a><br /></td></tr>
+<tr class="separator:a29c3a5e4ea1fb6d0ea8b234849684daf"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4241971b8a82af2c1f5f930be3cdd5c4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, int8_t const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgA &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">GlobalTileTraits</a></td></tr>
+<tr class="memdesc:a4241971b8a82af2c1f5f930be3cdd5c4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for A^T.  <a href="#a4241971b8a82af2c1f5f930be3cdd5c4">More...</a><br /></td></tr>
+<tr class="separator:a4241971b8a82af2c1f5f930be3cdd5c4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aed9492775f012986a7c158156bf4e01e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">GlobalTileTraits</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e">GlobalLoadIterator</a></td></tr>
+<tr class="memdesc:aed9492775f012986a7c158156bf4e01e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The global load iterator.  <a href="#aed9492775f012986a7c158156bf4e01e">More...</a><br /></td></tr>
+<tr class="separator:aed9492775f012986a7c158156bf4e01e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a11d02ea6e4ab68a0f4dff1eb8ecf4f9d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; int8_t, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kW *4 &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">GlobalTileTraits::Threads</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aedb61c43d8fb9c4ba18ae72601b9f6e1">kScalarsPerStsA</a>, 16 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">SharedStoreTileTraits</a></td></tr>
+<tr class="memdesc:a11d02ea6e4ab68a0f4dff1eb8ecf4f9d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for A^N.  <a href="#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">More...</a><br /></td></tr>
+<tr class="separator:a11d02ea6e4ab68a0f4dff1eb8ecf4f9d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a53dd72126a43a1c5811ed92a2313d19d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt; int8_t const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 16, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d">SharedLoadTileTraits</a></td></tr>
+<tr class="memdesc:a53dd72126a43a1c5811ed92a2313d19d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for A^N.  <a href="#a53dd72126a43a1c5811ed92a2313d19d">More...</a><br /></td></tr>
+<tr class="separator:a53dd72126a43a1c5811ed92a2313d19d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a32729d0fad10fcbbcf2643a2fa5671d6"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a32729d0fad10fcbbcf2643a2fa5671d6">kLayout</a> = <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a></td></tr>
+<tr class="memdesc:a32729d0fad10fcbbcf2643a2fa5671d6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="#a32729d0fad10fcbbcf2643a2fa5671d6">More...</a><br /></td></tr>
+<tr class="separator:a32729d0fad10fcbbcf2643a2fa5671d6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aedb61c43d8fb9c4ba18ae72601b9f6e1"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aedb61c43d8fb9c4ba18ae72601b9f6e1">kScalarsPerStsA</a> = 16</td></tr>
+<tr class="memdesc:aedb61c43d8fb9c4ba18ae72601b9f6e1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="#aedb61c43d8fb9c4ba18ae72601b9f6e1">More...</a><br /></td></tr>
+<tr class="separator:aedb61c43d8fb9c4ba18ae72601b9f6e1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="aed9492775f012986a7c158156bf4e01e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aed9492775f012986a7c158156bf4e01e">&#9670;&nbsp;</a></span>GlobalLoadIterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">GlobalTileTraits</a>, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aed9492775f012986a7c158156bf4e01e">GlobalLoadIterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4241971b8a82af2c1f5f930be3cdd5c4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4241971b8a82af2c1f5f930be3cdd5c4">&#9670;&nbsp;</a></span>GlobalTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, int8_t const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD&gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;, GemmConfig_::kScalarsPerLdgA&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4241971b8a82af2c1f5f930be3cdd5c4">GlobalTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a29c3a5e4ea1fb6d0ea8b234849684daf"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a29c3a5e4ea1fb6d0ea8b234849684daf">&#9670;&nbsp;</a></span>MultiplyAddScalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef int8_t <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a29c3a5e4ea1fb6d0ea8b234849684daf">MultiplyAddScalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa37f285c74bb63c8bb8cbfc767378c41"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa37f285c74bb63c8bb8cbfc767378c41">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef int8_t <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aa37f285c74bb63c8bb8cbfc767378c41">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a53dd72126a43a1c5811ed92a2313d19d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a53dd72126a43a1c5811ed92a2313d19d">&#9670;&nbsp;</a></span>SharedLoadTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileATraits.html">GemmSharedLoadTileATraits</a>&lt; int8_t const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 16, SharedStoreTileTraits::kSkew&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a53dd72126a43a1c5811ed92a2313d19d">SharedLoadTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a11d02ea6e4ab68a0f4dff1eb8ecf4f9d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; int8_t, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kW * 4&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">GlobalTileTraits::Threads</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#aedb61c43d8fb9c4ba18ae72601b9f6e1">kScalarsPerStsA</a>, 16&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a11d02ea6e4ab68a0f4dff1eb8ecf4f9d">SharedStoreTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a32729d0fad10fcbbcf2643a2fa5671d6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a32729d0fad10fcbbcf2643a2fa5671d6">&#9670;&nbsp;</a></span>kLayout</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::kLayout = <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aedb61c43d8fb9c4ba18ae72601b9f6e1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aedb61c43d8fb9c4ba18ae72601b9f6e1">&#9670;&nbsp;</a></span>kScalarsPerStsA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">cutlass::gemm::IgemmTileTraitsHelperA</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::kScalarsPerStsA = 16</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html
index 56b03b2b2..950b4ac0d 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_, Index_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -73,18 +73,18 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_, Index_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, GemmConfig_, Index_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.png" usemap="#cutlass::gemm::IgemmTileTraitsHelperB_3C_20kLayout_5F_2C_20GemmConfig_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::IgemmTileTraitsHelperB_3C_20kLayout_5F_2C_20GemmConfig_5F_20_3E_map" name="cutlass::gemm::IgemmTileTraitsHelperB_3C_20kLayout_5F_2C_20GemmConfig_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html" alt="cutlass::gemm::GemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;" shape="rect" coords="0,0,389,24"/>
+  <img src="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.png" usemap="#cutlass::gemm::IgemmTileTraitsHelperB_3C_20kLayout_5F_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::IgemmTileTraitsHelperB_3C_20kLayout_5F_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map" name="cutlass::gemm::IgemmTileTraitsHelperB_3C_20kLayout_5F_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html" alt="cutlass::gemm::GemmTileTraitsHelperB&lt; kLayout_, GemmConfig_ &gt;" shape="rect" coords="0,0,435,24"/>
 </map>
  </div></div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
@@ -93,7 +93,7 @@ Inheritance diagram for cutlass::gemm::IgemmTileTraitsHelperB&lt; kLayout_, Gemm
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.png b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.png
index 27dbc2cd675ac84dfecdcb202e60d1e0be5f74a3..4400379253f11e2465bb7938d4fac15825fcffd2 100644
GIT binary patch
literal 1476
zcmb`Hdo<ez6vuz6p7p4%rj??`s-g7?f)%S#eu!F#h>p;bFr=!2dFx|N&(`R~BcY_#
zMA1+LRgFh?lt$uJMCl>67WGI=6cG(ex3m4xzjx2M_kQm=-+TZ1oO{F1*F#-ZR}}yN
zb<ood2>@~|nf6nbmsNT}%t={0<mVIMzPr0ClPl|QD}N{6lBvJ5tE(%hAtg{YDkma+
z{Q;TjQ;hWmSOb89Kj?NkAVp4CwnSn%s=1@>Ua)tKXwin%m*rK3aM5ob)BbyX&*PsB
zV2dI#uH42Ggzm3ELolHt>=@W_kY~&(zCtzLLRylIv8j2O)Dq(<q(n-l-_WNS=qELQ
zBz)N~S&=xGchc?|K*8_SLo|@oROSNsVq3BgHwfLB=U{8cqq?8)6lnyjZ+s({FU9C+
zQfu!=j3tR5CFik_JLvl+c@z7`wJ*>rGadX{!CRt~G9~9s?`*!*!A_~QzeP`2PE{GK
zd}U%$-S|2{QQu*Qn6pnzq7;5)MEHPTzy!2alxBttM1taZ%|VKyfe`w-_|y<@&2g_o
zmHE`1M}G6CwTuG9NCDlcEIe>llsXJARGHDL+2R{m#c+*`UcRewL~?o4cpN@KyG5r9
zgWIl7<ehQJ|5Xq9q&t?&KI=kb-1f+4+Uh(f(INvkCK3^_`h}Zg^dxpTR_N8w)XS(G
z*g!t+TD~=@ja!#mkz)AmHE#2nh%(z>no$B5wU)M;@x?pq?ZfO-oY<m1>=-7^Nlo{u
z*_+qXK~v`7qOb}c`eaa&)-XNqgqyW4h!EOqlQ}E%`!**g>&Crpce6UoxU)U1>)2p+
zeotV}S!s#SBb&wPR>IQd&c!x3c@9AQG|QRv$2dl5#8J{mG6opPV+-E!ixlIsaYGoG
z>hV7JC@2`J_1sX(vgWwp>>eY(UeHW5$zOemw+b~?2X&v1if@#Q%N*12k)Wi8a7{GW
z*xD3s@cw50!F>8dC<V;7P=J9V#(!vJQcrRlugSn+E6?m!8)Wa#hA6-Qv}8*q3MfCw
z1AbW0!F($pPY+X^L7Z0WD!y_!TXq4!s^S0{TR=LLA}2;#%C9hF2Jff;i(#jihxCFL
zAiW4~dz9tuzyJI?f+Fo;4~kNLZrVX{XOmg+{M_-)Ra5B^sb}`xo^vnGDhEN*m<w`h
zqYRaJdS@i=Hghd%<{y3`2<1bNv}KEA@<gg<U>rUxZPVU#Hj9`dqNraAu`KP)xiBz#
z0^M;cbUr6faNsU6i`1`0V8vn9c|PfO0_U_l*5onc!W<8hAa-w9t?G{U^Bp-Ttnh>3
zVIwQ6HR<En^>}{6`9Nzyy^qmb*V<k<MrY5fN*_^NCJ=+74ki$sB*%05Ogqj0sC=eD
zMOCvyKR8A1X~o1g>8LP;*8id$@CjwR@eOeYhl#b#X?{Hd1lX-Z3R5#SaJ-i8?d3Hs
zPPB17U%@81iPz^`S{JQo*WOSvN`fyx7>&UR-@=G3#eKOH)H#hHGjy*8OCmXxYa0`K
z58*i!gvR&(7&o!0d9}7~v3UtfteBexajXDmG@g94hsdASxavIA5`IAbfv9Z+@^A_-
zZ4Y|Crq4<^yobN+PQ3#!<%omr&u^4;#QjO$jurBk%1U-!1chS>f{6+Xz4Go+(veah
z@6}h+tvzC&D)V$$G-;>+UCwO3j-Be|hm>Z7U>|xW`9sMc7^UzEYD@C*;<=SKHauW@
zc;OOS2e7|?&TLt8Ct^h&2V7jzWr4|xRm4fHnZ|caOa1K=J#98X9d}f`5Y2-7O+2eV
z<1d%!C{&I|!HdL7!x`yD&M5_eD}W9B92}{&H<aP$1^sC_i_;aX|FOYDEPJ^C=<e%Q
I=Nfk9FJNxeApigX

literal 1400
zcmcJPdsNZ~6vuz0mSN6Slr*(7gB0g;K5I@Y9|<W6itpFlj+vzSC``}Dw{5GF)(^rZ
z1TkY~ipz*u`68@Lh-E&CEN3spK*fB7sK~I>I{mf(cF+0V^SSrjKR@UGf)5Eag?<4A
z0KgQB@ecz4NV%Tz#s>O+EB~B+0l@LW!~mU6r^l(evEN1H(|URzp->pzlozQVjgN$d
zgai7cl^PHeT>-#o4c31TF%L3vexjmu$GU(}r`}c_LIuNQwHMJRqg$p?M^6Yt#+fpW
z<f=o^ff)K7f&&NxkzPhd*y%|8X=LU{z@aXZF}(=x@Gfli*qkOMIZC41|1jOGOZ|39
zYuQ$dH1%-5fk`1Xac!}-3sH6r;milrj@bG$T`jQH?5%|BAt~wEndW9ti*DQ^WN5f8
zkFMMFVw~?+A1XLjJvbthl13y-axO(n2Y4C<!{Ax!)5@gKTV<(z6Vxi=DJ60B=AFwK
z#cp4g`*vgY?MJ1#-dB_FC^)KZek~__yHke8(tw1Eg2G()8O!Ly_=KC%N~CvV_?GBd
zf+vp@%sDZc_poZ(@X3K0IU_%S<0HxsSF@4=Np`XyZ@sRz=Vr7VwPV)y65v{l>#Lt9
zm?BmX8$Ws;5d>P{5a=d8O#Iim#1u<L1rbNmno1Q*1F%??w;+oyUIVLe^x@*wFW&Cs
zvk2wr=7S_oOat%!a`Kh@2wX&9tqL<bf`jsj?NKHf3@h63`rG8d%QugJ3)ur_&@JW*
zi`<U$sW35jTX%($7;MwYj#G;Y1dO26!YG@2BZnH7dRKw{l`nS*4t_suQ19LQCqemH
zzaY&<3aQ?3k1D8&c@wwuTJrP|k79e)6`Pcp--%4SP+Ed)tD$1IzcHIbfrsUpHX1UN
zD%lHK&LY7kRjiA=D+-*H^e0Evupf)EoUqe9rTArslQX7^tq5!w24vZzFko{@2{Qj9
zD62#tGzkTC*;=3su-pU#m~%55;Q-}5nOM63*S|sm^Y(Bc&mQ&vMycCv&87L;abKf0
z>^2tS_CSPjpJpSp!<pT8gJqpjIFO?ma$rupm`5ja*)?iIIH`5JwyenNhm(#zMK>sR
zaKyoHb0}4!=Y0rh&02`t-OXNJob*m;PG139ebkvbQfRbealA+2*A^EKAC*aS{&m%O
z#Z`pfRldUR*ZK7JWAAo*1V>U=WG&#Y2inBV;O9s;Oz?3{yHm8!Gmi!oE&kmp*501-
z*u~U9x5{oZJ#)rDMmYP@LH_8s%ByJ+e$a@lu9NMc?L9@O=Y6MQt6JC~g6Tz8X~>u8
zC2i*EjTyzQSWc2hvDIS=#I1Vf>zXUIy>e={T)08@aQjZLYyV}cn8gaa^mHnZ6C;6h
z&tBM);OJg2;6B;4&hwAUb&Zosf2o84+h0fFZ60*;zSNF5-eUDeG}VeYmg_vL4l4A1
zfT9H%UFl5Rv34QZZHw0{3%#j)hPU3-rNaV-MaPjM!_Mp!+3iGVf9^%cyW};Bm+sV2
zW8B);-GfgXW_gx_E{l_q=y7=+4ZAQcwt(~~$1Q~M&02H<@SL@kmo>R0ecpjf&Up;<
z-^?(cYGO6Gyh|_{ot<CRY90Pl!l{CIlbSl<n;}obd7>G8zI5zR`fc-UgEHXnNIWq0
jX&yP3)54%!8pvLTxXJOE8VR`aQ2}f~h<~H+cP0M-U=5I#

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html
new file mode 100644
index 000000000..d5696e449
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html
@@ -0,0 +1,98 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327">GlobalLoadIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">GlobalTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a11026d05b2b32f1373020c049f2cfa66">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aaa3228d45ff4428bba0f88a7a6e8b31b">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html
new file mode 100644
index 000000000..e542db2d0
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html
@@ -0,0 +1,273 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kColumnMajor, GemmConfig_, Index_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a1ebf24984863d0422356031615b74c53"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53">Scalar</a></td></tr>
+<tr class="memdesc:a1ebf24984863d0422356031615b74c53"><td class="mdescLeft">&#160;</td><td class="mdescRight">The input scalar.  <a href="#a1ebf24984863d0422356031615b74c53">More...</a><br /></td></tr>
+<tr class="separator:a1ebf24984863d0422356031615b74c53"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aac06796d174a2d54103903e7dbe7b194"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194">MultiplyAddScalar</a></td></tr>
+<tr class="memdesc:aac06796d174a2d54103903e7dbe7b194"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar stored in shared memory.  <a href="#aac06796d174a2d54103903e7dbe7b194">More...</a><br /></td></tr>
+<tr class="separator:aac06796d174a2d54103903e7dbe7b194"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af6f6d293f058666f9f0da53f34c712aa"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, int8_t const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">GlobalTileTraits</a></td></tr>
+<tr class="memdesc:af6f6d293f058666f9f0da53f34c712aa"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for B^T.  <a href="#af6f6d293f058666f9f0da53f34c712aa">More...</a><br /></td></tr>
+<tr class="separator:af6f6d293f058666f9f0da53f34c712aa"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acd7e5d5b940f410275ebbcd6c27e4327"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">GlobalTileTraits</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327">GlobalLoadIterator</a></td></tr>
+<tr class="memdesc:acd7e5d5b940f410275ebbcd6c27e4327"><td class="mdescLeft">&#160;</td><td class="mdescRight">The global load iterator.  <a href="#acd7e5d5b940f410275ebbcd6c27e4327">More...</a><br /></td></tr>
+<tr class="separator:acd7e5d5b940f410275ebbcd6c27e4327"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a86ed2ebc5b6e4426ab35a1f30a3e47bb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; int8_t, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kH *4 &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">GlobalTileTraits::Threads</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aaa3228d45ff4428bba0f88a7a6e8b31b">kScalarsPerStsB</a>, 16 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb">SharedStoreTileTraits</a></td></tr>
+<tr class="memdesc:a86ed2ebc5b6e4426ab35a1f30a3e47bb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for B^N.  <a href="#a86ed2ebc5b6e4426ab35a1f30a3e47bb">More...</a><br /></td></tr>
+<tr class="separator:a86ed2ebc5b6e4426ab35a1f30a3e47bb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad8f1b0fda40f1fb7dc598cc841f38afe"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt; int8_t const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 16, SharedStoreTileTraits::kSkew &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe">SharedLoadTileTraits</a></td></tr>
+<tr class="memdesc:ad8f1b0fda40f1fb7dc598cc841f38afe"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for B^N.  <a href="#ad8f1b0fda40f1fb7dc598cc841f38afe">More...</a><br /></td></tr>
+<tr class="separator:ad8f1b0fda40f1fb7dc598cc841f38afe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a11026d05b2b32f1373020c049f2cfa66"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a11026d05b2b32f1373020c049f2cfa66">kLayout</a> = <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a></td></tr>
+<tr class="memdesc:a11026d05b2b32f1373020c049f2cfa66"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="#a11026d05b2b32f1373020c049f2cfa66">More...</a><br /></td></tr>
+<tr class="separator:a11026d05b2b32f1373020c049f2cfa66"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaa3228d45ff4428bba0f88a7a6e8b31b"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aaa3228d45ff4428bba0f88a7a6e8b31b">kScalarsPerStsB</a> = 16</td></tr>
+<tr class="memdesc:aaa3228d45ff4428bba0f88a7a6e8b31b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="#aaa3228d45ff4428bba0f88a7a6e8b31b">More...</a><br /></td></tr>
+<tr class="separator:aaa3228d45ff4428bba0f88a7a6e8b31b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="acd7e5d5b940f410275ebbcd6c27e4327"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acd7e5d5b940f410275ebbcd6c27e4327">&#9670;&nbsp;</a></span>GlobalLoadIterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalIteratorAb.html">IgemmGlobalIteratorAb</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">GlobalTileTraits</a>, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#acd7e5d5b940f410275ebbcd6c27e4327">GlobalLoadIterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af6f6d293f058666f9f0da53f34c712aa"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af6f6d293f058666f9f0da53f34c712aa">&#9670;&nbsp;</a></span>GlobalTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, int8_t const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD&gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;, GemmConfig_::kScalarsPerLdgB&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#af6f6d293f058666f9f0da53f34c712aa">GlobalTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aac06796d174a2d54103903e7dbe7b194"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aac06796d174a2d54103903e7dbe7b194">&#9670;&nbsp;</a></span>MultiplyAddScalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef int8_t <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aac06796d174a2d54103903e7dbe7b194">MultiplyAddScalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1ebf24984863d0422356031615b74c53"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1ebf24984863d0422356031615b74c53">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef int8_t <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a1ebf24984863d0422356031615b74c53">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad8f1b0fda40f1fb7dc598cc841f38afe"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad8f1b0fda40f1fb7dc598cc841f38afe">&#9670;&nbsp;</a></span>SharedLoadTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt; int8_t const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, 16, SharedStoreTileTraits::kSkew&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#ad8f1b0fda40f1fb7dc598cc841f38afe">SharedLoadTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a86ed2ebc5b6e4426ab35a1f30a3e47bb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a86ed2ebc5b6e4426ab35a1f30a3e47bb">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreWithSkewTileAbTraits.html">GemmSharedStoreWithSkewTileAbTraits</a>&lt; int8_t, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kH * 4&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html#a72fe2fb9077d072f8266f07374624a1f">GlobalTileTraits::Threads</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#aaa3228d45ff4428bba0f88a7a6e8b31b">kScalarsPerStsB</a>, 16&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kColumnMajor_00_01GemmConfig___00_01Index___01_4.html#a86ed2ebc5b6e4426ab35a1f30a3e47bb">SharedStoreTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a11026d05b2b32f1373020c049f2cfa66"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a11026d05b2b32f1373020c049f2cfa66">&#9670;&nbsp;</a></span>kLayout</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::kLayout = <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aaa3228d45ff4428bba0f88a7a6e8b31b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aaa3228d45ff4428bba0f88a7a6e8b31b">&#9670;&nbsp;</a></span>kScalarsPerStsB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>, GemmConfig_, Index_ &gt;::kScalarsPerStsB = 16</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html
new file mode 100644
index 000000000..953c446c5
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html
@@ -0,0 +1,99 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d">GlobalLoadIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a125c9a43da3bcdc00d5194a1376f613c">GlobalTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a8a6cef5e733eab9c0ead20b1e345ad6f">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">SharedLoadTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a872dc2d0b8ed6c75c41d258a23183861">SharedStoreTileTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html
new file mode 100644
index 000000000..b807d68f4
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html
@@ -0,0 +1,237 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html">IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-static-attribs">Static Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::IgemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_, Index_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.png" usemap="#cutlass::gemm::IgemmTileTraitsHelperB_3C_20MatrixLayout::kRowMajor_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::IgemmTileTraitsHelperB_3C_20MatrixLayout::kRowMajor_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map" name="cutlass::gemm::IgemmTileTraitsHelperB_3C_20MatrixLayout::kRowMajor_2C_20GemmConfig_5F_2C_20Index_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html" alt="cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;" shape="rect" coords="0,0,526,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a4f7dfa33f6b6e52aac05ad5072710aa9"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9">Base</a></td></tr>
+<tr class="memdesc:a4f7dfa33f6b6e52aac05ad5072710aa9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base config.  <a href="#a4f7dfa33f6b6e52aac05ad5072710aa9">More...</a><br /></td></tr>
+<tr class="separator:a4f7dfa33f6b6e52aac05ad5072710aa9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a125c9a43da3bcdc00d5194a1376f613c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, int8_t const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a125c9a43da3bcdc00d5194a1376f613c">GlobalTileTraits</a></td></tr>
+<tr class="memdesc:a125c9a43da3bcdc00d5194a1376f613c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for B^T.  <a href="#a125c9a43da3bcdc00d5194a1376f613c">More...</a><br /></td></tr>
+<tr class="separator:a125c9a43da3bcdc00d5194a1376f613c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a57670718427808a241005f5e27acce5d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">GlobalTileTraits</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d">GlobalLoadIterator</a></td></tr>
+<tr class="memdesc:a57670718427808a241005f5e27acce5d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The global load iterator.  <a href="#a57670718427808a241005f5e27acce5d">More...</a><br /></td></tr>
+<tr class="separator:a57670718427808a241005f5e27acce5d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a872dc2d0b8ed6c75c41d258a23183861"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; int8_t, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/4, GemmConfig_::OutputTile::kH *4 &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a8a6cef5e733eab9c0ead20b1e345ad6f">kScalarsPerStsB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a872dc2d0b8ed6c75c41d258a23183861">SharedStoreTileTraits</a></td></tr>
+<tr class="memdesc:a872dc2d0b8ed6c75c41d258a23183861"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for B^N.  <a href="#a872dc2d0b8ed6c75c41d258a23183861">More...</a><br /></td></tr>
+<tr class="separator:a872dc2d0b8ed6c75c41d258a23183861"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:a7639ccd7f6419a9f232db173a228e756 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::ScalarB&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">Scalar</a></td></tr>
+<tr class="memdesc:a7639ccd7f6419a9f232db173a228e756 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The input scalar.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">More...</a><br /></td></tr>
+<tr class="separator:a7639ccd7f6419a9f232db173a228e756 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aad14588b1515e37ede24915f589d32ab inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::MultiplyAdd::ScalarB&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a></td></tr>
+<tr class="memdesc:aad14588b1515e37ede24915f589d32ab inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar stored in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">More...</a><br /></td></tr>
+<tr class="separator:aad14588b1515e37ede24915f589d32ab inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afbc41e7b98097b153fd27a48f073a877 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a7639ccd7f6419a9f232db173a228e756">Scalar</a> const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH &gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; typename GemmConfig_::Warps &gt;::kCount, GemmConfig_::kWarpSize &gt;, GemmConfig_::kScalarsPerLdgB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">GlobalTileTraits</a></td></tr>
+<tr class="memdesc:afbc41e7b98097b153fd27a48f073a877 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load data from global memory for B^T.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">More...</a><br /></td></tr>
+<tr class="separator:afbc41e7b98097b153fd27a48f073a877 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acbeea56f0ce95ddd632db3482c1021e5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a>, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; GemmConfig_::kStages, GemmConfig_::OutputTile::kD/GemmConfig_::InstructionShape::kD, GemmConfig_::OutputTile::kH *GemmConfig_::InstructionShape::kD &gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, GemmConfig_::kScalarsPerStsB &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">SharedStoreTileTraits</a></td></tr>
+<tr class="memdesc:acbeea56f0ce95ddd632db3482c1021e5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to store data to shared memory for B^T.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">More...</a><br /></td></tr>
+<tr class="separator:acbeea56f0ce95ddd632db3482c1021e5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9335aca8b152ff1167763de8ff8fb882 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedLoadTileBTraits.html">GemmSharedLoadTileBTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#aad14588b1515e37ede24915f589d32ab">MultiplyAddScalar</a> const, typename GemmConfig_::OutputTile, typename GemmConfig_::Warps, typename GemmConfig_::MultiplyAdd::ThreadsPerWarp, typename GemmConfig_::InstructionShape, GemmConfig_::kStages, GemmConfig_::kScalarsPerLdsB, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">SharedLoadTileTraits</a></td></tr>
+<tr class="memdesc:a9335aca8b152ff1167763de8ff8fb882 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits class to build the iterator to load from shared memory for B^T.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a9335aca8b152ff1167763de8ff8fb882">More...</a><br /></td></tr>
+<tr class="separator:a9335aca8b152ff1167763de8ff8fb882 inherit pub_types_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
+Static Public Attributes</h2></td></tr>
+<tr class="memitem:a8a6cef5e733eab9c0ead20b1e345ad6f"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a8a6cef5e733eab9c0ead20b1e345ad6f">kScalarsPerStsB</a> = 16</td></tr>
+<tr class="memdesc:a8a6cef5e733eab9c0ead20b1e345ad6f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="#a8a6cef5e733eab9c0ead20b1e345ad6f">More...</a><br /></td></tr>
+<tr class="separator:a8a6cef5e733eab9c0ead20b1e345ad6f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html">cutlass::gemm::GemmTileTraitsHelperB&lt; MatrixLayout::kRowMajor, GemmConfig_ &gt;</a></td></tr>
+<tr class="memitem:a31fa28168811e2d04fbd74029df785ab inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab">kLayout</a> = <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a></td></tr>
+<tr class="memdesc:a31fa28168811e2d04fbd74029df785ab inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#a31fa28168811e2d04fbd74029df785ab">More...</a><br /></td></tr>
+<tr class="separator:a31fa28168811e2d04fbd74029df785ab inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a4f7dfa33f6b6e52aac05ad5072710aa9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4f7dfa33f6b6e52aac05ad5072710aa9">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt;<a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a4f7dfa33f6b6e52aac05ad5072710aa9">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a57670718427808a241005f5e27acce5d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a57670718427808a241005f5e27acce5d">&#9670;&nbsp;</a></span>GlobalLoadIterator</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">GlobalTileTraits</a>, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a57670718427808a241005f5e27acce5d">GlobalLoadIterator</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a125c9a43da3bcdc00d5194a1376f613c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a125c9a43da3bcdc00d5194a1376f613c">&#9670;&nbsp;</a></span>GlobalTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmGlobalTileTraits.html">IgemmGlobalTileTraits</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, int8_t const, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kH&gt;, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;, GemmConfig_::kScalarsPerLdgB&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#afbc41e7b98097b153fd27a48f073a877">GlobalTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a872dc2d0b8ed6c75c41d258a23183861"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a872dc2d0b8ed6c75c41d258a23183861">&#9670;&nbsp;</a></span>SharedStoreTileTraits</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmSharedStoreTileAbTraits.html">GemmSharedStoreTileAbTraits</a>&lt; int8_t, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;GemmConfig_::kStages, GemmConfig_::OutputTile::kD / 4, GemmConfig_::OutputTile::kH * 4&gt;, typename <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">GlobalTileTraits::Threads</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.html#a8a6cef5e733eab9c0ead20b1e345ad6f">kScalarsPerStsB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___01_4.html#acbeea56f0ce95ddd632db3482c1021e5">SharedStoreTileTraits</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a8a6cef5e733eab9c0ead20b1e345ad6f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8a6cef5e733eab9c0ead20b1e345ad6f">&#9670;&nbsp;</a></span>kScalarsPerStsB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename GemmConfig_ , typename Index_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">int const <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">cutlass::gemm::IgemmTileTraitsHelperB</a>&lt; <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>, GemmConfig_, Index_ &gt;::kScalarsPerStsB = 16</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">static</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.png b/docs/structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB_3_01MatrixLayout_1_1kRowMajor_00_01GemmConfig___00_01Index___01_4.png
new file mode 100644
index 0000000000000000000000000000000000000000..7cab2403570c461b12d7997da45f046a947c9acb
GIT binary patch
literal 1727
zcma)-c~H`67{`BLrs0aF)q0S}hP9SgbWx<0M+$h7r442lWtp;K9%zZ$q2z8Gh31{6
zLDm)?S(t)~!Roj(=9MRwA#Iw4E-8o_vOjCKncbb)*>~oB-{+n0_xt?yeCEyc_x03=
znZW=6(8qeY6951T2Wx*_E%4l*qR$2|6MyeO4~<3xmVYS5?>>va4pyJHKp+UNPCNuY
zb>j%W2LRBtw0eIFL;=8ZU#$DSz(k1bR@b#@KFlMR%9>JJ&Uu@QA?6#%8+yk-9T)Yv
z>o51tX}1@1$@j@(?h9@;mVjdtGA|+7Mmks=7L|kcB5aJg&dNrTrX>Ew>#<FQxw$M>
zx<#d>#dhKX`C$7Zh0l<7Y=(Cv$qYl7Ic9o?qhfA(Gx-knk7ouj8?aOF9Vv+!XvUUW
z`%t+9y!pXUK+iygOb2b3)82-(eG#8~oN<(P8;?i;sJ-imsSgSt5o4zo<jS#O7kl-P
zuMc<etvr^fQjO?6p6qzS5twm`3ycwG_%yj>M6$IZ4@2_v_6xkUHpLCq??)Vp&xJDX
z%o{jnZbF=kWFPnT(AzRqqNt<KT{KW5;IuK%4N~Y`oO+(yDcY$z>$Ck;#pwNSW41&!
zJIAHMn1e9s`|#fOF47Nsfkq@}1_rM%ZZ(jqle<gn<`qE=&yMX*4-fX+ccez<MZF_Y
zg?GW4T8$A=9mKNLb`JUNW9O5G*emGcB}h{4-sH<};`hUYxRYYf8xQq+6rzsN&ON23
z>%t{Yb|L<}S7F;Mgwn@w>Oz{(WPX`W<#(p$S@tpLscs!~2voiTo^q%)o>LK9+x29G
zg88Pcg?A=J*Cm^Ga<?#?*=~8>Y|W&yBt|#G<Cc*HJuFy+epo*fR4YXPsP%@ytfZ$G
zzVRrKoe37{m1DQ<5Vx3a&ZL~KZQBVaI||j7HU?SgXnrR<v+gz|x|#B`(50!kRJn|N
zR}m-M#rb_Uzr1W<ex5y2)l;v($8N$l@}$Y3Yqx3F3aJPDKAlc%k@?7kY#+~9<(=nO
z^=Kc_`P4_{Z|m_5mrZMw_Q-efM@Fr%Q{!qQ<U8~EP#fz0Yvb80%uFl#@-&XQ=zjFU
zn?8Xw-2qFz_lmGkf^1-&kET;m`0gMDhtP<<gnY?jH2x|Rx-tpO8O=S>zArP0G{qy3
zwl~3<#4)Qa5nQsEur#^)R@xeX0NfWrta>9<xw`?Dkxp86xpflYWdjFnUsqj*SlvVe
zEP#}$wRd9-;00*`4S}P;b?8;lu$0p_!6N_yD8rm`Kqn}#3bO;9OL;*s=){3?S~ckW
zpN%NNwrm#8*5)8g+e-U$`tQx7E(kjqO|5TsxejVV>XqVOiqw)s%TxIzMDg^HHCjL*
zS??>GJ^_UOWSDDlehh&6tX=lBdt}s*YagomCq{rP$2BCWh`wk8$E5NmGC57X&V#q=
zX4P>Eq)=xEgxJ@o{x6C)eWvJ{8E0~08Qm=UXtK()J&#CYd}YX=SP(H#hQH7npq^k-
zX!6w+lJOhoPL-P6sdAcL%<psNPmEK>F?)8I207iF=r`bPABm27B<D7dg^ONRY0q}5
zZN0)bU9BuUi1B39LDII2?NFf5>y6<RD?ySJ$=$cBRgoYwEeB3#DEQ9Qt?gbV$}`jt
zK`Ni(*I~Q?BTiUMTU4XOr~ysu&x1bCNr7O5nTI8v++91ksD5sMU?{M2sO!H`g0{4r
zz$2dX;*8;wk<h;RJeTHX#>CTyy=03gRf4b{nbQe##|LxPD*wqGxnW_z_S6p%!B54h
zE!HM$;&F+Hi^o<<t0uZ>wZf|OY4Ncl5kxKxDKpFy_eW=V@F@j*V{6DoE3<Uz357+{
zP9<ts6Y$aL@D;c6gqNR@N~^i&*1F%##9K!xS0vXuMz7<XimZ*`G%|L>@Vv8#grQ11
z%o0}dU$J5=VYQYQ7jp0I2TxAEI5MlXjh{8Q-dX$wt3DES&>c>5*`M2XMN5D=m-MoH
z1rXXZiyAiFS!Vniu8juxoDNFx)lEQU?plaTUq5QtEKxUs_~9I0mg<;6ew9{Z5KaGn
zm4LM*_tp}UvzDh7#*r9%EY|?GX`1W*hGL<)G@C$RXEQfyw1ies1>R+xX7INGupYkd
J6|P|y{{#<%H)H?+

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTraits-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTraits-members.html
index 23f0fe6d0..ee32e38b1 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTraits-members.html
@@ -73,19 +73,21 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_, Helper_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_, Helper_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_, Helper_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraits.html">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_, Helper_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
@@ -98,12 +100,13 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTraits.html b/docs/structcutlass_1_1gemm_1_1IgemmTraits.html
index 92ff0ed8a..7a4907a7f 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTraits.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_, Helper_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_, Helper_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -75,17 +75,17 @@ $(function() {
   <div class="summary">
 <a href="structcutlass_1_1gemm_1_1IgemmTraits-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_, Helper_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_, Helper_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="igemm__traits_8h_source.html">igemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_, Helper_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_, Helper_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1IgemmTraits.png" usemap="#cutlass::gemm::IgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20ScalarD_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::IgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20ScalarD_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" name="cutlass::gemm::IgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20ScalarD_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map">
+  <img src="structcutlass_1_1gemm_1_1IgemmTraits.png" usemap="#cutlass::gemm::IgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20ScalarD_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::IgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20ScalarD_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" name="cutlass::gemm::IgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20ScalarD_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map">
 <area href="structcutlass_1_1gemm_1_1GemmTraits.html" alt="cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;" shape="rect" coords="0,0,1447,24"/>
 </map>
  </div></div>
@@ -93,10 +93,16 @@ Inheritance diagram for cutlass::gemm::IgemmTraits&lt; kLayoutA_, kLayoutB_, Out
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td></tr>
+<tr class="memitem:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>, Index_, Helper_::ClearAccumulators &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a></td></tr>
+<tr class="memdesc:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">This traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">More...</a><br /></td></tr>
+<tr class="separator:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a></td></tr>
+<tr class="memdesc:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The struct that consumes this Traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">More...</a><br /></td></tr>
+<tr class="separator:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GemmConfig&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a></td></tr>
 <tr class="memdesc:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The configuration.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">More...</a><br /></td></tr>
 <tr class="separator:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
+<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
 <tr class="memdesc:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">More...</a><br /></td></tr>
 <tr class="separator:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalLoadStreamA&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a></td></tr>
@@ -117,13 +123,7 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedLoadStreamB&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a></td></tr>
 <tr class="memdesc:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for B to load from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">More...</a><br /></td></tr>
 <tr class="separator:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamA::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a></td></tr>
-<tr class="memdesc:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for A.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">More...</a><br /></td></tr>
-<tr class="separator:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamB::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a></td></tr>
-<tr class="memdesc:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">More...</a><br /></td></tr>
-<tr class="separator:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
+<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
 <tr class="memdesc:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">More...</a><br /></td></tr>
 <tr class="separator:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Epilogue&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a></td></tr>
@@ -143,6 +143,15 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::ClearAccumulators&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a></td></tr>
 <tr class="memdesc:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear the accumulators.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">More...</a><br /></td></tr>
 <tr class="separator:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, GemmConfig::kResidueInProlog &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a></td></tr>
+<tr class="memdesc:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">More...</a><br /></td></tr>
+<tr class="separator:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">GlobalLoadStream::ThreadblockTileStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory needed to store the threadblock-scoped GEMM tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">More...</a><br /></td></tr>
+<tr class="separator:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a></td></tr>
+<tr class="memdesc:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">More...</a><br /></td></tr>
+<tr class="separator:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; Helper_::GemmConfig, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Helper_::Epilogue, IdentityBlockSwizzle, Index_, Helper_::ClearAccumulators &gt;</a></td></tr>
 <tr class="memitem:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a> (bool in_loop)</td></tr>
 <tr class="memdesc:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">More...</a><br /></td></tr>
@@ -164,7 +173,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTraits.png b/docs/structcutlass_1_1gemm_1_1IgemmTraits.png
index 7f98448cc867fef1d0174483b86d238631451982..59b3777086188f507b3e04e89f4bfb32c164a5e7 100644
GIT binary patch
literal 3065
zcmdUvXH-+!7RSRdkbx1<0TDsLLNQ=KBB+F}f&?U#(2+8LN{fjYIw;PF1w^D6M9G9|
zXdz@k0+ABrQ3Np>ARv(<h!R5R5+Ia!_383`eD8gGXRUkBKKt(b-|PI(y}vv5$TL!s
zijp7@ND5(f+7Sd2BLT7fFQUL5{)>SzFe%udb+Xvn+5*D4&y!D{hu;UHuNQ;CaHB@K
z0Lx!+jz|;;DEcz`I-Ou3(66@<r_G(BMEC?w`WSrs&#0o?i(AAv1xAfF)SuCEJH_w8
zwh-EyddZUYD}%>5SB@Ec3JrVp_Crq93xiLPeKzT7ss|C4>33CkBOZZx)xZQx4^Vw!
z#WHduslBlJ_V{Bn9Qv&amaZqm4*FJ=o>myGFo~l}BVv+qt5&Q8Vn4a{&;tMc@|1my
z%$N*Ro0(6-6drl>w11LUA3;~O(34;MI0#+UDp8iyM`27K&h3`EB>hn~3`^s^#Ar)q
z75K@6f8P<Sk9+K#elzEand*aaiS9Vq0%dBcueF5?LF^=Pm&RA9t-hUxkow~I4IDx;
zPzN7<h3~PMba#)Wz5~WIdoD-{U!5Y0quU+Od~)R7omCC^Mxe-G$^pbdZ#I`-T6^Q!
zdZW)M&6OkYJ6GSdS#cFtvW<_QC4!URFh|y4<Tbkbnm;{y_Sw>jtG-m#uw=b~StiLo
zyzHT)UMPB*#pe$h7d%Cv&0{@ao)w0$1zc&GS7wi1!^Y|7O|M5k8|l53li_vu@bez$
zm(v|XyisS|dFqIM0Vh%+S}WwJ!l6wAaAA$th3e1m2w4+yt7M;$?DXEsDV#w=s7v~o
zLw%FH+eR^kkT*0~al$RypgbNrU3$1{?OvPA;kE4>tVaCvBW-~qlBr$Hwm`mrJohYt
z=Vp12M87%3hijmgmNO)XZ$|m_`;NMQw2Xjxz2=C%KpY(!kv8Z;dhD3rk!NH9i)V{K
z&`J?_4Y*5dDSjvwM^B;}AM&i$no2X0R;?YjOH}A@PIehGxlGt_hs!thaIrg()_DTO
zAfE;qanD?yGexcEV+@l=cH-ElJKC0r%YJK&ZKIxo)s!{7tD3f<I0YBV+nv^S{=gSy
z>AYAz>Ne`)P>^`(<T0B_D^ixX{PA<=pSnCM46Al!4^+J7vL+*{s$Eabmb+g@v_|dO
zLJ+QMB>D<^X%_|cbq(w+{)dItT^~FS3%g1z^QMZa(;Mzzj(oS2c0MFXshRl1aOkla
z$@;t!uR3$e;ZEzN4^Qa!Bp-}5Keh_3Zo=jsTNqQfpYkGHijnQ~sFxgSR(b1uJYXW1
zi=8gNOVcvCyzUylRwQSsOMgYXCp0wi5K=ln-*x(vr<w$}`_c*$`~E)CMzejg6XG?^
z!!52Y>#%|l6ADH04;%Y4Crwg}XLvY4S+={RZ&8l`LG7|+x4E7tlVzsG;SGdTddSnN
z%8n;g;r#d_>elV7<yAR0Z!LEjnhgdE5zuU%{^O|leX+Jkz|C<9VjAY@-sjv0SMiE2
zM7SE--<2dh@aUv4*pD#$+vMQ<u!zK!nedp=6OwY2K((uhNFU{4R_&0t;6lZg=LIN|
zCU8`|8@~CvqVWKw&1QEqy3YE=R4Ag{D_LWVa$aC~jl6I}uG5{98CxgVHL;lAGJ!@Z
ziFquD)m1>R9qdzc(xoQDoxf~bLaK3XV7k<ndLCt5t|QbOba}oOpjBN_P&u;hl8XOF
zeh0r9ilHrw$IK`EY~UJc>B@ABE+BBUYj-(M=Bnz40t{hpkIpD$&fnQKmK>h1Zl&42
zYhuk7z0rBYt|Ky_-}G9(sK#-gL8K3jH~fYRo>D`o>>D^tOI0N>V!EvzUt&o65X?D?
zx~nM9CfNI<3n_6oZe5GW_U;tYy##pVmfSwXwJr*2uC_Cq;*028$v@XrLiWj?dlPr+
znLv80p8P0!hfnVhdI9Xy@F(DZAQ1eYB5)VsmBGb~E3ec)<=B1)tC1*3oB>+@bsg*r
z+Lj=41SIY&S>E#{rvMT?BDJ+~F;5&w0?P#VN~9=|1nL-i=K=;#N_~4H!<X>AB)ii3
zdkMf|k#B;^KLh~`e^p2jc?jm|eeK5pz5Fv=@oPU{5CHA(vWq`tqknY%Ka^#dp0b8y
zXF9?lMFEc1FA6i$5s)ItK9PTU2{-}z@0?iI%o1-J8E;o+@kK-Z<<^$x%v@q`GEZ<(
zT0O&Mi+`KXCh`Tk+g=;(zVN1cW<E)*!G!K&VE_`Xz(o2vS(sKe(4~GlQt0KMEXGg)
zOkQy|DeMs~kj2GRp81Q#9a>7-bsf3OuDy8-L`JG$SO*E>3iFj}Ek?l^w=N`K4_6!|
zw!x*a#~{#8)2xxMSssN~)kWmT>S_=BTyr%|x+3hru5LzGDr~Gn3wCzamHMQiiNe2-
zDiN^s9AN=DvkZOT{P$jG)T%e<94QRy7gZH1V8F=URQ)E_<^3c<v<<C)Q^tc<KX|sZ
zJo$DwhO-mH(w1+)if0ydMwA6snt8Uf=}H3m?Fl~ZXz>%-3*}ic_<hQ)LY{8%)jj&>
z?40+I>-Wxpare<%7juub6ZZ6R^E;lODd}kml|%#`9MP#0g%fi3m~)cLld#Q-6bF%D
zb{YNb;kyGr2f4;U=+aG`;?7)-rkOtbUJ9O6cBDdq0jj?ZY&`(ZFP$hh*&*tHx%bL!
zJ-B5snpb$joJO>e*WoV7B3Vpu?*3k`_YRrKC1auqA^#65a%55IU3oJx);KT5bkfrS
zWup>|<+5F8qu^%UQFq4m@4>5l@*V)%z<;74JGB({H|AFL>z7j>Gy*Ln>)UQ7N<Xmd
z5A5TXsMXY@RQq9XrWyvRZAcN615jFv_*a7hFT%{sOYl!ac2Rbu{%(hmu{5#+0&QS?
zsduGw_ecR+nr|!S)M71#)no@HWZc2g`|dbie|EI7tjE8l`%1z6G7r}>Z<4#wwAwLw
zng$`Kpa*1}Xo0o(tGK5?VwSr!z!^@;vPgxAl~Pe}Ds>%#&Vv*D+=@hyU%mra>tz{a
zd@f^N=uJ{lkjBLrF1Eg((j#XKKm~cV#-CINgNg#6HJ)ryg0h5lp*dlXbXD!~Lmt#(
z;ry5w;QUF#%z=t59<~*1VH)h@I*|X<^^ek@?rK(Bi{{(|EDvR&Y2J+(C1J!Eehd06
z`YoRmYc)RKQJLQBSv}zvev4bPU`m8mIlmOXD;swU?7gfJS;lVf3u`!yPw4(&dEf6$
zGI7jqNbt<IFUgjO!OZ0GtU@@v8Oq;IN$iH5oOiV!T}Zt0{tAlmUh)b{cp&a=)1jCL
z{ErPUYR-+9RzE%CkO&eV#R122t^2+HN?$8{GHzu0VTN%TDL9U@|ILQj>o9AMY5420
z6HJQ{YK=E2PLZd_@LA~DIu(K)*gh(zyn>`LJz?=3?P-dsYNFe9bN1H7()hDQl5?ug
zxu5b?s52wbDuAr305&%>TRhhzna?4OOzgrfCD^tN^lwXDZ#{HCCMo|LDYfAQM{D(>
g%(MRnq9E~2u+R8@2t{iZ2?7Sf0(rXPr0*a91fy564gdfE

literal 3096
zcmdT_d05if8pbTwv}w^yQ*VVfT56+sHQbs>R4~ZYN-fFJkkH)01($5B%q17xMjez)
zK~2$I6VqtQ6>%e1GRs6Gv|KS1^itEzz0Y(1y7S*X&vVZAp7Z;@_j}I!Jm>u-I3R2l
z<W%JV0DuD2&e{<G*g+9v2N_B63YIx(Ar2}IXPhBhTU%ndu=<|-J1$L(zD_!w?(!)7
zf_N)~bwoG;#7SSqP`9%o03c6+TL0)AE-_E!5*|F+W1UL4`$?oJz)RL;o=_P-GHI8Z
z!j>!<2bOFa!dX|zn7kekJR_HkF=T<@-g#t<%&)*MJ3>0}2-Jp<3{;54xrxI8s3GAh
z5Oc7CB@W*{zw;nwf6F=mRh8z|eaq^y8#KjY!4`Lb#KRMogqLqOX$|ioF_xFF%)>sx
zh19lr*Oe7(xfa(;_hNb;QtTbAQ9t-onS>jJ4^)REtNbL{D+6yncxa@><+yuoV$+-E
zl#I+|l19t#k5v#}a`Ge(>u5@YmOZAehPd%bjhCDVa{4Up+M-udZ>Et>RB7})7AjY2
zkR24_=eC)UJSS)D5b!j20i}>#mm-g)!4K<d8@;+KIE!7M*!EHlLcm8=uz2T#<ij>Z
zG<spx@TW1;$gR)r!fTG)apvTjbnSpBAR<>e+I>$;KJ_(Qza>@Er6<As2#&w8xG&Kk
z<y3P=k6F;%(i(}X1C{Atv$wZl;7;2pQdGwvCly%i0H9D>0oi*x3(l{8WzN*V>vk6%
zE15Zuo35u4R>Ggg#HWwcT!>4Vx)O2<#*VOY?_)$D5!sVV^_e<Qr6j~GYuQ^%M`LWm
z_GVk^(l~cqZ$2@Olk<FVq=(vRSQQW;q!%d+=+C2duwE<5|5!HNsz}bZ%+BfUZ{nk_
z-YB;(9i|2uT7S_%NdZ|UuY)>bD)g(iQO|TvhEaH)=(0*2O;;=NV7C*Hbx}R-RfDHj
zM3GlkrO#`T9VJPH7xx5`U!>9HW%~<5l$j88z}$CedGE+rK}qzY8c}io+oFALRq6b!
z4N~onJY>C_;dN@&6GVwyJRuVnY^*|RoILY6Q7YbuuTE%n=W?=8m+<!;E$U6bJ9#mk
zC0*=JSVdRU>x*pU-EUW9`{y9~T6+8+|L#);f(lBjDq7vitfqlw@3N{p!>;vHgqlUm
z%^!)D89!A=cC%|EkP}D-10TF8ln!QQi{3dua6r9u;cvSBaogS^9gO<3!g4ca{wYc@
zipQ(V>^^t5&3n3>=0LFufN>-1E45okxZtHZZHEtVA{D>4+wF-Q^Vz2{C6lXfNgo2|
zj;A*2m<I{Z;?^JR!~c-iJCedSvvk`i>|RZDj^hCn!H6%dv?71bLD+ZOe(LUWzs|$1
zt_utXF;Kz#66IeDd|}wac8x|HO>mysv!lA7J5oG~(()BOta&+X5~@x__Sufr54yTs
z9U7hgyeQB){lY%d{5FU7x-2?m=GimLQmuC!yy1{Z%|#CARKU}M1tozp`_OO5_h{<R
zoHD0D@IP@hy&~PZO6_5;@lCS&tfJkoArD#V9p^~l5cx$0cAdYF+rG@l8;1xc&3!{@
ztvQb9<IByV93{bt0)~t~0|HY<hj^~K9lZNAbK;}0q+8yx6J6<q<g_BE`)U<u8{wFJ
z*SdC1)9QrQ<sqflJ@?{DU&k1|l~)xmJQ`QZ_hgd8U66c8UHvUim)kX0TkogqdK%0G
zNIEYrf6{+dVdbraY_R^vWO6~%63lGGeL+{3^&_<0MeHpp-$i5;e_Fh^b1Df((zfgF
z*u`15_Y-y9GU#kXk62pu-%QHK^-T25(~Q6(n-(BfetSMgkX|hBLUn~E3V8c~Tp6oO
zo<aTU(Y>vQCp&G!KilSTo1PT1aTM%2G8QPhv}t~O?R-kq4tw49Kgri-)W(Ts!gmcm
z(-5HpMe9Et&pr8XIo>NQK9AgWh6T#S<Y^oI<*Y0jfC@lzVT*nPAVvQIJpgy;U<D7r
z&RB^PfaeR7H<W$89E!IpJ9wZkhf;LF&gXEl-pemYTya8X7z2>}BSrS%pDD?4IMr{2
z?a%%q6nnDNR|b{XplXEV*M2+crY;nTul=Mv#18%^t>V9FrT^;u|41vGOml>3mt>xS
z>EvcQ8tRl>b%bGL?7rR8LmdA%efEd=as|}ZwX_0F5A~M*zId~maYOT|Vz}Pf$cMe`
z>?oy%iH;MeR*Ul?L$tMH$}8*rZW413I^{^f&Lh12r{drE)rJ9RFBt(Gz-O__u}J~~
zA}m?IpW90{EoS9&Q3l(Hy#@TZHVK~{?8)LVutNVkKl_w}wP9dUD+Zt^F41fQD+Cr~
zevFO^-V%LY4G-O@jp=J2+vxZ-)q$6Lt=jwT$E2a>)C&>STxY*(#Nrz>3Id;KRF;@u
zkK1YZfSmXH+Te^~mhJ9|d{m3{42F}aC*Y*ypj>B|6Ug;R%me|N;rob+I(&~^WQ3v%
z(Eh*O&I{X<mRgi{d|?=Vp|1E^+|c$n0fA@<M26<0%YA!Z9Esc-<+Y`@++hqPJm55*
z4$X_Z&bCtXsqO1R5_=PSqNc$UOl{UZ@Dh)}zR!|f+FfVC(3Rg`vA9QxM0(txXEjE%
zy>!$-+xP5&z~S+tB{Gnt0y)Ig-<J3YRNEK~Pp&=yka`0UE5HJcpYJ}`G;dafB&Mc(
zHl8)!PXw>48k;er*8*_su^HGcfb%Wzgzl6gF^0n;JIQ)goU9UpO?->VefXbNV_1#r
zsJcsF%VW0-jZ*E;oPy`7r=@Ow=wN6X`!$CjGp0v~-vUJzhqrX-Gs?tx2QBS&esJ=1
z^mAdFw@vD`w%s~f4RwBJea?FAGA+{*-9m)b=wwB}(cBF(!X#`)?WX_Hg9F^-CGKGL
z)dpG)tgsSc&}`szfutg0m)>X_R;y`!5$owvCeiCjlrn|SPAh@aj|GObo8V{xkMY!f
z!RL6ML<XofzVbzT$2uv)7pqFrs+FO3%HwDzKR-oOZEJL*yz?xNEDKdkAZWXjRMgr+
zBbCp)&tA=vdc21RqGM{}lr)>&ZoXTqL_Gar?){2x!<eiOs4{)jc&*Yanhw2K=e<lu
zs}nz#*#JTJ+*V6!-KY(B9TLka_etA$-*4AX-U~7~P9A*mK^JxkazO5Tn@q-W*_$(=
zvnz>>Fv-g|ajI|3xlLLDlYJ8#qxFof89lQA?y5!cW;ohKV=#U(Dl~8J@@3uznt6Tq
z@;}$6da?$qSzU~B{$llI{q&O_#!ZfIM+fGPZaDEpD5pBlq1oB|i|-8w2l+J{N&M;V
z6`wY+iCjZy6)g7!IC#YVVsInwFjM(^f65a*Ud?bq<?RaD3%6IgUD*4Tc6k7(;+MP-
z9U3M&n}en-`_)Dx8Y&cr!l{P_L^~WppzL@Hw~jsR>V|MYl!REHu%@u6iz8ub+oI@d
zlU%_`Emm{XTv^Z+L%{BdvGnFzKdT&Fx@OSvM;62L%@NA65|6iwt8&I#Qnx~%UzysF
zJGvDpf9HOs5g;<K5YQU?_Z-(BO#E+q+P*10N;>4!los^@ARbT%!kYS%$1nc^Ls-Vp

diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTraitsHelper-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTraitsHelper-members.html
index 9c138df71..6a63acf70 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTraitsHelper-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTraitsHelper-members.html
@@ -73,34 +73,34 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf">GemmTileTraitsHelperA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8">GemmTileTraitsHelperB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">GlobalLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">GlobalLoadIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">GlobalTransformerA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">GlobalTransformerB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">SharedLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">SharedLoadIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">SharedStoreIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">SharedStoreIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3">GemmTileTraitsHelperA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685">GemmTileTraitsHelperB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">GlobalTransformerA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">GlobalTransformerB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">SharedLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">SharedLoadIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">SharedStoreIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">SharedStoreIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTraitsHelper.html b/docs/structcutlass_1_1gemm_1_1IgemmTraitsHelper.html
index 3ac649b17..b2c9724a0 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTraitsHelper.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTraitsHelper.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -76,7 +76,7 @@ $(function() {
 <a href="#pub-types">Public Types</a> &#124;
 <a href="structcutlass_1_1gemm_1_1IgemmTraitsHelper-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::IgemmTraitsHelper&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -84,343 +84,343 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:af10aebe7ca4e24cce435ac4cd60e7bac"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a>&lt; OutputTile_, ScalarD_, AccumulatorsPerThread_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a></td></tr>
-<tr class="memdesc:af10aebe7ca4e24cce435ac4cd60e7bac"><td class="mdescLeft">&#160;</td><td class="mdescRight">The IGEMM config.  <a href="#af10aebe7ca4e24cce435ac4cd60e7bac">More...</a><br /></td></tr>
-<tr class="separator:af10aebe7ca4e24cce435ac4cd60e7bac"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab9e10d54c81a359db0eba58a11b9a0cf"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a>&lt; kLayoutA_, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf">GemmTileTraitsHelperA</a></td></tr>
-<tr class="memdesc:ab9e10d54c81a359db0eba58a11b9a0cf"><td class="mdescLeft">&#160;</td><td class="mdescRight">The GEMM config for A.  <a href="#ab9e10d54c81a359db0eba58a11b9a0cf">More...</a><br /></td></tr>
-<tr class="separator:ab9e10d54c81a359db0eba58a11b9a0cf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a095505bfcea6791accd06bf4d37b9df8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a>&lt; kLayoutB_, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8">GemmTileTraitsHelperB</a></td></tr>
-<tr class="memdesc:a095505bfcea6791accd06bf4d37b9df8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The GEMM config for B.  <a href="#a095505bfcea6791accd06bf4d37b9df8">More...</a><br /></td></tr>
-<tr class="separator:a095505bfcea6791accd06bf4d37b9df8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac7ee33e683e48511a1a220df6c9d4758"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; typename GemmTileTraitsHelperA::GlobalTileTraits, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">GlobalLoadIteratorA</a></td></tr>
-<tr class="memdesc:ac7ee33e683e48511a1a220df6c9d4758"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load A from global memory.  <a href="#ac7ee33e683e48511a1a220df6c9d4758">More...</a><br /></td></tr>
-<tr class="separator:ac7ee33e683e48511a1a220df6c9d4758"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a23bb732b7237bcabe3667408f288844d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt; GemmTileTraitsHelperA::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">GlobalLoadIteratorA</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">GlobalTransformerA</a></td></tr>
-<tr class="memdesc:a23bb732b7237bcabe3667408f288844d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default transformer for A.  <a href="#a23bb732b7237bcabe3667408f288844d">More...</a><br /></td></tr>
-<tr class="separator:a23bb732b7237bcabe3667408f288844d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae187303a8da63f36960687a4730f4c46"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">SharedStoreIteratorA</a></td></tr>
-<tr class="memdesc:ae187303a8da63f36960687a4730f4c46"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store A to shared memory.  <a href="#ae187303a8da63f36960687a4730f4c46">More...</a><br /></td></tr>
-<tr class="separator:ae187303a8da63f36960687a4730f4c46"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7fb1354154f303642da72e6fd157d846"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">GlobalTransformerA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846">GlobalLoadStreamA</a></td></tr>
-<tr class="memdesc:a7fb1354154f303642da72e6fd157d846"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from global memory to shared memory.  <a href="#a7fb1354154f303642da72e6fd157d846">More...</a><br /></td></tr>
-<tr class="separator:a7fb1354154f303642da72e6fd157d846"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3a6d816852cca926afa08103f754477b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; typename GemmTileTraitsHelperB::GlobalTileTraits, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">GlobalLoadIteratorB</a></td></tr>
-<tr class="memdesc:a3a6d816852cca926afa08103f754477b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load B from global memory.  <a href="#a3a6d816852cca926afa08103f754477b">More...</a><br /></td></tr>
-<tr class="separator:a3a6d816852cca926afa08103f754477b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a600bcc571ea5e04a98663c134d4664b9"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt; GemmTileTraitsHelperB::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">GlobalLoadIteratorB</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">GlobalTransformerB</a></td></tr>
-<tr class="separator:a600bcc571ea5e04a98663c134d4664b9"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4d6658f3a3b53760b10a3da9c807b81f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">SharedStoreIteratorB</a></td></tr>
-<tr class="memdesc:a4d6658f3a3b53760b10a3da9c807b81f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store B to shared memory.  <a href="#a4d6658f3a3b53760b10a3da9c807b81f">More...</a><br /></td></tr>
-<tr class="separator:a4d6658f3a3b53760b10a3da9c807b81f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a88e66ee760aea03687e7b3ccc6ea535b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">GlobalTransformerB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b">GlobalLoadStreamB</a></td></tr>
-<tr class="memdesc:a88e66ee760aea03687e7b3ccc6ea535b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from global memory to shared memory.  <a href="#a88e66ee760aea03687e7b3ccc6ea535b">More...</a><br /></td></tr>
-<tr class="separator:a88e66ee760aea03687e7b3ccc6ea535b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa93043ac87d89ce7fb991c9195c3bf99"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">SharedLoadIteratorA</a></td></tr>
-<tr class="memdesc:aa93043ac87d89ce7fb991c9195c3bf99"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load A from shared memory.  <a href="#aa93043ac87d89ce7fb991c9195c3bf99">More...</a><br /></td></tr>
-<tr class="separator:aa93043ac87d89ce7fb991c9195c3bf99"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a70063eb7e19921efef55a6f32562773f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">SharedLoadIteratorA</a>, <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">SharedLoadIteratorA::Fragment</a> &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f">SharedLoadStreamA</a></td></tr>
-<tr class="memdesc:a70063eb7e19921efef55a6f32562773f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from shared memory.  <a href="#a70063eb7e19921efef55a6f32562773f">More...</a><br /></td></tr>
-<tr class="separator:a70063eb7e19921efef55a6f32562773f"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a42322b9b10e894fe157e527b378c59f8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">SharedLoadIteratorB</a></td></tr>
-<tr class="memdesc:a42322b9b10e894fe157e527b378c59f8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load B from shared memory.  <a href="#a42322b9b10e894fe157e527b378c59f8">More...</a><br /></td></tr>
-<tr class="separator:a42322b9b10e894fe157e527b378c59f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a54e8ad5874306a3764951a9791f02c96"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">SharedLoadIteratorB</a>, <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">SharedLoadIteratorB::Fragment</a> &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96">SharedLoadStreamB</a></td></tr>
-<tr class="memdesc:a54e8ad5874306a3764951a9791f02c96"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from shared memory.  <a href="#a54e8ad5874306a3764951a9791f02c96">More...</a><br /></td></tr>
-<tr class="separator:a54e8ad5874306a3764951a9791f02c96"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a87e34d56fa955670331749724bee9fd8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8">MultiplyAdd</a></td></tr>
-<tr class="memdesc:a87e34d56fa955670331749724bee9fd8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="#a87e34d56fa955670331749724bee9fd8">More...</a><br /></td></tr>
-<tr class="separator:a87e34d56fa955670331749724bee9fd8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5645e18de29a84c9a9b3f3105966f0c5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">ClearAccumulators</a>&lt; typename <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">MultiplyAdd::ScalarC</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">ClearAccumulators</a></td></tr>
-<tr class="memdesc:a5645e18de29a84c9a9b3f3105966f0c5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The object to clear accumulators.  <a href="#a5645e18de29a84c9a9b3f3105966f0c5">More...</a><br /></td></tr>
-<tr class="separator:a5645e18de29a84c9a9b3f3105966f0c5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5e2ed697a9091a1ca8b19855b5a2c651"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">IgemmEpilogueTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a>, EpilogueFunctor_ &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651">Epilogue</a></td></tr>
-<tr class="memdesc:a5e2ed697a9091a1ca8b19855b5a2c651"><td class="mdescLeft">&#160;</td><td class="mdescRight">The epilogue.  <a href="#a5e2ed697a9091a1ca8b19855b5a2c651">More...</a><br /></td></tr>
-<tr class="separator:a5e2ed697a9091a1ca8b19855b5a2c651"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a52c2c7b45156e53d9bc66ed185fc3d71"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a>&lt; OutputTile_, ScalarD_, ThreadGemmShape_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a></td></tr>
+<tr class="memdesc:a52c2c7b45156e53d9bc66ed185fc3d71"><td class="mdescLeft">&#160;</td><td class="mdescRight">The IGEMM config.  <a href="#a52c2c7b45156e53d9bc66ed185fc3d71">More...</a><br /></td></tr>
+<tr class="separator:a52c2c7b45156e53d9bc66ed185fc3d71"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aee1dfb15e1b63f838a712af93777e5d3"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a>&lt; kLayoutA_, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3">GemmTileTraitsHelperA</a></td></tr>
+<tr class="memdesc:aee1dfb15e1b63f838a712af93777e5d3"><td class="mdescLeft">&#160;</td><td class="mdescRight">The GEMM config for A.  <a href="#aee1dfb15e1b63f838a712af93777e5d3">More...</a><br /></td></tr>
+<tr class="separator:aee1dfb15e1b63f838a712af93777e5d3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f175193ac6bcdccba012f5d80324685"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a>&lt; kLayoutB_, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685">GemmTileTraitsHelperB</a></td></tr>
+<tr class="memdesc:a7f175193ac6bcdccba012f5d80324685"><td class="mdescLeft">&#160;</td><td class="mdescRight">The GEMM config for B.  <a href="#a7f175193ac6bcdccba012f5d80324685">More...</a><br /></td></tr>
+<tr class="separator:a7f175193ac6bcdccba012f5d80324685"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a48f6b161acb181aee1e5bdb3bc909b04"><td class="memItemLeft" align="right" valign="top">typedef GemmTileTraitsHelperA::GlobalLoadIterator&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a></td></tr>
+<tr class="memdesc:a48f6b161acb181aee1e5bdb3bc909b04"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load A from global memory.  <a href="#a48f6b161acb181aee1e5bdb3bc909b04">More...</a><br /></td></tr>
+<tr class="separator:a48f6b161acb181aee1e5bdb3bc909b04"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af394532cb8e7b088f950122b42eaa2fb"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt; GemmTileTraitsHelperA::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">GlobalTransformerA</a></td></tr>
+<tr class="memdesc:af394532cb8e7b088f950122b42eaa2fb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default transformer for A.  <a href="#af394532cb8e7b088f950122b42eaa2fb">More...</a><br /></td></tr>
+<tr class="separator:af394532cb8e7b088f950122b42eaa2fb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3d2b39cacb975afbfeae9e368f0656ae"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">SharedStoreIteratorA</a></td></tr>
+<tr class="memdesc:a3d2b39cacb975afbfeae9e368f0656ae"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store A to shared memory.  <a href="#a3d2b39cacb975afbfeae9e368f0656ae">More...</a><br /></td></tr>
+<tr class="separator:a3d2b39cacb975afbfeae9e368f0656ae"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2aceaceb30287e909c254f01f1716845"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">GlobalTransformerA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845">GlobalLoadStreamA</a></td></tr>
+<tr class="memdesc:a2aceaceb30287e909c254f01f1716845"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from global memory to shared memory.  <a href="#a2aceaceb30287e909c254f01f1716845">More...</a><br /></td></tr>
+<tr class="separator:a2aceaceb30287e909c254f01f1716845"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad1a34cb78f88fe2fcbf13239e89f6137"><td class="memItemLeft" align="right" valign="top">typedef GemmTileTraitsHelperB::GlobalLoadIterator&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a></td></tr>
+<tr class="memdesc:ad1a34cb78f88fe2fcbf13239e89f6137"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load B from global memory.  <a href="#ad1a34cb78f88fe2fcbf13239e89f6137">More...</a><br /></td></tr>
+<tr class="separator:ad1a34cb78f88fe2fcbf13239e89f6137"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7b25e0203997662a537b21674c3d0cd2"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt; GemmTileTraitsHelperB::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a> &gt;::Transformer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">GlobalTransformerB</a></td></tr>
+<tr class="separator:a7b25e0203997662a537b21674c3d0cd2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2953ae145fdb2eadf871aee8219e92d1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">SharedStoreIteratorB</a></td></tr>
+<tr class="memdesc:a2953ae145fdb2eadf871aee8219e92d1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store B to shared memory.  <a href="#a2953ae145fdb2eadf871aee8219e92d1">More...</a><br /></td></tr>
+<tr class="separator:a2953ae145fdb2eadf871aee8219e92d1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae59454c1b3862522c8ea293bacb194a8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">GlobalTransformerB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8">GlobalLoadStreamB</a></td></tr>
+<tr class="memdesc:ae59454c1b3862522c8ea293bacb194a8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from global memory to shared memory.  <a href="#ae59454c1b3862522c8ea293bacb194a8">More...</a><br /></td></tr>
+<tr class="separator:ae59454c1b3862522c8ea293bacb194a8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a03d7378c46b517438fce25e0f1e4d98c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">SharedLoadIteratorA</a></td></tr>
+<tr class="memdesc:a03d7378c46b517438fce25e0f1e4d98c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load A from shared memory.  <a href="#a03d7378c46b517438fce25e0f1e4d98c">More...</a><br /></td></tr>
+<tr class="separator:a03d7378c46b517438fce25e0f1e4d98c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7e035ceab26dc904726ddbf14371f476"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">SharedLoadIteratorA</a>, <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">SharedLoadIteratorA::Fragment</a> &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476">SharedLoadStreamA</a></td></tr>
+<tr class="memdesc:a7e035ceab26dc904726ddbf14371f476"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from shared memory.  <a href="#a7e035ceab26dc904726ddbf14371f476">More...</a><br /></td></tr>
+<tr class="separator:a7e035ceab26dc904726ddbf14371f476"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a94111367763890341e88450f43b59312"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">SharedLoadIteratorB</a></td></tr>
+<tr class="memdesc:a94111367763890341e88450f43b59312"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load B from shared memory.  <a href="#a94111367763890341e88450f43b59312">More...</a><br /></td></tr>
+<tr class="separator:a94111367763890341e88450f43b59312"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff287e2ca10a437a82736baab2d7c28d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">SharedLoadIteratorB</a>, <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt; typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">SharedLoadIteratorB::Fragment</a> &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d">SharedLoadStreamB</a></td></tr>
+<tr class="memdesc:aff287e2ca10a437a82736baab2d7c28d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from shared memory.  <a href="#aff287e2ca10a437a82736baab2d7c28d">More...</a><br /></td></tr>
+<tr class="separator:aff287e2ca10a437a82736baab2d7c28d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae84c7fd1567580dc3da15a520c47ff6e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e">MultiplyAdd</a></td></tr>
+<tr class="memdesc:ae84c7fd1567580dc3da15a520c47ff6e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="#ae84c7fd1567580dc3da15a520c47ff6e">More...</a><br /></td></tr>
+<tr class="separator:ae84c7fd1567580dc3da15a520c47ff6e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af6c45c949a8dee887924bba4de92e760"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">ClearAccumulators</a>&lt; typename <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">MultiplyAdd::ScalarC</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">ClearAccumulators</a></td></tr>
+<tr class="memdesc:af6c45c949a8dee887924bba4de92e760"><td class="mdescLeft">&#160;</td><td class="mdescRight">The object to clear accumulators.  <a href="#af6c45c949a8dee887924bba4de92e760">More...</a><br /></td></tr>
+<tr class="separator:af6c45c949a8dee887924bba4de92e760"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a36c8b17c98723934d9d75228dd9c2915"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">IgemmEpilogueTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a>, EpilogueFunctor_ &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915">Epilogue</a></td></tr>
+<tr class="memdesc:a36c8b17c98723934d9d75228dd9c2915"><td class="mdescLeft">&#160;</td><td class="mdescRight">The epilogue.  <a href="#a36c8b17c98723934d9d75228dd9c2915">More...</a><br /></td></tr>
+<tr class="separator:a36c8b17c98723934d9d75228dd9c2915"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a5645e18de29a84c9a9b3f3105966f0c5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5645e18de29a84c9a9b3f3105966f0c5">&#9670;&nbsp;</a></span>ClearAccumulators</h2>
+<a id="af6c45c949a8dee887924bba4de92e760"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af6c45c949a8dee887924bba4de92e760">&#9670;&nbsp;</a></span>ClearAccumulators</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">ClearAccumulators</a>&lt;typename <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">MultiplyAdd::ScalarC</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5645e18de29a84c9a9b3f3105966f0c5">ClearAccumulators</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">ClearAccumulators</a>&lt;typename <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">MultiplyAdd::ScalarC</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af6c45c949a8dee887924bba4de92e760">ClearAccumulators</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a5e2ed697a9091a1ca8b19855b5a2c651"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5e2ed697a9091a1ca8b19855b5a2c651">&#9670;&nbsp;</a></span>Epilogue</h2>
+<a id="a36c8b17c98723934d9d75228dd9c2915"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a36c8b17c98723934d9d75228dd9c2915">&#9670;&nbsp;</a></span>Epilogue</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">IgemmEpilogueTraits</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a>, EpilogueFunctor_&gt; &gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a5e2ed697a9091a1ca8b19855b5a2c651">Epilogue</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogue.html">IgemmEpilogue</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmEpilogueTraits.html">IgemmEpilogueTraits</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a>, EpilogueFunctor_&gt; &gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a36c8b17c98723934d9d75228dd9c2915">Epilogue</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="af10aebe7ca4e24cce435ac4cd60e7bac"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af10aebe7ca4e24cce435ac4cd60e7bac">&#9670;&nbsp;</a></span>GemmConfig</h2>
+<a id="a52c2c7b45156e53d9bc66ed185fc3d71"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a52c2c7b45156e53d9bc66ed185fc3d71">&#9670;&nbsp;</a></span>GemmConfig</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a>&lt;OutputTile_, ScalarD_, AccumulatorsPerThread_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmConfig.html">IgemmConfig</a>&lt;OutputTile_, ScalarD_, ThreadGemmShape_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ab9e10d54c81a359db0eba58a11b9a0cf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab9e10d54c81a359db0eba58a11b9a0cf">&#9670;&nbsp;</a></span>GemmTileTraitsHelperA</h2>
+<a id="aee1dfb15e1b63f838a712af93777e5d3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aee1dfb15e1b63f838a712af93777e5d3">&#9670;&nbsp;</a></span>GemmTileTraitsHelperA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a>&lt;kLayoutA_, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ab9e10d54c81a359db0eba58a11b9a0cf">GemmTileTraitsHelperA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperA.html">IgemmTileTraitsHelperA</a>&lt;kLayoutA_, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a>, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aee1dfb15e1b63f838a712af93777e5d3">GemmTileTraitsHelperA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a095505bfcea6791accd06bf4d37b9df8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a095505bfcea6791accd06bf4d37b9df8">&#9670;&nbsp;</a></span>GemmTileTraitsHelperB</h2>
+<a id="a7f175193ac6bcdccba012f5d80324685"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7f175193ac6bcdccba012f5d80324685">&#9670;&nbsp;</a></span>GemmTileTraitsHelperB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a>&lt;kLayoutB_, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af10aebe7ca4e24cce435ac4cd60e7bac">GemmConfig</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a095505bfcea6791accd06bf4d37b9df8">GemmTileTraitsHelperB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTileTraitsHelperB.html">IgemmTileTraitsHelperB</a>&lt;kLayoutB_, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a52c2c7b45156e53d9bc66ed185fc3d71">GemmConfig</a>, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7f175193ac6bcdccba012f5d80324685">GemmTileTraitsHelperB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ac7ee33e683e48511a1a220df6c9d4758"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac7ee33e683e48511a1a220df6c9d4758">&#9670;&nbsp;</a></span>GlobalLoadIteratorA</h2>
+<a id="a48f6b161acb181aee1e5bdb3bc909b04"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a48f6b161acb181aee1e5bdb3bc909b04">&#9670;&nbsp;</a></span>GlobalLoadIteratorA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;typename GemmTileTraitsHelperA::GlobalTileTraits, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">GlobalLoadIteratorA</a></td>
+          <td class="memname">typedef GemmTileTraitsHelperA::GlobalLoadIterator <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a3a6d816852cca926afa08103f754477b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a3a6d816852cca926afa08103f754477b">&#9670;&nbsp;</a></span>GlobalLoadIteratorB</h2>
+<a id="ad1a34cb78f88fe2fcbf13239e89f6137"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad1a34cb78f88fe2fcbf13239e89f6137">&#9670;&nbsp;</a></span>GlobalLoadIteratorB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt;typename GemmTileTraitsHelperB::GlobalTileTraits, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">GlobalLoadIteratorB</a></td>
+          <td class="memname">typedef GemmTileTraitsHelperB::GlobalLoadIterator <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a7fb1354154f303642da72e6fd157d846"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7fb1354154f303642da72e6fd157d846">&#9670;&nbsp;</a></span>GlobalLoadStreamA</h2>
+<a id="a2aceaceb30287e909c254f01f1716845"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2aceaceb30287e909c254f01f1716845">&#9670;&nbsp;</a></span>GlobalLoadStreamA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">GlobalTransformerA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7fb1354154f303642da72e6fd157d846">GlobalLoadStreamA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">GlobalTransformerA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2aceaceb30287e909c254f01f1716845">GlobalLoadStreamA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a88e66ee760aea03687e7b3ccc6ea535b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a88e66ee760aea03687e7b3ccc6ea535b">&#9670;&nbsp;</a></span>GlobalLoadStreamB</h2>
+<a id="ae59454c1b3862522c8ea293bacb194a8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae59454c1b3862522c8ea293bacb194a8">&#9670;&nbsp;</a></span>GlobalLoadStreamB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">GlobalTransformerB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a88e66ee760aea03687e7b3ccc6ea535b">GlobalLoadStreamB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">GlobalTransformerB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae59454c1b3862522c8ea293bacb194a8">GlobalLoadStreamB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a23bb732b7237bcabe3667408f288844d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a23bb732b7237bcabe3667408f288844d">&#9670;&nbsp;</a></span>GlobalTransformerA</h2>
+<a id="af394532cb8e7b088f950122b42eaa2fb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af394532cb8e7b088f950122b42eaa2fb">&#9670;&nbsp;</a></span>GlobalTransformerA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt;GemmTileTraitsHelperA::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ac7ee33e683e48511a1a220df6c9d4758">GlobalLoadIteratorA</a>&gt;::Transformer <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a23bb732b7237bcabe3667408f288844d">GlobalTransformerA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerA.html">IgemmTransformerA</a>&lt;GemmTileTraitsHelperA::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a48f6b161acb181aee1e5bdb3bc909b04">GlobalLoadIteratorA</a>&gt;::Transformer <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#af394532cb8e7b088f950122b42eaa2fb">GlobalTransformerA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a600bcc571ea5e04a98663c134d4664b9"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a600bcc571ea5e04a98663c134d4664b9">&#9670;&nbsp;</a></span>GlobalTransformerB</h2>
+<a id="a7b25e0203997662a537b21674c3d0cd2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7b25e0203997662a537b21674c3d0cd2">&#9670;&nbsp;</a></span>GlobalTransformerB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt;GemmTileTraitsHelperB::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3a6d816852cca926afa08103f754477b">GlobalLoadIteratorB</a>&gt;::Transformer <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a600bcc571ea5e04a98663c134d4664b9">GlobalTransformerB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1IgemmTransformerB.html">IgemmTransformerB</a>&lt;GemmTileTraitsHelperB::kLayout, <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ad1a34cb78f88fe2fcbf13239e89f6137">GlobalLoadIteratorB</a>&gt;::Transformer <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7b25e0203997662a537b21674c3d0cd2">GlobalTransformerB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a87e34d56fa955670331749724bee9fd8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a87e34d56fa955670331749724bee9fd8">&#9670;&nbsp;</a></span>MultiplyAdd</h2>
+<a id="ae84c7fd1567580dc3da15a520c47ff6e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae84c7fd1567580dc3da15a520c47ff6e">&#9670;&nbsp;</a></span>MultiplyAdd</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a87e34d56fa955670331749724bee9fd8">MultiplyAdd</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a> <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae84c7fd1567580dc3da15a520c47ff6e">MultiplyAdd</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aa93043ac87d89ce7fb991c9195c3bf99"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa93043ac87d89ce7fb991c9195c3bf99">&#9670;&nbsp;</a></span>SharedLoadIteratorA</h2>
+<a id="a03d7378c46b517438fce25e0f1e4d98c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a03d7378c46b517438fce25e0f1e4d98c">&#9670;&nbsp;</a></span>SharedLoadIteratorA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">SharedLoadIteratorA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;typename GemmTileTraitsHelperA::SharedLoadTileTraits, typename GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">SharedLoadIteratorA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a42322b9b10e894fe157e527b378c59f8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a42322b9b10e894fe157e527b378c59f8">&#9670;&nbsp;</a></span>SharedLoadIteratorB</h2>
+<a id="a94111367763890341e88450f43b59312"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a94111367763890341e88450f43b59312">&#9670;&nbsp;</a></span>SharedLoadIteratorB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">SharedLoadIteratorB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt;typename GemmTileTraitsHelperB::SharedLoadTileTraits, typename GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">SharedLoadIteratorB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a70063eb7e19921efef55a6f32562773f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a70063eb7e19921efef55a6f32562773f">&#9670;&nbsp;</a></span>SharedLoadStreamA</h2>
+<a id="a7e035ceab26dc904726ddbf14371f476"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7e035ceab26dc904726ddbf14371f476">&#9670;&nbsp;</a></span>SharedLoadStreamA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aa93043ac87d89ce7fb991c9195c3bf99">SharedLoadIteratorA</a>, <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">SharedLoadIteratorA::Fragment</a>&gt; &gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a70063eb7e19921efef55a6f32562773f">SharedLoadStreamA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a03d7378c46b517438fce25e0f1e4d98c">SharedLoadIteratorA</a>, <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">SharedLoadIteratorA::Fragment</a>&gt; &gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a7e035ceab26dc904726ddbf14371f476">SharedLoadStreamA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a54e8ad5874306a3764951a9791f02c96"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a54e8ad5874306a3764951a9791f02c96">&#9670;&nbsp;</a></span>SharedLoadStreamB</h2>
+<a id="aff287e2ca10a437a82736baab2d7c28d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aff287e2ca10a437a82736baab2d7c28d">&#9670;&nbsp;</a></span>SharedLoadStreamB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a42322b9b10e894fe157e527b378c59f8">SharedLoadIteratorB</a>, <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">SharedLoadIteratorB::Fragment</a>&gt; &gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a54e8ad5874306a3764951a9791f02c96">SharedLoadStreamB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">SharedLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a94111367763890341e88450f43b59312">SharedLoadIteratorB</a>, <a class="el" href="structcutlass_1_1Copy.html">Copy</a>&lt;typename <a class="el" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">SharedLoadIteratorB::Fragment</a>&gt; &gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#aff287e2ca10a437a82736baab2d7c28d">SharedLoadStreamB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ae187303a8da63f36960687a4730f4c46"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ae187303a8da63f36960687a4730f4c46">&#9670;&nbsp;</a></span>SharedStoreIteratorA</h2>
+<a id="a3d2b39cacb975afbfeae9e368f0656ae"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3d2b39cacb975afbfeae9e368f0656ae">&#9670;&nbsp;</a></span>SharedStoreIteratorA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#ae187303a8da63f36960687a4730f4c46">SharedStoreIteratorA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;typename GemmTileTraitsHelperA::SharedStoreTileTraits, typename GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a3d2b39cacb975afbfeae9e368f0656ae">SharedStoreIteratorA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a4d6658f3a3b53760b10a3da9c807b81f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4d6658f3a3b53760b10a3da9c807b81f">&#9670;&nbsp;</a></span>SharedStoreIteratorB</h2>
+<a id="a2953ae145fdb2eadf871aee8219e92d1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2953ae145fdb2eadf871aee8219e92d1">&#9670;&nbsp;</a></span>SharedStoreIteratorB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename AccumulatorsPerThread_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
+template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename OutputTile_ , typename ScalarD_ , typename EpilogueFunctor_ , typename ThreadGemmShape_  = Shape&lt;32, 8, 8&gt;, typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, AccumulatorsPerThread_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a4d6658f3a3b53760b10a3da9c807b81f">SharedStoreIteratorB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt;typename GemmTileTraitsHelperB::SharedStoreTileTraits, typename GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html">cutlass::gemm::IgemmTraitsHelper</a>&lt; kLayoutA_, kLayoutB_, OutputTile_, ScalarD_, EpilogueFunctor_, ThreadGemmShape_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1IgemmTraitsHelper.html#a2953ae145fdb2eadf871aee8219e92d1">SharedStoreIteratorB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -433,7 +433,7 @@ template&lt;MatrixLayout::Kind kLayoutA_, MatrixLayout::Kind kLayoutB_, typename
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA.html
index 73e523bb0..de1890e1e 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
index b31cf3bbc..53ef81bb2 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
index 7135e2be7..732df3eaf 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Iterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
index e8d627ef0..67afb00fd 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
index 3c826b8ad..0ec2e2a76 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerA_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Iterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB.html
index fa606b244..48ff3c738 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
index ed73de85f..b15d04aee 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
index 61c70cf98..0520804b1 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kColumnMajor_00_01Iterator___01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Iterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
index 709672d2f..dd9f6f552 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
index 836dae8a0..a19398182 100644
--- a/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1IgemmTransformerB_3_01MatrixLayout_1_1kRowMajor_00_01Iterator___01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Iterator_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1Launch-members.html b/docs/structcutlass_1_1gemm_1_1Launch-members.html
new file mode 100644
index 000000000..5bb5a169a
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1Launch-members.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html">Launch</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1Launch.html">cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html#a8552a524b9419f60bf8ef3c6b8528d27">Launch</a>(typename Gemm::Params params, dim3 grid, dim3 block, cudaStream_t stream=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html">cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1Launch.html b/docs/structcutlass_1_1gemm_1_1Launch.html
new file mode 100644
index 000000000..84b28c21f
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1Launch.html
@@ -0,0 +1,155 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html">Launch</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1Launch-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::Launch&lt; Gemm, WithLaunchBounds &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Partial specialization for launching the GEMM kernel with or without launch bounds.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="gemm_8h_source.html">gemm.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a8552a524b9419f60bf8ef3c6b8528d27"><td class="memItemLeft" align="right" valign="top">&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html#a8552a524b9419f60bf8ef3c6b8528d27">Launch</a> (typename <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Gemm::Params</a> params, dim3 grid, dim3 block, cudaStream_t stream=0)</td></tr>
+<tr class="separator:a8552a524b9419f60bf8ef3c6b8528d27"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a8552a524b9419f60bf8ef3c6b8528d27"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8552a524b9419f60bf8ef3c6b8528d27">&#9670;&nbsp;</a></span>Launch()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Gemm, bool WithLaunchBounds&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html">cutlass::gemm::Launch</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a>, WithLaunchBounds &gt;::<a class="el" href="structcutlass_1_1gemm_1_1Launch.html">Launch</a> </td>
+          <td>(</td>
+          <td class="paramtype">typename <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Gemm::Params</a>&#160;</td>
+          <td class="paramname"><em>params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">dim3&#160;</td>
+          <td class="paramname"><em>grid</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">dim3&#160;</td>
+          <td class="paramname"><em>block</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">cudaStream_t&#160;</td>
+          <td class="paramname"><em>stream</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm_8h_source.html">gemm.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4-members.html b/docs/structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4-members.html
new file mode 100644
index 000000000..edffd4304
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4-members.html
@@ -0,0 +1,91 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html">Launch&lt; Gemm, false &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::Launch&lt; Gemm, false &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html">cutlass::gemm::Launch&lt; Gemm, false &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#ab7a89806834a5fa8022daae4180e6180">Launch</a>(typename Gemm::Params params, dim3 grid, dim3 block, cudaStream_t stream=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html">cutlass::gemm::Launch&lt; Gemm, false &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html b/docs/structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html
new file mode 100644
index 000000000..3bcadde93
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html
@@ -0,0 +1,155 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::Launch&lt; Gemm, false &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html">Launch&lt; Gemm, false &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::Launch&lt; Gemm, false &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Partial specialization for launching the GEMM kernel with or without launch bounds.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="gemm_8h_source.html">gemm.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:ab7a89806834a5fa8022daae4180e6180"><td class="memItemLeft" align="right" valign="top">&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1Launch_3_01Gemm_00_01false_01_4.html#ab7a89806834a5fa8022daae4180e6180">Launch</a> (typename <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Gemm::Params</a> params, dim3 grid, dim3 block, cudaStream_t stream=0)</td></tr>
+<tr class="separator:ab7a89806834a5fa8022daae4180e6180"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ab7a89806834a5fa8022daae4180e6180"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ab7a89806834a5fa8022daae4180e6180">&#9670;&nbsp;</a></span>Launch()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Gemm &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1Launch.html">cutlass::gemm::Launch</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">Gemm</a>, false &gt;::<a class="el" href="structcutlass_1_1gemm_1_1Launch.html">Launch</a> </td>
+          <td>(</td>
+          <td class="paramtype">typename <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html#a054d5e87f1985ae7e53fc07f4c16d916">Gemm::Params</a>&#160;</td>
+          <td class="paramname"><em>params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">dim3&#160;</td>
+          <td class="paramname"><em>grid</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">dim3&#160;</td>
+          <td class="paramname"><em>block</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">cudaStream_t&#160;</td>
+          <td class="paramname"><em>stream</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm_8h_source.html">gemm.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1LinearScaling-members.html b/docs/structcutlass_1_1gemm_1_1LinearScaling-members.html
index 165525471..bee4cd734 100644
--- a/docs/structcutlass_1_1gemm_1_1LinearScaling-members.html
+++ b/docs/structcutlass_1_1gemm_1_1LinearScaling-members.html
@@ -79,17 +79,21 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">alpha</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">beta</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a2e0d140aed388d2457dfb24d28fcd08a">evaluate</a>(Fragment_ const &amp;accum, Fragment_ &amp;output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a47a53e5b67b2207fb3ba38a8b9cef448">evaluate</a>(Fragment_ const &amp;accum, Fragment_ const &amp;old, Fragment_ &amp;output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">evaluate</a>(FragmentA_ const &amp;accum, FragmentB_ &amp;output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02">evaluate</a>(ScalarAccum const *accum, ScalarOutput *output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1">evaluate</a>(FragmentA_ const &amp;accum, FragmentB_ const &amp;old, FragmentB_ &amp;output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947">evaluate</a>(ScalarAccum const *accum, ScalarOutput const *old, ScalarOutput *output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a34df6970f033b3090ad8f4d40063b1b2">LinearScaling</a>(Params const &amp;params)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe">LinearScaling</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">LinearScaling</a>(Params const &amp;_params)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54">source_required</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1LinearScaling.html b/docs/structcutlass_1_1gemm_1_1LinearScaling.html
index d79eb6f66..eacedb06f 100644
--- a/docs/structcutlass_1_1gemm_1_1LinearScaling.html
+++ b/docs/structcutlass_1_1gemm_1_1LinearScaling.html
@@ -87,6 +87,15 @@ $(function() {
 </p>
 
 <p><code>#include &lt;<a class="el" href="linear__scaling_8h_source.html">linear_scaling.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1LinearScaling.png" usemap="#cutlass::gemm::LinearScaling_3C_20Scalar_5F_2C_20FragmentMultiplyAdd_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::LinearScaling_3C_20Scalar_5F_2C_20FragmentMultiplyAdd_5F_20_3E_map" name="cutlass::gemm::LinearScaling_3C_20Scalar_5F_2C_20FragmentMultiplyAdd_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html" alt="cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;" shape="rect" coords="0,56,433,80"/>
+</map>
+ </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
@@ -98,30 +107,42 @@ Classes</h2></td></tr>
 Public Types</h2></td></tr>
 <tr class="memitem:ae6b053ca059932f7c0d3c99243854183"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a></td></tr>
 <tr class="separator:ae6b053ca059932f7c0d3c99243854183"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae80882255b71c1ec94c6caeded2d0309"><td class="memItemLeft" align="right" valign="top">typedef FragmentMultiplyAdd_::ScalarAccum&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a></td></tr>
+<tr class="separator:ae80882255b71c1ec94c6caeded2d0309"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:aa697d4eaced1ef08247aeb1fcc0f0ea8"><td class="memItemLeft" align="right" valign="top">typedef FragmentMultiplyAdd_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a></td></tr>
 <tr class="separator:aa697d4eaced1ef08247aeb1fcc0f0ea8"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a34df6970f033b3090ad8f4d40063b1b2"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a34df6970f033b3090ad8f4d40063b1b2">LinearScaling</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> const &amp;params)</td></tr>
-<tr class="memdesc:a34df6970f033b3090ad8f4d40063b1b2"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a34df6970f033b3090ad8f4d40063b1b2">More...</a><br /></td></tr>
-<tr class="separator:a34df6970f033b3090ad8f4d40063b1b2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2e0d140aed388d2457dfb24d28fcd08a"><td class="memTemplParams" colspan="2">template&lt;typename Fragment_ &gt; </td></tr>
-<tr class="memitem:a2e0d140aed388d2457dfb24d28fcd08a"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a2e0d140aed388d2457dfb24d28fcd08a">evaluate</a> (Fragment_ const &amp;accum, Fragment_ &amp;output)</td></tr>
-<tr class="memdesc:a2e0d140aed388d2457dfb24d28fcd08a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor.  <a href="#a2e0d140aed388d2457dfb24d28fcd08a">More...</a><br /></td></tr>
-<tr class="separator:a2e0d140aed388d2457dfb24d28fcd08a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a47a53e5b67b2207fb3ba38a8b9cef448"><td class="memTemplParams" colspan="2">template&lt;typename Fragment_ &gt; </td></tr>
-<tr class="memitem:a47a53e5b67b2207fb3ba38a8b9cef448"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a47a53e5b67b2207fb3ba38a8b9cef448">evaluate</a> (Fragment_ const &amp;accum, Fragment_ const &amp;old, Fragment_ &amp;output)</td></tr>
-<tr class="memdesc:a47a53e5b67b2207fb3ba38a8b9cef448"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor.  <a href="#a47a53e5b67b2207fb3ba38a8b9cef448">More...</a><br /></td></tr>
-<tr class="separator:a47a53e5b67b2207fb3ba38a8b9cef448"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae5ed200fe8c45b6478d3893e67da0ebe"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe">LinearScaling</a> ()</td></tr>
+<tr class="memdesc:ae5ed200fe8c45b6478d3893e67da0ebe"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ae5ed200fe8c45b6478d3893e67da0ebe">More...</a><br /></td></tr>
+<tr class="separator:ae5ed200fe8c45b6478d3893e67da0ebe"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a46965529bd1384465c6f2b8c2a244889"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">LinearScaling</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> const &amp;_params)</td></tr>
+<tr class="memdesc:a46965529bd1384465c6f2b8c2a244889"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a46965529bd1384465c6f2b8c2a244889">More...</a><br /></td></tr>
+<tr class="separator:a46965529bd1384465c6f2b8c2a244889"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aae313f3e691334f80d1316ac4cd30d54"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54">source_required</a> () const</td></tr>
+<tr class="separator:aae313f3e691334f80d1316ac4cd30d54"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a303c8dd75a31c01aa4e1de5097aca8eb"><td class="memTemplParams" colspan="2">template&lt;typename FragmentA_ , typename FragmentB_ &gt; </td></tr>
+<tr class="memitem:a303c8dd75a31c01aa4e1de5097aca8eb"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">evaluate</a> (FragmentA_ const &amp;accum, FragmentB_ &amp;output)</td></tr>
+<tr class="memdesc:a303c8dd75a31c01aa4e1de5097aca8eb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor.  <a href="#a303c8dd75a31c01aa4e1de5097aca8eb">More...</a><br /></td></tr>
+<tr class="separator:a303c8dd75a31c01aa4e1de5097aca8eb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0159214b89d7648f1e8f3b5dd228df02"><td class="memTemplParams" colspan="2">template&lt;typename ScalarAccum , typename ScalarOutput , int size&gt; </td></tr>
+<tr class="memitem:a0159214b89d7648f1e8f3b5dd228df02"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02">evaluate</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> const *accum, ScalarOutput *output)</td></tr>
+<tr class="memdesc:a0159214b89d7648f1e8f3b5dd228df02"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor, without using fragment in the API.  <a href="#a0159214b89d7648f1e8f3b5dd228df02">More...</a><br /></td></tr>
+<tr class="separator:a0159214b89d7648f1e8f3b5dd228df02"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a429d78c47d55929903ee02733ad881c1"><td class="memTemplParams" colspan="2">template&lt;typename FragmentA_ , typename FragmentB_ &gt; </td></tr>
+<tr class="memitem:a429d78c47d55929903ee02733ad881c1"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1">evaluate</a> (FragmentA_ const &amp;accum, FragmentB_ const &amp;old, FragmentB_ &amp;output)</td></tr>
+<tr class="memdesc:a429d78c47d55929903ee02733ad881c1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor.  <a href="#a429d78c47d55929903ee02733ad881c1">More...</a><br /></td></tr>
+<tr class="separator:a429d78c47d55929903ee02733ad881c1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aad0708f7681b16e6d6b4ca8d1f59a947"><td class="memTemplParams" colspan="2">template&lt;typename ScalarAccum , typename ScalarOutput , int size&gt; </td></tr>
+<tr class="memitem:aad0708f7681b16e6d6b4ca8d1f59a947"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947">evaluate</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> const *accum, ScalarOutput const *old, ScalarOutput *output)</td></tr>
+<tr class="memdesc:aad0708f7681b16e6d6b4ca8d1f59a947"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor, without using fragment in the API.  <a href="#aad0708f7681b16e6d6b4ca8d1f59a947">More...</a><br /></td></tr>
+<tr class="separator:aad0708f7681b16e6d6b4ca8d1f59a947"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:ab9c51c8b1f06e935a353ac5b1c22cee6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ab9c51c8b1f06e935a353ac5b1c22cee6">alpha</a></td></tr>
-<tr class="memdesc:ab9c51c8b1f06e935a353ac5b1c22cee6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The alpha/beta scaling factors.  <a href="#ab9c51c8b1f06e935a353ac5b1c22cee6">More...</a><br /></td></tr>
-<tr class="separator:ab9c51c8b1f06e935a353ac5b1c22cee6"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8af4e58c4988838f2dd0a2172c47e12e"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a8af4e58c4988838f2dd0a2172c47e12e">beta</a></td></tr>
-<tr class="separator:a8af4e58c4988838f2dd0a2172c47e12e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7bbf90dc0938698a0fa22468f9df315d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a></td></tr>
+<tr class="separator:a7bbf90dc0938698a0fa22468f9df315d"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="aa697d4eaced1ef08247aeb1fcc0f0ea8"></a>
@@ -130,7 +151,7 @@ Public Attributes</h2></td></tr>
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef FragmentMultiplyAdd_ <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a></td>
@@ -146,7 +167,7 @@ template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAd
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">typedef Scalar_ <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a></td>
@@ -156,14 +177,57 @@ template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAd
 
 </div>
 </div>
-<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a34df6970f033b3090ad8f4d40063b1b2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a34df6970f033b3090ad8f4d40063b1b2">&#9670;&nbsp;</a></span>LinearScaling()</h2>
+<a id="ae80882255b71c1ec94c6caeded2d0309"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae80882255b71c1ec94c6caeded2d0309">&#9670;&nbsp;</a></span>ScalarAccum</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef FragmentMultiplyAdd_::ScalarAccum <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ae5ed200fe8c45b6478d3893e67da0ebe"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae5ed200fe8c45b6478d3893e67da0ebe">&#9670;&nbsp;</a></span>LinearScaling() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a46965529bd1384465c6f2b8c2a244889"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a46965529bd1384465c6f2b8c2a244889">&#9670;&nbsp;</a></span>LinearScaling() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
@@ -172,7 +236,7 @@ template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAd
           <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a> </td>
           <td>(</td>
           <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> const &amp;&#160;</td>
-          <td class="paramname"><em>params</em></td><td>)</td>
+          <td class="paramname"><em>_params</em></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -186,15 +250,15 @@ template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAd
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a2e0d140aed388d2457dfb24d28fcd08a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a2e0d140aed388d2457dfb24d28fcd08a">&#9670;&nbsp;</a></span>evaluate() <span class="overload">[1/2]</span></h2>
+<a id="a303c8dd75a31c01aa4e1de5097aca8eb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a303c8dd75a31c01aa4e1de5097aca8eb">&#9670;&nbsp;</a></span>evaluate() <span class="overload">[1/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
 <div class="memtemplate">
-template&lt;typename Fragment_ &gt; </div>
+template&lt;typename FragmentA_ , typename FragmentB_ &gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
@@ -202,13 +266,13 @@ template&lt;typename Fragment_ &gt; </div>
         <tr>
           <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::evaluate </td>
           <td>(</td>
-          <td class="paramtype">Fragment_ const &amp;&#160;</td>
+          <td class="paramtype">FragmentA_ const &amp;&#160;</td>
           <td class="paramname"><em>accum</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">Fragment_ &amp;&#160;</td>
+          <td class="paramtype">FragmentB_ &amp;&#160;</td>
           <td class="paramname"><em>output</em>&#160;</td>
         </tr>
         <tr>
@@ -226,15 +290,15 @@ template&lt;typename Fragment_ &gt; </div>
 
 </div>
 </div>
-<a id="a47a53e5b67b2207fb3ba38a8b9cef448"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a47a53e5b67b2207fb3ba38a8b9cef448">&#9670;&nbsp;</a></span>evaluate() <span class="overload">[2/2]</span></h2>
+<a id="a0159214b89d7648f1e8f3b5dd228df02"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0159214b89d7648f1e8f3b5dd228df02">&#9670;&nbsp;</a></span>evaluate() <span class="overload">[2/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
 <div class="memtemplate">
-template&lt;typename Fragment_ &gt; </div>
+template&lt;typename ScalarAccum , typename ScalarOutput , int size&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
@@ -242,19 +306,59 @@ template&lt;typename Fragment_ &gt; </div>
         <tr>
           <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::evaluate </td>
           <td>(</td>
-          <td class="paramtype">Fragment_ const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> const *&#160;</td>
           <td class="paramname"><em>accum</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">Fragment_ const &amp;&#160;</td>
+          <td class="paramtype">ScalarOutput *&#160;</td>
+          <td class="paramname"><em>output</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a429d78c47d55929903ee02733ad881c1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a429d78c47d55929903ee02733ad881c1">&#9670;&nbsp;</a></span>evaluate() <span class="overload">[3/4]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename FragmentA_ , typename FragmentB_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::evaluate </td>
+          <td>(</td>
+          <td class="paramtype">FragmentA_ const &amp;&#160;</td>
+          <td class="paramname"><em>accum</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">FragmentB_ const &amp;&#160;</td>
           <td class="paramname"><em>old</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype">Fragment_ &amp;&#160;</td>
+          <td class="paramtype">FragmentB_ &amp;&#160;</td>
           <td class="paramname"><em>output</em>&#160;</td>
         </tr>
         <tr>
@@ -272,33 +376,91 @@ template&lt;typename Fragment_ &gt; </div>
 
 </div>
 </div>
-<h2 class="groupheader">Member Data Documentation</h2>
-<a id="ab9c51c8b1f06e935a353ac5b1c22cee6"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab9c51c8b1f06e935a353ac5b1c22cee6">&#9670;&nbsp;</a></span>alpha</h2>
+<a id="aad0708f7681b16e6d6b4ca8d1f59a947"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aad0708f7681b16e6d6b4ca8d1f59a947">&#9670;&nbsp;</a></span>evaluate() <span class="overload">[4/4]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<div class="memtemplate">
+template&lt;typename ScalarAccum , typename ScalarOutput , int size&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::alpha</td>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::evaluate </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> const *&#160;</td>
+          <td class="paramname"><em>accum</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">ScalarOutput const *&#160;</td>
+          <td class="paramname"><em>old</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">ScalarOutput *&#160;</td>
+          <td class="paramname"><em>output</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
         </tr>
       </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a8af4e58c4988838f2dd0a2172c47e12e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8af4e58c4988838f2dd0a2172c47e12e">&#9670;&nbsp;</a></span>beta</h2>
+<a id="aae313f3e691334f80d1316ac4cd30d54"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aae313f3e691334f80d1316ac4cd30d54">&#9670;&nbsp;</a></span>source_required()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::beta</td>
+          <td class="memname">CUTLASS_DEVICE bool <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::source_required </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Method to determine whether the source accumulator matrix C is ever needed. This method may always safely return true, though better performance is possible if the source accumulator matrix is never loaded unnecessarily. </p>
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a7bbf90dc0938698a0fa22468f9df315d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7bbf90dc0938698a0fa22468f9df315d">&#9670;&nbsp;</a></span>params</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::params</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -311,7 +473,7 @@ template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAd
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1LinearScaling.png b/docs/structcutlass_1_1gemm_1_1LinearScaling.png
new file mode 100644
index 0000000000000000000000000000000000000000..4fa775f4cdb4a03c4ed6a1dbae00cc2a7a07349e
GIT binary patch
literal 1511
zcmb`HYc$k(7{~u(%57_<b{P@HP)6>CB5bXp5tGI+SmiQJBBFzFnbhRC9JeXMxa2Zz
zh8owV4I4(I%s7OJ8tXC$QNpO)jm!S+zUu7Tea`tk&-Xd!`#jH^&-taeU>x?!ACw0G
zU@!Wt9Tor}Y*4$%Lc#pNuW=t(U@lHL)b{o^D8DRyDtj4u4^;m=E|=@Uj&=uI*$6Dg
z6#z{;A?(1J0Kje%+U_(i8ZuWjL!CIhC(#zejM;V=F?Z%p(aNTu>DjB_AO&*&A{4w}
zW@8VRX6r!Y4g*HJ<Bci#`_dtu3BG%Lb#@T|(=jQ6#hn$;5i>PC$9h{J`O%aE7SIwA
zEwKO;W|1nID3J_@kKw)m)*AtQAjxCiOqqecM2oe4Kvq)6CQVx+my_EUm0{#}qtKPj
z26A-J_OM~WLgc)8?c1mfp8b{pb@lGDWp`2qkc4$dzRy8VIVSd8R1+wM;P(&)*!osO
zekXOWgvZ*n=UH6xvORq}e?b^k&o1>az(Z`LM*L^<qpa|zGFTMSH}`<KCVhfV^huTL
zC||hD*61rGQCr@oKUeGjF|ctvucxl<rv7@>Kx6VlhbMPAndLYraWbH@$+<}Ovw*-K
zv}AeAP{rY)JU4zFtbmpGL!k9}mnubqCqqylH^#9y4J8ZQwS<qw=TU~^>t!o3CvKe0
zCXQSA&i)jTtD>h<VQy*=IW+sAje`5#I<}ACfSpjUXwqQ6Y51DX7Nxw({KisO?fht<
zJS=Z*@v}qvp;IM7D-wJOL0HO$A%ew&sz`!QbemY8Gc76}pZl$@(PG1WUUHJz^Hi%_
zBnWyPQBDnF=}<DWT`w97op}2nlVxV#tqAG!*9%N2U6N0|;fMu59X|>1R}(N4gAwCp
zr{!|-B{yJ0>K23D^B%Gq>1|d=TKxlY`{+KcD5n1k^!;(0H-wr7AWVf}wwxr^T$N03
zig!U}0dIRFX`=(*@gRbo(=GkQQMU_1u}#sS09?2%AJBOzIPW5DqyRco!nBSbgXT%M
zz_{MB&A^p2|JkrZ)DajoPY$#=fy4ik<>e?b*fVF+a6Diq$D?RcG&2xo^nJOOJa|`v
zuM-VCq=Po~<9c}I!Z~-GU$GxXNV4F`#cL8CwS0_IJ&=h+AM|ru#hRx}P~xvWo8sqR
z%mRJDNf7C0p1Dl<%>vp7_NZ0OgbIPSxL@3-0m40~EzzR;7#g`F7Ibb8)ifrfB=ffh
z3Tw#qtc+2llIoi6N0#;AjInBWY?ZJu(Tk+e@_8lZDm?uhO=QyU%?h)bqfR;n?||N;
zU-2*KUIL>jdbSb<y92sRJzLw&08h11vv7K+q)IrX&rwL~DDPFM^n{>^C;haryS-y(
z&z(RMg=@9_3VODkp>26-Jkr@AUR!#d_0+YF&<gw`SEKH<>kT2D)iN`mBz=fnIGxTg
zUNDc;tg*eTa&3m`U$uRT;UBEfOcfnHiWVL;&RJS(8ps{IHfxf@8&3JkmmF)aDz4?1
zZs8U+t3zWM$yttQA`)dDb~)|CJ+`J-ttTC!yB7I|K*J_t7^h~~CL5f}`Gm4IYGnqw
zGBvjK%*>W4-%+;Y!eV8cba>rsRDEx^Gf$BqBX}IcDD1yCKoYAvdiz!u8~mEsb&*_h
zWi~NtcI5uhz%ujt=+ljnKZgoMf>JXtQft1%GbG<cctM|-?AIK0;u)f&b;dnt^nN(Y
zzdS!x`?Pp7EUVv**xVSB%9x6a2%O8obmhT0@oWrwop@8&k1oK+eRfNP7que!_E0<8
ztwTP@x}|S^^cT}vnO0b~<Vbr}nsuM6Hd><vpMma`YZ`M^Y+{bD<Fc6)c%1V0KplZ)
mG4sO+Abi?Sj=wgM*@8I5d-N751lxeWGJr;5?5fZB#{Ufm<;|=B

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr-members.html b/docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr-members.html
new file mode 100644
index 000000000..04e4b3dd4
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr-members.html
@@ -0,0 +1,103 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">LinearScalingDevicePtr</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">evaluate</a>(FragmentA_ const &amp;accum, FragmentB_ &amp;output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02">evaluate</a>(ScalarAccum const *accum, ScalarOutput *output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1">evaluate</a>(FragmentA_ const &amp;accum, FragmentB_ const &amp;old, FragmentB_ &amp;output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947">evaluate</a>(ScalarAccum const *accum, ScalarOutput const *old, ScalarOutput *output)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe">LinearScaling</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">LinearScaling</a>(Params const &amp;_params)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a9dcb15bbcf3785280fd5cea0e0da5602">LinearScalingDevicePtr</a>(Params const &amp;_params)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54">source_required</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html b/docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html
new file mode 100644
index 000000000..18f90921e
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html
@@ -0,0 +1,232 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">LinearScalingDevicePtr</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="linear__scaling__device__ptr_8h_source.html">linear_scaling_device_ptr.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.png" usemap="#cutlass::gemm::LinearScalingDevicePtr_3C_20Scalar_5F_2C_20FragmentMultiplyAdd_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::LinearScalingDevicePtr_3C_20Scalar_5F_2C_20FragmentMultiplyAdd_5F_20_3E_map" name="cutlass::gemm::LinearScalingDevicePtr_3C_20Scalar_5F_2C_20FragmentMultiplyAdd_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1LinearScaling.html" title="Functor to compute linear combination of fragments. " alt="cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;" shape="rect" coords="0,0,433,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">The parameters.  <a href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:ad10463da3f5a421f9b87638775ef0a85"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85">Base</a></td></tr>
+<tr class="memdesc:ad10463da3f5a421f9b87638775ef0a85"><td class="mdescLeft">&#160;</td><td class="mdescRight">Linear Scaling class used.  <a href="#ad10463da3f5a421f9b87638775ef0a85">More...</a><br /></td></tr>
+<tr class="separator:ad10463da3f5a421f9b87638775ef0a85"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0599650f5cc68b430782d2db74e73d2e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Base::Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a0599650f5cc68b430782d2db74e73d2e">Scalar</a></td></tr>
+<tr class="separator:a0599650f5cc68b430782d2db74e73d2e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1LinearScaling"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1LinearScaling')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td></tr>
+<tr class="memitem:ae6b053ca059932f7c0d3c99243854183 inherit pub_types_structcutlass_1_1gemm_1_1LinearScaling"><td class="memItemLeft" align="right" valign="top">typedef Scalar_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a></td></tr>
+<tr class="separator:ae6b053ca059932f7c0d3c99243854183 inherit pub_types_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae80882255b71c1ec94c6caeded2d0309 inherit pub_types_structcutlass_1_1gemm_1_1LinearScaling"><td class="memItemLeft" align="right" valign="top">typedef FragmentMultiplyAdd_::ScalarAccum&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a></td></tr>
+<tr class="separator:ae80882255b71c1ec94c6caeded2d0309 inherit pub_types_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa697d4eaced1ef08247aeb1fcc0f0ea8 inherit pub_types_structcutlass_1_1gemm_1_1LinearScaling"><td class="memItemLeft" align="right" valign="top">typedef FragmentMultiplyAdd_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aa697d4eaced1ef08247aeb1fcc0f0ea8">FragmentMultiplyAdd</a></td></tr>
+<tr class="separator:aa697d4eaced1ef08247aeb1fcc0f0ea8 inherit pub_types_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a9dcb15bbcf3785280fd5cea0e0da5602"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#a9dcb15bbcf3785280fd5cea0e0da5602">LinearScalingDevicePtr</a> (<a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">Params</a> const &amp;_params)</td></tr>
+<tr class="memdesc:a9dcb15bbcf3785280fd5cea0e0da5602"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a9dcb15bbcf3785280fd5cea0e0da5602">More...</a><br /></td></tr>
+<tr class="separator:a9dcb15bbcf3785280fd5cea0e0da5602"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1gemm_1_1LinearScaling')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td></tr>
+<tr class="memitem:ae5ed200fe8c45b6478d3893e67da0ebe inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe">LinearScaling</a> ()</td></tr>
+<tr class="memdesc:ae5ed200fe8c45b6478d3893e67da0ebe inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1LinearScaling.html#ae5ed200fe8c45b6478d3893e67da0ebe">More...</a><br /></td></tr>
+<tr class="separator:ae5ed200fe8c45b6478d3893e67da0ebe inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a46965529bd1384465c6f2b8c2a244889 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">LinearScaling</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a> const &amp;_params)</td></tr>
+<tr class="memdesc:a46965529bd1384465c6f2b8c2a244889 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1LinearScaling.html#a46965529bd1384465c6f2b8c2a244889">More...</a><br /></td></tr>
+<tr class="separator:a46965529bd1384465c6f2b8c2a244889 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aae313f3e691334f80d1316ac4cd30d54 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aae313f3e691334f80d1316ac4cd30d54">source_required</a> () const</td></tr>
+<tr class="separator:aae313f3e691334f80d1316ac4cd30d54 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a303c8dd75a31c01aa4e1de5097aca8eb inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memTemplParams" colspan="2">template&lt;typename FragmentA_ , typename FragmentB_ &gt; </td></tr>
+<tr class="memitem:a303c8dd75a31c01aa4e1de5097aca8eb inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">evaluate</a> (FragmentA_ const &amp;accum, FragmentB_ &amp;output)</td></tr>
+<tr class="memdesc:a303c8dd75a31c01aa4e1de5097aca8eb inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor.  <a href="structcutlass_1_1gemm_1_1LinearScaling.html#a303c8dd75a31c01aa4e1de5097aca8eb">More...</a><br /></td></tr>
+<tr class="separator:a303c8dd75a31c01aa4e1de5097aca8eb inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0159214b89d7648f1e8f3b5dd228df02 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memTemplParams" colspan="2">template&lt;typename ScalarAccum , typename ScalarOutput , int size&gt; </td></tr>
+<tr class="memitem:a0159214b89d7648f1e8f3b5dd228df02 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02">evaluate</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> const *accum, ScalarOutput *output)</td></tr>
+<tr class="memdesc:a0159214b89d7648f1e8f3b5dd228df02 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor, without using fragment in the API.  <a href="structcutlass_1_1gemm_1_1LinearScaling.html#a0159214b89d7648f1e8f3b5dd228df02">More...</a><br /></td></tr>
+<tr class="separator:a0159214b89d7648f1e8f3b5dd228df02 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a429d78c47d55929903ee02733ad881c1 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memTemplParams" colspan="2">template&lt;typename FragmentA_ , typename FragmentB_ &gt; </td></tr>
+<tr class="memitem:a429d78c47d55929903ee02733ad881c1 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1">evaluate</a> (FragmentA_ const &amp;accum, FragmentB_ const &amp;old, FragmentB_ &amp;output)</td></tr>
+<tr class="memdesc:a429d78c47d55929903ee02733ad881c1 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor.  <a href="structcutlass_1_1gemm_1_1LinearScaling.html#a429d78c47d55929903ee02733ad881c1">More...</a><br /></td></tr>
+<tr class="separator:a429d78c47d55929903ee02733ad881c1 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aad0708f7681b16e6d6b4ca8d1f59a947 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memTemplParams" colspan="2">template&lt;typename ScalarAccum , typename ScalarOutput , int size&gt; </td></tr>
+<tr class="memitem:aad0708f7681b16e6d6b4ca8d1f59a947 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947">evaluate</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae80882255b71c1ec94c6caeded2d0309">ScalarAccum</a> const *accum, ScalarOutput const *old, ScalarOutput *output)</td></tr>
+<tr class="memdesc:aad0708f7681b16e6d6b4ca8d1f59a947 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="mdescLeft">&#160;</td><td class="mdescRight">Evaluate the functor, without using fragment in the API.  <a href="structcutlass_1_1gemm_1_1LinearScaling.html#aad0708f7681b16e6d6b4ca8d1f59a947">More...</a><br /></td></tr>
+<tr class="separator:aad0708f7681b16e6d6b4ca8d1f59a947 inherit pub_methods_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1gemm_1_1LinearScaling"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1gemm_1_1LinearScaling')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;</a></td></tr>
+<tr class="memitem:a7bbf90dc0938698a0fa22468f9df315d inherit pub_attribs_structcutlass_1_1gemm_1_1LinearScaling"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#a7bbf90dc0938698a0fa22468f9df315d">params</a></td></tr>
+<tr class="separator:a7bbf90dc0938698a0fa22468f9df315d inherit pub_attribs_structcutlass_1_1gemm_1_1LinearScaling"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><h3>template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt;<br />
+struct cutlass::gemm::LinearScalingDevicePtr&lt; Scalar_, FragmentMultiplyAdd_ &gt;</h3>
+
+<p>Functor to compute linear combination of fragments. This is intended to support passing scalars either by value from the host or by reference to device-side scalar elements. This is inspired by cuBLAS's device pointer mode. </p>
+</div><h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="ad10463da3f5a421f9b87638775ef0a85"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad10463da3f5a421f9b87638775ef0a85">&#9670;&nbsp;</a></span>Base</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">LinearScaling</a>&lt;Scalar_, FragmentMultiplyAdd_&gt; <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html#ad10463da3f5a421f9b87638775ef0a85">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a0599650f5cc68b430782d2db74e73d2e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0599650f5cc68b430782d2db74e73d2e">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Base::Scalar</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a9dcb15bbcf3785280fd5cea0e0da5602"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9dcb15bbcf3785280fd5cea0e0da5602">&#9670;&nbsp;</a></span>LinearScalingDevicePtr()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_ , typename FragmentMultiplyAdd_  = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">cutlass::gemm::LinearScalingDevicePtr</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1LinearScalingDevicePtr.html">LinearScalingDevicePtr</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="classcutlass_1_1gemm_1_1LinearScalingDevicePtr_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>_params</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="linear__scaling__device__ptr_8h_source.html">linear_scaling_device_ptr.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr.png b/docs/structcutlass_1_1gemm_1_1LinearScalingDevicePtr.png
new file mode 100644
index 0000000000000000000000000000000000000000..06e3e5c6cbeb92a5c5e3773a5bce9d52a51dbd1d
GIT binary patch
literal 1507
zcmcIkc{G~|5dYF{UDaK$s++KmC3Kaib!FAj!@5GKhM;UILASIhDjI}EtJSQMC_<IC
zR8iUwMO_Wi#BEt24I*g89fUffvg!WYzjxl7ncvKt_vXEs-^@K{C)-0ZiZTEI975Vz
zp#cB_im|iQez7g|ZIlx`s58pdS|k#Q;mXGB^R}DmV)UO<sZ<Xz+D#lvMWUTt0CCY*
zVRpG10KkE8q}4gsXvk9j5^4J7_sObkOpGWy_Ao<2I%zuEAi_TMYAQ!lBCZy`SEbuc
z^2iF1-ggvfZ-<tGV@XG(J9FUHmIhkLjC3Lr4IjJw@}&cbkl;vr`*dxK3{R<>xq>Dc
z(Od%6G?DVqUvtM6o(V0&C($b;qc#ymADQdd98tgJw3ao*gIH9rkPJ|prQjKR;f5r!
zd7gipM;LE5e<NDX?%i&{<#Fap=z-7nc<ME_G0N_=OI#Q2a!-<%7DY$F1{cv}Q*%k5
zh+)(&UQ1ajqEyUnJJOq0hj*+MPeiorEF)@<jDFIix>LP~8iEjB(2P}CX_kMsJVHHx
zIzPZC)jFuWpZuP{%4Qo&oG_dTzijrA^@T@NiRl@6I+5EP^NY=QLe>xH{2=6Y=9Qi%
z$0Vtp{s?;7%|Q_H)401yV?XQYwD0j@OV9rMLlrPArl7wrZnD|NFx0kx_}qLU-dv&i
z?n2%GZ?65q1uv}@dAi<>s5~&RD%fy(@O7^f9)+F@Gsll$ub>4g3rz)JSmd-a_Kkdr
z#-}>`HG_hb-(_{y*{+ZDqt=K~d=_P>gt+12SGE#1!kL8$lW>b42J`xsv^g!9#u!@Y
zMoWQ1K<(mP!_9IwBER98_dJz~>MC8%F-5&U`XWYhacGl?;fLfQ5_*NRgNC}wNK=L}
z9X=;NCa@-jaF5YBogAh`nGAAgUrRsh+KS!a$c=wk>`8vv?y*0iZw(b1RY{Qw@BYRX
zG^io#R`ckD!bWNFt|lm{q|Edpz6Ok3WM@Z*Yab@*BU6+8Q6%-rR#ug+gWtt0O$lI+
zyd{|qNG1Bqs>$trap(f3)L{Fik|lkSu(MD&768*@Ay$?K5^~a=(6exHLd>rJDbW_6
z4WjLlnP_`CXW%gK^EZu7`Yx`n@=zg)eF_g5stL4?UBT2@<~qlu@}6-5%<Z;n0Ih!F
zqqpifKjUC1`LiSuf&w|G0+kDCTUrSW0>2>*M})*CmuzHb`ZnM?_fG1@Qa#Fh7<CNs
zymZ;|o82?9<Bg7?yQScV7ot<=mj=8aFvFO^6~nsgRWVX2_(z`AdXNx`f2FHQK@=lM
zt5)X@I6s@kTzZ{vRBc@04i(sY9{dsdmE>GRZ4vuZ-$3^CoqL?AR@T|>*`y~`<?Hgn
zZonVi(n=Y6+&-*N+X42xAQ)7QBGh|tT%S#P-MiSh^=JV5U^{nhbeRb|LKOJrgeX-n
zw4UAp-}Gq~R_qWdbywwXiEj0=Kqu2-dcQ!E{+TQ6hzpmA45oW9d4fQnpjS6KJQQ%p
z=t_JI?r;aYwRqKaUA;2Yrl5qJYU!1to@avQ(WJ4CHNn+-80THnIsL*&=z3?PN^oV&
z#R=&Y6|-stAJm(N9kkt?&>yzU`Rggp0zs+%P4CXbsO!i3pk}vhdW9d`pZBQnmP^|Y
z(RbzyFwynFq3guBl{5>l2(!`0LrY!{CzNn`WZ|jI4^<j{W3PfnGw0Iq+Ger~7}^ue
zz!c1Fo|PL>ik&~H;FUNgoYVr#yYRSCqcdL*!BjW@v3|n&F!%4dSn)pYBi?1yE153q
zBb3wtA4Y-VD1N)9D}I)oVdeq~A@w(_88&4A;Xr(lEO#G)OO7J}r`x}jN~Hr^Uf+<`
j9I8{CX{BA<P89*?o?IL)24oY(9~nSeJ6Tm)UQYZMckk)5

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1LinearScaling_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1LinearScaling_1_1Params-members.html
index 4342065c6..2bcaed09d 100644
--- a/docs/structcutlass_1_1gemm_1_1LinearScaling_1_1Params-members.html
+++ b/docs/structcutlass_1_1gemm_1_1LinearScaling_1_1Params-members.html
@@ -81,11 +81,13 @@ $(function() {
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a3248d6b3d9bcc59365d582b879292a70">alpha</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">initialize</a>(GemmDesc_ const &amp;desc)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ad4089906220d4656ba075fb9afd1012c">initialize</a>(Scalar _alpha, Scalar _beta)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">initialize</a>(GemmDesc_ const &amp;desc)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ae515cd98a75ff3eafffcc69692d6301a">Params</a>(Scalar _alpha=0, Scalar _beta=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html">cutlass::gemm::LinearScaling&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html b/docs/structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html
index 605e0b8f9..415b5a954 100644
--- a/docs/structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html
+++ b/docs/structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html
@@ -88,6 +88,11 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
+<tr class="memitem:ae515cd98a75ff3eafffcc69692d6301a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ae515cd98a75ff3eafffcc69692d6301a">Params</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> _alpha=0, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> _beta=0)</td></tr>
+<tr class="separator:ae515cd98a75ff3eafffcc69692d6301a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad4089906220d4656ba075fb9afd1012c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#ad4089906220d4656ba075fb9afd1012c">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> _alpha, <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> _beta)</td></tr>
+<tr class="memdesc:ad4089906220d4656ba075fb9afd1012c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize the parameters.  <a href="#ad4089906220d4656ba075fb9afd1012c">More...</a><br /></td></tr>
+<tr class="separator:ad4089906220d4656ba075fb9afd1012c"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a4946e45e10661307f562b27bad5cb72d"><td class="memTemplParams" colspan="2">template&lt;typename GemmDesc_ &gt; </td></tr>
 <tr class="memitem:a4946e45e10661307f562b27bad5cb72d"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a4946e45e10661307f562b27bad5cb72d">initialize</a> (GemmDesc_ const &amp;desc)</td></tr>
 <tr class="memdesc:a4946e45e10661307f562b27bad5cb72d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize the parameters.  <a href="#a4946e45e10661307f562b27bad5cb72d">More...</a><br /></td></tr>
@@ -101,14 +106,91 @@ Public Attributes</h2></td></tr>
 <tr class="memitem:a0e455ad2e4eba67259867f9123ca817b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling_1_1Params.html#a0e455ad2e4eba67259867f9123ca817b">beta</a></td></tr>
 <tr class="separator:a0e455ad2e4eba67259867f9123ca817b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
-<h2 class="groupheader">Member Function Documentation</h2>
-<a id="a4946e45e10661307f562b27bad5cb72d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a4946e45e10661307f562b27bad5cb72d">&#9670;&nbsp;</a></span>initialize()</h2>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="ae515cd98a75ff3eafffcc69692d6301a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae515cd98a75ff3eafffcc69692d6301a">&#9670;&nbsp;</a></span>Params()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::Params </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a>&#160;</td>
+          <td class="paramname"><em>_alpha</em> = <code>0</code>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a>&#160;</td>
+          <td class="paramname"><em>_beta</em> = <code>0</code>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ad4089906220d4656ba075fb9afd1012c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad4089906220d4656ba075fb9afd1012c">&#9670;&nbsp;</a></span>initialize() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::initialize </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a>&#160;</td>
+          <td class="paramname"><em>_alpha</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a>&#160;</td>
+          <td class="paramname"><em>_beta</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4946e45e10661307f562b27bad5cb72d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4946e45e10661307f562b27bad5cb72d">&#9670;&nbsp;</a></span>initialize() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
 <div class="memtemplate">
 template&lt;typename GemmDesc_ &gt; </div>
 <table class="mlabels">
@@ -139,7 +221,7 @@ template&lt;typename GemmDesc_ &gt; </div>
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::alpha</td>
@@ -155,7 +237,7 @@ template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAd
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_&gt;&gt; </div>
+template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAdd&lt;Scalar_, Scalar_&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html#ae6b053ca059932f7c0d3c99243854183">Scalar</a> <a class="el" href="structcutlass_1_1gemm_1_1LinearScaling.html">cutlass::gemm::LinearScaling</a>&lt; Scalar_, FragmentMultiplyAdd_ &gt;::Params::beta</td>
@@ -171,7 +253,7 @@ template&lt;typename Scalar_, typename FragmentMultiplyAdd_ = FragmentMultiplyAd
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ProjectOperand.html b/docs/structcutlass_1_1gemm_1_1ProjectOperand.html
index 6b5a39583..09e14d1b2 100644
--- a/docs/structcutlass_1_1gemm_1_1ProjectOperand.html
+++ b/docs/structcutlass_1_1gemm_1_1ProjectOperand.html
@@ -89,7 +89,7 @@ struct cutlass::gemm::ProjectOperand&lt; operand, Kstrided &gt;</h3>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4-members.html b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4-members.html
index cbf6186db..1b3fa0e05 100644
--- a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html
index 50d953353..68cfab74c 100644
--- a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kA_00_01Kstrided_01_4.html
@@ -125,7 +125,7 @@ template&lt;bool Kstrided&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4-members.html b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4-members.html
index ab297d480..1d501a261 100644
--- a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html
index 7021dbf8b..59aab4a02 100644
--- a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kB_00_01Kstrided_01_4.html
@@ -125,7 +125,7 @@ template&lt;bool Kstrided&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4-members.html b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4-members.html
index 79bf952fc..24f99a7e3 100644
--- a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html
index 8e2882f93..d2f227e62 100644
--- a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kC_00_01true_01_4.html
@@ -123,7 +123,7 @@ Static Public Member Functions</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4-members.html b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4-members.html
index d20c5c9f6..f77efde93 100644
--- a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html
index 5cf621e38..68f484b5b 100644
--- a/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1ProjectOperand_3_01GemmOperand_1_1kD_00_01true_01_4.html
@@ -123,7 +123,7 @@ Static Public Member Functions</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ReshapeThreads-members.html b/docs/structcutlass_1_1gemm_1_1ReshapeThreads-members.html
index 9d8d3d8a6..a1811ca24 100644
--- a/docs/structcutlass_1_1gemm_1_1ReshapeThreads-members.html
+++ b/docs/structcutlass_1_1gemm_1_1ReshapeThreads-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ReshapeThreads.html b/docs/structcutlass_1_1gemm_1_1ReshapeThreads.html
index e4f6d4b50..95af5c25b 100644
--- a/docs/structcutlass_1_1gemm_1_1ReshapeThreads.html
+++ b/docs/structcutlass_1_1gemm_1_1ReshapeThreads.html
@@ -110,7 +110,7 @@ template&lt;typename Tile_, typename Threads_, bool  = (Tile_::kW &lt; Threads_:
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4-members.html b/docs/structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4-members.html
index 722512f71..14b5b2331 100644
--- a/docs/structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4-members.html
+++ b/docs/structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html b/docs/structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html
index ccfacd4f3..635802678 100644
--- a/docs/structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html
+++ b/docs/structcutlass_1_1gemm_1_1ReshapeThreads_3_01Tile___00_01Threads___00_01true_01_4.html
@@ -110,7 +110,7 @@ template&lt;typename Tile_ , typename Threads_ &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1RowMajorBlockSwizzle-members.html b/docs/structcutlass_1_1gemm_1_1RowMajorBlockSwizzle-members.html
new file mode 100644
index 000000000..7b3110327
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1RowMajorBlockSwizzle-members.html
@@ -0,0 +1,95 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">RowMajorBlockSwizzle</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a9be74716c0e3dc6a7f4cdd64cbb16211">get_batch_id</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#aa9fc825e19404ff527cb3d2dcc55ae1c">get_grid_layout</a>(GemmCoord const &amp;problem_size, Coord&lt; 3 &gt; const &amp;OutputTile)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#af7c1b4e0afb08e893cd14a169a0b47cd">get_threadblock_offset</a>(Coord&lt; 3 &gt; const &amp;OutputTile)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a4ed7847f8ddad11a6765d914b6f32fcd">RowMajorBlockSwizzle</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d">swizzle</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html b/docs/structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html
new file mode 100644
index 000000000..b2267dc7f
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html
@@ -0,0 +1,260 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">RowMajorBlockSwizzle</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="threadblock__swizzle_8h_source.html">threadblock_swizzle.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a4ed7847f8ddad11a6765d914b6f32fcd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a4ed7847f8ddad11a6765d914b6f32fcd">RowMajorBlockSwizzle</a> ()</td></tr>
+<tr class="memdesc:a4ed7847f8ddad11a6765d914b6f32fcd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a4ed7847f8ddad11a6765d914b6f32fcd">More...</a><br /></td></tr>
+<tr class="separator:a4ed7847f8ddad11a6765d914b6f32fcd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a668d220ad1f163b72e40106b719e0c8d"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d">swizzle</a> ()</td></tr>
+<tr class="memdesc:a668d220ad1f163b72e40106b719e0c8d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Swizzle the block index.  <a href="#a668d220ad1f163b72e40106b719e0c8d">More...</a><br /></td></tr>
+<tr class="separator:a668d220ad1f163b72e40106b719e0c8d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa9fc825e19404ff527cb3d2dcc55ae1c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dim3&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#aa9fc825e19404ff527cb3d2dcc55ae1c">get_grid_layout</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> const &amp;problem_size, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;OutputTile)</td></tr>
+<tr class="separator:aa9fc825e19404ff527cb3d2dcc55ae1c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af7c1b4e0afb08e893cd14a169a0b47cd"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#af7c1b4e0afb08e893cd14a169a0b47cd">get_threadblock_offset</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;OutputTile)</td></tr>
+<tr class="separator:af7c1b4e0afb08e893cd14a169a0b47cd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9be74716c0e3dc6a7f4cdd64cbb16211"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a9be74716c0e3dc6a7f4cdd64cbb16211">get_batch_id</a> ()</td></tr>
+<tr class="separator:a9be74716c0e3dc6a7f4cdd64cbb16211"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a4ed7847f8ddad11a6765d914b6f32fcd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4ed7847f8ddad11a6765d914b6f32fcd">&#9670;&nbsp;</a></span>RowMajorBlockSwizzle()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupRows, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle</a>&lt; groupRows, swDirection &gt;::<a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">RowMajorBlockSwizzle</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a9be74716c0e3dc6a7f4cdd64cbb16211"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9be74716c0e3dc6a7f4cdd64cbb16211">&#9670;&nbsp;</a></span>get_batch_id()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupRows, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE int <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle</a>&lt; groupRows, swDirection &gt;::get_batch_id </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa9fc825e19404ff527cb3d2dcc55ae1c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa9fc825e19404ff527cb3d2dcc55ae1c">&#9670;&nbsp;</a></span>get_grid_layout()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupRows, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dim3 <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle</a>&lt; groupRows, swDirection &gt;::get_grid_layout </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> const &amp;&#160;</td>
+          <td class="paramname"><em>problem_size</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>OutputTile</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af7c1b4e0afb08e893cd14a169a0b47cd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af7c1b4e0afb08e893cd14a169a0b47cd">&#9670;&nbsp;</a></span>get_threadblock_offset()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupRows, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;3&gt; <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle</a>&lt; groupRows, swDirection &gt;::get_threadblock_offset </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;&#160;</td>
+          <td class="paramname"><em>OutputTile</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a668d220ad1f163b72e40106b719e0c8d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a668d220ad1f163b72e40106b719e0c8d">&#9670;&nbsp;</a></span>swizzle()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int groupRows, enum swizzleDirection::Kind swDirection&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE dim3 <a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle</a>&lt; groupRows, swDirection &gt;::swizzle </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="threadblock__swizzle_8h_source.html">threadblock_swizzle.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1SgemmConfig-members.html b/docs/structcutlass_1_1gemm_1_1SgemmConfig-members.html
index 1cd9d1933..a1db93d78 100644
--- a/docs/structcutlass_1_1gemm_1_1SgemmConfig-members.html
+++ b/docs/structcutlass_1_1gemm_1_1SgemmConfig-members.html
@@ -73,41 +73,44 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::SgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::SgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, kLaunchBounds &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html">cutlass::gemm::SgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1SgemmConfig.html">cutlass::gemm::SgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, kLaunchBounds &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SgemmConfig.html b/docs/structcutlass_1_1gemm_1_1SgemmConfig.html
index 41649897f..16e077038 100644
--- a/docs/structcutlass_1_1gemm_1_1SgemmConfig.html
+++ b/docs/structcutlass_1_1gemm_1_1SgemmConfig.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::SgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::SgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, kLaunchBounds &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -75,93 +75,102 @@ $(function() {
   <div class="summary">
 <a href="structcutlass_1_1gemm_1_1SgemmConfig-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::SgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::SgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, kLaunchBounds &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="sgemm__traits_8h_source.html">sgemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::SgemmConfig&lt; OutputTile_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::SgemmConfig&lt; OutputTile_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, kLaunchBounds &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1SgemmConfig.png" usemap="#cutlass::gemm::SgemmConfig_3C_20OutputTile_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::SgemmConfig_3C_20OutputTile_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map" name="cutlass::gemm::SgemmConfig_3C_20OutputTile_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;" shape="rect" coords="0,0,1431,24"/>
+  <img src="structcutlass_1_1gemm_1_1SgemmConfig.png" usemap="#cutlass::gemm::SgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20kLaunchBounds_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::SgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20kLaunchBounds_20_3E_map" name="cutlass::gemm::SgemmConfig_3C_20OutputTile_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20kLaunchBounds_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmConfig.html" alt="cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;" shape="rect" coords="0,0,1570,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td></tr>
-<tr class="memitem:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef float&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">ScalarA</a></td></tr>
-<tr class="memdesc:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9d1e4e364be8fd9de5e1199d93ad76aa">More...</a><br /></td></tr>
-<tr class="separator:a9d1e4e364be8fd9de5e1199d93ad76aa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef float&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">ScalarB</a></td></tr>
-<tr class="memdesc:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa13d6f5e5ad907ef09c88ae49e6e8e9b">More...</a><br /></td></tr>
-<tr class="separator:aa13d6f5e5ad907ef09c88ae49e6e8e9b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef float&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">ScalarC</a></td></tr>
-<tr class="memdesc:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad8f262d7da093d07cdd5c6a4fd9aceea">More...</a><br /></td></tr>
-<tr class="separator:ad8f262d7da093d07cdd5c6a4fd9aceea inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef float&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">ScalarD</a></td></tr>
-<tr class="memdesc:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a188ef7f4c49ff2830753218343a1b8f8">More...</a><br /></td></tr>
-<tr class="separator:a188ef7f4c49ff2830753218343a1b8f8 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a></td></tr>
-<tr class="memdesc:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">More...</a><br /></td></tr>
-<tr class="separator:a53450f4d7444d6a4c0d2353496c0a4fd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, float, float, float &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">MultiplyAdd</a></td></tr>
-<tr class="memdesc:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">More...</a><br /></td></tr>
-<tr class="separator:a8669096ddbb8c810fb8d2313d62e6ee7 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">InstructionShape</a></td></tr>
-<tr class="memdesc:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3a57d05f50932d718538f0d1ededa95b">More...</a><br /></td></tr>
-<tr class="separator:a3a57d05f50932d718538f0d1ededa95b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a></td></tr>
-<tr class="memdesc:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">More...</a><br /></td></tr>
-<tr class="separator:a51d583dfcd645ad0ecfc23b87b3c5108 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">Accumulators</a></td></tr>
-<tr class="memdesc:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2fadb0ad2e28109ccfa9195e817a4d54">More...</a><br /></td></tr>
-<tr class="separator:a2fadb0ad2e28109ccfa9195e817a4d54 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a51d583dfcd645ad0ecfc23b87b3c5108">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">Warps</a></td></tr>
-<tr class="memdesc:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#abb6ba58a2f2d80db0b2c9c1d88454efd">More...</a><br /></td></tr>
-<tr class="separator:abb6ba58a2f2d80db0b2c9c1d88454efd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; AccumulatorsPerThread_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2 &gt;</a></td></tr>
-<tr class="memitem:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">kWarpSize</a></td></tr>
-<tr class="memdesc:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a677d6a1711cc756b817095b7437cce0e">More...</a><br /></td></tr>
-<tr class="separator:a677d6a1711cc756b817095b7437cce0e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">kThreads</a></td></tr>
-<tr class="memdesc:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a0b2be601de08848afc4418adb97255bf">More...</a><br /></td></tr>
-<tr class="separator:a0b2be601de08848afc4418adb97255bf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">kScalarsPerLdgA</a></td></tr>
-<tr class="memdesc:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a2e0a043c5d4d7959ec1a2214c3ac39ac">More...</a><br /></td></tr>
-<tr class="separator:a2e0a043c5d4d7959ec1a2214c3ac39ac inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:accc95abc55880abdab92253367b4b186 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#accc95abc55880abdab92253367b4b186">kScalarsPerStsA</a></td></tr>
-<tr class="separator:accc95abc55880abdab92253367b4b186 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa1b75484138923a52b32888fef608d9b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa1b75484138923a52b32888fef608d9b">kScalarsPerLdsA</a></td></tr>
-<tr class="separator:aa1b75484138923a52b32888fef608d9b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">kScalarsPerLdgB</a></td></tr>
-<tr class="memdesc:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a849b21fed39aaac1cdd546334739be97">More...</a><br /></td></tr>
-<tr class="separator:a849b21fed39aaac1cdd546334739be97 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac0c8c027e3ede14b62d7c7d519551f21 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ac0c8c027e3ede14b62d7c7d519551f21">kScalarsPerStsB</a></td></tr>
-<tr class="separator:ac0c8c027e3ede14b62d7c7d519551f21 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a86470d3a44e2b50ee31ec3c9f79927ef inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a86470d3a44e2b50ee31ec3c9f79927ef">kScalarsPerLdsB</a></td></tr>
-<tr class="separator:a86470d3a44e2b50ee31ec3c9f79927ef inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">kScalarsPerLdgC</a></td></tr>
-<tr class="memdesc:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aad47c635a73e83bd4b19494864832d31">More...</a><br /></td></tr>
-<tr class="separator:aad47c635a73e83bd4b19494864832d31 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">kScalarsPerStgD</a></td></tr>
-<tr class="memdesc:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a3633083f4f778215543e376c092745d7">More...</a><br /></td></tr>
-<tr class="separator:a3633083f4f778215543e376c092745d7 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a3087cdd38e2c65ad0dffdd0587d2cce0 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a3087cdd38e2c65ad0dffdd0587d2cce0">kScalarsPerStsD</a></td></tr>
-<tr class="separator:a3087cdd38e2c65ad0dffdd0587d2cce0 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adaf2ee5b8e6f7bdb9939cd45a186ca56 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#adaf2ee5b8e6f7bdb9939cd45a186ca56">kScalarsPerLdsD</a></td></tr>
-<tr class="separator:adaf2ee5b8e6f7bdb9939cd45a186ca56 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">kAccumulatorsPerLdsA</a></td></tr>
-<tr class="memdesc:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#abbdd356f280099269867e614684645cf">More...</a><br /></td></tr>
-<tr class="separator:abbdd356f280099269867e614684645cf inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9dd092bca2f1f2c039f367b23bafa9c1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd092bca2f1f2c039f367b23bafa9c1">kAccumulatorsPerLdsB</a></td></tr>
-<tr class="separator:a9dd092bca2f1f2c039f367b23bafa9c1 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">kStages</a></td></tr>
-<tr class="memdesc:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a221949c289057e39d439ce03a5b01c52">More...</a><br /></td></tr>
-<tr class="separator:a221949c289057e39d439ce03a5b01c52 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td></tr>
+<tr class="memitem:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef float&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">ScalarA</a></td></tr>
+<tr class="memdesc:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa97b0e7f369f927c4db6d683dbb7f53b">More...</a><br /></td></tr>
+<tr class="separator:aa97b0e7f369f927c4db6d683dbb7f53b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef float&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">ScalarB</a></td></tr>
+<tr class="memdesc:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a389c0980e978463d3cc126342d8413c6">More...</a><br /></td></tr>
+<tr class="separator:a389c0980e978463d3cc126342d8413c6 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef float&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">ScalarC</a></td></tr>
+<tr class="memdesc:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a30d9cfbbede42166e4e1964145dfe05d">More...</a><br /></td></tr>
+<tr class="separator:a30d9cfbbede42166e4e1964145dfe05d inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef float&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">ScalarD</a></td></tr>
+<tr class="memdesc:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a7ad231b16f05a58900dca8ff0e0e7bfa">More...</a><br /></td></tr>
+<tr class="separator:a7ad231b16f05a58900dca8ff0e0e7bfa inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef OutputTile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a></td></tr>
+<tr class="memdesc:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">More...</a><br /></td></tr>
+<tr class="separator:a9dd9c3efc3dfd9b5c6acd12236697399 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 4, 8 &gt;, float, float, float &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">MultiplyAdd</a></td></tr>
+<tr class="memdesc:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor to do D = A*B + C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">More...</a><br /></td></tr>
+<tr class="separator:aedb95febe4a0b2943e233c95c36a22cd inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">MultiplyAdd::InstructionShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">InstructionShape</a></td></tr>
+<tr class="memdesc:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ad83132bd03f8bd844487d1a9da908c8b">More...</a><br /></td></tr>
+<tr class="separator:ad83132bd03f8bd844487d1a9da908c8b inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">MultiplyAdd::AccumulatorsPerWarp</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of warp-level GEMM.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">More...</a><br /></td></tr>
+<tr class="separator:a32a8979ff618f069665708c7771c3cc3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">MultiplyAdd::Accumulators</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">Accumulators</a></td></tr>
+<tr class="memdesc:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9f90f91f9e5e40496e8a88eb657fd591">More...</a><br /></td></tr>
+<tr class="separator:a9f90f91f9e5e40496e8a88eb657fd591 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeDiv.html">ShapeDiv</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">OutputTile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a32a8979ff618f069665708c7771c3cc3">AccumulatorsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">Warps</a></td></tr>
+<tr class="memdesc:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of warps.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9b987cfb25a32e671a47cb6376a361f3">More...</a><br /></td></tr>
+<tr class="separator:a9b987cfb25a32e671a47cb6376a361f3 inherit pub_types_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html">cutlass::gemm::GemmConfig&lt; float, float, float, float, OutputTile_, ThreadMultiplyAdd&lt; ThreadGemmShape_, Shape&lt; 1, 4, 8 &gt;, float, float, float &gt;, kScalarsPerLdgA_, kScalarsPerLdgA_, 4, kScalarsPerLdgB_, kScalarsPerLdgB_, 4, 1, 4, 1, 2, false, true, kLaunchBounds &gt;</a></td></tr>
+<tr class="memitem:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">kWarpSize</a></td></tr>
+<tr class="memdesc:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The default warp size (32 threads per warp).  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aa549183981095a3e604974e909a7d396">More...</a><br /></td></tr>
+<tr class="separator:aa549183981095a3e604974e909a7d396 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">kThreads</a></td></tr>
+<tr class="memdesc:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The numnber of threads.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#acf461f0ba3067cc5d66a04f0a176308f">More...</a><br /></td></tr>
+<tr class="separator:acf461f0ba3067cc5d66a04f0a176308f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">kScalarsPerLdgA</a></td></tr>
+<tr class="memdesc:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for A.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64e7d66e0646c7044e754b3b6b91e761">More...</a><br /></td></tr>
+<tr class="separator:a64e7d66e0646c7044e754b3b6b91e761 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab2b6167b0165ed544254dc87c2a7db8f">kScalarsPerStsA</a></td></tr>
+<tr class="separator:ab2b6167b0165ed544254dc87c2a7db8f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a82295105d7ccbcce057b4c57632a644b">kScalarsPerLdsA</a></td></tr>
+<tr class="separator:a82295105d7ccbcce057b4c57632a644b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">kScalarsPerLdgB</a></td></tr>
+<tr class="memdesc:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG/STS/LDS for B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#aff7409a9d2666159435d3b9db16443bc">More...</a><br /></td></tr>
+<tr class="separator:aff7409a9d2666159435d3b9db16443bc inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a2a424063136c56c5ca6345496485afce">kScalarsPerStsB</a></td></tr>
+<tr class="separator:a2a424063136c56c5ca6345496485afce inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9ccd14b44a22dfdfeefabe1e643da65e">kScalarsPerLdsB</a></td></tr>
+<tr class="separator:a9ccd14b44a22dfdfeefabe1e643da65e inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">kScalarsPerLdgC</a></td></tr>
+<tr class="memdesc:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per LDG for C.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a9c3985d8de485d76a5d72c91c3e3aaff">More...</a><br /></td></tr>
+<tr class="separator:a9c3985d8de485d76a5d72c91c3e3aaff inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">kScalarsPerStgD</a></td></tr>
+<tr class="memdesc:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars per STS/LDS/STG for D.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ade9d3c2aeb0e4d73e04a5e9a06ce5203">More...</a><br /></td></tr>
+<tr class="separator:ade9d3c2aeb0e4d73e04a5e9a06ce5203 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a1e93d0163c0d150d33f4093b4a1ec87f">kScalarsPerStsD</a></td></tr>
+<tr class="separator:a1e93d0163c0d150d33f4093b4a1ec87f inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a26942561aa111089b3ba0f12cf233951">kScalarsPerLdsD</a></td></tr>
+<tr class="separator:a26942561aa111089b3ba0f12cf233951 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">kAccumulatorsPerLdsA</a></td></tr>
+<tr class="memdesc:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators that are going to be fed from one LDS A/B.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a60ab48db1b87fb6063d194247bc055f5">More...</a><br /></td></tr>
+<tr class="separator:a60ab48db1b87fb6063d194247bc055f5 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aeb740e4ab9f93f29f1b8ab43ebef68eb">kAccumulatorsPerLdsB</a></td></tr>
+<tr class="separator:aeb740e4ab9f93f29f1b8ab43ebef68eb inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">kStages</a></td></tr>
+<tr class="memdesc:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of stages in shared memory to implement double, triple, more-buffering.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#ab26d76515e394118bfc530d6a81b9508">More...</a><br /></td></tr>
+<tr class="separator:ab26d76515e394118bfc530d6a81b9508 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">kResidueSeparate</a></td></tr>
+<tr class="memdesc:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, mainloop is instantiated twice. The first instantiation contains no predicate.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a64c1e0d794c1bdfa8b2f3a53e387155c">More...</a><br /></td></tr>
+<tr class="separator:a64c1e0d794c1bdfa8b2f3a53e387155c inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">kResidueInProlog</a></td></tr>
+<tr class="memdesc:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, residue is computed in the prologue.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a600746def904eeca46d7f92a4b223b46">More...</a><br /></td></tr>
+<tr class="separator:a600746def904eeca46d7f92a4b223b46 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memItemLeft" align="right" valign="top">static bool const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">kLaunchBounds</a></td></tr>
+<tr class="memdesc:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="mdescLeft">&#160;</td><td class="mdescRight">If true, kernel is launched with launch bounds specified.  <a href="structcutlass_1_1gemm_1_1GemmConfig.html#a54e252cedbfee75e7c4ac2f7fe5ce45b">More...</a><br /></td></tr>
+<tr class="separator:a54e252cedbfee75e7c4ac2f7fe5ce45b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmConfig"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <hr/>The documentation for this struct was generated from the following file:<ul>
 <li><a class="el" href="sgemm__traits_8h_source.html">sgemm_traits.h</a></li>
@@ -169,7 +178,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SgemmConfig.png b/docs/structcutlass_1_1gemm_1_1SgemmConfig.png
index 5690d0823d0e5ece0d2dd47cbf5e1ded0b5c4b82..4cf6d80bd9477946e86c1fda71182884da34e04d 100644
GIT binary patch
literal 3126
zcmd5-XH-+!8V%wgLJ)~a5fH&dhmKUGmrx=_2}sdU2I)maIuT?<AfXc^7^GMLl@<XZ
zV1NWcBHe+Z2m}Oa0-=Z@)bN6{TyNfwx8D4GXRUkBK3}=_oPED<U-VT=6CSQpTmS%o
z2WAR|0{|S7EPR!doppcSmKVXAgsz&~813)xv*0RyzW7~8It%@{$Yip8Ww<SC$r%i{
zv<9$(4#q%-jS>LB{T>F@w+UyX<^6$ueh~=8Ck1Wn>qhiT#Q1gUd2mE3IaW6{!qPKj
z%}VTwy>q%$EHZJ$-b(!{79Kgp?dJU|d%=&u?WULv@L8BKCK<fvC(DO%`)O$dN&K)1
z!;~;?|J7k>3XPD5ZOe6hDFCOm%bh0iY`9-35x=GA6>C{Wl5I-f_$K5B_SOq;@wm8e
zAJzLVB5EO4cV?rN-Uu9*&LS{Go#VkpV^%=wiuYij_PUWNm&{%9u?2OasJ-KH1CLGZ
z(>sFVCyjP$B4`_Q1P1cTBl_;MB!k+}@&sOmEL22~X&-9L^~GFTSAgRD{hsojW_g$@
z<!I!1YpLjUw9xwr>_qfk%%9aBljfT%4?BoR%<OV%lX^8?KEA=Xm)356Bt$j+d%$g+
zBUx1<d0{0wjfzW4th)A~uxuHNvhJ3J$vuX4QF6AncXw69Rhf>;RoeHWD|EmMxg!vP
z-i$h}Tcs*m5pi!GO?V!^b2@Xt4WA!(mhIlB2CeQpuOl2m$H7zdDSEsbsd>gHe|EKD
zw10@uB#oGw|G2X9HFBp6$~t^`PJ&BGZd-O)*xOqF@T%DtO-+^1F`80+Op?KH2I{f)
zM*Xlt#}Z`VdvZ(AV|-R(R}mwzA|OTMXkhqU`M~rOWuD(n6MeH#k$rw_{8G-7Tm4q_
zr}eF3#KC84L<@>mM<kZ&@exwW(||!u3f(9Qt1n;*IK{zvXEy}yr-koF9P1@&zil#Z
z=rem*m>7f{@uE<LuD>W>O-gziMmQJx@#=-ir<OVAJMoj-@$C&0?h1T%af(<JQJcwz
z_L@VgA$Ix}eei2_d9K6elQ-ZU?O<<TA_k?lx;hx!BLzpSr5}L@eN0TLrEiVUzIFmR
z+_!u|60cNL@FHf=2_eT{YA<Q6Y|L+C8L0#_IAtwgXJk{3R_o{E>;z09mXO{(FL^92
zmP?l-#V^@Ht}SXJY6WjQa3(!1^ofe4Ku?TE<PRrAW&P={gt-ir@!aBHNUc@(UPn^1
zQ8P7GHAsSykL}%=e5x>dzRgJWvMr4?^w|O}WaFe%I+RSPzLfD`dglrMsg)Ph{Q6lH
zJ7j{+Sf<fq8G}KGkRgN<@DIm<Gozw6c<ZR<+SCy~tmb$gmQcT>@VV;vh{UG<=@T_$
z3LVzYH_5Q38)z?ayUNg%QM1;o#wD6pzBS13=_f44hU)W6RoF@zhkAk~2a2C=Qr%XI
zp{8(S-O?i$M9o_L;B$9_w+>$4)L4~S7;lZ-_99e?1;eY>wq3ob{+Ut%FVB6_cOR_=
zRv5r*mcwuea*@Q?z4;TKI?^2*5Sq-F`G8na*n`44SK<oxt0pL8FciXv=ReQ>vS7Z(
z=cH6cc!wkLIoUa|Vv@-Nva%S4IE=pH0A*Nq1>1%leJO4;R2>BaOSTSjmnZ(&H@&yI
z%|Rd_=Q9tAfhK%|bfK|M2o#2F96nDJbLe*Q<?>1ICOV!IyzS1(5Z`WPb<H<z^oJeD
z$aI=@)R^_}lU}bhU%#SVlWZznrTdL5@}g!&t9)5)jF674Sr#AZKGYBq0HxJvc8=CA
zt~uNOG9>J$PjOTI<hxv$b567R?Z(@NibNk`-&{h6-O`dOJ@$@HFmh_!35}9UsyF4`
zYs;@w-gQ#HQ#BLsIvi-1{XLQ_N36sxj3bL)5Sz4qnfOxG7{hI7zq3?p$g34<6lU|V
zdwsycUG&hc`!^(cm5Y$OZkk4F3MIIaA{pEp7{dsiUKsY_y)A|b_G}a#ar9laRbsl#
za?oXA6UL`0(ZQ5Tf&eK*gcNZ5=6N^#J~v`q{2c?i+dlz$HA9|d%I~Y9UluxG<R^I)
zCd!V_Ek`pMCMN{P>4aaQVjtQKNqKwX&yHJgBdiQCB_Vw?Q3v0z+LOu0wUz{0%Ywq*
zK0-E__N{z#42-YB7Lx8eqo=Kx9Wb|MM6Q2Un18!txS4Bp7Do7%^mlCrf1POl`})6X
z_1_)E87S|ZbIKO|ZvXjb&=m!+y8ycG0XWD2p#vDLf#p1yfiY}~ym6bor`Z0&fHu%i
z<YCL{dzj@0aIkXBexgSX;2%i`*4<!Pz8_uyyURaCF?Ihm^51d)uQ>zKMf}#6rHUWI
z&83PS!7pDZdibsX>0bo1h~4~TFZq+J|B0Bwrv*2UEWg%bvWa3ubfQK41Jr^&((=|x
z)Xc*oF>Jjr5=<h58!~IM{kIpsYX`m2v!6uLf90Ll$i_{21WL+Dym9pH6^P-bfY?_5
z*yTe%@{}R7)lc^Hgc>%5ZG|X2IB}sObH58Yo{dsJR)9NJr8wWbh)7lXUJK3bP+{%X
zoJDwnu~et*-LZ);>+AjN1j>FbDJd|Vxr>PM%Gn}oEZNI8<!kNx5&OMCE&fw@%ElrX
za8lv%(9wdyPVa2PAy18qE!!oxF&T^q-w*Jbpq<}RrBi!X-9j3s!?i(rogwmJV9D@g
zBkWvB;4n^Jo()Jo?}`R&Dh@h5013o3bM+SRAfoIOc9bB;$`*w*R`3kJpgJrn*c!rD
z0}280P0`lVO@?zN+U)Z}C_75sL$V>4(yZdFRj(|FQrfw$2Ih5ELLb<lN_dV?6?D)}
z_7LEXxzfsF<hNi8MDOI=y(5wEu$7T!lR+w=hbfq#FU?0SRtF#Yl_v^V6T^=xz2vJg
z7vtlP84|Mj#7h*Hu(6D936tf^u15fW_vzN%$j>1zj91%nXNe~rCMW!Muy;7xekA19
zdZcjx4e`W*j!Y}-HHE5jM(ay*u*+tk=v_77+)IHFuR!E-qvgC>!%*Jn>oSu_O~MKE
zu-LF&onO|OY?ORyBNXUfsF81U==04=DB!LT4(hjlhUq^de3`JYhIETEmeh!gw3Y-Y
zMWTgzNMDqfEYxD+>#t1pI6Wu!+p;qhot|75B#tra3i4PaM^@>vo`L0z;XT`hww3I2
zU{*a#FSC@~C{Js9=gZ~Sa^~0uWQ>-=jy6qF%0i8AJ+o?22ByAV+|xsBqed=K&DUo)
zCqCbqxCwW=87Pj6e|Y^2KnG-YnEb+O_7-wCPb4ruv6E0Fk{wFTHxw?zQzr8a7rlnB
ze05iUUG8oOB%nz+wE@{rI$@y78HsbQTN*koGSB4ZJxzVD;uzOVq@TOb2^g41N7*Tm
z22%XkRW=)%XCfguioe+hpRQ{suZ!J)a|>|9@UjGH6~8_%w(n$=JG_UDB`zp4f+`tH
zbO!M|CqNOP%{t^g9DYap9%aRWeL$mrCplJWpNQ9zF$oI~z=V)GN3DS_0G*?PoMheZ
zA%4I`3UW}driaFqF<WLniB=c@1g!HMlwty_6#r5?z|DV%*jwr8s2`2*dRglILwKUp
e4@J<;-Diu4yhIE=6%z<x4VaN7w8FsU{=WcQ<dq@-

literal 2930
zcmds(X;4#H7RN)QjiAWPfFRPrwmX7?fCgk2#0D`c7?4dNK@?>$?1qGhfNNC3(j>q`
z5KvLjK?op-B#^K)Fmz-M5Vo)<5JLzgghfJ_*!I-aR87tF=ebqy-rxV+^WnUA|L@d&
z40m-_RoSBg0)bRvrySiupsj$M;oB7Dv->)At9;oFKkMPNxw$FF1<7n-WAx8*`t7N&
zulFgB@si7JXm{81AbHZ4(f6wd6a?C?0CRNkh*1!*1;j~P@`DLOL(k5&y`p(Me&BIa
z>(cQoY;miF`lFDxib^TVw)4i3PO;xdv8|TawzK)GytR!BIY@kYiueO8Q4Z6f(*WsT
z%JPpZ3>s&h3|ZU7Wcd^4Oy9454h<Teby;cB+0pNy_Lgo$OAh0dm&1tQ>|L5o;#BsE
zo2C6ZU!`+T1u3L3by)V|0*&}`DyXEjfSTY6gHD5^E7szC1gYGrqa#)e_Ym_wb>H7l
zn>eCdy?x9uF_a2vO9VcNf*<GblZ?X9%wuAU-63~%eZ%|AU^nOWXVHHNB5<Yst<2Vh
zjrT>26*I9mf|h?9G6<z4=fACWa1O1AI&;7up`SCB|9Ux%=h`NC%2hCSR$9pZ)3VCk
zhOR{{%{#q##m0#;E5bEC5za7~xU^;QCloH>=DhB=Kzmo%rO2M=48CN|B0T;CC5ztq
z%#CV(p?FSW@DAH28<56WqZTG5#M>u<1Wj6A*JO1h?&w}_nQ8D-qcbLis)_2yK8=)2
z)H=5zZa=RjiX@4QK2JJyg$YmnB(nJw7)Ld42vOfWg(R=>&SCt4F+o%W$V6oVZ%iMY
zGS{jmL{<LX2r)k#J2;k}<Sdr;TC<xBj#<q0YZ}rCkmQ27@VnL8A;hYkwM-7;&WBN~
z{fxck1A+(UZjIdo<Z0HRA1C5U|0XN1{n?HocuvXta9y@H5xu0<Ri;Nt9zoqXsmGEb
z{q%jYtn|61Aw^uM3K=$uj0BHI6*I^x0beRwG?^8>K4pWLf8WFC%*}pE#F%--dAqh<
zA2}#`#Ztl`ZiOEmuv)NZav;pazNmFdtx?VMS<H#@=t`@#<esG5rybR(zCy1;2+F+1
zr6(nNc<c~f@<Z{Bi#5DgB2IKg6iXSCpcy9%pN_r(=Uc!sBkwaL3blvs69R}~-;GCp
z|4V1B|E@j`BNRc~!bYAb>08@Ke|wTTZA5iO<Cu>SB=ePF8`ZpCPOd3<mUVQBzaH|e
z>7Fp>gwAxCDee?7JmqUpZMYHN-nyIt(ZRo=b0acZbfC7Y0TC8;m97`D2w^3RuOqmI
z#5#)d9P8RS%OIp?V^4tGv6$3*?leR?mYzo+>*aVBs9r@6w<{t>-^Drt549T2uL_UG
zxC5lXU%cp;%OA*$Ad=n8x|JVTUhJrCiF;ROOP;aXx(&=GJ4ujV&&{4E=QO}l^k_8K
z{&`KS-9gejwe$RD%N!xb%JMdVUy!-jm(9dF)gS{U0#Ox{lRw^CQbX+KtEQjL=?)VW
zvg^F0kHvfB?vE<61_F(!L*1O`=4uiY>9))XYs&!c7+aK=-1v|$IC!B&ZXGo$c~$<}
zFLi91%Q_~wiGza2@5j6fO-f03sD;MgvgUuph4uz|qHL;1sED0A$20cTCNS0J){t(a
zJ)FYpr4(t&oV~Ck?WvPQB!KcOYB+IFK@wkzpo-%vVub3rMd)9vuJyC%Zt?y>Wn0*K
zsEj(#NOT;fC!_Q`Ycjy0yw(h`IfkYU<<%6%`)L&$Va|~Ks;pLzgz}%8<m)e2wY8o@
z4y*t5JXMgGd}4`hnkB+p*G!a>m-*iUwId(-D|78_Dd!`SzIfvBebjbZDAPvQ!U;=0
z;4NhF!_Zc+yntI+NZZ)7n+aBcL@jtgWtX`agZ(fWI7}%%!52mF2lon9M+YDU9Q%6C
z`cIalQ{i;|;MROz6qX5TI}_8$XsD3Fvx;&SXLh<0=?$N~T!{$}l*Efm4O06wjwiPE
z1%-&7asY(eCpL28(Vg^kj(smjxImn4u5CR-lx7x8hN$SlWLj(aY#*W&uSl6v+#}l9
z_gw`~p7(Ff7f3hOhowQBh#D|=NL%C|SGRbg|J>cTz>h0zLN^^0wra@fA)K<~D=dyB
z?Eff_Y}JU+c*Xb%yZtNt8o%x<x&5B#?Ebf}k=B1k{vSaqKFc)Q#WZtiHgh?D#D(ec
zyL@=*?l&q2p56Xt=QFhSZ;(>(U%@VmJhir6-z;vU0nvi@rwd&CT?Vq^+HE)4>^Ajb
zzq1cX9kQ|{y=?;ll@c8st`~<IsN3T#wg!Iu>A*PY00OVZCC`e2A2?@f>x^dA<Q>k7
zU6Xii>-3mBhM?_L4jJs@=!>9GHms{7(|<-ZVJ)xi1zOvV5d7JWWIEPaRKyJT-!#hC
zn&NKoYGQq&xnTaamgdRzcHWgIbpqMdTvD5X%t<Xf_jv170pAsH`V1P5&P*k^@k?WG
ztW}wY`Ke;69odiwF#E?2@=DMC4c4Vg?R>vX<0krX9`u$*$#SKO^%33nb<!MK&D*IC
zEd}%K@X0F#%>1k<!o7%5Ck@Bcu{ZSU9Zr_UhCo6kToH=&bLfkQlo8~Ef_J!j9I3E{
z8E=5(M7?C#upk-{+g>pi+zx^J-Xp}lc>^hru<F1vHK?we)145iuNI9n<y}CG!Wyr4
zC%YnwT*eZH{gp&?Hi%O0=U{lxILW5Nf_j1807cG-E<d`K4s8mOdv$L!95BhnY68gJ
z06xbjIi4NcpE?`GYEF2@_$hd{in9+9wo-P$P5<gfwl9LFCkc9$LmAos`bp1+foNI*
zgZd^WgTXo6mE?YH6>=JwC>Th4>4m_5L&+%XxX#WyTM+3DSg;yNlpVgM!#6zui*v<3
zLx%)B5!|Rd<;J~A<&n`R*jyoDTEW;t_e{pbJNenBzTnlD>y~U;YW+3vusP+{@XhbX
z>o!ueLcGG75MCqlX00i}%@e!g_Rf0Hg~$dx#dZjs+5OfsX@1{K^8HfiI}*X0;)grr
zi9aXzp&fxYV&I=YgR!m}lnlShFa}d<gNC%n$T>%`CB981QHX0-v;pPN55=qAdzi`&
zh6mZ}cFM&9V{NN9?Ww^z*><EWh%kiF6WuMC<?`Gf-H$FaWACU<7kiiLjLAh?x8Bl|
zA56G-L|HapyEkhi{a$JbO-srAq6`GU>mSNL@}}`v(aNf_T~KnEt>yZkm6&TnaiS1>
zr$n?G4``*r>%TOM&BL7%mXNYoKIjRLASjxZ2kw@EPXo_y%YUtL`33WT0}YMKE_{<!
p7;I1&oShh)U3mGcw7$EkxVcAHA&{V|A-^DlU{0=%r6(@k{RiOZ$&dg5

diff --git a/docs/structcutlass_1_1gemm_1_1SgemmLBTraits-members.html b/docs/structcutlass_1_1gemm_1_1SgemmLBTraits-members.html
new file mode 100644
index 000000000..6a90490c5
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1SgemmLBTraits-members.html
@@ -0,0 +1,114 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html">SgemmLBTraits</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::SgemmLBTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html">cutlass::gemm::SgemmLBTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1SgemmLBTraits.html b/docs/structcutlass_1_1gemm_1_1SgemmLBTraits.html
new file mode 100644
index 000000000..bbdee92f3
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1SgemmLBTraits.html
@@ -0,0 +1,185 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::SgemmLBTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1SgemmLBTraits.html">SgemmLBTraits</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="structcutlass_1_1gemm_1_1SgemmLBTraits-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::SgemmLBTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Helper to define SGEMM traits using <a class="el" href="structcutlass_1_1gemm_1_1Launch.html" title="Partial specialization for launching the GEMM kernel with or without launch bounds. ">Launch</a> Bounds.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="sgemm__traits_8h_source.html">sgemm_traits.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::SgemmLBTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1SgemmLBTraits.png" usemap="#cutlass::gemm::SgemmLBTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::SgemmLBTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" name="cutlass::gemm::SgemmLBTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" alt="cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, Index_ &gt;" shape="rect" coords="0,56,4915,80"/>
+<area href="structcutlass_1_1gemm_1_1GemmTraits.html" alt="cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;" shape="rect" coords="0,0,4915,24"/>
+</map>
+ </div></div>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
+<tr class="memitem:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt; GemmConfig_, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>, Index_, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a></td></tr>
+<tr class="memdesc:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">This traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">More...</a><br /></td></tr>
+<tr class="separator:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a></td></tr>
+<tr class="memdesc:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The struct that consumes this Traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">More...</a><br /></td></tr>
+<tr class="separator:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a></td></tr>
+<tr class="memdesc:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The configuration.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">More...</a><br /></td></tr>
+<tr class="separator:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
+<tr class="memdesc:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">More...</a><br /></td></tr>
+<tr class="separator:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a></td></tr>
+<tr class="memdesc:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from global memory to shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">More...</a><br /></td></tr>
+<tr class="separator:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a96d64bdc48db4971798b620d6b49b3f6 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> ::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">ScalarA</a></td></tr>
+<tr class="memdesc:a96d64bdc48db4971798b620d6b49b3f6 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for A.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a96d64bdc48db4971798b620d6b49b3f6">More...</a><br /></td></tr>
+<tr class="separator:a96d64bdc48db4971798b620d6b49b3f6 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac393b07e780629fc8254fc22cc6f815b inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a></td></tr>
+<tr class="memdesc:ac393b07e780629fc8254fc22cc6f815b inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from global memory to shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">More...</a><br /></td></tr>
+<tr class="separator:ac393b07e780629fc8254fc22cc6f815b inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa0e8fd28f5247764dfb7843f7670c698 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> ::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">ScalarB</a></td></tr>
+<tr class="memdesc:aa0e8fd28f5247764dfb7843f7670c698 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa0e8fd28f5247764dfb7843f7670c698">More...</a><br /></td></tr>
+<tr class="separator:aa0e8fd28f5247764dfb7843f7670c698 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae01371eb31b88fa83c4926564cecafdc inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a></td></tr>
+<tr class="memdesc:ae01371eb31b88fa83c4926564cecafdc inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for A to load from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">More...</a><br /></td></tr>
+<tr class="separator:ae01371eb31b88fa83c4926564cecafdc inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a></td></tr>
+<tr class="memdesc:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for B to load from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">More...</a><br /></td></tr>
+<tr class="separator:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
+<tr class="memdesc:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">More...</a><br /></td></tr>
+<tr class="separator:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a></td></tr>
+<tr class="memdesc:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The epilogue.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">More...</a><br /></td></tr>
+<tr class="separator:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f78d4a68817760099081523aa7fd443 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#abb0741601652df8fdf927d49c2c0e4d0">Epilogue::ScalarC</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">ScalarC</a></td></tr>
+<tr class="memdesc:a8f78d4a68817760099081523aa7fd443 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalars in the epilogue.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8f78d4a68817760099081523aa7fd443">More...</a><br /></td></tr>
+<tr class="separator:a8f78d4a68817760099081523aa7fd443 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3129be75ee087603170f8367e10e070e inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html#a4887b56a96694ce6350db77f78bb505f">Epilogue::ScalarD</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a3129be75ee087603170f8367e10e070e">ScalarD</a></td></tr>
+<tr class="separator:a3129be75ee087603170f8367e10e070e inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a50672b5fa67d858aeff8f254cf28e941 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a></td></tr>
+<tr class="memdesc:a50672b5fa67d858aeff8f254cf28e941 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The block swizzle to reorganize the grid.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">More...</a><br /></td></tr>
+<tr class="separator:a50672b5fa67d858aeff8f254cf28e941 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae67227cecbe84f5c8497d9a7ff82b367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a></td></tr>
+<tr class="memdesc:ae67227cecbe84f5c8497d9a7ff82b367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">More...</a><br /></td></tr>
+<tr class="separator:ae67227cecbe84f5c8497d9a7ff82b367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a></td></tr>
+<tr class="memdesc:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear the accumulators.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">More...</a><br /></td></tr>
+<tr class="separator:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, GemmConfig::kResidueInProlog &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a></td></tr>
+<tr class="memdesc:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">More...</a><br /></td></tr>
+<tr class="separator:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">GlobalLoadStream::ThreadblockTileStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory needed to store the threadblock-scoped GEMM tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">More...</a><br /></td></tr>
+<tr class="separator:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a></td></tr>
+<tr class="memdesc:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">More...</a><br /></td></tr>
+<tr class="separator:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
+<tr class="memitem:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a> (bool in_loop)</td></tr>
+<tr class="memdesc:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">More...</a><br /></td></tr>
+<tr class="separator:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac3c840a3d90c0da43301761af83c2c9f inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a> (bool in_loop)</td></tr>
+<tr class="memdesc:ac3c840a3d90c0da43301761af83c2c9f inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared stores.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">More...</a><br /></td></tr>
+<tr class="separator:ac3c840a3d90c0da43301761af83c2c9f inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
+<tr class="memitem:ac5bb5931a707ed7672f69267753ba41b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td></tr>
+<tr class="memdesc:ac5bb5931a707ed7672f69267753ba41b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout of A.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">More...</a><br /></td></tr>
+<tr class="separator:ac5bb5931a707ed7672f69267753ba41b inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a078e8d9cfa1b182e1b96a2cc8c54b684 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td></tr>
+<tr class="memdesc:a078e8d9cfa1b182e1b96a2cc8c54b684 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout of B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">More...</a><br /></td></tr>
+<tr class="separator:a078e8d9cfa1b182e1b96a2cc8c54b684 inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="sgemm__traits_8h_source.html">sgemm_traits.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1SgemmLBTraits.png b/docs/structcutlass_1_1gemm_1_1SgemmLBTraits.png
new file mode 100644
index 0000000000000000000000000000000000000000..1c459b4932ff82251247ad52f665c95368e8ec94
GIT binary patch
literal 8497
zcmeHN3sjR=wzgwiJFOL|RV)bU+ZGi>(Fj8RP8F=$8Yz#I5)ze*SRV->uLP3R`oJ~?
z##V@mkP)f~kwna3Adp0*5KDxp7y|?nFoZy2-sJuGZ>-qr=&W_u%$;@Tt~F=<aCVYE
zd!N1ccfPat58rOxvf<U2{a>CjW5%l+KUx3zj2ZJ*dgY@p&Gi1>wDZ7!d8dV2KTU`M
zLC`De%@gOY<^I_#{rYp|%9Ssg3X;4pU&{G>OZ*J)O%H~sJ7L9)8E;<Mxc*NG1<z@Q
zmDxjUSVwMk7ALa7&9I=9Gby{@D?TZVWE>KG`{uP5R~y8*YUODquJ@mq{6;REYN-Ev
zmqT6E`}aRR)xeWZ{;R*PEY+P=Q5MNO4Jd<9p<IR1*{ixxjRp-1s%_&b?-BqaA<JpS
z^42gRkZL;V-G0b@V?(8E)%O&?YT1{$eUka$jhZC50w7BSt6_eZQ>@_TxV9!a4K@+8
zg%I8eS)pw{ej!9a9tojP1OkQXlIw-mqO`*m-J2C>vvZS)AC?2hzgt^Lxw(1by`0=+
z%%KTRe^kmKt1Hetq{DbPjY;NH&P|~zPYbwXF5?B$nFAR!3xaMn?4b@rbdBSSD@Njd
zdVn83;1yo<SvxYEC#%nlq*Xib&tc#v`Sl2MLka?oBXT7D8h^+HSTYA4(MinR31n4}
zY6OBWdFczGc@|}_QT(}FxOBHU!PC|<tg^>v*em6>+Bj!3)73d|Ouj+X`By-{t1aw?
z!kCR~bx{;X@`oYi6t5EvOL#wYLpFC-^>`hadX3Fq8mhEo_F@+2h&H&s9hVL5PGqz)
zrZ5<;{|)kY*qj3S?ZsApA<aH0Kci|DMumf))VM5HrFd5YN5AE8pM9&LV9ih5S1l5y
zj>-is8qK8njIq<KqcULaC$7`XK`78ZdgeBuqf`+tHU+E-`qCYCm$h19-2`7IWm%V>
zplwA84a%LC1Vz|=D+iW0wVT`Cr!W_ggv&8hh2Mdep{P*SZJHDGS*8L%8A3$}fJK+Z
z)$746cdFl?3U9GeODJMS^<2NJINz@;f60}Nrn#tai~05BkWg<9N%0}Pg@Vs<_3a6C
zwsGy}_PblyCu62FI8`}o%GuO<!x&J7)*c3iT$L$}s#Sh_>_t`7yqleuQcK1r2iIMo
zu9jKVa7O4lL#x|h6Of;aD&$5%hM0V#`Q2(%5FeRZ0sQy@k8sg1<0g5gy7OWKDl3wa
zWZZq2N{Ud`Baxs~Br2vYzN<C|Sq++AEn}$PhmqrG?_zEodbu+mmU_AWRy=N?J5+eT
zzE7!vz30eKlFFIFpd8-n@5!m8uxbIC$}$=?<G%V?3(TEXFa#qUwCD6oqXpouJ0X`w
z6z4HA`w9(O12z};D(;eeL3MgzYkh?m!wMt%gdnt*nScroEhl9JqcOt)zPMw*#XvLD
zA#cLHCqU;}T9-b=fUfbjxnx815=tDq=@%jrzo^Rxeui{x0aXeS)>>TknF+%7rn{ln
zaGV$-z8Utz2g2%fUfM;mZ(;4pjQOGawUegF_ET2!s@9_H)MdRic&pmh?g?)n;)^Ry
zieC)Jx=<GcJw5Tcn(b?cyW3g*&hnFlHanFk*+V?0pq>OPGj20pmESF>24YE;rJ#n4
zcmM44k>{b6bsd%hQf{)R>OAMtccHU#<cDyJq=FzSfUJ(r2&wK84qxx~>-*wi?o&f#
z-}U~Qdk>-B6*ZqGAMBL$j(dTR|D${NQP|wdl+9L4ulv&lM6R91`Z6~Tc6n2%gHv`}
za1+RL>}c_;WjCe6m;jw6FG<ZxJHTio`u^-UiN{&%lGKY|Q{>OF-22Kn{s&aEW$BGF
zDqN{fb4Ue!GbfV&9Av#7C+trD5i4%%=Zoh#h!V0}pOgkPg+OmBo5PE$&+x*T2>*iW
zd}<|VJ~>rT>M|~`rlYV|XtQoICDd7-lK4rVr7F=DP<Jm+)(bDz*qcCItY#n@QTC1M
zQhU@EEI_6!3+?~a_9<Nnch}Jw?>oECMXHh~C+e5}N?%|zk{ei6TU}mS-Tg2OnZdG6
zo$3qi-8It;;3%I<h*}M0y1GsSCl6EiJ)p4EazxT3ZW}e9koK;)BrrFb{-Sxs0iYEK
z!M1&Qou(8hj<on*%@F>m#F=V!RAeLk-EQon`%L|i|3u><T&oYU2v&tHoy`6W+v~Du
zaSOV|>gZLj`)^o^pgdW>F!~A%Um-hT3%zkaZ>Es?f;Rx<(}c^}K=k*ByYhh}o>B9<
zNlpADG(=^VkMT++j3XL=JSZqc!M0+m$0!|zjUZ)m>H<w!#+ASY0ZLn(aMK2OdTTop
z6#~M?jSshbhyc4qLE#MF=zipD)lA2_CfqUs_JShglHSzA<A@r_#=F78+Ntb!q~}Ql
zJ0E2J#A}|Q4nV{!2~B3~i{|ELqM}c<3}Ai<fghKx?Wg&$W;s@Duhtyo3+qgs+fdPW
z=y%5~W_6IR5ML`@;<SAQMQ?ESbYXz?^u^v-R%Y1aD2mu6yhtW3(9kZXy#W5~!j9d?
zzR{)FugHpGSq91LCTp51H+mlI?YBXGmQ!@m4UKDC)$H633%FJC6MLa_-8-zHJ*?`#
z_@oZMq*x*>e#q?evmX!}Di{G*<exKYxL9~rhRF+V&LN`vYa+0^Y)RIgbld``;3MMu
zuaIi&P}ZQ6mJ@y2i-*o$yg4f`>}bXTVylp}gEUmo&2<#v_AMSNSOG}X;#$woD^1LA
zjgnb~z84V|t65?qWE$)_Fpn(_B}0ty)mB;1;;GD|!?Pwv@qvuvd?&gwzd3`LKz!+%
zAkc82D@dtd;f5S>EhYL`7v;v$N$d%8Q#tzdK#T*nDl@_s@P^@P2m~>a9O-c_#{_j+
ze{s&`7B_L&<#hi7hb_g=oZjnZWfd-T2#;t6+~AHos3ec{<{qI+-4+B1@N)wt<HS7p
zb1nGZsGl|W-YQC+9Eixzz5WpUyf6x+uH{$KqtT2hpW8n?8>A~bR{n_kowKIen(Rb@
zX(_2fiuf$SPvH{|jwjLZ+8yO|34X%R^le>_{$500A{aRUA>mJSlk0BtEqqbU(84P*
zOQ0`WmzR*=L>)10_&Stto<}pET#w5-<Z^7IVo&<bBs9?z84*>9z^EpV=1~qsebzvC
zLsvQ>-zvStb}%38ZRHkLAlx|K9T^|v`6iC$NEav?0xATFR2Gu%2whrE!+a5pAV@!N
zRq>dI=<Mx(Of};+Pc(oxl(Rg8fxHi&Ctb3`|7xi8o7&&w=I}ev5ygGU=8fQ|`p}f~
zkaaMkixX|DQX~TMs!HH>cS9K)bq5ST#k)N!v3i6tn!8nr;4wwEXqnfpFeL=xo>kGE
z$nx5SVe64*YVya3;Y)|;j`sI*L?p%H7x$|xAjj$*>AZS7dPu^<9fPp|4=c!?NS(sh
zB)ElMXQ^hyjYjqd5QwqY*g)0m;G?7ri09fGkNHE_;eizMO0Rdo_Ex0%E3Zjlhu6wH
zuSx3V1iIs3#ZB)=UKhXex=51r%yn_EyGF-pQdT<Mfg>SmPXAxmo`1J4{<ZRr67KIc
zMJfOB$@I$C2ObSTGv~#p2KVc=3!fS`=kW0GRc{ONHv_HHYM-IQla~*=o^`ucO9h@%
zzR;$AmTteySu>v+=qrJ<pBhEa<u89~=wBFm#tQzU^r?`}{I`!OY4D$DHm7^lfBT;E
zv3;+qUnJWsVyxl1-McQZgRL4;TM@zFWH}`b7`xJF@@JG-`DKt3-6`{dzUzWB(XYgc
zmSDsMzO|~FcJY1YHbUNZQof0r+^%XE>JLtgU-kR-;IMe?wJ1J<OKCvsIfo@ZE}L1=
zOd{gsm(>y)Ionh!cGR=8Ws{*$qiRG(6>0o+IZh0dm4-C?de3;DP*iRreTm!QdAuDD
z)#W68CQ5j8E#e!5>U^-s<C%0~WzuRCBp8hZJ$6+G;cT5%5NsWGO(>F~Vk>XZ(V+%_
zs04?!zjH2?P4vIs`8s-wjeFJG(|$F^U*ACI05or3cg|W{i{4{dp@+UrG{~tKPX`&1
zTJHSJR0MJs7$1Ld(3kv}-=HoKh~f;}vhT#Vwh)U#DG)8gZ8Fw)>p8D|tBf8yRbwuW
zq^xV%YiyE}xKcz*L?;Cc=b#Ud%S({68TeqGP!(H3xmr)}=2sHl(~HB3-rxc^U4>+8
zc&k#zVB_Afh;@(00<7DT@p~u|+`RlK4#8AA1nT8|Zfiz!Bs;D;SbF}pw<l9*s7~oF
zH-5da&?B8x@X5ZM0W~w(^XWUXSmG@=^C%~R#&44@LgyyKZr*nvg)OvYj5=rb@R$Xn
z_|`d!4Y5Ve$4@Q?N%ce?z(RhX1PW~8vv@kJEOZ#rdfqH|cpHb@whgHj-ZCwBC7i_@
zcBEAmzXdC`?mkiW4#}05Y^`r251@QJrV?Z#!B@)KX)fq1IS`$jlv+^+EnKM=V`Y^s
zb7WYor>c|2&bG^GpK%MH@EORBq@CN{Fny^&j(k#6$<GFz3Uy+m6YDije!mQ#6p0TO
z_e2p2+st*N$Y!hFo%Oto3+oxJ@tCVZ{m+L8>H=B^x(b=>`9pqKQKG$o$#}ujxdK_N
zvqHh%dx>zxjt{WmxB;7H?Gxtep8|m^UMr&$3tgVAc5c!JXm|XNfvJ?*5CIdT1-N2I
zSxC?laaNobOIkD`KU%E<+DxjuUI=2wVgn#2L@_NWpDnqG(tVb&*Su@b=-@8uh=F@|
zgLQ%KD~ymQ+hr#PRuAJ>COo#w%%JdzM^+J~a(;?TN@^#98a@kx;Bvfp6srr)y7t=@
zW;HeB6mHkl88IS-M{2!L1YCz`kXux3q^_*6s$vQDQ`_jEh!0<tjaK6VAg4rWX=Mjm
zzrWRZh9kRgeJ<L^#XO2$6_<M43(aCbT~}ljxr-nc3z8n&3?_a4<5}6=0F$40{FT~9
zQ$ZagZ%XNwrdXn~D0I+K#AFN`DqplMt^}$5D<5|W8u<i|BtmkBXpYklR9JBtv-xGb
z{07c`^SXTrgqvkY!H=0NjNP7ofo-fjMLIE}WZh_dGEZ$!<SE{~ou8FJkiw-&<~CQw
zTQ0T9HhGk{Y6QJ+3cZK>8=Sm?iuuGId&E1x5fJ)GKKkwbX~Av&SAV@)8KJ~g@Bhaq
z`wPDpUDUk)X-(vEYqi>KPmK{qet!NlbdcKGNS>$e-Zm1NZxuqGD!695%+J#OO3T4V
zrRDE)=*Tk)#Ag?ofB28mzfHl&|Ie5Lnl+_qrSdi7|M(<-CG&UO|0bbzHjB^GB`m2;
zE&-kaQ%xxre5x~8u4k>~x;uW;`I{iq{;r%SVC}a;7jgJ3pny-PBJBqIbY(zPx%h}l
z&i9!zBy|eIjoG^xH_S0-<ykwhU6z3{8M-*&7C!Cuf?&Uy-yn*34(%o>!gk|a>lb+~
z*@ey61dffEJK1>FGcT2U`Q=bcSo^5^cx$S>D!qs?AjGr@-~Djf2UkN{@$!eVYp1Mt
z7!BZgEd7C<T3S>hFIU);M|9b4g_NSPW17)aWI>#=;hMUN({Aj&B5ikRe}Y|H4<ZSy
z!F7j)dry&DWTgw}-Hi>5LoWAOPfsd$!5KA`*nuzFp{MS$^hvbyHoiO^Ql6^+t=SJ{
zo_38VVlT<2G+E&?lG9?Da%{EVb6AB4NKmP+OvGhaYk#Z@AR$RDN~%@h8#R=DORkuW
z>Q!?8)M7aq8*-$$&KQ1Jz=p<V#!Yta4UrJpc6?yS$9cEL`i|;!g-69{&!bPeI?mPw
zm!(Fl4Uv(IrK7o4A$PO^$#=8mf{oxpkwV(iV*Kk~D<Y`wd7-;CMAp9$9#^n?vRno6
znaVv1krbT(Lb~h3I`=;7x9=XFrX94|{n3$WnQ9SkboTT~N<wGB755yh{SIfGdur4(
zSSEMQY=*>U8nSbRiladiw^B_wT)DEqZrM5?u2|`<`F!AtNiCTzJZPKB4tpC}!9N*@
ztO$tX?XvC|fhK9Qmt`gsXHV>CMfKWh%ET0XRz0JQl+jSe;avhlHstzV%Rtas{nl|Q
zN(J0f1O&)ynkj{U^i#M$lASkXb21ZQ()-1%VdqB29cNF~BUXl3-D`>;Ek2KQ+hely
zlx2e*WpK&{L;SMh07d;hLOFB~Ff}EV#UOk%?HBTgUFpS$;r607e~A~C;jzf$>TS`l
zS{)jLV#oTHrLwgxz8AzY?S`CMR(=LCtU-y&%iWVeQD;YdR~h$nB5wAWyh>~!h1F!l
z6YdU}e&KTOc>fRtUEQ^0t)Y3}RNh}8I{f}h`K6-2Jiw{-hu7hXapd-gWHr)JTDf={
zth0;mxHme5-b(X3xkP4V=_u86<i%eCbV$?^v4)Fq)~Lx8XPKY12y(UagP>U!o92=>
zS7xO!_!fICy+QiDlsN;%iRMPd%tR=%7E*eKP6*Q1P=_-EZ<D{eva+leKh-kkQvzJJ
zXum;Q@^YO^;yHux(0gEuJxGm8!mVyp5Ac}Ni|<Kqlk&wh@Bk9G58mFq7P$Q&+>(ti
zBQTzqrV$UxiK<piQ-pq{7CuOla&b$oJTw<2VuN{^$swnTc8`k&{Zi5GQ5ItIq|?fu
z!zB>>@5Q*)Yti9f3yhPon9EsVEcHZcujlQzq5iFVop&RLcIofF8oGlJ0eEo}7fs8f
zHRn_GRmbi%Ab)n_BgK_Ed@%H!tE(U@(UVDGLAz3x926L@ek9X+g0~wI9wMV~<9Bu0
z$C@53Z(b>dA3DttMc07E8Yp<&$)d@Ect8S|p~$R_T7?@v*P+Qyc8?Z29di&0DmsW=
zkOle(we9TrbOQTWz`m%|mh;YV6>TkJ2bpGE!}MC+yAT0LQ9oq3hy16^7pXnA8a@Oq
zOT9)J=0Qbb-B_jq-yp0ruLuWYC=843?N_AdJzI8iB5eZmwM2WrgRoP=q5cG~l1cH8
zmb#s9lKV|RTY@Rqa3PmvC>{qaaC;<WSb*-@|E>&O(B5m<<n3o;Dj8x=oX(@!P+lyC
zywd{da4X1RBx|PJy$gcjg;9(5ARvI~x_lu+QgBM0UM$2APuxz+#Dq_A4(e9XI|zY%
zbtY`c{)Kb$UfD%hrA=|3`iD$kJ*}MQa;RQ|eF|Q33SJsIts-ppi$;am<a0x;QgagF
zsMvI~-3ykV1c=pLq939T>j!>7?yF_Zbnn$uD#z-};85q}le{AT^CMm%^(afnNv1c!
zZD=gQ`Nca}k>k#BDuSpPm%YX(?FqwJO~r*gk&7o&kSKwE`v}|tfUTK6-$xb)uBAQP
zKO-`;u*qepweN2prL^~n402u7ZXMG7NdV-ek@o5^+m4Xinof3LvqiUfx17wE+|E=Y
zoiBrNAqVY;car)p7cPA6(Xp`r$i4sQV1q}N3Qyml(q83_uyV|6{q1L0W27!dmoM=a
z4;TdB{1}WU8)*mauSup0H11Dw%Nui^ak!TMZy&CY*&wxbWG&(^;%D9XCni5VNuPhf
X{zjy@-uwRzGd9L-Sx^6X+c*CWKUt!?

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1SgemmTraits-members.html b/docs/structcutlass_1_1gemm_1_1SgemmTraits-members.html
index ad7350b74..df926f3e4 100644
--- a/docs/structcutlass_1_1gemm_1_1SgemmTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1SgemmTraits-members.html
@@ -73,19 +73,21 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1SgemmTraits.html">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a50672b5fa67d858aeff8f254cf28e941">BlockSwizzle</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
@@ -98,12 +100,13 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SgemmTraits.html b/docs/structcutlass_1_1gemm_1_1SgemmTraits.html
index 87da28431..644e28553 100644
--- a/docs/structcutlass_1_1gemm_1_1SgemmTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1SgemmTraits.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -75,17 +75,17 @@ $(function() {
   <div class="summary">
 <a href="structcutlass_1_1gemm_1_1SgemmTraits-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
 <p><code>#include &lt;<a class="el" href="sgemm__traits_8h_source.html">sgemm_traits.h</a>&gt;</code></p>
 <div class="dynheader">
-Inheritance diagram for cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, AccumulatorsPerThread_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;:</div>
+Inheritance diagram for cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, OutputTile_, EpilogueFunctor_, ThreadGemmShape_, kScalarsPerLdgA_, kScalarsPerLdgB_, Index_, GemmConfig_, GemmEpilogueTraits_ &gt;:</div>
 <div class="dyncontent">
  <div class="center">
-  <img src="structcutlass_1_1gemm_1_1SgemmTraits.png" usemap="#cutlass::gemm::SgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" alt=""/>
-  <map id="cutlass::gemm::SgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" name="cutlass::gemm::SgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20AccumulatorsPerThread_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map">
+  <img src="structcutlass_1_1gemm_1_1SgemmTraits.png" usemap="#cutlass::gemm::SgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" alt=""/>
+  <map id="cutlass::gemm::SgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map" name="cutlass::gemm::SgemmTraits_3C_20kLayoutA_5F_2C_20kLayoutB_5F_2C_20OutputTile_5F_2C_20EpilogueFunctor_5F_2C_20ThreadGemmShape_5F_2C_20kScalarsPerLdgA_5F_2C_20kScalarsPerLdgB_5F_2C_20Index_5F_2C_20GemmConfig_5F_2C_20GemmEpilogueTraits_5F_20_3E_map">
 <area href="structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html" alt="cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayoutB_, GemmConfig_, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, Index_ &gt;" shape="rect" coords="0,56,4915,80"/>
 <area href="structcutlass_1_1gemm_1_1GemmTraits.html" alt="cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;" shape="rect" coords="0,0,4915,24"/>
 </map>
@@ -94,10 +94,16 @@ Inheritance diagram for cutlass::gemm::SgemmTraits&lt; kLayoutA_, kLayoutB_, Out
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
+<tr class="memitem:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt; GemmConfig_, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>, Index_, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a></td></tr>
+<tr class="memdesc:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">This traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">More...</a><br /></td></tr>
+<tr class="separator:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a></td></tr>
+<tr class="memdesc:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The struct that consumes this Traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">More...</a><br /></td></tr>
+<tr class="separator:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a></td></tr>
 <tr class="memdesc:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The configuration.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">More...</a><br /></td></tr>
 <tr class="separator:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
+<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
 <tr class="memdesc:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">More...</a><br /></td></tr>
 <tr class="separator:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a></td></tr>
@@ -118,13 +124,7 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">SimplifiedGemmTraitsHelper</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperA.html">GemmTileTraitsHelperA</a>&lt; kLayoutA_, GemmConfig_ &gt;, <a class="el" href="structcutlass_1_1gemm_1_1GemmTileTraitsHelperB.html">GemmTileTraitsHelperB</a>&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::<a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a></td></tr>
 <tr class="memdesc:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for B to load from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">More...</a><br /></td></tr>
 <tr class="separator:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamA::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a></td></tr>
-<tr class="memdesc:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for A.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">More...</a><br /></td></tr>
-<tr class="separator:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamB::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a></td></tr>
-<tr class="memdesc:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">More...</a><br /></td></tr>
-<tr class="separator:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
+<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
 <tr class="memdesc:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">More...</a><br /></td></tr>
 <tr class="separator:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogue.html">GemmEpilogue</a>&lt; GemmEpilogueTraits_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a></td></tr>
@@ -144,6 +144,15 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a></td></tr>
 <tr class="memdesc:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear the accumulators.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">More...</a><br /></td></tr>
 <tr class="separator:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, GemmConfig::kResidueInProlog &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a></td></tr>
+<tr class="memdesc:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">More...</a><br /></td></tr>
+<tr class="separator:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">GlobalLoadStream::ThreadblockTileStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory needed to store the threadblock-scoped GEMM tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">More...</a><br /></td></tr>
+<tr class="separator:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a></td></tr>
+<tr class="memdesc:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">More...</a><br /></td></tr>
+<tr class="separator:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::GlobalLoadStreamB, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamA, SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA&lt; kLayoutA_, GemmConfig_ &gt;, GemmTileTraitsHelperB&lt; kLayoutB_, GemmConfig_ &gt;, Index_ &gt; ::SharedLoadStreamB, GemmEpilogue&lt; GemmEpilogueTraits_ &gt;, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
 <tr class="memitem:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a> (bool in_loop)</td></tr>
 <tr class="memdesc:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">More...</a><br /></td></tr>
@@ -165,7 +174,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SgemmTraits.png b/docs/structcutlass_1_1gemm_1_1SgemmTraits.png
index 3e5427bc9d67ae9948cae9f0bbc9a566b4afedc8..66feefd3d77a323752398fc948260c6a0b608707 100644
GIT binary patch
literal 8476
zcmeHNdsI_b*4NdC+FBXMX;D$qN~<j>siH=Kkg+JXTBQnzC?qPiv0@Vm5b}=JDpCfc
zwSbC{PpC$M5RqbdB)L`w;t(MsjgdzP5R*Vc$b-CJ_lpl&tnEM3HEVs}T65M-&dy5i
z+57C*`R#p^``OlwZ@f1DwJB4kyz$A$>$gvtGAGPOpPc@Z?|su3M?d#Xb3gkuegg=C
zKGI+rzH&S3w2yl7x^?T;&KklF-^b~h+qcF|@%`xWkhI0Gm@?(<%1_p>iziIg$)vcx
zk85K(kLOPpfI*OX7ce(QV(#CCmNKqMW*uKze08^)Sej9)Ui&8|)REeQ>??nCX*k*8
zm4Eo{LAIB~`cL0p8bSM>jlxk}m82G%NSwy&H%0t}tTO7ju(2jU{eX&~Q`21xEU@MV
z6H;1D|NI8x;iH5wpfUgojRfj6SGXbG^Bby4+vuyY&{PVh2O|Ta?LGMmQI>U3oTmH(
z@9A{T<<GN{ke`m>hz-2t>QE8tv<SB2Km{)z8Jt+8EZXjfuBfji&ftH8{K)sY^>2I_
zOk8NKqQ%2)P0avT!bWDGMmETpHdN+N-M=W)4cA^0qkq)&plw2Or6cz}`_IwijCb4g
zW24Qp2(Yn;H@BiC8BEz=0@M>}VI#A&nh-H3`<SfSc+@ICU?_+iP26bp>oCQxBqnLO
znTpm9Z(ovk*FpEwjli(nUEZIQyk8)^!`D1LN#3CuCS$o~-$MxDN7=CI$u7JioTKG0
zMQxjvmvNE;)F(>D<)IGMd*;8AW~8JP7AYv%7|fDP$wqgs0gI_)OZyT@Fc_-jZr-=p
zl?288B~K*pQC!kAh$B~mAD6kU9sMMCJm0YOc$ecdBVo-Cf-GyV8p5QxtvcO^<&vqz
z0%3BZcysSmS^|*(X!vZz<=USLnTaoNjsBTQrKZJsubTg6jOvd@S6>+-{R2God2B);
z%Oj8oPaxZivM=z)^!kxjU9EfHqEMJvRAtt9!RS0EVg;6SQ3)x%DJ@+Oc3gwMF<g<M
zM+87QDEK>}i`6YJ_kCLJdKIDu9eYr*XOt%2_T4b0DNnGp;PLj^AwW<8R`)}3(vQzf
z2oV1cAYesFv~r_}Z^&r|8Xg<4rcf+(d^s&;X>USoX*K+=rAy^X_l#JS@e~X_(rYSv
zNn8pQN7zPdDDac4B4L!z6U6VfVfCXe^UOoHNS#&e#ETu31-xB@YSbxGu)mbPGRrck
z$+eL9LMo-H#uWmyHizU#ag2xl!o4!|0W&lRZ;nUCIFx7LtDKQzab<M8J8`XRbe%0t
zR{zlA?`d#bh~F1sVT>b)>sO%yFnip(w1dUc$!gt<j-Cx~@kS-O2-Fo%r4F#(Yv^-A
zRUoMwiD5t0fxpTm>P`xV`m_Lq6+pRT`SXZpHbfK`-P=6;o>}*jQ;{*gsSr3cnvrDp
zyX{j#|L)7$00wDCD0-xIv5PoT6M%qk@#OtzH+u<DX=3JU8!dMO(meaZIovx4WR=gM
zYth~M;Ze&!__I|>EuxELCncQI>e;s?l$o5EH?D~rBhirb`N%Paw%uWRWdHcOzZRD<
z9-l&fxRtv?U$qBVaRUpZgH3#uf0FmS5g;!1?1Et|YDcP>S*ir6+c-=DILMPp9l|av
zfu5D*ElDEpe-nitZk;jykYBVcie4W{?nsWzXEvQFfS#yHMutL*z{X_3stBLso3=Y_
zmrdjG*G{GRV<$FV8D~D)&`_6&)%S@%A5=F3d<i?xRFgpJ9P=#YUvvs%P?@%}MA*%{
zXsghI=hcK@mKw6Upo@(g8j<~;3W;-Ct|=mdY+Omqn93=G7psI~*0?3gb3i#V)qLo?
zK--;d;<o*FxZ0Fag?6f^Ue`h+ggiv-ED9JI-!(r<d=E9hJ7j99TBdHLQy0TagMhw#
zR;4t+pqXkOwW{ZUtrg~JZ&?nqeD=me)R5TT@l;S=QirxB!(U^IOr|w_&(g*~z4EMX
zMMEjV!n`1uKN?c3xr)AA&bskb15%vBI=aAeEz=xd_&5caa^f62f{|!t!dtpS$d90x
zitcef?G&n2UlhvcjxVV-)DFsf4@we<`wL2AN5`*V&5yz#ZYxr<<DhfwXI%=@&C26E
zk{}s#G9b)8N;E}cX*WH7iP|~2rho|7ArdCbyyG^nZyEx@?0~s48?L}M(#W>R;x?%k
z{tC@HlPoBf`&q?-dmwNTcBb1u1|M;29Q~8J6<ma7R`nsqT0^wPL(!nwdC6?8FbDWs
zoarW%xR<lFm%cg;swX=B-az~gh1b_vQCGTZuaqL37{oH{Ma4#V$U=C*Q-?>K7d<h0
zL*r6lZ2{^gJ}e}A_2aE>9?qUM?AP9&mPAWkhB$ki=?7YORED<guFP!e6y+1jy%r@C
z6o2P^P)7fPp3E?}JOI{KaH=dJ%xa8dNu|ZO-oY>7I}bONL+7ZvqX=$FI4V;miPjz5
zf<XZoqu?@3!@t2`;>RtAfO(_V=trbIl7t3gAtWmav)&;&lcGDRu0k%eFKML*q3N4p
zq0A75r=d=YT(HUiC(L38WarQRd2Yzl4Tq(1PvGV4Xn5n9cz+prI!;@I*UoU>`#HaY
zqI6t;VqxH;(8qzjS*fXTcf<>1R^2;e6NZJ{(~H{`n-*jxm9~47>uHN$2iMtQ+#XkD
zrmW;tX<JJN$&!xm%tg=f;F#bsPrBj*mu6g9S8`bKFZUr1%I2ISzAIk*B(;6RzX5RM
zrTSxeJ|{N{nF?pkA_R)=wyyb~oaj;7*MZei<0c{xl#mk1Dzq}^6GB5!)L%x^XF|Kc
zOCqsKKUi8G+GdIMuZoIsw46!#K_7QS)FHof(r>k+{v+{yBQsl}+D2jW{JL!SxQX2R
z2}f8AAZr^+)klxO`lW!ZF6*e5p8f#2!#jJp4sEfdFc|rHRwgL}(a4%nPwI%g+uIUt
zZ@gcdF{U}4<O}~I5j`~&F)RJ)@tvsT{$PsR1n+k&`o$Y;e#6;nm2jE3)}2H`9lsjd
z2AK}3c2tta_7zm8!hf{S9r`kiM>v%t0k&F&%)k?-p$c=2C%x`{Soq=D${2OviS*^U
zMO}`Juc0oB-wth9u4!nx!_pBYUjYqw?n|jeW`tLIk8%||JmLo8h4>T~HpYrr!2}-U
z`}KPwgwC-fq($x7PKGo&Uhmi?f$k1XlwD7*cJh=s34L!xa#r*92F-Y3TLM_}UZ&)Y
z&BJW*?vD~Z=qR~SI%eMzXIRoqU(||4-V+~pkr_DvZYHZ%b5`JIfbPD^Oo^g-`7%d|
zG6DQ&1dM*bS{bDwZ3DZy-37181vWb70Y;W&fh75O-k9LI$H!AN!SlS2=duZ&iQaW+
zjLekr1)J85eGSYbyI|1!YO4@@5Cmw>B4fX2gKK@vYrWsrB={>8DgC~!`MF)uc6oOW
zaF0Q!PN(m+?(obJDcSTr4at@-eFS1(MY6?jX+dSwS3Y9evP(W?`FOG(6JNnt1Ge_N
zkXa~;U|EI)VatB6ZRFYocEulEPHjoYAAfs+4fOw~Zy%3TM~X8#{{0D<GIwIwyT<ms
zFa}<)KX&wm0mx;tg)?6mZp+x%@2!E&wt4(sePMWU*>dm&j(Y|;+0$NnVW4jP4nxY+
z><?cUhFAK2@>My%8UBa=yXbF~`u|g>?l1pD(fO=q{XbuOPOf}eIQRPrz>wW)3)`8M
zFs7h4QK&{C*VW6$IA{)HzSQX&7y8XqR(;EyVY-nfUR<tulbgmnSFS1J`CGd`r{ee0
zv+d%g$gBj+p@QcUmh|Ft2~1P50I^8|wa*^JpJM_7p4C$X!!!x_jqk(sgsKvDh%MiX
zJDnH-daq)n1Xg!;bAPFV&9KiIMDPec*imiPx+YiU0$x|rs)V?SD`SDsCWQ#-UgL-m
zEAKBwLV{7rpwXdere0>*M8URp_aS9cnA8T$_Y7KGetreCmz#!%;<{oNHq0FoO_fi(
z)@VKdHe%ZLES+bY?5goY9`g;)u7{#rV7bB{;T<tRkUR~$4|_rF(${^!nUuHJmi#J4
zoCWMRc6IgULpQ<;^0Yz*&N1liu@(6zgp-2B7aBmkq};y~qDjUNu6UH%EC>1%>(~CX
z2pe04+R`pOmYm5U1?w4_nEax%aVZ6i9P0idj@qC!dyX3P%lf+pO6kBsmGVb`hL*%{
znYcWNtjYZh4airF=!%(2Zw`|=1|TXWo%yDCV@!b$C52$+dUB96i&4sTmv@R7{%}&Q
z1YPc4vQA)empRa3R@K!&J*k#1+3)!KLsua6@DOv0+y^8&h7w|xq+rB-MQ`?wUpQ}(
zfN{_DO1$!j(td#>DO}+35M1dag0>A+OsTK@s#XMMCHZt9-CK&GM>tbUazdl5Hg+)s
zPIu#zY!wZ8oyctO__}Jg;9Ng9#zN@IKLua4Bc+g$!(VHZVi6xD$I7vOkL5^da2qA3
z_5G9055_)sTsrA`0?DPS=>usFQi9go>qGsE9&HnE+8C=0zuU#-mLsy%!TrrPVIalj
zTzMkTDa{s4|1702c3Q(c1%I3DLZ3fYlHedblrHwRtnjhcKVcoKEDOPY!<$KSP4;ak
zU6c8oPRPPoxyaKi!7}8KV7XK?97BAqyEAL8=0;?i%BvuE(pMXIHk``C(Osz<A!Ktr
z*j<vy-I3zTJRPt+>O*$k2#JbgSDG*nh3D7!Zqi!!Lqc~s=M2hs^H?=-kQQX}ghw`6
zRPhOuO@VmM6sk3+m{=+qbT}1UrksX!SWV^0NRFbw<S~h~Qbfu(#Ocm^n#xW+Dl|l%
zZ9-oZt@9Z85dUUky{GjEq&kJ_jz8_%B~GOrh-ds1xI~3Jh4BT)bws$CGQ@1RC!Exj
zxsN`MivX?R(CV>b0rKYL43Gmn7ol;Mc^f4xPi+&MR_=!%(jA1nZi*0+XKTmzqM8)2
zEJN%GkohodaxB5ZCx_Om1V~n2rSl>kpD59fZ-ty<()ICVwI*j@JoTP<9(epZ7voTi
zc4jGI$LVti)ZDvO5tG_{8nEd%^6V9+$5Z<eyedt$V_Aw_Dl{_C?y6bf!F%*&l!@Sa
zqG0rM-Zd%qpW?UwJQ$m-*Wc1U?tc!b`EcI&>qmY;VhG)=7x2`pf+G<VVD8u1?vlx5
zzXOO+`mwR!S;LF}eNYDd0}My{F9Q250{t%l{ng!=_yxk{!t@2cqyOKXjIXTu-6DbF
z%K0T6ejxyvQ3rW3GQ4;pm;P%^Oi=dTg>vuS7gis@X8*dle6-i-3fMZJ=!Nif<SO->
zs5DT`fXr~lw1{6OcGo4oYAd^MTyq_^WW0Mo&a?;AT4JDv_|Wi|Iremm>~a&wa6Scx
zvVAe!TS+a~wAd;)W0zT&2TXMdgc`=+8+!E}-F*F01$i%`Nf&kYhiBeoXj%~QkEfyy
zi0yc{*Ez!-bUWvEA3Jlrm5HFet)lh<3m!?9M*@bjj)ddV05VZoa*9uM$ktK!Y!RTS
z+@9#;;?eK&hyZ+deK40TSfSKIEm(}HZeF8z1a?ihBpl4W&g{oCKi>XKA@-D03tOKG
zVCeOMwJ;k?&!khF#$GO$CCzE`b(Sdtr{VCo^dGIwS{o!Vm`Vo@nJx`&m{XKOTYJQH
z<ghMm9qrVDY8hx=`8^~HYaS@OpVyh(N^5kGh9JA^M|+#|5us7>)N{NXGIo}C@P1r@
z@JeYN0UjZijwW%Tg}Oy^Lq!%I3PxEw%;Yzo<BLLKMR>Y0{bNHPGtHErZ(R9$>=|T*
z*O)6P9TJ}NQwTRW%uYU_i#qeG^4x3AJ+tdTA{B8MAd;Gl%7KdHWDuVWuBl;0^`TtE
zZ-GRY`m%OYQ3_$E*`uW%FHWI3te?FZs|;Hg+L*&KW!g5#)U{SKt}`gPP<Uoxa$!Ih
zWwxzM0V~wtOzBB9{O~?1@|3+SANF8$?^m2+I{GT33b-*CO3qq-TwI;3uYe5pBQ=Q5
zM*#tfMLi<^H+d%Sdihl&j(<2ID$v^8JLY+pdeEcln5eSFuJmio&uUjrqfc^xI$qlc
z8pgYnx$bz;U<{E>Kq*Ulq{|{1=Ab)DVcuKSLjp>Z<}P9ejshM-SEJPxO;Ria>JPuY
z-_dz1znkdM2{yuZk+UE9^GRd-<G7@(hR`B@{o1_xV8$E=L2YpZ!=1I4qS8iv4>C~C
zq%A11_pBz7%OHAEMzP`s<?T^4S4RHiTNW<k+JujODQrJG_gS<>jd*W)yw-N{<3dHD
z6JBP8IW9dAYp03ZvifXkAWtbMU~NKN;2p5mEMdq)wMZDA?r02S`r#5Rs!VusO(j=Y
z#2QqvBk_tAck^qKJLI(ip^H7FxrV!`oIrTBG1?$JpszOUPfO$iD}Jtg!@SQ6$?i>+
ziGsx^vf$3_LTBtsM{8?+!y&25PO``^3=5ku`dltvz411U(919R;jmK0m=OLGq2m0k
zXC*N(@KpHJ2GC=&upfB1$3(c<rVs80)G=?P>Og~M`4E>AOKrSLr>gU&)GuYu!iBZA
z?5SpHarORjhlB3yAKg8N9yCxD;Cq;-v>#3iBwMcaR2{%pb?4VnJLe@A_~J0I!-8oF
zY|DQK=tLzKAo?EZ@{JGL25wLem-!w>6kH+%L;PHWU)hk~4OJw6zVumt#r?HHxqRj`
zL76tsEsu)aKyPyDjIL;<Yu7ATTihM(Ip5U0%=YGj>NXoHa38YH@D#7!uJfVg*@}_d
z8)PgbN=96D-e>cmi29}C#&nB9w~FwfqiQQE+tqy%y36gbRIO^7`%u|Sj;4CH&PuG#
zaZ+|dSt{UwN%9uzkPF5J&Mx5Ky-%F?CXLyR*Do1~Q*gO~&qSs47~OMEJWIy(M{8&o
z8{|lU4^lkFUNIKIp&-udp^->6;W7oF%pRBY*q}BDJzjt{t93;s?m=>2-Wa@(mO8~x
zS{+3TzSBInw1qIgZ~rkdhBjZ;W$?AW1;<^*9BtIrK8qXP=h*2Q8DgA(s>~ZW%*6xy
zZgUEqCapHj`XSlB9o2EG{ZjwN#sfy&Pmrd=4c*l?RWk+7yx{W_#!5$9YyGb8SRYVs
zzMI%P%zsp`aVr-S4=TF$BKXf|lE`ZlnM7`FnB!!Wsv$GI_&UZb#L5S(Ry)s>1_KLo
zUFEePCW2mX**yq)7K2Th^(QTk>-5atiL($Ij{o9WVAF?OBW~jyXGYy%Mt?5V?IyE&
zA`%gQRRpC{R^6*Are_UBt;X56RL^(9cF|WygS4~EG$YrhN26))jADE6e((t-DAzz1
zf)gH{c1jU8&8$AyjCL131cL5BTk479%#t;BzSq<5ofc+B)V&Y%oQKxvo*sDvn<Fqx
z<+HmdO@_p^0?$Men$$;=kJ+t$zilGD^b);E(TjMY8939eJB6JPZSvyWhy}v*yXgyr
he`2Cc1*a8_9PQM!UD@ROE5npeHf&vA{n4JU{}=7)gunm*

literal 8487
zcmeHNeO!|F+PBl$TCZ+-%2p}cY0FhAm8YzHVOyDJEoEg&CPJ>2OG^?&1O(RUZH<yT
zrDUdT^(+!omOiGaa92((NzII~6wnY+5D<{}m;1rZ&fHqhv(L^s&tK>I-0=I|pZosZ
z*YA40zt;sPKZ%W=J!9bvFE6jzAN_UHb}uiV5YPO}*QR>Dx9mIonP*t=$<`fFAP9P<
zqo$#&ckpLCvmZXUZr$2>BPYRg`dZfZ*f=lGP2(hL-Lcxs>#ds~ZTetG&J>MAiS2p+
z=CRIW-ti<bS}><_)Ak+M3vW6yN_~A6vgIFu_!8xMC9wqe`v;r%p@bOGj+Y%SQ*7$X
zuf~Ybx~zZq@^X1nsr}s+Ccr`D@^h2qrUKb?bJ}Srz|WM)BP?2nTTSl)D2}GH6mT@x
zwd9=Z_EPReTe2jF*l&K!sh3t*Q|DKcg28Gc`As>lD_iFVA6%C_(Z@r^{>+ZN_zbpM
zTYdg|u#kQ)IT*@h3PpQuGqJYz8A18X){hmcO6T_FwD;x_)<VBwKKOV@RoPp3*)lk|
zZ@)|xEh?A!x%uS@ri(3GpeiZ=UiRU}3^Kez{c4LlIq573L{~l-P|z3W-3I&ndq8~^
zEc;e{rmXbPhO!Jw_6Y=k%=M^@B;uEG!vX2+Y@m7CQ`(i=h}auwzbEiZ3fAX_%Ey@D
z=Hg-(ugY2d$QnZ56~P3h4U%+QT&k_eWxY~mPEWPb1MapkIP?@+UuQPENT^U4ur{br
z;kyyJ9O@Aw9zlIKA6D>HSkbru?`Gi>QF%rQkH>lt577tQ0eB(~%D8h_(wmE44P7qi
z>?{75)jPiPbjArz5{vk``|Kv0rkHQBmXi95XRwXYP4bqvP2X0bBWaE?O$`*&!G$eH
zBSEuG)kr_wuuIpX7DK2z>~`vt?rBFPrTQf*i$GAl42UP?Sr_P{Q!B1MBb|bURw|dn
zyWHKXxQ*OFVOR{xVzFe&-HFsyZ!n9LiUblK1iy)LK?-XS?FMgnPdfZEc>j8Y_Ye=K
zgDrw`(GhP4FI6`Eu{Wlo<yF=onEf4>eHTmQH6YzZSX&gjz+=8|v7&t0*;Y&TLrLJ%
zCk;nYA40#8g?}w$6$t}@E~^4%ZS0rzrp0r4JB2-Xs`LY2VYcX;G95N(CmJdBZl@i)
zJhBE>LM3({E>a2)Dl`0r;v+d!q6&vkbZ@=vG`FKJeE^+v-B-dPH4QiHx>q(&;KDw_
z@oL@WrDfg-_;s;5LL+yajzICMAgKLgH=Enu(#AC5B9k|d4DlLH8H7v78Dnd;xXZL`
zCt^L>__d=t136-+yOD0vB88$yvZT*DP({~)d}94c<M4j6B@nz)m3{UVC>am7GxvjO
z4sJwNaE+U815h`aMQI)dpn}0;JSR5$2Nf7}TNT1`a_VN(XPxbX?~ctSO{aigxUIbn
ze^)>kIgs<+o2;QVPswFj6#2GL1-3wYpi;*ysnbi0kAT0@;W|c7Vm)Q~V$tc)$M&Wy
z6y_`oRnB;)wXJG|kYy${OJBpq=~pXDV667COkn3ZVSrfltigW1zJw)a9cMbMB%C08
zedOGcrn+89c)XZ;fK4v6Bz%W{^9i#Ea7)ledLVe;DhoeHEnj4@;~WcIPpX_XP?gC?
z2du*|@Kn;%5-m4aNZa=qmDt4etHa$1$LsdeYrH*va=)p|`ndRd?y6HBw<q$PVugYK
zB=HBw2cY?wxEmWPk{dJ!#tqMWz>V#kHaIAK$mio==Z>+wL32V`aBEA#a8x~`Y7DDl
zEu?fx=qSmP)vPBFagV;eqPFUmI0m@zz3(uIXkjO)1Li6S+2&{a4TFC`Mb#G$vOCyD
zQzRu_VVjZ_@)4XoaIFaYra?pU^@#nxEQ5RlBAsFOQDXxrsE-?aX1TsS%b(k~Ru>uS
zR)-7^FSaQ%!qI%`7YOgKi+V5t?$dF@9%GAQL0wzVo=dEfn>~9#SXg?f1sO4eBQzM+
z@xj14f1To-W;HK^W$%bV&o<}B;2*^d5Agy$$xEmJtC0d&ShVDPUWsr!v9w`_`_OXP
z$4%<%4Xu}p+dT0<HrJlN%x>-NZ8L=Jaep?Sy4FcfDz974z5Y=1y>u;w9U#7)R~LvV
zCKcZD<N;<)a?pUtsK9RQExcW%ymwHVi*W=X)IKK-i^9ku5ta=kXbMVuM8|?Fizs!-
zuKFbaK+d>oFp)YAV@gtL>TRywFpHOCD3O}l2du1gOvzxq!de8<FYyz3EN$}&b!OE!
z0NM2k$+5$Jnoe@9vtc@VxUoI7gO5>Cqv0^t@(wT}P1gWh*+o|~AQTI$fY7eLlCdSa
zWABf?4j(l9AZkUh5EH9lmP^`NpNm>N)xHsD+*Ke;6n1>puWSVPA`ac~c)0{KhFu~p
zrBQ4SFy^5wX{=*}p*}0<wi5zO)zwr*mnaBUwF?42FY9?y=4}bHuTIG@-|kX&*)E50
z{nHTXSkR8AGlKZrbomr#LlHOC(YD(H`LlRxSw*X)%6UzQ4QS=&jig2Q-XvA`u@->E
zms~-T+T4n8lTwNzXTF#G$NHiH+U{-WKm&~^rQ)Bu!>Y0|pED#4!=1(dRW~GMyk+rE
zx0HMhyI2>J&kctZc&w{10B3}rv}V}OBLxE?`MMek?aPV8KBk^F=D->Mdv0`cK@ktQ
zbk`#={3s1q#s{{DB_0Psj$B7TQhkeS3x}8vXMnk-m_1U~!4zlTDGo5Up#ZHZprnu$
zb6zHWLZ43FOG5(^?Gd`i!G~LPa{J9c%g}(!{FkpGC%WZ-bk(9-Rw#zu2z9ciP?t~J
zdPnG|KfD{hC#TR2tIG|c!L;jDmyuvrrz-9|dhwGed*rm*5ohr!>+W;#6<O!<V6xNo
z(fU0G_XPojLdLI1ekI3kP4YGEZFdornrJaC`)P(2^lpDDY?b|iZ@w-NsE2Q4cDivG
z|7c726hucM#F(vrT~LvQYftuD{o`8?b6>%JJNU;JH^*79gBn}P4nu#Ym`Hmr_Y{}5
zH@9A~R)~4%SiT9r&HcV7_3aXs)8p&%OjnxNuXhynH{nJ&ZhR%oHMZwHXvr2x4+KHS
zvZwlP(`IQ~Rt7KCV>bZs(Y*lm)9T1`??Lm<pmigf0%B*UuX>m1VppQcN1B&pf+@B8
zx8pTHNF{jI=B&=h9o5R#KPGe-I4~XasiV6M?7JTCs#IV_enJJOBPkf+3JuIJ)9zf3
zph&m#R6y$VWPHoqI+d~DK|HvIrL(3JoL84w&-KIJkcUEtly_YGmPYjY;~s_|p{H4y
zL60oK5E&@dI@=8#mcG3Wa?!<M)S(`MssrvVM=&x6EHvGsy>5pl1|uX@$O?OdhdJ%G
zhgXT`HK`2BFLS4Rcv%9!DT~BRPd3R6KE*tO&{9}x-wP~rLbV!M!(UlF5HN}1<iJT0
z+c<9JrFKq-eMNIZ@_7b<m`W7EtsUO|v{Z=uLzr8>(K@rLMwJ@KETi7R@>E>~!g$*E
z9(Dm9IU^62B2CkRzVTf0$k;V5<9-6W&(d}uG6!uE1mQ#-j{3QZe>=Q<DfIm<;P#)x
z-s8|6^jh$otX=-QU!Xq7sMpjNhz6WEG41)fpGK=XB0StvTKtk^+I}@;)(hlR_zT>(
ze|ht*TWH;sS6?9a6z`QU(5QFL7l&UU+O4TC@S5eE`kSQ#zxXxTru~{^u)hCn^*8#=
zzf!BC>|!Ocomis0^!o?*)JySkYhHTL_+5!FzZz!}hZVnct>>}-;^h&{@hWtlrwY~G
z=9C#0fI@|uE)zsZ6Yw2kVa*zpT4#a4R-Ug}PF;FeSRvWES+qhc&RG>LiXuWs+CHOX
zr_c!2jzAPXUV9*)Q+n~IL+nYRlg?GV#j-6TsC9ln^@0u%G?-1y(2RNkzwSMPE~mVh
zvx0HjjXi@11Krm=4A@TyjZ&7J!?61F!y0l#@w|#LwWBJHbM^V*CbB1=4zA1Na%H(L
zr>3h$CTNHN+}Cn5T|LS&Z$^HJ3|bbx*2vE<+E<~Yt+6x2T$uCPSWtJAFRO^Ez1#FU
zdX9C~Zc%l|A8nCmIO#fuD)uy_(II`nJ;uLe4GW>_<*Yeif0G9R$*=MxG;R!WQuCl~
z`1&NVK}(*lM5fJMui_z*FhRc1n;{km8m>L;#PRkI>U-iDs7>HDW#vrf+pL9dyXnRq
z$=iZla)v7{Ez*DBGFgNp(smHi8ZKQ@adN{)R`}2&PC(f@@1rz~zGND~;o=lByWIB4
zPGSNd{c;P+8mNHT0uj(iPHJ4)l`sYGS@Cke2qr=*kXkm6sr@B4o#mZEhHnI^N>sGX
zz4Z(<0{Gm$uUWcS)Rl}ebL#>juQ|G}c*i>1#$1O-b%7`ovVv_`5+R^XZk)Ja_zh+M
zu*p>w$d}tRbltadp{%9`!}KphKC)9?p3=e3a!oj{f;q-qM^7h9<s5nzN8{Gn9vRsf
zCZ1JPzd(am!XN`26@8eJz5^aA8ScjI@w6;*y6b&tE_2ZLrZJa!d>^8GAp||!rv1M)
zP|_;bF}a9pf4~o)82q6>K5hdkSe#M<@cmr8Fod3(OH<uuay$0aUZYWzbT1FLtTXki
zq>DuSdlY>_az5h(<=``PV55h%`$rW7*BLh774}(lKQlS|XU!xRK*+UJhYONj<}p{a
zqGgw#WLd}CVRgad@O7U*OyKJx`@r+nweK-%VED1p=nfM`+fY}nddfc1ds2URTk=-1
z`dnOcKA|zP?fY#^#nm1rrS|h-59IZ@Kufm66+6&^ujQGvJK`txw?No0144(P5J9(H
zQ=^j!&^Cji9Esw}^9?40P%VZfAGN(P7G1{OOv~k6cXr>?Wd=_(wTY?7S;`g-;Z>*n
zsi+113h_FAk$mG7(hT!oRxxo|+;rUu*W+(`P6CDcve!jXwyERMNqF49Z>@ik0CjV6
zz(Z(1+s{>1NFE37;MH@eSG=>IY0@Aw4Ph<hH`K-ybiF(jKMFq%vbsYi<vvsBhRHTw
z6A!_MbL^K`^<^pxk?q}L0SFvE&a`nACvwPf3jDB}T;p`EPDr-J^wVaI8j}X4lb4%7
z$<KnM)c&1(9Vb#3fGM*lQ$O}~%jMSLH)&;!z``-ue8KZHGw$1}s-M|+lFokwS^p2s
z!v7u3{r)!TM3>d({S(}QX?`>Gu#j_p4JQH8#>QVmN}89zvX`JZ(|>@~3uyJ#|G?Er
zbp!2b=HiycEt&WKi2-(N$_r)4R2p9{g#8NE*W^LL7m9_IqcvdyXXA_YhD>WUc>l`7
z>wkK<vkn@d#jML>Kxv~lxz!mf1drVwz%_U5^jECuhRSsAEN#@c^8LFpv4d@WGL|*0
z%Cs5U*BVe@;vf!bVqw9XXK`zBCOx};iQ{uQa~?OCUp>>k=^Quc0X=9ACI?3GfT`3e
z(wUAYezrpAv5A_7MHsP8%w>bZlMeL>ZOv<t8944k$sz!>9=^ah2ztO+%OP@qRB_o1
zZm8MN8s<kf8tRXb_HOArro707%X=D+Gqp(m&c8d}$c)#<Q}(Wr%3c9@_rzEG>}>Bq
z(TN1do?>uQH(YlYJ^-E2rn6yB%f#IImE20YPqmngHE<c#VK6)GR}4)i42v7-TvrR*
z<@l-FKEU|OHwKw)Q+WALz4HT1!`7OuUB*uYB7WBq`WEPB+?x*Dp!y^&t-lfj%W!7v
zqeYN&7P++k2&h-bP4ztjWQ<&H^G)G4XG{7R3}!y`qWy;Np~MR2K&&qEq1E_RB#Nk-
z)oaJa2yUd7Ak?2`>kz=*D+t42>}hrrDg7#Jfw?iv;A5LPVNsY)+xgtOkWteq*E5@@
zoq0rw&2$N;yEJF0?$I2L<F*T>(J?DlBxm<8dm!dA=4m}r^e{L%!K~@n&WLcPvL33E
zwm&rrqZo%0OEza8O4M#OM)lJ3WQiQ%y_P86r2^(zXn{^TCuasZVvTq<mB#D#g0jc7
zf#DKME6Vx4+&3ND`LL(H5B?Wha|!QDGq$Mza=2?Op@3gCkGgE+1Yy8obM)Hz`OlNQ
zw=Mh3bAN^Bgzo_a6g@xOJ?iRGyzN8^`(ud})}4ytr{bXA&Gz{N26@y>L?&90j2}$>
z+hR1>*K8UICs^#7Va4U>+CbUD+K@0V5MdsQP1of)&CmEzw08#;#S9@{a#k1>en?$M
zs11bUoPW}j_D4Rl(mQi^`#Mi9m34=34?GlScT0-(t2?Fly^saoM_nU%xlo!Osm+@=
zk^Cb2YRTq16Vc`H@95@Y(7Dh&C`~36B$FbK)5Z~I-&JG_1u$EZ{F8_kW99eg`&cBy
zn5I&T-@{;X!;H4K5b?TLaoee6egr?<8-h@jE@Gx=PbskOjEvd~W9pP!)sW)aotm(N
zvitqQ@0hDHK8>91xYxDR-svD$9jdND1-5l<&aKk>Ua{Q@w)%{FiMC?MG#`*Iz$n_f
zk}WmDq(zn`DX@kmvUYSW))GC@zsM11>V{5C1fKVVws-i`fLuPuWYzRlB9G?IF>cl<
zM-dv(>i&~nC{{)$KLP~CD33<q(|C*IpRN>l;n(-lm(}_VtTyvc0zRYC+0dmHY;I04
zJPzxpzNsN^teZ|=^|ji<P5~PFNgwy~kb(E`y2vi8q#&|#JSA8x_mk+yh1k^cIT@|#
zZNQo?$ZSWypAF@H#zVdnG7+D-t&?|aB{fs^lcDS!LM!gB`hsU*B>Aschs@^!&M%3g
zJ2+QS7&qfsI%^I#pxJngUf01F)EU!OXU6~F(iwG`Cb?@(?S7>w7L5REhQy7uH_fDC
z?xKcE%%VlXAIdpMxVdN#iLY1A;}=$2vTu8SBNWX?fA;+%k?dZPrz~vV3P8+VVFs6z
zlHo)#CYl3%8}oXO_&)a()jEM+6&eLJ&^#4Gj|C&+=0==?K*N)jIp2DIV|~LYddh$@
zAV56zz?ehBEOrj2_tLelT35Rl6<Ke$mc9jRKI9`O9%9ax_BzAsl>NZa{XH`op=dGX
zVy)Wd$W+E@lyuob!G$j75@3H{WlN~g5gt~Pf(bKx`UVua7SCHrC>Z#(5ve=IE|MK^
z5~DD$>YIbDOJW3-sTB!o;=GImb=nC&GZaw_^ujt0=582a69xhd&t;%WMgPbuw1>($
z3K;1qZKbtG6ghvOd>3n>{GdXd;STb#M5jWik0IJ_{wQc$3X%)4<477D$~!vYY4EV@
zEfX<LYZXtm$xj%RX^qMTABWX#iLEA7P~T~eZnma<O%4TB-%}0@j6%$;q3*T;m$Jx-
zqyv1KEX+7Fh1Qkl?3_B`%GM|tzVCVBVEeVCwhwfOj(1ptZqTC7puftr48p=PN4*`;
zty1t2$(5FRb4kh%hU%krWP)SIU+AbE23qwB$giNB>=q{Nr~cpbnYG6c?f&tJlbb_*
z7(%Y?d4x^k0Z97S<?YFnuk$nqe(xZMjM7TYhaH4W`cBWk8oWM=irrN4;qJfv4+dRL
AV*mgE

diff --git a/docs/structcutlass_1_1gemm_1_1SharedLoadStream-members.html b/docs/structcutlass_1_1gemm_1_1SharedLoadStream-members.html
index 115015d01..a725c7c70 100644
--- a/docs/structcutlass_1_1gemm_1_1SharedLoadStream-members.html
+++ b/docs/structcutlass_1_1gemm_1_1SharedLoadStream-members.html
@@ -79,25 +79,32 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9cc435369c7fc76d0bb6233a8258e257">commit</a>(FetchedFragment &amp;fetched, TransformedFragment &amp;transformed)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7f6bf3b8d70bcd74d84519decd9f0d8e">copy</a>(FetchedFragment &amp;fetched)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a279144e9722055d4b862e3fa25948762">copy</a>(int d, FetchedFragment &amp;fetched)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa3aa987bf0fd6303e06f46e2f54e47e4">commit</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6be479189765a1803ceced424561466b">commit</a>(int step)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a4b919d229e259909efbf994ff2c09339">copy</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a99039d115a539fc99e2235c12ac57eed">copy</a>(int step)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">fetched</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad5cb076de46e841a165bd43924dab463">fragment</a>(int step=0)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a30e815fcee63b5a99b2797464b6a3192">fragment</a>(int step=0) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">inc_stage</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf">initialize</a>(Params const &amp;params, SharedStorage &amp;shared_storage)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">Iterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">SharedLoadStream</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a93e9bcdca4ceb68754fb1f73e2b25d25">SharedLoadStream</a>(Params const &amp;params, SharedStorage &amp;shared_storage)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">Transformer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0">initialize</a>(Params const &amp;params, TensorRef const &amp;ref)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">Iterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">SharedLoadStream</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad2f619712c817f91d62a13db0476a627">SharedLoadStream</a>(Params const &amp;params, TensorRef const &amp;ref)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">transformed</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">transformer</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">Transformer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream&lt; Iterator_, Transformer_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SharedLoadStream.html b/docs/structcutlass_1_1gemm_1_1SharedLoadStream.html
index 4e2badd0d..2aecc0da5 100644
--- a/docs/structcutlass_1_1gemm_1_1SharedLoadStream.html
+++ b/docs/structcutlass_1_1gemm_1_1SharedLoadStream.html
@@ -108,6 +108,12 @@ Public Types</h2></td></tr>
 <tr class="memitem:a9f025ed2609bf33230f6a390c22b11b7"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9f025ed2609bf33230f6a390c22b11b7">Fragment</a></td></tr>
 <tr class="memdesc:a9f025ed2609bf33230f6a390c22b11b7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Make sure the fragments match.  <a href="#a9f025ed2609bf33230f6a390c22b11b7">More...</a><br /></td></tr>
 <tr class="separator:a9f025ed2609bf33230f6a390c22b11b7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5da116ae7e3f8ac2168bcf9bb964a429"><td class="memItemLeft" align="right" valign="top">typedef Iterator::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">Scalar</a></td></tr>
+<tr class="memdesc:a5da116ae7e3f8ac2168bcf9bb964a429"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar data type.  <a href="#a5da116ae7e3f8ac2168bcf9bb964a429">More...</a><br /></td></tr>
+<tr class="separator:a5da116ae7e3f8ac2168bcf9bb964a429"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aff5202428b0e7207456c97204d4d219a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">Scalar</a>, 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a></td></tr>
+<tr class="memdesc:aff5202428b0e7207456c97204d4d219a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Reference type to a tensor.  <a href="#aff5202428b0e7207456c97204d4d219a">More...</a><br /></td></tr>
+<tr class="separator:aff5202428b0e7207456c97204d4d219a"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a22c671494d487511c71f2b0f26fdb404"><td class="memItemLeft" align="right" valign="top">typedef Iterator::Storage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a></td></tr>
 <tr class="memdesc:a22c671494d487511c71f2b0f26fdb404"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage in shared memory needed by that stream.  <a href="#a22c671494d487511c71f2b0f26fdb404">More...</a><br /></td></tr>
 <tr class="separator:a22c671494d487511c71f2b0f26fdb404"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -117,21 +123,30 @@ Public Member Functions</h2></td></tr>
 <tr class="memitem:a6e097738679436d580e8dc6ac70efaad"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6e097738679436d580e8dc6ac70efaad">SharedLoadStream</a> ()</td></tr>
 <tr class="memdesc:a6e097738679436d580e8dc6ac70efaad"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a6e097738679436d580e8dc6ac70efaad">More...</a><br /></td></tr>
 <tr class="separator:a6e097738679436d580e8dc6ac70efaad"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a93e9bcdca4ceb68754fb1f73e2b25d25"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a93e9bcdca4ceb68754fb1f73e2b25d25">SharedLoadStream</a> (<a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> const &amp;params, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a> &amp;shared_storage)</td></tr>
-<tr class="memdesc:a93e9bcdca4ceb68754fb1f73e2b25d25"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a93e9bcdca4ceb68754fb1f73e2b25d25">More...</a><br /></td></tr>
-<tr class="separator:a93e9bcdca4ceb68754fb1f73e2b25d25"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8e4d277325bb5e56c718a2298b60d3cf"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8e4d277325bb5e56c718a2298b60d3cf">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> const &amp;params, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a> &amp;shared_storage)</td></tr>
-<tr class="memdesc:a8e4d277325bb5e56c718a2298b60d3cf"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize the stream.  <a href="#a8e4d277325bb5e56c718a2298b60d3cf">More...</a><br /></td></tr>
-<tr class="separator:a8e4d277325bb5e56c718a2298b60d3cf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7f6bf3b8d70bcd74d84519decd9f0d8e"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7f6bf3b8d70bcd74d84519decd9f0d8e">copy</a> (<a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> &amp;fetched)</td></tr>
-<tr class="memdesc:a7f6bf3b8d70bcd74d84519decd9f0d8e"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Load.html">Load</a> the data from shared memory to the fetch fragment.  <a href="#a7f6bf3b8d70bcd74d84519decd9f0d8e">More...</a><br /></td></tr>
-<tr class="separator:a7f6bf3b8d70bcd74d84519decd9f0d8e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a279144e9722055d4b862e3fa25948762"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a279144e9722055d4b862e3fa25948762">copy</a> (int d, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> &amp;fetched)</td></tr>
-<tr class="memdesc:a279144e9722055d4b862e3fa25948762"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Load.html">Load</a> the data from shared memory to the fetch fragment.  <a href="#a279144e9722055d4b862e3fa25948762">More...</a><br /></td></tr>
-<tr class="separator:a279144e9722055d4b862e3fa25948762"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9cc435369c7fc76d0bb6233a8258e257"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9cc435369c7fc76d0bb6233a8258e257">commit</a> (<a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> &amp;fetched, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> &amp;transformed)</td></tr>
-<tr class="memdesc:a9cc435369c7fc76d0bb6233a8258e257"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commit the data.  <a href="#a9cc435369c7fc76d0bb6233a8258e257">More...</a><br /></td></tr>
-<tr class="separator:a9cc435369c7fc76d0bb6233a8258e257"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad2f619712c817f91d62a13db0476a627"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad2f619712c817f91d62a13db0476a627">SharedLoadStream</a> (<a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> const &amp;params, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a> const &amp;ref)</td></tr>
+<tr class="memdesc:ad2f619712c817f91d62a13db0476a627"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ad2f619712c817f91d62a13db0476a627">More...</a><br /></td></tr>
+<tr class="separator:ad2f619712c817f91d62a13db0476a627"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9b62788c187fff49b0250c0070a41fa0"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a9b62788c187fff49b0250c0070a41fa0">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html">Params</a> const &amp;params, <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a> const &amp;ref)</td></tr>
+<tr class="memdesc:a9b62788c187fff49b0250c0070a41fa0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initialize the stream.  <a href="#a9b62788c187fff49b0250c0070a41fa0">More...</a><br /></td></tr>
+<tr class="separator:a9b62788c187fff49b0250c0070a41fa0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4b919d229e259909efbf994ff2c09339"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a4b919d229e259909efbf994ff2c09339">copy</a> ()</td></tr>
+<tr class="memdesc:a4b919d229e259909efbf994ff2c09339"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Load.html">Load</a> the data from shared memory to the fetch fragment.  <a href="#a4b919d229e259909efbf994ff2c09339">More...</a><br /></td></tr>
+<tr class="separator:a4b919d229e259909efbf994ff2c09339"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a99039d115a539fc99e2235c12ac57eed"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a99039d115a539fc99e2235c12ac57eed">copy</a> (int step)</td></tr>
+<tr class="memdesc:a99039d115a539fc99e2235c12ac57eed"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Load.html">Load</a> the data from shared memory to the fetch fragment.  <a href="#a99039d115a539fc99e2235c12ac57eed">More...</a><br /></td></tr>
+<tr class="separator:a99039d115a539fc99e2235c12ac57eed"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa3aa987bf0fd6303e06f46e2f54e47e4"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa3aa987bf0fd6303e06f46e2f54e47e4">commit</a> ()</td></tr>
+<tr class="memdesc:aa3aa987bf0fd6303e06f46e2f54e47e4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commit the data.  <a href="#aa3aa987bf0fd6303e06f46e2f54e47e4">More...</a><br /></td></tr>
+<tr class="separator:aa3aa987bf0fd6303e06f46e2f54e47e4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6be479189765a1803ceced424561466b"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6be479189765a1803ceced424561466b">commit</a> (int step)</td></tr>
+<tr class="memdesc:a6be479189765a1803ceced424561466b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commit the data.  <a href="#a6be479189765a1803ceced424561466b">More...</a><br /></td></tr>
+<tr class="separator:a6be479189765a1803ceced424561466b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad5cb076de46e841a165bd43924dab463"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad5cb076de46e841a165bd43924dab463">fragment</a> (int step=0)</td></tr>
+<tr class="memdesc:ad5cb076de46e841a165bd43924dab463"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the fragment for the given step.  <a href="#ad5cb076de46e841a165bd43924dab463">More...</a><br /></td></tr>
+<tr class="separator:ad5cb076de46e841a165bd43924dab463"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a30e815fcee63b5a99b2797464b6a3192"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a30e815fcee63b5a99b2797464b6a3192">fragment</a> (int step=0) const</td></tr>
+<tr class="memdesc:a30e815fcee63b5a99b2797464b6a3192"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the fragment for the given step.  <a href="#a30e815fcee63b5a99b2797464b6a3192">More...</a><br /></td></tr>
+<tr class="separator:a30e815fcee63b5a99b2797464b6a3192"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:acf22fd09aa537943c16b900d66f1ec6f"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#acf22fd09aa537943c16b900d66f1ec6f">inc_stage</a> ()</td></tr>
 <tr class="memdesc:acf22fd09aa537943c16b900d66f1ec6f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the stage.  <a href="#acf22fd09aa537943c16b900d66f1ec6f">More...</a><br /></td></tr>
 <tr class="separator:acf22fd09aa537943c16b900d66f1ec6f"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -141,9 +156,15 @@ Public Attributes</h2></td></tr>
 <tr class="memitem:a54481a42d4125e3693a086269d9a7b10"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a6925270c4ad157554ab155cddc7b46e6">Iterator</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a54481a42d4125e3693a086269d9a7b10">iterator</a></td></tr>
 <tr class="memdesc:a54481a42d4125e3693a086269d9a7b10"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator.  <a href="#a54481a42d4125e3693a086269d9a7b10">More...</a><br /></td></tr>
 <tr class="separator:a54481a42d4125e3693a086269d9a7b10"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8ae6f60b5fb3642542a6cb833d83c8e4"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a8ae6f60b5fb3642542a6cb833d83c8e4">fetched</a> [2]</td></tr>
+<tr class="memdesc:a8ae6f60b5fb3642542a6cb833d83c8e4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fetched fragment.  <a href="#a8ae6f60b5fb3642542a6cb833d83c8e4">More...</a><br /></td></tr>
+<tr class="separator:a8ae6f60b5fb3642542a6cb833d83c8e4"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:af846390ad0e5b80ccb4e8b95c5fe64a7"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#ad1f70f0dd1027da1353ff7a38f524904">Transformer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#af846390ad0e5b80ccb4e8b95c5fe64a7">transformer</a></td></tr>
 <tr class="memdesc:af846390ad0e5b80ccb4e8b95c5fe64a7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer.  <a href="#af846390ad0e5b80ccb4e8b95c5fe64a7">More...</a><br /></td></tr>
 <tr class="separator:af846390ad0e5b80ccb4e8b95c5fe64a7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7583af38ca0fb446882b28c0e2dcae88"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a7583af38ca0fb446882b28c0e2dcae88">transformed</a> [2]</td></tr>
+<tr class="memdesc:a7583af38ca0fb446882b28c0e2dcae88"><td class="mdescLeft">&#160;</td><td class="mdescRight">Transformed fragment.  <a href="#a7583af38ca0fb446882b28c0e2dcae88">More...</a><br /></td></tr>
+<tr class="separator:a7583af38ca0fb446882b28c0e2dcae88"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
 <a id="a41b45085f17532a6394de3f5ccf201e7"></a>
@@ -193,6 +214,22 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a5da116ae7e3f8ac2168bcf9bb964a429"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5da116ae7e3f8ac2168bcf9bb964a429">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef Iterator::Scalar <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="a22c671494d487511c71f2b0f26fdb404"></a>
@@ -209,6 +246,22 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="aff5202428b0e7207456c97204d4d219a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aff5202428b0e7207456c97204d4d219a">&#9670;&nbsp;</a></span>TensorRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a5da116ae7e3f8ac2168bcf9bb964a429">Scalar</a>, 4&gt; <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="aa2227d7fa1edef3f6730c7db41b132b4"></a>
@@ -271,8 +324,8 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
 
 </div>
 </div>
-<a id="a93e9bcdca4ceb68754fb1f73e2b25d25"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a93e9bcdca4ceb68754fb1f73e2b25d25">&#9670;&nbsp;</a></span>SharedLoadStream() <span class="overload">[2/2]</span></h2>
+<a id="ad2f619712c817f91d62a13db0476a627"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad2f619712c817f91d62a13db0476a627">&#9670;&nbsp;</a></span>SharedLoadStream() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -291,8 +344,8 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a> &amp;&#160;</td>
-          <td class="paramname"><em>shared_storage</em>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -310,8 +363,8 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a9cc435369c7fc76d0bb6233a8258e257"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a9cc435369c7fc76d0bb6233a8258e257">&#9670;&nbsp;</a></span>commit()</h2>
+<a id="aa3aa987bf0fd6303e06f46e2f54e47e4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa3aa987bf0fd6303e06f46e2f54e47e4">&#9670;&nbsp;</a></span>commit() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -324,19 +377,8 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
         <tr>
           <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::commit </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fetched</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
+          <td class="paramname"></td><td>)</td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>transformed</em>&#160;</td>
-        </tr>
-        <tr>
-          <td></td>
-          <td>)</td>
-          <td></td><td></td>
         </tr>
       </table>
   </td>
@@ -348,8 +390,36 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
 
 </div>
 </div>
-<a id="a7f6bf3b8d70bcd74d84519decd9f0d8e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a7f6bf3b8d70bcd74d84519decd9f0d8e">&#9670;&nbsp;</a></span>copy() <span class="overload">[1/2]</span></h2>
+<a id="a6be479189765a1803ceced424561466b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6be479189765a1803ceced424561466b">&#9670;&nbsp;</a></span>commit() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::commit </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>step</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4b919d229e259909efbf994ff2c09339"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4b919d229e259909efbf994ff2c09339">&#9670;&nbsp;</a></span>copy() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -362,8 +432,7 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
         <tr>
           <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::copy </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fetched</em></td><td>)</td>
+          <td class="paramname"></td><td>)</td>
           <td></td>
         </tr>
       </table>
@@ -376,8 +445,8 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
 
 </div>
 </div>
-<a id="a279144e9722055d4b862e3fa25948762"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a279144e9722055d4b862e3fa25948762">&#9670;&nbsp;</a></span>copy() <span class="overload">[2/2]</span></h2>
+<a id="a99039d115a539fc99e2235c12ac57eed"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a99039d115a539fc99e2235c12ac57eed">&#9670;&nbsp;</a></span>copy() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -391,18 +460,64 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
           <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::copy </td>
           <td>(</td>
           <td class="paramtype">int&#160;</td>
-          <td class="paramname"><em>d</em>, </td>
-        </tr>
-        <tr>
-          <td class="paramkey"></td>
+          <td class="paramname"><em>step</em></td><td>)</td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> &amp;&#160;</td>
-          <td class="paramname"><em>fetched</em>&#160;</td>
         </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad5cb076de46e841a165bd43924dab463"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad5cb076de46e841a165bd43924dab463">&#9670;&nbsp;</a></span>fragment() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
         <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a>&amp; <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::fragment </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>step</em> = <code>0</code></td><td>)</td>
           <td></td>
-          <td>)</td>
-          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a30e815fcee63b5a99b2797464b6a3192"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a30e815fcee63b5a99b2797464b6a3192">&#9670;&nbsp;</a></span>fragment() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> const&amp; <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::fragment </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>step</em> = <code>0</code></td><td>)</td>
+          <td> const</td>
         </tr>
       </table>
   </td>
@@ -441,8 +556,8 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
 
 </div>
 </div>
-<a id="a8e4d277325bb5e56c718a2298b60d3cf"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8e4d277325bb5e56c718a2298b60d3cf">&#9670;&nbsp;</a></span>initialize()</h2>
+<a id="a9b62788c187fff49b0250c0070a41fa0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9b62788c187fff49b0250c0070a41fa0">&#9670;&nbsp;</a></span>initialize()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -461,8 +576,8 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a22c671494d487511c71f2b0f26fdb404">SharedStorage</a> &amp;&#160;</td>
-          <td class="paramname"><em>shared_storage</em>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aff5202428b0e7207456c97204d4d219a">TensorRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>ref</em>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -480,6 +595,22 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
+<a id="a8ae6f60b5fb3642542a6cb833d83c8e4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8ae6f60b5fb3642542a6cb833d83c8e4">&#9670;&nbsp;</a></span>fetched</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#a41b45085f17532a6394de3f5ccf201e7">FetchedFragment</a> <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::fetched[2]</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
 <a id="a54481a42d4125e3693a086269d9a7b10"></a>
 <h2 class="memtitle"><span class="permalink"><a href="#a54481a42d4125e3693a086269d9a7b10">&#9670;&nbsp;</a></span>iterator</h2>
 
@@ -494,6 +625,22 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
       </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="a7583af38ca0fb446882b28c0e2dcae88"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7583af38ca0fb446882b28c0e2dcae88">&#9670;&nbsp;</a></span>transformed</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Iterator_::Fragment&gt;&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html#aa2227d7fa1edef3f6730c7db41b132b4">TransformedFragment</a> <a class="el" href="structcutlass_1_1gemm_1_1SharedLoadStream.html">cutlass::gemm::SharedLoadStream</a>&lt; Iterator_, Transformer_ &gt;::transformed[2]</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <a id="af846390ad0e5b80ccb4e8b95c5fe64a7"></a>
@@ -518,7 +665,7 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params-members.html
index f947377b9..c7bca4a8f 100644
--- a/docs/structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params-members.html
+++ b/docs/structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params-members.html
@@ -84,7 +84,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html b/docs/structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html
index 84b8e79d2..7cd5ae49f 100644
--- a/docs/structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html
+++ b/docs/structcutlass_1_1gemm_1_1SharedLoadStream_1_1Params.html
@@ -149,7 +149,7 @@ template&lt;typename Iterator_ , typename Transformer_  = Copy&lt;typename Itera
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SharedStreamPair-members.html b/docs/structcutlass_1_1gemm_1_1SharedStreamPair-members.html
new file mode 100644
index 000000000..6a96e97ea
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1SharedStreamPair-members.html
@@ -0,0 +1,101 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a93cc2a7eb3215ce5bae343fb117f55c5">commit</a>(int step)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad46887abb2e3136b635c3ef5be29cf69">copy</a>(int step)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#af29f052dc0145abe3144dea1472d241a">fragment_a</a>(int step) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a375e96bc2e35447682bd1dea3c4d87ad">fragment_b</a>(int step) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad4b9b1c1fe4b0c6961842d0eff6d7db7">inc_stage</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a0b69ca0b37dad32ba25c7f7e71a3dcc1">SharedStreamPair</a>(Params const &amp;params, ThreadblockTileRef const &amp;threadblock_tile_ref)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">stream_a</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">stream_b</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">StreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">StreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">ThreadblockTileRef</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1SharedStreamPair.html b/docs/structcutlass_1_1gemm_1_1SharedStreamPair.html
new file mode 100644
index 000000000..c41334743
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1SharedStreamPair.html
@@ -0,0 +1,411 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1SharedStreamPair-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Collect the global load streams for multiplicands.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object passed to load iterators.  <a href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:aa1e8da4d8a313881d5e6509cf6e852d4"><td class="memItemLeft" align="right" valign="top">typedef StreamA_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">StreamA</a></td></tr>
+<tr class="memdesc:aa1e8da4d8a313881d5e6509cf6e852d4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stream for A multiplicand.  <a href="#aa1e8da4d8a313881d5e6509cf6e852d4">More...</a><br /></td></tr>
+<tr class="separator:aa1e8da4d8a313881d5e6509cf6e852d4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8be3e50ce5b65b777972720c77b51529"><td class="memItemLeft" align="right" valign="top">typedef StreamB_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">StreamB</a></td></tr>
+<tr class="memdesc:a8be3e50ce5b65b777972720c77b51529"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stream for B multiplicand.  <a href="#a8be3e50ce5b65b777972720c77b51529">More...</a><br /></td></tr>
+<tr class="separator:a8be3e50ce5b65b777972720c77b51529"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae2c64823a7a5af01187bd3dda6bc309d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt; typename StreamA::TensorRef, typename StreamB::TensorRef &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">ThreadblockTileRef</a></td></tr>
+<tr class="memdesc:ae2c64823a7a5af01187bd3dda6bc309d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Shared memory allocation for threadblock-scoped GEMM tile.  <a href="#ae2c64823a7a5af01187bd3dda6bc309d">More...</a><br /></td></tr>
+<tr class="separator:ae2c64823a7a5af01187bd3dda6bc309d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a0b69ca0b37dad32ba25c7f7e71a3dcc1"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a0b69ca0b37dad32ba25c7f7e71a3dcc1">SharedStreamPair</a> (<a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">Params</a> const &amp;params, <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">ThreadblockTileRef</a> const &amp;threadblock_tile_ref)</td></tr>
+<tr class="memdesc:a0b69ca0b37dad32ba25c7f7e71a3dcc1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Construct with the composable structure.  <a href="#a0b69ca0b37dad32ba25c7f7e71a3dcc1">More...</a><br /></td></tr>
+<tr class="separator:a0b69ca0b37dad32ba25c7f7e71a3dcc1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad46887abb2e3136b635c3ef5be29cf69"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad46887abb2e3136b635c3ef5be29cf69">copy</a> (int step)</td></tr>
+<tr class="memdesc:ad46887abb2e3136b635c3ef5be29cf69"><td class="mdescLeft">&#160;</td><td class="mdescRight">Trigger the copies from shared memory to registers.  <a href="#ad46887abb2e3136b635c3ef5be29cf69">More...</a><br /></td></tr>
+<tr class="separator:ad46887abb2e3136b635c3ef5be29cf69"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a93cc2a7eb3215ce5bae343fb117f55c5"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a93cc2a7eb3215ce5bae343fb117f55c5">commit</a> (int step)</td></tr>
+<tr class="memdesc:a93cc2a7eb3215ce5bae343fb117f55c5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Commit the data.  <a href="#a93cc2a7eb3215ce5bae343fb117f55c5">More...</a><br /></td></tr>
+<tr class="separator:a93cc2a7eb3215ce5bae343fb117f55c5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af29f052dc0145abe3144dea1472d241a"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE StreamA::TransformedFragment const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#af29f052dc0145abe3144dea1472d241a">fragment_a</a> (int step) const</td></tr>
+<tr class="memdesc:af29f052dc0145abe3144dea1472d241a"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment A.  <a href="#af29f052dc0145abe3144dea1472d241a">More...</a><br /></td></tr>
+<tr class="separator:af29f052dc0145abe3144dea1472d241a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a375e96bc2e35447682bd1dea3c4d87ad"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE StreamB::TransformedFragment const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a375e96bc2e35447682bd1dea3c4d87ad">fragment_b</a> (int step) const</td></tr>
+<tr class="memdesc:a375e96bc2e35447682bd1dea3c4d87ad"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment B.  <a href="#a375e96bc2e35447682bd1dea3c4d87ad">More...</a><br /></td></tr>
+<tr class="separator:a375e96bc2e35447682bd1dea3c4d87ad"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad4b9b1c1fe4b0c6961842d0eff6d7db7"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ad4b9b1c1fe4b0c6961842d0eff6d7db7">inc_stage</a> ()</td></tr>
+<tr class="memdesc:ad4b9b1c1fe4b0c6961842d0eff6d7db7"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the stage.  <a href="#ad4b9b1c1fe4b0c6961842d0eff6d7db7">More...</a><br /></td></tr>
+<tr class="separator:ad4b9b1c1fe4b0c6961842d0eff6d7db7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a157cec4ae2881fd37e0244614bc4ab7a"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">StreamA</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a157cec4ae2881fd37e0244614bc4ab7a">stream_a</a></td></tr>
+<tr class="memdesc:a157cec4ae2881fd37e0244614bc4ab7a"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream for A.  <a href="#a157cec4ae2881fd37e0244614bc4ab7a">More...</a><br /></td></tr>
+<tr class="separator:a157cec4ae2881fd37e0244614bc4ab7a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a698586bcc25212e8cd65ab6a4e5c42a9"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">StreamB</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a698586bcc25212e8cd65ab6a4e5c42a9">stream_b</a></td></tr>
+<tr class="memdesc:a698586bcc25212e8cd65ab6a4e5c42a9"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream for B.  <a href="#a698586bcc25212e8cd65ab6a4e5c42a9">More...</a><br /></td></tr>
+<tr class="separator:a698586bcc25212e8cd65ab6a4e5c42a9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="aa1e8da4d8a313881d5e6509cf6e852d4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa1e8da4d8a313881d5e6509cf6e852d4">&#9670;&nbsp;</a></span>StreamA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef StreamA_ <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">StreamA</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8be3e50ce5b65b777972720c77b51529"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8be3e50ce5b65b777972720c77b51529">&#9670;&nbsp;</a></span>StreamB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef StreamB_ <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">StreamB</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae2c64823a7a5af01187bd3dda6bc309d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae2c64823a7a5af01187bd3dda6bc309d">&#9670;&nbsp;</a></span>ThreadblockTileRef</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt;typename StreamA::TensorRef, typename StreamB::TensorRef &gt; <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">ThreadblockTileRef</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a0b69ca0b37dad32ba25c7f7e71a3dcc1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0b69ca0b37dad32ba25c7f7e71a3dcc1">&#9670;&nbsp;</a></span>SharedStreamPair()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a> </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">Params</a> const &amp;&#160;</td>
+          <td class="paramname"><em>params</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#ae2c64823a7a5af01187bd3dda6bc309d">ThreadblockTileRef</a> const &amp;&#160;</td>
+          <td class="paramname"><em>threadblock_tile_ref</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a93cc2a7eb3215ce5bae343fb117f55c5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a93cc2a7eb3215ce5bae343fb117f55c5">&#9670;&nbsp;</a></span>commit()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::commit </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>step</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad46887abb2e3136b635c3ef5be29cf69"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad46887abb2e3136b635c3ef5be29cf69">&#9670;&nbsp;</a></span>copy()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::copy </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>step</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af29f052dc0145abe3144dea1472d241a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af29f052dc0145abe3144dea1472d241a">&#9670;&nbsp;</a></span>fragment_a()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE StreamA::TransformedFragment const&amp; <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::fragment_a </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>step</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a375e96bc2e35447682bd1dea3c4d87ad"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a375e96bc2e35447682bd1dea3c4d87ad">&#9670;&nbsp;</a></span>fragment_b()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE StreamB::TransformedFragment const&amp; <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::fragment_b </td>
+          <td>(</td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>step</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ad4b9b1c1fe4b0c6961842d0eff6d7db7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad4b9b1c1fe4b0c6961842d0eff6d7db7">&#9670;&nbsp;</a></span>inc_stage()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::inc_stage </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a157cec4ae2881fd37e0244614bc4ab7a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a157cec4ae2881fd37e0244614bc4ab7a">&#9670;&nbsp;</a></span>stream_a</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#aa1e8da4d8a313881d5e6509cf6e852d4">StreamA</a> <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::stream_a</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a698586bcc25212e8cd65ab6a4e5c42a9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a698586bcc25212e8cd65ab6a4e5c42a9">&#9670;&nbsp;</a></span>stream_b</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html#a8be3e50ce5b65b777972720c77b51529">StreamB</a> <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::stream_b</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params-members.html
new file mode 100644
index 000000000..25fded100
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params-members.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#afb56016927b59b8d5447c3656f0b634e">stream_a</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#a4a8f9207ffb3bbcdb000af62808371f5">stream_b</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html b/docs/structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html
new file mode 100644
index 000000000..e3be6b885
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html
@@ -0,0 +1,139 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html">Params</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::SharedStreamPair&lt; StreamA_, StreamB_ &gt;::Params Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Parameters object passed to load iterators.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:afb56016927b59b8d5447c3656f0b634e"><td class="memItemLeft" align="right" valign="top">StreamA::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#afb56016927b59b8d5447c3656f0b634e">stream_a</a></td></tr>
+<tr class="separator:afb56016927b59b8d5447c3656f0b634e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4a8f9207ffb3bbcdb000af62808371f5"><td class="memItemLeft" align="right" valign="top">StreamB::Params&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair_1_1Params.html#a4a8f9207ffb3bbcdb000af62808371f5">stream_b</a></td></tr>
+<tr class="separator:a4a8f9207ffb3bbcdb000af62808371f5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="afb56016927b59b8d5447c3656f0b634e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afb56016927b59b8d5447c3656f0b634e">&#9670;&nbsp;</a></span>stream_a</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">StreamA::Params <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::Params::stream_a</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4a8f9207ffb3bbcdb000af62808371f5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4a8f9207ffb3bbcdb000af62808371f5">&#9670;&nbsp;</a></span>stream_b</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename StreamA_ , typename StreamB_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">StreamB::Params <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">cutlass::gemm::SharedStreamPair</a>&lt; StreamA_, StreamB_ &gt;::Params::stream_b</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="gemm__stream__pair_8h_source.html">gemm_stream_pair.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits-members.html b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits-members.html
index 43845f4d7..1f644d8a6 100644
--- a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits-members.html
@@ -79,26 +79,26 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html">cutlass::gemm::SimplifiedGemmEpilogueTraits&lt; GemmConfig_, EpilogueFunctor_, Index_, Helper_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">Functor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">SharedLoadIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">Functor</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">GlobalLoadIteratorC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">GlobalStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">GlobalTransformerC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">GlobalTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">OutputTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">SharedLoadStreamD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">SharedStoreIteratorD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">SharedStoreTransformerD</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html
index f38963060..ce8663156 100644
--- a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.html
@@ -86,60 +86,60 @@ Inheritance diagram for cutlass::gemm::SimplifiedGemmEpilogueTraits&lt; GemmConf
  <div class="center">
   <img src="structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.png" usemap="#cutlass::gemm::SimplifiedGemmEpilogueTraits_3C_20GemmConfig_5F_2C_20EpilogueFunctor_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" alt=""/>
   <map id="cutlass::gemm::SimplifiedGemmEpilogueTraits_3C_20GemmConfig_5F_2C_20EpilogueFunctor_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map" name="cutlass::gemm::SimplifiedGemmEpilogueTraits_3C_20GemmConfig_5F_2C_20EpilogueFunctor_5F_2C_20Index_5F_2C_20Helper_5F_20_3E_map">
-<area href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" alt="cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;" shape="rect" coords="0,0,2162,24"/>
+<area href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html" alt="cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;" shape="rect" coords="0,0,2161,24"/>
 </map>
  </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
-<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadIteratorD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td></tr>
-<tr class="memitem:aed1bd9df5ff579ba3e36ae5ba781c075 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::OutputTile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">OutputTile</a></td></tr>
-<tr class="memdesc:aed1bd9df5ff579ba3e36ae5ba781c075 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aed1bd9df5ff579ba3e36ae5ba781c075">More...</a><br /></td></tr>
-<tr class="separator:aed1bd9df5ff579ba3e36ae5ba781c075 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af7ff579ccb4269bfa5e9ae297260f7a2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::Accumulators&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af7ff579ccb4269bfa5e9ae297260f7a2">Accumulators</a></td></tr>
-<tr class="separator:af7ff579ccb4269bfa5e9ae297260f7a2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8409d84ee282a4d6953bd41149d8b9c2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalLoadIteratorC&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">GlobalLoadIteratorC</a></td></tr>
-<tr class="memdesc:a8409d84ee282a4d6953bd41149d8b9c2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for C in global memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8409d84ee282a4d6953bd41149d8b9c2">More...</a><br /></td></tr>
-<tr class="separator:a8409d84ee282a4d6953bd41149d8b9c2 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a051f25a4aa3ea71ff400582228adbdaa inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalTransformerC&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">GlobalTransformerC</a></td></tr>
-<tr class="memdesc:a051f25a4aa3ea71ff400582228adbdaa inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a051f25a4aa3ea71ff400582228adbdaa">More...</a><br /></td></tr>
-<tr class="separator:a051f25a4aa3ea71ff400582228adbdaa inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a261e526c6a8e832bc483bf4e486cc9d7 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">GlobalTransformerD</a></td></tr>
-<tr class="memdesc:a261e526c6a8e832bc483bf4e486cc9d7 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a261e526c6a8e832bc483bf4e486cc9d7">More...</a><br /></td></tr>
-<tr class="separator:a261e526c6a8e832bc483bf4e486cc9d7 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aeef5745d149770c9f79e12f6d97ffce1 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalStoreIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">GlobalStoreIteratorD</a></td></tr>
-<tr class="memdesc:aeef5745d149770c9f79e12f6d97ffce1 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for D in global memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aeef5745d149770c9f79e12f6d97ffce1">More...</a><br /></td></tr>
-<tr class="separator:aeef5745d149770c9f79e12f6d97ffce1 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a74f4beb86447f6b613e9b60234cb27bc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedStoreIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">SharedStoreIteratorD</a></td></tr>
-<tr class="memdesc:a74f4beb86447f6b613e9b60234cb27bc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a74f4beb86447f6b613e9b60234cb27bc">More...</a><br /></td></tr>
-<tr class="separator:a74f4beb86447f6b613e9b60234cb27bc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0b8ac1972b2f2cff48070f8b862ed25c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedStoreTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">SharedStoreTransformerD</a></td></tr>
-<tr class="memdesc:a0b8ac1972b2f2cff48070f8b862ed25c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a0b8ac1972b2f2cff48070f8b862ed25c">More...</a><br /></td></tr>
-<tr class="separator:a0b8ac1972b2f2cff48070f8b862ed25c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9822fa405b32cc2f471c9fdd37585cb5 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedLoadIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">SharedLoadIteratorD</a></td></tr>
-<tr class="memdesc:a9822fa405b32cc2f471c9fdd37585cb5 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a9822fa405b32cc2f471c9fdd37585cb5">More...</a><br /></td></tr>
-<tr class="separator:a9822fa405b32cc2f471c9fdd37585cb5 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab00969bdda930eeb7b82985c476adf7d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">Iterations</a></td></tr>
-<tr class="memdesc:ab00969bdda930eeb7b82985c476adf7d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">typedef typename GemmConfig::EpilogueIterations Iterations;  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab00969bdda930eeb7b82985c476adf7d">More...</a><br /></td></tr>
-<tr class="separator:ab00969bdda930eeb7b82985c476adf7d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af1f105d4712f01880b0944666e2f81ae inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">Delta</a></td></tr>
-<tr class="memdesc:af1f105d4712f01880b0944666e2f81ae inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterations strides.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af1f105d4712f01880b0944666e2f81ae">More...</a><br /></td></tr>
-<tr class="separator:af1f105d4712f01880b0944666e2f81ae inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7cdb30f17692e8fdb3dd4cf4c0b8e9ee inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef EpilogueFunctor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">Functor</a></td></tr>
-<tr class="memdesc:a7cdb30f17692e8fdb3dd4cf4c0b8e9ee inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor in charge of the math.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cdb30f17692e8fdb3dd4cf4c0b8e9ee">More...</a><br /></td></tr>
-<tr class="separator:a7cdb30f17692e8fdb3dd4cf4c0b8e9ee inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab430d05bd17efd60c28077c87b5ca331 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">Index</a></td></tr>
-<tr class="memdesc:ab430d05bd17efd60c28077c87b5ca331 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ab430d05bd17efd60c28077c87b5ca331">More...</a><br /></td></tr>
-<tr class="separator:ab430d05bd17efd60c28077c87b5ca331 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a006e50cf5fb67407d41c60d6d08b8b66 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Functor::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">Scalar</a></td></tr>
-<tr class="memdesc:a006e50cf5fb67407d41c60d6d08b8b66 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">We do not support 3D or 4D shapes.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a006e50cf5fb67407d41c60d6d08b8b66">More...</a><br /></td></tr>
-<tr class="separator:a006e50cf5fb67407d41c60d6d08b8b66 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abf97949c238d72854225c1c6131b5cbc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadIteratorC::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">ScalarC</a></td></tr>
-<tr class="memdesc:abf97949c238d72854225c1c6131b5cbc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#abf97949c238d72854225c1c6131b5cbc">More...</a><br /></td></tr>
-<tr class="separator:abf97949c238d72854225c1c6131b5cbc inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1ee74d6f89b044578e1cd6dd210ce5fe inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalStoreIteratorD::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">ScalarD</a></td></tr>
-<tr class="memdesc:a1ee74d6f89b044578e1cd6dd210ce5fe inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a1ee74d6f89b044578e1cd6dd210ce5fe">More...</a><br /></td></tr>
-<tr class="separator:a1ee74d6f89b044578e1cd6dd210ce5fe inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits&lt; GemmConfig_::OutputTile, GemmConfig_::Accumulators, Helper_::GlobalLoadIteratorC, Helper_::GlobalTransformerC, Helper_::GlobalTransformerD, Helper_::GlobalStoreIteratorD, Helper_::SharedStoreIteratorD, Helper_::SharedStoreTransformerD, Helper_::SharedLoadStreamD, Helper_::Iterations, Helper_::Delta, EpilogueFunctor_, Index_ &gt;</a></td></tr>
+<tr class="memitem:af4d17d3774382fc0ba63d329bd12772c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::OutputTile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">OutputTile</a></td></tr>
+<tr class="memdesc:af4d17d3774382fc0ba63d329bd12772c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af4d17d3774382fc0ba63d329bd12772c">More...</a><br /></td></tr>
+<tr class="separator:af4d17d3774382fc0ba63d329bd12772c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af27cfae15beafcfbaf6d660781cbe5c4 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_::Accumulators&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#af27cfae15beafcfbaf6d660781cbe5c4">Accumulators</a></td></tr>
+<tr class="separator:af27cfae15beafcfbaf6d660781cbe5c4 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4de6207ce3843d6c4325abc7d7abcf24 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalLoadIteratorC&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">GlobalLoadIteratorC</a></td></tr>
+<tr class="memdesc:a4de6207ce3843d6c4325abc7d7abcf24 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for C in global memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a4de6207ce3843d6c4325abc7d7abcf24">More...</a><br /></td></tr>
+<tr class="separator:a4de6207ce3843d6c4325abc7d7abcf24 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a853b7ad3afb06fd720afc4559df2198d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalTransformerC&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">GlobalTransformerC</a></td></tr>
+<tr class="memdesc:a853b7ad3afb06fd720afc4559df2198d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a853b7ad3afb06fd720afc4559df2198d">More...</a><br /></td></tr>
+<tr class="separator:a853b7ad3afb06fd720afc4559df2198d inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adb4eb47c84dc1c6df2556e72ff5800e6 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">GlobalTransformerD</a></td></tr>
+<tr class="memdesc:adb4eb47c84dc1c6df2556e72ff5800e6 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#adb4eb47c84dc1c6df2556e72ff5800e6">More...</a><br /></td></tr>
+<tr class="separator:adb4eb47c84dc1c6df2556e72ff5800e6 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ada036c0457773a42fb18bc0463071d02 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalStoreIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">GlobalStoreIteratorD</a></td></tr>
+<tr class="memdesc:ada036c0457773a42fb18bc0463071d02 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for D in global memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ada036c0457773a42fb18bc0463071d02">More...</a><br /></td></tr>
+<tr class="separator:ada036c0457773a42fb18bc0463071d02 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a48dee5c2aafb86e999732a1347c9f668 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedStoreIteratorD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">SharedStoreIteratorD</a></td></tr>
+<tr class="memdesc:a48dee5c2aafb86e999732a1347c9f668 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a48dee5c2aafb86e999732a1347c9f668">More...</a><br /></td></tr>
+<tr class="separator:a48dee5c2aafb86e999732a1347c9f668 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a685d59ee03a226e62660e83c4c60ca69 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedStoreTransformerD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">SharedStoreTransformerD</a></td></tr>
+<tr class="memdesc:a685d59ee03a226e62660e83c4c60ca69 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared store transformer for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a685d59ee03a226e62660e83c4c60ca69">More...</a><br /></td></tr>
+<tr class="separator:a685d59ee03a226e62660e83c4c60ca69 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5bb3232a2f15d8263d058c69b0839e2f inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedLoadStreamD&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">SharedLoadStreamD</a></td></tr>
+<tr class="memdesc:a5bb3232a2f15d8263d058c69b0839e2f inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to store D in shared memory.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a5bb3232a2f15d8263d058c69b0839e2f">More...</a><br /></td></tr>
+<tr class="separator:a5bb3232a2f15d8263d058c69b0839e2f inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7cf2e703f78b877ad551d0516982da10 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">Iterations</a></td></tr>
+<tr class="memdesc:a7cf2e703f78b877ad551d0516982da10 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">typedef typename GemmConfig::EpilogueIterations Iterations;  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a7cf2e703f78b877ad551d0516982da10">More...</a><br /></td></tr>
+<tr class="separator:a7cf2e703f78b877ad551d0516982da10 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a84b89d856f548a26fa1dc15bfd2940da inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">Delta</a></td></tr>
+<tr class="memdesc:a84b89d856f548a26fa1dc15bfd2940da inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterations strides.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a84b89d856f548a26fa1dc15bfd2940da">More...</a><br /></td></tr>
+<tr class="separator:a84b89d856f548a26fa1dc15bfd2940da inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8acbe7bfa905258a964ef56e634d4c99 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef EpilogueFunctor_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">Functor</a></td></tr>
+<tr class="memdesc:a8acbe7bfa905258a964ef56e634d4c99 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The functor in charge of the math.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8acbe7bfa905258a964ef56e634d4c99">More...</a><br /></td></tr>
+<tr class="separator:a8acbe7bfa905258a964ef56e634d4c99 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a23b0e6a448e51f2e0837af95802c23b0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">Index</a></td></tr>
+<tr class="memdesc:a23b0e6a448e51f2e0837af95802c23b0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a23b0e6a448e51f2e0837af95802c23b0">More...</a><br /></td></tr>
+<tr class="separator:a23b0e6a448e51f2e0837af95802c23b0 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f15d59a7571d406d5ef593c342f0d4a inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef Functor::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">Scalar</a></td></tr>
+<tr class="memdesc:a8f15d59a7571d406d5ef593c342f0d4a inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">We do not support 3D or 4D shapes.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#a8f15d59a7571d406d5ef593c342f0d4a">More...</a><br /></td></tr>
+<tr class="separator:a8f15d59a7571d406d5ef593c342f0d4a inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa794b5f04ce736cdba0d778861ce3a9c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadIteratorC::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">ScalarC</a></td></tr>
+<tr class="memdesc:aa794b5f04ce736cdba0d778861ce3a9c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for C.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#aa794b5f04ce736cdba0d778861ce3a9c">More...</a><br /></td></tr>
+<tr class="separator:aa794b5f04ce736cdba0d778861ce3a9c inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad9a81c3ff36a4f3aa376e2cff94cbb50 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalStoreIteratorD::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">ScalarD</a></td></tr>
+<tr class="memdesc:ad9a81c3ff36a4f3aa376e2cff94cbb50 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar for D.  <a href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html#ad9a81c3ff36a4f3aa376e2cff94cbb50">More...</a><br /></td></tr>
+<tr class="separator:ad9a81c3ff36a4f3aa376e2cff94cbb50 inherit pub_types_structcutlass_1_1gemm_1_1GemmEpilogueTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <hr/>The documentation for this struct was generated from the following file:<ul>
 <li><a class="el" href="gemm__epilogue__traits_8h_source.html">gemm_epilogue_traits.h</a></li>
@@ -147,7 +147,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.png b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmEpilogueTraits.png
index eaded28cc2a2f85170d318c2f828742ea00d68e8..c97c803e73946f33522d89cea3cb9c773901c78b 100644
GIT binary patch
literal 3705
zcmdT{X;f3!7N(Cn6b0LAMFyb?f?5#70c1)ogQg&&B2<F}4HA(d2r@_vs8wji6b&+n
z4XI+GErei#2~!A)%+UxD0%j5eVF*bKAqgSVySCb{c0J#p_v?Lo-Fx=EYoG6)v(MRk
zpZk4i$R1M@OA{j_BUA8R|AR(GOV0p$=u%_gUQw989cb2s28RV03<f}bt(dHQly)7^
ze!tq<+P=A;84f%yJ$o?ZkP%??27|p}Zbn9COTqrT!!kb*b0<;+-m4e236B@?3^!Q2
zFCHik7O`dY`~7C?mqtF;usnW%p#>g8?`Z_<I_-b`hwO^p?f~BKcj@_{Vk>y_Kg4Ve
z8hr2{lG1i681wZ%#5fR!aWb{t05-GWwPIoz8aWv4g4ET32qeQm1XVhisYy^#JFKd+
z5QK6VCtvj00Uy#gq^S_hTHJnHyw3`h6pvh{RVQd<S!L#j=E|ZeWC#YVKD{XiT7P@V
z%x6}|kB#5K66fdOkEm9?d}}$b9&WSt8P#g+eqgr4OJtvJP{f}~!e;FxJx;YqQ-1|?
zp61$9W~0q4(O}|S+r14v=DuYO&Dg>iVP6zwGiTRC2Af?gJK0uf!ghiBa?y&simd(a
z;MwbYC~C?U^dRp@VlPtFQ4yicx*D}=29|o$UZwr*6ieKaV&|O`??O`Tzl;Rkq<IQK
zaE7=0PxeQ$qU%7`uVIwK7$@seoQ4a+9-xH;fQgBM#b0AIfr9ZXqq?H~(wrQvLN>xC
zuo*$)J@Nt?Jf|jw9YTeiZawQOO*<&oj;7&xw#Sa53_fT{53kA@YtYY}@nUjcc{7+N
zUI{h&PgTn*JZaw8Mu@*Ww`w;xJ8~jb6B>EjYekxJK=?8i39}hU>zUYxt>AnYXE#8F
zDFhEC36#D#j~qACnJke`a;l0-OSelP%ojpN^B!@3qcmO9*OnSueB_fC(vz<DM8gqD
zocnpkJg5YZGT6DdwT$+-B{5#HEELK|o>vFwF~NN`di(oMj_y79Yn=fFJ+7N9h=&{)
zpeC$tYtWVq5jJD5TX1inZGKRiSJPClFHdu?v&k?u7Uez{c%6xyn}v~SQ1iioSFHL`
zbefO!ruyo>jCo#YMisnY)714uOpY`tEE&H0+%~zGq{la#_SDmjA#?=+tpp7(Eul#8
z^A(WM=mu7(M7a>rshya)mAB-qbn&g_>2^pb$*|zI_9Dua#xleGO68L2E-T>A<C-|l
z1alevU(IR6v?tJbp57Ks3Z)!uS1u$>Xb<;tj(!imDTR6kJy673(1}d7Cu&e5NhS}a
z_<|u*$ZVNZ`W^0v)9KDLPUENZ6C*c*9mZ1=CCk$se?UJc-nbTygLmWUWd^qa)}m%A
zR|r2bD*Y~<d=mPZc-J0#zwmOl$&z;LWg-VxJ!v488h-SVzrG;he%=>IuEmM3De?QV
z5sj3Un)}-x+{oJ5CG!vTVezqoX3>KZtV3KTnJk4?oB{1aT~5VQ=|a}2yqE*Usr3;E
zVz5QZ7n+sZxK7M)(B0dnb26SSL+rIHr7^6;me~MZGnl{vhJ5!*fM)}JLTLsaiaJX{
zZ45^y4|L9X4tv-#h3<CTVFux&bYwHvZ18%_ai3iN8Zir^TymEi(nU&@y$ttQBbiRe
z26vseF*N-(bO_psfQw(*<*ufVx8A<I0{d$KkKOIEKjyh&nS2+I)**?RQb!YxObb}2
zT5eay=97w+v*HrNMcGtGA$)Lh{S;wH@%wPAuMGbnpM|~X>Z>Tjb)dmqlXLfRWX8)O
z<<TMi`hF+YG*8e`Io#w71aQE^Bn0Igf~}IBSPrZKqd-Y}v9vi}!wH}NKG_}fc<9JN
z-wA!YlHP8-@M_geYh&=5u79;sI1rNh5d1XtUjA}LX5cYeoyAb6b2{Zo+I-3WK*8q6
zV(SNcb0>~k5D!#VG(<=}IqPl}2iP-jaXmjLC2nU7XH;-_V{(0AaPN-GhtC#zP|VbV
z)Y<c4eWK&=O>hH(zq>i_gh+u6Ynp^rci~N2U!-N!&P;`5#?@(5GV?on-l>R(t!M4L
zEr#<S>DG_n_pA6T<v0?&-0GR$l$b#P_PBO$+lt_4(?Ty#5WCM6G5`IwEYxwuR0RAy
zd?61#f)&>EXX;*)gk4rR5XiS#*ie8giA699k5@(V`2>|r@yU3N3~Vp2tz0t3SvXl|
z#p0P$bCfw&niK+VBFVFn<z6YTFKy^(1%Xh<!wS7%3$HfZ?YPSwQl!3c0H0YsMI2<i
z;k)W1Ur#|O5l>g1&34tD|8#nDC4MjB(A<k?3WdD`$Mc24OZb-Jlc*?LahhFCgjR-s
zy=^q=t6MD|YrAJwFEpRff2*Wd7&m2nOJD4Tl&9!8vrqdkNS#$Rci0Iw(@B`D)y?8E
z<JKDo2)bai8S&^W4;x4;Dt?M`nRaX}>MynD*Rf+T-f;vxZpIE=uGniR=$MDn!!gzw
zRSJVD#lD9_Fd_Fl^i*q!$vKI1Fj2%ZodlW9pX568v*QANo_7O<%8{C(p0-|KqU?LN
z`D$!^X_%NUzpeV=FKy79!L8$scUoPq+pBxu$AsTZU0)IP>Rb()I=Kgi@fPK|_r}5u
zQl^625rSc<4;6-Dv<I>e*P(ZUqsB|FXyRcZm}9i0FAa*0a(j@lfc}du^nWd^VVJ**
zwX0>}J<Q)_>_Y#04ghZt2ZD8>0FqfBnY@MBuHA3(@RKU$U#~r|A#W_-;5DjB<+AZD
z=E+Qr`Kq_DPQLUGet()LcmKum7x_BJcMKk5A1-=}ydQshi<j3|{z;nhj`Pz08)-7j
zb-ABuyX*7!H0|pa|LKM3Oik{)iAt?_t#{seLX%5DytA5b9Ti)>TdG#XA6*g=RpU#{
z=&zNEku|a796ej0ZZ9xAB|NNDO%z%}I~R`R4E8?_f+|`gU^|NK*1162?wwa`NgA(C
z)1LRuHwF00Q>8mET)LEHzu}R&@6q9;*jvI%9RFORi(|HhDEx}o4Q?W$xl{LXxtUtD
zG@7lIMWm7<uSVSjHiNU@iceRqax!h-z@@D%rqDq8h4~pVOFZ%O?3lWXPXY-WMS^xn
zQK~zR>eO_LMq@7Exe$mII@q_Ra!|FWBpj3ljapWq@=cu5s^A5Xh$qZ-`-Kv>Bdje5
z5ZQ%%L<hM&u~1sX{_q&GTrt$Q(!|7Oz|VNmq9CTf$EL+zCug;GeoyobvHYOLKZb2>
zC<<^ddF+8cRjo+vgqPk#cW<#!Sa&N+lWzDj-yAk_=)J%P1S2zJvkA>4FsPd4>P*>j
zG?&Ec3daExVrUw^0DM2R>rBy)N#Jt_&UqnSh%fe}SeCB-7BZrK&|7FsnUyJ$A*6aw
z3ueqU%5~dGRK};VJ|_+W?upD1jJDwL@rmxg^mvrqafUVXyJGzST7=ck0*6(rw0%iE
z31#U|<D}c-U1n!@IGZ{3Zq_Bnj2uqKo*YEtp`Mwaqi{=-<LBHeMMmaRav3ipi$j0L
z$ZN?yKA^hyhC0JC){Y8#H4<M}Hv&Y7wlDVy4Dg462yxriP!w0o3nu3;^xaITb6QMs
zLkN|8>JV-(zq;NtXKL0UPRVRh>1^C<%c}gMXmuv12?S)KB$qrmzkP9VZ_FcL>Ra+E
z;UAiq2pt-e?KadFiW`d`2HuMK?cx!O(&7MjmVXvO5$|9P=;nnj=Yy)fU`;<ib3x+F
z;&VPOEw1t_kI{5g$-gAmKEPMHxW8=Dr=2FJx5e5*j4xlhl*3cE010NFyc_=Yg2(1R
zs?{@~TKS(vKCL^%vnAjdpt9|$adQKrY>_QApS&7PFDtz_7$hobX}WQdHmUQhfuPmj
zR7N}*XH@yMlFvk490^7R>eZ4NOtU`9KUIPZ&pC+X&F|>N`vS9xZlAFP_Vy(>O8TX4
zY%3>TWI#Q4)VcVbi|c0WNU2Jfe!X#HChyrHAPwzlv8|M@{RQWp3rR$Q+&m;C!>Bxd
zZO<29@x;r+ZGNR@r=ME}#0%Lw%LWM0Xfb<a!m(g97GjXLWYP>Ex0uqYV;?PA#IVY`
x`YwL!{zJ(A9_ari${)TbVZ2Qy?duH2vvI$rY*|#<0sJQ#fdfMPYrl%V^l#xRYaIXp

literal 3650
zcmdT{c~p|=8n<a$EWNg8S~-<li=~!J;&N*;!&EG{OvTED+$R@M5iL7y<5GkBf;88{
za>Eq_RMf@{H^yAZlyFicL?9tTK;U9ibI;7Vo%!#cbAQkIzUTSg_c_n|p67Yq-}im@
z+})fs*XgWNQ&ZCfo;h`1O>J$g%64D7QguJ`$ka-uwB21i9hFL@%6u<+hv`aqpt3$)
z9UUDP>Jz<Hk89)4yLqUooR%@#>uIivHv~L&!ZUFNm(GcuXx;Q}$84Q5U-_b^KH)d7
z{F7|JHFL{}bEh_t)K<&~PFrVNWKUoCn(EQcd4&A4%-kI+)X)2iIAuQ9fBF|We&v`U
z(BRKP*;sA{Jn$FE*3JSp97_QMV_&>q$kB(V($P(emUBL`q!Rg^_KbGg+i4P=wGCAL
z8ey9}c<l%l7A)%TD|Uq;=NE~xtDK}cIEW7K3>4#HuoX#Wj(i|Af?!bO&uHsK7jS1+
z!+TC%uu8i6_)t5-l?d~Yl*B1=#`?=wCU>g~keU2dGTs719bao#67rUSB&K{vnUV6w
z_3@m}y~lKNg4s8KXOS@}&}%R|BT7I19A0PAHv}e|h+c^5%2_?371&N65Ow>?E3JTn
z2Tlc&7?e&`bK}KathMQw#|KQXUP-w=f#noJ;;~Tcf0KB?eF5N~cydq0T&c3uLO6LH
z8O*-7dB$sp1JvJu(se_fsHb2fr3e#eWR$LxJ95%W=ZKaDdACHs5wa?%e0v2!-gc~P
zQn_R+t2+=4;6^t~Hl^%Ncsaks6a~nM32YIKJUm~PY0qUZNe;e+J|!`e$||~l8Gum@
z_*S6_sfjjm_{`Z|pd6x{Fv$9dX@SCa&&~fl&^a*n-1af&AR3l17`v|`%SDVE?aQJ2
zMi<b3P=pr05@jmK$KA@wusxCF1*3wljF<FqyiKN}wp7__A$)fo{6qTA!9<5wV_j*K
zji&rW!ESuTf()4qzl7=zPXS_R)$&IThm5Q!T%D|pyA)G`c`&PZQmFxunN}T!O`v>0
z<}S5a+8G`R01~?dVJm&qZKH^f#ZJKXQP?MvB}WHjS-vJFiXv$10+@O*MDZMRFeT;*
zX}Ixjdv*(9GM}F&&xSAzi~M7pRUM#7`A}?xE9B^vaMS8G99Ff+^!>xPZnD811YHrf
zUqbags-^WV!RW<;m!jijVMRis2iF82awDnbksF8k=0@8KNd7C67h}iMqLO6FtEG>L
zUb;926*?3++FxU3MiJ1cgH^AkkfMI`cT0AN?Fg8)A3xR}=qG}w3i#N&J`fAQb|{z`
zelM!j7-&eNkqAdeP_~xgeWxuhBG7yA5o2<EQTvf`F4K~+d3~A_uF*hN8%f=2wxdBX
zdEUB^r=Q1^`iCeBm`kkcqC0Co5I4^(9w2XzBsJ(wc<MGo;&y^^N8)63V7sjAWAE^z
ze^9|ZEPALVu)=<rfCJ|XBXHk0wB*M%(V_*#<}*+(s6W2m1upN8w*0lH+yOiZ%U=|D
z1t?sEsX^Y2UX8*7+wBg`b%xmEeHI%;dnZ3)F4S}a^@iKX^$r+%OenFwjFB_{F_sin
zxrfq~tl?lb!7rF!-#|aSx)HH3wY=rIc$7;|%5Ej`Q**z+4u+-g3}lMa=`~$<EJy$K
zK59#$k@KANhD4vQ7X<75kWxo87fGmBTm33Rk3gz)YB{f~N99mZKeck$aWt@v_GzC!
zN3H;<edw@EJj8;LshdO06I`*2;&;|Cn<M3}kA2&#;P~wsS2!&$$RaBPQrqP05Ke2R
zTN~+8>)<e<4Bs=~KEcZGI{1=qyvYyFKGG-A@>?#xfvWf_0+=Ws^ognz0RnQL^qf^~
zZlK9ByPkxo9VVw7)$!RMz5S`9g)P4KK~{v#k8p17vt3Ab^NV1cMn6FC>+ytOh7-e=
zDO^;Q*y5HKG{+VXl}yJ8QoQ?wmswte3UZq!%&L2A8qgfSG3emiv2Oxvh=4WE;|*FZ
z#^oy|C7x-~xT;_VaYLEQyem7^gF8l&@hQvgN!5Her7oz<)GPdXbO;uoj$=G)omQn!
zbYm3Hh!SvX9jYO)i%qAeMSa+OG$=(bU*cVyu~&kLZFJCW6i2$0N}{5vhaf1BdC{F>
z-h()PL1%O+oN-F|W16lkwjRxjwjt1rFv6z7mTum01|rBi=ldY(ltFp-SyCGf8&=}k
z?ThIH$6&+kFwFI6`vmxm?Fp9dFyH8DZS3pb50;L6S16niuzrp!6ODiLXl!dmiy`oU
zwHzzO;`u~ZVu7cjmfIS0z^!GLc=(AWuBEr?Ps2MychNCI_ZA@6_Ygi}<6;&vIqT?n
zJ-(#xCahTQ9bnS~ZUV)UP6r{EZqpCv%mCqtHuKX+Th335_nC`<{ocr(unMtK%sGQ3
z=;cK=x*}nc%WTD~(wtx#RrlAl(uIjG6Le|>&~Ais)dguJUnk-1mCk7c1)12zXEYFU
zKGC?RKyzlO8aacvwHmQ9MCvmn=O~sF`bh<P`MmoB$AM6J>k4_#4zkH)<q*Jm&H&vb
zebtwG%#hLuZar@akdd*^87bpHfqh!|R%fI`?|o<7xFLnKR2QEXIS6dvur%M1?Z<Ow
zLKH8MQpr)B|INE}+Iq}7J1FZbYWK=jDu_`JKVzzJ^On!p8Ef;O;k(1^Z<jrnv8FUt
z{?8M?qmvJiOK+rq#y&Uq&-kHVecfkdAOGxoqSMUC_%p0${|MJp`rj6h`w}xf=>In;
zPv`dKCzrKve@$6GSNlDst5!K_=#l?OUdQ`|^<O5|{LMt&bP%caQjdn7Lm=uh6eUx(
z*pVd?vM{KQO_KvNV&dfC<aJHLUtvSyi`CC#^_k3-h5ih?j0q7PzC?8B(^QqIERKKd
zdU|^D6T>bmd-y9}s4ok{U?fFijZ;fF-Zue7bZ!i(TfU{tO(N5{G_mv%7T1`v)o%aK
z52x@N^fT`6b><oc$;x^^d;7Fh=@M@mJ;69TO_5WnjatIDA_=pGa=hOs*RfC{1hg@v
zZKCEO%1mEGfINZok^}j`B)m`j5C&pV12^Iaiz__J`spDJwR>XHa3Gwo%n!}_SQvm;
zC!Q{I<gnFOt<qv+R2`QWW>D(C8bF&-K<*VITJjlZ)k}|=wFG3C7W7&VT&)tvQ6Po>
zx<vubbH{(;n$gV>hRa_N_Mx=l{UG7EMl1opD{>P=q>Z6*cbN>2XVh=qyl$N$2@P4b
zWy{FvbN*fxeqP{XZw@mu8b11>R$~e}xvwP<FXJ`QG#2$4Vqk7A*d@p8&H2>tq&)rp
zy;oxGPy&Md`9M->O<a`KQ;K!LQ<FH7UQpvcW8+1<W{KZ&_%M99WetEu6no*e-;!M1
zzGfS(QW2Fq?v;ef8-=$8eq-xSrmk#BNZv7=a6LmRN&JAiTVf!U<kGZUu7KV~q9RDc
zrn+qTM(XaHw+3n-KAZ})jEvS*tx!R)Eb8PIZ{rMvldh7hDXaVXrl12Pf}9WLgGTsX
z0Vs!fiIN+iXe&+qC983ktqNI<e4UYirP4=mHt5;w6pJELW8)`%81`;ees2NICZF8n
zgu|ml>aMvuk9N%K6oNBMY0k-5am4<eDtkjtS4veCAc#2nYfL%lPP4;W7p$syxw3A&
z@Dy&axu*7r(-cvj5RUWi2+gcnaq>i`1HYA_I_;siW~vMkygV!!%?QYN$6}l{AkrbP
z2&r^11D$5Uo_)zSm`mlO9WvUtq56r1Bco^e1zp5*>EwH<yT)p|Qw|L`&I%UTxmZLg
zqaza2Zmvv*LVE+00l{(Eb`cI?cKoGcrniQQY+jiHR;yN=3M1po!2~U_RGP*Y0hdA!
z#JEZbZoDSmWmQK}b%_}&p9g^?wir5cQ2d*BAQ`=5r+91HqSO~6$j*h`?CjlFLlYkc
zskp2&-$}erMUs(=T!F9`(K1d`l1$&+S2|%dj@lhkor$FHVH>}Ys8!0+$uC^F;#tp;
lKiJjus}tIPLmIPbVY@2J^C<W?svkZzprhNV+LM>k{|)d&R|o(A

diff --git a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraits-members.html b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraits-members.html
index eb82c0156..2b6d75c67 100644
--- a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraits-members.html
@@ -83,9 +83,11 @@ $(function() {
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae67227cecbe84f5c8497d9a7ff82b367">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac5bb5931a707ed7672f69267753ba41b">kLayoutA</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a078e8d9cfa1b182e1b96a2cc8c54b684">kLayoutB</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
@@ -98,12 +100,13 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac3c840a3d90c0da43301761af83c2c9f">shared_store_fence</a>(bool in_loop)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html
index 9a2328d5e..4439f98ae 100644
--- a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraits.html
@@ -93,10 +93,16 @@ Inheritance diagram for cutlass::gemm::SimplifiedGemmTraits&lt; kLayoutA_, kLayo
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
+<tr class="memitem:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">GemmTraits</a>&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, <a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a>, Index_, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt; &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a></td></tr>
+<tr class="memdesc:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">This traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">More...</a><br /></td></tr>
+<tr class="separator:aa6214a0ad09d155ed79feadc6647b989 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1Gemm.html">cutlass::gemm::Gemm</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#aa6214a0ad09d155ed79feadc6647b989">This_</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">KernelClass</a></td></tr>
+<tr class="memdesc:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The struct that consumes this Traits.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a28c32832f0353f00e93e867373cf6cae">More...</a><br /></td></tr>
+<tr class="separator:a28c32832f0353f00e93e867373cf6cae inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GemmConfig_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">GemmConfig</a></td></tr>
 <tr class="memdesc:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The configuration.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a4efe5d156abca056ef8b5334fb574dd5">More...</a><br /></td></tr>
 <tr class="separator:a4efe5d156abca056ef8b5334fb574dd5 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a53450f4d7444d6a4c0d2353496c0a4fd">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
+<tr class="memitem:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a9dd9c3efc3dfd9b5c6acd12236697399">GemmConfig::OutputTile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">OutputTile</a></td></tr>
 <tr class="memdesc:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The output tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a97d7ee63e5d180410b370f095648f367">More...</a><br /></td></tr>
 <tr class="separator:a97d7ee63e5d180410b370f095648f367 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a9cd6c3fddfb4315eb52b672900462c47 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::GlobalLoadStreamA&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a></td></tr>
@@ -117,13 +123,7 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Helper_::SharedLoadStreamB&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a></td></tr>
 <tr class="memdesc:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator for B to load from shared memory.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">More...</a><br /></td></tr>
 <tr class="separator:acaeb27063a444e2a3b93f3cb70e3c290 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamA::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">SharedStoreStorageA</a></td></tr>
-<tr class="memdesc:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for A.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a8d49ad32fc9d8c14f6141690962c3f9c">More...</a><br /></td></tr>
-<tr class="separator:a8d49ad32fc9d8c14f6141690962c3f9c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef GlobalLoadStreamB::SharedStoreStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">SharedStoreStorageB</a></td></tr>
-<tr class="memdesc:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shared storage for B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a438b80cd8d8df0e74014ae47a162f7ed">More...</a><br /></td></tr>
-<tr class="separator:a438b80cd8d8df0e74014ae47a162f7ed inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
+<tr class="memitem:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">MultiplyAdd</a></td></tr>
 <tr class="memdesc:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The multiply-add functor.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#af810544e956b04830c5be7ce41d3b45c">More...</a><br /></td></tr>
 <tr class="separator:af810544e956b04830c5be7ce41d3b45c inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a424f1ac14e1e7ad37428edd0cf13e7fe inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef Epilogue_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a424f1ac14e1e7ad37428edd0cf13e7fe">Epilogue</a></td></tr>
@@ -143,6 +143,15 @@ Additional Inherited Members</h2></td></tr>
 <tr class="memitem:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a>&lt; GemmConfig_::Accumulators::Element &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">ClearAccumulators</a></td></tr>
 <tr class="memdesc:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Clear the accumulators.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#ae1cf7988c9cff79a2c3252aaf91fc165">More...</a><br /></td></tr>
 <tr class="separator:ae1cf7988c9cff79a2c3252aaf91fc165 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html">GlobalLoadStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a9cd6c3fddfb4315eb52b672900462c47">GlobalLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ac393b07e780629fc8254fc22cc6f815b">GlobalLoadStreamB</a>, GemmConfig::kResidueInProlog &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">GlobalLoadStream</a></td></tr>
+<tr class="memdesc:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the global load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a367aa0bd4be33d90ffe752274c728ef8">More...</a><br /></td></tr>
+<tr class="separator:a367aa0bd4be33d90ffe752274c728ef8 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStreamPair.html#a5eef540f82acea5d9cb12965707ba158">GlobalLoadStream::ThreadblockTileStorage</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">ThreadblockTileStorage</a></td></tr>
+<tr class="memdesc:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Memory needed to store the threadblock-scoped GEMM tile.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#abfecd4a57dfbf82e8fa74a50e01fc4ee">More...</a><br /></td></tr>
+<tr class="separator:abfecd4a57dfbf82e8fa74a50e01fc4ee inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1SharedStreamPair.html">SharedStreamPair</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#ae01371eb31b88fa83c4926564cecafdc">SharedLoadStreamA</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#acaeb27063a444e2a3b93f3cb70e3c290">SharedLoadStreamB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">SharedStream</a></td></tr>
+<tr class="memdesc:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Assemble the shared load streams for A/B.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a7864969e774c0f7155951e1ab599ed17">More...</a><br /></td></tr>
+<tr class="separator:a7864969e774c0f7155951e1ab599ed17 inherit pub_types_structcutlass_1_1gemm_1_1GemmTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits&lt; GemmConfig_, Helper_::GlobalLoadStreamA, Helper_::GlobalLoadStreamB, Helper_::SharedLoadStreamA, Helper_::SharedLoadStreamB, Epilogue_, IdentityBlockSwizzle, Index_, ClearAccumulators&lt; GemmConfig_::Accumulators::Element &gt; &gt;</a></td></tr>
 <tr class="memitem:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">shared_load_fence</a> (bool in_loop)</td></tr>
 <tr class="memdesc:a475463c1e3af71598e22da8956900ebe inherit pub_static_methods_structcutlass_1_1gemm_1_1GemmTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The memory fence for shared loads.  <a href="structcutlass_1_1gemm_1_1GemmTraits.html#a475463c1e3af71598e22da8956900ebe">More...</a><br /></td></tr>
@@ -164,7 +173,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper-members.html b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper-members.html
index 65e20abd3..eb4d77f7f 100644
--- a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper-members.html
+++ b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper-members.html
@@ -81,8 +81,8 @@ $(function() {
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">GlobalLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">GlobalLoadIteratorB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266">GlobalLoadStreamA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83">GlobalLoadStreamB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">GlobalTransformerA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">GlobalTransformerB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">SharedLoadIteratorA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;</a></td><td class="entry"></td></tr>
@@ -94,7 +94,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html
index 6b3b04941..6fb892ed9 100644
--- a/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html
+++ b/docs/structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html
@@ -93,9 +93,9 @@ Public Types</h2></td></tr>
 <tr class="memitem:a3a20852daeb46c625b2391d078b30d73"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperA_::SharedStoreTileTraits, typename GemmTileTraitsHelperA_::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">SharedStoreIteratorA</a></td></tr>
 <tr class="memdesc:a3a20852daeb46c625b2391d078b30d73"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store A to shared memory.  <a href="#a3a20852daeb46c625b2391d078b30d73">More...</a><br /></td></tr>
 <tr class="separator:a3a20852daeb46c625b2391d078b30d73"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a448c242880183e006b70d839d210a2ec"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">GlobalTransformerA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec">GlobalLoadStreamA</a></td></tr>
-<tr class="memdesc:a448c242880183e006b70d839d210a2ec"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from global memory to shared memory.  <a href="#a448c242880183e006b70d839d210a2ec">More...</a><br /></td></tr>
-<tr class="separator:a448c242880183e006b70d839d210a2ec"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a50121da13661e9fa50e5ea3a87c06266"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">GlobalTransformerA</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266">GlobalLoadStreamA</a></td></tr>
+<tr class="memdesc:a50121da13661e9fa50e5ea3a87c06266"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load A from global memory to shared memory.  <a href="#a50121da13661e9fa50e5ea3a87c06266">More...</a><br /></td></tr>
+<tr class="separator:a50121da13661e9fa50e5ea3a87c06266"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a362794738bc14b283a91558bcadbbfd5"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorAb.html">GemmGlobalIteratorAb</a>&lt; typename GemmTileTraitsHelperB_::GlobalTileTraits, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">GlobalLoadIteratorB</a></td></tr>
 <tr class="memdesc:a362794738bc14b283a91558bcadbbfd5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The global iterator to load B from global memory.  <a href="#a362794738bc14b283a91558bcadbbfd5">More...</a><br /></td></tr>
 <tr class="separator:a362794738bc14b283a91558bcadbbfd5"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -105,9 +105,9 @@ Public Types</h2></td></tr>
 <tr class="memitem:a43713f534798b1e27c4ba38b72e63c08"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a>&lt; typename GemmTileTraitsHelperB_::SharedStoreTileTraits, typename GemmTileTraitsHelperB_::SharedStoreTileTraits::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">SharedStoreIteratorB</a></td></tr>
 <tr class="memdesc:a43713f534798b1e27c4ba38b72e63c08"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to store B to shared memory.  <a href="#a43713f534798b1e27c4ba38b72e63c08">More...</a><br /></td></tr>
 <tr class="separator:a43713f534798b1e27c4ba38b72e63c08"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aad467ed9a680b4d77acecb096799cd89"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">GlobalTransformerB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89">GlobalLoadStreamB</a></td></tr>
-<tr class="memdesc:aad467ed9a680b4d77acecb096799cd89"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from global memory to shared memory.  <a href="#aad467ed9a680b4d77acecb096799cd89">More...</a><br /></td></tr>
-<tr class="separator:aad467ed9a680b4d77acecb096799cd89"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2fcf34dcf8d89424aa15da709aed4a83"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt; <a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">GlobalTransformerB</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83">GlobalLoadStreamB</a></td></tr>
+<tr class="memdesc:a2fcf34dcf8d89424aa15da709aed4a83"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stream to load B from global memory to shared memory.  <a href="#a2fcf34dcf8d89424aa15da709aed4a83">More...</a><br /></td></tr>
+<tr class="separator:a2fcf34dcf8d89424aa15da709aed4a83"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a365aed4c0e2ad1bffea517ee36998557"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a>&lt; typename GemmTileTraitsHelperA_::SharedLoadTileTraits, typename GemmTileTraitsHelperA_::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a365aed4c0e2ad1bffea517ee36998557">SharedLoadIteratorA</a></td></tr>
 <tr class="memdesc:a365aed4c0e2ad1bffea517ee36998557"><td class="mdescLeft">&#160;</td><td class="mdescRight">The iterator to load A from shared memory.  <a href="#a365aed4c0e2ad1bffea517ee36998557">More...</a><br /></td></tr>
 <tr class="separator:a365aed4c0e2ad1bffea517ee36998557"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -154,8 +154,8 @@ template&lt;typename GemmTileTraitsHelperA_ , typename GemmTileTraitsHelperB_ ,
 
 </div>
 </div>
-<a id="a448c242880183e006b70d839d210a2ec"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a448c242880183e006b70d839d210a2ec">&#9670;&nbsp;</a></span>GlobalLoadStreamA</h2>
+<a id="a50121da13661e9fa50e5ea3a87c06266"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a50121da13661e9fa50e5ea3a87c06266">&#9670;&nbsp;</a></span>GlobalLoadStreamA</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -163,15 +163,15 @@ template&lt;typename GemmTileTraitsHelperA_ , typename GemmTileTraitsHelperB_ ,
 template&lt;typename GemmTileTraitsHelperA_ , typename GemmTileTraitsHelperB_ , typename Index_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">GlobalTransformerA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper</a>&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a448c242880183e006b70d839d210a2ec">GlobalLoadStreamA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a5687850f235d644a4820851880740d27">GlobalLoadIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a3a20852daeb46c625b2391d078b30d73">SharedStoreIteratorA</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#af9a98d39d6959a9641f7c3c90df2f98e">GlobalTransformerA</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper</a>&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a50121da13661e9fa50e5ea3a87c06266">GlobalLoadStreamA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aad467ed9a680b4d77acecb096799cd89"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aad467ed9a680b4d77acecb096799cd89">&#9670;&nbsp;</a></span>GlobalLoadStreamB</h2>
+<a id="a2fcf34dcf8d89424aa15da709aed4a83"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2fcf34dcf8d89424aa15da709aed4a83">&#9670;&nbsp;</a></span>GlobalLoadStreamB</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -179,7 +179,7 @@ template&lt;typename GemmTileTraitsHelperA_ , typename GemmTileTraitsHelperB_ ,
 template&lt;typename GemmTileTraitsHelperA_ , typename GemmTileTraitsHelperB_ , typename Index_ &gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">GlobalTransformerB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper</a>&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#aad467ed9a680b4d77acecb096799cd89">GlobalLoadStreamB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GlobalLoadStream.html">GlobalLoadStream</a>&lt;<a class="el" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a362794738bc14b283a91558bcadbbfd5">GlobalLoadIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a43713f534798b1e27c4ba38b72e63c08">SharedStoreIteratorB</a>, <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a437070ba4a214aee363315d6019e450c">GlobalTransformerB</a>&gt; <a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html">cutlass::gemm::SimplifiedGemmTraitsHelper</a>&lt; GemmTileTraitsHelperA_, GemmTileTraitsHelperB_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1SimplifiedGemmTraitsHelper.html#a2fcf34dcf8d89424aa15da709aed4a83">GlobalLoadStreamB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -320,7 +320,7 @@ template&lt;typename GemmTileTraitsHelperA_ , typename GemmTileTraitsHelperB_ ,
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd-members.html b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd-members.html
index fd4bda028..2fed8fa28 100644
--- a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd-members.html
+++ b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd-members.html
@@ -73,28 +73,29 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt; Member List</div>  </div>
+<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt; Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">AccumulatorsPerThread</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">FragmentA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">FragmentB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5dcf66c8126ec8adf8e66d4bf5b2f347">multiply_add</a>(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ab271a3f11ccde4b629ddb11b78c0d555">ThreadMultiplyAdd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">ThreadsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d">AccumulatorsPerThread</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">FragmentA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">FragmentB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7989d48e4c2e16b7804b813630f347cb">multiply_add</a>(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">ThreadGemmShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac087f0b397599221b74d220fcb1c7121">ThreadMultiplyAdd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">ThreadsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html
index 2fcd68bdf..fe9c9ebd7 100644
--- a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html
+++ b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt; Struct Template Reference</title>
+<title>Cutlass: cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt; Struct Template Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -77,7 +77,7 @@ $(function() {
 <a href="#pub-methods">Public Member Functions</a> &#124;
 <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt; Struct Template Reference</div>  </div>
+<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt; Struct Template Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -88,201 +88,220 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:ac6381210d447fda9b0e9a028d167f22b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, 1, 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">InstructionShape</a></td></tr>
-<tr class="memdesc:ac6381210d447fda9b0e9a028d167f22b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#ac6381210d447fda9b0e9a028d167f22b">More...</a><br /></td></tr>
-<tr class="separator:ac6381210d447fda9b0e9a028d167f22b"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a002b1944b25cc8fe0862f40a8c8555c5"><td class="memItemLeft" align="right" valign="top">typedef AccumulatorsPerThread_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">AccumulatorsPerThread</a></td></tr>
-<tr class="memdesc:a002b1944b25cc8fe0862f40a8c8555c5"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per thread.  <a href="#a002b1944b25cc8fe0862f40a8c8555c5">More...</a><br /></td></tr>
-<tr class="separator:a002b1944b25cc8fe0862f40a8c8555c5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ad2fbba0a70da29af27ed4578577abc5e"><td class="memItemLeft" align="right" valign="top">typedef ThreadsPerWarp_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">ThreadsPerWarp</a></td></tr>
-<tr class="memdesc:ad2fbba0a70da29af27ed4578577abc5e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of threads per warp.  <a href="#ad2fbba0a70da29af27ed4578577abc5e">More...</a><br /></td></tr>
-<tr class="separator:ad2fbba0a70da29af27ed4578577abc5e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa83190df3c1639b6dd632cd4b9278d77"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">AccumulatorsPerThread</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">ThreadsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">AccumulatorsPerWarp</a></td></tr>
-<tr class="memdesc:aa83190df3c1639b6dd632cd4b9278d77"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="#aa83190df3c1639b6dd632cd4b9278d77">More...</a><br /></td></tr>
-<tr class="separator:aa83190df3c1639b6dd632cd4b9278d77"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a382242001b4c8e18ea5f2de724902217"><td class="memItemLeft" align="right" valign="top">typedef ScalarA_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">ScalarA</a></td></tr>
-<tr class="memdesc:a382242001b4c8e18ea5f2de724902217"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for A.  <a href="#a382242001b4c8e18ea5f2de724902217">More...</a><br /></td></tr>
-<tr class="separator:a382242001b4c8e18ea5f2de724902217"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a69d387d932b628dc51c18fcc178c4914"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">ScalarA</a>, AccumulatorsPerThread::kW &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">FragmentA</a></td></tr>
-<tr class="memdesc:a69d387d932b628dc51c18fcc178c4914"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for A.  <a href="#a69d387d932b628dc51c18fcc178c4914">More...</a><br /></td></tr>
-<tr class="separator:a69d387d932b628dc51c18fcc178c4914"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a42d181e7f4d0d0a15e1c911d3498b767"><td class="memItemLeft" align="right" valign="top">typedef ScalarB_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">ScalarB</a></td></tr>
-<tr class="memdesc:a42d181e7f4d0d0a15e1c911d3498b767"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for B.  <a href="#a42d181e7f4d0d0a15e1c911d3498b767">More...</a><br /></td></tr>
-<tr class="separator:a42d181e7f4d0d0a15e1c911d3498b767"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5429a730a1dea00dc4aecbe8e3ef1620"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">ScalarB</a>, AccumulatorsPerThread::kH &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">FragmentB</a></td></tr>
-<tr class="memdesc:a5429a730a1dea00dc4aecbe8e3ef1620"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for B.  <a href="#a5429a730a1dea00dc4aecbe8e3ef1620">More...</a><br /></td></tr>
-<tr class="separator:a5429a730a1dea00dc4aecbe8e3ef1620"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a1af758cb98c33060462a2706856b0a01"><td class="memItemLeft" align="right" valign="top">typedef ScalarC_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">ScalarC</a></td></tr>
-<tr class="memdesc:a1af758cb98c33060462a2706856b0a01"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for C and D.  <a href="#a1af758cb98c33060462a2706856b0a01">More...</a><br /></td></tr>
-<tr class="separator:a1af758cb98c33060462a2706856b0a01"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a760a5262f419b789540e7bbb2fda4b9d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">ScalarC</a>, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW, 16 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">Accumulators</a></td></tr>
-<tr class="memdesc:a760a5262f419b789540e7bbb2fda4b9d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="#a760a5262f419b789540e7bbb2fda4b9d">More...</a><br /></td></tr>
-<tr class="separator:a760a5262f419b789540e7bbb2fda4b9d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a56d687b878397c694e7338fa750995af"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, 1, 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">InstructionShape</a></td></tr>
+<tr class="memdesc:a56d687b878397c694e7338fa750995af"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#a56d687b878397c694e7338fa750995af">More...</a><br /></td></tr>
+<tr class="separator:a56d687b878397c694e7338fa750995af"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a33a68b52cca697bd505bfd982938143e"><td class="memItemLeft" align="right" valign="top">typedef ThreadGemmShape_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">ThreadGemmShape</a></td></tr>
+<tr class="memdesc:a33a68b52cca697bd505bfd982938143e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of a thread-leveel matrix multiply accumulate.  <a href="#a33a68b52cca697bd505bfd982938143e">More...</a><br /></td></tr>
+<tr class="separator:a33a68b52cca697bd505bfd982938143e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad8ea3777c307bf3f8c58a8df3966715d"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">ThreadGemmShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d">AccumulatorsPerThread</a></td></tr>
+<tr class="memdesc:ad8ea3777c307bf3f8c58a8df3966715d"><td class="mdescLeft">&#160;</td><td class="mdescRight">Aliased to "AccumulatorsPerThread" for compatibility. Expect to be renamed in CUTLASS v2.0.  <a href="#ad8ea3777c307bf3f8c58a8df3966715d">More...</a><br /></td></tr>
+<tr class="separator:ad8ea3777c307bf3f8c58a8df3966715d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a19bd7eb621b08f192bc01a4634853a9b"><td class="memItemLeft" align="right" valign="top">typedef ThreadsPerWarp_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">ThreadsPerWarp</a></td></tr>
+<tr class="memdesc:a19bd7eb621b08f192bc01a4634853a9b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of threads per warp.  <a href="#a19bd7eb621b08f192bc01a4634853a9b">More...</a><br /></td></tr>
+<tr class="separator:a19bd7eb621b08f192bc01a4634853a9b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9f706e141ec3bc880fa17a5731d8370e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">ThreadGemmShape</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">ThreadsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:a9f706e141ec3bc880fa17a5731d8370e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="#a9f706e141ec3bc880fa17a5731d8370e">More...</a><br /></td></tr>
+<tr class="separator:a9f706e141ec3bc880fa17a5731d8370e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6bb4f6a102edc2c8fba5b67abf05c363"><td class="memItemLeft" align="right" valign="top">typedef ScalarA_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">ScalarA</a></td></tr>
+<tr class="memdesc:a6bb4f6a102edc2c8fba5b67abf05c363"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for A.  <a href="#a6bb4f6a102edc2c8fba5b67abf05c363">More...</a><br /></td></tr>
+<tr class="separator:a6bb4f6a102edc2c8fba5b67abf05c363"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7c1cc536ac6ad12800f9e2b5ec682649"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">ScalarA</a>, AccumulatorsPerThread::kW &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">FragmentA</a></td></tr>
+<tr class="memdesc:a7c1cc536ac6ad12800f9e2b5ec682649"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for A.  <a href="#a7c1cc536ac6ad12800f9e2b5ec682649">More...</a><br /></td></tr>
+<tr class="separator:a7c1cc536ac6ad12800f9e2b5ec682649"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6c9a73da33b5ba70307a719db988b56c"><td class="memItemLeft" align="right" valign="top">typedef ScalarB_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">ScalarB</a></td></tr>
+<tr class="memdesc:a6c9a73da33b5ba70307a719db988b56c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for B.  <a href="#a6c9a73da33b5ba70307a719db988b56c">More...</a><br /></td></tr>
+<tr class="separator:a6c9a73da33b5ba70307a719db988b56c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1401162276ea0858ea85a8e4785adbad"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">ScalarB</a>, AccumulatorsPerThread::kH &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">FragmentB</a></td></tr>
+<tr class="memdesc:a1401162276ea0858ea85a8e4785adbad"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for B.  <a href="#a1401162276ea0858ea85a8e4785adbad">More...</a><br /></td></tr>
+<tr class="separator:a1401162276ea0858ea85a8e4785adbad"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af41778b170d940d10bd53f13d34912b1"><td class="memItemLeft" align="right" valign="top">typedef ScalarC_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">ScalarC</a></td></tr>
+<tr class="memdesc:af41778b170d940d10bd53f13d34912b1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for C and D.  <a href="#af41778b170d940d10bd53f13d34912b1">More...</a><br /></td></tr>
+<tr class="separator:af41778b170d940d10bd53f13d34912b1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a72d1ac143dab68b6cdd73d057315fcb6"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">ScalarC</a>, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW, 16 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">Accumulators</a></td></tr>
+<tr class="memdesc:a72d1ac143dab68b6cdd73d057315fcb6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="#a72d1ac143dab68b6cdd73d057315fcb6">More...</a><br /></td></tr>
+<tr class="separator:a72d1ac143dab68b6cdd73d057315fcb6"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:ab271a3f11ccde4b629ddb11b78c0d555"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ab271a3f11ccde4b629ddb11b78c0d555">ThreadMultiplyAdd</a> ()</td></tr>
-<tr class="memdesc:ab271a3f11ccde4b629ddb11b78c0d555"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ab271a3f11ccde4b629ddb11b78c0d555">More...</a><br /></td></tr>
-<tr class="separator:ab271a3f11ccde4b629ddb11b78c0d555"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5dcf66c8126ec8adf8e66d4bf5b2f347"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5dcf66c8126ec8adf8e66d4bf5b2f347">multiply_add</a> (<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">FragmentA</a> const &amp;a, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">FragmentB</a> const &amp;b, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">Accumulators</a> const &amp;c, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">Accumulators</a> &amp;d)</td></tr>
-<tr class="memdesc:a5dcf66c8126ec8adf8e66d4bf5b2f347"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b + c.  <a href="#a5dcf66c8126ec8adf8e66d4bf5b2f347">More...</a><br /></td></tr>
-<tr class="separator:a5dcf66c8126ec8adf8e66d4bf5b2f347"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac087f0b397599221b74d220fcb1c7121"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac087f0b397599221b74d220fcb1c7121">ThreadMultiplyAdd</a> ()</td></tr>
+<tr class="memdesc:ac087f0b397599221b74d220fcb1c7121"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#ac087f0b397599221b74d220fcb1c7121">More...</a><br /></td></tr>
+<tr class="separator:ac087f0b397599221b74d220fcb1c7121"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7989d48e4c2e16b7804b813630f347cb"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7989d48e4c2e16b7804b813630f347cb">multiply_add</a> (<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">FragmentA</a> const &amp;a, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">FragmentB</a> const &amp;b, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">Accumulators</a> const &amp;c, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">Accumulators</a> &amp;d)</td></tr>
+<tr class="memdesc:a7989d48e4c2e16b7804b813630f347cb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b + c.  <a href="#a7989d48e4c2e16b7804b813630f347cb">More...</a><br /></td></tr>
+<tr class="separator:a7989d48e4c2e16b7804b813630f347cb"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a760a5262f419b789540e7bbb2fda4b9d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a760a5262f419b789540e7bbb2fda4b9d">&#9670;&nbsp;</a></span>Accumulators</h2>
+<a id="a72d1ac143dab68b6cdd73d057315fcb6"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a72d1ac143dab68b6cdd73d057315fcb6">&#9670;&nbsp;</a></span>Accumulators</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">ScalarC</a>, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW, 16&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">Accumulators</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">ScalarC</a>, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW, 16&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">Accumulators</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a002b1944b25cc8fe0862f40a8c8555c5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a002b1944b25cc8fe0862f40a8c8555c5">&#9670;&nbsp;</a></span>AccumulatorsPerThread</h2>
+<a id="ad8ea3777c307bf3f8c58a8df3966715d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad8ea3777c307bf3f8c58a8df3966715d">&#9670;&nbsp;</a></span>AccumulatorsPerThread</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef AccumulatorsPerThread_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">AccumulatorsPerThread</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">ThreadGemmShape</a> <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d">AccumulatorsPerThread</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="aa83190df3c1639b6dd632cd4b9278d77"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa83190df3c1639b6dd632cd4b9278d77">&#9670;&nbsp;</a></span>AccumulatorsPerWarp</h2>
+<a id="a9f706e141ec3bc880fa17a5731d8370e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9f706e141ec3bc880fa17a5731d8370e">&#9670;&nbsp;</a></span>AccumulatorsPerWarp</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">AccumulatorsPerThread</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">ThreadsPerWarp</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">AccumulatorsPerWarp</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">ThreadGemmShape</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">ThreadsPerWarp</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">AccumulatorsPerWarp</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a69d387d932b628dc51c18fcc178c4914"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a69d387d932b628dc51c18fcc178c4914">&#9670;&nbsp;</a></span>FragmentA</h2>
+<a id="a7c1cc536ac6ad12800f9e2b5ec682649"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7c1cc536ac6ad12800f9e2b5ec682649">&#9670;&nbsp;</a></span>FragmentA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">ScalarA</a>, AccumulatorsPerThread::kW&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">FragmentA</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">ScalarA</a>, AccumulatorsPerThread::kW&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">FragmentA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a5429a730a1dea00dc4aecbe8e3ef1620"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5429a730a1dea00dc4aecbe8e3ef1620">&#9670;&nbsp;</a></span>FragmentB</h2>
+<a id="a1401162276ea0858ea85a8e4785adbad"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1401162276ea0858ea85a8e4785adbad">&#9670;&nbsp;</a></span>FragmentB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">ScalarB</a>, AccumulatorsPerThread::kH&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">FragmentB</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">ScalarB</a>, AccumulatorsPerThread::kH&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">FragmentB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ac6381210d447fda9b0e9a028d167f22b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ac6381210d447fda9b0e9a028d167f22b">&#9670;&nbsp;</a></span>InstructionShape</h2>
+<a id="a56d687b878397c694e7338fa750995af"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a56d687b878397c694e7338fa750995af">&#9670;&nbsp;</a></span>InstructionShape</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, 1, 1&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">InstructionShape</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, 1, 1&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">InstructionShape</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a382242001b4c8e18ea5f2de724902217"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a382242001b4c8e18ea5f2de724902217">&#9670;&nbsp;</a></span>ScalarA</h2>
+<a id="a6bb4f6a102edc2c8fba5b67abf05c363"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6bb4f6a102edc2c8fba5b67abf05c363">&#9670;&nbsp;</a></span>ScalarA</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef ScalarA_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">ScalarA</a></td>
+          <td class="memname">typedef ScalarA_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">ScalarA</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a42d181e7f4d0d0a15e1c911d3498b767"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a42d181e7f4d0d0a15e1c911d3498b767">&#9670;&nbsp;</a></span>ScalarB</h2>
+<a id="a6c9a73da33b5ba70307a719db988b56c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6c9a73da33b5ba70307a719db988b56c">&#9670;&nbsp;</a></span>ScalarB</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef ScalarB_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">ScalarB</a></td>
+          <td class="memname">typedef ScalarB_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">ScalarB</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a1af758cb98c33060462a2706856b0a01"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1af758cb98c33060462a2706856b0a01">&#9670;&nbsp;</a></span>ScalarC</h2>
+<a id="af41778b170d940d10bd53f13d34912b1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af41778b170d940d10bd53f13d34912b1">&#9670;&nbsp;</a></span>ScalarC</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef ScalarC_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">ScalarC</a></td>
+          <td class="memname">typedef ScalarC_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">ScalarC</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="ad2fbba0a70da29af27ed4578577abc5e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad2fbba0a70da29af27ed4578577abc5e">&#9670;&nbsp;</a></span>ThreadsPerWarp</h2>
+<a id="a33a68b52cca697bd505bfd982938143e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a33a68b52cca697bd505bfd982938143e">&#9670;&nbsp;</a></span>ThreadGemmShape</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef ThreadsPerWarp_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">ThreadsPerWarp</a></td>
+          <td class="memname">typedef ThreadGemmShape_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">ThreadGemmShape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a19bd7eb621b08f192bc01a4634853a9b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a19bd7eb621b08f192bc01a4634853a9b">&#9670;&nbsp;</a></span>ThreadsPerWarp</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef ThreadsPerWarp_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">ThreadsPerWarp</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -290,19 +309,19 @@ template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typenam
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="ab271a3f11ccde4b629ddb11b78c0d555"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab271a3f11ccde4b629ddb11b78c0d555">&#9670;&nbsp;</a></span>ThreadMultiplyAdd()</h2>
+<a id="ac087f0b397599221b74d220fcb1c7121"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac087f0b397599221b74d220fcb1c7121">&#9670;&nbsp;</a></span>ThreadMultiplyAdd()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a> </td>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a> </td>
           <td>(</td>
           <td class="paramname"></td><td>)</td>
           <td></td>
@@ -318,39 +337,39 @@ template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typenam
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a5dcf66c8126ec8adf8e66d4bf5b2f347"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5dcf66c8126ec8adf8e66d4bf5b2f347">&#9670;&nbsp;</a></span>multiply_add()</h2>
+<a id="a7989d48e4c2e16b7804b813630f347cb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a7989d48e4c2e16b7804b813630f347cb">&#9670;&nbsp;</a></span>multiply_add()</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ &gt; </div>
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ , typename ScalarA_ , typename ScalarB_ , typename ScalarC_ , MatrixLayout::Kind kLayout_ = MatrixLayout::kColumnMajor&gt; </div>
 <table class="mlabels">
   <tr>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;::multiply_add </td>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;::multiply_add </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">FragmentA</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">FragmentA</a> const &amp;&#160;</td>
           <td class="paramname"><em>a</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">FragmentB</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">FragmentB</a> const &amp;&#160;</td>
           <td class="paramname"><em>b</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">Accumulators</a> const &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">Accumulators</a> const &amp;&#160;</td>
           <td class="paramname"><em>c</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">Accumulators</a> &amp;&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">Accumulators</a> &amp;&#160;</td>
           <td class="paramname"><em>d</em>&#160;</td>
         </tr>
         <tr>
@@ -374,7 +393,7 @@ template&lt;typename AccumulatorsPerThread_ , typename ThreadsPerWarp_ , typenam
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half030e27fde4380ad93cd574bc743e0ba3.html b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half030e27fde4380ad93cd574bc743e0ba3.html
new file mode 100644
index 000000000..09d3ddca1
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half030e27fde4380ad93cd574bc743e0ba3.html
@@ -0,0 +1,103 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a">AccumulatorsPerThread</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">FragmentA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">FragmentB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aaf8ea4aaf393488f03ba7fb7af264940">multiply_add</a>(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">ThreadGemmShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a32b234c873ffe44090a12e12d871024c">ThreadMultiplyAdd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">ThreadsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half8ea66703da782e035d986e48031ff835.html b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half8ea66703da782e035d986e48031ff835.html
new file mode 100644
index 000000000..6dab18940
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half8ea66703da782e035d986e48031ff835.html
@@ -0,0 +1,103 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42">AccumulatorsPerThread</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">FragmentA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">FragmentB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#ae0ea662652907b60140598dad777c5ab">multiply_add</a>(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">ThreadGemmShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a0ab850304c3c6e73bcba321426ba93f9">ThreadMultiplyAdd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">ThreadsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html
new file mode 100644
index 000000000..4357b6eb3
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html
@@ -0,0 +1,401 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half8ea66703da782e035d986e48031ff835.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Template performing matrix multiply-add operation within a thread.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="fp16__sgemm__multiply__add_8h_source.html">fp16_sgemm_multiply_add.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:afc7858e849a2967631761986512dbfb7"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, 1, 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7">InstructionShape</a></td></tr>
+<tr class="memdesc:afc7858e849a2967631761986512dbfb7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#afc7858e849a2967631761986512dbfb7">More...</a><br /></td></tr>
+<tr class="separator:afc7858e849a2967631761986512dbfb7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8bbf1a5eac01585438c639da0e40e5c8"><td class="memItemLeft" align="right" valign="top">typedef ThreadGemmShape_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">ThreadGemmShape</a></td></tr>
+<tr class="memdesc:a8bbf1a5eac01585438c639da0e40e5c8"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of a thread-leveel matrix multiply accumulate.  <a href="#a8bbf1a5eac01585438c639da0e40e5c8">More...</a><br /></td></tr>
+<tr class="separator:a8bbf1a5eac01585438c639da0e40e5c8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a70e8444060c36afb41e5064b2fb18b42"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">ThreadGemmShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42">AccumulatorsPerThread</a></td></tr>
+<tr class="memdesc:a70e8444060c36afb41e5064b2fb18b42"><td class="mdescLeft">&#160;</td><td class="mdescRight">Aliased to "AccumulatorsPerThread" for compatibility. Expect to be renamed in CUTLASS v2.0.  <a href="#a70e8444060c36afb41e5064b2fb18b42">More...</a><br /></td></tr>
+<tr class="separator:a70e8444060c36afb41e5064b2fb18b42"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea4b928b0cfd4082e93851104838c5d7"><td class="memItemLeft" align="right" valign="top">typedef ThreadsPerWarp_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">ThreadsPerWarp</a></td></tr>
+<tr class="memdesc:aea4b928b0cfd4082e93851104838c5d7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of threads per warp.  <a href="#aea4b928b0cfd4082e93851104838c5d7">More...</a><br /></td></tr>
+<tr class="separator:aea4b928b0cfd4082e93851104838c5d7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9a5632bb1891a33126d6170af72a3ae2"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">ThreadGemmShape</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">ThreadsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:a9a5632bb1891a33126d6170af72a3ae2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="#a9a5632bb1891a33126d6170af72a3ae2">More...</a><br /></td></tr>
+<tr class="separator:a9a5632bb1891a33126d6170af72a3ae2"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a4f4a40f3e77a7c36425449fa97bf2324"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">ScalarA</a></td></tr>
+<tr class="memdesc:a4f4a40f3e77a7c36425449fa97bf2324"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for A. specialized to half.  <a href="#a4f4a40f3e77a7c36425449fa97bf2324">More...</a><br /></td></tr>
+<tr class="separator:a4f4a40f3e77a7c36425449fa97bf2324"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abe217e2e1a21b9f7cff5bb0a56bfa959"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">ScalarA</a>, AccumulatorsPerThread::kW &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">FragmentA</a></td></tr>
+<tr class="memdesc:abe217e2e1a21b9f7cff5bb0a56bfa959"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for A.  <a href="#abe217e2e1a21b9f7cff5bb0a56bfa959">More...</a><br /></td></tr>
+<tr class="separator:abe217e2e1a21b9f7cff5bb0a56bfa959"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3f4a2d052e6701f5d0ff950a850eabe3"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">ScalarB</a></td></tr>
+<tr class="memdesc:a3f4a2d052e6701f5d0ff950a850eabe3"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for B. specialized to half.  <a href="#a3f4a2d052e6701f5d0ff950a850eabe3">More...</a><br /></td></tr>
+<tr class="separator:a3f4a2d052e6701f5d0ff950a850eabe3"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8d74401ef0bfa076caad70669fb8d100"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">ScalarB</a>, AccumulatorsPerThread::kH &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">FragmentB</a></td></tr>
+<tr class="memdesc:a8d74401ef0bfa076caad70669fb8d100"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for B.  <a href="#a8d74401ef0bfa076caad70669fb8d100">More...</a><br /></td></tr>
+<tr class="separator:a8d74401ef0bfa076caad70669fb8d100"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a726556cb28d1515c89ac841f1140c781"><td class="memItemLeft" align="right" valign="top">typedef float&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">ScalarC</a></td></tr>
+<tr class="memdesc:a726556cb28d1515c89ac841f1140c781"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for C and D. specialized to float.  <a href="#a726556cb28d1515c89ac841f1140c781">More...</a><br /></td></tr>
+<tr class="separator:a726556cb28d1515c89ac841f1140c781"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af197d64d806795a1d88d1833e5f3ac89"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">ScalarC</a>, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW, 16 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">Accumulators</a></td></tr>
+<tr class="memdesc:af197d64d806795a1d88d1833e5f3ac89"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="#af197d64d806795a1d88d1833e5f3ac89">More...</a><br /></td></tr>
+<tr class="separator:af197d64d806795a1d88d1833e5f3ac89"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a0ab850304c3c6e73bcba321426ba93f9"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a0ab850304c3c6e73bcba321426ba93f9">ThreadMultiplyAdd</a> ()</td></tr>
+<tr class="memdesc:a0ab850304c3c6e73bcba321426ba93f9"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a0ab850304c3c6e73bcba321426ba93f9">More...</a><br /></td></tr>
+<tr class="separator:a0ab850304c3c6e73bcba321426ba93f9"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae0ea662652907b60140598dad777c5ab"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#ae0ea662652907b60140598dad777c5ab">multiply_add</a> (<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">FragmentA</a> const &amp;a, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">FragmentB</a> const &amp;b, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">Accumulators</a> const &amp;c, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">Accumulators</a> &amp;d)</td></tr>
+<tr class="memdesc:ae0ea662652907b60140598dad777c5ab"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b + c.  <a href="#ae0ea662652907b60140598dad777c5ab">More...</a><br /></td></tr>
+<tr class="separator:ae0ea662652907b60140598dad777c5ab"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="af197d64d806795a1d88d1833e5f3ac89"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af197d64d806795a1d88d1833e5f3ac89">&#9670;&nbsp;</a></span>Accumulators</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">ScalarC</a>, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW, 16&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">Accumulators</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a70e8444060c36afb41e5064b2fb18b42"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a70e8444060c36afb41e5064b2fb18b42">&#9670;&nbsp;</a></span>AccumulatorsPerThread</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">ThreadGemmShape</a> <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a70e8444060c36afb41e5064b2fb18b42">AccumulatorsPerThread</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a9a5632bb1891a33126d6170af72a3ae2"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9a5632bb1891a33126d6170af72a3ae2">&#9670;&nbsp;</a></span>AccumulatorsPerWarp</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">ThreadGemmShape</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">ThreadsPerWarp</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a9a5632bb1891a33126d6170af72a3ae2">AccumulatorsPerWarp</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="abe217e2e1a21b9f7cff5bb0a56bfa959"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abe217e2e1a21b9f7cff5bb0a56bfa959">&#9670;&nbsp;</a></span>FragmentA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">ScalarA</a>, AccumulatorsPerThread::kW&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">FragmentA</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8d74401ef0bfa076caad70669fb8d100"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8d74401ef0bfa076caad70669fb8d100">&#9670;&nbsp;</a></span>FragmentB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">ScalarB</a>, AccumulatorsPerThread::kH&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">FragmentB</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="afc7858e849a2967631761986512dbfb7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afc7858e849a2967631761986512dbfb7">&#9670;&nbsp;</a></span>InstructionShape</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, 1, 1&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#afc7858e849a2967631761986512dbfb7">InstructionShape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a4f4a40f3e77a7c36425449fa97bf2324"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4f4a40f3e77a7c36425449fa97bf2324">&#9670;&nbsp;</a></span>ScalarA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef half <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a4f4a40f3e77a7c36425449fa97bf2324">ScalarA</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a3f4a2d052e6701f5d0ff950a850eabe3"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3f4a2d052e6701f5d0ff950a850eabe3">&#9670;&nbsp;</a></span>ScalarB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef half <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a3f4a2d052e6701f5d0ff950a850eabe3">ScalarB</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a726556cb28d1515c89ac841f1140c781"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a726556cb28d1515c89ac841f1140c781">&#9670;&nbsp;</a></span>ScalarC</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef float <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a726556cb28d1515c89ac841f1140c781">ScalarC</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8bbf1a5eac01585438c639da0e40e5c8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8bbf1a5eac01585438c639da0e40e5c8">&#9670;&nbsp;</a></span>ThreadGemmShape</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef ThreadGemmShape_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8bbf1a5eac01585438c639da0e40e5c8">ThreadGemmShape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aea4b928b0cfd4082e93851104838c5d7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea4b928b0cfd4082e93851104838c5d7">&#9670;&nbsp;</a></span>ThreadsPerWarp</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef ThreadsPerWarp_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#aea4b928b0cfd4082e93851104838c5d7">ThreadsPerWarp</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a0ab850304c3c6e73bcba321426ba93f9"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0ab850304c3c6e73bcba321426ba93f9">&#9670;&nbsp;</a></span>ThreadMultiplyAdd()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ae0ea662652907b60140598dad777c5ab"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae0ea662652907b60140598dad777c5ab">&#9670;&nbsp;</a></span>multiply_add()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, float &gt;::multiply_add </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#abe217e2e1a21b9f7cff5bb0a56bfa959">FragmentA</a> const &amp;&#160;</td>
+          <td class="paramname"><em>a</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#a8d74401ef0bfa076caad70669fb8d100">FragmentB</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">Accumulators</a> const &amp;&#160;</td>
+          <td class="paramname"><em>c</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01float_01_4.html#af197d64d806795a1d88d1833e5f3ac89">Accumulators</a> &amp;&#160;</td>
+          <td class="paramname"><em>d</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="fp16__sgemm__multiply__add_8h_source.html">fp16_sgemm_multiply_add.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html
new file mode 100644
index 000000000..6e9193b2d
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html
@@ -0,0 +1,402 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half030e27fde4380ad93cd574bc743e0ba3.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Template performing matrix multiply-add operation within a thread.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="hgemm__multiply__add_8h_source.html">hgemm_multiply_add.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a245bdf059794144d04d2823d2b39588e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, 2, 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e">InstructionShape</a></td></tr>
+<tr class="memdesc:a245bdf059794144d04d2823d2b39588e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#a245bdf059794144d04d2823d2b39588e">More...</a><br /></td></tr>
+<tr class="separator:a245bdf059794144d04d2823d2b39588e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac095b403212e23cb95e70cee9013099e"><td class="memItemLeft" align="right" valign="top">typedef ThreadGemmShape_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">ThreadGemmShape</a></td></tr>
+<tr class="memdesc:ac095b403212e23cb95e70cee9013099e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per thread.  <a href="#ac095b403212e23cb95e70cee9013099e">More...</a><br /></td></tr>
+<tr class="separator:ac095b403212e23cb95e70cee9013099e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24dd9fdc54b001840e8b82664b3bfe3a"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">ThreadGemmShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a">AccumulatorsPerThread</a></td></tr>
+<tr class="memdesc:a24dd9fdc54b001840e8b82664b3bfe3a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Aliased for compatibility. Will be removed for CUTLASS v2.0.  <a href="#a24dd9fdc54b001840e8b82664b3bfe3a">More...</a><br /></td></tr>
+<tr class="separator:a24dd9fdc54b001840e8b82664b3bfe3a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a61ed3d8bb4ca6db39d16b632f58d75dc"><td class="memItemLeft" align="right" valign="top">typedef ThreadsPerWarp_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">ThreadsPerWarp</a></td></tr>
+<tr class="memdesc:a61ed3d8bb4ca6db39d16b632f58d75dc"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of threads per warp.  <a href="#a61ed3d8bb4ca6db39d16b632f58d75dc">More...</a><br /></td></tr>
+<tr class="separator:a61ed3d8bb4ca6db39d16b632f58d75dc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aacb9a5a1d8f3b6e21bc449b0b97949b7"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">ThreadGemmShape</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">ThreadsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:aacb9a5a1d8f3b6e21bc449b0b97949b7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="#aacb9a5a1d8f3b6e21bc449b0b97949b7">More...</a><br /></td></tr>
+<tr class="separator:aacb9a5a1d8f3b6e21bc449b0b97949b7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1a8f6feed85c7e88b36bc1a2637c716f"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">ScalarA</a></td></tr>
+<tr class="memdesc:a1a8f6feed85c7e88b36bc1a2637c716f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for A.  <a href="#a1a8f6feed85c7e88b36bc1a2637c716f">More...</a><br /></td></tr>
+<tr class="separator:a1a8f6feed85c7e88b36bc1a2637c716f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1889bdc9e88265a8afdaeeca217a3372"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">ScalarA</a>, AccumulatorsPerThread::kW &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">FragmentA</a></td></tr>
+<tr class="memdesc:a1889bdc9e88265a8afdaeeca217a3372"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for A.  <a href="#a1889bdc9e88265a8afdaeeca217a3372">More...</a><br /></td></tr>
+<tr class="separator:a1889bdc9e88265a8afdaeeca217a3372"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a70dfd2f33548dbd104d798f728526fbc"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">ScalarB</a></td></tr>
+<tr class="memdesc:a70dfd2f33548dbd104d798f728526fbc"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for B.  <a href="#a70dfd2f33548dbd104d798f728526fbc">More...</a><br /></td></tr>
+<tr class="separator:a70dfd2f33548dbd104d798f728526fbc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae8f4db1465f5e082c6855bf13a4751c7"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">ScalarB</a>, AccumulatorsPerThread::kH &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">FragmentB</a></td></tr>
+<tr class="memdesc:ae8f4db1465f5e082c6855bf13a4751c7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for B.  <a href="#ae8f4db1465f5e082c6855bf13a4751c7">More...</a><br /></td></tr>
+<tr class="separator:ae8f4db1465f5e082c6855bf13a4751c7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a48a641d601c88d95aa542b636f94d60d"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d">ScalarC</a></td></tr>
+<tr class="memdesc:a48a641d601c88d95aa542b636f94d60d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for C and D.  <a href="#a48a641d601c88d95aa542b636f94d60d">More...</a><br /></td></tr>
+<tr class="separator:a48a641d601c88d95aa542b636f94d60d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af8124acb485709dba1c5378faa24516c"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; half, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">Accumulators</a></td></tr>
+<tr class="memdesc:af8124acb485709dba1c5378faa24516c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="#af8124acb485709dba1c5378faa24516c">More...</a><br /></td></tr>
+<tr class="separator:af8124acb485709dba1c5378faa24516c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a32b234c873ffe44090a12e12d871024c"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a32b234c873ffe44090a12e12d871024c">ThreadMultiplyAdd</a> ()</td></tr>
+<tr class="memdesc:a32b234c873ffe44090a12e12d871024c"><td class="mdescLeft">&#160;</td><td class="mdescRight">Make sure there's an even number of elements in both dimensions.  <a href="#a32b234c873ffe44090a12e12d871024c">More...</a><br /></td></tr>
+<tr class="separator:a32b234c873ffe44090a12e12d871024c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaf8ea4aaf393488f03ba7fb7af264940"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aaf8ea4aaf393488f03ba7fb7af264940">multiply_add</a> (<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">FragmentA</a> const &amp;a, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">FragmentB</a> const &amp;b, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">Accumulators</a> const &amp;c, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">Accumulators</a> &amp;d)</td></tr>
+<tr class="memdesc:aaf8ea4aaf393488f03ba7fb7af264940"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b + c.  <a href="#aaf8ea4aaf393488f03ba7fb7af264940">More...</a><br /></td></tr>
+<tr class="separator:aaf8ea4aaf393488f03ba7fb7af264940"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="af8124acb485709dba1c5378faa24516c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af8124acb485709dba1c5378faa24516c">&#9670;&nbsp;</a></span>Accumulators</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;half, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">Accumulators</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a24dd9fdc54b001840e8b82664b3bfe3a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a24dd9fdc54b001840e8b82664b3bfe3a">&#9670;&nbsp;</a></span>AccumulatorsPerThread</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">ThreadGemmShape</a> <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a24dd9fdc54b001840e8b82664b3bfe3a">AccumulatorsPerThread</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aacb9a5a1d8f3b6e21bc449b0b97949b7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aacb9a5a1d8f3b6e21bc449b0b97949b7">&#9670;&nbsp;</a></span>AccumulatorsPerWarp</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">ThreadGemmShape</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">ThreadsPerWarp</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#aacb9a5a1d8f3b6e21bc449b0b97949b7">AccumulatorsPerWarp</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1889bdc9e88265a8afdaeeca217a3372"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1889bdc9e88265a8afdaeeca217a3372">&#9670;&nbsp;</a></span>FragmentA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">ScalarA</a>, AccumulatorsPerThread::kW&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">FragmentA</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae8f4db1465f5e082c6855bf13a4751c7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae8f4db1465f5e082c6855bf13a4751c7">&#9670;&nbsp;</a></span>FragmentB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">ScalarB</a>, AccumulatorsPerThread::kH&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">FragmentB</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a245bdf059794144d04d2823d2b39588e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a245bdf059794144d04d2823d2b39588e">&#9670;&nbsp;</a></span>InstructionShape</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, 1, 2, 1&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a245bdf059794144d04d2823d2b39588e">InstructionShape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1a8f6feed85c7e88b36bc1a2637c716f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1a8f6feed85c7e88b36bc1a2637c716f">&#9670;&nbsp;</a></span>ScalarA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef half <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1a8f6feed85c7e88b36bc1a2637c716f">ScalarA</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a70dfd2f33548dbd104d798f728526fbc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a70dfd2f33548dbd104d798f728526fbc">&#9670;&nbsp;</a></span>ScalarB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef half <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a70dfd2f33548dbd104d798f728526fbc">ScalarB</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a48a641d601c88d95aa542b636f94d60d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a48a641d601c88d95aa542b636f94d60d">&#9670;&nbsp;</a></span>ScalarC</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef half <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a48a641d601c88d95aa542b636f94d60d">ScalarC</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac095b403212e23cb95e70cee9013099e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac095b403212e23cb95e70cee9013099e">&#9670;&nbsp;</a></span>ThreadGemmShape</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef ThreadGemmShape_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ac095b403212e23cb95e70cee9013099e">ThreadGemmShape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a61ed3d8bb4ca6db39d16b632f58d75dc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a61ed3d8bb4ca6db39d16b632f58d75dc">&#9670;&nbsp;</a></span>ThreadsPerWarp</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef ThreadsPerWarp_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a61ed3d8bb4ca6db39d16b632f58d75dc">ThreadsPerWarp</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a32b234c873ffe44090a12e12d871024c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a32b234c873ffe44090a12e12d871024c">&#9670;&nbsp;</a></span>ThreadMultiplyAdd()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+<p>Ctor. </p>
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="aaf8ea4aaf393488f03ba7fb7af264940"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aaf8ea4aaf393488f03ba7fb7af264940">&#9670;&nbsp;</a></span>multiply_add()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, half, half, half &gt;::multiply_add </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#a1889bdc9e88265a8afdaeeca217a3372">FragmentA</a> const &amp;&#160;</td>
+          <td class="paramname"><em>a</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#ae8f4db1465f5e082c6855bf13a4751c7">FragmentB</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">Accumulators</a> const &amp;&#160;</td>
+          <td class="paramname"><em>c</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01half_00_01half_00_01half_01_4.html#af8124acb485709dba1c5378faa24516c">Accumulators</a> &amp;&#160;</td>
+          <td class="paramname"><em>d</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="hgemm__multiply__add_8h_source.html">hgemm_multiply_add.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int86f255c0f34c1afba22b3a7d64d8f85bf.html b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int86f255c0f34c1afba22b3a7d64d8f85bf.html
new file mode 100644
index 000000000..e74e474f6
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int86f255c0f34c1afba22b3a7d64d8f85bf.html
@@ -0,0 +1,103 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">Accumulators</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947">AccumulatorsPerThread</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027">AccumulatorsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">FragmentA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">FragmentB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd">InstructionShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ad9d8e47e8896d8d4eab538aa78b56e47">multiply_add</a>(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">ScalarA</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">ScalarB</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">ScalarC</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">ThreadGemmShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aad8a642f46c88e407a1150ee1d42b8dd">ThreadMultiplyAdd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">ThreadsPerWarp</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html
new file mode 100644
index 000000000..c5d0581a6
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html
@@ -0,0 +1,401 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt; Struct Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html">ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int86f255c0f34c1afba22b3a7d64d8f85bf.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt; Struct Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Template performing matrix multiply-add operation within a thread.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="igemm__multiply__add_8h_source.html">igemm_multiply_add.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:aa84c3d4efc7947d6efb75536c88043bd"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 4, 1, 1 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd">InstructionShape</a></td></tr>
+<tr class="memdesc:aa84c3d4efc7947d6efb75536c88043bd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the instruction.  <a href="#aa84c3d4efc7947d6efb75536c88043bd">More...</a><br /></td></tr>
+<tr class="separator:aa84c3d4efc7947d6efb75536c88043bd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac5cde71eb825b0a4311bd0ce982f47aa"><td class="memItemLeft" align="right" valign="top">typedef ThreadGemmShape_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">ThreadGemmShape</a></td></tr>
+<tr class="memdesc:ac5cde71eb825b0a4311bd0ce982f47aa"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1Shape.html" title="A Shape implementing Layout Concept describing the dimensions of a cube. ">Shape</a> of the thread-level GEMM (K-by-N-by-M)  <a href="#ac5cde71eb825b0a4311bd0ce982f47aa">More...</a><br /></td></tr>
+<tr class="separator:ac5cde71eb825b0a4311bd0ce982f47aa"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa88edf2e89062be00181f5dc4f4a0947"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">ThreadGemmShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947">AccumulatorsPerThread</a></td></tr>
+<tr class="memdesc:aa88edf2e89062be00181f5dc4f4a0947"><td class="mdescLeft">&#160;</td><td class="mdescRight">Aliased for compatibility. Will be removed in CUTLASS v2.0.  <a href="#aa88edf2e89062be00181f5dc4f4a0947">More...</a><br /></td></tr>
+<tr class="separator:aa88edf2e89062be00181f5dc4f4a0947"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6bb1afd96da05370e61b38f2a93e40df"><td class="memItemLeft" align="right" valign="top">typedef ThreadsPerWarp_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">ThreadsPerWarp</a></td></tr>
+<tr class="memdesc:a6bb1afd96da05370e61b38f2a93e40df"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of threads per warp.  <a href="#a6bb1afd96da05370e61b38f2a93e40df">More...</a><br /></td></tr>
+<tr class="separator:a6bb1afd96da05370e61b38f2a93e40df"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae3152470cbbba2310d9c83b9d5d43027"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">ThreadGemmShape</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">ThreadsPerWarp</a> &gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027">AccumulatorsPerWarp</a></td></tr>
+<tr class="memdesc:ae3152470cbbba2310d9c83b9d5d43027"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of accumulators per warp.  <a href="#ae3152470cbbba2310d9c83b9d5d43027">More...</a><br /></td></tr>
+<tr class="separator:ae3152470cbbba2310d9c83b9d5d43027"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a11be198f90afb859be51ec5feb5dcd2b"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">ScalarA</a></td></tr>
+<tr class="memdesc:a11be198f90afb859be51ec5feb5dcd2b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for A.  <a href="#a11be198f90afb859be51ec5feb5dcd2b">More...</a><br /></td></tr>
+<tr class="separator:a11be198f90afb859be51ec5feb5dcd2b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8d0734b8e797576adcf89f70c62160d4"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">ScalarA</a>, AccumulatorsPerThread::kW *4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">FragmentA</a></td></tr>
+<tr class="memdesc:a8d0734b8e797576adcf89f70c62160d4"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for A.  <a href="#a8d0734b8e797576adcf89f70c62160d4">More...</a><br /></td></tr>
+<tr class="separator:a8d0734b8e797576adcf89f70c62160d4"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6a9c4f906a4930f4fc415009ead2e05d"><td class="memItemLeft" align="right" valign="top">typedef int8_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">ScalarB</a></td></tr>
+<tr class="memdesc:a6a9c4f906a4930f4fc415009ead2e05d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for B.  <a href="#a6a9c4f906a4930f4fc415009ead2e05d">More...</a><br /></td></tr>
+<tr class="separator:a6a9c4f906a4930f4fc415009ead2e05d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6439d8fc71727cc6d50f87eae549157e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">ScalarB</a>, AccumulatorsPerThread::kH *4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">FragmentB</a></td></tr>
+<tr class="memdesc:a6439d8fc71727cc6d50f87eae549157e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment for B.  <a href="#a6439d8fc71727cc6d50f87eae549157e">More...</a><br /></td></tr>
+<tr class="separator:a6439d8fc71727cc6d50f87eae549157e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a703b329ebf14d78f576e83c5e6fe23a7"><td class="memItemLeft" align="right" valign="top">typedef int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">ScalarC</a></td></tr>
+<tr class="memdesc:a703b329ebf14d78f576e83c5e6fe23a7"><td class="mdescLeft">&#160;</td><td class="mdescRight">The type for C and D.  <a href="#a703b329ebf14d78f576e83c5e6fe23a7">More...</a><br /></td></tr>
+<tr class="separator:a703b329ebf14d78f576e83c5e6fe23a7"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1ae57ab39203313cfd20208947750786"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">ScalarC</a>, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">Accumulators</a></td></tr>
+<tr class="memdesc:a1ae57ab39203313cfd20208947750786"><td class="mdescLeft">&#160;</td><td class="mdescRight">The accumulators.  <a href="#a1ae57ab39203313cfd20208947750786">More...</a><br /></td></tr>
+<tr class="separator:a1ae57ab39203313cfd20208947750786"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:aad8a642f46c88e407a1150ee1d42b8dd"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aad8a642f46c88e407a1150ee1d42b8dd">ThreadMultiplyAdd</a> ()</td></tr>
+<tr class="memdesc:aad8a642f46c88e407a1150ee1d42b8dd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#aad8a642f46c88e407a1150ee1d42b8dd">More...</a><br /></td></tr>
+<tr class="separator:aad8a642f46c88e407a1150ee1d42b8dd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad9d8e47e8896d8d4eab538aa78b56e47"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ad9d8e47e8896d8d4eab538aa78b56e47">multiply_add</a> (<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">FragmentA</a> const &amp;a, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">FragmentB</a> const &amp;b, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">Accumulators</a> const &amp;c, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">Accumulators</a> &amp;d)</td></tr>
+<tr class="memdesc:ad9d8e47e8896d8d4eab538aa78b56e47"><td class="mdescLeft">&#160;</td><td class="mdescRight">Multiply : d = a*b + c.  <a href="#ad9d8e47e8896d8d4eab538aa78b56e47">More...</a><br /></td></tr>
+<tr class="separator:ad9d8e47e8896d8d4eab538aa78b56e47"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a1ae57ab39203313cfd20208947750786"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1ae57ab39203313cfd20208947750786">&#9670;&nbsp;</a></span>Accumulators</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">ScalarC</a>, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">Accumulators</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa88edf2e89062be00181f5dc4f4a0947"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa88edf2e89062be00181f5dc4f4a0947">&#9670;&nbsp;</a></span>AccumulatorsPerThread</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">ThreadGemmShape</a> <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa88edf2e89062be00181f5dc4f4a0947">AccumulatorsPerThread</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ae3152470cbbba2310d9c83b9d5d43027"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae3152470cbbba2310d9c83b9d5d43027">&#9670;&nbsp;</a></span>AccumulatorsPerWarp</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1ShapeMul.html">ShapeMul</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">ThreadGemmShape</a>, <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">ThreadsPerWarp</a>&gt;::<a class="el" href="structcutlass_1_1Shape.html">Shape</a> <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ae3152470cbbba2310d9c83b9d5d43027">AccumulatorsPerWarp</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a8d0734b8e797576adcf89f70c62160d4"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8d0734b8e797576adcf89f70c62160d4">&#9670;&nbsp;</a></span>FragmentA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">ScalarA</a>, AccumulatorsPerThread::kW * 4&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">FragmentA</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6439d8fc71727cc6d50f87eae549157e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6439d8fc71727cc6d50f87eae549157e">&#9670;&nbsp;</a></span>FragmentB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Fragment.html">Fragment</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">ScalarB</a>, AccumulatorsPerThread::kH * 4&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">FragmentB</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="aa84c3d4efc7947d6efb75536c88043bd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aa84c3d4efc7947d6efb75536c88043bd">&#9670;&nbsp;</a></span>InstructionShape</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt;4, 1, 1&gt; <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#aa84c3d4efc7947d6efb75536c88043bd">InstructionShape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a11be198f90afb859be51ec5feb5dcd2b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a11be198f90afb859be51ec5feb5dcd2b">&#9670;&nbsp;</a></span>ScalarA</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef int8_t <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a11be198f90afb859be51ec5feb5dcd2b">ScalarA</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6a9c4f906a4930f4fc415009ead2e05d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6a9c4f906a4930f4fc415009ead2e05d">&#9670;&nbsp;</a></span>ScalarB</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef int8_t <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6a9c4f906a4930f4fc415009ead2e05d">ScalarB</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a703b329ebf14d78f576e83c5e6fe23a7"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a703b329ebf14d78f576e83c5e6fe23a7">&#9670;&nbsp;</a></span>ScalarC</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef int <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a703b329ebf14d78f576e83c5e6fe23a7">ScalarC</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ac5cde71eb825b0a4311bd0ce982f47aa"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ac5cde71eb825b0a4311bd0ce982f47aa">&#9670;&nbsp;</a></span>ThreadGemmShape</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef ThreadGemmShape_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#ac5cde71eb825b0a4311bd0ce982f47aa">ThreadGemmShape</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a6bb1afd96da05370e61b38f2a93e40df"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6bb1afd96da05370e61b38f2a93e40df">&#9670;&nbsp;</a></span>ThreadsPerWarp</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef ThreadsPerWarp_ <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6bb1afd96da05370e61b38f2a93e40df">ThreadsPerWarp</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="aad8a642f46c88e407a1150ee1d42b8dd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aad8a642f46c88e407a1150ee1d42b8dd">&#9670;&nbsp;</a></span>ThreadMultiplyAdd()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::<a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ad9d8e47e8896d8d4eab538aa78b56e47"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad9d8e47e8896d8d4eab538aa78b56e47">&#9670;&nbsp;</a></span>multiply_add()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename ThreadGemmShape_ , typename ThreadsPerWarp_ &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a>&lt; ThreadGemmShape_, ThreadsPerWarp_, int8_t, int8_t, int &gt;::multiply_add </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a8d0734b8e797576adcf89f70c62160d4">FragmentA</a> const &amp;&#160;</td>
+          <td class="paramname"><em>a</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a6439d8fc71727cc6d50f87eae549157e">FragmentB</a> const &amp;&#160;</td>
+          <td class="paramname"><em>b</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">Accumulators</a> const &amp;&#160;</td>
+          <td class="paramname"><em>c</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_3_01ThreadGemmShape___00_01ThreadsPerWarp___00_01int8__t_00_01int8__t_00_01int_01_4.html#a1ae57ab39203313cfd20208947750786">Accumulators</a> &amp;&#160;</td>
+          <td class="paramname"><em>d</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="igemm__multiply__add_8h_source.html">igemm_multiply_add.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd-members.html b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd-members.html
index 633e1cdc7..7d97f99c6 100644
--- a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd-members.html
+++ b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd-members.html
@@ -79,51 +79,57 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afe77778a126449e210c0bd6ec2dc6709">data</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a90e9886534ecbbce69f57b4030d0903f">data</a>() const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">add_pointer_offset</a>(Index offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aea87c73ae2d4e027014ebd4d8141c89e">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8">BaseParams</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">GemmGlobalIteratorCd</a>(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block_offset, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6">GemmGlobalIteratorCd</a>(Params const &amp;_params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a174ae7d8aa0664eaf1d6f63c5606baa0">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a44287250bf5631a490b514859fd101d1">inc_c</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab1ebbe54e4315ac07daf260a88f41d04">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa9a733f35e9be67663c9c8f80b0034d4">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aec2d692967d9be5d42673dfde21f5427">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">inc_advance</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">inc_c</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">inc_d</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">inc_h</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">inc_w</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a>(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;offset=make_Coord(0, 0, 0))</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a>(PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa">predicates</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a468f8f503777e4a2b0089ee2bd6c471a">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a505f124fa3f47c6d57b7275e81be6dd3">WmmaGemmGlobalIteratorCd</a>()</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a109209936a9453e8f1f3f5eecfd6afca">load_element</a>(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae2febd768cbbfb8aab3c2cb669c0505d">load_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">operator+=</a>(Coord&lt; 3 &gt; const &amp;offset)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a051eb2a8637601cf9c1f52999117151b">store_element</a>(typename Base::AccessType const &amp;value, int d, int h, int w, int c)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a018d5be34cdbb263d7f133197b2921ca">store_post_increment</a>(Fragment &amp;fragment)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">This_</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">valid</a>(int d, int h, int w, int c) const</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">WmmaGemmGlobalIteratorCd</a>(Params const &amp;params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int const pointer_offset=0, int const pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html
index e9c160775..4bf4c41ba 100644
--- a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html
+++ b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html
@@ -76,7 +76,6 @@ $(function() {
 <a href="#nested-classes">Classes</a> &#124;
 <a href="#pub-types">Public Types</a> &#124;
 <a href="#pub-methods">Public Member Functions</a> &#124;
-<a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="#pub-static-attribs">Static Public Attributes</a> &#124;
 <a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd-members.html">List of all members</a>  </div>
   <div class="headertitle">
@@ -91,6 +90,7 @@ Inheritance diagram for cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_,
  <div class="center">
   <img src="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.png" usemap="#cutlass::gemm::WmmaGemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map" alt=""/>
   <map id="cutlass::gemm::WmmaGemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map" name="cutlass::gemm::WmmaGemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E_map">
+<area href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html" alt="cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;" shape="rect" coords="0,56,643,80"/>
 <area href="structcutlass_1_1TileIteratorBase.html" alt="cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;" shape="rect" coords="0,0,643,24"/>
 </map>
  </div></div>
@@ -109,9 +109,9 @@ Public Types</h2></td></tr>
 <tr class="memitem:af2b5682b8e6dd13590ec258a44636430"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a></td></tr>
 <tr class="memdesc:af2b5682b8e6dd13590ec258a44636430"><td class="mdescLeft">&#160;</td><td class="mdescRight">The traits.  <a href="#af2b5682b8e6dd13590ec258a44636430">More...</a><br /></td></tr>
 <tr class="separator:af2b5682b8e6dd13590ec258a44636430"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a48a8eda430139e6a131654a54bbf0f3b"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a>, typename TileTraits_::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b">Base</a></td></tr>
-<tr class="memdesc:a48a8eda430139e6a131654a54bbf0f3b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base class.  <a href="#a48a8eda430139e6a131654a54bbf0f3b">More...</a><br /></td></tr>
-<tr class="separator:a48a8eda430139e6a131654a54bbf0f3b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aea87c73ae2d4e027014ebd4d8141c89e"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aea87c73ae2d4e027014ebd4d8141c89e">Base</a></td></tr>
+<tr class="memdesc:aea87c73ae2d4e027014ebd4d8141c89e"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base class.  <a href="#aea87c73ae2d4e027014ebd4d8141c89e">More...</a><br /></td></tr>
+<tr class="separator:aea87c73ae2d4e027014ebd4d8141c89e"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:af53d49bad7060b87a2761fe8a82a7ddd"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, Base::Delta::kW, Base::Delta::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">ImmediateOffsetStrides</a></td></tr>
 <tr class="memdesc:af53d49bad7060b87a2761fe8a82a7ddd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Override the strides in each dimension between different loads/stores.  <a href="#af53d49bad7060b87a2761fe8a82a7ddd">More...</a><br /></td></tr>
 <tr class="separator:af53d49bad7060b87a2761fe8a82a7ddd"><td class="memSeparator" colspan="2">&#160;</td></tr>
@@ -130,137 +130,196 @@ Public Types</h2></td></tr>
 <tr class="memitem:a667cae4a9fa78a6df073f5ee48ef9664"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a></td></tr>
 <tr class="memdesc:a667cae4a9fa78a6df073f5ee48ef9664"><td class="mdescLeft">&#160;</td><td class="mdescRight">The thread offset functor.  <a href="#a667cae4a9fa78a6df073f5ee48ef9664">More...</a><br /></td></tr>
 <tr class="separator:a667cae4a9fa78a6df073f5ee48ef9664"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afd2bed46f4cf04aaf331fb2ecae953f8"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Base::Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8">BaseParams</a></td></tr>
+<tr class="memdesc:afd2bed46f4cf04aaf331fb2ecae953f8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Base parameters.  <a href="#afd2bed46f4cf04aaf331fb2ecae953f8">More...</a><br /></td></tr>
+<tr class="separator:afd2bed46f4cf04aaf331fb2ecae953f8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td></tr>
+<tr class="memitem:a6a745d66c4c7de352041f779e54e6b2b inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">This_</a></td></tr>
+<tr class="memdesc:a6a745d66c4c7de352041f779e54e6b2b inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">This class.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">More...</a><br /></td></tr>
+<tr class="separator:a6a745d66c4c7de352041f779e54e6b2b inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8f8fbb65070589769468c6b1ac6ba7a5 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt; TileTraits_, typename TileTraits_::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>, Index_ &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">Base</a></td></tr>
+<tr class="memdesc:a8f8fbb65070589769468c6b1ac6ba7a5 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The base class.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">More...</a><br /></td></tr>
+<tr class="separator:a8f8fbb65070589769468c6b1ac6ba7a5 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6b5b207eb1147e9669215e192901df9e inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">Scalar</a></td></tr>
+<tr class="memdesc:a6b5b207eb1147e9669215e192901df9e inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">More...</a><br /></td></tr>
+<tr class="separator:a6b5b207eb1147e9669215e192901df9e inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3abcfa68ae9904a13195d32d6e6c4bc6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Pointer&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a></td></tr>
+<tr class="memdesc:a3abcfa68ae9904a13195d32d6e6c4bc6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">More...</a><br /></td></tr>
+<tr class="separator:a3abcfa68ae9904a13195d32d6e6c4bc6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:afdd08b4f4c1feaa426f997d15cd28c02 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Threads&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">Threads</a></td></tr>
+<tr class="memdesc:afdd08b4f4c1feaa426f997d15cd28c02 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">More...</a><br /></td></tr>
+<tr class="separator:afdd08b4f4c1feaa426f997d15cd28c02 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a56847e834b31b88544093c3df54d299f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a></td></tr>
+<tr class="memdesc:a56847e834b31b88544093c3df54d299f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The index.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">More...</a><br /></td></tr>
+<tr class="separator:a56847e834b31b88544093c3df54d299f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6d985f8e93be21e56f72ec1400d73df1 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a></td></tr>
+<tr class="memdesc:a6d985f8e93be21e56f72ec1400d73df1 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The thread offset.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">More...</a><br /></td></tr>
+<tr class="separator:a6d985f8e93be21e56f72ec1400d73df1 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_types_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_types_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Types inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a></td></tr>
-<tr class="memdesc:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">More...</a><br /></td></tr>
-<tr class="separator:ae7add0ee02bbec2c130ebaf608ab0696 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a></td></tr>
-<tr class="memdesc:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">More...</a><br /></td></tr>
-<tr class="separator:a17163e93d7d3616b4950925f72bb4c16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a></td></tr>
-<tr class="memdesc:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">More...</a><br /></td></tr>
-<tr class="separator:ac7cca14d54bf3f0749db1ffaea7c9ae7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a></td></tr>
-<tr class="memdesc:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">More...</a><br /></td></tr>
-<tr class="separator:a44665808adfd69df0d26cec4b1840cc3 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a></td></tr>
-<tr class="memdesc:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">More...</a><br /></td></tr>
-<tr class="separator:ae89afbcf642b3023770ff22969c51d16 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a></td></tr>
-<tr class="memdesc:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">More...</a><br /></td></tr>
-<tr class="separator:a954ef18acc12d8256a7d4e37683f8c2c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a></td></tr>
-<tr class="memdesc:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">More...</a><br /></td></tr>
-<tr class="separator:a9bc6c04f4a3adeb5a29743fa43425088 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a></td></tr>
-<tr class="memdesc:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">More...</a><br /></td></tr>
-<tr class="separator:a561ceb1093b28b8dce67df0129b7b8b8 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a></td></tr>
-<tr class="memdesc:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">More...</a><br /></td></tr>
-<tr class="separator:a352ed0773b37f03bf68e4b6cf9899474 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a></td></tr>
-<tr class="memdesc:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">More...</a><br /></td></tr>
-<tr class="separator:a5abf4755aee07dc58b1d6183fbf4786f inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a></td></tr>
-<tr class="memdesc:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">More...</a><br /></td></tr>
-<tr class="separator:abb3dde23971ad35a477b75ee99381b53 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a></td></tr>
-<tr class="memdesc:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">More...</a><br /></td></tr>
-<tr class="separator:a6ca47fd6e2f9cbb3498c138417ea414a inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a></td></tr>
-<tr class="memdesc:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">More...</a><br /></td></tr>
-<tr class="separator:a0d7b595d7959cc1680fc07c2e02e1c8e inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a></td></tr>
-<tr class="memdesc:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">More...</a><br /></td></tr>
-<tr class="separator:a379a52ed1128fc9f93cad35d3e3233e5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a></td></tr>
-<tr class="memdesc:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">More...</a><br /></td></tr>
-<tr class="separator:a25a241bbdc0b0121992019a16f1a6d60 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a></td></tr>
-<tr class="memdesc:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">More...</a><br /></td></tr>
-<tr class="separator:a14f4b356c9cd320e6e7b451edbf58c24 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a></td></tr>
-<tr class="memdesc:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">More...</a><br /></td></tr>
-<tr class="separator:a7ab46a9210b421d32af4d1394892cfd5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a></td></tr>
+<tr class="memdesc:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">concept TileTraits  <a href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">More...</a><br /></td></tr>
+<tr class="separator:aac9e5b7890a53d46e5d49912b254ded7 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a></td></tr>
+<tr class="memdesc:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Scalar element.  <a href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">More...</a><br /></td></tr>
+<tr class="separator:affac5a91f0659bb6739db25d20822c34 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef TileTraits_::Scalar&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a></td></tr>
+<tr class="memdesc:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Fragment element.  <a href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">More...</a><br /></td></tr>
+<tr class="separator:a7f2fe3fa2eb764bf664817097d22fe45 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Index_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a></td></tr>
+<tr class="memdesc:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Index type.  <a href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">More...</a><br /></td></tr>
+<tr class="separator:ab49ff66953031a8cfcfa11ddc092025c inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, 0, 0 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a></td></tr>
+<tr class="memdesc:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Skew quantity.  <a href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">More...</a><br /></td></tr>
+<tr class="separator:ae50ca325a827bdf1d1bfab3ba6e204c1 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Tile&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a></td></tr>
+<tr class="memdesc:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Tile shape.  <a href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">More...</a><br /></td></tr>
+<tr class="separator:a7fcf13023c85cf1e1150d867bd1559d4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Delta&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a></td></tr>
+<tr class="memdesc:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Distance along each dimension.  <a href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">More...</a><br /></td></tr>
+<tr class="separator:a9aaac43bc2258e06824c354a068e7815 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ImmediateOffsetStrides&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a></td></tr>
+<tr class="memdesc:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">More...</a><br /></td></tr>
+<tr class="separator:ab37eec43846be90d558201bd6bb27ee4 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::Iterations&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a></td></tr>
+<tr class="memdesc:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterations.  <a href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">More...</a><br /></td></tr>
+<tr class="separator:adbf563ecda4ffd4110d288f521c7e0da inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef Traits::ThreadOffset&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a></td></tr>
+<tr class="memdesc:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Thread offset.  <a href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">More...</a><br /></td></tr>
+<tr class="separator:a0fec2c1f9c0b8fbde4ca6faf123b59a5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;::Type&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a></td></tr>
+<tr class="memdesc:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The elements loaded/store by one instruction.  <a href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">More...</a><br /></td></tr>
+<tr class="separator:a24716c07ab1d7834a79d52231a990973 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a> &gt;::kCount, <a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a></td></tr>
+<tr class="memdesc:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The storage.  <a href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">More...</a><br /></td></tr>
+<tr class="separator:a2e682380b5ea9ea05ee8ffd68a1205f0 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>, <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount *<a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a></td></tr>
+<tr class="memdesc:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">More...</a><br /></td></tr>
+<tr class="separator:a9ffa12dcd7ed1e96845e1cd273d9f219 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a></td></tr>
+<tr class="memdesc:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">More...</a><br /></td></tr>
+<tr class="separator:a59d40c5bd544fdabf42787b9f11cce51 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>, <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a></td></tr>
+<tr class="memdesc:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The fragment const iterator.  <a href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">More...</a><br /></td></tr>
+<tr class="separator:a5eb6375410d4440c0f73a25c06d282b5 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a></td></tr>
+<tr class="memdesc:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The shape of the fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">More...</a><br /></td></tr>
+<tr class="separator:a064aaca9cc27e34bdae9684447a3f5be inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a>&lt; <a class="el" href="structcutlass_1_1ShapeCount.html">ShapeCount</a>&lt; <a class="el" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a> &gt;::kCount &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a></td></tr>
+<tr class="memdesc:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default predicate mask type.  <a href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">More...</a><br /></td></tr>
+<tr class="separator:a05065dadf7b8a20284c566c82cda8000 inherit pub_types_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a505f124fa3f47c6d57b7275e81be6dd3"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a505f124fa3f47c6d57b7275e81be6dd3">WmmaGemmGlobalIteratorCd</a> ()</td></tr>
-<tr class="memdesc:a505f124fa3f47c6d57b7275e81be6dd3"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#a505f124fa3f47c6d57b7275e81be6dd3">More...</a><br /></td></tr>
-<tr class="separator:a505f124fa3f47c6d57b7275e81be6dd3"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa5c14e2a799249fe8bba14aa1dbe69dc"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">WmmaGemmGlobalIteratorCd</a> (<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">Params</a> const &amp;<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block, int const pointer_offset=0, int const pred_offset=0, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a>())</td></tr>
+<tr class="memitem:aa5c14e2a799249fe8bba14aa1dbe69dc"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">WmmaGemmGlobalIteratorCd</a> (<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">Params</a> const &amp;<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block, int const pointer_offset=0, int const pred_offset=0, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>())</td></tr>
 <tr class="memdesc:aa5c14e2a799249fe8bba14aa1dbe69dc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="#aa5c14e2a799249fe8bba14aa1dbe69dc">More...</a><br /></td></tr>
 <tr class="separator:aa5c14e2a799249fe8bba14aa1dbe69dc"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a44287250bf5631a490b514859fd101d1"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a44287250bf5631a490b514859fd101d1">inc_c</a> ()</td></tr>
-<tr class="memdesc:a44287250bf5631a490b514859fd101d1"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the C dimension.  <a href="#a44287250bf5631a490b514859fd101d1">More...</a><br /></td></tr>
-<tr class="separator:a44287250bf5631a490b514859fd101d1"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aec2d692967d9be5d42673dfde21f5427"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aec2d692967d9be5d42673dfde21f5427">inc_w</a> ()</td></tr>
-<tr class="memdesc:aec2d692967d9be5d42673dfde21f5427"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the W dimension.  <a href="#aec2d692967d9be5d42673dfde21f5427">More...</a><br /></td></tr>
-<tr class="separator:aec2d692967d9be5d42673dfde21f5427"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa9a733f35e9be67663c9c8f80b0034d4"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa9a733f35e9be67663c9c8f80b0034d4">inc_h</a> ()</td></tr>
-<tr class="memdesc:aa9a733f35e9be67663c9c8f80b0034d4"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the H dimension.  <a href="#aa9a733f35e9be67663c9c8f80b0034d4">More...</a><br /></td></tr>
-<tr class="separator:aa9a733f35e9be67663c9c8f80b0034d4"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab1ebbe54e4315ac07daf260a88f41d04"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab1ebbe54e4315ac07daf260a88f41d04">inc_d</a> ()</td></tr>
-<tr class="memdesc:ab1ebbe54e4315ac07daf260a88f41d04"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the D dimension.  <a href="#ab1ebbe54e4315ac07daf260a88f41d04">More...</a><br /></td></tr>
-<tr class="separator:ab1ebbe54e4315ac07daf260a88f41d04"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a174ae7d8aa0664eaf1d6f63c5606baa0"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a174ae7d8aa0664eaf1d6f63c5606baa0">inc_advance</a> ()</td></tr>
-<tr class="memdesc:a174ae7d8aa0664eaf1d6f63c5606baa0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer to move to the next iteration.  <a href="#a174ae7d8aa0664eaf1d6f63c5606baa0">More...</a><br /></td></tr>
-<tr class="separator:a174ae7d8aa0664eaf1d6f63c5606baa0"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a468f8f503777e4a2b0089ee2bd6c471a"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a468f8f503777e4a2b0089ee2bd6c471a">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:a468f8f503777e4a2b0089ee2bd6c471a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Test the predicate.  <a href="#a468f8f503777e4a2b0089ee2bd6c471a">More...</a><br /></td></tr>
-<tr class="separator:a468f8f503777e4a2b0089ee2bd6c471a"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:afe77778a126449e210c0bd6ec2dc6709"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afe77778a126449e210c0bd6ec2dc6709">data</a> ()</td></tr>
-<tr class="memdesc:afe77778a126449e210c0bd6ec2dc6709"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the raw pointer.  <a href="#afe77778a126449e210c0bd6ec2dc6709">More...</a><br /></td></tr>
-<tr class="separator:afe77778a126449e210c0bd6ec2dc6709"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a90e9886534ecbbce69f57b4030d0903f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a90e9886534ecbbce69f57b4030d0903f">data</a> () const</td></tr>
-<tr class="separator:a90e9886534ecbbce69f57b4030d0903f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a109209936a9453e8f1f3f5eecfd6afca"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a109209936a9453e8f1f3f5eecfd6afca">load_element</a> (typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a109209936a9453e8f1f3f5eecfd6afca"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a single fragment element from memory.  <a href="#a109209936a9453e8f1f3f5eecfd6afca">More...</a><br /></td></tr>
+<tr class="separator:a109209936a9453e8f1f3f5eecfd6afca"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a051eb2a8637601cf9c1f52999117151b"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a051eb2a8637601cf9c1f52999117151b">store_element</a> (typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> const &amp;value, int d, int h, int w, int c)</td></tr>
+<tr class="memdesc:a051eb2a8637601cf9c1f52999117151b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a single fragment element into memory.  <a href="#a051eb2a8637601cf9c1f52999117151b">More...</a><br /></td></tr>
+<tr class="separator:a051eb2a8637601cf9c1f52999117151b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae2febd768cbbfb8aab3c2cb669c0505d"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:ae2febd768cbbfb8aab3c2cb669c0505d"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae2febd768cbbfb8aab3c2cb669c0505d">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="separator:ae2febd768cbbfb8aab3c2cb669c0505d"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a018d5be34cdbb263d7f133197b2921ca"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a018d5be34cdbb263d7f133197b2921ca"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a018d5be34cdbb263d7f133197b2921ca">store_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="separator:a018d5be34cdbb263d7f133197b2921ca"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td></tr>
+<tr class="memitem:aeeed9a3582a879d9da77191df88e83ff inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">GemmGlobalIteratorCd</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> const &amp;_params, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block_offset, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:aeeed9a3582a879d9da77191df88e83ff inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeeed9a3582a879d9da77191df88e83ff">More...</a><br /></td></tr>
+<tr class="separator:aeeed9a3582a879d9da77191df88e83ff inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a15d3244546d1c8f4727e84b27a8b7fc6 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6">GemmGlobalIteratorCd</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a> const &amp;_params, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;bounds, const <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; &amp;block, int offset=0, int pred_offset=0, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func=<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>())</td></tr>
+<tr class="memdesc:a15d3244546d1c8f4727e84b27a8b7fc6 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Ctor.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a15d3244546d1c8f4727e84b27a8b7fc6">More...</a><br /></td></tr>
+<tr class="separator:a15d3244546d1c8f4727e84b27a8b7fc6 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a365eb7c90a79c9ab32f603c6985a0316 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">inc_c</a> ()</td></tr>
+<tr class="memdesc:a365eb7c90a79c9ab32f603c6985a0316 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the C dimension.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a365eb7c90a79c9ab32f603c6985a0316">More...</a><br /></td></tr>
+<tr class="separator:a365eb7c90a79c9ab32f603c6985a0316 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab1d9e606a89d3dd315df3d3efa48bcc2 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">inc_w</a> ()</td></tr>
+<tr class="memdesc:ab1d9e606a89d3dd315df3d3efa48bcc2 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the W dimension.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab1d9e606a89d3dd315df3d3efa48bcc2">More...</a><br /></td></tr>
+<tr class="separator:ab1d9e606a89d3dd315df3d3efa48bcc2 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a40144d869b56b46cf1dd8f9941e61e77 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">inc_h</a> ()</td></tr>
+<tr class="memdesc:a40144d869b56b46cf1dd8f9941e61e77 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the H dimension.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a40144d869b56b46cf1dd8f9941e61e77">More...</a><br /></td></tr>
+<tr class="separator:a40144d869b56b46cf1dd8f9941e61e77 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a49d7db2dab7a6d1e496ebff0e67039bc inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">inc_d</a> ()</td></tr>
+<tr class="memdesc:a49d7db2dab7a6d1e496ebff0e67039bc inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer in the D dimension.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a49d7db2dab7a6d1e496ebff0e67039bc">More...</a><br /></td></tr>
+<tr class="separator:a49d7db2dab7a6d1e496ebff0e67039bc inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aeac77cdc31ce151634b7c27ccdaf5552 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">inc_advance</a> ()</td></tr>
+<tr class="memdesc:aeac77cdc31ce151634b7c27ccdaf5552 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Increment the pointer to move to the next iteration.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aeac77cdc31ce151634b7c27ccdaf5552">More...</a><br /></td></tr>
+<tr class="separator:aeac77cdc31ce151634b7c27ccdaf5552 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa6845b5a0fa36eb185caafea791e53ec inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">operator+=</a> (<a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:aa6845b5a0fa36eb185caafea791e53ec inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Adds a vector offset to the iterator.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aa6845b5a0fa36eb185caafea791e53ec">More...</a><br /></td></tr>
+<tr class="separator:aa6845b5a0fa36eb185caafea791e53ec inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6034b7229e4aca05f63c39560f219433 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">load_element</a> (typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> &amp;value, int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:a6034b7229e4aca05f63c39560f219433 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads a single fragment element from memory.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">More...</a><br /></td></tr>
+<tr class="separator:a6034b7229e4aca05f63c39560f219433 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5de982aed44932da3b265f8bb520249d inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">store_element</a> (typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> const &amp;value, int d, int h, int w, int c)</td></tr>
+<tr class="memdesc:a5de982aed44932da3b265f8bb520249d inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Stores a single fragment element into memory.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a5de982aed44932da3b265f8bb520249d">More...</a><br /></td></tr>
+<tr class="separator:a5de982aed44932da3b265f8bb520249d inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab224a0a6ab8ce7fc4e76b06fb7679fa0 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ab224a0a6ab8ce7fc4e76b06fb7679fa0 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Test the validity of the.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ab224a0a6ab8ce7fc4e76b06fb7679fa0">More...</a><br /></td></tr>
+<tr class="separator:ab224a0a6ab8ce7fc4e76b06fb7679fa0 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8fd617565db6eb9c6fb99de868c389db inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">add_pointer_offset</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> offset)</td></tr>
+<tr class="memdesc:a8fd617565db6eb9c6fb99de868c389db inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">add pointer offset  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8fd617565db6eb9c6fb99de868c389db">More...</a><br /></td></tr>
+<tr class="separator:a8fd617565db6eb9c6fb99de868c389db inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1a587af6edd528a02679c0decc31cdd1 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:a1a587af6edd528a02679c0decc31cdd1 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">load_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="memdesc:a1a587af6edd528a02679c0decc31cdd1 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Loads and increments iterator.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">More...</a><br /></td></tr>
+<tr class="separator:a1a587af6edd528a02679c0decc31cdd1 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aafa962f7e63da77c9904d438ab94347a inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memTemplParams" colspan="2">template&lt;typename Fragment &gt; </td></tr>
+<tr class="memitem:aafa962f7e63da77c9904d438ab94347a inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">store_post_increment</a> (<a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)</td></tr>
+<tr class="separator:aafa962f7e63da77c9904d438ab94347a inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a> (int d, int h, int w, int c) const</td></tr>
-<tr class="memdesc:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">More...</a><br /></td></tr>
-<tr class="separator:af78a2bf3e7507dc7f50343a3c209f770 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-</table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
-Public Attributes</h2></td></tr>
-<tr class="memitem:a0ad4218ad2c10641379b236473e79e84"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a></td></tr>
-<tr class="separator:a0ad4218ad2c10641379b236473e79e84"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab3057dad7a4decb5594c66aa328f8066"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">thread_offset</a></td></tr>
-<tr class="separator:ab3057dad7a4decb5594c66aa328f8066"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:af3c9d62554b1d311d82ba89e09cdd3fa"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a>&lt; Base::Iterations::kW &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa">predicates</a></td></tr>
-<tr class="memdesc:af3c9d62554b1d311d82ba89e09cdd3fa"><td class="mdescLeft">&#160;</td><td class="mdescRight">The predicates for the row.  <a href="#af3c9d62554b1d311d82ba89e09cdd3fa">More...</a><br /></td></tr>
-<tr class="separator:af3c9d62554b1d311d82ba89e09cdd3fa"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a> (int d, int h, int w, int c) const</td></tr>
+<tr class="memdesc:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Is the iterator valid?  <a href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">More...</a><br /></td></tr>
+<tr class="separator:ac811886f3412861928040546282b6973 inherit pub_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-static-attribs"></a>
 Static Public Attributes</h2></td></tr>
 <tr class="memitem:ae0f176733ba9dee0cce45435ac5d53ba"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">kLayout</a> = TileTraits_::kLayout</td></tr>
 <tr class="memdesc:ae0f176733ba9dee0cce45435ac5d53ba"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="#ae0f176733ba9dee0cce45435ac5d53ba">More...</a><br /></td></tr>
 <tr class="separator:ae0f176733ba9dee0cce45435ac5d53ba"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td></tr>
+<tr class="memitem:a27b88818f5b094372bf2c6e090c9148a inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">kLayout</a> = TileTraits_::kLayout</td></tr>
+<tr class="memdesc:a27b88818f5b094372bf2c6e090c9148a inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The layout.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a27b88818f5b094372bf2c6e090c9148a">More...</a><br /></td></tr>
+<tr class="separator:a27b88818f5b094372bf2c6e090c9148a inherit pub_static_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="inherit_header pub_static_attribs_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_attribs_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Attributes inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a></td></tr>
-<tr class="memdesc:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">More...</a><br /></td></tr>
-<tr class="separator:ac1a64e974dcd69c3a86a31db6cbff421 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a></td></tr>
-<tr class="memdesc:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">More...</a><br /></td></tr>
-<tr class="separator:a38c8ec1e9d0117172981b4c7dd4bf3be inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a></td></tr>
-<tr class="memdesc:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">More...</a><br /></td></tr>
-<tr class="separator:a871c9b82109eab432c5a1d465643bf97 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a></td></tr>
-<tr class="memdesc:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">More...</a><br /></td></tr>
-<tr class="separator:aef07ba456ea016092d7d2446751b76a3 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a></td></tr>
-<tr class="memdesc:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">More...</a><br /></td></tr>
-<tr class="separator:a4e0b2bc06bb8f52313e4d8c51ab30ff2 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a></td></tr>
+<tr class="memdesc:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">More...</a><br /></td></tr>
+<tr class="separator:acc8c86a3629a3ca105269fc3a47f2a4f inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a></td></tr>
+<tr class="memdesc:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies iterator storage fragment type (Scalar or WmmaMatrix)  <a href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">More...</a><br /></td></tr>
+<tr class="separator:af405f6c5f0bd8f04487d8a7f41dc1826 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a></td></tr>
+<tr class="memdesc:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Source or destination memory space.  <a href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">More...</a><br /></td></tr>
+<tr class="separator:ab8bfa9914c4ba49a583d1cfaa8a62d56 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a></td></tr>
+<tr class="memdesc:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of scalars accessed per load/store.  <a href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">More...</a><br /></td></tr>
+<tr class="separator:a8a4edd46b8cad3eeafc2a3dc3a344499 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static int const&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a></td></tr>
+<tr class="memdesc:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of storage needed per fragment.  <a href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">More...</a><br /></td></tr>
+<tr class="separator:aefe67241dde93bb032c5b4d82bc3f761 inherit pub_static_attribs_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
 Additional Inherited Members</h2></td></tr>
 <tr class="inherit_header pub_static_methods_structcutlass_1_1TileIteratorBase"><td colspan="2" onclick="javascript:toggleInherit('pub_static_methods_structcutlass_1_1TileIteratorBase')"><img src="closed.png" alt="-"/>&#160;Static Public Member Functions inherited from <a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;</a></td></tr>
-<tr class="memitem:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static CUTLASS_DEVICE void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a> (PredicateIterator predicate_it, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;bounds, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset=make_Coord(0, 0, 0))</td></tr>
-<tr class="memdesc:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">More...</a><br /></td></tr>
-<tr class="separator:a78b6c0d6a1a96dd55a34bc302ecb07d7 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memItemLeft" align="right" valign="top">static <a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a> (PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, <a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 3 &gt; const &amp;offset)</td></tr>
+<tr class="memdesc:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="mdescLeft">&#160;</td><td class="mdescRight">Initializes a predicate vector.  <a href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">More...</a><br /></td></tr>
+<tr class="separator:aa58daf082cf97108e2e2ad0b1fd89208 inherit pub_static_methods_structcutlass_1_1TileIteratorBase"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;</a></td></tr>
+<tr class="memitem:ac368b1ea1c5ad2209a6ac6bec597600f inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Params</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a></td></tr>
+<tr class="memdesc:ac368b1ea1c5ad2209a6ac6bec597600f inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">More...</a><br /></td></tr>
+<tr class="separator:ac368b1ea1c5ad2209a6ac6bec597600f inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a56601dc34e8f9a070db5dc48c37d55a0 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt; 4 &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">thread_offset</a></td></tr>
+<tr class="memdesc:a56601dc34e8f9a070db5dc48c37d55a0 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">Offset of an individual lane from the start of the tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56601dc34e8f9a070db5dc48c37d55a0">More...</a><br /></td></tr>
+<tr class="separator:a56601dc34e8f9a070db5dc48c37d55a0 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad23e6224e37ec1d13dc237ce8ec6e977 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a>&lt; Base::Iterations::kW &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">predicates</a></td></tr>
+<tr class="memdesc:ad23e6224e37ec1d13dc237ce8ec6e977 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The predicates for the row.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ad23e6224e37ec1d13dc237ce8ec6e977">More...</a><br /></td></tr>
+<tr class="separator:ad23e6224e37ec1d13dc237ce8ec6e977 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Typedef Documentation</h2>
-<a id="a48a8eda430139e6a131654a54bbf0f3b"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a48a8eda430139e6a131654a54bbf0f3b">&#9670;&nbsp;</a></span>Base</h2>
+<a id="aea87c73ae2d4e027014ebd4d8141c89e"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aea87c73ae2d4e027014ebd4d8141c89e">&#9670;&nbsp;</a></span>Base</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -268,7 +327,23 @@ Additional Inherited Members</h2></td></tr>
 template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a>, typename TileTraits_::Scalar, <a class="el" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>, <a class="el" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b">Base</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt;<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a>, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a8f8fbb65070589769468c6b1ac6ba7a5">Base</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="afd2bed46f4cf04aaf331fb2ecae953f8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#afd2bed46f4cf04aaf331fb2ecae953f8">&#9670;&nbsp;</a></span>BaseParams</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Base::Params</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8">BaseParams</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -300,7 +375,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a></td>
+          <td class="memname">typedef Index_ <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -316,7 +391,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef TileTraits_::Pointer <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a></td>
+          <td class="memname">typedef TileTraits_::Pointer <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -332,7 +407,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef TileTraits_::Scalar <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">Scalar</a></td>
+          <td class="memname">typedef TileTraits_::Scalar <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6b5b207eb1147e9669215e192901df9e">Scalar</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -348,7 +423,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd</a>&lt;TileTraits_, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">This_</a></td>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd</a>&lt;TileTraits_, Index_&gt; <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6a745d66c4c7de352041f779e54e6b2b">This_</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -364,7 +439,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef TileTraits_::ThreadOffset <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a></td>
+          <td class="memname">typedef TileTraits_::ThreadOffset <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -380,7 +455,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">typedef TileTraits_::Threads <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">Threads</a></td>
+          <td class="memname">typedef TileTraits_::Threads <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#afdd08b4f4c1feaa426f997d15cd28c02">Threads</a></td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -404,35 +479,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
-<a id="a505f124fa3f47c6d57b7275e81be6dd3"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a505f124fa3f47c6d57b7275e81be6dd3">&#9670;&nbsp;</a></span>WmmaGemmGlobalIteratorCd() <span class="overload">[1/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd</a> </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
 <a id="aa5c14e2a799249fe8bba14aa1dbe69dc"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa5c14e2a799249fe8bba14aa1dbe69dc">&#9670;&nbsp;</a></span>WmmaGemmGlobalIteratorCd() <span class="overload">[2/2]</span></h2>
+<h2 class="memtitle"><span class="permalink"><a href="#aa5c14e2a799249fe8bba14aa1dbe69dc">&#9670;&nbsp;</a></span>WmmaGemmGlobalIteratorCd()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -475,8 +523,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a>&#160;</td>
-          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a>()</code>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>&#160;</td>
+          <td class="paramname"><em>thread_offset_func</em> = <code><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a>()</code>&#160;</td>
         </tr>
         <tr>
           <td></td>
@@ -494,8 +542,8 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="afe77778a126449e210c0bd6ec2dc6709"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#afe77778a126449e210c0bd6ec2dc6709">&#9670;&nbsp;</a></span>data() <span class="overload">[1/2]</span></h2>
+<a id="a109209936a9453e8f1f3f5eecfd6afca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a109209936a9453e8f1f3f5eecfd6afca">&#9670;&nbsp;</a></span>load_element()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -506,197 +554,14 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::data </td>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::load_element </td>
           <td>(</td>
-          <td class="paramname"></td><td>)</td>
+          <td class="paramtype">typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
           <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a90e9886534ecbbce69f57b4030d0903f"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a90e9886534ecbbce69f57b4030d0903f">&#9670;&nbsp;</a></span>data() <span class="overload">[2/2]</span></h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> const <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::data </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td> const</td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a174ae7d8aa0664eaf1d6f63c5606baa0"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a174ae7d8aa0664eaf1d6f63c5606baa0">&#9670;&nbsp;</a></span>inc_advance()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_advance </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a44287250bf5631a490b514859fd101d1"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a44287250bf5631a490b514859fd101d1">&#9670;&nbsp;</a></span>inc_c()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_c </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="ab1ebbe54e4315ac07daf260a88f41d04"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab1ebbe54e4315ac07daf260a88f41d04">&#9670;&nbsp;</a></span>inc_d()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_d </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aa9a733f35e9be67663c9c8f80b0034d4"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa9a733f35e9be67663c9c8f80b0034d4">&#9670;&nbsp;</a></span>inc_h()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_h </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aec2d692967d9be5d42673dfde21f5427"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aec2d692967d9be5d42673dfde21f5427">&#9670;&nbsp;</a></span>inc_w()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::inc_w </td>
-          <td>(</td>
-          <td class="paramname"></td><td>)</td>
-          <td></td>
-        </tr>
-      </table>
-  </td>
-  <td class="mlabels-right">
-<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
-  </tr>
-</table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a468f8f503777e4a2b0089ee2bd6c471a"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a468f8f503777e4a2b0089ee2bd6c471a">&#9670;&nbsp;</a></span>valid()</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-<table class="mlabels">
-  <tr>
-  <td class="mlabels-left">
-      <table class="memname">
-        <tr>
-          <td class="memname">CUTLASS_DEVICE bool <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::valid </td>
-          <td>(</td>
           <td class="paramtype">int&#160;</td>
           <td class="paramname"><em>d</em>, </td>
         </tr>
@@ -731,6 +596,122 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </table>
 </div><div class="memdoc">
 
+</div>
+</div>
+<a id="ae2febd768cbbfb8aab3c2cb669c0505d"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae2febd768cbbfb8aab3c2cb669c0505d">&#9670;&nbsp;</a></span>load_post_increment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::load_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a051eb2a8637601cf9c1f52999117151b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a051eb2a8637601cf9c1f52999117151b">&#9670;&nbsp;</a></span>store_element()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::store_element </td>
+          <td>(</td>
+          <td class="paramtype">typename <a class="el" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">Base::AccessType</a> const &amp;&#160;</td>
+          <td class="paramname"><em>value</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>d</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>h</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>w</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype">int&#160;</td>
+          <td class="paramname"><em>c</em>&#160;</td>
+        </tr>
+        <tr>
+          <td></td>
+          <td>)</td>
+          <td></td><td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a018d5be34cdbb263d7f133197b2921ca"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a018d5be34cdbb263d7f133197b2921ca">&#9670;&nbsp;</a></span>store_post_increment()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
+<div class="memtemplate">
+template&lt;typename Fragment &gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname">CUTLASS_DEVICE void <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::store_post_increment </td>
+          <td>(</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;&#160;</td>
+          <td class="paramname"><em>fragment</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
 </div>
 </div>
 <h2 class="groupheader">Member Data Documentation</h2>
@@ -756,54 +737,6 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </table>
 </div><div class="memdoc">
 
-</div>
-</div>
-<a id="a0ad4218ad2c10641379b236473e79e84"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a0ad4218ad2c10641379b236473e79e84">&#9670;&nbsp;</a></span>params</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">Params</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::params</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="af3c9d62554b1d311d82ba89e09cdd3fa"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#af3c9d62554b1d311d82ba89e09cdd3fa">&#9670;&nbsp;</a></span>predicates</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector</a>&lt;Base::Iterations::kW&gt; <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::predicates</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="ab3057dad7a4decb5594c66aa328f8066"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab3057dad7a4decb5594c66aa328f8066">&#9670;&nbsp;</a></span>thread_offset</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1Coord.html">Coord</a>&lt;4&gt; <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::thread_offset</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
 </div>
 </div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
@@ -812,7 +745,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.png b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.png
index f5ad5c7aa3ca2fe9955ba9874e2f19effb9c234a..6555799de28eaafce410a786be8a1ed563c8c1c2 100644
GIT binary patch
literal 2539
zcmc(h`8U-2AICrF8d-*$!Z%yzT$E(VzD2ee;@bBaCM_65j4VUlJC;g}>^qe`GP09p
z2$v8u42`u2%@|9Tv5onT?)Q6c{RQ`Z&inm(JkNRm^ghq$>-~CcX<^L6d6p9Z03L{m
zp)~-oqM7`NgN=E<TK?6ZS%fUF+Zr(#3?{B`FBf+r6PfgVcXV_(R)-wl;Rv#}umPBt
zj@MYfts(%N41*Zz*@m!CbE)?>D^8toF|b=@Bw;)vWI0ZM39zsq(vm~2oO9%>4Q5!I
zN*AYCUzaYDxcW@uH^{Z5NKvf|%<=|{PP!=}&Gn;*`vXnbOez#39F~Ri#41;AT0%67
z)Otz50Yz1@%W_Ed>297<XSo$ag4$7~hwD?MFT-Ohw8L|xwFrgKV=TDSn&h=YLXoYl
zR37bc7Z~S=8<_&uaf=fV^7q=0ahm<eKz7KhH@-ibc%cz~$@e|M?t_qEeF7@7${<gz
zA!fLls>hE?lr7iT;h(tSM=-_zF|Pk^<)e>PNWVL=h-V^}s?j{t)0JZNEfCajj#4u&
zEN)BwT{&y*W_-NB!C=I@CR#Qc9z8il)rDJq@((x2qm=sDR(8QtPxfluC>i=JQMTx2
z;6nn_q-O47R#0p^4@j`*MGr*a*<de~{ln0s_}N$^j1>6;t^2G;e#9Z1D?xq;hx2Zs
z#mw8d`C}g_Y{pd&y8W^yN;WA_-G@Y=WDO6B9fWN#P0cLZezvW=AQv;NR6Z8X25J#@
zYhUX10&Pa$RCNvLB{U<d1}e>$z;e9du()*DvZIfjdJkm4xFz_YJ|@tXb!?=)qFX*{
z0!899L-qII<kbqur%VGMwTT;#Qn82SK=6=$mhDKN7n~%&NO^oF1}su>I_Y#((Z(oF
zb$fiTAX}k}GAm=W{TF$U#66uopQsuex^Jxit_Yl8k_?jfxjG#(@C4p((54lLO`hs1
zzQ4oRN1cy8(B>6u$z8yeKjl?CQ1jl91o76dCFcm@le?jn-EPrBV&j5f*u+EZI5K)Q
z{SA77+Cp;qEC|l?9D}4G@3kz<<q^Bu#JRb_Ln@5WyJBq;lUSR8A#zB)R^YezqSZha
zBn8G#nKO<}2&|0`3S~50uqzIiG=$!xwK_H5MPO>6GY_FT<RJa6uzu&#{WIPo+B>=e
z>vftjxx8H30}fYw?t0dw6i`)P%)9TdfKBn@@ZH*^t@*=MpQ`Iq#lDdJ|G+qR(nV0W
zCsZ0t@H8g_6TH!kElwOtt8;ugNKX#6OnO>K_6F-xr=Jya{^<Ch?EgOzqVD+r%pB?f
z>~n5=fC9jNjzx>Z9Z1^U#YQm&=(`BH;CYgT`zmKJUk9)NXJewkG2VoO{$-q#G?ng7
zv3??5lyc$%Gv<9J_$m*OWS@z(Krr(yByPcf6dO8Viw|Z=up41039kXX$C@22e|!WJ
z;K@^?Vzv1D8E@Z~{n6OGq^+34aS>FEdVI~!?n%(RkFl;6It)%NkhoQSzR<WcBe@5^
zvrA&U&h4Vh;zl#2j?QjP)>yC94%7!_IMm2~`B<wGMO2^cz#)lWAjEc;9N&u&Z%2E)
z&f$1fro{9kEv?4fM&)R;WOj!}hIS6wIJa$R-!Ak%W->EOV|NiY*4*v9<vkM{HcXy#
zSA}eprv<wjZ7Z7Lp-nC5)F<Hv17}M*cSeOp0){`iL$4q`CZC%$+`o9aN`2y*i2YHQ
zjd)2@d-UC<xh_mZc6NoL12$2(8JtI(3=c}E7keXjtBl~LIT6Aq>Z)%9qCDzyc0Iq+
zsFCy;>BcoXh@*RE+X`8{%>L{QGN$){6UsdlR#UYnv~9ELpt{|4JNiAbltKrN-eJv&
zI!bMiefMsK+j4bL`lnGI-{{xYP)cX0teDPn2af(+zu>;Y`V2Udn05=aWDeu}99f8v
zb$#o!W=5DJ_3$20m7**tKKW{$&tmtRrV!5Qe>Tfn;3Izljq91q!fsFUye1oL;(g$n
z%q&DS)uEHNL}$F_CBKUAAuxM)M5g*PCFl^HKyp^M<ky_K28rpM_GHlP%`T<^NL9La
zam<Q$`N;x5i4A}3_a7s}+H@}h;O=Pu#^MfeUu8Y^w#3E;{Mhs0zlG)SDORC}r&rEB
zWcjO$or#yeV<-4u#tyUV1m#SxEGZ>(LJGkDkVOG#PY^w!060zP0c?rU|6n&%6jedq
zj*htI$g-?-MF;Rm6AQ0uX1pavJ~cpOR6bUGP;QBs9Lv?%I?;F~cs+E}8k6s@FciF1
zqf{zL1hXFMP9zU{SOw}klEmB&X6phQ+a)oYafTo*D7ep;5AngY+D7ySY@>ea4uQz$
zJnzE>8h1)BfinC8>dSz$X{oisTiXcs#GVL|DGUB$|I3#fJLyY34!T*@bUEa-)?>Rb
zixI0s--vyruLcwW#K<d1)po%c4(D_AZF!NXgH`J~K%0Ys?JutKT>dSGbJCBN6Sm(<
z$_ZRNAim6Nu$CePU%*pyO$TJa^}oiZGO$X$UaPl14T_?2=xx#FJsGcTLe|>9&Z+Li
zIfi3~Mu-N)FLKCzGmtRv3$$73vb$)2V;m()RE_V^IP}un2J}I-N*PwJkYCv$+b?6;
zwGuv`5CJkCyDUUA74s2$TgiuZM(vhIYVfi?<#3tWSO`%p+1_kMXP=yReBPS|i+PXm
zlnF{DI|~jWHvE;?!K=JySf@X9Xld*^sijS4s`*O?9|Tk){Q_>Z@)G7Wk^b?}h_0Z<
z9Xn<!o}@Xqi-nfvzi%x@N|#Qu0S9O7o59}R8;X;D{&ogg>9@HE0eo|EQ-A3_TwAZ_
z0_{4@gv-o~;$+)d4)5#@lpzE_>UXF-{xUNvyfgQdShzbHLgt;h-GLdA<DSkOi<s@5
r>mQ7ZMH7_GZ)X+vF&#zMVXy^6(L0Cf;&+&n82~Y|Fnq1={^x%Il6bO>

literal 1763
zcmd6oc{tPw7{`BR+Cgj5HZp5+ZLylIjFlsio1EjGAsN$(aSgHK%ss5g)i}0TBu8>3
zGA2U?;VC3B&M}BBWE^Q+lV)ezKig;j-uHRl&-eR%p7)RUpZ9rFY|$5?2N4GW0DzjC
z8QTK@h%E57B47cXk}@R(^1ZE<qY0nS7ua>~Vnt_2mcV^!27}@JC>$e*A|!jX10Wds
zyO=K=RRI7JY;J7e7%s#q<OFZl95R7Voo(Y=#te@`Qp9_Gf)h5SJzFV~WQAv@dwmV3
zE$dJB9XZ|CU=?RV0hu3ESej3SC?d1UT>e$W)NZe4Dsau-_YNYIADE7nQ%Gimy}F^Q
zug9!OMlvnhcL2@c<1prB9*6kH;}B*3=xPgIf`rPs58BIy(0RJG9m7N1;3?N|k}FPi
zNSqr2Wk2jbrcQ%iD5)WQXh-eDL2ix*A}>|<YEU^ZIYSWY!&d&P<tl13PHI4_GEKZH
zY10lZKh+<g_+U;QMvcTERq1Lk&gaH8)Qor+_w<w>-F*aUycNBsyJ2b(eep!B@Xwfr
zlc>H_k7)ulU!-wuPY#x&#bQ&gORpv!lTrTF!aI80yl__G`6d?TLhWLWZ*y<SDBb<!
zFsOQBe_qAM_eB+Rb8Q#97my&UwamMIxU|q=R1@iqLYEr+zN-3abuSUZ6K=$%t;|TR
z$t;`cH*v|Ick)yAD(KI4)CsWJ#yKxd;rAx>aJlS`cnCdZd%HD6d!3Lvq4FjJy+490
zm`cu2rxCYk@IYh`f5G&XjfqE;8|ItIy=$NkqjFns;8s^J{MqwMn2XQ)6%b2eI6s{m
zER6}U-l-D`eQ9VBO!CbS;xXK9oV}Lx$!J5$N+VR(w_bVwsVwQ+iYK4jFbmk0edf`Y
zccsXJuJiknFpZJ9nDZg)#-LAl*Q4ou6>J%wdIy&EYwcaVwY9rJa$_B#lLj&*VwCMf
z@nZLVweiZfb6Npq!X1U2?o2DO%=hsS8wJL~WY}WNDL-S}3=?-lTrFI_8vW>FHzx;T
z>7p4CDB-O}+xo<#hwNhftt)D5!gO{AE=3Wmc~C}XUeRKDGr~7|B%MU(Po!3p9^PI*
z)4bqSP~_3fMl0PF=`GB7wCWaVuzSkUr@nATW4%o~zrO%D78}smR_=7tlp0}jk^I&{
z?W8$hq-)yZ_0(=nGgf-c)0M*Rvh4Y+2xXsI!MQ3dMTEjABnm2b)^%Q&;FrUSZ8&6M
zFaP`kbIyjYO<53u3X*x_e+kX!noFLdbDpPYo~MhhxIVCsjR8P$03K9gAm9-_y&nt(
zdgz~|Df*j;5GW3r2oW$M5hS4Cj{bMV9WT#G$gw|YZ{Y({hy&z-opWFIm;9Po=IoiO
zF)**G9{fsaS{Lx3N_plLxA#mo52Yajb91@#RvZt)+2Q^JG@X(TUZ2BRc8S6JS|)*D
zH|XzucsAAmsnL9QG@(9yI_AZ;?nLWgcNg}%>W-H=6*Q=SZq-$#2$<h9Ef&vKR;6@w
zN}o(0BR2EGsM&5pj{dhsL?fdHfQld)=-c7MtFlMPy{+v^?0vghj?G5&8Y8cIpgT;d
zb=rl)PV;gtXs!CN4Cf%E!@(=_hJK~j;Igxb%a&wxswV@JXw)&fgtN4X#kl>N@v(>y
z-i}tq5UsQ8X3kwH8p0EU#&-+)9|zP`bl&t^58YBsa_V-bXFu7t@l|;kjj!%sl&*De
zNTzd_k`Xl|ygKbp1LC7(a@#oEzd)a%i?y3;Qg_a%{VD0`tsg6kT3A_&I!&EDFdjlW
z<YFleyNqwzXfYCt4BDLkoO)hFrL&Ayn!R=P5bs?C)Jrjqct`3<t5{ccrS{`fAx)AQ
z*Edw8z|cHvDWfrm*<7`qDNX81jVLSMO{=bLkeEL{V}#I2MzDx<ce4S9dn(ymH>kLF
zxhG4-Q*>XFUu6VXKf<bvcdrT_$WBdg6Mvv=tuZ_#&v2q;L4=Ct{J_HDsF}i46cb+;
z2=JRfjgGXXf~6Y=AvB4ZOTwr-R&l^A@+l1tJ^;9*y${O+w@tocw>24AE>V_apJi`R
b{7z3bK7Qfpi1!V_M*_@E(8hI!_=LXzRN5^3

diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits-members.html b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits-members.html
index 11f86143e..e81e89e17 100644
--- a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits-members.html
+++ b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits-members.html
@@ -82,7 +82,7 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86">Base</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002">Delta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits&lt; Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#af219ece6e66e2866169e06e15cc4472d">kMemorySpace</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"><span class="mlabel">static</span></td></tr>
@@ -90,13 +90,14 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6894b653fffa59bcb847bc3295643d6b">Scalar</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">ThreadsDelta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a> typedef</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html
index d327b3c16..265747987 100644
--- a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html
+++ b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html
@@ -113,25 +113,28 @@ Public Types</h2></td></tr>
 <tr class="memitem:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef Scalar_ *&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">Pointer</a></td></tr>
 <tr class="memdesc:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a3ff6f630b6b317ace1cf6e13fdf3a0cd">More...</a><br /></td></tr>
 <tr class="separator:a3ff6f630b6b317ace1cf6e13fdf3a0cd inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aebbf8834d0d88f0e5b3e1926db5e6758 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt; Tile_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a></td></tr>
-<tr class="memdesc:aebbf8834d0d88f0e5b3e1926db5e6758 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">More...</a><br /></td></tr>
-<tr class="separator:aebbf8834d0d88f0e5b3e1926db5e6758 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a29bd05960cc541bb67098f5483c84cf6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, Threads_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">Threads</a></td></tr>
-<tr class="memdesc:a29bd05960cc541bb67098f5483c84cf6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a29bd05960cc541bb67098f5483c84cf6">More...</a><br /></td></tr>
-<tr class="separator:a29bd05960cc541bb67098f5483c84cf6 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a65f9ccd630dde0c9db5358cfc951583d inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, Tile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">ThreadsDelta</a></td></tr>
-<tr class="memdesc:a65f9ccd630dde0c9db5358cfc951583d inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The relative offset between two elements in the H/W dimension in adjacent threads.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a65f9ccd630dde0c9db5358cfc951583d">More...</a><br /></td></tr>
-<tr class="separator:a65f9ccd630dde0c9db5358cfc951583d inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef Tile_&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a></td></tr>
+<tr class="memdesc:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">More...</a><br /></td></tr>
+<tr class="separator:a52ba72984ea8ce84eda28d07c6c8ec19 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1ReshapeTile.html">ReshapeTile</a>&lt; Tile_, kAccessSize_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a></td></tr>
+<tr class="memdesc:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The vectorized tile shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">More...</a><br /></td></tr>
+<tr class="separator:a6cb3196f1fe3958d1656ba8b493c82ac inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1ReshapeThreads.html">ReshapeThreads</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a6cb3196f1fe3958d1656ba8b493c82ac">VectorizedTile</a>, Threads_ &gt;::<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">Threads</a></td></tr>
+<tr class="memdesc:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The threads shape.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aae7128f5522383c857d2639031b64c30">More...</a><br /></td></tr>
+<tr class="separator:aae7128f5522383c857d2639031b64c30 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, 1, VectorizedTile::kC &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">ThreadsDelta</a></td></tr>
+<tr class="memdesc:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The relative offset between two elements in the H/W dimension in adjacent threads.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a428750e54eabd15b2a3f7ac2a96af0a9">More...</a><br /></td></tr>
+<tr class="separator:a428750e54eabd15b2a3f7ac2a96af0a9 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, Threads::kH, Threads::kW *<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">Delta</a></td></tr>
 <tr class="memdesc:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides in each dimension between different loads/stores.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a07bb48f99000256f04f00564a4371c2f">More...</a><br /></td></tr>
 <tr class="separator:a07bb48f99000256f04f00564a4371c2f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 0, 0, Threads::kW *ThreadsDelta::kW, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">ImmediateOffsetStrides</a></td></tr>
 <tr class="memdesc:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">Strides for immediate offset computation.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#abc47717230ddde3edc88d2770f6841bf">More...</a><br /></td></tr>
 <tr class="separator:abc47717230ddde3edc88d2770f6841bf inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aaf6410f99d7f995792d0ac34efd3a82f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, Tile::kH/Threads::kH, Tile::kW/Threads::kW, Tile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">Iterations</a></td></tr>
-<tr class="memdesc:aaf6410f99d7f995792d0ac34efd3a82f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aaf6410f99d7f995792d0ac34efd3a82f">More...</a><br /></td></tr>
-<tr class="separator:aaf6410f99d7f995792d0ac34efd3a82f inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aebbf8834d0d88f0e5b3e1926db5e6758">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td></tr>
+<tr class="memitem:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1Shape.html">Shape</a>&lt; 1, VectorizedTile::kH/Threads::kH, VectorizedTile::kW/Threads::kW, VectorizedTile::kC/<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#aa001e09b246fdd8259cbda6a500cad5f">kAccessSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">Iterations</a></td></tr>
+<tr class="memdesc:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of iterations needed to load/store the tile.  <a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a893cb2cc67676b44c1f3ad5908a4ab0c">More...</a><br /></td></tr>
+<tr class="separator:a893cb2cc67676b44c1f3ad5908a4ab0c inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1gemm_1_1GemmMultiplicandTraits.html">GemmMultiplicandTraits</a>&lt; <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a52ba72984ea8ce84eda28d07c6c8ec19">Tile</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#ae0bca976b7cfba8561db4cccc16e99e1">kOperand</a>, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a74bc07cb021a73513ab2fbacd572be90">kLayout</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html#a21a3524edaf002b5e5878df3c7eae7e7">MultiplicandTraits</a></td></tr>
 <tr class="separator:a21a3524edaf002b5e5878df3c7eae7e7 inherit pub_types_structcutlass_1_1gemm_1_1GemmGlobalTileTraits"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
@@ -189,7 +192,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessS
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset-members.html b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset-members.html
index 383587f8e..3e1d6494a 100644
--- a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset-members.html
+++ b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html
index 0b836280f..0a9852228 100644
--- a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html
+++ b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html
@@ -124,7 +124,7 @@ template&lt;typename Scalar_ , typename Tile_ , typename Threads_ , int kAccessS
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params-members.html b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params-members.html
index 9f72d0038..d7d5aa01c 100644
--- a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params-members.html
+++ b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params-members.html
@@ -79,18 +79,19 @@ $(function() {
 
 <p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#ad6b65c5f3ed7cd9e7ffeb684cbf30d04">initialize</a>(Pointer pointer, Index ld, Index n, Index epilogue_stride_w, Index epilogue_delta_w)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248">predicate_inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">predicate_inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">predicate_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a98867f4fc4daf790e309f8365e71cc8f">initialize</a>(Pointer pointer, long long batch_stride, Index ldm, Index n, Index epilogue_stride_w, Index epilogue_delta_w)</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">predicate_inc_advance</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">predicate_inc_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">stride_d</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a></td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html
index 32bf2ce88..cfe095ab8 100644
--- a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html
+++ b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html
@@ -74,7 +74,6 @@ $(function() {
 <div class="header">
   <div class="summary">
 <a href="#pub-methods">Public Member Functions</a> &#124;
-<a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params-members.html">List of all members</a>  </div>
   <div class="headertitle">
 <div class="title">cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params Struct Reference</div>  </div>
@@ -85,38 +84,55 @@ $(function() {
 </p>
 
 <p><code>#include &lt;<a class="el" href="wmma__gemm__global__tile_8h_source.html">wmma_gemm_global_tile.h</a>&gt;</code></p>
+<div class="dynheader">
+Inheritance diagram for cutlass::gemm::WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params:</div>
+<div class="dyncontent">
+ <div class="center">
+  <img src="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.png" usemap="#cutlass::gemm::WmmaGemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E::Params_map" alt=""/>
+  <map id="cutlass::gemm::WmmaGemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E::Params_map" name="cutlass::gemm::WmmaGemmGlobalIteratorCd_3C_20TileTraits_5F_2C_20Index_5F_20_3E::Params_map">
+<area href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html" title="The params. " alt="cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params" shape="rect" coords="0,0,433,24"/>
+</map>
+ </div></div>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:ad6b65c5f3ed7cd9e7ffeb684cbf30d04"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#ad6b65c5f3ed7cd9e7ffeb684cbf30d04">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a>, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> ld, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> n, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> epilogue_stride_w, <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> epilogue_delta_w)</td></tr>
-<tr class="memdesc:ad6b65c5f3ed7cd9e7ffeb684cbf30d04"><td class="mdescLeft">&#160;</td><td class="mdescRight">Setup the params.  <a href="#ad6b65c5f3ed7cd9e7ffeb684cbf30d04">More...</a><br /></td></tr>
-<tr class="separator:ad6b65c5f3ed7cd9e7ffeb684cbf30d04"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a98867f4fc4daf790e309f8365e71cc8f"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a98867f4fc4daf790e309f8365e71cc8f">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>, long long batch_stride, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> ldm, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> n, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_stride_w, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_delta_w)</td></tr>
+<tr class="memdesc:a98867f4fc4daf790e309f8365e71cc8f"><td class="mdescLeft">&#160;</td><td class="mdescRight">Setup the params.  <a href="#a98867f4fc4daf790e309f8365e71cc8f">More...</a><br /></td></tr>
+<tr class="separator:a98867f4fc4daf790e309f8365e71cc8f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="inherit_header pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Member Functions inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td></tr>
+<tr class="memitem:ae24453fcdf9f21385b2637476746bbe5 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5">initialize</a> (<a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>, long long batch_stride, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> ldm, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> bound, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_stride_w, <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_delta_w)</td></tr>
+<tr class="memdesc:ae24453fcdf9f21385b2637476746bbe5 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">Setup the params.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ae24453fcdf9f21385b2637476746bbe5">More...</a><br /></td></tr>
+<tr class="separator:ae24453fcdf9f21385b2637476746bbe5 inherit pub_methods_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
-<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
-Public Attributes</h2></td></tr>
-<tr class="memitem:aa42c4e7419308926b925909e6a5c719d"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a></td></tr>
-<tr class="memdesc:aa42c4e7419308926b925909e6a5c719d"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="#aa42c4e7419308926b925909e6a5c719d">More...</a><br /></td></tr>
-<tr class="separator:aa42c4e7419308926b925909e6a5c719d"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5cff0436eed0fefa2957ad6d083ed007"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007">stride_h</a></td></tr>
-<tr class="memdesc:a5cff0436eed0fefa2957ad6d083ed007"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stride in the H dimension to setup the thread in the block.  <a href="#a5cff0436eed0fefa2957ad6d083ed007">More...</a><br /></td></tr>
-<tr class="separator:a5cff0436eed0fefa2957ad6d083ed007"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a6306f771718c0c05276e103f30f862b2"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">inc_h</a></td></tr>
-<tr class="memdesc:a6306f771718c0c05276e103f30f862b2"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides to increment the pointer.  <a href="#a6306f771718c0c05276e103f30f862b2">More...</a><br /></td></tr>
-<tr class="separator:a6306f771718c0c05276e103f30f862b2"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a857db0c999250248b104f17f13fe9bd8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8">inc_advance</a></td></tr>
-<tr class="separator:a857db0c999250248b104f17f13fe9bd8"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a38f13119cf3111e84914f1bef6f5d985"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">predicate_offset</a></td></tr>
-<tr class="memdesc:a38f13119cf3111e84914f1bef6f5d985"><td class="mdescLeft">&#160;</td><td class="mdescRight">The column offset to compute the predicate for the columns.  <a href="#a38f13119cf3111e84914f1bef6f5d985">More...</a><br /></td></tr>
-<tr class="separator:a38f13119cf3111e84914f1bef6f5d985"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a5b8177a936ba30a3d68ca238aaf76ff6"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">predicate_inc_h</a></td></tr>
-<tr class="memdesc:a5b8177a936ba30a3d68ca238aaf76ff6"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides to increment the predicate offset.  <a href="#a5b8177a936ba30a3d68ca238aaf76ff6">More...</a><br /></td></tr>
-<tr class="separator:a5b8177a936ba30a3d68ca238aaf76ff6"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aa0367d016549cce6bd896bae364fc248"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248">predicate_inc_advance</a></td></tr>
-<tr class="separator:aa0367d016549cce6bd896bae364fc248"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="inherited"></a>
+Additional Inherited Members</h2></td></tr>
+<tr class="inherit_header pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td colspan="2" onclick="javascript:toggleInherit('pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params')"><img src="closed.png" alt="-"/>&#160;Public Attributes inherited from <a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt;::Params</a></td></tr>
+<tr class="memitem:ad764f98e770d4685006e6888214dcd4d inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a></td></tr>
+<tr class="memdesc:ad764f98e770d4685006e6888214dcd4d inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">The pointer.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">More...</a><br /></td></tr>
+<tr class="separator:ad764f98e770d4685006e6888214dcd4d inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1a53695ce7f3cb267225d3ab86a0d5aa inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memItemLeft" align="right" valign="top">long long&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">stride_d</a></td></tr>
+<tr class="memdesc:a1a53695ce7f3cb267225d3ab86a0d5aa inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stride in the D dimension.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">More...</a><br /></td></tr>
+<tr class="separator:a1a53695ce7f3cb267225d3ab86a0d5aa inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0c6b03c635e14ad4424a83f8c7f8025e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">stride_h</a></td></tr>
+<tr class="memdesc:a0c6b03c635e14ad4424a83f8c7f8025e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">The stride in the H dimension to setup the thread in the block.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">More...</a><br /></td></tr>
+<tr class="separator:a0c6b03c635e14ad4424a83f8c7f8025e inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8c2618ac16362a8362dcddeed71c41d4 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">inc_advance</a></td></tr>
+<tr class="memdesc:a8c2618ac16362a8362dcddeed71c41d4 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides to increment the pointer.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">More...</a><br /></td></tr>
+<tr class="separator:a8c2618ac16362a8362dcddeed71c41d4 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aed94505e5a269d5f33499e71284104f5 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">inc_h</a></td></tr>
+<tr class="separator:aed94505e5a269d5f33499e71284104f5 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2b5d2b02d241e89677c41eb658ace129 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">predicate_inc_advance</a></td></tr>
+<tr class="memdesc:a2b5d2b02d241e89677c41eb658ace129 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">The strides to increment the predicate offset.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">More...</a><br /></td></tr>
+<tr class="separator:a2b5d2b02d241e89677c41eb658ace129 inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a36afe18f94aacd0746c8946866371d3c inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">predicate_inc_h</a></td></tr>
+<tr class="separator:a36afe18f94aacd0746c8946866371d3c inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3e8f6cf08d23318f3e3263b55cf3b84a inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">predicate_offset</a></td></tr>
+<tr class="memdesc:a3e8f6cf08d23318f3e3263b55cf3b84a inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="mdescLeft">&#160;</td><td class="mdescRight">The column offset to compute the predicate for the columns.  <a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">More...</a><br /></td></tr>
+<tr class="separator:a3e8f6cf08d23318f3e3263b55cf3b84a inherit pub_attribs_structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="ad6b65c5f3ed7cd9e7ffeb684cbf30d04"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ad6b65c5f3ed7cd9e7ffeb684cbf30d04">&#9670;&nbsp;</a></span>initialize()</h2>
+<a id="a98867f4fc4daf790e309f8365e71cc8f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a98867f4fc4daf790e309f8365e71cc8f">&#9670;&nbsp;</a></span>initialize()</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -129,31 +145,37 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
         <tr>
           <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::Params::initialize </td>
           <td>(</td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a>&#160;</td>
           <td class="paramname"><em>pointer</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td>
-          <td class="paramname"><em>ld</em>, </td>
+          <td class="paramtype">long long&#160;</td>
+          <td class="paramname"><em>batch_stride</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td>
+          <td class="paramname"><em>ldm</em>, </td>
+        </tr>
+        <tr>
+          <td class="paramkey"></td>
+          <td></td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td>
           <td class="paramname"><em>n</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td>
           <td class="paramname"><em>epilogue_stride_w</em>, </td>
         </tr>
         <tr>
           <td class="paramkey"></td>
           <td></td>
-          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>&#160;</td>
+          <td class="paramtype"><a class="el" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a>&#160;</td>
           <td class="paramname"><em>epilogue_delta_w</em>&#160;</td>
         </tr>
         <tr>
@@ -169,119 +191,6 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </table>
 </div><div class="memdoc">
 
-</div>
-</div>
-<h2 class="groupheader">Member Data Documentation</h2>
-<a id="a857db0c999250248b104f17f13fe9bd8"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a857db0c999250248b104f17f13fe9bd8">&#9670;&nbsp;</a></span>inc_advance</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::Params::inc_advance</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a6306f771718c0c05276e103f30f862b2"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a6306f771718c0c05276e103f30f862b2">&#9670;&nbsp;</a></span>inc_h</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::Params::inc_h</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aa42c4e7419308926b925909e6a5c719d"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa42c4e7419308926b925909e6a5c719d">&#9670;&nbsp;</a></span>pointer</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::Params::pointer</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="aa0367d016549cce6bd896bae364fc248"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa0367d016549cce6bd896bae364fc248">&#9670;&nbsp;</a></span>predicate_inc_advance</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::Params::predicate_inc_advance</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a5b8177a936ba30a3d68ca238aaf76ff6"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5b8177a936ba30a3d68ca238aaf76ff6">&#9670;&nbsp;</a></span>predicate_inc_h</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::Params::predicate_inc_h</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a38f13119cf3111e84914f1bef6f5d985"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a38f13119cf3111e84914f1bef6f5d985">&#9670;&nbsp;</a></span>predicate_offset</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::Params::predicate_offset</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
-</div>
-</div>
-<a id="a5cff0436eed0fefa2957ad6d083ed007"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a5cff0436eed0fefa2957ad6d083ed007">&#9670;&nbsp;</a></span>stride_h</h2>
-
-<div class="memitem">
-<div class="memproto">
-<div class="memtemplate">
-template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
-      <table class="memname">
-        <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="el" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a>&lt; TileTraits_, Index_ &gt;::Params::stride_h</td>
-        </tr>
-      </table>
-</div><div class="memdoc">
-
 </div>
 </div>
 <hr/>The documentation for this struct was generated from the following file:<ul>
@@ -290,7 +199,7 @@ template&lt;typename TileTraits_ , typename Index_  = int&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.png b/docs/structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.png
new file mode 100644
index 0000000000000000000000000000000000000000..27742572e4dbee28dd2fcf8a8fba7195e17bf98c
GIT binary patch
literal 1460
zcmb`Hdo<f;7{?Qq&N`GT)gG6s1esgYu6jum=Kd3ul$MgCq@~qHr_qF_A?<WXsfp_-
zZ4ugq5SJ)2bb{6`Me7!%Ra2J=r!FCG`>lWMkL};R=e+Opeb4!v=lSPzo&*nfCzYN1
zcS0Z#6~NgZ4}m~=VD?Z_1mDMj^=e?z_Hgxb*xud-<HGV((H}Q|0n?Y;)YRm|i#!W{
zl_K!&XCNT-_j%jybr=GH*#Y)Hctt|za>c9<CzTvB`5gJS^;#hjw}bEy7ZS|G7FMOE
zB|>@drFK5aFI3Doj~|315r9FO5RPQAvfvK*-KmAnE<vn4z-bLrnE_ypucgDUls1o7
zeO{sIk@cHP68fWtth>E)X_U7=vEi70ZF^SUK!6d28a`co{`TFhB&*(sg73-e;X#(Z
zIM#qBk6bCS`p{sITq_o>5t6zV`B9q|{B14D#|JfzPF2kpL`Ccyk3uzq`yKt%IG)Mr
zZ{{b9@39Kqos2fe_0_M4;x^o>E!^M3cxUyWWj)DnIV76Lg~x34Jg*>!$d}OH(9Hz2
z$>5waMaLT21}=T@U^X1>A4=2;o0ZK4rZkpiz>{v-blyQ5e|jJgq7|!6;*n!bFXN<x
z%5xPl<IF{6-q?qVuXl0unvVx>VywEhUu-UZ$1@yxttqxZ{h6mx&!43hn8wDii|`!_
z@jmCAaV1(kYKwZAgq~xHemVf<xQoiD*>G=*pRn6DqOEfRi@{=e>7&_$zn$KPwLU={
z&6jsqOfj32*N<5fiDSeh$vl$_1XRm>O&{reo^GkE%gz(DWe7J=x8CdJyjf7^kv&^`
zVh6~=F+tnP`o+dwvobnY^KsrxLHnF4zUOw8ERz!Q7167JZhZ)LIQLUze^-C&nbgz>
zRlAagH#b`hhhNc5YKMZP%)Ehm$;3z7&EYXAleNU+N^yW3A#dy0*n^^8ckV6glSP&4
z+OoLbrHJWD`QX0wBhvuhrS}AOND~2i5rYR@SqG5`03MD&0n9?U5s(sL$R~+2hWVuX
z28@7bmW(|%Y6uj=MlN@`2nkOULKLQVn595tJ$Ea{vnOC`0HAz;#nQF`8!$kzASoaM
zc7)pFL7))6<Np8}GkuWkLKh?=-UNbVsQqUOj3=HD0nxOl3R#>HEaa-LR&jcbgq*vs
z9qd-s-LVzUof)Z2-)9EZyQ-{E-fL}4iCIl+F^(U)Y}oY*ccez&cqRX4M<r=OJkl`q
z;2)1so2u19BctXQzN;sxf}@`;RucW{WY4SugGp5|-u`7D(q>rnc@qX`GX0L;7n2FK
zw}MD>9-WWNwI|mwZn9z;HEbOH`kp0KDjG~(3N6P9ekC=iYLE6TTY3lGzs%6Js78G|
zptQbH{<4vC`Scf!!|H`%<C^QUwcd@7$|z2i3*n>LbIdr(iKP&~havIHdYPEWr=8lZ
zsM&eml`T8Z0pU!pgxbPabVUXr`p4++IFcl;+E#jYn0d2d5W&Elci!HvljcuxkSJe+
zLeV<xpTo4eYM;X?78U5=2DavuV`Dnf)lozw9XICBoRMx7GWz;LO8g=vbS*;o>U7=q
zr^KYFWSvPu&(U|Be$3UrdG(xtQyk9pE7~=nQ@>!Zln1EjtE2Z`(s7H#I9<DuJV$Mb
z9(X&y?(gT1;W@#?o3?>iiv(|pbZ`5iZnH$suBoZIYMY`|T~Xc8aO8{vgPi3$izA#n
zm7gn!W967na;Mh12J~aePohbET%`rp7=72f%;~a>aZHfZ9kLoQvo7dYh5lF?s<NQ*
zdsHh{eg6R%NX;`rLmD~%_O4Fdl%3{<WD8%%&@TCwjp+}jf-4pRIJnz$Z7<yY3-bKM
Ae*gdg

literal 0
HcmV?d00001

diff --git a/docs/structcutlass_1_1gemm_1_1swizzleDirection-members.html b/docs/structcutlass_1_1gemm_1_1swizzleDirection-members.html
new file mode 100644
index 000000000..f5ef4f4e6
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1swizzleDirection-members.html
@@ -0,0 +1,93 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html">swizzleDirection</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::gemm::swizzleDirection Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html">cutlass::gemm::swizzleDirection</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa">Boustrophedon</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html">cutlass::gemm::swizzleDirection</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8">Kind</a> enum name</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html">cutlass::gemm::swizzleDirection</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5">OneDirection</a> enum value</td><td class="entry"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html">cutlass::gemm::swizzleDirection</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1gemm_1_1swizzleDirection.html b/docs/structcutlass_1_1gemm_1_1swizzleDirection.html
new file mode 100644
index 000000000..5fa910d26
--- /dev/null
+++ b/docs/structcutlass_1_1gemm_1_1swizzleDirection.html
@@ -0,0 +1,122 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::gemm::swizzleDirection Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="namespacecutlass_1_1gemm.html">gemm</a></li><li class="navelem"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html">swizzleDirection</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="structcutlass_1_1gemm_1_1swizzleDirection-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::gemm::swizzleDirection Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="threadblock__swizzle_8h_source.html">threadblock_swizzle.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:aba1528de966f236380c5f55942802fb8"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8">Kind</a> { <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa">Boustrophedon</a>, 
+<a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5">OneDirection</a>
+ }</td></tr>
+<tr class="separator:aba1528de966f236380c5f55942802fb8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Enumeration Documentation</h2>
+<a id="aba1528de966f236380c5f55942802fb8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aba1528de966f236380c5f55942802fb8">&#9670;&nbsp;</a></span>Kind</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">enum <a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8">cutlass::gemm::swizzleDirection::Kind</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa"></a>Boustrophedon&#160;</td><td class="fielddoc"></td></tr>
+<tr><td class="fieldname"><a id="aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5"></a>OneDirection&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="threadblock__swizzle_8h_source.html">threadblock_swizzle.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1int4__t.html b/docs/structcutlass_1_1int4__t.html
new file mode 100644
index 000000000..ea0a33e92
--- /dev/null
+++ b/docs/structcutlass_1_1int4__t.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::int4_t Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1int4__t.html">int4_t</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::int4_t Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="numeric__types_8h_source.html">numeric_types.h</a>&gt;</code></p>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="numeric__types_8h_source.html">numeric_types.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/structcutlass_1_1is__pow2-members.html b/docs/structcutlass_1_1is__pow2-members.html
index 8ec013158..22f162427 100644
--- a/docs/structcutlass_1_1is__pow2-members.html
+++ b/docs/structcutlass_1_1is__pow2-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1is__pow2.html b/docs/structcutlass_1_1is__pow2.html
index 01c0ea167..d3f497d61 100644
--- a/docs/structcutlass_1_1is__pow2.html
+++ b/docs/structcutlass_1_1is__pow2.html
@@ -117,7 +117,7 @@ struct cutlass::is_pow2&lt; N &gt;</h3>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1log2__down-members.html b/docs/structcutlass_1_1log2__down-members.html
index e585259d9..547b840d5 100644
--- a/docs/structcutlass_1_1log2__down-members.html
+++ b/docs/structcutlass_1_1log2__down-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1log2__down.html b/docs/structcutlass_1_1log2__down.html
index bee9f1c87..82b470a4a 100644
--- a/docs/structcutlass_1_1log2__down.html
+++ b/docs/structcutlass_1_1log2__down.html
@@ -120,7 +120,7 @@ template&lt;int N, int CurrentVal = N, int Count = 0&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4-members.html b/docs/structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4-members.html
index 9e97ad595..11bdf8691 100644
--- a/docs/structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4-members.html
+++ b/docs/structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html b/docs/structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html
index 115f5dec0..37b333f17 100644
--- a/docs/structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html
+++ b/docs/structcutlass_1_1log2__down_3_01N_00_011_00_01Count_01_4.html
@@ -114,7 +114,7 @@ template&lt;int N, int Count&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1log2__up-members.html b/docs/structcutlass_1_1log2__up-members.html
index b402e19a2..0be961182 100644
--- a/docs/structcutlass_1_1log2__up-members.html
+++ b/docs/structcutlass_1_1log2__up-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1log2__up.html b/docs/structcutlass_1_1log2__up.html
index 76434f767..e639242bc 100644
--- a/docs/structcutlass_1_1log2__up.html
+++ b/docs/structcutlass_1_1log2__up.html
@@ -120,7 +120,7 @@ template&lt;int N, int CurrentVal = N, int Count = 0&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4-members.html b/docs/structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4-members.html
index 43e9b591a..ac1f19d9d 100644
--- a/docs/structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4-members.html
+++ b/docs/structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html b/docs/structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html
index 7fffdf1b7..2ec0db026 100644
--- a/docs/structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html
+++ b/docs/structcutlass_1_1log2__up_3_01N_00_011_00_01Count_01_4.html
@@ -114,7 +114,7 @@ template&lt;int N, int Count&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1aligned__chunk.html b/docs/structcutlass_1_1platform_1_1aligned__chunk.html
index 3de8d20ba..6575901e7 100644
--- a/docs/structcutlass_1_1platform_1_1aligned__chunk.html
+++ b/docs/structcutlass_1_1platform_1_1aligned__chunk.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1aligned__storage-members.html b/docs/structcutlass_1_1platform_1_1aligned__storage-members.html
index fd6fe12ec..d6e3fede2 100644
--- a/docs/structcutlass_1_1platform_1_1aligned__storage-members.html
+++ b/docs/structcutlass_1_1platform_1_1aligned__storage-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1aligned__storage.html b/docs/structcutlass_1_1platform_1_1aligned__storage.html
index aff24062b..85482bc92 100644
--- a/docs/structcutlass_1_1platform_1_1aligned__storage.html
+++ b/docs/structcutlass_1_1platform_1_1aligned__storage.html
@@ -113,7 +113,7 @@ template&lt;size_t Len, size_t Align&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of-members.html b/docs/structcutlass_1_1platform_1_1alignment__of-members.html
index fc7b447c3..b71307aca 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of.html b/docs/structcutlass_1_1platform_1_1alignment__of.html
index 694be0bd3..a560500c0 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of.html
@@ -134,7 +134,7 @@ template&lt;typename value_t &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_1_1pad-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_1_1pad-members.html
index acdc53706..53f1cd1df 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_1_1pad-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_1_1pad-members.html
@@ -84,7 +84,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_1_1pad.html b/docs/structcutlass_1_1platform_1_1alignment__of_1_1pad.html
index 55d1bd6e8..8adc06db7 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_1_1pad.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_1_1pad.html
@@ -128,7 +128,7 @@ template&lt;typename value_t &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4-members.html
index ea64f250a..cf8ad55c7 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html
index 8e98bc530..d9cebbcc7 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01value__t_01_4.html
@@ -103,7 +103,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4-members.html
index a61b3244b..86b364d39 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html
index 4f8edc6ee..0336e3003 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01const_01volatile_01value__t_01_4.html
@@ -103,7 +103,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4-members.html
index 0e3715f69..b7dd56b61 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html
index a60e78c50..6dc811c7f 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01double2_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4-members.html
index 8f2714a94..d2af5cc28 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html
index 2084602e2..4dbbef8cc 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01double4_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4-members.html
index 3cbf902fc..b5a95a3d4 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html
index 845ab556a..2bdfc0d1d 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01float4_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4-members.html
index 8aa758284..128c7f1da 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html
index 1d78331a6..7932c2121 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01int4_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4-members.html
index b788913c9..8d96dc233 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html
index 0a6a59b61..f20b6e3f8 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01long4_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4-members.html
index ce64ecf4b..378c0a2c3 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html
index b5d0d2149..4ff677b76 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong2_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4-members.html
index 7bdc4055e..c683dfcb5 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html
index e03232f6a..ace782e1b 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01longlong4_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4-members.html
index 501443504..7795163a1 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html
index 45a392e24..f5d5f1dbc 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01uint4_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4-members.html
index b18799de1..9e94e18cc 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html
index 45ca5ac52..e5c523c65 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulong4_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4-members.html
index 867a1a97c..9ebfeac4f 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html
index e74e49099..2b6d2db2c 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong2_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4-members.html
index 572097821..e6e4ef802 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html
index de2f97f02..9d9da9e67 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01ulonglong4_01_4.html
@@ -112,7 +112,7 @@ Public Types</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4-members.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4-members.html
index 93d5c3875..862d16f2e 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html b/docs/structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html
index 9ad8844d2..6cafad368 100644
--- a/docs/structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1alignment__of_3_01volatile_01value__t_01_4.html
@@ -103,7 +103,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1bool__constant-members.html b/docs/structcutlass_1_1platform_1_1bool__constant-members.html
index 970d8749d..abd1fa9f7 100644
--- a/docs/structcutlass_1_1platform_1_1bool__constant-members.html
+++ b/docs/structcutlass_1_1platform_1_1bool__constant-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1bool__constant.html b/docs/structcutlass_1_1platform_1_1bool__constant.html
index 77a7942d0..ea222ccbe 100644
--- a/docs/structcutlass_1_1platform_1_1bool__constant.html
+++ b/docs/structcutlass_1_1platform_1_1bool__constant.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1conditional-members.html b/docs/structcutlass_1_1platform_1_1conditional-members.html
index 0e246b140..0d33dde9d 100644
--- a/docs/structcutlass_1_1platform_1_1conditional-members.html
+++ b/docs/structcutlass_1_1platform_1_1conditional-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1conditional.html b/docs/structcutlass_1_1platform_1_1conditional.html
index 71ae69b88..2dc52bba2 100644
--- a/docs/structcutlass_1_1platform_1_1conditional.html
+++ b/docs/structcutlass_1_1platform_1_1conditional.html
@@ -113,7 +113,7 @@ template&lt;bool B, class T, class F &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4-members.html b/docs/structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4-members.html
index 309d3523c..049dc4a61 100644
--- a/docs/structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html b/docs/structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html
index 4eee2e3ea..f7785b7a0 100644
--- a/docs/structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1conditional_3_01false_00_01T_00_01F_01_4.html
@@ -113,7 +113,7 @@ template&lt;class T , class F &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1default__delete-members.html b/docs/structcutlass_1_1platform_1_1default__delete-members.html
index 0d47203dc..8066c92dc 100644
--- a/docs/structcutlass_1_1platform_1_1default__delete-members.html
+++ b/docs/structcutlass_1_1platform_1_1default__delete-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1default__delete.html b/docs/structcutlass_1_1platform_1_1default__delete.html
index d15c650d5..f11beac1d 100644
--- a/docs/structcutlass_1_1platform_1_1default__delete.html
+++ b/docs/structcutlass_1_1platform_1_1default__delete.html
@@ -125,7 +125,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1default__delete_3_01T[]_4-members.html b/docs/structcutlass_1_1platform_1_1default__delete_3_01T[]_4-members.html
index 2ad2a9488..ba1d7c7b8 100644
--- a/docs/structcutlass_1_1platform_1_1default__delete_3_01T[]_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1default__delete_3_01T[]_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html b/docs/structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html
index 9051d14f5..611d31ac7 100644
--- a/docs/structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html
+++ b/docs/structcutlass_1_1platform_1_1default__delete_3_01T[]_4.html
@@ -125,7 +125,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1enable__if-members.html b/docs/structcutlass_1_1platform_1_1enable__if-members.html
index cd8ca9d5e..8a13fe0f6 100644
--- a/docs/structcutlass_1_1platform_1_1enable__if-members.html
+++ b/docs/structcutlass_1_1platform_1_1enable__if-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1enable__if.html b/docs/structcutlass_1_1platform_1_1enable__if.html
index 2621d1739..dd6b21d41 100644
--- a/docs/structcutlass_1_1platform_1_1enable__if.html
+++ b/docs/structcutlass_1_1platform_1_1enable__if.html
@@ -113,7 +113,7 @@ template&lt;bool C, typename T  = void&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html b/docs/structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html
index 22e8b1c94..423fcd4fe 100644
--- a/docs/structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1enable__if_3_01false_00_01T_01_4.html
@@ -87,7 +87,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1greater-members.html b/docs/structcutlass_1_1platform_1_1greater-members.html
index 4cf39f7c7..502eceb0d 100644
--- a/docs/structcutlass_1_1platform_1_1greater-members.html
+++ b/docs/structcutlass_1_1platform_1_1greater-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1greater.html b/docs/structcutlass_1_1platform_1_1greater.html
index aadc82c7e..b040ae73d 100644
--- a/docs/structcutlass_1_1platform_1_1greater.html
+++ b/docs/structcutlass_1_1platform_1_1greater.html
@@ -135,7 +135,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1integral__constant-members.html b/docs/structcutlass_1_1platform_1_1integral__constant-members.html
index 40aca68b8..0888a9f26 100644
--- a/docs/structcutlass_1_1platform_1_1integral__constant-members.html
+++ b/docs/structcutlass_1_1platform_1_1integral__constant-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1integral__constant.html b/docs/structcutlass_1_1platform_1_1integral__constant.html
index db936f3f9..716aedc4e 100644
--- a/docs/structcutlass_1_1platform_1_1integral__constant.html
+++ b/docs/structcutlass_1_1platform_1_1integral__constant.html
@@ -253,7 +253,7 @@ template&lt;typename value_t, value_t V&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__arithmetic-members.html b/docs/structcutlass_1_1platform_1_1is__arithmetic-members.html
index 1b38edecf..088ad7900 100644
--- a/docs/structcutlass_1_1platform_1_1is__arithmetic-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__arithmetic-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__arithmetic.html b/docs/structcutlass_1_1platform_1_1is__arithmetic.html
index a97af770e..337dca8f0 100644
--- a/docs/structcutlass_1_1platform_1_1is__arithmetic.html
+++ b/docs/structcutlass_1_1platform_1_1is__arithmetic.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__base__of-members.html b/docs/structcutlass_1_1platform_1_1is__base__of-members.html
index 249c1c919..5a9b58c9d 100644
--- a/docs/structcutlass_1_1platform_1_1is__base__of-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__base__of-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__base__of.html b/docs/structcutlass_1_1platform_1_1is__base__of.html
index dedb3f49f..e3391d184 100644
--- a/docs/structcutlass_1_1platform_1_1is__base__of.html
+++ b/docs/structcutlass_1_1platform_1_1is__base__of.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__base__of__helper-members.html b/docs/structcutlass_1_1platform_1_1is__base__of__helper-members.html
index 8b6909276..3a2bcd26d 100644
--- a/docs/structcutlass_1_1platform_1_1is__base__of__helper-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__base__of__helper-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__base__of__helper.html b/docs/structcutlass_1_1platform_1_1is__base__of__helper.html
index 023363b0f..23c1e54c4 100644
--- a/docs/structcutlass_1_1platform_1_1is__base__of__helper.html
+++ b/docs/structcutlass_1_1platform_1_1is__base__of__helper.html
@@ -256,7 +256,7 @@ template&lt;typename BaseT , typename DerivedT &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy-members.html b/docs/structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy-members.html
index 681dfbf0f..1554dea39 100644
--- a/docs/structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy-members.html
@@ -84,7 +84,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html b/docs/structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html
index 99556de73..bf8f329e8 100644
--- a/docs/structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html
+++ b/docs/structcutlass_1_1platform_1_1is__base__of__helper_1_1dummy.html
@@ -138,7 +138,7 @@ template&lt;typename B , typename D &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__floating__point-members.html b/docs/structcutlass_1_1platform_1_1is__floating__point-members.html
index d9fc90914..725d40ab8 100644
--- a/docs/structcutlass_1_1platform_1_1is__floating__point-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__floating__point-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__floating__point.html b/docs/structcutlass_1_1platform_1_1is__floating__point.html
index a4612f174..ea7cc9638 100644
--- a/docs/structcutlass_1_1platform_1_1is__floating__point.html
+++ b/docs/structcutlass_1_1platform_1_1is__floating__point.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__fundamental-members.html b/docs/structcutlass_1_1platform_1_1is__fundamental-members.html
index 9594895f5..9a178ab83 100644
--- a/docs/structcutlass_1_1platform_1_1is__fundamental-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__fundamental-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__fundamental.html b/docs/structcutlass_1_1platform_1_1is__fundamental.html
index 0fbbe471b..028831ed6 100644
--- a/docs/structcutlass_1_1platform_1_1is__fundamental.html
+++ b/docs/structcutlass_1_1platform_1_1is__fundamental.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral-members.html b/docs/structcutlass_1_1platform_1_1is__integral-members.html
index 1e8b70960..7967813b2 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral.html b/docs/structcutlass_1_1platform_1_1is__integral.html
index a8218637a..27f93de9c 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral.html
@@ -118,7 +118,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01char_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01char_01_4-members.html
index 6de7dfe3b..1993b9f8e 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01char_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01char_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html
index faa0e6d2e..07cfe696c 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01char_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4-members.html
index 8f7fc5b48..b303b701a 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html
index 769cba51d..1b4b4a57f 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01T_01_4.html
@@ -113,7 +113,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4-members.html
index 435a585bc..275d16904 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html
index 44de345ce..3d9479b36 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01const_01volatile_01T_01_4.html
@@ -113,7 +113,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01int_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01int_01_4-members.html
index 28ebf9d1a..1667f2c2f 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01int_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01int_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html
index fe037e174..d3e96de61 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01int_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01_4-members.html
index 679ccf3be..9c273ee06 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html
index 2643071c1..170284ec3 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4-members.html
index 82a054fae..f03e2d6ee 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html
index a3f5c11d5..cdc7f9eb7 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01long_01long_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01short_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01short_01_4-members.html
index 3dc681ff1..5749a385a 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01short_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01short_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html
index 119f69bf5..44fbff05a 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01short_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4-members.html
index 74a51c68b..898e12fab 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html
index 78ff2a0c7..122567a45 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01signed_01char_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4-members.html
index ce5684847..ef844b7d2 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html
index eb0734cd7..e82748894 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01char_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4-members.html
index e334b6af4..a3d2668c3 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html
index 669a35f45..35e937cec 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01int_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4-members.html
index f0de60204..44f6009e8 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html
index 57166d8f4..334d78ff0 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4-members.html
index 4c796bf97..ac4ff358d 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html
index 8fb6640e3..b35f19667 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01long_01long_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4-members.html
index c7dbea3fb..ac20da410 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html
index 3dad4c368..14e0ba1b9 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01unsigned_01short_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4-members.html
index cf6c6e95d..a2562e410 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html b/docs/structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html
index 771358c7e..8b0502426 100644
--- a/docs/structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__integral_3_01volatile_01T_01_4.html
@@ -113,7 +113,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__pointer-members.html b/docs/structcutlass_1_1platform_1_1is__pointer-members.html
index 7f6e12d67..64a254850 100644
--- a/docs/structcutlass_1_1platform_1_1is__pointer-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__pointer-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__pointer.html b/docs/structcutlass_1_1platform_1_1is__pointer.html
index f6bd0999e..20c2f44c7 100644
--- a/docs/structcutlass_1_1platform_1_1is__pointer.html
+++ b/docs/structcutlass_1_1platform_1_1is__pointer.html
@@ -116,7 +116,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__pointer__helper-members.html b/docs/structcutlass_1_1platform_1_1is__pointer__helper-members.html
index 4d36210e6..8f471653a 100644
--- a/docs/structcutlass_1_1platform_1_1is__pointer__helper-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__pointer__helper-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__pointer__helper.html b/docs/structcutlass_1_1platform_1_1is__pointer__helper.html
index 56fdd506b..8eca9c947 100644
--- a/docs/structcutlass_1_1platform_1_1is__pointer__helper.html
+++ b/docs/structcutlass_1_1platform_1_1is__pointer__helper.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4-members.html
index 9a6bacc85..0dfb85ef2 100644
--- a/docs/structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html b/docs/structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html
index 1e1fb5ed6..95599b82a 100644
--- a/docs/structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__pointer__helper_3_01T_01_5_01_4.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__same-members.html b/docs/structcutlass_1_1platform_1_1is__same-members.html
index 3ed687e1b..cd9ffc503 100644
--- a/docs/structcutlass_1_1platform_1_1is__same-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__same-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__same.html b/docs/structcutlass_1_1platform_1_1is__same.html
index bc71a8458..7c844864f 100644
--- a/docs/structcutlass_1_1platform_1_1is__same.html
+++ b/docs/structcutlass_1_1platform_1_1is__same.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4-members.html
index 0c4aba485..4574a6cef 100644
--- a/docs/structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html b/docs/structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html
index 973be0304..869cfc127 100644
--- a/docs/structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__same_3_01A_00_01A_01_4.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__trivially__copyable-members.html b/docs/structcutlass_1_1platform_1_1is__trivially__copyable-members.html
index 1ba94b361..23208073d 100644
--- a/docs/structcutlass_1_1platform_1_1is__trivially__copyable-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__trivially__copyable-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__trivially__copyable.html b/docs/structcutlass_1_1platform_1_1is__trivially__copyable.html
index f779e4e4a..e1a0331ef 100644
--- a/docs/structcutlass_1_1platform_1_1is__trivially__copyable.html
+++ b/docs/structcutlass_1_1platform_1_1is__trivially__copyable.html
@@ -119,7 +119,7 @@ struct cutlass::platform::is_trivially_copyable&lt; T &gt;</h3>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__void-members.html b/docs/structcutlass_1_1platform_1_1is__void-members.html
index a04530c01..7d47918d1 100644
--- a/docs/structcutlass_1_1platform_1_1is__void-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__void-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__void.html b/docs/structcutlass_1_1platform_1_1is__void.html
index e71b03581..cba57610e 100644
--- a/docs/structcutlass_1_1platform_1_1is__void.html
+++ b/docs/structcutlass_1_1platform_1_1is__void.html
@@ -116,7 +116,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__volatile-members.html b/docs/structcutlass_1_1platform_1_1is__volatile-members.html
index 95b52e5fd..1491994fd 100644
--- a/docs/structcutlass_1_1platform_1_1is__volatile-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__volatile-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__volatile.html b/docs/structcutlass_1_1platform_1_1is__volatile.html
index a75658c05..2b61e1588 100644
--- a/docs/structcutlass_1_1platform_1_1is__volatile.html
+++ b/docs/structcutlass_1_1platform_1_1is__volatile.html
@@ -115,7 +115,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4-members.html b/docs/structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4-members.html
index bc3af3871..2a288547c 100644
--- a/docs/structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4-members.html
@@ -87,7 +87,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html b/docs/structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html
index c2817b5f3..69f0ab20b 100644
--- a/docs/structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1is__volatile_3_01volatile_01T_01_4.html
@@ -112,7 +112,7 @@ Additional Inherited Members</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1less-members.html b/docs/structcutlass_1_1platform_1_1less-members.html
index 24798c6b0..20986e5fe 100644
--- a/docs/structcutlass_1_1platform_1_1less-members.html
+++ b/docs/structcutlass_1_1platform_1_1less-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1less.html b/docs/structcutlass_1_1platform_1_1less.html
index abaff3e48..7ad26f16c 100644
--- a/docs/structcutlass_1_1platform_1_1less.html
+++ b/docs/structcutlass_1_1platform_1_1less.html
@@ -135,7 +135,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1nullptr__t.html b/docs/structcutlass_1_1platform_1_1nullptr__t.html
index c35b9e853..add701f11 100644
--- a/docs/structcutlass_1_1platform_1_1nullptr__t.html
+++ b/docs/structcutlass_1_1platform_1_1nullptr__t.html
@@ -87,7 +87,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1plus-members.html b/docs/structcutlass_1_1platform_1_1plus-members.html
index 6055a46c0..a78a34dd7 100644
--- a/docs/structcutlass_1_1platform_1_1plus-members.html
+++ b/docs/structcutlass_1_1platform_1_1plus-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1plus.html b/docs/structcutlass_1_1platform_1_1plus.html
index 71f732c90..e20d3f769 100644
--- a/docs/structcutlass_1_1platform_1_1plus.html
+++ b/docs/structcutlass_1_1platform_1_1plus.html
@@ -135,7 +135,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__const-members.html b/docs/structcutlass_1_1platform_1_1remove__const-members.html
index a67005a93..9e2e15330 100644
--- a/docs/structcutlass_1_1platform_1_1remove__const-members.html
+++ b/docs/structcutlass_1_1platform_1_1remove__const-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__const.html b/docs/structcutlass_1_1platform_1_1remove__const.html
index d0af5788f..003fd3498 100644
--- a/docs/structcutlass_1_1platform_1_1remove__const.html
+++ b/docs/structcutlass_1_1platform_1_1remove__const.html
@@ -113,7 +113,7 @@ template&lt;typename T&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4-members.html b/docs/structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4-members.html
index 49041398a..2f23cff47 100644
--- a/docs/structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html b/docs/structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html
index a8fff9b4d..a803e99e3 100644
--- a/docs/structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1remove__const_3_01const_01T_01_4.html
@@ -113,7 +113,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__cv-members.html b/docs/structcutlass_1_1platform_1_1remove__cv-members.html
index 64c6607b3..455f01286 100644
--- a/docs/structcutlass_1_1platform_1_1remove__cv-members.html
+++ b/docs/structcutlass_1_1platform_1_1remove__cv-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__cv.html b/docs/structcutlass_1_1platform_1_1remove__cv.html
index 5972cb34b..8a2b4bd7c 100644
--- a/docs/structcutlass_1_1platform_1_1remove__cv.html
+++ b/docs/structcutlass_1_1platform_1_1remove__cv.html
@@ -113,7 +113,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__volatile-members.html b/docs/structcutlass_1_1platform_1_1remove__volatile-members.html
index 19a47545a..094fcf664 100644
--- a/docs/structcutlass_1_1platform_1_1remove__volatile-members.html
+++ b/docs/structcutlass_1_1platform_1_1remove__volatile-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__volatile.html b/docs/structcutlass_1_1platform_1_1remove__volatile.html
index eb259c2e6..0f52d3e15 100644
--- a/docs/structcutlass_1_1platform_1_1remove__volatile.html
+++ b/docs/structcutlass_1_1platform_1_1remove__volatile.html
@@ -113,7 +113,7 @@ template&lt;typename T&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4-members.html b/docs/structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4-members.html
index 09e68535b..9f6bcace8 100644
--- a/docs/structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4-members.html
+++ b/docs/structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html b/docs/structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html
index d2a95b212..787398eb2 100644
--- a/docs/structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html
+++ b/docs/structcutlass_1_1platform_1_1remove__volatile_3_01volatile_01T_01_4.html
@@ -113,7 +113,7 @@ template&lt;typename T &gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:15 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:53 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1sqrt__est-members.html b/docs/structcutlass_1_1sqrt__est-members.html
index 56f161409..c62849598 100644
--- a/docs/structcutlass_1_1sqrt__est-members.html
+++ b/docs/structcutlass_1_1sqrt__est-members.html
@@ -83,7 +83,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1sqrt__est.html b/docs/structcutlass_1_1sqrt__est.html
index c973ff723..fa8885d19 100644
--- a/docs/structcutlass_1_1sqrt__est.html
+++ b/docs/structcutlass_1_1sqrt__est.html
@@ -119,7 +119,7 @@ template&lt;int N&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/structcutlass_1_1uint4__t.html b/docs/structcutlass_1_1uint4__t.html
new file mode 100644
index 000000000..fe2c9166c
--- /dev/null
+++ b/docs/structcutlass_1_1uint4__t.html
@@ -0,0 +1,92 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::uint4_t Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::uint4_t Struct Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="numeric__types_8h_source.html">numeric_types.h</a>&gt;</code></p>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="numeric__types_8h_source.html">numeric_types.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tensor__ref_8h.html b/docs/tensor__ref_8h.html
index 14314c66f..846363ab9 100644
--- a/docs/tensor__ref_8h.html
+++ b/docs/tensor__ref_8h.html
@@ -82,17 +82,22 @@ $(function() {
 
 <p>Defines a structure containing strides, bounds, and a pointer to tensor data.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;typeinfo&gt;</code><br />
-<code>#include &lt;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&quot;</code><br />
 </div>
 <p><a href="tensor__ref_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_ &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Structure modeling a pointer and stride into a tensor.  <a href="classcutlass_1_1TensorRef.html#details">More...</a><br /></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1IdentityTensorMapFunc.html">cutlass::IdentityTensorMapFunc&lt; Rank &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specialization for rank=1 case with no internal <a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">StrideVector</a>.  <a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StrideVector</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -103,7 +108,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/tensor__ref_8h_source.html b/docs/tensor__ref_8h_source.html
index 8031da7d3..fce87a172 100644
--- a/docs/tensor__ref_8h_source.html
+++ b/docs/tensor__ref_8h_source.html
@@ -76,40 +76,90 @@ $(function() {
 <div class="title">tensor_ref.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="tensor__ref_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;typeinfo&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Storage_, <span class="keywordtype">int</span> Rank_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html">   42</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> {</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">   45</a></span>&#160;  <span class="keyword">typedef</span> Storage_ <a class="code" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">   48</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> = Rank_;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>* ptr_;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> stride_;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">   68</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">TensorRef</a>() : ptr_(<a class="code" href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a>) {}</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8">   72</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8">TensorRef</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>* ptr, <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <a class="code" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>) : ptr_(ptr), stride_(<a class="code" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>) {}</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">   76</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">reset</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>* ptr = <span class="keyword">nullptr</span>, <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <a class="code" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a> = <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a>(0)) {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    ptr_ = ptr;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    stride_ = <a class="code" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  }</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">   83</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;T, Rank&gt;</a> <a class="code" href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">convert</a>() {</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> converted_stride;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> - 1; ++i) {</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      converted_stride[i] = stride_[i] * <a class="code" href="structcutlass_1_1Extent.html">Extent&lt;Storage&gt;::kValue</a> / <a class="code" href="structcutlass_1_1Extent.html">Extent&lt;T&gt;::kValue</a>;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    }</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    converted_stride[<a class="code" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> - 1] = stride_[<a class="code" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">Rank</a> - 1];</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;T, Rank&gt;</a>(<span class="keyword">reinterpret_cast&lt;</span>T*<span class="keyword">&gt;</span>(ptr_), converted_stride);</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  }</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">   95</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">good</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_ != <span class="keyword">nullptr</span>; }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">   99</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>* <a class="code" href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_; }</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">  103</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> stride_; }</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31">  107</a></span>&#160;  <span class="keywordtype">int</span> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31">stride</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> stride_.<a class="code" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">at</a>(dim); }</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">  111</a></span>&#160;  <span class="keywordtype">int</span> <a class="code" href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">leading_dim</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="platform_8h.html#abd31f291635329bc15292954f1f01d38">__NV_STD_MAX</a>(stride_[1], stride_[2]); }</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">  115</a></span>&#160;  <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">offset</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keywordflow">return</span> stride_.template dot&lt;long long&gt;(coord);</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  }</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00121"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">  121</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">at</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_[<a class="code" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">offset</a>(coord)]; }</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974">  124</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974">operator[]</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">at</a>(coord); }</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215">  128</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215">at</a>(<span class="keywordtype">int</span> idx)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_[idx]; }</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c">  131</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c">operator[]</a>(<span class="keywordtype">int</span> idx)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">at</a>(idx); }</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00135"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">  135</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">advance</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    ptr_ += <a class="code" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">offset</a>(b);</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  }</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00142"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">  142</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="code" href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">operator+</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">TensorRef</a>(ptr_ + <a class="code" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">offset</a>(b), stride_); }</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">  146</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="code" href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">operator-</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">TensorRef</a>(ptr_ - <a class="code" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">offset</a>(b), stride_); }</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;};</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="classcutlass_1_1TensorRef_html_af47f192552544272774a29d7a0829a31"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#af47f192552544272774a29d7a0829a31">cutlass::TensorRef::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int const  &amp; stride(int dim) const</div><div class="ttdoc">Returns the stride of the tensor in the given dimension. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:107</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a34e97ab2190b4681d1c1199186d66f1c"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a34e97ab2190b4681d1c1199186d66f1c">cutlass::TensorRef::operator[]</a></div><div class="ttdeci">Storage &amp; operator[](int idx) const</div><div class="ttdoc">Element-wise accessor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:131</div></div>
+<a href="tensor__ref_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> Rank&gt;</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1IdentityTensorMapFunc.html">   41</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1IdentityTensorMapFunc.html">IdentityTensorMapFunc</a> {</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1IdentityTensorMapFunc.html#ac609498e7fe858b4fb3791d1039438f4">   42</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1IdentityTensorMapFunc.html#ac609498e7fe858b4fb3791d1039438f4">kStorageRank</a> = Rank;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1IdentityTensorMapFunc.html#a3922130841c34d3ce8c112ee6fae4ca1">   44</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <a class="code" href="structcutlass_1_1IdentityTensorMapFunc.html#a3922130841c34d3ce8c112ee6fae4ca1">operator()</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keywordflow">return</span> coord;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  }</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;};</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="comment">/* \brief Structure modeling a pointer and stride into a tensor.</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="comment">  A tensor consists of an index space with Rank_ dimensions. It is stored in memory modeled</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="comment">  as an n-D array, where n = StorageRank_. A mapping function maps the logical coordinates of the</span></div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment">  tensor&#39;s index space into the n-D array, and a stride vector maps the n-D array to linear memory.</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="comment">  CUTLASS requires the n-D array&#39;s least significant, &quot;fastest changing&quot; dimension to</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="comment">  be contiguous in memory. It therefore has a stride of 1 and is not stored. Construction is offered</span></div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="comment">  from vectors of full StorageRank and of the &#39;compact&#39; rank, though it is in error to construct</span></div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;<span class="comment">  with the least significant stride != 1.</span></div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;<span class="comment">  The requirement that the least significant dimension be consecutive enables numerous optimizations</span></div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;<span class="comment">  and assumptions about vectorizing memory accesses throughout CUTLASS. It also matches various</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="comment">  BLAS conventions in which only the &quot;leading dimension&quot; or most significant stride of a rank=2</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;<span class="comment">  matrix is provided.</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;<span class="comment">  This does affect the ability of constructing arbitrary &quot;sparse&quot; 2-D matrices in memory where all</span></div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="comment">  stride elements are &gt; 1. This can be overcome by defining a custom mapping function and a</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="comment">  StorageRank of 3 or more.</span></div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="comment">  Examples:</span></div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="comment">  (These examples use helpers for matrix layouts defined in cutlass/matrix_traits.h)</span></div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;<span class="comment">  1. Column-major matrix may be represented as a rank=2 tensor:</span></div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;<span class="comment">    TensorRef&lt;float, 2, MatrixLayout::ColumnMajor&gt; A(ptr_A, make_Coord(ldm, 1));</span></div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="comment">  2. Row-major matrix may be represented as a rank=2 tensor:</span></div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;<span class="comment">    TensorRef&lt;float, 2, MatrixLayout::RowMajor&gt; B(ptr_A, ldm);</span></div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;<span class="comment">  3. An interleaved matrix may be represented as a rank=2 tensor:</span></div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;<span class="comment">    TensorRef&lt;int8_t, 2, MatrixLayout::ColumnMajorInterleaved&lt;32&gt; &gt; C;</span></div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;<span class="comment">  4. Defining a sparse matrix with arbitrary strides in each dimension</span></div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;<span class="comment">    struct ContiguousLayout {</span></div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;<span class="comment">      static int const kStorageRank = 3;</span></div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="comment">      CUTLASS_HOST_DEVICE</span></div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="comment">      Coord&lt;3&gt; operator()(MatrixCoord const &amp;coord) const {</span></div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="comment">          return make_Coord(coord.row(), coord.column(), 0);</span></div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="comment">      }</span></div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="comment">    };</span></div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="comment">    typedef TensorRef&lt;float, 2, ContiguousLayout&gt; ContiguousTensorRef;</span></div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;<span class="comment">    // Construct the TensorRef object from a pair of stride values</span></div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="comment">    ContiguousTensorRef D(ptr_D, make_Coord(row_stride, column_stride));</span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="comment">  5. A helper exists to define a TensorRef for a contiguous matrix whose layout</span></div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="comment">     is not known at compile time.</span></div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="comment">    MatrixLayout::Kind layout;   // Could be MatrixLayout::kRowMajor or MatrixLayout::kColumnMajor</span></div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="comment">    int ldm;                     // leading dimension</span></div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;<span class="comment">    ContiguousTensorRef E(ptr_E, ContiguousLayout::stride(layout, ldm));</span></div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;<span class="comment">*/</span></div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="keyword">typename</span> Storage_,</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <span class="keywordtype">int</span> Rank_,</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="keyword">typename</span> MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  <span class="keywordtype">int</span> StorageRank_ = MapFunc_::kStorageRank,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  <span class="keyword">typename</span> LongIndex_ = <span class="keywordtype">long</span> <span class="keywordtype">long</span></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;&gt;</div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html">  131</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> {</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">  134</a></span>&#160;  <span class="keyword">typedef</span> Storage_ <a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">  137</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> = Rank_;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">  140</a></span>&#160;  <span class="keyword">typedef</span> MapFunc_ <a class="code" href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">MapFunc</a>;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">  143</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> = StorageRank_;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">  146</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">  149</a></span>&#160;  <span class="keyword">typedef</span> LongIndex_ <a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">  152</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kRank&gt;</a> <a class="code" href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">TensorCoord</a>;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">  155</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">StorageCoord</a>;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">  159</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1&gt; <a class="code" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a>;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Storage&gt;::type</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    Rank_,</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    MapFunc_,</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;    StorageRank_,</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    Index_,</div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">  168</a></span>&#160;    LongIndex_&gt; <a class="code" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a>;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">  173</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> &gt; 0, <span class="stringliteral">&quot;Cannot define a zero-rank TensorRef&quot;</span>);</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  <span class="comment">// Definitions included for backwards compatibility - to be removed in next major release</span></div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <a class="code" href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">Coord_t</a>;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;</div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">  183</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">Rank</a> = <a class="code" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>* ptr_;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">StrideVector</a> stride_;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  <a class="code" href="structcutlass_1_1IdentityTensorMapFunc.html">MapFunc</a> coord_map_;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00204"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">  204</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">TensorRef</a>(<a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr = <span class="keyword">nullptr</span>): ptr_(ptr) {</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1; ++i) {</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;      stride_[i] = 1;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    }</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  }</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  <span class="comment">// Higher ranks are projected onto the fastest-changing rank.</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00213"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">  213</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">TensorRef</a>(<a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>* ptr, <a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> ldm) {</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;    ptr_ = ptr;</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1; ++i) {</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;      stride_[i] = ldm;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;    }</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;  }</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00222"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">  222</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">TensorRef</a>(<a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>* ptr, <a class="code" href="structcutlass_1_1Coord.html">StrideVector</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>) : ptr_(ptr), stride_(<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>) {</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;  }</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0">  229</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0">TensorRef</a>(<a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>* ptr, <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>) {</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <span class="comment">// Fastest-changing stride must be one</span></div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>.<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1) == 1) {</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;      ptr_ = ptr;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1; ++i) {</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;        stride_[i] = <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>[i];</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;      }</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;    }</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;    <span class="keywordflow">else</span> {</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;      <span class="comment">// Fastest-chaning stride must be 1.</span></div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a>();</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;    }</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;  }</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00245"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">  245</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">TensorRef</a>(</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Storage&gt;::type</a>,</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>,</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <a class="code" href="structcutlass_1_1IdentityTensorMapFunc.html">MapFunc</a>,</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a>,</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a>,</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a>&gt; <span class="keyword">const</span> &amp;ref</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;  ):</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    ptr_(ref.<a class="code" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">data</a>()) {</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1; ++i) {</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      stride_[i] = ref.stride(i);</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;    }</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;  }</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00262"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">  262</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">ConstTensorRef</a> <a class="code" href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">const_ref</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a>(*<span class="keyword">this</span>);</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;  }</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00268"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">  268</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a>(<a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>* ptr = <span class="keyword">nullptr</span>) {</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;    ptr_ = ptr;</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;  }</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">  274</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">reset</a>(<a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>* ptr, <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> <span class="keyword">const</span> &amp; <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>) {</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    <span class="comment">// Fastest-changing stride must be one</span></div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>.<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1) == 1) {</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;      ptr_ = ptr;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1; ++i) {</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;        stride_[i] = <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>[i];</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;      }</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;    }</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;    <span class="keywordflow">else</span> {</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      <span class="comment">// Fastest-changing stride must be 1 - this is an error.</span></div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a>();</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;    }</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;  }</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">  290</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">good</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    <span class="keywordflow">return</span> ptr_ != <span class="keyword">nullptr</span>;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;  }</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00296"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">  296</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> * <a class="code" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_; }</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00300"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">  300</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> ld;</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1; ++i) {</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;      ld[i] = stride_[i];</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;    }</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;    ld[<a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1] = 1;</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;    <span class="keywordflow">return</span> ld;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;  }</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00311"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">  311</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> <a class="code" href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">stride</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;    <span class="comment">// fastest-changing stride assumbed to be 1</span></div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;    <span class="keywordflow">if</span> (dim + 1 &gt;= <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a>) {</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      <span class="keywordflow">return</span> 1;</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;    }</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;    <span class="keywordflow">return</span> stride_.<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(dim);</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;  }</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00321"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">  321</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> <a class="code" href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">leading_dim</a>(<span class="keywordtype">int</span> idx = 0)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>(idx); }</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00325"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">  325</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> <a class="code" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;    <span class="keywordflow">return</span> coord_map_(coord);</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;  }</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00331"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">  331</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> <a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>().template dot&lt;LongIndex&gt;(<a class="code" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a>(coord));</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;  }</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00337"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">  337</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">at</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    <span class="keywordflow">return</span> ptr_[<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(coord)];</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;  }</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00343"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">  343</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">at</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> idx)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_[idx]; }</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00347"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">  347</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">operator[]</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;    <span class="keywordflow">return</span> ptr_[<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(coord)];</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;  }</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00353"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">  353</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">operator[]</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> idx)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_[idx]; }</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00357"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">  357</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp; <a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> delta) {</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    ptr_ += delta;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;  }</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00364"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">  364</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="code" href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">operator+</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> result(*<span class="keyword">this</span>);</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;    result.<a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;    <span class="keywordflow">return</span> result;</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;  }</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00372"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">  372</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;  }</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00379"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">  379</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="code" href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">operator-</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> result(*<span class="keyword">this</span>);</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;    result.<a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(-<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;    <span class="keywordflow">return</span> result;</div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;  }</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00387"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">  387</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">operator-=</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(-<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;  }</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;};</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;<span class="comment">// Partial specializations to handle degenerate cases.</span></div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;  <span class="keyword">typename</span> Storage_,</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;  <span class="keywordtype">int</span> Rank_,</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;  <span class="keyword">typename</span> MapFunc_,</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;  <span class="keyword">typename</span> Index_,</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;  <span class="keyword">typename</span> LongIndex_</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;&gt;</div><div class="line"><a name="l00412"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html">  412</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_&gt; {</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00415"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">  415</a></span>&#160;  <span class="keyword">typedef</span> Storage_ <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>;</div><div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;</div><div class="line"><a name="l00418"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#abff03af38d99413315824c476e9a7d78">  418</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a> = Rank_;</div><div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;</div><div class="line"><a name="l00421"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">  421</a></span>&#160;  <span class="keyword">typedef</span> MapFunc_ <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">MapFunc</a>;</div><div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;</div><div class="line"><a name="l00424"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9bae6c2fd5ac6c97c97786c89862c298">  424</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> = 1;</div><div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;</div><div class="line"><a name="l00427"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">  427</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a>;</div><div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;</div><div class="line"><a name="l00430"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">  430</a></span>&#160;  <span class="keyword">typedef</span> LongIndex_ <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a>;</div><div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;</div><div class="line"><a name="l00433"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">  433</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kRank&gt;</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">TensorCoord</a>;</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;</div><div class="line"><a name="l00436"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">  436</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kStorageRank&gt;</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">StorageCoord</a>;</div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;</div><div class="line"><a name="l00440"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_1_1StrideVector.html">  440</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> { };</div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;</div><div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;</div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Storage&gt;::type</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;    Rank_,</div><div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;    MapFunc_,</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a>,</div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;    Index_,</div><div class="line"><a name="l00449"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">  449</a></span>&#160;    LongIndex_&gt; <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">ConstTensorRef</a>;</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;  <span class="comment">// Definitions included for backwards compatibility - to be removed in next major release</span></div><div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;</div><div class="line"><a name="l00456"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031">  456</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031">Coord_t</a>;</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;</div><div class="line"><a name="l00459"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a233fba9abdbbd0fe3a2cc7465ea76a41">  459</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">Rank</a> = <a class="code" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>;</div><div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;</div><div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>* ptr_;</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;</div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">MapFunc</a> coord_map_;</div><div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;</div><div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;</div><div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;</div><div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00477"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa091e497277d0ba8a98c4ebf73c0cdba">  477</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa091e497277d0ba8a98c4ebf73c0cdba">TensorRef</a>(<a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> *ptr = <span class="keyword">nullptr</span>): ptr_(ptr) { }</div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;</div><div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00481"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a3464537a35ef7fbfc9349e5ce2233f1c">  481</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a3464537a35ef7fbfc9349e5ce2233f1c">TensorRef</a>(<a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>* ptr, <a class="code" href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">StrideVector</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>) : ptr_(ptr) {</div><div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;</div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;  }</div><div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00488"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeacb444d31783eafe27a9e8d8cab98f8">  488</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeacb444d31783eafe27a9e8d8cab98f8">TensorRef</a>(<a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>* ptr, <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>) {</div><div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;    <span class="comment">// Fastest-changing stride must be one</span></div><div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>.<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1) == 1) {</div><div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;      ptr_ = ptr;</div><div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;    }</div><div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;    <span class="keywordflow">else</span> {</div><div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;      <span class="comment">// Fastest-chaning stride must be 1.</span></div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a>();</div><div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;    }</div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;  }</div><div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;</div><div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00501"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af815dd66739801b10d43acc097e23636">  501</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af815dd66739801b10d43acc097e23636">TensorRef</a>(</div><div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;</div><div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;      <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Storage&gt;::type</a>,</div><div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">kRank</a>,</div><div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">MapFunc</a>,</div><div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a>,</div><div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a>,</div><div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a>&gt; <span class="keyword">const</span> &amp;ref</div><div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;  ):</div><div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;    ptr_(ref.<a class="code" href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">data</a>()) {</div><div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;  }</div><div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;</div><div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00515"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0a48de201c35cbc9d5e3b94fa597a617">  515</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">ConstTensorRef</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0a48de201c35cbc9d5e3b94fa597a617">const_ref</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">ConstTensorRef</a>(*<span class="keyword">this</span>);</div><div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;  }</div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;</div><div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00521"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a1043f0ef382179b8ecd9f4e710f6e106">  521</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a1043f0ef382179b8ecd9f4e710f6e106">reset</a>(<a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>* ptr = <span class="keyword">nullptr</span>) {</div><div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;    ptr_ = ptr;</div><div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;  }</div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00527"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6339a8ac88f9172acf0337d149b98cb4">  527</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6339a8ac88f9172acf0337d149b98cb4">reset</a>(<a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>* ptr, <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> <span class="keyword">const</span> &amp; <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>) {</div><div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;    <span class="comment">// Fastest-changing stride must be one</span></div><div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>.<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1) == 1) {</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;      ptr_ = ptr;</div><div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;    }</div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;    <span class="keywordflow">else</span> {</div><div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;      <span class="comment">// Fastest-changing stride must be 1 - this is an error.</span></div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">reset</a>();</div><div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;    }</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;  }</div><div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;</div><div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00540"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98">  540</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98">good</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;    <span class="keywordflow">return</span> ptr_ != <span class="keyword">nullptr</span>;</div><div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;  }</div><div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;</div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00546"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a67b25cc51ce867b073feead7b94e6aa3">  546</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a> * <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a67b25cc51ce867b073feead7b94e6aa3">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_; }</div><div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00550"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9">  550</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9">stride</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> ld;</div><div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;    ld[<a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">kStorageRank</a> - 1] = 1;</div><div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;    <span class="keywordflow">return</span> ld;</div><div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;  }</div><div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;</div><div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00558"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af83380ffc0e5949d40d1a5039a5ddc00">  558</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af83380ffc0e5949d40d1a5039a5ddc00">stride</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{</div><div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;    <span class="comment">// fastest-changing stride assumbed to be 1</span></div><div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;    <span class="keywordflow">return</span> 1;</div><div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;  }</div><div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;</div><div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00565"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6c580a451a36143d1eb0e409e7b13e33">  565</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">Index</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6c580a451a36143d1eb0e409e7b13e33">leading_dim</a>(<span class="keywordtype">int</span> idx = 0)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> 1; }</div><div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;</div><div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00569"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a215f63b5a1b3799654c5670ef108fcfb">  569</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a215f63b5a1b3799654c5670ef108fcfb">map</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span> &amp;coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;    <span class="keywordflow">return</span> coord_map_(coord);</div><div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;  }</div><div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;</div><div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00575"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a07c7f56e724cfbc844777e8ee9f616b5">  575</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a07c7f56e724cfbc844777e8ee9f616b5">offset</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>().template dot&lt;LongIndex&gt;(<a class="code" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a>(coord));</div><div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;  }</div><div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;</div><div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00581"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a597bb02594c918c50f0bdb0cb4ce74c8">  581</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a597bb02594c918c50f0bdb0cb4ce74c8">at</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;    <span class="keywordflow">return</span> ptr_[<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(coord)];</div><div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;  }</div><div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;</div><div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00587"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a92371a586e756734522a853bef74324d">  587</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a92371a586e756734522a853bef74324d">at</a>(<a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> idx)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_[idx]; }</div><div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;</div><div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00591"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a64a5e91e01555b8bfd22875543573d22">  591</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a64a5e91e01555b8bfd22875543573d22">operator[]</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;    <span class="keywordflow">return</span> ptr_[<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(coord)];</div><div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;  }</div><div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;</div><div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00597"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a57f132816e51bbdb4c807d57c067b619">  597</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">Storage</a>&amp; <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a57f132816e51bbdb4c807d57c067b619">operator[]</a>(<a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> idx)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> ptr_[idx]; }</div><div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;</div><div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00601"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a93ff0a9fda3e136a1674aeb82de050db">  601</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> &amp; <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a93ff0a9fda3e136a1674aeb82de050db">add_pointer_offset</a>(<a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">LongIndex</a> delta) {</div><div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;    ptr_ += delta;</div><div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;  }</div><div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;</div><div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00608"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ad054f14b5580c9480d671b8fc8ef016a">  608</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ad054f14b5580c9480d671b8fc8ef016a">operator+</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> result(*<span class="keyword">this</span>);</div><div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;    result.<a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;    <span class="keywordflow">return</span> result;</div><div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;  }</div><div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;</div><div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00616"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0753aeb57365a976bc0a88481af504cb">  616</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0753aeb57365a976bc0a88481af504cb">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;  }</div><div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;</div><div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00623"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#afde28cda18918d3e177d3e5024ed3dd4">  623</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#afde28cda18918d3e177d3e5024ed3dd4">operator-</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a> result(*<span class="keyword">this</span>);</div><div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;    result.<a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(-<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;    <span class="keywordflow">return</span> result;</div><div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;  }</div><div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;</div><div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00631"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a11964d045ac8e41c80026515adb03008">  631</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&amp; <a class="code" href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a11964d045ac8e41c80026515adb03008">operator-=</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(-<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;  }</div><div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;};</div><div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;</div><div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;</div><div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a6893c1a9057713560b46a9062b29b116"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6893c1a9057713560b46a9062b29b116">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::StorageCoord</a></div><div class="ttdeci">Coord&lt; kStorageRank &gt; StorageCoord</div><div class="ttdoc">Coordinate in storage n-D array. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:436</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a207a0dabf6c368fa1edcb32baa2110e3"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a207a0dabf6c368fa1edcb32baa2110e3">cutlass::TensorRef::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; operator[](LongIndex idx) const</div><div class="ttdoc">Returns a reference to the element at a given linear index. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:353</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_af815dd66739801b10d43acc097e23636"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af815dd66739801b10d43acc097e23636">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)</div><div class="ttdoc">Enables conversion from TensorRef of non-const type. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:501</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a758f24783e36ffc393b360d0b8640bc6"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a758f24783e36ffc393b360d0b8640bc6">cutlass::TensorRef::Coord_t</a></div><div class="ttdeci">TensorCoord Coord_t</div><div class="ttdoc">Coordinate in logical tensor space. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:173</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a93ff0a9fda3e136a1674aeb82de050db"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a93ff0a9fda3e136a1674aeb82de050db">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::add_pointer_offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef &amp; add_pointer_offset(LongIndex delta)</div><div class="ttdoc">Adds an offset to each pointer. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:601</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_ae1c80b524cd9491e2d499d703e1459f7"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#ae1c80b524cd9491e2d499d703e1459f7">cutlass::TensorRef::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage * data() const</div><div class="ttdoc">Returns the pointer to referenced data. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:296</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a6339a8ac88f9172acf0337d149b98cb4"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6339a8ac88f9172acf0337d149b98cb4">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::reset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void reset(Storage *ptr, StorageCoord const &amp;stride)</div><div class="ttdoc">Updates the pointer, stride, and location within a TensorRef. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:527</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a597bb02594c918c50f0bdb0cb4ce74c8"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a597bb02594c918c50f0bdb0cb4ce74c8">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; at(TensorCoord const &amp;coord) const</div><div class="ttdoc">Returns a reference to the element at a given Coord. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:581</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a7eff42a37e4dbee488bfa726f3f0df4f"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">cutlass::TensorRef::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; at(Coord&lt; Rank &gt; const &amp;coord) const</div><div class="ttdoc">Returns a reference to the element at a given Coord. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:121</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_aab0dafb81a462320e55e0dc4a5886478"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#aab0dafb81a462320e55e0dc4a5886478">cutlass::TensorRef::advance</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef &amp; advance(Coord&lt; Rank &gt; const &amp;b)</div><div class="ttdoc">Adds an offset to the pointer. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:135</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a22ac53a60e63a743613e732586ad0c66"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">cutlass::TensorRef::Rank</a></div><div class="ttdeci">static int const Rank</div><div class="ttdoc">Rank of tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:48</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_aa7b80d225c01c9dc12aafc515cf15842"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#aa7b80d225c01c9dc12aafc515cf15842">cutlass::TensorRef::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef operator+(Coord&lt; Rank &gt; const &amp;b) const</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:142</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_aa091e497277d0ba8a98c4ebf73c0cdba"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa091e497277d0ba8a98c4ebf73c0cdba">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(Storage *ptr=nullptr)</div><div class="ttdoc">Helper for 1-D memory. All higher ranks are projected onto the fastest changing rank. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:477</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html_ac3662947fa50251daf58240a9c798085"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">cutlass::platform::remove_const::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:377</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a429692d4ac03a3427fbd8fdfaac4ae31"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a429692d4ac03a3427fbd8fdfaac4ae31">cutlass::TensorRef::kRank</a></div><div class="ttdeci">static int const kRank</div><div class="ttdoc">Logical rank of tensor index space. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:137</div></div>
 <div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a604921388cb7ee18ddb8127b8ca2f7fd"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a604921388cb7ee18ddb8127b8ca2f7fd">cutlass::TensorRef::Storage</a></div><div class="ttdeci">Storage_ Storage</div><div class="ttdoc">Data type of individual access. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:45</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a3843ccfd1d097f25eff45dc159709938"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a3843ccfd1d097f25eff45dc159709938">cutlass::TensorRef::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef operator-(Coord&lt; Rank &gt; const &amp;b) const</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:146</div></div>
-<div class="ttc" id="platform_8h_html_abd31f291635329bc15292954f1f01d38"><div class="ttname"><a href="platform_8h.html#abd31f291635329bc15292954f1f01d38">__NV_STD_MAX</a></div><div class="ttdeci">#define __NV_STD_MAX(a, b)</div><div class="ttdoc">Select maximum(a, b) </div><div class="ttdef"><b>Definition:</b> platform.h:155</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a8e1c61910ffb49ec64930f66dd342b77"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a8e1c61910ffb49ec64930f66dd342b77">cutlass::TensorRef::leading_dim</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int leading_dim() const</div><div class="ttdoc">Returns the maximum stride element as the &amp;#39;leading dimension&amp;#39;. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:111</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a8e23c78658f45c6f197a1774cc85c5b7"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">cutlass::TensorRef::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage * data() const</div><div class="ttdoc">Returns the pointer to referenced data. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:99</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_ae48325312183ff61dbd312c64f31fcb8"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#ae48325312183ff61dbd312c64f31fcb8">cutlass::TensorRef::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(Storage *ptr, Coord&lt; Rank &gt; stride)</div><div class="ttdoc">Constructs from a pointer, size, and stride. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:72</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a6a2aa88ed77557c089a165da0df1e974"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a6a2aa88ed77557c089a165da0df1e974">cutlass::TensorRef::operator[]</a></div><div class="ttdeci">Storage &amp; operator[](Coord&lt; Rank &gt; const &amp;coord) const</div><div class="ttdoc">Element-wise accessor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:124</div></div>
-<div class="ttc" id="platform_8h_html_ab979d9d4b4923f7c54d6caa6e1a61936"><div class="ttname"><a href="platform_8h.html#ab979d9d4b4923f7c54d6caa6e1a61936">nullptr</a></div><div class="ttdeci">#define nullptr</div><div class="ttdoc">nullptr </div><div class="ttdef"><b>Definition:</b> platform.h:136</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a02ee5d16ed4ce4705a99bb16b2ae1ae8"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">cutlass::TensorRef::offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE long long offset(Coord&lt; Rank &gt; const &amp;coord) const</div><div class="ttdoc">Computes the offset of an index from the origin of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:115</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html"><div class="ttname"><a href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a></div><div class="ttdoc">Structure modeling a pointer and stride into a tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:42</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a7eb4444e2b3fce5a5ccde65a75df633c"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a7eb4444e2b3fce5a5ccde65a75df633c">cutlass::TensorRef::convert</a></div><div class="ttdeci">TensorRef&lt; T, Rank &gt; convert()</div><div class="ttdoc">Conversion function. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:83</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a7a1da27a46883eb68e3f8983670b784b"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a7a1da27a46883eb68e3f8983670b784b">cutlass::TensorRef::reset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void reset(Storage *ptr, StorageCoord const &amp;stride)</div><div class="ttdoc">Updates the pointer, stride, and location within a TensorRef. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:274</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a67b25cc51ce867b073feead7b94e6aa3"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a67b25cc51ce867b073feead7b94e6aa3">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage * data() const</div><div class="ttdoc">Returns the pointer to referenced data. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:546</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a7ec815838aed4e02dd96acb1000614c0"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a7ec815838aed4e02dd96acb1000614c0">cutlass::TensorRef::reset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void reset(Storage *ptr=nullptr)</div><div class="ttdoc">Updates only the pointer. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:268</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a57f132816e51bbdb4c807d57c067b619"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a57f132816e51bbdb4c807d57c067b619">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; operator[](LongIndex idx) const</div><div class="ttdoc">Returns a reference to the element at a given linear index. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:597</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_afe92be0a61fb8fc84426f4907faca6c1"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#afe92be0a61fb8fc84426f4907faca6c1">cutlass::TensorRef::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type, kRank, MapFunc, kStorageRank, Index, LongIndex &gt; const &amp;ref)</div><div class="ttdoc">Enables conversion from TensorRef of non-const type. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:245</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a0a4fd9ace579b46bc9d575b8adc6882f"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a0a4fd9ace579b46bc9d575b8adc6882f">cutlass::TensorRef::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef operator+(TensorCoord const &amp;b) const</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:364</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_ad0273300d26125278b6930b1e463ff29"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#ad0273300d26125278b6930b1e463ff29">cutlass::TensorRef::MapFunc</a></div><div class="ttdeci">MapFunc_ MapFunc</div><div class="ttdoc">Mapping function from logical coordinate to internal n-D array. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:140</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_ad327edfe1f8085632ff682d354922009"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">cutlass::TensorRef::Storage</a></div><div class="ttdeci">Storage_ Storage</div><div class="ttdoc">Data type of individual access. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:134</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_aa6956072f1231b79fe8925a78c4760b7"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#aa6956072f1231b79fe8925a78c4760b7">cutlass::TensorRef::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index stride(int dim) const</div><div class="ttdoc">Returns the stride of the tensor in the given dimension. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:311</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_af83380ffc0e5949d40d1a5039a5ddc00"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af83380ffc0e5949d40d1a5039a5ddc00">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index stride(int dim) const</div><div class="ttdoc">Returns the stride of the tensor in the given dimension. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:558</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a3464537a35ef7fbfc9349e5ce2233f1c"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a3464537a35ef7fbfc9349e5ce2233f1c">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(Storage *ptr, StrideVector const &amp;stride)</div><div class="ttdoc">Constructs from a single pointer and stride vector. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:481</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a11964d045ac8e41c80026515adb03008"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a11964d045ac8e41c80026515adb03008">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef &amp; operator-=(TensorCoord const &amp;b)</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:631</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_adb52dd6f9f68e7b8b67b8ddfb5c0021c"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">cutlass::TensorRef::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE StorageCoord stride() const</div><div class="ttdoc">Returns the stride of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:300</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a5f0363da1e0544f256438e066d3cc143"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">cutlass::TensorRef::add_pointer_offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef &amp; add_pointer_offset(LongIndex delta)</div><div class="ttdoc">Adds an offset to each pointer. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:357</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a1043f0ef382179b8ecd9f4e710f6e106"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a1043f0ef382179b8ecd9f4e710f6e106">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::reset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void reset(Storage *ptr=nullptr)</div><div class="ttdoc">Updates only the pointer. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:521</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a2beda7a1946bde2858e730bece21b890"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">cutlass::TensorRef::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:146</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_ada832ce3a57aaf4919b1ed89192f1fa6"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#ada832ce3a57aaf4919b1ed89192f1fa6">cutlass::TensorRef::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; operator[](TensorCoord const &amp;coord) const</div><div class="ttdoc">Returns a reference to the element at a given Coord. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:347</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a0c95903f2b959003534cd2d78d4b9496"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0c95903f2b959003534cd2d78d4b9496">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::ConstTensorRef</a></div><div class="ttdeci">TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type const, Rank_, MapFunc_, kStorageRank, Index_, LongIndex_ &gt; ConstTensorRef</div><div class="ttdoc">Tensor reference to of constant value. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:449</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a92371a586e756734522a853bef74324d"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a92371a586e756734522a853bef74324d">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; at(LongIndex idx) const</div><div class="ttdoc">Returns a reference to the element at a given linear index. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:587</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_afde28cda18918d3e177d3e5024ed3dd4"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#afde28cda18918d3e177d3e5024ed3dd4">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef operator-(TensorCoord const &amp;b) const</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:623</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a48b9b4ad9034f6cf2b7c2ee479aea135"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a48b9b4ad9034f6cf2b7c2ee479aea135">cutlass::TensorRef::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(Storage *ptr, Index ldm)</div><div class="ttdoc">Helper to construct from a pointer and single stride element for 2-D pitch linear memory...</div><div class="ttdef"><b>Definition:</b> tensor_ref.h:213</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a07dfe328d4a8316e79e9acde50582360"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">cutlass::TensorRef::map</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE StorageCoord map(TensorCoord const &amp;coord) const</div><div class="ttdoc">Maps a logical coordinate to an n-D array in memory. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:325</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_ab0cf071be50423dece4e931878573a1c"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#ab0cf071be50423dece4e931878573a1c">cutlass::TensorRef::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; at(LongIndex idx) const</div><div class="ttdoc">Returns a reference to the element at a given linear index. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:343</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a42ca6a39ab0e44296fed71a77c57b7b1"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">cutlass::TensorRef::LongIndex</a></div><div class="ttdeci">LongIndex_ LongIndex</div><div class="ttdoc">Typically, strides in memory can be very large. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:149</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a455a2df539b53086699c210d06df1c5d"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a455a2df539b53086699c210d06df1c5d">cutlass::TensorRef::StorageCoord</a></div><div class="ttdeci">Coord&lt; kStorageRank &gt; StorageCoord</div><div class="ttdoc">Coordinate in storage n-D array. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:155</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_ab5dbedeff1ae3d2936b6ce76023a18f7"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ab5dbedeff1ae3d2936b6ce76023a18f7">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Storage</a></div><div class="ttdeci">Storage_ Storage</div><div class="ttdoc">Data type of individual access. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:415</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_ad054f14b5580c9480d671b8fc8ef016a"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ad054f14b5580c9480d671b8fc8ef016a">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef operator+(TensorCoord const &amp;b) const</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:608</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a5a667a48c64fb916c31802b73b769765"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a5a667a48c64fb916c31802b73b769765">cutlass::TensorRef::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(Storage *ptr=nullptr)</div><div class="ttdoc">Helper for 1-D memory. All higher ranks are projected onto the fastest changing rank. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:204</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a727d9c25d6df0aa9e795123b638b9306"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a727d9c25d6df0aa9e795123b638b9306">cutlass::TensorRef::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef &amp; operator+=(TensorCoord const &amp;b)</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:372</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a8281d11677512d6e229504ab4babad17"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a8281d11677512d6e229504ab4babad17">cutlass::TensorRef::ConstTensorRef</a></div><div class="ttdeci">TensorRef&lt; typename platform::remove_const&lt; Storage &gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; ConstTensorRef</div><div class="ttdoc">Tensor reference to of constant value. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:168</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html"><div class="ttname"><a href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a></div><div class="ttdef"><b>Definition:</b> tensor_ref.h:131</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_af5615a41f73259e579a122c86e08d6f9"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#af5615a41f73259e579a122c86e08d6f9">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE StorageCoord stride() const</div><div class="ttdoc">Returns the stride of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:550</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a35b7e1fc59298e0f06f484652d62fd65"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a35b7e1fc59298e0f06f484652d62fd65">cutlass::TensorRef::TensorCoord</a></div><div class="ttdeci">Coord&lt; kRank &gt; TensorCoord</div><div class="ttdoc">Coordinate in logical tensor space. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:152</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a425ff3d894ed1153eee79b1944fa5ed2"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">cutlass::TensorRef::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdoc">Rank of internal storage. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:143</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a2088b39881deef375af08511bca1e90a"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a2088b39881deef375af08511bca1e90a">cutlass::TensorRef::Rank</a></div><div class="ttdeci">static int const Rank</div><div class="ttdoc">Logical rank of tensor index space. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:183</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a705c22cb328c4dc9365c2f370ece2031"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a705c22cb328c4dc9365c2f370ece2031">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Coord_t</a></div><div class="ttdeci">TensorCoord Coord_t</div><div class="ttdoc">Coordinate in logical tensor space. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:456</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_aeacb444d31783eafe27a9e8d8cab98f8"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeacb444d31783eafe27a9e8d8cab98f8">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(Storage *ptr, StorageCoord const &amp;stride)</div><div class="ttdef"><b>Definition:</b> tensor_ref.h:488</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a0c049e523ee0fc98769ed8cd2d026780"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">cutlass::TensorRef::good</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool good() const</div><div class="ttdoc">Returns true if the TensorRef may be safely accessed. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:95</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank &gt;</a></div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a8e1cfab3a220175dad58239c764a5d98"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a8e1cfab3a220175dad58239c764a5d98">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::good</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool good() const</div><div class="ttdoc">Returns true if the TensorRef may be safely accessed. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:540</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a6c580a451a36143d1eb0e409e7b13e33"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a6c580a451a36143d1eb0e409e7b13e33">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::leading_dim</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index leading_dim(int idx=0) const</div><div class="ttdoc">Returns the maximum stride element as the &amp;#39;leading dimension&amp;#39;. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:565</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a9eff24a3b74b68d11839b92324613c93"><div class="ttname"><a href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; at()</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:240</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a64a5e91e01555b8bfd22875543573d22"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a64a5e91e01555b8bfd22875543573d22">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; operator[](TensorCoord const &amp;coord) const</div><div class="ttdoc">Returns a reference to the element at a given Coord. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:591</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a0753aeb57365a976bc0a88481af504cb"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0753aeb57365a976bc0a88481af504cb">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef &amp; operator+=(TensorCoord const &amp;b)</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:616</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a4da903ecbeaaf80c35084e8779e920a1"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">cutlass::TensorRef::offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE LongIndex offset(TensorCoord const &amp;coord) const</div><div class="ttdoc">Computes the offset of an index from the origin of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:331</div></div>
+<div class="ttc" id="structcutlass_1_1IdentityTensorMapFunc_html_a3922130841c34d3ce8c112ee6fae4ca1"><div class="ttname"><a href="structcutlass_1_1IdentityTensorMapFunc.html#a3922130841c34d3ce8c112ee6fae4ca1">cutlass::IdentityTensorMapFunc::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; Rank &gt; operator()(Coord&lt; Rank &gt; const &amp;coord) const</div><div class="ttdef"><b>Definition:</b> tensor_ref.h:44</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a9ad2f8da5e7e6b616dd05f792032699b"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a9ad2f8da5e7e6b616dd05f792032699b">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::LongIndex</a></div><div class="ttdeci">LongIndex_ LongIndex</div><div class="ttdoc">Typically, strides in memory can be very large. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:430</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:49</div></div>
 <div class="ttc" id="vector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div><div class="ttdoc">Defines a 1D vector of elements held in the registers of each thread. </div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_abefe392e81da2c09cb127f963ae90674"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#abefe392e81da2c09cb127f963ae90674">cutlass::TensorRef::reset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void reset(Storage *ptr=nullptr, Coord&lt; Rank &gt; stride=Coord&lt; Rank &gt;(0))</div><div class="ttdoc">Updates the pointer, stride, and location within a TensorRef. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:76</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_ad10b59430927a354fcd874d2d32f1bd8"><div class="ttname"><a href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int &amp; at()</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:185</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a89380141d25528c4c7ba6c365b96a878"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">cutlass::TensorRef::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; Rank &gt; const  &amp; stride() const</div><div class="ttdoc">Returns the stride of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:103</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a07c7f56e724cfbc844777e8ee9f616b5"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a07c7f56e724cfbc844777e8ee9f616b5">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE LongIndex offset(TensorCoord const &amp;coord) const</div><div class="ttdoc">Computes the offset of an index from the origin of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:575</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a4169a1344897c2c87822ee49d5e0002f"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a4169a1344897c2c87822ee49d5e0002f">cutlass::TensorRef::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; at(TensorCoord const &amp;coord) const</div><div class="ttdoc">Returns a reference to the element at a given Coord. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:337</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a0a48de201c35cbc9d5e3b94fa597a617"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a0a48de201c35cbc9d5e3b94fa597a617">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::const_ref</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstTensorRef const_ref() const</div><div class="ttdoc">Returns a reference to constant-valued tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:515</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_aa72857a51fafb4764ef338aea16ddfa3"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aa72857a51fafb4764ef338aea16ddfa3">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:427</div></div>
+<div class="ttc" id="structcutlass_1_1IdentityTensorMapFunc_html_ac609498e7fe858b4fb3791d1039438f4"><div class="ttname"><a href="structcutlass_1_1IdentityTensorMapFunc.html#ac609498e7fe858b4fb3791d1039438f4">cutlass::IdentityTensorMapFunc::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdef"><b>Definition:</b> tensor_ref.h:42</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a6ab468e38773f5a971a8428673fb5e47"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a6ab468e38773f5a971a8428673fb5e47">cutlass::TensorRef::const_ref</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstTensorRef const_ref() const</div><div class="ttdoc">Returns a reference to constant-valued tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:262</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_a215f63b5a1b3799654c5670ef108fcfb"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#a215f63b5a1b3799654c5670ef108fcfb">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::map</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE StorageCoord map(TensorCoord const &amp;coord) const</div><div class="ttdoc">Maps a logical coordinate to an n-D array in memory. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:569</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_aeca439296c8446741ba84b78f5a601e0"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#aeca439296c8446741ba84b78f5a601e0">cutlass::TensorRef::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(Storage *ptr, StorageCoord const &amp;stride)</div><div class="ttdef"><b>Definition:</b> tensor_ref.h:229</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_ac19ed34103d115d99e835ad9c1164a2f"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#ac19ed34103d115d99e835ad9c1164a2f">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::MapFunc</a></div><div class="ttdeci">MapFunc_ MapFunc</div><div class="ttdoc">Mapping function from logical coordinate to internal n-D array. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:421</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_afe4fc6fa539f36b2764707d50351905c"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#afe4fc6fa539f36b2764707d50351905c">cutlass::TensorRef::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef(Storage *ptr, StrideVector const &amp;stride)</div><div class="ttdoc">Constructs from a single pointer and stride vector. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:222</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a07c4b1ace7c8799537553b54cfe0a059"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a07c4b1ace7c8799537553b54cfe0a059">cutlass::TensorRef::StrideVector</a></div><div class="ttdeci">Coord&lt; kStorageRank - 1 &gt; StrideVector</div><div class="ttdef"><b>Definition:</b> tensor_ref.h:159</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4_html_aeca2ec193d8a07dc9073c6b199215c88"><div class="ttname"><a href="classcutlass_1_1TensorRef_3_01Storage___00_01Rank___00_01MapFunc___00_011_00_01Index___00_01LongIndex___01_4.html#aeca2ec193d8a07dc9073c6b199215c88">cutlass::TensorRef&lt; Storage_, Rank_, MapFunc_, 1, Index_, LongIndex_ &gt;::TensorCoord</a></div><div class="ttdeci">Coord&lt; kRank &gt; TensorCoord</div><div class="ttdoc">Coordinate in logical tensor space. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:433</div></div>
 <div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a5702dea703104ab431c098c7b039c215"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a5702dea703104ab431c098c7b039c215">cutlass::TensorRef::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; at(int idx) const</div><div class="ttdoc">Returns a reference to the element at a given Coord. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:128</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a54f6edc293b0b8ac97f02e8ab951c478"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a54f6edc293b0b8ac97f02e8ab951c478">cutlass::TensorRef::TensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef()</div><div class="ttdoc">Default ctor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:68</div></div>
-<div class="ttc" id="structcutlass_1_1Extent_html"><div class="ttname"><a href="structcutlass_1_1Extent.html">cutlass::Extent</a></div><div class="ttdoc">Returns the extent of a scalar or vector. </div><div class="ttdef"><b>Definition:</b> vector.h:161</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a4a56b323aed2a3b2c843c276b68378fa"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a4a56b323aed2a3b2c843c276b68378fa">cutlass::TensorRef::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef operator-(TensorCoord const &amp;b) const</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:379</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a2dbee889626b4764d30e9058ef3a7ae8"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a2dbee889626b4764d30e9058ef3a7ae8">cutlass::TensorRef::good</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool good() const</div><div class="ttdoc">Returns true if the TensorRef may be safely accessed. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:290</div></div>
+<div class="ttc" id="structcutlass_1_1IdentityTensorMapFunc_html"><div class="ttname"><a href="structcutlass_1_1IdentityTensorMapFunc.html">cutlass::IdentityTensorMapFunc</a></div><div class="ttdef"><b>Definition:</b> tensor_ref.h:41</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_aa60b92372db1da1d2aa997d6a03e01ca"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#aa60b92372db1da1d2aa997d6a03e01ca">cutlass::TensorRef::leading_dim</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index leading_dim(int idx=0) const</div><div class="ttdoc">Returns the maximum stride element as the &amp;#39;leading dimension&amp;#39;. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:321</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a5b5af26da32278d19c27c0d5a4a18890"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a5b5af26da32278d19c27c0d5a4a18890">cutlass::TensorRef::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef &amp; operator-=(TensorCoord const &amp;b)</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:387</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/tensor__ref__collection_8h.html b/docs/tensor__ref__collection_8h.html
new file mode 100644
index 000000000..24b9b84cd
--- /dev/null
+++ b/docs/tensor__ref__collection_8h.html
@@ -0,0 +1,115 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: tensor_ref_collection.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">tensor_ref_collection.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Introduces TensorRefCollection concept and defines TensorRefBatch and TensorRefArray.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="tensor__ref_8h_source.html">cutlass/tensor_ref.h</a>&quot;</code><br />
+</div>
+<p><a href="tensor__ref__collection_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constant iterator over tensors implied by <a class="el" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a>.  <a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;::ConstIterator</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">TensorRefIterator over <a class="el" href="classcutlass_1_1TensorRef.html">TensorRef</a> objects in <a class="el" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a>.  <a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tensor__ref__collection_8h_source.html b/docs/tensor__ref__collection_8h_source.html
new file mode 100644
index 000000000..00649cd74
--- /dev/null
+++ b/docs/tensor__ref__collection_8h_source.html
@@ -0,0 +1,146 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: tensor_ref_collection.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">tensor_ref_collection.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="tensor__ref__collection_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tensor__ref_8h.html">cutlass/tensor_ref.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment">// TensorRefCollection is a concept for storing a logical collection of TensorRef objects. Classes</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="comment">// satisfying the TensorRefCollection concept must support the following:</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="comment">//   // Define storage type</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="comment">//   typedef typename TensorRefCollection::Storage Storage;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="comment">//   // Define a type for offsets in memory</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="comment">//   typedef typename TensorRefCollection::LongIndex LongIndex;</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="comment">//   // Define a ConstIterator type satisfying TensorRefIterator</span></div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="comment">//   typedef typename TensorRefCollection::ConstIterator TensorRefIterator;</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="comment">//   // Implement a begin() method.</span></div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="comment">//   TensorRefIterator iterator = collection.begin();</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="comment">// TensorRefIterator is a concept for accessing an element in a TensorRefCollection. Classes</span></div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="comment">// satisfying the TensorRefIterator concept must support the following:</span></div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment">//   // Define a TensorRef type accessed by the iterator</span></div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="comment">//   typedef typename TensorRefIterator::TensorRef TensorRef;</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="comment">//   // Access the TensorRef</span></div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;<span class="comment">//   TensorRef ref = *iterator;</span></div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;<span class="comment">//   // Pre-increment and post-increment</span></div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;<span class="comment">//   ++iterator;</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="comment">//   iterator++;</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="comment">//   // Pre-decrement and post-decrement</span></div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;<span class="comment">//   --iterator;</span></div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="comment">//   iterator--;</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <span class="keyword">typename</span> Storage_,</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  <span class="keywordtype">int</span> Rank_,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  <span class="keyword">typename</span> MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  <span class="keywordtype">int</span> StorageRank_ = MapFunc_::kStorageRank,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  <span class="keyword">typename</span> LongIndex_ = <span class="keywordtype">long</span> <span class="keywordtype">long</span></div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;&gt;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html">   88</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a>: </div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a>&lt;Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt; {</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">   96</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef&lt;Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt;</a> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a>;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#aa86a59779c0830e8cf82066853dc1089">   99</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Base::Storage <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#aa86a59779c0830e8cf82066853dc1089">Storage</a>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#ab12d9d196122dc3075185ab239a27fb4">  102</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#ab12d9d196122dc3075185ab239a27fb4">Index</a>;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#aa3df5b7337d41d8f96717ea73bf3e24e">  105</a></span>&#160;  <span class="keyword">typedef</span> LongIndex_ <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#aa3df5b7337d41d8f96717ea73bf3e24e">LongIndex</a>;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#a9d07d96c2eccba10c3a9e4bef58d4e01">  108</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;kRank&gt;</a> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a9d07d96c2eccba10c3a9e4bef58d4e01">TensorCoord</a>;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">  111</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a>;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">  114</a></span>&#160;  <span class="keyword">class </span><a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> {</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  <span class="keyword">public</span>:</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">  117</a></span>&#160;    <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">Base</a> <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">TensorRef</a>;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="keyword">private</span>:</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a> <span class="keyword">const</span> &amp;ref_;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> offset_;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <span class="keyword">public</span>:</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed">  131</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed">ConstIterator</a>(</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html">TensorRefBatchStrided</a> <span class="keyword">const</span> &amp;ref, </div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      <a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> <a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a> = 0): ref_(ref), offset_(<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>) { }</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">  137</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">TensorRef</a> *<a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">operator</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">TensorRef</a> ref(ref_);</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      ref.add_pointer_offset(offset_);</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <span class="keywordflow">return</span> ref;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;    }</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00145"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a3481d6f41defd25ab574bb19ee5fe424">  145</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a3481d6f41defd25ab574bb19ee5fe424">operator++</a>() {</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      offset_ += ref_.<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    }</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00152"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#aca860ff7f125e02f35c7dc174e84708d">  152</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#aca860ff7f125e02f35c7dc174e84708d">operator++</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      offset_ += ref_.<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a>;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    }</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a1d48f4fea3fa85a7bf1b26b421387afd">  160</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a1d48f4fea3fa85a7bf1b26b421387afd">operator+</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx) {</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed">ConstIterator</a>(ref, offset_ + ref_.<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a> * idx);</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    }</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab07a5d1a4ec6d96ec53e868b3a6d7cae">  166</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab07a5d1a4ec6d96ec53e868b3a6d7cae">operator+=</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx) {</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;      offset_ += ref_.<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a> * idx;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    }</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad5290f0e7814892cb4fff55e9518562b">  173</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad5290f0e7814892cb4fff55e9518562b">operator--</a>() {</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;      offset_ -= ref_.<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a>;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    }</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00180"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a09909fbe2e4365b5f34ddb61658f27b3">  180</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a09909fbe2e4365b5f34ddb61658f27b3">operator--</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      offset_ -= ref_.<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a>;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    }</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad1d8099e8d63b6d88c53738ec68a7589">  188</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad1d8099e8d63b6d88c53738ec68a7589">operator-</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx) {</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed">ConstIterator</a>(ref_, offset_ - ref_.<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a> * idx);</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    }</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ac4018b51e78842fb252d6917738fa571">  194</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ac4018b51e78842fb252d6917738fa571">operator-=</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx) {</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      offset_ -= ref_.<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a> * idx;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    }</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab92bc090d6753ff5e17676ba85a1e478">  201</a></span>&#160;    Stride <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab92bc090d6753ff5e17676ba85a1e478">operator-</a>(<a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <span class="keyword">const</span> &amp;it) {</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      <span class="keywordflow">return</span> offset_ - it.offset_;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;    }</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;  };</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div><div class="line"><a name="l00211"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">  211</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a>;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;  <span class="comment">// Default ctor</span></div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#aa5d7e9a4589d7dacc5d69ca3c70ecc2b">  219</a></span>&#160;  <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#aa5d7e9a4589d7dacc5d69ca3c70ecc2b">TensorRefBatchStrided</a>(): <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a>(0) { }</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;  <span class="comment">// Constructs form a tensor reference and </span></div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00223"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#abc2ddccdb742f95438b214e0a3a14620">  223</a></span>&#160;  <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#abc2ddccdb742f95438b214e0a3a14620">TensorRefBatchStrided</a>(<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a> <span class="keyword">const</span> &amp;ref, <a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> _tensor_stride = 0): </div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a>(ref), </div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a>(_tensor_stride) { }</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00229"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c">  229</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">LongIndex</a> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c">get_pointer_offset</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx)<span class="keyword"> const </span>{</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <span class="keywordflow">return</span> idx * <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">tensor_stride</a>;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;  }</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;  <span class="comment">// Returns a reference</span></div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00235"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#aac4b013050925c1e2db4019140e82602">  235</a></span>&#160;  <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#aac4b013050925c1e2db4019140e82602">at</a>(<a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> idx)<span class="keyword"> const </span>{</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;    <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">TensorRef</a> ref(*<span class="keyword">this</span>);</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;    ref.add_pointer_offset(<a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c">get_pointer_offset</a>(idx));</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    <span class="keywordflow">return</span> ref;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;  }</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00243"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefBatchStrided.html#a4f4a2f860cc10688ee27cc9ce1df1015">  243</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="structcutlass_1_1TensorRefBatchStrided.html#a4f4a2f860cc10688ee27cc9ce1df1015">begin</a>() {</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">ConstIterator</a>(*<span class="keyword">this</span>);</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;  }</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;};</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;  <span class="keyword">typename</span> Storage_,</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;  <span class="keywordtype">int</span> Rank_,</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;  <span class="keyword">typename</span> MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;,</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;  <span class="keywordtype">int</span> StorageRank_ = MapFunc_::kStorageRank,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;  <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;  <span class="keyword">typename</span> LongIndex_ = <span class="keywordtype">long</span> <span class="keywordtype">long</span></div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;&gt;</div><div class="line"><a name="l00272"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html">  272</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a> {</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;</div><div class="line"><a name="l00278"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">  278</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef&lt;Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt;</a> <a class="code" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a>;</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;</div><div class="line"><a name="l00281"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">  281</a></span>&#160;  <span class="keyword">typedef</span> Storage_ <a class="code" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a>;</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div><div class="line"><a name="l00284"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">  284</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a>;</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;</div><div class="line"><a name="l00287"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0">  287</a></span>&#160;  <span class="keyword">typedef</span> LongIndex_ <a class="code" href="structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0">LongIndex</a>;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00290"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">  290</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> = <a class="code" href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">TensorRef::kStorageRank</a>;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;</div><div class="line"><a name="l00293"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">  293</a></span>&#160;  <span class="keyword">class </span><a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> {</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;  <span class="keyword">public</span>:</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;</div><div class="line"><a name="l00297"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">  297</a></span>&#160;    <span class="keyword">typedef</span> Base <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">TensorRef</a>;</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;  <span class="keyword">private</span>:</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;    <a class="code" href="structcutlass_1_1TensorRefArray.html">TensorRefArray</a> <span class="keyword">const</span> &amp;ref_;</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;    <span class="keywordtype">int</span> idx_;</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;  <span class="keyword">public</span>:</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00310"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541">  310</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541">ConstIterator</a>(<a class="code" href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">TensorArrayRef</a> <span class="keyword">const</span> &amp;ref, <span class="keywordtype">int</span> idx = 0): ref_(ref), idx_(idx) { }</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00314"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">  314</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">TensorRef</a> *<a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">operator</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;      <span class="keywordflow">return</span> ref_.reference(idx_);</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;    }</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00320"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a8ce80124ab0f4ab9981f1a4d64d976a5">  320</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a8ce80124ab0f4ab9981f1a4d64d976a5">operator++</a>() {</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;      ++idx_;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;    }</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00327"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a051f34d90c0680dc5f4e4e1c4d79e929">  327</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a051f34d90c0680dc5f4e4e1c4d79e929">operator++</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;      <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;      idx_ ++;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;    }</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00334"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a9fcd43018e60f12cb328859c76ec7891">  334</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a9fcd43018e60f12cb328859c76ec7891">operator+</a>(<a class="code" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx) {</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541">ConstIterator</a>(ref_, idx_ + idx);</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;    }</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00339"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a22b87d281057c8e03b80db7046c54dd8">  339</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a22b87d281057c8e03b80db7046c54dd8">operator+=</a>(<a class="code" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx) {</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;      idx_ += idx;</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;    }</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00345"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a0f395558e2c589ac48179447a23b59d8">  345</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a0f395558e2c589ac48179447a23b59d8">operator--</a>() {</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;      --idx_;</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;    }</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00352"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ac9019febbc8b6bfea06ac4d23d253d57">  352</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ac9019febbc8b6bfea06ac4d23d253d57">operator--</a>(<span class="keywordtype">int</span>) {</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;      <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> ret(*<span class="keyword">this</span>);</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;      --idx_;</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;      <span class="keywordflow">return</span> ret;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;    }</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00359"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ae3561f863072cd7be7dcdee2cb5cc1f0">  359</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> &amp;<a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ae3561f863072cd7be7dcdee2cb5cc1f0">operator-=</a>(<a class="code" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx) {</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;      idx_ -= idx;</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;      <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;    }</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00365"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a143ec893406d930aa4c5aa860052197e">  365</a></span>&#160;    <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a143ec893406d930aa4c5aa860052197e">operator-</a>(<a class="code" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx) {</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541">ConstIterator</a>(ref_, idx_ + idx);</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;    }</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;  };</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;</div><div class="line"><a name="l00375"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e">  375</a></span>&#160;  <a class="code" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a> **<a class="code" href="structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e">pointers</a>;</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div><div class="line"><a name="l00378"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be">  378</a></span>&#160;  <a class="code" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> *<a class="code" href="structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be">strides</a>[<a class="code" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> - 1];</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;  <span class="comment">// Default ctor</span></div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00386"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">  386</a></span>&#160;  <a class="code" href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">TensorArrayRef</a>() { }</div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;  <span class="comment">// Construct from pointers to arrays to strides</span></div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00390"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#aea35239326dcb23c3c6a18e7b3f92091">  390</a></span>&#160;  <a class="code" href="structcutlass_1_1TensorRefArray.html#aea35239326dcb23c3c6a18e7b3f92091">TensorArrayRef</a>(</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;    <a class="code" href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">Storage</a> **_pointers,</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;    <a class="code" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> _strides[<a class="code" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> - 1]): <a class="code" href="structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e">pointers</a>(_pointers) { </div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;    <span class="comment">// Copy pointers to strides arrays</span></div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> - 1; ++i) {</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;      <a class="code" href="structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be">strides</a>[i] = _strides[i];</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;    }</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;  }</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;  <span class="comment">// Returns a TensorRef at the given index in the collection</span></div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00402"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#a2a95fd42d48c550a45f340b04f9dfe3d">  402</a></span>&#160;  <a class="code" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a> <a class="code" href="structcutlass_1_1TensorRefArray.html#a2a95fd42d48c550a45f340b04f9dfe3d">at</a>(<a class="code" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a> idx)<span class="keyword"> const </span>{</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&lt;<a class="code" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> - 1, <a class="code" href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">Index</a>&gt; stride;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; <a class="code" href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">kStorageRank</a> - 1; ++i) {</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;      stride[i] = stride_[idx][i];</div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;    }</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">TensorRef</a>(<a class="code" href="structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e">pointers</a>[idx], stride);</div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;  }</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;</div><div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00413"></a><span class="lineno"><a class="line" href="structcutlass_1_1TensorRefArray.html#a6b0f0d9cef4a2f3f4a8bf6c192a282db">  413</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a> <a class="code" href="structcutlass_1_1TensorRefArray.html#a6b0f0d9cef4a2f3f4a8bf6c192a282db">begin</a>() {</div><div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">ConstIterator</a>(*<span class="keyword">this</span>);</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;  }</div><div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;};</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;</div><div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;</div><div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html">cutlass::TensorRefBatchStrided::ConstIterator</a></div><div class="ttdoc">Constant iterator over tensors implied by TensorRefBatchStrided. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:114</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_ad5290f0e7814892cb4fff55e9518562b"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad5290f0e7814892cb4fff55e9518562b">cutlass::TensorRefBatchStrided::ConstIterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator--()</div><div class="ttdoc">Moves to the previous tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:173</div></div>
+<div class="ttc" id="tensor__ref_8h_html"><div class="ttname"><a href="tensor__ref_8h.html">tensor_ref.h</a></div><div class="ttdoc">Defines a structure containing strides, bounds, and a pointer to tensor data. </div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_a0f395558e2c589ac48179447a23b59d8"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a0f395558e2c589ac48179447a23b59d8">cutlass::TensorRefArray::ConstIterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator--()</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:345</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_a76228819a72b8ed341e680ba84a960be"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#a76228819a72b8ed341e680ba84a960be">cutlass::TensorRefArray::strides</a></div><div class="ttdeci">Index * strides[kStorageRank - 1]</div><div class="ttdoc">Array of strides. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:378</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_ab6a6ed8af1a4b3da33e840409c0a72d8"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#ab6a6ed8af1a4b3da33e840409c0a72d8">cutlass::TensorRefArray::Storage</a></div><div class="ttdeci">Storage_ Storage</div><div class="ttdoc">Element pointed to by the TensorRef. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:281</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html">cutlass::TensorRefArray</a></div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:272</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_a131bdcf213e3d46672c9b3b34d6bf243"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#a131bdcf213e3d46672c9b3b34d6bf243">cutlass::TensorRefArray::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdoc">Rank of the stride vector. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:290</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_aa86a59779c0830e8cf82066853dc1089"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#aa86a59779c0830e8cf82066853dc1089">cutlass::TensorRefBatchStrided::Storage</a></div><div class="ttdeci">Base::Storage Storage</div><div class="ttdoc">Storage type. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:99</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_ae3561f863072cd7be7dcdee2cb5cc1f0"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ae3561f863072cd7be7dcdee2cb5cc1f0">cutlass::TensorRefArray::ConstIterator::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator-=(Index idx)</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:359</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_a6220549b72ed8451dbf76466b50a96c0"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#a6220549b72ed8451dbf76466b50a96c0">cutlass::TensorRefArray::LongIndex</a></div><div class="ttdeci">LongIndex_ LongIndex</div><div class="ttdoc">Typically, strides in memory can be very large. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:287</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_a4f4a2f860cc10688ee27cc9ce1df1015"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#a4f4a2f860cc10688ee27cc9ce1df1015">cutlass::TensorRefBatchStrided::begin</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator begin()</div><div class="ttdoc">Returns an iterator. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:243</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_a27a1e93508bb9c602028cabc3431815f"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#a27a1e93508bb9c602028cabc3431815f">cutlass::TensorRefBatchStrided::tensor_stride</a></div><div class="ttdeci">LongIndex tensor_stride</div><div class="ttdoc">Stride between tensors. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:211</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_aca860ff7f125e02f35c7dc174e84708d"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#aca860ff7f125e02f35c7dc174e84708d">cutlass::TensorRefBatchStrided::ConstIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator++(int)</div><div class="ttdoc">Advances the iterator to point to the next tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:152</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_a0d5f100b9b87f881e7ecaced63bce9dd"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#a0d5f100b9b87f881e7ecaced63bce9dd">cutlass::TensorRefBatchStrided::TensorRef</a></div><div class="ttdeci">Base TensorRef</div><div class="ttdoc">Tensor reference implied by the TensorRefBatchStrided. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:111</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_ab0ea61995928c0935ec03c260463ef15"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab0ea61995928c0935ec03c260463ef15">cutlass::TensorRefBatchStrided::ConstIterator::operator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef * operator() const</div><div class="ttdoc">Obtains a TensorRef pointed to by the iterator. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:137</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_a09909fbe2e4365b5f34ddb61658f27b3"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a09909fbe2e4365b5f34ddb61658f27b3">cutlass::TensorRefBatchStrided::ConstIterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator--(int)</div><div class="ttdoc">Moves to the previous tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:180</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_a6b0f0d9cef4a2f3f4a8bf6c192a282db"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#a6b0f0d9cef4a2f3f4a8bf6c192a282db">cutlass::TensorRefArray::begin</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator begin()</div><div class="ttdoc">Returns an TesnorRefIterator over the TensorRef objects in this collection. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:413</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html">cutlass::TensorRefArray::ConstIterator</a></div><div class="ttdoc">TensorRefIterator over TensorRef objects in TensorRefArray. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:293</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a2beda7a1946bde2858e730bece21b890"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">cutlass::TensorRef::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:146</div></div>
+<div class="ttc" id="cutlass_8h_html_a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><div class="ttname"><a href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="ttdeci">#define CUTLASS_PRAGMA_UNROLL</div><div class="ttdef"><b>Definition:</b> cutlass.h:62</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_a45331031771aeb9f71d5c1abdf42e541"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a45331031771aeb9f71d5c1abdf42e541">cutlass::TensorRefArray::ConstIterator::ConstIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator(TensorArrayRef const &amp;ref, int idx=0)</div><div class="ttdoc">Constructs a ConstIterator over the TensorRef objects. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:310</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_a066d684240f8a24e1ba621ae3904ec75"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#a066d684240f8a24e1ba621ae3904ec75">cutlass::TensorRefArray::TensorRef</a></div><div class="ttdeci">TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; TensorRef</div><div class="ttdoc">TensorRef type obtained from the TensorRefArray. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:278</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_a8f4658dd194b305ae4f150cf371869d9"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#a8f4658dd194b305ae4f150cf371869d9">cutlass::TensorRefArray::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:284</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_a143ec893406d930aa4c5aa860052197e"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a143ec893406d930aa4c5aa860052197e">cutlass::TensorRefArray::ConstIterator::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator-(Index idx)</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:365</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a42ca6a39ab0e44296fed71a77c57b7b1"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a42ca6a39ab0e44296fed71a77c57b7b1">cutlass::TensorRef::LongIndex</a></div><div class="ttdeci">LongIndex_ LongIndex</div><div class="ttdoc">Typically, strides in memory can be very large. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:149</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_ac9019febbc8b6bfea06ac4d23d253d57"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ac9019febbc8b6bfea06ac4d23d253d57">cutlass::TensorRefArray::ConstIterator::operator--</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator--(int)</div><div class="ttdoc">Advances to next TensorRef. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:352</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_ab92bc090d6753ff5e17676ba85a1e478"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab92bc090d6753ff5e17676ba85a1e478">cutlass::TensorRefBatchStrided::ConstIterator::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Stride operator-(ConstIterator const &amp;it)</div><div class="ttdoc">Returns the difference in offset between two iterators. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:201</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_aa6e59a5ecb15c9842c5ee80cc168f679"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#aa6e59a5ecb15c9842c5ee80cc168f679">cutlass::TensorRefArray::ConstIterator::operator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef * operator() const</div><div class="ttdoc">Obtains a TensorRef pointed to by this iterator. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:314</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_a2a95fd42d48c550a45f340b04f9dfe3d"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#a2a95fd42d48c550a45f340b04f9dfe3d">cutlass::TensorRefArray::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef at(Index idx) const</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:402</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_aa3df5b7337d41d8f96717ea73bf3e24e"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#aa3df5b7337d41d8f96717ea73bf3e24e">cutlass::TensorRefBatchStrided::LongIndex</a></div><div class="ttdeci">LongIndex_ LongIndex</div><div class="ttdoc">Typically, strides in memory can be very large. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:105</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a425ff3d894ed1153eee79b1944fa5ed2"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a425ff3d894ed1153eee79b1944fa5ed2">cutlass::TensorRef::kStorageRank</a></div><div class="ttdeci">static int const kStorageRank</div><div class="ttdoc">Rank of internal storage. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:143</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_a9d07d96c2eccba10c3a9e4bef58d4e01"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#a9d07d96c2eccba10c3a9e4bef58d4e01">cutlass::TensorRefBatchStrided::TensorCoord</a></div><div class="ttdeci">Coord&lt; kRank &gt; TensorCoord</div><div class="ttdoc">Coordinate in logical tensor space. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:108</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_aac4b013050925c1e2db4019140e82602"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#aac4b013050925c1e2db4019140e82602">cutlass::TensorRefBatchStrided::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef at(Index idx) const</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:235</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_ad1d8099e8d63b6d88c53738ec68a7589"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ad1d8099e8d63b6d88c53738ec68a7589">cutlass::TensorRefBatchStrided::ConstIterator::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator-(Index idx)</div><div class="ttdoc">Returns an iterator moved forward by (idx) amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:188</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_aa5d7e9a4589d7dacc5d69ca3c70ecc2b"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#aa5d7e9a4589d7dacc5d69ca3c70ecc2b">cutlass::TensorRefBatchStrided::TensorRefBatchStrided</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRefBatchStrided()</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:219</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a4da903ecbeaaf80c35084e8779e920a1"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">cutlass::TensorRef::offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE LongIndex offset(TensorCoord const &amp;coord) const</div><div class="ttdoc">Computes the offset of an index from the origin of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:331</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:49</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_ab12d9d196122dc3075185ab239a27fb4"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#ab12d9d196122dc3075185ab239a27fb4">cutlass::TensorRefBatchStrided::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:102</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_a1d48f4fea3fa85a7bf1b26b421387afd"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a1d48f4fea3fa85a7bf1b26b421387afd">cutlass::TensorRefBatchStrided::ConstIterator::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator+(Index idx)</div><div class="ttdoc">Returns an iterator advanced by (idx) amount. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:160</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_ab07a5d1a4ec6d96ec53e868b3a6d7cae"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ab07a5d1a4ec6d96ec53e868b3a6d7cae">cutlass::TensorRefBatchStrided::ConstIterator::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator+=(Index idx)</div><div class="ttdoc">Advances this iterator by (idx) and returns a reference to self. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:166</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_ae322501a04b0008e5db4f7fccb6e903e"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#ae322501a04b0008e5db4f7fccb6e903e">cutlass::TensorRefArray::pointers</a></div><div class="ttdeci">Storage ** pointers</div><div class="ttdoc">Base addresses. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:375</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_a3d1922402bba34d0bc865fcc3e1a9a5c"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#a3d1922402bba34d0bc865fcc3e1a9a5c">cutlass::TensorRefBatchStrided::get_pointer_offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE LongIndex get_pointer_offset(Index idx) const</div><div class="ttdoc">Gets the pointer offset. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:229</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html">cutlass::TensorRefBatchStrided</a></div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:88</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_a9fcd43018e60f12cb328859c76ec7891"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a9fcd43018e60f12cb328859c76ec7891">cutlass::TensorRefArray::ConstIterator::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator+(Index idx)</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:334</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_ac4018b51e78842fb252d6917738fa571"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#ac4018b51e78842fb252d6917738fa571">cutlass::TensorRefBatchStrided::ConstIterator::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator-=(Index idx)</div><div class="ttdoc">Moves this iterator by (idx) and returns a reference to self. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:194</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_a5557f98c75b51751f834c4a7d6385efc"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a5557f98c75b51751f834c4a7d6385efc">cutlass::TensorRefBatchStrided::ConstIterator::TensorRef</a></div><div class="ttdeci">Base TensorRef</div><div class="ttdoc">TensorRef returned by the iterator. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:117</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_abc2ddccdb742f95438b214e0a3a14620"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#abc2ddccdb742f95438b214e0a3a14620">cutlass::TensorRefBatchStrided::TensorRefBatchStrided</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRefBatchStrided(TensorRef const &amp;ref, LongIndex _tensor_stride=0)</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:223</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_a22b87d281057c8e03b80db7046c54dd8"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a22b87d281057c8e03b80db7046c54dd8">cutlass::TensorRefArray::ConstIterator::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator+=(Index idx)</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:339</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_a28da80c1ba56e354ddb9352b54b231ed"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a28da80c1ba56e354ddb9352b54b231ed">cutlass::TensorRefBatchStrided::ConstIterator::ConstIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator(TensorRefBatchStrided const &amp;ref, LongIndex offset=0)</div><div class="ttdoc">Constructs a ConstIterator from a parent TensorRefBatchStrided. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:131</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator_html_a3481d6f41defd25ab574bb19ee5fe424"><div class="ttname"><a href="classcutlass_1_1TensorRefBatchStrided_1_1ConstIterator.html#a3481d6f41defd25ab574bb19ee5fe424">cutlass::TensorRefBatchStrided::ConstIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator++()</div><div class="ttdoc">Advances the iterator to point to the next tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:145</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefBatchStrided_html_ac92b0cbb46cea7a04ee4660c2603b000"><div class="ttname"><a href="structcutlass_1_1TensorRefBatchStrided.html#ac92b0cbb46cea7a04ee4660c2603b000">cutlass::TensorRefBatchStrided::Base</a></div><div class="ttdeci">TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Base</div><div class="ttdoc">Underlying TensorRef type. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:96</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_a771ede5f73ec18729cc9a5946cf86109"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#a771ede5f73ec18729cc9a5946cf86109">cutlass::TensorRefArray::TensorArrayRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorArrayRef()</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:386</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_a8ce80124ab0f4ab9981f1a4d64d976a5"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a8ce80124ab0f4ab9981f1a4d64d976a5">cutlass::TensorRefArray::ConstIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator &amp; operator++()</div><div class="ttdoc">Advances to next TensorRef. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:320</div></div>
+<div class="ttc" id="structcutlass_1_1TensorRefArray_html_aea35239326dcb23c3c6a18e7b3f92091"><div class="ttname"><a href="structcutlass_1_1TensorRefArray.html#aea35239326dcb23c3c6a18e7b3f92091">cutlass::TensorRefArray::TensorArrayRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorArrayRef(Storage **_pointers, Index _strides[kStorageRank - 1])</div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:390</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_ad19f348ecb951eae63a3ef2c47d34f4f"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#ad19f348ecb951eae63a3ef2c47d34f4f">cutlass::TensorRefArray::ConstIterator::TensorRef</a></div><div class="ttdeci">Base TensorRef</div><div class="ttdoc">TensorRef returned by the iterator. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:297</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRefArray_1_1ConstIterator_html_a051f34d90c0680dc5f4e4e1c4d79e929"><div class="ttname"><a href="classcutlass_1_1TensorRefArray_1_1ConstIterator.html#a051f34d90c0680dc5f4e4e1c4d79e929">cutlass::TensorRefArray::ConstIterator::operator++</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstIterator operator++(int)</div><div class="ttdoc">Advances to next TensorRef. </div><div class="ttdef"><b>Definition:</b> tensor_ref_collection.h:327</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tensor__view_8h.html b/docs/tensor__view_8h.html
index 7fa3cfcf8..5a359b84e 100644
--- a/docs/tensor__view_8h.html
+++ b/docs/tensor__view_8h.html
@@ -83,15 +83,15 @@ $(function() {
 <p>Defines a structure containing strides and a pointer to tensor data.  
 <a href="#details">More...</a></p>
 <div class="textblock"><code>#include &lt;cmath&gt;</code><br />
-<code>#include &lt;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="tensor__ref_8h_source.html">cutlass/tensor_ref.h</a>&gt;</code><br />
+<code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tensor__ref_8h_source.html">cutlass/tensor_ref.h</a>&quot;</code><br />
 </div>
 <p><a href="tensor__view_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; T &gt;</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Host-side reference implementation of tensor operations.  <a href="classcutlass_1_1TensorView.html#details">More...</a><br /></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1TensorView.html">cutlass::TensorView&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Defines a view into a logical tensor.  <a href="classcutlass_1_1TensorView.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
@@ -99,10 +99,13 @@ Namespaces</h2></td></tr>
 <tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
-</div><!-- contents -->
+<a name="details" id="details"></a><h2 class="groupheader">Detailed Description</h2>
+<div class="textblock"><p>TensorView is derived from TensorRef and contributes bounds to the tensor's index space. Thus, it is a complete mathematical object and may be used in tensor algorithms. It is decoupled from data storage and is therefore lightweight and may be embedded in larger tensor objects or memory structures.</p>
+<p>See <a class="el" href="tensor__ref_8h.html" title="Defines a structure containing strides, bounds, and a pointer to tensor data. ">cutlass/tensor_ref.h</a> for more details about the mapping of the logical tensor index space to linear memory. </p>
+</div></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/tensor__view_8h_source.html b/docs/tensor__view_8h_source.html
index 655854021..d86617150 100644
--- a/docs/tensor__view_8h_source.html
+++ b/docs/tensor__view_8h_source.html
@@ -76,50 +76,58 @@ $(function() {
 <div class="title">tensor_view.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="tensor__view_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;cmath&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="tensor__ref_8h.html">cutlass/tensor_ref.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html">   42</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1TensorView.html">TensorView</a> : <span class="keyword">public</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef</a>&lt;T, 4&gt; {</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">   45</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;T, 4&gt;</a> <a class="code" href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">Base</a>;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">   48</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorRef.html">Base</a> <a class="code" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a>;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">   51</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef&lt;T const, 4&gt;</a> <a class="code" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">ConstTensorRef_t</a>;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">   54</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">Rank</a> = <a class="code" href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">TensorRef_t::Rank</a>;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">   57</a></span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> <a class="code" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a>;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">   60</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <a class="code" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a>;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef_t</a> ref_;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> size_;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <span class="comment">// Device and Host Methods</span></div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a22401348796d603546e44d6c196018dc">   80</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html#a22401348796d603546e44d6c196018dc">TensorView</a>() {}</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a80480aa986a488a106a9b0aea331c317">   84</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html#a80480aa986a488a106a9b0aea331c317">TensorView</a>(<a class="code" href="classcutlass_1_1TensorRef.html">TensorRef_t</a> <span class="keyword">const</span>&amp; _ref, <a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> <span class="keyword">const</span>&amp; _size) : <a class="code" href="classcutlass_1_1TensorRef.html">Base</a>(_ref), size_(_size) {}</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a837881bc82704491accf54aad2b9def9">   88</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1TensorView.html#a837881bc82704491accf54aad2b9def9">good</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>().<a class="code" href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">good</a>(); }</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8">   92</a></span>&#160;  T* <a class="code" href="classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>().<a class="code" href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">data</a>(); }</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00096"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a8b1785a1ea5d7aa7eba8e45297d539d3">   96</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1TensorView.html#a8b1785a1ea5d7aa7eba8e45297d539d3">reset</a>(<a class="code" href="classcutlass_1_1TensorRef.html">TensorRef_t</a> <span class="keyword">const</span>&amp; _ref = <a class="code" href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">TensorRef_t</a>(0), <a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> <span class="keyword">const</span>&amp; _size = <a class="code" href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">Coord_t</a>()) {</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    Base::operator=(_ref);</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    size_ = _size;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  }</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">  103</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef_t</a>&amp; <a class="code" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>() { <span class="keywordflow">return</span> *<span class="keyword">this</span>; }</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a23564f1d333bb16343ed3a885f894285">  107</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">ConstTensorRef_t</a> <a class="code" href="classcutlass_1_1TensorView.html#a23564f1d333bb16343ed3a885f894285">const_ref</a>() { <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">ConstTensorRef_t</a>(<a class="code" href="classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8">data</a>(), <a class="code" href="classcutlass_1_1TensorView.html#a3ac125a25199fd91f73d2cfe9fc3d09b">stride</a>()); }</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a5cbff89d3d8dc71d27a4d6c1d7abb58a">  111</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef_t</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorView.html#a5cbff89d3d8dc71d27a4d6c1d7abb58a">ref</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> *<span class="keyword">this</span>; }</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027">  115</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027">size</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> size_; }</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a6218d8555679966eab784a6bb1fa4ed1">  119</a></span>&#160;  <span class="keywordtype">int</span> <a class="code" href="classcutlass_1_1TensorView.html#a6218d8555679966eab784a6bb1fa4ed1">size</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> size_.<a class="code" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">at</a>(dim); }</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00123"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a3ac125a25199fd91f73d2cfe9fc3d09b">  123</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorView.html#a3ac125a25199fd91f73d2cfe9fc3d09b">stride</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>().<a class="code" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>(); }</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00127"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a522630bb0df977282a9bff17e6fee843">  127</a></span>&#160;  <span class="keywordtype">int</span> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorView.html#a522630bb0df977282a9bff17e6fee843">stride</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>().<a class="code" href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">stride</a>(dim); }</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#aa9e9e19f35ce3111f64b763ca49b51ef">  131</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html">TensorView</a>&amp; <a class="code" href="classcutlass_1_1TensorView.html#aa9e9e19f35ce3111f64b763ca49b51ef">operator=</a>(<a class="code" href="classcutlass_1_1TensorView.html">TensorView</a> <span class="keyword">const</span>&amp; _tensor) {</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    Base::operator=(_tensor._ref);</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    size_ = _tensor.size_;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00139"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a064f3630e69798e7915f910c4ee99ab7">  139</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a> <a class="code" href="classcutlass_1_1TensorView.html#a064f3630e69798e7915f910c4ee99ab7">offset</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>().<a class="code" href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">offset</a>(coord); }</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#aa94063d9a9c6e599d3f53e22433274be">  143</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1TensorView.html#aa94063d9a9c6e599d3f53e22433274be">contains</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> dim = 0; dim &lt; <a class="code" href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">Rank</a>; ++dim) {</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      <span class="keywordflow">if</span> (coord.<a class="code" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">at</a>(dim) &gt;= size_.<a class="code" href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">at</a>(dim)) {</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;        <span class="keywordflow">return</span> <span class="keyword">false</span>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      }</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    }</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">true</span>;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  }</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#ad894a8b373c413d308cb1b7c7ba545ce">  154</a></span>&#160;  T&amp; <a class="code" href="classcutlass_1_1TensorView.html#ad894a8b373c413d308cb1b7c7ba545ce">at</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>().<a class="code" href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">at</a>(coord); }</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a7fe7e44e15fd1ac58fb55edf72e8fb23">  157</a></span>&#160;  T&amp; <a class="code" href="classcutlass_1_1TensorView.html#a7fe7e44e15fd1ac58fb55edf72e8fb23">operator[]</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;Rank&gt;</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#ad894a8b373c413d308cb1b7c7ba545ce">at</a>(coord); }</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00161"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#acc55581896fae8c0449b44b56d750155">  161</a></span>&#160;  T&amp; <a class="code" href="classcutlass_1_1TensorView.html#acc55581896fae8c0449b44b56d750155">at</a>(<a class="code" href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">Offset_t</a> idx)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>().<a class="code" href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">at</a>(idx); }</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00165"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#aee43c516397d7c06eb8012711d8d7c15">  165</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html">TensorView&lt;T&gt;</a> <a class="code" href="classcutlass_1_1TensorView.html#aee43c516397d7c06eb8012711d8d7c15">subview</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> <span class="keyword">const</span>&amp; location, <a class="code" href="structcutlass_1_1Coord.html">Coord_t</a> <a class="code" href="classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027">size</a>)<span class="keyword"> const </span>{</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html">TensorView&lt;T&gt;</a>(<a class="code" href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">ref</a>() + location, <a class="code" href="classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027">size</a>.<a class="code" href="structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e">clamp</a>(size_ - location));</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  }</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;};</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="classcutlass_1_1TensorView_html_a5cbff89d3d8dc71d27a4d6c1d7abb58a"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a5cbff89d3d8dc71d27a4d6c1d7abb58a">cutlass::TensorView::ref</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef_t const  &amp; ref() const</div><div class="ttdoc">Accesses the tensor reference pointing to data. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:111</div></div>
+<a href="tensor__view_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &lt;cmath&gt;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tensor__ref_8h.html">cutlass/tensor_ref.h</a>&quot;</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="keyword">typename</span> Storage_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keywordtype">int</span> Rank_ = 4,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <span class="keyword">typename</span> MapFunc_ = IdentityTensorMapFunc&lt;Rank_&gt;,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="keywordtype">int</span> StorageRank_ = MapFunc_::kStorageRank,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">typename</span> LongIndex_ = <span class="keywordtype">long</span> <span class="keywordtype">long</span></div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;&gt;</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html">   63</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1TensorView.html">TensorView</a> : <span class="keyword">public</span> <a class="code" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>&lt;Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt; {</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">   66</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef&lt;Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_&gt;</a> <a class="code" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a>;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>&lt;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Storage_&gt;::type</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    Rank_,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    MapFunc_,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    StorageRank_,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    Index_,</div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57">   75</a></span>&#160;    LongIndex_&gt; <a class="code" href="classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57">ConstTensorRef</a>;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">   78</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a> <a class="code" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a52fb77744c7c7ecf0f8a3a725556293d">   81</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Base::Storage <a class="code" href="classcutlass_1_1TensorView.html#a52fb77744c7c7ecf0f8a3a725556293d">Storage</a>;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a5a3f096a01e6a2dfe984d7e605380599">   84</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Base::Index <a class="code" href="classcutlass_1_1TensorView.html#a5a3f096a01e6a2dfe984d7e605380599">Index</a>;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e">   87</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Coord.html">TensorRef::TensorCoord</a> <a class="code" href="classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e">TensorCoord</a>;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#abaf7ec0e96bc99cf0ce243e703b8711c">   90</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Coord.html">TensorRef::StorageCoord</a> <a class="code" href="classcutlass_1_1TensorView.html#abaf7ec0e96bc99cf0ce243e703b8711c">StorageCoord</a>;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a625892aa9063eebf769bb2ed0cba7684">   94</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Coord.html">TensorRef::StrideVector</a> <a class="code" href="classcutlass_1_1TensorView.html#a625892aa9063eebf769bb2ed0cba7684">StrideVector</a>;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorView.html">TensorView</a>&lt;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">platform::remove_const&lt;Storage&gt;::type</a> <span class="keyword">const</span>,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    Rank_,</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    MapFunc_,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    StorageRank_,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    Index_,</div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719">  103</a></span>&#160;    LongIndex_&gt; <a class="code" href="classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719">ConstTensorView</a>;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <span class="comment">// Definitions included for backwards compatibility - to be removed in next major release</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#ab16a0244199ca2800ea5460ed8ed6ae2">  110</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <a class="code" href="classcutlass_1_1TensorView.html#ab16a0244199ca2800ea5460ed8ed6ae2">Coord_t</a>;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a8dbb7043546fae133547d2c3e46dddab">  113</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="classcutlass_1_1TensorView.html#a8dbb7043546fae133547d2c3e46dddab">Rank</a> = Base::kRank;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1">  116</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Base::LongIndex <a class="code" href="classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1">Offset_t</a>;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606">  119</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a> <a class="code" href="classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606">TensorRef_t</a>;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165">  122</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="classcutlass_1_1TensorRef.html">TensorRef::ConstTensorRef</a> <a class="code" href="classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165">ConstTensorRef_t</a>;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160; <span class="keyword">private</span>:</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> size_;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  <span class="comment">// Device and Host Methods</span></div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00139"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a36d48227f65ad482a7bded99d6a3d0c1">  139</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html#a36d48227f65ad482a7bded99d6a3d0c1">TensorView</a>() {}</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#aad06edac0f43c358c5644dffb5fe9ad7">  143</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html#aad06edac0f43c358c5644dffb5fe9ad7">TensorView</a>(<a class="code" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a> <span class="keyword">const</span>&amp; _ref, <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; _size) : <a class="code" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a>(_ref), size_(_size) {}</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00147"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a73f049694ca1ea4825b5a651852827f5">  147</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html#a73f049694ca1ea4825b5a651852827f5">TensorView</a>(</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr,</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">StrideVector</a> <span class="keyword">const</span> &amp;<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>,</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a></div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  ):</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    <a class="code" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a>(ptr, <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>), size_(<a class="code" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>) {}</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00156"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#af64d4195fd6ba2cba53179e1ae678737">  156</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html#af64d4195fd6ba2cba53179e1ae678737">TensorView</a>(</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <a class="code" href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">Storage</a> *ptr,</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> <span class="keyword">const</span> &amp;<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>,</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a></div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  ):</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    <a class="code" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a>(ptr, <a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>), size_(<a class="code" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>) {}</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00165"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#ae142eb93cf91e000b635d32fcacf1db3">  165</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1TensorView.html#ae142eb93cf91e000b635d32fcacf1db3">reset</a>(<a class="code" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a> <span class="keyword">const</span>&amp; _ref = <a class="code" href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">Base</a>(), <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; _size = <a class="code" href="classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e">TensorCoord</a>()) {</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;    Base::operator=(_ref);</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    size_ = _size;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  }</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">  172</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; <a class="code" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> size_; }</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00176"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a3778dc1c62a27ed811f1bb82a420096e">  176</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">Index</a> <a class="code" href="classcutlass_1_1TensorView.html#a3778dc1c62a27ed811f1bb82a420096e">size</a>(<span class="keywordtype">int</span> dim)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> size_.<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(dim); }</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00180"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#acf0c156efb9197bc7538f7e9057d8a68">  180</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html">TensorView</a>&amp; <a class="code" href="classcutlass_1_1TensorView.html#acf0c156efb9197bc7538f7e9057d8a68">operator=</a>(<a class="code" href="classcutlass_1_1TensorView.html">TensorView</a> <span class="keyword">const</span>&amp; _tensor) {</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    Base::operator=(_tensor);</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    size_ = _tensor.size_;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;  }</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a3f448bcf6e664c244f472e2659215628">  188</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="classcutlass_1_1TensorView.html#a3f448bcf6e664c244f472e2659215628">contains</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; coord)<span class="keyword"> const </span>{</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> dim = 0; dim &lt; Rank_; ++dim) {</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;      <span class="keywordflow">if</span> (coord[dim] &gt;= size_[dim]) {</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;        <span class="keywordflow">return</span> <span class="keyword">false</span>;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;      }</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    }</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">true</span>;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;  }</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00200"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a7e2beb56a3bc2d58c9ec65467b78c4f3">  200</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a> <a class="code" href="classcutlass_1_1TensorView.html#a7e2beb56a3bc2d58c9ec65467b78c4f3">ref</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a>(*<span class="keyword">this</span>);</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;  }</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00206"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a559f7210b445c77a167ab1f41c8d0827">  206</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorRef.html">ConstTensorRef</a> <a class="code" href="classcutlass_1_1TensorView.html#a559f7210b445c77a167ab1f41c8d0827">const_ref</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57">ConstTensorRef</a>(*<span class="keyword">this</span>);</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  }</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#ad4b3faa318699b786f94cf8735a11dbb">  212</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html">TensorView</a> <a class="code" href="classcutlass_1_1TensorView.html#ad4b3faa318699b786f94cf8735a11dbb">subview</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; location, <a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <a class="code" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>)<span class="keyword"> const </span>{</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1TensorView.html#a36d48227f65ad482a7bded99d6a3d0c1">TensorView</a>((*<span class="keyword">this</span>) + location, <a class="code" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>.<a class="code" href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">clamp</a>(size_ - location));</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;  }</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#ad870c366ffe904d3363df1dfb0d5f04c">  218</a></span>&#160;  <span class="keywordtype">size_t</span> <a class="code" href="classcutlass_1_1TensorView.html#ad870c366ffe904d3363df1dfb0d5f04c">capacity</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <span class="keywordtype">int</span> max_rank = 0;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">StorageCoord</a> mapped_size(this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">map</a>(<a class="code" href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">size</a>()));</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Base::kStorageRank; ++i) {</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      <span class="keywordflow">if</span> (!i ||</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;        this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>(i) * mapped_size[i] &gt; this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>(max_rank) * mapped_size[max_rank]) {</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;        max_rank = i;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;      }</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    }</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <span class="keywordflow">return</span> this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">stride</a>(max_rank) * mapped_size[max_rank];</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;  }</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00235"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#aa2390d8e127a51df239affd2ca36e97a">  235</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html">TensorView</a> <a class="code" href="classcutlass_1_1TensorView.html#aa2390d8e127a51df239affd2ca36e97a">operator+</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;    <a class="code" href="classcutlass_1_1TensorView.html">TensorView</a> result(*<span class="keyword">this</span>);</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;    result.<a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    <span class="keywordflow">return</span> result;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;  }</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00243"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a4fa8fa35d00eb4d0097da492c738cddc">  243</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html">TensorView</a>&amp; <a class="code" href="classcutlass_1_1TensorView.html#a4fa8fa35d00eb4d0097da492c738cddc">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;    this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;  }</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00250"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#a1e4b2bb02c5843898f72f62787403add">  250</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html">TensorView</a> <a class="code" href="classcutlass_1_1TensorView.html#a1e4b2bb02c5843898f72f62787403add">operator-</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;    <a class="code" href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">TensorRef</a> result(*<span class="keyword">this</span>);</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    result.add_pointer_offset(-this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    <span class="keywordflow">return</span> result;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;  }</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00258"></a><span class="lineno"><a class="line" href="classcutlass_1_1TensorView.html#abc088fad6debb6a0ceb04c5d2767e81b">  258</a></span>&#160;  <a class="code" href="classcutlass_1_1TensorView.html">TensorView</a>&amp; <a class="code" href="classcutlass_1_1TensorView.html#abc088fad6debb6a0ceb04c5d2767e81b">operator-=</a>(<a class="code" href="structcutlass_1_1Coord.html">TensorCoord</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;    this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">add_pointer_offset</a>(-this-&gt;<a class="code" href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">offset</a>(b));</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;  }</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;};</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="classcutlass_1_1TensorView_html_a5a3f096a01e6a2dfe984d7e605380599"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a5a3f096a01e6a2dfe984d7e605380599">cutlass::TensorView::Index</a></div><div class="ttdeci">Base::Index Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:84</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_ae142eb93cf91e000b635d32fcacf1db3"><div class="ttname"><a href="classcutlass_1_1TensorView.html#ae142eb93cf91e000b635d32fcacf1db3">cutlass::TensorView::reset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void reset(Base const &amp;_ref=Base(), TensorCoord const &amp;_size=TensorCoord())</div><div class="ttdoc">Updates the reference and size of a Tensor_view object. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:165</div></div>
 <div class="ttc" id="tensor__ref_8h_html"><div class="ttname"><a href="tensor__ref_8h.html">tensor_ref.h</a></div><div class="ttdoc">Defines a structure containing strides, bounds, and a pointer to tensor data. </div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a7eff42a37e4dbee488bfa726f3f0df4f"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a7eff42a37e4dbee488bfa726f3f0df4f">cutlass::TensorRef::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage &amp; at(Coord&lt; Rank &gt; const &amp;coord) const</div><div class="ttdoc">Returns a reference to the element at a given Coord. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:121</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a215946fb080a5253815feb1f639c8f6f"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a215946fb080a5253815feb1f639c8f6f">cutlass::TensorView::Offset_t</a></div><div class="ttdeci">int Offset_t</div><div class="ttdoc">Type used to compute the offset of an element to the base of a tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:57</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a22ac53a60e63a743613e732586ad0c66"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a22ac53a60e63a743613e732586ad0c66">cutlass::TensorRef&lt; T, 4 &gt;::Rank</a></div><div class="ttdeci">static int const Rank</div><div class="ttdoc">Rank of tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:48</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a22401348796d603546e44d6c196018dc"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a22401348796d603546e44d6c196018dc">cutlass::TensorView::TensorView</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:80</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a6218d8555679966eab784a6bb1fa4ed1"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a6218d8555679966eab784a6bb1fa4ed1">cutlass::TensorView::size</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int size(int dim) const</div><div class="ttdoc">Accesses the size. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:119</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_a482ada6da62f427987c22098796fcf7e"><div class="ttname"><a href="structcutlass_1_1Coord.html#a482ada6da62f427987c22098796fcf7e">cutlass::Coord::clamp</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; clamp(Coord&lt; N &gt; const &amp;max, Coord&lt; N &gt; const &amp;min=Coord&lt; N &gt;())</div><div class="ttdoc">Clamps a coordinate to a range specified by maximum and minimum values. </div><div class="ttdef"><b>Definition:</b> coord.h:219</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a4037baf5069138ec3967810d2e185017"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a4037baf5069138ec3967810d2e185017">cutlass::TensorView::Coord_t</a></div><div class="ttdeci">Coord&lt; Rank &gt; Coord_t</div><div class="ttdoc">Coordinate into tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:60</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a8b1785a1ea5d7aa7eba8e45297d539d3"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a8b1785a1ea5d7aa7eba8e45297d539d3">cutlass::TensorView::reset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void reset(TensorRef_t const &amp;_ref=TensorRef_t(0), Coord_t const &amp;_size=Coord_t())</div><div class="ttdoc">Updates the reference and size of a Tensor_view object. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:96</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_aa94063d9a9c6e599d3f53e22433274be"><div class="ttname"><a href="classcutlass_1_1TensorView.html#aa94063d9a9c6e599d3f53e22433274be">cutlass::TensorView::contains</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool contains(Coord_t const &amp;coord) const</div><div class="ttdoc">Determines whether a location is within a tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:143</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a522630bb0df977282a9bff17e6fee843"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a522630bb0df977282a9bff17e6fee843">cutlass::TensorView::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int const  &amp; stride(int dim) const</div><div class="ttdoc">Accesses the stride. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:127</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a22c39e8cf314884c5d523914cf4cac90"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a22c39e8cf314884c5d523914cf4cac90">cutlass::TensorView::Rank</a></div><div class="ttdeci">static int const Rank</div><div class="ttdoc">Rank of tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:54</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_acc55581896fae8c0449b44b56d750155"><div class="ttname"><a href="classcutlass_1_1TensorView.html#acc55581896fae8c0449b44b56d750155">cutlass::TensorView::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T &amp; at(Offset_t idx) const</div><div class="ttdoc">Element-wise accessor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:161</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a23564f1d333bb16343ed3a885f894285"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a23564f1d333bb16343ed3a885f894285">cutlass::TensorView::const_ref</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstTensorRef_t const_ref()</div><div class="ttdef"><b>Definition:</b> tensor_view.h:107</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a8e23c78658f45c6f197a1774cc85c5b7"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a8e23c78658f45c6f197a1774cc85c5b7">cutlass::TensorRef::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Storage * data() const</div><div class="ttdoc">Returns the pointer to referenced data. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:99</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html"><div class="ttname"><a href="classcutlass_1_1TensorView.html">cutlass::TensorView</a></div><div class="ttdoc">Host-side reference implementation of tensor operations. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:42</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a02ee5d16ed4ce4705a99bb16b2ae1ae8"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a02ee5d16ed4ce4705a99bb16b2ae1ae8">cutlass::TensorRef::offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE long long offset(Coord&lt; Rank &gt; const &amp;coord) const</div><div class="ttdoc">Computes the offset of an index from the origin of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:115</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html"><div class="ttname"><a href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a></div><div class="ttdoc">Structure modeling a pointer and stride into a tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:42</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a27f09c55f879410cceb75eb25fe542d4"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a27f09c55f879410cceb75eb25fe542d4">cutlass::TensorView::Base</a></div><div class="ttdeci">TensorRef&lt; T, 4 &gt; Base</div><div class="ttdoc">Reference and stride. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:45</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_af64d4195fd6ba2cba53179e1ae678737"><div class="ttname"><a href="classcutlass_1_1TensorView.html#af64d4195fd6ba2cba53179e1ae678737">cutlass::TensorView::TensorView</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView(Storage *ptr, StorageCoord const &amp;stride, TensorCoord const &amp;size)</div><div class="ttdoc">Constructs a TensorView from a pointer, a stride vector, and size. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:156</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1remove__const_html_ac3662947fa50251daf58240a9c798085"><div class="ttname"><a href="structcutlass_1_1platform_1_1remove__const.html#ac3662947fa50251daf58240a9c798085">cutlass::platform::remove_const::type</a></div><div class="ttdeci">T type</div><div class="ttdef"><b>Definition:</b> platform.h:377</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a25eb8c0fe380114ddaabb37453be4606"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a25eb8c0fe380114ddaabb37453be4606">cutlass::TensorView::TensorRef_t</a></div><div class="ttdeci">TensorRef TensorRef_t</div><div class="ttdoc">Base class. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:119</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a3778dc1c62a27ed811f1bb82a420096e"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a3778dc1c62a27ed811f1bb82a420096e">cutlass::TensorView::size</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index size(int dim) const</div><div class="ttdoc">Accesses the size. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:176</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a52fb77744c7c7ecf0f8a3a725556293d"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a52fb77744c7c7ecf0f8a3a725556293d">cutlass::TensorView::Storage</a></div><div class="ttdeci">Base::Storage Storage</div><div class="ttdoc">Storage type. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:81</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_af0237fca8d8df1cf4f17d9cb43eae507"><div class="ttname"><a href="classcutlass_1_1TensorView.html#af0237fca8d8df1cf4f17d9cb43eae507">cutlass::TensorView::TensorRef</a></div><div class="ttdeci">Base TensorRef</div><div class="ttdoc">Base tensor reference. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:78</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_ab879a7b6552c879a81c49cbc0946d719"><div class="ttname"><a href="classcutlass_1_1TensorView.html#ab879a7b6552c879a81c49cbc0946d719">cutlass::TensorView::ConstTensorView</a></div><div class="ttdeci">TensorView&lt; typename platform::remove_const&lt; Storage &gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; ConstTensorView</div><div class="ttdoc">TensorView of constant value. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:103</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_ad327edfe1f8085632ff682d354922009"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#ad327edfe1f8085632ff682d354922009">cutlass::TensorRef::Storage</a></div><div class="ttdeci">Storage_ Storage</div><div class="ttdoc">Data type of individual access. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:134</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_adb52dd6f9f68e7b8b67b8ddfb5c0021c"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#adb52dd6f9f68e7b8b67b8ddfb5c0021c">cutlass::TensorRef::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE StorageCoord stride() const</div><div class="ttdoc">Returns the stride of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:300</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_ad116076aa4ec7dc2d4b23b62e5dfbb7a"><div class="ttname"><a href="classcutlass_1_1TensorView.html#ad116076aa4ec7dc2d4b23b62e5dfbb7a">cutlass::TensorView::size</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorCoord const  &amp; size() const</div><div class="ttdoc">Accesses the size. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:172</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a5f0363da1e0544f256438e066d3cc143"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a5f0363da1e0544f256438e066d3cc143">cutlass::TensorRef::add_pointer_offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef &amp; add_pointer_offset(LongIndex delta)</div><div class="ttdoc">Adds an offset to each pointer. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:357</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a2beda7a1946bde2858e730bece21b890"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a2beda7a1946bde2858e730bece21b890">cutlass::TensorRef::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:146</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a3861f7f09da0b8153d0e3686f2c7cf57"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a3861f7f09da0b8153d0e3686f2c7cf57">cutlass::TensorView::ConstTensorRef</a></div><div class="ttdeci">TensorRef&lt; typename platform::remove_const&lt; Storage_ &gt;::type const, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; ConstTensorRef</div><div class="ttdoc">Tensor reference to of constant value. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:75</div></div>
+<div class="ttc" id="cutlass_8h_html_a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><div class="ttname"><a href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="ttdeci">#define CUTLASS_PRAGMA_UNROLL</div><div class="ttdef"><b>Definition:</b> cutlass.h:62</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_abc088fad6debb6a0ceb04c5d2767e81b"><div class="ttname"><a href="classcutlass_1_1TensorView.html#abc088fad6debb6a0ceb04c5d2767e81b">cutlass::TensorView::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView &amp; operator-=(TensorCoord const &amp;b)</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:258</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a07dfe328d4a8316e79e9acde50582360"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a07dfe328d4a8316e79e9acde50582360">cutlass::TensorRef::map</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE StorageCoord map(TensorCoord const &amp;coord) const</div><div class="ttdoc">Maps a logical coordinate to an n-D array in memory. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:325</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html"><div class="ttname"><a href="classcutlass_1_1TensorView.html">cutlass::TensorView</a></div><div class="ttdoc">Defines a view into a logical tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:63</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_aad06edac0f43c358c5644dffb5fe9ad7"><div class="ttname"><a href="classcutlass_1_1TensorView.html#aad06edac0f43c358c5644dffb5fe9ad7">cutlass::TensorView::TensorView</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView(Base const &amp;_ref, TensorCoord const &amp;_size)</div><div class="ttdoc">Constructs a TensorView from a TensorRef and size. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:143</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a2d0d8ed1c19485318e84db99b8b4e9e6"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a2d0d8ed1c19485318e84db99b8b4e9e6">cutlass::TensorView::Base</a></div><div class="ttdeci">TensorRef&lt; Storage_, Rank_, MapFunc_, StorageRank_, Index_, LongIndex_ &gt; Base</div><div class="ttdoc">Base tensor reference. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:66</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html"><div class="ttname"><a href="classcutlass_1_1TensorRef.html">cutlass::TensorRef</a></div><div class="ttdef"><b>Definition:</b> tensor_ref.h:131</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_acf0c156efb9197bc7538f7e9057d8a68"><div class="ttname"><a href="classcutlass_1_1TensorView.html#acf0c156efb9197bc7538f7e9057d8a68">cutlass::TensorView::operator=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView &amp; operator=(TensorView const &amp;_tensor)</div><div class="ttdoc">Assigns the Tensor_view. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:180</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_ad870c366ffe904d3363df1dfb0d5f04c"><div class="ttname"><a href="classcutlass_1_1TensorView.html#ad870c366ffe904d3363df1dfb0d5f04c">cutlass::TensorView::capacity</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE size_t capacity() const</div><div class="ttdoc">Returns the number of scalar elements needed to store tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:218</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a837881bc82704491accf54aad2b9def9"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a837881bc82704491accf54aad2b9def9">cutlass::TensorView::good</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool good() const</div><div class="ttdoc">Returns true if the Tensor_view is bound to some memory. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:88</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a0c049e523ee0fc98769ed8cd2d026780"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a0c049e523ee0fc98769ed8cd2d026780">cutlass::TensorRef::good</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool good() const</div><div class="ttdoc">Returns true if the TensorRef may be safely accessed. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:95</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a064f3630e69798e7915f910c4ee99ab7"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a064f3630e69798e7915f910c4ee99ab7">cutlass::TensorView::offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Offset_t offset(Coord_t const &amp;coord) const</div><div class="ttdoc">Returns the index of an element. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:139</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a248e4240ccf96c976254464710a73fc8"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a248e4240ccf96c976254464710a73fc8">cutlass::TensorView::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T * data() const</div><div class="ttdoc">Returns a pointer to data. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:92</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; Rank &gt;</a></div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a7fe7e44e15fd1ac58fb55edf72e8fb23"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a7fe7e44e15fd1ac58fb55edf72e8fb23">cutlass::TensorView::operator[]</a></div><div class="ttdeci">T &amp; operator[](Coord&lt; Rank &gt; const &amp;coord) const</div><div class="ttdoc">Element-wise accessor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:157</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a762fc3d887ab14f4c7bcde85f0af16ab"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a762fc3d887ab14f4c7bcde85f0af16ab">cutlass::TensorView::TensorRef_t</a></div><div class="ttdeci">Base TensorRef_t</div><div class="ttdoc">Reference and stride. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:48</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html_ad10b59430927a354fcd874d2d32f1bd8"><div class="ttname"><a href="structcutlass_1_1Coord.html#ad10b59430927a354fcd874d2d32f1bd8">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int &amp; at()</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:185</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_ad894a8b373c413d308cb1b7c7ba545ce"><div class="ttname"><a href="classcutlass_1_1TensorView.html#ad894a8b373c413d308cb1b7c7ba545ce">cutlass::TensorView::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE T &amp; at(Coord_t const &amp;coord) const</div><div class="ttdoc">Element-wise accessor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:154</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a541a7c22e7109d4059044f146fe69027"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a541a7c22e7109d4059044f146fe69027">cutlass::TensorView::size</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord_t const  &amp; size() const</div><div class="ttdoc">Accesses the size. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:115</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a3ac125a25199fd91f73d2cfe9fc3d09b"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a3ac125a25199fd91f73d2cfe9fc3d09b">cutlass::TensorView::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord_t const  &amp; stride() const</div><div class="ttdoc">Accesses the stride. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:123</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a8650860460ea24944c803a671095be09"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a8650860460ea24944c803a671095be09">cutlass::TensorView::ref</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef_t &amp; ref()</div><div class="ttdoc">Accesses the tensor reference pointing to data. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:103</div></div>
-<div class="ttc" id="classcutlass_1_1TensorRef_html_a89380141d25528c4c7ba6c365b96a878"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a89380141d25528c4c7ba6c365b96a878">cutlass::TensorRef::stride</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; Rank &gt; const  &amp; stride() const</div><div class="ttdoc">Returns the stride of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:103</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_aa9e9e19f35ce3111f64b763ca49b51ef"><div class="ttname"><a href="classcutlass_1_1TensorView.html#aa9e9e19f35ce3111f64b763ca49b51ef">cutlass::TensorView::operator=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView &amp; operator=(TensorView const &amp;_tensor)</div><div class="ttdoc">Assigns the Tensor_view. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:131</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a9eff24a3b74b68d11839b92324613c93"><div class="ttname"><a href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">cutlass::Coord::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; at()</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:240</div></div>
+<div class="ttc" id="classcutlass_1_1TensorRef_html_a4da903ecbeaaf80c35084e8779e920a1"><div class="ttname"><a href="classcutlass_1_1TensorRef.html#a4da903ecbeaaf80c35084e8779e920a1">cutlass::TensorRef::offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE LongIndex offset(TensorCoord const &amp;coord) const</div><div class="ttdoc">Computes the offset of an index from the origin of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_ref.h:331</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_ada8a241b6b2c5439183b0d6c456c934e"><div class="ttname"><a href="classcutlass_1_1TensorView.html#ada8a241b6b2c5439183b0d6c456c934e">cutlass::TensorView::TensorCoord</a></div><div class="ttdeci">TensorRef::TensorCoord TensorCoord</div><div class="ttdoc">Coordinate in logical tensor space. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:87</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a408d9a8026115bdaf70a37c86dc720b1"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a408d9a8026115bdaf70a37c86dc720b1">cutlass::TensorView::Offset_t</a></div><div class="ttdeci">Base::LongIndex Offset_t</div><div class="ttdoc">Type used to compute the offset of an element to the base of a tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:116</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_ab16a0244199ca2800ea5460ed8ed6ae2"><div class="ttname"><a href="classcutlass_1_1TensorView.html#ab16a0244199ca2800ea5460ed8ed6ae2">cutlass::TensorView::Coord_t</a></div><div class="ttdeci">TensorCoord Coord_t</div><div class="ttdoc">Coordinate in logical tensor space. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:110</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_ad4b3faa318699b786f94cf8735a11dbb"><div class="ttname"><a href="classcutlass_1_1TensorView.html#ad4b3faa318699b786f94cf8735a11dbb">cutlass::TensorView::subview</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView subview(TensorCoord const &amp;location, TensorCoord size) const</div><div class="ttdoc">Returns a Tensor_view given location and size quantities. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:212</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a7e2beb56a3bc2d58c9ec65467b78c4f3"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a7e2beb56a3bc2d58c9ec65467b78c4f3">cutlass::TensorView::ref</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorRef ref() const</div><div class="ttdoc">Returns a TensorRef pointing to the first element of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:200</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:49</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a8dbb7043546fae133547d2c3e46dddab"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a8dbb7043546fae133547d2c3e46dddab">cutlass::TensorView::Rank</a></div><div class="ttdeci">static int const Rank</div><div class="ttdoc">Logical rank of tensor index space. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:113</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a4fa8fa35d00eb4d0097da492c738cddc"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a4fa8fa35d00eb4d0097da492c738cddc">cutlass::TensorView::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView &amp; operator+=(TensorCoord const &amp;b)</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:243</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a559f7210b445c77a167ab1f41c8d0827"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a559f7210b445c77a167ab1f41c8d0827">cutlass::TensorView::const_ref</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ConstTensorRef const_ref() const</div><div class="ttdoc">Returns a TensorRef pointing to the first element of the tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:206</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a625892aa9063eebf769bb2ed0cba7684"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a625892aa9063eebf769bb2ed0cba7684">cutlass::TensorView::StrideVector</a></div><div class="ttdeci">TensorRef::StrideVector StrideVector</div><div class="ttdef"><b>Definition:</b> tensor_view.h:94</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a1e4b2bb02c5843898f72f62787403add"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a1e4b2bb02c5843898f72f62787403add">cutlass::TensorView::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView operator-(TensorCoord const &amp;b) const</div><div class="ttdoc">Returns a TensorRef offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:250</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a36d48227f65ad482a7bded99d6a3d0c1"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a36d48227f65ad482a7bded99d6a3d0c1">cutlass::TensorView::TensorView</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:139</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a73f049694ca1ea4825b5a651852827f5"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a73f049694ca1ea4825b5a651852827f5">cutlass::TensorView::TensorView</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView(Storage *ptr, StrideVector const &amp;stride, TensorCoord const &amp;size)</div><div class="ttdoc">Constructs a TensorView from a pointer, a stride vector, and size. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:147</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a404a3b4e00f59cac71d41fb1bbba38ba"><div class="ttname"><a href="structcutlass_1_1Coord.html#a404a3b4e00f59cac71d41fb1bbba38ba">cutlass::Coord::clamp</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; clamp(Coord&lt; kRank &gt; const &amp;max, Coord&lt; kRank &gt; const &amp;min=Coord&lt; kRank &gt;())</div><div class="ttdoc">Clamps a coordinate to a range specified by maximum and minimum values. </div><div class="ttdef"><b>Definition:</b> coord.h:274</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_aa2390d8e127a51df239affd2ca36e97a"><div class="ttname"><a href="classcutlass_1_1TensorView.html#aa2390d8e127a51df239affd2ca36e97a">cutlass::TensorView::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView operator+(TensorCoord const &amp;b) const</div><div class="ttdoc">Returns a TensorView offset by a given amount. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:235</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a162c4cb4f4e866892d63cd37f7f72165"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a162c4cb4f4e866892d63cd37f7f72165">cutlass::TensorView::ConstTensorRef_t</a></div><div class="ttdeci">TensorRef::ConstTensorRef ConstTensorRef_t</div><div class="ttdoc">TensorRef to const-valued type. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:122</div></div>
 <div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a80480aa986a488a106a9b0aea331c317"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a80480aa986a488a106a9b0aea331c317">cutlass::TensorView::TensorView</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView(TensorRef_t const &amp;_ref, Coord_t const &amp;_size)</div><div class="ttdoc">Constructs a Tensor_view from a TensorRef and size. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:84</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_a8ef76170bc5ba832dc01339133021830"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a8ef76170bc5ba832dc01339133021830">cutlass::TensorView::ConstTensorRef_t</a></div><div class="ttdeci">TensorRef&lt; T const, 4 &gt; ConstTensorRef_t</div><div class="ttdoc">Reference to constant type. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:51</div></div>
-<div class="ttc" id="classcutlass_1_1TensorView_html_aee43c516397d7c06eb8012711d8d7c15"><div class="ttname"><a href="classcutlass_1_1TensorView.html#aee43c516397d7c06eb8012711d8d7c15">cutlass::TensorView::subview</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TensorView&lt; T &gt; subview(Coord_t const &amp;location, Coord_t size) const</div><div class="ttdoc">Returns a Tensor_view given location and size quantities. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:165</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_abaf7ec0e96bc99cf0ce243e703b8711c"><div class="ttname"><a href="classcutlass_1_1TensorView.html#abaf7ec0e96bc99cf0ce243e703b8711c">cutlass::TensorView::StorageCoord</a></div><div class="ttdeci">TensorRef::StorageCoord StorageCoord</div><div class="ttdoc">Coordinate in storage n-D array. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:90</div></div>
+<div class="ttc" id="classcutlass_1_1TensorView_html_a3f448bcf6e664c244f472e2659215628"><div class="ttname"><a href="classcutlass_1_1TensorView.html#a3f448bcf6e664c244f472e2659215628">cutlass::TensorView::contains</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool contains(TensorCoord const &amp;coord) const</div><div class="ttdoc">Determines whether a location is within a tensor. </div><div class="ttdef"><b>Definition:</b> tensor_view.h:188</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/thread__multiply__add_8h.html b/docs/thread__multiply__add_8h.html
index ab673590a..a5df6a91f 100644
--- a/docs/thread__multiply__add_8h.html
+++ b/docs/thread__multiply__add_8h.html
@@ -82,13 +82,13 @@ $(function() {
 
 <p>Template implementing matrix multiply-add operations on fragments.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
 </div>
 <p><a href="thread__multiply__add_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
 Classes</h2></td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; AccumulatorsPerThread_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd&lt; ThreadGemmShape_, ThreadsPerWarp_, ScalarA_, ScalarB_, ScalarC_, kLayout_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Template performing matrix multiply-add operation within a thread.  <a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
@@ -102,7 +102,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/thread__multiply__add_8h_source.html b/docs/thread__multiply__add_8h_source.html
index 45c64172b..69f018e38 100644
--- a/docs/thread__multiply__add_8h_source.html
+++ b/docs/thread__multiply__add_8h_source.html
@@ -76,28 +76,31 @@ $(function() {
 <div class="title">thread_multiply_add.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="thread__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> AccumulatorsPerThread_,</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;          <span class="keyword">typename</span> ScalarA_,</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;          <span class="keyword">typename</span> ScalarB_,</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;          <span class="keyword">typename</span> ScalarC_&gt;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">   43</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a> {</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">   45</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">InstructionShape</a>;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">   47</a></span>&#160;  <span class="keyword">typedef</span> AccumulatorsPerThread_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">AccumulatorsPerThread</a>;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">   49</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">ThreadsPerWarp</a>;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">   51</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">ShapeMul&lt;AccumulatorsPerThread, ThreadsPerWarp&gt;::Shape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">AccumulatorsPerWarp</a>;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">   53</a></span>&#160;  <span class="keyword">typedef</span> ScalarA_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">ScalarA</a>;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">   55</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarA, AccumulatorsPerThread::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">FragmentA</a>;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">   57</a></span>&#160;  <span class="keyword">typedef</span> ScalarB_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">ScalarB</a>;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">   59</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarB, AccumulatorsPerThread::kH&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">FragmentB</a>;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">   61</a></span>&#160;  <span class="keyword">typedef</span> ScalarC_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">ScalarC</a>;</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">   63</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarC, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW, 16&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">Accumulators</a>;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ab271a3f11ccde4b629ddb11b78c0d555">   66</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ab271a3f11ccde4b629ddb11b78c0d555">ThreadMultiplyAdd</a>() {}</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5dcf66c8126ec8adf8e66d4bf5b2f347">   69</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5dcf66c8126ec8adf8e66d4bf5b2f347">multiply_add</a>(<a class="code" href="structcutlass_1_1Fragment.html">FragmentA</a> <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">FragmentB</a> <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a> <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a>&amp; d) {</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; AccumulatorsPerThread::kH; ++j) {</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; AccumulatorsPerThread::kW; ++i) {</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;        d[j * AccumulatorsPerThread::kW + i] = a[i] * b[j] + c[j * AccumulatorsPerThread::kW + i];</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      }</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    }</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  }</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;};</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_ad2fbba0a70da29af27ed4578577abc5e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad2fbba0a70da29af27ed4578577abc5e">cutlass::gemm::ThreadMultiplyAdd::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The number of threads per warp. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:49</div></div>
+<a href="thread__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ThreadGemmShape_,</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;          <span class="keyword">typename</span> ThreadsPerWarp_,</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;          <span class="keyword">typename</span> ScalarA_,</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;          <span class="keyword">typename</span> ScalarB_,</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;          <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_ = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>&gt;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">   44</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">ThreadMultiplyAdd</a> {</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">   46</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">InstructionShape</a>;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">   48</a></span>&#160;  <span class="keyword">typedef</span> ThreadGemmShape_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">ThreadGemmShape</a>;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d">   50</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">ThreadGemmShape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d">AccumulatorsPerThread</a>;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">   52</a></span>&#160;  <span class="keyword">typedef</span> ThreadsPerWarp_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">ThreadsPerWarp</a>;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">   54</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">ShapeMul&lt;ThreadGemmShape, ThreadsPerWarp&gt;::Shape</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">AccumulatorsPerWarp</a>;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">   56</a></span>&#160;  <span class="keyword">typedef</span> ScalarA_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">ScalarA</a>;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">   58</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarA, AccumulatorsPerThread::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">FragmentA</a>;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">   60</a></span>&#160;  <span class="keyword">typedef</span> ScalarB_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">ScalarB</a>;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">   62</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarB, AccumulatorsPerThread::kH&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">FragmentB</a>;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">   64</a></span>&#160;  <span class="keyword">typedef</span> ScalarC_ <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">ScalarC</a>;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">   66</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Fragment.html">Fragment&lt;ScalarC, AccumulatorsPerThread::kH * AccumulatorsPerThread::kW, 16&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">Accumulators</a>;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac087f0b397599221b74d220fcb1c7121">   69</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac087f0b397599221b74d220fcb1c7121">ThreadMultiplyAdd</a>() {}</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7989d48e4c2e16b7804b813630f347cb">   72</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7989d48e4c2e16b7804b813630f347cb">multiply_add</a>(<a class="code" href="structcutlass_1_1Fragment.html">FragmentA</a> <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">FragmentB</a> <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a> <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                                   <a class="code" href="structcutlass_1_1Fragment.html">Accumulators</a>&amp; d) {</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keywordflow">if</span>(kLayout_ == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>) {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; AccumulatorsPerThread::kH; ++j) {</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; AccumulatorsPerThread::kW; ++i) {</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;          d[j * AccumulatorsPerThread::kW + i] = a[i] * b[j] + c[j * AccumulatorsPerThread::kW + i];</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;        }</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;      }</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    }</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    <span class="keywordflow">else</span> {</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      <span class="keywordflow">for</span>(<span class="keywordtype">int</span> i = 0; i &lt; AccumulatorsPerThread::kW; ++i) {</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;        <span class="keywordflow">for</span>(<span class="keywordtype">int</span> j = 0; j &lt; AccumulatorsPerThread::kH; ++j) {</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;          d[i * AccumulatorsPerThread::kH + j] = a[i] * b[j] + c[i * AccumulatorsPerThread::kH + j];</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;        }</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      }</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    }</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  }</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;};</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a7c1cc536ac6ad12800f9e2b5ec682649"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7c1cc536ac6ad12800f9e2b5ec682649">cutlass::gemm::ThreadMultiplyAdd::FragmentA</a></div><div class="ttdeci">Fragment&lt; ScalarA, AccumulatorsPerThread::kW &gt; FragmentA</div><div class="ttdoc">The fragment for A. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:58</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeMul_html_a8875fc5e861339f981360ed774e8cc94"><div class="ttname"><a href="structcutlass_1_1ShapeMul.html#a8875fc5e861339f981360ed774e8cc94">cutlass::ShapeMul::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD *B_::kD, A_::kH *B_::kH, A_::kW *B_::kW, A_::kC *B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:119</div></div>
 <div class="ttc" id="structcutlass_1_1Fragment_html"><div class="ttname"><a href="structcutlass_1_1Fragment.html">cutlass::Fragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> fragment.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a69d387d932b628dc51c18fcc178c4914"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a69d387d932b628dc51c18fcc178c4914">cutlass::gemm::ThreadMultiplyAdd::FragmentA</a></div><div class="ttdeci">Fragment&lt; ScalarA, AccumulatorsPerThread::kW &gt; FragmentA</div><div class="ttdoc">The fragment for A. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:55</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a5dcf66c8126ec8adf8e66d4bf5b2f347"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5dcf66c8126ec8adf8e66d4bf5b2f347">cutlass::gemm::ThreadMultiplyAdd::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:69</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_ac6381210d447fda9b0e9a028d167f22b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac6381210d447fda9b0e9a028d167f22b">cutlass::gemm::ThreadMultiplyAdd::InstructionShape</a></div><div class="ttdeci">Shape&lt; 1, 1, 1, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:45</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a1af758cb98c33060462a2706856b0a01"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1af758cb98c33060462a2706856b0a01">cutlass::gemm::ThreadMultiplyAdd::ScalarC</a></div><div class="ttdeci">ScalarC_ ScalarC</div><div class="ttdoc">The type for C and D. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:61</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_ab271a3f11ccde4b629ddb11b78c0d555"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ab271a3f11ccde4b629ddb11b78c0d555">cutlass::gemm::ThreadMultiplyAdd::ThreadMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE ThreadMultiplyAdd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a9f706e141ec3bc880fa17a5731d8370e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a9f706e141ec3bc880fa17a5731d8370e">cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerWarp</a></div><div class="ttdeci">ShapeMul&lt; ThreadGemmShape, ThreadsPerWarp &gt;::Shape AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:54</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a6c9a73da33b5ba70307a719db988b56c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6c9a73da33b5ba70307a719db988b56c">cutlass::gemm::ThreadMultiplyAdd::ScalarB</a></div><div class="ttdeci">ScalarB_ ScalarB</div><div class="ttdoc">The type for B. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a7989d48e4c2e16b7804b813630f347cb"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a7989d48e4c2e16b7804b813630f347cb">cutlass::gemm::ThreadMultiplyAdd::multiply_add</a></div><div class="ttdeci">CUTLASS_DEVICE void multiply_add(FragmentA const &amp;a, FragmentB const &amp;b, Accumulators const &amp;c, Accumulators &amp;d)</div><div class="ttdoc">Multiply : d = a*b + c. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:72</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_ac087f0b397599221b74d220fcb1c7121"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ac087f0b397599221b74d220fcb1c7121">cutlass::gemm::ThreadMultiplyAdd::ThreadMultiplyAdd</a></div><div class="ttdeci">CUTLASS_DEVICE ThreadMultiplyAdd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a33a68b52cca697bd505bfd982938143e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a33a68b52cca697bd505bfd982938143e">cutlass::gemm::ThreadMultiplyAdd::ThreadGemmShape</a></div><div class="ttdeci">ThreadGemmShape_ ThreadGemmShape</div><div class="ttdoc">The shape of a thread-leveel matrix multiply accumulate. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:48</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a002b1944b25cc8fe0862f40a8c8555c5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a002b1944b25cc8fe0862f40a8c8555c5">cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerThread</a></div><div class="ttdeci">AccumulatorsPerThread_ AccumulatorsPerThread</div><div class="ttdoc">The number of accumulators per thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:47</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a42d181e7f4d0d0a15e1c911d3498b767"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a42d181e7f4d0d0a15e1c911d3498b767">cutlass::gemm::ThreadMultiplyAdd::ScalarB</a></div><div class="ttdeci">ScalarB_ ScalarB</div><div class="ttdoc">The type for B. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:57</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a760a5262f419b789540e7bbb2fda4b9d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a760a5262f419b789540e7bbb2fda4b9d">cutlass::gemm::ThreadMultiplyAdd::Accumulators</a></div><div class="ttdeci">Fragment&lt; ScalarC, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW, 16 &gt; Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:63</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a382242001b4c8e18ea5f2de724902217"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a382242001b4c8e18ea5f2de724902217">cutlass::gemm::ThreadMultiplyAdd::ScalarA</a></div><div class="ttdeci">ScalarA_ ScalarA</div><div class="ttdoc">The type for A. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:53</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a5429a730a1dea00dc4aecbe8e3ef1620"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a5429a730a1dea00dc4aecbe8e3ef1620">cutlass::gemm::ThreadMultiplyAdd::FragmentB</a></div><div class="ttdeci">Fragment&lt; ScalarB, AccumulatorsPerThread::kH &gt; FragmentB</div><div class="ttdoc">The fragment for B. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:59</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a72d1ac143dab68b6cdd73d057315fcb6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a72d1ac143dab68b6cdd73d057315fcb6">cutlass::gemm::ThreadMultiplyAdd::Accumulators</a></div><div class="ttdeci">Fragment&lt; ScalarC, AccumulatorsPerThread::kH *AccumulatorsPerThread::kW, 16 &gt; Accumulators</div><div class="ttdoc">The accumulators. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a6bb4f6a102edc2c8fba5b67abf05c363"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a6bb4f6a102edc2c8fba5b67abf05c363">cutlass::gemm::ThreadMultiplyAdd::ScalarA</a></div><div class="ttdeci">ScalarA_ ScalarA</div><div class="ttdoc">The type for A. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:56</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html">cutlass::gemm::ThreadMultiplyAdd</a></div><div class="ttdoc">Template performing matrix multiply-add operation within a thread. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:44</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a19bd7eb621b08f192bc01a4634853a9b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a19bd7eb621b08f192bc01a4634853a9b">cutlass::gemm::ThreadMultiplyAdd::ThreadsPerWarp</a></div><div class="ttdeci">ThreadsPerWarp_ ThreadsPerWarp</div><div class="ttdoc">The number of threads per warp. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_af41778b170d940d10bd53f13d34912b1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#af41778b170d940d10bd53f13d34912b1">cutlass::gemm::ThreadMultiplyAdd::ScalarC</a></div><div class="ttdeci">ScalarC_ ScalarC</div><div class="ttdoc">The type for C and D. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_ad8ea3777c307bf3f8c58a8df3966715d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#ad8ea3777c307bf3f8c58a8df3966715d">cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerThread</a></div><div class="ttdeci">ThreadGemmShape AccumulatorsPerThread</div><div class="ttdoc">Aliased to &quot;AccumulatorsPerThread&quot; for compatibility. Expect to be renamed in CUTLASS v2...</div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:50</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a56d687b878397c694e7338fa750995af"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a56d687b878397c694e7338fa750995af">cutlass::gemm::ThreadMultiplyAdd::InstructionShape</a></div><div class="ttdeci">Shape&lt; 1, 1, 1, 1 &gt; InstructionShape</div><div class="ttdoc">The shape of the instruction. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:46</div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_aa83190df3c1639b6dd632cd4b9278d77"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#aa83190df3c1639b6dd632cd4b9278d77">cutlass::gemm::ThreadMultiplyAdd::AccumulatorsPerWarp</a></div><div class="ttdeci">ShapeMul&lt; AccumulatorsPerThread, ThreadsPerWarp &gt;::Shape AccumulatorsPerWarp</div><div class="ttdoc">The number of accumulators per warp. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:51</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ThreadMultiplyAdd_html_a1401162276ea0858ea85a8e4785adbad"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ThreadMultiplyAdd.html#a1401162276ea0858ea85a8e4785adbad">cutlass::gemm::ThreadMultiplyAdd::FragmentB</a></div><div class="ttdeci">Fragment&lt; ScalarB, AccumulatorsPerThread::kH &gt; FragmentB</div><div class="ttdoc">The fragment for B. </div><div class="ttdef"><b>Definition:</b> thread_multiply_add.h:62</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/threadblock__swizzle_8h.html b/docs/threadblock__swizzle_8h.html
new file mode 100644
index 000000000..3720edaab
--- /dev/null
+++ b/docs/threadblock__swizzle_8h.html
@@ -0,0 +1,126 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: threadblock_swizzle.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a> &#124;
+<a href="#func-members">Functions</a>  </div>
+  <div class="headertitle">
+<div class="title">threadblock_swizzle.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Defies functors for mapping blockIdx to partitions of the GEMM computation.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="gemm__coord_8h_source.html">cutlass/gemm/gemm_coord.h</a>&quot;</code><br />
+</div>
+<p><a href="threadblock__swizzle_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1swizzleDirection.html">cutlass::gemm::swizzleDirection</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle&lt; groupCols, swDirection &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle&lt; groupRows, swDirection &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:namespacecutlass_1_1gemm"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html">cutlass::gemm</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
+Functions</h2></td></tr>
+<tr class="memitem:a2336880c866ef4e73bbe0c3dbcb6c40e"><td class="memTemplParams" colspan="2">template&lt;enum swizzleDirection::Kind &gt; </td></tr>
+<tr class="memitem:a2336880c866ef4e73bbe0c3dbcb6c40e"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE int&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e">cutlass::gemm::getLinearIdx</a> (int groups)</td></tr>
+<tr class="separator:a2336880c866ef4e73bbe0c3dbcb6c40e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a37c566ad59d61647374f215c3d33f088"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
+<tr class="memitem:a37c566ad59d61647374f215c3d33f088"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE int&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass_1_1gemm.html#a37c566ad59d61647374f215c3d33f088">cutlass::gemm::getLinearIdx&lt; swizzleDirection::Boustrophedon &gt;</a> (int groups)</td></tr>
+<tr class="separator:a37c566ad59d61647374f215c3d33f088"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/threadblock__swizzle_8h_source.html b/docs/threadblock__swizzle_8h_source.html
new file mode 100644
index 000000000..3153f6aaf
--- /dev/null
+++ b/docs/threadblock__swizzle_8h_source.html
@@ -0,0 +1,120 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: threadblock_swizzle.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li><li class="navelem"><a class="el" href="dir_18d6a367a3982a494d65599933fc67a3.html">gemm</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">threadblock_swizzle.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="threadblock__swizzle_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__coord_8h.html">cutlass/gemm/gemm_coord.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1swizzleDirection.html">   36</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1swizzleDirection.html">swizzleDirection</a> {</div><div class="line"><a name="l00037"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5">   37</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8">Kind</a> { <a class="code" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa">Boustrophedon</a>, <a class="code" href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5">OneDirection</a> };</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;};</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="comment">// helper template function</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">template</span> &lt;enum swizzleDirection::Kind&gt;</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e">   41</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">int</span> <a class="code" href="namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e">getLinearIdx</a>(<span class="keywordtype">int</span> groups) {</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  <span class="comment">// groupCols is not needed for OneDirection Swizzle</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  <span class="keywordflow">return</span> blockIdx.y * gridDim.x + blockIdx.x;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;}</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="namespacecutlass_1_1gemm.html#a37c566ad59d61647374f215c3d33f088">   46</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">int</span> getLinearIdx&lt;swizzleDirection::Boustrophedon&gt;(<span class="keywordtype">int</span> groups) {</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  <span class="comment">// reverse blockIdx.x for some columns</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  <span class="keywordflow">if</span> ((blockIdx.y / groups) % 2 == 1)</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;    <span class="keywordflow">return</span> blockIdx.y * gridDim.x + (gridDim.x - blockIdx.x - 1);</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;  <span class="keywordflow">else</span></div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <span class="keywordflow">return</span> blockIdx.y * gridDim.x + blockIdx.x;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;}</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">   65</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">IdentityBlockSwizzle</a> {</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a046a5dfd01164df2abd514e9a52987c3">   67</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a046a5dfd01164df2abd514e9a52987c3">IdentityBlockSwizzle</a>() {}</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">   70</a></span>&#160;  CUTLASS_DEVICE dim3 <a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">swizzle</a>() { <span class="keywordflow">return</span> blockIdx; }</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#afc20f302a5cc5b736cfc1c91dfcaa57c">   73</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dim3 <a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#afc20f302a5cc5b736cfc1c91dfcaa57c">get_grid_layout</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <span class="keyword">const</span> &amp;problem_size,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                                           <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;OutputTile) {</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="comment">/*OutputTile and problem_size are both in KNM order*/</span></div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    dim3 grid;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    grid.x = (problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>() + OutputTile[2] - 1) / OutputTile[2];</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    grid.y = (problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>() + OutputTile[1] - 1) / OutputTile[1];</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    grid.z = problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a>();</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    <span class="keywordflow">return</span> grid;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  }</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a386e5cf702b0dcc3d57f9fdb4ab5d236">   84</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a386e5cf702b0dcc3d57f9fdb4ab5d236">get_threadblock_offset</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;OutputTile) {</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    dim3 block = <a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">swizzle</a>();</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> threadblock_offset =</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;        <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, block.y * OutputTile[1], block.x * OutputTile[2]);</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    <span class="keywordflow">return</span> threadblock_offset;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  }</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a8f84a2b830caecff3edd052dc24635e6">   92</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a8f84a2b830caecff3edd052dc24635e6">get_batch_id</a>() {</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    dim3 block = <a class="code" href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">swizzle</a>();</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    <span class="keywordflow">return</span> block.z;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;};</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="comment">/*</span></div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;<span class="comment">ColumnMajorBlockSwizzle&lt;1, OneDirection&gt; is equivalent with IdentityBlockSwizzle</span></div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="comment">groupCols has the effect of controlling the schedulling of thread blocks</span></div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="comment">settings with different groupCols can contribute to the overall performance by affecting L2 cache</span></div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;<span class="comment">hit rate</span></div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;<span class="comment">consider a regular thread block mapping btween matrix C and different thread blocks</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;<span class="comment">note that C is column major, and the leading dimension of thread block id is blockIdx.x</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="comment">let&#39;s look at an example where gridIdx.x = 6, gridIdx.y = 7, gridIdx.z = 1</span></div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="comment">(blockIdx.x, blockIdx.y)</span></div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="comment">mapping between threadblockID and C matrix:</span></div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;<span class="comment">(0,0) | (0,1) | (0,2) | (0,3) | (0,4) | (0,5) | (0,6) |</span></div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="comment">(1,0) | (1,1) | (1,2) | (1,3) | (1,4) | (1,5) | (1,6) |</span></div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="comment">(2,0) | (2,1) | (2,2) | (2,3) | (2,4) | (2,5) | (2,6) |</span></div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;<span class="comment">(3,0) | (3,1) | (3,2) | (3,3) | (3,4) | (3,5) | (3,6) |</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="comment">(4,0) | (4,1) | (4,2) | (4,3) | (4,4) | (4,5) | (4,6) |</span></div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;<span class="comment">(5,0) | (5,1) | (5,2) | (5,3) | (5,4) | (5,5) | (5,6) |</span></div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;<span class="comment">A ColumnMajorBlockSwizzle&lt;1, OneDirection&gt; will imply the above order where threadblocks are</span></div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="comment">launched in a column major</span></div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;<span class="comment">A ColumnMajorBlockSwizzle&lt;2, OneDirection&gt; swizzles things a little,</span></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="comment">(0,0) | (3,0) | (0,2) | (3,2) | (0,4) | (3,4) | (0,6) |</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="comment">(0,1) | (3,1) | (0,3) | (3,3) | (0,5) | (3,5) | (1,6) |</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="comment">(1,0) | (4,0) | (1,2) | (4,2) | (1,4) | (4,4) | (2,6) |</span></div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="comment">(1,1) | (4,1) | (1,3) | (4,3) | (1,5) | (4,5) | (3,6) |</span></div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;<span class="comment">(2,0) | (5,0) | (2,2) | (5,2) | (2,4) | (5,4) | (4,6) |</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="comment">(2,1) | (5,1) | (2,3) | (5,3) | (2,5) | (5,5) | (5,6) |</span></div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="comment">so in memory, it would apprear that we work on 2 columns at a time rather than 1</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="comment">Note that the index here really represent how each block maps to memory</span></div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="comment">A ColumnMajorBlockSwizzle&lt;1, Boustrophedon&gt; is similar to ColumnMajorBlockSwizzle&lt;1, OneDirection&gt;</span></div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;<span class="comment">except that every column flips the ordering against the previous one</span></div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="comment">(0,0) | (5,1) | (0,2) | (5,3) | (0,4) | (5,5) | (0,6) |</span></div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;<span class="comment">(1,0) | (4,1) | (1,2) | (4,3) | (1,4) | (4,5) | (1,6) |</span></div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="comment">(2,0) | (3,1) | (2,2) | (3,3) | (2,4) | (3,5) | (2,6) |</span></div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="comment">(3,0) | (2,1) | (3,2) | (2,3) | (3,4) | (2,5) | (3,6) |</span></div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;<span class="comment">(4,0) | (1,1) | (4,2) | (1,3) | (4,4) | (1,5) | (4,6) |</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;<span class="comment">(5,0) | (0,1) | (5,2) | (0,3) | (5,4) | (0,5) | (5,6) |</span></div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;<span class="comment">similarily, A ColumnMajorBlockSwizzle&lt;2, Boustrophedon&gt; looks like</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;<span class="comment">(0,0) | (3,0) | (2,3) | (5,3) | (0,4) | (3,4) | (5,6) |</span></div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;<span class="comment">(0,1) | (3,1) | (2,2) | (5,2) | (0,5) | (3,5) | (4,6) |</span></div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;<span class="comment">(1,0) | (4,0) | (1,3) | (4,3) | (1,4) | (4,4) | (3,6) |</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="comment">(1,1) | (4,1) | (1,2) | (4,2) | (1,5) | (4,5) | (2,6) |</span></div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;<span class="comment">(2,0) | (5,0) | (0,3) | (3,3) | (2,4) | (5,4) | (1,6) |</span></div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;<span class="comment">(2,1) | (5,1) | (0,2) | (3,2) | (2,5) | (5,5) | (0,6) |</span></div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="comment">*/</span></div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> groupCols, enum swizzleDirection::Kind swDirection&gt;</div><div class="line"><a name="l00181"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">  181</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">ColumnMajorBlockSwizzle</a> {</div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a6d0ee4e76371af26030ab4922e6c915a">  183</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a6d0ee4e76371af26030ab4922e6c915a">ColumnMajorBlockSwizzle</a>() {}</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b">  186</a></span>&#160;  CUTLASS_DEVICE dim3 <a class="code" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b">swizzle</a>() {</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    assert(gridDim.z == 1);</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    <span class="keywordtype">int</span> linearIdx = getLinearIdx&lt;swDirection&gt;(groupCols);</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    dim3 swizzledBlockIdx;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    <span class="keywordtype">int</span> currGroupCols = groupCols;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <span class="keywordtype">int</span> prevGroupCols = groupCols;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    <span class="keywordflow">if</span> ((gridDim.y % groupCols != 0) &amp;&amp; ((blockIdx.y + (gridDim.y % groupCols)) &gt;= gridDim.y)) {</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;      <span class="comment">// last colmuns if gridDim.y is not divisble by groupCols</span></div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      currGroupCols = gridDim.y % groupCols;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    }</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    swizzledBlockIdx.x = (linearIdx / currGroupCols) % gridDim.x;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    swizzledBlockIdx.y =</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;        linearIdx % currGroupCols + prevGroupCols * (linearIdx / (prevGroupCols * gridDim.x));</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;    swizzledBlockIdx.z = blockIdx.z;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;    <span class="keywordflow">return</span> swizzledBlockIdx;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;  }</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div><div class="line"><a name="l00207"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a927ce3eed4cd22554f9e6fe20a1ccc6e">  207</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dim3 <a class="code" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a927ce3eed4cd22554f9e6fe20a1ccc6e">get_grid_layout</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <span class="keyword">const</span> &amp;problem_size,</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;                                           <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;OutputTile) {</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;    dim3 grid;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    grid.x = (problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>() + OutputTile[2] - 1) / OutputTile[2];</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;    grid.y = (problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>() + OutputTile[1] - 1) / OutputTile[1];</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    grid.z = problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a>();</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <span class="keywordflow">return</span> grid;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;  }</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00217"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a380fb7f905548c52933ea411166424b4">  217</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a380fb7f905548c52933ea411166424b4">get_threadblock_offset</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;OutputTile) {</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    dim3 block = <a class="code" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b">swizzle</a>();</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> threadblock_offset =</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;        <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, block.y * OutputTile[1], block.x * OutputTile[2]);</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <span class="keywordflow">return</span> threadblock_offset;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  }</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;</div><div class="line"><a name="l00225"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#abb21a72e2cef3217f446f70758c59c1e">  225</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#abb21a72e2cef3217f446f70758c59c1e">get_batch_id</a>() {</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    dim3 block = <a class="code" href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b">swizzle</a>();</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    <span class="keywordflow">return</span> block.z;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;  }</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;};</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;<span class="comment">/*</span></div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;<span class="comment">consider a regular thread block mapping btween matrix C and different thread blocks</span></div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;<span class="comment">note that C is column major, and the leading dimension of thread block id is blockIdx.x</span></div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;<span class="comment">let&#39;s look at an example where gridIdx.x = 6, gridIdx.y = 7, gridIdx.z = 1</span></div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;<span class="comment">(blockIdx.x, blockIdx.y)</span></div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;<span class="comment">mapping between threadblockID and C matrix:</span></div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;<span class="comment">(0,0) | (0,1) | (0,2) | (0,3) | (0,4) | (0,5) | (0,6) |</span></div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;<span class="comment">(1,0) | (1,1) | (1,2) | (1,3) | (1,4) | (1,5) | (1,6) |</span></div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;<span class="comment">(2,0) | (2,1) | (2,2) | (2,3) | (2,4) | (2,5) | (2,6) |</span></div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;<span class="comment">(3,0) | (3,1) | (3,2) | (3,3) | (3,4) | (3,5) | (3,6) |</span></div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;<span class="comment">(4,0) | (4,1) | (4,2) | (4,3) | (4,4) | (4,5) | (4,6) |</span></div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;<span class="comment">(5,0) | (5,1) | (5,2) | (5,3) | (5,4) | (5,5) | (5,6) |</span></div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;<span class="comment">-------------------------------------------------------</span></div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;<span class="comment">A RowMajorBlockSwizzle&lt;1, OneDirection&gt; will effectively transpose the map</span></div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;<span class="comment">(0,0) | (1,0) | (2,0) | (3,0) | (4,0) | (5,0) |</span></div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="comment">(0,1) | (1,1) | (2,1) | (3,1) | (4,1) | (5,1) |</span></div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;<span class="comment">(0,2) | (1,2) | (2,2) | (3,2) | (4,2) | (5,2) |</span></div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;<span class="comment">(0,3) | (1,3) | (2,3) | (3,3) | (4,3) | (5,3) |</span></div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;<span class="comment">(0,4) | (1,4) | (2,4) | (3,4) | (4,4) | (5,4) |</span></div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;<span class="comment">---------------------------------------------</span></div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;<span class="comment">(0,5) | (1,5) | (2,5) | (3,5) | (4,5) | (5,5) |</span></div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;<span class="comment">(0,6) | (1,6) | (2,6) | (3,6) | (4,6) | (5,6) |</span></div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;<span class="comment">It would aprear in memory we are working on 1 row at a time</span></div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;<span class="comment">A ColumnMajorBlockSwizzle&lt;2, OneDirection&gt; swizzles things a little bit more</span></div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;<span class="comment">(0,0) | (1,3) | (2,0) | (3,3) | (4,0) | (5,3) |</span></div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;<span class="comment">(1,0) | (0,4) | (3,0) | (2,4) | (5,0) | (4,4) |</span></div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;<span class="comment">(0,1) | (1,4) | (2,1) | (3,4) | (4,1) | (5,4) |</span></div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;<span class="comment">(1,1) | (0,5) | (3,1) | (2,5) | (5,1) | (4,5) |</span></div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;<span class="comment">(0,2) | (1,5) | (2,2) | (3,5) | (4,2) | (5,5) |</span></div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;<span class="comment">---------------------------------------------</span></div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;<span class="comment">(1,2) | (0,6) | (3,2) | (2,6) | (5,2) | (4,6) |</span></div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;<span class="comment">(0,3) | (1,6) | (2,3) | (3,6) | (4,3) | (5,6) |</span></div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;<span class="comment">so in memory, it would apprear that we work on 2 rows at a time rather than 1 row</span></div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;<span class="comment">Note that the index here really represent how each block maps to memory</span></div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;<span class="comment">A RowMajorBlockSwizzle&lt;1, Boustrophedon&gt; is similar to RowMajorBlockSwizzle&lt;1, OneDirection&gt;</span></div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;<span class="comment">except that every column flips the ordering against the previous one</span></div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;<span class="comment">(0,0) | (1,6) | (2,0) | (3,6) | (4,0) | (5,6) |</span></div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;<span class="comment">(0,1) | (1,5) | (2,1) | (3,5) | (4,1) | (5,5) |</span></div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;<span class="comment">(0,2) | (1,4) | (2,2) | (3,4) | (4,2) | (5,4) |</span></div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;<span class="comment">(0,3) | (1,3) | (2,3) | (3,3) | (4,3) | (5,3) |</span></div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;<span class="comment">(0,4) | (1,2) | (2,4) | (3,2) | (4,4) | (5,2) |</span></div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;<span class="comment">---------------------------------------------</span></div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;<span class="comment">(0,5) | (1,1) | (2,5) | (3,1) | (4,5) | (5,1) |</span></div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;<span class="comment">(0,6) | (1,0) | (2,6) | (3,0) | (4,6) | (5,0) |</span></div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;<span class="comment">similarily, A RowMajorBlockSwizzle&lt;2, Boustrophedon&gt; looks like</span></div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;<span class="comment">(0,0) | (1,3) | (2,3) | (3,6) | (4,0) | (5,3) |</span></div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;<span class="comment">(1,0) | (0,4) | (3,2) | (2,6) | (5,0) | (4,4) |</span></div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;<span class="comment">(0,1) | (1,4) | (2,2) | (3,5) | (4,1) | (5,4) |</span></div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;<span class="comment">(1,1) | (0,5) | (3,1) | (2,5) | (5,1) | (4,5) |</span></div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;<span class="comment">(0,2) | (1,5) | (2,1) | (3,4) | (4,2) | (5,5) |</span></div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;<span class="comment">---------------------------------------------</span></div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;<span class="comment">(1,2) | (0,6) | (3,0) | (2,4) | (5,2) | (4,6) |</span></div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;<span class="comment">(0,3) | (1,6) | (2,0) | (3,3) | (4,3) | (5,6) |</span></div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;<span class="comment">-----------------------------------------------</span></div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;<span class="comment"></span></div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;<span class="comment">*/</span></div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> groupRows, enum swizzleDirection::Kind swDirection&gt;</div><div class="line"><a name="l00334"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">  334</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">RowMajorBlockSwizzle</a> {</div><div class="line"><a name="l00336"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a4ed7847f8ddad11a6765d914b6f32fcd">  336</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a4ed7847f8ddad11a6765d914b6f32fcd">RowMajorBlockSwizzle</a>() {}</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;</div><div class="line"><a name="l00339"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d">  339</a></span>&#160;  CUTLASS_DEVICE dim3 <a class="code" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d">swizzle</a>() {</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;    assert(gridDim.z == 1);</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <span class="keywordtype">int</span> linearIdx = getLinearIdx&lt;swDirection&gt;(groupRows);</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;    dim3 swizzledBlockIdx;</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;    <span class="keywordtype">int</span> currGroupRows = groupRows;</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    <span class="keywordtype">int</span> prevGroupRows = groupRows;</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    <span class="keywordflow">if</span> ((gridDim.y % groupRows != 0) &amp;&amp; ((blockIdx.y + (gridDim.y % groupRows)) &gt;= gridDim.y)) {</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;      <span class="comment">// last columns</span></div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;      currGroupRows = gridDim.y % groupRows;</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    }</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    swizzledBlockIdx.x =</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;        linearIdx % currGroupRows + prevGroupRows * (linearIdx / (prevGroupRows * gridDim.x));</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;    swizzledBlockIdx.y = (linearIdx / currGroupRows) % gridDim.x;</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;    swizzledBlockIdx.z = blockIdx.z;</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;    <span class="keywordflow">return</span> swizzledBlockIdx;</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;  }</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;</div><div class="line"><a name="l00360"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#aa9fc825e19404ff527cb3d2dcc55ae1c">  360</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> dim3 <a class="code" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#aa9fc825e19404ff527cb3d2dcc55ae1c">get_grid_layout</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html">GemmCoord</a> <span class="keyword">const</span> &amp;problem_size,</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;                                           <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;OutputTile) {</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;    dim3 grid;</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;    grid.x = (problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">n</a>() + OutputTile[1] - 1) / OutputTile[1];</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;    grid.y = (problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">m</a>() + OutputTile[2] - 1) / OutputTile[2];</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;    grid.z = problem_size.<a class="code" href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">batch</a>();</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;    <span class="keywordflow">return</span> grid;</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;  }</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;</div><div class="line"><a name="l00370"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#af7c1b4e0afb08e893cd14a169a0b47cd">  370</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#af7c1b4e0afb08e893cd14a169a0b47cd">get_threadblock_offset</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;OutputTile) {</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;    dim3 block = <a class="code" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d">swizzle</a>();</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> threadblock_offset =</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;        <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, block.y * OutputTile[1], block.x * OutputTile[2]);</div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;    <span class="keywordflow">return</span> threadblock_offset;</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;  }</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div><div class="line"><a name="l00378"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a9be74716c0e3dc6a7f4cdd64cbb16211">  378</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a9be74716c0e3dc6a7f4cdd64cbb16211">get_batch_id</a>() {</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;    dim3 block = <a class="code" href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d">swizzle</a>();</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;    <span class="keywordflow">return</span> block.z;</div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;  }</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;};</div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1swizzleDirection_html_aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a7c9f735f930f7acf8a16ef43c5fadda5">cutlass::gemm::swizzleDirection::OneDirection</a></div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:37</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IdentityBlockSwizzle_html_a046a5dfd01164df2abd514e9a52987c3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a046a5dfd01164df2abd514e9a52987c3">cutlass::gemm::IdentityBlockSwizzle::IdentityBlockSwizzle</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE IdentityBlockSwizzle()</div><div class="ttdoc">Ctor. aka ColumnMajorBlockSwizzle&lt;1&gt; </div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:67</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IdentityBlockSwizzle_html_a8f84a2b830caecff3edd052dc24635e6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a8f84a2b830caecff3edd052dc24635e6">cutlass::gemm::IdentityBlockSwizzle::get_batch_id</a></div><div class="ttdeci">CUTLASS_DEVICE int get_batch_id()</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:92</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle_html_a380fb7f905548c52933ea411166424b4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a380fb7f905548c52933ea411166424b4">cutlass::gemm::ColumnMajorBlockSwizzle::get_threadblock_offset</a></div><div class="ttdeci">CUTLASS_DEVICE Coord&lt; 3 &gt; get_threadblock_offset(Coord&lt; 3 &gt; const &amp;OutputTile)</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:217</div></div>
+<div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a7c582518db6860e19286361b162c4fcd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a7c582518db6860e19286361b162c4fcd">cutlass::gemm::GemmCoord::n</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; n() const</div><div class="ttdoc">Returns the GEMM N coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:97</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html">cutlass::gemm::GemmCoord</a></div><div class="ttdef"><b>Definition:</b> gemm_coord.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html">cutlass::gemm::ColumnMajorBlockSwizzle</a></div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:181</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle_html_af7c1b4e0afb08e893cd14a169a0b47cd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#af7c1b4e0afb08e893cd14a169a0b47cd">cutlass::gemm::RowMajorBlockSwizzle::get_threadblock_offset</a></div><div class="ttdeci">CUTLASS_DEVICE Coord&lt; 3 &gt; get_threadblock_offset(Coord&lt; 3 &gt; const &amp;OutputTile)</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:370</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle_html_a4ed7847f8ddad11a6765d914b6f32fcd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a4ed7847f8ddad11a6765d914b6f32fcd">cutlass::gemm::RowMajorBlockSwizzle::RowMajorBlockSwizzle</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE RowMajorBlockSwizzle()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:336</div></div>
+<div class="ttc" id="namespacecutlass_1_1gemm_html_a2336880c866ef4e73bbe0c3dbcb6c40e"><div class="ttname"><a href="namespacecutlass_1_1gemm.html#a2336880c866ef4e73bbe0c3dbcb6c40e">cutlass::gemm::getLinearIdx</a></div><div class="ttdeci">CUTLASS_DEVICE int getLinearIdx(int groups)</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:41</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle_html_a927ce3eed4cd22554f9e6fe20a1ccc6e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a927ce3eed4cd22554f9e6fe20a1ccc6e">cutlass::gemm::ColumnMajorBlockSwizzle::get_grid_layout</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE dim3 get_grid_layout(GemmCoord const &amp;problem_size, Coord&lt; 3 &gt; const &amp;OutputTile)</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:207</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle_html_aa9fc825e19404ff527cb3d2dcc55ae1c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#aa9fc825e19404ff527cb3d2dcc55ae1c">cutlass::gemm::RowMajorBlockSwizzle::get_grid_layout</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE dim3 get_grid_layout(GemmCoord const &amp;problem_size, Coord&lt; 3 &gt; const &amp;OutputTile)</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:360</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IdentityBlockSwizzle_html_a0a366c072ee66bbcb390acd7b8bbe5f8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a0a366c072ee66bbcb390acd7b8bbe5f8">cutlass::gemm::IdentityBlockSwizzle::swizzle</a></div><div class="ttdeci">CUTLASS_DEVICE dim3 swizzle()</div><div class="ttdoc">Swizzle the block index. </div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:70</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle_html_abb21a72e2cef3217f446f70758c59c1e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#abb21a72e2cef3217f446f70758c59c1e">cutlass::gemm::ColumnMajorBlockSwizzle::get_batch_id</a></div><div class="ttdeci">CUTLASS_DEVICE int get_batch_id()</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:225</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IdentityBlockSwizzle_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html">cutlass::gemm::IdentityBlockSwizzle</a></div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:65</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IdentityBlockSwizzle_html_a386e5cf702b0dcc3d57f9fdb4ab5d236"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#a386e5cf702b0dcc3d57f9fdb4ab5d236">cutlass::gemm::IdentityBlockSwizzle::get_threadblock_offset</a></div><div class="ttdeci">CUTLASS_DEVICE Coord&lt; 3 &gt; get_threadblock_offset(Coord&lt; 3 &gt; const &amp;OutputTile)</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:84</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle_html_a9be74716c0e3dc6a7f4cdd64cbb16211"><div class="ttname"><a href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a9be74716c0e3dc6a7f4cdd64cbb16211">cutlass::gemm::RowMajorBlockSwizzle::get_batch_id</a></div><div class="ttdeci">CUTLASS_DEVICE int get_batch_id()</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:378</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle_html_a6d0ee4e76371af26030ab4922e6c915a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#a6d0ee4e76371af26030ab4922e6c915a">cutlass::gemm::ColumnMajorBlockSwizzle::ColumnMajorBlockSwizzle</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ColumnMajorBlockSwizzle()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:183</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle_html_aaeb1e1167144352521651547815e003b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ColumnMajorBlockSwizzle.html#aaeb1e1167144352521651547815e003b">cutlass::gemm::ColumnMajorBlockSwizzle::swizzle</a></div><div class="ttdeci">CUTLASS_DEVICE dim3 swizzle()</div><div class="ttdoc">Swizzle the block index. </div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:186</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_a9167769a2b915eb92fb4ca37b9212793"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#a9167769a2b915eb92fb4ca37b9212793">cutlass::gemm::GemmCoord::m</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; m() const</div><div class="ttdoc">Returns the GEMM M coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:89</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle_html_a668d220ad1f163b72e40106b719e0c8d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html#a668d220ad1f163b72e40106b719e0c8d">cutlass::gemm::RowMajorBlockSwizzle::swizzle</a></div><div class="ttdeci">CUTLASS_DEVICE dim3 swizzle()</div><div class="ttdoc">Swizzle the block index. </div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:339</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1swizzleDirection_html_aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8a3172f5122c4348fdf4eb2480601249fa">cutlass::gemm::swizzleDirection::Boustrophedon</a></div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:37</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmCoord_html_ac441e93411ed6954a93ab36f0c747d26"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmCoord.html#ac441e93411ed6954a93ab36f0c747d26">cutlass::gemm::GemmCoord::batch</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; batch() const</div><div class="ttdoc">Returns the GEMM batch coordinate. </div><div class="ttdef"><b>Definition:</b> gemm_coord.h:113</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1swizzleDirection_html_aba1528de966f236380c5f55942802fb8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1swizzleDirection.html#aba1528de966f236380c5f55942802fb8">cutlass::gemm::swizzleDirection::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:37</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1swizzleDirection_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1swizzleDirection.html">cutlass::gemm::swizzleDirection</a></div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1RowMajorBlockSwizzle.html">cutlass::gemm::RowMajorBlockSwizzle</a></div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:334</div></div>
+<div class="ttc" id="gemm__coord_8h_html"><div class="ttname"><a href="gemm__coord_8h.html">gemm_coord.h</a></div><div class="ttdoc">GemmCoord is a structure derived from Coord&lt;4&gt; that specifies a location within the coordinate system...</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1IdentityBlockSwizzle_html_afc20f302a5cc5b736cfc1c91dfcaa57c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1IdentityBlockSwizzle.html#afc20f302a5cc5b736cfc1c91dfcaa57c">cutlass::gemm::IdentityBlockSwizzle::get_grid_layout</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE dim3 get_grid_layout(GemmCoord const &amp;problem_size, Coord&lt; 3 &gt; const &amp;OutputTile)</div><div class="ttdef"><b>Definition:</b> threadblock_swizzle.h:73</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tile__allocation_8h.html b/docs/tile__allocation_8h.html
new file mode 100644
index 000000000..5953680f8
--- /dev/null
+++ b/docs/tile__allocation_8h.html
@@ -0,0 +1,114 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: tile_allocation.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">tile_allocation.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Defines a fragment based on a Shape&lt;&gt; template.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tensor__ref_8h_source.html">cutlass/tensor_ref.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="zip__tensor__ref_8h_source.html">cutlass/zip_tensor_ref.h</a>&quot;</code><br />
+</div>
+<p><a href="tile__allocation_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation&lt; Scalar_, Shape_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Class for storing a tile in memory and accessing it through a tensor ref.  <a href="structcutlass_1_1TileAllocation.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation&lt; First_, Second_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Manages a pair of tile allocations as if they are one allocation.  <a href="structcutlass_1_1ZipTileAllocation.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tile__allocation_8h_source.html b/docs/tile__allocation_8h_source.html
new file mode 100644
index 000000000..b27e0dcce
--- /dev/null
+++ b/docs/tile__allocation_8h_source.html
@@ -0,0 +1,121 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: tile_allocation.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">tile_allocation.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="tile__allocation_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tensor__ref_8h.html">cutlass/tensor_ref.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="zip__tensor__ref_8h.html">cutlass/zip_tensor_ref.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Shape_&gt;</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html">   41</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileAllocation.html">TileAllocation</a> {</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">   47</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a>;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">   50</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1StorageType.html">StorageType&lt;sizeof(Scalar)&gt;::Type</a> <a class="code" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">Storage</a>;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">   53</a></span>&#160;  <span class="keyword">typedef</span> Shape_ <a class="code" href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">Shape</a>;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c">   56</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">ShapeStrides&lt;Shape, 1&gt;::Shape</a> <a class="code" href="structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c">Strides</a>;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">   59</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef&lt;Scalar const, 4&gt;</a> <a class="code" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">ConstTensorRef</a>;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">   62</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef&lt;Scalar, 4&gt;</a> <a class="code" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a>;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604">   69</a></span>&#160;  <a class="code" href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">Storage</a> <a class="code" href="structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604">storage</a>[<a class="code" href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">Shape::kD</a>][<a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Shape::kH</a>][<a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Shape::kW</a>][<a class="code" href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">Shape::kC</a>];</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#a69c43b27939e9ecebd23edb18ed3a9dc">   77</a></span>&#160;  <a class="code" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> *<a class="code" href="structcutlass_1_1TileAllocation.html#a69c43b27939e9ecebd23edb18ed3a9dc">data</a>() { <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> *<span class="keyword">&gt;</span>(&amp;<a class="code" href="structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604">storage</a>[0][0][0][0]); }</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#acc3f2c29fe21316091a1405613083000">   81</a></span>&#160;  <a class="code" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> <span class="keyword">const</span> *<a class="code" href="structcutlass_1_1TileAllocation.html#acc3f2c29fe21316091a1405613083000">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">Scalar</a> <span class="keyword">const </span>*<span class="keyword">&gt;</span>(&amp;<a class="code" href="structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604">storage</a>[0][0][0][0]); }</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#a3466ef2b478e4617aa1ff261217cfd05">   85</a></span>&#160;  <a class="code" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a> <a class="code" href="structcutlass_1_1TileAllocation.html#a3466ef2b478e4617aa1ff261217cfd05">reference</a>() {</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">TensorRef</a>(<a class="code" href="structcutlass_1_1TileAllocation.html#a69c43b27939e9ecebd23edb18ed3a9dc">data</a>(), <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(Strides::kD, Strides::kH, Strides::kW, Strides::kC));</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  }</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileAllocation.html#afcdc0be82acf0b4ae66468e2170c5a0d">   91</a></span>&#160;  <a class="code" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">ConstTensorRef</a> <a class="code" href="structcutlass_1_1TileAllocation.html#afcdc0be82acf0b4ae66468e2170c5a0d">reference</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">ConstTensorRef</a>(<a class="code" href="structcutlass_1_1TileAllocation.html#a69c43b27939e9ecebd23edb18ed3a9dc">data</a>(), <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(Strides::kD, Strides::kH, Strides::kW, Strides::kC));</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  }</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;};</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> First_, <span class="keyword">typename</span> Second_&gt;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileAllocation.html">  100</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ZipTileAllocation.html">ZipTileAllocation</a> {</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">  106</a></span>&#160;  <span class="keyword">typedef</span> First_ <a class="code" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">First</a>;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">  109</a></span>&#160;  <span class="keyword">typedef</span> Second_ <a class="code" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">Second</a>;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">  112</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef&lt;typename First::TensorRef, typename Second::TensorRef&gt;</a> <a class="code" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">TensorRef</a>;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef&lt;typename First::ConstTensorRef, typename Second::ConstTensorRef&gt;</a></div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">  116</a></span>&#160;      <a class="code" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">ConstTensorRef</a>;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014">  123</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">First</a> <a class="code" href="structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014">first</a>;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc">  126</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">Second</a> <a class="code" href="structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc">second</a>;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileAllocation.html#a0d00001220df7f2bdb1f09ae3f37c585">  134</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipTensorRef.html">TensorRef</a> <a class="code" href="structcutlass_1_1ZipTileAllocation.html#a0d00001220df7f2bdb1f09ae3f37c585">reference</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">TensorRef</a>(<a class="code" href="structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014">first</a>.reference(), <a class="code" href="structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc">second</a>.reference()); }</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00138"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileAllocation.html#af9964904e789b3ab58334f1ec1ceee56">  138</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipTensorRef.html">ConstTensorRef</a> <a class="code" href="structcutlass_1_1ZipTileAllocation.html#af9964904e789b3ab58334f1ec1ceee56">reference</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">ConstTensorRef</a>(<a class="code" href="structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014">first</a>.reference(), <a class="code" href="structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc">second</a>.reference()); }</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;};</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html_a0d00001220df7f2bdb1f09ae3f37c585"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html#a0d00001220df7f2bdb1f09ae3f37c585">cutlass::ZipTileAllocation::reference</a></div><div class="ttdeci">CUTLASS_DEVICE TensorRef reference()</div><div class="ttdoc">Returns a TensorRef object pointing to the data. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:134</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html_aba6d5cfb32cfed340d8af2971ec50af4"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html#aba6d5cfb32cfed340d8af2971ec50af4">cutlass::ZipTileAllocation::ConstTensorRef</a></div><div class="ttdeci">ZipTensorRef&lt; typename First::ConstTensorRef, typename Second::ConstTensorRef &gt; ConstTensorRef</div><div class="ttdoc">Defines the tensor reference for this allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:116</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeStrides_html_a76cde4c3ebd1d191e0191826b2663be4"><div class="ttname"><a href="structcutlass_1_1ShapeStrides.html#a76cde4c3ebd1d191e0191826b2663be4">cutlass::ShapeStrides::Shape</a></div><div class="ttdeci">Shape&lt; Shape_::kH *Shape_::kW *Shape_::kC, Shape_::kW *Shape_::kC, Shape_::kC, elementsPerAccess &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:170</div></div>
+<div class="ttc" id="tensor__ref_8h_html"><div class="ttname"><a href="tensor__ref_8h.html">tensor_ref.h</a></div><div class="ttdoc">Defines a structure containing strides, bounds, and a pointer to tensor data. </div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a></div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:38</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_aa0bf6caeab13dc004350c6c0cfe0df80"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#aa0bf6caeab13dc004350c6c0cfe0df80">cutlass::TileAllocation::TensorRef</a></div><div class="ttdeci">TensorRef&lt; Scalar, 4 &gt; TensorRef</div><div class="ttdoc">Defines the tensor reference for this allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_acc3f2c29fe21316091a1405613083000"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#acc3f2c29fe21316091a1405613083000">cutlass::TileAllocation::data</a></div><div class="ttdeci">CUTLASS_DEVICE Scalar const  * data() const</div><div class="ttdoc">Returns a const pointer to the raw data. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:81</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_a3466ef2b478e4617aa1ff261217cfd05"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#a3466ef2b478e4617aa1ff261217cfd05">cutlass::TileAllocation::reference</a></div><div class="ttdeci">CUTLASS_DEVICE TensorRef reference()</div><div class="ttdoc">Returns a TensorRef object pointing to the data. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:85</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html_ac6b988a7e6cd8ec83fae642342209527"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html#ac6b988a7e6cd8ec83fae642342209527">cutlass::ZipTileAllocation::Second</a></div><div class="ttdeci">Second_ Second</div><div class="ttdoc">Second tensor allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:109</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_a3c1ba61c511110b14558941367ad4604"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#a3c1ba61c511110b14558941367ad4604">cutlass::TileAllocation::storage</a></div><div class="ttdeci">Storage storage[Shape::kD][Shape::kH][Shape::kW][Shape::kC]</div><div class="ttdoc">Storage. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html_a1c274bfb4401beabaf62fed9c2054ddf"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html#a1c274bfb4401beabaf62fed9c2054ddf">cutlass::ZipTileAllocation::TensorRef</a></div><div class="ttdeci">ZipTensorRef&lt; typename First::TensorRef, typename Second::TensorRef &gt; TensorRef</div><div class="ttdoc">Defines the tensor reference for this allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:112</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_aba9164abe2fd7a091a858b23c0d3ac9c"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#aba9164abe2fd7a091a858b23c0d3ac9c">cutlass::TileAllocation::Strides</a></div><div class="ttdeci">ShapeStrides&lt; Shape, 1 &gt;::Shape Strides</div><div class="ttdoc">Strides. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:56</div></div>
+<div class="ttc" id="structcutlass_1_1Shape_html_a3a20d9062bba613c160bb2cd14f80a5e"><div class="ttname"><a href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">cutlass::Shape::kH</a></div><div class="ttdeci">static int const kH</div><div class="ttdoc">The height of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:68</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html_a94abc7e74632b14718fd2d5b78cceafc"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html#a94abc7e74632b14718fd2d5b78cceafc">cutlass::ZipTileAllocation::second</a></div><div class="ttdeci">Second second</div><div class="ttdoc">Second tensor allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:126</div></div>
+<div class="ttc" id="structcutlass_1_1StorageType_html"><div class="ttname"><a href="structcutlass_1_1StorageType.html">cutlass::StorageType</a></div><div class="ttdef"><b>Definition:</b> fragment.h:76</div></div>
+<div class="ttc" id="structcutlass_1_1Shape_html_a3f2433fd6401dd28f1130499f9fd340c"><div class="ttname"><a href="structcutlass_1_1Shape.html#a3f2433fd6401dd28f1130499f9fd340c">cutlass::Shape::kC</a></div><div class="ttdeci">static int const kC</div><div class="ttdoc">The number of scalars per element. </div><div class="ttdef"><b>Definition:</b> shape.h:72</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_a122fa067390f45b29946286271654033"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#a122fa067390f45b29946286271654033">cutlass::TileAllocation::ConstTensorRef</a></div><div class="ttdeci">TensorRef&lt; Scalar const, 4 &gt; ConstTensorRef</div><div class="ttdoc">Defines the tensor reference for this allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:59</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html_a6c0f139eef549521763b36cb1e45a014"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html#a6c0f139eef549521763b36cb1e45a014">cutlass::ZipTileAllocation::first</a></div><div class="ttdeci">First first</div><div class="ttdoc">First tensor allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:123</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_afcdc0be82acf0b4ae66468e2170c5a0d"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#afcdc0be82acf0b4ae66468e2170c5a0d">cutlass::TileAllocation::reference</a></div><div class="ttdeci">CUTLASS_DEVICE ConstTensorRef reference() const</div><div class="ttdoc">Returns a TensorRef object pointing to the data. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:91</div></div>
+<div class="ttc" id="zip__tensor__ref_8h_html"><div class="ttname"><a href="zip__tensor__ref_8h.html">zip_tensor_ref.h</a></div><div class="ttdoc">Defines a structure containing a pair of TensorRef-like objects. </div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_a98f1243dc279999e3ff083ef45dee3f6"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#a98f1243dc279999e3ff083ef45dee3f6">cutlass::TileAllocation::Scalar</a></div><div class="ttdeci">Scalar_ Scalar</div><div class="ttdoc">Scalar element. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:47</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html">cutlass::ZipTileAllocation</a></div><div class="ttdoc">Manages a pair of tile allocations as if they are one allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:100</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_a2254302a3ce0b4da5c3657ada0cb8ccc"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#a2254302a3ce0b4da5c3657ada0cb8ccc">cutlass::TileAllocation::Shape</a></div><div class="ttdeci">Shape_ Shape</div><div class="ttdoc">Size of the allocation in units of scalars. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:53</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html">cutlass::TileAllocation</a></div><div class="ttdoc">Class for storing a tile in memory and accessing it through a tensor ref. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:41</div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_a69c43b27939e9ecebd23edb18ed3a9dc"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#a69c43b27939e9ecebd23edb18ed3a9dc">cutlass::TileAllocation::data</a></div><div class="ttdeci">CUTLASS_DEVICE Scalar * data()</div><div class="ttdoc">Returns a pointer to the raw data. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:77</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html_af9964904e789b3ab58334f1ec1ceee56"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html#af9964904e789b3ab58334f1ec1ceee56">cutlass::ZipTileAllocation::reference</a></div><div class="ttdeci">CUTLASS_DEVICE ConstTensorRef reference() const</div><div class="ttdoc">Returns a TensorRef object pointing to the data. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:138</div></div>
+<div class="ttc" id="structcutlass_1_1Shape_html_a78836a20250ff24c25a6622ad818b421"><div class="ttname"><a href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">cutlass::Shape::kW</a></div><div class="ttdeci">static int const kW</div><div class="ttdoc">The width of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:70</div></div>
+<div class="ttc" id="structcutlass_1_1Shape_html_a19086a5567d6c710ec853e35a7f29c25"><div class="ttname"><a href="structcutlass_1_1Shape.html#a19086a5567d6c710ec853e35a7f29c25">cutlass::Shape::kD</a></div><div class="ttdeci">static int const kD</div><div class="ttdoc">The depth of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:66</div></div>
+<div class="ttc" id="shape_8h_html"><div class="ttname"><a href="shape_8h.html">shape.h</a></div><div class="ttdoc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects. </div></div>
+<div class="ttc" id="structcutlass_1_1TileAllocation_html_ace1f396620f3eb69c367bdf69aa27ebd"><div class="ttname"><a href="structcutlass_1_1TileAllocation.html#ace1f396620f3eb69c367bdf69aa27ebd">cutlass::TileAllocation::Storage</a></div><div class="ttdeci">StorageType&lt; sizeof(Scalar)&gt;::Type Storage</div><div class="ttdoc">The actual storage (may differ from the scalar type) </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:50</div></div>
+<div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileAllocation_html_acbdbed808b27997a0e8c22adfa9cc9b2"><div class="ttname"><a href="structcutlass_1_1ZipTileAllocation.html#acbdbed808b27997a0e8c22adfa9cc9b2">cutlass::ZipTileAllocation::First</a></div><div class="ttdeci">First_ First</div><div class="ttdoc">First tensor allocation. </div><div class="ttdef"><b>Definition:</b> tile_allocation.h:106</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tile__coord_8h.html b/docs/tile__coord_8h.html
new file mode 100644
index 000000000..953deb98d
--- /dev/null
+++ b/docs/tile__coord_8h.html
@@ -0,0 +1,107 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: tile_coord.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">tile_coord.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Defines a coordinate used for the CUTLASS 4-D tile structure.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+</div>
+<p><a href="tile__coord_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileCoord.html">cutlass::TileCoord&lt; Index_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tile__coord_8h_source.html b/docs/tile__coord_8h_source.html
new file mode 100644
index 000000000..9fb8d1fa9
--- /dev/null
+++ b/docs/tile__coord_8h_source.html
@@ -0,0 +1,128 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: tile_coord.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">tile_coord.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="tile__coord_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html">   40</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileCoord.html">TileCoord</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1Coord.html">Coord</a>&lt;4, Index_&gt; {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  </div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">   43</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a>;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">   46</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4, Index&gt;</a> <a class="code" href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">Base</a>;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ab5ebf352327baadcc740175d6b39adcb">   49</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileCoord.html#ab5ebf352327baadcc740175d6b39adcb">kD</a> = 0;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a24d32587359493bb965745f5551e1624">   52</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileCoord.html#a24d32587359493bb965745f5551e1624">kH</a> = 1;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ac2c14af3ceffd5ef8f17c9e0efb4e5ec">   55</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileCoord.html#ac2c14af3ceffd5ef8f17c9e0efb4e5ec">kW</a> = 2;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a8236879e1670072033983b7ec4b7ae32">   58</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileCoord.html#a8236879e1670072033983b7ec4b7ae32">kC</a> = 3;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">   66</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">TileCoord</a>() { }</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00070"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ac760795433c0f0ccc5c44fb58626f51d">   70</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#ac760795433c0f0ccc5c44fb58626f51d">TileCoord</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3, Index&gt;</a> <span class="keyword">const</span> &amp;coord): </div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Base</a>(<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(coord[0], coord[1], coord[2], 0)) { }</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a752dcc11f1a018de692e5846a80fe185">   75</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a752dcc11f1a018de692e5846a80fe185">TileCoord</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4, Index&gt;</a> <span class="keyword">const</span> &amp;coord): <a class="code" href="structcutlass_1_1Coord.html">Base</a>(coord) { }</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a2ff6ac0ad18cff304ee7f79597fdc274">   79</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a2ff6ac0ad18cff304ee7f79597fdc274">TileCoord</a>(<a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> coord[4]): <a class="code" href="structcutlass_1_1Coord.html">Base</a>(coord) { }</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;  </div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a28ee00699941f879cfa92327c038fca6">   83</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a28ee00699941f879cfa92327c038fca6">TileCoord</a>(<a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <a class="code" href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">d</a>, <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <a class="code" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">h</a>, <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <a class="code" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">w</a>, <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <a class="code" href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">c</a>): <a class="code" href="structcutlass_1_1Coord.html">Base</a>(<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">d</a>, <a class="code" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">h</a>, <a class="code" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">w</a>, <a class="code" href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">c</a>)) { }</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00087"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">   87</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">d</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kD); }</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00091"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#aec4ffcdc8fbf57a8b649fff38af55007">   91</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &amp; <a class="code" href="structcutlass_1_1TileCoord.html#aec4ffcdc8fbf57a8b649fff38af55007">d</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kD); }</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">   95</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">h</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kH); }</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a1d91ffa0a63ad03431ff79185526f92f">   99</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &amp; <a class="code" href="structcutlass_1_1TileCoord.html#a1d91ffa0a63ad03431ff79185526f92f">h</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kH); }</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">  103</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">w</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kW); }</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a8f83026751c83f57c1854c8544e75bd0">  107</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &amp; <a class="code" href="structcutlass_1_1TileCoord.html#a8f83026751c83f57c1854c8544e75bd0">w</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kW); }</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">  111</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> <span class="keyword">const</span> &amp; <a class="code" href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">c</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kC); }</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ad8281750f2978c6c1c91982f347a14cd">  115</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">Index</a> &amp; <a class="code" href="structcutlass_1_1TileCoord.html#ad8281750f2978c6c1c91982f347a14cd">c</a>() { <span class="keywordflow">return</span> this-&gt;<a class="code" href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">at</a>(kC); }</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a0927c4ba212d00f3687034afe6bb8daf">  119</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;2&gt;</a> <a class="code" href="structcutlass_1_1TileCoord.html#a0927c4ba212d00f3687034afe6bb8daf">hw</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">h</a>(), <a class="code" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">w</a>());</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  }</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a11bb7593ce7bba2dcedd199322a8b42b">  125</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1TileCoord.html#a11bb7593ce7bba2dcedd199322a8b42b">hwc</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">h</a>(), <a class="code" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">w</a>(), <a class="code" href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">c</a>());</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  }</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#abe65d1a0ff3798b662376032d51e9713">  131</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1TileCoord.html#abe65d1a0ff3798b662376032d51e9713">dhw</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">d</a>(), <a class="code" href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">h</a>(), <a class="code" href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">w</a>());</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  }</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <span class="comment">// Coord operators</span></div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00141"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a3bfa2daa0e63144c1e8510ba336f185b">  141</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html">TileCoord</a> <a class="code" href="structcutlass_1_1TileCoord.html#a3bfa2daa0e63144c1e8510ba336f185b">operator+</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">TileCoord</a>(Base::operator+(b));</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  }</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00147"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a9f274d8e93f9cd3e0a9699e11b85fa7c">  147</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html">TileCoord</a> <a class="code" href="structcutlass_1_1TileCoord.html#a9f274d8e93f9cd3e0a9699e11b85fa7c">operator-</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">TileCoord</a>(Base::operator-(b));</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;  }</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00153"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ab8fbb13cc5ea4f580a7fc32963de9553">  153</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html">TileCoord</a> <a class="code" href="structcutlass_1_1TileCoord.html#ab8fbb13cc5ea4f580a7fc32963de9553">operator*</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">TileCoord</a>(Base::operator*(b));</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  }</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a5d2cc915343a3b90fb530348ddd329d2">  159</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html">TileCoord</a> <a class="code" href="structcutlass_1_1TileCoord.html#a5d2cc915343a3b90fb530348ddd329d2">operator/</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b)<span class="keyword"> const </span>{</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">TileCoord</a>(Base::operator/(b));</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  }</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00165"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a812760c633ea813db8a2bc24826c68df">  165</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html">TileCoord</a>&amp; <a class="code" href="structcutlass_1_1TileCoord.html#a812760c633ea813db8a2bc24826c68df">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">Base::operator+=</a>(b);</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  }</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#a02da20e580962fe0754a772842045389">  172</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html">TileCoord</a>&amp; <a class="code" href="structcutlass_1_1TileCoord.html#a02da20e580962fe0754a772842045389">operator-=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">Base::operator-=</a>(b);</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  }</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ae946b3af6b795d26632da7ca66b3751c">  179</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html">TileCoord</a>&amp; <a class="code" href="structcutlass_1_1TileCoord.html#ae946b3af6b795d26632da7ca66b3751c">operator*=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">Base::operator*=</a>(b);</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;  }</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileCoord.html#ac3207d8aa879c86a907cdcc93ccb2eb5">  186</a></span>&#160;  <a class="code" href="structcutlass_1_1TileCoord.html">TileCoord</a>&amp; <a class="code" href="structcutlass_1_1TileCoord.html#ac3207d8aa879c86a907cdcc93ccb2eb5">operator/=</a>(<a class="code" href="structcutlass_1_1Coord.html">Base</a> <span class="keyword">const</span>&amp; b) {</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">Base::operator/=</a>(b);</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;  }</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;};</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1TileCoord_html_a8236879e1670072033983b7ec4b7ae32"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a8236879e1670072033983b7ec4b7ae32">cutlass::TileCoord::kC</a></div><div class="ttdeci">static int kC</div><div class="ttdoc">C dimension. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:58</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ab5ebf352327baadcc740175d6b39adcb"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ab5ebf352327baadcc740175d6b39adcb">cutlass::TileCoord::kD</a></div><div class="ttdeci">static int kD</div><div class="ttdoc">D dimension. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:49</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a24d32587359493bb965745f5551e1624"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a24d32587359493bb965745f5551e1624">cutlass::TileCoord::kH</a></div><div class="ttdeci">static int kH</div><div class="ttdoc">H dimension. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:52</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_abe65d1a0ff3798b662376032d51e9713"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#abe65d1a0ff3798b662376032d51e9713">cutlass::TileCoord::dhw</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; dhw() const</div><div class="ttdoc">Gets D, H, and W dimensions as a Coord&lt;3&gt; </div><div class="ttdef"><b>Definition:</b> tile_coord.h:131</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_aeebb556622fe87c0902448de13a30e0c"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#aeebb556622fe87c0902448de13a30e0c">cutlass::TileCoord::c</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; c() const</div><div class="ttdoc">Returns the Celement of the coordinate. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:111</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ac7c697a6fd23c7f49ff19aa6db4a41a3"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ac7c697a6fd23c7f49ff19aa6db4a41a3">cutlass::TileCoord::h</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; h() const</div><div class="ttdoc">Returns the H element of the coordinate. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:95</div></div>
+<div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a7018df7f2dbc7d70345d5f076fb26259"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a7018df7f2dbc7d70345d5f076fb26259">cutlass::TileCoord::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a21ae028c4ee3e5cbe5bf9d47a41e6613"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a21ae028c4ee3e5cbe5bf9d47a41e6613">cutlass::TileCoord::w</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; w() const</div><div class="ttdoc">Returns the W element of the coordinate. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:103</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a07a067df652b64bd580f2ddf373e292b"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a07a067df652b64bd580f2ddf373e292b">cutlass::TileCoord::d</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index const  &amp; d() const</div><div class="ttdoc">Returns the D element of the coordinate. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:87</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a02da20e580962fe0754a772842045389"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a02da20e580962fe0754a772842045389">cutlass::TileCoord::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord &amp; operator-=(Base const &amp;b)</div><div class="ttdoc">In-place subtraction. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:172</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a28ee00699941f879cfa92327c038fca6"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a28ee00699941f879cfa92327c038fca6">cutlass::TileCoord::TileCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord(Index d, Index h, Index w, Index c)</div><div class="ttdoc">Helper to construct from a row and column. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:83</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a752dcc11f1a018de692e5846a80fe185"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a752dcc11f1a018de692e5846a80fe185">cutlass::TileCoord::TileCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord(Coord&lt; 4, Index &gt; const &amp;coord)</div><div class="ttdoc">Constructs from Coord&lt;4&gt; </div><div class="ttdef"><b>Definition:</b> tile_coord.h:75</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ab8fbb13cc5ea4f580a7fc32963de9553"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ab8fbb13cc5ea4f580a7fc32963de9553">cutlass::TileCoord::operator*</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord operator*(Base const &amp;b) const</div><div class="ttdoc">Element-wise multiplication. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ad8281750f2978c6c1c91982f347a14cd"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ad8281750f2978c6c1c91982f347a14cd">cutlass::TileCoord::c</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; c()</div><div class="ttdoc">Returns the C element of the coordinate. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:115</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ad4303b578b72b5cb2a0198375290e168"><div class="ttname"><a href="structcutlass_1_1Coord.html#ad4303b578b72b5cb2a0198375290e168">cutlass::Coord::operator*=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator*=(Coord const &amp;b)</div><div class="ttdoc">In-place multiplication. </div><div class="ttdef"><b>Definition:</b> coord.h:197</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ac760795433c0f0ccc5c44fb58626f51d"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ac760795433c0f0ccc5c44fb58626f51d">cutlass::TileCoord::TileCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord(Coord&lt; 3, Index &gt; const &amp;coord)</div><div class="ttdoc">Constructs from Coord&lt;3&gt; and infers coord[kC] = 0. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:70</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a9f274d8e93f9cd3e0a9699e11b85fa7c"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a9f274d8e93f9cd3e0a9699e11b85fa7c">cutlass::TileCoord::operator-</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord operator-(Base const &amp;b) const</div><div class="ttdoc">Element-wise subtraction. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:147</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ae946b3af6b795d26632da7ca66b3751c"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ae946b3af6b795d26632da7ca66b3751c">cutlass::TileCoord::operator*=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord &amp; operator*=(Base const &amp;b)</div><div class="ttdoc">In-place multiplication. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:179</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html"><div class="ttname"><a href="structcutlass_1_1TileCoord.html">cutlass::TileCoord</a></div><div class="ttdef"><b>Definition:</b> tile_coord.h:40</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a11bb7593ce7bba2dcedd199322a8b42b"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a11bb7593ce7bba2dcedd199322a8b42b">cutlass::TileCoord::hwc</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 3 &gt; hwc() const</div><div class="ttdoc">Gets H, W, and C dimensions as a Coord&lt;3&gt; </div><div class="ttdef"><b>Definition:</b> tile_coord.h:125</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ae0c8cd0657a73f3ffff99e9546ea8a95"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ae0c8cd0657a73f3ffff99e9546ea8a95">cutlass::TileCoord::TileCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord()</div><div class="ttdoc">Default ctor. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a8f83026751c83f57c1854c8544e75bd0"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a8f83026751c83f57c1854c8544e75bd0">cutlass::TileCoord::w</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; w()</div><div class="ttdoc">Returns the W element of the coordinate. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:107</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a0927c4ba212d00f3687034afe6bb8daf"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a0927c4ba212d00f3687034afe6bb8daf">cutlass::TileCoord::hw</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 2 &gt; hw() const</div><div class="ttdoc">Gets H and W dimensions as a Coord&lt;2&gt; </div><div class="ttdef"><b>Definition:</b> tile_coord.h:119</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a304334cbcad636d7b058fdc6310f0e6b"><div class="ttname"><a href="structcutlass_1_1Coord.html#a304334cbcad636d7b058fdc6310f0e6b">cutlass::Coord::operator-=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator-=(Coord const &amp;b)</div><div class="ttdoc">In-place subtraction. </div><div class="ttdef"><b>Definition:</b> coord.h:188</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a5d2cc915343a3b90fb530348ddd329d2"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a5d2cc915343a3b90fb530348ddd329d2">cutlass::TileCoord::operator/</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord operator/(Base const &amp;b) const</div><div class="ttdoc">Element-wise division. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ae4f2cb12b84411118cb93e7c4cb88b20"><div class="ttname"><a href="structcutlass_1_1Coord.html#ae4f2cb12b84411118cb93e7c4cb88b20">cutlass::Coord::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator+=(Coord const &amp;b)</div><div class="ttdoc">In-place addition. </div><div class="ttdef"><b>Definition:</b> coord.h:179</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ab40c6bb58967d6be5a349bf6276c2eca"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ab40c6bb58967d6be5a349bf6276c2eca">cutlass::TileCoord::Base</a></div><div class="ttdeci">Coord&lt; 4, Index &gt; Base</div><div class="ttdoc">Underlying Coord&lt;4&gt; </div><div class="ttdef"><b>Definition:</b> tile_coord.h:46</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_a9eff24a3b74b68d11839b92324613c93"><div class="ttname"><a href="structcutlass_1_1Coord.html#a9eff24a3b74b68d11839b92324613c93">cutlass::Coord&lt; 4, Index_ &gt;::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; at()</div><div class="ttdoc">Gets the index of a given Coord element. </div><div class="ttdef"><b>Definition:</b> coord.h:240</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ac3207d8aa879c86a907cdcc93ccb2eb5"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ac3207d8aa879c86a907cdcc93ccb2eb5">cutlass::TileCoord::operator/=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord &amp; operator/=(Base const &amp;b)</div><div class="ttdoc">In-place division. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:186</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html_ac87199c4c9a4e20aac4eb6e3b9a68f28"><div class="ttname"><a href="structcutlass_1_1Coord.html#ac87199c4c9a4e20aac4eb6e3b9a68f28">cutlass::Coord::operator/=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord &amp; operator/=(Coord const &amp;b)</div><div class="ttdoc">In-place division. </div><div class="ttdef"><b>Definition:</b> coord.h:206</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a2ff6ac0ad18cff304ee7f79597fdc274"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a2ff6ac0ad18cff304ee7f79597fdc274">cutlass::TileCoord::TileCoord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord(Index coord[4])</div><div class="ttdoc">Constructs from an array of coordinate elements. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:79</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_ac2c14af3ceffd5ef8f17c9e0efb4e5ec"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#ac2c14af3ceffd5ef8f17c9e0efb4e5ec">cutlass::TileCoord::kW</a></div><div class="ttdeci">static int kW</div><div class="ttdoc">W dimension. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:55</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:49</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a1d91ffa0a63ad03431ff79185526f92f"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a1d91ffa0a63ad03431ff79185526f92f">cutlass::TileCoord::h</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; h()</div><div class="ttdoc">Returns the H element of the coordinate. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a812760c633ea813db8a2bc24826c68df"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a812760c633ea813db8a2bc24826c68df">cutlass::TileCoord::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord &amp; operator+=(Base const &amp;b)</div><div class="ttdoc">In-place addition. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:165</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_a3bfa2daa0e63144c1e8510ba336f185b"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#a3bfa2daa0e63144c1e8510ba336f185b">cutlass::TileCoord::operator+</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileCoord operator+(Base const &amp;b) const</div><div class="ttdoc">Element-wise addition. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:141</div></div>
+<div class="ttc" id="structcutlass_1_1TileCoord_html_aec4ffcdc8fbf57a8b649fff38af55007"><div class="ttname"><a href="structcutlass_1_1TileCoord.html#aec4ffcdc8fbf57a8b649fff38af55007">cutlass::TileCoord::d</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index &amp; d()</div><div class="ttdoc">Returns the D element of the coordinate. </div><div class="ttdef"><b>Definition:</b> tile_coord.h:91</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tile__iterator_8h.html b/docs/tile__iterator_8h.html
index 2b778c190..fb872e973 100644
--- a/docs/tile__iterator_8h.html
+++ b/docs/tile__iterator_8h.html
@@ -82,10 +82,13 @@ $(function() {
 
 <p>Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="load__store_8h_source.html">cutlass/load_store.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="predicate__vector_8h_source.html">cutlass/predicate_vector.h</a>&gt;</code><br />
-<code>#include &lt;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tensor__ref_8h_source.html">cutlass/tensor_ref.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="fragment_8h_source.html">cutlass/fragment.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="load__store_8h_source.html">cutlass/load_store.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="predicate__vector_8h_source.html">cutlass/predicate_vector.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&quot;</code><br />
+<code>#include &lt;cstdio&gt;</code><br />
 </div>
 <p><a href="tile__iterator_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -94,28 +97,30 @@ Classes</h2></td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1IteratorAdvance.html">cutlass::IteratorAdvance</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies dimension in which post-increment accesses advance.  <a href="structcutlass_1_1IteratorAdvance.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1IteratorFragment.html">cutlass::IteratorFragment</a></td></tr>
-<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix.  <a href="structcutlass_1_1IteratorFragment.html#details">More...</a><br /></td></tr>
-<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileTraits.html">cutlass::TileTraits&lt; Tile_, Delta_, Iterations_, ThreadOffset_, AccessSize &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">A template defining <a class="el" href="group__tile__traits__concept.html">Tile Traits Concept</a>.  <a href="structcutlass_1_1TileTraits.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor&lt; Delta_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Functor computing a predicate given the logical position of an access.  <a href="structcutlass_1_1RegularTilePredicateFunctor.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1DumpType.html">cutlass::DumpType&lt; T &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Iterator for accessing a stripmined tile in memory.  <a href="structcutlass_1_1TileIteratorBase.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters to the iterator.  <a href="structcutlass_1_1TileIteratorBase_1_1Params.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">An iterator implementing <a class="el" href="group__tile__load__iterator__concept.html">Tile Load Iterator Concept</a> for loading a tile from memory.  <a href="structcutlass_1_1TileLoadIterator.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters.  <a href="structcutlass_1_1TileLoadIterator_1_1Params.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">An iterator implementing <a class="el" href="group__tile__store__iterator__concept.html">Tile Store Iterator Concept</a> for storing a tile to memory.  <a href="structcutlass_1_1TileStoreIterator.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt;::Params</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt;::Params</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters.  <a href="structcutlass_1_1TileStoreIterator_1_1Params.html#details">More...</a><br /></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
@@ -127,7 +132,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/tile__iterator_8h_source.html b/docs/tile__iterator_8h_source.html
index 69ef0b175..7c0ade6bf 100644
--- a/docs/tile__iterator_8h_source.html
+++ b/docs/tile__iterator_8h_source.html
@@ -76,169 +76,216 @@ $(function() {
 <div class="title">tile_iterator.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="tile__iterator_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="load__store_8h.html">cutlass/load_store.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="predicate__vector_8h.html">cutlass/predicate_vector.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1IteratorAdvance.html">   61</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1IteratorAdvance.html">IteratorAdvance</a> {</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">   62</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">Kind</a> { <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5">kD</a>, <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">kH</a>, <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">kW</a> };</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;};</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1IteratorFragment.html">   66</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1IteratorFragment.html">IteratorFragment</a> {</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">   67</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">Kind</a> { <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954">kScalar</a>, <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">kWmmaMatrix</a> };</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;};</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Delta_, <span class="keyword">typename</span> Iterations_, <span class="keyword">typename</span> ThreadOffset_&gt;</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html">   77</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraits.html">TileTraits</a> {</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831">   79</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831">Tile</a>;</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb">   82</a></span>&#160;  <span class="keyword">typedef</span> Delta_ <a class="code" href="structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb">Delta</a>;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469">   85</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469">Iterations</a>;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd">   88</a></span>&#160;  <span class="keyword">typedef</span> ThreadOffset_ <a class="code" href="structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd">ThreadOffset</a>;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;};</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Traits_,</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;          <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> Advance_ = <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">MemorySpace::kGeneric</a>,</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;          <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;          <span class="keyword">typename</span> FragmentElement_ = Scalar_,</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;          <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> IteratorFragment_ = <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954">IteratorFragment::kScalar</a>,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;          <span class="keyword">typename</span> Skew_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, 0, 0&gt;</a> &gt;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html">  102</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a> {</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">  104</a></span>&#160;  <span class="keyword">typedef</span> Traits_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Traits</a>;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">  107</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a>;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">  110</a></span>&#160;  <span class="keyword">typedef</span> FragmentElement_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">FragmentElement</a>;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">  113</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a> = Advance_;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">  116</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a> = IteratorFragment_;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">  119</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">  122</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a>;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">  125</a></span>&#160;  <span class="keyword">typedef</span> Skew_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Skew</a>;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">  128</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Tile <a class="code" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Tile</a>;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">  131</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Delta <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Delta</a>;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">  134</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ImmediateOffsetStrides <a class="code" href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">  137</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Iterations <a class="code" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Iterations</a>;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">  140</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ThreadOffset <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a>;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">  143</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a> = Tile::kC;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">  146</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;FragmentElement, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">  149</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a> =</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;      (<a class="code" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">kIteratorFragment</a> == <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">IteratorFragment::kWmmaMatrix</a> ? 16 : <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">AccessType</a>));</div><div class="line"><a name="l00152"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">  152</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment&lt;Scalar, ShapeCount&lt;Tile&gt;::kCount</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">kFragmentSize</a>&gt; <a class="code" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Storage</a>;</div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">  154</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment&lt;FragmentElement, ShapeCount&lt;Iterations&gt;::kCount</a> * <a class="code" href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a>;</div><div class="line"><a name="l00156"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">  156</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator&lt;Fragment, Iterations, AccessType&gt;</a> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a>;</div><div class="line"><a name="l00158"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">  158</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator&lt;Fragment, Iterations, AccessType&gt;</a> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">FragmentConstIterator</a>;</div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">  160</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">FragmentShape</a>;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">  163</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector&lt;ShapeCount&lt;Iterations&gt;::kCount</a>&gt; <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">PredicateVector</a>;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <span class="comment">// Params struct</span></div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html">  170</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Params</a> {</div><div class="line"><a name="l00171"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">  171</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a>;</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">  172</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>;</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">  173</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;</div><div class="line"><a name="l00175"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">  175</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a>;</div><div class="line"><a name="l00176"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">  176</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a>;</div><div class="line"><a name="l00177"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">  177</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a>;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">  179</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a>;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">  183</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">initialize</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d,</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h,</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w,</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d,</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h,</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w,</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance) {</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a> = _stride_d;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a> = _stride_h;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a> = _stride_w;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a> = _inc_d;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a> = _inc_h;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a> = _inc_w;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a> = _inc_advance;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    }</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">  203</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">initialize</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w) {</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a> = _stride_d;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a> = _stride_h;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a> = _stride_w;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a> * Delta::kW;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a> * Delta::kH - <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a> * Delta::kW * (Iterations::kW - 1);</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;        <span class="comment">// Advance in the H dimension.</span></div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a> = 0;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">IteratorAdvance::kW</a>) {</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;        <span class="comment">// Advance in the W dimension.</span></div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a> * Tile::kW - <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a> * Tile::kH;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;        <span class="comment">// Advance in the D dimension.</span></div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a>;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      }</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a> = 0;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    }</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">  227</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">initialize</a>() {</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a> = 0;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a> = 0;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a> = 1;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a> = 0;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;    }</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  };</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div><div class="line"><a name="l00239"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">  239</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  <span class="comment">// Static function members</span></div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00247"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">  247</a></span>&#160;  CUTLASS_DEVICE <span class="keyword">static</span> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;                                                   <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;bounds,</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;                                                   <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0)) {</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Iterations::kD; ++d) {</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <span class="keywordtype">bool</span> enable_d = (d * Delta::kD + offset[0] &lt; bounds[0]);</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;        <span class="keywordtype">bool</span> enable_h = (h * Delta::kH + offset[1] &lt; bounds[1]);</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w) {</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;          <span class="keywordtype">bool</span> enable_w = (w * Tile::kC * Delta::kW + offset[2] &lt; bounds[2]);</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;          predicate_it.set(d, h, w, 0, enable_d &amp;&amp; enable_h &amp;&amp; enable_w);</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;        }</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;      }</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;    }</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;  }</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;};</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Traits_,</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;          <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> Advance_ = <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> MemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">MemorySpace::kGeneric</a>,</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;          <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;          <span class="keyword">typename</span> FragmentElement_ = Scalar_,</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;          <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> IteratorFragment_ = <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954">IteratorFragment::kScalar</a>,</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;          <span class="keyword">typename</span> Skew_ = Shape&lt;0, 0, 0, 0&gt; &gt;</div><div class="line"><a name="l00302"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html">  302</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_,</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;                                                  Scalar_,</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;                                                  Advance_,</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;                                                  MemorySpace,</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;                                                  Index_,</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;                                                  FragmentElement_,</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;                                                  IteratorFragment_,</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;                                                  Skew_&gt; {</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_,</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;                           Scalar_,</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;                           Advance_,</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>,</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;                           Index_,</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;                           FragmentElement_,</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;                           IteratorFragment_,</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                           Skew_&gt;</div><div class="line"><a name="l00319"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">  319</a></span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">Base</a>;</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;</div><div class="line"><a name="l00322"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">  322</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Base::Traits</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">Traits</a>;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;</div><div class="line"><a name="l00325"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">  325</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Base::Scalar</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a>;</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;</div><div class="line"><a name="l00328"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">  328</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">Base::FragmentElement</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">FragmentElement</a>;</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;</div><div class="line"><a name="l00331"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">  331</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">kAdvance</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">Base::kAdvance</a>;</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;</div><div class="line"><a name="l00334"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">  334</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">kIteratorFragment</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">Base::kIteratorFragment</a>;</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;</div><div class="line"><a name="l00337"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">  337</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">kMemorySpace</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">Base::kMemorySpace</a>;</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;</div><div class="line"><a name="l00340"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36">  340</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Base::Index</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36">Index</a>;</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;</div><div class="line"><a name="l00343"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">  343</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::Skew</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">Skew</a>;</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">  346</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Base::Tile</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">Tile</a>;</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;</div><div class="line"><a name="l00349"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">  349</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Base::Delta</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">Delta</a>;</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div><div class="line"><a name="l00352"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">  352</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Base::Iterations</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">Iterations</a>;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;</div><div class="line"><a name="l00355"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">  355</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">Base::ThreadOffset</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">ThreadOffset</a>;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;</div><div class="line"><a name="l00358"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">  358</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">Base::FragmentShape</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">FragmentShape</a>;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;</div><div class="line"><a name="l00361"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">  361</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">AccessType</a>;</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;</div><div class="line"><a name="l00364"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">  364</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Base::Fragment</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">Fragment</a>;</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;</div><div class="line"><a name="l00367"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">  367</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">Base::FragmentIterator</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">FragmentIterator</a>;</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;</div><div class="line"><a name="l00370"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">  370</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">Base::FragmentConstIterator</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">FragmentConstIterator</a>;</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div><div class="line"><a name="l00373"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328">  373</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">Base::PredicateVector</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328">PredicateVector</a>;</div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;</div><div class="line"><a name="l00376"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">  376</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Base::Storage</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a>;</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;</div><div class="line"><a name="l00379"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">  379</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Base::Params <a class="code" href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">BaseParams</a>;</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;</div><div class="line"><a name="l00382"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc">  382</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc">kRequiresLoadFence</a> = Tile::kD == 1 };</div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;</div><div class="line"><a name="l00385"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">  385</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> <span class="keyword">const</span> *<a class="code" href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">Pointer</a>;</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;</div><div class="line"><a name="l00388"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html">  388</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html">BaseParams</a> {</div><div class="line"><a name="l00390"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">  390</a></span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> <span class="keyword">const</span> *<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a>;</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00394"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">  394</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">initialize</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> <span class="keyword">const</span> &amp;storage) {</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> = &amp;storage[0];</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;    }</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00401"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2">  401</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2">initialize</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> <span class="keyword">const</span> *ptr, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>) {</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">Base::Params::initialize</a>(<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>);</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> = ptr;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;    }</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00409"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1">  409</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1">initialize</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">Scalar</a> <span class="keyword">const</span> *ptr,</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d,</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h,</div><div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w,</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d,</div><div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h,</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w,</div><div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance) {</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> = ptr;</div><div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">Base::Params::initialize</a>(</div><div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;          _stride_d, _stride_h, _stride_w, _inc_d, _inc_h, _inc_w, _inc_advance);</div><div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;    }</div><div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;</div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;    <span class="comment">// Initializes params to default values</span></div><div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00425"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8">  425</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8">initialize</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">Base::Params::initialize</a>(); }</div><div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;  };</div><div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;</div><div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;</div><div class="line"><a name="l00433"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">  433</a></span>&#160;  Params <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>;</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;</div><div class="line"><a name="l00436"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">  436</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">thread_offset</a>;</div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;</div><div class="line"><a name="l00439"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">  439</a></span>&#160;  <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a>;</div><div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;</div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;  <span class="comment">// Static member functions</span></div><div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;</div><div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00447"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">  447</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;bounds,</div><div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;                                                                                           0,</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;                                                                                           0)) {</div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">Base::initialize_predicates</a>(</div><div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;        predicate_it,</div><div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;        bounds,</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;        block_offset + <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">thread_offset</a>[1], <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">thread_offset</a>[2] * Tile::kC));</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;  }</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;</div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00464"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">  464</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">TileLoadIterator</a>() {}</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;</div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00468"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23">  468</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23">TileLoadIterator</a>(Params <span class="keyword">const</span> &amp;_params,</div><div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;                   <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0),</div><div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">ThreadOffset</a>())</div><div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;      : <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>(_params), <a class="code" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a>(0) {</div><div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;</div><div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> block_offset_h = 0;</div><div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> block_offset_w = 0;</div><div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;      block_offset_h = block_offset[1];</div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;      block_offset_w = block_offset[2];</div><div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;    } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;      block_offset_h = block_offset[2];</div><div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;      block_offset_w = block_offset[1];</div><div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;    }</div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;</div><div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += block_offset[0] * <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a> +</div><div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;                      (block_offset_h + <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">thread_offset</a>[1]) * <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a> +</div><div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;                      (block_offset_w + <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">thread_offset</a>[2] * Tile::kC) / Tile::kC * <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>;</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;  }</div><div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;</div><div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00491"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6">  491</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6">TileLoadIterator</a>(Params <span class="keyword">const</span> &amp;,</div><div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;                   <a class="code" href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">SharedStorage</a> &amp;shared_storage,</div><div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;                   <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0),</div><div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">ThreadOffset</a>())</div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;      : <a class="code" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a>(0) {</div><div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> offset = thread_offset_func()[2];</div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> = &amp;shared_storage[offset];</div><div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;  }</div><div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;</div><div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00502"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">  502</a></span>&#160;  <a class="code" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> <span class="keyword">const</span> *<a class="code" href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a>; }</div><div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;</div><div class="line"><a name="l00505"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">  505</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">inc_d</a>() { <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a>; }</div><div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;</div><div class="line"><a name="l00508"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">  508</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">inc_h</a>() { <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a>; }</div><div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;</div><div class="line"><a name="l00511"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">  511</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">inc_w</a>() { <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a>; }</div><div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;</div><div class="line"><a name="l00514"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">  514</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">inc_advance</a>() { <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">inc_advance</a>; }</div><div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;</div><div class="line"><a name="l00517"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">  517</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">inc_stage</a>() {</div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;    <span class="keywordflow">if</span> (Tile::kD &gt; 1) {</div><div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> kStageSize = Tile::kH * Tile::kW * Tile::kC;</div><div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a> == Tile::kD - 1) {</div><div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> -= (Tile::kD - 1) * kStageSize;</div><div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a> = 0;</div><div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">pointer</a> += kStageSize;</div><div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a> = <a class="code" href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">stage</a> + 1;</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;      }</div><div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;    }</div><div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;  }</div><div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00533"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">  533</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">load_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it) {</div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Iterations::kD; ++d) {</div><div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w, ++pred_it) {</div><div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;          <span class="keywordflow">if</span> (*pred_it) {</div><div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;            <a class="code" href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">Load&lt;typename Fragment::Element, Tile::kC, kMemorySpace&gt;::load</a>(</div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;                reinterpret_cast&lt;AccessType &amp;&gt;(frag_iterator.at(d, h, w, 0)), <a class="code" href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">data</a>(), 0);</div><div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;          }</div><div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;</div><div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;          <span class="keywordflow">if</span> (w &lt; Iterations::kW - 1) {</div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;            <a class="code" href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">inc_w</a>();</div><div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;          }</div><div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;        }</div><div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;        <span class="keywordflow">if</span> (h &lt; Iterations::kH - 1) {</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;          <a class="code" href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">inc_h</a>();</div><div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;        }</div><div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;      }</div><div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;      <span class="keywordflow">if</span> (d &lt; Iterations::kD - 1) {</div><div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">inc_d</a>();</div><div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;      }</div><div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;    }</div><div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">inc_advance</a>();</div><div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;  }</div><div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;</div><div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00561"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">  561</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">load_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">load_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;  }</div><div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;</div><div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00568"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">  568</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">load</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it)<span class="keyword"> const </span>{</div><div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> _load_it(*<span class="keyword">this</span>);</div><div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;    _load_it.<a class="code" href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">load_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;  }</div><div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;</div><div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00575"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db">  575</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db">load</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment)<span class="keyword"> const </span>{</div><div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">load</a>(fragment, pred_it);</div><div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;  }</div><div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;};</div><div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;</div><div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;</div><div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;</div><div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Traits_,</div><div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;          <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> Advance_ = <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> MemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">MemorySpace::kGeneric</a>,</div><div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;          <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;          <span class="keyword">typename</span> FragmentElement_ = Scalar_,</div><div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;          <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> IteratorFragment_ = <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954">IteratorFragment::kScalar</a>,</div><div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;          <span class="keyword">typename</span> Skew_ = Shape&lt;0, 0, 0, 0&gt; &gt;</div><div class="line"><a name="l00620"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html">  620</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_,</div><div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;                                                   Scalar_,</div><div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;                                                   Advance_,</div><div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;                                                   MemorySpace,</div><div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;                                                   Index_,</div><div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;                                                   FragmentElement_,</div><div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;                                                   IteratorFragment_,</div><div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;                                                   Skew_&gt; {</div><div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_,</div><div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;                           Scalar_,</div><div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;                           Advance_,</div><div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>,</div><div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;                           Index_,</div><div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;                           FragmentElement_,</div><div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;                           IteratorFragment_,</div><div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;                           Skew_&gt;</div><div class="line"><a name="l00637"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67">  637</a></span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67">Base</a>;</div><div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;</div><div class="line"><a name="l00640"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a6f50a8aec2d7045e9057b93df08172a8">  640</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">Base::Traits</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a6f50a8aec2d7045e9057b93df08172a8">Traits</a>;</div><div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;</div><div class="line"><a name="l00643"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">  643</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Base::Scalar</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a>;</div><div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;</div><div class="line"><a name="l00646"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a2b13136a970fae187fcb377c9be28fac">  646</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">Base::FragmentElement</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a2b13136a970fae187fcb377c9be28fac">FragmentElement</a>;</div><div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;</div><div class="line"><a name="l00649"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a8059c57030df99b73309e9210ec5f624">  649</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a8059c57030df99b73309e9210ec5f624">kAdvance</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">Base::kAdvance</a>;</div><div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;</div><div class="line"><a name="l00652"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a94c0567316118abfb84fc28560a5a46a">  652</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">IteratorFragment::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a94c0567316118abfb84fc28560a5a46a">kIteratorFragment</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">Base::kIteratorFragment</a>;</div><div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;</div><div class="line"><a name="l00655"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#adaebec9eacf767f63f048033de73ea5b">  655</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#adaebec9eacf767f63f048033de73ea5b">kMemorySpace</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">Base::kMemorySpace</a>;</div><div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;</div><div class="line"><a name="l00658"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a5ac2280dfcac08cec17b8c0db1c4593e">  658</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Base::Index</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5ac2280dfcac08cec17b8c0db1c4593e">Index</a>;</div><div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;</div><div class="line"><a name="l00661"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a57348779bb004ed1ea0fd9cc252e895d">  661</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">Base::Skew</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a57348779bb004ed1ea0fd9cc252e895d">Skew</a>;</div><div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;</div><div class="line"><a name="l00664"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a8a87c8ef986e110a01a9226012594a61">  664</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">Base::Tile</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a8a87c8ef986e110a01a9226012594a61">Tile</a>;</div><div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;</div><div class="line"><a name="l00667"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a1c433ba0eea5e6a46f36101d8de98ed0">  667</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">Base::Delta</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a1c433ba0eea5e6a46f36101d8de98ed0">Delta</a>;</div><div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;</div><div class="line"><a name="l00670"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a552a67fb03c28e985d143f6193f88308">  670</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">Base::Iterations</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a552a67fb03c28e985d143f6193f88308">Iterations</a>;</div><div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;</div><div class="line"><a name="l00673"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27">  673</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">Base::ThreadOffset</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27">ThreadOffset</a>;</div><div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;</div><div class="line"><a name="l00676"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a3b872e85844c9e009fa480a71a829136">  676</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">Base::FragmentShape</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a3b872e85844c9e009fa480a71a829136">FragmentShape</a>;</div><div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;</div><div class="line"><a name="l00679"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a0e79ed59263ebc3478c43f2f9a50cb5a">  679</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a0e79ed59263ebc3478c43f2f9a50cb5a">AccessType</a>;</div><div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;</div><div class="line"><a name="l00682"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">  682</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Base::Fragment</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">Fragment</a>;</div><div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;</div><div class="line"><a name="l00685"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a0843b2d82422e7178f324a8d3be9d705">  685</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">Base::FragmentIterator</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a0843b2d82422e7178f324a8d3be9d705">FragmentIterator</a>;</div><div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;</div><div class="line"><a name="l00688"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a48de0db7ee2ee9699b946a9d5a0364c7">  688</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">Base::FragmentConstIterator</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a48de0db7ee2ee9699b946a9d5a0364c7">FragmentConstIterator</a>;</div><div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;</div><div class="line"><a name="l00691"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a5aa507eaeb63951f8e69fb223ec41809">  691</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">Base::PredicateVector</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5aa507eaeb63951f8e69fb223ec41809">PredicateVector</a>;</div><div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;</div><div class="line"><a name="l00694"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">  694</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">Base::Storage</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a>;</div><div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;</div><div class="line"><a name="l00697"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0">  697</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0">BaseParams</a>;</div><div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;</div><div class="line"><a name="l00700"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html">  700</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html">BaseParams</a> {</div><div class="line"><a name="l00702"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">  702</a></span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a> *<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a>;</div><div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;</div><div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00706"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a71f5238a712f7b2f377fb58938ac829b">  706</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a71f5238a712f7b2f377fb58938ac829b">initialize</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a> &amp;storage) {</div><div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> = &amp;storage[0];</div><div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;    }</div><div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;</div><div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00713"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#af0d26a2df2a1a5ba3c3169b736bd5d43">  713</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#af0d26a2df2a1a5ba3c3169b736bd5d43">initialize</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a> *ptr, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>) {</div><div class="line"><a name="l00714"></a><span class="lineno">  714</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">Base::Params::initialize</a>(<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>);</div><div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> = ptr;</div><div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;    }</div><div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;</div><div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00721"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ac1cfe92f1543ba445fa10f1859a0db98">  721</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ac1cfe92f1543ba445fa10f1859a0db98">initialize</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">Scalar</a> *ptr,</div><div class="line"><a name="l00722"></a><span class="lineno">  722</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_d,</div><div class="line"><a name="l00723"></a><span class="lineno">  723</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_h,</div><div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _stride_w,</div><div class="line"><a name="l00725"></a><span class="lineno">  725</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_d,</div><div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_h,</div><div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_w,</div><div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">Index</a> _inc_advance) {</div><div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> = ptr;</div><div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">Base::Params::initialize</a>(</div><div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;          _stride_d, _stride_h, _stride_w, _inc_d, _inc_h, _inc_w, _inc_advance);</div><div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00733"></a><span class="lineno">  733</span>&#160;    }</div><div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;</div><div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00737"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#af884f720d36aa82e7f972932686ae986">  737</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#af884f720d36aa82e7f972932686ae986">initialize</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">Base::Params::initialize</a>(); }</div><div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;  };</div><div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;</div><div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;</div><div class="line"><a name="l00745"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">  745</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>;</div><div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;</div><div class="line"><a name="l00748"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">  748</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">thread_offset</a>;</div><div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;</div><div class="line"><a name="l00751"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">  751</a></span>&#160;  <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">stage</a>;</div><div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;</div><div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;  <span class="comment">// Static member functions</span></div><div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;</div><div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00759"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#af92ba20db048a9ec96976a1673f0f7c2">  759</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#af92ba20db048a9ec96976a1673f0f7c2">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;bounds,</div><div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,</div><div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;                                                                                           0,</div><div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160;                                                                                           0)) {</div><div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">Base::initialize_predicates</a>(</div><div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;        predicate_it,</div><div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;        bounds,</div><div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;        block_offset + <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, <a class="code" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">thread_offset</a>[1], <a class="code" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">thread_offset</a>[2] * Tile::kC));</div><div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;  }</div><div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;</div><div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00771"></a><span class="lineno">  771</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;</div><div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00776"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aac4d49854d63f632627b6974f9b59dbb">  776</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreIterator.html#aac4d49854d63f632627b6974f9b59dbb">TileStoreIterator</a>() {}</div><div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160;</div><div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00780"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a037ccd942359e6bc8640a240b13cd330">  780</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreIterator.html#a037ccd942359e6bc8640a240b13cd330">TileStoreIterator</a>(<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params,</div><div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;                    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0),</div><div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160;                    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27">ThreadOffset</a>())</div><div class="line"><a name="l00783"></a><span class="lineno">  783</span>&#160;      : <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>(_params), <a class="code" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">stage</a>(0) {</div><div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160;</div><div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> += block_offset[0] * <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">stride_d</a> +</div><div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;                      (block_offset[1] + <a class="code" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">thread_offset</a>[1]) * <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">stride_h</a> +</div><div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;                      (block_offset[2] + <a class="code" href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">thread_offset</a>[2] * Tile::kC) / Tile::kC * <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">stride_w</a>;</div><div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;  }</div><div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;</div><div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00793"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a4f89c5182659de94605300e15c3651b2">  793</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreIterator.html#a4f89c5182659de94605300e15c3651b2">TileStoreIterator</a>(<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;,</div><div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;                    <a class="code" href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">SharedStorage</a> &amp;shared_storage,</div><div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;                    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0),</div><div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;                    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27">ThreadOffset</a>())</div><div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;      : <a class="code" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">stage</a>(0) {</div><div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> offset = thread_offset_func()[2];</div><div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> = &amp;shared_storage[offset];</div><div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;  }</div><div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;</div><div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00804"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0">  804</a></span>&#160;  <a class="code" href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">Scalar</a> *<a class="code" href="structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a>; }</div><div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;</div><div class="line"><a name="l00807"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3">  807</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3">inc_d</a>() { <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> += <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">inc_d</a>; }</div><div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;</div><div class="line"><a name="l00810"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1">  810</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1">inc_h</a>() { <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> += <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">inc_h</a>; }</div><div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;</div><div class="line"><a name="l00813"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1">  813</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1">inc_w</a>() { <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> += <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">inc_w</a>; }</div><div class="line"><a name="l00814"></a><span class="lineno">  814</span>&#160;</div><div class="line"><a name="l00816"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75">  816</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75">inc_advance</a>() {}</div><div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;</div><div class="line"><a name="l00819"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a187e0852ec4862f6d3cb6249bedc3bb3">  819</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a187e0852ec4862f6d3cb6249bedc3bb3">inc_stage</a>() {</div><div class="line"><a name="l00820"></a><span class="lineno">  820</span>&#160;    <span class="keywordflow">if</span> (Tile::kD &gt; 1) {</div><div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> kStageSize = Tile::kH * Tile::kW * Tile::kC;</div><div class="line"><a name="l00822"></a><span class="lineno">  822</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">stage</a> == Tile::kD - 1) {</div><div class="line"><a name="l00823"></a><span class="lineno">  823</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> -= (Tile::kD - 1) * kStageSize;</div><div class="line"><a name="l00824"></a><span class="lineno">  824</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">stage</a> = 0;</div><div class="line"><a name="l00825"></a><span class="lineno">  825</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00826"></a><span class="lineno">  826</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">pointer</a> += kStageSize;</div><div class="line"><a name="l00827"></a><span class="lineno">  827</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">stage</a> = <a class="code" href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">stage</a> + 1;</div><div class="line"><a name="l00828"></a><span class="lineno">  828</span>&#160;      }</div><div class="line"><a name="l00829"></a><span class="lineno">  829</span>&#160;    }</div><div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160;  }</div><div class="line"><a name="l00831"></a><span class="lineno">  831</span>&#160;</div><div class="line"><a name="l00832"></a><span class="lineno">  832</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00834"></a><span class="lineno">  834</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00835"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526">  835</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526">store_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it) {</div><div class="line"><a name="l00836"></a><span class="lineno">  836</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">FragmentIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l00837"></a><span class="lineno">  837</span>&#160;</div><div class="line"><a name="l00838"></a><span class="lineno">  838</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Iterations::kD; ++d) {</div><div class="line"><a name="l00839"></a><span class="lineno">  839</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l00840"></a><span class="lineno">  840</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w, ++pred_it) {</div><div class="line"><a name="l00841"></a><span class="lineno">  841</span>&#160;          <span class="keywordflow">if</span> (*pred_it) {</div><div class="line"><a name="l00842"></a><span class="lineno">  842</span>&#160;            <a class="code" href="structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf">Store&lt;typename Fragment::Element, Tile::kC, kMemorySpace&gt;::store</a>(</div><div class="line"><a name="l00843"></a><span class="lineno">  843</span>&#160;                reinterpret_cast&lt;AccessType &amp;&gt;(frag_iterator.at(d, h, w, 0)), <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0">data</a>(), 0);</div><div class="line"><a name="l00844"></a><span class="lineno">  844</span>&#160;          }</div><div class="line"><a name="l00845"></a><span class="lineno">  845</span>&#160;          <span class="keywordflow">if</span> (w &lt; Iterations::kW - 1) {</div><div class="line"><a name="l00846"></a><span class="lineno">  846</span>&#160;            <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1">inc_w</a>();</div><div class="line"><a name="l00847"></a><span class="lineno">  847</span>&#160;          }</div><div class="line"><a name="l00848"></a><span class="lineno">  848</span>&#160;        }</div><div class="line"><a name="l00849"></a><span class="lineno">  849</span>&#160;        <span class="keywordflow">if</span> (h &lt; Iterations::kH - 1) {</div><div class="line"><a name="l00850"></a><span class="lineno">  850</span>&#160;          <a class="code" href="structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1">inc_h</a>();</div><div class="line"><a name="l00851"></a><span class="lineno">  851</span>&#160;        }</div><div class="line"><a name="l00852"></a><span class="lineno">  852</span>&#160;      }</div><div class="line"><a name="l00853"></a><span class="lineno">  853</span>&#160;      <span class="keywordflow">if</span> (d &lt; Iterations::kD - 1) {</div><div class="line"><a name="l00854"></a><span class="lineno">  854</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3">inc_d</a>();</div><div class="line"><a name="l00855"></a><span class="lineno">  855</span>&#160;      }</div><div class="line"><a name="l00856"></a><span class="lineno">  856</span>&#160;    }</div><div class="line"><a name="l00857"></a><span class="lineno">  857</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75">inc_advance</a>();</div><div class="line"><a name="l00858"></a><span class="lineno">  858</span>&#160;  }</div><div class="line"><a name="l00859"></a><span class="lineno">  859</span>&#160;</div><div class="line"><a name="l00861"></a><span class="lineno">  861</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00862"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#ae63949f58c1b32959bbfa5b64d521f0f">  862</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#ae63949f58c1b32959bbfa5b64d521f0f">store_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l00863"></a><span class="lineno">  863</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l00864"></a><span class="lineno">  864</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526">store_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l00865"></a><span class="lineno">  865</span>&#160;  }</div><div class="line"><a name="l00866"></a><span class="lineno">  866</span>&#160;</div><div class="line"><a name="l00868"></a><span class="lineno">  868</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00869"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a53820de506cecb1f5fb07b3385d8272a">  869</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a53820de506cecb1f5fb07b3385d8272a">store</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment, PredicateIterator pred_it)<span class="keyword"> const </span>{</div><div class="line"><a name="l00870"></a><span class="lineno">  870</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> _store_it(*<span class="keyword">this</span>);</div><div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160;    _store_it.<a class="code" href="structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526">store_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160;  }</div><div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;</div><div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00876"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a60258b7c1a1708f97e28f8f6c292bfe4">  876</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a60258b7c1a1708f97e28f8f6c292bfe4">store</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">Fragment</a> &amp;fragment)<span class="keyword"> const </span>{</div><div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a53820de506cecb1f5fb07b3385d8272a">store</a>(fragment, pred_it);</div><div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160;  }</div><div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160;};</div><div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;}</div><div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a4e0b2bc06bb8f52313e4d8c51ab30ff2"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a4e0b2bc06bb8f52313e4d8c51ab30ff2">cutlass::TileIteratorBase::kFragmentSize</a></div><div class="ttdeci">static int const kFragmentSize</div><div class="ttdoc">The size of storage needed per fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:149</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aba1d75a0cd5f11dee2aecf89b2b13d98"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aba1d75a0cd5f11dee2aecf89b2b13d98">cutlass::TileLoadIterator::kIteratorFragment</a></div><div class="ttdeci">static IteratorFragment::Kind const kIteratorFragment</div><div class="ttdoc">Specifies type of iterator fragment storage (Salar or WmmaMatrix) </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:334</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a1614b27755cf82c0e1f3e7852c5a4c75"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a1614b27755cf82c0e1f3e7852c5a4c75">cutlass::TileStoreIterator::inc_advance</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_advance()</div><div class="ttdoc">Increment in the next dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:816</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a25a241bbdc0b0121992019a16f1a6d60"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a25a241bbdc0b0121992019a16f1a6d60">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::FragmentConstIterator</a></div><div class="ttdeci">FragmentConstIterator&lt; Fragment, Iterations, AccessType &gt; FragmentConstIterator</div><div class="ttdoc">The fragment const iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:158</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_af4576dca736bab8ac73b308522cb4a67"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#af4576dca736bab8ac73b308522cb4a67">cutlass::TileStoreIterator::Base</a></div><div class="ttdeci">TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Base</div><div class="ttdoc">Base class. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:637</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a95da23108b74ad085024ab45e84083e1"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a95da23108b74ad085024ab45e84083e1">cutlass::TileStoreIterator::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:682</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aebbe5a0996dcd362caad618e78dc2591"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aebbe5a0996dcd362caad618e78dc2591">cutlass::TileLoadIterator::FragmentIterator</a></div><div class="ttdeci">Base::FragmentIterator FragmentIterator</div><div class="ttdoc">Fragment iterator definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:367</div></div>
+<a href="tile__iterator_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tensor__ref_8h.html">cutlass/tensor_ref.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="load__store_8h.html">cutlass/load_store.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="predicate__vector_8h.html">cutlass/predicate_vector.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;cstdio&gt;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1IteratorAdvance.html">   64</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1IteratorAdvance.html">IteratorAdvance</a> {</div><div class="line"><a name="l00065"></a><span class="lineno"><a class="line" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">   65</a></span>&#160;  <span class="keyword">enum</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">Kind</a> { <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5">kD</a>, <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">kH</a>, <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">kW</a> };</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;};</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;          <span class="keyword">typename</span> Delta_,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;          <span class="keyword">typename</span> Iterations_,</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;          <span class="keyword">typename</span> ThreadOffset_,</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;          <span class="keywordtype">int</span> AccessSize&gt;</div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html">   78</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraits.html">TileTraits</a> {</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0">   80</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0">Tile</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82">   83</a></span>&#160;  <span class="keyword">typedef</span> Delta_ <a class="code" href="structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82">Delta</a>;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc">   86</a></span>&#160;  <span class="keyword">typedef</span> Iterations_ <a class="code" href="structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc">Iterations</a>;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  <span class="comment">// ThreadOffset should be a functor defined like:</span></div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  <span class="comment">// struct ThreadOffsetExample {</span></div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  <span class="comment">//   CUTLASS_DEVICE</span></div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  <span class="comment">//   Coord&lt;4&gt; operator()() const {</span></div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;  <span class="comment">//      return make_Coord(0, threadIdx.y, threadIdx.x, 0);</span></div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="comment">//   }</span></div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  <span class="comment">// };</span></div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb">   99</a></span>&#160;  <span class="keyword">typedef</span> ThreadOffset_ <a class="code" href="structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb">ThreadOffset</a>;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f">  102</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, 0, 0&gt;</a> <a class="code" href="structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraits.html#a0a494c2eacb51b65487f8405908a0214">  105</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraits.html#a0a494c2eacb51b65487f8405908a0214">kAccessSize</a> = AccessSize;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;};</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Delta_&gt;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1RegularTilePredicateFunctor.html">  112</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html">RegularTilePredicateFunctor</a> {</div><div class="line"><a name="l00113"></a><span class="lineno"><a class="line" href="structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360">  113</a></span>&#160;  <span class="keyword">typedef</span> Delta_ <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360">Delta</a>;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">  116</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">bounds</a>;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1RegularTilePredicateFunctor.html#a0e0b728d3685097a9280fbca6a47a2af">  120</a></span>&#160;  <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html#a0e0b728d3685097a9280fbca6a47a2af">RegularTilePredicateFunctor</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> _bounds) : <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">bounds</a>(_bounds) {}</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1RegularTilePredicateFunctor.html#a084c0a2732827a74f7a30873c5883827">  124</a></span>&#160;  <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html#a084c0a2732827a74f7a30873c5883827">operator()</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> iteration, <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> offset)<span class="keyword"> const </span>{</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <span class="keywordflow">return</span> (iteration[0] * Delta::kD + offset[0] &lt; <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">bounds</a>[0]) &amp;&amp;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;           (iteration[1] * Delta::kH + offset[1] &lt; <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">bounds</a>[1]) &amp;&amp;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;           (iteration[2] * Delta::kW + offset[2] &lt; <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">bounds</a>[2]);</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  }</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;};</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="structcutlass_1_1DumpType.html">  134</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1DumpType.html">DumpType</a> {};</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Traits_,</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;          <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> Advance_ = <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">MemorySpace::kGeneric</a>,</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;          <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;          <span class="keyword">typename</span> FragmentElement_ = Scalar_,</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;          <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> FragmentElementType_ = <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>,</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;          <span class="keyword">typename</span> Skew_ = <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, 0, 0&gt;</a> &gt;</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html">  144</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a> {</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">  146</a></span>&#160;  <span class="keyword">typedef</span> Traits_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Traits</a>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">  149</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a>;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">  152</a></span>&#160;  <span class="keyword">typedef</span> FragmentElement_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">FragmentElement</a>;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">  155</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a> = Advance_;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">  158</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a> = FragmentElementType_;</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div><div class="line"><a name="l00161"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">  161</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">kMemorySpace</a> = <a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">  164</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a>;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">  167</a></span>&#160;  <span class="keyword">typedef</span> Skew_ <a class="code" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Skew</a>;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;</div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">  170</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Tile <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Tile</a>;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">  173</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Delta <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Delta</a>;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;</div><div class="line"><a name="l00176"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">  176</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ImmediateOffsetStrides <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">  179</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Iterations <a class="code" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Iterations</a>;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">  182</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ThreadOffset <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a>;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">  185</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a> = Traits::kAccessSize;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00188"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">  188</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Vectorize&lt;FragmentElement, kAccessSize&gt;::Type</a> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a>;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">  191</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a> =</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;      (<a class="code" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">kFragmentElementType</a> == <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a> ? 16 : <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">AccessType</a>));</div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">  194</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment&lt;Scalar, ShapeCount&lt;Tile&gt;::kCount</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">kFragmentSize</a>&gt; <a class="code" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Storage</a>;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">  196</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment&lt;FragmentElement, ShapeCount&lt;Iterations&gt;::kCount</a> * <a class="code" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">kAccessSize</a>&gt; <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">  199</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator&lt;Fragment, Iterations, AccessType&gt;</a> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a>;</div><div class="line"><a name="l00201"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">  201</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator&lt;Fragment, Iterations, AccessType&gt;</a> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a>;</div><div class="line"><a name="l00203"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">  203</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">FragmentIterator::FragmentShape</a> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">FragmentShape</a>;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">  206</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector&lt;ShapeCount&lt;Iterations&gt;::kCount</a>&gt; <a class="code" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">PredicateVector</a>;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;  <span class="comment">// Params struct</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;</div><div class="line"><a name="l00213"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html">  213</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Params</a> {</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    <span class="comment">// Dat members</span></div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;</div><div class="line"><a name="l00219"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">  219</a></span>&#160;    <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>;</div><div class="line"><a name="l00220"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">  220</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>;</div><div class="line"><a name="l00221"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">  221</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">  223</a></span>&#160;    <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a>;</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">  224</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>;</div><div class="line"><a name="l00225"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">  225</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a>;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">  227</a></span>&#160;    <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a>;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <span class="comment">// Methods</span></div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00235"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">  235</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">Params</a>() : <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>(0), <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>(0), <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>(0), <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a>(0), <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>(0), <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a>(0) {}</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00239"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">  239</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">Params</a>(<span class="keywordtype">long</span> <span class="keywordtype">long</span> _stride_d,</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h,</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w,</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _inc_d,</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h,</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w,</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _inc_advance)</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;        : <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>(_stride_d),</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>(_stride_h),</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>(_stride_w),</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a>(_inc_d),</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>(_inc_h),</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a>(_inc_w),</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a>(_inc_advance) {}</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00256"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">  256</a></span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">Params</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <span class="keyword">const</span> &amp;stride) {</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">initialize</a>(stride);</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    }</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00262"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">  262</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">initialize</a>(<span class="keywordtype">long</span> <span class="keywordtype">long</span> _stride_d,</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h,</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w,</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;                   <span class="keywordtype">long</span> <span class="keywordtype">long</span> _inc_d,</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h,</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w,</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;                   <span class="keywordtype">long</span> <span class="keywordtype">long</span> _inc_advance) {</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a> = _stride_d;</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> = _stride_h;</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a> = _stride_w;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a> = _inc_d;</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a> = _inc_h;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a> = _inc_w;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = _inc_advance;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;    }</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00283"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">  283</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">initialize</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <span class="keyword">const</span> &amp;stride) {</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">initialize</a>(stride[0], stride[1], stride[2]);</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;    }</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00289"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">  289</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">initialize</a>(<span class="keywordtype">long</span> <span class="keywordtype">long</span> _stride_d, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w) {</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a> = _stride_d;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> = _stride_h;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a> = _stride_w;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a> * Delta::kW;</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> * Delta::kH - <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a> * Delta::kW * (Iterations::kW - 1);</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a> * Delta::kD - <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> * Delta::kH * (Iterations::kH - 1) -</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;              <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a> * Delta::kW * (Iterations::kW - 1);</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = 0;</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>) {</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;        <span class="comment">// Advance in the H dimension.</span></div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = Tile::kH * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>;</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;      } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">IteratorAdvance::kW</a>) {</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;        <span class="comment">// Advance in the W dimension.</span></div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = Tile::kW * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;        <span class="comment">// Advance in the D dimension.</span></div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = Tile::kD * <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>;</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;      }</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> -= <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a> * Delta::kD * (Iterations::kD - 1) +</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;                     <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> * Delta::kH * (Iterations::kH - 1) +</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;                     <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a> * Delta::kW * (Iterations::kW - 1);</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;    }</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;</div><div class="line"><a name="l00321"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">  321</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">initialize</a>() {</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a> = 0;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> = 0;</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a> = 1;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = 0;</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a> = <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a> = 0;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;    }</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;  };</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;</div><div class="line"><a name="l00334"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">  334</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <span class="keyword">true</span>; }</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;  <span class="comment">// Static function members</span></div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> PredicateIterator, <span class="keyword">typename</span> PredicateFunctor&gt;</div><div class="line"><a name="l00342"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">  342</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keyword">static</span> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;                                                   PredicateFunctor <span class="keyword">const</span> &amp;predicate_func,</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;                                                   <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;offset) {</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;    <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Iterations::kD; ++d) {</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;      <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;        <a class="code" href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w) {</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;          <span class="keywordtype">bool</span> enable = predicate_func(<a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(d, h, w), offset);</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;          predicate_it.set(enable);</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;          ++predicate_it;</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;        }</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;      }</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;    }</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;  }</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;};</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;</div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;</div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Traits_,</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;          <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> Advance_ = <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> MemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">MemorySpace::kGeneric</a>,</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;          <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;          <span class="keyword">typename</span> FragmentElement_ = Scalar_,</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;          <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> FragmentElementType_ = <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>,</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;          <span class="keyword">typename</span> Skew_ = Shape&lt;0, 0, 0, 0&gt; &gt;</div><div class="line"><a name="l00399"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html">  399</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_,</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;                                                  Scalar_,</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;                                                  Advance_,</div><div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;                                                  MemorySpace,</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;                                                  Index_,</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;                                                  FragmentElement_,</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;                                                  FragmentElementType_,</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;                                                  Skew_&gt; {</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_,</div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;                           Scalar_,</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;                           Advance_,</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>,</div><div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;                           Index_,</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;                           FragmentElement_,</div><div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;                           FragmentElementType_,</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;                           Skew_&gt;</div><div class="line"><a name="l00416"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">  416</a></span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">Base</a>;</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;</div><div class="line"><a name="l00419"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">  419</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Base::Traits</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">Traits</a>;</div><div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;</div><div class="line"><a name="l00422"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">  422</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Base::Scalar</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a>;</div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;</div><div class="line"><a name="l00425"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">  425</a></span>&#160;  <span class="keyword">typedef</span> FragmentElement_ <a class="code" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">FragmentElement</a>;</div><div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;</div><div class="line"><a name="l00428"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">  428</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">kAdvance</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">Base::kAdvance</a>;</div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;</div><div class="line"><a name="l00431"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">  431</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">kFragmentElementType</a> = FragmentElementType_;</div><div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;</div><div class="line"><a name="l00434"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">  434</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">kMemorySpace</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">Base::kMemorySpace</a>;</div><div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;</div><div class="line"><a name="l00437"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">  437</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Base::Index</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">Index</a>;</div><div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;</div><div class="line"><a name="l00440"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">  440</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1Shape.html">Base::Skew</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">Skew</a>;</div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;</div><div class="line"><a name="l00443"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">  443</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Base::Tile</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">Tile</a>;</div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;</div><div class="line"><a name="l00446"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">  446</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Base::Delta</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">Delta</a>;</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;</div><div class="line"><a name="l00449"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">  449</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Base::Iterations</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">Iterations</a>;</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;</div><div class="line"><a name="l00452"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">  452</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">Base::ThreadOffset</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">ThreadOffset</a>;</div><div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;</div><div class="line"><a name="l00455"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">  455</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">Base::FragmentShape</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">FragmentShape</a>;</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;</div><div class="line"><a name="l00458"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">  458</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">AccessType</a>;</div><div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;</div><div class="line"><a name="l00461"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">  461</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">kAccessSize</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">Base::kAccessSize</a>;</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;</div><div class="line"><a name="l00464"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">  464</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Base::Fragment</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">Fragment</a>;</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;</div><div class="line"><a name="l00467"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">  467</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">FragmentIterator</a>;</div><div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;</div><div class="line"><a name="l00470"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">  470</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">Base::FragmentConstIterator</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">FragmentConstIterator</a>;</div><div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;</div><div class="line"><a name="l00473"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">  473</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">Base::PredicateVector</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">PredicateVector</a>;</div><div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;</div><div class="line"><a name="l00476"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">  476</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Base::Storage</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a>;</div><div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;</div><div class="line"><a name="l00479"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">  479</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Base::Params <a class="code" href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">BaseParams</a>;</div><div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;</div><div class="line"><a name="l00482"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126">  482</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126">kRequiresLoadFence</a> = Tile::kD == 1 };</div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;</div><div class="line"><a name="l00485"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">  485</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> <span class="keyword">const</span> *<a class="code" href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">Pointer</a>;</div><div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;</div><div class="line"><a name="l00488"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">  488</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef&lt;Scalar const, 4&gt;</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a>;</div><div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;</div><div class="line"><a name="l00491"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html">  491</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html">Params</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html">BaseParams</a> {</div><div class="line"><a name="l00493"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">  493</a></span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> <span class="keyword">const</span> *<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a>;</div><div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;</div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;    <span class="comment">// Methods</span></div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;</div><div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00501"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5">  501</a></span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5">Params</a>() : <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a>(0){ <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(); }</div><div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;</div><div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00505"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282">  505</a></span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282">Params</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> <span class="keyword">const</span> *ptr) : <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a>(ptr) { <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(); }</div><div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;</div><div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00509"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192">  509</a></span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192">Params</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> <span class="keyword">const</span> &amp;ref): <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a>(ref.data()) {</div><div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(ref.stride());</div><div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;    }</div><div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;</div><div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00515"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e">  515</a></span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e">Params</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> <span class="keyword">const</span> *ptr,</div><div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _stride_d,</div><div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h,</div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w,</div><div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _inc_d,</div><div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h,</div><div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w,</div><div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance)</div><div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;        : <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a>(ptr) {</div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(</div><div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;          _stride_d, _stride_h, _stride_w, _inc_d, _inc_h, _inc_w, _inc_advance);</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;    }</div><div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;</div><div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00530"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a">  530</a></span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a">Params</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> <span class="keyword">const</span> *ptr, <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</div><div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;        : <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a>(ptr) {</div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>);</div><div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;    }</div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00537"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803">  537</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803">initialize</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">TensorRef</a> <span class="keyword">const</span> &amp;ref) {</div><div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> = ref.data();</div><div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(ref.stride());</div><div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;    }</div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;</div><div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00544"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0">  544</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0">initialize</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">SharedStorage</a> <span class="keyword">const</span> &amp;storage) {</div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> = &amp;storage[0];</div><div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>();</div><div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;    }</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;</div><div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00552"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf">  552</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf">initialize</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> <span class="keyword">const</span> *ptr) {</div><div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> = ptr;</div><div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>();</div><div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;    }</div><div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;</div><div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00560"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662">  560</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662">initialize</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> <span class="keyword">const</span> *ptr, <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>) {</div><div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>);</div><div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> = ptr;</div><div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;    }</div><div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;</div><div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00568"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d">  568</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d">initialize</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a> <span class="keyword">const</span> *ptr,</div><div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;                   <span class="keywordtype">long</span> <span class="keywordtype">long</span> _stride_d,</div><div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h,</div><div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w,</div><div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;                   <span class="keywordtype">long</span> <span class="keywordtype">long</span> _inc_d,</div><div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h,</div><div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w,</div><div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance) {</div><div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;      <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> = ptr;</div><div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(</div><div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;          _stride_d, _stride_h, _stride_w, _inc_d, _inc_h, _inc_w, _inc_advance);</div><div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;    }</div><div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;</div><div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;    <span class="comment">// Initializes params to default values</span></div><div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00584"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d">  584</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d">initialize</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(); }</div><div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;  };</div><div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;</div><div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;</div><div class="line"><a name="l00592"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">  592</a></span>&#160;  Params <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>;</div><div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;</div><div class="line"><a name="l00595"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">  595</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>;</div><div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;</div><div class="line"><a name="l00598"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">  598</a></span>&#160;  <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a>;</div><div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;</div><div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;  <span class="comment">// Predicate initialization</span></div><div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;</div><div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;  <span class="keyword">template</span> &lt;</div><div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;      <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00608"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">  608</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;bounds,</div><div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,</div><div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;                                                                                           0,</div><div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;                                                                                           0)) {</div><div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">Base::initialize_predicates</a>(</div><div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;        predicate_it,</div><div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;        <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html">RegularTilePredicateFunctor&lt;typename Traits::Delta&gt;</a>(bounds),</div><div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;        block_offset + <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>[0], <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>[1], <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>[2]));</div><div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;  }</div><div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;</div><div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;  <span class="keyword">template</span> &lt;</div><div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;      <span class="keyword">typename</span> PredicateIterator,</div><div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;      <span class="keyword">typename</span> PredicateFunctor&gt;</div><div class="line"><a name="l00625"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">  625</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;                                                 PredicateFunctor <span class="keyword">const</span> &amp;functor,</div><div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset) {</div><div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">Base::initialize_predicates</a>(</div><div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;        predicate_it,</div><div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;        functor,</div><div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;        block_offset + <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>[0], <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>[1], <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>[2]));</div><div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;  }</div><div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;</div><div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;</div><div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00640"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">  640</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">TileLoadIterator</a>() {}</div><div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;</div><div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00644"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">  644</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">TileLoadIterator</a>(Params <span class="keyword">const</span> &amp;_params,</div><div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;                   <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0),</div><div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">ThreadOffset</a>())</div><div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;      : <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>(_params), <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a>(0) {</div><div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;</div><div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> pointer_offset = <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">Index</a>((block_offset[0] + <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>[0]) * <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>) +</div><div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;                           <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">Index</a>((block_offset[1] + <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>[1]) * <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>) +</div><div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;                           <a class="code" href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">Index</a>((block_offset[2] + <a class="code" href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">thread_offset</a>[2]) * <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>);</div><div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;</div><div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += pointer_offset;</div><div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;  }</div><div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;</div><div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00659"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">  659</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">TileLoadIterator</a>(Params <span class="keyword">const</span> &amp;,</div><div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> <span class="keyword">const</span> *ptr,</div><div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;                   <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0),</div><div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">ThreadOffset</a>())</div><div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;      : <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a>(0) {</div><div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> = ptr + thread_offset_func()[2];</div><div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;</div><div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a> = 0;</div><div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> = 0;</div><div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a> = 1;</div><div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;</div><div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a> = <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a> = <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a> = <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = 0;</div><div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;  }</div><div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;</div><div class="line"><a name="l00674"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">  674</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">inc_d</a>() { <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a>; }</div><div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;</div><div class="line"><a name="l00677"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">  677</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">inc_h</a>() { <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>; }</div><div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;</div><div class="line"><a name="l00680"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">  680</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">inc_w</a>() { <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a>; }</div><div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;</div><div class="line"><a name="l00683"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">  683</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">inc_advance</a>() { <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a>; }</div><div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;</div><div class="line"><a name="l00686"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">  686</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">load_element</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> &amp;value, <span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;        <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;typename Base::ImmediateOffsetStrides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;    <a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;<a class="code" href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">Scalar</a>,</div><div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;         <a class="code" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">kAccessSize</a>,</div><div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;         <a class="code" href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">kMemorySpace</a>,</div><div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;         <a class="code" href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">kFragmentElementType</a>,</div><div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;         <a class="code" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">FragmentElement</a>,</div><div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;         Tile::kW,</div><div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;         <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">FragmentElement</a>) * <a class="code" href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">kAccessSize</a>&gt;::<a class="code" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a>(value, <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a>, offset);</div><div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;  }</div><div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;</div><div class="line"><a name="l00699"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">  699</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">inc_stage</a>() {</div><div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;    <span class="keywordflow">if</span> (Tile::kD &gt; 1) {</div><div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> kStageSize = Tile::kH * Tile::kW * Tile::kC;</div><div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a> == Tile::kD - 1) {</div><div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> -= (Tile::kD - 1) * kStageSize;</div><div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a> = 0;</div><div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += kStageSize;</div><div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a> = <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">stage</a> + 1;</div><div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;      }</div><div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;    }</div><div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;  }</div><div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;</div><div class="line"><a name="l00713"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">  713</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> &amp; <a class="code" href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;offset) {</div><div class="line"><a name="l00714"></a><span class="lineno">  714</span>&#160;    <span class="keywordtype">long</span> <span class="keywordtype">long</span> _offset = offset.template dot&lt;long long&gt;(</div><div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;      <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</div><div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;    );</div><div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;</div><div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += _offset;</div><div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;  }</div><div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;</div><div class="line"><a name="l00723"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">  723</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">add_pointer_offset</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> offset) { <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">pointer</a> += offset; }</div><div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;</div><div class="line"><a name="l00725"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11">  725</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11">stride_advance</a>(<span class="keywordtype">void</span>) {</div><div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> stride = <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>;</div><div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;    <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">kAdvance</a> == <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">IteratorAdvance::kW</a>) {</div><div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;      stride = <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>;</div><div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;    }</div><div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;    <span class="keywordflow">return</span> stride;</div><div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;  }</div><div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;</div><div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00735"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">  735</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">load_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it) {</div><div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;</div><div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Iterations::kD; ++d) {</div><div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w, ++pred_it) {</div><div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Iterations::kC; ++c) {</div><div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;            <span class="keywordflow">if</span> (*pred_it) {</div><div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;              <a class="code" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">load_element</a>(</div><div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;                  reinterpret_cast&lt;AccessType &amp;&gt;(frag_iterator.at(d, h, w, c)), d, h, w, c);</div><div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;            }</div><div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;          }</div><div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160;          <span class="keywordflow">if</span> (w &lt; Iterations::kW - 1) {</div><div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160;            <a class="code" href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">inc_w</a>();</div><div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;          }</div><div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160;        }</div><div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;        <span class="keywordflow">if</span> (h &lt; Iterations::kH - 1) {</div><div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;          <a class="code" href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">inc_h</a>();</div><div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;        }</div><div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;      }</div><div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;      <span class="keywordflow">if</span> (d &lt; Iterations::kD - 1) {</div><div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;        <a class="code" href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">inc_d</a>();</div><div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;      }</div><div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;    }</div><div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">inc_advance</a>();</div><div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;  }</div><div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;</div><div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00764"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">  764</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">load_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">load_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;  }</div><div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;</div><div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00771"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">  771</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it)<span class="keyword"> const </span>{</div><div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html">TileLoadIterator</a> _load_it(*<span class="keyword">this</span>);</div><div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;    _load_it.<a class="code" href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">load_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;  }</div><div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;</div><div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00778"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">  778</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">load</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)<span class="keyword"> const </span>{</div><div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l00780"></a><span class="lineno">  780</span>&#160;    <a class="code" href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">load</a>(fragment, pred_it);</div><div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;  }</div><div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160;</div><div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00785"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">  785</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">load</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, <span class="keywordtype">int</span> d) {</div><div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w) {</div><div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Iterations::kC; ++c) {</div><div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;          <a class="code" href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">load_element</a>(reinterpret_cast&lt;AccessType &amp;&gt;(frag_iterator.at(0, h, w, c)), d, h, w, c);</div><div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160;        }</div><div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;      }</div><div class="line"><a name="l00793"></a><span class="lineno">  793</span>&#160;    }</div><div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;  }</div><div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;};</div><div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;</div><div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;</div><div class="line"><a name="l00822"></a><span class="lineno">  822</span>&#160;</div><div class="line"><a name="l00828"></a><span class="lineno">  828</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Traits_,</div><div class="line"><a name="l00829"></a><span class="lineno">  829</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160;          <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> Advance_ = <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00831"></a><span class="lineno">  831</span>&#160;          <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> MemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">MemorySpace::kGeneric</a>,</div><div class="line"><a name="l00832"></a><span class="lineno">  832</span>&#160;          <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00833"></a><span class="lineno">  833</span>&#160;          <span class="keyword">typename</span> FragmentElement_ = Scalar_,</div><div class="line"><a name="l00834"></a><span class="lineno">  834</span>&#160;          <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> FragmentElementType_ = <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">FragmentElementType::kScalar</a>,</div><div class="line"><a name="l00835"></a><span class="lineno">  835</span>&#160;          <span class="keyword">typename</span> Skew_ = Shape&lt;0, 0, 0, 0&gt; &gt;</div><div class="line"><a name="l00836"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html">  836</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_,</div><div class="line"><a name="l00837"></a><span class="lineno">  837</span>&#160;                                                   Scalar_,</div><div class="line"><a name="l00838"></a><span class="lineno">  838</span>&#160;                                                   Advance_,</div><div class="line"><a name="l00839"></a><span class="lineno">  839</span>&#160;                                                   MemorySpace,</div><div class="line"><a name="l00840"></a><span class="lineno">  840</span>&#160;                                                   Index_,</div><div class="line"><a name="l00841"></a><span class="lineno">  841</span>&#160;                                                   FragmentElement_,</div><div class="line"><a name="l00842"></a><span class="lineno">  842</span>&#160;                                                   FragmentElementType_,</div><div class="line"><a name="l00843"></a><span class="lineno">  843</span>&#160;                                                   Skew_&gt; {</div><div class="line"><a name="l00845"></a><span class="lineno">  845</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;Traits_,</div><div class="line"><a name="l00846"></a><span class="lineno">  846</span>&#160;                           Scalar_,</div><div class="line"><a name="l00847"></a><span class="lineno">  847</span>&#160;                           Advance_,</div><div class="line"><a name="l00848"></a><span class="lineno">  848</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html">MemorySpace</a>,</div><div class="line"><a name="l00849"></a><span class="lineno">  849</span>&#160;                           Index_,</div><div class="line"><a name="l00850"></a><span class="lineno">  850</span>&#160;                           FragmentElement_,</div><div class="line"><a name="l00851"></a><span class="lineno">  851</span>&#160;                           FragmentElementType_,</div><div class="line"><a name="l00852"></a><span class="lineno">  852</span>&#160;                           Skew_&gt;</div><div class="line"><a name="l00853"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48">  853</a></span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48">Base</a>;</div><div class="line"><a name="l00854"></a><span class="lineno">  854</span>&#160;</div><div class="line"><a name="l00856"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a5016bd7b24938026a2879ec0054eb3b6">  856</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">Base::Traits</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5016bd7b24938026a2879ec0054eb3b6">Traits</a>;</div><div class="line"><a name="l00857"></a><span class="lineno">  857</span>&#160;</div><div class="line"><a name="l00859"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">  859</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Base::Scalar</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a>;</div><div class="line"><a name="l00860"></a><span class="lineno">  860</span>&#160;</div><div class="line"><a name="l00862"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">  862</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">Base::FragmentElement</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">FragmentElement</a>;</div><div class="line"><a name="l00863"></a><span class="lineno">  863</span>&#160;</div><div class="line"><a name="l00865"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a44200854ad5b35c1863f73c435b8750b">  865</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">IteratorAdvance::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a44200854ad5b35c1863f73c435b8750b">kAdvance</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">Base::kAdvance</a>;</div><div class="line"><a name="l00866"></a><span class="lineno">  866</span>&#160;</div><div class="line"><a name="l00868"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f">  868</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">FragmentElementType::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f">kFragmentElementType</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">Base::kFragmentElementType</a>;</div><div class="line"><a name="l00869"></a><span class="lineno">  869</span>&#160;</div><div class="line"><a name="l00871"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f">  871</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f">kMemorySpace</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">Base::kMemorySpace</a>;</div><div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160;</div><div class="line"><a name="l00874"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">  874</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">kAccessSize</a> = <a class="code" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">Base::kAccessSize</a>;</div><div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;</div><div class="line"><a name="l00877"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aae07fdedeef68abd4e6c099924c70910">  877</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Base::Index</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aae07fdedeef68abd4e6c099924c70910">Index</a>;</div><div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;</div><div class="line"><a name="l00880"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a18248da35dc9a0ae2411121bee323085">  880</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">Base::Skew</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a18248da35dc9a0ae2411121bee323085">Skew</a>;</div><div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;</div><div class="line"><a name="l00883"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#ad18ee6f519b03e1dbf711339b63e16d6">  883</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">Base::Tile</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#ad18ee6f519b03e1dbf711339b63e16d6">Tile</a>;</div><div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;</div><div class="line"><a name="l00886"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#afdb38f790d9c7cf1ac238643103b45ce">  886</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">Base::Delta</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#afdb38f790d9c7cf1ac238643103b45ce">Delta</a>;</div><div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160;</div><div class="line"><a name="l00889"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a8628ea7116f736b59c644fc0d85d395f">  889</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">Base::Iterations</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a8628ea7116f736b59c644fc0d85d395f">Iterations</a>;</div><div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;</div><div class="line"><a name="l00892"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a">  892</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">Base::ThreadOffset</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a">ThreadOffset</a>;</div><div class="line"><a name="l00893"></a><span class="lineno">  893</span>&#160;</div><div class="line"><a name="l00895"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a82ceeea55603dbb0c6e5bf9c22ac692e">  895</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">Base::FragmentShape</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a82ceeea55603dbb0c6e5bf9c22ac692e">FragmentShape</a>;</div><div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;</div><div class="line"><a name="l00898"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a10431ed94c0dd66a8c1d01ba7c8b5aa2">  898</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a10431ed94c0dd66a8c1d01ba7c8b5aa2">AccessType</a>;</div><div class="line"><a name="l00899"></a><span class="lineno">  899</span>&#160;</div><div class="line"><a name="l00901"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">  901</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Base::Fragment</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">Fragment</a>;</div><div class="line"><a name="l00902"></a><span class="lineno">  902</span>&#160;</div><div class="line"><a name="l00904"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#ace8a65d90db264a0ee93a810be38918f">  904</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">Base::FragmentIterator</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#ace8a65d90db264a0ee93a810be38918f">FragmentIterator</a>;</div><div class="line"><a name="l00905"></a><span class="lineno">  905</span>&#160;</div><div class="line"><a name="l00907"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#adfcd8a2e63bd0c515ef03760cc1c4283">  907</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">Base::FragmentConstIterator</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#adfcd8a2e63bd0c515ef03760cc1c4283">FragmentConstIterator</a>;</div><div class="line"><a name="l00908"></a><span class="lineno">  908</span>&#160;</div><div class="line"><a name="l00910"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a6157fe8a2ffefd45eba6f3953f0e2994">  910</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">Base::PredicateVector</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a6157fe8a2ffefd45eba6f3953f0e2994">PredicateVector</a>;</div><div class="line"><a name="l00911"></a><span class="lineno">  911</span>&#160;</div><div class="line"><a name="l00913"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">  913</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">Base::Storage</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">SharedStorage</a>;</div><div class="line"><a name="l00914"></a><span class="lineno">  914</span>&#160;</div><div class="line"><a name="l00916"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66">  916</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html">Base::Params</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66">BaseParams</a>;</div><div class="line"><a name="l00917"></a><span class="lineno">  917</span>&#160;</div><div class="line"><a name="l00919"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35">  919</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> *<a class="code" href="structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35">Pointer</a>;</div><div class="line"><a name="l00920"></a><span class="lineno">  920</span>&#160;</div><div class="line"><a name="l00922"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">  922</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef&lt;Scalar, 4&gt;</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef</a>;</div><div class="line"><a name="l00923"></a><span class="lineno">  923</span>&#160;</div><div class="line"><a name="l00925"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html">  925</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html">BaseParams</a> {</div><div class="line"><a name="l00927"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">  927</a></span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a>;</div><div class="line"><a name="l00928"></a><span class="lineno">  928</span>&#160;</div><div class="line"><a name="l00929"></a><span class="lineno">  929</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00930"></a><span class="lineno">  930</span>&#160;    <span class="comment">// Methods</span></div><div class="line"><a name="l00931"></a><span class="lineno">  931</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00932"></a><span class="lineno">  932</span>&#160;</div><div class="line"><a name="l00933"></a><span class="lineno">  933</span>&#160;    <span class="comment">// Default constructor</span></div><div class="line"><a name="l00934"></a><span class="lineno">  934</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00935"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a79304c022d2466c97cd671a98128815a">  935</a></span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a79304c022d2466c97cd671a98128815a">Params</a>() : <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a>(0) {}</div><div class="line"><a name="l00936"></a><span class="lineno">  936</span>&#160;</div><div class="line"><a name="l00937"></a><span class="lineno">  937</span>&#160;    <span class="comment">// Default constructor</span></div><div class="line"><a name="l00938"></a><span class="lineno">  938</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00939"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ae1cb260e7b05034ec9b7fa61c92bbc80">  939</a></span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ae1cb260e7b05034ec9b7fa61c92bbc80">Params</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr) : <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a>(ptr) { <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(); }</div><div class="line"><a name="l00940"></a><span class="lineno">  940</span>&#160;</div><div class="line"><a name="l00942"></a><span class="lineno">  942</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00943"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#afae37ebc78884290300f38fce7c021b1">  943</a></span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#afae37ebc78884290300f38fce7c021b1">Params</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">TensorRef</a> <span class="keyword">const</span> &amp;ref): <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a>(ref.data()) {</div><div class="line"><a name="l00944"></a><span class="lineno">  944</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(ref.stride());</div><div class="line"><a name="l00945"></a><span class="lineno">  945</span>&#160;    }</div><div class="line"><a name="l00946"></a><span class="lineno">  946</span>&#160;</div><div class="line"><a name="l00947"></a><span class="lineno">  947</span>&#160;    <span class="comment">// Default constructor</span></div><div class="line"><a name="l00948"></a><span class="lineno">  948</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00949"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#aa131e0ef02ce37038c1a17bea7088ef6">  949</a></span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#aa131e0ef02ce37038c1a17bea7088ef6">Params</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr, <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>) {</div><div class="line"><a name="l00950"></a><span class="lineno">  950</span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ad90642d96a3b5354813fbf4d9b04b83f">initialize</a>(ptr, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>);</div><div class="line"><a name="l00951"></a><span class="lineno">  951</span>&#160;    }</div><div class="line"><a name="l00952"></a><span class="lineno">  952</span>&#160;</div><div class="line"><a name="l00953"></a><span class="lineno">  953</span>&#160;    <span class="comment">// Default constructor</span></div><div class="line"><a name="l00954"></a><span class="lineno">  954</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00955"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9cf4cd4ecb0a81cf3c03a70c7bfc4e09">  955</a></span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9cf4cd4ecb0a81cf3c03a70c7bfc4e09">Params</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr,</div><div class="line"><a name="l00956"></a><span class="lineno">  956</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _stride_d,</div><div class="line"><a name="l00957"></a><span class="lineno">  957</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h,</div><div class="line"><a name="l00958"></a><span class="lineno">  958</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w,</div><div class="line"><a name="l00959"></a><span class="lineno">  959</span>&#160;           <span class="keywordtype">long</span> <span class="keywordtype">long</span> _inc_d,</div><div class="line"><a name="l00960"></a><span class="lineno">  960</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h,</div><div class="line"><a name="l00961"></a><span class="lineno">  961</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w,</div><div class="line"><a name="l00962"></a><span class="lineno">  962</span>&#160;           <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance) {</div><div class="line"><a name="l00963"></a><span class="lineno">  963</span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ad90642d96a3b5354813fbf4d9b04b83f">initialize</a>(ptr, _stride_d, _stride_h, _stride_w, _inc_d, _inc_h, _inc_w, _inc_advance);</div><div class="line"><a name="l00964"></a><span class="lineno">  964</span>&#160;    }</div><div class="line"><a name="l00965"></a><span class="lineno">  965</span>&#160;</div><div class="line"><a name="l00967"></a><span class="lineno">  967</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00968"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#aca14058b112b7d5105658457341726cb">  968</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#aca14058b112b7d5105658457341726cb">initialize</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">SharedStorage</a> &amp;storage) {</div><div class="line"><a name="l00969"></a><span class="lineno">  969</span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> = &amp;storage[0];</div><div class="line"><a name="l00970"></a><span class="lineno">  970</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>();</div><div class="line"><a name="l00971"></a><span class="lineno">  971</span>&#160;    }</div><div class="line"><a name="l00972"></a><span class="lineno">  972</span>&#160;</div><div class="line"><a name="l00974"></a><span class="lineno">  974</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00975"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a0d36c05a4a757db5ebfe5f180b174b8c">  975</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a0d36c05a4a757db5ebfe5f180b174b8c">initialize</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr) {</div><div class="line"><a name="l00976"></a><span class="lineno">  976</span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> = ptr;</div><div class="line"><a name="l00977"></a><span class="lineno">  977</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>();</div><div class="line"><a name="l00978"></a><span class="lineno">  978</span>&#160;    }</div><div class="line"><a name="l00979"></a><span class="lineno">  979</span>&#160;</div><div class="line"><a name="l00981"></a><span class="lineno">  981</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00982"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a23c9e9d1d2bed7e5d8579df9cc42dda3">  982</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a23c9e9d1d2bed7e5d8579df9cc42dda3">initialize</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr, <span class="keywordtype">long</span> <span class="keywordtype">long</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>) {</div><div class="line"><a name="l00983"></a><span class="lineno">  983</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>);</div><div class="line"><a name="l00984"></a><span class="lineno">  984</span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> = ptr;</div><div class="line"><a name="l00985"></a><span class="lineno">  985</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00986"></a><span class="lineno">  986</span>&#160;    }</div><div class="line"><a name="l00987"></a><span class="lineno">  987</span>&#160;</div><div class="line"><a name="l00989"></a><span class="lineno">  989</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00990"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6a7702de0e88449b3d1864b208adf87a">  990</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6a7702de0e88449b3d1864b208adf87a">initialize</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a> *ptr,</div><div class="line"><a name="l00991"></a><span class="lineno">  991</span>&#160;                   <span class="keywordtype">long</span> <span class="keywordtype">long</span> _stride_d,</div><div class="line"><a name="l00992"></a><span class="lineno">  992</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_h,</div><div class="line"><a name="l00993"></a><span class="lineno">  993</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _stride_w,</div><div class="line"><a name="l00994"></a><span class="lineno">  994</span>&#160;                   <span class="keywordtype">long</span> <span class="keywordtype">long</span> _inc_d,</div><div class="line"><a name="l00995"></a><span class="lineno">  995</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_h,</div><div class="line"><a name="l00996"></a><span class="lineno">  996</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_w,</div><div class="line"><a name="l00997"></a><span class="lineno">  997</span>&#160;                   <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> _inc_advance) {</div><div class="line"><a name="l00998"></a><span class="lineno">  998</span>&#160;      <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> = ptr;</div><div class="line"><a name="l00999"></a><span class="lineno">  999</span>&#160;      <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(</div><div class="line"><a name="l01000"></a><span class="lineno"> 1000</span>&#160;          _stride_d, _stride_h, _stride_w, _inc_d, _inc_h, _inc_w, _inc_advance);</div><div class="line"><a name="l01001"></a><span class="lineno"> 1001</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l01002"></a><span class="lineno"> 1002</span>&#160;    }</div><div class="line"><a name="l01003"></a><span class="lineno"> 1003</span>&#160;</div><div class="line"><a name="l01005"></a><span class="lineno"> 1005</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l01006"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ad90642d96a3b5354813fbf4d9b04b83f"> 1006</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#ad90642d96a3b5354813fbf4d9b04b83f">initialize</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">Base::Params::initialize</a>(); }</div><div class="line"><a name="l01007"></a><span class="lineno"> 1007</span>&#160;  };</div><div class="line"><a name="l01008"></a><span class="lineno"> 1008</span>&#160;</div><div class="line"><a name="l01009"></a><span class="lineno"> 1009</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l01010"></a><span class="lineno"> 1010</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l01011"></a><span class="lineno"> 1011</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l01012"></a><span class="lineno"> 1012</span>&#160;</div><div class="line"><a name="l01014"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d"> 1014</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>;</div><div class="line"><a name="l01015"></a><span class="lineno"> 1015</span>&#160;</div><div class="line"><a name="l01017"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825"> 1017</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>;</div><div class="line"><a name="l01018"></a><span class="lineno"> 1018</span>&#160;</div><div class="line"><a name="l01020"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e"> 1020</a></span>&#160;  <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">stage</a>;</div><div class="line"><a name="l01021"></a><span class="lineno"> 1021</span>&#160;</div><div class="line"><a name="l01022"></a><span class="lineno"> 1022</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l01023"></a><span class="lineno"> 1023</span>&#160;  <span class="comment">// Predicate initialization</span></div><div class="line"><a name="l01024"></a><span class="lineno"> 1024</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l01025"></a><span class="lineno"> 1025</span>&#160;</div><div class="line"><a name="l01027"></a><span class="lineno"> 1027</span>&#160;  <span class="keyword">template</span> &lt;</div><div class="line"><a name="l01029"></a><span class="lineno"> 1029</span>&#160;      <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l01030"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#acb6bc889b93d25c9e483a0b7297d7c89"> 1030</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#acb6bc889b93d25c9e483a0b7297d7c89">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l01031"></a><span class="lineno"> 1031</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;bounds,</div><div class="line"><a name="l01032"></a><span class="lineno"> 1032</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,</div><div class="line"><a name="l01033"></a><span class="lineno"> 1033</span>&#160;                                                                                           0,</div><div class="line"><a name="l01034"></a><span class="lineno"> 1034</span>&#160;                                                                                           0)) {</div><div class="line"><a name="l01035"></a><span class="lineno"> 1035</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">Base::initialize_predicates</a>(</div><div class="line"><a name="l01036"></a><span class="lineno"> 1036</span>&#160;        predicate_it,</div><div class="line"><a name="l01037"></a><span class="lineno"> 1037</span>&#160;        <a class="code" href="structcutlass_1_1RegularTilePredicateFunctor.html">RegularTilePredicateFunctor&lt;typename Traits::Delta&gt;</a>(bounds),</div><div class="line"><a name="l01038"></a><span class="lineno"> 1038</span>&#160;        block_offset + <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>[0], <a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>[1], <a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>[2]));</div><div class="line"><a name="l01039"></a><span class="lineno"> 1039</span>&#160;  }</div><div class="line"><a name="l01040"></a><span class="lineno"> 1040</span>&#160;</div><div class="line"><a name="l01042"></a><span class="lineno"> 1042</span>&#160;  <span class="keyword">template</span> &lt;</div><div class="line"><a name="l01044"></a><span class="lineno"> 1044</span>&#160;      <span class="keyword">typename</span> PredicateIterator,</div><div class="line"><a name="l01046"></a><span class="lineno"> 1046</span>&#160;      <span class="keyword">typename</span> PredicateFunctor&gt;</div><div class="line"><a name="l01047"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a890a7239a89679662aeaea797ba32d32"> 1047</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a890a7239a89679662aeaea797ba32d32">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l01048"></a><span class="lineno"> 1048</span>&#160;                                                 PredicateFunctor <span class="keyword">const</span> &amp;functor,</div><div class="line"><a name="l01049"></a><span class="lineno"> 1049</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset) {</div><div class="line"><a name="l01050"></a><span class="lineno"> 1050</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">Base::initialize_predicates</a>(</div><div class="line"><a name="l01051"></a><span class="lineno"> 1051</span>&#160;        predicate_it,</div><div class="line"><a name="l01052"></a><span class="lineno"> 1052</span>&#160;        functor,</div><div class="line"><a name="l01053"></a><span class="lineno"> 1053</span>&#160;        block_offset + <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>[0], <a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>[1], <a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>[2]));</div><div class="line"><a name="l01054"></a><span class="lineno"> 1054</span>&#160;  }</div><div class="line"><a name="l01055"></a><span class="lineno"> 1055</span>&#160;</div><div class="line"><a name="l01056"></a><span class="lineno"> 1056</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l01057"></a><span class="lineno"> 1057</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l01058"></a><span class="lineno"> 1058</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l01059"></a><span class="lineno"> 1059</span>&#160;</div><div class="line"><a name="l01061"></a><span class="lineno"> 1061</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l01062"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a9f4501c6e8ba0f4511919c1b63c14e69"> 1062</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreIterator.html#a9f4501c6e8ba0f4511919c1b63c14e69">TileStoreIterator</a>() {}</div><div class="line"><a name="l01063"></a><span class="lineno"> 1063</span>&#160;</div><div class="line"><a name="l01065"></a><span class="lineno"> 1065</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l01066"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aa563bb10f8e58d97e81959556923e210"> 1066</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa563bb10f8e58d97e81959556923e210">TileStoreIterator</a>(<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params,</div><div class="line"><a name="l01067"></a><span class="lineno"> 1067</span>&#160;                    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0),</div><div class="line"><a name="l01068"></a><span class="lineno"> 1068</span>&#160;                    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a">ThreadOffset</a>())</div><div class="line"><a name="l01069"></a><span class="lineno"> 1069</span>&#160;      : <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>(_params), <a class="code" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">stage</a>(0) {</div><div class="line"><a name="l01070"></a><span class="lineno"> 1070</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l01071"></a><span class="lineno"> 1071</span>&#160;</div><div class="line"><a name="l01072"></a><span class="lineno"> 1072</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> += (block_offset[0] + <a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>[0]) * <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a> +</div><div class="line"><a name="l01073"></a><span class="lineno"> 1073</span>&#160;                      (block_offset[1] + <a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>[1]) * <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> +</div><div class="line"><a name="l01074"></a><span class="lineno"> 1074</span>&#160;                      (block_offset[2] + <a class="code" href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">thread_offset</a>[2]) * <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>;</div><div class="line"><a name="l01075"></a><span class="lineno"> 1075</span>&#160;  }</div><div class="line"><a name="l01076"></a><span class="lineno"> 1076</span>&#160;</div><div class="line"><a name="l01078"></a><span class="lineno"> 1078</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l01079"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a2b58a21331cf3255f5d3938a39babf20"> 1079</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreIterator.html#a2b58a21331cf3255f5d3938a39babf20">TileStoreIterator</a>(<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;, <a class="code" href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">Scalar</a> *ptr, <a class="code" href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a">ThreadOffset</a>())</div><div class="line"><a name="l01080"></a><span class="lineno"> 1080</span>&#160;      : <a class="code" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">stage</a>(0) {</div><div class="line"><a name="l01081"></a><span class="lineno"> 1081</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> = ptr + thread_offset_func()[2];</div><div class="line"><a name="l01082"></a><span class="lineno"> 1082</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a> = 0;</div><div class="line"><a name="l01083"></a><span class="lineno"> 1083</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a> = 0;</div><div class="line"><a name="l01084"></a><span class="lineno"> 1084</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a> = 1;</div><div class="line"><a name="l01085"></a><span class="lineno"> 1085</span>&#160;</div><div class="line"><a name="l01086"></a><span class="lineno"> 1086</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a> = <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a> = <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a> = <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">inc_advance</a> = 0;</div><div class="line"><a name="l01087"></a><span class="lineno"> 1087</span>&#160;  }</div><div class="line"><a name="l01088"></a><span class="lineno"> 1088</span>&#160;</div><div class="line"><a name="l01090"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975"> 1090</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975">inc_d</a>() { <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> += <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">inc_d</a>; }</div><div class="line"><a name="l01091"></a><span class="lineno"> 1091</span>&#160;</div><div class="line"><a name="l01093"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d"> 1093</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d">inc_h</a>() { <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> += <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">inc_h</a>; }</div><div class="line"><a name="l01094"></a><span class="lineno"> 1094</span>&#160;</div><div class="line"><a name="l01096"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1"> 1096</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1">inc_w</a>() { <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> += <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">inc_w</a>; }</div><div class="line"><a name="l01097"></a><span class="lineno"> 1097</span>&#160;</div><div class="line"><a name="l01099"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d"> 1099</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d">inc_advance</a>() {}</div><div class="line"><a name="l01100"></a><span class="lineno"> 1100</span>&#160;</div><div class="line"><a name="l01102"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#ad61206a742c8c5ab5bcd64b76ece9f74"> 1102</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#ad61206a742c8c5ab5bcd64b76ece9f74">inc_stage</a>() {</div><div class="line"><a name="l01103"></a><span class="lineno"> 1103</span>&#160;    <span class="keywordflow">if</span> (Tile::kD &gt; 1) {</div><div class="line"><a name="l01104"></a><span class="lineno"> 1104</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> kStageSize = Tile::kH * Tile::kW * Tile::kC;</div><div class="line"><a name="l01105"></a><span class="lineno"> 1105</span>&#160;      <span class="keywordflow">if</span> (<a class="code" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">stage</a> == Tile::kD - 1) {</div><div class="line"><a name="l01106"></a><span class="lineno"> 1106</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> -= (Tile::kD - 1) * kStageSize;</div><div class="line"><a name="l01107"></a><span class="lineno"> 1107</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">stage</a> = 0;</div><div class="line"><a name="l01108"></a><span class="lineno"> 1108</span>&#160;      } <span class="keywordflow">else</span> {</div><div class="line"><a name="l01109"></a><span class="lineno"> 1109</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> += kStageSize;</div><div class="line"><a name="l01110"></a><span class="lineno"> 1110</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">stage</a> = <a class="code" href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">stage</a> + 1;</div><div class="line"><a name="l01111"></a><span class="lineno"> 1111</span>&#160;      }</div><div class="line"><a name="l01112"></a><span class="lineno"> 1112</span>&#160;    }</div><div class="line"><a name="l01113"></a><span class="lineno"> 1113</span>&#160;  }</div><div class="line"><a name="l01114"></a><span class="lineno"> 1114</span>&#160;</div><div class="line"><a name="l01116"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a57b284e6cbff892d45e5cfeb0ae1e3ed"> 1116</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> &amp; <a class="code" href="structcutlass_1_1TileStoreIterator.html#a57b284e6cbff892d45e5cfeb0ae1e3ed">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;offset) {</div><div class="line"><a name="l01117"></a><span class="lineno"> 1117</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> += offset.template dot&lt;long long&gt;(</div><div class="line"><a name="l01118"></a><span class="lineno"> 1118</span>&#160;      <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">stride_d</a>, <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">stride_h</a>, <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">stride_w</a>)</div><div class="line"><a name="l01119"></a><span class="lineno"> 1119</span>&#160;    );</div><div class="line"><a name="l01120"></a><span class="lineno"> 1120</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l01121"></a><span class="lineno"> 1121</span>&#160;  }</div><div class="line"><a name="l01122"></a><span class="lineno"> 1122</span>&#160;</div><div class="line"><a name="l01124"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aa6977ded39ead005b3435f13f0e51116"> 1124</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa6977ded39ead005b3435f13f0e51116">add_pointer_offset</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">Index</a> offset) { <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a> += offset; }</div><div class="line"><a name="l01125"></a><span class="lineno"> 1125</span>&#160;</div><div class="line"><a name="l01127"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08"> 1127</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08">store_element</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> <span class="keyword">const</span> &amp;value, <span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) {</div><div class="line"><a name="l01128"></a><span class="lineno"> 1128</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l01129"></a><span class="lineno"> 1129</span>&#160;        <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;typename Base::ImmediateOffsetStrides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l01130"></a><span class="lineno"> 1130</span>&#160;    <a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;<a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a>,</div><div class="line"><a name="l01131"></a><span class="lineno"> 1131</span>&#160;          <a class="code" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">kAccessSize</a>,</div><div class="line"><a name="l01132"></a><span class="lineno"> 1132</span>&#160;          <a class="code" href="structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f">kMemorySpace</a>,</div><div class="line"><a name="l01133"></a><span class="lineno"> 1133</span>&#160;          <a class="code" href="structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f">kFragmentElementType</a>,</div><div class="line"><a name="l01134"></a><span class="lineno"> 1134</span>&#160;          <a class="code" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">FragmentElement</a>,</div><div class="line"><a name="l01135"></a><span class="lineno"> 1135</span>&#160;          Tile::kW,</div><div class="line"><a name="l01136"></a><span class="lineno"> 1136</span>&#160;          <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">FragmentElement</a>) * <a class="code" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">kAccessSize</a>&gt;::<a class="code" href="structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e">store</a>(value, <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a>, offset);</div><div class="line"><a name="l01137"></a><span class="lineno"> 1137</span>&#160;  }</div><div class="line"><a name="l01138"></a><span class="lineno"> 1138</span>&#160;</div><div class="line"><a name="l01140"></a><span class="lineno"> 1140</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l01141"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44"> 1141</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44">store_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> <span class="keyword">const</span> &amp;fragment, PredicateIterator pred_it) {</div><div class="line"><a name="l01142"></a><span class="lineno"> 1142</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">FragmentConstIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l01143"></a><span class="lineno"> 1143</span>&#160;</div><div class="line"><a name="l01144"></a><span class="lineno"> 1144</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Iterations::kD; ++d) {</div><div class="line"><a name="l01145"></a><span class="lineno"> 1145</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l01146"></a><span class="lineno"> 1146</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w, ++pred_it) {</div><div class="line"><a name="l01147"></a><span class="lineno"> 1147</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Iterations::kC; ++c) {</div><div class="line"><a name="l01148"></a><span class="lineno"> 1148</span>&#160;            <span class="keywordflow">if</span> (*pred_it) {</div><div class="line"><a name="l01149"></a><span class="lineno"> 1149</span>&#160;              <a class="code" href="structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08">store_element</a>(</div><div class="line"><a name="l01150"></a><span class="lineno"> 1150</span>&#160;                  reinterpret_cast&lt;AccessType const &amp;&gt;(frag_iterator.at(d, h, w, c)), d, h, w, c);</div><div class="line"><a name="l01151"></a><span class="lineno"> 1151</span>&#160;            }</div><div class="line"><a name="l01152"></a><span class="lineno"> 1152</span>&#160;          }</div><div class="line"><a name="l01153"></a><span class="lineno"> 1153</span>&#160;          <span class="keywordflow">if</span> (w &lt; Iterations::kW - 1) {</div><div class="line"><a name="l01154"></a><span class="lineno"> 1154</span>&#160;            <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1">inc_w</a>();</div><div class="line"><a name="l01155"></a><span class="lineno"> 1155</span>&#160;          }</div><div class="line"><a name="l01156"></a><span class="lineno"> 1156</span>&#160;        }</div><div class="line"><a name="l01157"></a><span class="lineno"> 1157</span>&#160;        <span class="keywordflow">if</span> (h &lt; Iterations::kH - 1) {</div><div class="line"><a name="l01158"></a><span class="lineno"> 1158</span>&#160;          <a class="code" href="structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d">inc_h</a>();</div><div class="line"><a name="l01159"></a><span class="lineno"> 1159</span>&#160;        }</div><div class="line"><a name="l01160"></a><span class="lineno"> 1160</span>&#160;      }</div><div class="line"><a name="l01161"></a><span class="lineno"> 1161</span>&#160;      <span class="keywordflow">if</span> (d &lt; Iterations::kD - 1) {</div><div class="line"><a name="l01162"></a><span class="lineno"> 1162</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975">inc_d</a>();</div><div class="line"><a name="l01163"></a><span class="lineno"> 1163</span>&#160;      }</div><div class="line"><a name="l01164"></a><span class="lineno"> 1164</span>&#160;    }</div><div class="line"><a name="l01165"></a><span class="lineno"> 1165</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d">inc_advance</a>();</div><div class="line"><a name="l01166"></a><span class="lineno"> 1166</span>&#160;  }</div><div class="line"><a name="l01167"></a><span class="lineno"> 1167</span>&#160;</div><div class="line"><a name="l01169"></a><span class="lineno"> 1169</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l01170"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a35ab2595b09912d31a60c2a4e5847c88"> 1170</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a35ab2595b09912d31a60c2a4e5847c88">store_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> <span class="keyword">const</span> &amp;fragment) {</div><div class="line"><a name="l01171"></a><span class="lineno"> 1171</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l01172"></a><span class="lineno"> 1172</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44">store_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l01173"></a><span class="lineno"> 1173</span>&#160;  }</div><div class="line"><a name="l01174"></a><span class="lineno"> 1174</span>&#160;</div><div class="line"><a name="l01176"></a><span class="lineno"> 1176</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l01177"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e"> 1177</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e">store</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> <span class="keyword">const</span> &amp;fragment, PredicateIterator pred_it)<span class="keyword"> const </span>{</div><div class="line"><a name="l01178"></a><span class="lineno"> 1178</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> _store_it(*<span class="keyword">this</span>);</div><div class="line"><a name="l01179"></a><span class="lineno"> 1179</span>&#160;    _store_it.<a class="code" href="structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44">store_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l01180"></a><span class="lineno"> 1180</span>&#160;  }</div><div class="line"><a name="l01181"></a><span class="lineno"> 1181</span>&#160;</div><div class="line"><a name="l01183"></a><span class="lineno"> 1183</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l01184"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aa27a456bf12d0e44adc89a1c2ca7bc3b"> 1184</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa27a456bf12d0e44adc89a1c2ca7bc3b">store</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> <span class="keyword">const</span> &amp;fragment)<span class="keyword"> const </span>{</div><div class="line"><a name="l01185"></a><span class="lineno"> 1185</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l01186"></a><span class="lineno"> 1186</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e">store</a>(fragment, pred_it);</div><div class="line"><a name="l01187"></a><span class="lineno"> 1187</span>&#160;  }</div><div class="line"><a name="l01188"></a><span class="lineno"> 1188</span>&#160;</div><div class="line"><a name="l01190"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c"> 1190</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c">load_element</a>(<a class="code" href="unioncutlass_1_1Vector.html">AccessType</a> &amp;value, <span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l01191"></a><span class="lineno"> 1191</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l01192"></a><span class="lineno"> 1192</span>&#160;        <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;typename Base::ImmediateOffsetStrides&gt;::get</a>(d, h, w, c);</div><div class="line"><a name="l01193"></a><span class="lineno"> 1193</span>&#160;</div><div class="line"><a name="l01194"></a><span class="lineno"> 1194</span>&#160;    <a class="code" href="structcutlass_1_1Load.html">Load</a>&lt;<a class="code" href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">Scalar</a>,</div><div class="line"><a name="l01195"></a><span class="lineno"> 1195</span>&#160;         <a class="code" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">kAccessSize</a>,</div><div class="line"><a name="l01196"></a><span class="lineno"> 1196</span>&#160;         <a class="code" href="structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f">kMemorySpace</a>,</div><div class="line"><a name="l01197"></a><span class="lineno"> 1197</span>&#160;         <a class="code" href="structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f">kFragmentElementType</a>,</div><div class="line"><a name="l01198"></a><span class="lineno"> 1198</span>&#160;         <a class="code" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">FragmentElement</a>,</div><div class="line"><a name="l01199"></a><span class="lineno"> 1199</span>&#160;         Tile::kW,</div><div class="line"><a name="l01200"></a><span class="lineno"> 1200</span>&#160;         <span class="keyword">sizeof</span>(<a class="code" href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">FragmentElement</a>) * <a class="code" href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">kAccessSize</a>&gt;::<a class="code" href="structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6">load</a>(value, <a class="code" href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">params</a>.<a class="code" href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">pointer</a>, offset);</div><div class="line"><a name="l01201"></a><span class="lineno"> 1201</span>&#160;  }</div><div class="line"><a name="l01202"></a><span class="lineno"> 1202</span>&#160;</div><div class="line"><a name="l01204"></a><span class="lineno"> 1204</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l01205"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214"> 1205</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214">load_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it) {</div><div class="line"><a name="l01206"></a><span class="lineno"> 1206</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l01207"></a><span class="lineno"> 1207</span>&#160;</div><div class="line"><a name="l01208"></a><span class="lineno"> 1208</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> d = 0; d &lt; Iterations::kD; ++d) {</div><div class="line"><a name="l01209"></a><span class="lineno"> 1209</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l01210"></a><span class="lineno"> 1210</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w, ++pred_it) {</div><div class="line"><a name="l01211"></a><span class="lineno"> 1211</span>&#160;          <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Iterations::kC; ++c) {</div><div class="line"><a name="l01212"></a><span class="lineno"> 1212</span>&#160;            <span class="keywordflow">if</span> (*pred_it) {</div><div class="line"><a name="l01213"></a><span class="lineno"> 1213</span>&#160;              <a class="code" href="structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c">load_element</a>(</div><div class="line"><a name="l01214"></a><span class="lineno"> 1214</span>&#160;                  reinterpret_cast&lt;AccessType &amp;&gt;(frag_iterator.at(d, h, w, c)), d, h, w, c);</div><div class="line"><a name="l01215"></a><span class="lineno"> 1215</span>&#160;            }</div><div class="line"><a name="l01216"></a><span class="lineno"> 1216</span>&#160;          }</div><div class="line"><a name="l01217"></a><span class="lineno"> 1217</span>&#160;          <span class="keywordflow">if</span> (w &lt; Iterations::kW - 1) {</div><div class="line"><a name="l01218"></a><span class="lineno"> 1218</span>&#160;            <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1">inc_w</a>();</div><div class="line"><a name="l01219"></a><span class="lineno"> 1219</span>&#160;          }</div><div class="line"><a name="l01220"></a><span class="lineno"> 1220</span>&#160;        }</div><div class="line"><a name="l01221"></a><span class="lineno"> 1221</span>&#160;        <span class="keywordflow">if</span> (h &lt; Iterations::kH - 1) {</div><div class="line"><a name="l01222"></a><span class="lineno"> 1222</span>&#160;          <a class="code" href="structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d">inc_h</a>();</div><div class="line"><a name="l01223"></a><span class="lineno"> 1223</span>&#160;        }</div><div class="line"><a name="l01224"></a><span class="lineno"> 1224</span>&#160;      }</div><div class="line"><a name="l01225"></a><span class="lineno"> 1225</span>&#160;      <span class="keywordflow">if</span> (d &lt; Iterations::kD - 1) {</div><div class="line"><a name="l01226"></a><span class="lineno"> 1226</span>&#160;        <a class="code" href="structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975">inc_d</a>();</div><div class="line"><a name="l01227"></a><span class="lineno"> 1227</span>&#160;      }</div><div class="line"><a name="l01228"></a><span class="lineno"> 1228</span>&#160;    }</div><div class="line"><a name="l01229"></a><span class="lineno"> 1229</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d">inc_advance</a>();</div><div class="line"><a name="l01230"></a><span class="lineno"> 1230</span>&#160;  }</div><div class="line"><a name="l01231"></a><span class="lineno"> 1231</span>&#160;</div><div class="line"><a name="l01233"></a><span class="lineno"> 1233</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l01234"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#adfbd262dfb19fffd91e0712190d9712d"> 1234</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#adfbd262dfb19fffd91e0712190d9712d">load_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l01235"></a><span class="lineno"> 1235</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l01236"></a><span class="lineno"> 1236</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214">load_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l01237"></a><span class="lineno"> 1237</span>&#160;  }</div><div class="line"><a name="l01238"></a><span class="lineno"> 1238</span>&#160;</div><div class="line"><a name="l01240"></a><span class="lineno"> 1240</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l01241"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6"> 1241</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6">load</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, PredicateIterator pred_it)<span class="keyword"> const </span>{</div><div class="line"><a name="l01242"></a><span class="lineno"> 1242</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html">TileStoreIterator</a> _load_it(*<span class="keyword">this</span>);</div><div class="line"><a name="l01243"></a><span class="lineno"> 1243</span>&#160;    _load_it.<a class="code" href="structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214">load_post_increment</a>(fragment, pred_it);</div><div class="line"><a name="l01244"></a><span class="lineno"> 1244</span>&#160;  }</div><div class="line"><a name="l01245"></a><span class="lineno"> 1245</span>&#160;</div><div class="line"><a name="l01247"></a><span class="lineno"> 1247</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l01248"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#a8c42ab8699c3fd74dc7b59d559364b9a"> 1248</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#a8c42ab8699c3fd74dc7b59d559364b9a">load</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment)<span class="keyword"> const </span>{</div><div class="line"><a name="l01249"></a><span class="lineno"> 1249</span>&#160;    <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">PredicateVector::TrivialIterator</a> pred_it;</div><div class="line"><a name="l01250"></a><span class="lineno"> 1250</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6">load</a>(fragment, pred_it);</div><div class="line"><a name="l01251"></a><span class="lineno"> 1251</span>&#160;  }</div><div class="line"><a name="l01252"></a><span class="lineno"> 1252</span>&#160;</div><div class="line"><a name="l01254"></a><span class="lineno"> 1254</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l01255"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreIterator.html#ad33c46a584deb1c7968e08e349382af3"> 1255</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreIterator.html#ad33c46a584deb1c7968e08e349382af3">load</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a> &amp;fragment, <span class="keywordtype">int</span> d) {</div><div class="line"><a name="l01256"></a><span class="lineno"> 1256</span>&#160;    <a class="code" href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">FragmentIterator</a> frag_iterator(fragment);</div><div class="line"><a name="l01257"></a><span class="lineno"> 1257</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> h = 0; h &lt; Iterations::kH; ++h) {</div><div class="line"><a name="l01258"></a><span class="lineno"> 1258</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> w = 0; w &lt; Iterations::kW; ++w) {</div><div class="line"><a name="l01259"></a><span class="lineno"> 1259</span>&#160;        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> c = 0; c &lt; Iterations::kC; ++c) {</div><div class="line"><a name="l01260"></a><span class="lineno"> 1260</span>&#160;          <a class="code" href="structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c">load_element</a>(reinterpret_cast&lt;AccessType &amp;&gt;(frag_iterator.at(0, h, w, c)), d, h, w, c);</div><div class="line"><a name="l01261"></a><span class="lineno"> 1261</span>&#160;        }</div><div class="line"><a name="l01262"></a><span class="lineno"> 1262</span>&#160;      }</div><div class="line"><a name="l01263"></a><span class="lineno"> 1263</span>&#160;    }</div><div class="line"><a name="l01264"></a><span class="lineno"> 1264</span>&#160;  }</div><div class="line"><a name="l01265"></a><span class="lineno"> 1265</span>&#160;};</div><div class="line"><a name="l01266"></a><span class="lineno"> 1266</span>&#160;</div><div class="line"><a name="l01268"></a><span class="lineno"> 1268</span>&#160;</div><div class="line"><a name="l01269"></a><span class="lineno"> 1269</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_a6a7702de0e88449b3d1864b208adf87a"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6a7702de0e88449b3d1864b208adf87a">cutlass::TileStoreIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</div><div class="ttdoc">Initializes params. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:990</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a9bda55335fb2e90af2ee7d20571f3d9b"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a9bda55335fb2e90af2ee7d20571f3d9b">cutlass::TileLoadIterator::inc_advance</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_advance()</div><div class="ttdoc">Increment in the next dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:683</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a320c917d585df901e66257c7d9b4780c"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a320c917d585df901e66257c7d9b4780c">cutlass::TileStoreIterator::load_element</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_element(AccessType &amp;value, int d, int h, int w, int c) const</div><div class="ttdoc">Loads a single fragment element from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1190</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a24716c07ab1d7834a79d52231a990973"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a24716c07ab1d7834a79d52231a990973">cutlass::TileIteratorBase::AccessType</a></div><div class="ttdeci">Vectorize&lt; FragmentElement, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The elements loaded/store by one instruction. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:188</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_ad18ee6f519b03e1dbf711339b63e16d6"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#ad18ee6f519b03e1dbf711339b63e16d6">cutlass::TileStoreIterator::Tile</a></div><div class="ttdeci">Base::Tile Tile</div><div class="ttdoc">Tile shape. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:883</div></div>
+<div class="ttc" id="structcutlass_1_1RegularTilePredicateFunctor_html_acd32282ce7852c4669098c06bcd9a360"><div class="ttname"><a href="structcutlass_1_1RegularTilePredicateFunctor.html#acd32282ce7852c4669098c06bcd9a360">cutlass::RegularTilePredicateFunctor::Delta</a></div><div class="ttdeci">Delta_ Delta</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:113</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a6157fe8a2ffefd45eba6f3953f0e2994"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a6157fe8a2ffefd45eba6f3953f0e2994">cutlass::TileStoreIterator::PredicateVector</a></div><div class="ttdeci">Base::PredicateVector PredicateVector</div><div class="ttdoc">Default predicate mask type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:910</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a9a1098e6c7b8c7c377031fe59a18fbf5"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a1098e6c7b8c7c377031fe59a18fbf5">cutlass::TileLoadIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params()</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:501</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a4ffe90c974b260220fe0b44274095322"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a4ffe90c974b260220fe0b44274095322">cutlass::TileLoadIterator::TileLoadIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileLoadIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Constructs a tile load iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:644</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a61b898051d0397b013407a4c90409aa0"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a61b898051d0397b013407a4c90409aa0">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(SharedStorage const &amp;storage)</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:544</div></div>
+<div class="ttc" id="structcutlass_1_1TileTraits_html_a3632c351a28f71f6c140dd33089d80b0"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#a3632c351a28f71f6c140dd33089d80b0">cutlass::TileTraits::Tile</a></div><div class="ttdeci">Tile_ Tile</div><div class="ttdoc">Shape of the tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:80</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ab49ff66953031a8cfcfa11ddc092025c"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ab49ff66953031a8cfcfa11ddc092025c">cutlass::TileIteratorBase::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:164</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a7f1499ada284c21624487d4d3a5dbd10"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a7f1499ada284c21624487d4d3a5dbd10">cutlass::TileLoadIterator::Tile</a></div><div class="ttdeci">Base::Tile Tile</div><div class="ttdoc">Tile shape. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:346</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a2716b9010d2902b90e63abb0531ee915"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a2716b9010d2902b90e63abb0531ee915">cutlass::TileLoadIterator::load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)</div><div class="ttdoc">Loads a fragment and advances the iterator to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:533</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a8a1527b4b469ae1f97afde2502ece70d"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a8a1527b4b469ae1f97afde2502ece70d">cutlass::TileLoadIterator::ThreadOffset</a></div><div class="ttdeci">Base::ThreadOffset ThreadOffset</div><div class="ttdoc">ThreadOffset functor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:355</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a8059c57030df99b73309e9210ec5f624"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a8059c57030df99b73309e9210ec5f624">cutlass::TileStoreIterator::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies in which dimension post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:649</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a14f4b356c9cd320e6e7b451edbf58c24"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a14f4b356c9cd320e6e7b451edbf58c24">cutlass::TileIteratorBase::FragmentShape</a></div><div class="ttdeci">FragmentIterator::FragmentShape FragmentShape</div><div class="ttdoc">The shape of the fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:160</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a5abf4755aee07dc58b1d6183fbf4786f"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a5abf4755aee07dc58b1d6183fbf4786f">cutlass::TileIteratorBase::ThreadOffset</a></div><div class="ttdeci">Traits::ThreadOffset ThreadOffset</div><div class="ttdoc">Thread offset. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:140</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a94c0567316118abfb84fc28560a5a46a"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a94c0567316118abfb84fc28560a5a46a">cutlass::TileStoreIterator::kIteratorFragment</a></div><div class="ttdeci">static IteratorFragment::Kind const kIteratorFragment</div><div class="ttdoc">Specifies type of iterator fragment storage (Salar or WmmaMatrix) </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:652</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ae89afbcf642b3023770ff22969c51d16"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ae89afbcf642b3023770ff22969c51d16">cutlass::TileIteratorBase::Skew</a></div><div class="ttdeci">Skew_ Skew</div><div class="ttdoc">Skew quantity. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:125</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a3b872e85844c9e009fa480a71a829136"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a3b872e85844c9e009fa480a71a829136">cutlass::TileStoreIterator::FragmentShape</a></div><div class="ttdeci">Base::FragmentShape FragmentShape</div><div class="ttdoc">Fragment type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:676</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_a71f5238a712f7b2f377fb58938ac829b"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#a71f5238a712f7b2f377fb58938ac829b">cutlass::TileStoreIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(SharedStorage &amp;storage)</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:706</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html">cutlass::MemorySpace</a></div><div class="ttdoc">Enum to specify which memory space data resides in. </div><div class="ttdef"><b>Definition:</b> load_store.h:39</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a11ec4297c9a1352c8005ac222892b35c"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a11ec4297c9a1352c8005ac222892b35c">cutlass::TileLoadIterator::Skew</a></div><div class="ttdeci">Base::Skew Skew</div><div class="ttdoc">Skew quantity. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:343</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738dda"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">cutlass::IteratorAdvance::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_af496afebb8983e5d346c681334955224"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#af496afebb8983e5d346c681334955224">cutlass::TileIteratorBase::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:227</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a57348779bb004ed1ea0fd9cc252e895d"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a57348779bb004ed1ea0fd9cc252e895d">cutlass::TileStoreIterator::Skew</a></div><div class="ttdeci">Base::Skew Skew</div><div class="ttdoc">Skew quantity. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:661</div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_ab7922305d47b67e6cfb439e4e8d9f09b"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#ab7922305d47b67e6cfb439e4e8d9f09b">cutlass::TileStoreIterator::SharedStorage</a></div><div class="ttdeci">Base::Storage SharedStorage</div><div class="ttdoc">Storage object which may be stored to. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:694</div></div>
-<div class="ttc" id="structcutlass_1_1TileTraits_html"><div class="ttname"><a href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a></div><div class="ttdoc">A template defining Tile Traits Concept. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:77</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_afb6320b600f1f561594a9fb543b954e4"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#afb6320b600f1f561594a9fb543b954e4">cutlass::TileLoadIterator::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar const  * data() const</div><div class="ttdoc">Returns the current pointer. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:502</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a1bc1bd4893c14b313ee71b71db2903f3"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a1bc1bd4893c14b313ee71b71db2903f3">cutlass::TileLoadIterator::Base</a></div><div class="ttdeci">TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, IteratorFragment_, Skew_ &gt; Base</div><div class="ttdoc">Base class. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:319</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a53282fa4cb33cfcec79033d26e418af6"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a53282fa4cb33cfcec79033d26e418af6">cutlass::TileLoadIterator::TileLoadIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileLoadIterator(Params const &amp;, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Constructs a tile load iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:491</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_afd9e82df76ad35fe883b7834457242b2"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#afd9e82df76ad35fe883b7834457242b2">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar const *ptr, Index stride_d, Index stride_h, Index stride_w)</div><div class="ttdoc">Initializes params to access a raw pointer. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:401</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a788bab4fa46dc26854348b751cf1cc76"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a788bab4fa46dc26854348b751cf1cc76">cutlass::TileLoadIterator::BaseParams</a></div><div class="ttdeci">Base::Params BaseParams</div><div class="ttdoc">IteratorBase parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:379</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a5e6c00b99e0f752137b07f7059f6ee0f"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a5e6c00b99e0f752137b07f7059f6ee0f">cutlass::TileStoreIterator::params</a></div><div class="ttdeci">Params params</div><div class="ttdoc">Parameters structure. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:745</div></div>
-<div class="ttc" id="structcutlass_1_1Load_html_ad033ebc1452d96b18913333bf7068140"><div class="ttname"><a href="structcutlass_1_1Load.html#ad033ebc1452d96b18913333bf7068140">cutlass::Load::load</a></div><div class="ttdeci">static CUTLASS_DEVICE void load(AccessType &amp;dst, Scalar_ const *pointer, int offset)</div><div class="ttdoc">The load function. </div><div class="ttdef"><b>Definition:</b> load_store.h:59</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_aeeea0f8bdee876553a4908b9b7cbaf76"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#aeeea0f8bdee876553a4908b9b7cbaf76">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(SharedStorage const &amp;storage)</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:394</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84eaee9d9d6cea8079c32c9383bde45161fc">cutlass::TileLoadIterator::kRequiresLoadFence</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:382</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ae8dff52e619f06fbdbca8cb847c79895"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ae8dff52e619f06fbdbca8cb847c79895">cutlass::TileLoadIterator::Scalar</a></div><div class="ttdeci">Base::Scalar Scalar</div><div class="ttdoc">Scalar element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:325</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a4af8eeabe7c1ec0362782687a84466e0"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a4af8eeabe7c1ec0362782687a84466e0">cutlass::TileLoadIterator::AccessType</a></div><div class="ttdeci">Base::AccessType AccessType</div><div class="ttdoc">Memory access type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:361</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a53820de506cecb1f5fb07b3385d8272a"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a53820de506cecb1f5fb07b3385d8272a">cutlass::TileStoreIterator::store</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store(Fragment &amp;fragment, PredicateIterator pred_it) const</div><div class="ttdoc">Stores a fragment without advancing the iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:869</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a69d2f21c8188fb3229af8c2dbe0a23b6"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a69d2f21c8188fb3229af8c2dbe0a23b6">cutlass::TileLoadIterator::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies in which dimension post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:331</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a195993d58ae0eeb53203116ac02ab38d"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a195993d58ae0eeb53203116ac02ab38d">cutlass::TileLoadIterator::load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_post_increment(Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment and advances the iterator to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:561</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a93e166575be3b2f7489833ae5da23f23"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a93e166575be3b2f7489833ae5da23f23">cutlass::TileLoadIterator::TileLoadIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileLoadIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Constructs a tile load iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:468</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_af78a2bf3e7507dc7f50343a3c209f770"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#af78a2bf3e7507dc7f50343a3c209f770">cutlass::TileIteratorBase::valid</a></div><div class="ttdeci">CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Is the iterator valid? </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:239</div></div>
-<div class="ttc" id="structcutlass_1_1TileTraits_html_af7ae2fdb4c8f1702169cc7d437d2b469"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#af7ae2fdb4c8f1702169cc7d437d2b469">cutlass::TileTraits::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">Number of accesses performed. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:85</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_af0d26a2df2a1a5ba3c3169b736bd5d43"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#af0d26a2df2a1a5ba3c3169b736bd5d43">cutlass::TileStoreIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar *ptr, Index stride_d, Index stride_h, Index stride_w)</div><div class="ttdoc">Initializes params to access a raw pointer. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:713</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aaafe35622751532971c1b7efc54c888b"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aaafe35622751532971c1b7efc54c888b">cutlass::TileLoadIterator::params</a></div><div class="ttdeci">Params params</div><div class="ttdoc">Parameters structure. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:433</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">cutlass::PredicateVector::TrivialIterator</a></div><div class="ttdoc">Iterator that always returns true. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:308</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_ad52318b430437575b55099ca992ca3a7"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#ad52318b430437575b55099ca992ca3a7">cutlass::TileStoreIterator::Scalar</a></div><div class="ttdeci">Base::Scalar Scalar</div><div class="ttdoc">Scalar element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:643</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a6f50a8aec2d7045e9057b93df08172a8"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a6f50a8aec2d7045e9057b93df08172a8">cutlass::TileStoreIterator::Traits</a></div><div class="ttdeci">Base::Traits Traits</div><div class="ttdoc">concept TileTraits </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:640</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:40</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a58e8c883aea4cfdfa5a84c25a4704ebc"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a58e8c883aea4cfdfa5a84c25a4704ebc">cutlass::TileIteratorBase::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:172</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_ae63949f58c1b32959bbfa5b64d521f0f"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#ae63949f58c1b32959bbfa5b64d521f0f">cutlass::TileStoreIterator::store_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store_post_increment(Fragment &amp;fragment)</div><div class="ttdoc">Stores a fragment and advances to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:862</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a6ca47fd6e2f9cbb3498c138417ea414a"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a6ca47fd6e2f9cbb3498c138417ea414a">cutlass::TileIteratorBase::Storage</a></div><div class="ttdeci">Fragment&lt; Scalar, ShapeCount&lt; Tile &gt;::kCount, kFragmentSize &gt; Storage</div><div class="ttdoc">The storage. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:152</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_aebaecd0f971245ffc5a50fe5f7a9b4e8"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#aebaecd0f971245ffc5a50fe5f7a9b4e8">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:425</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a74dffe1ddcc84935ab170117e939b7e3"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a74dffe1ddcc84935ab170117e939b7e3">cutlass::TileStoreIterator::inc_d</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_d()</div><div class="ttdoc">Increment in the D dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:807</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a9720b1e4a10c2d5aa85f9a9c66a31bbf"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a9720b1e4a10c2d5aa85f9a9c66a31bbf">cutlass::TileLoadIterator::Iterations</a></div><div class="ttdeci">Base::Iterations Iterations</div><div class="ttdoc">Iterations. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:352</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_af884f720d36aa82e7f972932686ae986"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#af884f720d36aa82e7f972932686ae986">cutlass::TileStoreIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdoc">Initializes params to default values. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:737</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a4c7a3a4917245de8269b74bdabe16b76"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a4c7a3a4917245de8269b74bdabe16b76">cutlass::TileLoadIterator::FragmentConstIterator</a></div><div class="ttdeci">Base::FragmentConstIterator FragmentConstIterator</div><div class="ttdoc">Fragment const iterator definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:370</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a44665808adfd69df0d26cec4b1840cc3"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a44665808adfd69df0d26cec4b1840cc3">cutlass::TileIteratorBase::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:122</div></div>
-<div class="ttc" id="structcutlass_1_1Store_html_a1117fa7b7bdeeb3a7f2d647a1d340aaf"><div class="ttname"><a href="structcutlass_1_1Store.html#a1117fa7b7bdeeb3a7f2d647a1d340aaf">cutlass::Store::store</a></div><div class="ttdeci">static CUTLASS_DEVICE void store(AccessType const &amp;src, Scalar_ *pointer, int offset)</div><div class="ttdoc">The store function. </div><div class="ttdef"><b>Definition:</b> load_store.h:136</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_aea591d4278a8338ae8b50fa0b8f3a366"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#aea591d4278a8338ae8b50fa0b8f3a366">cutlass::TileIteratorBase::Params::inc_h</a></div><div class="ttdeci">Index inc_h</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:176</div></div>
+<div class="ttc" id="tensor__ref_8h_html"><div class="ttname"><a href="tensor__ref_8h.html">tensor_ref.h</a></div><div class="ttdoc">Defines a structure containing strides, bounds, and a pointer to tensor data. </div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a6c570dfa1cb68d436d8da6bd23cce6ce"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a6c570dfa1cb68d436d8da6bd23cce6ce">cutlass::TileLoadIterator::Iterations</a></div><div class="ttdeci">Base::Iterations Iterations</div><div class="ttdoc">Iterations. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:449</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a2ef70d9e13b5aa7e4a53233b153d7edd"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a2ef70d9e13b5aa7e4a53233b153d7edd">cutlass::TileIteratorBase::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Coord&lt; 4 &gt; const &amp;stride)</div><div class="ttdoc">Initializes the parameters object from a vector of strides. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:283</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ac811886f3412861928040546282b6973"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ac811886f3412861928040546282b6973">cutlass::TileIteratorBase::valid</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Is the iterator valid? </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:334</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ae50ca325a827bdf1d1bfab3ba6e204c1"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ae50ca325a827bdf1d1bfab3ba6e204c1">cutlass::TileIteratorBase::Skew</a></div><div class="ttdeci">Skew_ Skew</div><div class="ttdoc">Skew quantity. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:167</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a84f2f19069c3b003b1fcad438f690bc8"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a84f2f19069c3b003b1fcad438f690bc8">cutlass::TileLoadIterator::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars accessed per load/store. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:461</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html">cutlass::MemorySpace</a></div><div class="ttdoc">Enum to specify which memory space data resides in. </div><div class="ttdef"><b>Definition:</b> load_store.h:38</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_adfbd262dfb19fffd91e0712190d9712d"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#adfbd262dfb19fffd91e0712190d9712d">cutlass::TileStoreIterator::load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_post_increment(Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment and advances the iterator to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1234</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aae07fdedeef68abd4e6c099924c70910"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aae07fdedeef68abd4e6c099924c70910">cutlass::TileStoreIterator::Index</a></div><div class="ttdeci">Base::Index Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:877</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a57eff980f6b1086abe39dd617de5b948"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a57eff980f6b1086abe39dd617de5b948">cutlass::TileLoadIterator::SharedStorage</a></div><div class="ttdeci">Base::Storage SharedStorage</div><div class="ttdoc">Storage object that may be loaded from. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:476</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aff36e4a3de7e27667542564e0ec96a7e"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aff36e4a3de7e27667542564e0ec96a7e">cutlass::TileStoreIterator::stage</a></div><div class="ttdeci">int stage</div><div class="ttdoc">The stage. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1020</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a88eaa581e0b5419b98ee5a71073d0539"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a88eaa581e0b5419b98ee5a71073d0539">cutlass::TileLoadIterator::Tile</a></div><div class="ttdeci">Base::Tile Tile</div><div class="ttdoc">Tile shape. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:443</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a53917e002fd29a5650752c65f96b353d"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a53917e002fd29a5650752c65f96b353d">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</div><div class="ttdoc">Initializes params. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:568</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a59d40c5bd544fdabf42787b9f11cce51"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a59d40c5bd544fdabf42787b9f11cce51">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::FragmentIterator</a></div><div class="ttdeci">FragmentIterator&lt; Fragment, Iterations, AccessType &gt; FragmentIterator</div><div class="ttdoc">The fragment iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:199</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_adc4182adb78e34b7741f297eca86fe35"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#adc4182adb78e34b7741f297eca86fe35">cutlass::TileStoreIterator::Pointer</a></div><div class="ttdeci">Scalar * Pointer</div><div class="ttdoc">Pointer to underlying type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:919</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a0fec2c1f9c0b8fbde4ca6faf123b59a5"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a0fec2c1f9c0b8fbde4ca6faf123b59a5">cutlass::TileIteratorBase::ThreadOffset</a></div><div class="ttdeci">Traits::ThreadOffset ThreadOffset</div><div class="ttdoc">Thread offset. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:182</div></div>
+<div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738dda"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738dda">cutlass::IteratorAdvance::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a802c270449da579ed8661e915d27ce60"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a802c270449da579ed8661e915d27ce60">cutlass::TileIteratorBase::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</div><div class="ttdoc">Initializes params. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:262</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1TileTraits_html_a3db8202befa891bbc7c0a53c535cd21f"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#a3db8202befa891bbc7c0a53c535cd21f">cutlass::TileTraits::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; 0, 0, 0, 0 &gt; ImmediateOffsetStrides</div><div class="ttdoc">Strides for immediate offset computation. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:102</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ad272502e5a54615584bb037a33ff1dca"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ad272502e5a54615584bb037a33ff1dca">cutlass::TileLoadIterator::FragmentConstIterator</a></div><div class="ttdeci">Base::FragmentConstIterator FragmentConstIterator</div><div class="ttdoc">Fragment const iterator definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:470</div></div>
+<div class="ttc" id="structcutlass_1_1TileTraits_html"><div class="ttname"><a href="structcutlass_1_1TileTraits.html">cutlass::TileTraits</a></div><div class="ttdoc">A template defining Tile Traits Concept. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:78</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a70dfd0b62feb082d8da34af09d9524a6"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a70dfd0b62feb082d8da34af09d9524a6">cutlass::TileLoadIterator::FragmentElement</a></div><div class="ttdeci">FragmentElement_ FragmentElement</div><div class="ttdoc">Fragment element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:425</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a1dcbf633eac61ff06980e4992fbe8264"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a1dcbf633eac61ff06980e4992fbe8264">cutlass::TileLoadIterator::Base</a></div><div class="ttdeci">TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Base</div><div class="ttdoc">Base class. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:416</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a60bbb4d4a6a5b8fb32e176e7d33f9e82"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a60bbb4d4a6a5b8fb32e176e7d33f9e82">cutlass::TileLoadIterator::initialize_predicates</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Initializes a predicate vector using a RegularTilePredicateFunctor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:608</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a9ffa12dcd7ed1e96845e1cd273d9f219"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::Fragment</a></div><div class="ttdeci">Fragment&lt; FragmentElement, ShapeCount&lt; Iterations &gt;::kCount *kAccessSize &gt; Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_adbf563ecda4ffd4110d288f521c7e0da"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#adbf563ecda4ffd4110d288f521c7e0da">cutlass::TileIteratorBase::Iterations</a></div><div class="ttdeci">Traits::Iterations Iterations</div><div class="ttdoc">Iterations. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:179</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a1b070fc66109d372f5a45a5857594ac6"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a1b070fc66109d372f5a45a5857594ac6">cutlass::TileLoadIterator::load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load(Fragment &amp;fragment, int d)</div><div class="ttdoc">Loads a fragment without advancing the iterator.. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:785</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_afc68649cb9bb32931b27e711c7ce2604"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#afc68649cb9bb32931b27e711c7ce2604">cutlass::TileLoadIterator::Delta</a></div><div class="ttdeci">Base::Delta Delta</div><div class="ttdoc">Delta. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:446</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a4d437597ae736c581a9ba0764f9d955f"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a4d437597ae736c581a9ba0764f9d955f">cutlass::TileLoadIterator::load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)</div><div class="ttdoc">Loads a fragment and advances the iterator to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:735</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentElementType_html_a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd"><div class="ttname"><a href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">cutlass::FragmentElementType::kWmmaMatrix</a></div><div class="ttdef"><b>Definition:</b> load_store.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a3175746438646453e93e6e08e954bc8d"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a3175746438646453e93e6e08e954bc8d">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:584</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a44424164c9347f9916b2b86858706043"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a44424164c9347f9916b2b86858706043">cutlass::TileLoadIterator::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">Source or destination memory space. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:434</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ab37eec43846be90d558201bd6bb27ee4"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ab37eec43846be90d558201bd6bb27ee4">cutlass::TileIteratorBase::ImmediateOffsetStrides</a></div><div class="ttdeci">Traits::ImmediateOffsetStrides ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:176</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a7b4293bf8291b0383dee695a60f2e0fd"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a7b4293bf8291b0383dee695a60f2e0fd">cutlass::TileIteratorBase::Params::inc_d</a></div><div class="ttdeci">long long inc_d</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:223</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ae8cb43a98cd2fa28f6457afbda8ec58a"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ae8cb43a98cd2fa28f6457afbda8ec58a">cutlass::TileLoadIterator::ThreadOffset</a></div><div class="ttdeci">Base::ThreadOffset ThreadOffset</div><div class="ttdoc">ThreadOffset functor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:452</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_ad90642d96a3b5354813fbf4d9b04b83f"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#ad90642d96a3b5354813fbf4d9b04b83f">cutlass::TileStoreIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdoc">Initializes params to default values. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1006</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a4604b230174b11bc7ddf5f3e9a922139"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a4604b230174b11bc7ddf5f3e9a922139">cutlass::TileLoadIterator::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:464</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a6d8f1e07f286ed8d5761e2a878b807d3"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a6d8f1e07f286ed8d5761e2a878b807d3">cutlass::TileIteratorBase::Params::inc_advance</a></div><div class="ttdeci">long long inc_advance</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:227</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_af6c297bb43573a13f6b721cc8ff730ca"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#af6c297bb43573a13f6b721cc8ff730ca">cutlass::TileStoreIterator::SharedStorage</a></div><div class="ttdeci">Base::Storage SharedStorage</div><div class="ttdoc">Storage object which may be stored to. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:913</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a993e1e7d8cc461a9cfa009b61b42621f"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a993e1e7d8cc461a9cfa009b61b42621f">cutlass::TileStoreIterator::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">Source or destination memory space. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:871</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_acb6bc889b93d25c9e483a0b7297d7c89"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#acb6bc889b93d25c9e483a0b7297d7c89">cutlass::TileStoreIterator::initialize_predicates</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Initializes a predicate vector using a RegularTilePredicateFunctor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1030</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_abcb7af7b35e605dfda5ce6a37a02f975"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#abcb7af7b35e605dfda5ce6a37a02f975">cutlass::TileStoreIterator::inc_d</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_d()</div><div class="ttdoc">Increment in the D dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1090</div></div>
+<div class="ttc" id="structcutlass_1_1TileTraits_html_a671ef48f4141a9de30b6ec6fb0be1feb"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#a671ef48f4141a9de30b6ec6fb0be1feb">cutlass::TileTraits::ThreadOffset</a></div><div class="ttdeci">ThreadOffset_ ThreadOffset</div><div class="ttdoc">Functor that returns the logical coordinate of each entity&amp;#39;s initial offset in the tile...</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:99</div></div>
+<div class="ttc" id="structcutlass_1_1PredicateVector_1_1TrivialIterator_html"><div class="ttname"><a href="structcutlass_1_1PredicateVector_1_1TrivialIterator.html">cutlass::PredicateVector::TrivialIterator</a></div><div class="ttdoc">Iterator that always returns true. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:309</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_ac030ea4568fa2cb6d6661df75062cd1a"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac030ea4568fa2cb6d6661df75062cd1a">cutlass::TileIteratorBase::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Coord&lt; 4 &gt; const &amp;stride)</div><div class="ttdoc">Constructs params with a stride vector. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:256</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_a9e50043acd3b851cce169310a04c6827"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9e50043acd3b851cce169310a04c6827">cutlass::TileStoreIterator::Params::pointer</a></div><div class="ttdeci">Scalar * pointer</div><div class="ttdoc">Pointer to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:927</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_aa131e0ef02ce37038c1a17bea7088ef6"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#aa131e0ef02ce37038c1a17bea7088ef6">cutlass::TileStoreIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w)</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:949</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a82ceeea55603dbb0c6e5bf9c22ac692e"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a82ceeea55603dbb0c6e5bf9c22ac692e">cutlass::TileStoreIterator::FragmentShape</a></div><div class="ttdeci">Base::FragmentShape FragmentShape</div><div class="ttdoc">Fragment type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:895</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:39</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a05065dadf7b8a20284c566c82cda8000"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a05065dadf7b8a20284c566c82cda8000">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::PredicateVector</a></div><div class="ttdeci">PredicateVector&lt; ShapeCount&lt; Iterations &gt;::kCount &gt; PredicateVector</div><div class="ttdoc">Default predicate mask type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:206</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a31a021d6c099e8027fa9bcb5fdc21c11"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a31a021d6c099e8027fa9bcb5fdc21c11">cutlass::TileLoadIterator::stride_advance</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Index stride_advance(void)</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:725</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aa5386367e805cdaf47a5e7564bedc2fb"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aa5386367e805cdaf47a5e7564bedc2fb">cutlass::TileStoreIterator::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:901</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_acd3c170dd70bee777cb9e9dc662c5eac"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#acd3c170dd70bee777cb9e9dc662c5eac">cutlass::TileStoreIterator::TensorRef</a></div><div class="ttdeci">TensorRef&lt; Scalar, 4 &gt; TensorRef</div><div class="ttdoc">Tensor reference for the store iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:922</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a6a5d065939282fa1b9454b28a1e73948"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a6a5d065939282fa1b9454b28a1e73948">cutlass::TileLoadIterator::Traits</a></div><div class="ttdeci">Base::Traits Traits</div><div class="ttdoc">concept TileTraits </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:419</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a146adfb1951efd70995b05a7a31fd548"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a146adfb1951efd70995b05a7a31fd548">cutlass::TileLoadIterator&lt; TileTraits_, TileTraits_::Scalar, TileTraits_::MultiplicandTraits::kKstrided ? IteratorAdvance::kH :IteratorAdvance::kW, MemorySpace::kGlobal, Index_ &gt;::TensorRef</a></div><div class="ttdeci">TensorRef&lt; Scalar const, 4 &gt; TensorRef</div><div class="ttdoc">Tensor reference for the load iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:488</div></div>
+<div class="ttc" id="structcutlass_1_1Store_html"><div class="ttname"><a href="structcutlass_1_1Store.html">cutlass::Store</a></div><div class="ttdef"><b>Definition:</b> load_store.h:178</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a8c42ab8699c3fd74dc7b59d559364b9a"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a8c42ab8699c3fd74dc7b59d559364b9a">cutlass::TileStoreIterator::load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load(Fragment &amp;fragment) const</div><div class="ttdoc">Loads a fragment without advancing the iterator.. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1248</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aa566cf603a5c19c59946a41b04642e49"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aa566cf603a5c19c59946a41b04642e49">cutlass::TileLoadIterator::initialize_predicates</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)</div><div class="ttdoc">Initializes a predicate vector using an arbitrary predicate functor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:625</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a1f7c4143443d2bee4a69d1b380576f08"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a1f7c4143443d2bee4a69d1b380576f08">cutlass::TileStoreIterator::store_element</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store_element(AccessType const &amp;value, int d, int h, int w, int c)</div><div class="ttdoc">Stores a single fragment element into memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1127</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a064aaca9cc27e34bdae9684447a3f5be"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a064aaca9cc27e34bdae9684447a3f5be">cutlass::TileIteratorBase::FragmentShape</a></div><div class="ttdeci">FragmentIterator::FragmentShape FragmentShape</div><div class="ttdoc">The shape of the fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:203</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a39acc5c35c8db019a3aeef79e8005b7f"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a39acc5c35c8db019a3aeef79e8005b7f">cutlass::TileLoadIterator::Pointer</a></div><div class="ttdeci">Scalar const  * Pointer</div><div class="ttdoc">The pointer type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:485</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_acc8c86a3629a3ca105269fc3a47f2a4f"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#acc8c86a3629a3ca105269fc3a47f2a4f">cutlass::TileIteratorBase::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies dimension in which post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:155</div></div>
+<div class="ttc" id="cutlass_8h_html_a4b1c9f25ab6eaa25e1f2258dd63e6ce4"><div class="ttname"><a href="cutlass_8h.html#a4b1c9f25ab6eaa25e1f2258dd63e6ce4">CUTLASS_PRAGMA_UNROLL</a></div><div class="ttdeci">#define CUTLASS_PRAGMA_UNROLL</div><div class="ttdef"><b>Definition:</b> cutlass.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a4f029a268387bd63112d9074c185c623"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a4f029a268387bd63112d9074c185c623">cutlass::TileIteratorBase::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:220</div></div>
 <div class="ttc" id="predicate__vector_8h_html"><div class="ttname"><a href="predicate__vector_8h.html">predicate_vector.h</a></div><div class="ttdoc">Defines container classes and iterators for managing a statically sized vector of boolean predicates...</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ab457bd7953af9ef418510f55f52d1f39"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ab457bd7953af9ef418510f55f52d1f39">cutlass::TileLoadIterator::SharedStorage</a></div><div class="ttdeci">Base::Storage SharedStorage</div><div class="ttdoc">Storage object that may be loaded from. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:376</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator::Params</a></div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:700</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_af92ba20db048a9ec96976a1673f0f7c2"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#af92ba20db048a9ec96976a1673f0f7c2">cutlass::TileStoreIterator::initialize_predicates</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Initializes a predicate vector. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:759</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:302</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a7c6182031d9aa41d0e4a64516723e20a"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a7c6182031d9aa41d0e4a64516723e20a">cutlass::TileLoadIterator::Traits</a></div><div class="ttdeci">Base::Traits Traits</div><div class="ttdoc">concept TileTraits </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:322</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a78b6c0d6a1a96dd55a34bc302ecb07d7"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a78b6c0d6a1a96dd55a34bc302ecb07d7">cutlass::TileIteratorBase::initialize_predicates</a></div><div class="ttdeci">static CUTLASS_DEVICE void initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Initializes a predicate vector. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:247</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a5484b46ac2646edb7a185b51137f70c0"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a5484b46ac2646edb7a185b51137f70c0">cutlass::TileStoreIterator::BaseParams</a></div><div class="ttdeci">Base::Params BaseParams</div><div class="ttdoc">IteratorBase parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:697</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a2edd89863b8035137ccd8dd3ad7be464"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a2edd89863b8035137ccd8dd3ad7be464">cutlass::TileLoadIterator::FragmentElement</a></div><div class="ttdeci">Base::FragmentElement FragmentElement</div><div class="ttdoc">Fragment element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:328</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a954ef18acc12d8256a7d4e37683f8c2c"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a954ef18acc12d8256a7d4e37683f8c2c">cutlass::TileIteratorBase::Tile</a></div><div class="ttdeci">Traits::Tile Tile</div><div class="ttdoc">Tile shape. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:128</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a379a52ed1128fc9f93cad35d3e3233e5"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a379a52ed1128fc9f93cad35d3e3233e5">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::FragmentIterator</a></div><div class="ttdeci">FragmentIterator&lt; Fragment, Iterations, AccessType &gt; FragmentIterator</div><div class="ttdoc">The fragment iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:156</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_ae435b72b15eca46eb871446d92bd316e"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#ae435b72b15eca46eb871446d92bd316e">cutlass::TileStoreIterator::stage</a></div><div class="ttdeci">int stage</div><div class="ttdoc">The stage. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:751</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_ad2631ffcc963638aa5b016c66a2e2c55"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad2631ffcc963638aa5b016c66a2e2c55">cutlass::TileIteratorBase::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</div><div class="ttdoc">Initializes params. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:183</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a0e79ed59263ebc3478c43f2f9a50cb5a"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a0e79ed59263ebc3478c43f2f9a50cb5a">cutlass::TileStoreIterator::AccessType</a></div><div class="ttdeci">Base::AccessType AccessType</div><div class="ttdoc">Memory access type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:679</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a2b13136a970fae187fcb377c9be28fac"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a2b13136a970fae187fcb377c9be28fac">cutlass::TileStoreIterator::FragmentElement</a></div><div class="ttdeci">Base::FragmentElement FragmentElement</div><div class="ttdoc">Fragment element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:646</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">cutlass::MemorySpace::kGeneric</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aeb3faf5e8f976f5a4d158ceb41a1cc64"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aeb3faf5e8f976f5a4d158ceb41a1cc64">cutlass::TileLoadIterator::inc_stage</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_stage()</div><div class="ttdoc">Increment the stage. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:517</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorFragment_html_ae7b6a9ac856eca8b8e437305fa716a80"><div class="ttname"><a href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80">cutlass::IteratorFragment::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:67</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a64ae02b44f275ef2f016949aec769328"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a64ae02b44f275ef2f016949aec769328">cutlass::TileLoadIterator::PredicateVector</a></div><div class="ttdeci">Base::PredicateVector PredicateVector</div><div class="ttdoc">Default predicate mask type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:373</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_aa3922946bb0da0c0040dec44aa389ec1"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#aa3922946bb0da0c0040dec44aa389ec1">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar const *ptr, Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</div><div class="ttdoc">Initializes params. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:409</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_ac1cfe92f1543ba445fa10f1859a0db98"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#ac1cfe92f1543ba445fa10f1859a0db98">cutlass::TileStoreIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar *ptr, Index _stride_d, Index _stride_h, Index _stride_w, Index _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</div><div class="ttdoc">Initializes params. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:721</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ac7cca14d54bf3f0749db1ffaea7c9ae7"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ac7cca14d54bf3f0749db1ffaea7c9ae7">cutlass::TileIteratorBase::FragmentElement</a></div><div class="ttdeci">FragmentElement_ FragmentElement</div><div class="ttdoc">Fragment element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:110</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a5ac2280dfcac08cec17b8c0db1c4593e"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a5ac2280dfcac08cec17b8c0db1c4593e">cutlass::TileStoreIterator::Index</a></div><div class="ttdeci">Base::Index Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:658</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_a6bbadae6b13aef8f31a77cacd88b068b"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#a6bbadae6b13aef8f31a77cacd88b068b">cutlass::TileStoreIterator::Params::pointer</a></div><div class="ttdeci">Scalar * pointer</div><div class="ttdoc">Pointer to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:702</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a1187258cd4068a627e73bee0302f1fc2"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1187258cd4068a627e73bee0302f1fc2">cutlass::TileIteratorBase::Params::inc_advance</a></div><div class="ttdeci">Index inc_advance</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:179</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorFragment_html_ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419"><div class="ttname"><a href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">cutlass::IteratorFragment::kWmmaMatrix</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:67</div></div>
-<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a63ff1767c4923b0a2b6b64487306ed76"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">cutlass::FragmentIterator::FragmentShape</a></div><div class="ttdeci">ShapeMul&lt; Iterations, Shape&lt; 1, 1, 1, kElementsPerAccess &gt; &gt;::Shape FragmentShape</div><div class="ttdoc">The shape of the the fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:185</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a313984457c78eea66c980f6813047b9c"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a313984457c78eea66c980f6813047b9c">cutlass::TileIteratorBase::Params::stride_w</a></div><div class="ttdeci">Index stride_w</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:173</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a81c9c0b17bf5f214230ecf10e0690a4e"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a81c9c0b17bf5f214230ecf10e0690a4e">cutlass::TileLoadIterator::TileLoadIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileLoadIterator()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:464</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html">cutlass::TileStoreIterator::Params</a></div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:925</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_af405f6c5f0bd8f04487d8a7f41dc1826"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">cutlass::TileIteratorBase::kFragmentElementType</a></div><div class="ttdeci">static FragmentElementType::Kind const kFragmentElementType</div><div class="ttdoc">Specifies iterator storage fragment type (Scalar or WmmaMatrix) </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:158</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_aac9e5b7890a53d46e5d49912b254ded7"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#aac9e5b7890a53d46e5d49912b254ded7">cutlass::TileIteratorBase::Traits</a></div><div class="ttdeci">Traits_ Traits</div><div class="ttdoc">concept TileTraits </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:146</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a64e0c9fb1f7d8fcc77bf0a915445ee6d"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a64e0c9fb1f7d8fcc77bf0a915445ee6d">cutlass::TileStoreIterator::params</a></div><div class="ttdeci">Params params</div><div class="ttdoc">Parameters structure. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1014</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_adfcd8a2e63bd0c515ef03760cc1c4283"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#adfcd8a2e63bd0c515ef03760cc1c4283">cutlass::TileStoreIterator::FragmentConstIterator</a></div><div class="ttdeci">Base::FragmentConstIterator FragmentConstIterator</div><div class="ttdoc">Fragment const iterator definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:907</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html">cutlass::TileLoadIterator</a></div><div class="ttdoc">An iterator implementing Tile Load Iterator Concept for loading a tile from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:399</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a5dd2a31d41d9098e928c559af12cbe66"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a5dd2a31d41d9098e928c559af12cbe66">cutlass::TileStoreIterator::BaseParams</a></div><div class="ttdeci">Base::Params BaseParams</div><div class="ttdoc">IteratorBase parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:916</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a64ce59c5deb58e208529761a44c7661d"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a64ce59c5deb58e208529761a44c7661d">cutlass::TileLoadIterator::inc_stage</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_stage()</div><div class="ttdoc">Increment the stage. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:699</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a1776bf51e1e23cde6c58529be58aafb9"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a1776bf51e1e23cde6c58529be58aafb9">cutlass::TileIteratorBase::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize()</div><div class="ttdoc">Gotta have this. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:321</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentElementType_html_a62883b0695dc3a7ff82916ff9d75df0b"><div class="ttname"><a href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0b">cutlass::FragmentElementType::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1RegularTilePredicateFunctor_html_a0e0b728d3685097a9280fbca6a47a2af"><div class="ttname"><a href="structcutlass_1_1RegularTilePredicateFunctor.html#a0e0b728d3685097a9280fbca6a47a2af">cutlass::RegularTilePredicateFunctor::RegularTilePredicateFunctor</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE RegularTilePredicateFunctor(Coord&lt; 3 &gt; _bounds)</div><div class="ttdoc">Constructs a predicate functor given the bounds of a tensor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:120</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_add962655973d5b8eff5673c04e053e4e"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#add962655973d5b8eff5673c04e053e4e">cutlass::TileLoadIterator::TileLoadIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileLoadIterator()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:640</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca21a44c0b78017acea0d1ffe223e5ca38">cutlass::MemorySpace::kGeneric</a></div><div class="ttdef"><b>Definition:</b> load_store.h:40</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a9aebb9153659320f1391671c215c519e"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a9aebb9153659320f1391671c215c519e">cutlass::TileLoadIterator::BaseParams</a></div><div class="ttdeci">Base::Params BaseParams</div><div class="ttdoc">IteratorBase parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:479</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a5561e676148200c2fc85a603847cc596"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a5561e676148200c2fc85a603847cc596">cutlass::TileLoadIterator::params</a></div><div class="ttdeci">Params params</div><div class="ttdoc">Parameters structure. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:592</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a5eb6375410d4440c0f73a25c06d282b5"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a5eb6375410d4440c0f73a25c06d282b5">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::FragmentConstIterator</a></div><div class="ttdeci">FragmentConstIterator&lt; Fragment, Iterations, AccessType &gt; FragmentConstIterator</div><div class="ttdoc">The fragment const iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:201</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a8869188d1c3b867fe6389aadf04837bf"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8869188d1c3b867fe6389aadf04837bf">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar const *ptr)</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:552</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a723041057b1e8212e075959a22c0c120"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a723041057b1e8212e075959a22c0c120">cutlass::TileLoadIterator::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileLoadIterator &amp; operator+=(Coord&lt; 3 &gt; const &amp;offset)</div><div class="ttdoc">Adds a vector offset to the iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:713</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a6f74b87df129693ee6ac9a6fcc0c8910"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a6f74b87df129693ee6ac9a6fcc0c8910">cutlass::TileLoadIterator::load_element</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_element(AccessType &amp;value, int d, int h, int w, int c) const</div><div class="ttdoc">Loads a single fragment element from memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:686</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a10431ed94c0dd66a8c1d01ba7c8b5aa2"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a10431ed94c0dd66a8c1d01ba7c8b5aa2">cutlass::TileStoreIterator::AccessType</a></div><div class="ttdeci">Base::AccessType AccessType</div><div class="ttdoc">Memory access type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:898</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a1f3601c595f12e7083919ece9b1ec84ea33514d9f9f71acb901aa1d9860fa8126">cutlass::TileLoadIterator::kRequiresLoadFence</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:482</div></div>
+<div class="ttc" id="structcutlass_1_1DumpType_html"><div class="ttname"><a href="structcutlass_1_1DumpType.html">cutlass::DumpType</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:134</div></div>
+<div class="ttc" id="structcutlass_1_1TileTraits_html_a46b9e04bb8d33fcf8fc116cc48a555fc"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#a46b9e04bb8d33fcf8fc116cc48a555fc">cutlass::TileTraits::Iterations</a></div><div class="ttdeci">Iterations_ Iterations</div><div class="ttdoc">Number of accesses performed. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:86</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentIterator_html_a63ff1767c4923b0a2b6b64487306ed76"><div class="ttname"><a href="structcutlass_1_1FragmentIterator.html#a63ff1767c4923b0a2b6b64487306ed76">cutlass::FragmentIterator::FragmentShape</a></div><div class="ttdeci">ShapeMul&lt; Iterations, Shape&lt; 1, 1, 1, kElementsPerAccess &gt; &gt;::Shape FragmentShape</div><div class="ttdoc">The shape of the the fragment. </div><div class="ttdef"><b>Definition:</b> fragment.h:183</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aa856180123f8d50a00222542fa6345cf"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aa856180123f8d50a00222542fa6345cf">cutlass::TileLoadIterator::load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load(Fragment &amp;fragment, PredicateIterator pred_it) const</div><div class="ttdoc">Loads a fragment without advancing the iterator.. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:771</div></div>
+<div class="ttc" id="structcutlass_1_1TileTraits_html_a0a494c2eacb51b65487f8405908a0214"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#a0a494c2eacb51b65487f8405908a0214">cutlass::TileTraits::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">Access size. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:105</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a2e682380b5ea9ea05ee8ffd68a1205f0"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a2e682380b5ea9ea05ee8ffd68a1205f0">cutlass::TileIteratorBase::Storage</a></div><div class="ttdeci">Fragment&lt; Scalar, ShapeCount&lt; Tile &gt;::kCount, kFragmentSize &gt; Storage</div><div class="ttdoc">The storage. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:194</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a18248da35dc9a0ae2411121bee323085"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a18248da35dc9a0ae2411121bee323085">cutlass::TileStoreIterator::Skew</a></div><div class="ttdeci">Base::Skew Skew</div><div class="ttdoc">Skew quantity. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:880</div></div>
+<div class="ttc" id="structcutlass_1_1TileTraits_html_ad6d99ccf2fcd2bd47e45d068f4d99c82"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#ad6d99ccf2fcd2bd47e45d068f4d99c82">cutlass::TileTraits::Delta</a></div><div class="ttdeci">Delta_ Delta</div><div class="ttdoc">Number of steps between accesses along each dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:83</div></div>
 <div class="ttc" id="load__store_8h_html"><div class="ttname"><a href="load__store_8h.html">load_store.h</a></div><div class="ttdoc">Defines abstractions for efficiently loading and storing vectors to memory. </div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a6608f7027994aaebdefd004fe94153d9"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a6608f7027994aaebdefd004fe94153d9">cutlass::TileLoadIterator::Params::pointer</a></div><div class="ttdeci">Scalar const  * pointer</div><div class="ttdoc">Pointer to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:390</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a037ccd942359e6bc8640a240b13cd330"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a037ccd942359e6bc8640a240b13cd330">cutlass::TileStoreIterator::TileStoreIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileStoreIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Constructs a tile store iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:780</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aafbb7a2137a07f0e07a12838b66bd511"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aafbb7a2137a07f0e07a12838b66bd511">cutlass::TileLoadIterator::Scalar</a></div><div class="ttdeci">Base::Scalar Scalar</div><div class="ttdoc">Scalar element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:422</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a46a2cbf407d3f43a7441323d150d96f1"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a46a2cbf407d3f43a7441323d150d96f1">cutlass::TileLoadIterator::FragmentShape</a></div><div class="ttdeci">Base::FragmentShape FragmentShape</div><div class="ttdoc">Fragment type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:455</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a9fb3af1ab0eeb5b17b42bb990edf0e4f"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a9fb3af1ab0eeb5b17b42bb990edf0e4f">cutlass::TileStoreIterator::kFragmentElementType</a></div><div class="ttdeci">static FragmentElementType::Kind const kFragmentElementType</div><div class="ttdoc">Specifies type of iterator fragment storage (Salar or WmmaMatrix) </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:868</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a2b58a21331cf3255f5d3938a39babf20"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a2b58a21331cf3255f5d3938a39babf20">cutlass::TileStoreIterator::TileStoreIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileStoreIterator(Params const &amp;, Scalar *ptr, ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Constructs a tile store iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1079</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a3ecd73de1202f7e4a0db86d9fe9de38d"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a3ecd73de1202f7e4a0db86d9fe9de38d">cutlass::TileStoreIterator::inc_advance</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_advance()</div><div class="ttdoc">Increment in the next dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1099</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a350f5beea87d811f43c55519bc0b9035"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a350f5beea87d811f43c55519bc0b9035">cutlass::TileStoreIterator::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdoc">Offset of an individual lane from the start of the tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:748</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a352ed0773b37f03bf68e4b6cf9899474"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a352ed0773b37f03bf68e4b6cf9899474">cutlass::TileIteratorBase::Iterations</a></div><div class="ttdeci">Traits::Iterations Iterations</div><div class="ttdoc">Iterations. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:137</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_aef07ba456ea016092d7d2446751b76a3"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#aef07ba456ea016092d7d2446751b76a3">cutlass::TileIteratorBase::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars accessed per load/store. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:143</div></div>
-<div class="ttc" id="structcutlass_1_1TileTraits_html_ab831be0adb255eece4f2e12fd9713831"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#ab831be0adb255eece4f2e12fd9713831">cutlass::TileTraits::Tile</a></div><div class="ttdeci">Tile_ Tile</div><div class="ttdoc">Shape of the tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:79</div></div>
-<div class="ttc" id="structcutlass_1_1TileTraits_html_af88f5cea9f452d83004ea0fa0f9d56eb"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#af88f5cea9f452d83004ea0fa0f9d56eb">cutlass::TileTraits::Delta</a></div><div class="ttdeci">Delta_ Delta</div><div class="ttdoc">Number of steps between accesses along each dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:82</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a3ba93370bd4b2ede4bd4eb97ac0881be"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a3ba93370bd4b2ede4bd4eb97ac0881be">cutlass::TileIteratorBase::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Index _stride_d, Index _stride_h, Index _stride_w)</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:203</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_ad67234ec264354a22032bb2519575dc1"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ad67234ec264354a22032bb2519575dc1">cutlass::TileIteratorBase::Params::stride_d</a></div><div class="ttdeci">Index stride_d</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:171</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a91e13a7aad4b0acac002b6dd125abc37"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a91e13a7aad4b0acac002b6dd125abc37">cutlass::TileLoadIterator::inc_advance</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_advance()</div><div class="ttdoc">Increment in the next dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:514</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:61</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ac2a7f94723259f0d3c7b8a6d5b8778bf"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ac2a7f94723259f0d3c7b8a6d5b8778bf">cutlass::TileLoadIterator::Delta</a></div><div class="ttdeci">Base::Delta Delta</div><div class="ttdoc">Delta. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:349</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a8a87c8ef986e110a01a9226012594a61"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a8a87c8ef986e110a01a9226012594a61">cutlass::TileStoreIterator::Tile</a></div><div class="ttdeci">Base::Tile Tile</div><div class="ttdoc">Tile shape. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:664</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_ae1cb260e7b05034ec9b7fa61c92bbc80"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#ae1cb260e7b05034ec9b7fa61c92bbc80">cutlass::TileStoreIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Scalar *ptr)</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:939</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aa563bb10f8e58d97e81959556923e210"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aa563bb10f8e58d97e81959556923e210">cutlass::TileStoreIterator::TileStoreIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileStoreIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Constructs a tile store iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1066</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a15227102466522445261b6ea65c89c06"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a15227102466522445261b6ea65c89c06">cutlass::TileIteratorBase::Params::inc_h</a></div><div class="ttdeci">Index inc_h</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:224</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_acc0341b88143aac4ffd9bc1dcfaafa71"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#acc0341b88143aac4ffd9bc1dcfaafa71">cutlass::TileIteratorBase::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params()</div><div class="ttdoc">Constructs params. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:235</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a24fa369165de783a72311d8ec3115c48"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a24fa369165de783a72311d8ec3115c48">cutlass::TileStoreIterator::Base</a></div><div class="ttdeci">TileIteratorBase&lt; Traits_, Scalar_, Advance_, MemorySpace, Index_, FragmentElement_, FragmentElementType_, Skew_ &gt; Base</div><div class="ttdoc">Base class. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:853</div></div>
+<div class="ttc" id="structcutlass_1_1Load_html"><div class="ttname"><a href="structcutlass_1_1Load.html">cutlass::Load</a></div><div class="ttdef"><b>Definition:</b> load_store.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a5016bd7b24938026a2879ec0054eb3b6"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a5016bd7b24938026a2879ec0054eb3b6">cutlass::TileStoreIterator::Traits</a></div><div class="ttdeci">Base::Traits Traits</div><div class="ttdoc">concept TileTraits </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:856</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a7c27a7b0d8593b002eca186c15fdc869"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a7c27a7b0d8593b002eca186c15fdc869">cutlass::TileLoadIterator::FragmentShape</a></div><div class="ttdeci">Base::FragmentShape FragmentShape</div><div class="ttdoc">Fragment type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:358</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html">cutlass::IteratorAdvance</a></div><div class="ttdoc">Specifies dimension in which post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:61</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_adaebec9eacf767f63f048033de73ea5b"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#adaebec9eacf767f63f048033de73ea5b">cutlass::TileStoreIterator::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">Source or destination memory space. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:655</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a49cf3ee608debebf451cdd8c2125d073"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a49cf3ee608debebf451cdd8c2125d073">cutlass::TileLoadIterator::inc_w</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_w()</div><div class="ttdoc">Increment in the W dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:511</div></div>
-<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord</a></div><div class="ttdoc">Statically-sized array specifying Coords within a tensor. </div><div class="ttdef"><b>Definition:</b> coord.h:48</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a561ceb1093b28b8dce67df0129b7b8b8"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a561ceb1093b28b8dce67df0129b7b8b8">cutlass::TileIteratorBase::ImmediateOffsetStrides</a></div><div class="ttdeci">Traits::ImmediateOffsetStrides ImmediateOffsetStrides</div><div class="ttdoc">The strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:134</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aaf72c4897641080b1d84c0bbd8d813cc"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aaf72c4897641080b1d84c0bbd8d813cc">cutlass::TileLoadIterator::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:364</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a552a67fb03c28e985d143f6193f88308"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a552a67fb03c28e985d143f6193f88308">cutlass::TileStoreIterator::Iterations</a></div><div class="ttdeci">Base::Iterations Iterations</div><div class="ttdoc">Iterations. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:670</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a88a90437f11d029ef109ebb4f828f282"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a88a90437f11d029ef109ebb4f828f282">cutlass::TileLoadIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Scalar const *ptr)</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:505</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a235647baff946e483dd61a2069aa01d2"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a235647baff946e483dd61a2069aa01d2">cutlass::TileIteratorBase::Params::stride_d</a></div><div class="ttdeci">long long stride_d</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:219</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_ace8a65d90db264a0ee93a810be38918f"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#ace8a65d90db264a0ee93a810be38918f">cutlass::TileStoreIterator::FragmentIterator</a></div><div class="ttdeci">Base::FragmentIterator FragmentIterator</div><div class="ttdoc">Fragment iterator definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:904</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html">cutlass::IteratorAdvance</a></div><div class="ttdoc">Specifies dimension in which post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:64</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a2de32338814d0554b05ca985dbb7e192"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a2de32338814d0554b05ca985dbb7e192">cutlass::TileLoadIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(TensorRef const &amp;ref)</div><div class="ttdoc">Constructs with a CompactTensorRef&lt;&gt; </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:509</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a78380e92553010656516400d51e14c7e"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a78380e92553010656516400d51e14c7e">cutlass::TileLoadIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Scalar const *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:515</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ab8bfa9914c4ba49a583d1cfaa8a62d56"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">cutlass::TileIteratorBase::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">Source or destination memory space. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:161</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a9f4501c6e8ba0f4511919c1b63c14e69"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a9f4501c6e8ba0f4511919c1b63c14e69">cutlass::TileStoreIterator::TileStoreIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileStoreIterator()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1062</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1FragmentElementType_html_a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b"><div class="ttname"><a href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0babb4fa5d034035e4c751287dd9e366f3b">cutlass::FragmentElementType::kScalar</a></div><div class="ttdef"><b>Definition:</b> load_store.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_ac22d9229f3f8993d52b808dced173803"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#ac22d9229f3f8993d52b808dced173803">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(TensorRef const &amp;ref)</div><div class="ttdoc">Initializes params to access a raw pointer. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:537</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_ac3273690cdd0a1c2e61d29b289daf5b5"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#ac3273690cdd0a1c2e61d29b289daf5b5">cutlass::TileStoreIterator::Scalar</a></div><div class="ttdeci">Base::Scalar Scalar</div><div class="ttdoc">Scalar element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:859</div></div>
 <div class="ttc" id="vector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div><div class="ttdoc">Defines a 1D vector of elements held in the registers of each thread. </div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a></div><div class="ttdoc">Iterator for accessing a stripmined tile in memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:102</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a38c8ec1e9d0117172981b4c7dd4bf3be"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a38c8ec1e9d0117172981b4c7dd4bf3be">cutlass::TileIteratorBase::kIteratorFragment</a></div><div class="ttdeci">static IteratorFragment::Kind const kIteratorFragment</div><div class="ttdoc">Specifies iterator storage fragment type (Scalar or WmmaMatrix) </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:116</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a1c433ba0eea5e6a46f36101d8de98ed0"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a1c433ba0eea5e6a46f36101d8de98ed0">cutlass::TileStoreIterator::Delta</a></div><div class="ttdeci">Base::Delta Delta</div><div class="ttdoc">Delta. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:667</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5">cutlass::IteratorAdvance::kD</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a5ebab59862d5f50ad980871515d999b0"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a5ebab59862d5f50ad980871515d999b0">cutlass::TileStoreIterator::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar * data() const</div><div class="ttdoc">Returns the current pointer. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:804</div></div>
-<div class="ttc" id="structcutlass_1_1TileTraits_html_af9c0fc178dac7f9dac8d254da34e04dd"><div class="ttname"><a href="structcutlass_1_1TileTraits.html#af9c0fc178dac7f9dac8d254da34e04dd">cutlass::TileTraits::ThreadOffset</a></div><div class="ttdeci">ThreadOffset_ ThreadOffset</div><div class="ttdoc">Functor that returns the logical coordinate of each entity&amp;#39;s initial offset in the tile...</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:88</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_abb3dde23971ad35a477b75ee99381b53"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#abb3dde23971ad35a477b75ee99381b53">cutlass::TileIteratorBase::AccessType</a></div><div class="ttdeci">Vectorize&lt; FragmentElement, kAccessSize &gt;::Type AccessType</div><div class="ttdoc">The elements loaded/store by one instruction. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:146</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a0a93f37fd366a48c4ed6cc39aa850eb5"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a0a93f37fd366a48c4ed6cc39aa850eb5">cutlass::TileLoadIterator::inc_d</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_d()</div><div class="ttdoc">Increment in the D dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:505</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a3793f5d5846862f22f1de736e36ae7c1"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a3793f5d5846862f22f1de736e36ae7c1">cutlass::TileStoreIterator::inc_h</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_h()</div><div class="ttdoc">Increment in the H dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:810</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a60258b7c1a1708f97e28f8f6c292bfe4"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a60258b7c1a1708f97e28f8f6c292bfe4">cutlass::TileStoreIterator::store</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store(Fragment &amp;fragment) const</div><div class="ttdoc">Stores a fragment without advancing the iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:876</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a228a95cf2c9c6089287984fcbf5cface"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a228a95cf2c9c6089287984fcbf5cface">cutlass::TileLoadIterator::inc_h</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_h()</div><div class="ttdoc">Increment in the H dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:508</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator::Params</a></div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:388</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ac21bd78b31c99c826f0eddb5aa033bf1"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ac21bd78b31c99c826f0eddb5aa033bf1">cutlass::TileLoadIterator::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">Source or destination memory space. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:337</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a6a6f51f459f98c0cddeacf476660cd27"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a6a6f51f459f98c0cddeacf476660cd27">cutlass::TileStoreIterator::ThreadOffset</a></div><div class="ttdeci">Base::ThreadOffset ThreadOffset</div><div class="ttdoc">ThreadOffset functor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:673</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a871c9b82109eab432c5a1d465643bf97"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a871c9b82109eab432c5a1d465643bf97">cutlass::TileIteratorBase::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">Source or destination memory space. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:119</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a0843b2d82422e7178f324a8d3be9d705"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a0843b2d82422e7178f324a8d3be9d705">cutlass::TileStoreIterator::FragmentIterator</a></div><div class="ttdeci">Base::FragmentIterator FragmentIterator</div><div class="ttdoc">Fragment iterator definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:685</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a9c4b332857f419e6f789a93404dc2140"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a9c4b332857f419e6f789a93404dc2140">cutlass::TileLoadIterator::load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load(Fragment &amp;fragment, PredicateIterator pred_it) const</div><div class="ttdoc">Loads a fragment without advancing the iterator.. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:568</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a4f89c5182659de94605300e15c3651b2"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a4f89c5182659de94605300e15c3651b2">cutlass::TileStoreIterator::TileStoreIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileStoreIterator(Params const &amp;, SharedStorage &amp;shared_storage, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Constructs a tile store iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:793</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a8291a51bf96f86bc77d0e3453345dbd5"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a8291a51bf96f86bc77d0e3453345dbd5">cutlass::TileLoadIterator::initialize_predicates</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Initializes a predicate vector. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:447</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a0d7b595d7959cc1680fc07c2e02e1c8e"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a0d7b595d7959cc1680fc07c2e02e1c8e">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::Fragment</a></div><div class="ttdeci">Fragment&lt; FragmentElement, ShapeCount&lt; Iterations &gt;::kCount *kAccessSize &gt; Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:154</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a1058cdec33393db9c16b28c21d8957db"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a1058cdec33393db9c16b28c21d8957db">cutlass::TileLoadIterator::load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load(Fragment &amp;fragment) const</div><div class="ttdoc">Loads a fragment without advancing the iterator.. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:575</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">cutlass::IteratorAdvance::kW</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ac1a64e974dcd69c3a86a31db6cbff421"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ac1a64e974dcd69c3a86a31db6cbff421">cutlass::TileIteratorBase::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies dimension in which post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:113</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_ac6e81450a2d78555a6c2415dcc42b178"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ac6e81450a2d78555a6c2415dcc42b178">cutlass::TileIteratorBase::Params::inc_w</a></div><div class="ttdeci">Index inc_w</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:177</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a7726cdd4fe056c59bb04adb9e5504457"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a7726cdd4fe056c59bb04adb9e5504457">cutlass::TileLoadIterator::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdoc">Offset of an individual lane from the start of the tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:436</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a9bc6c04f4a3adeb5a29743fa43425088"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a9bc6c04f4a3adeb5a29743fa43425088">cutlass::TileIteratorBase::Delta</a></div><div class="ttdeci">Traits::Delta Delta</div><div class="ttdoc">Distance along each dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:131</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aa3fd9859de68d76e07ebee06c6ccee92"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aa3fd9859de68d76e07ebee06c6ccee92">cutlass::TileLoadIterator::stage</a></div><div class="ttdeci">int stage</div><div class="ttdoc">Stage argument enables wrapping after some number of tiles have been loaded. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:439</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a48de0db7ee2ee9699b946a9d5a0364c7"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a48de0db7ee2ee9699b946a9d5a0364c7">cutlass::TileStoreIterator::FragmentConstIterator</a></div><div class="ttdeci">Base::FragmentConstIterator FragmentConstIterator</div><div class="ttdoc">Fragment const iterator definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:688</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aac4d49854d63f632627b6974f9b59dbb"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aac4d49854d63f632627b6974f9b59dbb">cutlass::TileStoreIterator::TileStoreIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileStoreIterator()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:776</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a5aa507eaeb63951f8e69fb223ec41809"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a5aa507eaeb63951f8e69fb223ec41809">cutlass::TileStoreIterator::PredicateVector</a></div><div class="ttdeci">Base::PredicateVector PredicateVector</div><div class="ttdoc">Default predicate mask type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:691</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a5a179e148ccd770e1703f288624fa9b8"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a5a179e148ccd770e1703f288624fa9b8">cutlass::TileLoadIterator::Pointer</a></div><div class="ttdeci">Scalar const  * Pointer</div><div class="ttdoc">The pointer type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:385</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a></div><div class="ttdoc">Iterator for accessing a stripmined tile in memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:144</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a8c9856709d3392d8b70dce9a13fa529a"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a8c9856709d3392d8b70dce9a13fa529a">cutlass::TileLoadIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:530</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a388d464c35cc1bcd509d22937f38dcf6"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a388d464c35cc1bcd509d22937f38dcf6">cutlass::TileLoadIterator::Params::pointer</a></div><div class="ttdeci">Scalar const  * pointer</div><div class="ttdoc">Pointer to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:493</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_adbb7fdb5710295cdfb86e090a8c40f44"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#adbb7fdb5710295cdfb86e090a8c40f44">cutlass::TileStoreIterator::store_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store_post_increment(Fragment const &amp;fragment, PredicateIterator pred_it)</div><div class="ttdoc">Stores a fragment and advances to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1141</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa56ecb02f4ed3bd7ae4a9c971805ee8c5">cutlass::IteratorAdvance::kD</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aea9fbc738003a7424cfa9b0527d4a352"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aea9fbc738003a7424cfa9b0527d4a352">cutlass::TileLoadIterator::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies in which dimension post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:428</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a7f2fe3fa2eb764bf664817097d22fe45"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">cutlass::TileIteratorBase::FragmentElement</a></div><div class="ttdeci">FragmentElement_ FragmentElement</div><div class="ttdoc">Fragment element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:152</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aa27a456bf12d0e44adc89a1c2ca7bc3b"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aa27a456bf12d0e44adc89a1c2ca7bc3b">cutlass::TileStoreIterator::store</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store(Fragment const &amp;fragment) const</div><div class="ttdoc">Stores a fragment without advancing the iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1184</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a00a33d258b9d60c8f9d4bfc48e2c6825"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a00a33d258b9d60c8f9d4bfc48e2c6825">cutlass::TileStoreIterator::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdoc">Offset of an individual lane from the start of the tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1017</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a8628ea7116f736b59c644fc0d85d395f"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a8628ea7116f736b59c644fc0d85d395f">cutlass::TileStoreIterator::Iterations</a></div><div class="ttdeci">Base::Iterations Iterations</div><div class="ttdoc">Iterations. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:889</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a39cecf8198d1286f497930cce632c671"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a39cecf8198d1286f497930cce632c671">cutlass::TileStoreIterator::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars accessed per load/store. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:874</div></div>
+<div class="ttc" id="structcutlass_1_1RegularTilePredicateFunctor_html"><div class="ttname"><a href="structcutlass_1_1RegularTilePredicateFunctor.html">cutlass::RegularTilePredicateFunctor</a></div><div class="ttdoc">Functor computing a predicate given the logical position of an access. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:112</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a7fcf13023c85cf1e1150d867bd1559d4"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a7fcf13023c85cf1e1150d867bd1559d4">cutlass::TileIteratorBase::Tile</a></div><div class="ttdeci">Traits::Tile Tile</div><div class="ttdoc">Tile shape. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:170</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aa6977ded39ead005b3435f13f0e51116"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aa6977ded39ead005b3435f13f0e51116">cutlass::TileStoreIterator::add_pointer_offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void add_pointer_offset(Index offset)</div><div class="ttdoc">Adds a raw offset to the pointer. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1124</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a8a4edd46b8cad3eeafc2a3dc3a344499"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">cutlass::TileIteratorBase::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars accessed per load/store. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:185</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html">cutlass::TileLoadIterator::Params</a></div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:491</div></div>
+<div class="ttc" id="structcutlass_1_1ComputeOffsetFromStrides_html_aa28231590bfa0ced0f317e6a4d52dc1e"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">cutlass::ComputeOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:199</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ad71f865c61f02eba981c056ef71653f5"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ad71f865c61f02eba981c056ef71653f5">cutlass::TileLoadIterator::PredicateVector</a></div><div class="ttdeci">Base::PredicateVector PredicateVector</div><div class="ttdoc">Default predicate mask type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:473</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_ad33c46a584deb1c7968e08e349382af3"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#ad33c46a584deb1c7968e08e349382af3">cutlass::TileStoreIterator::load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load(Fragment &amp;fragment, int d)</div><div class="ttdoc">Loads a fragment without advancing the iterator.. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1255</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ae8f2c93ec43646be70d4b9f32d034125"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ae8f2c93ec43646be70d4b9f32d034125">cutlass::TileLoadIterator::AccessType</a></div><div class="ttdeci">Base::AccessType AccessType</div><div class="ttdoc">Memory access type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:458</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aeb6cc0e2990c06c83b789b579a03b15f"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aeb6cc0e2990c06c83b789b579a03b15f">cutlass::TileLoadIterator::Skew</a></div><div class="ttdeci">Base::Skew Skew</div><div class="ttdoc">Skew quantity. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:440</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_afdb38f790d9c7cf1ac238643103b45ce"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#afdb38f790d9c7cf1ac238643103b45ce">cutlass::TileStoreIterator::Delta</a></div><div class="ttdeci">Base::Delta Delta</div><div class="ttdoc">Delta. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:886</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_1_1Params_html_a9a40662ff01a14e0616ce1a0fbb70662"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator_1_1Params.html#a9a40662ff01a14e0616ce1a0fbb70662">cutlass::TileLoadIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar const *ptr, long long stride_d, Index stride_h, Index stride_w)</div><div class="ttdoc">Initializes params to access a raw pointer. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:560</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aaec63ca7faf0cf4f54cac31c7d6e0d3d"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aaec63ca7faf0cf4f54cac31c7d6e0d3d">cutlass::TileStoreIterator::inc_h</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_h()</div><div class="ttdoc">Increment in the H dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1093</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a0218adf569557b17d8e36a3d97fb185e"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a0218adf569557b17d8e36a3d97fb185e">cutlass::TileStoreIterator::store</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store(Fragment const &amp;fragment, PredicateIterator pred_it) const</div><div class="ttdoc">Stores a fragment without advancing the iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1177</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_af4f964364fc54a2b9a431fa529f6c44c"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#af4f964364fc54a2b9a431fa529f6c44c">cutlass::TileLoadIterator::inc_w</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_w()</div><div class="ttdoc">Increment in the W dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:680</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a83dadcea858a5e426dcea54400138480"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a83dadcea858a5e426dcea54400138480">cutlass::TileLoadIterator::load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load(Fragment &amp;fragment) const</div><div class="ttdoc">Loads a fragment without advancing the iterator.. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:778</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a076357a165302f01f449fd91f9ed402a"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a076357a165302f01f449fd91f9ed402a">cutlass::TileStoreIterator::ThreadOffset</a></div><div class="ttdeci">Base::ThreadOffset ThreadOffset</div><div class="ttdoc">ThreadOffset functor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:892</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaa567e61af8a3401d302f3a3ab26418df0">cutlass::IteratorAdvance::kW</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a2af872794b35a631f9c1a97df0c6d177"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a2af872794b35a631f9c1a97df0c6d177">cutlass::TileLoadIterator::kFragmentElementType</a></div><div class="ttdeci">static FragmentElementType::Kind const kFragmentElementType</div><div class="ttdoc">Specifies type of iterator fragment storage (Salar or WmmaMatrix) </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:431</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a1b94be88a160b21347c0eb58ed8e1b51"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a1b94be88a160b21347c0eb58ed8e1b51">cutlass::TileLoadIterator::inc_h</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_h()</div><div class="ttdoc">Increment in the H dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:677</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_aa58daf082cf97108e2e2ad0b1fd89208"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#aa58daf082cf97108e2e2ad0b1fd89208">cutlass::TileIteratorBase::initialize_predicates</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;predicate_func, Coord&lt; 3 &gt; const &amp;offset)</div><div class="ttdoc">Initializes a predicate vector. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:342</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_affac5a91f0659bb6739db25d20822c34"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#affac5a91f0659bb6739db25d20822c34">cutlass::TileIteratorBase::Scalar</a></div><div class="ttdeci">Scalar_ Scalar</div><div class="ttdoc">Scalar element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:149</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a7808588ce0b12017379dcbe1ba9c511f"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a7808588ce0b12017379dcbe1ba9c511f">cutlass::TileLoadIterator::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdoc">Offset of an individual lane from the start of the tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:595</div></div>
+<div class="ttc" id="structcutlass_1_1RegularTilePredicateFunctor_html_ac2f49374e6f0a27ad2daffcb1f74708a"><div class="ttname"><a href="structcutlass_1_1RegularTilePredicateFunctor.html#ac2f49374e6f0a27ad2daffcb1f74708a">cutlass::RegularTilePredicateFunctor::bounds</a></div><div class="ttdeci">Coord&lt; 3 &gt; bounds</div><div class="ttdoc">Dimensions of the bounding volume. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:116</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a9aaac43bc2258e06824c354a068e7815"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a9aaac43bc2258e06824c354a068e7815">cutlass::TileIteratorBase::Delta</a></div><div class="ttdeci">Traits::Delta Delta</div><div class="ttdoc">Distance along each dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:173</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_aefe67241dde93bb032c5b4d82bc3f761"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#aefe67241dde93bb032c5b4d82bc3f761">cutlass::TileIteratorBase::kFragmentSize</a></div><div class="ttdeci">static int const kFragmentSize</div><div class="ttdoc">The size of storage needed per fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:191</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a35ab2595b09912d31a60c2a4e5847c88"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a35ab2595b09912d31a60c2a4e5847c88">cutlass::TileStoreIterator::store_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store_post_increment(Fragment const &amp;fragment)</div><div class="ttdoc">Stores a fragment and advances to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1170</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_a79304c022d2466c97cd671a98128815a"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#a79304c022d2466c97cd671a98128815a">cutlass::TileStoreIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params()</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:935</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_a0d36c05a4a757db5ebfe5f180b174b8c"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#a0d36c05a4a757db5ebfe5f180b174b8c">cutlass::TileStoreIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar *ptr)</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:975</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a96e55c1ce2475115e6e834f3996c9ee8"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a96e55c1ce2475115e6e834f3996c9ee8">cutlass::TileStoreIterator::FragmentElement</a></div><div class="ttdeci">Base::FragmentElement FragmentElement</div><div class="ttdoc">Fragment element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:862</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aa3ce9690a0e8c6457e570607474af7a6"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aa3ce9690a0e8c6457e570607474af7a6">cutlass::TileStoreIterator::load</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load(Fragment &amp;fragment, PredicateIterator pred_it) const</div><div class="ttdoc">Loads a fragment without advancing the iterator.. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1241</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_afae37ebc78884290300f38fce7c021b1"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#afae37ebc78884290300f38fce7c021b1">cutlass::TileStoreIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(TensorRef const &amp;ref)</div><div class="ttdoc">Constructs with a CompactTensorRef&lt;&gt; </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:943</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aeb92092230ae933ff6cc4a36960d0674"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aeb92092230ae933ff6cc4a36960d0674">cutlass::TileLoadIterator::inc_d</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_d()</div><div class="ttdoc">Increment in the D dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:674</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a5c8a4318ffd400363d9c7572c07ff32a"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a5c8a4318ffd400363d9c7572c07ff32a">cutlass::TileLoadIterator::load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_post_increment(Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment and advances the iterator to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:764</div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase::Params</a></div><div class="ttdoc">Parameters to the iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:170</div></div>
-<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aaa83f05e0cb3204053c3ee1da036cd36"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aaa83f05e0cb3204053c3ee1da036cd36">cutlass::TileLoadIterator::Index</a></div><div class="ttdeci">Base::Index Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:340</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a187e0852ec4862f6d3cb6249bedc3bb3"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a187e0852ec4862f6d3cb6249bedc3bb3">cutlass::TileStoreIterator::inc_stage</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_stage()</div><div class="ttdoc">Increment the stage. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:819</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a57aa2c36eb6ad9d2500c1f5396b3a526"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a57aa2c36eb6ad9d2500c1f5396b3a526">cutlass::TileStoreIterator::store_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)</div><div class="ttdoc">Stores a fragment and advances to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:835</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aa573a47a9ffc3e07239a09e2bc470cf1"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aa573a47a9ffc3e07239a09e2bc470cf1">cutlass::TileStoreIterator::inc_w</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_w()</div><div class="ttdoc">Increment in the W dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:813</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a7ab46a9210b421d32af4d1394892cfd5"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a7ab46a9210b421d32af4d1394892cfd5">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::PredicateVector</a></div><div class="ttdeci">PredicateVector&lt; ShapeCount&lt; Iterations &gt;::kCount &gt; PredicateVector</div><div class="ttdoc">Default predicate mask type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:163</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorFragment_html_ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954"><div class="ttname"><a href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80aeca44a186befa21ccae44eb4dc7b6954">cutlass::IteratorFragment::kScalar</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:67</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a17163e93d7d3616b4950925f72bb4c16"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a17163e93d7d3616b4950925f72bb4c16">cutlass::TileIteratorBase::Scalar</a></div><div class="ttdeci">Scalar_ Scalar</div><div class="ttdoc">Scalar element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:107</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorFragment_html"><div class="ttname"><a href="structcutlass_1_1IteratorFragment.html">cutlass::IteratorFragment</a></div><div class="ttdoc">Specifies whether iterator storage fragment consists of Scalar values or WMMA matrix. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:66</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_af95fa1b5102176a0fa9b17713fd48150"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#af95fa1b5102176a0fa9b17713fd48150">cutlass::TileIteratorBase::Params::inc_d</a></div><div class="ttdeci">Index inc_d</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:175</div></div>
-<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:620</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ae7add0ee02bbec2c130ebaf608ab0696"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ae7add0ee02bbec2c130ebaf608ab0696">cutlass::TileIteratorBase::Traits</a></div><div class="ttdeci">Traits_ Traits</div><div class="ttdoc">concept TileTraits </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:104</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html">cutlass::TileIteratorBase::Params</a></div><div class="ttdoc">Parameters to the iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:213</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a57b284e6cbff892d45e5cfeb0ae1e3ed"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a57b284e6cbff892d45e5cfeb0ae1e3ed">cutlass::TileStoreIterator::operator+=</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileStoreIterator &amp; operator+=(Coord&lt; 3 &gt; const &amp;offset)</div><div class="ttdoc">Adds a vector offset to the iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1116</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_ad61206a742c8c5ab5bcd64b76ece9f74"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#ad61206a742c8c5ab5bcd64b76ece9f74">cutlass::TileStoreIterator::inc_stage</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_stage()</div><div class="ttdoc">Increment the stage. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1102</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ad9c77ca0521d18a90dd3542a3941f016"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ad9c77ca0521d18a90dd3542a3941f016">cutlass::TileLoadIterator::FragmentIterator</a></div><div class="ttdeci">Base::FragmentIterator FragmentIterator</div><div class="ttdoc">Fragment iterator definition. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:467</div></div>
+<div class="ttc" id="structcutlass_1_1RegularTilePredicateFunctor_html_a084c0a2732827a74f7a30873c5883827"><div class="ttname"><a href="structcutlass_1_1RegularTilePredicateFunctor.html#a084c0a2732827a74f7a30873c5883827">cutlass::RegularTilePredicateFunctor::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator()(Coord&lt; 3 &gt; iteration, Coord&lt; 3 &gt; offset) const</div><div class="ttdoc">Computes the predicate given the logical position of an access. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:124</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_a9cf4cd4ecb0a81cf3c03a70c7bfc4e09"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#a9cf4cd4ecb0a81cf3c03a70c7bfc4e09">cutlass::TileStoreIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(Scalar *ptr, long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, Index _inc_advance)</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:955</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_aaa5d98b72576478ba04e4ad554faa827"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#aaa5d98b72576478ba04e4ad554faa827">cutlass::TileLoadIterator::Index</a></div><div class="ttdeci">Base::Index Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:437</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_aa676184bbd4c2e3f6c09dbc548e6c4e1"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#aa676184bbd4c2e3f6c09dbc548e6c4e1">cutlass::TileStoreIterator::inc_w</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void inc_w()</div><div class="ttdoc">Increment in the W dimension. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1096</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a44200854ad5b35c1863f73c435b8750b"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a44200854ad5b35c1863f73c435b8750b">cutlass::TileStoreIterator::kAdvance</a></div><div class="ttdeci">static IteratorAdvance::Kind const kAdvance</div><div class="ttdoc">Specifies in which dimension post-increment accesses advance. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:865</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_a23c9e9d1d2bed7e5d8579df9cc42dda3"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#a23c9e9d1d2bed7e5d8579df9cc42dda3">cutlass::TileStoreIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Scalar *ptr, long long stride_d, Index stride_h, Index stride_w)</div><div class="ttdoc">Initializes params to access a raw pointer. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:982</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ad8e730768c1805d98e23886a492389d3"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ad8e730768c1805d98e23886a492389d3">cutlass::TileLoadIterator::stage</a></div><div class="ttdeci">int stage</div><div class="ttdoc">Stage argument enables wrapping after some number of tiles have been loaded. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:598</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_a44870d45442ec45c8eaba46ab47a3ad9"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#a44870d45442ec45c8eaba46ab47a3ad9">cutlass::TileIteratorBase::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(long long _stride_d, Index _stride_h, Index _stride_w)</div><div class="ttdoc">Initializes the parameters object from a vector of strides. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:289</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_a1636f4e15ca7f9f56bfccb93a2826c30"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#a1636f4e15ca7f9f56bfccb93a2826c30">cutlass::TileLoadIterator::TileLoadIterator</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE TileLoadIterator(Params const &amp;, Scalar const *ptr, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0), ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Constructs a tile load iterator. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:659</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_1_1Params_html_aca14058b112b7d5105658457341726cb"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator_1_1Params.html#aca14058b112b7d5105658457341726cb">cutlass::TileStoreIterator::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(SharedStorage &amp;storage)</div><div class="ttdoc">Initialize params to access storage object. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:968</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_af0be1271cfe6d6c03a9a76ff992d8a5c"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#af0be1271cfe6d6c03a9a76ff992d8a5c">cutlass::TileIteratorBase::Params::inc_w</a></div><div class="ttdeci">Index inc_w</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:225</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a890a7239a89679662aeaea797ba32d32"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a890a7239a89679662aeaea797ba32d32">cutlass::TileStoreIterator::initialize_predicates</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)</div><div class="ttdoc">Initializes a predicate vector using an arbitrary predicate functor. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1047</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html">cutlass::TileStoreIterator</a></div><div class="ttdoc">An iterator implementing Tile Store Iterator Concept for storing a tile to memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:836</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_ab04617136a3bf909ef27eb97ea5ef81c"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#ab04617136a3bf909ef27eb97ea5ef81c">cutlass::TileIteratorBase::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(long long _stride_d, Index _stride_h, Index _stride_w, long long _inc_d, Index _inc_h, Index _inc_w, long long _inc_advance)</div><div class="ttdoc">Constructs params. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:239</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadIterator_html_ad65b7a0a5b4f42c590642ef7b269f232"><div class="ttname"><a href="structcutlass_1_1TileLoadIterator.html#ad65b7a0a5b4f42c590642ef7b269f232">cutlass::TileLoadIterator::add_pointer_offset</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void add_pointer_offset(Index offset)</div><div class="ttdoc">Adds a raw offset to the pointer. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:723</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_1_1Params_html_af7e7a71a9fa41cc3f6d0e5963963339d"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase_1_1Params.html#af7e7a71a9fa41cc3f6d0e5963963339d">cutlass::TileIteratorBase::Params::stride_w</a></div><div class="ttdeci">Index stride_w</div><div class="ttdef"><b>Definition:</b> tile_iterator.h:221</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreIterator_html_a57c56e2fe02fc5c771283e35d59b9214"><div class="ttname"><a href="structcutlass_1_1TileStoreIterator.html#a57c56e2fe02fc5c771283e35d59b9214">cutlass::TileStoreIterator::load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)</div><div class="ttdoc">Loads a fragment and advances the iterator to the next tile. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:1205</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/tile__stream_8h.html b/docs/tile__stream_8h.html
new file mode 100644
index 000000000..2c856793a
--- /dev/null
+++ b/docs/tile__stream_8h.html
@@ -0,0 +1,130 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: tile_stream.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">tile_stream.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Implements the tile stream concept, composing an iterator with a transformation. Offers split-phase semantics, separating the initiation of an asynchronous memory operation with a fence forcing it to complete.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="convert_8h_source.html">cutlass/convert.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&quot;</code><br />
+</div>
+<p><a href="tile__stream_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Generic stream for loading and transforming fragments.  <a href="structcutlass_1_1TileLoadStream.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::PredicateVector</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Empty predicate vector struct.  <a href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileLoadStream_1_1Params.html">cutlass::TileLoadStream&lt; Iterator_, Transformer_ &gt;::Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters object used to construct generic load stream.  <a href="structcutlass_1_1TileLoadStream_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Generic stream for transforming and storing fragments.  <a href="structcutlass_1_1TileStoreStream.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::PredicateVector</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Empty predicate vector struct.  <a href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1TileStoreStream_1_1Params.html">cutlass::TileStoreStream&lt; Iterator_, Transformer_ &gt;::Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Parameters used to construct the stream.  <a href="structcutlass_1_1TileStoreStream_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Generic stream for loading and transforming fragments.  <a href="structcutlass_1_1PredicatedTileLoadStream.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream&lt; Iterator_, PredicateFunctor_, Transformer_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Generic stream for transforming and storing fragments.  <a href="structcutlass_1_1PredicatedTileStoreStream.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tile__stream_8h_source.html b/docs/tile__stream_8h_source.html
new file mode 100644
index 000000000..21804ab78
--- /dev/null
+++ b/docs/tile__stream_8h_source.html
@@ -0,0 +1,162 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: tile_stream.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">tile_stream.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="tile__stream_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="comment">// clang-format off</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_, <span class="keyword">typename</span> Transformer_ = Copy&lt;<span class="keyword">typename</span> Iterator_::Fragment&gt; &gt;</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html">   45</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a> {</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">   51</a></span>&#160;  <span class="keyword">typedef</span> Iterator_ <a class="code" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a>;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">   54</a></span>&#160;  <span class="keyword">typedef</span> Transformer_ <a class="code" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a>;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">   57</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::Fragment <a class="code" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a>;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">   60</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Transformer::OutputFragment <a class="code" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a>;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">   63</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::TensorRef <a class="code" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a>;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html">   66</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html">PredicateVector</a> {};</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">   69</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::Index <a class="code" href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">Index</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream_1_1Params.html">   72</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> {</div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57">   74</a></span>&#160;    <span class="keyword">typename</span> Iterator::Params <a class="code" href="structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57">iterator</a>;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="comment">// Methods</span></div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00082"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream_1_1Params.html#a90772ac34f8c49f049eb62fada0a2165">   82</a></span>&#160;    <a class="code" href="structcutlass_1_1TileLoadStream_1_1Params.html#a90772ac34f8c49f049eb62fada0a2165">Params</a>() {}</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream_1_1Params.html#a50f136516b139f011939015c8c417ddd">   86</a></span>&#160;    <a class="code" href="structcutlass_1_1TileLoadStream_1_1Params.html#a50f136516b139f011939015c8c417ddd">Params</a>(<span class="keyword">typename</span> Iterator::Params <span class="keyword">const</span> &amp;_iterator) : <a class="code" href="structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57">iterator</a>(_iterator) {}</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  };</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">   94</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">Iterator</a> <a class="code" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a>;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">   97</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a> <a class="code" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">fetched_fragment</a>;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">  100</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">Transformer</a> <a class="code" href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">transformer</a>;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">  103</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a> <a class="code" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">transformed_fragment</a>;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3">  111</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3">TileLoadStream</a>(<a class="code" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params, <a class="code" href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">TensorRef</a> <span class="keyword">const</span> &amp;_ref)</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;      : <a class="code" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a>(_params.<a class="code" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a>, _ref) {}</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7">  116</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7">TileLoadStream</a>(<a class="code" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;threadblock_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0)</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  ): <a class="code" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a>(_params.<a class="code" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a>, threadblock_offset) { }</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23">  122</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23">copy</a>() { <a class="code" href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">iterator</a>.load_post_increment(<a class="code" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">fetched_fragment</a>); }</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">  126</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">commit</a>() { <a class="code" href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">transformer</a>.transform(<a class="code" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">fetched_fragment</a>, <a class="code" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">transformed_fragment</a>); }</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00130"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">  130</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Fragment</a> &amp;<a class="code" href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">intermediate_fragment</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">fetched_fragment</a>; }</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">  134</a></span>&#160;  <a class="code" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">TransformedFragment</a> &amp;<a class="code" href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">fragment</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">transformed_fragment</a>; }</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;};</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_, <span class="keyword">typename</span> Transformer_ = Copy&lt;<span class="keyword">typename</span> Iterator_::Fragment&gt; &gt;</div><div class="line"><a name="l00141"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html">  141</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a> {</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">  147</a></span>&#160;  <span class="keyword">typedef</span> Iterator_ <a class="code" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a>;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00150"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">  150</a></span>&#160;  <span class="keyword">typedef</span> Transformer_ <a class="code" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a>;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00153"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">  153</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Transformer::InputFragment <a class="code" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a>;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div><div class="line"><a name="l00156"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">  156</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Transformer::OutputFragment <a class="code" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a>;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">  159</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::TensorRef <a class="code" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a>;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html">  162</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html">PredicateVector</a> {};</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div><div class="line"><a name="l00165"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">  165</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Iterator::Index <a class="code" href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">Index</a>;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream_1_1Params.html">  168</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> {</div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088">  170</a></span>&#160;    <span class="keyword">typename</span> Iterator::Params <a class="code" href="structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088">iterator</a>;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;    <span class="comment">// Methods</span></div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <span class="comment">//</span></div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00178"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream_1_1Params.html#adfa2399bf13cdff16b7bfe1cb0dd2bd9">  178</a></span>&#160;    <a class="code" href="structcutlass_1_1TileStoreStream_1_1Params.html#adfa2399bf13cdff16b7bfe1cb0dd2bd9">Params</a>() {}</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00182"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream_1_1Params.html#acc400568f7694f818b5afbb109bd2e63">  182</a></span>&#160;    <a class="code" href="structcutlass_1_1TileStoreStream_1_1Params.html#acc400568f7694f818b5afbb109bd2e63">Params</a>(<span class="keyword">typename</span> Iterator::Params <span class="keyword">const</span> &amp;_iterator) : <a class="code" href="structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088">iterator</a>(_iterator) {}</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;  };</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">  190</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">Iterator</a> <a class="code" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a>;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">  193</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">Transformer</a> <a class="code" href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">transformer</a>;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">  196</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> <a class="code" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">source_fragment</a>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">  199</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a> <a class="code" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">transformed_fragment</a>;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00207"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">  207</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">TileStoreStream</a>(<a class="code" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params, <a class="code" href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">TensorRef</a> <span class="keyword">const</span> &amp;_ref)</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      : <a class="code" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a>(_params.<a class="code" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a>, _ref) {}</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084">  212</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084">TileStoreStream</a>(<a class="code" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params,</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;                  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;threadblock_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0)</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;  ): <a class="code" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a>(_params.<a class="code" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a>, threadblock_offset) { }</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009">  218</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009">copy</a>() {</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">transformer</a>.transform(<a class="code" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">source_fragment</a>, <a class="code" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">transformed_fragment</a>);</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">iterator</a>.store_post_increment(<a class="code" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">transformed_fragment</a>);</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  }</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00226"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978">  226</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978">copy</a>(<a class="code" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> <span class="keyword">const</span> &amp;frag) {</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">source_fragment</a> = frag;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;    <a class="code" href="structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009">copy</a>();</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;  }</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00233"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579">  233</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579">commit</a>() {}</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">  237</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> &amp;<a class="code" href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">fragment</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">source_fragment</a>; }</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00241"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">  241</a></span>&#160;  <a class="code" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">TransformedFragment</a> &amp;<a class="code" href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">intermediate_fragment</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">transformed_fragment</a>; }</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;};</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_,</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;          <span class="keyword">typename</span> PredicateFunctor_ =</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;              RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;,</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;          <span class="keyword">typename</span> Transformer_ = Copy&lt;typename Iterator_::Fragment&gt; &gt;</div><div class="line"><a name="l00251"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html">  251</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html">PredicatedTileLoadStream</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileLoadStream.html">TileLoadStream</a>&lt;Iterator_, Transformer_&gt; {</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;</div><div class="line"><a name="l00256"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1">  256</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileLoadStream.html">TileLoadStream&lt;Iterator_, Transformer_&gt;</a> <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1">Base</a>;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00259"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#a1f2314aa062360b249b7c57c39af5430">  259</a></span>&#160;  <span class="keyword">typedef</span> Iterator_ <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#a1f2314aa062360b249b7c57c39af5430">Iterator</a>;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;</div><div class="line"><a name="l00262"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5">  262</a></span>&#160;  <span class="keyword">typedef</span> PredicateFunctor_ <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5">PredicateFunctor</a>;</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00265"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#a9f79fd30231825b38694bf7c1d12ec2a">  265</a></span>&#160;  <span class="keyword">typedef</span> Transformer_ <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#a9f79fd30231825b38694bf7c1d12ec2a">Transformer</a>;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div><div class="line"><a name="l00268"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#a7f802c4c733375d0a63f91c58196e6a0">  268</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">Base::Fragment</a> <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#a7f802c4c733375d0a63f91c58196e6a0">Fragment</a>;</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div><div class="line"><a name="l00271"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#adeb35451885c1c4fb930ae8c914ceb20">  271</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">Base::TransformedFragment</a> <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#adeb35451885c1c4fb930ae8c914ceb20">TransformedFragment</a>;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;</div><div class="line"><a name="l00274"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">  274</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileLoadStream_1_1Params.html">Base::Params</a> <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">Params</a>;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;</div><div class="line"><a name="l00281"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f">  281</a></span>&#160;  <span class="keyword">typename</span> Iterator::PredicateVector <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f">predicates</a>;</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00289"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#a672a8883d16eff4ecc90dc79162084d3">  289</a></span>&#160;  <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#a672a8883d16eff4ecc90dc79162084d3">PredicatedTileLoadStream</a>(<a class="code" href="structcutlass_1_1TileLoadStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params,</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;                          <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;bounds,</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;                          <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;threadblock_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;      : <a class="code" href="structcutlass_1_1TileLoadStream.html">Base</a>(_params, threadblock_offset) {</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;    this-&gt;iterator.initialize_predicates(</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;        <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f">predicates</a>.begin(), <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5">PredicateFunctor</a>(bounds), threadblock_offset);</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;  }</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00299"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileLoadStream.html#a60a03c95452fe627477933d60815f7cb">  299</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#a60a03c95452fe627477933d60815f7cb">copy</a>() { this-&gt;iterator.load_post_increment(this-&gt;fetched_fragment, <a class="code" href="structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f">predicates</a>.begin()); }</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;};</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Iterator_,</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;          <span class="keyword">typename</span> PredicateFunctor_ =</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;              RegularTilePredicateFunctor&lt;typename Iterator_::Traits::Delta&gt;,</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;          <span class="keyword">typename</span> Transformer_ = Copy&lt;typename Iterator_::Fragment&gt; &gt;</div><div class="line"><a name="l00309"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html">  309</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html">PredicatedTileStoreStream</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileStoreStream.html">TileStoreStream</a>&lt;Iterator_, Transformer_&gt; {</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;  <span class="comment">// Type definitions</span></div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;</div><div class="line"><a name="l00314"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b">  314</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileStoreStream.html">TileStoreStream&lt;Iterator_, Transformer_&gt;</a> <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b">Base</a>;</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div><div class="line"><a name="l00317"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#a0ba9097d54f3ba7b7dab12012631fa76">  317</a></span>&#160;  <span class="keyword">typedef</span> Iterator_ <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#a0ba9097d54f3ba7b7dab12012631fa76">Iterator</a>;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;</div><div class="line"><a name="l00320"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f">  320</a></span>&#160;  <span class="keyword">typedef</span> PredicateFunctor_ <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f">PredicateFunctor</a>;</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;</div><div class="line"><a name="l00323"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#a0f91f328ed2b6bd65ef4eeafe18f9afd">  323</a></span>&#160;  <span class="keyword">typedef</span> Transformer_ <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#a0f91f328ed2b6bd65ef4eeafe18f9afd">Transformer</a>;</div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;</div><div class="line"><a name="l00326"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#a6c9737f5b09e7eb1aa7daabb00ae2e69">  326</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Base::Fragment</a> <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#a6c9737f5b09e7eb1aa7daabb00ae2e69">Fragment</a>;</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;</div><div class="line"><a name="l00329"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#af349831b19bb91d414a83c67d14f6927">  329</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">Base::TransformedFragment</a> <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#af349831b19bb91d414a83c67d14f6927">TransformedFragment</a>;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;</div><div class="line"><a name="l00332"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">  332</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileStoreStream_1_1Params.html">Base::Params</a> <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">Params</a>;</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;</div><div class="line"><a name="l00339"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe">  339</a></span>&#160;  <span class="keyword">typename</span> Iterator::PredicateVector <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe">predicates</a>;</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00347"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#ac4aafc6bcc6cf3bff5b31b9cd60fd667">  347</a></span>&#160;  <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#ac4aafc6bcc6cf3bff5b31b9cd60fd667">PredicatedTileStoreStream</a>(<a class="code" href="structcutlass_1_1TileStoreStream_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params,</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;                           <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;bounds,</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;                           <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;threadblock_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;      : <a class="code" href="structcutlass_1_1TileStoreStream.html">Base</a>(_params, threadblock_offset) {</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    this-&gt;iterator.initialize_predicates(</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;        <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe">predicates</a>.begin(), <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f">PredicateFunctor</a>(bounds), threadblock_offset);</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;  }</div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00357"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350">  357</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350">copy</a>() {</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    this-&gt;transformer.transform(this-&gt;source_fragment, this-&gt;transformed_fragment);</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;    this-&gt;iterator.store_post_increment(this-&gt;transformed_fragment, <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe">predicates</a>.begin());</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;  }</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00364"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#a1d33da4593ae68e6301df54b310a70a0">  364</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#a1d33da4593ae68e6301df54b310a70a0">copy</a>(<a class="code" href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">Fragment</a> <span class="keyword">const</span> &amp;frag) {</div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;    this-&gt;source_fragment = frag;</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;    <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350">copy</a>();</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;  }</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00371"></a><span class="lineno"><a class="line" href="structcutlass_1_1PredicatedTileStoreStream.html#a165a0d486f53fb2315d4e555c9f59891">  371</a></span>&#160;  <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1PredicatedTileStoreStream.html#a165a0d486f53fb2315d4e555c9f59891">commit</a>() {}</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;};</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;} <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;<span class="comment">// clang-format on</span></div><div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_af349831b19bb91d414a83c67d14f6927"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#af349831b19bb91d414a83c67d14f6927">cutlass::PredicatedTileStoreStream::TransformedFragment</a></div><div class="ttdeci">Base::TransformedFragment TransformedFragment</div><div class="ttdoc">Output fragment from transformer. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:329</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_a5b7161b2b97100c13c2c5009edd2a6be"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#a5b7161b2b97100c13c2c5009edd2a6be">cutlass::TileLoadStream::fragment</a></div><div class="ttdeci">CUTLASS_DEVICE TransformedFragment &amp; fragment()</div><div class="ttdoc">Accesses the loaded, transformed fragment. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:134</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_a1d33da4593ae68e6301df54b310a70a0"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#a1d33da4593ae68e6301df54b310a70a0">cutlass::PredicatedTileStoreStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy(Fragment const &amp;frag)</div><div class="ttdoc">Stores the fragment and increments the iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:364</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_ad6ff1786f85d64053ece0ac8ae9a92b5"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#ad6ff1786f85d64053ece0ac8ae9a92b5">cutlass::TileStoreStream::fragment</a></div><div class="ttdeci">CUTLASS_DEVICE Fragment &amp; fragment()</div><div class="ttdoc">Accesses the transformed fragment. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:237</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_aed4e6a6f1bc125ea40ae04fb120d6a23"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#aed4e6a6f1bc125ea40ae04fb120d6a23">cutlass::TileLoadStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy()</div><div class="ttdoc">Loads a tile and increments the iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:122</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_ae84437a66097189406c2090d88a79350"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#ae84437a66097189406c2090d88a79350">cutlass::PredicatedTileStoreStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy()</div><div class="ttdoc">Stores the fragment and increments the iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:357</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_aea4357a67b8abef10f91a45e64840878"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#aea4357a67b8abef10f91a45e64840878">cutlass::TileStoreStream::Fragment</a></div><div class="ttdeci">Transformer::InputFragment Fragment</div><div class="ttdoc">Source fragment. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:153</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_a8f8c7c54dba8a0c8cd0799b89130564f"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#a8f8c7c54dba8a0c8cd0799b89130564f">cutlass::PredicatedTileLoadStream::predicates</a></div><div class="ttdeci">Iterator::PredicateVector predicates</div><div class="ttdoc">Predicates. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:281</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_aa0f3c75e59054d6229de159474c9c978"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#aa0f3c75e59054d6229de159474c9c978">cutlass::TileStoreStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy(Fragment const &amp;frag)</div><div class="ttdoc">Stores a fragment and increments the iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:226</div></div>
+<div class="ttc" id="tile__iterator_8h_html"><div class="ttname"><a href="tile__iterator_8h.html">tile_iterator.h</a></div><div class="ttdoc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently. </div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_a0ba9097d54f3ba7b7dab12012631fa76"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#a0ba9097d54f3ba7b7dab12012631fa76">cutlass::PredicatedTileStoreStream::Iterator</a></div><div class="ttdeci">Iterator_ Iterator</div><div class="ttdoc">TileLoadIterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:317</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_a2255d760e812cfe8e31f114cdb5793fe"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#a2255d760e812cfe8e31f114cdb5793fe">cutlass::TileStoreStream::TensorRef</a></div><div class="ttdeci">Iterator::TensorRef TensorRef</div><div class="ttdoc">Tensor reference expected by the underlying iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_a21234ea1d4e0ff5cd599c763035b967b"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#a21234ea1d4e0ff5cd599c763035b967b">cutlass::TileLoadStream::Iterator</a></div><div class="ttdeci">Iterator_ Iterator</div><div class="ttdoc">TileLoadIterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:51</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html">cutlass::TileStoreStream</a></div><div class="ttdoc">Generic stream for transforming and storing fragments. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:141</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_aedafb6329f8c484071e04ffd8949edc5"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#aedafb6329f8c484071e04ffd8949edc5">cutlass::PredicatedTileLoadStream::PredicateFunctor</a></div><div class="ttdeci">PredicateFunctor_ PredicateFunctor</div><div class="ttdoc">Predicate functor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:262</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html">cutlass::PredicatedTileLoadStream</a></div><div class="ttdoc">Generic stream for loading and transforming fragments. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:251</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_adeb35451885c1c4fb930ae8c914ceb20"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#adeb35451885c1c4fb930ae8c914ceb20">cutlass::PredicatedTileLoadStream::TransformedFragment</a></div><div class="ttdeci">Base::TransformedFragment TransformedFragment</div><div class="ttdoc">Output fragment from transformer. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:271</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_a6c9737f5b09e7eb1aa7daabb00ae2e69"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#a6c9737f5b09e7eb1aa7daabb00ae2e69">cutlass::PredicatedTileStoreStream::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment fetched from source memory. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:326</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_1_1PredicateVector_html"><div class="ttname"><a href="structcutlass_1_1TileStoreStream_1_1PredicateVector.html">cutlass::TileStoreStream::PredicateVector</a></div><div class="ttdoc">Empty predicate vector struct. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:162</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_ad0c7a51f1b98111ce332ed906601a4ba"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#ad0c7a51f1b98111ce332ed906601a4ba">cutlass::PredicatedTileStoreStream::Params</a></div><div class="ttdeci">Base::Params Params</div><div class="ttdoc">Parameters object used to construct generic load stream. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:332</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileStoreStream_1_1Params.html">cutlass::TileStoreStream::Params</a></div><div class="ttdoc">Parameters used to construct the stream. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:168</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_a60a03c95452fe627477933d60815f7cb"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#a60a03c95452fe627477933d60815f7cb">cutlass::PredicatedTileLoadStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy()</div><div class="ttdoc">Loads a tile and increments the iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:299</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_ac61d45d91faf9d060509cf1e5c34fe01"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#ac61d45d91faf9d060509cf1e5c34fe01">cutlass::TileLoadStream::transformed_fragment</a></div><div class="ttdeci">TransformedFragment transformed_fragment</div><div class="ttdoc">Transformed fragment from transformer. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:103</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_ac004fc2e078591ced5d4e5521dfd8627"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#ac004fc2e078591ced5d4e5521dfd8627">cutlass::TileLoadStream::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit()</div><div class="ttdoc">Commits the fetched fragment and applies a transformation. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:126</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_a0f91f328ed2b6bd65ef4eeafe18f9afd"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#a0f91f328ed2b6bd65ef4eeafe18f9afd">cutlass::PredicatedTileStoreStream::Transformer</a></div><div class="ttdeci">Transformer_ Transformer</div><div class="ttdoc">Transformer. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:323</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_ab6d8716c166d071615f4e78d9ac6efb8"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#ab6d8716c166d071615f4e78d9ac6efb8">cutlass::TileLoadStream::iterator</a></div><div class="ttdeci">Iterator iterator</div><div class="ttdoc">Iterator to load tiles. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_1_1Params_html_acc400568f7694f818b5afbb109bd2e63"><div class="ttname"><a href="structcutlass_1_1TileStoreStream_1_1Params.html#acc400568f7694f818b5afbb109bd2e63">cutlass::TileStoreStream::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(typename Iterator::Params const &amp;_iterator)</div><div class="ttdoc">Constructor with iterator params. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:182</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_af2727fc0ddeffd1cdaef751140aa6093"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#af2727fc0ddeffd1cdaef751140aa6093">cutlass::TileLoadStream::intermediate_fragment</a></div><div class="ttdeci">CUTLASS_DEVICE Fragment &amp; intermediate_fragment()</div><div class="ttdoc">Accesses the loaded, transformed fragment. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:130</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_a9f79fd30231825b38694bf7c1d12ec2a"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#a9f79fd30231825b38694bf7c1d12ec2a">cutlass::PredicatedTileLoadStream::Transformer</a></div><div class="ttdeci">Transformer_ Transformer</div><div class="ttdoc">Transformer. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:265</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_a3af1a02201f53d4d09adc483fdcc23a6"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#a3af1a02201f53d4d09adc483fdcc23a6">cutlass::PredicatedTileLoadStream::Params</a></div><div class="ttdeci">Base::Params Params</div><div class="ttdoc">Parameters object used to construct generic load stream. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:274</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_aa8c192da812ec83329350e5838838f5e"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#aa8c192da812ec83329350e5838838f5e">cutlass::TileStoreStream::Transformer</a></div><div class="ttdeci">Transformer_ Transformer</div><div class="ttdoc">Transformer. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:150</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_a90ca6bbd882e39b5624ee0cd17e0d652"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#a90ca6bbd882e39b5624ee0cd17e0d652">cutlass::TileLoadStream::Index</a></div><div class="ttdeci">Iterator::Index Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_1_1Params_html_acd106661221997d7c5943daac8eb5088"><div class="ttname"><a href="structcutlass_1_1TileStoreStream_1_1Params.html#acd106661221997d7c5943daac8eb5088">cutlass::TileStoreStream::Params::iterator</a></div><div class="ttdeci">Iterator::Params iterator</div><div class="ttdoc">Parameters to the iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:170</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_a2ecdfa152dcf7b3acaf8767f3e69cfbe"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#a2ecdfa152dcf7b3acaf8767f3e69cfbe">cutlass::PredicatedTileStoreStream::predicates</a></div><div class="ttdeci">Iterator::PredicateVector predicates</div><div class="ttdoc">Predicates. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:339</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_a54399d7a42c1330ef0e756949483c552"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#a54399d7a42c1330ef0e756949483c552">cutlass::TileLoadStream::transformer</a></div><div class="ttdeci">Transformer transformer</div><div class="ttdoc">Transformation applied to fragments. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:100</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_ac4aafc6bcc6cf3bff5b31b9cd60fd667"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#ac4aafc6bcc6cf3bff5b31b9cd60fd667">cutlass::PredicatedTileStoreStream::PredicatedTileStoreStream</a></div><div class="ttdeci">CUTLASS_DEVICE PredicatedTileStoreStream(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:347</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_a89b0f92764b5492a8d1de2c1ada60869"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#a89b0f92764b5492a8d1de2c1ada60869">cutlass::TileLoadStream::fetched_fragment</a></div><div class="ttdeci">Fragment fetched_fragment</div><div class="ttdoc">Fragment loaded via iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:97</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_ad531770d336b2541c303c19148ef5cd7"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#ad531770d336b2541c303c19148ef5cd7">cutlass::TileLoadStream::Transformer</a></div><div class="ttdeci">Transformer_ Transformer</div><div class="ttdoc">Transformer. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:54</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_af85b3acfc29e41ee605df64b09698a8b"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#af85b3acfc29e41ee605df64b09698a8b">cutlass::TileStoreStream::TileStoreStream</a></div><div class="ttdeci">CUTLASS_DEVICE TileStoreStream(Params const &amp;_params, TensorRef const &amp;_ref)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:207</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_1_1Params_html_a90772ac34f8c49f049eb62fada0a2165"><div class="ttname"><a href="structcutlass_1_1TileLoadStream_1_1Params.html#a90772ac34f8c49f049eb62fada0a2165">cutlass::TileLoadStream::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:82</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_a08e7e7bf74e1e0d670dd6a4e65d14084"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#a08e7e7bf74e1e0d670dd6a4e65d14084">cutlass::TileStoreStream::TileStoreStream</a></div><div class="ttdeci">CUTLASS_DEVICE TileStoreStream(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:212</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_a40a9b1a87cda0f3eb6f4b3e73a4fade3"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#a40a9b1a87cda0f3eb6f4b3e73a4fade3">cutlass::TileLoadStream::TileLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE TileLoadStream(Params const &amp;_params, TensorRef const &amp;_ref)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:111</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_a8c9256c5cdd1fd129dbcc6536375aca7"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#a8c9256c5cdd1fd129dbcc6536375aca7">cutlass::TileLoadStream::TensorRef</a></div><div class="ttdeci">Iterator::TensorRef TensorRef</div><div class="ttdoc">Tensor reference expected by the stream. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:63</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_1_1Params_html_adfa2399bf13cdff16b7bfe1cb0dd2bd9"><div class="ttname"><a href="structcutlass_1_1TileStoreStream_1_1Params.html#adfa2399bf13cdff16b7bfe1cb0dd2bd9">cutlass::TileStoreStream::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:178</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_a61d57147150bffda0c1662d6131a3934"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#a61d57147150bffda0c1662d6131a3934">cutlass::TileStoreStream::transformer</a></div><div class="ttdeci">Transformer transformer</div><div class="ttdoc">Transformation applied to inputs. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:193</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_a94cde8bcdcedc934cc14de19e43375d1"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#a94cde8bcdcedc934cc14de19e43375d1">cutlass::TileLoadStream::TransformedFragment</a></div><div class="ttdeci">Transformer::OutputFragment TransformedFragment</div><div class="ttdoc">Output fragment from transformer. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_a672a8883d16eff4ecc90dc79162084d3"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#a672a8883d16eff4ecc90dc79162084d3">cutlass::PredicatedTileLoadStream::PredicatedTileLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE PredicatedTileLoadStream(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:289</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_aa6d4c263e057678b9f1b8ba6a9feb59f"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#aa6d4c263e057678b9f1b8ba6a9feb59f">cutlass::PredicatedTileStoreStream::PredicateFunctor</a></div><div class="ttdeci">PredicateFunctor_ PredicateFunctor</div><div class="ttdoc">Predicate functor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:320</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html">cutlass::TileLoadStream</a></div><div class="ttdoc">Generic stream for loading and transforming fragments. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:45</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_1_1PredicateVector_html"><div class="ttname"><a href="structcutlass_1_1TileLoadStream_1_1PredicateVector.html">cutlass::TileLoadStream::PredicateVector</a></div><div class="ttdoc">Empty predicate vector struct. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:66</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_ab5176fc539364fdf63647dc33020f579"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#ab5176fc539364fdf63647dc33020f579">cutlass::TileStoreStream::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit()</div><div class="ttdoc">Commits the store operation. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:233</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_aea86cbd64781caabeee293cfa2070e81"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#aea86cbd64781caabeee293cfa2070e81">cutlass::TileLoadStream::Fragment</a></div><div class="ttdeci">Iterator::Fragment Fragment</div><div class="ttdoc">Fragment fetched from source memory. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:57</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1TileLoadStream_1_1Params.html">cutlass::TileLoadStream::Params</a></div><div class="ttdoc">Parameters object used to construct generic load stream. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:72</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_aa0e894a30d3a979ac56e5134360a08f4"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#aa0e894a30d3a979ac56e5134360a08f4">cutlass::TileStoreStream::Index</a></div><div class="ttdeci">Iterator::Index Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:165</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_a7f802c4c733375d0a63f91c58196e6a0"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#a7f802c4c733375d0a63f91c58196e6a0">cutlass::PredicatedTileLoadStream::Fragment</a></div><div class="ttdeci">Base::Fragment Fragment</div><div class="ttdoc">Fragment fetched from source memory. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:268</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_1_1Params_html_a50f136516b139f011939015c8c417ddd"><div class="ttname"><a href="structcutlass_1_1TileLoadStream_1_1Params.html#a50f136516b139f011939015c8c417ddd">cutlass::TileLoadStream::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(typename Iterator::Params const &amp;_iterator)</div><div class="ttdoc">Constructor with iterator params. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:86</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_ae14c71f6bb331030429d346f0140c993"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#ae14c71f6bb331030429d346f0140c993">cutlass::TileStoreStream::TransformedFragment</a></div><div class="ttdeci">Transformer::OutputFragment TransformedFragment</div><div class="ttdoc">Transformed fragment, compatible with Iterator::Fragment. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:156</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_a0880c28b3ec82d38571ed332451c8d6a"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#a0880c28b3ec82d38571ed332451c8d6a">cutlass::TileStoreStream::source_fragment</a></div><div class="ttdeci">Fragment source_fragment</div><div class="ttdoc">Source fragment. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_aff77aed0f1b1583b01a427fc935c5d71"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#aff77aed0f1b1583b01a427fc935c5d71">cutlass::TileStoreStream::intermediate_fragment</a></div><div class="ttdeci">CUTLASS_DEVICE TransformedFragment &amp; intermediate_fragment()</div><div class="ttdoc">Accesses the fragment after trasnforming. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:241</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_afc320f4d29f05102e9de0064ca31e49b"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#afc320f4d29f05102e9de0064ca31e49b">cutlass::PredicatedTileStoreStream::Base</a></div><div class="ttdeci">TileStoreStream&lt; Iterator_, Transformer_ &gt; Base</div><div class="ttdef"><b>Definition:</b> tile_stream.h:314</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_html_a6b8b65772d95c30d29e7833348d06ba7"><div class="ttname"><a href="structcutlass_1_1TileLoadStream.html#a6b8b65772d95c30d29e7833348d06ba7">cutlass::TileLoadStream::TileLoadStream</a></div><div class="ttdeci">CUTLASS_DEVICE TileLoadStream(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:116</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_a35009c9a697f20fd5a7ee634de4d6c97"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#a35009c9a697f20fd5a7ee634de4d6c97">cutlass::TileStoreStream::Iterator</a></div><div class="ttdeci">Iterator_ Iterator</div><div class="ttdoc">TileLoadIterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:147</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html_a165a0d486f53fb2315d4e555c9f59891"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html#a165a0d486f53fb2315d4e555c9f59891">cutlass::PredicatedTileStoreStream::commit</a></div><div class="ttdeci">CUTLASS_DEVICE void commit()</div><div class="ttdoc">Commits the store operation. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:371</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileStoreStream_html"><div class="ttname"><a href="structcutlass_1_1PredicatedTileStoreStream.html">cutlass::PredicatedTileStoreStream</a></div><div class="ttdoc">Generic stream for transforming and storing fragments. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:309</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_aeb5be2edcc35c7876abe5234663f9c48"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#aeb5be2edcc35c7876abe5234663f9c48">cutlass::TileStoreStream::transformed_fragment</a></div><div class="ttdeci">TransformedFragment transformed_fragment</div><div class="ttdoc">Transformed fragment from transformer. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:199</div></div>
+<div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_a1f2314aa062360b249b7c57c39af5430"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#a1f2314aa062360b249b7c57c39af5430">cutlass::PredicatedTileLoadStream::Iterator</a></div><div class="ttdeci">Iterator_ Iterator</div><div class="ttdoc">TileLoadIterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:259</div></div>
+<div class="ttc" id="structcutlass_1_1PredicatedTileLoadStream_html_ac7f57248d3e10c9309f042e5d41440c1"><div class="ttname"><a href="structcutlass_1_1PredicatedTileLoadStream.html#ac7f57248d3e10c9309f042e5d41440c1">cutlass::PredicatedTileLoadStream::Base</a></div><div class="ttdeci">TileLoadStream&lt; Iterator_, Transformer_ &gt; Base</div><div class="ttdef"><b>Definition:</b> tile_stream.h:256</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_a50b6b5bd08fd83baa36c3dc4461ca009"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#a50b6b5bd08fd83baa36c3dc4461ca009">cutlass::TileStoreStream::copy</a></div><div class="ttdeci">CUTLASS_DEVICE void copy()</div><div class="ttdoc">Stores a fragment and increments the iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:218</div></div>
+<div class="ttc" id="structcutlass_1_1TileLoadStream_1_1Params_html_a0430f377595718291f84ef62eb6f4e57"><div class="ttname"><a href="structcutlass_1_1TileLoadStream_1_1Params.html#a0430f377595718291f84ef62eb6f4e57">cutlass::TileLoadStream::Params::iterator</a></div><div class="ttdeci">Iterator::Params iterator</div><div class="ttdoc">Parameters to the iterator. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:74</div></div>
+<div class="ttc" id="structcutlass_1_1TileStoreStream_html_a601a296ec830e9b98aca9d5cf4b4010c"><div class="ttname"><a href="structcutlass_1_1TileStoreStream.html#a601a296ec830e9b98aca9d5cf4b4010c">cutlass::TileStoreStream::iterator</a></div><div class="ttdeci">Iterator iterator</div><div class="ttdoc">Iterator to store tiles. </div><div class="ttdef"><b>Definition:</b> tile_stream.h:190</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/tile__traits__standard_8h.html b/docs/tile__traits__standard_8h.html
index d45ace8ca..504747e11 100644
--- a/docs/tile__traits__standard_8h.html
+++ b/docs/tile__traits__standard_8h.html
@@ -82,7 +82,7 @@ $(function() {
 
 <p>Defines tile traits for several tile partitioning arrangements of threads expected to achieve efficient streaming performance.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="tile__iterator_8h_source.html">cutlass/tile_iterator.h</a>&quot;</code><br />
 </div>
 <p><a href="tile__traits__standard_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -113,7 +113,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/tile__traits__standard_8h_source.html b/docs/tile__traits__standard_8h_source.html
index ed4a1efa9..533df7f3c 100644
--- a/docs/tile__traits__standard_8h_source.html
+++ b/docs/tile__traits__standard_8h_source.html
@@ -76,7 +76,7 @@ $(function() {
 <div class="title">tile_traits_standard.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="tile__traits__standard_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ThreadShape&gt;</div><div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="structcutlass_1_1TiledThreadOffset.html">   39</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TiledThreadOffset.html">TiledThreadOffset</a> {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2">   42</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> thread_offset;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keywordtype">int</span> index = threadIdx.x;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    thread_offset[3] = (index % ThreadShape::kC);</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;    index = (index / ThreadShape::kC);</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;    thread_offset[2] = (index % ThreadShape::kW);</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    index = (index / ThreadShape::kW);</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    thread_offset[1] = (index % ThreadShape::kH);</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    index = (index / ThreadShape::kH);</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    thread_offset[0] = index;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    <span class="keywordflow">return</span> thread_offset;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  }</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;};</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> Threads&gt;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html">   67</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html">TileTraitsStrideMajor</a> {</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac">   69</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac">Tile</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">   72</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">kThreads</a> = Threads;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="comment">// Static assertions</span></div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kDhw</a> % <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">kThreads</a>),</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#a03567f41ce616ebb4cdb309c85820599">   76</a></span>&#160;                <span class="stringliteral">&quot;Tiling undefined if elements not divisible by threads.&quot;</span>);</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Tile::kW &lt;= <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">kThreads</a>,</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;                <span class="stringliteral">&quot;This specialization assumes there are more threads than the contiguous dimension &quot;</span></div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                <span class="stringliteral">&quot;of the tile.&quot;</span>);</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">kThreads</a> / Tile::kW, Tile::kW, 1&gt; <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a03567f41ce616ebb4cdb309c85820599">ThreadShape</a>;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5">   86</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ThreadShape::kH, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5">Delta</a>;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2">   89</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, Tile::kH / <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">ThreadShape::kH</a>, 1, 1&gt; <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2">Iterations</a>;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c">   92</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TiledThreadOffset.html">TiledThreadOffset&lt;ThreadShape&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c">ThreadOffset</a>;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;};</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> Threads&gt;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html">  100</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html">TileTraitsContiguousMajor</a> {</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763">  102</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763">Tile</a>;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">  105</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a> = Threads;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <span class="comment">// Static assertions</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Tile::kW &gt;= <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a>,</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;                <span class="stringliteral">&quot;This specialization assumes there are more threads than the contiguous dimension &quot;</span></div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a33116b67e580292d4e354ca17ecd4167">  110</a></span>&#160;                <span class="stringliteral">&quot;of the tile.&quot;</span>);</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kDhw</a> % <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a>),</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                <span class="stringliteral">&quot;Tiling undefined if elements not divisible by threads.&quot;</span>);</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(Tile::kW % <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a>),</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;                <span class="stringliteral">&quot;The contiguous size of the tile must be divisible by the number of threads.&quot;</span>);</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, kThreads&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a33116b67e580292d4e354ca17ecd4167">ThreadShape</a>;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896">  122</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, kThreads&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896">Delta</a>;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82">  125</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, Tile::kH, Tile::kW / <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a>&gt; <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82">Iterations</a>;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351">  128</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TiledThreadOffset.html">TiledThreadOffset&lt;ThreadShape&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351">ThreadOffset</a>;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;};</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> Threads&gt;</div><div class="line"><a name="l00135"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html">  135</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsWarpRake.html">TileTraitsWarpRake</a> {</div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#adcd658d9daf286368a9d51c8c1647f89">  137</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#adcd658d9daf286368a9d51c8c1647f89">Tile</a>;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">  140</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">kThreads</a> = Threads;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">  143</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a> = 32;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">  146</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">kWarpCount</a> = <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">kThreads</a> / <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  <span class="comment">// Static assertions</span></div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kDhw</a> % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">kThreads</a>),</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;                <span class="stringliteral">&quot;Tiling undefined if elements not divisible by threads.&quot;</span>);</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">kThreads</a> % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>), <span class="stringliteral">&quot;Number of threads must be divisible by the warp size.&quot;</span>);</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(Tile::kW % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>), <span class="stringliteral">&quot;Contiguous dimension must be divisible by the warp size&quot;</span>);</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a8b1d3fe590f426ce11d597bb98c51bd4">  157</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a8b1d3fe590f426ce11d597bb98c51bd4">kWarpsStrided</a> = <a class="code" href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">__NV_STD_MIN</a>(<a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">kWarpCount</a>, Tile::kH);</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">  160</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">kWarpsContiguous</a> = <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">kWarpCount</a> / <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a8b1d3fe590f426ce11d597bb98c51bd4">kWarpsStrided</a>;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#ad6619e0b5d876fafd51c78e39f2c029e">  163</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, kWarpsStrided, kWarpsContiguous * kWarpSize&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad6619e0b5d876fafd51c78e39f2c029e">ThreadShape</a>;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe">  166</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, kWarpsStrided, kWarpSize&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe">Delta</a>;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323">  169</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, Tile::kH / <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Delta::kH</a>, Tile::kW / <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadShape::kW</a>&gt; <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323">Iterations</a>;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html">  172</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00175"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000">  175</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;      <span class="keywordtype">int</span> tid = threadIdx.x;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      <span class="keywordtype">int</span> warp = (tid / <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>);</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      <span class="keywordtype">int</span> lane = (tid % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>);</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kWarpSpanContiguous = <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a> * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Iterations::kW</a>;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      <span class="keywordtype">int</span> warp_w = (warp % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">kWarpsContiguous</a>);</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="keywordtype">int</span> warp_h = (warp / <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">kWarpsContiguous</a>);</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, warp_h, lane + kWarpSpanContiguous * warp_w, 0);</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    }</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  };</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;};</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> Threads&gt;</div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html">  194</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsStandard.html">TileTraitsStandard</a> {</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b">  196</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b">Tile</a>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">  199</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">kThreads</a> = Threads;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">  202</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a> = 32;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">  205</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">kWarpCount</a> = <a class="code" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">kThreads</a> / <a class="code" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a>;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;  <span class="comment">// Static assertions</span></div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kDhw</a> % <a class="code" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">kThreads</a>),</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;                <span class="stringliteral">&quot;Tiling undefined if elements not divisible by threads.&quot;</span>);</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1conditional.html">platform::conditional</a> &lt;</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      Tile::kW&lt;<a class="code" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a>,</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;               <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html">TileTraitsStrideMajor&lt;Tile, Threads&gt;</a>,</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1conditional.html">platform::conditional</a>&lt;!(Tile::kW % <a class="code" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a>),</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;                                              <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html">TileTraitsWarpRake&lt;Tile, Threads&gt;</a>,</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;                                              <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html">TileTraitsContiguousMajor&lt;Tile, Threads&gt;</a> &gt;::type&gt;::</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;          type Traits;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Delta Delta;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;  <span class="keyword">typedef</span> Delta ImmediateOffsetStrides;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Iterations Iterations;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ThreadOffset ThreadOffset;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;};</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1TileTraitsWarpRake_html_a410e44aa83f2179152a48f7aceb05323"><div class="ttname"><a href="structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323">cutlass::TileTraitsWarpRake::Iterations</a></div><div class="ttdeci">Shape&lt; 1, Tile::kH/Delta::kH, Tile::kW/ThreadShape::kW &gt; Iterations</div><div class="ttdoc">Number of iterations. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:169</div></div>
+<a href="tile__traits__standard_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ThreadShape&gt;</div><div class="line"><a name="l00039"></a><span class="lineno"><a class="line" href="structcutlass_1_1TiledThreadOffset.html">   39</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TiledThreadOffset.html">TiledThreadOffset</a> {</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2">   42</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1TiledThreadOffset.html#a7290b6ca9ef0bede634f69bd05450fa2">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> thread_offset;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;    <span class="keywordtype">int</span> index = threadIdx.x;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;    thread_offset[3] = (index % ThreadShape::kC);</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;    index = (index / ThreadShape::kC);</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;    thread_offset[2] = (index % ThreadShape::kW);</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    index = (index / ThreadShape::kW);</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    thread_offset[1] = (index % ThreadShape::kH);</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;    index = (index / ThreadShape::kH);</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;    thread_offset[0] = index;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    <span class="keywordflow">return</span> thread_offset;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  }</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;};</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> Threads&gt;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html">   67</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html">TileTraitsStrideMajor</a> {</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac">   69</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac">Tile</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">   72</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">kThreads</a> = Threads;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="comment">// Static assertions</span></div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kDhw</a> % <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">kThreads</a>),</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#a03567f41ce616ebb4cdb309c85820599">   76</a></span>&#160;                <span class="stringliteral">&quot;Tiling undefined if elements not divisible by threads.&quot;</span>);</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Tile::kW &lt;= <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">kThreads</a>,</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;                <span class="stringliteral">&quot;This specialization assumes there are more threads than the contiguous dimension &quot;</span></div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                <span class="stringliteral">&quot;of the tile.&quot;</span>);</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">kThreads</a> / Tile::kW, Tile::kW, 1&gt; <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a03567f41ce616ebb4cdb309c85820599">ThreadShape</a>;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5">   86</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, ThreadShape::kH, 1, 1&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5">Delta</a>;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2">   89</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, Tile::kH / <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">ThreadShape::kH</a>, 1, 1&gt; <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2">Iterations</a>;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c">   92</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TiledThreadOffset.html">TiledThreadOffset&lt;ThreadShape&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c">ThreadOffset</a>;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;};</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> Threads&gt;</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html">  100</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html">TileTraitsContiguousMajor</a> {</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763">  102</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a1607d53544302c12278793bc9b283763">Tile</a>;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">  105</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a> = Threads;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <span class="comment">// Static assertions</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(Tile::kW &gt;= <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a>,</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;                <span class="stringliteral">&quot;This specialization assumes there are more threads than the contiguous dimension &quot;</span></div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a33116b67e580292d4e354ca17ecd4167">  110</a></span>&#160;                <span class="stringliteral">&quot;of the tile.&quot;</span>);</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kDhw</a> % <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a>),</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                <span class="stringliteral">&quot;Tiling undefined if elements not divisible by threads.&quot;</span>);</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(Tile::kW % <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a>),</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;                <span class="stringliteral">&quot;The contiguous size of the tile must be divisible by the number of threads.&quot;</span>);</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, kThreads&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a33116b67e580292d4e354ca17ecd4167">ThreadShape</a>;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896">  122</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, 1, kThreads&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#ab1a4945bf562debeee1af813288e5896">Delta</a>;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82">  125</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, Tile::kH, Tile::kW / <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">kThreads</a>&gt; <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a425a20b642ae8736c12626b2de9b8b82">Iterations</a>;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351">  128</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TiledThreadOffset.html">TiledThreadOffset&lt;ThreadShape&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html#a823ba83e9ca680da0af7d63be772a351">ThreadOffset</a>;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;};</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> Threads&gt;</div><div class="line"><a name="l00135"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html">  135</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsWarpRake.html">TileTraitsWarpRake</a> {</div><div class="line"><a name="l00137"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#adcd658d9daf286368a9d51c8c1647f89">  137</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#adcd658d9daf286368a9d51c8c1647f89">Tile</a>;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">  140</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">kThreads</a> = Threads;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">  143</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a> = 32;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">  146</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">kWarpCount</a> = <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">kThreads</a> / <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  <span class="comment">// Static assertions</span></div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kDhw</a> % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">kThreads</a>),</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;                <span class="stringliteral">&quot;Tiling undefined if elements not divisible by threads.&quot;</span>);</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a11d943e15e397cbc5233b09071dff642">kThreads</a> % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>), <span class="stringliteral">&quot;Number of threads must be divisible by the warp size.&quot;</span>);</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(Tile::kW % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>), <span class="stringliteral">&quot;Contiguous dimension must be divisible by the warp size&quot;</span>);</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a8b1d3fe590f426ce11d597bb98c51bd4">  157</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a8b1d3fe590f426ce11d597bb98c51bd4">kWarpsStrided</a> = <a class="code" href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">__NV_STD_MIN</a>(<a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">kWarpCount</a>, Tile::kH);</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">  160</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">kWarpsContiguous</a> = <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">kWarpCount</a> / <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a8b1d3fe590f426ce11d597bb98c51bd4">kWarpsStrided</a>;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#ad6619e0b5d876fafd51c78e39f2c029e">  163</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, kWarpsStrided, kWarpsContiguous * kWarpSize&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad6619e0b5d876fafd51c78e39f2c029e">ThreadShape</a>;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe">  166</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;1, kWarpsStrided, kWarpSize&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a3ce218b223c5716af40c316899324bbe">Delta</a>;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323">  169</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape</a>&lt;1, Tile::kH / <a class="code" href="structcutlass_1_1Shape.html#a3a20d9062bba613c160bb2cd14f80a5e">Delta::kH</a>, Tile::kW / <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">ThreadShape::kW</a>&gt; <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323">Iterations</a>;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html">  172</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00175"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000">  175</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html#a0e4edffb19218ccbf77995f6d20df000">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;      <span class="keywordtype">int</span> tid = threadIdx.x;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      <span class="keywordtype">int</span> warp = (tid / <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>);</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      <span class="keywordtype">int</span> lane = (tid % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a>);</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kWarpSpanContiguous = <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">kWarpSize</a> * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Iterations::kW</a>;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      <span class="keywordtype">int</span> warp_w = (warp % <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">kWarpsContiguous</a>);</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="keywordtype">int</span> warp_h = (warp / <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html#aede0832e95df911b1e6e3f1cc9e593ce">kWarpsContiguous</a>);</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, warp_h, lane + kWarpSpanContiguous * warp_w, 0);</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    }</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  };</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;};</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tile_, <span class="keywordtype">int</span> Threads&gt;</div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html">  194</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1TileTraitsStandard.html">TileTraitsStandard</a> {</div><div class="line"><a name="l00196"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b">  196</a></span>&#160;  <span class="keyword">typedef</span> Tile_ <a class="code" href="structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b">Tile</a>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">  199</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">kThreads</a> = Threads;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">  202</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a> = 32;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">  205</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">kWarpCount</a> = <a class="code" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">kThreads</a> / <a class="code" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a>;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;</div><div class="line"><a name="l00208"></a><span class="lineno"><a class="line" href="structcutlass_1_1TileTraitsStandard.html#a5e04777205c7a292602880c59d6b43c8">  208</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1TileTraitsStandard.html#a5e04777205c7a292602880c59d6b43c8">kAccessSize</a> = 1;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <span class="comment">// Static assertions</span></div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(!(<a class="code" href="structcutlass_1_1ShapeCount.html">ShapeCount&lt;Tile&gt;::kDhw</a> % <a class="code" href="structcutlass_1_1TileTraitsStandard.html#a9cbcbe09aa6e9465b63dd22d59435af1">kThreads</a>),</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;                <span class="stringliteral">&quot;Tiling undefined if elements not divisible by threads.&quot;</span>);</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1conditional.html">platform::conditional</a> &lt;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      Tile::kW&lt;<a class="code" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a>,</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;               <a class="code" href="structcutlass_1_1TileTraitsStrideMajor.html">TileTraitsStrideMajor&lt;Tile, Threads&gt;</a>,</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;               <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1platform_1_1conditional.html">platform::conditional</a>&lt;!(Tile::kW % <a class="code" href="structcutlass_1_1TileTraitsStandard.html#ae9f40eb177c440f01adcc2fe9ca7ec10">kWarpSize</a>),</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;                                              <a class="code" href="structcutlass_1_1TileTraitsWarpRake.html">TileTraitsWarpRake&lt;Tile, Threads&gt;</a>,</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;                                              <a class="code" href="structcutlass_1_1TileTraitsContiguousMajor.html">TileTraitsContiguousMajor&lt;Tile, Threads&gt;</a> &gt;::type&gt;::</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;          type Traits;</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Delta Delta;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, 0, 0&gt;</a> ImmediateOffsetStrides;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::Iterations Iterations;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> Traits::ThreadOffset ThreadOffset;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;};</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1TileTraitsWarpRake_html_a410e44aa83f2179152a48f7aceb05323"><div class="ttname"><a href="structcutlass_1_1TileTraitsWarpRake.html#a410e44aa83f2179152a48f7aceb05323">cutlass::TileTraitsWarpRake::Iterations</a></div><div class="ttdeci">Shape&lt; 1, Tile::kH/Delta::kH, Tile::kW/ThreadShape::kW &gt; Iterations</div><div class="ttdoc">Number of iterations. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:169</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsStrideMajor_html_a03a32694da75bb95422c6b550e3324e2"><div class="ttname"><a href="structcutlass_1_1TileTraitsStrideMajor.html#a03a32694da75bb95422c6b550e3324e2">cutlass::TileTraitsStrideMajor::Iterations</a></div><div class="ttdeci">Shape&lt; 1, Tile::kH/ThreadShape::kH, 1, 1 &gt; Iterations</div><div class="ttdoc">Number of iterations. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:89</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsStandard_html_a1e8f90991e179d13971b84494c989d25"><div class="ttname"><a href="structcutlass_1_1TileTraitsStandard.html#a1e8f90991e179d13971b84494c989d25">cutlass::TileTraitsStandard::kWarpCount</a></div><div class="ttdeci">static int const kWarpCount</div><div class="ttdoc">Number of participating warps. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:205</div></div>
@@ -84,7 +84,7 @@ $(function() {
 <div class="ttc" id="tile__iterator_8h_html"><div class="ttname"><a href="tile__iterator_8h.html">tile_iterator.h</a></div><div class="ttdoc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently. </div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsWarpRake_html_a8b1d3fe590f426ce11d597bb98c51bd4"><div class="ttname"><a href="structcutlass_1_1TileTraitsWarpRake.html#a8b1d3fe590f426ce11d597bb98c51bd4">cutlass::TileTraitsWarpRake::kWarpsStrided</a></div><div class="ttdeci">static int const kWarpsStrided</div><div class="ttdoc">Warps strip-mined across strided dimension. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:157</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsContiguousMajor_html_a53d10552356855bf7379632e72bbe0c9"><div class="ttname"><a href="structcutlass_1_1TileTraitsContiguousMajor.html#a53d10552356855bf7379632e72bbe0c9">cutlass::TileTraitsContiguousMajor::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">Number of participating threads. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:105</div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1TileTraitsWarpRake_1_1ThreadOffset.html">cutlass::TileTraitsWarpRake::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:172</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsStrideMajor_html_a2b6ad449269a178018f02b8cc64ddb85"><div class="ttname"><a href="structcutlass_1_1TileTraitsStrideMajor.html#a2b6ad449269a178018f02b8cc64ddb85">cutlass::TileTraitsStrideMajor::kThreads</a></div><div class="ttdeci">static int const kThreads</div><div class="ttdoc">Number of participating threads. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:72</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsStandard_html"><div class="ttname"><a href="structcutlass_1_1TileTraitsStandard.html">cutlass::TileTraitsStandard</a></div><div class="ttdoc">Chooses &amp;#39;best&amp;#39; shape to enable warp raking along contiguous dimension if possible. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:194</div></div>
@@ -99,15 +99,16 @@ $(function() {
 <div class="ttc" id="structcutlass_1_1TileTraitsStrideMajor_html_a47404b4527b101e286347714aea687d5"><div class="ttname"><a href="structcutlass_1_1TileTraitsStrideMajor.html#a47404b4527b101e286347714aea687d5">cutlass::TileTraitsStrideMajor::Delta</a></div><div class="ttdeci">Shape&lt; 1, ThreadShape::kH, 1, 1 &gt; Delta</div><div class="ttdoc">Delta along each dimension. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:86</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsStrideMajor_html_a03567f41ce616ebb4cdb309c85820599"><div class="ttname"><a href="structcutlass_1_1TileTraitsStrideMajor.html#a03567f41ce616ebb4cdb309c85820599">cutlass::TileTraitsStrideMajor::ThreadShape</a></div><div class="ttdeci">Shape&lt; 1, kThreads/Tile::kW, Tile::kW, 1 &gt; ThreadShape</div><div class="ttdoc">Shape of threads. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:76</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsWarpRake_html_ad25fb7c1b5dc8c5828a69e5a468f490b"><div class="ttname"><a href="structcutlass_1_1TileTraitsWarpRake.html#ad25fb7c1b5dc8c5828a69e5a468f490b">cutlass::TileTraitsWarpRake::kWarpSize</a></div><div class="ttdeci">static int const kWarpSize</div><div class="ttdoc">Hard-coded warp size. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:143</div></div>
-<div class="ttc" id="platform_8h_html_a39e234a3e3b0018b58df720bcb143420"><div class="ttname"><a href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">__NV_STD_MIN</a></div><div class="ttdeci">#define __NV_STD_MIN(a, b)</div><div class="ttdoc">Select minimum(a, b) </div><div class="ttdef"><b>Definition:</b> platform.h:160</div></div>
+<div class="ttc" id="platform_8h_html_a39e234a3e3b0018b58df720bcb143420"><div class="ttname"><a href="platform_8h.html#a39e234a3e3b0018b58df720bcb143420">__NV_STD_MIN</a></div><div class="ttdeci">#define __NV_STD_MIN(a, b)</div><div class="ttdoc">Select minimum(a, b) </div><div class="ttdef"><b>Definition:</b> platform.h:168</div></div>
+<div class="ttc" id="structcutlass_1_1TileTraitsStandard_html_a5e04777205c7a292602880c59d6b43c8"><div class="ttname"><a href="structcutlass_1_1TileTraitsStandard.html#a5e04777205c7a292602880c59d6b43c8">cutlass::TileTraitsStandard::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">By default, do not do scalar loads. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:208</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsStandard_html_aee3fee526bc4d4820c03665a2f5f166b"><div class="ttname"><a href="structcutlass_1_1TileTraitsStandard.html#aee3fee526bc4d4820c03665a2f5f166b">cutlass::TileTraitsStandard::Tile</a></div><div class="ttdeci">Tile_ Tile</div><div class="ttdoc">Shape of tile. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:196</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsStrideMajor_html_afbb78ece048b868475d4a6802e6894ac"><div class="ttname"><a href="structcutlass_1_1TileTraitsStrideMajor.html#afbb78ece048b868475d4a6802e6894ac">cutlass::TileTraitsStrideMajor::Tile</a></div><div class="ttdeci">Tile_ Tile</div><div class="ttdoc">Shape of tile. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:69</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsWarpRake_html_a7a03abe44862077351b0a0a2818d214d"><div class="ttname"><a href="structcutlass_1_1TileTraitsWarpRake.html#a7a03abe44862077351b0a0a2818d214d">cutlass::TileTraitsWarpRake::kWarpCount</a></div><div class="ttdeci">static int const kWarpCount</div><div class="ttdoc">Number of participating warps. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:146</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsWarpRake_html_ad6619e0b5d876fafd51c78e39f2c029e"><div class="ttname"><a href="structcutlass_1_1TileTraitsWarpRake.html#ad6619e0b5d876fafd51c78e39f2c029e">cutlass::TileTraitsWarpRake::ThreadShape</a></div><div class="ttdeci">Shape&lt; 1, kWarpsStrided, kWarpsContiguous *kWarpSize &gt; ThreadShape</div><div class="ttdoc">Arrangement of threads. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:163</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsStrideMajor_html"><div class="ttname"><a href="structcutlass_1_1TileTraitsStrideMajor.html">cutlass::TileTraitsStrideMajor</a></div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:67</div></div>
-<div class="ttc" id="structcutlass_1_1platform_1_1conditional_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional.html">cutlass::platform::conditional</a></div><div class="ttdoc">std::conditional (true specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:343</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
+<div class="ttc" id="structcutlass_1_1platform_1_1conditional_html"><div class="ttname"><a href="structcutlass_1_1platform_1_1conditional.html">cutlass::platform::conditional</a></div><div class="ttdoc">std::conditional (true specialization) </div><div class="ttdef"><b>Definition:</b> platform.h:351</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
 <div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4 &gt;</a></div></div>
 <div class="ttc" id="structcutlass_1_1TileTraitsStrideMajor_html_ae8d14a3c6871072febfd75ed08aba32c"><div class="ttname"><a href="structcutlass_1_1TileTraitsStrideMajor.html#ae8d14a3c6871072febfd75ed08aba32c">cutlass::TileTraitsStrideMajor::ThreadOffset</a></div><div class="ttdeci">TiledThreadOffset&lt; ThreadShape &gt; ThreadOffset</div><div class="ttdoc">Computes the initial offset. </div><div class="ttdef"><b>Definition:</b> tile_traits_standard.h:92</div></div>
@@ -124,7 +125,7 @@ $(function() {
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/unioncutlass_1_1Vector-members.html b/docs/unioncutlass_1_1Vector-members.html
index f581f8db5..90db4f378 100644
--- a/docs/unioncutlass_1_1Vector-members.html
+++ b/docs/unioncutlass_1_1Vector-members.html
@@ -82,15 +82,15 @@ $(function() {
   <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c">aligned_</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#a250860c921c94a6077344f9e11bf5b02">operator[]</a>(uint32_t i) const</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#a44cc27bf8a7b789b4ae8538155a50156">operator[]</a>(uint32_t i)</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#a69be4f85c1dac371fa6f1c6747724adc">operator[]</a>(uint32_t i) const</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#abf531676caf85cde1c8df435c1ebe8bb">operator[]</a>(uint32_t i)</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> typedef</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/unioncutlass_1_1Vector.html b/docs/unioncutlass_1_1Vector.html
index f8e027716..a2c01e63e 100644
--- a/docs/unioncutlass_1_1Vector.html
+++ b/docs/unioncutlass_1_1Vector.html
@@ -103,12 +103,12 @@ Public Types</h2></td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:a250860c921c94a6077344f9e11bf5b02"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector.html#a250860c921c94a6077344f9e11bf5b02">operator[]</a> (uint32_t i) const</td></tr>
-<tr class="memdesc:a250860c921c94a6077344f9e11bf5b02"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#a250860c921c94a6077344f9e11bf5b02">More...</a><br /></td></tr>
-<tr class="separator:a250860c921c94a6077344f9e11bf5b02"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a44cc27bf8a7b789b4ae8538155a50156"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector.html#a44cc27bf8a7b789b4ae8538155a50156">operator[]</a> (uint32_t i)</td></tr>
-<tr class="memdesc:a44cc27bf8a7b789b4ae8538155a50156"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#a44cc27bf8a7b789b4ae8538155a50156">More...</a><br /></td></tr>
-<tr class="separator:a44cc27bf8a7b789b4ae8538155a50156"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a69be4f85c1dac371fa6f1c6747724adc"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector.html#a69be4f85c1dac371fa6f1c6747724adc">operator[]</a> (uint32_t i) const</td></tr>
+<tr class="memdesc:a69be4f85c1dac371fa6f1c6747724adc"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#a69be4f85c1dac371fa6f1c6747724adc">More...</a><br /></td></tr>
+<tr class="separator:a69be4f85c1dac371fa6f1c6747724adc"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:abf531676caf85cde1c8df435c1ebe8bb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector.html#abf531676caf85cde1c8df435c1ebe8bb">operator[]</a> (uint32_t i)</td></tr>
+<tr class="memdesc:abf531676caf85cde1c8df435c1ebe8bb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#abf531676caf85cde1c8df435c1ebe8bb">More...</a><br /></td></tr>
+<tr class="separator:abf531676caf85cde1c8df435c1ebe8bb"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
@@ -195,8 +195,8 @@ template&lt;typename Scalar_, int kLanes_&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="a250860c921c94a6077344f9e11bf5b02"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a250860c921c94a6077344f9e11bf5b02">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
+<a id="a69be4f85c1dac371fa6f1c6747724adc"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a69be4f85c1dac371fa6f1c6747724adc">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -207,7 +207,7 @@ template&lt;typename Scalar_, int kLanes_&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> const&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; Scalar_, kLanes_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> const&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; Scalar_, kLanes_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">uint32_t&#160;</td>
           <td class="paramname"><em>i</em></td><td>)</td>
@@ -223,8 +223,8 @@ template&lt;typename Scalar_, int kLanes_&gt; </div>
 
 </div>
 </div>
-<a id="a44cc27bf8a7b789b4ae8538155a50156"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a44cc27bf8a7b789b4ae8538155a50156">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
+<a id="abf531676caf85cde1c8df435c1ebe8bb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#abf531676caf85cde1c8df435c1ebe8bb">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -235,7 +235,7 @@ template&lt;typename Scalar_, int kLanes_&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a>&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; Scalar_, kLanes_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a>&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; Scalar_, kLanes_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">uint32_t&#160;</td>
           <td class="paramname"><em>i</em></td><td>)</td>
@@ -306,7 +306,7 @@ template&lt;typename Scalar_, int kLanes_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4-members.html b/docs/unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4-members.html
new file mode 100644
index 000000000..1202a8752
--- /dev/null
+++ b/docs/unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4-members.html
@@ -0,0 +1,98 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">Vector&lt; bin1_t, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Vector&lt; bin1_t, kLanes_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1df3324868465331db13bd7775b55e87">aligned_</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a4020f25408022dbf20c26ed4fa8c7dffa14befaa9d739f1b754bc372f717b105b">kLanes</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff">kVectorSize</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a8eda6e6181a5333ca8350977374708cb">operator[]</a>(uint32_t i) const</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#af27a36f604513f05aebe0624a9c539ab">registers</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31">Scalar</a> typedef</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1310cf2e92e260cf55cfda1cb2cb7280">Vector</a>()</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a50ae62579267952a648d4b6a6be3c663">Vector</a>(uint32_t value)</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html b/docs/unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html
new file mode 100644
index 000000000..cc50ffcaf
--- /dev/null
+++ b/docs/unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html
@@ -0,0 +1,329 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Vector&lt; bin1_t, kLanes_ &gt; Union Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">Vector&lt; bin1_t, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Vector&lt; bin1_t, kLanes_ &gt; Union Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 1-bit binary datatype.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="vector_8h_source.html">vector.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a4020f25408022dbf20c26ed4fa8c7dff"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a4020f25408022dbf20c26ed4fa8c7dffa14befaa9d739f1b754bc372f717b105b">kLanes</a> = kLanes_
+ }</td></tr>
+<tr class="memdesc:a4020f25408022dbf20c26ed4fa8c7dff"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of elements in the vector.  <a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a4020f25408022dbf20c26ed4fa8c7dff">More...</a><br /></td></tr>
+<tr class="separator:a4020f25408022dbf20c26ed4fa8c7dff"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad75d72ca210d77ae82b8aa4bed04fed0"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff">kVectorSize</a> = kLanes / 8
+ }</td></tr>
+<tr class="memdesc:ad75d72ca210d77ae82b8aa4bed04fed0"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of the vector.  <a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0">More...</a><br /></td></tr>
+<tr class="separator:ad75d72ca210d77ae82b8aa4bed04fed0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aaebc331402dce98e1f55adff5a4f7dfb"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"></td></tr>
+<tr class="memdesc:aaebc331402dce98e1f55adff5a4f7dfb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of registers needed to store the vector.  <a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#aaebc331402dce98e1f55adff5a4f7dfb">More...</a><br /></td></tr>
+<tr class="separator:aaebc331402dce98e1f55adff5a4f7dfb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a05914a7339b9d399ac7d8cf7ef617c31"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31">Scalar</a></td></tr>
+<tr class="memdesc:a05914a7339b9d399ac7d8cf7ef617c31"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar type.  <a href="#a05914a7339b9d399ac7d8cf7ef617c31">More...</a><br /></td></tr>
+<tr class="separator:a05914a7339b9d399ac7d8cf7ef617c31"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a1310cf2e92e260cf55cfda1cb2cb7280"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1310cf2e92e260cf55cfda1cb2cb7280">Vector</a> ()</td></tr>
+<tr class="memdesc:a1310cf2e92e260cf55cfda1cb2cb7280"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default Constructor.  <a href="#a1310cf2e92e260cf55cfda1cb2cb7280">More...</a><br /></td></tr>
+<tr class="separator:a1310cf2e92e260cf55cfda1cb2cb7280"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a50ae62579267952a648d4b6a6be3c663"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a50ae62579267952a648d4b6a6be3c663">Vector</a> (uint32_t value)</td></tr>
+<tr class="memdesc:a50ae62579267952a648d4b6a6be3c663"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor to convert from uint32_t type.  <a href="#a50ae62579267952a648d4b6a6be3c663">More...</a><br /></td></tr>
+<tr class="separator:a50ae62579267952a648d4b6a6be3c663"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a8eda6e6181a5333ca8350977374708cb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a8eda6e6181a5333ca8350977374708cb">operator[]</a> (uint32_t i) const</td></tr>
+<tr class="memdesc:a8eda6e6181a5333ca8350977374708cb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#a8eda6e6181a5333ca8350977374708cb">More...</a><br /></td></tr>
+<tr class="separator:a8eda6e6181a5333ca8350977374708cb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a1df3324868465331db13bd7775b55e87"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt; <a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff">kVectorSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1df3324868465331db13bd7775b55e87">aligned_</a></td></tr>
+<tr class="memdesc:a1df3324868465331db13bd7775b55e87"><td class="mdescLeft">&#160;</td><td class="mdescRight">The aligned storage to make sure we have good alignment.  <a href="#a1df3324868465331db13bd7775b55e87">More...</a><br /></td></tr>
+<tr class="separator:a1df3324868465331db13bd7775b55e87"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af27a36f604513f05aebe0624a9c539ab"><td class="memItemLeft" align="right" valign="top">uint32_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#af27a36f604513f05aebe0624a9c539ab">registers</a> [kRegisters]</td></tr>
+<tr class="memdesc:af27a36f604513f05aebe0624a9c539ab"><td class="mdescLeft">&#160;</td><td class="mdescRight">The data in registers.  <a href="#af27a36f604513f05aebe0624a9c539ab">More...</a><br /></td></tr>
+<tr class="separator:af27a36f604513f05aebe0624a9c539ab"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a05914a7339b9d399ac7d8cf7ef617c31"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a05914a7339b9d399ac7d8cf7ef617c31">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a> <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, kLanes_ &gt;::<a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Enumeration Documentation</h2>
+<a id="a4020f25408022dbf20c26ed4fa8c7dff"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4020f25408022dbf20c26ed4fa8c7dff">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a4020f25408022dbf20c26ed4fa8c7dffa14befaa9d739f1b754bc372f717b105b"></a>kLanes&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<a id="ad75d72ca210d77ae82b8aa4bed04fed0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad75d72ca210d77ae82b8aa4bed04fed0">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff"></a>kVectorSize&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<a id="aaebc331402dce98e1f55adff5a4f7dfb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#aaebc331402dce98e1f55adff5a4f7dfb">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a1310cf2e92e260cf55cfda1cb2cb7280"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1310cf2e92e260cf55cfda1cb2cb7280">&#9670;&nbsp;</a></span>Vector() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, kLanes_ &gt;::<a class="el" href="unioncutlass_1_1Vector.html">Vector</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a50ae62579267952a648d4b6a6be3c663"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a50ae62579267952a648d4b6a6be3c663">&#9670;&nbsp;</a></span>Vector() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, kLanes_ &gt;::<a class="el" href="unioncutlass_1_1Vector.html">Vector</a> </td>
+          <td>(</td>
+          <td class="paramtype">uint32_t&#160;</td>
+          <td class="paramname"><em>value</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a8eda6e6181a5333ca8350977374708cb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a8eda6e6181a5333ca8350977374708cb">&#9670;&nbsp;</a></span>operator[]()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> bool <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, kLanes_ &gt;::operator[] </td>
+          <td>(</td>
+          <td class="paramtype">uint32_t&#160;</td>
+          <td class="paramname"><em>i</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a1df3324868465331db13bd7775b55e87"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1df3324868465331db13bd7775b55e87">&#9670;&nbsp;</a></span>aligned_</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;<a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff">kVectorSize</a>&gt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, kLanes_ &gt;::aligned_</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="af27a36f604513f05aebe0624a9c539ab"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af27a36f604513f05aebe0624a9c539ab">&#9670;&nbsp;</a></span>registers</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">uint32_t <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1bin1__t.html">bin1_t</a>, kLanes_ &gt;::registers[kRegisters]</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this union was generated from the following file:<ul>
+<li><a class="el" href="vector_8h_source.html">vector.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/unioncutlass_1_1Vector_3_01half_00_011_01_4-members.html b/docs/unioncutlass_1_1Vector_3_01half_00_011_01_4-members.html
new file mode 100644
index 000000000..c2aa80772
--- /dev/null
+++ b/docs/unioncutlass_1_1Vector_3_01half_00_011_01_4-members.html
@@ -0,0 +1,97 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">Vector&lt; half, 1 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Vector&lt; half, 1 &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">cutlass::Vector&lt; half, 1 &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#acc698443a38fd0ad63f931bdf172ad99">aligned_</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">cutlass::Vector&lt; half, 1 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393">kLanes</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">cutlass::Vector&lt; half, 1 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d">kVectorSize</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">cutlass::Vector&lt; half, 1 &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a12fa9366dd57fadb2d3f624ab7836dc8">operator[]</a>(uint32_t i) const</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">cutlass::Vector&lt; half, 1 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1e6568c0f3f958db739074ab6978ff10">operator[]</a>(uint32_t i)</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">cutlass::Vector&lt; half, 1 &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a> typedef</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">cutlass::Vector&lt; half, 1 &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a81709dacea12d6bd3bb328a3f0a519b0">scalars</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">cutlass::Vector&lt; half, 1 &gt;</a></td><td class="entry"></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/unioncutlass_1_1Vector_3_01half_00_011_01_4.html b/docs/unioncutlass_1_1Vector_3_01half_00_011_01_4.html
new file mode 100644
index 000000000..8f498f8cb
--- /dev/null
+++ b/docs/unioncutlass_1_1Vector_3_01half_00_011_01_4.html
@@ -0,0 +1,279 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Vector&lt; half, 1 &gt; Union Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">Vector&lt; half, 1 &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="unioncutlass_1_1Vector_3_01half_00_011_01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Vector&lt; half, 1 &gt; Union Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><code>#include &lt;<a class="el" href="vector_8h_source.html">vector.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a27410a8095bb82f682612954df4d6182"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393">kLanes</a> = 1
+ }</td></tr>
+<tr class="memdesc:a27410a8095bb82f682612954df4d6182"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of elements in the vector.  <a href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182">More...</a><br /></td></tr>
+<tr class="separator:a27410a8095bb82f682612954df4d6182"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a0c3d44e7c726aabf23d57094475fcc22"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d">kVectorSize</a> = kLanes * (int)sizeof(Scalar)
+ }</td></tr>
+<tr class="memdesc:a0c3d44e7c726aabf23d57094475fcc22"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of the vector.  <a href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22">More...</a><br /></td></tr>
+<tr class="separator:a0c3d44e7c726aabf23d57094475fcc22"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1034f48698dcdaa2e37cbf96268f24aa"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"></td></tr>
+<tr class="memdesc:a1034f48698dcdaa2e37cbf96268f24aa"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of registers needed to store the vector.  <a href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1034f48698dcdaa2e37cbf96268f24aa">More...</a><br /></td></tr>
+<tr class="separator:a1034f48698dcdaa2e37cbf96268f24aa"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a394b6e6ea7b97e076ae6445eb75d47ac"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a></td></tr>
+<tr class="memdesc:a394b6e6ea7b97e076ae6445eb75d47ac"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar type.  <a href="#a394b6e6ea7b97e076ae6445eb75d47ac">More...</a><br /></td></tr>
+<tr class="separator:a394b6e6ea7b97e076ae6445eb75d47ac"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a12fa9366dd57fadb2d3f624ab7836dc8"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a12fa9366dd57fadb2d3f624ab7836dc8">operator[]</a> (uint32_t i) const</td></tr>
+<tr class="memdesc:a12fa9366dd57fadb2d3f624ab7836dc8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#a12fa9366dd57fadb2d3f624ab7836dc8">More...</a><br /></td></tr>
+<tr class="separator:a12fa9366dd57fadb2d3f624ab7836dc8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a1e6568c0f3f958db739074ab6978ff10"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1e6568c0f3f958db739074ab6978ff10">operator[]</a> (uint32_t i)</td></tr>
+<tr class="memdesc:a1e6568c0f3f958db739074ab6978ff10"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#a1e6568c0f3f958db739074ab6978ff10">More...</a><br /></td></tr>
+<tr class="separator:a1e6568c0f3f958db739074ab6978ff10"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:acc698443a38fd0ad63f931bdf172ad99"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt; <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d">kVectorSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#acc698443a38fd0ad63f931bdf172ad99">aligned_</a></td></tr>
+<tr class="memdesc:acc698443a38fd0ad63f931bdf172ad99"><td class="mdescLeft">&#160;</td><td class="mdescRight">The aligned storage to make sure we have good alignment.  <a href="#acc698443a38fd0ad63f931bdf172ad99">More...</a><br /></td></tr>
+<tr class="separator:acc698443a38fd0ad63f931bdf172ad99"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a81709dacea12d6bd3bb328a3f0a519b0"><td class="memItemLeft" align="right" valign="top">uint16_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a81709dacea12d6bd3bb328a3f0a519b0">scalars</a> [<a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393">kLanes</a>]</td></tr>
+<tr class="memdesc:a81709dacea12d6bd3bb328a3f0a519b0"><td class="mdescLeft">&#160;</td><td class="mdescRight">The associated array of scalars.  <a href="#a81709dacea12d6bd3bb328a3f0a519b0">More...</a><br /></td></tr>
+<tr class="separator:a81709dacea12d6bd3bb328a3f0a519b0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a394b6e6ea7b97e076ae6445eb75d47ac"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a394b6e6ea7b97e076ae6445eb75d47ac">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef half <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, 1 &gt;::<a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Enumeration Documentation</h2>
+<a id="a27410a8095bb82f682612954df4d6182"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a27410a8095bb82f682612954df4d6182">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393"></a>kLanes&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<a id="a0c3d44e7c726aabf23d57094475fcc22"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a0c3d44e7c726aabf23d57094475fcc22">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d"></a>kVectorSize&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<a id="a1034f48698dcdaa2e37cbf96268f24aa"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1034f48698dcdaa2e37cbf96268f24aa">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a12fa9366dd57fadb2d3f624ab7836dc8"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a12fa9366dd57fadb2d3f624ab7836dc8">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a> const&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, 1 &gt;::operator[] </td>
+          <td>(</td>
+          <td class="paramtype">uint32_t&#160;</td>
+          <td class="paramname"><em>i</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a1e6568c0f3f958db739074ab6978ff10"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a1e6568c0f3f958db739074ab6978ff10">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a>&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, 1 &gt;::operator[] </td>
+          <td>(</td>
+          <td class="paramtype">uint32_t&#160;</td>
+          <td class="paramname"><em>i</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="acc698443a38fd0ad63f931bdf172ad99"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acc698443a38fd0ad63f931bdf172ad99">&#9670;&nbsp;</a></span>aligned_</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;<a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d">kVectorSize</a>&gt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, 1 &gt;::aligned_</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a81709dacea12d6bd3bb328a3f0a519b0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a81709dacea12d6bd3bb328a3f0a519b0">&#9670;&nbsp;</a></span>scalars</h2>
+
+<div class="memitem">
+<div class="memproto">
+      <table class="memname">
+        <tr>
+          <td class="memname">uint16_t <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, 1 &gt;::scalars[<a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393">kLanes</a>]</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this union was generated from the following file:<ul>
+<li><a class="el" href="vector_8h_source.html">vector.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4-members.html b/docs/unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4-members.html
index 26516dab6..1b747c044 100644
--- a/docs/unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4-members.html
+++ b/docs/unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4-members.html
@@ -80,17 +80,17 @@ $(function() {
 <p>This is the complete list of members for <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a>, including all inherited members.</p>
 <table class="directory">
   <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">aligned_</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392">kLanes</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79">kVectorSize</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab0516cef8949f5998b5251cc6b6db683">operator[]</a>(uint32_t i) const</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
-  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a8ade80e040264fbd669d3f15c249884e">operator[]</a>(uint32_t i)</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392">kLanes</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79">kVectorSize</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ad50b5d4acbd7ead82c128091c9db9113">operator[]</a>(uint32_t i) const</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a3891ce1c321a3e57e938c8864de9baf0">operator[]</a>(uint32_t i)</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
   <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f">registers</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"></td></tr>
   <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> typedef</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"></td></tr>
   <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3">scalars</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html b/docs/unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html
index 80d3d9ee9..1a00e2015 100644
--- a/docs/unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html
+++ b/docs/unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html
@@ -86,36 +86,36 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
 Public Types</h2></td></tr>
-<tr class="memitem:aa70d2fd36f00b63d321c1f7b6d6c3024"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392">kLanes</a> = kLanes_
+<tr class="memitem:acfa6821aefbd38a1b7c44e5d83eda05f"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392">kLanes</a> = kLanes_
  }</td></tr>
-<tr class="memdesc:aa70d2fd36f00b63d321c1f7b6d6c3024"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of elements in the vector.  <a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024">More...</a><br /></td></tr>
-<tr class="separator:aa70d2fd36f00b63d321c1f7b6d6c3024"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:adc4140a7e40be1e4f81c78a657c7ba73"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79">kVectorSize</a> = kLanes * (int)sizeof(Scalar)
+<tr class="memdesc:acfa6821aefbd38a1b7c44e5d83eda05f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of elements in the vector.  <a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05f">More...</a><br /></td></tr>
+<tr class="separator:acfa6821aefbd38a1b7c44e5d83eda05f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a42288bc8b85cd3f40aafbe7549a5285b"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79">kVectorSize</a> = kLanes * (int)sizeof(Scalar)
  }</td></tr>
-<tr class="memdesc:adc4140a7e40be1e4f81c78a657c7ba73"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of the vector.  <a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73">More...</a><br /></td></tr>
-<tr class="separator:adc4140a7e40be1e4f81c78a657c7ba73"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a85510d5e04542dbb9d03f70a1d324d35"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"></td></tr>
-<tr class="memdesc:a85510d5e04542dbb9d03f70a1d324d35"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of registers needed to store the vector.  <a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a85510d5e04542dbb9d03f70a1d324d35">More...</a><br /></td></tr>
-<tr class="separator:a85510d5e04542dbb9d03f70a1d324d35"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memdesc:a42288bc8b85cd3f40aafbe7549a5285b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of the vector.  <a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285b">More...</a><br /></td></tr>
+<tr class="separator:a42288bc8b85cd3f40aafbe7549a5285b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a6c0c130195a6b5926d9acb4fb2e27201"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"></td></tr>
+<tr class="memdesc:a6c0c130195a6b5926d9acb4fb2e27201"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of registers needed to store the vector.  <a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a6c0c130195a6b5926d9acb4fb2e27201">More...</a><br /></td></tr>
+<tr class="separator:a6c0c130195a6b5926d9acb4fb2e27201"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:a03199df1287d263f7267239c014f1d9b"><td class="memItemLeft" align="right" valign="top">typedef half&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a></td></tr>
 <tr class="memdesc:a03199df1287d263f7267239c014f1d9b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar type.  <a href="#a03199df1287d263f7267239c014f1d9b">More...</a><br /></td></tr>
 <tr class="separator:a03199df1287d263f7267239c014f1d9b"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
 Public Member Functions</h2></td></tr>
-<tr class="memitem:ab0516cef8949f5998b5251cc6b6db683"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab0516cef8949f5998b5251cc6b6db683">operator[]</a> (uint32_t i) const</td></tr>
-<tr class="memdesc:ab0516cef8949f5998b5251cc6b6db683"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#ab0516cef8949f5998b5251cc6b6db683">More...</a><br /></td></tr>
-<tr class="separator:ab0516cef8949f5998b5251cc6b6db683"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:a8ade80e040264fbd669d3f15c249884e"><td class="memItemLeft" align="right" valign="top">CUTLASS_DEVICE <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a8ade80e040264fbd669d3f15c249884e">operator[]</a> (uint32_t i)</td></tr>
-<tr class="memdesc:a8ade80e040264fbd669d3f15c249884e"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#a8ade80e040264fbd669d3f15c249884e">More...</a><br /></td></tr>
-<tr class="separator:a8ade80e040264fbd669d3f15c249884e"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ad50b5d4acbd7ead82c128091c9db9113"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> const  &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ad50b5d4acbd7ead82c128091c9db9113">operator[]</a> (uint32_t i) const</td></tr>
+<tr class="memdesc:ad50b5d4acbd7ead82c128091c9db9113"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#ad50b5d4acbd7ead82c128091c9db9113">More...</a><br /></td></tr>
+<tr class="separator:ad50b5d4acbd7ead82c128091c9db9113"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a3891ce1c321a3e57e938c8864de9baf0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> &amp;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a3891ce1c321a3e57e938c8864de9baf0">operator[]</a> (uint32_t i)</td></tr>
+<tr class="memdesc:a3891ce1c321a3e57e938c8864de9baf0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#a3891ce1c321a3e57e938c8864de9baf0">More...</a><br /></td></tr>
+<tr class="separator:a3891ce1c321a3e57e938c8864de9baf0"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table><table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:a9e41dbe541a7dddf1e461e0390fe8896"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt; <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79">kVectorSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">aligned_</a></td></tr>
+<tr class="memitem:a9e41dbe541a7dddf1e461e0390fe8896"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt; <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79">kVectorSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">aligned_</a></td></tr>
 <tr class="memdesc:a9e41dbe541a7dddf1e461e0390fe8896"><td class="mdescLeft">&#160;</td><td class="mdescRight">The aligned storage to make sure we have good alignment.  <a href="#a9e41dbe541a7dddf1e461e0390fe8896">More...</a><br /></td></tr>
 <tr class="separator:a9e41dbe541a7dddf1e461e0390fe8896"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:ab4a119a4813f80aa10c25e32f8b115f3"><td class="memItemLeft" align="right" valign="top">uint16_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3">scalars</a> [<a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392">kLanes</a>]</td></tr>
+<tr class="memitem:ab4a119a4813f80aa10c25e32f8b115f3"><td class="memItemLeft" align="right" valign="top">uint16_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3">scalars</a> [<a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392">kLanes</a>]</td></tr>
 <tr class="memdesc:ab4a119a4813f80aa10c25e32f8b115f3"><td class="mdescLeft">&#160;</td><td class="mdescRight">The associated array of scalars.  <a href="#ab4a119a4813f80aa10c25e32f8b115f3">More...</a><br /></td></tr>
 <tr class="separator:ab4a119a4813f80aa10c25e32f8b115f3"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:abd116dc7a5b82ac9b1481fb1d2bfc93f"><td class="memItemLeft" align="right" valign="top">uint32_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f">registers</a> [kRegisters]</td></tr>
@@ -140,8 +140,8 @@ template&lt;int kLanes_&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Enumeration Documentation</h2>
-<a id="aa70d2fd36f00b63d321c1f7b6d6c3024"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aa70d2fd36f00b63d321c1f7b6d6c3024">&#9670;&nbsp;</a></span>anonymous enum</h2>
+<a id="acfa6821aefbd38a1b7c44e5d83eda05f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#acfa6821aefbd38a1b7c44e5d83eda05f">&#9670;&nbsp;</a></span>anonymous enum</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -154,13 +154,13 @@ template&lt;int kLanes_&gt; </div>
       </table>
 </div><div class="memdoc">
 <table class="fieldtable">
-<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392"></a>kLanes&#160;</td><td class="fielddoc"></td></tr>
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392"></a>kLanes&#160;</td><td class="fielddoc"></td></tr>
 </table>
 
 </div>
 </div>
-<a id="adc4140a7e40be1e4f81c78a657c7ba73"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#adc4140a7e40be1e4f81c78a657c7ba73">&#9670;&nbsp;</a></span>anonymous enum</h2>
+<a id="a42288bc8b85cd3f40aafbe7549a5285b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a42288bc8b85cd3f40aafbe7549a5285b">&#9670;&nbsp;</a></span>anonymous enum</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -173,13 +173,13 @@ template&lt;int kLanes_&gt; </div>
       </table>
 </div><div class="memdoc">
 <table class="fieldtable">
-<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79"></a>kVectorSize&#160;</td><td class="fielddoc"></td></tr>
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79"></a>kVectorSize&#160;</td><td class="fielddoc"></td></tr>
 </table>
 
 </div>
 </div>
-<a id="a85510d5e04542dbb9d03f70a1d324d35"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a85510d5e04542dbb9d03f70a1d324d35">&#9670;&nbsp;</a></span>anonymous enum</h2>
+<a id="a6c0c130195a6b5926d9acb4fb2e27201"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a6c0c130195a6b5926d9acb4fb2e27201">&#9670;&nbsp;</a></span>anonymous enum</h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -195,8 +195,8 @@ template&lt;int kLanes_&gt; </div>
 </div>
 </div>
 <h2 class="groupheader">Member Function Documentation</h2>
-<a id="ab0516cef8949f5998b5251cc6b6db683"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#ab0516cef8949f5998b5251cc6b6db683">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
+<a id="ad50b5d4acbd7ead82c128091c9db9113"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad50b5d4acbd7ead82c128091c9db9113">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[1/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -207,7 +207,7 @@ template&lt;int kLanes_&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> const&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, kLanes_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> const&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, kLanes_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">uint32_t&#160;</td>
           <td class="paramname"><em>i</em></td><td>)</td>
@@ -223,8 +223,8 @@ template&lt;int kLanes_&gt; </div>
 
 </div>
 </div>
-<a id="a8ade80e040264fbd669d3f15c249884e"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a8ade80e040264fbd669d3f15c249884e">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
+<a id="a3891ce1c321a3e57e938c8864de9baf0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a3891ce1c321a3e57e938c8864de9baf0">&#9670;&nbsp;</a></span>operator[]() <span class="overload">[2/2]</span></h2>
 
 <div class="memitem">
 <div class="memproto">
@@ -235,7 +235,7 @@ template&lt;int kLanes_&gt; </div>
   <td class="mlabels-left">
       <table class="memname">
         <tr>
-          <td class="memname">CUTLASS_DEVICE <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, kLanes_ &gt;::operator[] </td>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>&amp; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, kLanes_ &gt;::operator[] </td>
           <td>(</td>
           <td class="paramtype">uint32_t&#160;</td>
           <td class="paramname"><em>i</em></td><td>)</td>
@@ -261,7 +261,7 @@ template&lt;int kLanes_&gt; </div>
 template&lt;int kLanes_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;<a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79">kVectorSize</a>&gt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, kLanes_ &gt;::aligned_</td>
+          <td class="memname"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;<a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79">kVectorSize</a>&gt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, kLanes_ &gt;::aligned_</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -293,7 +293,7 @@ template&lt;int kLanes_&gt; </div>
 template&lt;int kLanes_&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">uint16_t <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, kLanes_ &gt;::scalars[<a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392">kLanes</a>]</td>
+          <td class="memname">uint16_t <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; half, kLanes_ &gt;::scalars[<a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392">kLanes</a>]</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -306,7 +306,7 @@ template&lt;int kLanes_&gt; </div>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4-members.html b/docs/unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4-members.html
new file mode 100644
index 000000000..dbe0abbbb
--- /dev/null
+++ b/docs/unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4-members.html
@@ -0,0 +1,98 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">Vector&lt; int4_t, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Vector&lt; int4_t, kLanes_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ad6784e347f068ad20af52379286337c0">aligned_</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a322ddd3ec1f47b76e21c24d3a3c44c5badeba151dbcb3c15e581bad7d767a93fa">kLanes</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6">kVectorSize</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2d5ec0b76daa136dae0b4aec1edf9e0b">operator[]</a>(uint32_t i) const</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ace5e03860b434b2d2a4590bd2bc8c147">registers</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f">Scalar</a> typedef</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af166f710ebbfdff8a62453eee454c1d5">Vector</a>()</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a5feb070268f85bd73c3095eaf2d0e2bb">Vector</a>(uint32_t value)</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html b/docs/unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html
new file mode 100644
index 000000000..885b32b8e
--- /dev/null
+++ b/docs/unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html
@@ -0,0 +1,329 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Vector&lt; int4_t, kLanes_ &gt; Union Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">Vector&lt; int4_t, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Vector&lt; int4_t, kLanes_ &gt; Union Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit signed integer datatype.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="vector_8h_source.html">vector.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a322ddd3ec1f47b76e21c24d3a3c44c5b"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a322ddd3ec1f47b76e21c24d3a3c44c5badeba151dbcb3c15e581bad7d767a93fa">kLanes</a> = kLanes_
+ }</td></tr>
+<tr class="memdesc:a322ddd3ec1f47b76e21c24d3a3c44c5b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of elements in the vector.  <a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a322ddd3ec1f47b76e21c24d3a3c44c5b">More...</a><br /></td></tr>
+<tr class="separator:a322ddd3ec1f47b76e21c24d3a3c44c5b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a01e23040ab8cea016e3709f55c2089fd"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6">kVectorSize</a> = kLanes / 2
+ }</td></tr>
+<tr class="memdesc:a01e23040ab8cea016e3709f55c2089fd"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of the vector.  <a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fd">More...</a><br /></td></tr>
+<tr class="separator:a01e23040ab8cea016e3709f55c2089fd"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2173fdc9aaaea1cd7297b487d2e7c504"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"></td></tr>
+<tr class="memdesc:a2173fdc9aaaea1cd7297b487d2e7c504"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of registers needed to store the vector.  <a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2173fdc9aaaea1cd7297b487d2e7c504">More...</a><br /></td></tr>
+<tr class="separator:a2173fdc9aaaea1cd7297b487d2e7c504"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:af60049062cedca55d8cb4a3cae82641f"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f">Scalar</a></td></tr>
+<tr class="memdesc:af60049062cedca55d8cb4a3cae82641f"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar type.  <a href="#af60049062cedca55d8cb4a3cae82641f">More...</a><br /></td></tr>
+<tr class="separator:af60049062cedca55d8cb4a3cae82641f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:af166f710ebbfdff8a62453eee454c1d5"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af166f710ebbfdff8a62453eee454c1d5">Vector</a> ()</td></tr>
+<tr class="memdesc:af166f710ebbfdff8a62453eee454c1d5"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default Constructor.  <a href="#af166f710ebbfdff8a62453eee454c1d5">More...</a><br /></td></tr>
+<tr class="separator:af166f710ebbfdff8a62453eee454c1d5"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a5feb070268f85bd73c3095eaf2d0e2bb"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a5feb070268f85bd73c3095eaf2d0e2bb">Vector</a> (uint32_t value)</td></tr>
+<tr class="memdesc:a5feb070268f85bd73c3095eaf2d0e2bb"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor to convert from uint32_t type.  <a href="#a5feb070268f85bd73c3095eaf2d0e2bb">More...</a><br /></td></tr>
+<tr class="separator:a5feb070268f85bd73c3095eaf2d0e2bb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a2d5ec0b76daa136dae0b4aec1edf9e0b"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2d5ec0b76daa136dae0b4aec1edf9e0b">operator[]</a> (uint32_t i) const</td></tr>
+<tr class="memdesc:a2d5ec0b76daa136dae0b4aec1edf9e0b"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#a2d5ec0b76daa136dae0b4aec1edf9e0b">More...</a><br /></td></tr>
+<tr class="separator:a2d5ec0b76daa136dae0b4aec1edf9e0b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:ad6784e347f068ad20af52379286337c0"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt; <a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6">kVectorSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ad6784e347f068ad20af52379286337c0">aligned_</a></td></tr>
+<tr class="memdesc:ad6784e347f068ad20af52379286337c0"><td class="mdescLeft">&#160;</td><td class="mdescRight">The aligned storage to make sure we have good alignment.  <a href="#ad6784e347f068ad20af52379286337c0">More...</a><br /></td></tr>
+<tr class="separator:ad6784e347f068ad20af52379286337c0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ace5e03860b434b2d2a4590bd2bc8c147"><td class="memItemLeft" align="right" valign="top">uint32_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ace5e03860b434b2d2a4590bd2bc8c147">registers</a> [kRegisters]</td></tr>
+<tr class="memdesc:ace5e03860b434b2d2a4590bd2bc8c147"><td class="mdescLeft">&#160;</td><td class="mdescRight">The data in registers.  <a href="#ace5e03860b434b2d2a4590bd2bc8c147">More...</a><br /></td></tr>
+<tr class="separator:ace5e03860b434b2d2a4590bd2bc8c147"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="af60049062cedca55d8cb4a3cae82641f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af60049062cedca55d8cb4a3cae82641f">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a> <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, kLanes_ &gt;::<a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Enumeration Documentation</h2>
+<a id="a322ddd3ec1f47b76e21c24d3a3c44c5b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a322ddd3ec1f47b76e21c24d3a3c44c5b">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a322ddd3ec1f47b76e21c24d3a3c44c5badeba151dbcb3c15e581bad7d767a93fa"></a>kLanes&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<a id="a01e23040ab8cea016e3709f55c2089fd"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a01e23040ab8cea016e3709f55c2089fd">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6"></a>kVectorSize&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<a id="a2173fdc9aaaea1cd7297b487d2e7c504"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2173fdc9aaaea1cd7297b487d2e7c504">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="af166f710ebbfdff8a62453eee454c1d5"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#af166f710ebbfdff8a62453eee454c1d5">&#9670;&nbsp;</a></span>Vector() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, kLanes_ &gt;::<a class="el" href="unioncutlass_1_1Vector.html">Vector</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a5feb070268f85bd73c3095eaf2d0e2bb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a5feb070268f85bd73c3095eaf2d0e2bb">&#9670;&nbsp;</a></span>Vector() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, kLanes_ &gt;::<a class="el" href="unioncutlass_1_1Vector.html">Vector</a> </td>
+          <td>(</td>
+          <td class="paramtype">uint32_t&#160;</td>
+          <td class="paramname"><em>value</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="a2d5ec0b76daa136dae0b4aec1edf9e0b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a2d5ec0b76daa136dae0b4aec1edf9e0b">&#9670;&nbsp;</a></span>operator[]()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, kLanes_ &gt;::operator[] </td>
+          <td>(</td>
+          <td class="paramtype">uint32_t&#160;</td>
+          <td class="paramname"><em>i</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="ad6784e347f068ad20af52379286337c0"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ad6784e347f068ad20af52379286337c0">&#9670;&nbsp;</a></span>aligned_</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;<a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6">kVectorSize</a>&gt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, kLanes_ &gt;::aligned_</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="ace5e03860b434b2d2a4590bd2bc8c147"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ace5e03860b434b2d2a4590bd2bc8c147">&#9670;&nbsp;</a></span>registers</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">uint32_t <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1int4__t.html">int4_t</a>, kLanes_ &gt;::registers[kRegisters]</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this union was generated from the following file:<ul>
+<li><a class="el" href="vector_8h_source.html">vector.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4-members.html b/docs/unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4-members.html
new file mode 100644
index 000000000..49fc036f0
--- /dev/null
+++ b/docs/unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4-members.html
@@ -0,0 +1,98 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">Vector&lt; uint4_t, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cutlass::Vector&lt; uint4_t, kLanes_ &gt; Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a4eab187b6f7650bd88ccd421c8330d3c">aligned_</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a9aacb7538f1b83762d68c768629c98eba17b71e816051646b567cf47334649a9b">kLanes</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb">kVectorSize</a> enum value</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#ae2215fe7c2c223175b4172d73a6c7a82">operator[]</a>(uint32_t i) const</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a15d5103e46d53e030100dedaecb0220a">registers</a></td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1">Scalar</a> typedef</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a48e193a0b636934ea553c6e60ffef563">Vector</a>()</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a023d6ae1bf06d678f8cb5652eca1bf79">Vector</a>(uint32_t value)</td><td class="entry"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html b/docs/unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html
new file mode 100644
index 000000000..a07e876ea
--- /dev/null
+++ b/docs/unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html
@@ -0,0 +1,329 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: cutlass::Vector&lt; uint4_t, kLanes_ &gt; Union Template Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecutlass.html">cutlass</a></li><li class="navelem"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">Vector&lt; uint4_t, kLanes_ &gt;</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-types">Public Types</a> &#124;
+<a href="#pub-methods">Public Member Functions</a> &#124;
+<a href="#pub-attribs">Public Attributes</a> &#124;
+<a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cutlass::Vector&lt; uint4_t, kLanes_ &gt; Union Template Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit unsigned integer datatype.  
+</p>
+
+<p><code>#include &lt;<a class="el" href="vector_8h_source.html">vector.h</a>&gt;</code></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-types"></a>
+Public Types</h2></td></tr>
+<tr class="memitem:a9aacb7538f1b83762d68c768629c98eb"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a9aacb7538f1b83762d68c768629c98eba17b71e816051646b567cf47334649a9b">kLanes</a> = kLanes_
+ }</td></tr>
+<tr class="memdesc:a9aacb7538f1b83762d68c768629c98eb"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of elements in the vector.  <a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a9aacb7538f1b83762d68c768629c98eb">More...</a><br /></td></tr>
+<tr class="separator:a9aacb7538f1b83762d68c768629c98eb"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a722f7852892c56613ea5027610523d8b"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom">{ <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb">kVectorSize</a> = kLanes / 2
+ }</td></tr>
+<tr class="memdesc:a722f7852892c56613ea5027610523d8b"><td class="mdescLeft">&#160;</td><td class="mdescRight">The size of the vector.  <a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8b">More...</a><br /></td></tr>
+<tr class="separator:a722f7852892c56613ea5027610523d8b"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a9bc93f275de86e94935e5e0fd31b9328"><td class="memItemLeft" align="right" valign="top">enum &#160;</td><td class="memItemRight" valign="bottom"></td></tr>
+<tr class="memdesc:a9bc93f275de86e94935e5e0fd31b9328"><td class="mdescLeft">&#160;</td><td class="mdescRight">The number of registers needed to store the vector.  <a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a9bc93f275de86e94935e5e0fd31b9328">More...</a><br /></td></tr>
+<tr class="separator:a9bc93f275de86e94935e5e0fd31b9328"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a602530542f526bd151f8a32deda015a1"><td class="memItemLeft" align="right" valign="top">typedef <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1">Scalar</a></td></tr>
+<tr class="memdesc:a602530542f526bd151f8a32deda015a1"><td class="mdescLeft">&#160;</td><td class="mdescRight">The scalar type.  <a href="#a602530542f526bd151f8a32deda015a1">More...</a><br /></td></tr>
+<tr class="separator:a602530542f526bd151f8a32deda015a1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Member Functions</h2></td></tr>
+<tr class="memitem:a48e193a0b636934ea553c6e60ffef563"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a48e193a0b636934ea553c6e60ffef563">Vector</a> ()</td></tr>
+<tr class="memdesc:a48e193a0b636934ea553c6e60ffef563"><td class="mdescLeft">&#160;</td><td class="mdescRight">Default Constructor.  <a href="#a48e193a0b636934ea553c6e60ffef563">More...</a><br /></td></tr>
+<tr class="separator:a48e193a0b636934ea553c6e60ffef563"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a023d6ae1bf06d678f8cb5652eca1bf79"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a>&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a023d6ae1bf06d678f8cb5652eca1bf79">Vector</a> (uint32_t value)</td></tr>
+<tr class="memdesc:a023d6ae1bf06d678f8cb5652eca1bf79"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructor to convert from uint32_t type.  <a href="#a023d6ae1bf06d678f8cb5652eca1bf79">More...</a><br /></td></tr>
+<tr class="separator:a023d6ae1bf06d678f8cb5652eca1bf79"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae2215fe7c2c223175b4172d73a6c7a82"><td class="memItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#ae2215fe7c2c223175b4172d73a6c7a82">operator[]</a> (uint32_t i) const</td></tr>
+<tr class="memdesc:ae2215fe7c2c223175b4172d73a6c7a82"><td class="mdescLeft">&#160;</td><td class="mdescRight">Accessor to the ith lane.  <a href="#ae2215fe7c2c223175b4172d73a6c7a82">More...</a><br /></td></tr>
+<tr class="separator:ae2215fe7c2c223175b4172d73a6c7a82"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
+Public Attributes</h2></td></tr>
+<tr class="memitem:a4eab187b6f7650bd88ccd421c8330d3c"><td class="memItemLeft" align="right" valign="top"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt; <a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb">kVectorSize</a> &gt;&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a4eab187b6f7650bd88ccd421c8330d3c">aligned_</a></td></tr>
+<tr class="memdesc:a4eab187b6f7650bd88ccd421c8330d3c"><td class="mdescLeft">&#160;</td><td class="mdescRight">The aligned storage to make sure we have good alignment.  <a href="#a4eab187b6f7650bd88ccd421c8330d3c">More...</a><br /></td></tr>
+<tr class="separator:a4eab187b6f7650bd88ccd421c8330d3c"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a15d5103e46d53e030100dedaecb0220a"><td class="memItemLeft" align="right" valign="top">uint32_t&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a15d5103e46d53e030100dedaecb0220a">registers</a> [kRegisters]</td></tr>
+<tr class="memdesc:a15d5103e46d53e030100dedaecb0220a"><td class="mdescLeft">&#160;</td><td class="mdescRight">The data in registers.  <a href="#a15d5103e46d53e030100dedaecb0220a">More...</a><br /></td></tr>
+<tr class="separator:a15d5103e46d53e030100dedaecb0220a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<h2 class="groupheader">Member Typedef Documentation</h2>
+<a id="a602530542f526bd151f8a32deda015a1"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a602530542f526bd151f8a32deda015a1">&#9670;&nbsp;</a></span>Scalar</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">typedef <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a> <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, kLanes_ &gt;::<a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1">Scalar</a></td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Enumeration Documentation</h2>
+<a id="a9aacb7538f1b83762d68c768629c98eb"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9aacb7538f1b83762d68c768629c98eb">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a9aacb7538f1b83762d68c768629c98eba17b71e816051646b567cf47334649a9b"></a>kLanes&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<a id="a722f7852892c56613ea5027610523d8b"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a722f7852892c56613ea5027610523d8b">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+<table class="fieldtable">
+<tr><th colspan="2">Enumerator</th></tr><tr><td class="fieldname"><a id="a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb"></a>kVectorSize&#160;</td><td class="fielddoc"></td></tr>
+</table>
+
+</div>
+</div>
+<a id="a9bc93f275de86e94935e5e0fd31b9328"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a9bc93f275de86e94935e5e0fd31b9328">&#9670;&nbsp;</a></span>anonymous enum</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">anonymous enum</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Constructor &amp; Destructor Documentation</h2>
+<a id="a48e193a0b636934ea553c6e60ffef563"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a48e193a0b636934ea553c6e60ffef563">&#9670;&nbsp;</a></span>Vector() <span class="overload">[1/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, kLanes_ &gt;::<a class="el" href="unioncutlass_1_1Vector.html">Vector</a> </td>
+          <td>(</td>
+          <td class="paramname"></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a023d6ae1bf06d678f8cb5652eca1bf79"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a023d6ae1bf06d678f8cb5652eca1bf79">&#9670;&nbsp;</a></span>Vector() <span class="overload">[2/2]</span></h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, kLanes_ &gt;::<a class="el" href="unioncutlass_1_1Vector.html">Vector</a> </td>
+          <td>(</td>
+          <td class="paramtype">uint32_t&#160;</td>
+          <td class="paramname"><em>value</em></td><td>)</td>
+          <td></td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Function Documentation</h2>
+<a id="ae2215fe7c2c223175b4172d73a6c7a82"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae2215fe7c2c223175b4172d73a6c7a82">&#9670;&nbsp;</a></span>operator[]()</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+<table class="mlabels">
+  <tr>
+  <td class="mlabels-left">
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> int <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, kLanes_ &gt;::operator[] </td>
+          <td>(</td>
+          <td class="paramtype">uint32_t&#160;</td>
+          <td class="paramname"><em>i</em></td><td>)</td>
+          <td> const</td>
+        </tr>
+      </table>
+  </td>
+  <td class="mlabels-right">
+<span class="mlabels"><span class="mlabel">inline</span></span>  </td>
+  </tr>
+</table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<h2 class="groupheader">Member Data Documentation</h2>
+<a id="a4eab187b6f7650bd88ccd421c8330d3c"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a4eab187b6f7650bd88ccd421c8330d3c">&#9670;&nbsp;</a></span>aligned_</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname"><a class="el" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;<a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb">kVectorSize</a>&gt; <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, kLanes_ &gt;::aligned_</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<a id="a15d5103e46d53e030100dedaecb0220a"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a15d5103e46d53e030100dedaecb0220a">&#9670;&nbsp;</a></span>registers</h2>
+
+<div class="memitem">
+<div class="memproto">
+<div class="memtemplate">
+template&lt;int kLanes_&gt; </div>
+      <table class="memname">
+        <tr>
+          <td class="memname">uint32_t <a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector</a>&lt; <a class="el" href="structcutlass_1_1uint4__t.html">uint4_t</a>, kLanes_ &gt;::registers[kRegisters]</td>
+        </tr>
+      </table>
+</div><div class="memdoc">
+
+</div>
+</div>
+<hr/>The documentation for this union was generated from the following file:<ul>
+<li><a class="el" href="vector_8h_source.html">vector.h</a></li>
+</ul>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage-members.html b/docs/unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage-members.html
index 5b998e32a..4f3ed8e97 100644
--- a/docs/unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage-members.html
+++ b/docs/unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage-members.html
@@ -73,18 +73,18 @@ $(function() {
 </div><!-- top -->
 <div class="header">
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage Member List</div>  </div>
+<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage Member List</div>  </div>
 </div><!--header-->
 <div class="contents">
 
-<p>This is the complete list of members for <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>, including all inherited members.</p>
+<p>This is the complete list of members for <a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a>, including all inherited members.</p>
 <table class="directory">
-  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#aea5ed35a44624684ffa9ada9d09a8893">load</a></td><td class="entry"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a></td><td class="entry"></td></tr>
-  <tr><td class="entry"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a1f31090613c4e6f0895f598880d6c4e5">store</a></td><td class="entry"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a></td><td class="entry"></td></tr>
+  <tr class="even"><td class="entry"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af">load</a></td><td class="entry"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a></td><td class="entry"></td></tr>
+  <tr><td class="entry"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a673ddeb91e89c9a39c0a4dbaaa97dd8f">store</a></td><td class="entry"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage</a></td><td class="entry"></td></tr>
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html b/docs/unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html
index 1a79c8cfc..cc24a5d21 100644
--- a/docs/unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html
+++ b/docs/unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html
@@ -5,7 +5,7 @@
 <meta http-equiv="X-UA-Compatible" content="IE=9"/>
 <meta name="generator" content="Doxygen 1.8.14"/>
 <meta name="viewport" content="width=device-width, initial-scale=1"/>
-<title>Cutlass: cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage Union Reference</title>
+<title>Cutlass: cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage Union Reference</title>
 <link href="tabs.css" rel="stylesheet" type="text/css"/>
 <script type="text/javascript" src="jquery.js"></script>
 <script type="text/javascript" src="dynsections.js"></script>
@@ -76,7 +76,7 @@ $(function() {
 <a href="#pub-attribs">Public Attributes</a> &#124;
 <a href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage-members.html">List of all members</a>  </div>
   <div class="headertitle">
-<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage Union Reference</div>  </div>
+<div class="title">cutlass::gemm::GemmEpilogueTraits&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage Union Reference</div>  </div>
 </div><!--header-->
 <div class="contents">
 
@@ -87,38 +87,38 @@ $(function() {
 <table class="memberdecls">
 <tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-attribs"></a>
 Public Attributes</h2></td></tr>
-<tr class="memitem:a1f31090613c4e6f0895f598880d6c4e5"><td class="memItemLeft" align="right" valign="top">SharedStoreIteratorD::SharedStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a1f31090613c4e6f0895f598880d6c4e5">store</a></td></tr>
-<tr class="separator:a1f31090613c4e6f0895f598880d6c4e5"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:aea5ed35a44624684ffa9ada9d09a8893"><td class="memItemLeft" align="right" valign="top">SharedLoadIteratorD::SharedStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#aea5ed35a44624684ffa9ada9d09a8893">load</a></td></tr>
-<tr class="separator:aea5ed35a44624684ffa9ada9d09a8893"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a673ddeb91e89c9a39c0a4dbaaa97dd8f"><td class="memItemLeft" align="right" valign="top">SharedStoreIteratorD::SharedStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#a673ddeb91e89c9a39c0a4dbaaa97dd8f">store</a></td></tr>
+<tr class="separator:a673ddeb91e89c9a39c0a4dbaaa97dd8f"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:ae7bc498e4976814111114091de4e43af"><td class="memItemLeft" align="right" valign="top">SharedLoadStreamD::SharedStorage&#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1gemm_1_1GemmEpilogueTraits_1_1StreamSharedStorage.html#ae7bc498e4976814111114091de4e43af">load</a></td></tr>
+<tr class="separator:ae7bc498e4976814111114091de4e43af"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 <h2 class="groupheader">Member Data Documentation</h2>
-<a id="aea5ed35a44624684ffa9ada9d09a8893"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#aea5ed35a44624684ffa9ada9d09a8893">&#9670;&nbsp;</a></span>load</h2>
+<a id="ae7bc498e4976814111114091de4e43af"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#ae7bc498e4976814111114091de4e43af">&#9670;&nbsp;</a></span>load</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">SharedLoadIteratorD::SharedStorage <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage::load</td>
+          <td class="memname">SharedLoadStreamD::SharedStorage <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage::load</td>
         </tr>
       </table>
 </div><div class="memdoc">
 
 </div>
 </div>
-<a id="a1f31090613c4e6f0895f598880d6c4e5"></a>
-<h2 class="memtitle"><span class="permalink"><a href="#a1f31090613c4e6f0895f598880d6c4e5">&#9670;&nbsp;</a></span>store</h2>
+<a id="a673ddeb91e89c9a39c0a4dbaaa97dd8f"></a>
+<h2 class="memtitle"><span class="permalink"><a href="#a673ddeb91e89c9a39c0a4dbaaa97dd8f">&#9670;&nbsp;</a></span>store</h2>
 
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadIteratorD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
+template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIteratorC_, typename GlobalTransformerC_, typename GlobalTransformerD_, typename GlobalStoreIteratorD_, typename SharedStoreIteratorD_, typename SharedStoreTransformerD_, typename SharedLoadStreamD_, typename Iterations_, typename Delta_, typename Functor_, typename Index_ = int&gt; </div>
       <table class="memname">
         <tr>
-          <td class="memname">SharedStoreIteratorD::SharedStorage <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadIteratorD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage::store</td>
+          <td class="memname">SharedStoreIteratorD::SharedStorage <a class="el" href="structcutlass_1_1gemm_1_1GemmEpilogueTraits.html">cutlass::gemm::GemmEpilogueTraits</a>&lt; OutputTile_, Accumulators_, GlobalLoadIteratorC_, GlobalTransformerC_, GlobalTransformerD_, GlobalStoreIteratorD_, SharedStoreIteratorD_, SharedStoreTransformerD_, SharedLoadStreamD_, Iterations_, Delta_, Functor_, Index_ &gt;::StreamSharedStorage::store</td>
         </tr>
       </table>
 </div><div class="memdoc">
@@ -131,7 +131,7 @@ template&lt;typename OutputTile_, typename Accumulators_, typename GlobalLoadIte
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:13 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:51 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage-members.html b/docs/unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage-members.html
index be28d80e5..d27143d36 100644
--- a/docs/unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage-members.html
+++ b/docs/unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage-members.html
@@ -84,7 +84,7 @@ $(function() {
 </table></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html b/docs/unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html
index c182796bb..f9671017c 100644
--- a/docs/unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html
+++ b/docs/unioncutlass_1_1gemm_1_1GemmTraits_1_1SharedStorage.html
@@ -99,7 +99,7 @@ Public Attributes</h2></td></tr>
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname">Epilogue::SharedStorage <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage::epilogue</td>
@@ -115,7 +115,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 <div class="memitem">
 <div class="memproto">
 <div class="memtemplate">
-template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Scalar&gt;&gt; </div>
+template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLoadStreamB_, typename SharedLoadStreamA_, typename SharedLoadStreamB_, typename Epilogue_, typename BlockSwizzle_ = IdentityBlockSwizzle, typename Index_ = int, typename ClearAccumulators_ = ClearAccumulators&lt;typename GemmConfig_::Accumulators::Element&gt;&gt; </div>
       <table class="memname">
         <tr>
           <td class="memname"><a class="el" href="structcutlass_1_1gemm_1_1GemmTraits_1_1MainLoopSharedStorage.html">MainLoopSharedStorage</a> <a class="el" href="structcutlass_1_1gemm_1_1GemmTraits.html">cutlass::gemm::GemmTraits</a>&lt; GemmConfig_, GlobalLoadStreamA_, GlobalLoadStreamB_, SharedLoadStreamA_, SharedLoadStreamB_, Epilogue_, BlockSwizzle_, Index_, ClearAccumulators_ &gt;::SharedStorage::main_loop</td>
@@ -131,7 +131,7 @@ template&lt;typename GemmConfig_, typename GlobalLoadStreamA_, typename GlobalLo
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:14 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:52 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/vector_8h.html b/docs/vector_8h.html
index a3e0c090d..66943201b 100644
--- a/docs/vector_8h.html
+++ b/docs/vector_8h.html
@@ -84,7 +84,8 @@ $(function() {
 <p>Defines a 1D vector of elements held in the registers of each thread.  
 <a href="#details">More...</a></p>
 <div class="textblock"><code>#include &lt;cuda_fp16.h&gt;</code><br />
-<code>#include &lt;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&gt;</code><br />
+<code>#include &quot;<a class="el" href="numeric__types_8h_source.html">cutlass/util/numeric_types.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="platform_8h_source.html">cutlass/util/platform.h</a>&quot;</code><br />
 </div>
 <p><a href="vector_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -94,11 +95,26 @@ Classes</h2></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector.html">cutlass::Vector&lt; Scalar_, kLanes_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">cutlass::Vector&lt; half, 1 &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">cutlass::Vector&lt; half, kLanes_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">cutlass::Vector&lt; bin1_t, kLanes_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 1-bit binary datatype.  <a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; int4_t, kLanes_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit signed integer datatype.  <a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">union &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">cutlass::Vector&lt; uint4_t, kLanes_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="unioncutlass_1_1Vector.html">Vector</a> definition for 4-bit unsigned integer datatype.  <a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize.html">cutlass::Vectorize&lt; Element_, kLanes_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html">cutlass::Vectorize&lt; Element_, 1 &gt;</a></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html">cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html">cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html">cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;</a></td></tr>
 <tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
 <tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1Extent.html">cutlass::Extent&lt; T &gt;</a></td></tr>
 <tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Returns the extent of a scalar or vector.  <a href="structcutlass_1_1Extent.html#details">More...</a><br /></td></tr>
@@ -147,17 +163,17 @@ Functions</h2></td></tr>
 <tr class="memitem:aa80a7cb3febd19b96f2ecbcb610b1b9e"><td class="memTemplParams" colspan="2">template&lt;&gt; </td></tr>
 <tr class="memitem:aa80a7cb3febd19b96f2ecbcb610b1b9e"><td class="memTemplItemLeft" align="right" valign="top">struct&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aa80a7cb3febd19b96f2ecbcb610b1b9e">cutlass::__align__</a> (64) AlignedStruct&lt; 64 &gt;</td></tr>
 <tr class="separator:aa80a7cb3febd19b96f2ecbcb610b1b9e"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:acdb62db582cf90cfd437fc56f4ca7bbf"><td class="memTemplParams" colspan="2">template&lt;typename Scalar_ &gt; </td></tr>
-<tr class="memitem:acdb62db582cf90cfd437fc56f4ca7bbf"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf">cutlass::make_zero</a> (Scalar_ &amp;x)</td></tr>
-<tr class="separator:acdb62db582cf90cfd437fc56f4ca7bbf"><td class="memSeparator" colspan="2">&#160;</td></tr>
-<tr class="memitem:abc5c00b4986db5a114e774cee9999717"><td class="memTemplParams" colspan="2">template&lt;typename Scalar_ , int kLanes_&gt; </td></tr>
-<tr class="memitem:abc5c00b4986db5a114e774cee9999717"><td class="memTemplItemLeft" align="right" valign="top">CUTLASS_DEVICE void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#abc5c00b4986db5a114e774cee9999717">cutlass::make_zero</a> (Vector&lt; Scalar_, kLanes_ &gt; &amp;vec)</td></tr>
-<tr class="separator:abc5c00b4986db5a114e774cee9999717"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:aa03883e612d292e1b53eedd46e08ccd1"><td class="memTemplParams" colspan="2">template&lt;typename Scalar_ &gt; </td></tr>
+<tr class="memitem:aa03883e612d292e1b53eedd46e08ccd1"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#aa03883e612d292e1b53eedd46e08ccd1">cutlass::make_zero</a> (Scalar_ &amp;x)</td></tr>
+<tr class="separator:aa03883e612d292e1b53eedd46e08ccd1"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:a55b5b15eadf125d5ddddee1ea22191ee"><td class="memTemplParams" colspan="2">template&lt;typename Scalar_ , int kLanes_&gt; </td></tr>
+<tr class="memitem:a55b5b15eadf125d5ddddee1ea22191ee"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> void&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a55b5b15eadf125d5ddddee1ea22191ee">cutlass::make_zero</a> (Vector&lt; Scalar_, kLanes_ &gt; &amp;vec)</td></tr>
+<tr class="separator:a55b5b15eadf125d5ddddee1ea22191ee"><td class="memSeparator" colspan="2">&#160;</td></tr>
 </table>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/vector_8h_source.html b/docs/vector_8h_source.html
index 735823858..ebd7873e6 100644
--- a/docs/vector_8h_source.html
+++ b/docs/vector_8h_source.html
@@ -76,43 +76,69 @@ $(function() {
 <div class="title">vector.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="vector_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;cuda_fp16.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">size_t</span> kAlignment_&gt;</div><div class="line"><a name="l00041"></a><span class="lineno"><a class="line" href="structcutlass_1_1AlignedStruct.html">   41</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a> {};</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00044"></a><span class="lineno"><a class="line" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">   44</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(1) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;1&gt;{};</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a602227fad962270da185209ecc6012f2">   46</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(2) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;2&gt;{};</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a266d7d2ae6e79537e46ee37b4fdface7">   48</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(4) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;4&gt;{};</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a1101e01215ddb0e5a7b120a4541a3c4e">   50</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(8) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;8&gt;{};</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00052"></a><span class="lineno"><a class="line" href="namespacecutlass.html#aa4071cf5103f352a5100d9b4bba895e2">   52</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(16) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;16&gt;{};</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="namespacecutlass.html#ada65694bdd4b70d4c9d769a536275a47">   54</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(32) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;32&gt;{};</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="namespacecutlass.html#aa80a7cb3febd19b96f2ecbcb610b1b9e">   56</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(64) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;64&gt;{};</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html">   61</a></span>&#160;<span class="keyword">union </span><a class="code" href="unioncutlass_1_1Vector.html">Vector</a> {</div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">   63</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a>;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">   66</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> = kLanes_ };</div><div class="line"><a name="l00068"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">   68</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> = <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> * (int)<span class="keyword">sizeof</span>(<a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a>) };</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keyword">enum</span> { kRegisters = <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt; 4 ? 1 : <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> / 4 };</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <span class="comment">// Make sure that the vector type makes sense.</span></div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c">   73</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt;= 16, <span class="stringliteral">&quot;Vector type is too large&quot;</span>);</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct&lt;kVectorSize&gt;</a> <a class="code" href="unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c">aligned_</a>;</div><div class="line"><a name="l00078"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">   78</a></span>&#160;  <a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> <a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a>];</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">   80</a></span>&#160;  uint32_t <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[kRegisters];</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00083"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a250860c921c94a6077344f9e11bf5b02">   83</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> <span class="keyword">const</span>&amp; <a class="code" href="unioncutlass_1_1Vector.html#a250860c921c94a6077344f9e11bf5b02">operator[]</a>(uint32_t i)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]; }</div><div class="line"><a name="l00085"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a44cc27bf8a7b789b4ae8538155a50156">   85</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a>&amp; <a class="code" href="unioncutlass_1_1Vector.html#a44cc27bf8a7b789b4ae8538155a50156">operator[]</a>(uint32_t i) { <span class="keywordflow">return</span> <a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]; }</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;};</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)</span></div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">   93</a></span>&#160;<span class="keyword">union </span><a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;half, kLanes_&gt; {</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">   95</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#aa70d2fd36f00b63d321c1f7b6d6c3024ad242b575673ca1bf9cf311e58a966392">   98</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> = kLanes_ };</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#adc4140a7e40be1e4f81c78a657c7ba73abfbb3cf98db2f8af7150efb91cac4e79">  100</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> = <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> * (int)<span class="keyword">sizeof</span>(<a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>) };</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <span class="keyword">enum</span> { kRegisters = <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt; 4 ? 1 : <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> / 4 };</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  <span class="comment">// Make sure that the vector type makes sense.</span></div><div class="line"><a name="l00105"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">  105</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt;= <span class="keywordtype">size_t</span>(16), <span class="stringliteral">&quot;Vector type is too large&quot;</span>);</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct&lt;kVectorSize&gt;</a> <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">aligned_</a>;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3">  110</a></span>&#160;  uint16_t <a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a>];</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f">  112</a></span>&#160;  uint32_t <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[kRegisters];</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab0516cef8949f5998b5251cc6b6db683">  115</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> <span class="keyword">const</span>&amp; <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab0516cef8949f5998b5251cc6b6db683">operator[]</a>(uint32_t i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]);</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  }</div><div class="line"><a name="l00119"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a8ade80e040264fbd669d3f15c249884e">  119</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>&amp; <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a8ade80e040264fbd669d3f15c249884e">operator[]</a>(uint32_t i) { <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>&amp;<span class="keyword">&gt;</span>(<a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]); }</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;};</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_&gt;</div><div class="line"><a name="l00127"></a><span class="lineno"><a class="line" href="namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf">  127</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf">make_zero</a>(Scalar_&amp; x) {</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  x = Scalar_(0);</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;}</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Element_, <span class="keywordtype">int</span> kLanes_ = 1&gt;</div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize.html">  134</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Vectorize.html">Vectorize</a> {</div><div class="line"><a name="l00135"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">  135</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;Element_, kLanes_&gt;</a> <a class="code" href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">Type</a>;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;};</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Element_&gt;</div><div class="line"><a name="l00141"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html">  141</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;Element_, 1&gt; {</div><div class="line"><a name="l00142"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html#a79f147933e3f520145aee94ae18da3c5">  142</a></span>&#160;  <span class="keyword">typedef</span> Element_ <a class="code" href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html#a79f147933e3f520145aee94ae18da3c5">Type</a>;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;};</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00148"></a><span class="lineno"><a class="line" href="namespacecutlass.html#abc5c00b4986db5a114e774cee9999717">  148</a></span>&#160;CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf">make_zero</a>(<a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;Scalar_, kLanes_&gt;</a>&amp; vec) {</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Vector&lt;Scalar_, kLanes_&gt;::kRegisters; ++i) {</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    vec.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[i] = 0;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  }</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;}</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="comment">// cutlass::Extent similar to std::extent but applicable to CUTLASS types</span></div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00161"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent.html">  161</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Extent.html">Extent</a> {</div><div class="line"><a name="l00162"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">  162</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">size_t</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">kValue</a> = 1;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;};</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> Lanes&gt;</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html">  167</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Extent.html">Extent</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;T, Lanes&gt; &gt; {</div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a10f7184a9a50de0268efa45dab5dc304">  168</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">size_t</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">kValue</a> = Lanes;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;};</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> Lanes&gt;</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html">  173</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Extent.html">Extent</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;T, Lanes&gt; const&gt; {</div><div class="line"><a name="l00174"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a87917a6dfbb1662416c4ea4831669aaf">  174</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">size_t</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">kValue</a> = Lanes;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;};</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00181"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html">  181</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1VectorTraits.html">VectorTraits</a> {</div><div class="line"><a name="l00183"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599">  183</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599">Scalar</a>;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">  186</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">kLanes</a> = 1;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div><div class="line"><a name="l00189"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">  189</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">IsVector</a> = <span class="keyword">false</span>;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div><div class="line"><a name="l00192"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">  192</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">Vector&lt;T, 1&gt;</a> <a class="code" href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">Vector</a>;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;};</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> Lanes&gt;</div><div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html">  197</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1VectorTraits.html">VectorTraits</a>&lt;<a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">Vector</a>&lt;T, Lanes&gt; &gt; {</div><div class="line"><a name="l00199"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc">  199</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc">Scalar</a>;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aca745b59c6c21292f119943e5a480f39">  202</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">kLanes</a> = Lanes;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div><div class="line"><a name="l00205"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aead181209c756f25ab5870682670bb99">  205</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">IsVector</a> = <span class="keyword">true</span>;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;</div><div class="line"><a name="l00208"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">  208</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">Vector&lt;T, Lanes&gt;</a> <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">Vector</a>;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;};</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> Lanes&gt;</div><div class="line"><a name="l00213"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html">  213</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1VectorTraits.html">VectorTraits</a>&lt;<a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">Vector</a>&lt;T, Lanes&gt; const&gt; {</div><div class="line"><a name="l00215"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e">  215</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e">Scalar</a>;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;</div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a43ac200035052a2c352c8c4b84aac73c">  218</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">kLanes</a> = Lanes;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a893488718d8437970c1b4ed4f4056620">  221</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">IsVector</a> = <span class="keyword">true</span>;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div><div class="line"><a name="l00224"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">  224</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">Vector&lt;T, Lanes&gt;</a> <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">Vector</a>;</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;};</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1Vectorize_3_01Element___00_011_01_4_html_a79f147933e3f520145aee94ae18da3c5"><div class="ttname"><a href="structcutlass_1_1Vectorize_3_01Element___00_011_01_4.html#a79f147933e3f520145aee94ae18da3c5">cutlass::Vectorize&lt; Element_, 1 &gt;::Type</a></div><div class="ttdeci">Element_ Type</div><div class="ttdef"><b>Definition:</b> vector.h:142</div></div>
+<a href="vector_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;cuda_fp16.h&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="numeric__types_8h.html">cutlass/util/numeric_types.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="platform_8h.html">cutlass/util/platform.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">size_t</span> kAlignment_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="structcutlass_1_1AlignedStruct.html">   42</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a> {};</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">   45</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(1) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;1&gt;{};</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00047"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a602227fad962270da185209ecc6012f2">   47</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(2) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;2&gt;{};</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00049"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a266d7d2ae6e79537e46ee37b4fdface7">   49</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(4) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;4&gt;{};</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a1101e01215ddb0e5a7b120a4541a3c4e">   51</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(8) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;8&gt;{};</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="namespacecutlass.html#aa4071cf5103f352a5100d9b4bba895e2">   53</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(16) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;16&gt;{};</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00055"></a><span class="lineno"><a class="line" href="namespacecutlass.html#ada65694bdd4b70d4c9d769a536275a47">   55</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(32) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;32&gt;{};</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="namespacecutlass.html#aa80a7cb3febd19b96f2ecbcb610b1b9e">   57</a></span>&#160;<span class="keyword">struct </span><a class="code" href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">__align__</a>(64) <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct</a>&lt;64&gt;{};</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00062"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html">   62</a></span>&#160;<span class="keyword">union </span><a class="code" href="unioncutlass_1_1Vector.html">Vector</a> {</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">   64</a></span>&#160;  <span class="keyword">typedef</span> Scalar_ <a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a>;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">   67</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> = kLanes_ };</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">   69</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> = <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> * (int)<span class="keyword">sizeof</span>(<a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a>) };</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="keyword">enum</span> { kRegisters = <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt; 4 ? 1 : <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> / 4 };</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="comment">// Make sure that the vector type makes sense.</span></div><div class="line"><a name="l00074"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c">   74</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt;= 16, <span class="stringliteral">&quot;Vector type is too large&quot;</span>);</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct&lt;kVectorSize&gt;</a> <a class="code" href="unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c">aligned_</a>;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">   79</a></span>&#160;  <a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> <a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a>];</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">   81</a></span>&#160;  uint32_t <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[kRegisters];</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#a69be4f85c1dac371fa6f1c6747724adc">   84</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a> <span class="keyword">const</span>&amp; <a class="code" href="unioncutlass_1_1Vector.html#a69be4f85c1dac371fa6f1c6747724adc">operator[]</a>(uint32_t i)<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]; }</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector.html#abf531676caf85cde1c8df435c1ebe8bb">   86</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">Scalar</a>&amp; <a class="code" href="unioncutlass_1_1Vector.html#abf531676caf85cde1c8df435c1ebe8bb">operator[]</a>(uint32_t i) { <span class="keywordflow">return</span> <a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]; }</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;};</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html">   92</a></span>&#160;<span class="keyword">union </span><a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;half, 1&gt; {</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">   94</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a>;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a27410a8095bb82f682612954df4d6182a3a12b2fbef9007373a03125ec3c1c393">   97</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> = 1 };</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a0c3d44e7c726aabf23d57094475fcc22aa12662bfb46ed10de12f168219ce0a8d">   99</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> = <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> * (int)<span class="keyword">sizeof</span>(<a class="code" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a>) };</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  <span class="keyword">enum</span> { kRegisters = <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt; 4 ? 1 : <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> / 4 };</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;  <span class="comment">// Make sure that the vector type makes sense.</span></div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#acc698443a38fd0ad63f931bdf172ad99">  104</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt;= 16, <span class="stringliteral">&quot;Vector type is too large&quot;</span>);</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct&lt;kVectorSize&gt;</a> <a class="code" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#acc698443a38fd0ad63f931bdf172ad99">aligned_</a>;</div><div class="line"><a name="l00109"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a81709dacea12d6bd3bb328a3f0a519b0">  109</a></span>&#160;  uint16_t <a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a>];</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a12fa9366dd57fadb2d3f624ab7836dc8">  112</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a> <span class="keyword">const</span>&amp; <a class="code" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a12fa9366dd57fadb2d3f624ab7836dc8">operator[]</a>(uint32_t i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]);</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  }</div><div class="line"><a name="l00116"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1e6568c0f3f958db739074ab6978ff10">  116</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a>&amp; <a class="code" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1e6568c0f3f958db739074ab6978ff10">operator[]</a>(uint32_t i) {</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;      <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">Scalar</a>&amp;<span class="keyword">&gt;</span>(<a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]);</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  }</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;};</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="preprocessor">#if !defined(__CUDACC_RTC__) || defined(CUTLASS_NVRTC_HAS_FP16)</span></div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html">  124</a></span>&#160;<span class="keyword">union </span><a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;half, kLanes_&gt; {</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">  126</a></span>&#160;  <span class="keyword">typedef</span> half <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div><div class="line"><a name="l00129"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#acfa6821aefbd38a1b7c44e5d83eda05fad242b575673ca1bf9cf311e58a966392">  129</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> = kLanes_ };</div><div class="line"><a name="l00131"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a42288bc8b85cd3f40aafbe7549a5285babfbb3cf98db2f8af7150efb91cac4e79">  131</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> = <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> * (int)<span class="keyword">sizeof</span>(<a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>) };</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  <span class="keyword">enum</span> { kRegisters = <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt; 4 ? 1 : <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> / 4 };</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="comment">// Make sure that the vector type makes sense.</span></div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">  136</a></span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>(<a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt;= <span class="keywordtype">size_t</span>(16), <span class="stringliteral">&quot;Vector type is too large&quot;</span>);</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;  <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct&lt;kVectorSize&gt;</a> <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">aligned_</a>;</div><div class="line"><a name="l00141"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab4a119a4813f80aa10c25e32f8b115f3">  141</a></span>&#160;  uint16_t <a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a>];</div><div class="line"><a name="l00143"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#abd116dc7a5b82ac9b1481fb1d2bfc93f">  143</a></span>&#160;  uint32_t <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[kRegisters];</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ad50b5d4acbd7ead82c128091c9db9113">  146</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> <span class="keyword">const</span>&amp; <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ad50b5d4acbd7ead82c128091c9db9113">operator[]</a>(uint32_t i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a> const&amp;<span class="keyword">&gt;</span>(<a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]);</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  }</div><div class="line"><a name="l00150"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a3891ce1c321a3e57e938c8864de9baf0">  150</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>&amp; <a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a3891ce1c321a3e57e938c8864de9baf0">operator[]</a>(uint32_t i) {</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span><a class="code" href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">Scalar</a>&amp;<span class="keyword">&gt;</span>(<a class="code" href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">scalars</a>[i]);</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  }</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;};</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00161"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html">  161</a></span>&#160;<span class="keyword">union </span><a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="code" href="structcutlass_1_1bin1__t.html">bin1_t</a>, kLanes_&gt; {</div><div class="line"><a name="l00163"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31">  163</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1bin1__t.html">bin1_t</a> <a class="code" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31">Scalar</a>;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a4020f25408022dbf20c26ed4fa8c7dffa14befaa9d739f1b754bc372f717b105b">  166</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> = kLanes_ };</div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#ad75d72ca210d77ae82b8aa4bed04fed0ab98f21cd2645378ad0a840727b7edaff">  168</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> = <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> / 8 };</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;  <span class="keyword">enum</span> { kRegisters = <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt; 4 ? 1 : <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> / 4 };</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> &gt;= 8) &amp;&amp; !(<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> % 8),</div><div class="line"><a name="l00173"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1df3324868465331db13bd7775b55e87">  173</a></span>&#160;                <span class="stringliteral">&quot;May only construct vectors of bin1_t that are multiples of 8 bits.&quot;</span>);</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct&lt;kVectorSize&gt;</a> <a class="code" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1df3324868465331db13bd7775b55e87">aligned_</a>;</div><div class="line"><a name="l00178"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#af27a36f604513f05aebe0624a9c539ab">  178</a></span>&#160;  uint32_t <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[kRegisters];</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00182"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1310cf2e92e260cf55cfda1cb2cb7280">  182</a></span>&#160;  <a class="code" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1310cf2e92e260cf55cfda1cb2cb7280">Vector</a>() {}</div><div class="line"><a name="l00184"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a50ae62579267952a648d4b6a6be3c663">  184</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a50ae62579267952a648d4b6a6be3c663">Vector</a>(uint32_t value) { <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0] = value; }</div><div class="line"><a name="l00186"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a8eda6e6181a5333ca8350977374708cb">  186</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">bool</span> <a class="code" href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a8eda6e6181a5333ca8350977374708cb">operator[]</a>(uint32_t i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <span class="keywordflow">return</span> ( (<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[i / 32] &amp; (1 &lt;&lt; (i % 32))) != 0 );</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  }</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;};</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00195"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html">  195</a></span>&#160;<span class="keyword">union </span><a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="code" href="structcutlass_1_1int4__t.html">int4_t</a>, kLanes_&gt; {</div><div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f">  197</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1int4__t.html">int4_t</a> <a class="code" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f">Scalar</a>;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div><div class="line"><a name="l00200"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a322ddd3ec1f47b76e21c24d3a3c44c5badeba151dbcb3c15e581bad7d767a93fa">  200</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> = kLanes_ };</div><div class="line"><a name="l00202"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a01e23040ab8cea016e3709f55c2089fdaf9fe4d6ac4ee913780e3361dde6c80d6">  202</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> = <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> / 2 };</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;  <span class="keyword">enum</span> { kRegisters = <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt; 4 ? 1 : <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> / 4 };</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> &gt;= 2) &amp;&amp; !(<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> % 2),</div><div class="line"><a name="l00207"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ad6784e347f068ad20af52379286337c0">  207</a></span>&#160;   <span class="stringliteral">&quot;May only construct vectors of int4_t that are multiples of 8 bits.&quot;</span>);</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct&lt;kVectorSize&gt;</a> <a class="code" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ad6784e347f068ad20af52379286337c0">aligned_</a>;</div><div class="line"><a name="l00212"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ace5e03860b434b2d2a4590bd2bc8c147">  212</a></span>&#160;  uint32_t <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[kRegisters];</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00216"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af166f710ebbfdff8a62453eee454c1d5">  216</a></span>&#160;  <a class="code" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af166f710ebbfdff8a62453eee454c1d5">Vector</a>() {}</div><div class="line"><a name="l00218"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a5feb070268f85bd73c3095eaf2d0e2bb">  218</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a5feb070268f85bd73c3095eaf2d0e2bb">Vector</a>(uint32_t value) { <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0] = value; }</div><div class="line"><a name="l00220"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2d5ec0b76daa136dae0b4aec1edf9e0b">  220</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2d5ec0b76daa136dae0b4aec1edf9e0b">operator[]</a>(uint32_t i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <span class="keywordflow">return</span> (<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[i / 8] &gt;&gt; (i % 8 * 4) &amp; 0x0f)</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;              - 16 * (<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[i / 8] &gt;&gt; (i % 8 * 4 + 3) &amp; 0x01);</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;  }</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;};</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00230"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html">  230</a></span>&#160;<span class="keyword">union </span><a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="code" href="structcutlass_1_1uint4__t.html">uint4_t</a>, kLanes_&gt; {</div><div class="line"><a name="l00232"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1">  232</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1uint4__t.html">uint4_t</a> <a class="code" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1">Scalar</a>;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;</div><div class="line"><a name="l00235"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a9aacb7538f1b83762d68c768629c98eba17b71e816051646b567cf47334649a9b">  235</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> = kLanes_ };</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a722f7852892c56613ea5027610523d8bab0655ce225f020ac27580efa249f6acb">  237</a></span>&#160;  <span class="keyword">enum</span> { <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> = <a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> / 2 };</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;  <span class="keyword">enum</span> { kRegisters = <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> &lt; 4 ? 1 : <a class="code" href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">kVectorSize</a> / 4 };</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;  <a class="code" href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a>((<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> &gt;= 2) &amp;&amp; !(<a class="code" href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">kLanes</a> % 2),</div><div class="line"><a name="l00242"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a4eab187b6f7650bd88ccd421c8330d3c">  242</a></span>&#160;    <span class="stringliteral">&quot;May only construct vectors of uint4_t that are multiples of 8 bits.&quot;</span>);</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;  <a class="code" href="structcutlass_1_1AlignedStruct.html">AlignedStruct&lt;kVectorSize&gt;</a> <a class="code" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a4eab187b6f7650bd88ccd421c8330d3c">aligned_</a>;</div><div class="line"><a name="l00247"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a15d5103e46d53e030100dedaecb0220a">  247</a></span>&#160;  uint32_t <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[kRegisters];</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00251"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a48e193a0b636934ea553c6e60ffef563">  251</a></span>&#160;  <a class="code" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a48e193a0b636934ea553c6e60ffef563">Vector</a>() {}</div><div class="line"><a name="l00253"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a023d6ae1bf06d678f8cb5652eca1bf79">  253</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <a class="code" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a023d6ae1bf06d678f8cb5652eca1bf79">Vector</a>(uint32_t value) { <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[0] = value; }</div><div class="line"><a name="l00255"></a><span class="lineno"><a class="line" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#ae2215fe7c2c223175b4172d73a6c7a82">  255</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#ae2215fe7c2c223175b4172d73a6c7a82">operator[]</a>(uint32_t i)<span class="keyword"> const </span>{</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[i / 8] &gt;&gt; (i % 8 * 4) &amp; 0x0f;</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;  }</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;};</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_&gt;</div><div class="line"><a name="l00263"></a><span class="lineno"><a class="line" href="namespacecutlass.html#aa03883e612d292e1b53eedd46e08ccd1">  263</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#aa03883e612d292e1b53eedd46e08ccd1">make_zero</a>(Scalar_&amp; x) {</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;  x = Scalar_(0);</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;}</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Element_, <span class="keywordtype">int</span> kLanes_ = 1&gt;</div><div class="line"><a name="l00270"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize.html">  270</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Vectorize.html">Vectorize</a> {</div><div class="line"><a name="l00271"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">  271</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;Element_, kLanes_&gt;</a> <a class="code" href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">Type</a>;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;};</div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00277"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html">  277</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="code" href="structcutlass_1_1bin1__t.html">bin1_t</a>, 32&gt;, kLanes_&gt; {</div><div class="line"><a name="l00278"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186">  278</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;bin1_t, kLanes_ * 32&gt;</a> <a class="code" href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186">Type</a>;</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;};</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00284"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html">  284</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="code" href="structcutlass_1_1int4__t.html">int4_t</a>, 8&gt;, kLanes_&gt; {</div><div class="line"><a name="l00285"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06">  285</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;int4_t, kLanes_ * 8&gt;</a> <a class="code" href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06">Type</a>;</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;};</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;</div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00291"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html">  291</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Vectorize.html">Vectorize</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;<a class="code" href="structcutlass_1_1uint4__t.html">uint4_t</a>, 8&gt;, kLanes_&gt; {</div><div class="line"><a name="l00292"></a><span class="lineno"><a class="line" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca">  292</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;uint4_t, kLanes_ * 8&gt;</a> <a class="code" href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca">Type</a>;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;};</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keywordtype">int</span> kLanes_&gt;</div><div class="line"><a name="l00298"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a55b5b15eadf125d5ddddee1ea22191ee">  298</a></span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="namespacecutlass.html#aa03883e612d292e1b53eedd46e08ccd1">make_zero</a>(<a class="code" href="unioncutlass_1_1Vector.html">Vector&lt;Scalar_, kLanes_&gt;</a>&amp; vec) {</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;  <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Vector&lt;Scalar_, kLanes_&gt;::kRegisters; ++i) {</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;    vec.<a class="code" href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">registers</a>[i] = 0;</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;  }</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;}</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;<span class="comment">// cutlass::Extent similar to std::extent but applicable to CUTLASS types</span></div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;<span class="comment">//</span></div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00311"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent.html">  311</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Extent.html">Extent</a> {</div><div class="line"><a name="l00312"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">  312</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">size_t</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">kValue</a> = 1;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;};</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> Lanes&gt;</div><div class="line"><a name="l00317"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html">  317</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Extent.html">Extent</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;T, Lanes&gt; &gt; {</div><div class="line"><a name="l00318"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a10f7184a9a50de0268efa45dab5dc304">  318</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">size_t</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">kValue</a> = Lanes;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;};</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> Lanes&gt;</div><div class="line"><a name="l00323"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html">  323</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1Extent.html">Extent</a>&lt;<a class="code" href="unioncutlass_1_1Vector.html">Vector</a>&lt;T, Lanes&gt; const&gt; {</div><div class="line"><a name="l00324"></a><span class="lineno"><a class="line" href="structcutlass_1_1Extent_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a87917a6dfbb1662416c4ea4831669aaf">  324</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">size_t</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">kValue</a> = Lanes;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;};</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div><div class="line"><a name="l00331"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html">  331</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1VectorTraits.html">VectorTraits</a> {</div><div class="line"><a name="l00333"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599">  333</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599">Scalar</a>;</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;</div><div class="line"><a name="l00336"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">  336</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">kLanes</a> = 1;</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;</div><div class="line"><a name="l00339"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">  339</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">IsVector</a> = <span class="keyword">false</span>;</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;</div><div class="line"><a name="l00342"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">  342</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">Vector&lt;T, 1&gt;</a> <a class="code" href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">Vector</a>;</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;};</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> Lanes&gt;</div><div class="line"><a name="l00347"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html">  347</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1VectorTraits.html">VectorTraits</a>&lt;<a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">Vector</a>&lt;T, Lanes&gt; &gt; {</div><div class="line"><a name="l00349"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc">  349</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc">Scalar</a>;</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div><div class="line"><a name="l00352"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aca745b59c6c21292f119943e5a480f39">  352</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">kLanes</a> = Lanes;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;</div><div class="line"><a name="l00355"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aead181209c756f25ab5870682670bb99">  355</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">IsVector</a> = <span class="keyword">true</span>;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;</div><div class="line"><a name="l00358"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">  358</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">Vector&lt;T, Lanes&gt;</a> <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">Vector</a>;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;};</div><div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> Lanes&gt;</div><div class="line"><a name="l00363"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html">  363</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1VectorTraits.html">VectorTraits</a>&lt;<a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">Vector</a>&lt;T, Lanes&gt; const&gt; {</div><div class="line"><a name="l00365"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e">  365</a></span>&#160;  <span class="keyword">typedef</span> T <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e">Scalar</a>;</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;</div><div class="line"><a name="l00368"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a43ac200035052a2c352c8c4b84aac73c">  368</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">kLanes</a> = Lanes;</div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;</div><div class="line"><a name="l00371"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a893488718d8437970c1b4ed4f4056620">  371</a></span>&#160;  <span class="keyword">static</span> <span class="keywordtype">bool</span> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">IsVector</a> = <span class="keyword">true</span>;</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;</div><div class="line"><a name="l00374"></a><span class="lineno"><a class="line" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">  374</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">Vector&lt;T, Lanes&gt;</a> <a class="code" href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">Vector</a>;</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;};</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;</div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4_html_a5c32d50c6c97d7489034efb7188c8186"><div class="ttname"><a href="structcutlass_1_1Vectorize_3_01Vector_3_01bin1__t_00_0132_01_4_00_01kLanes___01_4.html#a5c32d50c6c97d7489034efb7188c8186">cutlass::Vectorize&lt; Vector&lt; bin1_t, 32 &gt;, kLanes_ &gt;::Type</a></div><div class="ttdeci">Vector&lt; bin1_t, kLanes_ *32 &gt; Type</div><div class="ttdef"><b>Definition:</b> vector.h:278</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html_a69be4f85c1dac371fa6f1c6747724adc"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a69be4f85c1dac371fa6f1c6747724adc">cutlass::Vector::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar const  &amp; operator[](uint32_t i) const</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:84</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1Vectorize_html"><div class="ttname"><a href="structcutlass_1_1Vectorize.html">cutlass::Vectorize</a></div><div class="ttdef"><b>Definition:</b> vector.h:134</div></div>
-<div class="ttc" id="namespacecutlass_html_acdb62db582cf90cfd437fc56f4ca7bbf"><div class="ttname"><a href="namespacecutlass.html#acdb62db582cf90cfd437fc56f4ca7bbf">cutlass::make_zero</a></div><div class="ttdeci">CUTLASS_DEVICE void make_zero(Scalar_ &amp;x)</div><div class="ttdef"><b>Definition:</b> vector.h:127</div></div>
-<div class="ttc" id="structcutlass_1_1AlignedStruct_html"><div class="ttname"><a href="structcutlass_1_1AlignedStruct.html">cutlass::AlignedStruct</a></div><div class="ttdef"><b>Definition:</b> vector.h:41</div></div>
-<div class="ttc" id="structcutlass_1_1VectorTraits_html_ab3b49d7fb52050c13e50e3c75bf72599"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599">cutlass::VectorTraits::Scalar</a></div><div class="ttdeci">T Scalar</div><div class="ttdoc">Scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:183</div></div>
-<div class="ttc" id="namespacecutlass_html_ae6ee3d9361526f859d737d9c68c13706"><div class="ttname"><a href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">cutlass::__align__</a></div><div class="ttdeci">struct __align__(1) AlignedStruct&lt; 1 &gt;</div><div class="ttdef"><b>Definition:</b> vector.h:44</div></div>
+<div class="ttc" id="namespacecutlass_html_aa03883e612d292e1b53eedd46e08ccd1"><div class="ttname"><a href="namespacecutlass.html#aa03883e612d292e1b53eedd46e08ccd1">cutlass::make_zero</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void make_zero(Scalar_ &amp;x)</div><div class="ttdef"><b>Definition:</b> vector.h:263</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4_html_a5feb070268f85bd73c3095eaf2d0e2bb"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a5feb070268f85bd73c3095eaf2d0e2bb">cutlass::Vector&lt; int4_t, kLanes_ &gt;::Vector</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Vector(uint32_t value)</div><div class="ttdoc">Constructor to convert from uint32_t type. </div><div class="ttdef"><b>Definition:</b> vector.h:218</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_011_01_4_html_a394b6e6ea7b97e076ae6445eb75d47ac"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a394b6e6ea7b97e076ae6445eb75d47ac">cutlass::Vector&lt; half, 1 &gt;::Scalar</a></div><div class="ttdeci">half Scalar</div><div class="ttdoc">The scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1Vectorize_html"><div class="ttname"><a href="structcutlass_1_1Vectorize.html">cutlass::Vectorize</a></div><div class="ttdef"><b>Definition:</b> vector.h:270</div></div>
+<div class="ttc" id="structcutlass_1_1bin1__t_html"><div class="ttname"><a href="structcutlass_1_1bin1__t.html">cutlass::bin1_t</a></div><div class="ttdef"><b>Definition:</b> numeric_types.h:39</div></div>
+<div class="ttc" id="structcutlass_1_1AlignedStruct_html"><div class="ttname"><a href="structcutlass_1_1AlignedStruct.html">cutlass::AlignedStruct</a></div><div class="ttdef"><b>Definition:</b> vector.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1VectorTraits_html_ab3b49d7fb52050c13e50e3c75bf72599"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html#ab3b49d7fb52050c13e50e3c75bf72599">cutlass::VectorTraits::Scalar</a></div><div class="ttdeci">T Scalar</div><div class="ttdoc">Scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:333</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4_html_a2d5ec0b76daa136dae0b4aec1edf9e0b"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#a2d5ec0b76daa136dae0b4aec1edf9e0b">cutlass::Vector&lt; int4_t, kLanes_ &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int operator[](uint32_t i) const</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:220</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_011_01_4_html_a12fa9366dd57fadb2d3f624ab7836dc8"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a12fa9366dd57fadb2d3f624ab7836dc8">cutlass::Vector&lt; half, 1 &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar const  &amp; operator[](uint32_t i) const</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:112</div></div>
+<div class="ttc" id="namespacecutlass_html_ae6ee3d9361526f859d737d9c68c13706"><div class="ttname"><a href="namespacecutlass.html#ae6ee3d9361526f859d737d9c68c13706">cutlass::__align__</a></div><div class="ttdeci">struct __align__(1) AlignedStruct&lt; 1 &gt;</div><div class="ttdef"><b>Definition:</b> vector.h:45</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html_abf531676caf85cde1c8df435c1ebe8bb"><div class="ttname"><a href="unioncutlass_1_1Vector.html#abf531676caf85cde1c8df435c1ebe8bb">cutlass::Vector::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar &amp; operator[](uint32_t i)</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:86</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4_html_a023d6ae1bf06d678f8cb5652eca1bf79"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a023d6ae1bf06d678f8cb5652eca1bf79">cutlass::Vector&lt; uint4_t, kLanes_ &gt;::Vector</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Vector(uint32_t value)</div><div class="ttdoc">Constructor to convert from uint32_t type. </div><div class="ttdef"><b>Definition:</b> vector.h:253</div></div>
 <div class="ttc" id="platform_8h_html"><div class="ttname"><a href="platform_8h.html">platform.h</a></div><div class="ttdoc">C++ features that may be otherwise unimplemented for CUDA device functions. </div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html_a56875d7cbf921261e68e1f63212db5bd"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">cutlass::Vector::Scalar</a></div><div class="ttdeci">Scalar_ Scalar</div><div class="ttdoc">The scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:63</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html_a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">cutlass::Vector::kLanes</a></div><div class="ttdef"><b>Definition:</b> vector.h:66</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4_html_a03199df1287d263f7267239c014f1d9b"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">cutlass::Vector&lt; half, kLanes_ &gt;::Scalar</a></div><div class="ttdeci">half Scalar</div><div class="ttdoc">The scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:95</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html_a29dab07949206cc1609543ffcefd1e5a"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">cutlass::Vector::registers</a></div><div class="ttdeci">uint32_t registers[kRegisters]</div><div class="ttdoc">The data in registers. </div><div class="ttdef"><b>Definition:</b> vector.h:80</div></div>
-<div class="ttc" id="structcutlass_1_1VectorTraits_html_a4ac6196c07e0d3ba8a03cd72a05026a2"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">cutlass::VectorTraits::Vector</a></div><div class="ttdeci">Vector&lt; T, 1 &gt; Vector</div><div class="ttdoc">Type that is always a vector. </div><div class="ttdef"><b>Definition:</b> vector.h:192</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4_html_a8ade80e040264fbd669d3f15c249884e"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a8ade80e040264fbd669d3f15c249884e">cutlass::Vector&lt; half, kLanes_ &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_DEVICE Scalar &amp; operator[](uint32_t i)</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:119</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html_a44cc27bf8a7b789b4ae8538155a50156"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a44cc27bf8a7b789b4ae8538155a50156">cutlass::Vector::operator[]</a></div><div class="ttdeci">CUTLASS_DEVICE Scalar &amp; operator[](uint32_t i)</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:85</div></div>
-<div class="ttc" id="structcutlass_1_1VectorTraits_html"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html">cutlass::VectorTraits</a></div><div class="ttdoc">Traits describing properties of vectors and scalar-as-vectors. </div><div class="ttdef"><b>Definition:</b> vector.h:181</div></div>
-<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:145</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:61</div></div>
-<div class="ttc" id="structcutlass_1_1VectorTraits_html_abf96ea5dfd3212d388cb91e48cc0e6a2"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">cutlass::VectorTraits::IsVector</a></div><div class="ttdeci">static bool const IsVector</div><div class="ttdoc">True if the type is actually a cutlass::Vector, otherwise false. </div><div class="ttdef"><b>Definition:</b> vector.h:189</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html_a091080b4e9db9e89734f44ceb985d78f"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">cutlass::Vector::scalars</a></div><div class="ttdeci">Scalar scalars[kLanes]</div><div class="ttdoc">The associated array of scalars. </div><div class="ttdef"><b>Definition:</b> vector.h:78</div></div>
-<div class="ttc" id="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4_html_aff21f15596731eacf8c587811bb4ccdb"><div class="ttname"><a href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Vector</a></div><div class="ttdeci">Vector&lt; T, Lanes &gt; Vector</div><div class="ttdoc">Type that is always a Vector. </div><div class="ttdef"><b>Definition:</b> vector.h:224</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html_abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e"><div class="ttname"><a href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">cutlass::Vector::kVectorSize</a></div><div class="ttdef"><b>Definition:</b> vector.h:68</div></div>
-<div class="ttc" id="structcutlass_1_1VectorTraits_html_a052e1e5963a9e04482b16cb881d1eaf8"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">cutlass::VectorTraits::kLanes</a></div><div class="ttdeci">static int const kLanes</div><div class="ttdoc">Number of lanes of vector. </div><div class="ttdef"><b>Definition:</b> vector.h:186</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4_html_ab0516cef8949f5998b5251cc6b6db683"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ab0516cef8949f5998b5251cc6b6db683">cutlass::Vector&lt; half, kLanes_ &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_DEVICE Scalar const  &amp; operator[](uint32_t i) const</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:115</div></div>
-<div class="ttc" id="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4_html_a6e99dde8432b13472971dc41573a574e"><div class="ttname"><a href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Scalar</a></div><div class="ttdeci">T Scalar</div><div class="ttdoc">Scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:215</div></div>
-<div class="ttc" id="structcutlass_1_1Vectorize_html_a070ec95f4297d769ee53a4d8a650c05e"><div class="ttname"><a href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">cutlass::Vectorize::Type</a></div><div class="ttdeci">Vector&lt; Element_, kLanes_ &gt; Type</div><div class="ttdef"><b>Definition:</b> vector.h:135</div></div>
-<div class="ttc" id="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4_html_aaf35570b10829356762dcec925a5b4bc"><div class="ttname"><a href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Scalar</a></div><div class="ttdeci">T Scalar</div><div class="ttdoc">Scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:199</div></div>
-<div class="ttc" id="structcutlass_1_1Extent_html_a2cb62986b9a7c168bf79b083f33c4bad"><div class="ttname"><a href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">cutlass::Extent::kValue</a></div><div class="ttdeci">static size_t const kValue</div><div class="ttdef"><b>Definition:</b> vector.h:162</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html_a9e9352594fcd022526d5b69b6c25c99c"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c">cutlass::Vector::aligned_</a></div><div class="ttdeci">AlignedStruct&lt; kVectorSize &gt; aligned_</div><div class="ttdoc">The aligned storage to make sure we have good alignment. </div><div class="ttdef"><b>Definition:</b> vector.h:73</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4_html_a9e41dbe541a7dddf1e461e0390fe8896"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">cutlass::Vector&lt; half, kLanes_ &gt;::aligned_</a></div><div class="ttdeci">AlignedStruct&lt; kVectorSize &gt; aligned_</div><div class="ttdoc">The aligned storage to make sure we have good alignment. </div><div class="ttdef"><b>Definition:</b> vector.h:105</div></div>
-<div class="ttc" id="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4_html_a12b9084c48d2d829730f907485dfb5e5"><div class="ttname"><a href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Vector</a></div><div class="ttdeci">Vector&lt; T, Lanes &gt; Vector</div><div class="ttdoc">Type that is always a Vector. </div><div class="ttdef"><b>Definition:</b> vector.h:208</div></div>
-<div class="ttc" id="unioncutlass_1_1Vector_html_a250860c921c94a6077344f9e11bf5b02"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a250860c921c94a6077344f9e11bf5b02">cutlass::Vector::operator[]</a></div><div class="ttdeci">CUTLASS_DEVICE Scalar const  &amp; operator[](uint32_t i) const</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:83</div></div>
-<div class="ttc" id="structcutlass_1_1Extent_html"><div class="ttname"><a href="structcutlass_1_1Extent.html">cutlass::Extent</a></div><div class="ttdoc">Returns the extent of a scalar or vector. </div><div class="ttdef"><b>Definition:</b> vector.h:161</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4_html_a4eab187b6f7650bd88ccd421c8330d3c"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a4eab187b6f7650bd88ccd421c8330d3c">cutlass::Vector&lt; uint4_t, kLanes_ &gt;::aligned_</a></div><div class="ttdeci">AlignedStruct&lt; kVectorSize &gt; aligned_</div><div class="ttdoc">The aligned storage to make sure we have good alignment. </div><div class="ttdef"><b>Definition:</b> vector.h:242</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html_a56875d7cbf921261e68e1f63212db5bd"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a56875d7cbf921261e68e1f63212db5bd">cutlass::Vector::Scalar</a></div><div class="ttdeci">Scalar_ Scalar</div><div class="ttdoc">The scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:64</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html_a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a824f9ab976c8e7f035236af03e5ae839a605c5e987bc7b08d743f29a6524abb27">cutlass::Vector::kLanes</a></div><div class="ttdef"><b>Definition:</b> vector.h:67</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_011_01_4_html_a1e6568c0f3f958db739074ab6978ff10"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#a1e6568c0f3f958db739074ab6978ff10">cutlass::Vector&lt; half, 1 &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar &amp; operator[](uint32_t i)</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:116</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4_html_a03199df1287d263f7267239c014f1d9b"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a03199df1287d263f7267239c014f1d9b">cutlass::Vector&lt; half, kLanes_ &gt;::Scalar</a></div><div class="ttdeci">half Scalar</div><div class="ttdoc">The scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:126</div></div>
+<div class="ttc" id="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4_html_a40dac8fb50ddccb5c1e2a98200ac3a06"><div class="ttname"><a href="structcutlass_1_1Vectorize_3_01Vector_3_01int4__t_00_018_01_4_00_01kLanes___01_4.html#a40dac8fb50ddccb5c1e2a98200ac3a06">cutlass::Vectorize&lt; Vector&lt; int4_t, 8 &gt;, kLanes_ &gt;::Type</a></div><div class="ttdeci">Vector&lt; int4_t, kLanes_ *8 &gt; Type</div><div class="ttdef"><b>Definition:</b> vector.h:285</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html_a29dab07949206cc1609543ffcefd1e5a"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a29dab07949206cc1609543ffcefd1e5a">cutlass::Vector::registers</a></div><div class="ttdeci">uint32_t registers[kRegisters]</div><div class="ttdoc">The data in registers. </div><div class="ttdef"><b>Definition:</b> vector.h:81</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4_html_a8eda6e6181a5333ca8350977374708cb"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a8eda6e6181a5333ca8350977374708cb">cutlass::Vector&lt; bin1_t, kLanes_ &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool operator[](uint32_t i) const</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:186</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4_html_a602530542f526bd151f8a32deda015a1"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a602530542f526bd151f8a32deda015a1">cutlass::Vector&lt; uint4_t, kLanes_ &gt;::Scalar</a></div><div class="ttdeci">uint4_t Scalar</div><div class="ttdoc">The scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:232</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_011_01_4_html_acc698443a38fd0ad63f931bdf172ad99"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_011_01_4.html#acc698443a38fd0ad63f931bdf172ad99">cutlass::Vector&lt; half, 1 &gt;::aligned_</a></div><div class="ttdeci">AlignedStruct&lt; kVectorSize &gt; aligned_</div><div class="ttdoc">The aligned storage to make sure we have good alignment. </div><div class="ttdef"><b>Definition:</b> vector.h:104</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4_html_a05914a7339b9d399ac7d8cf7ef617c31"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a05914a7339b9d399ac7d8cf7ef617c31">cutlass::Vector&lt; bin1_t, kLanes_ &gt;::Scalar</a></div><div class="ttdeci">bin1_t Scalar</div><div class="ttdoc">The scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:163</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4_html_af166f710ebbfdff8a62453eee454c1d5"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af166f710ebbfdff8a62453eee454c1d5">cutlass::Vector&lt; int4_t, kLanes_ &gt;::Vector</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Vector()</div><div class="ttdoc">Default Constructor. </div><div class="ttdef"><b>Definition:</b> vector.h:216</div></div>
+<div class="ttc" id="structcutlass_1_1VectorTraits_html_a4ac6196c07e0d3ba8a03cd72a05026a2"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html#a4ac6196c07e0d3ba8a03cd72a05026a2">cutlass::VectorTraits::Vector</a></div><div class="ttdeci">Vector&lt; T, 1 &gt; Vector</div><div class="ttdoc">Type that is always a vector. </div><div class="ttdef"><b>Definition:</b> vector.h:342</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4_html_a50ae62579267952a648d4b6a6be3c663"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a50ae62579267952a648d4b6a6be3c663">cutlass::Vector&lt; bin1_t, kLanes_ &gt;::Vector</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Vector(uint32_t value)</div><div class="ttdoc">Constructor to convert from uint32_t type. </div><div class="ttdef"><b>Definition:</b> vector.h:184</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4_html_a3891ce1c321a3e57e938c8864de9baf0"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a3891ce1c321a3e57e938c8864de9baf0">cutlass::Vector&lt; half, kLanes_ &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar &amp; operator[](uint32_t i)</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:150</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="numeric__types_8h_html"><div class="ttname"><a href="numeric__types_8h.html">numeric_types.h</a></div></div>
+<div class="ttc" id="structcutlass_1_1VectorTraits_html"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html">cutlass::VectorTraits</a></div><div class="ttdoc">Traits describing properties of vectors and scalar-as-vectors. </div><div class="ttdef"><b>Definition:</b> vector.h:331</div></div>
+<div class="ttc" id="platform_8h_html_adde4c9ea91b753491851361a4198c009"><div class="ttname"><a href="platform_8h.html#adde4c9ea91b753491851361a4198c009">static_assert</a></div><div class="ttdeci">#define static_assert(__e, __m)</div><div class="ttdef"><b>Definition:</b> platform.h:153</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1VectorTraits_html_abf96ea5dfd3212d388cb91e48cc0e6a2"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html#abf96ea5dfd3212d388cb91e48cc0e6a2">cutlass::VectorTraits::IsVector</a></div><div class="ttdeci">static bool const IsVector</div><div class="ttdoc">True if the type is actually a cutlass::Vector, otherwise false. </div><div class="ttdef"><b>Definition:</b> vector.h:339</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html_a091080b4e9db9e89734f44ceb985d78f"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a091080b4e9db9e89734f44ceb985d78f">cutlass::Vector::scalars</a></div><div class="ttdeci">Scalar scalars[kLanes]</div><div class="ttdoc">The associated array of scalars. </div><div class="ttdef"><b>Definition:</b> vector.h:79</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4_html_a1310cf2e92e260cf55cfda1cb2cb7280"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1310cf2e92e260cf55cfda1cb2cb7280">cutlass::Vector&lt; bin1_t, kLanes_ &gt;::Vector</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Vector()</div><div class="ttdoc">Default Constructor. </div><div class="ttdef"><b>Definition:</b> vector.h:182</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4_html_ae2215fe7c2c223175b4172d73a6c7a82"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#ae2215fe7c2c223175b4172d73a6c7a82">cutlass::Vector&lt; uint4_t, kLanes_ &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int operator[](uint32_t i) const</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:255</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4_html_ad6784e347f068ad20af52379286337c0"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#ad6784e347f068ad20af52379286337c0">cutlass::Vector&lt; int4_t, kLanes_ &gt;::aligned_</a></div><div class="ttdeci">AlignedStruct&lt; kVectorSize &gt; aligned_</div><div class="ttdoc">The aligned storage to make sure we have good alignment. </div><div class="ttdef"><b>Definition:</b> vector.h:207</div></div>
+<div class="ttc" id="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4_html_aff21f15596731eacf8c587811bb4ccdb"><div class="ttname"><a href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#aff21f15596731eacf8c587811bb4ccdb">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Vector</a></div><div class="ttdeci">Vector&lt; T, Lanes &gt; Vector</div><div class="ttdoc">Type that is always a Vector. </div><div class="ttdef"><b>Definition:</b> vector.h:374</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html_abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e"><div class="ttname"><a href="unioncutlass_1_1Vector.html#abf0c16b6f9cb8439835ebdb271d58763afaf4b62c6bcafbf961c5570364a0316e">cutlass::Vector::kVectorSize</a></div><div class="ttdef"><b>Definition:</b> vector.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1VectorTraits_html_a052e1e5963a9e04482b16cb881d1eaf8"><div class="ttname"><a href="structcutlass_1_1VectorTraits.html#a052e1e5963a9e04482b16cb881d1eaf8">cutlass::VectorTraits::kLanes</a></div><div class="ttdeci">static int const kLanes</div><div class="ttdoc">Number of lanes of vector. </div><div class="ttdef"><b>Definition:</b> vector.h:336</div></div>
+<div class="ttc" id="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4_html_a6e99dde8432b13472971dc41573a574e"><div class="ttname"><a href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01const_01_4.html#a6e99dde8432b13472971dc41573a574e">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; const &gt;::Scalar</a></div><div class="ttdeci">T Scalar</div><div class="ttdoc">Scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:365</div></div>
+<div class="ttc" id="structcutlass_1_1Vectorize_html_a070ec95f4297d769ee53a4d8a650c05e"><div class="ttname"><a href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">cutlass::Vectorize::Type</a></div><div class="ttdeci">Vector&lt; Element_, kLanes_ &gt; Type</div><div class="ttdef"><b>Definition:</b> vector.h:271</div></div>
+<div class="ttc" id="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4_html_aaf35570b10829356762dcec925a5b4bc"><div class="ttname"><a href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#aaf35570b10829356762dcec925a5b4bc">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Scalar</a></div><div class="ttdeci">T Scalar</div><div class="ttdoc">Scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:349</div></div>
+<div class="ttc" id="structcutlass_1_1uint4__t_html"><div class="ttname"><a href="structcutlass_1_1uint4__t.html">cutlass::uint4_t</a></div><div class="ttdef"><b>Definition:</b> numeric_types.h:43</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4_html_af60049062cedca55d8cb4a3cae82641f"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01int4__t_00_01kLanes___01_4.html#af60049062cedca55d8cb4a3cae82641f">cutlass::Vector&lt; int4_t, kLanes_ &gt;::Scalar</a></div><div class="ttdeci">int4_t Scalar</div><div class="ttdoc">The scalar type. </div><div class="ttdef"><b>Definition:</b> vector.h:197</div></div>
+<div class="ttc" id="structcutlass_1_1Extent_html_a2cb62986b9a7c168bf79b083f33c4bad"><div class="ttname"><a href="structcutlass_1_1Extent.html#a2cb62986b9a7c168bf79b083f33c4bad">cutlass::Extent::kValue</a></div><div class="ttdeci">static size_t const kValue</div><div class="ttdef"><b>Definition:</b> vector.h:312</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html_a9e9352594fcd022526d5b69b6c25c99c"><div class="ttname"><a href="unioncutlass_1_1Vector.html#a9e9352594fcd022526d5b69b6c25c99c">cutlass::Vector::aligned_</a></div><div class="ttdeci">AlignedStruct&lt; kVectorSize &gt; aligned_</div><div class="ttdoc">The aligned storage to make sure we have good alignment. </div><div class="ttdef"><b>Definition:</b> vector.h:74</div></div>
+<div class="ttc" id="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4_html_a9db5873c0d4df1452129022a280247ca"><div class="ttname"><a href="structcutlass_1_1Vectorize_3_01Vector_3_01uint4__t_00_018_01_4_00_01kLanes___01_4.html#a9db5873c0d4df1452129022a280247ca">cutlass::Vectorize&lt; Vector&lt; uint4_t, 8 &gt;, kLanes_ &gt;::Type</a></div><div class="ttdeci">Vector&lt; uint4_t, kLanes_ *8 &gt; Type</div><div class="ttdef"><b>Definition:</b> vector.h:292</div></div>
+<div class="ttc" id="structcutlass_1_1int4__t_html"><div class="ttname"><a href="structcutlass_1_1int4__t.html">cutlass::int4_t</a></div><div class="ttdef"><b>Definition:</b> numeric_types.h:41</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4_html_ad50b5d4acbd7ead82c128091c9db9113"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#ad50b5d4acbd7ead82c128091c9db9113">cutlass::Vector&lt; half, kLanes_ &gt;::operator[]</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Scalar const  &amp; operator[](uint32_t i) const</div><div class="ttdoc">Accessor to the ith lane. </div><div class="ttdef"><b>Definition:</b> vector.h:146</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4_html_a9e41dbe541a7dddf1e461e0390fe8896"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01half_00_01kLanes___01_4.html#a9e41dbe541a7dddf1e461e0390fe8896">cutlass::Vector&lt; half, kLanes_ &gt;::aligned_</a></div><div class="ttdeci">AlignedStruct&lt; kVectorSize &gt; aligned_</div><div class="ttdoc">The aligned storage to make sure we have good alignment. </div><div class="ttdef"><b>Definition:</b> vector.h:136</div></div>
+<div class="ttc" id="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4_html_a12b9084c48d2d829730f907485dfb5e5"><div class="ttname"><a href="structcutlass_1_1VectorTraits_3_01Vector_3_01T_00_01Lanes_01_4_01_4.html#a12b9084c48d2d829730f907485dfb5e5">cutlass::VectorTraits&lt; Vector&lt; T, Lanes &gt; &gt;::Vector</a></div><div class="ttdeci">Vector&lt; T, Lanes &gt; Vector</div><div class="ttdoc">Type that is always a Vector. </div><div class="ttdef"><b>Definition:</b> vector.h:358</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4_html_a48e193a0b636934ea553c6e60ffef563"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01uint4__t_00_01kLanes___01_4.html#a48e193a0b636934ea553c6e60ffef563">cutlass::Vector&lt; uint4_t, kLanes_ &gt;::Vector</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Vector()</div><div class="ttdoc">Default Constructor. </div><div class="ttdef"><b>Definition:</b> vector.h:251</div></div>
+<div class="ttc" id="structcutlass_1_1Extent_html"><div class="ttname"><a href="structcutlass_1_1Extent.html">cutlass::Extent</a></div><div class="ttdoc">Returns the extent of a scalar or vector. </div><div class="ttdef"><b>Definition:</b> vector.h:311</div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4_html_a1df3324868465331db13bd7775b55e87"><div class="ttname"><a href="unioncutlass_1_1Vector_3_01bin1__t_00_01kLanes___01_4.html#a1df3324868465331db13bd7775b55e87">cutlass::Vector&lt; bin1_t, kLanes_ &gt;::aligned_</a></div><div class="ttdeci">AlignedStruct&lt; kVectorSize &gt; aligned_</div><div class="ttdoc">The aligned storage to make sure we have good alignment. </div><div class="ttdef"><b>Definition:</b> vector.h:173</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__epilogue__traits_8h.html b/docs/wmma__gemm__epilogue__traits_8h.html
index 31a795945..04fa7bf4b 100644
--- a/docs/wmma__gemm__epilogue__traits_8h.html
+++ b/docs/wmma__gemm__epilogue__traits_8h.html
@@ -79,13 +79,13 @@ $(function() {
 
 <p>Defines structural properties of WMMA GEMM's epilogue phase.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="wmma__matrix_8h_source.html">cutlass/wmma_matrix.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="wmma__matrix_8h_source.html">cutlass/wmma_matrix.h</a>&quot;</code><br />
 </div>
 <p><a href="wmma__gemm__epilogue__traits_8h_source.html">Go to the source code of this file.</a></p>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__epilogue__traits_8h_source.html b/docs/wmma__gemm__epilogue__traits_8h_source.html
index 92d9abc1e..967f4d13b 100644
--- a/docs/wmma__gemm__epilogue__traits_8h_source.html
+++ b/docs/wmma__gemm__epilogue__traits_8h_source.html
@@ -76,19 +76,19 @@ $(function() {
 <div class="title">wmma_gemm_epilogue_traits.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="wmma__gemm__epilogue__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="wmma__matrix_8h.html">cutlass/wmma_matrix.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__stream_8h.html">cutlass/gemm/gemm_global_stream.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__stream_8h.html">cutlass/gemm/gemm_shared_stream.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="linear__scaling_8h.html">cutlass/gemm/linear_scaling.h</a>&gt;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="wmma__gemm__global__tile_8h.html">cutlass/gemm/wmma_gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="wmma__gemm__shared__tile_8h.html">cutlass/gemm/wmma_gemm_shared_tile.h</a>&gt;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&gt;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> EpilogueFunctor_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">struct </span>WmmaGemmEpilogueTraitsHelper {</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> EpilogueFunctor_::Scalar Scalar;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::OutputTile OutputTile;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kWmmasPerH =</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;      GemmConfig_::AccumulatorsPerWarp::kH / GemmConfig_::InstructionShape::kH;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, 1, kWmmasPerH&gt; Iterations;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="comment">// The iteration strides in the H/W dimension.</span></div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, 0, 0&gt; Delta;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="keyword">typedef</span> EpilogueFunctor_ Functor;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedStoreTileDTraits&lt;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;      <span class="comment">// The output layout.</span></div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;      <span class="keyword">typename</span> Functor::Scalar,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;                     Scalar,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  <span class="keyword">typedef</span> TileStoreIterator&lt;SharedStoreTileTraits,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                            <span class="keyword">typename</span> SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>,</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;                            Index_,</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;                            WmmaMatrix,</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">IteratorFragment::kWmmaMatrix</a>&gt;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      SharedStoreIteratorD;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename SharedStoreIteratorD::Fragment&gt; SharedStoreTransformerD;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileDTraits&lt;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;      <span class="keyword">typename</span> Functor::Scalar,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;      <span class="comment">// The tile size.</span></div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;      <span class="keyword">typename</span> SharedStoreIteratorD::Tile,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;      <span class="comment">// The number of threads.</span></div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;      Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      GemmConfig_::kScalarsPerLdsD&gt;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  <span class="keyword">typedef</span> TileLoadIterator&lt;SharedLoadTileTraits,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;                           <span class="keyword">typename</span> SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;      SharedLoadIteratorD;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <span class="keyword">typedef</span> WmmaGemmGlobalIteratorCdTraits&lt;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;      <span class="keyword">typename</span> GemmConfig_::ScalarC <span class="keyword">const</span>,</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;      <span class="comment">// The tile has size (N / Iterations)xM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;            GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;            GemmConfig_::OutputTile::kW&gt;,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;      Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;      GemmConfig_::kScalarsPerLdgC&gt;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      GlobalLoadTileTraits;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  <span class="keyword">typedef</span> WmmaGemmGlobalIteratorCd&lt;GlobalLoadTileTraits, Index_&gt; GlobalLoadIteratorC;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename GlobalLoadIteratorC::Fragment&gt; GlobalTransformerC;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  <span class="keyword">typedef</span> WmmaGemmGlobalIteratorCdTraits&lt;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      <span class="keyword">typename</span> GemmConfig_::ScalarD,</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <span class="comment">// The tile has size (N / Iterations)xM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;            GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;            GemmConfig_::OutputTile::kW&gt;,</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      GemmConfig_::kScalarsPerStgD&gt;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;      GlobalStoreTileTraits;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  <span class="keyword">typedef</span> WmmaGemmGlobalIteratorCd&lt;GlobalStoreTileTraits, Index_&gt; GlobalStoreIteratorD;</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename GlobalStoreIteratorD::Fragment&gt; GlobalTransformerD;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;};</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="wmma__matrix_8h_html"><div class="ttname"><a href="wmma__matrix_8h.html">wmma_matrix.h</a></div><div class="ttdoc">Abstractions for loading and storing matrices using the CUDA WMMA API. </div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
+<a href="wmma__gemm__epilogue__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="wmma__matrix_8h.html">cutlass/wmma_matrix.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__stream_8h.html">cutlass/gemm/gemm_global_stream.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__stream_8h.html">cutlass/gemm/gemm_shared_stream.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="linear__scaling_8h.html">cutlass/gemm/linear_scaling.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="wmma__gemm__global__tile_8h.html">cutlass/gemm/wmma_gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="wmma__gemm__shared__tile_8h.html">cutlass/gemm/wmma_gemm_shared_tile.h</a>&quot;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tile__iterator_8h.html">cutlass/tile_iterator.h</a>&quot;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> EpilogueFunctor_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">struct </span>WmmaGemmEpilogueTraitsHelper {</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> EpilogueFunctor_::Scalar Scalar;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::OutputTile OutputTile;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kWmmasPerH =</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;      GemmConfig_::AccumulatorsPerWarp::kH / GemmConfig_::InstructionShape::kH;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, 1, kWmmasPerH&gt; Iterations;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="comment">// The iteration strides in the H/W dimension.</span></div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, 0, 0&gt; Delta;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="keyword">typedef</span> EpilogueFunctor_ Functor;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedStoreTileDTraits&lt;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;      <span class="comment">// The output layout.</span></div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;      <span class="keyword">typename</span> Functor::Scalar,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;      <span class="keyword">typename</span> GemmConfig_::OutputTile,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;                     Scalar,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;  <span class="keyword">typedef</span> TileStoreIterator&lt;SharedStoreTileTraits,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                            <span class="keyword">typename</span> SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>,</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;                            Index_,</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;                            WmmaMatrix,</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;                            <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>&gt;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;      SharedStoreIteratorD;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename SharedStoreIteratorD::Fragment&gt; SharedStoreTransformerD;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileDTraits&lt;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;      <span class="keyword">typename</span> Functor::Scalar,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;      <span class="comment">// The tile size.</span></div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;      <span class="keyword">typename</span> SharedStoreIteratorD::Tile,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;      <span class="comment">// The number of threads.</span></div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;      Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;      <span class="comment">// The number of scalars per LDS.</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      GemmConfig_::kScalarsPerLdsD&gt;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  <span class="keyword">typedef</span> TileLoadIterator&lt;SharedLoadTileTraits,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;                           <span class="keyword">typename</span> SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;      SharedLoadIteratorD;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <span class="keyword">typedef</span> SharedLoadStream&lt;SharedLoadIteratorD&gt; SharedLoadStreamD;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <span class="keyword">typedef</span> WmmaGemmGlobalIteratorCdTraits&lt;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;      <span class="keyword">typename</span> GemmConfig_::ScalarC <span class="keyword">const</span>,</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;      <span class="comment">// The tile has size (N / Iterations)xM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;            GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;            GemmConfig_::OutputTile::kW&gt;,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      GemmConfig_::kScalarsPerLdgC&gt;</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      GlobalLoadTileTraits;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="keyword">typedef</span> WmmaGemmGlobalIteratorCd&lt;GlobalLoadTileTraits, Index_&gt; GlobalLoadIteratorC;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename GlobalLoadIteratorC::Fragment&gt; GlobalTransformerC;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  <span class="keyword">typedef</span> WmmaGemmGlobalIteratorCdTraits&lt;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      <span class="comment">// The pointer is float.</span></div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;      <span class="keyword">typename</span> GemmConfig_::ScalarD,</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;      <span class="comment">// The tile has size (N / Iterations)xM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;            GemmConfig_::OutputTile::kH / <a class="code" href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">ShapeCount&lt;Iterations&gt;::kCount</a>,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;            GemmConfig_::OutputTile::kW&gt;,</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;      Shape&lt;1, ShapeCount&lt;typename GemmConfig_::Warps&gt;::kCount, GemmConfig_::kWarpSize&gt;,</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;      GemmConfig_::kScalarsPerStgD&gt;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      GlobalStoreTileTraits;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;  <span class="keyword">typedef</span> WmmaGemmGlobalIteratorCd&lt;GlobalStoreTileTraits, Index_&gt; GlobalStoreIteratorD;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename GlobalStoreIteratorD::Fragment&gt; GlobalTransformerD;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;};</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="wmma__matrix_8h_html"><div class="ttname"><a href="wmma__matrix_8h.html">wmma_matrix.h</a></div><div class="ttdoc">Abstractions for loading and storing matrices using the CUDA WMMA API. </div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="tile__iterator_8h_html"><div class="ttname"><a href="tile__iterator_8h.html">tile_iterator.h</a></div><div class="ttdoc">Defines the Tile Traits concept and iterators for loading and storing to tiles efficiently. </div></div>
 <div class="ttc" id="linear__scaling_8h_html"><div class="ttname"><a href="linear__scaling_8h.html">linear_scaling.h</a></div><div class="ttdoc">Implements the BLAS linear scaling function alpha*AB + beta*C. </div></div>
 <div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentElementType_html_a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd"><div class="ttname"><a href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">cutlass::FragmentElementType::kWmmaMatrix</a></div><div class="ttdef"><b>Definition:</b> load_store.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
-<div class="ttc" id="structcutlass_1_1IteratorFragment_html_ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419"><div class="ttname"><a href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">cutlass::IteratorFragment::kWmmaMatrix</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:67</div></div>
 <div class="ttc" id="wmma__gemm__global__tile_8h_html"><div class="ttname"><a href="wmma__gemm__global__tile_8h.html">wmma_gemm_global_tile.h</a></div><div class="ttdoc">Defines tile iterator traits for loading thread block-level tile from global memory. </div></div>
 <div class="ttc" id="structcutlass_1_1ShapeCount_html_a8d25b48b3294b5563f89c62a6e6d00e5"><div class="ttname"><a href="structcutlass_1_1ShapeCount.html#a8d25b48b3294b5563f89c62a6e6d00e5">cutlass::ShapeCount::kCount</a></div><div class="ttdeci">static int const kCount</div><div class="ttdoc">The number of elements in the 4D space. </div><div class="ttdef"><b>Definition:</b> shape.h:91</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
 <div class="ttc" id="gemm__global__stream_8h_html"><div class="ttname"><a href="gemm__global__stream_8h.html">gemm_global_stream.h</a></div><div class="ttdoc">Implements efficient loading of the thread block-level tile from global memory and storing to shared ...</div></div>
 <div class="ttc" id="gemm__shared__stream_8h_html"><div class="ttname"><a href="gemm__shared__stream_8h.html">gemm_shared_stream.h</a></div><div class="ttdoc">Defines abstractions for managing loading and storing fragments to shared memory in the efficient GEM...</div></div>
 <div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
@@ -96,7 +96,7 @@ $(function() {
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__global__tile_8h.html b/docs/wmma__gemm__global__tile_8h.html
index 6c8b116f0..4017be066 100644
--- a/docs/wmma__gemm__global__tile_8h.html
+++ b/docs/wmma__gemm__global__tile_8h.html
@@ -82,7 +82,7 @@ $(function() {
 
 <p>Defines tile iterator traits for loading thread block-level tile from global memory.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="gemm__global__tile_8h_source.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</code><br />
 </div>
 <p><a href="wmma__gemm__global__tile_8h_source.html">Go to the source code of this file.</a></p>
 <table class="memberdecls">
@@ -109,7 +109,7 @@ Namespaces</h2></td></tr>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__global__tile_8h_source.html b/docs/wmma__gemm__global__tile_8h_source.html
index 4e58863d4..93259adfd 100644
--- a/docs/wmma__gemm__global__tile_8h_source.html
+++ b/docs/wmma__gemm__global__tile_8h_source.html
@@ -76,65 +76,71 @@ $(function() {
 <div class="title">wmma_gemm_global_tile.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="wmma__gemm__global__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html">WmmaGemmGlobalIteratorCdTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;GemmOperand::kC,</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;                                                                    MatrixLayout::kColumnMajor,</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;                                                                    Scalar_,</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;                                                                    Tile_,</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;                                                                    Threads_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;                                                                    kAccessSize_&gt; {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;                               <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;                               Scalar_,</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;                               Tile_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;                               Threads_,</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;                               kAccessSize_&gt;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86">   51</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86">Base</a>;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002">   54</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Base::Delta::kW, Base::Delta::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002">Delta</a>;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html">   57</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68">   59</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Base::Threads::kW;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Base::Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Base::ThreadsDelta::kW</a>;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    }</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  };</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;};</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> TileTraits_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">   71</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;TileTraits_,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                                                          typename TileTraits_::Scalar,</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;                                                          IteratorAdvance::kH,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                                                          MemorySpace::kGlobal,</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;                                                          Index_&gt; {</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">   77</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd&lt;TileTraits_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">This_</a>;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">   79</a></span>&#160;  <span class="keyword">typedef</span> TileTraits_ <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html">TileIteratorBase</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a>,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;                           <span class="keyword">typename</span> TileTraits_::Scalar,</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">MemorySpace::kGlobal</a>,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;                           Index_&gt;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b">   86</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b">Base</a>;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">   88</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Base::Delta::kW, Base::Delta::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">   90</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">kLayout</a> = TileTraits_::kLayout;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">   93</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">Scalar</a>;</div><div class="line"><a name="l00095"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">   95</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Pointer <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a>;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">   97</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Threads <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">Threads</a>;</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">   99</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>;</div><div class="line"><a name="l00101"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">  101</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::ThreadOffset <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a>;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">  104</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">Params</a> {</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">  106</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a>;</div><div class="line"><a name="l00108"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007">  108</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007">stride_h</a>;</div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">  110</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">inc_h</a>, <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8">inc_advance</a>;</div><div class="line"><a name="l00112"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">  112</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">predicate_offset</a>;</div><div class="line"><a name="l00114"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">  114</a></span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">predicate_inc_h</a>, <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248">predicate_inc_advance</a>;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#ad6b65c5f3ed7cd9e7ffeb684cbf30d04">  117</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#ad6b65c5f3ed7cd9e7ffeb684cbf30d04">initialize</a>(</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;        <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a>, <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> ld, <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> n, <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> epilogue_stride_w, <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a> epilogue_delta_w) {</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;      this-&gt;pointer = <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a>;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;      <span class="comment">// Setup the base stride. One &quot;group of threads&quot; per column.</span></div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007">stride_h</a> = ld;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;      <span class="comment">// Each thread output 1 column per iteration. .</span></div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">inc_h</a> = ld * TileTraits_::Threads::kH;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8">inc_advance</a> = <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">inc_h</a> + epilogue_stride_w;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">predicate_offset</a> = n;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">predicate_inc_h</a> = TileTraits_::Threads::kH;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248">predicate_inc_advance</a> = <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">predicate_inc_h</a> + epilogue_delta_w;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="comment">// It worked.</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    }</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;  };</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">  136</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">Params</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">  138</a></span>&#160;  <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">thread_offset</a>;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a505f124fa3f47c6d57b7275e81be6dd3">  141</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a505f124fa3f47c6d57b7275e81be6dd3">WmmaGemmGlobalIteratorCd</a>() {}</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">  144</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">WmmaGemmGlobalIteratorCd</a>(<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>,</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;                                          <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;                                          <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; block,</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;                                          <span class="keywordtype">int</span> <span class="keyword">const</span> pointer_offset = 0,</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;                                          <span class="keywordtype">int</span> <span class="keyword">const</span> pred_offset = 0,</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;                                          <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a>())</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      : <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>(<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>) {</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">thread_offset</a> = thread_offset_func();</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    <span class="comment">// Each warp works on a different column of the tile.</span></div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> h = <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">thread_offset</a>[1] + block[1];</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <span class="comment">// Each lane writes a different element.</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> w = <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">thread_offset</a>[2] + block[2];</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="comment">// Setup the pointer.</span></div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    this-&gt;params.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a> += ((h * <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007">stride_h</a> + w) + pointer_offset);</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    <span class="comment">// Prepare the vector of predicates.</span></div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Base::Iterations::kW; ++i) {</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">set</a>(i, w + i * Base::Delta::kW &lt; bounds[2]);</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    }</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    this-&gt;params.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">predicate_offset</a> -= (h + pred_offset);</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  }</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div><div class="line"><a name="l00168"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a44287250bf5631a490b514859fd101d1">  168</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a44287250bf5631a490b514859fd101d1">inc_c</a>() {}</div><div class="line"><a name="l00170"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aec2d692967d9be5d42673dfde21f5427">  170</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aec2d692967d9be5d42673dfde21f5427">inc_w</a>() {}</div><div class="line"><a name="l00172"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa9a733f35e9be67663c9c8f80b0034d4">  172</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa9a733f35e9be67663c9c8f80b0034d4">inc_h</a>() {</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">inc_h</a>;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">predicate_offset</a> -= <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">predicate_inc_h</a>;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  }</div><div class="line"><a name="l00177"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab1ebbe54e4315ac07daf260a88f41d04">  177</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab1ebbe54e4315ac07daf260a88f41d04">inc_d</a>() {}</div><div class="line"><a name="l00179"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a174ae7d8aa0664eaf1d6f63c5606baa0">  179</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a174ae7d8aa0664eaf1d6f63c5606baa0">inc_advance</a>() {</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a> += <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8">inc_advance</a>;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">predicate_offset</a> -= <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248">predicate_inc_advance</a>;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;  }</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;</div><div class="line"><a name="l00185"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a468f8f503777e4a2b0089ee2bd6c471a">  185</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">bool</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a468f8f503777e4a2b0089ee2bd6c471a">valid</a>(<span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa">predicates</a>.<a class="code" href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">at</a>(w) &amp;&amp; <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">predicate_offset</a> &gt; 0;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  }</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00191"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afe77778a126449e210c0bd6ec2dc6709">  191</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afe77778a126449e210c0bd6ec2dc6709">data</a>() { <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a>; }</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00194"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a90e9886534ecbbce69f57b4030d0903f">  194</a></span>&#160;  <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a90e9886534ecbbce69f57b4030d0903f">data</a>()<span class="keyword"> const </span>{ <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">params</a>.<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">pointer</a>; }</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div><div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa">  197</a></span>&#160;  <a class="code" href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector&lt;Base::Iterations::kW&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa">predicates</a>;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;};</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_aeb866237318ac7983e554a08395c5125"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">cutlass::gemm::WmmaGemmGlobalIteratorCd::Threads</a></div><div class="ttdeci">TileTraits_::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:97</div></div>
+<a href="wmma__gemm__global__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kAccessSize_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html">WmmaGemmGlobalIteratorCdTraits</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;GemmOperand::kC,</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;                                                                    MatrixLayout::kColumnMajor,</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;                                                                    Scalar_,</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;                                                                    Tile_,</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;                                                                    Threads_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;                                                                    kAccessSize_&gt; {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">GemmGlobalTileTraits</a>&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;                               <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;                               Scalar_,</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;                               Tile_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;                               Threads_,</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;                               kAccessSize_&gt;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86">   51</a></span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86">Base</a>;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002">   54</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Base::Delta::kW, Base::Delta::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002">Delta</a>;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html">   57</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html">ThreadOffset</a> {</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00059"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68">   59</a></span>&#160;    <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68">operator()</a>()<span class="keyword"> const </span>{</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;      <span class="keywordtype">int</span> thread_offset_h = threadIdx.x / Base::Threads::kW;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;      <span class="keywordtype">int</span> thread_offset_w = threadIdx.x % Base::Threads::kW * <a class="code" href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">Base::ThreadsDelta::kW</a>;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, thread_offset_h, thread_offset_w, 0);</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    }</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  };</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;};</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> TileTraits_, <span class="keyword">typename</span> Index_ = <span class="keywordtype">int</span>&gt;</div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">   71</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd</a>&lt;TileTraits_, Index_&gt; {</div><div class="line"><a name="l00073"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">   73</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">WmmaGemmGlobalIteratorCd&lt;TileTraits_, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">This_</a>;</div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">   75</a></span>&#160;  <span class="keyword">typedef</span> TileTraits_ <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">Traits</a>;</div><div class="line"><a name="l00077"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aea87c73ae2d4e027014ebd4d8141c89e">   77</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">GemmGlobalIteratorCd&lt;Traits, Index_&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aea87c73ae2d4e027014ebd4d8141c89e">Base</a>;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">   79</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1Shape.html">Shape&lt;0, 0, Base::Delta::kW, Base::Delta::kC&gt;</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">ImmediateOffsetStrides</a>;</div><div class="line"><a name="l00081"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">   81</a></span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">kLayout</a> = TileTraits_::kLayout;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">   84</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Scalar <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">Scalar</a>;</div><div class="line"><a name="l00086"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">   86</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Pointer <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">Pointer</a>;</div><div class="line"><a name="l00088"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">   88</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::Threads <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">Threads</a>;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">   90</a></span>&#160;  <span class="keyword">typedef</span> Index_ <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">Index</a>;</div><div class="line"><a name="l00092"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">   92</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> TileTraits_::ThreadOffset <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a>;</div><div class="line"><a name="l00094"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8">   94</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">Base::Params</a> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8">BaseParams</a>;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">   97</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">Params</a> : <span class="keyword">public</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">BaseParams</a> {</div><div class="line"><a name="l00099"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a98867f4fc4daf790e309f8365e71cc8f">   99</a></span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">int</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a98867f4fc4daf790e309f8365e71cc8f">initialize</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">Pointer</a> <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>,</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;                                       <span class="keywordtype">long</span> <span class="keywordtype">long</span> batch_stride,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> ldm,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> n,</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_stride_w,</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;                                       <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">Index</a> epilogue_delta_w) {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">BaseParams::pointer</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">pointer</a>;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;      <span class="comment">// Stride between GEMMs</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">BaseParams::stride_d</a> = batch_stride;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;      <span class="comment">// Setup the base stride. One &quot;group of threads&quot; per column.</span></div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">BaseParams::stride_h</a> = ldm;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;      <span class="comment">// Each thread output 1 column per iteration. .</span></div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">BaseParams::inc_h</a> = ldm * TileTraits_::Threads::kH;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">BaseParams::inc_advance</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">BaseParams::inc_h</a> + epilogue_stride_w;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">BaseParams::predicate_offset</a> = n;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">BaseParams::predicate_inc_h</a> = TileTraits_::Threads::kH;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;      <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">BaseParams::predicate_inc_advance</a> = <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">BaseParams::predicate_inc_h</a> + epilogue_delta_w;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;      <span class="keywordflow">return</span> 0;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    }</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  };</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div><div class="line"><a name="l00124"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">  124</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">WmmaGemmGlobalIteratorCd</a>(<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">Params</a> <span class="keyword">const</span>&amp; <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>,</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;                                          <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; bounds,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;                                          <span class="keyword">const</span> <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a>&amp; block,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;                                          <span class="keywordtype">int</span> <span class="keyword">const</span> pointer_offset = 0,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                                          <span class="keywordtype">int</span> <span class="keyword">const</span> pred_offset = 0,</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;                                          <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">ThreadOffset</a> thread_offset_func = <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">ThreadOffset</a>())</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      : <a class="code" href="structcutlass_1_1TileIteratorBase.html">Base</a>(<a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">params</a>, bounds, block, pointer_offset, pred_offset, thread_offset_func) {}</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div><div class="line"><a name="l00134"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a109209936a9453e8f1f3f5eecfd6afca">  134</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a109209936a9453e8f1f3f5eecfd6afca">load_element</a>(</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a>&amp; value, <span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c)<span class="keyword"> const </span>{</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">Base::load_element</a>(value, d, h, w, c);</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  }</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a051eb2a8637601cf9c1f52999117151b">  140</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a051eb2a8637601cf9c1f52999117151b">store_element</a>(</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      <span class="keyword">typename</span> <a class="code" href="unioncutlass_1_1Vector.html">Base::AccessType</a> <span class="keyword">const</span>&amp; value, <span class="keywordtype">int</span> d, <span class="keywordtype">int</span> h, <span class="keywordtype">int</span> w, <span class="keywordtype">int</span> c) {</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keywordtype">int</span> <span class="keyword">const</span> offset =</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;        <a class="code" href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">ComputeOffsetFromStrides&lt;typename Base::ImmediateOffsetStrides&gt;::get</a>(d, h, w, 0);</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <a class="code" href="structcutlass_1_1Store.html">Store</a>&lt;<a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">Scalar</a>,</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">Base::kAccessSize</a>,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">Base::kMemorySpace</a>,</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;          <a class="code" href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">Base::kFragmentElementType</a>,</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;          <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">Base::FragmentElement</a>,</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;          Base::Tile::kW&gt;::store(value, <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">Base::params</a>.pointer, offset);</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  }</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00154"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae2febd768cbbfb8aab3c2cb669c0505d">  154</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae2febd768cbbfb8aab3c2cb669c0505d">load_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&amp; fragment) {</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">Base::load_post_increment</a>(fragment);</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;  }</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a018d5be34cdbb263d7f133197b2921ca">  159</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a018d5be34cdbb263d7f133197b2921ca">store_post_increment</a>(<a class="code" href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">Fragment</a>&amp; fragment) {</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    <a class="code" href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">Base::store_post_increment</a>(fragment);</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  }</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;};</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_aeb866237318ac7983e554a08395c5125"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aeb866237318ac7983e554a08395c5125">cutlass::gemm::WmmaGemmGlobalIteratorCd::Threads</a></div><div class="ttdeci">TileTraits_::Threads Threads</div><div class="ttdoc">The threads. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a8c2618ac16362a8362dcddeed71c41d4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a8c2618ac16362a8362dcddeed71c41d4">cutlass::gemm::GemmGlobalIteratorCd::Params::inc_advance</a></div><div class="ttdeci">Index inc_advance</div><div class="ttdoc">The strides to increment the pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:434</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a56847e834b31b88544093c3df54d299f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a56847e834b31b88544093c3df54d299f">cutlass::gemm::GemmGlobalIteratorCd::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:421</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html_a98867f4fc4daf790e309f8365e71cc8f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a98867f4fc4daf790e309f8365e71cc8f">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Pointer pointer, long long batch_stride, Index ldm, Index n, Index epilogue_stride_w, Index epilogue_delta_w)</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:99</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalTileTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalTileTraits.html">cutlass::gemm::GemmGlobalTileTraits</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_ac8eca7087d1f7575b0c6beeb5f907bfd"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#ac8eca7087d1f7575b0c6beeb5f907bfd">cutlass::PredicateVector::at</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE bool at(int idx) const</div><div class="ttdoc">Accesses a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:356</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_ab1ebbe54e4315ac07daf260a88f41d04"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab1ebbe54e4315ac07daf260a88f41d04">cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_d</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_d()</div><div class="ttdoc">Increment the pointer in the D dimension. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:177</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03cac4bd4070cc396d698beb7ca2e3bbff37">cutlass::MemorySpace::kGlobal</a></div><div class="ttdef"><b>Definition:</b> load_store.h:43</div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html_a5cff0436eed0fefa2957ad6d083ed007"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5cff0436eed0fefa2957ad6d083ed007">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdoc">The stride in the H dimension to setup the thread in the block. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:108</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_aec2d692967d9be5d42673dfde21f5427"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aec2d692967d9be5d42673dfde21f5427">cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_w</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_w()</div><div class="ttdoc">Increment the pointer in the W dimension. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:170</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a3f45216454a550a116935aede0bda3de"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">cutlass::gemm::WmmaGemmGlobalIteratorCd::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:99</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_ab9979f3f1f6d31e1466780c5777de25e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">cutlass::gemm::WmmaGemmGlobalIteratorCd::Scalar</a></div><div class="ttdeci">TileTraits_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:93</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a0ad4218ad2c10641379b236473e79e84"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a0ad4218ad2c10641379b236473e79e84">cutlass::gemm::WmmaGemmGlobalIteratorCd::params</a></div><div class="ttdeci">Params params</div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:136</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html_a5b8177a936ba30a3d68ca238aaf76ff6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a5b8177a936ba30a3d68ca238aaf76ff6">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::predicate_inc_h</a></div><div class="ttdeci">Index predicate_inc_h</div><div class="ttdoc">The strides to increment the predicate offset. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:114</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html_aa42c4e7419308926b925909e6a5c719d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa42c4e7419308926b925909e6a5c719d">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::pointer</a></div><div class="ttdeci">Pointer pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:106</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a90e9886534ecbbce69f57b4030d0903f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a90e9886534ecbbce69f57b4030d0903f">cutlass::gemm::WmmaGemmGlobalIteratorCd::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Pointer const data() const</div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:194</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a174ae7d8aa0664eaf1d6f63c5606baa0"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a174ae7d8aa0664eaf1d6f63c5606baa0">cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_advance</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_advance()</div><div class="ttdoc">Increment the pointer to move to the next iteration. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:179</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:104</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html_a6306f771718c0c05276e103f30f862b2"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a6306f771718c0c05276e103f30f862b2">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::inc_h</a></div><div class="ttdeci">Index inc_h</div><div class="ttdoc">The strides to increment the pointer. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:110</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a48a8eda430139e6a131654a54bbf0f3b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a48a8eda430139e6a131654a54bbf0f3b">cutlass::gemm::WmmaGemmGlobalIteratorCd::Base</a></div><div class="ttdeci">TileIteratorBase&lt; Traits, typename TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:86</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a505f124fa3f47c6d57b7275e81be6dd3"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a505f124fa3f47c6d57b7275e81be6dd3">cutlass::gemm::WmmaGemmGlobalIteratorCd::WmmaGemmGlobalIteratorCd</a></div><div class="ttdeci">CUTLASS_DEVICE WmmaGemmGlobalIteratorCd()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:141</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html_a38f13119cf3111e84914f1bef6f5d985"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a38f13119cf3111e84914f1bef6f5d985">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::predicate_offset</a></div><div class="ttdeci">Index predicate_offset</div><div class="ttdoc">The column offset to compute the predicate for the columns. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:112</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_aea87c73ae2d4e027014ebd4d8141c89e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aea87c73ae2d4e027014ebd4d8141c89e">cutlass::gemm::WmmaGemmGlobalIteratorCd::Base</a></div><div class="ttdeci">GemmGlobalIteratorCd&lt; Traits, Index_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:77</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a109209936a9453e8f1f3f5eecfd6afca"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a109209936a9453e8f1f3f5eecfd6afca">cutlass::gemm::WmmaGemmGlobalIteratorCd::load_element</a></div><div class="ttdeci">CUTLASS_DEVICE void load_element(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</div><div class="ttdoc">Loads a single fragment element from memory. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:134</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a9ffa12dcd7ed1e96845e1cd273d9f219"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a9ffa12dcd7ed1e96845e1cd273d9f219">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::Fragment</a></div><div class="ttdeci">Fragment&lt; FragmentElement, ShapeCount&lt; Iterations &gt;::kCount *kAccessSize &gt; Fragment</div><div class="ttdoc">The fragment. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:196</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_afd2bed46f4cf04aaf331fb2ecae953f8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afd2bed46f4cf04aaf331fb2ecae953f8">cutlass::gemm::WmmaGemmGlobalIteratorCd::BaseParams</a></div><div class="ttdeci">Base::Params BaseParams</div><div class="ttdoc">Base parameters. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:94</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a36afe18f94aacd0746c8946866371d3c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a36afe18f94aacd0746c8946866371d3c">cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_h</a></div><div class="ttdeci">Index predicate_inc_h</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:436</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a3f45216454a550a116935aede0bda3de"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a3f45216454a550a116935aede0bda3de">cutlass::gemm::WmmaGemmGlobalIteratorCd::Index</a></div><div class="ttdeci">Index_ Index</div><div class="ttdoc">The index. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_ab9979f3f1f6d31e1466780c5777de25e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab9979f3f1f6d31e1466780c5777de25e">cutlass::gemm::WmmaGemmGlobalIteratorCd::Scalar</a></div><div class="ttdeci">TileTraits_::Scalar Scalar</div><div class="ttdoc">The scalar. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:84</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a1a587af6edd528a02679c0decc31cdd1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a1a587af6edd528a02679c0decc31cdd1">cutlass::gemm::GemmGlobalIteratorCd::load_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_post_increment(Fragment &amp;fragment)</div><div class="ttdoc">Loads and increments iterator. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:575</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_ae2febd768cbbfb8aab3c2cb669c0505d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae2febd768cbbfb8aab3c2cb669c0505d">cutlass::gemm::WmmaGemmGlobalIteratorCd::load_post_increment</a></div><div class="ttdeci">CUTLASS_DEVICE void load_post_increment(Fragment &amp;fragment)</div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:154</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1Store_html"><div class="ttname"><a href="structcutlass_1_1Store.html">cutlass::Store</a></div><div class="ttdef"><b>Definition:</b> load_store.h:178</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a2b5d2b02d241e89677c41eb658ace129"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a2b5d2b02d241e89677c41eb658ace129">cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_inc_advance</a></div><div class="ttdeci">Index predicate_inc_advance</div><div class="ttdoc">The strides to increment the predicate offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:436</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:97</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_af405f6c5f0bd8f04487d8a7f41dc1826"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#af405f6c5f0bd8f04487d8a7f41dc1826">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::kFragmentElementType</a></div><div class="ttdeci">static FragmentElementType::Kind const kFragmentElementType</div><div class="ttdoc">Specifies iterator storage fragment type (Scalar or WmmaMatrix) </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:158</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset_html_ad7537f8b30ee6913cf4afa1d3c054e68"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html#ad7537f8b30ee6913cf4afa1d3c054e68">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::ThreadOffset::operator()</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 4 &gt; operator()() const</div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:59</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html">cutlass::gemm::WmmaGemmGlobalIteratorCd</a></div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:71</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html_aa0367d016549cce6bd896bae364fc248"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#aa0367d016549cce6bd896bae364fc248">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::predicate_inc_advance</a></div><div class="ttdeci">Index predicate_inc_advance</div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:114</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a84a73da2a07210fcfad10853b941c85e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">cutlass::gemm::WmmaGemmGlobalIteratorCd::Pointer</a></div><div class="ttdeci">TileTraits_::Pointer Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:95</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a84a73da2a07210fcfad10853b941c85e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a84a73da2a07210fcfad10853b941c85e">cutlass::gemm::WmmaGemmGlobalIteratorCd::Pointer</a></div><div class="ttdeci">TileTraits_::Pointer Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:86</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_aafa962f7e63da77c9904d438ab94347a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#aafa962f7e63da77c9904d438ab94347a">cutlass::gemm::GemmGlobalIteratorCd::store_post_increment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void store_post_increment(Fragment &amp;fragment)</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:606</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a0c6b03c635e14ad4424a83f8c7f8025e"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a0c6b03c635e14ad4424a83f8c7f8025e">cutlass::gemm::GemmGlobalIteratorCd::Params::stride_h</a></div><div class="ttdeci">Index stride_h</div><div class="ttdoc">The stride in the H dimension to setup the thread in the block. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:432</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6034b7229e4aca05f63c39560f219433"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6034b7229e4aca05f63c39560f219433">cutlass::gemm::GemmGlobalIteratorCd::load_element</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void load_element(typename Base::AccessType &amp;value, int d, int h, int w, int c) const</div><div class="ttdoc">Loads a single fragment element from memory. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:538</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_html_ab55665f7c2f2cb8b8b9b8ac852d48002"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#ab55665f7c2f2cb8b8b9b8ac852d48002">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Delta</a></div><div class="ttdeci">Shape&lt; 0, 0, Base::Delta::kW, Base::Delta::kC &gt; Delta</div><div class="ttdoc">Override the strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:54</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html">cutlass::PredicateVector&lt; Base::Iterations::kW &gt;</a></div></div>
+<div class="ttc" id="unioncutlass_1_1Vector_html"><div class="ttname"><a href="unioncutlass_1_1Vector.html">cutlass::Vector</a></div><div class="ttdef"><b>Definition:</b> vector.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a6d985f8e93be21e56f72ec1400d73df1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a6d985f8e93be21e56f72ec1400d73df1">cutlass::gemm::GemmGlobalIteratorCd::ThreadOffset</a></div><div class="ttdeci">TileTraits_::ThreadOffset ThreadOffset</div><div class="ttdoc">The thread offset. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:423</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html"><div class="ttname"><a href="structcutlass_1_1Shape.html">cutlass::Shape</a></div><div class="ttdoc">A Shape implementing Layout Concept describing the dimensions of a cube. </div><div class="ttdef"><b>Definition:</b> shape.h:64</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_ab3057dad7a4decb5594c66aa328f8066"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ab3057dad7a4decb5594c66aa328f8066">cutlass::gemm::WmmaGemmGlobalIteratorCd::thread_offset</a></div><div class="ttdeci">Coord&lt; 4 &gt; thread_offset</div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:138</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html_a857db0c999250248b104f17f13fe9bd8"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#a857db0c999250248b104f17f13fe9bd8">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::inc_advance</a></div><div class="ttdeci">Index inc_advance</div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:110</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_ae0f176733ba9dee0cce45435ac5d53ba"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">cutlass::gemm::WmmaGemmGlobalIteratorCd::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">The layout. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a018d5be34cdbb263d7f133197b2921ca"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a018d5be34cdbb263d7f133197b2921ca">cutlass::gemm::WmmaGemmGlobalIteratorCd::store_post_increment</a></div><div class="ttdeci">CUTLASS_DEVICE void store_post_increment(Fragment &amp;fragment)</div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_aed94505e5a269d5f33499e71284104f5"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#aed94505e5a269d5f33499e71284104f5">cutlass::gemm::GemmGlobalIteratorCd::Params::inc_h</a></div><div class="ttdeci">Index inc_h</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:434</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_ab8bfa9914c4ba49a583d1cfaa8a62d56"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#ab8bfa9914c4ba49a583d1cfaa8a62d56">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::kMemorySpace</a></div><div class="ttdeci">static MemorySpace::Kind const kMemorySpace</div><div class="ttdoc">Source or destination memory space. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:161</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_ae0f176733ba9dee0cce45435ac5d53ba"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#ae0f176733ba9dee0cce45435ac5d53ba">cutlass::gemm::WmmaGemmGlobalIteratorCd::kLayout</a></div><div class="ttdeci">static MatrixLayout::Kind const kLayout</div><div class="ttdoc">The layout. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:81</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_ad764f98e770d4685006e6888214dcd4d"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#ad764f98e770d4685006e6888214dcd4d">cutlass::gemm::GemmGlobalIteratorCd::Params::pointer</a></div><div class="ttdeci">Pointer pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:428</div></div>
 <div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 4 &gt;</a></div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits</a></div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:38</div></div>
-<div class="ttc" id="structcutlass_1_1TileIteratorBase_html"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a></div><div class="ttdoc">Iterator for accessing a stripmined tile in memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:102</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a667cae4a9fa78a6df073f5ee48ef9664"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">cutlass::gemm::WmmaGemmGlobalIteratorCd::ThreadOffset</a></div><div class="ttdeci">TileTraits_::ThreadOffset ThreadOffset</div><div class="ttdoc">The thread offset functor. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:101</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_afe77778a126449e210c0bd6ec2dc6709"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#afe77778a126449e210c0bd6ec2dc6709">cutlass::gemm::WmmaGemmGlobalIteratorCd::data</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Pointer data()</div><div class="ttdoc">Returns the raw pointer. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:191</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html">cutlass::TileIteratorBase</a></div><div class="ttdoc">Iterator for accessing a stripmined tile in memory. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:144</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a667cae4a9fa78a6df073f5ee48ef9664"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a667cae4a9fa78a6df073f5ee48ef9664">cutlass::gemm::WmmaGemmGlobalIteratorCd::ThreadOffset</a></div><div class="ttdeci">TileTraits_::ThreadOffset ThreadOffset</div><div class="ttdoc">The thread offset functor. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:92</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_ac368b1ea1c5ad2209a6ac6bec597600f"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#ac368b1ea1c5ad2209a6ac6bec597600f">cutlass::gemm::GemmGlobalIteratorCd::params</a></div><div class="ttdeci">Params params</div><div class="ttdoc">Parameters. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:469</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html">cutlass::gemm::GemmGlobalIteratorCd</a></div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:396</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a7f2fe3fa2eb764bf664817097d22fe45"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a7f2fe3fa2eb764bf664817097d22fe45">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::FragmentElement</a></div><div class="ttdeci">TileTraits_::Scalar FragmentElement</div><div class="ttdoc">Fragment element. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:152</div></div>
 <div class="ttc" id="structcutlass_1_1Shape_html_a78836a20250ff24c25a6622ad818b421"><div class="ttname"><a href="structcutlass_1_1Shape.html#a78836a20250ff24c25a6622ad818b421">cutlass::Shape::kW</a></div><div class="ttdeci">static int const kW</div><div class="ttdoc">The width of the cube. </div><div class="ttdef"><b>Definition:</b> shape.h:70</div></div>
-<div class="ttc" id="structcutlass_1_1PredicateVector_html_a062fa8a8df725ef08ced2ffcca8336af"><div class="ttname"><a href="structcutlass_1_1PredicateVector.html#a062fa8a8df725ef08ced2ffcca8336af">cutlass::PredicateVector::set</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void set(int idx, bool value=true)</div><div class="ttdoc">Set a bit within the predicate vector. </div><div class="ttdef"><b>Definition:</b> predicate_vector.h:364</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1TileIteratorBase_html_a8a4edd46b8cad3eeafc2a3dc3a344499"><div class="ttname"><a href="structcutlass_1_1TileIteratorBase.html#a8a4edd46b8cad3eeafc2a3dc3a344499">cutlass::TileIteratorBase&lt; TileTraits_, TileTraits_::Scalar, IteratorAdvance::kH, MemorySpace::kGlobal, Index_ &gt;::kAccessSize</a></div><div class="ttdeci">static int const kAccessSize</div><div class="ttdoc">The number of scalars accessed per load/store. </div><div class="ttdef"><b>Definition:</b> tile_iterator.h:185</div></div>
+<div class="ttc" id="structcutlass_1_1ComputeOffsetFromStrides_html_aa28231590bfa0ced0f317e6a4d52dc1e"><div class="ttname"><a href="structcutlass_1_1ComputeOffsetFromStrides.html#aa28231590bfa0ced0f317e6a4d52dc1e">cutlass::ComputeOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_HOST_DEVICE int get(int d, int h, int w, int c)</div><div class="ttdef"><b>Definition:</b> shape.h:199</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_html_a194aa2762885c3d556a84ff410200b86"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits.html#a194aa2762885c3d556a84ff410200b86">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::Base</a></div><div class="ttdeci">GemmGlobalTileTraits&lt; GemmOperand::kC, MatrixLayout::kColumnMajor, Scalar_, Tile_, Threads_, kAccessSize_ &gt; Base</div><div class="ttdoc">The base class. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:51</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_aa5c14e2a799249fe8bba14aa1dbe69dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">cutlass::gemm::WmmaGemmGlobalIteratorCd::WmmaGemmGlobalIteratorCd</a></div><div class="ttdeci">CUTLASS_DEVICE WmmaGemmGlobalIteratorCd(Params const &amp;params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int const pointer_offset=0, int const pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:144</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_aa8b453116c2d96ea2c56e08cb981346c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">cutlass::gemm::WmmaGemmGlobalIteratorCd::This_</a></div><div class="ttdeci">WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:77</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_af3c9d62554b1d311d82ba89e09cdd3fa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af3c9d62554b1d311d82ba89e09cdd3fa">cutlass::gemm::WmmaGemmGlobalIteratorCd::predicates</a></div><div class="ttdeci">cutlass::PredicateVector&lt; Base::Iterations::kW &gt; predicates</div><div class="ttdoc">The predicates for the row. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:197</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_af53d49bad7060b87a2761fe8a82a7ddd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">cutlass::gemm::WmmaGemmGlobalIteratorCd::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; 0, 0, Base::Delta::kW, Base::Delta::kC &gt; ImmediateOffsetStrides</div><div class="ttdoc">Override the strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:88</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a1a53695ce7f3cb267225d3ab86a0d5aa"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a1a53695ce7f3cb267225d3ab86a0d5aa">cutlass::gemm::GemmGlobalIteratorCd::Params::stride_d</a></div><div class="ttdeci">long long stride_d</div><div class="ttdoc">The stride in the D dimension. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:430</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_aa5c14e2a799249fe8bba14aa1dbe69dc"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa5c14e2a799249fe8bba14aa1dbe69dc">cutlass::gemm::WmmaGemmGlobalIteratorCd::WmmaGemmGlobalIteratorCd</a></div><div class="ttdeci">CUTLASS_DEVICE WmmaGemmGlobalIteratorCd(Params const &amp;params, const Coord&lt; 3 &gt; &amp;bounds, const Coord&lt; 3 &gt; &amp;block, int const pointer_offset=0, int const pred_offset=0, ThreadOffset thread_offset_func=ThreadOffset())</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:124</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_aa8b453116c2d96ea2c56e08cb981346c"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa8b453116c2d96ea2c56e08cb981346c">cutlass::gemm::WmmaGemmGlobalIteratorCd::This_</a></div><div class="ttdeci">WmmaGemmGlobalIteratorCd&lt; TileTraits_, Index_ &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:73</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_html_a3abcfa68ae9904a13195d32d6e6c4bc6"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd.html#a3abcfa68ae9904a13195d32d6e6c4bc6">cutlass::gemm::GemmGlobalIteratorCd::Pointer</a></div><div class="ttdeci">TileTraits_::Pointer Pointer</div><div class="ttdoc">The pointer. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:417</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_af53d49bad7060b87a2761fe8a82a7ddd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af53d49bad7060b87a2761fe8a82a7ddd">cutlass::gemm::WmmaGemmGlobalIteratorCd::ImmediateOffsetStrides</a></div><div class="ttdeci">Shape&lt; 0, 0, Base::Delta::kW, Base::Delta::kC &gt; ImmediateOffsetStrides</div><div class="ttdoc">Override the strides in each dimension between different loads/stores. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:79</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCdTraits_1_1ThreadOffset.html">cutlass::gemm::WmmaGemmGlobalIteratorCdTraits::ThreadOffset</a></div><div class="ttdoc">Computes the thread offset in (H, W) based on thread ID. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:57</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a44287250bf5631a490b514859fd101d1"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a44287250bf5631a490b514859fd101d1">cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_c</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_c()</div><div class="ttdoc">Increment the pointer in the C dimension. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:168</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_aa9a733f35e9be67663c9c8f80b0034d4"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#aa9a733f35e9be67663c9c8f80b0034d4">cutlass::gemm::WmmaGemmGlobalIteratorCd::inc_h</a></div><div class="ttdeci">CUTLASS_DEVICE void inc_h()</div><div class="ttdoc">Increment the pointer in the H dimension. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:172</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_af2b5682b8e6dd13590ec258a44636430"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">cutlass::gemm::WmmaGemmGlobalIteratorCd::Traits</a></div><div class="ttdeci">TileTraits_ Traits</div><div class="ttdoc">The traits. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:79</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a468f8f503777e4a2b0089ee2bd6c471a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a468f8f503777e4a2b0089ee2bd6c471a">cutlass::gemm::WmmaGemmGlobalIteratorCd::valid</a></div><div class="ttdeci">CUTLASS_DEVICE bool valid(int d, int h, int w, int c) const</div><div class="ttdoc">Test the predicate. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:185</div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params_html_ad6b65c5f3ed7cd9e7ffeb684cbf30d04"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_1_1Params.html#ad6b65c5f3ed7cd9e7ffeb684cbf30d04">cutlass::gemm::WmmaGemmGlobalIteratorCd::Params::initialize</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE int initialize(Pointer pointer, Index ld, Index n, Index epilogue_stride_w, Index epilogue_delta_w)</div><div class="ttdoc">Setup the params. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:117</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html">cutlass::gemm::GemmGlobalIteratorCd::Params</a></div><div class="ttdoc">The params. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:426</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_af2b5682b8e6dd13590ec258a44636430"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#af2b5682b8e6dd13590ec258a44636430">cutlass::gemm::WmmaGemmGlobalIteratorCd::Traits</a></div><div class="ttdeci">TileTraits_ Traits</div><div class="ttdoc">The traits. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:75</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params_html_a3e8f6cf08d23318f3e3263b55cf3b84a"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmGlobalIteratorCd_1_1Params.html#a3e8f6cf08d23318f3e3263b55cf3b84a">cutlass::gemm::GemmGlobalIteratorCd::Params::predicate_offset</a></div><div class="ttdeci">Index predicate_offset</div><div class="ttdoc">The column offset to compute the predicate for the columns. </div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:438</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd_html_a051eb2a8637601cf9c1f52999117151b"><div class="ttname"><a href="structcutlass_1_1gemm_1_1WmmaGemmGlobalIteratorCd.html#a051eb2a8637601cf9c1f52999117151b">cutlass::gemm::WmmaGemmGlobalIteratorCd::store_element</a></div><div class="ttdeci">CUTLASS_DEVICE void store_element(typename Base::AccessType const &amp;value, int d, int h, int w, int c)</div><div class="ttdoc">Stores a single fragment element into memory. </div><div class="ttdef"><b>Definition:</b> wmma_gemm_global_tile.h:140</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__multiply__add_8h.html b/docs/wmma__gemm__multiply__add_8h.html
index b81b0189b..dad724fe2 100644
--- a/docs/wmma__gemm__multiply__add_8h.html
+++ b/docs/wmma__gemm__multiply__add_8h.html
@@ -79,13 +79,13 @@ $(function() {
 
 <p>Implements warp-level matrix multiply-accumulate operation using CUDA WMMA API.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="wmma__matrix_8h_source.html">cutlass/wmma_matrix.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="wmma__matrix_8h_source.html">cutlass/wmma_matrix.h</a>&quot;</code><br />
 </div>
 <p><a href="wmma__gemm__multiply__add_8h_source.html">Go to the source code of this file.</a></p>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__multiply__add_8h_source.html b/docs/wmma__gemm__multiply__add_8h_source.html
index 399aa11fa..e1964afb8 100644
--- a/docs/wmma__gemm__multiply__add_8h_source.html
+++ b/docs/wmma__gemm__multiply__add_8h_source.html
@@ -76,15 +76,20 @@ $(function() {
 <div class="title">wmma_gemm_multiply_add.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="wmma__gemm__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="wmma__matrix_8h.html">cutlass/wmma_matrix.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;          <span class="keyword">typename</span> ScalarA_,</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;          <span class="keyword">typename</span> ScalarB_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutC_,</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;          <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;          <span class="keyword">typename</span> AccumulatorsPerWarp_,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;          <span class="keyword">typename</span> InstructionShape_&gt;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">struct </span>WmmaGemmMultiplyAdd {</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="keyword">typedef</span> InstructionShape_ InstructionShape;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, InstructionShape_::kH, InstructionShape_::kW&gt; ThreadsPerWarp;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keyword">typedef</span> AccumulatorsPerWarp_ AccumulatorsPerWarp;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <span class="keyword">typedef</span> ScalarA_ ScalarA;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="keyword">typedef</span> ScalarB_ ScalarB;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keyword">typedef</span> ScalarC_ ScalarC;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">ShapeDiv&lt;AccumulatorsPerWarp, InstructionShape&gt;::Shape</a> Iterations;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kA, kLayoutA_, ScalarA, InstructionShape&gt; ElementA;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementA, Iterations::kW&gt; FragmentA;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kB, kLayoutB_, ScalarB, InstructionShape&gt; ElementB;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementB, Iterations::kH&gt; FragmentB;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kC, kLayoutC_, ScalarC, InstructionShape&gt; ElementC;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementC, Iterations::kH * Iterations::kW&gt; Accumulators;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  CUTLASS_DEVICE WmmaGemmMultiplyAdd() {}</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> multiply_add(FragmentA <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;                                   FragmentB <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;                                   Accumulators <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;                                   Accumulators&amp; d) {</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; Iterations::kH; ++j) {</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Iterations::kW; ++i) {</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;        <span class="comment">// The input elements.</span></div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;        ElementA <span class="keyword">const</span>&amp; elt_a = a[i];</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;        ElementB <span class="keyword">const</span>&amp; elt_b = b[j];</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;        ElementC <span class="keyword">const</span>&amp; elt_c = c[j * Iterations::kW + i];</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;        <span class="comment">// The output element.</span></div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;        ElementC&amp; elt_d = d[j * Iterations::kW + i];</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;        <span class="comment">// The wmma instruction.</span></div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;        nvcuda::wmma::mma_sync(elt_d, elt_a, elt_b, elt_c);</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;      }</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    }</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;  }</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;};</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="wmma__matrix_8h_html"><div class="ttname"><a href="wmma__matrix_8h.html">wmma_matrix.h</a></div><div class="ttdoc">Abstractions for loading and storing matrices using the CUDA WMMA API. </div></div>
+<a href="wmma__gemm__multiply__add_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="wmma__matrix_8h.html">cutlass/wmma_matrix.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;          <span class="keyword">typename</span> ScalarA_,</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;          <span class="keyword">typename</span> ScalarB_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutC_,</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;          <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;          <span class="keyword">typename</span> WarpGemmShape_,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;          <span class="keyword">typename</span> InstructionShape_&gt;</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">struct </span>WmmaGemmMultiplyAdd {</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;  <span class="keyword">typedef</span> InstructionShape_ InstructionShape;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, InstructionShape_::kH, InstructionShape_::kW&gt; ThreadsPerWarp;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keyword">typedef</span> WarpGemmShape_ WarpGemmShape;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <span class="keyword">typedef</span> WarpGemmShape_ AccumulatorsPerWarp;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="keyword">typedef</span> ScalarA_ ScalarA;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keyword">typedef</span> ScalarB_ ScalarB;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">typedef</span> ScalarC_ ScalarC;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">ShapeDiv&lt;AccumulatorsPerWarp, InstructionShape&gt;::Shape</a> Iterations;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kA, kLayoutA_, ScalarA, InstructionShape&gt; ElementA;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementA, Iterations::kW&gt; FragmentA;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kB, kLayoutB_, ScalarB, InstructionShape&gt; ElementB;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementB, Iterations::kH&gt; FragmentB;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kC, kLayoutC_, ScalarC, InstructionShape&gt; ElementC;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementC, Iterations::kH * Iterations::kW&gt; Accumulators;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  CUTLASS_DEVICE WmmaGemmMultiplyAdd() {}</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> multiply_add(FragmentA <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;                                   FragmentB <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;                                   Accumulators <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                                   Accumulators&amp; d) {</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; Iterations::kH; ++j) {</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Iterations::kW; ++i) {</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;        <span class="comment">// The input elements.</span></div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;        ElementA <span class="keyword">const</span>&amp; elt_a = a[i];</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;        ElementB <span class="keyword">const</span>&amp; elt_b = b[j];</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;        ElementC <span class="keyword">const</span>&amp; elt_c = c[j * Iterations::kW + i];</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;        <span class="comment">// The output element.</span></div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;        ElementC&amp; elt_d = d[j * Iterations::kW + i];</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;        <span class="comment">// The wmma instruction.</span></div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;        nvcuda::wmma::mma_sync(elt_d, elt_a, elt_b, elt_c);</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;      }</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    }</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  }</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;};</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="keyword">template</span>&lt;<span class="keyword">typename</span> WarpGemmShape_&gt;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="keyword">struct </span>WmmaGemmMultiplyAdd &lt;MatrixLayout::kRowMajor,</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;                            Vector&lt;bin1_t, 32&gt;,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;                            <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                            Vector&lt;bin1_t, 32&gt;,</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;                            <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                            int,</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;                            WarpGemmShape_,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                            Shape&lt;128, 8, 8&gt; &gt;{</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="keyword">typedef</span> Shape&lt;128, 8, 8&gt; InstructionShape;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, 4, 8&gt; ThreadsPerWarp;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="keyword">typedef</span> WarpGemmShape_ WarpGemmShape;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  <span class="keyword">typedef</span> WarpGemmShape_ AccumulatorsPerWarp;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <span class="keyword">typedef</span> Vector&lt;bin1_t, 32&gt; ScalarA;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  <span class="keyword">typedef</span> Vector&lt;bin1_t, 32&gt; ScalarB;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> ScalarC;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">ShapeDiv&lt;AccumulatorsPerWarp, InstructionShape&gt;::Shape</a> Iterations;</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;                     Vector&lt;bin1_t, 32&gt;,</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;                     InstructionShape&gt; ElementA;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementA, Iterations::kW&gt; FragmentA;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;                     Vector&lt;bin1_t, 32&gt;,</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;                     InstructionShape&gt; ElementB;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementB, Iterations::kH&gt; FragmentB;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>,</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;                     int,</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;                     InstructionShape&gt; ElementC;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementC, Iterations::kH * Iterations::kW&gt; Accumulators;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  CUTLASS_DEVICE WmmaGemmMultiplyAdd() {}</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> multiply_add(FragmentA <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;                                   FragmentB <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;                                   Accumulators <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;                                   Accumulators&amp; d) {</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; Iterations::kH; ++j) {</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Iterations::kW; ++i) {</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;        <span class="comment">// The input elements.</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;        ElementA <span class="keyword">const</span>&amp; elt_a = a[i];</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;        ElementB <span class="keyword">const</span>&amp; elt_b = b[j];</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;        ElementC <span class="keyword">const</span>&amp; elt_c = c[j * Iterations::kW + i];</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;        <span class="comment">// The output element.</span></div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;        ElementC&amp; elt_d = d[j * Iterations::kW + i];</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;        <span class="comment">// The wmma instruction.</span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;        nvcuda::wmma::bmma_sync(elt_d,</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;                                elt_a,</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;                                elt_b,</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;                                elt_c,</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;                                nvcuda::wmma::experimental::bmmaBitOpXOR,</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;                                nvcuda::wmma::experimental::bmmaAccumulateOpPOPC);</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;      }</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    }</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;  }</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;};</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;<span class="keyword">template</span>&lt;<span class="keyword">typename</span> WarpGemmShape_&gt;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;<span class="keyword">struct </span>WmmaGemmMultiplyAdd &lt;MatrixLayout::kRowMajor,</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;                            Vector&lt;int4_t, 8&gt;,</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;                            <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;                            Vector&lt;int4_t, 8&gt;,</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;                            <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;                            int,</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;                            WarpGemmShape_,</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;                            Shape&lt;32, 8, 8&gt; &gt;{</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;  <span class="keyword">typedef</span> Shape&lt;32, 8, 8&gt; InstructionShape;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, 4, 8&gt; ThreadsPerWarp;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  <span class="keyword">typedef</span> WarpGemmShape_ WarpGemmShape;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <span class="keyword">typedef</span> WarpGemmShape_ AccumulatorsPerWarp;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;  <span class="keyword">typedef</span> Vector&lt;int4_t, 8&gt; ScalarA;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;  <span class="keyword">typedef</span> Vector&lt;int4_t, 8&gt; ScalarB;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> ScalarC;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">ShapeDiv&lt;AccumulatorsPerWarp, InstructionShape&gt;::Shape</a> Iterations;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;                     Vector&lt;int4_t, 8&gt;,</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;                     InstructionShape&gt; ElementA;</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementA, Iterations::kW&gt; FragmentA;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;                     Vector&lt;int4_t, 8&gt;,</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;                     InstructionShape&gt; ElementB;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementB, Iterations::kH&gt; FragmentB;</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>,</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;                     int,</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;                     InstructionShape&gt; ElementC;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementC, Iterations::kH * Iterations::kW&gt; Accumulators;</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;  CUTLASS_DEVICE WmmaGemmMultiplyAdd() {}</div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> multiply_add(FragmentA <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;                                   FragmentB <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;                                   Accumulators <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;                                   Accumulators&amp; d) {</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; Iterations::kH; ++j) {</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Iterations::kW; ++i) {</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;        <span class="comment">// The input elements.</span></div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;        ElementA <span class="keyword">const</span>&amp; elt_a = a[i];</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;        ElementB <span class="keyword">const</span>&amp; elt_b = b[j];</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;        ElementC <span class="keyword">const</span>&amp; elt_c = c[j * Iterations::kW + i];</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;        <span class="comment">// The output element.</span></div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;        ElementC&amp; elt_d = d[j * Iterations::kW + i];</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;        <span class="comment">// The wmma instruction.</span></div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;        nvcuda::wmma::mma_sync(elt_d, elt_a, elt_b, elt_c);</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;      }</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;    }</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;  }</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;};</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;<span class="keyword">template</span>&lt;<span class="keyword">typename</span> WarpGemmShape_&gt;</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;<span class="keyword">struct </span>WmmaGemmMultiplyAdd &lt;MatrixLayout::kRowMajor,</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;                            Vector&lt;uint4_t, 8&gt;,</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;                            <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;                            Vector&lt;uint4_t, 8&gt;,</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;                            <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;                            int,</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;                            WarpGemmShape_,</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;                            Shape&lt;32, 8, 8&gt; &gt;{</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;  <span class="keyword">typedef</span> Shape&lt;32, 8, 8&gt; InstructionShape;</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, 4, 8&gt; ThreadsPerWarp;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;  <span class="keyword">typedef</span> WarpGemmShape_ WarpGemmShape;</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;  <span class="keyword">typedef</span> WarpGemmShape_ AccumulatorsPerWarp;</div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;  <span class="keyword">typedef</span> Vector&lt;uint4_t, 8&gt; ScalarA;</div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;  <span class="keyword">typedef</span> Vector&lt;uint4_t, 8&gt; ScalarB;</div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;  <span class="keyword">typedef</span> <span class="keywordtype">int</span> ScalarC;</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">ShapeDiv&lt;AccumulatorsPerWarp, InstructionShape&gt;::Shape</a> Iterations;</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;                     Vector&lt;uint4_t, 8&gt;,</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;                     InstructionShape&gt; ElementA;</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementA, Iterations::kW&gt; FragmentA;</div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;                     Vector&lt;uint4_t, 8&gt;,</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;                     InstructionShape&gt; ElementB;</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementB, Iterations::kH&gt; FragmentB;</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>,</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;                     int,</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;                     InstructionShape&gt; ElementC;</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;  <span class="keyword">typedef</span> Fragment&lt;ElementC, Iterations::kH * Iterations::kW&gt; Accumulators;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;  CUTLASS_DEVICE WmmaGemmMultiplyAdd() {}</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> multiply_add(FragmentA <span class="keyword">const</span>&amp; a,</div><div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;                                   FragmentB <span class="keyword">const</span>&amp; b,</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;                                   Accumulators <span class="keyword">const</span>&amp; c,</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;                                   Accumulators&amp; d) {</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> j = 0; j &lt; Iterations::kH; ++j) {</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;      <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; Iterations::kW; ++i) {</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;        <span class="comment">// The input elements.</span></div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;        ElementA <span class="keyword">const</span>&amp; elt_a = a[i];</div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;        ElementB <span class="keyword">const</span>&amp; elt_b = b[j];</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;        ElementC <span class="keyword">const</span>&amp; elt_c = c[j * Iterations::kW + i];</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;        <span class="comment">// The output element.</span></div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;        ElementC&amp; elt_d = d[j * Iterations::kW + i];</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;        <span class="comment">// The wmma instruction.</span></div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;        nvcuda::wmma::mma_sync(elt_d, elt_a, elt_b, elt_c);</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;      }</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;    }</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;  }</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;};</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="wmma__matrix_8h_html"><div class="ttname"><a href="wmma__matrix_8h.html">wmma_matrix.h</a></div><div class="ttdoc">Abstractions for loading and storing matrices using the CUDA WMMA API. </div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
 <div class="ttc" id="structcutlass_1_1ShapeDiv_html_a108ded386ef6708afc6fe769a77a234b"><div class="ttname"><a href="structcutlass_1_1ShapeDiv.html#a108ded386ef6708afc6fe769a77a234b">cutlass::ShapeDiv::Shape</a></div><div class="ttdeci">Shape&lt; A_::kD/B_::kD, A_::kH/B_::kH, A_::kW/B_::kW, A_::kC/B_::kC &gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:126</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__shared__tile_8h.html b/docs/wmma__gemm__shared__tile_8h.html
index e72f3a867..66535bfc6 100644
--- a/docs/wmma__gemm__shared__tile_8h.html
+++ b/docs/wmma__gemm__shared__tile_8h.html
@@ -79,13 +79,13 @@ $(function() {
 
 <p>Defines iterator traits for efficiently loading and storing fragment to and from shared memory, specialized for WMMA GEMM.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="wmma__matrix_8h_source.html">cutlass/wmma_matrix.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="wmma__matrix_8h_source.html">cutlass/wmma_matrix.h</a>&quot;</code><br />
 </div>
 <p><a href="wmma__gemm__shared__tile_8h_source.html">Go to the source code of this file.</a></p>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__shared__tile_8h_source.html b/docs/wmma__gemm__shared__tile_8h_source.html
index fe5658825..27d827aa7 100644
--- a/docs/wmma__gemm__shared__tile_8h_source.html
+++ b/docs/wmma__gemm__shared__tile_8h_source.html
@@ -76,26 +76,26 @@ $(function() {
 <div class="title">wmma_gemm_shared_tile.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="wmma__gemm__shared__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="wmma__matrix_8h.html">cutlass/wmma_matrix.h</a>&gt;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__operand_8h.html">cutlass/gemm/gemm_operand.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span>&gt;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">struct </span>Debug {};</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;          <span class="keywordtype">int</span> kWarpStride_,</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;          <span class="keyword">typename</span> Iterations_,</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;          <span class="keyword">typename</span> Delta_,</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;          <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="keyword">struct </span>WmmaGemmSharedLoadTileATraits {</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> kOperand = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = kLayout_;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keyword">typedef</span> Scalar_ Scalar;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;  <span class="keyword">typedef</span> Scalar <span class="keyword">const</span>* Pointer;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kAccessSize = 1;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;  <span class="keyword">typedef</span> Tile_ Tile;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <span class="keyword">typedef</span> Warps_ Warps;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kWarpStride = kWarpStride_;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  <span class="keyword">typedef</span> Iterations_ Iterations;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;  <span class="keyword">typedef</span> Delta_ Delta;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  <span class="keyword">typedef</span> Delta_ ImmediateOffsetStrides;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <span class="keyword">typedef</span> WmmaShape_ WmmaShape;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> kMemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;  <span class="keyword">struct </span>ThreadOffset {</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    Coord&lt;4&gt; operator()()<span class="keyword"> const </span>{</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      <span class="comment">// The warp id.</span></div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = warp % Warps::kW * kWarpStride;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    }</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;  };</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;};</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;          <span class="keywordtype">int</span> kWarpStride_,</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;          <span class="keyword">typename</span> Iterations_,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;          <span class="keyword">typename</span> Delta_,</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;          <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="keyword">struct </span>WmmaGemmSharedLoadTileBTraits {</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> kOperand = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = kLayout_;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  <span class="keyword">typedef</span> Scalar_ Scalar;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;  <span class="keyword">typedef</span> Scalar <span class="keyword">const</span>* Pointer;</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kAccessSize = 1;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;  <span class="keyword">typedef</span> Tile_ Tile;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;  <span class="keyword">typedef</span> Warps_ Warps;</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kWarpStride = kWarpStride_;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;  <span class="keyword">typedef</span> Iterations_ Iterations;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="keyword">typedef</span> Delta_ Delta;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  <span class="keyword">typedef</span> Delta_ ImmediateOffsetStrides;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  <span class="keyword">typedef</span> WmmaShape_ WmmaShape;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> kMemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <span class="keyword">struct </span>ThreadOffset {</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    Coord&lt;4&gt; operator()()<span class="keyword"> const </span>{</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;      <span class="comment">// The warp id.</span></div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = warp / Warps::kW * kWarpStride;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    }</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  };</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;};</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;          <span class="keyword">typename</span> WmmaShape_,</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="keyword">struct </span>WmmaGemmSharedStoreTileDTraits {</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> kOperand = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = kLayout_;</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;  <span class="keyword">typedef</span> Scalar_ Scalar;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <span class="comment">// The access size</span></div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kAccessSize = 1;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  <span class="keyword">typedef</span> Scalar* Pointer;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  <span class="keyword">typedef</span> Warps_ Warps;</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;  <span class="keyword">typedef</span> WmmaShape_ WmmaShape;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = kSkew_;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> kMemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, Warps_::kH * WmmaShape_::kH, OutputTile_::kW + kSkew_&gt; Tile;</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, 1, OutputTile_::kW / Warps::kW / WmmaShape_::kW&gt; Iterations;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, 0, Warps::kW * WmmaShape_::kW, 0&gt; Delta;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, 0, Warps::kW * WmmaShape_::kW, 0&gt; ImmediateOffsetStrides;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;  <span class="keyword">struct </span>ThreadOffset {</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    Coord&lt;4&gt; operator()()<span class="keyword"> const </span>{</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="comment">// The warp id.</span></div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      <span class="comment">// The starting column.</span></div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> h = warp / Warps::kW * WmmaShape::kH;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;      <span class="comment">// The w.</span></div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> w = warp % Warps::kW * WmmaShape::kW;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = h * Tile::kW + w;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    }</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;  };</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;};</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kScalarsPerLds_&gt;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;<span class="keyword">struct </span>WmmaGemmSharedLoadTileDTraits {</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;  <span class="keyword">typedef</span> Scalar_ Scalar;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;  <span class="keyword">typedef</span> Scalar <span class="keyword">const</span>* Pointer;</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kAccessSize = kScalarsPerLds_;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;Tile_, kScalarsPerLds_&gt;::Tile</a> Tile;</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">ReshapeThreads&lt;Tile, Threads_&gt;::Threads</a> Threads;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, Tile::kW * Tile::kC, Tile::kC&gt; ThreadsStrides;</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> kMemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, Threads::kH * ShapeCount&lt;Tile&gt;::kWc, Threads::kW * kScalarsPerLds_&gt; Delta;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, Threads::kH * ShapeCount&lt;Tile&gt;::kWc, Threads::kW * kScalarsPerLds_&gt;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      ImmediateOffsetStrides;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, Tile::kH / Threads::kH, Tile::kW / Threads::kW, Tile::kC / kScalarsPerLds_&gt;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;      Iterations;</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;  <span class="keyword">struct </span>ThreadOffset {</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    Coord&lt;4&gt; operator()()<span class="keyword"> const </span>{</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = <a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">ComputeThreadOffsetFromStrides&lt;Threads, ThreadsStrides&gt;::get</a>();</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    }</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;  };</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;};</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="structcutlass_1_1ComputeThreadOffsetFromStrides_html_a1744bfe277cbe0c642cce4a48c1dd9ad"><div class="ttname"><a href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">cutlass::ComputeThreadOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_DEVICE int get()</div><div class="ttdef"><b>Definition:</b> shape.h:253</div></div>
+<a href="wmma__gemm__shared__tile_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;</div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="wmma__matrix_8h.html">cutlass/wmma_matrix.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__operand_8h.html">cutlass/gemm/gemm_operand.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="reshape__tile_8h.html">cutlass/reshape_tile.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;          <span class="keywordtype">int</span> kWarpStride_,</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;          <span class="keyword">typename</span> Iterations_,</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;          <span class="keyword">typename</span> Delta_,</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;          <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="keyword">struct </span>WmmaGemmSharedLoadTileATraits {</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> kOperand = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = kLayout_;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="keyword">typedef</span> Scalar_ Scalar;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  <span class="keyword">typedef</span> Scalar <span class="keyword">const</span>* Pointer;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kAccessSize = 1;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="keyword">typedef</span> Tile_ Tile;</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;  <span class="keyword">typedef</span> Warps_ Warps;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kWarpStride = kWarpStride_;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="keyword">typedef</span> Iterations_ Iterations;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keyword">typedef</span> Delta_ Delta;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <span class="keyword">typedef</span> Delta_ ImmediateOffsetStrides;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;  <span class="keyword">typedef</span> WmmaShape_ WmmaShape;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> kMemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  <span class="keyword">struct </span>ThreadOffset {</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    Coord&lt;4&gt; operator()()<span class="keyword"> const </span>{</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;      <span class="comment">// The warp id.</span></div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = warp % Warps::kW * kWarpStride;</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    }</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;  };</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;};</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;          <span class="keyword">typename</span> Tile_,</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;          <span class="keywordtype">int</span> kWarpStride_,</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;          <span class="keyword">typename</span> Iterations_,</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;          <span class="keyword">typename</span> Delta_,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;          <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="keyword">struct </span>WmmaGemmSharedLoadTileBTraits {</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> kOperand = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = kLayout_;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  <span class="keyword">typedef</span> Scalar_ Scalar;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;  <span class="keyword">typedef</span> Scalar <span class="keyword">const</span>* Pointer;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kAccessSize = 1;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <span class="keyword">typedef</span> Tile_ Tile;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <span class="keyword">typedef</span> Warps_ Warps;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kWarpStride = kWarpStride_;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <span class="keyword">typedef</span> Iterations_ Iterations;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <span class="keyword">typedef</span> Delta_ Delta;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  <span class="keyword">typedef</span> Delta_ ImmediateOffsetStrides;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  <span class="keyword">typedef</span> WmmaShape_ WmmaShape;</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> kMemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  <span class="keyword">struct </span>ThreadOffset {</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    Coord&lt;4&gt; operator()()<span class="keyword"> const </span>{</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;      <span class="comment">// The warp id.</span></div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = warp / Warps::kW * kWarpStride;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    }</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  };</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;};</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;          <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;          <span class="keyword">typename</span> Warps_,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;          <span class="keyword">typename</span> WmmaShape_,</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;          <span class="keywordtype">int</span> kSkew_ = 0&gt;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;<span class="keyword">struct </span>WmmaGemmSharedStoreTileDTraits {</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> <span class="keyword">const</span> kOperand = <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">GemmOperand::kC</a>;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = kLayout_;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;  <span class="keyword">typedef</span> Scalar_ Scalar;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  <span class="comment">// The access size</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kAccessSize = 1;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <span class="keyword">typedef</span> Scalar* Pointer;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  <span class="keyword">typedef</span> Warps_ Warps;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;  <span class="keyword">typedef</span> WmmaShape_ WmmaShape;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = kSkew_;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> kMemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, Warps_::kH * WmmaShape_::kH, OutputTile_::kW + kSkew_&gt; Tile;</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, 1, OutputTile_::kW / Warps::kW / WmmaShape_::kW&gt; Iterations;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, 0, Warps::kW * WmmaShape_::kW, 0&gt; Delta;</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, 0, Warps::kW * WmmaShape_::kW, 0&gt; ImmediateOffsetStrides;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;  <span class="keyword">struct </span>ThreadOffset {</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    Coord&lt;4&gt; operator()()<span class="keyword"> const </span>{</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      <span class="comment">// The warp id.</span></div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> warp = threadIdx.x / kWarpSize;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      <span class="comment">// The starting column.</span></div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> h = warp / Warps::kW * WmmaShape::kH;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;      <span class="comment">// The w.</span></div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> w = warp % Warps::kW * WmmaShape::kW;</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = h * Tile::kW + w;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    }</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;  };</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;};</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> Tile_, <span class="keyword">typename</span> Threads_, <span class="keywordtype">int</span> kScalarsPerLds_&gt;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;<span class="keyword">struct </span>WmmaGemmSharedLoadTileDTraits {</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;  <span class="keyword">typedef</span> Scalar_ Scalar;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;  <span class="keyword">typedef</span> Scalar <span class="keyword">const</span>* Pointer;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kAccessSize = kScalarsPerLds_;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">ReshapeTile&lt;Tile_, kScalarsPerLds_&gt;::Tile</a> Tile;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">ReshapeThreads&lt;Tile, Threads_&gt;::Threads</a> Threads;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, Tile::kW * Tile::kC, Tile::kC&gt; ThreadsStrides;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">MemorySpace::Kind</a> <span class="keyword">const</span> kMemorySpace = <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>;</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, Threads::kH * ShapeCount&lt;Tile&gt;::kWc, Threads::kW * kScalarsPerLds_&gt; Delta;</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;  <span class="keyword">typedef</span> Shape&lt;0, Threads::kH * ShapeCount&lt;Tile&gt;::kWc, Threads::kW * kScalarsPerLds_&gt;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;      ImmediateOffsetStrides;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;  <span class="keyword">typedef</span> Shape&lt;1, Tile::kH / Threads::kH, Tile::kW / Threads::kW, Tile::kC / kScalarsPerLds_&gt;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      Iterations;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  <span class="keyword">struct </span>ThreadOffset {</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    Coord&lt;4&gt; operator()()<span class="keyword"> const </span>{</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      <span class="comment">// The offset.</span></div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;      <span class="keywordtype">int</span> <span class="keyword">const</span> offset = <a class="code" href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">ComputeThreadOffsetFromStrides&lt;Threads, ThreadsStrides&gt;::get</a>();</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;      <span class="keywordflow">return</span> <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, offset, 0);</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;    }</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;  };</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;};</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="structcutlass_1_1ComputeThreadOffsetFromStrides_html_a1744bfe277cbe0c642cce4a48c1dd9ad"><div class="ttname"><a href="structcutlass_1_1ComputeThreadOffsetFromStrides.html#a1744bfe277cbe0c642cce4a48c1dd9ad">cutlass::ComputeThreadOffsetFromStrides::get</a></div><div class="ttdeci">static CUTLASS_DEVICE int get()</div><div class="ttdef"><b>Definition:</b> shape.h:214</div></div>
 <div class="ttc" id="wmma__matrix_8h_html"><div class="ttname"><a href="wmma__matrix_8h.html">wmma_matrix.h</a></div><div class="ttdoc">Abstractions for loading and storing matrices using the CUDA WMMA API. </div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:241</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:40</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0ca7598e104da2001a76ec344f1c1b9c6dc">cutlass::GemmOperand::kC</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03c"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03c">cutlass::MemorySpace::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> load_store.h:39</div></div>
 <div class="ttc" id="reshape__tile_8h_html"><div class="ttname"><a href="reshape__tile_8h.html">reshape_tile.h</a></div><div class="ttdoc">Defines a type for restructuring a tile. </div></div>
 <div class="ttc" id="gemm__operand_8h_html"><div class="ttname"><a href="gemm__operand_8h.html">gemm_operand.h</a></div><div class="ttdoc">Defines constant expressions for mapping GEMM problem size and strides onto pitch-linear memory...</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
 <div class="ttc" id="structcutlass_1_1ReshapeTile_html_a8d57fe6422aa920d9815a66e5a85b5f5"><div class="ttname"><a href="structcutlass_1_1ReshapeTile.html#a8d57fe6422aa920d9815a66e5a85b5f5">cutlass::ReshapeTile::Tile</a></div><div class="ttdeci">Tile_ Tile</div><div class="ttdef"><b>Definition:</b> reshape_tile.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="structcutlass_1_1gemm_1_1ReshapeThreads_html_afd3614ff45f0fc77ad4967951cb5ab57"><div class="ttname"><a href="structcutlass_1_1gemm_1_1ReshapeThreads.html#afd3614ff45f0fc77ad4967951cb5ab57">cutlass::gemm::ReshapeThreads::Threads</a></div><div class="ttdeci">Threads_ Threads</div><div class="ttdef"><b>Definition:</b> gemm_global_tile.h:54</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__traits_8h.html b/docs/wmma__gemm__traits_8h.html
index 37eb3547b..0c4b09843 100644
--- a/docs/wmma__gemm__traits_8h.html
+++ b/docs/wmma__gemm__traits_8h.html
@@ -79,13 +79,13 @@ $(function() {
 
 <p>Defies structural properties of GEMM targeting WMMA API in CUDA.  
 <a href="#details">More...</a></p>
-<div class="textblock"><code>#include &lt;<a class="el" href="wmma__matrix_8h_source.html">cutlass/wmma_matrix.h</a>&gt;</code><br />
+<div class="textblock"><code>#include &quot;<a class="el" href="wmma__matrix_8h_source.html">cutlass/wmma_matrix.h</a>&quot;</code><br />
 </div>
 <p><a href="wmma__gemm__traits_8h_source.html">Go to the source code of this file.</a></p>
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__gemm__traits_8h_source.html b/docs/wmma__gemm__traits_8h_source.html
index ad4cb28d1..344fc5a76 100644
--- a/docs/wmma__gemm__traits_8h_source.html
+++ b/docs/wmma__gemm__traits_8h_source.html
@@ -76,32 +76,32 @@ $(function() {
 <div class="title">wmma_gemm_traits.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="wmma__gemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="wmma__matrix_8h.html">cutlass/wmma_matrix.h</a>&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&gt;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&gt;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&gt;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&gt;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&gt;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&gt;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="wmma__gemm__epilogue__traits_8h.html">cutlass/gemm/wmma_gemm_epilogue_traits.h</a>&gt;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="wmma__gemm__global__tile_8h.html">cutlass/gemm/wmma_gemm_global_tile.h</a>&gt;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="wmma__gemm__multiply__add_8h.html">cutlass/gemm/wmma_gemm_multiply_add.h</a>&gt;</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <span class="keyword">typename</span> Accumulator_,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerWarp_,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keyword">typename</span> InstructionShape_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_&gt;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="keyword">struct </span>WmmaGemmConfig : <span class="keyword">public</span> GemmConfig&lt;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;                            half,</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;                            half,</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                            ScalarC_,</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;                            ScalarC_,</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;                            OutputTile_,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                            WmmaGemmMultiplyAdd&lt;kLayoutA_,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;                                                half,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;                                                kLayoutB_,</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;                                                half,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;                                                MatrixLayout::kColumnMajor,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;                                                Accumulator_,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;                                                AccumulatorsPerWarp_,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                                                InstructionShape_&gt;,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;                            kScalarsPerLdgA_,</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;                            kScalarsPerLdgA_,</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;                            8,</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;                            kScalarsPerLdgB_,</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;                            kScalarsPerLdgB_,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;                            8,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;                            16 / sizeof(ScalarC_),</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;                            16 / sizeof(ScalarC_),</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;                            16 / sizeof(ScalarC_),</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;                            1&gt; {};</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperA {};</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperA&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    : <span class="keyword">public</span> GemmTileTraitsHelperA&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <span class="keyword">typedef</span> GemmTileTraitsHelperA&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt; Base;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(<span class="keyword">typename</span> Base::MultiplyAddScalar);</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;                GemmConfig_::OutputTile::kD,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;                GemmConfig_::OutputTile::kW + kSkew&gt;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;      Tile;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;                     <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;      Tile,</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;      <span class="keyword">typename</span> Base::GlobalTileTraits::Threads,</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;      GemmConfig_::kScalarsPerStsA&gt;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerIteration = Tile::kW * GemmConfig_::InstructionShape::kD;</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileATraits&lt;</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;      Tile,</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;      GemmConfig_::InstructionShape::kW,</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW&gt;,</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      Shape&lt;kScalarsPerIteration, 0, kScalarsPerW, 0&gt;,</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;};</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperA&lt;MatrixLayout::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarA Scalar;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar;</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;                     MultiplyAddScalar,</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;      <span class="comment">// That&#39;s A.</span></div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;      Shape&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;                GemmConfig_::OutputTile::kW,</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;                GemmConfig_::OutputTile::kD + kSkew&gt;</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      Tile;</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;      Tile,</div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;      GemmConfig_::kScalarsPerStsA&gt;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileATraits&lt;</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;      Tile,</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;      GemmConfig_::InstructionShape::kW * Tile::kW,</div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW&gt;,</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;};</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;</div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;<span class="keyword">template</span> &lt;enum MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperB {};</div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;</div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperB&lt;MatrixLayout::kRowMajor, GemmConfig_&gt;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    : <span class="keyword">public</span> GemmTileTraitsHelperB&lt;MatrixLayout::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;  <span class="keyword">typedef</span> GemmTileTraitsHelperB&lt;MatrixLayout::kRowMajor, GemmConfig_&gt; Base;</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(<span class="keyword">typename</span> Base::MultiplyAddScalar);</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;                GemmConfig_::OutputTile::kD,</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;                GemmConfig_::OutputTile::kH + kSkew&gt;</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;      Tile;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;                     <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;      <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;      Tile,</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;      <span class="keyword">typename</span> Base::GlobalTileTraits::Threads,</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;      GemmConfig_::kScalarsPerStsB&gt;</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerIteration = Tile::kW * GemmConfig_::InstructionShape::kD;</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileBTraits&lt;</div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;      <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;      Tile,</div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;      GemmConfig_::InstructionShape::kH,</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW&gt;,</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;      Shape&lt;kScalarsPerIteration, 0, kScalarsPerW, 0&gt;,</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;};</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;</div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperB&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarB Scalar;</div><div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;                     MultiplyAddScalar,</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;      <span class="comment">// That&#39;s B.</span></div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;      Shape&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;                GemmConfig_::OutputTile::kH,</div><div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;                GemmConfig_::OutputTile::kD + kSkew&gt;</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;      Tile;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;      Tile,</div><div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;      GemmConfig_::kScalarsPerStsB&gt;</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileBTraits&lt;</div><div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;      Tile,</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;      GemmConfig_::InstructionShape::kH * Tile::kW,</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW&gt;,</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;};</div><div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;</div><div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;    <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;    <span class="keyword">typename</span> Accumulator_,</div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerWarp_,</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;    <span class="keyword">typename</span> InstructionShape_,</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_,</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_,</div><div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;    <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;<span class="keyword">struct </span>WmmaGemmTraitsHelper {</div><div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;  <span class="keyword">typedef</span> WmmaGemmConfig&lt;kLayoutA_,</div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;                         kLayoutB_,</div><div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;                         OutputTile_,</div><div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;                         ScalarC_,</div><div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;                         Accumulator_,</div><div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;                         AccumulatorsPerWarp_,</div><div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;                         InstructionShape_,</div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;                         kScalarsPerLdgA_,</div><div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;                         kScalarsPerLdgB_&gt;</div><div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;      GemmConfig;</div><div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;  <span class="keyword">typedef</span> WmmaGemmTileTraitsHelperA&lt;kLayoutA_, GemmConfig&gt; GemmTileTraitsHelperA;</div><div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;  <span class="keyword">typedef</span> WmmaGemmTileTraitsHelperB&lt;kLayoutB_, GemmConfig&gt; GemmTileTraitsHelperB;</div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;</div><div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;  <span class="keyword">typedef</span> GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperA::GlobalTileTraits, Index_&gt;</div><div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;      GlobalLoadIteratorA;</div><div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename GlobalLoadIteratorA::Fragment&gt; GlobalTransformerA;</div><div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;  <span class="keyword">typedef</span> TileStoreIterator&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits,</div><div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;      SharedStoreIteratorA;</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;  <span class="keyword">typedef</span> GlobalLoadStream&lt;GlobalLoadIteratorA, SharedStoreIteratorA, GlobalTransformerA&gt;</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;      GlobalLoadStreamA;</div><div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;</div><div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;  <span class="keyword">typedef</span> GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperB::GlobalTileTraits, Index_&gt;</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;      GlobalLoadIteratorB;</div><div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;  <span class="comment">// The default transformer for B.</span></div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename GlobalLoadIteratorB::Fragment&gt; GlobalTransformerB;</div><div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;  <span class="keyword">typedef</span> TileStoreIterator&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits,</div><div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;      SharedStoreIteratorB;</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;  <span class="keyword">typedef</span> GlobalLoadStream&lt;GlobalLoadIteratorB, SharedStoreIteratorB, GlobalTransformerB&gt;</div><div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;      GlobalLoadStreamB;</div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;</div><div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;  <span class="keyword">typedef</span> TileLoadIterator&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits,</div><div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>,</div><div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;                           Index_,</div><div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA::WmmaMatrix,</div><div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">IteratorFragment::kWmmaMatrix</a>&gt;</div><div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;      SharedLoadIteratorA;</div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;  <span class="keyword">typedef</span> SharedLoadStream&lt;SharedLoadIteratorA&gt; SharedLoadStreamA;</div><div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;  <span class="keyword">typedef</span> TileLoadIterator&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits,</div><div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>,</div><div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;                           Index_,</div><div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB::WmmaMatrix,</div><div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">IteratorFragment::kWmmaMatrix</a>&gt;</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;      SharedLoadIteratorB;</div><div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;  <span class="keyword">typedef</span> SharedLoadStream&lt;SharedLoadIteratorB&gt; SharedLoadStreamB;</div><div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;</div><div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">GemmConfig::MultiplyAdd</a> MultiplyAdd;</div><div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;  <span class="keyword">typedef</span> ClearAccumulators&lt;typename MultiplyAdd::ScalarC&gt; ClearAccumulators;</div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;</div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;  <span class="keyword">typedef</span> WmmaGemmEpilogueTraitsHelper&lt;GemmConfig, EpilogueFunctor_, Index_&gt; EpilogueTraitsHelper;</div><div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;  <span class="keyword">typedef</span> SimplifiedGemmEpilogueTraits&lt;GemmConfig, EpilogueFunctor_, Index_, EpilogueTraitsHelper&gt;</div><div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;      GemmEpilogueTraits;</div><div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;  <span class="keyword">typedef</span> GemmEpilogue&lt;GemmEpilogueTraits&gt; Epilogue;</div><div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;};</div><div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;</div><div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;</div><div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputTile_, <span class="keyword">typename</span> DefaultShape_ = Shape&lt;64, 32, 64&gt; &gt;</div><div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;<span class="keyword">struct </span>WmmaGemmAccumulatorsPerWarp {</div><div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">ShapeMin&lt;OutputTile_, DefaultShape_&gt;::Shape</a> Shape;</div><div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;};</div><div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;</div><div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;</div><div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;    <span class="keyword">typename</span> OutputTile_ = Shape&lt;64, 128, 128&gt;,</div><div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;    <span class="keyword">typename</span> ScalarC_ = float,</div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = LinearScaling&lt;ScalarC_&gt;,</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;    <span class="keyword">typename</span> Accumulator_ = ScalarC_,</div><div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;    <span class="keyword">typename</span> AccumulatorsPerWarp_ = <span class="keyword">typename</span> WmmaGemmAccumulatorsPerWarp&lt;OutputTile_&gt;::Shape,</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;    <span class="keyword">typename</span> InstructionShape_ = Shape&lt;16, 16, 16&gt;,</div><div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 8,</div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 8,</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;    <span class="keyword">typename</span> Helper_ = WmmaGemmTraitsHelper&lt;kLayoutA_,</div><div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;                                            kLayoutB_,</div><div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;                                            OutputTile_,</div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;                                            ScalarC_,</div><div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;                                            Accumulator_,</div><div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;                                            EpilogueFunctor_,</div><div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;                                            AccumulatorsPerWarp_,</div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;                                            InstructionShape_,</div><div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;                                            kScalarsPerLdgA_,</div><div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;                                            kScalarsPerLdgB_,</div><div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;                                            Index_&gt; &gt;</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;<span class="keyword">struct </span>WmmaGemmTraits : <span class="keyword">public</span> GemmTraits&lt;</div><div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;                            <span class="comment">// The config.</span></div><div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;                            typename Helper_::GemmConfig,</div><div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;                            <span class="comment">// The stream to load A from global memory to shared memory.</span></div><div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;                            typename Helper_::GlobalLoadStreamA,</div><div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;                            <span class="comment">// The stream to load B from global memory to shared memory.</span></div><div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;                            typename Helper_::GlobalLoadStreamB,</div><div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;                            <span class="comment">// The stream to load A from shared memory.</span></div><div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;                            typename Helper_::SharedLoadStreamA,</div><div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;                            <span class="comment">// The stream to load B from shared memory.</span></div><div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;                            typename Helper_::SharedLoadStreamB,</div><div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;                            <span class="comment">// The epilogue.</span></div><div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;                            typename Helper_::Epilogue,</div><div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;                            <span class="comment">// The block swizzle to reorganize the grid.</span></div><div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;                            IdentityBlockSwizzle,</div><div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;                            <span class="comment">// The index.</span></div><div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;                            Index_,</div><div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;                            <span class="comment">// The tool used to clear accumulators.</span></div><div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;                            typename Helper_::ClearAccumulators&gt; {};</div><div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;</div><div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;</div><div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;</div><div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="wmma__matrix_8h_html"><div class="ttname"><a href="wmma__matrix_8h.html">wmma_matrix.h</a></div><div class="ttdoc">Abstractions for loading and storing matrices using the CUDA WMMA API. </div></div>
-<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_a8669096ddbb8c810fb8d2313d62e6ee7"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#a8669096ddbb8c810fb8d2313d62e6ee7">cutlass::gemm::GemmConfig::MultiplyAdd</a></div><div class="ttdeci">MultiplyAdd_ MultiplyAdd</div><div class="ttdoc">The functor to do D = A*B + C. </div><div class="ttdef"><b>Definition:</b> gemm_traits.h:93</div></div>
-<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:42</div></div>
+<a href="wmma__gemm__traits_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="wmma__matrix_8h.html">cutlass/wmma_matrix.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="convert_8h.html">cutlass/convert.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm_8h.html">cutlass/gemm/gemm.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue_8h.html">cutlass/gemm/gemm_epilogue.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__epilogue__traits_8h.html">cutlass/gemm/gemm_epilogue_traits.h</a>&quot;</span></div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__global__tile_8h.html">cutlass/gemm/gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__shared__tile_8h.html">cutlass/gemm/gemm_shared_tile.h</a>&quot;</span></div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="gemm__traits_8h.html">cutlass/gemm/gemm_traits.h</a>&quot;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="wmma__gemm__epilogue__traits_8h.html">cutlass/gemm/wmma_gemm_epilogue_traits.h</a>&quot;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="wmma__gemm__global__tile_8h.html">cutlass/gemm/wmma_gemm_global_tile.h</a>&quot;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="wmma__gemm__multiply__add_8h.html">cutlass/gemm/wmma_gemm_multiply_add.h</a>&quot;</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">namespace </span>gemm {</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;    <span class="keyword">typename</span> ScalarA_,</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <span class="keyword">typename</span> ScalarB_,</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keyword">typename</span> Accumulator_,</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keyword">typename</span> WarpGemmShape_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="keyword">typename</span> InstructionShape_,</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_,</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_&gt;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="keyword">struct </span>WmmaGemmConfig : <span class="keyword">public</span> GemmConfig&lt;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;                            ScalarA_,</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;                            ScalarB_,</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;                            ScalarC_,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;                            ScalarC_,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;                            OutputTile_,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;                            WmmaGemmMultiplyAdd&lt;kLayoutA_,</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;                                                ScalarA_,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;                                                kLayoutB_,</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;                                                ScalarB_,</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;                                                MatrixLayout::kColumnMajor,</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;                                                Accumulator_,</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;                                                WarpGemmShape_,</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;                                                InstructionShape_&gt;,</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;                            kScalarsPerLdgA_,</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;                            kScalarsPerLdgA_,</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;                            8,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;                            kScalarsPerLdgB_,</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;                            kScalarsPerLdgB_,</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;                            8,</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;                            16 / sizeof(ScalarC_),</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;                            16 / sizeof(Accumulator_),</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;                            16 / sizeof(Accumulator_),</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;                            1,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                            false,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                            true,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                            false&gt; {};</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">enum</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;          <span class="keyword">typename</span> GemmConfig_,</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;          <span class="keyword">typename</span> ScalarA_&gt;</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperA {};</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> ScalarA_&gt;</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperA&lt;MatrixLayout::kColumnMajor, GemmConfig_, ScalarA_&gt;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    : <span class="keyword">public</span> GemmTileTraitsHelperA&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  <span class="keyword">typedef</span> GemmTileTraitsHelperA&lt;MatrixLayout::kColumnMajor, GemmConfig_&gt; Base;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(<span class="keyword">typename</span> Base::MultiplyAddScalar);</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;                GemmConfig_::OutputTile::kD,</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;                GemmConfig_::OutputTile::kW + kSkew&gt;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;      Tile;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;                     <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;      <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;      Tile,</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;      <span class="keyword">typename</span> Base::GlobalTileTraits::Threads,</div><div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;      GemmConfig_::kScalarsPerStsA&gt;</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerIteration = Tile::kW * GemmConfig_::InstructionShape::kD;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileATraits&lt;</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;      <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;      Tile,</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;      GemmConfig_::InstructionShape::kW,</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW&gt;,</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;      Shape&lt;kScalarsPerIteration, 0, kScalarsPerW, 0&gt;,</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;};</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> ScalarA_&gt;</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperA&lt;MatrixLayout::kRowMajor, GemmConfig_, ScalarA_&gt; {</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarA Scalar;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;                     MultiplyAddScalar,</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;      <span class="comment">// That&#39;s A.</span></div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;      Shape&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;      GemmConfig_::kScalarsPerLdgA&gt;</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;                GemmConfig_::OutputTile::kW,</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;                GemmConfig_::OutputTile::kD + kSkew&gt;</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;      Tile;</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;      Tile,</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;      GemmConfig_::kScalarsPerStsA&gt;</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;</div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileATraits&lt;</div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;      Tile,</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;      GemmConfig_::InstructionShape::kW * Tile::kW,</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW&gt;,</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;};</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div><div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div><div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperA&lt;MatrixLayout::kRowMajor, GemmConfig_, Vector&lt;bin1_t, 32&gt; &gt; {</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarA Scalar;</div><div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar;</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kBitsPerScalar = <span class="keyword">sizeof</span>(Scalar) * 8;</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;                     Vector&lt;bin1_t, 32&gt;,</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div><div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;      <span class="comment">// That&#39;s A.</span></div><div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD / kBitsPerScalar&gt;,</div><div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kBitsPerScalar),</div><div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;            GemmConfig_::OutputTile::kD / kBitsPerScalar&gt;,</div><div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;      GemmConfig_::kScalarsPerLdgA / kBitsPerScalar&gt;</div><div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;</div><div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;                GemmConfig_::OutputTile::kW,</div><div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;                GemmConfig_::OutputTile::kD / kBitsPerScalar + kSkew&gt;</div><div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;      Tile;</div><div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div><div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;      Tile,</div><div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;      GemmConfig_::kScalarsPerStsA / kBitsPerScalar&gt;</div><div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;</div><div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;</div><div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileATraits&lt;</div><div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;      Tile,</div><div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;      GemmConfig_::InstructionShape::kW * Tile::kW,</div><div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW&gt;,</div><div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD / kBitsPerScalar, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;};</div><div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div><div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div><div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperA&lt;MatrixLayout::kRowMajor, GemmConfig_, Vector&lt;uint4_t, 8&gt; &gt; {</div><div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;</div><div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarA Scalar;</div><div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar;</div><div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;</div><div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kInt4PerScalar = <span class="keyword">sizeof</span>(Scalar) * 2;</div><div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;</div><div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;                     Vector&lt;uint4_t, 8&gt;,</div><div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;</div><div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;      <span class="comment">// That&#39;s A.</span></div><div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD / kInt4PerScalar&gt;,</div><div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kInt4PerScalar),</div><div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;            GemmConfig_::OutputTile::kD / kInt4PerScalar&gt;,</div><div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;      GemmConfig_::kScalarsPerLdgA / kInt4PerScalar&gt;</div><div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;</div><div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;                GemmConfig_::OutputTile::kW,</div><div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;                GemmConfig_::OutputTile::kD / kInt4PerScalar + kSkew&gt;</div><div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;      Tile;</div><div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;</div><div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;      Tile,</div><div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;      GemmConfig_::kScalarsPerStsA / kInt4PerScalar&gt;</div><div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;</div><div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;</div><div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileATraits&lt;</div><div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;      Tile,</div><div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;      GemmConfig_::InstructionShape::kW * Tile::kW,</div><div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW&gt;,</div><div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD / kInt4PerScalar, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;};</div><div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;</div><div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;</div><div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperA&lt;MatrixLayout::kRowMajor, GemmConfig_, Vector&lt;int4_t, 8&gt; &gt; {</div><div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;</div><div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarA Scalar;</div><div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarA MultiplyAddScalar;</div><div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;</div><div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kInt4PerScalar = <span class="keyword">sizeof</span>(Scalar) * 2;</div><div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;</div><div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;                     Vector&lt;int4_t, 8&gt;,</div><div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;</div><div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;      <span class="comment">// That&#39;s A.</span></div><div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kW, GemmConfig_::OutputTile::kD / kInt4PerScalar&gt;,</div><div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kInt4PerScalar),</div><div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;            GemmConfig_::OutputTile::kD / kInt4PerScalar&gt;,</div><div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;      GemmConfig_::kScalarsPerLdgA / kInt4PerScalar&gt;</div><div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;</div><div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;                GemmConfig_::OutputTile::kW,</div><div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;                GemmConfig_::OutputTile::kD / kInt4PerScalar + kSkew&gt;</div><div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;      Tile;</div><div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;</div><div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;      Tile,</div><div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;      GemmConfig_::kScalarsPerStsA / kInt4PerScalar&gt;</div><div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;</div><div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kW * GemmConfig_::Warps::kW;</div><div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileATraits&lt;</div><div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;      Tile,</div><div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;      GemmConfig_::InstructionShape::kW * Tile::kW,</div><div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kW / kScalarsPerW&gt;,</div><div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD / kInt4PerScalar, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;};</div><div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;</div><div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;</div><div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">enum</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;          <span class="keyword">typename</span> GemmConfig_,</div><div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;          <span class="keyword">typename</span> ScalarB_&gt;</div><div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperB {};</div><div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;</div><div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;</div><div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> ScalarB_&gt;</div><div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperB&lt;MatrixLayout::kRowMajor, GemmConfig_, ScalarB_&gt;</div><div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;    : <span class="keyword">public</span> GemmTileTraitsHelperB&lt;MatrixLayout::kRowMajor, GemmConfig_&gt; {</div><div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;  <span class="keyword">typedef</span> GemmTileTraitsHelperB&lt;MatrixLayout::kRowMajor, GemmConfig_&gt; Base;</div><div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;</div><div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(<span class="keyword">typename</span> Base::MultiplyAddScalar);</div><div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;                GemmConfig_::OutputTile::kD,</div><div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;                GemmConfig_::OutputTile::kH + kSkew&gt;</div><div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;      Tile;</div><div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;</div><div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;                     <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;</div><div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;      <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;      Tile,</div><div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;      <span class="keyword">typename</span> Base::GlobalTileTraits::Threads,</div><div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;      GemmConfig_::kScalarsPerStsB&gt;</div><div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;</div><div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;</div><div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerIteration = Tile::kW * GemmConfig_::InstructionShape::kD;</div><div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileBTraits&lt;</div><div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>,</div><div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;      <span class="keyword">typename</span> Base::MultiplyAddScalar,</div><div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;      <span class="comment">// The output tile size.</span></div><div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;      Tile,</div><div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;      GemmConfig_::InstructionShape::kH,</div><div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW&gt;,</div><div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;      Shape&lt;kScalarsPerIteration, 0, kScalarsPerW, 0&gt;,</div><div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;};</div><div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;</div><div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;</div><div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_, <span class="keyword">typename</span> ScalarB_&gt;</div><div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperB&lt;MatrixLayout::kColumnMajor, GemmConfig_, ScalarB_&gt; {</div><div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;</div><div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarB Scalar;</div><div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar;</div><div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;</div><div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;                     MultiplyAddScalar,</div><div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;</div><div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;      <span class="comment">// That&#39;s B.</span></div><div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;      Shape&lt;1, GemmConfig_::kThreads / GemmConfig_::OutputTile::kD, GemmConfig_::OutputTile::kD&gt;,</div><div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;      GemmConfig_::kScalarsPerLdgB&gt;</div><div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;</div><div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;                GemmConfig_::OutputTile::kH,</div><div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;                GemmConfig_::OutputTile::kD + kSkew&gt;</div><div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;      Tile;</div><div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;</div><div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;      Tile,</div><div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;      GemmConfig_::kScalarsPerStsB&gt;</div><div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;</div><div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;</div><div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileBTraits&lt;</div><div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;      Tile,</div><div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;      GemmConfig_::InstructionShape::kH * Tile::kW,</div><div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW&gt;,</div><div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;};</div><div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;</div><div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;</div><div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperB&lt;MatrixLayout::kColumnMajor, GemmConfig_, Vector&lt;bin1_t, 32&gt; &gt; {</div><div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;</div><div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarB Scalar;</div><div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar;</div><div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;</div><div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kBitsPerScalar = <span class="keyword">sizeof</span>(Scalar) * 8;</div><div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;</div><div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;                     Vector&lt;bin1_t, 32&gt;,</div><div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;</div><div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;      <span class="comment">// That&#39;s B.</span></div><div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD / kBitsPerScalar&gt;,</div><div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kBitsPerScalar),</div><div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;            GemmConfig_::OutputTile::kD / kBitsPerScalar&gt;,</div><div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;      GemmConfig_::kScalarsPerLdgB / kBitsPerScalar&gt;</div><div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;</div><div class="line"><a name="l00714"></a><span class="lineno">  714</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;                GemmConfig_::OutputTile::kH,</div><div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;                GemmConfig_::OutputTile::kD / kBitsPerScalar + kSkew&gt;</div><div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;      Tile;</div><div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;</div><div class="line"><a name="l00722"></a><span class="lineno">  722</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00723"></a><span class="lineno">  723</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00725"></a><span class="lineno">  725</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;      Tile,</div><div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;      GemmConfig_::kScalarsPerStsB / kBitsPerScalar&gt;</div><div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;</div><div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;</div><div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileBTraits&lt;</div><div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;      Tile,</div><div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;      GemmConfig_::InstructionShape::kH * Tile::kW,</div><div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW&gt;,</div><div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD / kBitsPerScalar, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;};</div><div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;</div><div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;</div><div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperB&lt;MatrixLayout::kColumnMajor, GemmConfig_, Vector&lt;uint4_t, 8&gt; &gt; {</div><div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;</div><div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarB Scalar;</div><div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar;</div><div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;</div><div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kInt4PerScalar = <span class="keyword">sizeof</span>(Scalar) * 2;</div><div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;</div><div class="line"><a name="l00776"></a><span class="lineno">  776</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00778"></a><span class="lineno">  778</span>&#160;                     Vector&lt;uint4_t, 8&gt;,</div><div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00780"></a><span class="lineno">  780</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;</div><div class="line"><a name="l00783"></a><span class="lineno">  783</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;      <span class="comment">// That&#39;s B.</span></div><div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD / kInt4PerScalar&gt;,</div><div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00793"></a><span class="lineno">  793</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kInt4PerScalar),</div><div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;            GemmConfig_::OutputTile::kD / kInt4PerScalar&gt;,</div><div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;      GemmConfig_::kScalarsPerLdgB / kInt4PerScalar&gt;</div><div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;</div><div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160;                GemmConfig_::OutputTile::kH,</div><div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;                GemmConfig_::OutputTile::kD / kInt4PerScalar + kSkew&gt;</div><div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;      Tile;</div><div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;</div><div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00812"></a><span class="lineno">  812</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00813"></a><span class="lineno">  813</span>&#160;      Tile,</div><div class="line"><a name="l00814"></a><span class="lineno">  814</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00815"></a><span class="lineno">  815</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00816"></a><span class="lineno">  816</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;      GemmConfig_::kScalarsPerStsB / kInt4PerScalar&gt;</div><div class="line"><a name="l00818"></a><span class="lineno">  818</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00819"></a><span class="lineno">  819</span>&#160;</div><div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;</div><div class="line"><a name="l00823"></a><span class="lineno">  823</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileBTraits&lt;</div><div class="line"><a name="l00824"></a><span class="lineno">  824</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00825"></a><span class="lineno">  825</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00826"></a><span class="lineno">  826</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00827"></a><span class="lineno">  827</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00828"></a><span class="lineno">  828</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00829"></a><span class="lineno">  829</span>&#160;      Tile,</div><div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00831"></a><span class="lineno">  831</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00832"></a><span class="lineno">  832</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00833"></a><span class="lineno">  833</span>&#160;      GemmConfig_::InstructionShape::kH * Tile::kW,</div><div class="line"><a name="l00834"></a><span class="lineno">  834</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00835"></a><span class="lineno">  835</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW&gt;,</div><div class="line"><a name="l00836"></a><span class="lineno">  836</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00837"></a><span class="lineno">  837</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD / kInt4PerScalar, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00838"></a><span class="lineno">  838</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00839"></a><span class="lineno">  839</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00840"></a><span class="lineno">  840</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00841"></a><span class="lineno">  841</span>&#160;};</div><div class="line"><a name="l00842"></a><span class="lineno">  842</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00843"></a><span class="lineno">  843</span>&#160;</div><div class="line"><a name="l00845"></a><span class="lineno">  845</span>&#160;</div><div class="line"><a name="l00846"></a><span class="lineno">  846</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00847"></a><span class="lineno">  847</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> GemmConfig_&gt;</div><div class="line"><a name="l00849"></a><span class="lineno">  849</span>&#160;<span class="keyword">struct </span>WmmaGemmTileTraitsHelperB&lt;MatrixLayout::kColumnMajor, GemmConfig_, Vector&lt;int4_t, 8&gt; &gt; {</div><div class="line"><a name="l00851"></a><span class="lineno">  851</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>;</div><div class="line"><a name="l00852"></a><span class="lineno">  852</span>&#160;</div><div class="line"><a name="l00854"></a><span class="lineno">  854</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::ScalarB Scalar;</div><div class="line"><a name="l00856"></a><span class="lineno">  856</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> GemmConfig_::MultiplyAdd::ScalarB MultiplyAddScalar;</div><div class="line"><a name="l00857"></a><span class="lineno">  857</span>&#160;</div><div class="line"><a name="l00860"></a><span class="lineno">  860</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kInt4PerScalar = <span class="keyword">sizeof</span>(Scalar) * 2;</div><div class="line"><a name="l00861"></a><span class="lineno">  861</span>&#160;</div><div class="line"><a name="l00863"></a><span class="lineno">  863</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00864"></a><span class="lineno">  864</span>&#160;                     <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00865"></a><span class="lineno">  865</span>&#160;                     Vector&lt;int4_t, 8&gt;,</div><div class="line"><a name="l00866"></a><span class="lineno">  866</span>&#160;                     <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00867"></a><span class="lineno">  867</span>&#160;      WmmaMatrix;</div><div class="line"><a name="l00868"></a><span class="lineno">  868</span>&#160;</div><div class="line"><a name="l00870"></a><span class="lineno">  870</span>&#160;  <span class="keyword">typedef</span> GemmGlobalTileTraits&lt;</div><div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160;      <span class="comment">// That&#39;s B.</span></div><div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160;      <a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;      <span class="comment">// A is row-major.</span></div><div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;      <span class="comment">// The pointer is float const.</span></div><div class="line"><a name="l00876"></a><span class="lineno">  876</span>&#160;      Scalar <span class="keyword">const</span>,</div><div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;      Shape&lt;1, GemmConfig_::OutputTile::kH, GemmConfig_::OutputTile::kD / kInt4PerScalar&gt;,</div><div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160;      Shape&lt;1,</div><div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;            GemmConfig_::kThreads / (GemmConfig_::OutputTile::kD / kInt4PerScalar),</div><div class="line"><a name="l00882"></a><span class="lineno">  882</span>&#160;            GemmConfig_::OutputTile::kD / kInt4PerScalar&gt;,</div><div class="line"><a name="l00883"></a><span class="lineno">  883</span>&#160;      <span class="comment">// The number of scalars per LDG (LDG.32 or LDG.128, etc).</span></div><div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;      GemmConfig_::kScalarsPerLdgB / kInt4PerScalar&gt;</div><div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;      GlobalTileTraits;</div><div class="line"><a name="l00886"></a><span class="lineno">  886</span>&#160;</div><div class="line"><a name="l00888"></a><span class="lineno">  888</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kSkew = 16 / <span class="keyword">sizeof</span>(MultiplyAddScalar);</div><div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;  <span class="keyword">typedef</span> Shape&lt;GemmConfig_::kStages,</div><div class="line"><a name="l00891"></a><span class="lineno">  891</span>&#160;                GemmConfig_::OutputTile::kH,</div><div class="line"><a name="l00892"></a><span class="lineno">  892</span>&#160;                GemmConfig_::OutputTile::kD / kInt4PerScalar + kSkew&gt;</div><div class="line"><a name="l00893"></a><span class="lineno">  893</span>&#160;      Tile;</div><div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160;</div><div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;  <span class="keyword">typedef</span> GemmSharedStoreTileAbTraits&lt;</div><div class="line"><a name="l00897"></a><span class="lineno">  897</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00898"></a><span class="lineno">  898</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00899"></a><span class="lineno">  899</span>&#160;      <span class="comment">// The tile has size KxM in GEMM&#39;s terminology.</span></div><div class="line"><a name="l00900"></a><span class="lineno">  900</span>&#160;      Tile,</div><div class="line"><a name="l00901"></a><span class="lineno">  901</span>&#160;      <span class="comment">// The threads are distributed as warps x 32 (the traits may reorganize).</span></div><div class="line"><a name="l00902"></a><span class="lineno">  902</span>&#160;      <span class="keyword">typename</span> GlobalTileTraits::Threads,</div><div class="line"><a name="l00903"></a><span class="lineno">  903</span>&#160;      <span class="comment">// The number of scalars per STS (STS.32 or STS.128, etc).</span></div><div class="line"><a name="l00904"></a><span class="lineno">  904</span>&#160;      GemmConfig_::kScalarsPerStsB / kInt4PerScalar&gt;</div><div class="line"><a name="l00905"></a><span class="lineno">  905</span>&#160;      SharedStoreTileTraits;</div><div class="line"><a name="l00906"></a><span class="lineno">  906</span>&#160;</div><div class="line"><a name="l00908"></a><span class="lineno">  908</span>&#160;  <span class="keyword">static</span> <span class="keywordtype">int</span> <span class="keyword">const</span> kScalarsPerW = GemmConfig_::InstructionShape::kH * GemmConfig_::Warps::kH;</div><div class="line"><a name="l00910"></a><span class="lineno">  910</span>&#160;  <span class="keyword">typedef</span> WmmaGemmSharedLoadTileBTraits&lt;</div><div class="line"><a name="l00911"></a><span class="lineno">  911</span>&#160;      <span class="comment">// The layout of the matrix.</span></div><div class="line"><a name="l00912"></a><span class="lineno">  912</span>&#160;      <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">MatrixLayout::kColumnMajor</a>,</div><div class="line"><a name="l00913"></a><span class="lineno">  913</span>&#160;      <span class="comment">// The pointer.</span></div><div class="line"><a name="l00914"></a><span class="lineno">  914</span>&#160;      MultiplyAddScalar,</div><div class="line"><a name="l00915"></a><span class="lineno">  915</span>&#160;      <span class="comment">// The tile in shared memory.</span></div><div class="line"><a name="l00916"></a><span class="lineno">  916</span>&#160;      Tile,</div><div class="line"><a name="l00917"></a><span class="lineno">  917</span>&#160;      <span class="comment">// The number of warps.</span></div><div class="line"><a name="l00918"></a><span class="lineno">  918</span>&#160;      <span class="keyword">typename</span> GemmConfig_::Warps,</div><div class="line"><a name="l00919"></a><span class="lineno">  919</span>&#160;      <span class="comment">// The strides between warps.</span></div><div class="line"><a name="l00920"></a><span class="lineno">  920</span>&#160;      GemmConfig_::InstructionShape::kH * Tile::kW,</div><div class="line"><a name="l00921"></a><span class="lineno">  921</span>&#160;      <span class="comment">// The number of iterations to load the data.</span></div><div class="line"><a name="l00922"></a><span class="lineno">  922</span>&#160;      Shape&lt;1, 1, GemmConfig_::OutputTile::kH / kScalarsPerW&gt;,</div><div class="line"><a name="l00923"></a><span class="lineno">  923</span>&#160;      <span class="comment">// The stride between iterations.</span></div><div class="line"><a name="l00924"></a><span class="lineno">  924</span>&#160;      Shape&lt;GemmConfig_::InstructionShape::kD / kInt4PerScalar, 0, kScalarsPerW * Tile::kW&gt;,</div><div class="line"><a name="l00925"></a><span class="lineno">  925</span>&#160;      <span class="comment">// The shape of the instruction.</span></div><div class="line"><a name="l00926"></a><span class="lineno">  926</span>&#160;      <span class="keyword">typename</span> GemmConfig_::InstructionShape&gt;</div><div class="line"><a name="l00927"></a><span class="lineno">  927</span>&#160;      SharedLoadTileTraits;</div><div class="line"><a name="l00928"></a><span class="lineno">  928</span>&#160;};</div><div class="line"><a name="l00929"></a><span class="lineno">  929</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00930"></a><span class="lineno">  930</span>&#160;</div><div class="line"><a name="l00932"></a><span class="lineno">  932</span>&#160;</div><div class="line"><a name="l00933"></a><span class="lineno">  933</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l00935"></a><span class="lineno">  935</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l00937"></a><span class="lineno">  937</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l00939"></a><span class="lineno">  939</span>&#160;    <span class="keyword">typename</span> OutputTile_,</div><div class="line"><a name="l00941"></a><span class="lineno">  941</span>&#160;    <span class="keyword">typename</span> ScalarA_,</div><div class="line"><a name="l00943"></a><span class="lineno">  943</span>&#160;    <span class="keyword">typename</span> ScalarB_,</div><div class="line"><a name="l00945"></a><span class="lineno">  945</span>&#160;    <span class="keyword">typename</span> ScalarC_,</div><div class="line"><a name="l00947"></a><span class="lineno">  947</span>&#160;    <span class="keyword">typename</span> Accumulator_,</div><div class="line"><a name="l00949"></a><span class="lineno">  949</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_,</div><div class="line"><a name="l00951"></a><span class="lineno">  951</span>&#160;    <span class="keyword">typename</span> WarpGemmShape_,</div><div class="line"><a name="l00953"></a><span class="lineno">  953</span>&#160;    <span class="keyword">typename</span> InstructionShape_,</div><div class="line"><a name="l00955"></a><span class="lineno">  955</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_,</div><div class="line"><a name="l00957"></a><span class="lineno">  957</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_,</div><div class="line"><a name="l00959"></a><span class="lineno">  959</span>&#160;    <span class="keyword">typename</span> Index_&gt;</div><div class="line"><a name="l00960"></a><span class="lineno">  960</span>&#160;<span class="keyword">struct </span>WmmaGemmTraitsHelper {</div><div class="line"><a name="l00962"></a><span class="lineno">  962</span>&#160;  <span class="keyword">typedef</span> WmmaGemmConfig&lt;kLayoutA_,</div><div class="line"><a name="l00963"></a><span class="lineno">  963</span>&#160;                         kLayoutB_,</div><div class="line"><a name="l00964"></a><span class="lineno">  964</span>&#160;                         OutputTile_,</div><div class="line"><a name="l00965"></a><span class="lineno">  965</span>&#160;                         ScalarA_,</div><div class="line"><a name="l00966"></a><span class="lineno">  966</span>&#160;                         ScalarB_,</div><div class="line"><a name="l00967"></a><span class="lineno">  967</span>&#160;                         ScalarC_,</div><div class="line"><a name="l00968"></a><span class="lineno">  968</span>&#160;                         Accumulator_,</div><div class="line"><a name="l00969"></a><span class="lineno">  969</span>&#160;                         WarpGemmShape_,</div><div class="line"><a name="l00970"></a><span class="lineno">  970</span>&#160;                         InstructionShape_,</div><div class="line"><a name="l00971"></a><span class="lineno">  971</span>&#160;                         kScalarsPerLdgA_,</div><div class="line"><a name="l00972"></a><span class="lineno">  972</span>&#160;                         kScalarsPerLdgB_&gt;</div><div class="line"><a name="l00973"></a><span class="lineno">  973</span>&#160;      GemmConfig;</div><div class="line"><a name="l00974"></a><span class="lineno">  974</span>&#160;</div><div class="line"><a name="l00976"></a><span class="lineno">  976</span>&#160;  <span class="keyword">typedef</span> WmmaGemmTileTraitsHelperA&lt;kLayoutA_, GemmConfig, ScalarA_&gt; GemmTileTraitsHelperA;</div><div class="line"><a name="l00978"></a><span class="lineno">  978</span>&#160;  <span class="keyword">typedef</span> WmmaGemmTileTraitsHelperB&lt;kLayoutB_, GemmConfig, ScalarB_&gt; GemmTileTraitsHelperB;</div><div class="line"><a name="l00979"></a><span class="lineno">  979</span>&#160;</div><div class="line"><a name="l00981"></a><span class="lineno">  981</span>&#160;  <span class="keyword">typedef</span> GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperA::GlobalTileTraits, Index_&gt;</div><div class="line"><a name="l00982"></a><span class="lineno">  982</span>&#160;      GlobalLoadIteratorA;</div><div class="line"><a name="l00984"></a><span class="lineno">  984</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename GlobalLoadIteratorA::Fragment&gt; GlobalTransformerA;</div><div class="line"><a name="l00986"></a><span class="lineno">  986</span>&#160;  <span class="keyword">typedef</span> TileStoreIterator&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits,</div><div class="line"><a name="l00987"></a><span class="lineno">  987</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l00988"></a><span class="lineno">  988</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l00989"></a><span class="lineno">  989</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l00990"></a><span class="lineno">  990</span>&#160;      SharedStoreIteratorA;</div><div class="line"><a name="l00992"></a><span class="lineno">  992</span>&#160;  <span class="keyword">typedef</span> GlobalLoadStream&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">GemmOperand::kA</a>,</div><div class="line"><a name="l00993"></a><span class="lineno">  993</span>&#160;                              GlobalLoadIteratorA,</div><div class="line"><a name="l00994"></a><span class="lineno">  994</span>&#160;                              SharedStoreIteratorA,</div><div class="line"><a name="l00995"></a><span class="lineno">  995</span>&#160;                              GlobalTransformerA&gt;</div><div class="line"><a name="l00996"></a><span class="lineno">  996</span>&#160;      GlobalLoadStreamA;</div><div class="line"><a name="l00997"></a><span class="lineno">  997</span>&#160;</div><div class="line"><a name="l00999"></a><span class="lineno">  999</span>&#160;  <span class="keyword">typedef</span> GemmGlobalIteratorAb&lt;typename GemmTileTraitsHelperB::GlobalTileTraits, Index_&gt;</div><div class="line"><a name="l01000"></a><span class="lineno"> 1000</span>&#160;      GlobalLoadIteratorB;</div><div class="line"><a name="l01001"></a><span class="lineno"> 1001</span>&#160;  <span class="comment">// The default transformer for B.</span></div><div class="line"><a name="l01002"></a><span class="lineno"> 1002</span>&#160;  <span class="keyword">typedef</span> Copy&lt;typename GlobalLoadIteratorB::Fragment&gt; GlobalTransformerB;</div><div class="line"><a name="l01004"></a><span class="lineno"> 1004</span>&#160;  <span class="keyword">typedef</span> TileStoreIterator&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits,</div><div class="line"><a name="l01005"></a><span class="lineno"> 1005</span>&#160;                            <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedStoreTileTraits::Scalar,</div><div class="line"><a name="l01006"></a><span class="lineno"> 1006</span>&#160;                            <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l01007"></a><span class="lineno"> 1007</span>&#160;                            <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>&gt;</div><div class="line"><a name="l01008"></a><span class="lineno"> 1008</span>&#160;      SharedStoreIteratorB;</div><div class="line"><a name="l01010"></a><span class="lineno"> 1010</span>&#160;  <span class="keyword">typedef</span> GlobalLoadStream&lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">GemmOperand::kB</a>,</div><div class="line"><a name="l01011"></a><span class="lineno"> 1011</span>&#160;                              GlobalLoadIteratorB,</div><div class="line"><a name="l01012"></a><span class="lineno"> 1012</span>&#160;                              SharedStoreIteratorB,</div><div class="line"><a name="l01013"></a><span class="lineno"> 1013</span>&#160;                              GlobalTransformerB&gt;</div><div class="line"><a name="l01014"></a><span class="lineno"> 1014</span>&#160;      GlobalLoadStreamB;</div><div class="line"><a name="l01015"></a><span class="lineno"> 1015</span>&#160;</div><div class="line"><a name="l01017"></a><span class="lineno"> 1017</span>&#160;  <span class="keyword">typedef</span> TileLoadIterator&lt;<span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits,</div><div class="line"><a name="l01018"></a><span class="lineno"> 1018</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l01019"></a><span class="lineno"> 1019</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l01020"></a><span class="lineno"> 1020</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>,</div><div class="line"><a name="l01021"></a><span class="lineno"> 1021</span>&#160;                           Index_,</div><div class="line"><a name="l01022"></a><span class="lineno"> 1022</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperA::WmmaMatrix,</div><div class="line"><a name="l01023"></a><span class="lineno"> 1023</span>&#160;                           <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>&gt;</div><div class="line"><a name="l01024"></a><span class="lineno"> 1024</span>&#160;      SharedLoadIteratorA;</div><div class="line"><a name="l01026"></a><span class="lineno"> 1026</span>&#160;  <span class="keyword">typedef</span> SharedLoadStream&lt;SharedLoadIteratorA&gt; SharedLoadStreamA;</div><div class="line"><a name="l01028"></a><span class="lineno"> 1028</span>&#160;  <span class="keyword">typedef</span> TileLoadIterator&lt;<span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits,</div><div class="line"><a name="l01029"></a><span class="lineno"> 1029</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB::SharedLoadTileTraits::Scalar,</div><div class="line"><a name="l01030"></a><span class="lineno"> 1030</span>&#160;                           <a class="code" href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">IteratorAdvance::kH</a>,</div><div class="line"><a name="l01031"></a><span class="lineno"> 1031</span>&#160;                           <a class="code" href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">MemorySpace::kShared</a>,</div><div class="line"><a name="l01032"></a><span class="lineno"> 1032</span>&#160;                           Index_,</div><div class="line"><a name="l01033"></a><span class="lineno"> 1033</span>&#160;                           <span class="keyword">typename</span> GemmTileTraitsHelperB::WmmaMatrix,</div><div class="line"><a name="l01034"></a><span class="lineno"> 1034</span>&#160;                           <a class="code" href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">FragmentElementType::kWmmaMatrix</a>&gt;</div><div class="line"><a name="l01035"></a><span class="lineno"> 1035</span>&#160;      SharedLoadIteratorB;</div><div class="line"><a name="l01037"></a><span class="lineno"> 1037</span>&#160;  <span class="keyword">typedef</span> SharedLoadStream&lt;SharedLoadIteratorB&gt; SharedLoadStreamB;</div><div class="line"><a name="l01038"></a><span class="lineno"> 1038</span>&#160;</div><div class="line"><a name="l01040"></a><span class="lineno"> 1040</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">GemmConfig::MultiplyAdd</a> MultiplyAdd;</div><div class="line"><a name="l01042"></a><span class="lineno"> 1042</span>&#160;  <span class="keyword">typedef</span> ClearAccumulators&lt;typename MultiplyAdd::ScalarC&gt; ClearAccumulators;</div><div class="line"><a name="l01043"></a><span class="lineno"> 1043</span>&#160;</div><div class="line"><a name="l01045"></a><span class="lineno"> 1045</span>&#160;  <span class="keyword">typedef</span> WmmaGemmEpilogueTraitsHelper&lt;GemmConfig, EpilogueFunctor_, Index_&gt; EpilogueTraitsHelper;</div><div class="line"><a name="l01047"></a><span class="lineno"> 1047</span>&#160;  <span class="keyword">typedef</span> SimplifiedGemmEpilogueTraits&lt;GemmConfig, EpilogueFunctor_, Index_, EpilogueTraitsHelper&gt;</div><div class="line"><a name="l01048"></a><span class="lineno"> 1048</span>&#160;      GemmEpilogueTraits;</div><div class="line"><a name="l01050"></a><span class="lineno"> 1050</span>&#160;  <span class="keyword">typedef</span> GemmEpilogue&lt;GemmEpilogueTraits&gt; Epilogue;</div><div class="line"><a name="l01051"></a><span class="lineno"> 1051</span>&#160;};</div><div class="line"><a name="l01052"></a><span class="lineno"> 1052</span>&#160;</div><div class="line"><a name="l01054"></a><span class="lineno"> 1054</span>&#160;</div><div class="line"><a name="l01055"></a><span class="lineno"> 1055</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputTile_, <span class="keyword">typename</span> DefaultShape_ = Shape&lt;64, 32, 64&gt; &gt;</div><div class="line"><a name="l01056"></a><span class="lineno"> 1056</span>&#160;<span class="keyword">struct </span>WmmaGemmAccumulatorsPerWarp {</div><div class="line"><a name="l01057"></a><span class="lineno"> 1057</span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">ShapeMin&lt;OutputTile_, DefaultShape_&gt;::Shape</a> Shape;</div><div class="line"><a name="l01058"></a><span class="lineno"> 1058</span>&#160;};</div><div class="line"><a name="l01059"></a><span class="lineno"> 1059</span>&#160;</div><div class="line"><a name="l01061"></a><span class="lineno"> 1061</span>&#160;</div><div class="line"><a name="l01062"></a><span class="lineno"> 1062</span>&#160;<span class="keyword">template</span> &lt;</div><div class="line"><a name="l01064"></a><span class="lineno"> 1064</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutA_,</div><div class="line"><a name="l01066"></a><span class="lineno"> 1066</span>&#160;    <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayoutB_,</div><div class="line"><a name="l01068"></a><span class="lineno"> 1068</span>&#160;    <span class="keyword">typename</span> OutputTile_ = Shape&lt;64, 128, 128&gt;,</div><div class="line"><a name="l01070"></a><span class="lineno"> 1070</span>&#160;    <span class="keyword">typename</span> ScalarA_ = half,</div><div class="line"><a name="l01072"></a><span class="lineno"> 1072</span>&#160;    <span class="keyword">typename</span> ScalarB_ = half,</div><div class="line"><a name="l01074"></a><span class="lineno"> 1074</span>&#160;    <span class="keyword">typename</span> ScalarC_ = float,</div><div class="line"><a name="l01076"></a><span class="lineno"> 1076</span>&#160;    <span class="keyword">typename</span> EpilogueFunctor_ = LinearScaling&lt;ScalarC_&gt;,</div><div class="line"><a name="l01078"></a><span class="lineno"> 1078</span>&#160;    <span class="keyword">typename</span> Accumulator_ = ScalarC_,</div><div class="line"><a name="l01080"></a><span class="lineno"> 1080</span>&#160;    <span class="keyword">typename</span> WarpGemmShape_ = <span class="keyword">typename</span> WmmaGemmAccumulatorsPerWarp&lt;OutputTile_&gt;::Shape,</div><div class="line"><a name="l01082"></a><span class="lineno"> 1082</span>&#160;    <span class="keyword">typename</span> InstructionShape_ = Shape&lt;16, 16, 16&gt;,</div><div class="line"><a name="l01084"></a><span class="lineno"> 1084</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgA_ = 8,</div><div class="line"><a name="l01086"></a><span class="lineno"> 1086</span>&#160;    <span class="keywordtype">int</span> kScalarsPerLdgB_ = 8,</div><div class="line"><a name="l01088"></a><span class="lineno"> 1088</span>&#160;    <span class="keyword">typename</span> Index_ = int,</div><div class="line"><a name="l01090"></a><span class="lineno"> 1090</span>&#160;    <span class="keyword">typename</span> Helper_ = WmmaGemmTraitsHelper&lt;kLayoutA_,</div><div class="line"><a name="l01091"></a><span class="lineno"> 1091</span>&#160;                                            kLayoutB_,</div><div class="line"><a name="l01092"></a><span class="lineno"> 1092</span>&#160;                                            OutputTile_,</div><div class="line"><a name="l01093"></a><span class="lineno"> 1093</span>&#160;                                            ScalarA_,</div><div class="line"><a name="l01094"></a><span class="lineno"> 1094</span>&#160;                                            ScalarB_,</div><div class="line"><a name="l01095"></a><span class="lineno"> 1095</span>&#160;                                            ScalarC_,</div><div class="line"><a name="l01096"></a><span class="lineno"> 1096</span>&#160;                                            Accumulator_,</div><div class="line"><a name="l01097"></a><span class="lineno"> 1097</span>&#160;                                            EpilogueFunctor_,</div><div class="line"><a name="l01098"></a><span class="lineno"> 1098</span>&#160;                                            WarpGemmShape_,</div><div class="line"><a name="l01099"></a><span class="lineno"> 1099</span>&#160;                                            InstructionShape_,</div><div class="line"><a name="l01100"></a><span class="lineno"> 1100</span>&#160;                                            kScalarsPerLdgA_,</div><div class="line"><a name="l01101"></a><span class="lineno"> 1101</span>&#160;                                            kScalarsPerLdgB_,</div><div class="line"><a name="l01102"></a><span class="lineno"> 1102</span>&#160;                                            Index_&gt; &gt;</div><div class="line"><a name="l01103"></a><span class="lineno"> 1103</span>&#160;<span class="keyword">struct </span>WmmaGemmTraits : <span class="keyword">public</span> GemmTraits&lt;</div><div class="line"><a name="l01104"></a><span class="lineno"> 1104</span>&#160;                            <span class="comment">// The config.</span></div><div class="line"><a name="l01105"></a><span class="lineno"> 1105</span>&#160;                            typename Helper_::GemmConfig,</div><div class="line"><a name="l01106"></a><span class="lineno"> 1106</span>&#160;                            <span class="comment">// The stream to load A from global memory to shared memory.</span></div><div class="line"><a name="l01107"></a><span class="lineno"> 1107</span>&#160;                            typename Helper_::GlobalLoadStreamA,</div><div class="line"><a name="l01108"></a><span class="lineno"> 1108</span>&#160;                            <span class="comment">// The stream to load B from global memory to shared memory.</span></div><div class="line"><a name="l01109"></a><span class="lineno"> 1109</span>&#160;                            typename Helper_::GlobalLoadStreamB,</div><div class="line"><a name="l01110"></a><span class="lineno"> 1110</span>&#160;                            <span class="comment">// The stream to load A from shared memory.</span></div><div class="line"><a name="l01111"></a><span class="lineno"> 1111</span>&#160;                            typename Helper_::SharedLoadStreamA,</div><div class="line"><a name="l01112"></a><span class="lineno"> 1112</span>&#160;                            <span class="comment">// The stream to load B from shared memory.</span></div><div class="line"><a name="l01113"></a><span class="lineno"> 1113</span>&#160;                            typename Helper_::SharedLoadStreamB,</div><div class="line"><a name="l01114"></a><span class="lineno"> 1114</span>&#160;                            <span class="comment">// The epilogue.</span></div><div class="line"><a name="l01115"></a><span class="lineno"> 1115</span>&#160;                            typename Helper_::Epilogue,</div><div class="line"><a name="l01116"></a><span class="lineno"> 1116</span>&#160;                            <span class="comment">// The block swizzle to reorganize the grid.</span></div><div class="line"><a name="l01117"></a><span class="lineno"> 1117</span>&#160;                            IdentityBlockSwizzle,</div><div class="line"><a name="l01118"></a><span class="lineno"> 1118</span>&#160;                            <span class="comment">// The index.</span></div><div class="line"><a name="l01119"></a><span class="lineno"> 1119</span>&#160;                            Index_,</div><div class="line"><a name="l01120"></a><span class="lineno"> 1120</span>&#160;                            <span class="comment">// The tool used to clear accumulators.</span></div><div class="line"><a name="l01121"></a><span class="lineno"> 1121</span>&#160;                            typename Helper_::ClearAccumulators&gt; {};</div><div class="line"><a name="l01122"></a><span class="lineno"> 1122</span>&#160;</div><div class="line"><a name="l01124"></a><span class="lineno"> 1124</span>&#160;</div><div class="line"><a name="l01125"></a><span class="lineno"> 1125</span>&#160;}  <span class="comment">// namespace gemm</span></div><div class="line"><a name="l01126"></a><span class="lineno"> 1126</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l01127"></a><span class="lineno"> 1127</span>&#160;</div><div class="line"><a name="l01128"></a><span class="lineno"> 1128</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="wmma__matrix_8h_html"><div class="ttname"><a href="wmma__matrix_8h.html">wmma_matrix.h</a></div><div class="ttdoc">Abstractions for loading and storing matrices using the CUDA WMMA API. </div></div>
+<div class="ttc" id="structcutlass_1_1MemorySpace_html_a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc"><div class="ttname"><a href="structcutlass_1_1MemorySpace.html#a1e031ec41668015a8fe4ba2c1145d03ca2804339b2be64ff68ae3042073aaa7cc">cutlass::MemorySpace::kShared</a></div><div class="ttdef"><b>Definition:</b> load_store.h:41</div></div>
 <div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
 <div class="ttc" id="gemm__global__tile_8h_html"><div class="ttname"><a href="gemm__global__tile_8h.html">gemm_global_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing to global memory. </div></div>
 <div class="ttc" id="gemm__traits_8h_html"><div class="ttname"><a href="gemm__traits_8h.html">gemm_traits.h</a></div><div class="ttdoc">Defines structural properties of complete GEMM computation. </div></div>
 <div class="ttc" id="wmma__gemm__epilogue__traits_8h_html"><div class="ttname"><a href="wmma__gemm__epilogue__traits_8h.html">wmma_gemm_epilogue_traits.h</a></div><div class="ttdoc">Defines structural properties of WMMA GEMM&amp;#39;s epilogue phase. </div></div>
-<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:62</div></div>
+<div class="ttc" id="structcutlass_1_1FragmentElementType_html_a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd"><div class="ttname"><a href="structcutlass_1_1FragmentElementType.html#a62883b0695dc3a7ff82916ff9d75df0ba6b5ad4d12e12461f93ccab8edb6cd0bd">cutlass::FragmentElementType::kWmmaMatrix</a></div><div class="ttdef"><b>Definition:</b> load_store.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1IteratorAdvance_html_a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81"><div class="ttname"><a href="structcutlass_1_1IteratorAdvance.html#a9ad9c2302ddffa148d47cdcf6c738ddaacfe756fca665eb1bbf389850915c1b81">cutlass::IteratorAdvance::kH</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:65</div></div>
 <div class="ttc" id="gemm__epilogue_8h_html"><div class="ttname"><a href="gemm__epilogue_8h.html">gemm_epilogue.h</a></div><div class="ttdoc">Implements the epilogue phase of the GEMM kernel that efficiently updates global memory with the comp...</div></div>
 <div class="ttc" id="gemm__shared__tile_8h_html"><div class="ttname"><a href="gemm__shared__tile_8h.html">gemm_shared_tile.h</a></div><div class="ttdoc">Defines iterators for efficiently loading and storing tiles to and from shared memory. </div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1IteratorFragment_html_ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419"><div class="ttname"><a href="structcutlass_1_1IteratorFragment.html#ae7b6a9ac856eca8b8e437305fa716a80a21d2b2793bab0d348df40715b8f14419">cutlass::IteratorFragment::kWmmaMatrix</a></div><div class="ttdef"><b>Definition:</b> tile_iterator.h:67</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1gemm_1_1GemmConfig_html_aedb95febe4a0b2943e233c95c36a22cd"><div class="ttname"><a href="structcutlass_1_1gemm_1_1GemmConfig.html#aedb95febe4a0b2943e233c95c36a22cd">cutlass::gemm::GemmConfig::MultiplyAdd</a></div><div class="ttdeci">MultiplyAdd_ MultiplyAdd</div><div class="ttdoc">The functor to do D = A*B + C. </div><div class="ttdef"><b>Definition:</b> gemm_config.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0caad0876342d150cef7da6ae149d5e99f9">cutlass::GemmOperand::kB</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="wmma__gemm__global__tile_8h_html"><div class="ttname"><a href="wmma__gemm__global__tile_8h.html">wmma_gemm_global_tile.h</a></div><div class="ttdoc">Defines tile iterator traits for loading thread block-level tile from global memory. </div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2bac15988acba79c11072d38b295f163a2b">cutlass::MatrixLayout::kColumnMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
 <div class="ttc" id="wmma__gemm__multiply__add_8h_html"><div class="ttname"><a href="wmma__gemm__multiply__add_8h.html">wmma_gemm_multiply_add.h</a></div><div class="ttdoc">Implements warp-level matrix multiply-accumulate operation using CUDA WMMA API. </div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0cac2b9fe9e3679a059d1a6c946b2a2c31a">cutlass::GemmOperand::kA</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="gemm_8h_html"><div class="ttname"><a href="gemm_8h.html">gemm.h</a></div><div class="ttdoc">Implements a software-pipelined efficient GEMM. </div></div>
 <div class="ttc" id="gemm__epilogue__traits_8h_html"><div class="ttname"><a href="gemm__epilogue__traits_8h.html">gemm_epilogue_traits.h</a></div><div class="ttdoc">Defines structural properties of the GEMM epilogue. </div></div>
-<div class="ttc" id="structcutlass_1_1ShapeMin_html_a5c813e4c34ea612431d31b36120f8549"><div class="ttname"><a href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">cutlass::ShapeMin::Shape</a></div><div class="ttdeci">Shape&lt;(A_::kD&lt; B_::kD ? A_::kD :B_::kD),(A_::kH&lt; B_::kH ? A_::kH :B_::kH),(A_::kW&lt; B_::kW ? A_::kW :B_::kW),(A_::kC&lt; B_::kC ? A_::kC :B_::kC)&gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:148</div></div>
+<div class="ttc" id="structcutlass_1_1ShapeMin_html_a5c813e4c34ea612431d31b36120f8549"><div class="ttname"><a href="structcutlass_1_1ShapeMin.html#a5c813e4c34ea612431d31b36120f8549">cutlass::ShapeMin::Shape</a></div><div class="ttdeci">Shape&lt;(A_::kD&lt; B_::kD ? A_::kD :B_::kD),(A_::kH&lt; B_::kH ? A_::kH :B_::kH),(A_::kW&lt; B_::kW ? A_::kW :B_::kW),(A_::kC&lt; B_::kC ? A_::kC :B_::kC)&gt; Shape</div><div class="ttdef"><b>Definition:</b> shape.h:159</div></div>
 <div class="ttc" id="convert_8h_html"><div class="ttname"><a href="convert_8h.html">convert.h</a></div><div class="ttdoc">Defines conversion operations among Fragments of different base type. </div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__matrix_8h.html b/docs/wmma__matrix_8h.html
index fd1ab8cf9..6db6d49e5 100644
--- a/docs/wmma__matrix_8h.html
+++ b/docs/wmma__matrix_8h.html
@@ -84,7 +84,7 @@ $(function() {
 </div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/wmma__matrix_8h_source.html b/docs/wmma__matrix_8h_source.html
index 9e91b6859..d53773faa 100644
--- a/docs/wmma__matrix_8h_source.html
+++ b/docs/wmma__matrix_8h_source.html
@@ -76,19 +76,19 @@ $(function() {
 <div class="title">wmma_matrix.h</div>  </div>
 </div><!--header-->
 <div class="contents">
-<a href="wmma__matrix_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; (!defined(__CUDA_ARCH__) || __CUDA_ARCH__ &gt;= 700)</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="comment">// Dependent header files should use the following macro to guard all code using</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="comment">// nvcuda::wmma:: to enable compilation for CUDA Compute Capabilities &lt; sm_70.</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="comment">// Earlier shader models not support Tensor Cores.</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#define CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;stdio.h&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &lt;crt/mma.h&gt;</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&gt;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="load__store_8h.html">cutlass/load_store.h</a>&gt;</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&gt;</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&gt;</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &lt;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&gt;</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="keyword">template</span> &lt;MatrixLayout::Kind kLayout_&gt;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">struct </span>WmmaLayout {</div><div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;  <span class="keyword">typedef</span> nvcuda::wmma::col_major Layout;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;};</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="keyword">struct </span>WmmaLayout&lt;MatrixLayout::kRowMajor&gt; {</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <span class="keyword">typedef</span> nvcuda::wmma::row_major Layout;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;};</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> kOperand_,</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;          <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="keyword">struct </span>WmmaMatrix {};</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="keyword">template</span> &lt;MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;<span class="keyword">struct </span>WmmaMatrix&lt;GemmOperand::kA, kLayout_, Scalar_, WmmaShape_&gt;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    : <span class="keyword">public</span> nvcuda::wmma::fragment&lt;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;          nvcuda::wmma::matrix_a,</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;          WmmaShape_::kW,</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;          WmmaShape_::kH,</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;          WmmaShape_::kD,</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;          Scalar_,</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;          typename WmmaLayout&lt;kLayout_&gt;::Layout&gt; {</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kA, kLayout_, Scalar_, WmmaShape_&gt; This_;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  CUTLASS_DEVICE This_&amp; operator=(Scalar_ <span class="keyword">const</span>&amp; x) {</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;    nvcuda::wmma::fill_fragment(*<span class="keyword">this</span>, x);</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  }</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> load(Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride) {</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    nvcuda::wmma::load_matrix_sync(*<span class="keyword">this</span>, pointer, stride);</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;  }</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div><div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> store(Scalar_* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride)<span class="keyword"> const </span>{</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    nvcuda::wmma::store_matrix_sync(pointer, *<span class="keyword">this</span>, stride);</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;  }</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;};</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="keyword">template</span> &lt;MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="keyword">struct </span>WmmaMatrix&lt;GemmOperand::kB, kLayout_, Scalar_, WmmaShape_&gt;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    : <span class="keyword">public</span> nvcuda::wmma::fragment&lt;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;          nvcuda::wmma::matrix_b,</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;          WmmaShape_::kW,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;          WmmaShape_::kH,</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;          WmmaShape_::kD,</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;          Scalar_,</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;          typename WmmaLayout&lt;kLayout_&gt;::Layout&gt; {</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kB, kLayout_, Scalar_, WmmaShape_&gt; This_;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;  CUTLASS_DEVICE This_&amp; operator=(Scalar_ <span class="keyword">const</span>&amp; x) {</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    nvcuda::wmma::fill_fragment(*<span class="keyword">this</span>, x);</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  }</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> load(Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride) {</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    nvcuda::wmma::load_matrix_sync(*<span class="keyword">this</span>, pointer, stride);</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> store(Scalar_* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride)<span class="keyword"> const </span>{</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    nvcuda::wmma::store_matrix_sync(pointer, *<span class="keyword">this</span>, stride);</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;  }</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;};</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;<span class="keyword">template</span> &lt;MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="keyword">struct </span>WmmaMatrix&lt;GemmOperand::kC, kLayout_, Scalar_, WmmaShape_&gt;</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    : <span class="keyword">public</span> nvcuda::wmma::fragment&lt;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;          nvcuda::wmma::accumulator,</div><div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;          WmmaShape_::kW,</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;          WmmaShape_::kH,</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;          WmmaShape_::kD,</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;          Scalar_&gt; {</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kC, kLayout_, Scalar_, WmmaShape_&gt; This_;</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = kLayout_;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  CUTLASS_DEVICE This_&amp; operator=(Scalar_ <span class="keyword">const</span>&amp; x) {</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    nvcuda::wmma::fill_fragment(*<span class="keyword">this</span>, x);</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  }</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> load(Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride) {</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    <span class="keywordtype">bool</span> <span class="keyword">const</span> kIsRowMajor = kLayout == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    nvcuda::wmma::load_matrix_sync(</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;        *<span class="keyword">this</span>,</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;        pointer,</div><div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;        stride,</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;        kIsRowMajor ? nvcuda::wmma::mem_row_major : nvcuda::wmma::mem_col_major);</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;  }</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> store(Scalar_* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride)<span class="keyword"> const </span>{</div><div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <span class="keywordtype">bool</span> <span class="keyword">const</span> kIsRowMajor = kLayout == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    nvcuda::wmma::store_matrix_sync(</div><div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;        pointer,</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;        *<span class="keyword">this</span>,</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;        stride,</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;        kIsRowMajor ? nvcuda::wmma::mem_row_major : nvcuda::wmma::mem_col_major);</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;  }</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;};</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="load__store_8h_html"><div class="ttname"><a href="load__store_8h.html">load_store.h</a></div><div class="ttdoc">Defines abstractions for efficiently loading and storing vectors to memory. </div></div>
+<a href="wmma__matrix_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; (!defined(__CUDA_ARCH__) || __CUDA_ARCH__ &gt;= 700)</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#define CUTLASS_USE_WMMA_API</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#if defined(__CUDACC__) &amp;&amp; (__CUDACC_VER_MAJOR__ &gt;= 10) &amp;&amp; (!defined(__CUDA_ARCH__) || __CUDA_ARCH__ &gt;= 750)</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#define CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;stdio.h&quot;</span></div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#if __CUDACC_VER_MAJOR__ &gt;= 10</span></div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &lt;mma.h&gt;</span></div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#else</span></div><div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &lt;crt/mma.h&gt;</span></div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="fragment_8h.html">cutlass/fragment.h</a>&quot;</span></div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="matrix__traits_8h.html">cutlass/matrix_traits.h</a>&quot;</span></div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&quot;</span></div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&quot;</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="keyword">template</span> &lt;MatrixLayout::Kind kLayout_&gt;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="keyword">struct </span>WmmaLayout {</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="keyword">typedef</span> nvcuda::wmma::col_major Layout;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;};</div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;<span class="keyword">template</span> &lt;&gt;</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<span class="keyword">struct </span>WmmaLayout&lt;MatrixLayout::kRowMajor&gt; {</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <span class="keyword">typedef</span> nvcuda::wmma::row_major Layout;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;};</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;</div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Type_&gt;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="keyword">struct </span>WmmaDataType{</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;  <span class="keyword">typedef</span> Type_ Type;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;};</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="preprocessor">#ifdef CUTLASS_USE_SUBBYTE_WMMA</span></div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="keyword">template</span>&lt;&gt;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;<span class="keyword">struct </span>WmmaDataType&lt;Vector&lt;bin1_t, 32&gt; &gt; {</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;  <span class="keyword">typedef</span> nvcuda::wmma::experimental::precision::b1 Type;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;};</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;<span class="keyword">template</span>&lt;&gt;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;<span class="keyword">struct </span>WmmaDataType&lt;Vector&lt;int4_t, 8&gt; &gt; {</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <span class="keyword">typedef</span> nvcuda::wmma::experimental::precision::s4 Type;</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;};</div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;<span class="keyword">template</span>&lt;&gt;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;<span class="keyword">struct </span>WmmaDataType&lt;Vector&lt;uint4_t, 8&gt; &gt; {</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;  <span class="keyword">typedef</span> nvcuda::wmma::experimental::precision::u4 Type;</div><div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;};</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;<span class="preprocessor">#endif</span></div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div><div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> kOperand_,</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;          <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="keyword">struct </span>WmmaMatrix {};</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div><div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="keyword">template</span> &lt;MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;<span class="keyword">struct </span>WmmaMatrix&lt;GemmOperand::kA, kLayout_, Scalar_, WmmaShape_&gt;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    : <span class="keyword">public</span> nvcuda::wmma::fragment&lt;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;          nvcuda::wmma::matrix_a,</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;          WmmaShape_::kW,</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;          WmmaShape_::kH,</div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;          WmmaShape_::kD,</div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;          typename WmmaDataType&lt;Scalar_&gt;::Type,</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;          typename WmmaLayout&lt;kLayout_&gt;::Layout&gt; {</div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kA, kLayout_, Scalar_, WmmaShape_&gt; This_;</div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  CUTLASS_DEVICE This_&amp; operator=(Scalar_ <span class="keyword">const</span>&amp; x) {</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    nvcuda::wmma::fill_fragment(*<span class="keyword">this</span>, x);</div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;  }</div><div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> load(Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride) {</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    nvcuda::wmma::load_matrix_sync(*<span class="keyword">this</span>, pointer, stride);</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;  }</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> store(Scalar_* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride)<span class="keyword"> const </span>{</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    nvcuda::wmma::store_matrix_sync(pointer, *<span class="keyword">this</span>, stride);</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  }</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;};</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="keyword">template</span> &lt;MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="keyword">struct </span>WmmaMatrix&lt;GemmOperand::kB, kLayout_, Scalar_, WmmaShape_&gt;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    : <span class="keyword">public</span> nvcuda::wmma::fragment&lt;</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;          nvcuda::wmma::matrix_b,</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;          WmmaShape_::kW,</div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;          WmmaShape_::kH,</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;          WmmaShape_::kD,</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;          typename WmmaDataType&lt;Scalar_&gt;::Type,</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;          typename WmmaLayout&lt;kLayout_&gt;::Layout&gt; {</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kB, kLayout_, Scalar_, WmmaShape_&gt; This_;</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  CUTLASS_DEVICE This_&amp; operator=(Scalar_ <span class="keyword">const</span>&amp; x) {</div><div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    nvcuda::wmma::fill_fragment(*<span class="keyword">this</span>, x);</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;  }</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> load(Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride) {</div><div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    nvcuda::wmma::load_matrix_sync(*<span class="keyword">this</span>, pointer, stride);</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  }</div><div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> store(Scalar_* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride)<span class="keyword"> const </span>{</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    nvcuda::wmma::store_matrix_sync(pointer, *<span class="keyword">this</span>, stride);</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;  }</div><div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;};</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="keyword">template</span> &lt;MatrixLayout::Kind kLayout_, <span class="keyword">typename</span> Scalar_, <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="keyword">struct </span>WmmaMatrix&lt;GemmOperand::kC, kLayout_, Scalar_, WmmaShape_&gt;</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    : <span class="keyword">public</span> nvcuda::wmma::fragment&lt;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;          nvcuda::wmma::accumulator,</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;          WmmaShape_::kW,</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;          WmmaShape_::kH,</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;          WmmaShape_::kD,</div><div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;          Scalar_&gt; {</div><div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;GemmOperand::kC, kLayout_, Scalar_, WmmaShape_&gt; This_;</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;  <span class="keyword">static</span> <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> <span class="keyword">const</span> kLayout = kLayout_;</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;  CUTLASS_DEVICE This_&amp; operator=(Scalar_ <span class="keyword">const</span>&amp; x) {</div><div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    nvcuda::wmma::fill_fragment(*<span class="keyword">this</span>, x);</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;  }</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> load(Scalar_ <span class="keyword">const</span>* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride) {</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;    <span class="keywordtype">bool</span> <span class="keyword">const</span> kIsRowMajor = kLayout == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;    nvcuda::wmma::load_matrix_sync(</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;        *<span class="keyword">this</span>,</div><div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;        pointer,</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;        stride,</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;        kIsRowMajor ? nvcuda::wmma::mem_row_major : nvcuda::wmma::mem_col_major);</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;  }</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> store(Scalar_* pointer, <span class="keywordtype">int</span> <span class="keyword">const</span> stride)<span class="keyword"> const </span>{</div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;    <span class="keywordtype">bool</span> <span class="keyword">const</span> kIsRowMajor = kLayout == <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">MatrixLayout::kRowMajor</a>;</div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    nvcuda::wmma::store_matrix_sync(</div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        pointer,</div><div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;        *<span class="keyword">this</span>,</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;        stride,</div><div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        kIsRowMajor ? nvcuda::wmma::mem_row_major : nvcuda::wmma::mem_col_major);</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;  }</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;};</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div><div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;<span class="comment">// WmmaMatrix cannot be used in a Union and thus in cannot be used in our Vector implementation.</span></div><div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;<span class="comment">// The only use of WmmaMatrix in in combination with Vectorize has kLanes == 1. Due to this it is</span></div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;<span class="comment">// safe to keep the Vector-&gt;Scalar conversion for WmmaMatrix.</span></div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;<span class="keyword">template</span> &lt;<a class="code" href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">GemmOperand::Kind</a> kOperand_,</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;          <a class="code" href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">MatrixLayout::Kind</a> kLayout_,</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;          <span class="keyword">typename</span> Scalar_,</div><div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;          <span class="keyword">typename</span> WmmaShape_&gt;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;<span class="keyword">struct </span>Vectorize&lt;WmmaMatrix&lt;kOperand_, kLayout_, Scalar_, WmmaShape_&gt;, 1&gt; {</div><div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;  <span class="keyword">typedef</span> WmmaMatrix&lt;kOperand_, kLayout_, Scalar_, WmmaShape_&gt; <a class="code" href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">Type</a>;</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;};</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;}</div><div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;<span class="preprocessor">#endif  // defined CUTLASS_USE_WMMA_API</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2ba6a287c17f9f5bf53528ae68296beeedb">cutlass::MatrixLayout::kRowMajor</a></div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1Vectorize_html_a070ec95f4297d769ee53a4d8a650c05e"><div class="ttname"><a href="structcutlass_1_1Vectorize.html#a070ec95f4297d769ee53a4d8a650c05e">cutlass::Vectorize::Type</a></div><div class="ttdeci">Vector&lt; Element_, kLanes_ &gt; Type</div><div class="ttdef"><b>Definition:</b> vector.h:271</div></div>
 <div class="ttc" id="vector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div><div class="ttdoc">Defines a 1D vector of elements held in the registers of each thread. </div></div>
-<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:36</div></div>
-<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1MatrixLayout_html_a97ef07af21b122c1804245b0c7784d2b"><div class="ttname"><a href="structcutlass_1_1MatrixLayout.html#a97ef07af21b122c1804245b0c7784d2b">cutlass::MatrixLayout::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdoc">Enumeration defining fundamental contiguous layouts. </div><div class="ttdef"><b>Definition:</b> matrix_traits.h:159</div></div>
+<div class="ttc" id="structcutlass_1_1GemmOperand_html_ab209ea3de198efabe8e8707dfe8e0a0c"><div class="ttname"><a href="structcutlass_1_1GemmOperand.html#ab209ea3de198efabe8e8707dfe8e0a0c">cutlass::GemmOperand::Kind</a></div><div class="ttdeci">Kind</div><div class="ttdef"><b>Definition:</b> matrix_traits.h:357</div></div>
 <div class="ttc" id="shape_8h_html"><div class="ttname"><a href="shape_8h.html">shape.h</a></div><div class="ttdoc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects. </div></div>
 <div class="ttc" id="matrix__traits_8h_html"><div class="ttname"><a href="matrix__traits_8h.html">matrix_traits.h</a></div><div class="ttdoc">Defines properties of matrices used to denote layout and operands to GEMM kernels. </div></div>
 <div class="ttc" id="fragment_8h_html"><div class="ttname"><a href="fragment_8h.html">fragment.h</a></div><div class="ttdoc">Defines Fragment, a statically-sized array for storing parts of matrices within a thread&amp;#39;s registers...</div></div>
 </div><!-- fragment --></div><!-- contents -->
 <!-- start footer part -->
 <hr class="footer"/><address class="footer"><small>
-Generated on Thu May 3 2018 16:36:12 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
 <img class="footer" src="doxygen.png" alt="doxygen"/>
 </a> 1.8.14
 </small></address>
diff --git a/docs/zip__fragment_8h.html b/docs/zip__fragment_8h.html
new file mode 100644
index 000000000..0fefe2830
--- /dev/null
+++ b/docs/zip__fragment_8h.html
@@ -0,0 +1,127 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: zip_fragment.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a> &#124;
+<a href="#func-members">Functions</a>  </div>
+  <div class="headertitle">
+<div class="title">zip_fragment.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Models a pair of fragments.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &lt;assert.h&gt;</code><br />
+<code>#include &quot;<a class="el" href="cutlass_8h_source.html">cutlass/cutlass.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="shape_8h_source.html">cutlass/shape.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="cutlass__math_8h_source.html">cutlass/util/cutlass_math.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="vector_8h_source.html">cutlass/vector.h</a>&quot;</code><br />
+</div>
+<p><a href="zip__fragment_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment&lt; First_, Second_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">A template defining <a class="el" href="group__fragment__concept.html">Fragment Concept</a>.  <a href="structcutlass_1_1ZipFragment.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert&lt; First_, Second_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Zips two convert operations.  <a href="structcutlass_1_1ZipConvert.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
+Functions</h2></td></tr>
+<tr class="memitem:a07b0da6c47bbd827779aa871249ff4b6"><td class="memTemplParams" colspan="2">template&lt;typename First , typename Second &gt; </td></tr>
+<tr class="memitem:a07b0da6c47bbd827779aa871249ff4b6"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> ZipFragment&lt; First, Second &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6">cutlass::make_ZipFragment</a> (First const &amp;first, Second const &amp;second)</td></tr>
+<tr class="memdesc:a07b0da6c47bbd827779aa871249ff4b6"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct a <a class="el" href="structcutlass_1_1ZipFragment.html" title="A template defining Fragment Concept. ">ZipFragment</a> object.  <a href="namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6">More...</a><br /></td></tr>
+<tr class="separator:a07b0da6c47bbd827779aa871249ff4b6"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:adad916101ca58fc9714362c611a0cad8"><td class="memTemplParams" colspan="2">template&lt;typename First , typename Second &gt; </td></tr>
+<tr class="memitem:adad916101ca58fc9714362c611a0cad8"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> ZipConvert&lt; First, Second &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#adad916101ca58fc9714362c611a0cad8">cutlass::make_ZipConvert</a> (First const &amp;first, Second const &amp;second)</td></tr>
+<tr class="memdesc:adad916101ca58fc9714362c611a0cad8"><td class="mdescLeft">&#160;</td><td class="mdescRight">Helper to construct a <a class="el" href="structcutlass_1_1ZipConvert.html" title="Zips two convert operations. ">ZipConvert</a> object.  <a href="namespacecutlass.html#adad916101ca58fc9714362c611a0cad8">More...</a><br /></td></tr>
+<tr class="separator:adad916101ca58fc9714362c611a0cad8"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/zip__fragment_8h_source.html b/docs/zip__fragment_8h_source.html
new file mode 100644
index 000000000..c47ae0a3f
--- /dev/null
+++ b/docs/zip__fragment_8h_source.html
@@ -0,0 +1,114 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: zip_fragment.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">zip_fragment.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="zip__fragment_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &lt;assert.h&gt;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass_8h.html">cutlass/cutlass.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="shape_8h.html">cutlass/shape.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="cutlass__math_8h.html">cutlass/util/cutlass_math.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="vector_8h.html">cutlass/vector.h</a>&quot;</span></div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div><div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> First_, <span class="keyword">typename</span> Second_&gt;</div><div class="line"><a name="l00046"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipFragment.html">   46</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ZipFragment.html">ZipFragment</a> {</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">   48</a></span>&#160;  <span class="keyword">typedef</span> First_ <a class="code" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a>;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">   51</a></span>&#160;  <span class="keyword">typedef</span> Second_ <a class="code" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a>;</div><div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div><div class="line"><a name="l00054"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1">   54</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ZipFragment.html">ZipFragment&lt;First, Second&gt;</a> <a class="code" href="structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1">This_</a>;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div><div class="line"><a name="l00061"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">   61</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a> <a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">   64</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a> <a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>;</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div><div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipFragment.html#aeb654423884324b14130a8fa8bc1ab83">   72</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipFragment.html#aeb654423884324b14130a8fa8bc1ab83">ZipFragment</a>() { }</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00076"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipFragment.html#a520318d060123c5870c4153b99cf0427">   76</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipFragment.html#a520318d060123c5870c4153b99cf0427">ZipFragment</a>(<a class="code" href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">First</a> <span class="keyword">const</span> &amp;_first, <a class="code" href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">Second</a> <span class="keyword">const</span> &amp;_second): <a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>(_first), <a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>(_second) { }</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div><div class="line"><a name="l00079"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipFragment.html#aa978dd7fca15ca20e9f52d15e6f8f9c1">   79</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1ZipFragment.html#aa978dd7fca15ca20e9f52d15e6f8f9c1">clear</a>() {</div><div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    <a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>.clear();</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>.clear();</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  }</div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;};</div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div><div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> First, <span class="keyword">typename</span> Second&gt;</div><div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6">   90</a></span>&#160;<a class="code" href="structcutlass_1_1ZipFragment.html">ZipFragment&lt;First, Second&gt;</a> <a class="code" href="namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6">make_ZipFragment</a>(First <span class="keyword">const</span> &amp;first, Second <span class="keyword">const</span> &amp;second) {</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1ZipFragment.html">ZipFragment&lt;First, Second&gt;</a>(first, second);</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;}</div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> First_, <span class="keyword">typename</span> Second_&gt;</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html">   98</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ZipConvert.html">ZipConvert</a> {</div><div class="line"><a name="l00100"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">  100</a></span>&#160;  <span class="keyword">typedef</span> First_ <a class="code" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a>;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div><div class="line"><a name="l00103"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">  103</a></span>&#160;  <span class="keyword">typedef</span> Second_ <a class="code" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a>;</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">  106</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ZipFragment.html">ZipFragment&lt;typename First::InputFragment, typename Second::InputFragment&gt;</a> <a class="code" href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">InputFragment</a>;</div><div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div><div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ZipFragment.html">ZipFragment&lt;typename First::OutputFragment, typename Second::OutputFragment&gt;</a></div><div class="line"><a name="l00110"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">  110</a></span>&#160;      <a class="code" href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">OutputFragment</a>;</div><div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;</div><div class="line"><a name="l00117"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f">  117</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a> <a class="code" href="structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f">first</a>;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div><div class="line"><a name="l00120"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9">  120</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a> <a class="code" href="structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9">second</a>;</div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div><div class="line"><a name="l00127"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html#a7aa56d3ea300ebc58493c4d66339fff5">  127</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1ZipConvert.html#a7aa56d3ea300ebc58493c4d66339fff5">ZipConvert</a>() {}</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div><div class="line"><a name="l00130"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html#a3322c88b418c365423480a481e29df29">  130</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="structcutlass_1_1ZipConvert.html#a3322c88b418c365423480a481e29df29">ZipConvert</a>(<a class="code" href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">First</a> <span class="keyword">const</span> &amp;_first, <a class="code" href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">Second</a> <span class="keyword">const</span> &amp;_second): <a class="code" href="structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f">first</a>(_first), <a class="code" href="structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9">second</a>(_second) { }</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div><div class="line"><a name="l00133"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipConvert.html#a7e6398ad8ecd8757744a42f3ab8ef955">  133</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="structcutlass_1_1ZipConvert.html#a7e6398ad8ecd8757744a42f3ab8ef955">transform</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">InputFragment</a> <span class="keyword">const</span>&amp; src, <a class="code" href="structcutlass_1_1ZipFragment.html">OutputFragment</a>&amp; dst) {</div><div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <a class="code" href="structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f">first</a>.transform(src.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>, dst.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>);</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    <a class="code" href="structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9">second</a>.transform(src.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>, dst.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>);</div><div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;  }</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;};</div><div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div><div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> First, <span class="keyword">typename</span> Second&gt;</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00144"></a><span class="lineno"><a class="line" href="namespacecutlass.html#adad916101ca58fc9714362c611a0cad8">  144</a></span>&#160;<a class="code" href="structcutlass_1_1ZipConvert.html">ZipConvert&lt;First, Second&gt;</a> <a class="code" href="namespacecutlass.html#adad916101ca58fc9714362c611a0cad8">make_ZipConvert</a>(First <span class="keyword">const</span> &amp;first, Second <span class="keyword">const</span> &amp;second) {</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1ZipConvert.html">ZipConvert&lt;First, Second&gt;</a>(first, second);</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;}</div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div><div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="structcutlass_1_1ZipConvert_html_ad0daa6c3b89db0a058958a6eba72c6b9"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html#ad0daa6c3b89db0a058958a6eba72c6b9">cutlass::ZipConvert::second</a></div><div class="ttdeci">Second second</div><div class="ttdoc">Second transformer. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:120</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_af93e3396f0f2ca8d5e439ca5803af92a"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#af93e3396f0f2ca8d5e439ca5803af92a">cutlass::ZipFragment::Second</a></div><div class="ttdeci">Second_ Second</div><div class="ttdoc">Second fragment object. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:51</div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_a97332506a4834bcced49301b1ac7a4c4"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#a97332506a4834bcced49301b1ac7a4c4">cutlass::ZipFragment::First</a></div><div class="ttdeci">First_ First</div><div class="ttdoc">First fragment object. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:48</div></div>
+<div class="ttc" id="structcutlass_1_1ZipConvert_html_a7e6398ad8ecd8757744a42f3ab8ef955"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html#a7e6398ad8ecd8757744a42f3ab8ef955">cutlass::ZipConvert::transform</a></div><div class="ttdeci">CUTLASS_DEVICE void transform(InputFragment const &amp;src, OutputFragment &amp;dst)</div><div class="ttdoc">Transform a fragment. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:133</div></div>
+<div class="ttc" id="cutlass__math_8h_html"><div class="ttname"><a href="cutlass__math_8h.html">cutlass_math.h</a></div><div class="ttdoc">Math utilities. </div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_aeb654423884324b14130a8fa8bc1ab83"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#aeb654423884324b14130a8fa8bc1ab83">cutlass::ZipFragment::ZipFragment</a></div><div class="ttdeci">CUTLASS_DEVICE ZipFragment()</div><div class="ttdoc">Default ctor. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:72</div></div>
+<div class="ttc" id="structcutlass_1_1ZipConvert_html_a6c59c5bda43da84da92f244103dfab6f"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html#a6c59c5bda43da84da92f244103dfab6f">cutlass::ZipConvert::first</a></div><div class="ttdeci">First first</div><div class="ttdoc">First transformer. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:117</div></div>
+<div class="ttc" id="structcutlass_1_1ZipConvert_html_a3322c88b418c365423480a481e29df29"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html#a3322c88b418c365423480a481e29df29">cutlass::ZipConvert::ZipConvert</a></div><div class="ttdeci">CUTLASS_DEVICE ZipConvert(First const &amp;_first, Second const &amp;_second)</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:130</div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_aea444ab3b52b6f0e994401cf2e0b7f3c"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">cutlass::ZipFragment::first</a></div><div class="ttdeci">First first</div><div class="ttdoc">First fragment object. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:61</div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_aa978dd7fca15ca20e9f52d15e6f8f9c1"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#aa978dd7fca15ca20e9f52d15e6f8f9c1">cutlass::ZipFragment::clear</a></div><div class="ttdeci">CUTLASS_DEVICE void clear()</div><div class="ttdoc">Clear a fragment. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:79</div></div>
+<div class="ttc" id="structcutlass_1_1ZipConvert_html_a215173f8ac00f67848cae872db94c2f4"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html#a215173f8ac00f67848cae872db94c2f4">cutlass::ZipConvert::First</a></div><div class="ttdeci">First_ First</div><div class="ttdoc">First convert operator. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:100</div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_a1812254d5fd77cd6dfdf7d7f2e81130c"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">cutlass::ZipFragment::second</a></div><div class="ttdeci">Second second</div><div class="ttdoc">Second fragment object. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:64</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1ZipConvert_html_a20d8f64fce1ad330969323f6959209d3"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html#a20d8f64fce1ad330969323f6959209d3">cutlass::ZipConvert::InputFragment</a></div><div class="ttdeci">ZipFragment&lt; typename First::InputFragment, typename Second::InputFragment &gt; InputFragment</div><div class="ttdoc">Defines the input zip fragment. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:106</div></div>
+<div class="ttc" id="structcutlass_1_1ZipConvert_html_a525a08b41696d53d6e542aea9c8e2f10"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html#a525a08b41696d53d6e542aea9c8e2f10">cutlass::ZipConvert::Second</a></div><div class="ttdeci">Second_ Second</div><div class="ttdoc">Second convert operator. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:103</div></div>
+<div class="ttc" id="structcutlass_1_1ZipConvert_html_ae0276951ad92b253de673c63ec88c584"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html#ae0276951ad92b253de673c63ec88c584">cutlass::ZipConvert::OutputFragment</a></div><div class="ttdeci">ZipFragment&lt; typename First::OutputFragment, typename Second::OutputFragment &gt; OutputFragment</div><div class="ttdoc">Defines the output zip fragment. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:110</div></div>
+<div class="ttc" id="vector_8h_html"><div class="ttname"><a href="vector_8h.html">vector.h</a></div><div class="ttdoc">Defines a 1D vector of elements held in the registers of each thread. </div></div>
+<div class="ttc" id="structcutlass_1_1ZipConvert_html"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html">cutlass::ZipConvert</a></div><div class="ttdoc">Zips two convert operations. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:98</div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_a2f038ddb37879cbc54dbadaeb7085fb1"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#a2f038ddb37879cbc54dbadaeb7085fb1">cutlass::ZipFragment::This_</a></div><div class="ttdeci">ZipFragment&lt; First, Second &gt; This_</div><div class="ttdoc">This class. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:54</div></div>
+<div class="ttc" id="shape_8h_html"><div class="ttname"><a href="shape_8h.html">shape.h</a></div><div class="ttdoc">Defines Shape implementing the Layout concept for representing a 4D hypercube of objects. </div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_a520318d060123c5870c4153b99cf0427"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#a520318d060123c5870c4153b99cf0427">cutlass::ZipFragment::ZipFragment</a></div><div class="ttdeci">CUTLASS_DEVICE ZipFragment(First const &amp;_first, Second const &amp;_second)</div><div class="ttdoc">Copy ctor. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:76</div></div>
+<div class="ttc" id="namespacecutlass_html_adad916101ca58fc9714362c611a0cad8"><div class="ttname"><a href="namespacecutlass.html#adad916101ca58fc9714362c611a0cad8">cutlass::make_ZipConvert</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ZipConvert&lt; First, Second &gt; make_ZipConvert(First const &amp;first, Second const &amp;second)</div><div class="ttdoc">Helper to construct a ZipConvert object. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:144</div></div>
+<div class="ttc" id="cutlass_8h_html"><div class="ttname"><a href="cutlass_8h.html">cutlass.h</a></div><div class="ttdoc">Basic include for CUTLASS macros. </div></div>
+<div class="ttc" id="structcutlass_1_1ZipConvert_html_a7aa56d3ea300ebc58493c4d66339fff5"><div class="ttname"><a href="structcutlass_1_1ZipConvert.html#a7aa56d3ea300ebc58493c4d66339fff5">cutlass::ZipConvert::ZipConvert</a></div><div class="ttdeci">CUTLASS_DEVICE ZipConvert()</div><div class="ttdoc">Ctor. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:127</div></div>
+<div class="ttc" id="namespacecutlass_html_a07b0da6c47bbd827779aa871249ff4b6"><div class="ttname"><a href="namespacecutlass.html#a07b0da6c47bbd827779aa871249ff4b6">cutlass::make_ZipFragment</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ZipFragment&lt; First, Second &gt; make_ZipFragment(First const &amp;first, Second const &amp;second)</div><div class="ttdoc">Helper to construct a ZipFragment object. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:90</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/zip__tensor__ref_8h.html b/docs/zip__tensor__ref_8h.html
new file mode 100644
index 000000000..a4c4a04e6
--- /dev/null
+++ b/docs/zip__tensor__ref_8h.html
@@ -0,0 +1,116 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: zip_tensor_ref.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a> &#124;
+<a href="#func-members">Functions</a>  </div>
+  <div class="headertitle">
+<div class="title">zip_tensor_ref.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Defines a structure containing a pair of TensorRef-like objects.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="tensor__ref_8h_source.html">cutlass/tensor_ref.h</a>&quot;</code><br />
+</div>
+<p><a href="zip__tensor__ref_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef&lt; First_, Second_ &gt;</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="func-members"></a>
+Functions</h2></td></tr>
+<tr class="memitem:a64869d4ab18d70dc8604098ec03e1a5a"><td class="memTemplParams" colspan="2">template&lt;typename First , typename Second &gt; </td></tr>
+<tr class="memitem:a64869d4ab18d70dc8604098ec03e1a5a"><td class="memTemplItemLeft" align="right" valign="top"><a class="el" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> ZipTensorRef&lt; First, Second &gt;&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a">cutlass::make_ZipTensorRef</a> (First const &amp;first, Second const &amp;second)</td></tr>
+<tr class="memdesc:a64869d4ab18d70dc8604098ec03e1a5a"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs a <a class="el" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>.  <a href="namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a">More...</a><br /></td></tr>
+<tr class="separator:a64869d4ab18d70dc8604098ec03e1a5a"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/zip__tensor__ref_8h_source.html b/docs/zip__tensor__ref_8h_source.html
new file mode 100644
index 000000000..05d9d7684
--- /dev/null
+++ b/docs/zip__tensor__ref_8h_source.html
@@ -0,0 +1,99 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: zip_tensor_ref.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">zip_tensor_ref.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="zip__tensor__ref_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="tensor__ref_8h.html">cutlass/tensor_ref.h</a>&quot;</span></div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;</div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> First_, <span class="keyword">typename</span> Second_&gt;</div><div class="line"><a name="l00038"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTensorRef.html">   38</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a> {</div><div class="line"><a name="l00040"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">   40</a></span>&#160;  <span class="keyword">typedef</span> First_ <a class="code" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a>;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div><div class="line"><a name="l00043"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">   43</a></span>&#160;  <span class="keyword">typedef</span> Second_ <a class="code" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a>;</div><div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div><div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div><div class="line"><a name="l00050"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c">   50</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a> <a class="code" href="structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c">first</a>;</div><div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451">   53</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a> <a class="code" href="structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451">second</a>;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTensorRef.html#a9b4e616da5b0a71ac2d9bd03b4e07b86">   60</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipTensorRef.html#a9b4e616da5b0a71ac2d9bd03b4e07b86">ZipTensorRef</a>() {}</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00063"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTensorRef.html#a6905b853de0521e2f2fedac407a920e1">   63</a></span>&#160;  <a class="code" href="structcutlass_1_1ZipTensorRef.html#a6905b853de0521e2f2fedac407a920e1">ZipTensorRef</a>(<a class="code" href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">First</a> <span class="keyword">const</span>&amp; _first, <a class="code" href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">Second</a> <span class="keyword">const</span>&amp; _second) : <a class="code" href="structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c">first</a>(_first), <a class="code" href="structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451">second</a>(_second) {}</div><div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;};</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> First, <span class="keyword">typename</span> Second&gt;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;<a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00071"></a><span class="lineno"><a class="line" href="namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a">   71</a></span>&#160;<a class="code" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef&lt;First, Second&gt;</a> <a class="code" href="namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a">make_ZipTensorRef</a>(First <span class="keyword">const</span> &amp;first, Second <span class="keyword">const</span> &amp;second) {</div><div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;  <span class="keywordflow">return</span> <a class="code" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef&lt;First, Second&gt;</a>(first, second);</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;}</div><div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;}  <span class="comment">// namespace cutlass</span></div><div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="tensor__ref_8h_html"><div class="ttname"><a href="tensor__ref_8h.html">tensor_ref.h</a></div><div class="ttdoc">Defines a structure containing strides, bounds, and a pointer to tensor data. </div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a></div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:38</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html_a44deb7a83049ee80dfd0419d4a0206d9"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html#a44deb7a83049ee80dfd0419d4a0206d9">cutlass::ZipTensorRef::First</a></div><div class="ttdeci">First_ First</div><div class="ttdoc">First tensor ref. </div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:40</div></div>
+<div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html_a535f0e6fc79d0e305f651efed099275c"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html#a535f0e6fc79d0e305f651efed099275c">cutlass::ZipTensorRef::first</a></div><div class="ttdeci">First first</div><div class="ttdoc">First TensorRef. </div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:50</div></div>
+<div class="ttc" id="namespacecutlass_html_a64869d4ab18d70dc8604098ec03e1a5a"><div class="ttname"><a href="namespacecutlass.html#a64869d4ab18d70dc8604098ec03e1a5a">cutlass::make_ZipTensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ZipTensorRef&lt; First, Second &gt; make_ZipTensorRef(First const &amp;first, Second const &amp;second)</div><div class="ttdoc">Constructs a ZipTensorRef. </div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:71</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html_a3e77904f83d1b33f0bac054355f3432e"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html#a3e77904f83d1b33f0bac054355f3432e">cutlass::ZipTensorRef::Second</a></div><div class="ttdeci">Second_ Second</div><div class="ttdoc">Second tensor ref. </div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:43</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html_a9b4e616da5b0a71ac2d9bd03b4e07b86"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html#a9b4e616da5b0a71ac2d9bd03b4e07b86">cutlass::ZipTensorRef::ZipTensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ZipTensorRef()</div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:60</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html_a6905b853de0521e2f2fedac407a920e1"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html#a6905b853de0521e2f2fedac407a920e1">cutlass::ZipTensorRef::ZipTensorRef</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE ZipTensorRef(First const &amp;_first, Second const &amp;_second)</div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:63</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html_ad981b056cc96709a23e6d51dba4cd451"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html#ad981b056cc96709a23e6d51dba4cd451">cutlass::ZipTensorRef::second</a></div><div class="ttdeci">Second second</div><div class="ttdoc">Second TensorRef. </div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:53</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/zip__tile__iterator_8h.html b/docs/zip__tile__iterator_8h.html
new file mode 100644
index 000000000..88f5aa4a8
--- /dev/null
+++ b/docs/zip__tile__iterator_8h.html
@@ -0,0 +1,113 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: zip_tile_iterator.h File Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#nested-classes">Classes</a> &#124;
+<a href="#namespaces">Namespaces</a>  </div>
+  <div class="headertitle">
+<div class="title">zip_tile_iterator.h File Reference</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>Constructs an iterator that owns two tile iterator instances.  
+<a href="#details">More...</a></p>
+<div class="textblock"><code>#include &quot;<a class="el" href="coord_8h_source.html">cutlass/coord.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="zip__tensor__ref_8h_source.html">cutlass/zip_tensor_ref.h</a>&quot;</code><br />
+<code>#include &quot;<a class="el" href="zip__fragment_8h_source.html">cutlass/zip_fragment.h</a>&quot;</code><br />
+</div>
+<p><a href="zip__tile__iterator_8h_source.html">Go to the source code of this file.</a></p>
+<table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="nested-classes"></a>
+Classes</h2></td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">class &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight">Constructs an iterator from a pair of iterators.  <a href="classcutlass_1_1ZipTileIterator.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+<tr class="memitem:"><td class="memItemLeft" align="right" valign="top">struct &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html">cutlass::ZipTileIterator&lt; First_, Second_ &gt;::Params</a></td></tr>
+<tr class="memdesc:"><td class="mdescLeft">&#160;</td><td class="mdescRight"><a class="el" href="structcutlass_1_1ZipTileIterator_1_1Params.html" title="Params object. ">Params</a> object.  <a href="structcutlass_1_1ZipTileIterator_1_1Params.html#details">More...</a><br /></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="namespaces"></a>
+Namespaces</h2></td></tr>
+<tr class="memitem:namespacecutlass"><td class="memItemLeft" align="right" valign="top"> &#160;</td><td class="memItemRight" valign="bottom"><a class="el" href="namespacecutlass.html">cutlass</a></td></tr>
+<tr class="separator:"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+</div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>
diff --git a/docs/zip__tile__iterator_8h_source.html b/docs/zip__tile__iterator_8h_source.html
new file mode 100644
index 000000000..2ab5a8333
--- /dev/null
+++ b/docs/zip__tile__iterator_8h_source.html
@@ -0,0 +1,139 @@
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.14"/>
+<meta name="viewport" content="width=device-width, initial-scale=1"/>
+<title>Cutlass: zip_tile_iterator.h Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/searchdata.js"></script>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/x-mathjax-config">
+  MathJax.Hub.Config({
+    extensions: ["tex2jax.js"],
+    jax: ["input/TeX","output/HTML-CSS"],
+});
+</script><script type="text/javascript" async src="http://cdn.mathjax.org/mathjax/latest/MathJax.js"></script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td id="projectalign" style="padding-left: 0.5em;">
+   <div id="projectname">Cutlass
+   </div>
+   <div id="projectbrief">CUDA Templates for Linear Algebra Subroutines and Solvers</div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.14 -->
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+/* @license-end */
+</script>
+<script type="text/javascript" src="menudata.js"></script>
+<script type="text/javascript" src="menu.js"></script>
+<script type="text/javascript">
+/* @license magnet:?xt=urn:btih:cf05388f2679ee054f2beb29a391d25f4e673ac3&amp;dn=gpl-2.0.txt GPL-v2 */
+$(function() {
+  initMenu('',true,false,'search.php','Search');
+  $(document).ready(function() { init_search(); });
+});
+/* @license-end */</script>
+<div id="main-nav"></div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+</div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_1417ee5ebebc309c36b7962f26a92c39.html">cutlass</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">zip_tile_iterator.h</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="zip__tile__iterator_8h.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/***************************************************************************************************</span></div><div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2017-2018, NVIDIA CORPORATION.  All rights reserved.</span></div><div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without modification, are permitted</span></div><div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * provided that the following conditions are met:</span></div><div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright notice, this list of</span></div><div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *       conditions and the following disclaimer.</span></div><div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright notice, this list of</span></div><div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       conditions and the following disclaimer in the documentation and/or other materials</span></div><div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       provided with the distribution.</span></div><div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the names of its contributors may be used</span></div><div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       to endorse or promote products derived from this software without specific prior written</span></div><div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       permission.</span></div><div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND ANY EXPRESS OR</span></div><div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND</span></div><div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * FITNESS FOR A PARTICULAR PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE</span></div><div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING,</span></div><div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;</span></div><div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT,</span></div><div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * STRICT LIABILITY, OR TOR (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE</span></div><div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div><div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> *</span></div><div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> **************************************************************************************************/</span></div><div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;</div><div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="preprocessor">#pragma once</span></div><div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;</div><div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="coord_8h.html">cutlass/coord.h</a>&quot;</span></div><div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="zip__tensor__ref_8h.html">cutlass/zip_tensor_ref.h</a>&quot;</span></div><div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="zip__fragment_8h.html">cutlass/zip_fragment.h</a>&quot;</span></div><div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;</div><div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="keyword">namespace </span><a class="code" href="namespacecutlass.html">cutlass</a> {</div><div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div><div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div><div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> First_, <span class="keyword">typename</span> Second_&gt;</div><div class="line"><a name="l00042"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html">   42</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> {</div><div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160; <span class="keyword">public</span>:</div><div class="line"><a name="l00045"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">   45</a></span>&#160;  <span class="keyword">typedef</span> First_ <a class="code" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a>;</div><div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div><div class="line"><a name="l00048"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">   48</a></span>&#160;  <span class="keyword">typedef</span> Second_ <a class="code" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a>;</div><div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div><div class="line"><a name="l00051"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileIterator_1_1Params.html">   51</a></span>&#160;  <span class="keyword">struct </span><a class="code" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a> {</div><div class="line"><a name="l00053"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e">   53</a></span>&#160;    <span class="keyword">typename</span> First::Params <a class="code" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e">first</a>;</div><div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div><div class="line"><a name="l00056"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26">   56</a></span>&#160;    <span class="keyword">typename</span> Second::Params <a class="code" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26">second</a>;</div><div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div><div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00060"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a4ed93b5319fe96457caf53e9384722d4">   60</a></span>&#160;    <a class="code" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a4ed93b5319fe96457caf53e9384722d4">Params</a>() {}</div><div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div><div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="line"><a name="l00064"></a><span class="lineno"><a class="line" href="structcutlass_1_1ZipTileIterator_1_1Params.html#ad38f6a2cc5800c0ec82b12d183040390">   64</a></span>&#160;    <a class="code" href="structcutlass_1_1ZipTileIterator_1_1Params.html#ad38f6a2cc5800c0ec82b12d183040390">Params</a>(<span class="keyword">typename</span> First::Params <span class="keyword">const</span> &amp;_first, <span class="keyword">typename</span> Second::Params <span class="keyword">const</span> &amp;_second)</div><div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;        : <a class="code" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e">first</a>(_first), <a class="code" href="structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26">second</a>(_second) {}</div><div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;  };</div><div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div><div class="line"><a name="l00069"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">   69</a></span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ZipFragment.html">ZipFragment&lt;typename First::Fragment, typename Second::Fragment&gt;</a> <a class="code" href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">Fragment</a>;</div><div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div><div class="line"><a name="l00072"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15">   72</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> First::PredicateVector <a class="code" href="classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15">PredicateVector</a>;</div><div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div><div class="line"><a name="l00075"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">   75</a></span>&#160;  <span class="keyword">typedef</span> <span class="keyword">typename</span> First::Index <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">Index</a>;</div><div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div><div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;  <span class="keyword">typedef</span> <a class="code" href="structcutlass_1_1ZipTensorRef.html">ZipTensorRef</a>&lt;</div><div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    <span class="keyword">typename</span> First::TensorRef,</div><div class="line"><a name="l00080"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">   80</a></span>&#160;    <span class="keyword">typename</span> Second::TensorRef&gt; <a class="code" href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">TensorRef</a>;</div><div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div><div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;  <span class="comment">// Data members</span></div><div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div><div class="line"><a name="l00087"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">   87</a></span>&#160;  <a class="code" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a> <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>;</div><div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div><div class="line"><a name="l00090"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">   90</a></span>&#160;  <a class="code" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a> <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>;</div><div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div><div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;  <span class="comment">// Methods</span></div><div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div><div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00098"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a09eab0c5218fc122848b623462c18149">   98</a></span>&#160;  <a class="code" href="classcutlass_1_1ZipTileIterator.html#a09eab0c5218fc122848b623462c18149">ZipTileIterator</a>() {}</div><div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div><div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00102"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a45a8ba275f8d4f71deb102ad46712b3e">  102</a></span>&#160;  <a class="code" href="classcutlass_1_1ZipTileIterator.html#a45a8ba275f8d4f71deb102ad46712b3e">ZipTileIterator</a>(<a class="code" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params, <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;threadblock_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0, 0, 0))</div><div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;      : <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>(_params.<a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>, threadblock_offset), <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>(_params.<a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>, threadblock_offset) {}</div><div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div><div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00107"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a31553842afd1cfd5a18a2fd6c39e17b5">  107</a></span>&#160;  <a class="code" href="classcutlass_1_1ZipTileIterator.html#a31553842afd1cfd5a18a2fd6c39e17b5">ZipTileIterator</a>(<a class="code" href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">First</a> <span class="keyword">const</span> &amp;_first, <a class="code" href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">Second</a> <span class="keyword">const</span> &amp;_second) : <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>(_first), <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>(_second) {}</div><div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div><div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00111"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a808e06560609aa5b7bb693ec79a3aa57">  111</a></span>&#160;  <a class="code" href="classcutlass_1_1ZipTileIterator.html#a808e06560609aa5b7bb693ec79a3aa57">ZipTileIterator</a>(<a class="code" href="structcutlass_1_1ZipTensorRef.html">TensorRef</a> <span class="keyword">const</span> &amp;ref) : <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>(ref.<a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>), <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>(ref.<a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>) {}</div><div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div><div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;  CUTLASS_DEVICE</div><div class="line"><a name="l00115"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a9d70b24bf38122c0fea49558c6f6b344">  115</a></span>&#160;  <a class="code" href="classcutlass_1_1ZipTileIterator.html#a9d70b24bf38122c0fea49558c6f6b344">ZipTileIterator</a>(<a class="code" href="structcutlass_1_1ZipTileIterator_1_1Params.html">Params</a> <span class="keyword">const</span> &amp;_params, <a class="code" href="structcutlass_1_1ZipTensorRef.html">TensorRef</a> <span class="keyword">const</span> &amp;ref):</div><div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>(_params.<a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>, ref.<a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>), <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>(_params.<a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>, ref.<a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>) {}</div><div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div><div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;  <span class="comment">// Predicate initialization</span></div><div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div><div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;  <span class="keyword">template</span> &lt;</div><div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;      <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00126"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a8f334010614b50d962e4769904d7b76f">  126</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a8f334010614b50d962e4769904d7b76f">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;bounds,</div><div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset = <a class="code" href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">make_Coord</a>(0,</div><div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;                                                                                           0,</div><div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;                                                                                           0)) {</div><div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.initialize_predicates(predicate_it, bounds, block_offset);</div><div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;  }</div><div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div><div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;  <span class="keyword">template</span> &lt;</div><div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;      <span class="keyword">typename</span> PredicateIterator,</div><div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;      <span class="keyword">typename</span> PredicateFunctor&gt;</div><div class="line"><a name="l00140"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#ab0f93878bbe5aac072450f9bf1dd8b64">  140</a></span>&#160;  <a class="code" href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a> <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab0f93878bbe5aac072450f9bf1dd8b64">initialize_predicates</a>(PredicateIterator predicate_it,</div><div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;                                                 PredicateFunctor <span class="keyword">const</span> &amp;functor,</div><div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;                                                 <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;block_offset) {</div><div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.initialize_predicates(predicate_it, functor, block_offset);</div><div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;  }</div><div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div><div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;  <span class="comment">// No predicates</span></div><div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div><div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00152"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a95b8db4af9228beed273669b3b0b12fe">  152</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a95b8db4af9228beed273669b3b0b12fe">load_post_increment</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> &amp;fragment) {</div><div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.load_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>);</div><div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.load_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>);</div><div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;  }</div><div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div><div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00159"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a3020bcd0a49efad674ca5539ea1c96c0">  159</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a3020bcd0a49efad674ca5539ea1c96c0">load_post_increment</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> &amp;fragment,</div><div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;                            <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <span class="keyword">const</span> &amp;offset) {</div><div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.load_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>, offset);</div><div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.load_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>, offset);</div><div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;  }</div><div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div><div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00167"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a23b72b086f350dfe07cff22ac010c45c">  167</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a23b72b086f350dfe07cff22ac010c45c">load</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> &amp;fragment)<span class="keyword"> const </span>{</div><div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.load(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>);</div><div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.load(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>);</div><div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;  }</div><div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div><div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00174"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a9a3f2f913ee73f0c04e74ec89c6c5cbb">  174</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a9a3f2f913ee73f0c04e74ec89c6c5cbb">load</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> &amp;fragment,</div><div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;                            <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <span class="keyword">const</span> &amp;offset)<span class="keyword"> const </span>{</div><div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.load(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>, offset);</div><div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.load(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>, offset);</div><div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;  }</div><div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div><div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00182"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a961a340f902542f3000dc80e852958f2">  182</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a961a340f902542f3000dc80e852958f2">store_post_increment</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment) {</div><div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.store_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>);</div><div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.store_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>);</div><div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;  }</div><div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div><div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00189"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a18ed76e6be1a02d0229cdf1d6528e34f">  189</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a18ed76e6be1a02d0229cdf1d6528e34f">store_post_increment</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment,</div><div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;                            <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <span class="keyword">const</span> &amp;offset) {</div><div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.store_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>, offset);</div><div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.store_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>, offset);</div><div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;  }</div><div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div><div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00197"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a884983cd1df81739fc971b46697b851c">  197</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a884983cd1df81739fc971b46697b851c">store</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment)<span class="keyword"> const </span>{</div><div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.store(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>);</div><div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.store(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>);</div><div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;  }</div><div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div><div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment&gt;</div><div class="line"><a name="l00204"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a425b4a4f2e66f3ff5960742d19d06bc2">  204</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a425b4a4f2e66f3ff5960742d19d06bc2">store</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment,</div><div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;                            <a class="code" href="structcutlass_1_1Coord.html">Coord&lt;4&gt;</a> <span class="keyword">const</span> &amp;offset)<span class="keyword"> const </span>{</div><div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.store(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>, offset);</div><div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.store(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>, offset);</div><div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;  }</div><div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div><div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;  <span class="comment">// With predication</span></div><div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;</div><div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00216"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a53045f40d203a805af9c92fa0b5bc684">  216</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a53045f40d203a805af9c92fa0b5bc684">load_post_increment</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> &amp;fragment, PredicateIterator pred_it) {</div><div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.load_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>, pred_it);</div><div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.load_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>, pred_it);</div><div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;  }</div><div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div><div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00223"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a4c9997488be2f09b9653d8ef8ac06c2b">  223</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a4c9997488be2f09b9653d8ef8ac06c2b">load</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> &amp;fragment, PredicateIterator pred_it)<span class="keyword"> const </span>{</div><div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.load(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>, pred_it);</div><div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.load(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>, pred_it);</div><div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;  }</div><div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div><div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00230"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a3a2cae47533c1122eb8ec404473a0d9e">  230</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a3a2cae47533c1122eb8ec404473a0d9e">store_post_increment</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment, PredicateIterator pred_it) {</div><div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.store_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>, pred_it);</div><div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.store_post_increment(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>, pred_it);</div><div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;  }</div><div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div><div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;  <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Fragment, <span class="keyword">typename</span> PredicateIterator&gt;</div><div class="line"><a name="l00237"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#aa617653e75535fe13aafa80bc4cc9cc4">  237</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#aa617653e75535fe13aafa80bc4cc9cc4">store</a>(<a class="code" href="structcutlass_1_1ZipFragment.html">Fragment</a> <span class="keyword">const</span> &amp;fragment, PredicateIterator pred_it)<span class="keyword"> const </span>{</div><div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.store(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">first</a>, pred_it);</div><div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.store(fragment.<a class="code" href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">second</a>, pred_it);</div><div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;  }</div><div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;</div><div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;  <span class="comment">// Advances the iterators</span></div><div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;  <span class="comment">//</span></div><div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div><div class="line"><a name="l00247"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808">  247</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;<a class="code" href="classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808">increment</a>(<span class="keywordtype">int</span> count = 1) {</div><div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.increment(count);</div><div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.increment(count);</div><div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;  }</div><div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;</div><div class="line"><a name="l00254"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a47d270fc4a119d7b95b2d5dd3ee5b87b">  254</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;<a class="code" href="classcutlass_1_1ZipTileIterator.html#a47d270fc4a119d7b95b2d5dd3ee5b87b">operator++</a>() { <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808">increment</a>(); }</div><div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;</div><div class="line"><a name="l00256"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a60ba516d7382cb7788d5430023f7fc44">  256</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;<a class="code" href="classcutlass_1_1ZipTileIterator.html#a60ba516d7382cb7788d5430023f7fc44">operator+=</a>(<span class="keywordtype">int</span> count) { <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808">increment</a>(count); }</div><div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div><div class="line"><a name="l00259"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a200a4e88ee6d23dcc80e974c77f8fa1f">  259</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;<a class="code" href="classcutlass_1_1ZipTileIterator.html#a200a4e88ee6d23dcc80e974c77f8fa1f">operator+=</a>(<a class="code" href="structcutlass_1_1Coord.html">Coord&lt;3&gt;</a> <span class="keyword">const</span> &amp;offset) {</div><div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a> += offset;</div><div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a> += offset;</div><div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;  }</div><div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;</div><div class="line"><a name="l00266"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6">  266</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;<a class="code" href="classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6">decrement</a>(<span class="keywordtype">int</span> count = 1) {</div><div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.decrement(count);</div><div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.decrement(count);</div><div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div><div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;  }</div><div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div><div class="line"><a name="l00273"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a3d22dab34b2abd0d05c00668f8591151">  273</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;<a class="code" href="classcutlass_1_1ZipTileIterator.html#a3d22dab34b2abd0d05c00668f8591151">operator--</a>() { <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6">decrement</a>(); }</div><div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;</div><div class="line"><a name="l00276"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a7bae0f9b789e75bb154c5f37db50e14c">  276</a></span>&#160;  CUTLASS_DEVICE <a class="code" href="classcutlass_1_1ZipTileIterator.html">ZipTileIterator</a> &amp;<a class="code" href="classcutlass_1_1ZipTileIterator.html#a7bae0f9b789e75bb154c5f37db50e14c">operator-=</a>(<span class="keywordtype">int</span> count) { <span class="keywordflow">return</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6">decrement</a>(count); }</div><div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;</div><div class="line"><a name="l00279"></a><span class="lineno"><a class="line" href="classcutlass_1_1ZipTileIterator.html#a0752af296e110d9104a45ae24bd0a104">  279</a></span>&#160;  CUTLASS_DEVICE <span class="keywordtype">void</span> <a class="code" href="classcutlass_1_1ZipTileIterator.html#a0752af296e110d9104a45ae24bd0a104">add_pointer_offset</a>(<a class="code" href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">Index</a> offset) {</div><div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">first</a>.add_pointer_offset(offset);</div><div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;    <a class="code" href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">second</a>.add_pointer_offset(offset);</div><div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;  }</div><div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;};</div><div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;</div><div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div><div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;}  <span class="comment">// namspace cutlass</span></div><div class="ttc" id="classcutlass_1_1ZipTileIterator_html_ae239840776fe7c3bd679b798188d9d06"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#ae239840776fe7c3bd679b798188d9d06">cutlass::ZipTileIterator::Fragment</a></div><div class="ttdeci">ZipFragment&lt; typename First::Fragment, typename Second::Fragment &gt; Fragment</div><div class="ttdoc">Fragment type. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:69</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileIterator_1_1Params_html_a6eb742dc39b1d776cf5d62719835fe26"><div class="ttname"><a href="structcutlass_1_1ZipTileIterator_1_1Params.html#a6eb742dc39b1d776cf5d62719835fe26">cutlass::ZipTileIterator::Params::second</a></div><div class="ttdeci">Second::Params second</div><div class="ttdoc">Parameters of second iterator. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:56</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a0c3046a077ef69a9325d7df817865bf7"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a0c3046a077ef69a9325d7df817865bf7">cutlass::ZipTileIterator::First</a></div><div class="ttdeci">First_ First</div><div class="ttdoc">First iterator type. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:45</div></div>
+<div class="ttc" id="namespacecutlass_html"><div class="ttname"><a href="namespacecutlass.html">cutlass</a></div><div class="ttdef"><b>Definition:</b> convert.h:33</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTensorRef_html"><div class="ttname"><a href="structcutlass_1_1ZipTensorRef.html">cutlass::ZipTensorRef</a></div><div class="ttdef"><b>Definition:</b> zip_tensor_ref.h:38</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_ab48ad3cf2ffeec356d8592d94f6b81f0"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#ab48ad3cf2ffeec356d8592d94f6b81f0">cutlass::ZipTileIterator::Index</a></div><div class="ttdeci">First::Index Index</div><div class="ttdoc">Index type. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:75</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a45a8ba275f8d4f71deb102ad46712b3e"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a45a8ba275f8d4f71deb102ad46712b3e">cutlass::ZipTileIterator::ZipTileIterator</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator(Params const &amp;_params, Coord&lt; 3 &gt; const &amp;threadblock_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Constructs a zip iterator from params. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:102</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a18ed76e6be1a02d0229cdf1d6528e34f"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a18ed76e6be1a02d0229cdf1d6528e34f">cutlass::ZipTileIterator::store_post_increment</a></div><div class="ttdeci">CUTLASS_DEVICE void store_post_increment(Fragment const &amp;fragment, Coord&lt; 4 &gt; const &amp;offset)</div><div class="ttdoc">Stores a fragment and increments without predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:189</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a3020bcd0a49efad674ca5539ea1c96c0"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a3020bcd0a49efad674ca5539ea1c96c0">cutlass::ZipTileIterator::load_post_increment</a></div><div class="ttdeci">CUTLASS_DEVICE void load_post_increment(Fragment &amp;fragment, Coord&lt; 4 &gt; const &amp;offset)</div><div class="ttdoc">Loads a fragment and increments without predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:159</div></div>
+<div class="ttc" id="coord_8h_html"><div class="ttname"><a href="coord_8h.html">coord.h</a></div><div class="ttdoc">A Coord is a coordinate of arbitrary rank into a tensor or matrix. </div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a884983cd1df81739fc971b46697b851c"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a884983cd1df81739fc971b46697b851c">cutlass::ZipTileIterator::store</a></div><div class="ttdeci">CUTLASS_DEVICE void store(Fragment const &amp;fragment) const</div><div class="ttdoc">Stores a fragment without predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:197</div></div>
+<div class="ttc" id="namespacecutlass_html_a7419519fa453a121dfa5f26bf87318d9"><div class="ttname"><a href="namespacecutlass.html#a7419519fa453a121dfa5f26bf87318d9">cutlass::make_Coord</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Coord&lt; 1 &gt; make_Coord(int _0)</div><div class="ttdoc">Helper to make a 2-element coordinate. </div><div class="ttdef"><b>Definition:</b> coord.h:318</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileIterator_1_1Params_html_ad38f6a2cc5800c0ec82b12d183040390"><div class="ttname"><a href="structcutlass_1_1ZipTileIterator_1_1Params.html#ad38f6a2cc5800c0ec82b12d183040390">cutlass::ZipTileIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params(typename First::Params const &amp;_first, typename Second::Params const &amp;_second)</div><div class="ttdoc">Constructs a parameters object. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:64</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a8f334010614b50d962e4769904d7b76f"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a8f334010614b50d962e4769904d7b76f">cutlass::ZipTileIterator::initialize_predicates</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it, Coord&lt; 3 &gt; const &amp;bounds, Coord&lt; 3 &gt; const &amp;block_offset=make_Coord(0, 0, 0))</div><div class="ttdoc">Initializes a predicate vector using a RegularTilePredicateFunctor. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:126</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileIterator_1_1Params_html_a4ed93b5319fe96457caf53e9384722d4"><div class="ttname"><a href="structcutlass_1_1ZipTileIterator_1_1Params.html#a4ed93b5319fe96457caf53e9384722d4">cutlass::ZipTileIterator::Params::Params</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE Params()</div><div class="ttdoc">Constructs a parameters object. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:60</div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html">cutlass::ZipFragment</a></div><div class="ttdoc">A template defining Fragment Concept. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:46</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a200a4e88ee6d23dcc80e974c77f8fa1f"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a200a4e88ee6d23dcc80e974c77f8fa1f">cutlass::ZipTileIterator::operator+=</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator &amp; operator+=(Coord&lt; 3 &gt; const &amp;offset)</div><div class="ttdoc">Adds a vector offset to the underlying iterators. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:259</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_ab0f93878bbe5aac072450f9bf1dd8b64"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#ab0f93878bbe5aac072450f9bf1dd8b64">cutlass::ZipTileIterator::initialize_predicates</a></div><div class="ttdeci">CUTLASS_HOST_DEVICE void initialize_predicates(PredicateIterator predicate_it, PredicateFunctor const &amp;functor, Coord&lt; 3 &gt; const &amp;block_offset)</div><div class="ttdoc">Initializes a predicate vector using an arbitrary predicate functor. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:140</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileIterator_1_1Params_html_a5dd69883d6b3f16fe28ebfe79235743e"><div class="ttname"><a href="structcutlass_1_1ZipTileIterator_1_1Params.html#a5dd69883d6b3f16fe28ebfe79235743e">cutlass::ZipTileIterator::Params::first</a></div><div class="ttdeci">First::Params first</div><div class="ttdoc">Parameters of first iterator. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:53</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a95b8db4af9228beed273669b3b0b12fe"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a95b8db4af9228beed273669b3b0b12fe">cutlass::ZipTileIterator::load_post_increment</a></div><div class="ttdeci">CUTLASS_DEVICE void load_post_increment(Fragment &amp;fragment)</div><div class="ttdoc">Loads a fragment and increments without predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:152</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a9d70b24bf38122c0fea49558c6f6b344"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a9d70b24bf38122c0fea49558c6f6b344">cutlass::ZipTileIterator::ZipTileIterator</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator(Params const &amp;_params, TensorRef const &amp;ref)</div><div class="ttdoc">Constructs a zip iterator from iterator instances. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:115</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a60ba516d7382cb7788d5430023f7fc44"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a60ba516d7382cb7788d5430023f7fc44">cutlass::ZipTileIterator::operator+=</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator &amp; operator+=(int count)</div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:256</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_aa617653e75535fe13aafa80bc4cc9cc4"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#aa617653e75535fe13aafa80bc4cc9cc4">cutlass::ZipTileIterator::store</a></div><div class="ttdeci">CUTLASS_DEVICE void store(Fragment const &amp;fragment, PredicateIterator pred_it) const</div><div class="ttdoc">Loads a fragment with predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:237</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a1dea96f5cf56aade14bd815aee91d09c"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a1dea96f5cf56aade14bd815aee91d09c">cutlass::ZipTileIterator::TensorRef</a></div><div class="ttdeci">ZipTensorRef&lt; typename First::TensorRef, typename Second::TensorRef &gt; TensorRef</div><div class="ttdoc">Tensor reference. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:80</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a7bae0f9b789e75bb154c5f37db50e14c"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a7bae0f9b789e75bb154c5f37db50e14c">cutlass::ZipTileIterator::operator-=</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator &amp; operator-=(int count)</div><div class="ttdoc">Decrements to previous tile. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:276</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a961a340f902542f3000dc80e852958f2"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a961a340f902542f3000dc80e852958f2">cutlass::ZipTileIterator::store_post_increment</a></div><div class="ttdeci">CUTLASS_DEVICE void store_post_increment(Fragment const &amp;fragment)</div><div class="ttdoc">Stores a fragment and increments without predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:182</div></div>
+<div class="ttc" id="zip__fragment_8h_html"><div class="ttname"><a href="zip__fragment_8h.html">zip_fragment.h</a></div><div class="ttdoc">Models a pair of fragments. </div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_aea444ab3b52b6f0e994401cf2e0b7f3c"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#aea444ab3b52b6f0e994401cf2e0b7f3c">cutlass::ZipFragment::first</a></div><div class="ttdeci">First first</div><div class="ttdoc">First fragment object. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:61</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a53045f40d203a805af9c92fa0b5bc684"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a53045f40d203a805af9c92fa0b5bc684">cutlass::ZipTileIterator::load_post_increment</a></div><div class="ttdeci">CUTLASS_DEVICE void load_post_increment(Fragment &amp;fragment, PredicateIterator pred_it)</div><div class="ttdoc">Loads a fragment and increments, using predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:216</div></div>
+<div class="ttc" id="zip__tensor__ref_8h_html"><div class="ttname"><a href="zip__tensor__ref_8h.html">zip_tensor_ref.h</a></div><div class="ttdoc">Defines a structure containing a pair of TensorRef-like objects. </div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_ae34d88ee2878174707dcfdda4f3fa76c"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#ae34d88ee2878174707dcfdda4f3fa76c">cutlass::ZipTileIterator::Second</a></div><div class="ttdeci">Second_ Second</div><div class="ttdoc">Second iterator type. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:48</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a31553842afd1cfd5a18a2fd6c39e17b5"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a31553842afd1cfd5a18a2fd6c39e17b5">cutlass::ZipTileIterator::ZipTileIterator</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator(First const &amp;_first, Second const &amp;_second)</div><div class="ttdoc">Constructs a zip iterator from iterator instances. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:107</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a47d270fc4a119d7b95b2d5dd3ee5b87b"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a47d270fc4a119d7b95b2d5dd3ee5b87b">cutlass::ZipTileIterator::operator++</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator &amp; operator++()</div><div class="ttdoc">Increments to next tile. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:254</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html">cutlass::ZipTileIterator</a></div><div class="ttdoc">Constructs an iterator from a pair of iterators. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:42</div></div>
+<div class="ttc" id="structcutlass_1_1ZipFragment_html_a1812254d5fd77cd6dfdf7d7f2e81130c"><div class="ttname"><a href="structcutlass_1_1ZipFragment.html#a1812254d5fd77cd6dfdf7d7f2e81130c">cutlass::ZipFragment::second</a></div><div class="ttdeci">Second second</div><div class="ttdoc">Second fragment object. </div><div class="ttdef"><b>Definition:</b> zip_fragment.h:64</div></div>
+<div class="ttc" id="cutlass_8h_html_a28c2443a142676d3d71effdae1a986b1"><div class="ttname"><a href="cutlass_8h.html#a28c2443a142676d3d71effdae1a986b1">CUTLASS_HOST_DEVICE</a></div><div class="ttdeci">#define CUTLASS_HOST_DEVICE</div><div class="ttdef"><b>Definition:</b> cutlass.h:46</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a09eab0c5218fc122848b623462c18149"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a09eab0c5218fc122848b623462c18149">cutlass::ZipTileIterator::ZipTileIterator</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator()</div><div class="ttdoc">Default constructor. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:98</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_af961a2621c6b42f2b3ba645afcb250a9"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#af961a2621c6b42f2b3ba645afcb250a9">cutlass::ZipTileIterator::first</a></div><div class="ttdeci">First first</div><div class="ttdoc">First iterator. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:87</div></div>
+<div class="ttc" id="structcutlass_1_1ZipTileIterator_1_1Params_html"><div class="ttname"><a href="structcutlass_1_1ZipTileIterator_1_1Params.html">cutlass::ZipTileIterator::Params</a></div><div class="ttdoc">Params object. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:51</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_ab88ce07b3012ae2e6a92ad784c8067f0"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#ab88ce07b3012ae2e6a92ad784c8067f0">cutlass::ZipTileIterator::second</a></div><div class="ttdeci">Second second</div><div class="ttdoc">Second iterator. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:90</div></div>
+<div class="ttc" id="structcutlass_1_1Coord_html"><div class="ttname"><a href="structcutlass_1_1Coord.html">cutlass::Coord&lt; 3 &gt;</a></div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a425b4a4f2e66f3ff5960742d19d06bc2"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a425b4a4f2e66f3ff5960742d19d06bc2">cutlass::ZipTileIterator::store</a></div><div class="ttdeci">CUTLASS_DEVICE void store(Fragment const &amp;fragment, Coord&lt; 4 &gt; const &amp;offset) const</div><div class="ttdoc">Stores a fragment without predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:204</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a23b72b086f350dfe07cff22ac010c45c"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a23b72b086f350dfe07cff22ac010c45c">cutlass::ZipTileIterator::load</a></div><div class="ttdeci">CUTLASS_DEVICE void load(Fragment &amp;fragment) const</div><div class="ttdoc">Loads a fragment without predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:167</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_aa853fa2a2e73397d8950567f3f5b7a15"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#aa853fa2a2e73397d8950567f3f5b7a15">cutlass::ZipTileIterator::PredicateVector</a></div><div class="ttdeci">First::PredicateVector PredicateVector</div><div class="ttdoc">Predicate vector. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:72</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a4c9997488be2f09b9653d8ef8ac06c2b"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a4c9997488be2f09b9653d8ef8ac06c2b">cutlass::ZipTileIterator::load</a></div><div class="ttdeci">CUTLASS_DEVICE void load(Fragment &amp;fragment, PredicateIterator pred_it) const</div><div class="ttdoc">Loads a fragment with predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:223</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a6f2f86a1d23ccbaed285550a1d1f92e6"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a6f2f86a1d23ccbaed285550a1d1f92e6">cutlass::ZipTileIterator::decrement</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator &amp; decrement(int count=1)</div><div class="ttdoc">Increments store iterator to previous tile. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:266</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a0752af296e110d9104a45ae24bd0a104"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a0752af296e110d9104a45ae24bd0a104">cutlass::ZipTileIterator::add_pointer_offset</a></div><div class="ttdeci">CUTLASS_DEVICE void add_pointer_offset(Index offset)</div><div class="ttdoc">Adds an offset to both iterators. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:279</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a3d22dab34b2abd0d05c00668f8591151"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a3d22dab34b2abd0d05c00668f8591151">cutlass::ZipTileIterator::operator--</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator &amp; operator--()</div><div class="ttdoc">Increments to subsequent tile. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:273</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a808e06560609aa5b7bb693ec79a3aa57"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a808e06560609aa5b7bb693ec79a3aa57">cutlass::ZipTileIterator::ZipTileIterator</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator(TensorRef const &amp;ref)</div><div class="ttdoc">Constructs a zip iterator from iterator instances. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:111</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a738f23c02f4a7437981d9e3e22470808"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a738f23c02f4a7437981d9e3e22470808">cutlass::ZipTileIterator::increment</a></div><div class="ttdeci">CUTLASS_DEVICE ZipTileIterator &amp; increment(int count=1)</div><div class="ttdoc">Increments store iterator to next tile. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:247</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a3a2cae47533c1122eb8ec404473a0d9e"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a3a2cae47533c1122eb8ec404473a0d9e">cutlass::ZipTileIterator::store_post_increment</a></div><div class="ttdeci">CUTLASS_DEVICE void store_post_increment(Fragment const &amp;fragment, PredicateIterator pred_it)</div><div class="ttdoc">Loads a fragment and increments, using predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:230</div></div>
+<div class="ttc" id="classcutlass_1_1ZipTileIterator_html_a9a3f2f913ee73f0c04e74ec89c6c5cbb"><div class="ttname"><a href="classcutlass_1_1ZipTileIterator.html#a9a3f2f913ee73f0c04e74ec89c6c5cbb">cutlass::ZipTileIterator::load</a></div><div class="ttdeci">CUTLASS_DEVICE void load(Fragment &amp;fragment, Coord&lt; 4 &gt; const &amp;offset) const</div><div class="ttdoc">Loads a fragment without predicates. </div><div class="ttdef"><b>Definition:</b> zip_tile_iterator.h:174</div></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Wed Sep 19 2018 13:58:50 for Cutlass by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.14
+</small></address>
+</body>
+</html>

From 77d1e0ca8118bfe57f0b529291ab2dddfc08ca82 Mon Sep 17 00:00:00 2001
From: akerr <akerr@nvidia.com>
Date: Wed, 19 Sep 2018 20:42:51 -0700
Subject: [PATCH 3/4] Updated README and CHANGELOG.

---
 CHANGELOG.md                                  |   2 +-
 README.md                                     |   2 +-
 cutlass/cutlass.h                             |   4 ++--
 media/images/cutlass-performance-plot.png     | Bin 114552 -> 90699 bytes
 .../gemm/batched_strided_sgemm_128x128x8.cu   |  11 +----------
 5 files changed, 5 insertions(+), 14 deletions(-)

diff --git a/CHANGELOG.md b/CHANGELOG.md
index 73c2f7689..c0606491e 100644
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
@@ -3,7 +3,7 @@
 
 ## 1.1.0 (2018-09-19)
   * Turing Features
-    * WMMA GEMM targeting TensorCores - INT8, INT4, INT1
+    * WMMA GEMM targeting TensorCores - INT8, INT4, 1-bit
   * Batched Strided GEMM
   * Threadblock rasterization strategies
     * Improved performance for adverse problem sizes and data layouts
diff --git a/README.md b/README.md
index d5bd15ef7..c53a42f4b 100644
--- a/README.md
+++ b/README.md
@@ -33,7 +33,7 @@ We describe the structure of an efficient GEMM in our talk at the
 * [Examples](examples/)
   * Basic GEMM, tensor views, CUTLASS utilities, batched GEMM, WMMA GEMM
 * Turing Features
-  * [WMMA GEMM targeting TensorCores](tools/test/unit/gemm/wmma_integer_gemm.cu) - INT8, INT4, INT1
+  * [WMMA GEMM targeting TensorCores](tools/test/unit/gemm/wmma_integer_gemm.cu) - INT8, INT4, 1-bit
 * [Batched Strided GEMM](tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu)
 * [Threadblock rasterization strategies](tools/test/unit/gemm/sgemm_threadblock_swizzle_nt.cu)
   * Improved performance for adverse problem sizes and data layouts
diff --git a/cutlass/cutlass.h b/cutlass/cutlass.h
index 097714c02..15ea83c01 100644
--- a/cutlass/cutlass.h
+++ b/cutlass/cutlass.h
@@ -32,8 +32,8 @@
 ////////////////////////////////////////////////////////////////////////////////////////////////////
 
 #define CUTLASS_MAJOR 1
-#define CUTLASS_MINOR 0
-#define CUTLASS_PATCH 1
+#define CUTLASS_MINOR 1
+#define CUTLASS_PATCH 0
 #define CUTLASS_VERSION ((CUTLASS_MAJOR)*100 + (CUTLASS_MINOR)*10 + CUTLASS_PATCH)
 
 #ifdef __NVCC__
diff --git a/media/images/cutlass-performance-plot.png b/media/images/cutlass-performance-plot.png
index f61c2e50bc6931c6c33b4cbce9a2cafd376b2b9f..041d28b3b9475933546fb315a8b4e9dc1be6b90a 100644
GIT binary patch
literal 90699
zcmeFa2~<<rwl<0uDwfiT3L=f7qGdy)A{aVB8ZBv*MjA~JDWnGxLKgxk2q>LZs2~DS
z5s`pII)TtcLBJ9O5klxfD+CfqfCvFX;9onzDyr^z=iL8}cgDM8ypwTG#h7GgueIiy
z^PAuN=JL*Y6GOotC4c1O;}bl4M$e3oZ&L&x-?}t`_26&#BLc+1(;6Q$LtVbSCaE##
z@0@gub@=%56E-c{uLG|)UO!{w!^gM#1oZzk1G4CJKECD5vwAuf0f=#OvzxR_%KnAx
zf=OdHufBHrny&xuO8M*3ThBJ_>{;*9(sTK_xUHiH{})-MP1zL_4^BNHx~H{2TjtwX
z^t-K#z2c4J^*e$EO@1@^d?oRX{h7#^#*WLs$wY3Ncx*ZvXK_G^lGSwbt^itVvOTaG
zMtPs0D%X^a#mT_uzr}0@_qOr~Yo9j`;{X1NkMD^ifAyL_U)uh>OX|;8Pcr}WCg1;t
zNuYkrvU@HGElhv4X2_x%YIfYl7FJwQk^1V@tIU02g^0?a2Ob_CnVDkw8rs^Jhuk&9
zpN+Z>{o#qIkdROTkx1-P3W&xST1#EAuCK4pUJJc9s&JG0nf_}14wS#Y>XDi4(qU^9
zGD??g6+hkI0Da_C>GYU*Hna!SN_3t!-M)R>-N)zH5y6YB5EKfPE!kHSC0xj2^krop
zzI5qQ!^5PcR<nn=W9^#8`Bm0l#DM|(H-&|X4^51&Vm91)(%IgA(H3T@c_Oi>vNBCt
zS~@ec`4tZ5bne_a7Z;5}>-t?priVnU2Hp6$`)hAcPX*Ms(F?X~>sn|b+GkoB=a6ib
z7}R3!d%H6)m)6}z^zD1{s;*M|h=RhkojZ5BxEvRsA*(kou>HlV#D4&{-1_vi8hE<y
zDf-I+n57VPa_5?e!7|Y^5?_bv6S7lsUDZnP>8f76&s~GGg6HmG3#qdw<EM%=(F?~d
zohpOpk6I>P(6U=tXQmtBbC(i-bvsSs;^NhJFYPBqNM`Ql5x<w`(UTPA=A`X&r=zd5
zEiMKJtyjtuS42E_J)SgH)waE|>fEVIaj4L{b`K9!HODPf&OfU{McD)|dwyYE1$TBO
zh`YzaeD0j@P=hb(iV9);_IpOQ9-7<2Jf3~t$X8XG6};m_^3fP%qZ#<QkhBUk`-Ei{
z6(43;(&$|tx;D{g2mPFf_e58*#hTl5G93@utwn@T{|S^bxcukGr=amGJ$%;Mqn4JC
z^K8g@F?&}2k^Wok+1+_+OPrA#J)Uun%FQj6QyS~nIb6$+kJ-ZBo)Lqs5BBy}wmg+s
zt9kZ7aKO|#-zjpoM21YcB4P2UW!9j$<LE?1ed_F8wt4FkTb~I1<UIE$C(90DLVk4x
zzZ&*bPw9zWR@w0IaQd3eQ8O!Xqi9M!4NI-Q#<d)~h+7{QJbbi8zea1nLTs<U780U$
zBu-(rL~>D+ffD-ShWOFP$ER5Oag?Qh>W`JPuRQ5&=_s3A2Pq`;<fv3$I>wPkqji4y
zVrEN?JPS{Fd%bSneZt=^<vnG3ZyQ?M<%?!v&}I~xWq(78Ih);!iJTY01FQ3I%afdC
zyOI5i&xXq89{a@TGv**5Cux)*GytC7e!$x2=tj89ZEaWlP?n$ntM>l2w#N-sV$CK#
zOOZG2u|AsTMc{x%kh`~yqKmtC)>~_vPK`kAw@uF*uSyqg>29ULa=M%I%7SKGv0*Qw
z*=D$Ay6e3yS00{FRdr*SQaDR6kJiN{awek|`nl^o6Zlnce>qGPA)PsN)t46gT4ySy
zyTpr<(1<7&yAq)-S86vy_V3Gd^(E%TZQ8U69qRq$VABH~=`BwA@iuq)OyH$I&9-6~
z8x(Yd{YdC`LLgJ#l21H?#2F)(`)9j8bO~LickygaiM#2qIJZ2_qc^7*IwO1N-unAt
zWQsylLz1F7a&U>mo_8odXHU>}=`)1~%+tx`*(tF$xkGY#rP(myff*Vpdu{S7{3&~t
z0D<eG;O!)=xvW<38OuT=CfnbNz}<YDjS<iuJe|XC9TK&T{(Nv^>&;(X@8JYmd&+$F
zhaS%HJ0?{(HRX+c;k2DrdH`%gBVu-mSKo^tugpGcJ$$OQXjt4Ri^C~z=!*eCDy%mz
zctIZvg{z>u{ncDYvW;As<>K$pDinFYx4jIHPr-^!?H@6mKSsShno`B}JMX<=rn~md
zs?L^=S1>xy&CD5m@PZteW9J`^t2tCF7VmJJK1Fu~8{CQ<9DhTI1V>H9NI*^{n=mmk
zkxoX{KWaX&sfcBpa{{BwqEBul(!8vvNCJ`b>+XlJr6SQ77=_F#nD(KJj1(9q$P6Q&
zlF+J~eS~IULX^&BU2<iadyh{}uxD(LkvtMJUJ{S@kR%?@`~5;1tFYKp)*ujV|E2z!
zC%x`u-+p9B0t&YYN%0{s5jAo6UIgoj4wiZBBZaD;MoH8f;e6|^SGt3m2ux)mPK?jD
zpCi+v%1kYAgbR#vqR*9Nh7q!lXrL);aDiM;Rk^@XP^PN1e&w0lw^0!xFo&CmYh%Q-
zVV0c4k)mcMrP&<$Y=QDMM%&IVy5F2X*ua~!Fk_KM6))OZf4IFxUfEDI`fiJ2?sn}%
z>HadcCq?TudUGVBh4eok)ctuVh((8EwN%Hoq6E&?GG(+wQkNWqGsaPt^JT;MjwFOm
zm56r2TkEtATuA-Xj^zv6*b)w(XH@R^xV1TK(N=F>xSGEH)t)!m9k>fk!}iV1XW@yh
ze(Cf=W6kY}T7(!>O(}v9l7?NPj>xSoa#XadG9pf1W#=$`W~f99V)<xUTCK9IpKQ%u
zZ8rnuPpHlVq!6-Cv$|n;+r&Atoo$(O>(Ua>BVIOH%iZJWdn*DHvF6CoFR8Q9pN&pl
z-+`6ZgGPUm)v$)6=U?lpc0|wV)7eM0FolmV-!%x_n%Q)7X3Nvp%!u1pD=Tj`w{EvD
z_nw{aEOeR=!Kgkt@jF`9acOYjNK|#qldIz-C4)|ub#p0O&9(ov>wSkUb&py*2p5`{
z1yDjhMh4_1-El*)AA-Hzb1>2^m3|UnpyGicrl*T@re4~AInT1`!!-nunwT(gj?J-H
zm)?f1{&GguIbyaqe#o@-aMgEj``y9c$16mO&pS<?B)B@i$QwfO|BTfkxLVcNYXnU0
zvdp?G^fVEKkjoMHypBpd+`xK5;~icgB2LUb_THD*G|gu8P+i>4Y}huohC3fV$$M?c
z?F+N$d)_08x{g!$<Pz^$htN=M%Sz&Hl7UKN5H%KMl2A}3@FA`|H2lrPv%KG3f)>8H
zU`;H`yW3r;`N{3`<U{vP<^l(n<?4$hyjG<u`dDhy*teG+A1!Is7|Bl%pI;f*uGyzB
zL*q^1Q8wshI+g37o~ZI1)DwJsWR2esnPu3gj}X#*IXVP^opF*qcTbt%eB^KalsIaw
z#vK#idARc{1%YjYrQ;J5#CX^czkiNSL2+^MG1{Hs>7M(c+cU5W3s)^_zKY6?Z~L5s
zLdPQP-+4DDTwqmVs8#Q29~s0$MiRIfA)MvZ;xvu+W>2+!cpfD|R{I6jg1_S<11^Ic
zcvI>XE2bvpYjm~k)0h%_+o054%0=R<ED}Db?1S44+aS14xNefM*7jBnf~;nc??|y_
zB^{|OCj!eWwYu0$yiold3GYXNDL7Hmsy1Rgm%HPa6js5Bm$YeFwhWVeoap0X+ea9Z
z%w_iodn|Dy(l>eDUiA$QPQ{v&^5EyTc~}VM=_|doqKx35*pV?`Wq<MUDRkn?9<`RZ
zna)hEg<bop+L(AA5rLxWx*>I53ZQ2;ohEXEd-^?h>wX~m$Uk)Ol>cdM46@rMf)jM-
zb^pRbkS%N*r9N<0-RMT2!_FLBOrWg%2dfC19Lm{>J~fih)Fy%a-he*H8_pAmcQ8ch
zp(I7S7p@xK!L)eCMi=-Q|IZ;auqbLg`l-NUp^TqMU-!OW7+UJ21qgom>d<nZiTXnC
zBVe#%84+h`_&X%Bx^5D%ZR5q<?3CHc@n^MVqAX0vo^<mQaSZ9i^J!V73@DCBg)5*H
zA>_FrCIDg4^;lZ^Pa?gZ#C}^9wTqU5mu9K=PoCkwCwI90+{tfZYqGqd_$#uz93N%{
zPim(!uP#Rk>gxBul!QsDc1R2qGJT7s_2E~P*9KMU#yE;rrT9Ma`Hd~}j)GW||GJ>y
zH*9n55^GaooiaAEW<7j^zKCYtEBo46E5=SF;qviZ>rlebrIP0G*&NczHb#f|Rn#Di
zwyntRqsqy<gH_h5*r$EEsjTpLtJVa4u_lH~sXqgOHK|0g6f8NG<#$M&YJKOSKrQSG
zbbH&Qk;>dx)TU+mmrWdKI}dZglTtDluf5$TW}h(nqxFdcYCg=7PZnvC!_DnU`qsG$
zyDYao?GVU{b=XczekjmUd%`l@Z}(bF<nAKZx1%wNRcDCTu}nKn?MP+!Id?Pc&00kL
zi=>Wr*HZ^)QK?F8ds&)Izw5l4wzh%?D9&oXalA)mTdC)m{5(^oOb;4N-kc$sy0fT?
znSR<EGqz36vs&e(v3IWA8CYXrAJIWMn~Aa=gyDLJu$17mId>erAx+)i40(~%%>4Yk
zIR)_|P|+=CkPS~<+ax~EDgVTa+XFltaQP_F<Tp_%$*reeZQ35U;6!VX+qKQU+P*qR
z)F^Oq&f8Y9_i(#%p0ypWB}dGQKWxuub4zh0N%`kC7gd)t_~Q)(F=<xtEBSdo3%ig5
zwIrNfmaAG~4@=Ez13cz7jfBgh>ZQuoq|%-$Txoy)`Euuh`d{vI?uKICpR~x@Ncvi&
zH>yR?L9(8~;9A=~&TD23rONt_W8v?Idd*awlI%Snf3s<AIL>f{i>#sG?OvA)h;umV
zdCf0ExHc$%nwuN<{}#v`F~*u~-YJ#x9`g!!_sO{k^YzFhu}BXuudK`#V1cdMpFTy9
z)e{mD%#m2hqq5g5(2H}*mf>VP@{ncWg%S^daZHGl)asawasT9*D)Bsc`9o|AyfR3|
zl5AFDha?%k+~g4NBSdro^MAw}6YCKpLRG>CAMU!6s^n7K{f)zBnIqdBle^{7?ca`m
zLfM$VSKRlWRjQLgS9FS)(=WGY*tE9YXY|46xNfA4w}0xU2Wp}$TI7+^nzXeJNP15h
zh=7SyytVI<*p_qdtU&y>CUE;A<Rfh4P-X194-gom>P5VboREWC3f?O#5md~3fDdz0
z4nme=9=ejgg;4VzdpAGDzCk3`a`H8T)~z3^I&So~;1etBMOxpG<US)?k|?{k5|s_3
z9Sxo>8YsL5T;7{IcBwJ!i)kDV#{wQJAF}L8`<vg-%h64ou;BR25T96Ui%Mm$PeD`#
zKf?Y#CaxR1t9vhA1KcO&g0EMs@_`QI4&A`;*e(2d*sAu*SA-j9W-H)7KYkwMrJkSw
zPt?EinqGJ{In1#;USGVK@mSRha_Iz`MR`=cUDoK#4&NQxsIEzyW51(pF4ZdLTIj!?
zmm_qmaM=E>JQ!Oey5f8`y_J%c&ANLcaA`3RYohldLx3Q744Za3YuoFebfb~!TIduk
z6X1oQJ2SI8-Q3*99*H}3G(8a4aYoG!!V*xYtaJ-JG@=xyQ+hf&KGeK(^j^la+1-&K
zK2OjmH8BeC4wix;;#dsDpV4bf96vr*m?g;Ch>60)*j;_8o`8KiZsS_RV#F-+l9fna
zYImOh5H@X0E?FsV*L6#{|FlhRNzAi7&MN1RZfxD$(S|&f`fafpxW%m`SCuPTO{KYz
zwH^G?TeA&$*-;H%CU14|q8XC<d*c3VNfWVzT1PcP4mp~3i-GJDHQ4CH9^VnyoHB;@
z9x}k1z%2r*Jo*Ubvy~FS9V>|O!t?<oyjl_4+8bD&NV+Xay+why=Ij{_v@Dk~F(YGs
z$N0Xy2E0|~2`~0*tPY;pBeqx^{%)29O!%U2Y~Ci{?HL=>=&0=U)2$Vr_#4J`icyx~
zwfSBdz8k#;^G65g;YdnTnnfD6>C%k4E;4V!*r1c?PA#`<z}Y0ud0HVa+?;#^umdl-
zDK+9{Q%`#;QL2_%FLv-Nw5==dt3)MXrz%1?Fv~2@zN$1V9ZM5{Z4}*dhaS~x#%d5q
zJQ0I5YH%EXru{qL<(XnA7umKuZz3ZjqsaH!D1Sv+*`uXQ^ou~U?|jPQbOT6|sKX6O
z*$bC}tG8-qVDVuT0Cpe@Ep7j~a*}83BS%9vI6poC?3>B8@6yJVdpoSCm<6m*)L?8g
zEFLcuN)dc!RpTc5+uf!t_(fGyz@s?f(}dKiOZOLx@Ulm($%@C?IA2aDwXN%~+o(^3
ziz6B6M_i|pb>hScGa>@X)X1j2XdwL(e9?e1ULat>`tivLj<xU1VxG_P62~I#K$HcI
zjzRXZKPuF4XAijQ9CQCq$1jjIvn3}n>-q>#ie<BfYwMA3N=uWm=H=xe?Mru^8`seJ
zhWC5|7Y>g)8`)2T#hK)=?O!%o%>*Y$fOOoJI+AZ!->dL)lUxXUq9j`qK}KF+ojZ_Z
zqq0bPVD}{ZG36{=6;6<+EnWT4nq>;sy)~g$AJbR3nbceEuL$5N!;E;|h0LnNzDcKK
zNHI?Yw>K^zE>0ZoYu1l^K+~NP7Zt!gW_vS~3qjgE!p&o@KUzsI+1%x52icst3SMB(
ztGv8f!GO@IT9Djq)A{DTw0Ehg$pmXc205oCd24;P<oHX!AEhnHG}I^iMn);+3|UdC
z2Xf6>fc=oqiDX@^s^?_hIT5X72~Qfl04u4Rdh`wHz2m*&*UdR&1D~Pb$cRRnrYYDZ
zBGWS1x3_fr9)5uiv8qXhQefgYB3U&C{j#a=bze-EQVHech{t>`2>0$ieA9q+%35f+
z72bv}$zf+kyWl@C`jR-@(0}<NFERNnCt)tmAH!$KFKn<86A@r63L7QmE5imYYZP`b
zeO-7>i#=}u@7Pyult}&3VWEhqI77^4Mqc&oDg71XGXte^MRuuskh>ERgJsCwNz^xB
z^BY^S8YBUMf&rOqe%^4*c~YiY$bdt#M*^iSZ9i~T+0U*+nN*sjZ`?Lkx2s5=OHkVB
zTFp$1K-V^s6`5HcV%&}vA1(F*@Kzih(hO6&q)Bm*#j<y<>9;3{7f)%(&Lo%cygS~r
zU38Ydzn3Xj(~r~{onwe1*+-4VXE^1_^$m+W&vA(7IrfTP&Gw5ptT(s!)&|b4Q=-SC
zDeom}KYsif+jOwKQ!!agJ7F>)EiNw30!iYgs8_c<O~z|ql6_a8GmxRCy8csWqvK))
zUE{9E;1dr_Ei6U;O$i-;IIkpxWH_I4cx^l<L?`2?tLfB`3w!AsIryt}A$303h<7w{
z6<Qt8Sok}9PHAehmGlzhR+`k^2}W_K{&nQ}{bPAxZ3o^WqzfMhAHIeTA)(*2y*f1O
zpRB}q8M$#f;mf;HLCSn!LLl%%&`zRlm$hf$(TXF!pHU{~2s0#3@lzMKk1R&R9B;rm
zf0APQ_nr$(8tL-?LcR5~qv*w#n@F*TZXKlvs<nBv2KK2|ONhFj#C60E4GlHFQH*Eq
zU3)e^j@W;OtTDUkNvzzh<BuOdb{WeB`|dK5Syob#g#G<)So_{v*5P^e)SxDmi6zA=
znXMDe*A`g)=(fOdA$G%VfRemf>UvS_H#W2jL~90pJ8)!1m5R>6=P@OG=@?3KTbeMS
z($MA7rh`&c|M6=`<9IB6Nt24srlU>~hBRXwl$%Z}H84^4n^|~{l+!YH{e%~RS(fx7
zoib2SuW|Xk)2EkUB6hOWLxaI~emd;qkj%`XFZs$SXDOF(VsE5>Gat7jQ^u9Lm1FTk
z=9>PGd8UvoBMns`!t(Xhu9!Vd3&7a-9$IUfDDYM9`cd6W8SB%#MgZH?>EDM=dT3%y
zZLSjT-tD(#AW7iD43}>65V_g!O8Ma3hWzC5tTeJ2Wtx2L6z<UAT&xeGHa||uCb9P9
z)|*}4wOX_6!(-Dbfh;;1#1eMnPseAh8>biJ8L&jP^%QRiW}_8mol+SF##+t$y&Jm$
zCIC!=T3_5CCuK72V3n-Np!(qJ!E*o7QAQt^UVb~gmz$o&9;se0nk%E~ET$74z&Y^r
zwm{B%x546}=+}*};lAa&U<ME4cFtnO80LaCL{8^|fJ2&7lU#(#0X>x%WRZSq-_ZJ-
zSG9)JOsG<iZiD!UKh9{~P9Yu`AeEBd40qHi?yNm|oa)s1nqq2&`yFrhRkF>cJiGqt
zLyCW{n?&ovzA${?p|;zLQN*vz;4SqPf*6(7iln&dD&x}S`ZskaSn7RQW6uboY%Xv}
zO5_3uz=;>#`K%MGb2m&kmdP(TSX|5A{NqbKiDv<x5soPe@hvay(_y0S2bUi$T~B{)
zm4;`jYiXGfZH7<o+*)x6vp<91892-n2N>N4NcFGNcH!&@=~yu<9Kx9RODr>_wnvzH
z&$hSEdj$O(J0zX9*j4P74ZA?j3!$c~H|9q(_rzZ!xE<2{Wh!+Laf#dnXs{m1;nJ-b
zN6uQ`p>*xmDtSXo&Ag%Xn0&j8l$m^qS*hgVd1*!q1F=n8c6L#6SW59*N{RPKVXg}$
z&?eVuOMUP~j0#2h70PC+s?q|Npwu)Um~PUgte7uYv$W;Z?j|xbSYG_D-9hJ%EH7?q
z(to4udvOEc8R+pu-<KN!d9V1Kf8si-l~-X8dExOtZ?4P$c>3QkL-;=yQS$55P(7gJ
zn!kMcdU&NM^izYMzkgwPczDr$$A*T6&aN(7+pAlnqM|whF0lPrP*zqp-jZSH;u1{s
z**&s<#Kl@zR;#g>5Q=$N;O^#j=rIOkdTuD2?ndnGMPTbxW01!?sZ>`$cYZ|LrY$q2
zN-p%}1cmM}n2}LAi)0Zm;IdqtX(}*mLx?fNf4?o_5w3iKGf?_vd~pVi(GCS$h3FXR
z&m~!-!<_hcHRniPsYJ8=unRGhZV`7IbXu8ruX|NE5zaeBQ@(9F&N>Eu*izXEun%em
z%Inh{5>uBi#QA97VODmO2;4U{BP(`l1Wxa@EF`tN`C25+r$Ed}n2iY6p2H&XeiOD>
zd0GWy=bBG)MdA)yZc_51<Eua^!DZ|{<X*8;diM$r_lBOQ^vea?h=*t<2;kx+KgUf3
z%up?DCEd5voS$_pc~cJSzUl7ncFDeU*C%ib>k+lsBDqb`Gxpgh(&$SCnu;J~8->2Z
zt%_#cKNcB9jDOr+4~jtU9v(-I2xcwFOf3Xp5C-TaN3r@Bk|90a-RFp-az-{naYC?O
z(dSaX06=o(Wd#<-um?4$?v9Q#=k`-)wKw~0h5#D1SQ}J@Ix`FtzI?F(E47%L<BOva
zf=p5=YL+DR(MoKytS@~Aw*4vnvV?xbNJ4x(_~1~FdOdLj%!_f4JamJja@?@P*Z*6L
z$S)D}ySsbPTF82a201E6I>HOe5DMkSZN-nn?d+PvYbl~>K{-#G0{ZaRJ;y`g(Z_C0
za6qDOyp>{r+vSdf>Z-Lqa+fd7O%9yKcI6~@3+P$Z7N7UejTEI=o!pGj@*J3FQUI2I
zW0#SE&m|p)Zs9UN&$ona%!xE6u<7L%aW5oaT(-7;IU#vjusl)#Ves~bi_1@(hB<C(
zDJI%0^{tBN*+9I4A_7WYPhDL-8z%a$AAiMNQ8e#Jbt~Wp8)VCOH8ItMyql70Rg{|)
ztt$ei<Sh4Bft=+SLmJ-L%#7I??mHkUO?0e$0hLnv<pj7@8a|^AE|+t)=ll?_2m}><
zs2;!VZWYmKr_NfPevFh`w3!IHELbWItpk=8(t|q`pr{`Zl<d%c0-zGi?P?at>QpLj
zY?vGrKZGT<mJ&*pu_q9##=P~9F>eZr7jw<^+ZzA+mozyMjo<INaLY=t3lkx|&0K<G
zaH6{;8|DV=F2(zY!lV`m7n<m)GA`t0jV?;#eu6-IC@6>eEm^;8s^448fksuaGAdqj
z@OGd0yN{ssZC6jHdoKKbM<DNEC_?aR9kW53F;f8}BCQN_QPxBj_O55+Fh+b&^|RLV
zf~VpoU2|m!7uG&Vv>?+V#=!OUPF2t6R6X2$D!`Z{+`@?{{8!YvCB<?9bE||;iTh2>
zRIH1cEI{^6*9Y{uvZn0mmyBEA(<ny~t<Y*;|CO8j@r6~z171iah087b=u4DKYT>%N
zx;|o5O?JHoV4t5s<oG)|?O&dM&dpf%8%$^|P7gO&q`j=_%e6>A7w6p22Hck^@y?B;
zkpi3C43~7SHxV^?Q6l#q9vvt%TXnu_R*ny$)y^dn?og4W^~Mz;3PZfTDSnnG@)*sL
zY}(mQ%&`J2)u_A{Rv=P%=h9&mu;I@-;{o)&M~)mBhGQBG#<YTceeYuv=`B+s;!h>(
zr1q6wX7%6$p{dyW28VAJ-!|tJlT4w`d|Q~IS<GCl9Ko)cbfrv{(o;f~EL5fz%G_5h
z{y1;-pWp;2AQR!huxma-EIqUqlOvxVTclZEzMPBpsBj`KErnns#dc5MIN*&&a~fe+
z$&OP!I?@e>NNzeS@rHd}<vr}@<Qu<XcQ?B3@|PfzEYzEzRL8so4c$;86*)OO(apUb
zD*YT0^)5zS(To_pdLoQ@6OsJLjg&W>ps$8<aM)v)clYx(etbjSL{Ita*Y|KalBID-
ztD2`7zLPR_V0F!qS3A%zBdry&sBe39lZir1S?v%b;vHxq0MC_#6&vEerkF9fq?}vY
z{xNNK2ys3u2(1~qq+$7qw8|V>R?Oki9T7jcTDghu4|#rcG-m+`hP~$Vr%#`XzLkyY
zAq0nHWMp1Y7q7}<cem-V&kN?)&5p^CJ&2QsX7Uh~px((XyH>hpG0OcJFQ~cHnQfs*
zuKdP=_BLOb3y=8Ylg#N74Y;q6FZ!G=zFtw!x!nCrnzI)f{{TcGdY>in?Hsh@R8WB9
zjq9HV&gFRctwtk*;#U6|#kKb>L+8Ij)hEkBXfb2|wwU=?>6?bi?)MhJ3TDHU$4<?0
zr%4VUYA8O5z}}pq(r&(cR^#uxpkVPspQS&&=PdD#Q*(MIq_pCDGS8a`zMtjEl_z2M
z6b~PMo+-x7YHdWfCcF*Ujj)=yqIHgVY6&V8%Y#yJ|8%zBT;BSsoQDq|P7@BE_q%@m
z9(KfaaAt@X@;X-rt<VO-baQ@r`Qvn=CvPiInlV|_T!=cR>dheG*VFSDHIn|)EtYt?
z#<)ry5>ip5i6l##6r)0C)E-)@2OIXI?osWwz4W6I4qx+*i^tyS=IW=6<+#wFud!!#
zcDC$vu}1-r;{b@?M`$j;X=VAtOCqVb<#2UVqOGCIb&WG*DWMEW&p77IcUUqTwXS+k
zhaHz=S>mScVlA&idro>L$}j2Ovips@axE)v`Iy+iM}eD$pQj75BhBn80)EAcdAonC
zceJ<PZ7EIx8xBml$@Q{@6e<dEqBWAmo2GyY1#4hllHMSqp@pL=W7n5%>O-^Oz;~7a
zzkGfnE-fwX+g)=at;i+Cm$Nmc)EN53&qyx+!1uOM14xX3xZyx$Nr{zudwctr!Y)Qr
z8i+Mhi}Ot2ht``idMh7eW6Z?^WVpV7_tUnvwpdMJRGfEh5cb6mjr7Nl&k^rji1#9@
z4fLLk_Q=aCr>jK@gqi+41M^6chil)K_Y{ME*f))vkMJppZP>5@vktb$q8w;09^#Kw
z=L}!*l!~dTsR78%tG5D}4L}hV@LbpAIY@yZIX*Y1X1PBIsR?ENFYsx^dCYTH|6!`~
z&WkE9)f*h(f{iR&{~jm#?4Yz07sPOwh5#NS(_g{y*9IXH57v@N@2kQ3m7zfudr3m4
z8?b&ALM<wlKViEUAs-@maold8{ne$FVC1@CE_vByT|!PhcUKUdA!b&F=K7h<Ex_0i
z*^LVe3r=a|4RNk~WkK;O#{b}_72bpBW{wPmq!5<-As4QFG5igY0)Nh>sP&4^`D)iL
zZR1KS3PHSmkxk<x5I_y>cODh1fto#RnUO6+qq0pJW@r7t>RwTY(XA{)^X2dsBu%e-
zuGR#6-#-jNKJ#-^4p;*psHoVBC5Ln?RA-Bt9jORi)?)m~0o(YS;!u=zR;J|Tc#k|k
zw>+`tJCyBm?=Jyd0_uw?FT3_>&kh5i4fIwyIXRkkmoypGFKL}*GH2Ync~B#6;&4>O
zX&k+uXqPL&y8Lpf;OB8x5x&G!7n+Bll_lV@>U;(_xWv<es7LHF2%(w;v&jD0Sk~k~
zP4lfM@atT6KR4U$)jaMrLoq%t=x?A_YFFPU&|K&9G3a){rb27O*7sV5{l$mz{#NQ&
zSz`6Os`~-Z7M^!Vd+^|aMOyUC=AAz#AT4St3f0>4?TDTuqR$xH^l*L;WlCB@`0wQ~
zkB){QTdpBF@6jhmG9@_e-aBwEkY$!0SlJS1uw<V-jh6+d^gkC#?s^q@47JW~s8Y_^
zn!crbA0QNfp}UT9pbENcyuiRkbt5ki5A+Gf?vW4>$&Wx$O{&8<2m;W+u{Y1EH{B^+
zzp$=m$Z0Bd8hMeE8B?Hkf*9s`Iebb6S+AydsstbZS@Av^k)LPn6pQUxqH1ludZ~dG
z%k=9apje(*6N~UM<6|+j{Ua}e?DG5^70bV4%82hg6OeYwSz8IY8CW0H4akTlCH)Xo
zQ(+jvTEA{Dt=B1;^Z=CJ<RUt}y6ZX<&ZFTGBC01&eEH(5mt2y^4jgB2;kENKA4cHm
zZ-5!n{2{reQ?)uZLvlC(xEW(2Emh*8Z&Cd9`CUX*-OIt0yKZjQiE4_cQ^i}#%9E&-
zjvX`t#`OTY4UKbUtJqdrMe5)x8+nnV@i(r_3h1olURq5o!eRs9{G3S9=AEiiWM3k^
z<~Ezf0J4EZ0df^oI>p2&(R+J)&oE`ybY0L*1M6+BpNvZFcaJ6simey+uBfvyZ9Lof
zDR6DeQ1nFH%q-9nP!&^*p0$R|AZ8%w6qmJ$<ZMaE`!;aYjtj<=&hZxZ^KLF(@lD@a
z{T2!-cczo(B>F8T?27O4JTY7x2BRvXHlF`d%j^7G?=3;MT~X47_OV+^#~qVJJQ~?g
z!koqpHJo}TCm}GdAK;hFIXJ6b_vE#&WuRs_;2nYdgOCa^_{sY$kL39{g*HcTuQ8%N
zYAY`U0)h|R*#ya1qhuj{N~@-HWepoYJ}@PmQGpC_<#FU0SH-yU>eM+Nwq1Eybf4!w
zc`yI-CYXo+Ou|2ygf_^kX7oUn+R4z+FtGB?n}<gf6)7{XWwe5mD}n1jl4c8%U4W^+
ze7TYsgz=uB)31Su99UUg{NPh_Gi8-Uz6~_i5D5tgNS+uU2WTyWzq(-!6*0mSzGY?x
zfv<y&HLOD~_%0Woxu~^0f7yGLx|~nm@!8GE8&;DA_CE{|MOYBIVsgJ6&D!K+N<(9@
zj7yfePRaczSIitdy?q&yDAT+TW{=CuTasLFclmN-{efp<{-Ra!d`Nf)OqV!SD566X
zaJMoZLSMBTL|@It;V8@7AvqdQb~NApJYQF5uq5#36_w74ZH!=mF&u38p>>G=2?i?R
z9!5>}>tMA?AU()o6t~uEOhqFg=v8==o|&0xS3?(-#EGq$2OxGB>1&9=V4B_jylB|j
zlry_D4j(@JRk~=8l4iWzDQO^zHlHaASia%Ua6N!BV=zH{TFehH>HPFqm06D`-Im)W
zTmQTdG!FdnNUhgfJ0Qy6*VAKkE+Zzs>$boJ;TsTJ<k$(M4(2Llte*~PJ4pa0Ci`O(
z(&&%x0hP=n>!?X)0Hnw(7>7^`_0?i3ly17-V3_+sG5;MT2!}up0xY;JH&ft!|3#+g
z%}KziJa<*&I>t_t2^C#k>_(cd2MTXWf+Ju?KFLA?$NBmBiV(mHy#eT&6cZBzsc;bx
z+qLpAIyba-VEEpwQqa2UW~SBvBmwwXP@f>1Mcq5c8SgBts0v*US&{%{U}n9*9WQtH
zudD6rxQd)euU^Z%It(2p5C+zJ!~rmI%OwIKxL2>hoUhl0!9LPJcwZF#{)<3M-NhA%
z?mvik6;CVLqgDwJISKiuq$E_(LO94%O-=2?=?;4UoV$B^8fj-MO>O2+-VW%K+q`1Q
zUy<{D-MjE<tA;U=d3ugdbh@{@Tm9I_rwkxiSX5p+JRF*EJ*dU9LSk*lpTGWg@0f_z
zlhXm(!{{E6&yP?j%+LO9m75FUe}0Cq##t|F5@eg12OG3P7L&09_wCfPSv%?m1_mCz
zMMb<j-J+~<zx;0Vr%%Jn7x_Q0TAHRD@0*kM_iK79*ACQ-&S=$ibawtOn^73hGNq0W
zPg1|1^eQ*^Id!iQr0raJTt~zSMA$*H5}R2ly`H%k(iFE-)eIQVj$cqHbxWH!pstNQ
z%;ohvJvIUnK3F7>De+P>-c_yygNyV*<ua$!#LBJk($goMHM3b`l>YvH5(#McDGA6t
zK>Z*5{;MGE9COy&6%5qefD~$=0n2d$Y-=EV|Ju&mwY9YtX~}KuZ_`v_jyvc$zzwNz
zbidZ{e_1`&3}A+n{qMqou|q_F7VGQpiQvy%g38s5VV)I05J-b;25D1vXbxBvD7;IV
z5Fm}hpLfAmM@l|5H$6T5h~5h^x-_T<V$o@Lx*h2$*n{TV(%u1Xa5~7*abIZeU7=yX
zga*QWw<rdK8uq+{d$$s8l_5xcg?cc8+(q#UYujre!sdrI%bE(Sh*A<rkjyH9HAT~V
z0V5ZvIjS;DX}7Vn6JK3OkbkBuUA-wmM)Tw8R^&7GEC4j;chkYQI{NyWWrvXA2r+v`
z00TR^S!P*b^Qtv8`ltts@b3il6_n<ZD)A|+?&>>*$QyLn!-fAZntT52P5~=_ZX^p6
z`k`vx``8hc8b$~^YTT62XL1hQ;3;hwk7(rG?B8Jv)Tm^^8`@jF#cxdEPE~Es7n#@Q
z$X?6$IAg4CmyHKX5x_{EkRih0$#B)uQjUd64Q6>R$pZW}kOL&^qE<cu;>0R*a^CUp
zDdJ>vv3A&_xdk@PjJP>;X~@oO9pA*)!fjw8<QK*$vISltz<qz3Ebm*|&2D9sv~D?n
zy%IFuoGKsVu?M`l_-w|5qr6vqNA~@*H<4UsT}jL?blDP{GSD2lcn-^l$GNcj`?Z2Y
zv@WgT3sac;hrgY1H0!fWo)!2NXCSbZG<JUVIHH|TA-=iYbGj3dF}^pIuCkKNorOt<
zz-NlOy}s;Oxg+T5$ew?8SO1M$j$_WS>@u+@mlo>@&+mGxcpyIgbp6qs`-D8^6`y#$
z(;+^iCR6R@duZm+HCxxnKF+LgCnkiD_E6%%$=kCl^R_Xf)p;pl#&e7952b2am&$*4
zI`p=7s<TUTWNZJRz#hMZzkSrS;~#vq=yBtrqVWIuV0laMug2rXN^bQ$iX$^yo3(%G
zTP%I_FlE4>z&Sme)#sJ9ug)G(UZ47h#r|JZ9eHNwoQfkXAGG{5MbTc`XBnI0!gMvc
z+3?=UO?BRV9d~N#Q~eSHC(<z?!1hM!KNYoYCa@=D3$!^Q>PM7?m|)7lJh-Vo;u!?5
z9I~?B|E@kj?5{T`0iENHM9vgWfeim!>_Dv>wf9iFvIo!_5%L&-jUKaGwRPn)K-3d3
zg&<mHAykrE*0|LkzSVv_z&Opi{z+J1L}|<^e`OHkTTR(9Z|C2=(?KXIDmpQl%s_7S
zi8mmnpW=RuFzm;_2C^nD@!U=#wVD=aIKv}e(exxL7MauR_sJkwEo)W}R_YE+$p8tK
z%UD}WOUt8)aYrD14~<2FUc2Gd7-g@Dya<9`AuV0ZO`Y!mWO(f9Bm!QYk>fAAK0(Qk
z|80&8(1FWuMWAuhsQck#!!z0twT6koY)kt+hrMc?;06UE4EfYyUgAN>w)pdN)z!MT
zu(7R(nQvpQAo7K85H_1BgXj#$POcDUkXwV;IT}A>cuM2_3DQXojmC6M)I(Cf?BB=k
z0xnH}lyCc`%h+WQeNZsYrM)a8@=yCpGWJ!IhZP2f!&p(mveWg06h|O_Yn08w{WLy4
z{xw1LGNUA9#Vo*67}Hg6*CJGy`B(tq7;G;@V?A($ItpQ;<g!h}CWDoi2_c#QEsWis
zZjQ<a4OiI10C5=sulW7(*7vxah}K;IA}!FpnQW**>0`mA63<L*$+Qm_7?~5_25N)s
zqqC*u0s;qtjPKtC&#i6IrvgCW2RCd+1ed;yZIT=*c3gq1+q=bXGO^Dd2fCjYHAy(X
z075515!8YKy7`Mu7=w9X{di3{qo=lfv1=M7l(E=_V$lIK<0cG={VY&No?hVgLUE(?
zp1oCom?W*fk@o0QbG!)vIaMd<b+pAx{1eog;30JA(4qM~Zyh0DsN(s@rQSMD;@;f7
z&s?{_T3+gNS{@2rOc*CDvzF5p37~+-&LJ%1Xe7hmfXU?4XfK|gZC+k%9<wVL_gbFy
zDqNnEU3Ne$4{0ws%!1pkSb9vDf830)n*sFjIA&=KGra)*)Y-=&_YEVXS#cf*LJ-yn
zMAOm|V_6Hgr&Q+Vq{y;NhOriU;XZa`fv}88q|=P2OO|yemn%|E;6}bJUd{obg9OEi
z>)yd{fSa9=2OeaZvFxA9DG^@Y2ckWJqrC)UYvVX}E_b|>Np$5b@-K+;-z&KB4nE)Z
z#Ns-CRg7nM&0P(Y=%NBa3l<>!qqD4()S~1l!rJ-+XpUnBacl2Cj1o!h6NZ86j|YK6
z$ac-!zf9X3+_zVF=~Jl5wjtN9ij-ES&nw7zt_lE<H)Aa}hXy8A&h;(d1KzfeGjh?7
zVYi%B^j;0T$8*QO@IVBB2s?M{5;>9&fps~7e#A~-M+-?Y%(<x{yYgRgxv9R)J7F`R
zg5dE|bN0~MQR5rKA0N~u$YZ-r9Ew_wBfFhrPo%u`R2QtdUg?KCZcIKQ8ENl}1cFLG
z$(rvU(?fQ<#43I9cE69GIBu|W?EHzJxo`VQ?9B93k83f2-H$UXNvm_-BmL1JyW6Bj
zY4i90Q4JGe5yFRbNxN?iK)8`6vU`G;aBfIY7~tGjkARFCv}6QoepqR;B@LT=9d7Cu
zy{x!3?fvQbz8&K<2H|H*pT+rv(6j$y-gt;BepXyIYvS)w3W_80OsHHl(f(3spe9<O
zho`rH4^l%j6<%^#MA~jY3DSMLn*MyazC?wjo+2zdN+59+Ts6|AtsQ_$JC+Z*TKN6k
z3f5s1B&ZKMq)mYcRH`CAO#FnZY3R8nh~0N8*>m{F5wItr+8UH%C?t-WbQi6-&Qt7S
z1(7AFD&g44EjkSXx;`7W^D{kjbX5A|(+LE~bVJaeK#R+gbyio|D*EAyr0q6=gj2JC
zYh(rinE_CFG}CksLzx#+gE2X&grmJjZ5ymyANW1Xomvc8Gi_fz`p2f_<D(E$P6b4i
z$DH!(04fEdjj)Uc7~2Gckwx_}P1iUJ#tG5;mD?EGZZh%6r1D##P$$6tkMF)g1!XX!
zPkKpxp~TYfq2Rc=!`cBTS%D(j7n>;t$S7QXY5?I1@CTsyaSUEPgwDBWWfeMcT&9^p
zno!ph;f#(RzyT5WbUk*|qzcq5NyGg?5M$1)@5s}kar?Y^_bhQS0~TR83ajoSUWmxA
z0XfLq^D}_yZHlPQVOT{g%|X%_tT?$+SV(9(=zPE;x1Mo!v_c}h`s=D;4>=p{($MYU
z=!t05y&mKQA-5!$^iCndtNZP_p^~&YC?ukm_C~pStcJhy``Ew*3|fHs=#Q3r#%2gO
zTh)(@TnjP?1(826YD(#6e+G47{cZB9kJq)lJQdKYXE-U>rU}~GmsUlPCp%WkhP>Od
z<s~7Klz(XOJp1i326(Z)xXXB?81fYV8l0^%`xpNqVEO)@vHgdI{@+hDTkQE^0Eejj
z2t0;cJpji+?biX_Yt7aIgv{8E*23~~Hf`Z5X4T%7&xR29bx^<pCo^o@P19LJ8w><h
zZPVo&?LaSA1>~Ez#sKR$mc`NUuMoifKcekZ<pS5C2n9l`QyqY_ONB}Yjw9%M5oioh
z+%5Jwz_~yhNmBz<Uid)xID<h+$j<|MkP1k+w(>}RUdLa(=Pg_)oJ;p~0++E=s2lMn
z=h=S+*%&U!2Gy#0!fh_o=rdJ#)s8y5Dgs^EA}J;iIzR0QFfdfoUbsB(#H}o6XPIJN
z0OY3;a1YxIF=+=Ic(NL<5~1@H>&urfxSQVu;{HV1Eju8J3%AN&$-h#*IavU8qPhC&
zOQ>_ZJbXmy3jP}vH&keY^Ch&mYb%xqGOsOJqmAuBX)qM1y++Ib3a@|JwFnir7kVIC
z>wzQG^GUoj+60e2HM?uLKadPF6nx<YTFnkN0KjApojbGgP?C<@7|{ncGT6*Qd>Psk
z&})`9e%$66E*;!dWv4hyxgS1q8>&4CLWB}Hfn#_E3XiK<abs{Hz_U66on0UY07{Ur
zso)x*Isx|ZCBV9KYXo=x!V_;#t9MYx_Ew=EYuCML0@Z?<94lOiAeQ7I{{8*{fq(qC
zyoe0cv4WJ-9S|+j0!a%^?uqnM8rA3Y$u_tUO88%6a74*!LbdfX2ob(LfS_&IzJ2=_
z!Y`e`%DD%Q6u6_&XzEj1N4!89;E)X^H0!{T0ZU$@i}CRzyVugVMG(O8Yp)8Bjn#y%
zgJw;F)Bd3>|ISbjZdrv*30<OmQ_Nagz%9er5U?)tZP#7`Si4JKBVFtrJp}4Z=d@~b
z%n^1V@3He5;9_zB*a-_Wl-nR^k298+7)%%}$#9p(dqTZ)qA5lz6I%wrH|04yC~<Kj
zRAf;b_u^B|Nlk5%tLh^X#2S1pEJj_<;UVb%5!`-lF$ua&n0Y<7N4Fz<`xRnL1}(w9
zC1|N~akn9BO762X4WQmen!RT5oRaVpE4xd*@w#8>8`iZsP5d+9{m<g5_VTdt>|p5f
zX+YtGvL0XRtPJH~zHAv%!jT<JKsErr3v4#bk8K>}9wA^YZa)dUfyOs!9a_L;P>oow
ze2vEkJ-s<1kS9+5V0F<1KmUIAy&rL1#~u-xHQ(gRZVdlCWGF`T$WrcdPQiNsP;G1h
z0qBf7)HkgX9$fgH5%(gy+W??+F8t=AbO5!vUs`m2#zo@XFA40Cu7^;!L(#87ju~y>
znu}+m@-J{N^!#+^0SLUG`0|ts-v7Ymn=?X=XPyoy%kd+4lJ%|VB2TBdr#&3-7f+z~
zx9qFH+=!Y4G`Bktli@Z%dAXmT-!#7GPDO?Au+Ye`M;^`H#EZw?4RP5!39Hr-Vrn|Z
z4Z<bR@=pUkD~||S0Z5?!O5?OF4GtA?=p~^amcFqk{y|<N*|J+>ZToOuS7mkoQ>m`_
zd&n}{?B8KJm|XkGQ6a?mX_aV%uZVCy?$1rim-rbZwLnZ}hWwIUjsZFPvF4wm@F0pn
zrLq44)jz(Qft*PiIsSD~(S2+o8%h&a9@k|+iXA#Px!bY^Nu|%ELdOA6-A|P#-LRUz
z;ar|HYJjM?hDK|K=K4UDtyP}X$aD`VABFj!l<GY<e{$Hfr$sXu90r8z0~C<7jLZl!
zO~7A#J#wEg6x@Kkn+Z$rQ#_?*Bq9C%w}G;?LQ+(KTN5Y%^(LplIegNbjYigMu1@Qp
zB6ZMkRH1Olf88=9lQDsa8}uqatCnEEU!BoC3sE#53jiy0OuAyzl-E>YHGt1p6a7;a
zJ^L0xfiDpL1{_GTeE2<+jbsb8>{wil)4|lYoUNFgDCrwX$cKlwue!ccF1UUTD5gF-
z9}t1vQwo<Eeu9j6mqUIB)em4|KjNxPcO&e?4=Tpcd-c`O{{*LVk8bje1(cWF={8Hw
zt$s_<k>1YEv*)tp0>Eyv*Nd7Gc#tria${6OPfb&o8cY8l;%Bv<WrX^nf6OmJ?hLF-
zlA!}EB1wNT$jb}ow|VD!;g(P3bj?UXKSRT5f$*pcc$5`s|6eK}rvZ2|7A1d(InM%;
zwgrf%TzQ0D<Eh$LUjA?BLHIXxhLrMYa{$!?F-5MyfE4e7@$q%({^x`?zJC`z{ckz_
z&bgAyz=Il*qzY6Q^N==5_#Z2FEPz{tI#;Mvs<i`vca`TV0SVe(rO<xTBj2NT0Xhh7
zb((zTsBPcwMIeUDhUEx25P-^q(_jNtDXl9o0^Z^`=~vwWl*G)6-(-RYnF<6T1);(<
z_pCYI=DK1Ayr`Y6?MEPUjg$e1aO}Yfq`a#XAX+C>iIBCQLOh)eNC2L&$d?M7oN%OY
z0Z=Mx*WrP9bb9r*ezPU*)&LwgoUq4T+J3rVlnRe{H$)NT!v%dCZGrq9q2VJVzqEAD
z?Orel49g{xfQ|!wc_A0whyJeJaCx;UA{6R3{#XDB#;9#jYw-g|$g>kE7eQ0|1IK2J
zHqgmK$FWh}pQu+;L`8%l<;Kk!9+9^GzbH4{ECI360idDF*xu`KK#<o=Pv5|5i4V|k
zBu(CU%jU`or<esmqdAg5ByEL4dp#h%s%YG^@_19GhP$|~x`9lHF(Es)q?L=@9M^#g
z<RE%N@@|s{;It{=kpX1|k{RrZ3xl3sWLN@042!`#VvQ>%KU|KaUF33O(0O$*<ahN(
z$ONLQsw#aob~Q401A>uK1w9r6#B8t<(5g!|0UT$JoGs?IhCtC%`ypsDIuV-s_%R!~
z6EYVd^BF<<DnLuTTEybwYP@R^Iuzhz0Z&+d<7K(jtc<~YF{F32d<dOGXu1C#<Jq}+
zARTAczlK)a;7l-tdR7JU7q7N)OFnkxNW;;fz`&EZtbMRh!z_l#nn_TO4+cF!!^_*d
zUjsD~X;p|cT$z@zv)nQ&D0N{k3_X@rZEXkF7S9IP<etFhr0!#C4s_+ZeU73Aq2Q!I
zgyDHkfB!DrP+t<zhU1R_M!Rk9I}Ci`x$`>=>{<;2oikjhZ(9Dqjw=i=gdI0)Lk#ct
zFIAtZ&%Y4T`LfGHB~lhpxpxCK`yjm7I5uwxc-*UqW^Di#w=#p4AUK&!V#WcQw>C9B
z6vC1tL_qC2GtbC6#SIn`li!t2H-sLaUR10InxT@KdUjJs`{96wW|KV0q9ZbGXEmyO
zS_agCis+Zek25$U&}uT9hKZzyB^jT+$`yZ>>VAQmCM;=z3SfWVBE>>E@4u5kFztGO
zQCwnaKL>?%e?r*<GMlvg(_gBA+~ngAq+Y5<e|Py}97AM@SBDxLyy~D!1Y)A5ntppo
zI1vj`<Wwhc9^%c(XO9ESFPGiOocfN%Ax=CaZq<D97;`Y6t!*9|0Kl)p;wu0?WCg%;
zzZCInyaN}Ocb$nU;KK5d=QSOFf#rX2>KSpq2e_R2fFUgQFP!=x=-yt!K->^Np#o9x
zb<Yi3)guhw;$MSp1Ug*+*`a@i4Z%cd^1F<4K*b|8AbO$?oYO(m5fT<I1d{m*1%Ek3
z|Mh(!)szL`P2>J@+B=>Ip`I&3_;0NMH==(^$l%o0yRiR|HvFYt0%cb+K0KNd6t}&F
zM+#hhqbB8Yr2!^fh<sP`cQnr<-CLw91j4PtNA)*MiP+!x)2)P^b@tr_C~^we$s2@a
zo?}ZuW)7$h?)hiEADhb{)yzVSLjUbgpIZCmPC`Atof87XyVy_;unL!6*NPL2Fx)@E
zJ?nFvWYWXw;i`gu=&IZ*U0L&lJ~Y6U1VN&^e;^5Rao@Gr?L{!Qd<ahKe1RnZC*=-7
z`aMQ6Pp1)bJ#dK;4$vy`{E-I1E-W}%2>_n&kGFv;M@3`?Xg64Nu73>Igbp^dc>_t}
zn>C@nM_yQ(xmaPv-vlbM)A-z;ZHrvDc|qt!U#a&V%kS3$&y>~=r{;J81JeCa81_I6
zi5c6n1gg>%3YXyUPodif=Q((E)aYgee;bcp@2Kl&KMxc_Tggoh<?CN<`ty2Mtm8IE
zXhV{G8$YPQT#x}eN}T}5!Kav@8}W{(5gMhVAqh`-^^jfgls?u(mr^USRen|AkT4ut
zJD@)Y(|f6|+c6Y<ehv^bwy;C6K*q#`;O6isuKWyfY;<09djjj#T~2f;NqSXD18`-a
zv4l@%U`#@ks+A!31TGB(SYtalkc*eDt2scf%%Q0>R?$s-Z7!F0Rh)gcCqR^%4%%Fo
zS0!(sH~(LVQvRv@<3Dc#_00b-CgF2ESHQ#JSj9;~ikCM+VGSn#%M%t!X@O9v#D~Y*
zszX(`!UfO*X+J>|78Y(j_QDAqE=roIt@?AT^BI|eyi{K#7zk214U~8wA$*He)R$lb
z7&K<r)CFXjHG`bCbzh<cpBeTqLTDr@DX9>+yT9<-_o2Od1}=1Kg(JtrK_{>*<{zx?
z2h_2Jow}-O(lRQd7InLNNRzsDOjIx7%G@qC8yw7<>joOBSA#4rXFu8lw*~|nU{^uA
zv*>tyQ@3Rcv0NbBP(nT3YG$-01Bg>xv!(z?{=-<l<{t$4vtxm{iB&#G4QBwr>u%a8
zwi56;4<lLsN`NwPCoCZPb3oeY^(9Ew8;?%@yByjLR14R(>)(Un{Yl7W8G|XAr+p~B
z((;~t6;hMH;htWyUaS}g0@Znk8I{}5YUZn}t2@}MW?U&26agCGWuOd!!M5o6({=d^
zHk5^Mf&hyTapf?}rFkW=b^!eYhsQhFn)mhOc<{|W=%mlX<xre6V1kA!fV^K_DlsEo
znm@_y-OT>iY<N-)2@=Ojeu5+?DydKerH;Gdz)4!#K*y{VdKkr?^;l8^YX&LhA?~|?
zOeR+#K;sW;wa&+&CHYhU(5pW|+9Q$0eo~;f(<#+b2$@vVTXTRg`%hKU9kUQGwYoO)
z1`tJioZ-<|0z?<-j-Z|ZS*~qL1?Y}Wt2)j9Hf91GcJOie$gMumQ6DJ1O7FVr2>9gN
zb-n_)yPs!3IrvdNKtmxxTci~I8R<o%-{28d(1G5CT!Pd0pf*rY)8<$}=v3hu6FQ$1
z>hcGjYF-lecMkTyC?&q*Xddp1lwD2S+6OP(kN+invB0>v+jX-xsLw{8oEQP5u@tD*
z)>Qa;fpRU-tbGEixs#1K_C*e*7vs*sAiXziSi#6wKoRd1B@oIoLwf?zmO4mkm%Co6
zSNDj1q3>S>q#p-r=8l@ly!%FVYv{gkz{|<}zIvf5F>!f@1v<AjERSes@q~$E^JN!#
zWHqEtBoEm_au-lIMm4$sf|fpyS)P_hO%axNL%J9Cr&r^>geB9z%3fB(I7nsZyn%Eu
z$#Mu3;GHHz<SeAuj8}7o{FhqNG(h3}AA#w`5mmzfi&K2L?6?2>DTXq3Ju8OX<w~HP
z^MEAR5k(kCXx1XFfsbIB(?t*=n7=_}MFxbAH+QKvEpVl=Qe0_lZRvL@(MnY#vALb@
z{c5F{z*8f#R+PX0Oo#I4I`A0sr_z^mK#t;^AO<JwAAnAok!*r$XDVH8F-ifx2NkRP
zMP0#vh`WMXbTssmS0N@)4rH>-KtF>Sa!a1f#giY<P&1-qCrIzP?m^YF=Zs}&%eso!
zWq}Kq_HspT<<j=xPzF$AgFMNqOgGgONH?Iye9MQGklJqMqYnMX+`>N-q*N%ba&oO-
zfLa|W;eZo^&NsHKym7BwYAs+WmWx~G0KriRgp(C{VgvMQkc44_V)BL|;e>QELwuL4
zeC#U4I8gm>i~wa>&}lJAKGev87?d>r!ae+m*?%mlCtjLDh^ldOodVF0!#$ZmFVGI^
zOg{MM4TdpYfFHkqdH~Qz;G~C=k`f?~OV7;AJ&`QUxIq8M$k}(FosG@!vN>|eTw#j-
z{;BGcz7S9&^b@pQT^M{VxlO<h{ObYbA>wjdWd<g$Zhbl~a1p@XVPqO`K4}|oC-v<y
z*j?S9-xMNuKjdG*=!~@kyYV5cO(;;t9=^%Y89WK9!r;)X(XY}piLL8}xnZ>8+GpmT
z!-$dz{V=#c_g_Ka4fe`!lHvl2dSQ6a#^&ZMr_C4ni*g*miQ$?V1jwh?1W06-`y<gc
z{2i-S-+<V0DnN`URry(DRTbjO_P+{M{-+#cn8Dwf5S8%NG~(oPp}+PkZ%0nrThoRP
z?_D(=I*4_#J$`N?5fL(VQ@f7HjK<j){hX|`t1?XKOp9y3%|?FPbp>X7BP;ke9*_AY
za}Dd+j<s7_9RhUEoC@y>jfir;DjG9jKiJWcu0^7BS=~5`{q5&j%`7chwPp_S!OwWp
z<zVW4Y!yt-{4a^ZqrWiWAO6~%_~I{<ar7^s_}=QXmaaTmtidg7Ezb8X+2_>RX(7&7
zZTP(NFFJmszX(u%`OC!a`ghzDU)X<s@_+lp0#P3(J)Ir|sD&4(H208@sv%Cvn>Sya
zE~f%ziEy76AkEWOks6~3?flhj>Eyhc4&W5V8tp+tyQTHw-l-JoDSu5!=wN8N{Raxt
z8GYl%(b)L-i>nmirwB!^QIoct&jST1Ms1KHwLkLRWA$j+N+2J+j?{{*P1tn19tYU$
zWKVQaVWIiD8q>o3{0q`UtdvKOvRzlX)(}_6U5grndA&#pjmUflzQvb7HgNjsq{Nb^
zYe?MG)ReH!bZ2KL^>Pu^lxSL;KvYizN=3`>G%2`LSjZtDh2*gMvJOUY>2P!K$o_Gl
zUN+Q-hyq#-BjUg**8BH*+e8wsI#(nDw*GZxC7kH(GznDh*j2D{v}ADY08&CdB{kKE
zn02+ZyzE@Sv3?FvoKvksE5<-aA#rLH?FuG}=<V)4{+=QH=SZ$2^w(7n(R+#|K4^V{
zTFtgqn`(3JV-r$j8FipV5UXo#ZGC2yj_+;lfrBDd&?$x@RZ9yr3u)Z^Ng(^qUKoWK
zD;OD2<e<?ln+lD7l|<$GuXlfpfRxdeWbUZ}LVYZta3*?(h7w>Wz`x#71Oud96g042
zGFcFyUrS9bEg5-vdF-lkM88}ypp^W()6>(Jet}e`&7-+HsGgCP<t-HqC=ze0hK?NS
z-9P}rE@uINbE0xrN5{)}<-J;}s#e55hs`H`<o~eu-f>N(-})$)0aOGm2rA97AR-`^
zp%-No8=ycyx`+yb^xlFF2%{*BgMx|}5otj{h0q}aB7-!kQF@UUgwO&Z5V&jafD@f>
znS1W<p3k}WeCLmu(Vb-P{g(AU>silQD_N-6!`&T!-t)k7zjfW!9Zm_9-Ry6M)aY<p
zyGgMVtu9~2D~xanr%60|^avly@?D%d5ce{H1%-v!FHmCr6mCZ4xnFI}Xm-7a5ZxYT
zfeWgZVIT_^GkjUNbYjDX4VdT<sLY&+%{ZGdbkKXNUH#yeJMG7|y5(xcX4M{xPOTrX
z`*)XeMeG^|6_&mgJT_uVm;Usls=02N?V(%|x>5Uw`u)L$5%QCS%9ym?waSt%1GW#<
z%_{_1E>RoC8uM^*r)&!Z-k6!1YGxgI5FM?&vDnPWi2l;pgUhAtx2Y2s9w?5C3YESA
zr|t;G!xj`%AoTKg?&x!C=pN~onQY$$Feb?+jbmZ1LXS|!=$Nb5bJDjPN`CSLmt(Zc
zPcpnPqP*Ei*oAPKj{Gs~NyG{BiV1B8Tww6RIRBu&;@s2+QrC#XoKtS8;ef5zWCrtt
z@I4LfisxyU>PY(szy7tdsjWLF<rtSgROe1G-Zod&F{g=FA!e(4aRq3=j%k!(f02-o
zpt>qRLx$Ikva5ZQy1IJG(qOf?<{taY5HrW|pI#c#V4WBXUn=ImGSYV&xx3D~M2<qD
zC<qu#8qacF0TGyiTdR=L$a?JWecW9#*65;4xMHU6A~xPv-3gGVQ3mg^KI~Dyd>d|I
zSR@{=JpXwbl7=2*TIl$MeydbuC}D(NXGWBnAOj75j7@+68)qKAy*=$9H#s^R-9c{~
z)yRshldL|n_z4)&hm!;)@5LEf`r`h<p~2=H<?2;vSsQIrBoU-dUQX^f#$h_8q|?&U
zQlz-k$zxQ33w!WaGm5Bi={}YOZ#C76{G9$s#<dDsiRZ>BqGLl$!uIXklN1bFf5^{#
zIXafL_7SNuKh*ldg&#57pyLB;wrZ#E>otM09#oZFW14J-Z#X_YpoieCK}p=)tWpj9
zdGKsyb+vw(mR55qiy!dR9KN+cHUP0a=fYISe2ZRztb)Rppx|IA?B}lvK`M-!m`tnb
zRuK{H#xc;FKnAE0rmRL)T&-R6Tg}Pq)q!Pd?gi=|Tv%-_Eq%9oq_7fSF$6F1DpUl2
z-#|nk@nlab=~jn_y?rV^>QUY=vK}&FkBTPm-o5*+OChnm%PDJQaBvXmPEhS@gT>B&
zNNtZk^64zsO<9jsVbh9xuxYecyRq{p^87TaMClC;dTvU4MzmCZ`boc$s?|*p!O~(B
z-VG@X`>>!@*JO-hAhLcehP7h39W`L7VAy8mz|I68>CzzTO9mBzy{b#8?jC7(<7H%w
z($E5d(=ij?k2kS0)^Z{GD~l~ZC<NsX31uqYTt=bEJGpKTDz>t+s!u8Dp1x_`pRvy~
z13mTpv}Wf7Hc?#tsDu_)+Ik>Cf0!5CgVAl1ey(q?d8CoAP1UX=YRf|OSmn#<_KJ~q
z4Pu93DhsIYJeaaNFiW#_T|T!P<nYF)vzXIiQPw=gZ$RaL02~|J|8xNNcO8WPHFJ3h
z<QIm9tLp3PMGyo<|6>po8a!=TNQ&a%0jX-pMGvNAK^cZ>79s1T#?Xo`nd}0{7qc&z
zMiOL%(zq=tkeG5H7z(88Ta1Oj<@FF6NY%))nDlG|))b>GFTeSihDI_AKzeF!B*MAS
z6%1K+1p@48B_C^{u2qbTl9EYun8jER<Vo5>k=1x(5hw$qS2S9G_3Bl<GFri9fI6(d
zf-@5042u~NcoW(!)zbEBo;S&2RN!6cve8)J7I|(IThj89W)8h8D^p!r4u&Jy1+Da`
z!l$ZFIgOlYLM)bxp3-=I6vCK#WdiL`9mpPo>zkzzwK1F!mDFxbh>wp4$Qh<O{{TOY
z>Xl2bkKDX@a}OLeA3Vii#4LP#^6)*?olyM(!;&ES!69XBV3}#&kZERA*KmD<#g~ES
zrlpqu2K&AkGOc2Hw(4hu>!VQMi7XJ%D3jlICtJ}&vYm1eC6PE)8I!tr6&q~+R)k1i
zZGqHpW3gKNvG=c!BKe)vOhsBdltMW|qYtI&y5;xv3knK8C&!|d>s)2tKvOf_#`N^`
zMwY@C0A!_j3-j`}0tcS#?dz+AI4W+kXvvZhlRS4xOfUtsCscAak!UUy1=U22gg`~4
zYGRz<2VN0Al+-#L+Q;%V{k6GjG~~!S0!gu_FdmO$MlOHM+ggQm@{q*@dq_A0H3C95
z5Q?QgvOJzovSo1}<dQ-C0xnlEWD8)BBd|<*+sK@d2R-xxo3FQb?iQ#P(wHMK_XK<(
za`pjFzbXWFvA&IqHAZwUSOj|<L*vb!*Xh>kh)&(c-Uv~YWCiw*va+(t3Quqk9wd@Y
zp!jDdHTI5zX+mv_b(9v#dh(~{#Co?a1$TZTyG9>#__voB*0EZoD~sP!zU@J&^Do~t
zGxJEnEV-8PfixcUWDx>i;`Wnt7`U<sf%{l5C4{E6GxnM`^YaBXI%N&-W`7kng3N}G
zb?}J7y|#>uj7f{E5iRqc#J*|4ty>}7yav;j0`VY_%q*1qMUl>ikc2&i9l~iH8N<SJ
z6Vkek!qff}+PbBNgp@RIZ)~3pKrIB+0*PPQ$cnsbR15sp3(r@WKQ|s8ZBaK5&LfVM
z4Q{dm$X;8|{2+W!Sa}iKJ^%XGRM(VG+vbV_I2vVw3bfZaXBB~`!^a*5`v-5ybxvDb
z+kZWK*agx2cFlarpr9Zl)x~km9CW?&=eV*AUcsGzdZ{gpbv8<9<m5^7*GI91@u4Ie
zSJg>EeoO)~yo(;jR&OI1-bLr*>!qQjSUyGAp}9jZC%=5T`T&{!czbuwux%iv8peml
zjAx&sop_`e2)I5N6y<o8Dp32MGc`>i_i25uiY_9NNXeFZlpVr{YFu(v7g|(LV|?by
zDNsW}E;*Bm(XOdkLcka8B*T_G57dL`oe4Hy@S|0f6@Y3ZWJ-}p&Fc!YmyR=jeB&Sb
z7|3WZxgPa|3qFq(xB!kd$#Au&Ah{uUMa01+4;O;7Z{{Gx9(JAj&)~4{n40GSQK1!$
zVEu(O3KTszdbHSMU$`S>D*q`sM)OumNb3%%k05O}SxyBxoc<TycIgh^2~9jVM@E<~
zWkAR+{eV|%d46FHjH=t0&qxX;%Qv#+%$0bB13m&kOb7)h132hl75%M3LMbYnN=@HJ
z<%Nmxm9!Cnq0kdTsFfEfDHyl8x$xzm+X8D@O=EJRP;o56OY8}RD3+cd8P*=K6Nn(B
zag3bCx1t}Ug_yPmkZeH26hk=_Fo<A&mPe7p0WA?89v<wz3P|xZay+17vgKL0nfq*L
zcXcPw(ir7KhcH56xAMZn?%ct+6@+^ZgBeK-9n004HDfVvZF{76g+cEjvie3Do2N^|
z1p(j7mv^<1_l}Gd<m4DOCfq1P>oFJbM3Z_lSUr?Ch8H(8HRYlF>Rn)l2b(OM#3)oM
zRkx(G7A&UQ?P>Yp3CnXz*tXaUa>`G#6p{X`i~oGk{<N|f#D&Rc+yuc241Os`pl<Cj
z1N0$yp?9%n?$auC#sxVRr2Dkvb?de{mz#>ekl+M8&Jw7#W_I6M{OSKtlm9`sY;6Bk
zw*7wsn8pJDg2?hdWo1VBIYYw}xY`0ZBSX!Byp!;IS88Z%JUhw&*Sp?uX*&VwIS)`F
zpW6Yc4{{(FO51q|^|3O!jnj%JxSUAWN4(#@^p@>DWN&Y;PyPJ)q5v4MZ}`_MnxabV
z*+ZjKG@2)<C{zz3u7B83nM%L9(3UaVM!<vFX?(;Er<hUNp-ue!^(kQ&&MCA13qlw8
z8elsx=Y2rq7CmF_<u!9=H<A^Sq_CI0bZDRF+#HP>YJ*J?SRK|yiSHv>2i1RzeS=#R
z8U8FLbRZa*>K>_P#Bk_aA#fMNiR73!T6Fj?_~E(z=g+b-zEv;14t!9SkvaRr+t?oW
z-5t%%t0DUfBebA;=X(~L04#Pr3KPqc0pr8?;8nn?SD6+^Eu(;VTCc1x^fLj<b70D1
zr;`x(p)9*)=0u0cpA*rU54;DIa(IqUM^G>OYi$>3C<<p(y|!u`IkvAX?-i0A<Vd#f
z|MN?1{r3Ur4b~^XK`@j?)N0f~&MWfVSnMNQz4%o$uRq!zB5zQLM30J`Pb{*9?Bifd
zdqzNw*)pildEmeSpp224DCBBH9_dCagivf+C~*3XuadaqK+N;++2BP_3y5v_ML?-Z
z3g6Pf)OjD$h0#3jxQ;xJG=*bOdI8YWTZkUBdOMxZ0E?@rs*1!XB=Fo(2t?c}NZ(ie
zQt5ZLn-r$#r!nS3BAw-^wH(cBk5L-oLIM3>An+d-f=8Qy{N}5i7X$$8HjpPCREHp7
zZ(G~s-1y!90|Bs+ZD}V`FC&*~#${W^>s}8jv%zh-ihgs60)3%SNgMV9xIHoWJU)*D
z9UUDDp9`yo5=+}krM;~t%s`_Uk1zOdgTIDffcbBS`iE)1kO%^w=YPN62j15nE@4eg
zO-z}mvJ=Ndti|YV_Tr(ow=EZ}trP!Gx*2JOCl_`af9|&>d!`(l23GwaV_uYS|9a_(
z!t0OQ^2OOxZ9%SN0am5WTci#&JE`PsMNh~$+fgM{9EME^Kj^X7VdUrb*3C-nA8mmF
zJUgM3FgrnHlmNSqo0~U}yOnNZY)+k=TXH2%Lz2dWWLBE|i9e0n5lr-LZ87)Fw<b;)
z6SvL}OzHeReqAxEO#U#JJt=gA7mH-|xj~^oQA|Nw7I#3IPz6}N{D^-BcY*y?70>qj
zTj*Bv^y%k&0)gQ8mN0d{K8mD!><L60HWWA%&g{YjuV^ky@|X;L6f@idaY1bMBGw&n
zV==ELfnSz)A)$yxTjT=_frY1MHXd49lz=ON@mRkEbfvK!sMn11*SVG-^{q&m@FTBq
zNfW^J;Nte^w`%TO-lP$vSb7-R|CSfYeWoTMGVDEpXa+-BGEtxFF%rvj({(Wzg(Muk
z0uonz*zMa$b&#chI(>}@>NJQX@o`Zy(ve*B7}EkIq9jxl1_2_aj8inoki*E9QqFQz
z^z`F0T0Axe46q<#(*A$L2lHJY6^Kt&Z>@z5%-3ums_>go={`>`XAvvr$u&U2m!_>F
zHl4U2SHS%Yw@G+mB#)v)RdF>7tN*4ph*j+)p<>HleIR@1HiTFX;BIvd)8xf&6xogq
zRaIBV8wZz0=l780CAow_O{7=miK|yp4Jz#+DenoY@A1kDV9C~JG(dS3JK)GyYkO>I
zTUiu^z~xs^;Y6he=@HY&-E&qt&qsuTm3hpfe*rFMO<>lEg6&>{Fo%PCmj)5a?kO%7
z)o1?Ie<TBJ|7XM+{}bTj|4R8s3Rhs-ix+|532Pry>PY^(cv%~%A8{bKbYiRrNf4+U
zBk!AnI;#pUACcX^Nfp7&B)u>|<CC@FrEk3aqQURBaCObVvlvWz+@b5EeIp&nX#_1=
zK3LzfpoF{ALPZ>c-oZHpfl9J3SBMDz>M(OlsISyUx3;oMSRI7BY-t&*@Q!lmzyV#>
z2s*OYk**HOqpn<6!5+q?i<C}is?Lq7<GDjn%9uVRM99zg-Mvw`q(ieRt(GgH210rL
z&n{nMB+_1aTa9ZinE$!g+2}FweAyxHTsF9ipxwYwJjf%T|2|jj)IW|AOAEN~N%0P&
z4V;vBfBbPA-yYI66ieRc-oW)6LW8gXW_piimVFyORD+@mxg;r}0DZ);{(nB*wTbt8
zc(IQzt1106sLTuHEWXLUk$KG>D6;k{XyW4b1f~(^6)<JC*lMVDfmiWHi&SUj<ZOm~
zM7+1Vd!_;laboiP#qzGIH`5?W0l!BxtKDa;`zSuw1vzGg3Mt5#_rUDCUG=6<UU9pM
zT>zCE<m2f#A~Sp8!ZX%Mm(tO{J}RdD<oO<7;0M2@g}1#x3K08^0*KGUGudIFddLFm
z-3YbALbf~BzFrjw%DfwpROKqcJO>&4C4EfE1VrDHK{InMI;4p5@Zm#zsA2$#bO<4K
zSQej3@Tm~D_c^`uUux#}&LM^J@Crc$v}_)xZIa~AAVDQ6BHo`ejZN#3>efWqcUm5C
zHV<D2GH_a{H1=#`t;k%FNFY+Cgyv}nD`ajwlK6rwpc8g|boZ06?P5?DW)(C#v88&_
z!WJY=?R@6)wk{;~5Vo|1p@g9-0H{TYgoT}?13)MyiRq=Tjmjiw#I$*tIZD97-Fe&0
z5@N3J_PHp3Mo1{h)>ZazlAeP-$+(4n)7;FaTQNfrS%A?3s!2~MlgTM(2TWgCHcUG-
zq&EHWBM58GC6etye{QgBGIrX|OhdA7M0-u5zx`K%g^F*-uKxyRnI}+Iy``4P(jL#^
zo_&l)Hc+*Z+ebzA7uwB^1yQ#2$7q?wDLREXFP&r)wlHe!AF-zzZ|B!oKXJfdQMqAg
zTw%E=Q(#isUh{)hJ)^1%GsJj=^NzF+_FsrvkZ<eW`w!&^tSW^ksg2i1W0wsH#D~U^
zdk(5MCxBX<>mM-2m;cDyeB5E=f*H`oLRoq8(F{a}h;Q!E#xA7k{2f|;j!r2tR~Z?W
zRx!)ym`Uka>+k9#{<ogdez%ZuzqNo8d#3gpPo$s>tA4`CU`zodL|HkCUiA>^$F~QU
zvup}_4B`6dW%z1Z-lu|DL<qgQ3(4SBFq?2WcI=pr+w1H#o^}>pJq}xykbYFbY1<z?
zcyJuU`B$2ly|}->A7l%oqoXmM)Dwj>eNlQs+}0uq?X`+FL78FcIXN?3Do7aWRrq2h
zyCvh+*_{FGsz+ygM~8OS5hydM)i{WlP&TiPM5F=_3y}WTj4=jXHtKoqkRcO~_hB*~
z;B+U^8<29Se5jHb-_vL=!Cs9x;kijr5)`qA?Y8Xo8t}d>GCxO^lvROcZJ^`Is!y4=
z7|rhSNZTbQ#xuMgTy^tCO(eSNzAX&rUuWNOHa}A#QH9AQlNA09ZiX`k_N86{KN4>B
zYyQ~Qra4VpWP3m)C&Q(3;6S*&+a{0c)U@G$rK3P(h>~B06I$&E;~rELi&{{MOLKqO
zOV7DnjZ#N%B?nfq@>3j~Mq$?n({F>=ZIVv~1GIi9B!o_GMxvd`?gC-npW0>zrbD`1
zmnI0+3c3f6Vt++R<?vrvDH-!$SVhHZe_OBn9|-s#X$35>|KS95QWHlp6b2}soOC?|
z)zj)fjlgl~pY87g3a_}DY&mc$MG8BhV6Xy9Ztn*XL>utNol6I$nG2G>lM2hcHRZ@1
zTDOAS_AAMp<D;0ESjoVEHHO8HojfH0=D}5HMT-?*NoQ5tTL?z--1#d)-p$@%xo_?u
zN-Sd25b(niR|lEY55-|4t5sA~%<h=IH7x)th0C&xjdqqP+me}UYna<IHcR>&Qeh}_
zk)I>s$z_h)d7AO>HN$U%uX%Ib@mQ}uj8e!R>>}Uu=Sba*EnBxHyZ3~44W%c3Ws!+k
z&@5hlGYiaY<EwekddR!O_tefdkk9zcEjZOpv&6H|su`BNz95WfBb&BH=WSZ?DFIDR
zKSCQ!!0AxWPV}^$Gcr1fks~dzNRF@BXV^o(laJ6v7Q<=o&u{}d!`x$pNb#FQ`_=t(
z1{t)<Xh*$&p^-qRk}@(9gfKqBA|gD9{FW8V-o3RpP`0GK&AJ`(zJWbL61gyx0ECyu
z_yK$*3!pTIz<OL%R5EMKAw*wKG~fKIQurUhURZ8=R7B9nLVME$r6ilg`y=S)3q$@l
z7AE}XwJ{6r6owgJlS;Mu0@WNz6343yyTszKbn&^i4u&ZP$$g*e<|ihS2YBW?d5WPV
zh^lY?Pe4p#XDZC~sc<MmDctTEIp=Xm!W@Oy&<_h<pmo$WW|k52#&D<@!W!iaOH7u+
z^n$<|2IVY;>SZT05S{Ryg;}yl$$|<^WRQ4SaW1(+wwO3WA`W;K9P{|QG^a`-ea62%
z&ek>#2w9uRk=-Nj{d5MruUr`{v2O#!mI2UX+Xv;JegX$+6F%1%%AI4_7z3z|B4@UK
zIT_ai8yMd_RHRDe>BuVoe_c@=tw!6tqN{2MU(zmf-mflbsLiCle-g>MB9QzSsQxEF
zXb{{%Pyc(eX5rw4nVN+|Z8pIjg|3QovmH?9`)>(4U@=GGwyH{l6!g*cQHaRzLp16M
zkO8_H$!TcIkH0Jm6%h**j{WzO!fj_1HgzGrD#@tB>Yazk9`bI14h*<!7mxAyq@*Oh
z0v^^{(Ua<DuQNO41S0+>*|Vx<^XAPb8q2$-Ite#!gc0pVQCVBzKhpt2f`I=-m28rN
z;0G10f>@6RE;|t`7ng|=zssO8vlK&QS>Gfgi0|Q5`7ero;a(d55AkW~55;hDumaM?
zvS+jzvEeD9(&!>2wZPlP2CpE@=OHEnhL-FtHrC9eI(J5>$1QrQ;7@GFmfMI|^W<_U
zd+F|i)OHFh<S`Oq&|pi@2Q(H1z7*XMi%~dUT$9tY^QIxng!xy5?%7uEE`q>nTy(T%
z7I%oE7n1F=g*^<YY`kTD%@v$TN%z>0Fki{wSbkg4pYF&ttPLCrLD`m$xsfso3Xet@
zNeWN>T%n@P^BOtB*1Jk0`-G{l^QLPl{0ppc&Pn4}ih<MWsJ0ikQHkY*psoLpIFvO<
z?mw9O|J#^5se45ioL&~*-t_QS&}2`gryKNBel#o)Hs6FT{5Njp1oiDV32IE#iA2>^
zyk85*L7%u6<nr?JeF_Rj-_WW$7hw|?4efK!fczqBE*>6(e#>)n*-$hR5n>KDX&_Oe
ze*ro{bme3~0oI}9qYN9i0orNBoblxHmpw#$N2Ae#MQ4z>yp$0LHX0MU%gE8?h%3JR
zPkW?B<m2aDn4g7yTg6B!1Qkqu5(oo&!c^nQNb$OOvg1=9pcz;Hsv&c*y&S;EM>ME;
zfc8C#HipX73b%zcwY1{Nx-zY8P(NbxC>F>}w->7Iu0u^JWY0+z0#p?v%l-6|d-u2C
z@)^8`$A}TvMO+`Eaa-M$fWw|_)Tj#cutd_iw;^_kHR5(*BOfP#xc?oPa%FMYIuClP
zdWR-L^m}>b;1K~Yaxj#k`DQGDcU0b&I%1Vn-Oh~eTRu<>%Fte4(&`jUvA%j0Mscs6
zTNWtPOXlb2#ZVS<L<&{60;|j#s+E7OPTLHHw)HGVt&xN6-8Jgu<fPcwn7f()OMcF{
zK?5W>J%?y7BrJN2{(Y&Z{|PtIe7n4e6>6bSn|dp><Jkym)?#QRS7*r9`2uQSZ2%Th
zP|7rSqkTtVG)U;Jkftf4Q1rxcX1v!C7M1HJHaQ@P&2GTm9iautzWw`uM?VLhWk;dn
z2~xJjaiXsZJ~wdmtYYBzoE<agN#?w1a8Ve0?U2yhSOL}ynt@<gnMjfEMK#YDXkUgM
z?8{8w*n-jr)+w3?=_^zVshjvC)Tr)1w-y`YjGpLRltbZ(#;$8qPGq5i*vr<lauCuH
z89AV+Xe^|Nx=$=$kkSHB1w_$4knlHxIk5mS310DL*GMzyp75cNMX(i;Ztx0#A(xHY
zf7|K;qbI7A>%V}-A3=LvB%r0zc?%g+Es$F<ZzSW0rk`n6nHE9!2py`~fd?uuQhWZq
z`?U#iP{zp1ds#=0LZk|B|LDn+RFIL@s9wpU>}C<dj3s6(&H$l}At~M@VQF2#WP!Ay
z3<?XK_aOz$QthHGx+bf^ny-Z9GWZ#J&LIu!8)rXwDQm4^#g&hb-UWXDze2PXdQYe8
zxx7X4E!v9s`T0@TF!H>IN0vgw<iaYp!h4XE83fe|Zp6gII6~ERbmc%Zr9h}g5qv6A
z>IPE(IGyc{AyOYg$&Y@}q|jHs6$-XPLUJ{<Lo~2(aFB)qdOL4J^dJ44@63Lr&$kJ*
zaBR)@Isl*ZKKq5ci^1!$GEC8@Y?~a*#>}|$|6k_L2%<%jr?s^WkS?In!)6onNZfL-
z<GM<NKLT=A&+J?58P;4nEBjmU;i%;0U20>Hh5{sU8kU-@x6JNh;Su3V%pbust8u~n
z3)@8cBt93J-0*#n_8W%_-?&9#@%hpDwV$_T<<OCo)<?@;=j9m-AyQq-a;7oE<~Bw#
zlP@3JkHx(eIY$=J14p6+wk2lz*}TWogyBo65f*3qhhUaVps7mnhYx46UHY{YjHM<H
z`8PEcoo8N#+9JhJm98Z2RAe!<j;c4bPQz9<(sr31Ty$x-3=j`Tr=^(_xuH({+DK`0
zZU`lww2CQsk@8y@a>cA*H8A#F@9#@kT)em=`o`4j%p)r7ZiR*4FBi%1X@~b8!g9!r
zrl|ww6SCGW7*SufwMQV=oaYZsV3?D-PsvkOxXeu#B1!6lS6U#5wYgzNVfS^%2?BWd
zuOBl1eEj<8M5UqhuFSHh1yAJ?D@psg$i70))v|Mp*lmZ-?=!F1mpI|}+w!hHo6Rp$
z0*ZVkOP*Gf4s!<LtU`bCT8I~_Rx~K+XtwXOm1nn0<&N9FG0vRl{bxxP(XtL-JC)t_
zQhj?4O%NEB20yyMzcDs_wzH)(TYOxf$lDf1Zm<57i=#KI^hs#;+4?+8KKL+s_;O+0
z#lp<UoRi@>@UzGT#ZoW4$j?rp@5-)HIx-?>PTm_b0nyC0TMOr7*L!d}%<GqV%}9Q%
zNy9OQ-s1Mz^0*xG?;FyHqwv}n_Enh(3HI5{SCYa`c5KVXN$+YleJ1p1A}dm8SNG6?
zXtUD|q$zmI1BnxaNulDZ#_@B;6_*Mltj_e?4k`vlCHKC{jHvLHtbw=w9qu(XnV;`J
zacMF=INFm)P_889KZGT@LPBNT?UP)ABGW5sz}_OMHCfilA=vYf3bP6h-oZ`gzvnzs
zouJ0nt?25rZLe%BvPkW#@ns}_R`XPy{Zjf?y60Ixo`0dG#J37JLqA)7-4S^Sa_2tt
z39CY^p0jAHNfj<fL9UWC_b^T5z98rHyym==cd9qbLnOnGwc?3=!L@THpI4;&^9)~L
z-egiOd*+d>i<{$v<e3BJs(a*lM@rw$c^!6ge2}*I7xwT;WTb4-k>Z9IpE+Q_5j=xF
z^zSRW+KJ^IN2@UlyP8XVtD<tY6rWKza#v}0e?Jn8BB#+3?#}sGOBa-f&nP^Y+@;z_
zK3^B5^e`<TW@eYE@7V77@+P_b6B-*AG(B|-lq(IiE)-@4=e$2r+2}4~E`M{TS-5YH
zn2bS7sc-KNm~gKY743H7=F{HcA}%1eU6K4*sCcO37pmBu_qB7w(NHpAALw5jKUbMZ
z*2Bcqd2q^_S6JFfhUXZ?!#>(c;cag<{ju<{2Dbb0ZI|?p?lre|7HWkbfb9wk11^92
zy6xM(9o>BOY}j5K`|Tf>+?_VAuz=<8p%1S{y9OiI{`f6+w`73W*-QHkDh?v61_swi
z*w*$T1dZ2{eI?Ps-4D^ti-i$aU=<-#NdP6@{)cIowlvHbAyX+CP9U7_vwa9#J3<f^
zRl}@o@5{`Ha%7!VHO9CGUZ||B1R)ucP_fL;GWCcG(;Rwbdr-{WZaXwJ5?`#%2%lN)
zwa?%ii%02DgO56k@oL>AbM!+Lo}6`|-1v*t+y(<D+MV3j50ZOj%#rn7Y9bk#V<bF5
zP@*c`$$!8J+iuB>F8yZgleBiCxW<<x7z=opOCS2k1{7?B4f}CMOU%v%!+`8Y|JHG0
zUyX~J;=|;7onZ31pf;w3we{{+=#3RE8HPTec+vNE@ssnx{v_4GHE>UzTOj5Qh7K)3
z6_L`xNT0y;Ugj&sc|z$vpnlgFq?)XPgpt9k@~D+RDQ;HiyBQiHZh{tLTkPBOA67@i
z$(wJ7H}`p%_W2~3LD(H(#D^OecIXh_c5pAFL;jDh?-4<qfQFUVk=A_wImrU>r||Z9
z$Yw-N3s^*{DRCUd+og9QBYpCWx2V#7bYOSxR^}CcnEV^h#QpX6kWIJtbBV8{wr}W0
zoWxNpuh52ke{Kq4bs$e7>=6hxCXsn~Djj8DDMU}-)YDsNfwB((_8=|H9e%$GIn!W;
zni`+t4)l>(2d7iSl@IM~iSWd-$o-HNVFxS79+`0xET?8<xxmTC0~6J6Y7qOl-B#$N
z#<i<&MXvU&7&bhXFa5!Otme~ED2JUE`ld8J^T?+cDZ_O&vV+$`E)~|D@I6p4m2A$~
zgYiAlw+9|QZiB7u>;v?Dv|gl)Uh*XJy}w`Yld`;PW5Sbbj1M(wr8AA%PpT&ZQbcaG
zl$gYY)A;w2y=-8&&KODA+8S136kcT(M|PF^?>1(bluH{I^;_EAcx`ChHL-Z}ZbsDW
zMq51WoAZUvdiE3o7V#=BUwiAHSPOoiTVQ60_ES3bDY?e!O{x44&gkY)9q1o(sb{4o
zsNb)l8}9I{!Z0X)(4N9`j^>o@I;fNFH|wro9E4Swf5*Q8l+*Q+%}>o4gv`u<8Kd}#
z`I{eNZLh*_f&8TlB<Nj$=DVP@$>7z^m5uPA6&H|wNox8Y_(#Axh$0a7GAF?gIth7B
zeKE}TrrKmfUmt}v!%a117Pb;5w-5WIA%|_L|I52-a`M(H`*4vW7i0YC^0JDXnX^5p
zpSLP7e5<WQMmT{Q3oGMZMaTl67oQbR^_@i@I~y8r;|a*kgsq=o(xm@K39P>5U7z30
zrhHIox8>s$IR}6GoXsx=iL)ipyD;|$UweMW&o+?BbQ(Nl<KbPrTJ|qeK4>*Hg{>?u
zzr()}6P>?o6rLvMRpt>zLu1wToMN&~`qpB$LmEpz%wLe&H)@s)Mhq^BAxriB5XYw7
zZAVq^zPC$V^YwAJUw3rwDfPD&b71q`@$G#Ge9h&}bmTT;Sc#0VX(M$3Sc`i-mt#V+
zIm^WUa6)2j>20>{3qSfF@AE`mAOBL-OP5ni`Yj9Zmoz_8wUzjsJQMHjdv@Qvc)MJF
z5_j({7v)IV#%&r+`T|N#`q}50|E2lnbLetYvihogQruxc+~Jw24liaWEHB;E{)H^2
z3IYXG!Q`_Jr*?EK*iidrON@wL)m<SN53sFZZejD-1UowGs$!3gt#y0v*k0Dz$8c%B
zo4jL;=>J8XSSrir>|+Y2%jb8^NCM{kixiPh+a9;V`G3)_3P+%BSA;>KWJL_-+uD9+
zG`SCIXuCjf)2Hm>yx3M8ksNe1Pv{X(rTl#75i7<yN97`W++m*|F<Ud#vIz(*M9zSN
ziMGkec+m{wu}bVvSI`gEG9NNKtd{{|Kp_;wE^vtRjubTQKiH4#pW3jp^EG+Rmp(Kh
zM?&{o4ic@T!VvfK(f%B1#s>ebIhoM3bPv1fTxo=N=%eIOFL-ndJJ{k9zMH9Z?}&Aj
zQ;MxfLc_bV8hYgDwp-G4jjx6xqNw@36PSP*c*^s3y>d<ZG+*)|suHEhb0J<izvHA>
zyF>4(4V($b$4=biXnftE{Tw7{`JM+myTcP`>N<04Pc@5GH_{T=dj#%v=!<NGsL?s&
zBtzqts%9f8>G{agkOkN7Qh!?hi<C>RGV5*<_*A69fV@a?y<m5vrpzbh(l}P)5G5;<
z^t6Dqh|SlF1U_58U~<$YYGGnLVQcfwsY6p)KOOfM7WZI0j*O;lxEuhSP7>W>&n@ky
z=I-yUg=8>+VA9m&YiK+enVFh`$h@HB9e1RZ>1uG`w5%#>YXD+3WF01%7%2CPtGg5o
z_j>90wx!gsS?H56uY(-U5~v(q0zGs~Af8$G$r)V?l3|4Vze6?mJy4P4hJ-<CAQba(
z%>)pQ%&?_h+zzPf$5r!0c@3D9wcr(=wyOB>IJv)fEYI)J5VCZ9Ctd8_yBSSIA2O$n
zekkV9E5AP4WA;=4f{sYrg-!B<{UKU+MJ}omL$K@l{G)6^v)1<P;_@zY2u><BHO;{b
z@n0XUsR>!QG|}x}m`~FtW-t#5JFr=Y%$xM-aVfS4)UdUM17PNLW}UPh^OQ*=oNjlh
z>NuK~((WL{WoK-#cz;?yzYW$}Ts=L3(Rrew-{Y?Kv&xC0x+ebJCwT&)UY{kh2kv99
z453F5+<3g(fBu^rha;<;<;D-;#_8YR7&mP^7@V1stUkzjbo|ZgVMj!pNHv(#z1%17
zYt|>25kTM@Z}gowR46K7E_kaXitIJiA4R?=R_*41FDXTL#`_a5QXF5wGJ2iqydD;}
zN_)WdsZp%NP9U1D?ePj8rDsJkR=swfoRDo|<XMOHIW*6>xVk2%5MP<mxx3JX346MC
zZ!_53e05J3(r-U8Wcz);u!j?~gWeG`I=Vv^b{5XR8)JST8#N%vpd+gYL5qMaSzcB#
z&<7n=aKelSF)d9XXIh4F7R{e|^Cg(yT3Y*=Tu5f2+F5VW*5=h-FEgDtEl$N4@wC~T
zbU5LDx;1lDQM&`f_V}nVsR@n==89T+Qh*y~5}!+&Po_0zrY=H^vy83PW7=D1HgJ8=
zdh)Z=COg0D&nDG8FWTLhN@ux|$hgJg>k4vafeXoU3;jQWzdnG{INYF!c>~0CyL9<-
zyu!QkP5v#Lt#NYNJx2tB#m;=d!byS{?ie#&M6?7{pVcM1AFj>6&Rnjx;FZQV-pSBM
z5huv5RFxjy@~7{ak8cCE*KKR)En?D!g*y$zyC*hJ^3f}rPf9DXN1iZ`@z1C6c#U?e
z!s{VJggoJI9B_{kpOne>v(A_545XTwVDk@%Z@KLq)AlXp-wBonds9{EY-aYycl;SY
zGNeGHnUvz^2Nilfp+$timMyD2Mp{o;Ay&{pH~<kE+Sr;yk>GEsz=)mm<wdjv4%_)j
zQL!-r6R16<YdniIQvQY=%-q|g?+w~7$g_{noT7fu;vhzCO;{0<T|*$G{nZ3?7U)+O
zTRI}Ol<bC*go?$rRB=BqV{6i98%Usa`?t=-z(JUin@hJa_|=S^jZ48+f^9OAz{f_f
z@JV6wm134&#NFgySoW0oB8BY(>~auzDXj|BeGGJkUbML?aTD9;_sxsk_6J1@Vfknd
zCtQXSbI|;tJ#rm<fcd*&-~7seH2P7L?!A2N%gBg+8Bm90&VZ{xm?J59ZobPkH$!Ct
zyWziZ9%}+B(3e84eGlvn1x&t<I*_G8P>y1YlzE|`eOvDR>f+AvuR{%#*vqUe{#28k
z^&nrY`{sM!qx+@rX}5U8dCo#QLdiz;ux<x8ggsipCI?HDc~Om$Pg<>}i54e+%4;^q
z!Cb2ThQ<)WlnVO4$EArP@Eug}1zXtOz)`sv1obANh8+FVQ=Ylkd`mM2lhON6t7NK$
zK*mcDNcuy!W4YJ_u9_Fj8sayLLQJU92_*Ombp@cye~DB9nGe+3j8r>o<{m2zPTwLd
z%nk8fK$S>?7bWk>-CS$e-ca-yd7kbH)C5{Lt;OO@Q`27<Nmo#HpvAw?%YSjTzP<cC
zAg)`xSedOrP9{Aabla$G9I0y+RzEja4^T7+i8M=y{AKMAf_wz6?}qh?Tc|{4?I{Jg
zwi@b=J<XsU<zqX)WIvEed5YFB#K=)2-F=`qn^OW(EyZ;W+pp}sR{BsE^l4gm_-^Ue
z6>1CT;KN_H!a!BHm^RRWXf3d6B>k$f0CfFGzZv^wZ_aOhjx+qBc-ghWo6>tHhfe6t
z=}NHe8(7*$1JcND8vzEsQ6|+7DH+ptqE*Nj3T?Nowt!#<bh_{m)bLmrrg)=lcEuaf
ztr<8&BEk|MP$P@^i7CH&o(^-xqn+IoZo{UcFp@<E<5yByc{&&K<a@3-!X92SR5sD}
zulps}!jw5b#M=P=ShkEW8MnQE-{SZ)_9G6^ckb}swtb6A>W~A<%BDh=Z+wspOvRf}
zOyFY31x`C8)}vi#66InPX8!%2f~n=}^bD9f0JRNah_0yIw3!d`E|;EL@#ZL)^|QW~
zFP|*jQ#U7a*-G$waY=<2VmCMGi=rEtF%F%#VcgNK+^?A-Kctu&jQJKAC1lLktTW%S
zoQ+-vyMgibsPO2v@2H*VuSvF)&1Hma1ho}Z${1RqHpt$^oMs0yzchI}o1+S1BGLH)
zYdDVNK0v~)Vkk{!{CV22J0u^I1w14n=9EIl;z_-Isfld+eq|rFYC>wYG;;k$U)77a
zna_Qo8V_`0O~5m*JeS@+|C_h|SdkyJDQbJBIZ5C`^nhkR8$lKK2X1}e<H$JUrY7kc
z)XZ^#pH}EKu}cY>BAMj6iX)9tqT{wUHM)<Y)(r98{zB*u0&EjP4?18^ZHFMnR1AfG
zvZ28xNilQ$34z-EmP_q%a4nN6Oa{fe>cT;w2}|b<8JYE@{f9_3;q;dT0v|N@O;*5a
z&9&Me#98%@pPT(YG8JKe&bXzhMix$?xwXwTFWfmfUdyPe`lsIbX?*L;;n=iGR|?O)
zf(mnco~AG#2*7u~Co-cErEv5zPrnfG?0S$4_SFgV>(5KabnOnZt{jsFU6(7;@}z*G
z&V}{ZFC%joe}?h9gX|-7iJ*1YLwft8pb(8b3_a{p(KSvngfkHu<`sIX4{sGHQ#M@e
z>}KAl9PYy$tZ<mmPV_+C1-@~~Kit1I!ADi3;XrPUc7=V|wz^TOv+PFkP)$ey`B*`$
z=fU0nIV%b`s&?Fi!h{EotER6GT#>@>&o)dtG9-H*3guMrE$A6e)Z8x>(=98ww#;`k
zdLs1#kv@wq<cNyq)x-VhLr5VHfv!m3+e+dqw|Lw|Iw)qf2Wx_gQ!z9)PqQrgb`N95
zcamU&MC`n!*>iffcxUi;_)VMQ+o#ELPNaJ9me6!hHE4Sik3faP^oP`B57kqLRy@Zp
zAIw@-UgSjd;uA?6>ge32N;fJ5yP+<vMBSqz4?WqmvYLm#Uwt>Gm<MHtXv$w*n89Nc
z9VdJP!fHy;<>?!cky(gk<kBa)A)KH>t*LZ*K%iDIha35U??Vc(belqSISyO$(yTvZ
zh_j!x{3uR#Z$BhbqHOPPMmNfQ&?dj-10|BFGK;h)bO13|0`<TVZDC1Olq^Iwq?x1t
z6Q^o=^EN^2g1#dybDEde*tNqrjr{=NrorpU&qt%5TwK9m!Y3H$f?plDnkH~HW$0rA
z>)~x-$JozYl9%k__+i6QkZj^@;IK+##G)QOf`W}m5d=QFXK7xyqU7F{l?dz`N}!oY
zB<z#>{0F+^_phz1fea`$eJy&5)p%T5@2~zkaqWI=e*~0uB1;oMr3i}9z>nLe%3KHl
zHhmhd*Fn)OgED*9yb=Zyef6HDKgJbu2W7Wd6WtL#6xC#n$^n;Dn9rcYvkx(%@Rs!8
zR_ucQUh{~;h(U+>J_j8)?7ZEZQsxf&W@UdaVj?7n4Czo_kgmK98@tq&?F6}T(Q7<B
zJd$&9WO*Ceg_=|592y12p32_qJW^9ABrf_2{xbBv#<^fCFQNk~&+4&Nmj=7n@LKVS
zIn8OFE_^{VR-lF)AIrMH(bX|53Kf+=>MY`2w0nM4^kG^``S<5fCb-0N%(aj3UVi}z
zmtLnvEIu(}?7oj+B3v~W6V`2MAh5vTxS?pzmK}u#g8dc;p#(3K;KbAAs%liLK7W3$
znzV4^poo<=S-o|q6ZFHt_w>K589p}QrJrVjsn#;zyzwufq2hCY(|#Jdhn~Qg12MBv
zLaT2=>E^9RJnX*mRU$Ufs!8YQ2*A>+GEM)`7vLB>FIgBPsUaIf=4yf>Pmw_5F`xK#
zX5V1ff)#~Zzelc#xXfV3j*Qc9KCKq7lkt3bZPg!n3qM+Qt>JtddA>(+AEz(Jk;0W*
zeV3W}S~<C|4_r}R*LnQzho<Wn#dkdS^(t$0^4b6Uu>+Et9@L39`wrQia+<Wkd*}Ky
zrWWQSH3r{@l%{TA=UMl3Oc-|u>LK;l1}prm=6TP1x-;9_QIJaEv-sIQEcb}Kuf1dl
zOtTJYd~)~zutP_0MekNTd?{&DYvNFb;vX5oxe*Bp=Qh^ZYv^x6>Vg#^A4P}=zzXu&
zr^!Z0umQZ`{Tz`eOu<hdjt6b@p)egfi8y~>BNhokhrNS<zv4jZAH%n}BWlN9u5WuL
zy_(0sU)ttSD1O5AgZPAdlEl3t81NZi-Cb^yr#e)?km^2`%l^=yrFUrCJ|Cx3$#lDv
z3q=J30a9%-sl7?un`ZVI!}C1+`aG7Vl95Z#<Mkq?_s{16!6eTU%i+AeE4Q>2bwKBE
zb3e|gLSRxqTV{uNy6z86>vv!4p>+F=LnWbvKqD^95|!v@l0$yBs-)3#kqpSNY)SHa
zx1%&U8zmE~%O(9y&VN2AcB<ce{DE+iih#+~GGek+E?#OEnY>y!cL?AdPS7(q^`m@y
zbMyN&>osnY8ZV?94|jmuItdu1DBBg1pP;<1G-UR~LB3r+GZYG*VruWeP&4FLModjl
z1G@D!0ty6(F;ht#`ih~2sVSi24rqBN4Qe6~BIOgffLD0<^_$Mlze8Q>dLXhvFja1x
z7rUDC*qhnc#_<|Y4<5N{(K>DFXO}5lbBy8lDMO{8rsbGvPAJ_(kbl^<Xl%?$K|$dp
zz?CZiPaGrzYEpV9U>}f;f(rdEH*R~}-Qe+zY>?CfeX!*^H*zGz8(NnnMqj<GVOp_)
ze+y>9t~FH3{kK7tzcV?KEh7GNcQwTQpuMJ-YYv6DpaLt0N;04LwPhov;-kndUY+m@
z=BKPZ-5dCFE4~?cSRok|sn!XK-I-f4)63q&vbZJjuxH%`4te)`Z7K-}BlZ9t5hy!c
zk!!^5;`p!uA>@GYuCU;i3eSbZw^<qUbQ0uZ0sT(5TUIfkSeTb<0Y!V_+4f7iLUGWw
z=c;+~PPlcIPpY5_obsj>4GA?baEzHqrFe~JeAr(lL{I9r*_7JxzkgLwpqzaqVHH-o
zS>3e4wRSjl7oWi~kD{3wuV&D90kw7oY85yjte{d~=l&$yhxFXcC(+SyAf!L2s)|E;
zm^SS{XHanweYT`D+o8e1D+*B47*6{uZf=KQE|56g*RMW){2a=pWn^c|xu40^d?sPG
za@&!Wr=%6E1T7v6{3h_DoDq+YdHlRj?fpknM+42@@kMV;?&KPdPvsiwR`P`opU_eY
z#8o;*(2Ui%qSM9pp>Lr$j7ow7f}4Ht5Wi)-d3%Xt-#}>BO?ms69(?(TE@{7M|FwF#
zT<2@R^Z+&W=c_>cAS*SZT+jq|u&((MgM_ZhOXQ*EW~!Q}ALI6UYqvF2i`qjJ$kYfJ
zb35{!+7Xi4u<_{*DkC+uvScSmv7fzU_*a88WP%O4(7<!<Ek@DR+%Lwh1@D|F;kq=0
z60QMm%n^bATO1pSj53(diQQ|L+wiwZ6|}EYl9Jl0!SFe1@H5-Ic<~k4nM8_*jE_oI
zL^&YFBneX_I*E@?dhp!RD$+igdsFE|cGk04Mg!rrrf{p>xQ~o75@<rq-u^>5!avOv
zJP37LdhJIhJW+FIr^}GK;mGPbt(h9EiItY(k3JFGVzD##n)$}nY4h#bS=DI@w>X5(
zEbCl>Gp^{F(1gz_X=1Cdj{CITtC^oWC0xH9ayYgsMb2%@$5!0uH5h)7m?xh4+Y9df
zIVmRc4flV4jKd{>GVCC<eu6ST69~P{T*W%SL-ZkoNW_6pTMy-;+l@BC>4QA5!AWOt
zZ-oJJ4pg!L>^{--8oqM@SzS861HO0l^n8Gnn1YIo?aj)u%ddde1@~Az^r<J`c<8<s
zXavg9V?mwvEcG^tfS4%vFSm=7%(&g6@3e5O^oUD^CN+c5gcs>)2@Fp@VJ{46>C%w4
z>-up91|zjZ;r#D2An_ZxAstu^Do@T8zAH+2388`~N?!W~>g~uUPtezM@+@uEd(U~U
zkAk5KMhqQX;zcewqx<;Y^Lwx&{XQL}OpJ4K!)ap`JMTigvb<}!+r?HMUAuK|%e$2M
z!VPvG;uSV%D828dIU187L_T!KxL(<3>gvAumWKN}liLsqH4MFhI6^NkZaJM>5P^l~
zK$q;jXK=H)!Sm0iJsz$M28*12mN<LFnr_umnj0a^Ih{i|joO33*Ew@srN0XG$GbnX
z4$EekxUI>}Hrj6=vylKd<I61qRux$qe9bkvMpBFa2O$aO|A{Ny`KeKSZmg&5$N@G3
z&(Y4Jj@h4~bgW|7?z>=j#}T`GGIEf&U3aGkXP8hg_?dGy3igCLZcUG!j)aSfi4r@-
z3)GkPA^agnJ$q?Opnq7}6+6XK)M>ld`EDkGWJqPzPdf2*C3|kE;M{6`M!yJu!_Q~(
zSDC)BEf@N_{|s`qMDr6)atHEgSK7CI@FU509^?+OLvN}4=LnvFPkbH0-<h;Aa|B@~
z9R>6|C~y+1n_5Y{R%{g7@`#J>{wkGamw&wrNvv;I+S7~fdoy9DVIRa-o95=`u$UOt
z$xCP~dJ%S<MDGhQ1YOSSuRAs;4th=P@9S)dP3`r8aH%&)CC>|b82_3lb^4TOzA50G
zMYE!*+avYZHoBtb%x%veOpW`q_h%Y2R>8K7k4?Q462MhIvYV9l`{hjh^f@Isch95d
z7{W-QWCmYNQzLURGI)oEo`;>oJuE=~c5#U^_SsYkPFvXh@HFg4HesPybv`bKTYmBG
ziDcdy*d8Uw_OQ*NJEvlTN1yD;QKwB!xi`193Eeimw8C-rf*3w2`e|xqPn-wv<jX7d
zMZk(G!ssq*j!B{tBwV~;dQwu@hCgHx;0G!i{Y75XWLY&|t8hyk8a``4fA*QXOC<}w
zh^r=$d9|DhXGijs=r47Dcr$#{_|YN4hF+WUsh9A}p-3PHbM2Gu_)4~PE4v>aD1-AE
zV5tf=V?YIGyzFv<L%)$5CnX7PADn$hEB~Q-t5H96tqqW2lO1}tVgdSm2)2&A(1R!C
zY0|&;3E+y6b1-b&A09+M@Q=#<!Q(O8M+EgWr@%86HLu>M=x1u|#z{0`cm`=DW<d!$
zu>xqTLA05-N=r?TNu4|j?*>?dExk6&1>(=j7*IWMiCpuBD7*J)=V9y*Z!{A-GE=oh
zF3uu0LH}9{i9`Uoi|5PK<(0?Gr8D<{HUbE>^jZ=Ds=YZck5AX_5Q8=v$H8ygd^_rC
zYC25sP3~GCI0IhQNQ&GS=H!9FYAq~`hA20@>WVIYA<swmc$C?Ck}1cjSLXL3%N$+^
z&=#!Nlw`K_Mp8%$vfg2YlG7lTO6y&D+A4W|!eRf_#MJb-)ZRpFAAj5CSm7-ry63Zz
z1Jti+B?WVBj5=(B9%Tn}HvI60`u2JV{lF!biI^HVbw0%vUJ7RCh+;#Y1`&bH0}6l`
zshj&Mq=|w`y5G+WDUEFXi^Nc~)uSzCpH;|vj4x}OR-7ST@N;oV|HJL_y*gMq#uZlR
z>WxW*a2%{1cm+3%Sf<YX)@=|C+Gh-NlGna1e~>z{zp3d{qKK|HH1<PUq@Pz>8~xl0
z`N66p{x(DP;L&k~z}ePjp8AGQUO7`bq>-VP94OK81koUUPSHPIIb5e_H!PSH0{EeM
z+ep2j5fX4>+Bt%fp9!KdF*cYjI@}FAU^CtO6$T9ts-l+t5-cA`ic%?iaJe5)^B`~#
z0Ztp-5~uPii(pjS3~&J&KNLc{$Tjc`Mw#(sTU?T917UAtb4##1WH%yKN;iI&$8VCE
z!!fCsZmrnp^z>O>aPvK3&V(hvl#L1;u5zzO+?4u+4Q%&e!tYg~a79~$1n)BDmA2d$
zFHBBr2<TYe)%!!Sc;tjL>KF|olgDnI^5C~9BkP{?JBFVE)--M?ja|<X0U1-{5>MBn
z00EF?%+^Or$4~nt+CId$;5F<V4siWof*v(UP=8u(YQ;W9b3ZCZ*l!a0+!Sru5(cH<
z$Sq=CZwvVy4?K>P0Q{AtjqW{hq2j^cL%4a%el``l_}r&~;2WE2PYnGiKXOubGhEw(
zA`V|aBiL36w%wvmjEijtb0^ItqjMwdvJ2xpOzXEjPL)C3vZgEoVMwTW`yB7Kl9Tm9
z<K(g=*P|<GdY|1OJ9#2Gige%WT(D#AJFgs=olkVfRLI*+SPA#f-jm=Az+@8i=X1BD
zbV<&ohZp2%9f7HWPkG_4%(tdGfruc%R&WP`snfLijaLQMA3|~J3_T;$9rh)8+x%Cj
zXBBliPmMMV$roD4R&*NVzc_g_H^P=y{5Wa{FSl$7`VbH4uBmQPsw-T7xseIJN2r`<
zZG+ZEM@8lx&%rp8i{j;u3v#UN+4ix)j%<`Fw~SZJBYxG38)svVJ>87nKIcVB+eS(O
zXIC)i;|TAH$-=}f#YZ(YZUptvbn>-(Vww<N@|O2I>=~2aT*C2Q!r6w^758C%d_ZlG
z+7L!W$M>8#tm(mioPTxf;7r@KC`)ul0gc$!BkBY=PEacIml5VLTi6X}dK-*FWTStb
zsh;VXvEE2??kC~_xe?NRUF08g$m=|`lYX|Mb*U1oV<kM=uSq$ZrNY}i0TaadQbYVK
zqpV|k!W&r5BA4=Rn~x_-qdszve<{8GmK@;*=&XQNFucM|vVPRgeAanQH01PTKu05>
zI_jW-b33Aln*NHnzxN(v3h>i-zv$PnGRavcIQ>Yhtd_QRJ=C!<f=)@0x#=a5!E~VG
z!QMfN;Na-!KBR*-gg^2LQRK3FKL&pMnKVxyyUn@7c>>=v#V@3YC&@35kImJrS0OiR
z`=tzh?>vUPq+D`jz9QW!{0tp68Dw=)Us{!tIEQ$1O!Kx(7voKClG=<CTO9Y9$(;zW
z2tl3PC-4}4s{={4zNYO%!(HfDpY~H+c4kl)u`KN9@;?n0?9}S7NR#`WrXVo|EBzuR
zs~>N9oGO3LF<Y^LfTJ6cR8|&8+e&I5(r)QTCbSpNNUE#swc34BSMh9yM&lh(vJozE
z@F#ebFT4gd+zR(gmq0zj?36Yu49_++w+d6ay=%AK-H(i-i`8Sc0rm4KaJNg$`3JH`
zy+N}0lI9PUKgw<BICZUW>TRjOeJB*jH5CGSmGMovCrxL?ryk<vKgo1C%aM%Y$p^F=
zn!IwH6KxIY?n|)1lVMYSrS#`cwWB^<q$W)Dr8A`04Guib4cB|5cB6351YO^T;6X-!
z{Voq!@S_)4=RNST<W5c0+zie|qhM=R%`Oy3Ec#^H;FHxU1lIeNl&y65y=N{<!!&1=
zW(VIhaln=i;{{&|npH}uZf2=mu-#bC#5sT3XqQ-<*g!lzIQ+y%d3!OG$Z*OdeTDIn
zsVGvriawP*@>GJH9;3uXYg@N;YF1oE_f8ygbjsQ3ss_1kHTmG8*l<5elovbu*j5sU
z8r=Pp!zRgUp4w2bb2l_cB4X5AkCdkjzUSo#hAp?j_cuEpa4`!~{T>FNLe(LQ9&;F~
zIpJ8S=x1(Bzk-k8!~!_>{rX()^1Nm|V|k*ndm$Zd5PZ;?#wzD8qf?0zn#q)4LQ)?b
z^sr36G5kS4e!96w-S-bWo0vFdU=W;&4+(GM-u0HFHBlB0@rWYy3_(~v>Kh|L*INPC
z$9T^T70NvopwwLXMbknr@$RRyr175vZrfDf5!HLlnb5+@Pd&jqoijNn1Lr_lWVhcI
zo-&c#o#f54hn<|>Y2NA(LP$D87@A<_&`<|WlDPpL0ocNCzdgd+o9MCUK}1K$)EV&1
z8}8fcI9*F#a}pJaFpnK%H^T&n1)RR0+7OUjdc9;<p4&{DHHVv|@#Bv-&s>O`9C-jA
z$O6?D`Xa_1O-)iBoM}zfAqqW>wn+h=^5EE#-|ukcB>GhoBFa(w?1ijW=E+M^oqQ`v
zJ~`+AC93P@CrQ`$Pg5`9ae;P647A8_0>clNv62FfK8@Gkyp}tT@C5avD)kw;z|SDU
zkUzNth~VTNGX<yXG^7wr$&-wB_4mF9Qf%-m<`BlqzFzUmr9|yYl|LeYZfVF8N;)|R
zp5v1BKwq1qSO^p@0dEoCow}q@VzQR#^_9gXiI&Hg$0OI1B*J+)ad&JOZm9%8gJIoT
zO~fwyT}J$bdys6i_DRp13-t~*_U4Fv*whR=_8~s^r<ig|>Eu@f(D2#&<LBuM&W(?@
zJX8PiQX)rGx9F?$x|_do1h+}OOU(BiyWp7b0VvoZM(<V4#;*IGa_;B2-ENFHrV^Bx
zhfw|Jnc7`Ml4k8T05}vlL=8&V4TfC}7(e}PM|>YNmL#!r5P%uH@}jeRa)ej-g7O_V
zLbq~@A113pP9U*F8=1V4wkrv>aUFL6&2ubqxX6GE!z$|P$(JpkEl_Q4c6u-f@8rsf
z6Y4jr=*~BJ*l<4;D$pf?<y806a9_`@lc5gY`><IF)Sver|6G3lbQbaqr$m*2S3un)
zo!`NQE-G4JPH)_fIF4fAW%eT54?YN@BrMn9PoBi-fKHSxS>Bc2Yho*p!X6gaU8Qy1
z<t-{7Gt>*>og@^qe%~9At8)vUA|<64wX@<!MV2FXaYh$W+zy}`;I-tLlt*2!nkRJf
zJ0WeB|3{jAL{AYzR1T%2jE4|Nn$xsjUfN)nTU<ro_<@bvxz8UYY&hzp<V$lL<s9q!
z3}yTU8Xno}8Vs;6@|Ok!L2?gZCzIb+Jb#ocsaPMfW<*5U`=EdZsY346vFRihIx0h>
z_2~BEi|Eb`NdcJw>|4~7804O2I((jth=BUKb@7N8rFo!Sz~EFSyxi|htd1fJo!?=W
z$_~RWed(2!c?#X4y+9BIJpG|9KK0&HaHo)b8HCup_Y^Rlw61@cxBvdsOn1S{3S`g*
zH4)$=OZya|w}3q0C=M38oMk^ym|cfIv8l!V3~63~P$FoctKW7F(U-${$|SH<>0r=M
z+kF~E%Hk(bn2yry1}A^y<;JZSL{Q!d*q3W59Ev0(c64hp_K|5ni}xG#!=T2_U%nHt
z(ft|Q<?ZfIFIagsoOptU1XON?-0!B8ZP)6n69!ku9qts9tCqK(W1;6-=MJ9hged`P
z;q%!Bf-3${=KQas8{1%Mqr0_P1cLC_!pO5l)r94hS|Zh;ao2r3(5<7KccFj_qZ#!9
zHXXcts!i}fu9#<cDxXu`Pd{6wb#2J4)S?Q9SlQZcUIOS9-JPmxKG`4fTugT>Vq0!E
zhX0hjFc({Wa&^wzbOJ$;x&ImxTv8U9Uc7lVElyHXa39`&-4>2LY}uwx9~SV@i61St
zxc%~zy}F^>t(yVWPNyQI<WyC)A!+Ig)J;xFOY2X8L<*)O|2;_;gn!~BdWOHw`Syg0
zP-Mp)FyPLmuWBI_FlUny($qvxA@umT_R`4zlmyP9XJ<b7N&-L7*ViA{e|I)5r>CkH
z4g=tqn~g|NTG7?j^<D(@7abpWZim@2T6Wp?anHKA$4gExH9%|Y)~$n3zzuQk(+aoi
z84PbM<@4xzCX{rB5iM2K1-lqnhxB^zx8XPqSYS&hE&5L|grA0b5Z_IHSv_(~FgDA(
zvTAbR@4;9%q1@PSKKT~vk2!yhHe|CeL%MWoh~!SbJsjw1(l3hjHBFQ<yD)_~?vOE4
zgS3Cs5LteetrhV6zCABD;k@3-uQM|b*nYn13kX*(L%f{LQ66~<grWc+O()+XS=P?v
zlYqe$(28-Ht#EW{C;H<wu5=q`VrP0I1NxH{-aF<YH-PGiVaU_>UPuP^bn&+iA-@&N
z{4K542r2i+&$b_K3*nb$Z%LbFJMY_At=)R^hBNYcpm}$3EWm$D^+EiJuqb?NozCcz
z>_C^KAV&y2rr9D@6_P?8F5FAiAvybwmGXN*E4mGwpe-ecEV(ZgU7f0Lu2P3rs);N;
zN!vI$SwzY}(J&kVs!UffMjCm?>sm>hKAlypB+k=qh5a^W@xR#A1KOhe`<Z7+&U#r>
zb5L1{qlUysNWt>pDL=ICMWHdoKgMr+o9pc2xQPUm9A9A|0?l9sK0xQlre=;BLP>Sz
zvp?R|;kkUn@L9=6B;_I(a6yQ9I-telF6051x;M#wcypGO@JQvMP{g~bEu)mebS#D{
zKv}co3pHA;=Qlp=!Hm1W(q}VCE%y_gJvFT3r?r`y)3?96f)JG(5yu?wYKVDsWMw^^
zTGtWc{-BSIf~co7#2Moi(q2DrO|<nQyWP}MA$@uXg-2)3bG#UDG%)X7mwtKCEFhsr
zFTpwKNc4mshdqrzb<{LMo*dk}I;Y8*`I4v5mjrFbhOxwek}zTAEnh~>dO>93b*~Ow
zAYmC>FrD6}N4}gcUG>D1tAl(9%Yj!7(eM-7(@OML4Z9Z4bgYmLmT>UMqv%DuLyK+l
zI*7bccnLvAHpg^wnQz+cuX(T87X4TzPJ)0vQYI-(#dR=A>jRhe$H=7I*?}!}!eF!h
zFV@~X5bC{sA0JXwvLsP4q(v!GDY9qDsVqrSF}9AfWS_BbMI_6db0k{q*+xbSVeDH@
zN!CeOGAPT)7Gqz2_j@dLJm);W&*%F&{&`O4>D0{o{d(QYbzS#$f8<0bdI<?SJ@j{e
zO6{BwB+bKryHrvFYD@=A9{5j$oKavvVa%4BPn6`Y($?pOnpYbOd1_hdG1!dS0R5F+
zERBBt1*GTI<4M)A?6S!FyBif7<dpQ9GutbwyZ>g|;xj^2D2v}jFGdrksJHxY85Lg&
zu?|YfWj<Q0IV*aq3z2Zad?n+G;8ll2KI)ZMA0ITgw!X`F%_DOTwB}VAK9A_c!u@K{
zvvkwTZv#*1l@E;E+UmfKDG!^QQpJ+iJk%@Dii$V@ZCD!pfcM>|UX-R)nqgSXlMfY6
z3gL+vUa=3H;B>1>Mi8oMbY-fZH{jZA6yMzk_MiT=p|!6yTm*AIL~x;Mb?N{16Z~7-
z5qV;$zBWQs0J(S=FVAgdt&6u82s8AntagOrZYjD4ATZ;W^yZrcwj&?rU<sP*n0Bk_
zv*x<y&!6AxKggmI$jHKrVGoRU6V<tx`x!jPx$_Ff64Z{1v274be33S_`4D7dsYxTY
z#arg^To*psS8+P(f{4xf$TcMuZdcON2a~iR_*Qiwbyb$a8M!7Agm>bP*OoaK5h&?^
z^RWam#;|8(0d?zdw(W%)FfOnyIHL>3hFr%++z-1`H?)~96}NEPDBdUNaLag5Q2N{D
z3J^ZaMO38W)8u<`)3Yb2qg1oUR@R5;X9F7r%>Kh}%G^&kto$I^YIBqa@g+sxd*0*O
zFM5U3)HGSs4^XT^@4J=GP>{+>7QWNVtlNW-ujz&ST2#&zT*sr0l((G*R<0|>+ZN%y
zo!ZRvUE?R}>?tBN{RVzMzAv0FB|P$qFWIHNmpe=hn%48)il0{6fq2xby?aPfa)!c@
zUiBzB!!tzFpJ6RO1TK02K@Dgt9Cv9`YYo5cv|TsDUVz$+ZugoQpqzMLook-O`n<jW
zFCU->tTx^zu<NN`%#Pj>{p^qq#=@e9BxkDTa&MZU>(ZqFo_5kCzum@CI9cBto&6E$
z?n8f?v^!a#!9yVlnb@Qw4@g+)oa?1{yZTQAQHR<(PDpw&Q-@TU16$5wK)MeT7)z{U
z@i*08$!@YmaPx%eD*z;EU9$}avuE6)vlm;ulc@sky=5cDH|_3@&d<%rp0R+zay&7a
zM2=;b8{pjdRdwT_ROg3`1`jz&Wz4ocPVumIZZr)KEA={JD}&+j(0kh>ceAoE5b2s!
zN0WWap$-f-wYKK5vdX3B6Hsn^k;Y#3^XE@Ega`bv`TE`F*AIWmhQ^6FdBdUZ`eS>k
zLrt30x6j1**|)MJOF>RkC*Iq$wN*Q;U)S_^Pnaz8Qf*1G`qX)mSjIeZNag{T*vu%9
zO$UmiyCKXkMxE;BW>2>Hh$?zSngVF;I%r#v2ljR!Kwyt}W>Pc;`Y-S_z*&W;cKxo}
z9{DuVIYJ&3!TR}naNpsxrHyr!EZ0<;!h4*~-I26FY#!(seLq0~&z~N&molxJS*PLe
zba%b9^lgLPTd!f1NNSioQ6~p#n}^s@!hKo>evKA6uvMy<lX>BQ^`l2MH8l;OX?zHi
z&M<B6ifFACGo6z@pdSBGdZm4+w*Nq$o@pjE%iF)(^BLd7$sE`(JY_Bb$OileFpq|{
zv-=Hv-|E4r9I7TOtEt7z-PrUROcs(C<|m34q}VudLDQHg57Q1gkeg~s-@G|3Ei0=I
zZZ{U-&1ZXioRkuT-O+9o3^2Mgd1NlFQ6c+P+iHkRIV+>fz)C?1X-Wo&h5YOvKw?q8
z<IpTv+4%PK-}U{Cta*V}V4nPuGxW_^e8BBjk05@Ss)=;Bl9rS<@H<EMCBm`?4~G}m
zTceIW1RRo`UIQq=Tl!wXWAvqtMwW@Imp`0w(ecLP@?7<N+pZyUJ3cdvG!B9){S`c7
zi*T9R?cJuB;Mj&?()P|TZhJ!cFBb7|ie+5VGjXHU+P%voyK9)|v;Yo5Za$&GE8FO;
z76}dGOa&blP`GC&dr9zd=Y{NvVE(StpUpvy`aS{QzR~ARIYaWarrkGL@?4L?!kYwk
zs<83Zo>ZdOun6g)y*nh&0r=SR%nLIW^aFO8e!vEJ7Qe?Csa&=_cU&XBr&yhc?=qje
zwV#9(ndAHBT%IXPRe)`<?e|_c(S@?%0e*TIV>ITYg=IYNI@+2gtogZ|P1nrXSrRXg
zt6Tq(pkF(DdX3HfEN){b_~Q1%0>-c4f1zT?JliMS6qiPr)8i=)SH)C~jn*ji)Q!#B
zWcoTH1#os(38akclNvi@bnFjAfv=_NHkr%hm=IFidqi}=;$we7M(X)430Z+A^1?x)
zgMc1x=6bed9tJ6tVS1>t#M|c+QbQo*i`Xj>qdAu$oB-G_RJY&0JTu;6%Utt3hB|kF
z4WJP_(W|0Qjc(wgDq(nKUhG}{@ci%aDYBDoD}9l=x8SNGX6{$TZxWk^E|Du9$+De4
z>`sg7=vU7vGrg5DB&9Vo7a58~gOXg!c>|CECES~z?83`VPtv3vvLJ-f+j2y^1&^Re
zot{6DU%+#Cckx?46OVqlFulZ3Zfj2P3id`=X@rr|@f`F(NI81Yh=3S_u4F?B%)S<S
znA;+Al4n3YWEb(-<L-Won2&+zLQxZ!k<Q!fmHbIWJ9yEoN0IE<;UqO#vk&=O545sD
zz<ul^if|vc!c8+mr4*VXpeN%G;$IzhKEDnySzJ@Fix<%2#_AI%n%?dU<-dO#^I#7|
zRc;xbguP8^<!tv39BdJ_`Fcg6b_c#nv)iv~Ue-p-h1}#g+L*;kX1Gf@@J<ypQE*Xe
z6c%Lh#EV69`?71687h!Z9XT;+Bu_tW$S*GIZ>w1U5&3ZWAJwcySPci<>(~IO!JqL+
zvOlRYk!s~i2zqJ|sT1vzAq~-<{tVih7Eg$%(>)`wQgJCiIagJ#sW%I1%{|S+Y*e=P
zx5vs)QZ8ZDG(OXAOYEJZIt$rkTnNm#?gTsnZOxX5xmoYok;)RsMk49O93d)W7?MWG
zOW!|{=4cVmgJ+eC)V%aeh5Q1*Cr3tvBk{Ma&a;fdKG$`=FmtlZG(COXqS6ylU1TJQ
znzko<-B6J4XRWEwlZ*G29f&8IO~GcB@B4Bo>52$i@Vtyp%sC;~_wya!Y4UCvs&>It
z->Z*1(b2))bF?PeGkvhupe8{gGQVHu{nl251w@v|j`o&?4yO2Sd4AOZQ#U{4z2H8~
zXISJFr6yq0CEHpcXsBm&{k;t!G>c>(Qab6+wx;14N*3nng;HKw^OfTOw=5okge#+_
zoAST)44I}4ri@=#dYVjj7iCPw>L05NedwK$FfUX34W7QKb$WMe4n<TfK0*C`)_B0x
z06_6<dg+HS*0Hlp%Trit>qpYUY>$HL*h$<o@e9n`4$yq{U?-+)`N0&cZSh;7?VTbA
zzz6TT;N4j9{$iHrq@wQQErcPaCg)5<FvDVgi~g7){(D1xLNAFBrQQ6qSL15$Dm9Dm
zLs}|>ZZL>;?@0N~{?7^bAZl>W94F6fJpKLoeYT7+#XP|EAhH)iWZ#NZ&|Wgdm-zab
zos{{Qf>pCOb4~2y!QoR#YeO0WZ*`|w<$^56!HkDk)mZeZFhO@nU3_+iafv}h6yl2l
zK=>!D*1NL9Jr~)9jjI4}?QMBOlTR5pI@F9$eB?Dh)g${bnvN+Pk@K9!KGS3~`m(kE
z*DQa-9)?y{`dNi;0lBZSG=i%5)~c$#HPbPe9_mLZzfFe?VxHu>LXl6{*tAc(fx5e9
zm`(57xymNPaT#re+%@X2>FvoQ(CIJor}Te9Zi`i}!42K}pg?yT=2P$<N_JpvI`Y|>
zEDu2rT*9aF#G%dFTe&`V2jRrW=VdS8>rOk+^F<^37R>ch{;gadG|z{VUh2dvOkKvq
zW(cOSFHvEBau;6SYc9gb>x4@Ze`A&afj?<F0g#FTJ6*gbv&j5=JGEGj7O|E$o!6Et
z%5i1Swx{S1A8ej4iP8oFrb(COo~Dbt!+Qgc??XgbzvsCHSJ+VkY@J@r4p95ay0q7M
zLZwZKv;&T2@gq(VYLaMbr;(s*;+I2vpCW13daLp#yH5+J%tu<(Qx}7*1`T%vn}BG-
z)-R$cgA73g(vF;9(1#Zv(2;c*y(h|GD2Q-vq%i2%?}KTBM2;GEv@CCMpFD(9-KM<~
zASx5B^kcY|v5_9zKf@Tng1w-E=4ONL7Yca&Erv9jMB4Ok=W*=0e|B`3pcBWYdSZI&
z$kgoAFTh=3fqa-j3KYHGz5SMSs7tSxUHAj&Mm8exRB4h1NXtcB+=Xo2p+suub_Akt
zZf>5gbd&1aRmd~Y6=}DPPv&44$pJ$<QLu@rbpI8;XWlT#=ta}!qu?bwQr_ehhHVM+
z$V%YLzC<W*a&)H({Ca5S(*k4^-<}kG+}bhSjaZk3`8i7NmBw6tc!p3X(>tUMZ6M91
zBh(w(zLdLdBjk<{rW)6Ow9(e<z2Cdp3+UxpYT5OV9mmEAl`!u-s&~{18EHW8;mPM#
z!Nj@qaf#7yHzE~!Y#2m5R2DV@s@#Vl8(o;2aJ{!K%z5sNi;PZo4=ne4pTI6dN|1l|
zI@JE)>yCCP)F>zN5iv!*ak5*E`^kJ_A#w2o0)*qV_yNB@Cps;Cz^-z)6NKEu-EXVB
z<~56*f=HWj!BaT^mf|bE>00%q;AqkWPs3}6x+yGE0gKURrjh$CJU?gpJx}bHpBX*m
zs*b-P!@fsT?C`cGXNS%;=RBGB&A0bwFSIU}x^FV-DQ9Sw-$T|cl$oAqFEgsFzPt9g
zeEIRXc^U1DiQ%CQl3JL&J>4IsPuD-%Dr`e?*zs~T*$bin!D98V>)5@Ul=-((QhMR;
zr1khx;5oZJ-Hp?SYb`$1YoDsFu*SN%J%q`r`qEORD;P|*ewBFsD?_tMXCbAdx*tWA
zD7uppjYZiL)Pe0@hw#nWsYNmUwA3aE)~2laf`OxLVmMK~0(qYF5WVUq%w?Sez!&@4
zKr^~n`ihnfyW_54(yaUZ+k?tR_qPF7O_`jO;^*gwd6UG<{QSq+_f00{q-Uq<4|fbY
ze0v5>1TJ{gb@KRnzX@a>efo*Vr!SWkQZ9KPy%;v6Y7$7*XiXGX-S5vnX{gp(KS;>H
zDOw(H%#tBW8+&t+&KCjiu#Ekf5d?NWJf%m~1G5s+mE-i3u1}PHb0x;;QEm7%Z9j*+
zfurz;yefLcay4ZO&6O&zk@K1_d%d35dElrz{QY~|ljR@1Qq!rtFCt%=i9qy!tmz0{
zA5o2@$pc-41!86#(Q#_qUG3X#SJir6tns2L1g+8Tn(hobw5~?O>zS!6z#@5eoxyIe
zV=8uS{XqH{7n)J<ZNj9H;fzfHNoi)KtxE3Wl6iL@mvw_)3uU%|2s&C#;ImHIP_Fsi
z^WN-6TkL|eT<=i}FzFqw(JU19n)D{^g=UttQ#nFt+T4?>ZgU%d(tTkuDS|<!?I;|1
zNxazBWBCLAyMvGCcUR01n|lfdmG`B~@d@t>BPmHr?KL<~PXX9)gh?E@aqr{Ke3I!P
zAykxR!*sarB9}dlcG#qnN$#oF*Uze43Ip6lGqg}elgZ=Hv3SzwP`BiW77l?sc@EEV
z#(<5uC`NDLUsc*wR#{*ztVIzGVt5+8h0ne|d0lSS(dN5Snpir*LlzNqt|S&3=@#9d
z*EIsSwE#<j6tQtUAuOdVDvvOiTs5BDKXd6Fe4)69YKNwSk60?COy`vy8?0~R1%AuW
z+xA0~I?1~6vCO6!RnXzgiEBjVjpZVohwdhRu5KZEX*d&S&0h){W|6&*&vi0gRoh@Z
z?qAjwG0^y-r>nLi>^Nfw0=qtR);3Q+EBr<n1fiI<v6q1+Nl!PRmwi_52FKW&dg{bI
zX0yEx=AMnqg7@ELctbVY02^$v*-H}9cz?LynfLv~DZ$pBi#}qO`hp%}3d)B&eb1yQ
z4e<o}N`x;Lnrru?79>1S3QjI!GMrp(s+~g@Mx8yZJw7HvIzqkFQJ@GgyI-viR(oSI
zTz^@Q0cE4d7eN?LNDHX7gF<u0VC?b}^g4V^7ERpcP7}H3Ns>~Cda~Q0RJF@Oy)v@4
zn$sNHZGaNj3p4S)R&&^7FXzsN9Nt)xpwE$%1Ckohjy1BMH^5dEBW9><(N`<eNaRnt
zGDaPA;k#wPCLg>hI=z%)Z?_=LjPD$}=x9}NRSMAsng?h{DfFWIMNkrHS4JOSVvY>4
zL=&as$*S3JNyyGaygUswF5R5g!)?y(U+WaCSc<EI9Md&!m+<ep!3-%aM-)1y<-q(l
zf$c)M?r}2PSkc1VP>G|<+%yjDDP?!8HSRc6iFyOi7>4V-=SO3fOU)5-Uev`B2gs}-
zAhf@!YbTh^_dyqBexIvfg+FcZ3R&6bIS@uNRFlCJonzUjdh*<yha=Sj@_gBkHoa1Q
znvNj7!3qA_XHhm<v`=Q2o+c!a@{Go7rwaJ_xYki#c`QwDu)V%VI?5rVMe|i}xU&XL
zW*|&kyHZ;o7(9NGTU~pdPkk(|r#sckTX*z}#4(Fb_tsad<1q}QeCiZzc=E1fAdzTx
z$CDuP5gg<{Jz7Hot)qpvw*rhsC4;#?GUP!X4CFdM%lpV$B#`{TQ7w?msZ|!2sI^Lu
zW3|n{y$Wj77y~;rb*N{0`!<GbH?<bP9~StxveSm-s51^PskB^kw)CMxc+){^Krd=?
zde)c@hMaJ@XBizD6rbnd{1lYlC2hjXLhmd0J0?1ZrPmi%r+9ny)i+C}ucnCDD*bYa
z_VO}yazKE;B3}rwySs(CJ5AFqEXCWJ@7o>zL6-|M+9jG7j?&vn5<hLbgJWY>5#fru
zPT1Z;=IWQP?(b*YOlCi*S?ZqU38<JoN|JFp?(=#-o0mi<EhafC!pq3US3%<BD9L28
z((7b$&pLh)PnvGN9Q8C+Wik)#kv8NVzV(T1UW&4AOwhQM&@=DL=2GQ7yO4XgCF`kt
zw&Cvi*?4i6g3ok0-Qlz3=ZPH?rccAj+ufp=QDOaOdGpzkS9}~S2%dgCT-Zwp`ndkC
zLQo~tvV6bY%_z8`))()45#_N(KqaG}5GIFU%LnaE)q1mKfeRpTnK2173A{DIto7-Z
zdTtoqYi^Wl-rfxd*A|UAXxZzc10ug%LQOhP?zfu$%HN0RnC2f>&!S%HV$5;mwR%|m
z)lyVz=Fjr}iLXvwVRvJ6TE%jRTG<vwo9t_y{;2JJ(y814O}<x!hIZ3Dp?$-i@&NLr
zopfkN%dfap;;JE`aBc9^;&8<32y0fC048m=BU<5Xk;dq!PnVH#b~u+7U}9-&7Kx*c
zvo1Uh@P4mh_}f*sLOJT0n8(r4Y_}p|o}|K=geC_{Xg<^vt_;9q%Eu>1A@Zgbl?|kJ
zQ-VT8Lz>wM^MiIF3BI$sCc2QY?hlbF1Nt3pJ&A+2kQ2p!edR>?Yg_e6h;1l5tPkSQ
zo=4CY9%*c<?6}IkM@C*=6TB@gz{f%K(4n4mR!8+51?tR)@nmFL$3kBN3DHg*xA+-J
zyXD8q17hBq$z<8<zsbR2Do!JR&<oZk$4hg@^}5W7BrKz%;A3L$zSb|lT4twOO*FE9
zYrjwAGXR4FpKC}`-z5B@B|+K-Ti5fT<27Sh<@)~06u(DsVCW<^&#C+AsnZ+8v*-#{
zTWW)>$O@aSCiwUwB4^wySE~=}!Q6N%#1O^ENNkv*6h@~=u#2Fnfej!z;T0z<z#2aG
zGGhl;gErM2Uvs?6V?I?N!QqcAewfh!Pqt(Oji{pa-4sNRL#{~(kZ(LC=mBD6y2QlF
zwfSNLaH6$W>=~44Cc<otMm-xoPUdk+u+iSvzl$c_@0ZTX|AlGpX3I_q5G{ZcE$ONB
zxLy=Yqlwky+C4@!(4JI~1HaqVtb}2>Cj9=*G4AceZbwA=%k6wRwSE5{vByDq7Hd!j
zr;sU8diQ&;exe-+(XO<1w-;XAq9CX>3rhP8pmW%r3^I-1=AywJE<TEA5Xq?qRF2VV
z*=0lPP_@o=v4Xd@&?@a%!ktnAyb?6Y7_Ef<`oY0LV?I-XZ1lZt6<&7kDF=$b%|Z|0
zI+hw~+m-(ght`l-7rza9N07|SdA2I3BxFuse_)TUJBdd1;+O6M`Q)oS=OMP}Jk!Zn
zQj(%<`=%*J-O1L(q*OJocHe8MRz>9u0afKUQ>9YsbXOh!ECW6A=#kGE0~|9t&yBc2
zzbcch^`|+^ioAdSz8>}qK8%Ucf_ZvZD@m2)=xNLi|8{%>g#GgMGN_!ltI70AsqAa?
z=&4~HVPCV>z)3x|dFU=jNZ!6Ir082UC9`2bR{?FpCJNWVs&y{O9{cs>`&D?Z8DE#j
z-XwQKF|`yurN818=KoA+scRevkJQu+u%OnJPsCmZ=ID8Y<EMlwlVSP5An~M4&s~dN
zDd+bHJr)4)M9w7%`ikbAj10J<+3#o33@FK+w>FbcN3i@Jx|!z&X6rikkp~gucdlHF
zu@&3w?NxU;(XF6pnZJqU_wz>}xjQw7AQLnAcyY2YOPl?{F0U8$&14+@+zjfUS|^YJ
z9G6gvA4T~@BR2}HDc<*l2Pr*)%<MhdYdZ3vX(Y)hRleQe%L|1J0o#1<1ut~nI_d`T
z9ptqq^e~ai*`O9$h8i}ZaxU9z8<JUHLi5;nk6!uM1VnW?-D%O+?R=u%YH4Bsn`&bC
zc3*55Kd09l>QZ!!d)<VWH69K^5{Mp3q^LXE+7tSjfZPywFDtp{J=bppz)hG{9F7}x
z9?`^7a=o6Wip}R!1q}m>b_iSe7bT&^u8(()R;Nho(t;EO61`f*rOz9UO+;=2Ayr`4
z*)VyDgXZ`}IHHm@ZBCd3_e8>=%2L7Nk401!r6{mm0yqhtl{enX&@jzV%JSM^Y+=XF
z2O!-1q9-8z#sKTCZPRWi8lcJ&KP||`93jSqD@f7d$UckN|7P`kU!`hWiRAI)#BbE{
zfuP)D-5*=FFmvZ#rk-hk{MTW>izwss$Q0+Z(Um6b9KR%~_o$`BR@m=WoiXqFE!!)Y
z;3c~OCFZzlq_e8N5wnZ`swLjC=#9MAWl((59J|0?OcQ{GKQrDsts3v!rY6yzCg%5Q
z5E08gA+}0@15o|&$=OK7LmP`K*|4)wlX*J}FA7(T-{F$bwLX<fGWwvvi%~Jpkpns~
z!K=3D^KH6Qy3eagP#cW)>Od{(k(3@#qCCf|%M~Yy+ILdN#I89}I_6@OZvse2qp72(
zWheHqvZ1nf9!b>QYF)3^f|v#MdKum>=|U~wh_^zD^al)@Wc-i1YZz4X>DAPW0c<b|
zDhOHFD(dqoEwtxiTR1gd#-)wUTE<L+E?|@eb!YS`oa!{(L#I0%JE%OBs<EnJnJ}67
z{X#VxCUOm``i`u{w_Umq>MhDAEMG2%oI~Aan3s73uZ^{E+N>57Uf1j`6f0*IjtXco
zo7|ew<?txPNk@+~I6Er~+KR;7++0{>5S@KLfn=@Cm+zccGM?7H|LgI|f*k&Te3gCR
z86dhckxSDb@TW!&506)k+j|bKrI0i=HR}PriT_o<9fdMIbXw))1+e^3KXBlHtJO9!
zD%)Vb#R>n3Fk+Rwj!df63F?Dz5Y2yXeLk_Obv_b0J!9k_4>bH<Ai4Jr`AD2b)0R7D
z>L%H0=KD~GNe&TO#HGZ^8q_m9FzbTnu=LYbZgI9@*yjtTLlR)mJDJ0yWe5=uS@!Z6
zd;K8lwKgKri+<gF>HgkFnk?d35a?13n+o4mFm{A-i6a30X^gE=*vy%@0o)^GfQo7v
zYC)u$ce>k+n%*k-wo{^2Bf;{rcglg*LYMXm)$<*|U;ADMCnR%U7B{_^%ZC<YmDK(V
zQ`EGK?<^>mQp#75>sd&!D9b=S)#<1ytHi|IWg3+tiL#SJ)~SNxg-2iaM5blICYr|;
zTz2RgKK<YUYZ%+C+dDO^1F8s=$GNspF*fOnC<*wRVnvCh+tX&=h6?^3fJezP`pgr=
zGD*~12S{I+Rs80NfcSAh5NguS=_@jcI?&{aYTLroty^*dN|Wp%=!`%a^7{2_%5{bJ
zw=?W}W+(H=^5^-KJs=Pnw_aQ3FhLhqA*wO=VMB*>cFm{7kp{q&+2s(plN%N6<mDAT
zK0aO#zL{5yjB50&xMtXCX@USXK1O`)jTjUiSEViR1xj7bKSuYXcZ71C(EU@0#E^TG
zAJrv&;>78IfB*~FcMPiyzNDL_WZ>;(bIM2Gcy56R*7iKZku3@-#E$WI4xZ^9{?7w+
z-DIbZj~2O!tnK*g+-Qxeqd85EWH)<mQPNwvBl9!a?2_CUPjYBx7z!1fPz9LG`vGfv
zK}Mf6SZ=QP5{5RJeOk^t2+CgQId`l^L~SlV=h`7ed4>tUnk#m5`1^XlH3m<w=p7>2
z5u=Y4K$r56)wyHzcMx`i!7O{3Ua98W(9NhW4wfQx{{fU9<S3tO@ZTuDgqcisNs5Dd
z_6%XPM`_+n8@@-l^Los58z^)iD^7mHkn^#8mQC^q=YioD=J2Xp>jXQ1G7FLrNT$A=
z%{qU1LD2N>!FWFW87#Tw)2BBXz3~KX1D%~Z%_pIYaE)MjbZo>f4%Pb9{Lk$(ryKnJ
zmC3E)pLCjDc+iDobmM>kPe9Y*EPxy1Xm3J_3HQ1oMmq15O{WiN<xQlh%_z@v?YRY;
z>H_JWUp`LmFhUg@WJo_+#!wX1h2Whg5xS*UIY1e}SJX?hLF6`lP0J|UE?c=4n;_<p
zeqE(&sJtgKXH@CV2+VXC^O1gYo?4y?@jQ<?+{`?(u0Y-3E1LN@ib8t-SI!$bH>-&5
z4JdW$*q8+9FrL7sPB3?Sn9Ya^TYYxEns<&*hMSkG$~5-7)rpSwp>c^@Rt@)t+pE}(
zAX8b-aTDVbxkXzVi2%dP{vMXD)K+IOiD(DyF$PTHnmofng@qbemSjnKIDqI+{~5cC
zt+qPCr0lNZo9W`m!gfkIOB=JfZ!2zXWXPg0>h4BI0^gNmk^ye=>7T8oR18I5HLyVz
zF^@E8o7$(;o-iIpb;jhrYcleVQX5EAcG03eSC&GxZUM`v*vrz$vB4q-2qxP+S_fUa
z?&uQ$U4nt*dVrLfvx{x-`sg5|t939Fm0DAhKw4M1)~U`~I{2Yczmb56>9#@;#U2T1
z*fUEQ9JW8K$g`boqu<0mBvPt@ciY1~9Bim+daD74SAZ?@lw`s6n&_{3SY2$0%^wsy
z2wvW-HPvwkN;2({@h92|m&RFFT|21@?FpF^juEK`62>z~nRtnam?hUXA9NZs8w7%b
ztZd@SoJ@G*W;<Tl*+m_aL_lzn06wQ{jooNxXRfyV!tAIl=@M3i4XBVV$^&RF=I;(q
z3@4mjSybhNg+&lWF#@tK;=B!>x|kJ7tjI?>5f-lpP-e~Zo3_HNsfR%G9_fvGadW2y
zGRtt?)nLmlyM2H(gtG}H)#H`}TU6o4ZA_>n$5ru*!RIvm{+}%ima3SaQy(`fvT>Cd
zLR1-hFNDLS_ll&f&v}*W!)dqtIA_r~o&XlUB9AEtaW61TgxSLm<5s6tM=y)-_XfJu
zEQzaK?X%T*w1RgutXPp@;XvMRx`67XNxGFlO3~3-8Iz(k=);H&JC}F5{6c3EJXr$P
z*yRb;%E6FD$DsYK+ccDm0k68uC7r5KkQ9Qne@>d9gPqenFyb7a=k6Dx9NZt*(T`2+
zzD73)SUSbvUKo0+S6n4|ScJk@Jb-MAgbN)hu0$Eh(M%o^@#BrMd{7XiG#^&apU+Ph
zIqjdD9j$@p2okyMw4k(>nz>8l!&d?Dpcf4l;dT@&`mv=^Ot|f~k#}<XbQgFd9vDE*
zyiMqzf`W&+M#KNN2L^IqjB=faKL7d5J4+Nz(=0P-6&q;{Wtlm}uWX<qX=#+|)e~Oj
z0W7U+`O{RZsm_<xPw+6b-#t`s_~UO9{K8=p(0lF51k4_KGYP$Rg%qoMCvU^<dQaMK
z-q@|7=O(~g>HGa4Rq<o<HXvC6>seA^_B(q2n2>i`ZBv>|hQV$z7MN5&>7}{@8G)!d
z(a>9Z`{K%9;$!nd?)+_2DxPIWJ&fgrF6sHuir2=eR{dbI_1)Zqra7`O)4uTi&hZqb
znUS27SDdVcDKFh`6p37VHvolP`MkD~d=I3V#pr<=Q{?7FbKjjpj6r%6dQa)E4T1&B
zqZgZDNJJawJO3B`tE!AaBMnlTLQO)D>h+OD%(E|A#Mr>Q)|1-oWp84jV=^rE6c!~c
z{qc$kJDE?GJEbxfH*G3ciFhYco&$b0lk$l7O%Hwewg{XK3&3|<yl_SSdINJ^t`%}h
zLfyj+#~8;dRC($zU_NJzrnEngOaE~#PyT6gVbbIeH6BJT&m$T<y>!s@{4{{3@a@lm
z46T1NMk9l3gEuH#1%EN5S4DR&6K+ibo+Kd4o(6+B%+m+#OHLW&Fcj0shn@rmbr5Pq
z0M~r0Uj=&nrLS-<h2>r-Rb<D>NS1PgJ<|Iw0=M)1&SkLcAop(;+JeSVx;VQ){FX9*
z5Dk@k4${mWKC3IP@Hrzv+DE}<SP(Bi8<k?_H=`U33N+>}%HR%Em^)}Z(BWt4-j&E-
z6nk#5AY<XW7{wXjn;em<bf+%$K15CjOk-B&XHnVG_A-VM(xhCD`-F{G#X+*~l)}QS
zBihsQ>Q$g{?@XWK^@x1PXrPsqp(7VD_)=lvkIJ!MvX0uSF`$y1|EICWH`IIC5@juF
zFK$(56juPV71PebecDk8X|*P;rxxPh2iB#(qRPus-R%G^zQH+PcyQSBL6zm_i~kX9
zXcNt_G)19r16rt3cZkXBcWtAyGQk^$@ds`Z=rx^nJh6?($^v&%_ub3H9y1)v^5VdK
z7r3{F{<aS)pckqEL-vfNW$}3~O{EmiVK|;Wb-iL8oagdWj(Y6z680-;5f*#@V6Oxp
zVd^mibBD&B572bTibSl~fr_8!zLTo3ci>9Z4bMdhIUI<ZUC4>&-r3RHipHniTHr+E
zi+JKpnv)HyV0Y!0^q9NN6*2hDEg2hv9cQS{ma)(xL|e`WlQegX*~)-<<>C*8OP9mr
zf?zk~(&_~KXRuCmHqK{nn;?C8A0^}4v#fe;p-#k38v-gdeil1NWUNR)b4n$#CQ#4L
zlvmhm-1c8YAMb9oq4KC#^n^oRm?a!s${(hc@*j6H`SeBo)wKjk7OUWJBw4INW&Y-+
zR&n<Hk<jqXEMCXjk1Ie9w#tL~sFQf;P=^N=>Xyy?n*(H6^rALbruM6P2ec#;?|oTS
z^D4Px8dascP1{=YK*V{med2+N-z;n&`<~`hzmhI^Ba`wbewN5Sh3gY_2t0ekj4;+x
zQb@J{0eTV?a60UpDpil^N;=1N*uXWbkUwv*PZIQS5@fmgy->z3J!{`*<teese#Szq
zj^S<rojJ<u2gF-XNSBsz-VIa>?k5zh(|Fn5(>3Oi$8c-SnVl~INp~NtB6|d8RQGVL
z9IyJt$qAc4L!2rfTeKl`ulaDvhSee5eR}a(S6ZnwV(qog2@0&$o#M8J3H4OwnO)__
zQzL!*c^K4Z=6tktXJp7n%^>K^B1uW2Ky21<8T^p<Xh~)MpTDlYSmmB&&;lt5{yK&7
z;Rr098XIEkNRYmz7AsyZI(CTqa1yqt7Ui+y8+0GHaP90kEwkJ3qT@Aq6`Ql3GR`d_
z7rdZ&e$gJdG%G$!kPF4*8|vz`ufRHH@SJspe3OOU%z3I6v6hHToOZ`KI_j*;;DBR3
z-Sg<&bRnK?Ij9%6n*_3)ITzi_#NUzBe^;zgsSF`zf`V>PF@;_B<h7`XxhX(1!;NaH
z@0{zDFd06_e(Z=oO-2H?nSvlB86IHGBl|erz8U$IOi|okIN2E_ODcrcpoi0XOO#lG
zqq{6|!@Sy`QuBsPp%#)L+=JPX`NA$G3^pUgcm(RM@AvUklcC<dm^nig7UFqa(bsWS
z=afWNT^A`!8S9TR5CC43U%4cw<<JyDgf3|5<jk|FFKa;UOu1dsK&HXXzd7w$Z;F~<
zFcj$nc$NwFfYQGxvsg;VhZs3F6v=Vc+lsK-SX)Q9Xp!6XIMHAw3Ehtfc&lZ#H$((E
ztf&<HoW>Z8-Bw|&$emn8Cm?rnm1N*=Up(ZoA)CxP{^w}_^|}$|y^69_r+!*SQST7S
z?l}v4Q(1GFqx~08Ar`|=%UTHe0Tq586l+@dNJqw_tkrase-O!64U?u>j@9>ExW1Wl
ztbN%`4Fo<nTAH1?pzdFKWcBo`yTH1~&`e5V@vfq}2<>qujkizKO+H7DeFj)9K?~D(
zT3YPG`m(5s+!K%tXJ^xF=1M7TJTs^5f3J{;>!^)*Ux5K)B@p-Wp)K&TH3xsXhx44W
z!RK6<OgkZ;iX7CD^H)9!hoNQ{>b36LtX;Kovce$!ya9uqc;YxHZ&{<)a$hftI{KD#
zD6hkF7Xm<TvAULJ^ZNSz$!`u(SucMo;co^>-~W(zTkW^b7thq0#Nu}d44h*h*W&UD
zjI~^pMS;iKg|%5350$}uaJ4Y%+Bm^xfCp!t{1^S#cesk!XSPQ@dJ+K5oV~hm{V{^W
zEr+KyoZW@{w#bLNPYi0%Xqh^G=5#{{ypa0Kf`TZcx?|K0l0z-FMf|dAmx`z;t%*%d
zN5;JkLEKn}tVr|bxuyYb8rd?YKZ-T)pmUQczxC=0vCPw5BVHlHI|?Lz!w(~J2ID>8
z`Jm?|2l|$(bGUm2B2pgULIp}5q{+r+LF$nMvprhS69aSYP`5wFVDNF=dqW%%nO|6X
z$-{w2FVof`PTFO-x3p_yLg*LGJk_2ay3v$?YH}|N2Yy4`2jvpZi{Jzxv`=?i;U)z@
zYO6RMZQ-JuDJ;NPi2X2MmOG*+_0YW|i$L4M25W0_`E~cnQnwGCCS|y>liPi<F<@r$
zhDLldgwt8MFgMAeyHVn~tLR^()&BPF;K0yOGOQfT1lMPJt1Ty|0eV9VST&zcBzC8x
zik|=mxGw54Z1tntZfzLgE@|&)a^FQUs@bg4(<gF+&!odmkuYDdYq&Sw2fU2Tnm>Ko
z#x#3iX+&>|%uG|XFOa7_^zR^jD4Iwak~zD&hB;U^^r>UIR<v$FZtw|5rzxWLg6HR=
zg@7xLOZ*k8_8`;)=J$c%I?AWS$2NJ&OR%&wyd$<3>6bCqWhr(SxHYZyi!-sH=64gc
zzXC>WZq+SY$A*-_m?vO7;{d4v0t|H6=RHG@X#uX>M*?bV=_M(ec!4%cb~`^~$SDV!
z;;`z;#vq$8Z_s*`IFchnTab|?lqqdAMrF>btMn$zL}kJT-+<${OJ)ScKHu4{4%U^l
z?ML(vSH5oDVd@p~Orb6L=QE%fM^Ln7@;<cj=7&{x%{GE`e*lb%cFAN1q*%;emi71T
z;`}ujq&Lp-8)O`0Iz4$xJl=8*y`&awHCbSpGrAs~7}XdqHnRk@c#7XiyMprRTV=QQ
z|6aIo+|24V-44q?5x`HJ*GTU%o@kS8^q_m@a1_gt+mPx`_H+cPd_>F$eC-RmurwN{
zY)EY1Gbjj)^0bV$7$>??-|B*9YlIYXIqpBg<Fva4u!(=t>EnYS_ROr?c<tRwP{v@R
zR&t@@E}?Vse2T1`zl5CQLuK!})y{e9se(jkzNc=(`!fc9hYcd^1xhIc9fRvZLkKdv
z<@R|Jv2bH2u`~(Psm>mWm~+McQb6suFvQ;5R2ElmQa4rjeNl)=f7_kMVTeAZroT1R
ztyp64{$au{1(d|eAAgt%cFb#0Q;0?31v^qWEakrOn~(_!7EBb85n3yeu*=SG^P!ok
zB~@XYFEjhPuC&tEi$WEV*mna!9r;t`E_k!oduqH7>HY+{^SdsOs>XMh=`o9Wu>snr
z81FY%-JUe(Iv?OgMSfmI&LCOL>94MuNEVBZPV)8j&0Mm{L*6x_XA8|+(X%NtkutbG
zer|1@{qoom8=bE7g_ALZxt-cR11rY*V2sfBu%s;%wj9G5H*VZ`f)wL=0xEwdp3l%K
zNHWPGE{ZiA8^cdGS_$xc%dA+%8j6+yNK9ed7N?=$=p!E}?mQQ|Da>+4mIx5n;?FQU
zr(inCqjDD`1-CF&<NdwYmylq`J9uk*d)j86G<)~>t(??!74hev2cDs~vvGdTc*X7<
zi2u!QF8(Gmv8nAa(jf|C?fyfBGh%pozcPj#46rD9iYu?@m!gGvcXY^LCx2UUKW2mw
znp`GEQk{qHU|kKFKRs8jt|NDPN-KUoi)L&uXOPf8GoYhqUUW$&Ehyf!Em&*-)f)P-
z$U=nG3kHsk|6Ipds(tKu!C^jEgIJ*SS{lJjEG734|8#RVTvVRV-SU=KaJK~5c-4M8
zTsRKppBuA_O$12fDrTO#WvB+s=L~mB_Y0%Krba3S5a!AAi9KCToYvC6)Irit$`h5=
z{O{qaoHiMh1m(+@-TY{DQbk2YCU}!)-`~k-X#(4HYh5RWI8EJ0IxCF%Zq|u>x#;Q1
zq_xXj`i8sv%n-4YlMw4JWc4gJ_kocoM}`?YNdq&pi=?9_cp}pREx$_nV1}H}1RkZ!
z3JkCHJmuH(c%IrHxN<*H2KyOHp<1E>e**Gj$x6&&RCC;zxC_UR(gs!uBkv*k&}RPn
z12Nw7u4v2v;4(G4&TQrnNSHA#ShEXaBucSKH^!FGQ~x8ydpk3Q+9c7(3DuA%$Xvtu
z6mc5-k@{LA6xX37a=R}pw4{-IuKht*;X21zpCVhe29RErWw(3DxP;b7c6k`~kyiM$
zZ2ehO@!0<Xh2Dn!({P3Uf}>Fnh4c5cd$2p99)XF{*o7$PU6*k|zBWIw?v>#U_*wo`
zkD)aefsya9I>_YyX54+l08d;y%R|j7*%mSCmHX7uvj!JnzW*3+#F>@d9mX7#&}U9C
z9W)W9835Iw3#?;qZ|OG~=I9u5ix^qFJHKy7)w)8<YrzAvC<f)*<B4T4*U#))fnQiv
zdIq6{`l{EYx6tfnoR5B*O1irSh1LGnB>|`au>vHd_xH=YH!66SUk}T1*A85&C+IC4
z!YP#;{ofZACnYse=EbX#)`k=|H_oIK(l_XmXT#o8p3BY4mP*hDDL8U_93QRS7ugFH
zO_!eQ_q(m)iQ@{ys6v=_t$0u{+$f8|5DzHLBd~|AOyA0vomKW*8z4Xve+O8h{M1X4
zUViWE;BG5U46-hzzyTyHm)Set)1EmEV$u8i#V&+w#3Zlx4M-wYw(nlSAY!%cv#BB~
zI&!Tg+fn;83<T9&VNM53d3^JDXt!62J-e>X;{$b3htMb#1_ubY7Try&XOYLlfs}1A
z0Q?Ch;kp`P@w)$c3;P#m-M>K`wy80drs-#?RoWq9d7#p=vi`&JRK3Aq3%5ymdV2co
z-OG1F%jlO3;4`yfC|SR{!j+#M$Zm%-4L!LYcETCBiluOlqWG)qvu~F9wNW|b-3PGb
zglZl^fa3cRCf{`w>R#1=5`?H-{%Q5;V9UA}w}D;FI(gGf15A$J&v~gto28WamgK;4
zuI1l{s(l9D`^UGg%eWPiS%#Rn;?MX6&|T`le5%R;IcttaVsDq2rSI_3N*rk$*-`4N
zsc(cUl94$J>$@$yyyW3aex(<%t4zayc3P#9c`LPy(ewVeoQ>fv*i~n(%1+yPnC0=s
zs5^bHraevsvP{z%o6Os!`#T+8fZdtz$g<IlfyhsfF4lx5K8d6yo=fG*y!kV*T>WS-
zT28}UYAn&wUJsnK;!PZmwL@>uc5D8p&JE?W1M#tgXN&|JSR^od;0)pxD08HImrAVy
z<AQeoX3s@EXyC=kokSnh|30D6&A9)D|1jgD=?|$nUsya#pMu1)8rE^;ozMG^at<-t
zm0sHp8%wPbdIQ@Ag+XkK9T&_X0vetC(DzaOIBwCMk0JI1y!Mqk9wl-1htjP7n@SQ~
z%A-XOH9ca)e)R=|M70!!(z&<;G>T=}&ISlpeJCRoL^JFf+w(0Gf#8O-a)OR-;kVph
zi5$vbtk0fj-=yF*d&xY9gL<avM^-_-yM+CN$h<i@aR*N3LfmkQbwiuwgAiB)G&@H>
zlaX{q#xZN9u=f6>C73C&rHV<$3ngCgf9ReN1;w&z;y{<n{H&|n%=mzD>v&80Q5dHQ
zBfUR0*JFrqCG8kXST%EkB_zNNBg711Tu9U`f(jm!;zgE4s~`M*w*e)rz*eaNV()k%
zp#Qv&c2&{a&VOi|CciMLGl)%$^)(d9_}MPje5|j-gBUx)r<>Fi^AF_4f@4uxO7Q|t
z#kqMgLJ*An4pR%xNCKxMxk3Y?P?5ijyyM@yUg$$v=^`s~If!F{U13&S7n!bAh)mD<
zC?q`+(7TV{#2fH~KIxSpit@RStl$Mr;1b=T*Rn`=JV*yL_T+Wvx1+-yWhJ{*J}M|J
zXxl=C()VI1f7`qJ)`shsp%fqeTM+FwHSFc5qy)rRfB4<NUHS<p6G8vW2lK7`*qfn>
zlL)!=0Z+~HS~PVnF*e8s)AZgOJ4omM!>PvKO)iNZ@kzx;WytPX`@1Q?GkjNxRVc4G
zAJ*!cVD$s{*>_1IBuG)63uBqK4vWYrmslI5ua|xLdFL$MMM1mqdFt@tYF;l}Rd^op
zVX^?jC%mZ@2Mz7lyIF_FA9Qk-ES&#w#J3!jZaj|$O|_np=P{SibDf~nFgDN|VnKTg
z-?Fx!xXsZ;7p|#DT3pLOi-!;g6QqmQ*trvEFWrK#*yf#CDXnAAL1wVX?E2c4=RA7n
zG9;5W#8l+`G&E08&_ZwTI#vSf+?j8_GO=uC16n4!|E3oy{mn)(gZw%O_0c(brMg)#
zMO)F{F}!z>bmZ(ZPuueQ$Eh{{X4b<#522Xev0Il7=Gqys{$yxKEQ`}4(9S-kX^+EN
znhj!}at7>w-(>(^4MRY$>a^XYRAddxf`X@;UrDd7d+%t@(+zjC*o|Ms?{Hx%uGDVN
zpl(<R=RP}lZr)`nTVLKrL@?F5fcK>%qXNRMn>TgCAOePam$AXIn5*M3ZjR6r(4K5Y
z9}5;-FcbQc0fEP3qRrWLY$qRE@wf73-kFo+T}tgdse{GZa-<)PP3*a%xp94%nS-4R
zvfIJk?jrm%=(rEz>ED368DFWI6;kXxJGJlm9HCe$I~h&EYj)HzpnaTDjGk?G{*a^2
zqtx*u#oo?KS<^|E%JKxUHFi`Ac=O3ZLT<Lzy^}s4>nT($fIo+O+y=l+{<>IxVuM_M
z`Z9c!JrkH#`)|Sv;Bx(F4E8Y1S{}I-IDl*nJSo}7lBL2^ZbG}FcD<aXjJ4(SXEgQ|
zETClrk?d+feH&rIQYT-pC62m<kLQEBL&Un~)0p)Uo@|ygd{0-pPjQaw3L(~`*1WP8
zLf%HEA1a!47@kE&lSiMq3HQ+*fz-4sMI^xZ_5fBn41|Ef-E|*r@2dGNfcxpVR%0$<
zN;SrJur)VKZ2*x{EdH>nR2skiPG{hE-OG9T@+fZ;Sw^k0Jy7r+Oh7VcT+PqTJ;56w
z#$+-La_8p6hgNBoDY*{@K@g<MGwg;*c+V3!_oSD#Fe@uOJM$;<jOCQUR{tC#oZfEE
zmsmsvc4pDRRm=LujW2b~V6ejPchx`DV)66x805Gl$O-Ye>B@oe#)$LB%s`n8I~W|l
z(S>EmfE9P<!!xzvf-YZ|+D)95m<;XTOJgvL>~6<&svk<R2v{Y4oL9|GNU3XQDQCFU
zg2B*nK8Cvi>;m0-nI{Wg0Z%gj#2w2^>`*=BDGH9(UxR9!p9nR64CiQBg(=(~yhE(x
z+=5o~Y`^QI(=-^wF)789?_^P(AH33dD!MJqd!jvi5Awwg+20bayYuw3_TgJyx?x9}
zJLt3Cb!|@){5iiAsr${|_HTjVW?kIjs8eCi9w;%MQFF3}6q=K*@E2URKlP+LX!0?y
zwmM~PoHWC-41s+y6evH0IY|Fd4VLFFa`~G}?wIi4STfQI)%?^mHpJI!CMc=%kRJ`6
zYZ~Oue$*#LI)4@Psh^}UN!68Y3B)$L%Th(<dE0+#K?dRn0~VX$gVI3(bU;^qLdC^m
z@+5SElI6E05rt^paj?6N5^F%D`^vOWzuvp#xJ%qn?o3YE?=bk52&Y>@4f;Uy`|vz!
z4<euUGEAstkm^sxeg$O0wO_4{U-lMP2jadb_znT&GLgzaO=_Lb2&R!ge=JYzUhB?$
zs^*Tka)5kTUytc{Dp*E(CJn+QdhXM!E*OIgF!2*^gbVob#1RoIbIl67?@b?p+7j}H
zATEV!(qs3ntT>_D^XZQ=iYI6PRr2lQw-&~f8%cy2)i{&3**usxPrIVm#mSRnxcfsF
z;q?eo0L_OvHGoGXqJQe{MIJLkXg;KWzciSO<1`Nx3+RYvqj26yNh1Za+YVXk$@yF+
z)Fg6V><^L$ThDi@R$^_Am$Q3K#=}X<n3)cOv~%1mFkz>wo_+}P=-4q#$#uzoM+9p5
z%Uc|ptZi-a<h8T$8O#*ZI^1#6ALF9uE+NuD9DgOWAUMCF$o@u2%N@s(<{HDbW89m)
zp5Om_K>8vKUvgwC!|d^Zu`J=Lg`9-fwl>WctH(B3Jax1e1<)kYWR8^^v_u$af!`+y
z>Kw#LdzR`z#z>jR*q4=dH^F3asaX`v|5<=T1j;-Vx+tiPmqlFQ6ECkBF`Q<TOw6;8
z!6Y|)HETxu_3eOKn0s(Yhw@D8=CBEE<8xxCXEQni<Cmb1b%x2WkfS`#CYb1|nx)vK
zSfi@*oaJ%F)eF3`D!kqC=dRq~S!WxQq*Rs(6DFw-l@neyV7-!e#IJG58hqV$Oss2y
zA$FU6wtu8fTBWYZaAZuL-S2Sn{{9>$I<q9p)>X@qNRn|{{6Q_6n5yFj?JV(fpwuW5
z(Tb7rGrD%6vN=fX&rT<J_{qp(2&#j95BIhL8=w<0J)x{|L8Iw^|BMmP-%*>VuXl|2
z$Q{1h6mf^ajt_~kMT(Qjou)oH`;52T9Cq5C?Vh*Mj--mo8<Mu_L;5Xe>)s<^`HraI
zy6GCwpSc8568f6R&fZdHpbM%>i<`*d!_Qz`hR3yWeUww#`}dk|Bb};VxD%t!&M8)s
z7;Y*)sJGLUbe`q!Rd#d@onY|$7j#9bu$>g!&Eav9=CBb*ehZP1HSH8eaw<zvob2wt
z_B{8~&%}e!Zx_6iK!BbE@!<qMsmD3NGk&9sA6J(>)YGI7r(zY*N{MY-+XB+AyatqS
z*TNfSJ)D1XRAbf-Q_*0xf{S}3wLkpRb<*N5Rl_yz&|^Bp^s#xTQb1kBk$bJ2&uwAe
zgOisSz%sNL!tWb}BR8+?Siv3KOOFWLz0lu8U<f+%2jo}WPGC!FsO5ex7hiS5Y?Zgl
zp;Ag>-VM3NwfP>fA-(9ufqa{Jh=ZBoD|mpoxQ(z5De)&XAX-F`chObg<{${Fr)2i=
z;SowqVVkJftleS78R$Aj7SZu9P=@+m&t_%(_v*$f4t}<-R}&g{#1jP7^H`fCOV2PS
z10HD>Xfs52dB=tf2CeS7{M|G%UgYNPuOgqU6P+gb*kNKmw_uWpSVSZIH)ItO8-NXl
z4sLh|_}~^?nMN7YTnl(PaJojbtPNO_4ZvP4h*1Hm&K>qHMz30M-EGkACeqcKnGfj7
zyMKyn{X38CjCi5K+}FFijfr2p1!g5KWLOz>cgn9VrGo}^gtF>#M9Wu#vA4l5JUoqc
z;C$Rv{S}e8BR@V2aW5TID9=)t+KOi;+)}}sS)AvB-E^YCp@|i|f6)<bA-lYIIyKRm
z019PT?w2rN!zG^mZ#k2x8f?$95s7CeQtH&>V3x+h*;%saVd$dEhwiAIj!^N(wVneU
zUg6q9qr}Ectgcjh>*cMu#D1nyccd42h~Slr8dl`tzC<vA><(DK$NIW%Q{B{;BdpBo
zaDJ25crd_muG^G<nz5s8i`9s#GYW8MiV$e47r!K`_c=^=eXR>1KDif%-VWW|^IE%|
zFwOZLG#({u8AfvUv7*~%87M+4HFL2d_Xhkkiv|!#hO8V^ItCebvwd$7Pc_K1r({s*
zA4itHJp@IG`57qvw$<ogthz48AMJyk(Ev2>l(^Y2cz5xnj=+A@bu~c!p8sR@d5!L6
z^wJ&9d+)x(r=J5VoWDsf;B7B!AenjmpmYQE*Jifg**~_n@&&^<5CUnhy9ymRGK@If
z|1=qJxU+QUL=?sC2l!I!ShsB!Oo$^vsfxUEu;Yu@ZUrc2T^IEK9V*cO$L%0q(dzQ#
ziz@Eg$;wtN@k48v`SN8L;yh}k{Rb3`Z0Mb(ft=HLH`uYXp>0dsTpEW94ZY6CVj1Jo
zXTF_dx&;;a{{KLd{bfl2E1XJS%`%M~#~w{YzzPZ-fU}M_KbK<+hOYcSAE>`e#yTq@
z6pW}N+a~@4&q792?25-gpw<WF*c3O08<X&8w^S?A$H3uTQ*8a<M>@un%P3GCZ(Rps
zkX{ykIPyqo7y6^LqnD!7wL51)<c7HL*(Ub;%M@vq4V{8PUIq1r^@V3~WGI}H5XWQ$
zSmQ(9FXYOl;z8Fz&;#Q10Kkf`VUOu{S=iX~aKo&#nHUcw#J(RfAhvRG?+ynWGiChP
zr#XI9FKj|ux;n;o0ey&@`0Kj;a9Mi5ayPpRRJI|vONNl<=*K*oD;yBY3HjPJsD=}(
zJcU6<@c%zFf+!MJ6I**20|AJ5lX3p%tvb0WGLulFEfg9jtE`d|aHDb{?fzZDe+qU8
zJZm|HX|Ow87QEIJW`~v0iCEzG>8nBrH{bz^7yL-eW0#;QL?tyuK$Tm|y7DwoKHKsf
zd)^B}QPnlQ$iUM9=~2i~%r&UuFaHO6>8}Ga2>*5!Q@ZONtOE!)s@qHdz?c})E6@vc
zzzgVuWwO37c5%(tLGFL`6z-*`7B4`|Sd{Z#=$MyZOM|V`#%@2tr4J*Vf+(P>kH{gd
zBwtok(x?oo_RvanMBR3Sja66UI(jduBU4alc@HU<3qo58;X)fRpn}JL%G*8A)Uri0
z_`LbIa63BX!+*1Zz;zgEjIZvCh^n<0&T~m?)jY6DO38?7id%sO6yvCI9Y}&jXeG2#
z8O(2fMRsq+9+(78UF`*CS5)kdl^BI`qadA?%4vWFkqr#+<Y7#zc=E?@*zkkqSy{S*
z^6~nauK4#)$8<-4!1vy1p*!@`arkVV_2kldNP4We6S5&dm>LL*<P}~Im9SeK!~B1H
zCd1h*yEPFBi{h@AwBEV|u>Jhc3J;}tbmd$7-0T?4{0q4Qh~E;q!;3QJTRAC;^n+qD
zEYkRk4BfOoMa9Jh#AZeDX+RtS=*=&iC(ew@AuhqZa3Ocd>dE}^Z(gOG6d4yLO+=B`
z0w_%b;FhCl{Xww{hy+Dd9}F6WYF;9^%?c`>xY`E*Rg6RW)Wsi<&FhK)#CC&FLfOgs
z*%Kkru=r>YM`J~85WZEy>1j6%uC$%}DDd;6C>92+<h~lV4e2f5`gp1CN0xKw`NM$G
zj9RY(brZ_&!7|z%^ngQeE91WyN;~=*l6^HxoCjM^13&6|07FNzC0dz^b|9V%gzk={
zatxZZ+Vu#o&dz^KFS4XfMaYl==uEKkxg2E-KWG{qplSYqR5Vrzi>Q_!oZB}LpSX_2
z&4`<&1o$J9L=pxp;29A6L%+kDqSV28+?u2#`qKXA`5?sLf~aBs-JJn7F!57xxt=}w
zZ#D(r0hk;EfO3|qJYn)bDX})73<Cb4_J@@Z9ZS2xrpPqa>r0%<U610wKoRtXl5nqn
zj=#ORy{z+P><a4K>)7c~@L{XEeS`4ueC@IKLh0Hv6sqwD@NWSZs=#CFNKyQ5WY3+f
zlHc5}F##H~&k^PG_PY1{9(>>LIk<Co4xD267nNeq5H3Wb)ektdCyRuU8zLIvZvijK
zaJ6@T0GX~d2f~zHa<1Qh6(96nRi6HrX9pE$hY!-i*CPzf0TN+D<Z)HI9DWFF3Do9*
zjW<?5u;*^P$Wlt6^F=uv9hoZ9D&dmNbHNUVA0g``PcwB27UudMZqp-YE$>gft2v-Y
z?gA~FcR(4iZx28Q>G|^s``6P~6+E^mCue8oE|xuv;`())WEm-42rG7d=$qXt#+kvV
zzjj6I|6?>vTpwVW9K~cemEIX4fQIMt99?7~=lswxt#giq3AH+7zNpd|1#fxYHMMMY
z4EY-ZfEkst<=5E9hniMhVS9L8V33W%Nw9f|$QhbYnUy$Fz#7!oC5ho8<8IKg38mh%
zYS{e$m2tn~4|R4DSYwM8Jv3z6@}Pilc6gaO2WiZKaA@+LfGVI{FNXS7*5kiD6>|wz
z%^Ae^U#WcL&aeVZ3wYhVqK7Nm$La+E1P1e`e<D`Ygl3IypYD1NWy*pdvK<aV<*g6p
z`3T>l)NS)XifjhdH05WF20cZsL50cuTQ%)Y>G#LUdt?~{OYaQWM>Wd>y$e;=zM}YQ
zfbW}9Z5xkUw(9<`D!MUcY={>ftjhfvIJj@p%Hd+c(+0>_@z_7K)L@)gy^<5F3fyQS
zcyk%tK$3vh<WBs2YCop<5YmJ<!0h}|5J!!vWABD4+Q}jc(d<yC%a_8PwDtaS_yhs;
zqYQD_%Od;${W%YUW%i#5-jMaa3g#QhL4y>rz=RS^T*`K2&5nP)eoi4VsR@qImxRnA
zA^qee_8!ZY1`TSnT$ht=(Q?N}>iN&Q=pPau86rKVN!dSm2vTVuXw0fIPL0mg%E8Rw
z4^X#m?L5-@>CQlO{>P_2y_H2^d~&2~474z?r7-WQ{+KuvR4^o)L->FpWI*0j*ZRj6
z(}g$rksY!Mq7O0xG?{i$)2FNxUT4OTHowZwZWtW2@uHO=1%65!Jxu-sES|{xGeiW>
z{}5~(K3Ej5@p{w7{;h2Q6McQ5iI9l3kjefQfP!Ur>_4jST%sSx3<aP7c+vHuq`bzg
z_SX;adDz1~$k(xj)rd<c$Y7tek6Nt^8k*nt`f7OxpKgE!qx?He4b#zjw@a>ue%OYF
z=mhJB=&V2j!g`!tVLhJ8gC*a)6q_uPUp8n^k!7^i8DiN0%Bj_IQm+*Dw}$V;y1xH!
zeeoWS`P3irWiyLyvVC4Q2w2ntI@o}yGZ1D%EIv!3cAODJjy`OZ`a9rcGmBQ=k8{8!
zJ>dW25bU|FbvBvUhSPnvuq3yg(mnCt-i0TtpV5c49+84B*%)0b+5p(FhHBp&2DZL)
zR1WD(<^G|oEo3UK>|-?CpLJDq{|c;*2<E<WViJi1+>W-r`ie#n>Hix@(8`fxQ~EXU
zX+kE&&N=mfHA15NbmJBA;NF85qj2(u1c<vlK(ta`lN|viUGcSc2CRzNDF;xB3O~jv
z#@<1%-+r>gB_C!`7v7k|Yj!%U$V~rTOGpkKDwu-k08Sgm4*%LL56nR=@d}{DdN1jG
z4jWV`B51(F-(jHusNyOn`2fm}{~r$aG8)@TKNMT@G%roAU^>>Y(@N#PJWz77q6@vk
zUt|wD8k}-PJ}y8{H3rI-*}KGZ^sQ9?c&w;af*v0M<fF^I(!A@B<;$H~8vqi$uWO|>
zG5Z5o-KF3?((IsFqYhO<`kW7AUxMJklL_xu;OC#Gg<(LY{FuqxyE&>fL1zR)#Al@z
zm1L*3=BfnZUrNcVaG|FJnb3G7`@($Y`wF<Vt!yg*2t^5M1aIczu95M9mRaEhIgncQ
zm;#QhKlW2u{_ht}T$tjF4PH(33<Ut>-@HqJ%a#I+FUMpKrWlZ6NtT;>?C>wIA&v-(
zKRHL3=HX=&t)U=Tras6UBaf|oIpZgA<BF6ih*|{szs$K-{x89{T*vFfDU2{V4?~Re
zI`F48|Io|)0xgv<GSt=fW5OAJRjd8~wRhb?O`zL8SgyOMfFe~4qARE<V5JGDEU=<M
zK_MmtB29!4iWrd=SPLjfSeGirC?FsqL`o>3#1#QSkeZ-W0f9gWJ%9-z?@PSbeRJ=d
zH}n2~GtS_QA%5k2=R4<ozw`V3$b&`y`>wx%1poh!q6PW?75a}w@U8vfUtK^}=Q9cl
zPGLfn^A^ZRQ7Pd%mZR~*Bq8Nzw%G)W-kn20q$`Rg{z{JjPT~Ms|J7rG)EAQ(jj-oW
z{6{=%n)+^L9Mlf+I4UT-XNw+3;4MGcfK2M>erd~XIAPc%Xq-#1AktXD1ilZg33OU@
z0&=oMbg1v=W$#}4Chy*VE5$#!{g4#OR-M&C+H2Vm@8ux;Q;~4fP7Ddhpjq<M{*8$P
zC>25kqQ~%qF9AyaVu(!7c*h)56QhCR{2L9-S^icE2?uMgGbZu!CI5pGCVszx71PvQ
zbPDJ6BDxFNP;|@)jq6RQUC5w1&(G{iKg!O~vL>e52}5a9^uW)?ZEgkrTQV9)6cUCO
zw&6xr*SeQmvh`KZ=<ZTg&B@HnEGa38PfSW$u(Nc<QcF*IFfnX5%wQIVJv-ykj|(dR
zocir*DmT*6_;34S>t#1P;i98IDW#ZCL9Pt4i)1C#Zr>fAsry*xR=^it4rmv)nhpAQ
z5x(H+KE9ciLazYQ<0K1VS813uM4@sTsqZNT?S|!(UQAFKG*5?(<>!E^f(10DVZ4J)
zfitbb=dZAb+%&*4>a0!UR`Mr{55B>PmD(1Eu1??xlzOxEII-GVjD{AAv{T9*p{Z`K
zX}&QZ&zs0OMbn?Fyu6Y5*3GG4XfWL`CV0!9C9L|-bq>GOpr?*G?0C4Dp)dGO#u48E
z$p4ZpPJ85&iAAMW-ia8t9tNFHoeQWJ?4s0+n}I%qF!?a|J{L8x1R&vz+HPnxqLQY%
zuOKA#>ph<-6w1A@+9QeM^>`#NZg)3BG{v%78t-?UTsZqR9^dvg$c?js^(?uPQVew*
zpFv_wW)X7NLbx)pa;x7w^|I`w55;6cp*^CEVeYD?*2#mX6sZ+fyZyFv2h-Wi;sb@+
zvi#%S0tZ0eNFQ`F8E0iE_un<WzavLbEz#51)3XJ`o?<ffN`2D@tKSznaEr^QgOnRi
z*6W)Cy%trGf`GHrWBcobpvSZXvqOIrt`Ick`+?XJB_w*IUsu>MXlB8|U=hm2LCgE+
zqm#klgTXr!L1s1DehdDYp|G|hq}-M)AYp}2h<7WN@_pAN-(VLi7BkgF=6kwqYrxy6
zI9e^c6X)YMRXk~7Oj?I(oyD$EIv?G-lIz|V9qr7?qu7g7tZyB`)G>y~gRDP!{z=FM
zOxZ$3DN{$cuC?0S2DfzU)M-hmd3qfEhH7qJuPxsQB+XbTY&m#+NfMRO(-V)#C)d&~
zMxe#zQ+LjWw9@?O<K=7`m5SZ~WcZ>V=*riuTtg^C`}7UCs??U*Jld7M@=R0!{9sad
zc4t`5qu$rYhf;lN8Z##fiuhr|8R4k4B_N@vFR*w$OEVH*maf80iVD{0XtBpFVEH0j
zoK}{)*ATP}z=^AqnUm$SZZC2SFdXp|(MBP1{sVfG5-(|DFoV`IU?TzWH6gE?KF@My
zMv)lzJgmEeAkzSY*qk}GHBv6J_77c;EAZJBA=H?Tckt7~U)epKAuRhe6J<hgYHG5C
z#t8B2X$?IFN*K09G0NT)*Zd{JMZT6jrAHrU6cVCq#&btx6{@u-frb*ees`$JFAY7=
z_V&5Sc&h+E+g-Pb@xf}{mT1jnmm>rUUqs2r?9~k!cKMSu<?Q}y?L}x`+=0vz&fxkt
zoYw_-SBH()P|ViY6eJ}-9nx<*vqeGU2_+?rB>Ot4kcs~aPM)h+u!pyMj6zZYl40#R
z^;^9emAdBTlX(SAe<A&-K{|)e;<$vTbAwNhUkykIx>^XmTeY?JOyf_v4({k1@hkdu
z6)TpjCNYu}n6qA+u2tJs78JvF%_pn2cw)(fZ78mPG}mio5Z68v$Tb>KY;Xh4r0@|f
zdO!ikWQyuMQQI~T&dS+wNj(vD>)`Zxj}+;=Ih^=?_IhRw>*CD>hfsHqJDZ%hWBJQK
z<}aT_6z!rEdpsuvC7#)$Sl%n<K7~vr&Vv(pRMZuoDJ_zmVL5YWFNYF#>MGiz=@F*>
zNriSOFFlAtx>F>^@Z4)}6>bVT=NT;O3-W$T3hOzKC|uQuHC_?PI^`;Hk+HJ3#2Z#|
zQV`6mDRmrGUvmJ;Pk=dl7GU(o+eas<px+p_TV=mxNH|&Bxp2g<UCyr7X%3;<OtcGa
zj}^|aQSEYumRwSKWWa9qc99R!{XpYA0Y1bJVPfJLR9$p?-7U0{it&N(mUlrb#ilM@
z^B~s{`FOiOsyRC0d)wfOh_~iO$&i04w|5m?hx989f@o=NkEYe{txq_27YA2b3oW-Y
zN|jNd#&qHq4S;^5|H7QVSBC;R<cWnU9)CJ8pBz_Q`Vo)i>;a-GAkC>$8gP0w6MiLv
zVw1WgzaJ~(w8E3}7u?o`zd}DzFuV>!DGi7R+(6?U07T>?!0F{paGQF5Zi8_Pz7$$X
z5liS&7*0-z-Ns}qqgmvPj)A37yu5#(uMRMv$F&YNlw%f1O)Wd=H=zqHx`B%mcX|Y|
z))A&ruvL`1$I5u;ujPJMjXo)y*oL|XbbmBDv%_Mk+?%!im8s>jJ+Fh>_(y?n1`vp-
zV^s^sCYKaz4TEdT4o&2NyZdCU@sv(%Wq3E`J!vKx_T7m^;JB9oOL@JMV72R?XI$x7
z0J`eVk)>6mW+eXr(N-e+m`YG}{!VwJ_$7dU4V_mhNYP|F*suf4p-I$XVg%cke#vVk
zqtLpgKHFLtnoF#m&KnBNPyMNEYgjAEK)4R*Yow=9sR9h9D+`)T(Q-{@0vIG%<i|UK
zmiAKQX}wEXytDF#Cbg4>!G->9?=pJ-QCr5#L-z+f`E;)Gm6g8Ol8@z+Q~~9@ViI>D
zGxhr!m0g&gZR`V~dkLtlqGMW-{3oq>kj|acrvecg9YOm^ll6Li33EkOPr3f7BA0vI
z7*l7$V4pbn)76=y_R>BlUJO*_-xoaL30q+tm%8Qr8Cj{w!SJJ3?KRx7SYeMrh{}j?
zZALhM!=QH85PRm{hpYB{Q((U~0?Ri#At(Cy%QFkCr2wf6QVZyV@SSk^Q&uH`N3au2
z)<ky&$g5XupFb!X{h~wKZ>rQK)S_a;p>Bq69JtWs!c&L+CoFU;91(^Rv~f_d0<w;2
zr)s8oU%%fQ$1|Z`v|L$tFG?gi?{%*)3tRr-rkh^#5+zIkl=&KvbFYGAuvcV!%g=k>
zA4{>3RwMM*6}L>PRRzVBf-H{EH~6T*O|2!miyk02Yx4XMli7%{H@VT<qbwvAE^UpR
zi3~$)Y@2z&69#XnqAY}x$pTRLShNWps%{eLy3D=6b-AR(jl%K<?KIX*wE5viRmEcZ
zd~1Kv74bZf$&k(`ftL{O!o5^Sv2&3f;)se6a3al0rw_^h9qdQTE8VQ9Z(3s|PTby^
zZd30UYrG5@E2C!lu&|EklzchWt()4+alh^wu#;|qxpd9E|HYh>w8g|Z?7BSQM>1HM
zLCY_awBl12$F1pY()**SI1t`Wbal5yLzBqlxfw<73BTX3I2_09oMsun`YxmNmx#9i
z6wMf@PJ!!i05j=Xn0?zITMiz^@L8A>D^IMwswviKA<VdmZ@cRVxXJ5+b-ufpt<v7k
zVlM-~|5n?;1G%xbfunPsEO_H?8$KbXzcJ3;)OAp#&a~KSsN8Mn#ssR$T%F$8ZgeDd
zIMdHCgDITK;9X#gTV2Nb?Ov1C1|JbG-<N5Sdr|I3C68$O9uqqkybg(q>%*13>aqAj
zA4o9rG&%S%ObN(O0dG?cr;{1`VcHKt83mfwTt0PVvNX4Q4s_{_wMVAsMO$3~_7&mN
z-H}x)2!`+uNtF|j!CFD6ZV;CYWp~>F2c+9F-XZPn`F%2JeUEVy8Q1RI8c@!`l(pum
zuH;MVr2n+obq~%BN4_)`is(82bz$GLPCw-$Mcx8@H$v06D|77_IpFfHldJ9{j(2W9
z?VYLttdr=mcCW_<%QAe^TJ?&NCfwQa(`8rfb6l|12(T^N-m6+L^h1z-Wid35*g<>y
z4<HBL;jserCE%#KJqD{o)S!0>{@CLoa-*WC;}q{kntl24m!jC}dIQbC2*?u&ubSkz
zfRM2!ImxAer`(oU+1}cP6&wPS<6gaymx2H2r*}(^!X8Q)dfw*C;)q)<r6WweM*b0_
z<xE~#q;E6ff52zgrrWXmFS=v9jGJahL^WEU!DlOhwnBmR_{fO6a+n=ldY_}Y!ey2;
zhW!=n3yDej0ELsunKkOrOnm(|N!2w0v>P0V1=c;ilSe)KtAWO)Dln@(jP*m@^k~b_
z-mJ~usdaDBCf0L6w_>c_0z^{+`YGC~ycX;R$d<x^b&<h2A#xX%#9^ZTaF%BpirmUp
zGk73f%mkT@udGPMi)HFw$5UPq#ZK0|2BhtyZ$(F|j6uuynDw!REb4Hl&|Kgi_JlWB
zk>BY_WK_N+^d^MpDeC6k({4kHk9Y5Zb-kGc2hbkzcqJvsVkvhB=IDBQ85E_>@&@;~
zc5Q0sNj1z$xgD4+3w$JO;B8_nc2hD|#f+b0qFCs(e?AFZ2?edZz)E%kRrdLz_LrEI
zcb=i%(o7_{4!qy`LUIQ7EdT;x&=w@3#${bjdN434LE;UjniIRDRz5T7=v&!@>9i!H
zh)Q_uWJweEyKRY68waly!k5!P3$C-Uw6xnda&Cx++6QFxh-j5fj||gbO+7u*>xNGI
zMFiY1=j@Q0VI`E;9;xbF6`xt-YM9lOPS-_3U%bfbZxBFs35v)F6Q2N)mB){Zoi*!T
z(0JK3G8ZBDCHvheyYFOtodsF75}%r8Q3#yzE~%@4vs>7dIk6Z>zTwPKWq5E6>N(H*
z_koUoGiYc}7DqjXwpZ_xyx1Z*CsD*97X^h!hA#kgt59BQQ*#cGh67z3m(qArFfm14
z=<%vAHKOFZ$%fv49>-3&(-ojR3Ew<WA|7bOkAa4X2RfP;_vZU@T2?FBHsjRBXhEzg
z@J1Q9c#+#?&-hj%NqO)S>$uWxHXC^a`{fX-EN<Mke&TWeZSLtif`A$iTJl-C__$#y
zVh;0qg$C`(2A$#M01QTxo&qjhk%?x!voZ~h94pf7n>74Y&6{eS0`#a10KXlH8$tQB
z)A-2EIN<)i2|4{2J$Kme*!1P7+Mlo1=Qv;3p<*s`#@z~a_gdl~k%lrG0(M{jxp7aL
zg^Zfi#`a(IPOOhqQ=1E%>aAi^4PLGBX_Yn7%03AbrDShGf1UwOGQ9l>Y1d7;aQypL
z!nx6esSU|KI1PjwHZs&Uy!~LRb=|kdD%K%wOH!OdwOOGZOP=xofKId8Z<HL-Y%;V2
zh>R<s-WUS~1>Fh6E|_5;^FZt6R#P>*&o9c(S)(hq@;M!bvFXg;O&Xa)@0k+}pTB~3
z+_eap?b{#q*ZCqG{=iS0#+m@oLm3xewzWmXvgpyZ?ZH>K+>f;Kvqy=F4UC{~a=~%N
zv&Pt&O`_3)!LBv7HjatLsy*7sq22XGV9;{cR5D}^&|C03PK=tl2U;W3tDcwk?kl#h
zl5e`(>qHfgc6lLXZf(9*H_YeWdo%_r`PPO1wF&E>F&F`>T*M34jAGWNETx(?J{zcf
zHmGi*v&{zURt6Fq4rM&YUvb44?gwK%d*Q1HC6Z{6!9QPNij2}^-t>FP0IxY69U<?1
z_}gU%SEH)u4}Lh8T)Mpe4ePyah2&}B*KyYc%iHTNQ1m908t#m2V7U$7@eSmEb!@on
zMg}YG_kJ^Sd3l+C&_MH;reyxSP*dBGuK%#q%?xibF;7r~eI@!-m8mbpInH-CZ7#fy
zaJ;41%gf-%`d6(kU^`ywt{IKCA`pmkd#^ncuXE$Wk)L6)2jZ3Pv=>Hyg1X6efj}d>
zebyBd3?^|MxxqQ@m;I(Xx6gi<*2WD-QRnlh0FWfWw*YpQoD*TuasQY*HdowP&}|!7
z7&CvaBkMvhU*g)WuX(7A&%@^Zivsr<N@SzcATf`F7sg=7g`BHss5Bmc3zP*gW)FO$
zVr11r^`br6uRUyTB`Vl#wZF#rHMMBZ(NkrB0^PhNq1B^fV`Wm+diOP>r*5MTG?z8I
z0ENV4%qY=f$J+!2Hse4ve{y=m`es$}UMM}W?st)#d#{apUpJG`%K<@{$70T%7@G5}
zH9q$Hq_Q3FqjZ1!V4?I-P2FGHvFf+;Nzv&aMM38xG5L6x;OSg$?+dK*yM9?^7_=6(
zEs2!+WemQ_s;8t{6=Lq*QK77!P6ozhU5qwB6v<vY`R?acnpe}ssYtzvP=sH2D5Ej1
z>`hf=E-UYmqk~ezXL8|TL}6K3lKHNCw;sfd|2lUQt}kR+d}iFf!v74zY2VaT9SvNf
zRh*|t<raoEg{{YhSs}8zvtHQi0a4#f!Wm=JYfJB$LygS2O1vOQ8Mm0{p;@<F*&VP7
zh><-OiP4^;O%`#4(ITqRj{EEV-Q3-C<_NA@ceS3`>*{;%vD&|7e%#73@TJ3rq9E9D
zb*G*IX-MWixW@T{b<LZ;>Fa|@7?>rVFlrx^GaHzzQg`LJHrhYmI(d`LB-?x3Dg-#I
zoOWUmS@l7ws~J8Z_Kd&DDbNiPW6-2Uge7c*yPaW{3s&a##_-^`Wn1d{awo>+h}h=Z
z6h~AUolZ1w*?i{rZ@cXy_u4mTE63O0=2)0CX#E3-HUu;>moCXjT}a1kxNJ)+T(1=C
zR3{<GrpP(<3qD7yUm8h6os^4v5pveXsz@CRhJ8A9v9smSVx?*7PK$yFp`rcgL5P60
z%#2<--*8cUZVHtv?7CYF71E1_$A^WB_|Ne4ErFX$&Nwu*fY?5#y>3_!i+C*iK>($5
zEOr)UOvxbS>$#b$hawN;e~ccVznkyKGfMP*;^au0x{I9rm=GkFSU0|tF6439CD~7_
zW@m*{C7Uli^V&u5;$Y)HD_6*Wlh?oVWP0xY3QFrHr-yo6x!Emn7qB(dw{Pc_JNE$C
z#+rbwXDSWp8D3qj;?0kqr@nrD3E*sAQXy}igEzK3AXRJ!7=IW*@)@}qvIS6Qml){j
z<t8R3)(4SXAvdA{&%t2&PXPPN>pskuuxyvW0aV{%oaDP)g$I$K2;}j~U+p<9@wT3^
zaY0Qe-wtTrz;(U*e#1yiHZsRtF_nLV-XJcQ20VU=`jo4n(0ePUvRE5Ze7^LghJCNu
znIDu7j~f9jw=*|S#2^2#1FRePy9fec4w=>c-1FEAtFZA0>w}Iu(7pD!VoNj*wcL9X
zbX+h*tckozz9!_WD|^%x!v~H;Tpb5*OGiYkDmZ{IF1cbWY9#oz8<dMXe*;7uNpWQG
zhm-l^eFsv{0yrS>#h_vB;@-Ew-;e-;<K@ddP*41AFN6gvT~fF2J@?-RZ9UMq$YSM!
zhh%|Kb{>FZ{9$g8ysj<Hivuey?MxujvyL3z4i6WhoL1N5Ac}pU<jn<Dc~2*&7f5^i
z^B9TnGvMhLR7&t<ATdN@Fc>BB5JeG3D9+dS(&590ZGm8d$6<(0F4&LB+1b}L&~c6f
zh*R;$KocYvoJY^VzzUk*h&kBEMbjT#FJJ+}m0tcmISAyMIk?gOxh~*GvbE&j6dmB9
zEB@}kaNGaWuR4fK>tC;A-~&3Qf48LnpTF#X9fysrV6(5?2BW7sx^KWYL(Z95{aSGL
H+TH&G4$k0L

literal 114552
zcmeFa2~?BU_BV`*MT?5oDpnc1+Cp0d6a-|9sFhL$96^QzEXo{434}m`B2p(%sZ3$2
zD1*$95FmsgRuLf#0to~NB9O=sKw^MEhW9){ZT(-rdvEW%zVBP_dYiRe5P6bkpM8FN
z@82Fya`l+C#oEueel8;;v)1y*LnmZp*3e~SR=TWO4*sWNcXj~yu`K9>#Q~Y37Nt?}
zMAqHh%3MaKG)`W4b|rYe+W$xUAQ_o|7(oA)>7L05laY};usmdbDikpxGH>09#HhR;
zQFmKBpn)W;Z`=RtF5P_bYR~-_GouL}9vt|J#+Hql7rQU6eI4&&&;1IsVa=^Kp&M@^
z?OXQ6|Jr!{5dVj=^d0u$3wb=Vbxzl(G&f%l?honj`f}{c3<*u503=v?sO-4(+56w?
zq7Jpa|6L~Z)~c-^o+x}_zT*9pm*zV>-v2IR@}un9_fI0_u4XQK|73dmhQ059mr?op
z|CXE7Y4b#ja|2r8i?f9Ysbc4+mz0XVm_JxvuI*ggiLDza^1uBI!j8Y9R7;U_6{#?M
zxL8<)T8WtICHWC&*VST04%(0gOD;hhvHKeI(x{OP!Gm~HFZ+w-?rywI4Si|F&Q#l8
zSou-?xzUcCt$o`LwY@YY;+CVnG+%r(WRdpv(cIL)_{x|40-e<|GB=JwyR|Ar<3!LX
zEvF&_hAV>O7P%ccHbg#__uBGEa$lG~|3*^`g10d=`}TR>pb>NUjid6oCJZagH7GbX
zg>Hg3gm>E}_E6Y%Pc(~H{m>swqqcro6V+7IJC;;2e=v1|frrf)%$aNPE4~l;(%f6Z
ztbKKOZ9JLIcXf6NHwW17)`J$koeqzC-m*D;4e^FGlHyE}+^<mSTga<$cQWfQR<!mS
z&(1zukkx7;*c%X$GVMWgowrlsolUfx7*D6R^lw^@_gQ>P(9G9kxt~EiG?lQ12MxlN
z5?9CRVYvso{bac_S`ONE*(&pMVS$Vj59d-l=~mnk`R`?9>QtmKO-^qN><{~#l}_oR
zFLo{3c#WGMmF3bqDh+U6lL-xn-2{&~8nJ?s{Hr%Zo;md6VaCke(Y6*f1J~7FMVwMl
zCvG}nviY>(!-F;Cq*Y8~;p0b1tg~<iOPv^el01J2>~6_P$WZoYI@&}PxiuA;9nWWA
z>9YlebNO=_o%E=Nnf*;#<Ra-(eNA&}njaSi1fS7T2o`AkEN?T92xx9_!v5ZqA1`YM
ztA_6`o~PWZGJ17Tg`A45(!Y;g8*M@ouRi11o8jP;C(4=@FT0I8m@Y0ygdRDvI}UXO
z9okpPh##+xEz3oj<`v=>=ADlL>zq9TLEuN;h=X{7W^u<ECq8~Tf02}93lP8;$1|%P
zDBSxMtSlD#gd-_Pa35KOs<xo;hH1i+T+;mI;@N#Y!$}Hfu$hZ&d(*s#h582KN}V1r
zr7?eXBEP=yx>xULsA^$i+GnFK=48^YL(je9GAIl5kS^`GOw;h?nq3P=mWNZ@v@<FL
z3Y-~s)N947E$Br+X~yrA<}6j(uT9Q7E5|KS6bo6dA<rVNBa^7=k<8AWb>swEk4OK|
z5YoR;004nV<oJ&k<<B9Uan^S!0{cXpU&o_4ouvRjYwhHaA?WM$XinR(r^KnY>PK&C
z@|?3GHT-O~uF2C%3Le7<?!^W2d-+b>5U^U_8)_zS-xDd2y{#Xam-Q$@oZ-%2cqkrn
z=h{2G18I@1pK)H{Ty98uC!O0FppgB>C+_v6XxmxtvOzVQMCX8JGGXIBJmR4wcsD$-
zLFD`!yw%TaOL}LKI^JY|p=(+vy;loYf3EuJ7%|O5<ABR06Ygx8nz{oyz2@yC(35l0
z<eIoWzEf;Lu!v1%5C<%g{npBJFI};JGM)y;b?T-{wbSJY%&e{Bl-(38uQ0!>7cAR!
zEDdOLCl}2M_<Rgz9g8V?yZ^+PRq;M{7z``U^0eRt<x0##;j3I1Di>}<-Hn6CEu)oV
zROyJ*4Mur|*O{I*zP}<4xm*h6s*u$lzMwxDPMd1}LuqpK;6*nvn{kCXb-%**KK%Oz
z<D;U6#(>tlSZ<=Fj7+40G$cGb9v5k?FG1d)&CRP|6|-<B9PRQ+VDXqvV_<8C+0@km
zEuRsa+ejF!X+A5cjD4GfA3LLtR|=wRHuugt?x@hRqOz*N?fy!J8oz$y*nY68_7Tq-
z-WoGYAe_RX)6AOzfeh-Gt&1b_9chDmo^tz5N{V`^3_omso(O2-FzU_9O)@er49EdT
zuIGL=e2!;f&h2sh#7=4w);tne`s35cOVTvP9R(m_31T!_vM%r~1#cc?8K~0DCN9b~
zTJW#Lb7G3tT{z)5@S+7b;z@8HbPq8NMEIkH`RWy?UGA-|@42%2#$9DikGac@_`#P=
zq@!cR7{cX8J+?fvs?_To_rWn?tznoQW#KvXZMSkZ#apz+_r*(H`Jj03iR6v*`&g2n
zdr^I?!P<rFwG45E${9u?;~>TVAQ#+})FwV}XyZY~Vg-t)z{21gq1b$&8Q1F)$k4ri
zmsw6?hEc;LmPmLZ3w6SA>iCpNUZLas0?*kg1$HyvN?l{)>UjMLyvbASlRcypoC~|t
z+>!mKFzYdl976Q0u&wJN(4OO@=}pIFx2x_d%yZ)MIR_cmqpxcYl80G@lKsr@9gq2i
zHn}RN(FV+@Zz`G!s`Qxr8NEbRiVyZ@dAbrR{hr67jl^EtiMQWp#P(8-eR6R3^mFQw
zZ3%Y`gtJ9@S#$RunA-D3Tb*5-7_F!IEy*a_QTNl@sRWz6!g0ceqC!Ru=Sf9lB@Kyn
zj;P~#Q{lHXroQk)z}%7DjDm60bTrZb)FQx>CgHnu1#6^{J(`+ASZ2S)2&lyT7l??g
z)+%3D9J=mp^TEEVe^N)1yDc;7>8yWPgih9o3o9I3^;9Fa>aI~vlw#T$%-1GyYbm3H
z=$Z#h+wA6lmO^qHc*`#52wW$4vP538@#HZ{DYGzkY@~}WYo;>(dSa|MhgWPxBFg)X
z9PMIVpG<q(I8#GH#cs31K8KHcpY7Jxw3%eviQ(BAzr|uoW?mBK8fU0Oc!O>?w18dF
zsHcz2V@w91Qw>^ctQuzO^!e%W%!Trh+U|<2q;jS!vGCG`Abf#H&>vbBc#q*MP=NGc
zFcl+p5%uAhTP3HIO@&XgX%5D_K%9$|;$D`!fic`Dmug3J_xps8&!DG&PI3?BZs0G-
z1#@qY4GVIpz*pFgU0#QHyRV#xvzuzInR{r|W{HeA;&`K@>$J9T;$qUXbArh|suzc3
zi8%}!;h^JIZ>Pg@D&yy8*h;2t?R_J?y+4$>FnOW3nlSU4ep=V~8LZC5V$YnAs`EY1
z&j;FlHu9QIT)3to(LzQS8P1I8R1u5Ri#<wcqk>m8gf2Z)&&<|DcnzA(y*zMZSsHPt
zbHvc1vybD=-r?Z6F0v1Cw)c=thn@B=2iyp(q{z|RFZ~4M#53qc$#hrp8kW$GU9fik
zT(3N^4VRE5O=#{e6_2*VKW!j3-f^$AGOQ|=IsKy8Oq7eU7|+Ob=3jI5ebB;w`GZ}c
zqqcl2Uc1op>%JvSoWNu_MXbjLCunEjoXr-URb~ajX51bXcx&sqtsLGw;kv}CFe{&O
zbZjKK38mI_Qh3I~oy+BZo~#gx8GRkNDD<(je$_W}%$em?l-^kXEm73Fp13Dj;aLx!
zM6UQgj(NV#EF_R$q9Mm+L3-Nku+xqh;J7bYQ4auSFsyreE7_#8EMF67DRF0o+hH|s
zS&h=Lb8snA$JfpVdqTU_DP3}I@bjvsE8bMidrem>$7ti6g0+iyJK#te@}w>-h}oXV
zb6Tx6L{xC7Hk@*qNnHgf=fMq-OZkG36XlHH?Udy%JN*flnL}&fj1947Q-ei&;Su|d
z?FFIyhjvOq8-rEk>|)-ak(9o!K#Z+O_!S-UC-?4hc2l>j%QJdMP7X)APxI7!cyVW7
zUvh<tX5$5X9eeDovoUSggyftBw_V)RMRHyjOy25E%^=Pu+7zH10>s>s_^`nP__C_}
z6__6O40lo|x77c1vjSF6y?uc>2E2=LOn%nh5XP#S+(&%*^4adUTk$6T?)w~gPaAv}
ziF207G{Gvx-p4~IL*phzFYaC*J6e>DWQgCg!UQfOyNXro^nY&RI=9TH@bcgwN_DW^
z%|ug7BVBkkf9BDQGNy>~#%JUu(9Pxd8v5DMl;Ok7>3qi_z4#UJ%&@pH4loyM%#E<%
z&$U#Eba@TJqYU!GcGOKkS<u0s$=Rv?YBrU;$^rj7r?mufF^a^i<b~Wy(~~$}z|6?w
z8L&{yQ=F}Kafui$Io^vaQ=2<RPCput&~^$f%gXn2p08{|#cnQo(B#-qze-7aO7GwW
z!%@;^aaRzcc3wN?0irTnvr%s}X2@|2=7tCv8F--iVq~;3bs)Ml0v^SECNIz1#OOXJ
zTD{ks)vfg`dQ;de`xw<%YjUQ$k{Dt|KkC5^D|6eDh^(AdM<(Q`0M0co=P#=Ejj*z9
zIl_$qrq(gJ+pcwZM(dPzLEDw{zGo>wFNdUw;uoD+>G5|JswcZtbl$V;KWnBXF#{*}
ziXPRde?=oBPDRsX7~dD1TMm?C$?uWt811545sRk64lOjhGV{m21t_gRJ+LZ5_!KrU
zt8<kF^a+x?&>{r>eMbwwBFbROt}yX#MzG;YlI=*mGQ3tqJ9C&jS02W_ve~23yH2sd
z#0Ov2m_oECr}sH{bkuaJsPpR&N|loKw9tEM=6lnJiN$Dm6f%Ldu%lG`B4S>aUh`%~
zhphLVJGWU|`=vr)sj0p%ci1kyaba<6Yj2UrlDw_h$4ewrVeU9Z@1HtB8N6R%mIDta
zWlxkIdF6pVH)-@G@WDmWT!S1USTps50!Ag28Fm`VbpA{t0b5<SdHJ_o!Rz{TJEHol
zL|ZdVI_AlqjN=($fI)(Eg8LIf;uBgX*vT_`Zi%D}2A0)2Ez*(_zBpqT#f96&nRqg$
zhgnUbBA(dNIG?O_Ro{tZ_PQ~a*~>^hD=&MLbt8aaW3NKs+p1Jp_1s6CA?P5>&w6W9
zW~N^F>WphT!?cmpMbTBP1p!#OZEe8F+QEWZ<I2>;xS&$g-M-wthyZ7}YnY$%$jjt|
z%ET3{YR=wqx#`m22*xxW1B^Rp?2Meeq?*`H9v^sQN#3nx3Znu)qM89w=@QHikGY2s
zUsf-`VFlrld8UT7V=VcXn;OE;M6e#g6?_@qb~Bw=N=be3wM=+KCB{3P88vJ$WaZAk
z5_MNDqW~suU*PL_?#U*npCu_&^Y@FSt1I|*HbKvdh|sqzI%=yjTlAf=V-H(*ywo$J
zl6x1INbmf~4`Bk<R%(y!SU55_xbckOX+>{fJ)71c-ly2RVrX{VT$i4{)1n3PME1!-
z#m$APbq#dBz4H0v+%SOfl3McU)}l1)vFI+dPAR!{J^-ap-IS)7!`fkW9e*T`e}?yg
z>vEc~Yrc=?yU!8buO+I4elNV{YL;m>;S%4#OH4;kh=jV#?AV!GM!!c3R-zeODm1Dp
z#0929xb5;?MTC*J2k`}b!??!hjbUY3v$J{{3q>3DdBx4DZkf#o%e=TTy&&9<5<WeA
z2R90qiR!P-W6dTc>d$xYqI!xREKaX3z`1e*%KTxTJ5hqx-y5pBRkn~&5w)*ss}EBo
zFN^lnoFAjC3)y}1D5b<hB*P*XX;aWYK{O)b0GXA*sn)9ul)>w#CuW~~2nS5+m6T5b
z6z`iZjXCV+6_@QbE*cX7MotXt1&9O*B0&Gcn-Y8+ow@UcyUG(y7zZ<PaZ)1|ow#s6
zN-@HTd}nTpxnr%5S56dJtHhHN)@zOw^|-dqbC`M+N=dnC>r^ULm`=_S3*vJY3N<3I
zVy3HXp|Ws{%rtB5Q&127HHua&BopNQZt4X&kX3wGFI~%p+5E)G$Lb~Gn;kg}YdLug
z9mJj~6F&1%F$G#PlmGIExh?}Fc{VPaHSRCh@vKw+I$hx<{3a>h5Wlt9v?wnPz&ESD
z7Rvm>!=c=>ZW8YHv#nV$+3u6675_MQPcJ?SXXqSfT5C!+dD-(gP61?ncgI`-W4cua
zZwx6+ob3!hp>6UoHV{ODwemqB#rbw@>00mDhq4C3&@Y*I)(Jne%7qC@W2{Q(;=+b~
zju}H$P0t^j`Pawm$@y7evy1JV1tDnNhcC47StGN~{U0rtd(Kz1k;h&J>wJQmswBqa
z+9UW@TtbHZqWj6I;L51conw&0o~8vy<fXkhPC;3515P-qb~#{z_G@WRs28_3tw^UV
zG<^-$tNjnCI`?%h$57qREHeD)|I@PVCsG=MxtjQ9J4_jNw)qiQv_Y4<Qr~kqlf0Xf
z=Q*7g8XMP)cU`nSBltRW@ahz$2>UZ86U%t5T!>>09A3PrPDd6MAO0qN;`K#RvFgQg
z{VzkF==o|6A0e$<tXpkEPvyB<)Q)ulhHQKIG?Q;=Ux`KZztjzSBh=GJ&&y7R4W;CH
z@&c<`^Et1y=3*W31&aN418<x8sHO|IjQSqE-N3KE$9FFagd1?@<D=tpO`*MI)!fl0
zl6-WuNs|hAB_$b|mmlcO&v;?d?+<3b`vfmmeUW~!IQ-Y%^gGro9JNgfO^r<+GE@K`
z)XG)Z*X@6f?O>siaYEHpGF_Xu0;D181+ABA@?z)9QGAwO7$A>xB!o(3xs_j@fvVHZ
zpG<n%SNJ)@mb)vg`N6nU&sSM$#fBWz9gVo~u6zLOg1CoHESK?U`C{Mci}tK(KwVJD
zR+C|_WOb*>8g>R>A-J^P*jJ(NXo~)oj%DM~7{YaT(FJXfhSbB^z@=kl7{%k+H@oXY
z@XR4#jpr_F=Rz*{Cgg%|WtuYV1*xNmPiMa|1ovPC%*5)+(}@ZKTeE2R^fg!33041+
z!SdEBgPp77ndM^~hJ*5J@V;mBeSR-I>&XzVu&ZC-h^98)1%yP7Rg0BvncR9U!Q{*o
z{jBP~!N!yz-z?J1Gii?71V4V4IXX;VT~qyt?1tuf`^<Eo*RLACiQJ+sx$9|x2W6`y
z!7;^N%20*dSuLq;B&|E6-REl58YX$9cCbAb9XzQ8yfY{x_KmCz8mI7QfV28>+sznL
zeX1RW^C##0W1ET`@Yq(S!imB>sM6Loh6D^kh2H|QsayJL3YeE)O<yv4-KZv4?3(6-
zsSn~WlS>?ov?6fILijVynBs@h4JBCg<K<4MVxGcCfP?WU1UZ(S>I2yOjYNLCS*xak
z1OKp<4YA=}JiDeVlM9?O_yIsw-HUzwMNT!Zz)ptm>05lNZ+z02UvEzK?4)Nz<X-2p
zW;0*{{X<9@JElK3!%8mivGP&X<4{VY)*8OHXfCyHD<Mn(ZDs1xR>r*BN*LZ`_K<&%
zZY!%LJEUt-A={NMpWg+QRiwoqK9*}Z89$ckI6o8gbwGU15Xk3FgEcBRsdy9kfp*$R
zC0nyW#4$Ng?y>PW;=@Z0oA^r72R0LL@l6qn_$T`$sq~V1VB}z14F#!%D%Ak;wYuQV
z7)VIw#6k9pX->+6b_SJ!3C<U8TB(qm)#hpgn7^S+lQK?>Pttp^(q#^CKpg|cY%LI#
z>z9*?8r?)PW<0%0${f9_s|jok7MYN7O0K_tZ+mcClrtFxV5_e#^+}cCUkll~&*TU(
zu^Jg%y;j&_0mLJgYDgkx6hYloACRV;61>SEpiIRN750T5mo0=}4vF{)bInBgAtLmY
z6ty|A!6kw%X0tbNzJMj6+%cJn5JwmF#4DRl&+>Qr)3un60XLiQFJ``}o+(jCojyl<
z)N5wLIy3gIoOU&)pwstDKj4&3Ul<=AABm!Eb24nwu70W(2X~9d3{?8NdTuOjbKnL{
zduvy$?RCzB%BNEVE)(X}Vel@>TDzV$R<5Zk;$(j|j+7&{6e7$(9g*ym(|X46jyJ(D
ztp86SUe&JROL=wC1Cz;TySC&rALq!eI|0>kmI{wh!Fn=mi=pSqifI=yf{PwglU9uL
z$5wzK<U}=%%qYkphdqV@`qKJM)rt$Zc^;X+sNTVKaHw6~X{{boSf<}j(qgI`hrQ&6
z+^lPVu4F?AFH2pUQeZN%LfynZXj<RGMoW;05QKQT&#;4gpPmg2o<uNTKDRGQw5fQv
zd^uLPSY#T~UZHA$;0I_`$T5rIHh?fjbX0gtJpKpI;4m?MnyC<~p_*VIBhQ+7VE(1F
zGHtd_+7>v3$<?(NOdu(<8{$m0YxsR36lkZGI0kD}kmHef(iU>a(fz|cgMeV1j;MR2
z)_T9#OCicmD}kdfI-xucjK)1B4TOXh`96=Nfp@o-$y5fx_$geKG!rF7_<-JW3-3S^
zg+oT5UNr;akF81#!mP^R`#p0n0KB>D%CqxOdCtm3iTagp3C<x)_*SSXrHq8y7Lub+
zrqx^k>C*niDSu~p*1CY1W+p7fIvW6OrjL0_t7iOSa73q8VPoMO9Rj&EGWM0Uz8tP3
zt#HSNrR$#5_Q{FG1TtKkEHPi2<|$4}OLa?IY;4Mtohx94&vct>Ap?DB?^c=;{@9hd
zlXF+W!+FoD-~!;%Qb&Iu^Ox&2dxdO`Q{8eI71s3K#n}K2_p#h3D}B!&`tw?m8G5cn
zc1gUPb!gelOQe0F$^2=q2?^u@Gy6|HND~gvz_pS7v|ZH6rRbxAapgwnAd^{VBmukA
z1Ocu22qVQ1bf$<tsxg`G?Nd1$r;-FXcw@b%iITbZirVS^?Ad*Jg&|%mjQPNQXMGSK
zibM%g_myS(Dy5Hq=FRKSTaK+?QiV!=_Mz8MU21XL#%b@}bXZOpuW>>Bb`WyEN>cF=
zE?P2N8iWT1?w6;quX1iVzFE6HngnZWCmaMkUE2g$H(={Q=!e@{?8vPq)51#A8RuFB
zr`a-{H*IF;2Y;4^C@f=@5>aE;i*S!y&c?p57Tf+jbP;fALyo2K{Cz~_z!4CJk1`z7
z9zA;AkxQ}BY7jhFTa-M)fV;+{mdj)G<KP+Gfq^`tAi+Sw7f2Hb6nf_5BA<D0)?Pul
z&6E+VpQor2++znywdC};%|#g?n;5az3_k?1uc=dhX6T9MKJw>iKjS(^B4H@s4{BNe
zz*GfafcwSR5az#t+WA9(U^`NDFmLqem?_9r)5iW#P26nX+d=i9#8&6tj>@4M1>ySP
zokbU$plqt|Sj5vulsJ-hLy)L^*g(CMOVt^f&Nk`;Zot9OcP@7LQr;V**N+M@PcG?O
z`Na;uxt5l%=u56SshP@=Izo(v%Zv0rXLwX1oFQ*O(9P&`U`l<Vp=y_ky7%PnhIr}?
z?V3qYYazp((mAKSt;N9~bo8jek6SukPRZ|grz;IdIr+rh?9HFb*8uh8&02Bgj^2{j
zp{eE3=o%l6$Dn3MH{Dv!n;wi$Yn+kovWE6PQ4vM)&q1YHj?aazwpvTa6}NrnPrCr>
z3KQ2M@T?!9ZzP5ZDrR#%2TOm(u)|Ij_oD<Qyg~IusCTtgccEB#a|RJ=!N0`MP6UZ7
zeQ80pv!Q;0f?wXg)6m;?VsP3}{Ag8lOmSkIonrbG1fq^#-yv;bc_xxB-Hk#kB}Aw7
zZio55A>DQkW#KLeR^d(*!-IMj>(B2-LwpB2wdyEydtbF}uNP(fPI@0x0zt`yW4Y~d
z<BUb8HRJGNFd(wbLj^VN2*g+-=`{l+RSAyXjsQ(fbgf?MSm}7s3BO7=+OH9}u5(KR
z$Ti(+e5PJvMp?Ks-19LJw-@e0Y-sFiuVjkb>sJ%5;{-dZluENkdZamvDYKfacg(x<
zAJ)ug%@(e-Zy1OD%1j~wqA=2K`+d*WpE*TlJE|9Mg$mBT7;(Lym9G$AG+8sfe!&VT
zN2)DRY}|mBs)mZfV$y8og{?(lgD=NkcX`9e)toN%Jir?$MTp?>{%UM?P`;^kLdNal
zs`+BAT=(=*{ovn0voN};J&7PcF;PYX1uNr;6$jhRylI<=wTWR|cRq8i4eD)Ouj-bI
zqh$pY1-kY{OA0FRtM+~5;BKi0N{uUGA(_<g66aX?SrNhO)2W~!!L-jHco;m$4=GWE
z6b5*OG92+4?>A%Y1yMt@D}yskM{7wQ@0q(-RmpH2st^y46EnKJZOA5qMptiKU=`;+
zJea#N=OB%=%L!&@!`C8NFBZ&_2i_30dtoZGdyp3i-a}&^ozhj-?}NaVC<Rxp={%K@
z(r}>FB*qcDT$C*>wt&<Y+o0=bgJi(+YsUi1*c)>5zskGoOB(_Xx!9;Liy72buCEtw
zpk2Y7QgK{ce_Z)3)E6^_)gDoPbzs}DfoiU^m*I`OLxSnx-g|2jrT!SUd-?c~6S2Xl
zBe_}oj$=%O&+|!8`B)oU<B27uVxEAke%59fuQ+JGZLG0tuJ+y|ez_B-pnPVlakY=+
z#Ym(HD#BVzA~H=`cLq~1-K1U7=sKj2?vDtjj2;Va!}K{U#-nTysMK-6C3qz^T`*>B
zuj@e^7sYDi^J~dcI*E}|tluAUOhO(S6i;`%GRWx@h|>@&1QCce1)9C4QQ@^&sJhw9
zwG}K+L4j9}vFX65z4Dvm9lvy4#OkM=1w{t-9(Qha3%k{7yb|i-axcF9NxrqPcbRJC
z_sqS8sxRaw4f!oUyhp<3l^!8itN7?xSCya59)i5D``1DkCkqq*ZPVyAeQgcX<nDdm
zA$+~|`0}vU#=>@14OqGGn)k#6?bp^37c*3Z3S3kfh9o*;N|ixr%7WKppU0|7<J)z%
z;}05ekCC;E<Q}rKNdBT4!)K%ds@nM4Ipd-N)D>^BsRMmoH{B0O>EOA8F@))}(%M|3
z7Ou|aQDH-T(-=*o=2g4+E!BJ6R0ZQ;VrX_KTr8V{GE201Jr!oO$X+4N0`+am-MAP(
z`+XUs516CrM|{OaD~WU2?1QC^BNqS_F=`@RN|;TOs6GFQTYG`g@tV)zE<84avId-w
ztk+bO!HTuK-p&Vt7fAy+kUNxa^o=LZz%~5VHQ9~Yb15y)U5nbQb3qRbw;`dS5ar-r
z^$6pR?)CQZ6+9z$KnBoG2%>P$(Y`{Qo^p17e4RVN3NZFQ68s46iYZ1iu#Og1iwu;w
zUEZ`pgKNb*UGieaQ+pqR#PiPN&nJP^4Ajz{P2y?Pqfp6Xue9W`UQ4wsJ%S1|5A+<|
z(7D3q<(XrT!v>SxZwCJ&k2j(A-FCD|bX7^w>XSo}to=-LLLMjMIp4?5>X?z(bEUFJ
zU);rYY5PnEGtMacx+#)gIb%z^VrT`bq&R=)eiYYP1xe7>pUS&3e`$}LjLcJM!2x(G
z@c4V?Xh{z;|1V5W)!k{$fJso(BTb1++5M@iFs#zlY`ot<ZI>;$Y2+s9U{WN$7AHZV
zWv|LcUf?vpc?<K}2yM&f5H4iutek7Z4WDi>i&!{?ms!Q<_L7E7aWi1Vi3yD_O>dTt
zFTJc5sGeV3;Cmw}yD6uPl?x=?RGSR5E(~_DP+z$j7sf4p-D_xQ;0a@)#t(8FEJ!BP
ziI$A;h10xPHN0>K+?c(By>quJAv*tj2qH`mD;w+v!vuY%T6+h_U0(C{+TGwT0pkf9
zK{&xCO;&{oG&zPd2c`0bEr}V-+x{$073MV_jm{qSIKTJ)tXZxVD8jy}(|*%wtiViW
z(4&|a2FtR}j|Y7XYRXK4HHCA|2w;4*o$j8HWc5?*sEWqXi1pf(t+?MdQ>sU7sr(sp
zq=P#)tutG`*fBD3Y`uDM<%RJ!5^~ES$MW2PnpJiz0W|K$UQ*-u_fgYyzrjvxm}7ir
z9$dkzqtWEYfGIy^n&ejBNHRlSjyPIRS)G)n?ughu^?Kssu2bbYmkBOrdOUOT-JxU)
z$8?w^gjb#aCeh=!Y6G|_H;kL9U#Ls9_UedcXx6cR&={W>dsAFJS6#g~4W;ZI4R}A2
z(Oi6M?GQ9=xL<#1FRr0Oe>N;WW-RitVrHXEbFI`htB*S}lGXD;n-8%s*GiGSI>`~X
zyt8HcHBHHq8*&V9n`DvMg4nt?+5L$vwoRx>(n``>4BuZ&-a0Ta5{%K)?mpm>$k<Qu
zKZd7Q8C<I1F84uHmucyqElkvZW`j@x^-g<YFq>YdlGch`P$hy%GZ~lLP)wEae_~=(
zu4J2=rd5-in=4x9)p3;K@6VX}q6@R`y*%`<U1GECys7ac!k@Soj^SB4l3xV(YxZu{
zX}yNL`z*OxVR6IEnei@5Ri9A3+VZAjrzrl91!3eHC}omrS9UP_dcHn9w10UjhW|Vz
zBtYYiu>@kg&kQf2ynko9!&^rC!t+?ck3giCdAu~pSd{zr(X|2He9=1gqiBP8CE|cN
zG9_6~EurI!Al|^?>M%B+X^yNeF<TbYiN$&Rqx3jNsWY3@9CN`aS>R65+NvXI<0q#Z
z&=knUtC-h|o`%@w1eWM{1UGxa5i1&^ls*z`^m&Sn=zax4*KaoYhduBFKZGlP58%5g
zp0Zv!R#QMMnf<$^yO&AUz#UsuCP<vDPjy<$5k1|o>p+T^fQ}s=%VBuGgHWR|NU`3O
z*kFzfYZ9D`72H7+&PQw>L+~!NTv_(3;B1CvZw*xuesjt*{T{xPZqaod=-r6-<TPHZ
z#&=l@<-&Pdt2=rn4K^35R;=qB89!25m{zf9zYhqq9WULtHd_4We&X%NxFNem?nexj
z=Bggf0_?!@8S8A-LO~c~z6JfYOrZDe%XGQ6e)}qeE2IW<A$g^b>V-aJ5YN&CJE_Kw
z5slm~z;vNieS-CB@pl=Vu;5H!el6hvT~fPpFGkpd(muxTw_@G3M<SXZ&0M9OyrAI@
zS=N^1C0Y76nE~i%k#@-@dBs6@7EI|E3gGw9b+71R=&se%`<J`vwA%GA^k;?%GW9i6
z;_3uP+2y?Ogx3$z+VZ;l3{-^zM~5=^M}-InU-kqoFPT~jT$2U=HSJd0@Fu$<vVBkh
z>p^TVfH?ZNEHcn8P8)8|O(`xU(H7xB-<kQS)ZlmF=;0<AUqJ(}F6*U^XTM!lRIuk=
z&}OK7aQ;f{Htnt^ut)BiyN^5i;njcieV{Qm0y!QKBAe2jB3vn`WBAQoMKDQptzf!^
z<mZuYmdt6~+}!FVPSC$9uLa8mmE7Itypu+gsIScM#<k-Kc1|~^+_08@cVhBgl{*32
z-A_ojF}=&W*xsId)N35cYYH@qVJ<A^eWu=YaPNR1(fwPXzQ{Nm>1^(Nqls6!TFh~>
z3V8MHL`XmIBvlU0|1g)7l$vh}uo2zx#qM~6)(V7it`&*4b350A$bVU+>*V=(mBaO+
zT}gBMU>6Pgw_X%{XSLYu&UqN!#C}Z^q~(kB7rIK_3Ey>ptzg$+lxsEK+)x7Ed@6`B
zLJ7RYRy^EW2!=ZO?Lo-80h5*$P24?5`!4!6HoWHBF(`g~E$yPqV0BvE3j}ZQOg<1z
zc&@W+{b5K^TFtr}oA&&2HwO+GpS*&)3!Cb8fv+@11S;+A^y7w=@`O={+xF<~8+BDB
zj(*9i6+hro&{K&!4J8GQh4NWklzyuV%_6X@Z$c<EsM<PU;dq0{Hw-R-5O`##2d~Fz
z%WTLQ``}-q40Lh4@v#SXO*L;u<mbW2WUdtuP{u&o`I3PpbN)fUyxWTb?mX?*_Zy@r
zMK<+!UHfNQ%`o48@TC3$5|MS|PA6oiSI|R=Sq2K5tlS;J9OabW?jHS1sH4j@n}<^5
zhjcEX_(rK2UBD-lvk%7EB5qE(vR>NS9Z{YHE}!>e6|<(p(Y{FVb*=Atns%hY$@AXU
zi)ii`91&@uU?U6U+PySh{ZhT*ZEJf<(gAMRG5k9A+1SSO>vJF{&uD(EL~3zQFFLa>
z7IGw`^^YH2N3%!0n0b)w1~tj_hm3Xl3WhXT#KHiWtgD%G^h1~Dk!#Suwb*zD1|N=P
z>(-hi^+KYVO~^<2CmQuZ@zAUjyw~{Vm&3H{B?#lt(DO9d`Lgg-=IG1d4Fo}0awq)<
zUVa1*zXk}o{_r~hQc9zsy-jOAsE~N|R@fle=5n?Dx^d}87a4SK&=LeDvhz?I>*!c>
z1B%!EJiIxvf#*Z}vRMJ6Ckje5unENe)O5T=;G&h$Ej*Y(-8#@PqZ58~Nn1@jJ*Fzk
zKzL5%==Q_MiODp^%<;v7yZL@boUq56<u?OKo~cO((1qtz+Cz0N=}QcAE#>!s8C>QC
zE8}NfKR!44zBJW7FAXvU#y2iffYD5}12yiv(D?=oQ~G6-wP+YBKLPkw8$ylXs<-v1
zhbSFV&Our3gsGjaam!EI*D`4_7l1PPnmi4TV5K~`?>Xsg9ssz4MmSFEl74bdti#*i
zDu5+!V<)FKU2Zek^wzCDdlrHdA~7<L0VL4l4L8((+1wh`8~H4pp0Ly2-TQ<S@39%K
z-VggK<)l%{l)&vXkH`6MBAT^x3a#_jfe21db|x(Ci*a#*;7N&#D0(4DP>nB8Jt2)N
zE~ZQ5K%F=LgtvhJ^6=dXXF9XN`X8Iz+mnVsnkG{h+^p|O1yQlCYtB-!i$5xjfuNuV
z!3pNuOXv_j<9+8?qIOspHUYny5Y~#cg9XsOQ>M*@>t50y5H#k$Nzj93o+cOVR-J9y
zh+WzsU1ujCnznN!Z^);tZ0roo*g2jTXYAMaTzDz9FW9POrw2Y`%b($5A}O_$MXHn}
zb<&Mb?gFv-$b;~7(f6m3)rIc`tV!<9g_ISI7J3-2>$>z)NZMGLoX#HJ{iZ@vvjSP|
zbKQ)d^M4i(P_p!@t$xWFt(xOGWaUCIt+C|oJ!O&TW!TGrV+sk3g6n*To!&*<Dn=S4
z(k+X32xe~}GzybA9zTla9tAXAavZ#)8Y1q0EcIBS`<C(8ZC%pnT+>0`l~XXOqx^7P
z^+E|RwL>aRsz<WT_}2H*IBo3c8S|=n@J&q7L%3b&519|8f+QE;24?Vs{PfO(f_!%A
z6Dv1PuI4>Ct!IK?q=~9b(-P6lXy&bV{GpA#A)_(CRn!29gTBG;n21|lWTU6tRRkHk
z>*}P<^SOmkxCS~36JU8~(J#VJ*|GiT!xXv=J^XVuJJ+-C@l>UDsiLcE-ghi@T|&&y
z4;tvt?z4h`|E=*@Mwg%K^*;|kty<2P>oQkRkw4TT(VRcV&;`nwUbZ9`tZFXNPwE<J
zCN%#wkD8;@8X^*Cb1?TIc8sa7y)6`Z<m0|^VZX_8ych=sAdydcbXZ-=vzJ?W2wSxT
zwmWuQllNH5$pN_@aCn1vsB+q9j`s-!v_WvSzk1)44(#PZzHj;$j{9!f?W#i^@AuBX
z8$5c^+wZ2)t4Dj&L5V$%rUT^Kt@a-5tC)fQ9H}p7gj46eBYByYT*B*_-`Q6a?vCDM
zE<*fe*Rqp<y=-FSCIZUds`4znd7#X#mY$S@wp9tTVtHe`JtfSrv#j=d-w*nlIlvtD
z3O4}pwzc6Z`(#yZkAS?{ZFrOXbW}mX5rx!lJgCSka9Y*ktfbERy+CtM1EhL-Y(mr(
zO<{I=3}}lN22I+_bSTF$s!)uR)n*&s8O1T^@({gCNp?@7%UQ5_L@~U{_HZ;C>>fKN
zZML{jksVdFTl_&FonyqtuKDz_=5^^*Yc>~j0v*{J-e-SdlaXaIu$Jduh&LN}?U<P)
zK(&~VNd8e$YBe2?t~~b-t6=FCZDX6?%AO5vGJ)?&;~0jNnRy2ENpe9v$30JxZ8mW*
zuzyDHRDnoo`dNpsE~gNV!{^`f+3saZEF;JGIR|t%I@RO1G=Z;O+$;!T!-D)brZh}y
zfgg|F!kc9%A<Y(>3=(LHFNIkQ1M#)HdUMx?T4N>~$NjNks=PbUX&JLG-))`d7QmnY
zJ@@KBYVHcO)uujpaApiw7;9-YwiW_7e036YYPgrHI+wD<lf_jbBga7%#_Vjli&=|C
z0}5<iZR>$mp4i)cUhZbL@%b5*>|bNqm?G6W!MCO;kVptDtv6@CeBJl5%QWZ6+xfBf
znMzuNS6MjPuNKmokvFNwK%v&{DDz%!VO*HcaUkFO{GmE#=XRp!aqa>j!J3++fC@9)
z6Mj%`MJK>o-BT&arVk<68%^4D)Al3bIcZ0c5%ng!2|CC0U@?w<o*f1Q+@?fr&h)V+
zeWI{K*w<3@&bL>YA$h{Cd9lM!o`HG@{Wye`@6E;$C#TpTJgpIZ&#woyOnm2Vu(&Nh
zr_*haR_>J(z)wOx_Zr{Gj$dT|3en~z%F>_M(|U~Z6~vsqI_{y%1`805zkQ>r7V_k$
zF;k$z1M<HVT+q<awS%lPUXbK`Gig_Th>A&uVsdNy^Z4YPbDLQ@e&xwj@3W+G&y*J3
zVE#tC^cUx9Ifa#7r)>~7slSgHYU5{%LlC-aeYm8Sl<Pc`!jLMW46gBc^%_=xnMsWW
zZ#*aveYHqZ>2`KMo6&edC@mYj17BPJ-Di1_bdFj(!HEConm6}UY1p2aG6Z^@w5lsm
z$nM+*{%VOd4c$Jyr?sbGHE|c7bIo?$R5&7GAkaIsm&{g%8zB-n2jQaM`8gLDD`9iP
zUGw>U3!;i6-k0ub#OYhvQU*19wdw#r0a2Rb-u|5Dnb<R;he9hC5&Ve^70i#Pp(A^$
z7vH5ly5IP*71-$8OhUa79ukdJg9bXQTLeLh3k%hgF=+`=+91t%D~N<`-j0{7d2zs7
zgJ$7!9?x6fjNenx^m}umw~P4XQ45}F>kyj1k&{u@_ayu+%S4b3&Eki=qCcn&e1S(h
zcu%sj`i=74XlHTU=hd59FfP&Q+I&l7ihc6(nhWDz86go<qOX8tTjHgXfkb+N=lVqZ
zAIol?O<x|qD{d9|+l?iHRr#vd6y~*Z|BVq<IF#g8E*-aXvRii9LK3MgLmn#jhZd=@
zUV4hJXmMub$dmO#P3y=#&63YK;DngB2KaN`jwR!(7WfU$JEqF)+$Y&&O~pake1Wu9
zEYtT^z~i`X9)u2zt&Ti4P#a;);;CboLmAPTrEH_pQ+&_^{2{+k=IbwvA)8j&Ddk?f
z4AsA=4Huli%lyI{YKR-^$G%dBP8&v&m+%UH1tI1C&QpWZwafgUe#nxk4=Rb`-bSc^
z{<$+13sPs{{F^KUVo<QNz(9F6R0ztE47H`jf)v_ihsU;gp@6q1DVU&hX%^HL!yd0C
z4j@~V24^T>k_(g&l|yPZ+(5;6>2d!HbIfyLLu(8D_wpj~g`Nk@#T570Hk}}M2ymuF
zf|-$~0MaO~^N)M@?C^*qZyFBMy+ps{jRb+*e|!pV7IeAk>mEU?x3#ZmWh(&i!rMH3
z$a6{`k2jiQ4jqY%Sa|DM`(S0gR+=PrWY}xiyY_KcmTA!Cp{JfP3sX_Nfe|58@m%P6
z)74mb1FCgNA0RO!Sft{9^a)%OS{Ro}o2%i+Xmb{w#9dA9vHmR9JvWZ(0rCRbn}hXR
z+4=rek$bLYn!ei7n8GP#-!6vYzc>30k$Hh8C=Rd4(7>AnT^>!1+ooOa-M~!*%=03_
z5w{7<7cV`wB&=fU(=FOsa65v;L+27(>`N^ddlP{kS*w@=M!T9=R{j08ZNFq9UC+xR
z(_dHf4fe*hP)+rdrv$?rCU0h@;eJ92%HLlIi6p&p#5Z1$&YNe%TO^4a0-6{-&KuHF
z<B>dS1-d0)Q_}ax(sykjAPbION!#cWKO)m3WVEmYO4Z~1S>0Ifgieb7)ay#<<g@gV
zxxu{m>2n}m$P+c_Y-yoECl)4I)x)#cCqdGhoS4Iv=V!o))}e%v%x&*qv|9(<VB*_L
z`gw(lE$(JqTwh>p-iLj2`U1RV?GBH4L4X=`vQ^QILV(c)?MJzgPn1699tvrP54Ba4
zl2<V=g|)Uez$9ACcDP*lZAtZqWkedE7Q5}-;n53dcZ66dm`@muignDkG4!n>2u2{c
zD}8{DG*jR9a9eG}qOGy!q<*p-wZ*ffk!Nwn-)vqu6$n5zTKPs8z}eC#CpnV#{$+Lf
zK&?X$HV{VP#Ng{Y`*a4V`ZTkm=<XI+LPhwx_m_ccF3{zTOj?Me_<Wh;@p4X_f0N;9
z{nq>lfbz;x<w4uMkk^$ywp;_Eup3K8YV5dgd;LJkKF^AgD(N1%uMbTo#`=%e1R1jp
z6K8?nWnS=~3=x1S$fZXlFp%Ces^*JtM?0jZlkMF?2CJ^pPcy+?cEipPM-NF;AnE02
zwqL5a$p?9UTs%!OJklrhNL&P$v6XDeCPC8RA-&AyA|%i4;->A4KBy{BjRMD*plTrv
zTwDdtF)M{gy9FtRRA$NoF#Lc;yg(nkGzB-WEg6)&O_cO58@CZJ%y})Td)1Dm`!*Uf
zg7-=;mVzB7El0Gf4!*A86;emhu_?qzra+cioCVM@y~MU<WbXU|Y)YxwVTi|R<yR#0
z25OzA&%g0=GQ(ZA1f{R9^G)5_tAiH(R8+x4H@&3&LEfDgN2FyvX=MuYJEPb+?yCYl
zUr}9m;FXE7j3++nCiR@wj5th@@Bx8s>kMM%_%E5~m%^&d_N%LyJJThb2<1#qH>-J{
zB9?wRdlhGMg3VOHlm3L0-r(}<A77r?a=UE75BNfbLv1?m;@~Z*!d(ph{vQZT|6gk(
zfx!9Z;OVshN2*s>IehjG)BsA4?#$Ml%YFC{Fh9I=gL%_-DXEd!|HX#AXI`Wyt~sp-
z(yH*UcX)gy&C<aUYw*DeN0_`jzdgJH)nX6HYA&T*GBTEj+FUF#2%S@1>j7GCe}ssw
zyF6QuTzR+^&^5C!HW1eQ0mrCsxah`Xrw;-US?su!V7_FPk>HLc_f56GdI*`y{Er`l
z=I_P)_dDZb?y}rPV>0(s`{^RTe4~tGfCcSSC~#b#B-4G(*y~f+>AqAaTW8yMT=!45
z{(h6{Hp{BXRJ@8!`P9}{Y~Q`CWK&4zrvOp1^5W{q!pbbSKm5=K7)5HXIx6GyL|N}s
z;QM=tf7(T#$pMjw>N!x?kVl<=W1$E76T%&kaft?YLk{8N?deX1vN9_8jFerT5`$*Q
zE<fG|=>T(`Hps+|FePhsAzS}Q-H|k?cs4D66>==N$5Q|C5prCDAlnxn`2SgiWk+|&
zlz`7<D7haYQihz&M@Xz=-%nhgbV$a93i-6f1>;Yw(^7lo?yE9&Sm{dnA&?9G*bMOT
zh|gWVSQaVz!W=lc@u^QKlk#QV*UM!Vzk$@r7=V20$2RC=9rj(MrL6ShEfNUD)KBf$
z+Y>VJtE9tTyF8t7F~G@wWF5DLr^GxeQt~?PBu;FAJC-G*8u{;D0z$Rfs?i5BY8zy_
zwV_B*D_#dhf<NyhpaomQ*S|ROFEt6pk@@ZaMwyVapEm#TgFZ!JRQNo|<tY{QfU1lm
zbs;95NYYmp%x{1guvPmzU71}$MZ})$l89IT;S8X_`X|{5&Z9{q)g$AKV&cGBD4l})
z<%)bO!!eYS*C5?*NTY%&5&S*kl4`@(a2J$v9!f+T|L}GHbDh+ups)~UUUXjmJ3>AT
zi^`j=od)Ft=Fmsk8X22|Wc(E|hqeqGdEwg2&Nmf_EoliZ-mo8S9TkeiRm~rAx(%(o
z7->$oHggHIFI_ztoPDQ7QyF!KKD)SjeiiV*m08Q7NUXEQIL<Op@xvYxoL{EO;GINi
z<>>l}v8kJBlCA7vub+Kt56b6S#r8VhnGl8;`ib5$rD>nT{aGoZBjbL9XAGU<Q*p~T
zekH5+a;Luq?PcueP=gaNh0XgvfRn43`!(ZL>s6Yo7jg8Q$}uuOL|5^E4=2%~b3%B~
zqY0LZ(#TAB`0vI3C3EGi4`ze$<H68X>p2e3k~Qylu+4Dd@V=at{n-kpzSJAV$|UE{
zhFV~^P<m+zg@5^-Ir|vHGdAa1x~vr~i9FSwngs)+)|TVtjY1oD);4pzJNwGQ##D=U
zcB^`jY}SxBhLgyu>8v^`Te4+E((h{~b0MAtk(p(GAe_~^u!?Eur7z)@qPI`z9Mm_E
zWD3&f4!5;XvnzxFdH;-wbL*2<x$OCD_tmfZjxU330fgq|e^>*B<k(np#7=UDEmXLm
zrQYo;`mU9?nxJZD9Mj9bN(w?C1&WMI{|w+~+jnoM`+1Ga7at(;KXse2$FU{Ys#qli
zZ_&nHT`{tXDU4!!mh)z3z1<Vr3Fu$AmFM^WWd&d_{uHbX6-X)&`z+ejh@P|M=i;O1
zRJyQ=_9Wg^ep-hcuZ9`WG%QTqpIGkO^OqGOTF%?jGd$B8kY4WW&aXcV_5J(@Q}vDI
zUbgHZ?)l4_Sk#LhExOCb?Fq_X#k~K`Ab^>ZcC%R4ebF^d^|@q0>wiip%8`r=kmyhI
zV1n_1{Nvr!vz+#?-A*-|q%2|L4s|g`QYy-VS&MoGgyuKv#cPe@aBqg<yjIOl;TGZ~
z)xieVPnxrUUuT^h@zdXNX|_p87a`w5jh?*+W$?YNssUm+Aqx{%RW;hjGG7Wnbq#Gr
ztpN`g2B^3<BwUZfwjA+%h=f1TvF340mSuBp5_<1D2;l@I$$jblN2jpV!)GN|(i&ik
z`LKe2bW?G&+LC~A-_&c#79eWW<UAknIV8)qOUW*uanj|~^%&0RNg~QZe#x{_4GCum
zZ2S?Xty#3<XMAxN*<&fZ%x?jQ7_CoB7Uv9LSjLhZ)UIzQ21<AyU+8}CregK;XCbF#
zwl_{;g&nhT;(h!a>Y`|Cv}hYjMKVz=F1g|&5eo*yq(X84boCCI>Gbb$<r_8-;>ML$
z;^m%!+5@U@pFk|aASrI?+l*rxSr^R2CUYpUX$4O`J>FkcpdIXc?|<0*08E%DX@kTW
zF2)s0S8WlWbbJpal+-JVCt;FasXQDUPfqXiMS}?w@sl{%Lr5)ibCT>2+X6mKiaTWF
zR-?v~>2Y1EX|xM90hF(5HlVDZX=XfSEy2wEGMxz=u!TqA&80Z>Z;UzO7}!17XW)%*
zFv1sS{P2Ye`Dtk<&-0!!1ydI*qWZ37M=u5OOREZrV6)?(1xW+azp>}V%$7&RmPjz=
z43k`JIl`gdHO#ZR-m*w~oF3!}1yCzF&hEY$&k6Vvnhr@t#x2Re6hN-ZY<882PkN-h
z3Ci+7DyI1dQDDji9}Th6T7k$gi!iF)D*^=<8kz(ZKC^q-up(Q$^`W*ag<Jo!)W5Xk
z6<f+<t=KR>eaZFYAl{EXg%Ru)G;x-pufD_MvF+Nwtm1t<VNcfu2B^?LLrO~(ntuI=
z=K-zYL*?k%$-I2cG^i>&G^@9PB=VAC`Y+49G8X2FN}e-{sgB(&Zebg4M(qV=Bbdst
zVl~I4%~AOQoN_PqaI=`E0na1v=+g!VZxBmWe<SKc#-qObwz<oW$R}IszIOAsSP7MN
zK*dFV`v*!mD^HN=(In2T<-pRaToy8!ixte^J(jkZX6!0%>JdlY1~Pq#m;L28R>G}B
zK6>uN2>hHo=G^7ef_obzXn4WY&QH@6T07oY3jV(=L2n6%1F(x%*DT+-Y}Zp6wLMYB
z-$Mlqkoh~v{E1<(l_V(`-jo~SVMt5C>I|zE>N)*1OQb{R7k&z<V=Dih#oQcM`YvC>
zPWi87`oLWOqK4kH@$Cn^k*N>GI|;zq|0lu!eXj5qjSD1O{}l?~rxoj$Ahoo}cU*1x
znH$TFF8N_;!G|F8&s2SfbX~BeMb6o{?1-v6By)XFq-FCbN#5Fb8OUF?NRSCi+2mgY
z)Zd#21<}7Z?{CYK{oC?B#Yz5lo1coqf4j}U-R9qf<)f16--PAQsodXg^KZBLcdGDF
z*X8d#@6W~jzuD&hIc(D%%IbgqY{Q?^dnzl(CId^J2FIDfnPO;Sajsc9vB+Xx7#^~K
zzK=ow2k-x&;!u|iH42kHE(8`|&<ocmDIHpz<vMah4st^tkMx31QRM_7RPXc>|C3BV
zRoXiJxXU5ZY1q!d`+h?y63;^ekkCAmcU(pU_`ZqRN;a4&Z|KjK9LK--Pl`w{k3xN^
z=8qdxjD7A^YM^-euuz@nY(WkWhE98fGaFAjy~ZDP!4lEQUmHu%w8lc%D>O8P{_DGD
z)xWNhd{X^&CR4$BJM@z!KlO|#{6^FDvfJp&Q`Q>5_Ob4q<4~If{BZ_2?KzYm@Awt*
z$E60#zb@hIleUt<bj6>VV~Z<W&K5VGH=B4ZjCYNnZP=rTFv3rDh&|YX2b=Yb<%SY)
z`?$9IHBbL1_1+e!f%W^xoh<A{H2C5O?Q1mLcZDO(Y~1hV`tTsJG7)r#0H)rz;KXS(
z-s*t`T7}DhzYs8_Np$|nSaO>-%X6cF=2<fCIR%X4CHEQi{%^c3`?n&;J!L$bG)>uh
zE!}fLyv*M4R&Y9n<9yOlTzTrhmRGN(s;CikroG1-3*UARFV0Qz>z@>7>G4cCa)zok
z5tD{}`VwzEr-nJBU9|GQHZ<)Za1tDD6=9_n<;=Ul43tHRF`hg^4;r&bEN}8)n*5IH
z)5-kz2InQy%3KBpaJGU%^T!2djng&b=foWz@v|D|EqIYk=|>HKQRN?g<qFL?aY>x6
zSVzcajC}1|s?Yxi3;Ariz%<hGvO>MI@AxrXpMWX(z#C{i{!FwLm}U(dtT#lW%u4eu
zD+87W8~!CrUlB@Isr$NK?yR&?`cZ>a6vk2Ah9_?lGQS5W5mmi(B(9kp*rOit8BWX$
zwf6d_G(?rWr3x28?}o3A6JeHGK`FoAfSO{U|DjhmAbKq6t_H272|sb>;j^5hJHppX
zn<Hnt(ZcJhxKjs9aFPz3knv9~Eay?WO=cSWO0)irOwC-9NVtLPGiAzVX9r>AK8ZNV
zD?dpYXbFhkOo_*-IbU5#`%~BIv-u{fNFCf{%mz2NsQ0<C`xk>zOWo(kEkhZiE>-&a
zi2>MRqNMUe^XfxS@zkAh7ct(QI64fzdWT>C$oNnj)ItYcy@G57BWUb*Qx%IErua#*
zaJ-=q(199@!_7G^buiWTWc|zrjZS}ywbNu(2?5+twA5exSUu&`g~wYji55Ay#es^+
zr+H9cQl<{GG^32Y`MJNcQ+6dZUR<mkE)i1@^MVJ0*(1EZZj)CP6X8O^z=(+?ukD}u
zd>=dFDOGV34r*cHW*AhvtP<QuJ<t`xew?(uIMym*D|mg0YWV;i&<d5#LCFHM6^jQ5
z9|Q!0JfO2o^+1o?{SJL}2u7&H3)^*xj{S+7AaL~RnAqqT%N4qMHszFtd{Sf55sCL@
z_fDB~qTKGQ)8<QM_>bdr-JU8vdvQQnz9kX87b)P5KlXCxoa!+tLz&$~-EwRv?Ec@o
z!4xw6ACA^nXu9WkN6#P^xFqO1mcRrwP9x|9eskKKUyLc|1yi9SZJWK>P0IhCU1R*l
zaj6rwXP|FeYPiXRwV_9AdZFOmf#kJ5wE7Qvc>lt*DI|2ax4`C13+}0piX_D^Lt@12
z6Q1<t>V~xB)5?7<{(Xn=U%or^(J}Fk7MhG;{eeOe)86<1Qe+RE(f0*siJHLY0^Y8K
zx`imQA?ZKt75*y^xU%K9qO7Ku3}Hx%TH;s5sLSYBq<GOi-hg+OBk~j3w+3|<q;UjF
zz7JmO{KqcQZ3_zY+YeV|efH~<Eyuv{$TycZgC8;_Av-*%PxsUipC)d@v1f!ix{7^a
zQ%>A!>3}%wGOFc4q2L$zf4uq4yC=YW!;L_TwclRflL-clev;J$KV)2{4z*#EK_gi8
zq?3G+_<VEu$d}9+Ok4}61Q-i9v8%;b<nQnwbbz2R1x?jR4f)%U&d9PYE5JRnfUo}v
z3<b|x%W@UHaVK~aLX4~5Lxbjb9mZK`_KJ}E4T~k*nDN!psK&oc=a!jxD}bRGFdqdR
zTHo;%&wpO??FPb)FU;k?1yj-8#v2F$X*<vJ2b?<oeRFl~OM46;$RH?y(TkDTt;aUI
z?!TIO{?}Cw;K#B$)*rKh|El-(?^pgGWn@c8|5tc;KkWFw*n9JUCeNjB*bUcOq!w`{
zA}T6iTu^o*ZnQ<ARs{tiDk3`(L69Yh;$9G>s3==-MMaE22qKWE>>>nYCqQJ45MqQt
zLdbHz*NsbSO?%Fv_xpb5c|Q72B87XIYp$8OW`6UVFHPx}b-%gK(gdKyn>&o<c)4I*
zf>yza?@UX8h``7A6FD<KgBkxWWc_IVK032^_r^M|o(QC}^+JNeWq>g4iGu;A|M~>-
zVK@Dq>is(v*L5eHxZsd<b{M8}+0b>v-q5j2g0JoXxGey@90L=^eMDdWGsXG0GVh}*
zvm26|eHvAnzru!$s?4a${O+Dctqj2PjXI`3ppgG%L^G-~qbl<yaD7x|y5+;(M#JB~
zf;;}dP#NZ2QP@zpObp%KI<^_GS8KWGazInm$iwpewxG301~+kK?NtOFOn-+1{rfPB
z3A(t1!zYE(0MP3-^7C9Bm=}<Zft#v4Yd|~KzmfI)izD4LDj13_g^!rNX{w-wZRDpq
zDmVu50ME%)O3VQ0QXBcf?y<I#&T%5#RoC<oG@|`2s`_uwb|*Z*dx?k7num=+^WEP8
zYXAOt=MDx#H-mX?h^W#W**PKva=xaniIL0TQ=<Xup9&tp>^-osg4(kGu{MBKdoCC#
zpyk2|`ll)iTEr=MC2-dFi2KL;2DFM%(Xdh^^Z)T?2314B7Fbh{nfz0=0Pyt&8r%R+
zE&Ip13XuCuF!O%T>l)EN-9T_ZnRvL#epI<Yso`%kY``dwDi>(X{8QE8FVb$nI{!B-
zS4r6-XV9oL$aR9t^tEpkkg~46GeHO4fZLg}m2kbu*FXf23poNNZkV9w2pysAAB6|y
zHNYo-GSv+(Zi(Yw5w&14ymaMvwFp^-RA8}=%G{66F^z#i9QHD9M#BW58$#Az^j3+I
zL?rSDqjVV+lq67pXSHTa%;V@aMyeUFH%_xY_x2c(&@Y+hy;CK9xeY@8s>CcjVL_#Z
znKqv?-!ul&E`yu2YQkGeS;w;a55Ic%pn-R`B%^j(NSOvy5sXJ8Wnuen0G{N~swgzp
zl~W9A>qnbgZb|KHm(l@;aUo-6b+d|RTyFAnqv*pePnaD(w_TBva=8-4e_MAS+MG7W
z)R2yENL$Z+sn1(?f4c@~4J504YqJ56OYghLvRhi*iJ9xi2|pf>@kwkGT|-Jw6&IM=
z%I2i$syk0pdK8X}pOPghPVweNCS6DoeH%qj@EwM!uwp?Ew|O|(!qc&8Q9452Ht6kS
zn<ep{r*EbL;nUOV7h(CN4O!LVAkx+ShV-hf1M>rHWi1rjvFW>zi#t%e;)LlN>R!@3
zr3+qrKj9v23}Z57k$lD5cH0vjk=i{<rsDHu5#-_yQiYLjGoksRzFFx~K5IvoZm_TH
z7^V1UVle+6LIF_6CbROZX;wJURBlMwR$Z8Jq?5m)F1aAQQ=j@puQ@^ygo)1tu4L_D
z>$Qj2u{G7sRWJbp+2SfuyXV$*lBk10FU96aPEs-fpPE{<Oz7ocIQSU?Ln}D438}S2
z83g-&YrcJ@_u&#H3LgjhQBUnd)k|KvRlW+^b`_`;%RDChnSbCkf!)^1PBm)V)v*X_
zZo}<yKTp#3N}pkB2>I4l!2P9X6mjwMvW9XU_%+QvNrEiBD*X;$ix@D0;ECf=)s~Kj
zwp65cZMdqb+ksT?L#{_P0nxW|N-<3q-0nj?)~x&8;h4?kfN1oLcSBFmQvPbx&j_04
z?SK*?6PRScX03gHz3{LFXVd*i;CF^Qe@Pz7rZE)L7-B2v6Sp|EFUBMu;$=C@v6OT=
z1W6b$o@AK*?0W%jxMZrl78GGm8M>Z;gv23YI>2IJ#4(tAJL>fRR8*Dbvt&HDeV!#N
zBsKwH4va(@=kC~U*o_(D$-)7GM+iws(1T;TKjbhMTLGp!L(sw==5=pU4+s52+1dk9
zM7w_H+>hP$tD!U0;+(?9MjuaJg1k*B1NU<Ty`MvEENLy#@?*95GyElrD7LimYpWv3
z-U;1cbjg=TbfUnTxCcfE^<ZUfHBEZ(Ybx#6RA=p=%c>z7Xib;#pg!pJ(|Na>J-*W<
zrbU3*VW~B7nnyjY&neP7d>Y+Y@GVer?3y?e&J)L>gtn{ZG1v%>)Q@*l?&Ef1rw>85
zR#ihHzppy+tHuxq$THLyAfhkI-}f-kM{WRF8&va!aBJx@Ocm(t$4Hrw8^`lfK*o;`
z0oNdisA7TuH1nt>E_1+I3zO>a$L^`UBl0YnljZN}-g2T;G{|3V<kVJ1I&Sd--%hW}
zydZBQ0G@<C6zGbsB1r~#e`XK>&n+ZD9)PQ0h))-tntLX0?S(HQ+bXPN@D_|T@*_ex
zupBT0!{!sop+RO+Ge}C@2~a^$E*;|3G%ZZ8{IPN81nxuWmZD7T;H`a@29Tic_If-1
zo(UcS)*f~`M01a5{K1lxILqUH^!0vG@}73)wLkXY|I7RZd?t*t+gjcSqE6{-cC;2$
z@k$h5LieDWJoNRoxKgU_#(su1EJ}8^LCUwQC{Yv-$g(_f1^KS@j2Et7vH);ZI?E0`
z>8PyBLg?+l?XWl*8;t>s8Me4#u0=MWDTTQfll40#h1IT=fIIN<Kg=k7JhKQmrNl?>
zGL==hy=joqFVxO!0ASgHdwd~by6rzq><ynGfxT#oxoco{cWKng2a5N~29mMs3}YbI
zhTC9<{qO`4yuNf!`6mtmk5!48dY;&|%f;0QMfZIbz{YwWTc=(fduxXoHzUg=T2%k2
z>)qS=(+s19dX_yOsRfiz7?KVc=J54{-YXG)LD1Hh5?{MZQ9-d9lo~oGN)J+a1)BGr
zWCgZ0{q|WamlnH**DKzL^L9Z69Va1mq=Cb5?xY-7j=@0uDMj&GJN`se(NXQh@*2tA
z2K|-{fFbf&RAwdXD7Ql@QWJp)9IT>MO;<eT7k?chFNPS}XMG*AVdm;*20*V~rWioK
z)el41ZeBeuethd`GD7<$3WVM<5Fo{#X;Ud1D63XVs)+pnH9|^-fHc{mRSv}Wy~P>1
zNafq$a5HRdYOw>xVLhaj-Y~%rslyPG3C2wlwXz>Qf(?<3_#{rRU??aUGY0tJO``Xo
zLMlsJaxM&Tcnzg*JR}51UjLwviGnHw^#IOp%&31pw78z)l*4`lLx9IM-j^3W{0F5$
zxSj&1U}2S5s=aN!sJG25#}_n#w33hXg(9_0K&%_H>vB&tk43jMq@c{*BopQ`<b{=A
zl9K#Ajt<mahLhU$rW3dT`+H?+77J#VTlW4EQjfg=1aT#FZ{HBf90pRxs@`k@_bp(r
zQ(hTZ0=jy-jo-&2^|;1c%FAG`tG#K{;LJnZ{%J^^)3QPno@b2~A>dAezl9!x+SGq@
z5h68lazh4=MF=bc&X6<XNFq|22TnWi$OM;Ev+9#?ERfPV5WoR)`};=^S>AJa9*0!&
z*d$;A7Z7bLFA97C@4q9+NdW`{VnA_rridVb8^XrhKSa<t!}7h6cB%`*Q8<o9O2Q!j
zA^_y|KY^UjT0#U;+5qH`)L(Dv5iCS1l1>eu+yKXKGqcG^JtSVDW}&1*xPsL6;Khe$
zL;%wN?eA%bDJw|S0Y|UALCnnn(-y3bn<2RL>-9mX0wOFw#G({%;DJ5Qm<Ajj-nrBl
zfk-(GxRwF8=xLr>dZr)?F=q^F^`I{#>Se-$Dy!o;Na{j=*UmF#@ogEE$M+z0q5~o3
z?qK(6$2LFN`R`s*2Gs|WRGET@Py4*jI=4)me*4m6myMdVjX&%;KT#*l`MUiND>HuH
zt5)xrrDcD2;o2fC-Aha6RUEl<F(qZ${V?8joEu$PiM_Qku$9K2=l#vat%n<*5NqNe
zo+*!y-T!mUEwwfMH^=$R8Ea$e;H)q`L0LyBQ_HG+_8wE)X`0T9*s}xe9aYB$ueJ%l
zj(R>jx$qU;WY*Hzd#;Unvu50?%@gf+jiI?s+JF8VS8tuoXYF^LSgF22)A^g^gt3(1
zrHi8Sr_LR(>Fm~`*!sPGVI6-3fAWmbihx&=$py~Fhh+mPtDZl5F=0%U(h0RS?{AKK
zZ)Z4W)1kk8rjVpZ2^S=9LygI6!p96hPx$`O8i!6SYTC?iw6={oGH2}UMdQ&c#<0@I
zgU3tPpSx%idc}q)CGcWrt;)yPm_{bOaGbDT;o?bUO8VpArANb3*t<KG7S6ska80B%
z{BRtH1HmWHOc}FM9X!pOEedb4e8-$EN?32U>CoFP3UAkpqXZX}znB2t^XTp;p<^B<
ztbQC!on=+Nxoou{`=!yi2@Vw1wU}X%5%F5vRy|%d_8GY4`ERoCjR~s#_SuX%Rh`b~
zzsb2b#%}8gAZnXyW1JPXKbi`}psX{|s=VgK)aWApf_UreW+#SU&TQ3I&T2k6{LGYz
zvzCqlxBMpJq>AzhUITd7Qw{T{N8C_RPAHjNK6UP<X*0(pClv2)Su^f&aKW>w4K{mB
zXO2|z2gU)RWv<w_b<9832kmWRfIe8CDVhB2gGL-s*xo+hfsyn|eZ%m}sSnG)w(!M-
z@!%D}EzcG`3z_=Nj|<+_)FbR{QF+MJa>ohI3KwsjnF55?{s64>9#e<?3Le@I6E4I$
z^!Q)#pD?UegkkwZLwm06-+y4-32@69bB^yAJNRe;(6W1_6*J}p>=^qr6v$~cW!2d7
zsnPqC!Ab+AeVCAZMp-Aqdt}N5R_06P+H*Hp(BJRFS8lgd^4CD<U1!}(z&nb1@_H4E
zQ5t=!2r0?FKn3n1X_`8aYsttq{8tO?#Z{&-nas;Yv@nU+BHkfn)+c|rb-5}ERk@Jq
zC28%lMyaY=U^BC_4DlU#El2e5(xSm75yCad?84Run$AL@@cwW3MObNk?Fwfzfi|U$
zSZ2MYnK3d`_U8=+8?&aSraNX-@%yxkYn3VLVwSkS|1$a4>_~*HlC_;_R!)xbu_Ak|
z>v7}+V`Jku!oYdd>803L$i2fIQ(tdyB9VmV>S0X{Q}Htz+*k|y_9CR5TKh}`gMy5t
z-CV8*t$)+E=W<2386qu&Hq>Mwb<u0Zda%5GOCtOb)SZlsjKp#EA($WeU0q%MNoGKA
z`PB=+7URqrkx%`4i&ZOA#A5NzlRfFA+nL9z>?PMITx+RmY+pV?ChSS~)P~&L-20n+
z+w&RvOaoW50^J_WIBve;j+y?`5L$spPlKs|M+8kMt8Z&_Acz9Pu=P<4i~025fD&0C
zq(u9UDR7ILn(P7&>FQcqT8g^Eq`KK#X}jB{NQp`?wL#`xW-nPtk!sw@IgdKI6q}3C
z7IPyfEXbtOF;|M;y?fVp2h}Gj^zy93M3RxRs^gR?x~c1`EgGAfJ5@H*f)O%4u^^5y
zTZN1@9*v3qzlw?Se^RELJ9jPy-6{~QC!Q`cM96%lY*paCd$-af6}^Ob3Aw9oP~d{+
zG)^TiBwj`As&F(zh9qg~vV|6+g9zHB-rm(qQc->H-(TX*5ba0s!ZMl3oixk&-=33<
zi)iz??p<iRmC&neVr<+Ig)Z&2G?6O%`T2>yi$-Xxe~dHI<HAmeok-FHw?s52BO{}B
zLwhxra4LfsNNCZrT^1f5j_557cgI<@o9nG<-fJ)UAx#A%>CqRxbIPs>G=w%;WH9a+
z%FYE{C_~5!uUp|<MG`%Mu4Sk*FxEZ&(?w{*FqZ$2wnhQ&l{Kcf^;Tf>VkRNGGoqGo
zo-K${g?5X68H<pUtQj<oEt=X;Gv2VTSy7qkS8MMc%B8pXr*ZoSD!^S=vfVKJeh_8Y
zbMC1jv_ZW<e1ZQ_6MOS9RFxu})gwTi6f`hO8;Oj!86I?<2Zx!MF3F_C9IKyiAs99>
z*+&=nC%dID6Z<v=Vs`ahEX~f!%BmEGS{fS8|2C0~A>K|Thx0J03MVCcPx(l>ZxHE3
zFl2efTZ(_+K}xY^RHvgdq37;2b+MVS8MyZG%pa7pBM{mxwf3e=XhSiZR0dx2Mi``z
z#m^IOtP@$DWtu$gDUunoY)zRa+qn{~nIl36r*!M`upUflNX5oLF2A_>1(V|@<~3#%
zQe7K*NfBuLLCp*<v7u97DGj!Cb3n*xA3O=93Wuml-J5AowU~O?@_Wpwhs?^X%LSw;
zDlWzYiz15ot_`$2-=Uw>klHKv5*E}G=C`XH@gT)fOH=X9bu#aY_4e-9xO9FRDd8$F
zP%sB5?|!!!uGlq^JYU}=qtd#}uc;0pW!lp-$&0XBl=kQpUcn>DKd0dBb-UZazKiMa
zLz6wI_+3n^ogAb>H?XcNUt<h^!@M&XbmzKXVhJvo?=BAub;`moW=3$$j@UCN6>&un
zZOYfuW%FdU#09qo2E`a@y3v_|`*3pP;8C67v>wER1}z<)szUG41a->;USH&42Ejbr
zWTW5#5eJe%p<Mxa?at>HSqGO)PSDT8i1K;u%O5hZ(ppkz*H4neYIlj=YQs@}*ClLj
z`oO(->+-GF-Q7;a)u|M%++%9EiNI8Ze&u>sSY!(s*?NUUrtbc))m|cEK<=S6Z9Ke?
z4hfeJC%)8{f}|Ws(Y<%VK(+A0zRAKecJ7(~MHW%kVo6vVz8^1ZV#s{9)vANP`9AYI
zkYg%UQzi6S_I+Q&#!7og;eUKqfkeIhk!Vw9bD5Q?A*QS=5cnC^?O>`jw!DpXZ0Kb#
z+5q37uL6;ZGWa357hk&=Q3zd23hmGvvZQAf@7zOz({!JoHj*yU{mZAV`1rKEM9BNk
zPdmi)pUUAAr4nd%<(0wGjoYBkjo@hG!PyvBWL@hN;|8UnNolwkV-u5j+8~H3&|KQ!
zB5`w_)l#t*lSGFyJmNCBxJH>r=r3>Pd>w8uAjvuUUugt=NK99)92hhs_RjO48shNB
zr0+8fVW`l50*9|l6ru`zjA1Q`(0uMVp?rQTNz&)X2SUckGDu-vKkd`W19^|QpDZ-W
zYLjbPFDg@{;cY?3kL%%kOIA389uS5squo4<?$uvMUH(Ibk<-_zFp|_>{#<39Ix~+Z
z7K`rqNJZ0GjE;xg(=wu}*Hf+PX{l7HTOq2?X5I9Huh;V5NmGB7+X3MM8>8*6PbD4n
zUyKd70B&j4cPAzWn8Tp1CC!5w?(Qs%tS&hUBndAA`zvP0K~4{m3RZxGJvub%5)-&t
zj!q^dca|EnmL6u=)}PN0cN9}Iz8@4ow}ZL@A0|{sBamf=kJr-(m)lnydXOefu6=M=
z?Ajo!tPu2QI+F2>crGtM7MqORt%~lq`?O0m2-<};9D}}tS)Q!5hB9{0z)bjPf5x&s
z3A30kxDeEJ>>ZD1$<mkIoXI4I5!qHVg3R+h?7mj}5oOjv($oVob;gNK{+9F@x}2(h
zOPr2hS|6d3<!7tilPBXB7my_NggSwgd__W?T!1+$)(y2ZJB3h@ptS)glz=p8>yQ>j
zy3gr&@|$$>{hR_@!sf%Y0ryBPR*HBb1!&h*`au_j-dO8rQ^PeT{hC-i5?`Cb5OB*f
z$_vh2%_$P_H!z5M8U_!gPya>z{W^qh2P>5}s()bCqwMAB1JBks4=9%L>U*#D)kkn6
zUo{WTv@n}bk}8qDLGFIqc8TVfFgtwRucS)+{4XFB?jczkLgg(-tYifaZ8Jp`2%Q%G
zS5|a>yV^TQ9Po=4DgDbrUl>%#o}Fw4s#l;Mr>yg_5DF)4L6PZCH78KW8m|8hmq~s7
zRaI3zX>5=S!77W+jvxj-GvzF(K7o?fhe{y0xmEc}2FP|!b=K7dB@EGnBHa<ho7&q}
z!O#Auhkb1#&I5T`+KRsEBhVaBr3E4Z<>n7{Sxsk9hO>*OFid)f>mEUyMzEJ(On}Rt
zpqBcfN;q{csLV#OK@vzo2cxi^uo$sRf}Dy1B_<}f<r4W<1fLY-fD|Z}gQm`XT!bWw
zpL{M?4P4U*q<cU<S5D~vFAJ>)g5g3dsOAqBy@!zjl<<R4n_f7a)=}AP5<ddtxav7v
zHwVS|VbB33cw+g~hDmEorg4E}=?nXwBc}VHRP>V*wy>8`Oj<Ug8iHJ%(wLqKdx!Qo
zq@L5V+aYQp@#cuqlyY~HDse{Qh|m%8OvvUF2)*a%g}#KM{Lc_JZGkTN{cvJBbH>-X
zgAo}JMcB#Nr7>V*&r<I@hLC=lTq-Oqyj;@!3b;H%T9Ne#vR44p1YkG-+w%d%G>jAy
zFQX+8eLq$`qDGM7lzY(`@$vD$EDO8<9=S~z+jUR0*SYTsQi3=QPM4Ho8he*v;6+fg
z31SIB85KLzAA`^WmaH`y$K|42d;<exSZ(2Lm&qdl-pG$DzCE`o;1Cb@TSo@I6=an!
z#2)z1&;9bR42q_|EDD4em5sHv;6TXVJ)$zdyv58i5|a|IqjRoH6?=okmhZoxgU~{*
zw48g02Q81)piX2)Nqr;Kky=0R6_*x>Qo~m>q4|uU9})Fr0NGH8m^RS*G+aFC(jRDx
zk#pZp(CWj(wf~r6p5*n!n4*!S^W}vw9iTXGd7-DX^N3!160WVKMUBokCx#^=cLV>R
zplug=W{SF*MLbbnAjfUdJcKktv1PbgDwG(NN-f_T^(kQTcDCn@AP07Bzca{z0Tkl!
zS;xk7yt4v#QypYfI<t`6UTc3a=*Vy>KoVUfMk>nvzD>PUU}R#V3JPId_wbQIF62G=
z_<BgM%+E`vUb)$%1R-fS==1kFlf8yQbt1?J88<;oEOas^5Qc>WZl;X{$|_HvGun>m
z-F6d%CMG5ZMHVd?0U}UdaC%`3LhGIr4!gD^^`)i5=g^~$2pQexLIB3QPlSCNT6zh*
ze5LMu{rTU5({siMs&Mjrk-)?ghqD|=9nJxt+hZE(Ca2EvuaevHFZ|2OwBV(+r3k4i
z{`Niq>GSi8LQ7`=nDcbRBrG`f;Q*Or_%NY(9YTRxAPOWox}vy6WITWg?HiAfX%wd5
zuHkh6j89~{rMVa($u<E<hEJYJyyVJ=K(TTce+f8}-&PkqZ|BV%5ztuPS)aUUdrEi<
z2-k@hkvpDV1Di^x$kP+VdLVz~fsj40n~k7~t_%g3_lZcQj5OeU5p1n~Y-b{LfS5V<
zzwJU<Mv97xq90>*bzw*mlDS4Wa^H}Z3BoIe^%mMl@B#8vyChOjuK}ZRcSqog5Zcy#
zxAB4tu)o~hJ`bVw$ua__XL*8XxpSZT2x><1&nv)CE>CD`1V#waCk4Q+<q7x~iW?(w
zBf-YYi@-MN&Hol$v$d;hIY<p|M<@uve=kNA`nSU&`og|mgxs3RrQW@8tAOZ?qyO>a
zMXQ`Lb8<>?$K!gBSOhf|<}ZNSE3sa%GrfV7#ft~66+4+-n*QbyoOx?a8o1wxrlWi7
zRc&cJ<#<RSd9j!JGpylDbP)1|CEgDV>`qHASm(~ubar~_jV27%d-pXlo@8Z}_(?AD
zF>D{P(|D8f?=B)F)0K?-Tpy)A4g2Y~Q5<ltGUv7Q_V)HOEkhL-m%wPd@RFb};CA*c
zi7)XZX(^IxA}ZgX(xX2NrV`hn*B1y_?<E?C<7p<UB?51KtXKo|P!zc>ShpA%;p+HL
z!tOL>5+^jcVRXGAW2RYLTphthQq7!nBMy2)L33UuBXkDY-u%2)=P8vH2qO|c!|G%g
z0j!Qpj-$yWo7$*~KLn=46&yw;`?8ex#tncv6zk`saO>+H95xeR4EQ<96mDfj*e>bh
zvYE(<a3A3NePJ(#lP2LS4O5{qp;bB6a;G6wy91$ZS8O=gI<=v#t*uK}RUgJ1ED^9W
zap4}-lwNCG2UTjxY#efBW4xx1q_;+n4Fs!YWf~Z<HiweD!M8mKzzzIe#F!)Ep+QO-
zyPAT(!0o@X5us3}?^^)Mv&bHN?!YYkZGnG4z)Nc^fbRB$HxQ_uHS3weY74CX(ZImK
zp_igZ^I{Mx{$%WDT{c*4^3qLNuswBc4{>Sdg^*q4VeKmMDe0xu-x@~-l#?4Ir^I%-
z8$+Rwq?Sn%cS}w~5nUX(b$rh+p#P^W;vL768U7}_^DGMz%5ybDAzj7+-LEXDi`=pN
zp(WgrI3p7D&VsJhK_XO0oC|PK=j7s|WFlOL5<tU2LdfX@oa=Lkt0WRDv50>$B&jA!
zi?2P(!_7K4q^ol9;?xGgOf@X*q*y{@v7&ik3jSC}kEV}VU$y1F$HBg5B~+A5naREx
zH&}t{>17F~%khpx86PtbVEY1DQXYhVIo!T_z8C=fKrf`Eo&gP9dsK)Sd{@i=epcZZ
z9jU~@NY*R$JtU$q4YQzfVEAu7HLNOPL>e#xjZ6?Q3VoIk(q>fBGiOZORbD1!gc-qY
zD!?D0p~o-Mr-~oc6Q1FIHf5?d_3{8%ZcrtT))yNBS++Ap`MPrQACi3RRT;EwzBG~5
z1n`4j%D5OSi&<?KPJG`)W-r$Y`=XH(daFUdZuZy&5>`U`cR5P%x_s*MR3*rT%mL_*
z<Z;o=L{fI<?n?WI30%w%JtE8QY=R(}j6d1K_2xpSleY=>QZYoxTR+1rM|#nAWvwLA
z04)#dM}ppGfSz9>lt{mt_}FB)>3AE^5YWN;#u~8G!%)Asa#56)kRA+7?BvOEuRSt@
z|K?Mh@t_7>(gZM>qHu_t=<xJAmFc|z@RJx{c>%w?yGS&(Axio2qhBQ)^bXU&UL|8E
z$hPlJ6H8CEO>n?PbG@W_BtSAbCWzbD!?9uzFSmm`MsVkC_481+fCkmY^(eTTjj@~4
zY;VP^vvCxg1xT2d*!jdFw`!f)$QX4>N!q%bVQ>vQiN&u6n}Vq#JrI#dltfhY0_*gk
zgR3ul6vTR`URw4T4-GnG6zVOidwGNn%}HAOpEn)JkC)k)f}S+suG+G~+RZtSAxhfn
zH|qyQu1%su-8$%)=(TW<Y0|p?uoYci{SU-DEk5n}sDUDY+{-6}o<v~}rnx7*o}p7`
ze<<);A?q3%AFfQX`A=Ku<t}RMTnn@P%9J)bJ4o9dLKE%Z2LOvthC5x=MCq38=HxW#
zF|-MrYi(x8)qBy!!QFp?R1CuHgYW(W=q)(e<DcUWbvc@at?g7H6cIrGD??)*@r9H4
z08>a8_<8J3i+CZx%_fCSM69qt{jHw=peBL=Vguaq<b4AUUPIP7XC!B%>h2omhA=!X
z;f$G!OZ<9FCVO!1<aChtjHE+GUQ)HA-o%NM|7|_kNV42#kCK-j)0^Li4vYg)Sdfqt
zi@T9CSmAZ5jdgUWlaIQ(-ej*wTf<X4>N!#eRCiSRv37s6ZV*OjS}*W7pTjXzgJ`Iu
zwCRFa33UN3)-Ny{cRy>voQoMknV||&8Bev_@A@xr6F0=`?KGW-TI<_swrzcy@v{-4
z>*NXc+^Uy{#0+6TGH4?O9a^=5oqCSi2t`Gx{6SH;2532^1+R~G4U|mQ5zR&F(mymD
z;yForEJoC@F3(zt_t;CcD15jvbOe}bxj|D4oLSr_&_}$$002LBX-=?hkJ-EuAsyd7
z0ikTpf8T|;2OC)|mJz7Sv_~PA2%Gl)pvWD@34%W87=&{1Vw=}%0>{H;R^vq|gw8?S
zq$fE!+vz<Xbs)bqlBQ~TKClFoc3iIFTk}a&(cs`UtSk?J#t5eE>IfYc@%s0#;9KE}
zFggM^lqceSpE((!xCjj&4dPO*O(1thW#vv<HJo>o6PW(Xz6E)5nFbfL6G1T>z!I_e
zI3a;vREv~uYy{=6oy)Q^i=)c=fXsOUC$E=<2*qmRjjxvm=32Hi7U7OFa7v;z2-#`u
z3n1bKKpOxj_`2D3CVJdK6rhR-mve*}QR!|8r~_&uWw4RGSdgOv7lvT0MkuLAn*b^`
z9sm0;b{en1Z38x|l%;_fd<FX=<9@<|VkEB^3`$)`k=iCjQYqf`AgTbk6WJQX5LW+v
z)vnPe`jWs*UL-myqfr_Cr$l(8di1Z!0{>^oNIVOi>zX8&K#dZh{U#w5JnjLgk)NCx
z$Af}i>Eao=xtj>w&Q4Gr#wsHQZ&qvvV8}D6QO7|QSBPiGa$kSI3k#8oQI~y@CucRb
zn=j%a75b@V5At;_G5+33cXRdtehIBIHs=1$cBBfjCZ{hKnZQ+SGNBbNMWyK}4x@NR
z!q6qRyT%Fn@$hhrEsO<)gnHTmpW4mHrLh~En&J!&nE~*9Uo}tUuHYf&7V=(2ZAJ{(
z)fWrRP6KJh;g;hgi?QD!2E{6g9I7iVZ8=gD<qM7qxMxUZ1aF%h2JLZ12nB#q8Uw2}
zo%`AlgR0mT_kb)BwxJhJ{ZB81E}<`sh!#;^&JZMH3wk~zW8reHb$E8&{*f`-$wd$F
zLEFrC_2$NDd}Rt;Whblp_p*=wntcYLvgtW+^<e~4wPh?g6nuNG5*>FOB=FJa5tGn|
ztm@jpk6BgO_ZG-yKJ%^CF}?NX3zR7pyO?ce3B`yd7&d?$0H)2!@7L@oghXA~*Xnd5
zu26P8$QYsQjUpRlZ#q&Luq{Qf35vD=7|*U~<2K+DS&NTOL1<eq+VH>jLU50;pmU~(
zw}=&skhXN_4=~ol$?|E7Sid55%^wGP=74@)mKuT$vH*vTZ37uT)=z4u@RqcItDvcw
z*9`aNVQD&r7*W6V<)CFv2zi=KPXKwPa(r1N&pwu&8;|?V7_<<J|Hur7zEleZBGryl
z*mreh!)sE>07x;e_5}tqXRyVIQS66l8+_Qe05goM=>5)iD(q55!hRsHxdE?k&#~ab
z-2(59)pa&NgB5@<_!fD+$t5kUG%qAQo4q}iTj-`L>cIv`R65NSkV=BB6F;bNd)Sw|
zD1&stf4(ckUyXG;g{R)7LTA~EEyLt+vgX>UL5W!7z6SbKq+sl3ZE1EC4s<_4bdK;K
z1Wyg7;^)=_;yceySzy5+6MgYPJ&gL0f=<5V!71J&qC%CIoi1coMFf-$J|Vk-T1c!c
zF7aKhlcuxnyq+Iu{ojd6J=b9-9Zr00tp%1SdqO3?4&myoN62uy9T4k~jYa7k2Z(H}
zTxJ4uv<+}2iCLgdtuDr}0j!M;y;y;ey|msub*Ew9v|7c`idkdE(D(hg*>qQ-V6P)n
z@re-@hPuW36$yHvSg9W^1MpH!V?f7tA#`hu3A6B&u?EY_5j0nIvNFUf?~)uCfHH}7
zRKgH-oA=PYS*lE#B)Q-BBW+xbwIOuDZ6y4a@{R(Sxy(YJoC4a;W4qnsGF3DWngPZz
z0X={QD!kbgJk$LX0#0S#Q4hp663HVzuE-CIVonOZc(xIg=>=I~Mo_gWjaTn<%_H3N
z6I)#U+@tI)Pj`f5%{mX7fp((1jcQrZFERb~n1Oj80dP_WDm%Nn$^fZ)l$N-=dX80>
zxrYLo-SHT=6L9&ccFA(<sHo@qggxxty^5^UU%M<m3zAv?6}X8m35Rs<a(WdZiEiIl
zI5G*J^%CI7AV~&&{-1DUP(7NUVR-;A>$YZH{GE3#Cz#4}h&v$BD$!);lL9h(OIJ8M
z72(7!*p%wd|7YZIpYeG{l6DfzWJe#W$Dsbmw+1uJ9!sn(&RCfbTE@CiP^%MF`WD{)
z*=<;#p_kq(Wta#YJ4&uV)3BEb+ul_Whnltn?B6i5ZZ#NF0fttbAjw);VO;@|Q#{#@
z_!q5TOm}!6PUwq)8P>p@S}gb_m~!v))Qxi_nJ)|^j7cP}zN^_AbLN_?^bBC{wz085
z_X0PFv$>dj0FZYMn+~X3bnY?lVou$$zz8mbMSR>?qtGZTNS@+Xin-5U^!0`!K_W$>
z;Z{yB7zykK;D0;esUgGn2NNv_145!P(1CDSt2`a(59d#=VdG@)Fdu0GKR+|EuY^?!
znDL-N)=v=DUuC*i%G3sC(k|-~zCrC9^%c&AtSjVr$4|gE8349%YR0mVs&fvbkOZWn
zbRBV6ZB||UGq{<sKXYR<v&40tZIU~7Zx)DJ@Lm!%^6tw0Ukl}54jhq(@@nVzOgqFo
z2=Q0)KU2X`Nml?toI!~|+7{jv;L@gEPu*Jvt+hfZFSL}z=3oH%x!{(OFo(i+X9=z{
zE;0Su`tI;jg00;C!`UwKVxMBiI%rI3#gIV?bUaOJ`KmFEd^ty897v@#^y+q+vm6wX
zYyQKjDDo1WktOdzCSY(`deFeR_F9t&bWWL6D(y0a(@+!#adm|SQx=CHPHp?jTo78A
zQElojNHe$?sHf;7F3rI>gUDER&jUJJD~lKj`ItPPhkYS)`bo9en(ib9ESbe_9S=C|
z+5nr3^Vh?Pl&*_v(umeH2cfAm6Vs<n%zurLLefry{KU@4uDrpbM?nMMwOj5xscTgp
zHVjAGxo#4ZkFq4J0$4PMWKUKULa80`cMlVcomj$v62_BP8Sjppi+YM`jv3y)gpPC6
zX)epCS%uikf&5E`<Y93}`TGNQ*k^*{d{)O2gd8`F3#h!Wa4hfUwS5S6rs*gxL?%=n
zz0jY=2FcCRdGn3o#>Lk$@UgA*!(505|96^QhYkzqQaGEbj96B98vhC~5Acu?7D1vY
z`VGMcCzIi^G#$bZ^$Dby;|{DGTt4C<EAkvd)++2?(?C$F!3idLy+n%j2V50&5<!v=
zycNjR2a-TPV^;`%3|8Q6v?UBF3-@byQi5owUWc2U4iF%-zn#-2&zIwsQP!p<*oA#t
z5PL$<{=BPTrJ2k*f{YN`f$ssBLupA?CbH}dz6TKGB*<C?_;BVTv?_M--<NxO0-8vG
zJHsK>3i!VlE&E@H-*o^Tbx%c8`x23>(3tgJ=}4Pdh*?aGEeb?P(eRU1x=0IBf|p`P
zLW3<YVYdl}?q2BO6oGMdh?R=jAagxEbwMFIo-okT($aqgF0xr$fUfq++VD_NdPO4>
zM^Q@Pv1TjkH9*bSKRMX<5NjjMGd;4YQS#1%!z`@<hq4qgOwb<znpSgQ<TQdo$Z(_h
zxt{#r;Jy<Ou!2%2Of;I0kadT7%03`tUx$HMTOD*P=Ln`RA|cd0;_GjrkgAThf@l6&
z(gQva^W?T1k<CMnm8mcG!$1nq--S7p1Q3=;VgkTGt@x>j(6Ys)Fr5%60|W4iwI8VB
zBh{hd>ks1%6jEymzjfB^2<&xuO~np?Xh;Pi#L6(YN8-1D)f~fi=iFN`hxHhmOi{sX
z-rlZ_lnyauW*)RbeJ6N2PzO(+;D|Lb^pgBUIE7e9i=PabNxCAM8i$(+4M9KuT#;1-
zVyK=O0+P3&b<zzkW;u5YqCG<SAj5Hgo9{3Y(<L@0%sUqpqL(0K+)&q(?+?>k0xAq;
zgcfs@>h*sj)hlAF)?C<f<cY`%o+F4u?x-vD0$w<{PFIbXgqTUlQPgx!oq*6z5`qEO
zm;dW{@(?538@<q%1J30goDq`|ei}I3dJ>A@ZnW*~<B<yNwE%+T4(PZ91>G1Lj6kCM
zdV_&+@T_6d*HyoNIRRZBsBRLV2Z`BOZw?d0i)l{K0T&p~`2az_Pqx?zE(M1HFlR>;
z&J&!5k@Mm95>d?Wd=SK0Y(A-KdEZuqvc;&4KOG{$WJ%T-FSv}oHx{f1g4w{5G-z=e
zOe;AM2zXq=+*zxhx-G&XR6+tl=DT+m3sTjG*>i<K0PP_awE1-c@G?@#LH{yhXgw&m
z0F6n+>HUTz)bmID2WDP#m~v9yV6l;O?fLruf&zq_7*&Kk2*CJWQ`QmnBDCG@;*$^g
z4o~DBgrUx7+lWO-9&6lD4uXT{dV&<VFeeunI_duS0%G9S4#1)I!-bwZ@$iuqF0TW0
z?jXpSHX~K}-2|>a6FzKoYn1IO2hIImQ5NvQKn1yE@21&~sZ#d!94kQUC999n1XSJ*
z&t~3o_lsA7PKUcSeV~L3DjV4}RC&hNEM<4803<*_=VAWbnhQzN$&?*e0?VABj>6~s
zWb!3m;2AdEn119cH-(<0k+BjXy;W?l@*f)ah`My(Ao-oXlZ~^Jjb9+(g*%=+Mkq;)
zeg~R~F?i+`BDGNgF&qo7$DNzmAgdRoX@!TbtQ|ZAPQP^>UX-9hje^@?QSBu&<8_O{
ze6!jB91|PxY7uq?LWyTVOOSwV;hA02`1CsqJh|2c=U!FPSB*+Vx98N&W)gGxE1J7F
zw|=A=Hv>E+AQ6U-{K>b@B4i~6+&Ysyj((_bl`Qd)3HlP(&=uE}a#7KSNpRU!YLWj$
zosH4srU%cxf{aIx-WLjzE!}|&{K33Z-S>TWqUr+N+bYYb7>Pd~44!3UoV>*+D4Njm
z%y5Jxyi}zPG?$3gV%pkDCyFtLpq3-N<OB~=nD6awvm^0HnMd_RltE^rlOGpkH7GQ}
zna8z+sq72fTP0yV^bhoORb|NG>1y+>Vhtk5kDk#E39^m+R#e9wmyLA^{6roHs|r9Z
z1`3H?$l~at4ru<sEhguj#1q{t3H}OHQks9ef3Z6h1P@>hKge3oq?wp-d;HgVU=JGN
z?_5GgZ5nD*(MHBj{deNipq49)VqH7kTLfK`J3V=V6wrY~7+h;Wiu^Ex)hy40m`@}7
z4!w*>{>G2SL5g-zusiz$<`=poEj*i3#78;#PtO*d^w6+Riu%JW*4;z)?k@(A>QFmc
z7L_6hWo$Hrik-|Jr3Lx6N)l-uG4Wpa0eO}bb?gxIkV<4aVS?V7wWH)sWn$AIDY?Me
zSSGV1Y6Ezjt2Y=&at%xlJ*lGnj3`1uF57C`P=Hac{VNW%K{ovg%z-At5&z7ACQJK7
zGe@S)`yIx%1?;oTOB(UINrK&J+)bH%ENn~Kz(co%P)%*Iko#o60$>&Oz(_Q=w(xR@
zo%#AQCQZ&bYc_)@bAkbayevpcx193@pbaAy4UY_+#F7Sl1!z+wegw1;1c2d86$Zf#
z4|TnvqWq>s16mB@1FIP_(Pw77)<SZ^MaA)f9xw1v*B}-vZi&GJpu08akhb|AGP(ql
z&CNY&%jEr$YOX^r)m)Ft9aLmsKZ)QM`DenmMEYRHhuN&e%ZZQmerIF@!(k-1NRq><
z&xa&px+LnWM^2>2fr~+%UD)5p-V!8J8)!SzkHy<BX7zU^ZtBEv2bHpZR&jz-j<lH_
zFo9=jfyy3CrWREvEGWa&8N*{*Gh><KS+WA{bT`?LaVm0{CL|2vAak`%I323Qmi&3V
zY!V&fz+`#-D)fl2UZE|K7z-4I$oGQ|e9cEF^Mql9g^<+{^fJr&Jcgj)fz2?$sxzai
z1(#kr&AZN>35floz=UDCCf2y*_erg95QMA=&cwQIGcytU+k|5z5piJ3WtD;hD}(7r
z7bqU^c`*@(PV#V1PQ^QVh?VZODf%ZzBgGH);m*ykHA*rF!BX{wLWNYAYYyiL_kjZU
z7gg7HC+*|h*7YVHo|?HM9oj0dR%TuYwHIdST<=RJ)e(PD3CEvw-&GDz48UTrFPJp0
zb`wo{E~x`CM4k9M+TGx*Xw!O70V%M2)|gRg&uQUmI^w#zJ%~+%Sz!oq+tE&=!N6Z=
z%wtXVyO|<1It6{*nB)Tip3l#NTEi@5{c&w=H5Tr4g9aC7_*6&Ye5Be>%-_NUk1g&&
zl)4DX3t{%2_YJNGGz7#V8J`grL`6~YkXyJ<QuM{(1_AE4$+(e>{gfAyN0sk2WfCYI
zPX4_P#TGq*?&RJ_W&wA9yvnP?&uFMI4=ll^AjQv&zL6H}+pevU+ItF3@|G#;@5C};
zE<}u$M^I`*LHBaRj%QIn+nO4t;IGy#q)XQK1^Q;+3GzK8X7WJO)19=?0;Z^D?pcK5
zh^WWp1pNHzsG0$Vkq=~*yE5-RRsblH5V?lZsQn7tA0gF6rg9V<-J|Qy!5xD1ZHNtN
zLM+QadZGVc7kNgPe{}iRAV7ILsz;-GG^$4*24RDl$nx-Eqg!Nji;QlO(Jhi(_$qvV
zXpKWBc0_H5qh@5(jEtI*Q8O}XMmCHFTBBa%?5w3@o`#N@9sw#%3CcPrtjb3n<fwy0
z!a=s11M1Kx{sp}uq7L07V89F07e*FEp-X!$O{B{3eAMp{8YmN;9S*ndM{(A{)x%`+
z`-6B7%g^H<;i?f!QcqMpg-k9!I{Vbl5Kda`egDs7TIu5&MT+}}Nivwdn09j?grJgr
zR#cLs{~@2u=E34a!#yFEp?7U)Ll;zt`#Skc>t&?=2F2b+*=xWr8+88!Qtx+VCkvi4
zNrx`s=k*kYpv<XKomc7~r$64RvcRIYrzT4U4VWGn@W#2Ph7g{qIKK`+BLG6dKNED;
zd}PofJ(j+{7wu7<!AHdkY)mh{M23lN`^o~^20``=D*9fBIoeBdF_AZi<m;<9AFyTF
zV-4|A5u?7*WFa@-cP>H`{s4ps^o4QHxtl;ID8{zcJw-AzCz!AbdY-Tw6U@&;?8UC5
zZe^lR=YZ)ymhLD!-$PK`FmULuuZ(;Pp^3baAt|_Uz_uAQFjMT?(2HRwp;MqTe4x8H
zw~&;5g()CqQ3tBah^=$4A*7Z2Lb<03!$RZhX>q<^v0ouN|MBP?L3K*ScZR8Wt@;Rn
z?M;FqgMvASZSy?<@fGyC(mHHDB&f75^J}U@s8^_c4H#-e`V|Xif^OjFZGkIt(-?IP
zhnW}$Xo~9@r0z1VhbZXahi@=E`VofH4yKyZAB&x`2XRlnleNg3d?ORHAlJ~EHXhVp
z+xLA<;(D`9hdvKajDmVe1wO{I7811eD^N=~QDzIXG?5^|R|pY|IG+deNnxekS*z_X
zu(a~}aVt+NQ#h@=BnG_)b9;i7DQnv^r0>afL?dQ|P<CB~J%|%e{8|zu3?w35tO$_g
z@MJ>B#PR1pGBU|}*iZlr6asU_{HKOE{7w_KQvDf5QjF^a^C;=!deYY{Qj$n`<e)W1
z%myO|>3h$2vGz^Ybhgd|Lmj&9(D1xgRssNjuLYc8{*n+2tbbWPq|wKf^vM$<K@jpf
zyx4filAcxkXNXEAR>J%+&k^%-=brhSK67sQ%o!`Iuq3R7$0ACxvJ&u1FaXLFp14^a
zGWGrYN>&-T7?IzPF8Dlv(yIK?8L3lfoJ%OoEE)3$Kn-<Gy;HqRB4u=B=j0gUy~Oh}
zmNu?~ZkL6~0e#8X7zy{UrhHbjK8(y93Skv}^~AlEm@+_hMi*s4tNt{BQdW#6>cUW_
zHln7K*kPx$83^<_jY#DYjM*hCoXPmR4f{WmTm`r@&)q=~QL>$ONy?~^^ql+E81#ME
zVubaFf5*-w6<)-&r@PJ#MaWhKO%dO$n@7CoNE7!kI7X>BYKOT~J&h<yu|;!Xp7x<U
ztFwj>V^17HH_VQ~LxA^jNPjrkA<|N*c&3Qd<9`rpaYb%0V>`ab77He?>OTI&ZUyCH
z#qq|rSnl9FK5`^lhO?z<74Hlfy)k^INd#GTNz$Ovcc*q3K+PT||Na1tF?*78r<IBj
zep|<1^VTN8BU$~0<XOH4A&t<Z%->0_9@Gz$T%iYrXr$b9^UGzI@K-_HDk)pQ3@<av
z?M1)zqg&7h+#|JEDdL5c<S4;a`au`OLdj-Z(?Bl2xGbaGUUEPB6wDK#OM)I#dW&7>
zk)^pmd~I4slwfU72GDz-C(Q*Rq+n_UuA%p8Uws5O@>Llmns=*LP><>@MhYMulCt|{
zA96HS|BLyZM_=s=0?BfDv~!~}8kNy?vlGL$C9_pqIji~P@H0~;f&|%<P{5%EaOWp@
z4P!@TG%BMH+0v59qh@4ui_9EjxAnyEd8~Zu+zpz}qh4gxLXKL<Q40x5i=#orsDm7J
zkfRQA^awE;AB~<MN5kXM1OjrWBZwF%<S#O>6iyNGg05W&UU_;VQR`SW^kS^zwftAD
zdYVlOW;8x|f8u8FTApEBcA?+*6LxIA6fx(l(wWuqWqPaq&2}Gl+HGZJO=x{Ocywpn
zmFsp&q_DR%OMKVa4NV592i@OqetUMkMRl*)hYu3z?1gXUE*-ZgbnNMC&%@?E3*>??
z2kPdZxwgZ%>O|`7@jvBm-s*B~^0JWC38#mD_Bwdh&o<=?f6gd7_rO3w>FJG&JC8{|
zey|e{EIM`e!kAeOW7G~mzBTc^eIWQUd%c<3;mZrwC1@3#c)coO2e{wMgWoLs@H0w+
z!sS^yldF>XHy&7+p7wNZ+qHoB;R6!6Tq{aAu;@ho><#DV^xPYpU8@SdoGsmPevYHr
zboh~UwjH{B_QLRUe)yTT^VmBI7wrf#i71ivvMs>p6pux(Ejdh(4(%opC`Z{{JG1HZ
z+D#QtkD2VMUVgrOx<~ATw(t)h7|isUb9A;%cszUj<khDZtUDoW0AF$+>rY*M3*6pu
z^+a&9(ATS!exBv9Vao8&?kH#{P!hc8fY$0h*)26ifm;}k8VFVx$X1Aos@1T{0p!RU
ztSSvZdql<mq)-w?T4(z->yfN4&3vF|nq8$WzpXGlpkN(~hL5q(RP4UtgX|sae?iqH
zYCGGt+4vERhg!NxCD}cT-H7&Sdxq5GxskM-oa#;E-`0qJ-krE`qb|kkK^W%42P6Tj
zRK7~-*}-oX=6&N^HKy535q!z*T$UG_dTZk4{MkRxUAhM7*@nHLW0!pR*(}P5*TDtT
zpQ@&U`3ItiM|XOD5xZT>uMSHQO^Nc03G<6P#N{0&K(ZXwp<7+`2k)C{|AMGOdX^Iu
z_pVMq?}0OoA!YXat!1-)h&pM;)#=gc*wa*5NafYJRlgkL1l@bEbH<H%4SKr^Q6D~t
z1n@S_*Cy{@J#ogtiH5FYc<Ga796Wo#`}>1i>vxQYH6Li%odb*D?eN|3&wiR_v%$r*
zZQ@R|+Uz*Dz-bNH_+-_mccoVt?=s@9SQ;##yJNvSvsJh%x9zwVB{j%y7HUR9IwrMV
z8jxn;wobE?Xuz+TMG-J7e!U@^z`kwE-n2U|cyd#D!F>bS#}9txstD8E&0|7VpO~?>
zZpZlJWMlB<o0wZO*1imz3-1oFbHQs4Z<!B2vne0<)3mu+?(U{Bx~H|J%4I)_s~z(t
zuWW708*n>qA)ot*?#Psqf?1S{iOT%7>?VigbsjRO4Iwp+>mj$8WUPl&_mKhzQB7Sr
zFR;XB{N9x2;PnvRh3}c>n=STmib{6jN9in>gRHIet*;BNA!zUI<<yb`d`yjbt$x?i
z>B;p^OFN~ml@YCgSJEK0nR7K6*_AU&Q%JsNxzCyObl;i<*P)5&V-eMUhbWDV1ZBRh
zGLOd_xKJO`CELR`7ZFJ}<-Ud332G(zY?_xS>%__~8cbvBx`%Cib?+MRTfmFGfri+S
zt?pB=ZXA?LyjAw1c*+-6yox1FB4$}U7fAv9hn!V$ap!7a;y>H@0g_~Zj&*90$fAgS
z!lxC}f3cjFB48PvpGC3mmCT|j52RuUzX}2?mS!~bTVA>a27AUS?mjkk5&S^igX$kX
z7(A4$Isvor>X0HNBhg78+~BTl;5ql3O@A+xb<^K%)wPf&(;;&8UOoLU{p1jn*o&)P
zu1AO7p`<EJZwv0j@Ala-56M&@&$u&uF<DkYthwlUDZu7@I@D=ONyz!N*2Ods&<i|r
zB?hMj-Rvs5bB?&hQ;0F%BG*6)t)W5Guq1EMp~SBwiINNunHN1{hir+x<l3(v)9}+{
z%E(ZOr%&7P`>lc(W0|4r25BKt!~-u!hdPN8M%EXSO!??5Z&z3T>d)Hawp6?;3zG1T
z0!Ola64S{&?g&{DWq|sN^;dyd7!HVJq@{GpykoP<aKj-Byo|taKZB%@1O*F?&c{e%
zj?J>L_%dvey(1G7;q?cz3yJV5<hL*T-6K^Ihr*##Koml{tdicdRriNDoz2?L<ks?8
zl%u<ipSlu$G}aM^+M#U4jxHQ@TMzP<OXR|#Gu;EzY$~6=?9_IHefqb)x_e!>Ppd@M
z_OGWVC=cAmNV}LBxPkI@T%6;qf$|5w1V3g?lmIp`Z#M-#|G)5#f>{*c*}Eux3Bb|C
z31l*RMeP`(AmFX8wsWo(g8l~hZzv#5gnbno!}92g&8#8&iteW;Ot<}Nzgp&Qo(No)
zR>7Fz9r`9m0KR-yWe}SHpM48Nhj761LA_l}r!CWV?n%v2;MS6{1KElLZ&B53ld4T6
zG`x6yoJcAb1~}g}X68IVVF=p_Gbm5utmSUPk%rB__07Rn6zbz*i7>L1w=<{#Ra1r?
zN{dgfe(3hI8~KKq>wExF<@7pLQ=6VI76<0I-<5W~Qnr<CK5Tp}J@R4vYR*MBGO;94
zFI}!N9I0>{--w00ozrS(nbS$`In%h^*y<h-z*}mNp;XE{-K2HqXssU+m8s`rC?jFr
z!0qeWrA}J{r*nk3r(qcbkJ4u&8cyq7uldCa(;1DZux8wo>nukatWD@fGDezs5>ZVw
zO&As32v4h{q8sr+e^hj%qWd>87o)ar#7Un~(T$4k-^nD61}7s<!i|b<RCNEwxpwq4
z!5HbObyRetqWhdq{_C>g=xJi~G%<Rbn0Wb*6~fWrWHdM#4Nks5myEiJQ8)2#xQT+=
zL77xcS}7SCNHUTB+(E6BvREt*!Z@JgRJfKk{eXG5f9*bdThg8Zfna@{gwJLKEVDzj
z5EI|sjmBi{V#sa*aMe&hN;=qkE8eR#1IM~s`SMhN^B6=6GRNad7@|ef{>XQJzg6Et
zt%MGCI%@0{^P}@$W8b@zdb!+W)w!FHeZfSj>8n=P$~wvEr0K49;BHy5EIN^VPUajy
z-P66pyc*G3uf}y~D&-C)P9NhW^IOa8eN_EWx`<N3ingL)W2sdMvmPQ^J+gc~_r<RP
zZ==EDb;XL%Mq;3xKJQcgJPZgTzx7P?4_OUyv&abFQdZO{sg1F7Z92R~%(<RHO-N^j
zS%nHT^fZuFmb3nrb+554u@siQ6=f~X!_<xblZVtBVN}stiA3bxJw+4X82h6|*ON~^
z9JqsrWO#!$E^!`wI<<bNx`x<fLq)U_X0(Z;rdeZK-bqI%uZvAT)r2$5a^D`~_jtQm
z0kSAfCujQghl2wgYvZR0@xnr^Lye5u>4>#iy<mBBbMsww&PC5&L~Dk<--vC?e+}s0
z$XTz+wluSeX?TqA^%Y%AH9LjNn}OY(nTB~@FHI?1jVMg2ZH{VnF!iQAzfhdP3R$1o
zb#~HnwBneL|2^5wrTfp&cGmFrnbrV?#rpgxo*CPbw#{s%v81GTDbarVr{8>b(G@B^
z<!owr9hmbf85tlz*bLIZ+jSjocj9$98n(5bCQw!^4u`9JF6gqE7fY|2^676+RR;U6
z5vC_xN$Rd}<nuW<>JvH9bq#29TjJ;IZ&(kWf)BjHePPlbsOc~>rg~{|l6x~*z-4B1
z?e{x(r$*<~_4Y5bDKB&CmaYJ(2`fdrO4+`{I~29uH2j3_c$X&936HoV9P-#tzg=`!
zfg1$thk*P?@W?gjaQZNM<kRmxo2u>1UJDHz=3}Dub$Kgn4H8{SU7N5>ElR@Yi)m64
z;uvHs9bD{3;~}$wOvQonU>u9KJrV4)9MxzShHsM#h9J2XMr>eB{B-FFKmb1_uXSGo
zDLe96M5~7x=hGvjWOtq1)^X-mHB5U;Fr548cUOI{?d()73+VjS68h<|F>V+uA>QJg
zjOJE~$A9{*dhi@|0V)mEn1}j8nam_Evsd@dv8x2H->>tnwsWGj;fup29wwR%xHSOc
zMLuVBjO)p<bNh6aXA3C_(;uW?t`7hFf}V*ApV#Dsp^NF~JHD~7DgX3$W1d9L`n(!r
z-rfG6_$LX%#A#rm?lF>wWYWN#{dea-v}6p2LODIKX7?yIEon+Kf1332+`t7zvqt`w
zDivMzyv%_>TG-Ig;dZ?Y0z+j7wlQ=DyM`y){W64%ej9ypN|}dc+S|_d2cmw})qL<*
z#ix(w8I!i12VX_)@Yjbq*Y5bo2Z;q92HZ+(%{;andh7YfwP*KGYSjyi=Xkq+_~-Ha
z5~H;_kF|4^>PvoWy94gJP|e<k&h|Rw<syxbf(^#~d6y$`#&kmTxoA(BKwyQT-8C|d
zqplgx<s=&2J7+P^G1JMI_lP*gpVoC}s@FRowON%(SK1o8j>g(Qn87YnzBx;0(AtV%
zAr)|Kjk}^PiO;yc#iI2ox0&%z&1*86?gk#Pe8P^Jc@TfFI^^7*q7;*q?tB1C2LE(B
zTSr)lP3gxSh_kKKdU`$E)ntd+D~XaYXpNex7eixaEBI=n4}W!oR4KCY+x&eEJUURJ
zrw4ZrOT;qllW^$!#4hmjK2oX=iEO)5*|99o9IJd&Yh_b(eq!WWYrq908FEp5kaPA9
zYJY>`#{8GH1=Xn27IPivnR}H}Fjr@w<5uQv42#m*s%CP1md?F~*IdCFm)d2FnsCUO
zR;V0hdjQ`W?&oY+QJ@?9t0#X&jo;0iIn*^byG;Fxm4p(TjamX0zoa;&j>sS{$vX%c
z(|;00-~)`KFj-MQ#>cOyA->8%m)<OGFW3-%O{D%#bZDbdYrN&sJn%K>DEzg?-cmOw
zuCK?Z!EwWutm5{**rC%i!Yk~<XT(T_K{UZ{?R7nLc4T_3dfs7h`No%)hBLt(iZw4e
zutW8yrtr_Gy}Zf4q-7FUU6#z|S#P{<()No1cZsrHs&}Q<6{sd0Gk-PLtTAnET;)E(
zefnHA`{*(kdkp;AcfF%)89UCypDKzwrp=Yq2gTKHnny|cbpUk;1oUjf{mctjsb%Ke
z-;R<52__l)X{MHnPfI!H0|{zs)JX%G3gr0*)e7PN_2vp#-oT$pw(nEbs3=xcurp>R
z`eN@poe<mcS2}lZ{QjU?UaQ+Ct@hcM976U>uVjq93d}j{^q$EnGg>W<ep9sL{8%;n
z6{g$JJ+6xuY1(V2Cbie;JA`fQ2|92-^{vt3kb%89J{*xa{rd9f)tiV_huwb(msJD>
zaBe7?Z4)aAW8IV}VvKf3R=U1YYkR2LEDxJ@y_DHmBBO&Z!k@4kyEaw@PbAh{_1w!I
zD4)n(aO=wUmIu_C9*_^;{N-6g<CRd>FC^MwgGBeO<}tNkaW`)KW^&4<TlvR18#>dh
z74e<tr(jy+v3Hj2QLWmfQp100SbEST5<nQ$56jL6np~d&?h-kr7knknhreF2Hp~g_
z`>p$i+sm{{m#AAa4|)~Wp?>&%KM!y1l4OXYp4u9gf+5W}tkh?}+;KjxD;7Ov$1Ly>
zxA!5V`;IMxcz%|rbTGUjEix(c{VNyn7~Yk}CHG3&y4sH(3h2Hv#p~T|wOL1F4PC-E
z#v0n4w<&+aXkgrO1glAMiMrf$L$$%3HnVyY={h#GqfgNHviQ?022~l;ug*suW1tu3
znKki~D79Ab+cnHa6JIw)9!_x-bat|FnZB2F&iu(5_0-bNPEn&44s?+h{;tl$n%&V5
zq6NA_Set89YZI~8=CduLZ_QxS)^FbX%6LV{mAyILHGI^~JOljelCe}$aKqw#aTFoz
z;<SM_R@gOx`n&p9g|;T{Yb&Kb!r;?&vARH4OZ|a*c^Aw`Pk2sB=k9l1*mRS-&+p-T
z?JUd0tV6CmJOA{`k{F9U4cTE&*eb5Md*^I4JCBN@{d|7Qyo#60430{kR2}@jHJ5@S
zmYf1d1((n*Q4R5*mGkBd%t~qNjA{B4+xILb2Fzhuv6k2jO<Jf%*ta4NGxK)^wGp|P
z9Rk<gcgVUJ2wfi-N4HIv^BZra?zvu_<Y^44HE85~bMIn~QM~Hq>(}F>Z3DV}c2H;D
zMGsuL?!RuMd&88(X(^W+DlHz*o~LGV5*VGk9X9)#5)B+9a2U}q88ba9>{4l{^eAiU
zjlP!G#lY6NZAagq(Hb8}$n4s!e6-P<L0*@0d*k`QcffZfMcXs_`>s;_&UPkpx23&3
z+_&?uj4Am+-YyXGY}8`cZrb>L>p9PHm}7aTQC<voWZNg}i?+6J?tgK&w*I`kwB1_0
zurnK&7*XF0#|ooWA$RuL9p#7=Q@-=ke;t;AI(9cPdVNL|S#%y&$kL$f$S%p1v!N<#
zd7arn8Qsf3k4DVev-cFHKS(W0R5r|P{H^n8a=Vq^zGl1E)WrW&-Iazlb#CiEr>9q|
zRj5^{3Rt9w1CT0%LLjsZ(lkIE4h9Jji%by%0+BJmsS{u-R8f#2P*D<PEK|Z5sxrtB
z0z{w$5D7zs5H*BA!g#-(AZSl}|J@(w7d-6jZ?E;Owcht#YwsP384fzF7k9qy9J^Qt
za!~nWOWhHlgD*znTN3WR1@P$TOcFdU<BS<Z+p1BpZ!Xle0#g<2ASVii)y0yY{!&$3
zTVc$Vy>&{A7en$QW$QG)!&;o*IE{kUS?J6UIpQ7;>eBbt*`OC{SN|Y|#TNT$+^z4-
z)31;$*rx3G<ocWlNKkxdk{dQH^H8p&-JgHGc;Fo3_uv?KXY?UW6>lXFxqun9t4`_A
zQ`&C}OCxhqg0G`caPCopj`In2+PHC{JD#sc9VX!V$~9Hy-^fO<e5vfNX-f`(Ya;p^
zto37DChbam7_KMS^TOB^uyG19kn_Td*}}na<J9H8B;~74>qW-_VBQCtQ(e0C#xpl#
z2o>!b*>}O#j!RXq?InAeF8!kGN2ysXiOe)^knstL#+#}at)F{&9b%1i4W0|CD+T+8
zjG#v?+>5OAdk%Y86Q!vl8CDW<YN9}KTv8*?iDG8P-7Fes=B_$DPp~LO&lYQ*`|h$^
zZvypVpUcuOT$P2<lb&U0^hGZ9WNH47NOS+OK=J;}O86msW8bMRHv%I}J%9}YFT2?^
z6T#eU(w1OH9~9fH4~X(8UIdU?^90h*V}Z|XcD9U`VLNrXgyiSqD7gC=1e9f}5a#r_
z#FzS5l~<pNWj}Xw3OlCc8f4O$wP|R|Src(Of-w4>IgvGbhHQMj#dlO{C)`zHyr185
z;3|kZ;U9{{Aea|7K>#er;$&Y~84w4EQq_KSnDxvht^fu=Nr|v^Kx7$TNUf0qo95cD
zwX4Ifg#I$K1I&5A1L)e|pi1Vs5a_KoM@Gi-UP9ClR7v~!mjIiVz1)_t7E9kyIQGLM
z@}y716W^#t!wYLp9<zvYBzRp3eW6S?HVG{K5^ifJ1)L<$lMAi_2MTegb>HS@hvQ0%
z^y%o0;zd!Q&fN1Z6jf`Wz_eyc_Bb12RpwSrz}M-90PsMBbimt(;78#u_jyg}p_>)K
zT+%aw?riqy{v8hu3%6t`(=J;saOI%&$BsRf<HFKo!Nzv$MeF6nb@tnM@KbaG=@I^;
ztD*1{@?_WUsvqJLPxANHH66IJm)vx=#3{8)8#wu`=d)39+d723jm&>B)OeeaMlmkJ
z=<ww}+EfWgTN$|-yPETx&$I~Al}^Vd26qW!oNkMfz)KTlYC6LG<RXnNy!-g?E*o)<
zev?wTP@F-#EY2UvDIT=<Zd>*rns6w6J)tdJw&VI%Rc_ZKxB*oA<kO<^@r*)be7*fF
z={rkZze+v^AJ>W-$<C#fUCwL>Fk<m0><W%3a>Ui1-`U0CK1ORP^X?T;gT^QD!k4tq
z*Nc2GA6F73rNM7GTSr14W`j-m?v7ZXskuS)wChusfd2rvo~)EwuB8WRmSi6YU323W
z_W+K0f)<%ajqocn%tZkV|A~A4wi-=~6C>VUm7ZyA!ik}1Q5Rz)RD_!)!znXY7o$W1
zlG_bs8f~J{KxaeIFT>OSS`2M)PtS;a2>~jv8mb?3>8LBnYliM*@YupsF1({MH@Wn(
za13+!ewuL|1sFhBPdIi}nZ3=u<7h{N<1>+q30<@FyKR=FGUb+pT8<!PS&j7QhUZdo
z2=%lJrD@yWAUihog~LuulUfas5*99$-?zzgZ$(2xa(W>UWg(26^wa|JukQs!D%uT1
zV`!)fs-$uRQ1Qe0=Y+t@<LGsLs!#hG{pU{4agVrj6Ux00sxSXbw!2WZ`fE);5f6ZR
z{}cE0$#ekEr|lXoB$pI!?wYO2KgX@TF1b3O?>~<UxTxdIAR;5Sb7DBdGX8!)t}@vi
zcx#!ik!cDtn==fh;JAn!^T(o7?Sq}pB|0o#_qW+$ca%Xjk4t;5IXyf0RU-)HZEqT<
z^0zBT)K!6aq^ttr6es=}b+}Na*D+9++Q<i0Qa>$ivAS(@&^+pl%7K#bu6({l_w*y$
z5aT!+ZS<yg`ONoW{abM1W!`bc_Vct#^xP$C&%U~C13HoR9MqlR>#q};zm8wr5MVQl
z!~sf{_Lu&<>RKFKiwL*jPb}-{3at+$>EmJdC#{7645XeqfNhv>c$sA$I@-x}shO&(
z+c-BJlRf<2A03-f6gM;kV?M(*Kj&@Y#~YHfQ(OZ7hQ?OBZI(&eV~jUwc3a`T`?FBI
z(_>ci8-!W;HC{KntYCKW;GM8fJ{5IGXxOSSUIe`pR=(%1g+@g9CcwVPWFL(v)1CtZ
zZFQ&x2-<P}xCKzS_aZ`Gg6fMRv4~GV9Y0(74FqLQWW@Ot_9fKaS@#*~hm?+ob`UlM
zVV3=W#OpX05s_8Vy*R2H7q6Oul`AdZb6VSY{S}tF+%uy`LJHLSzQ1~8_M9d?vjb9D
zPYjcI6TYAgI(3w2#B#^)Nml#o&h|V$96s7RUK$u>KHW#GcG@1Rtfc*CQP~~MO#w@}
z(Vw~fr1o*(R-OQWm{ze<W)})zn3MRXgOWb(Xj)NV;HQ;l<>^IZTaVK>Ru%R+R0xUA
zpgO{l;)4!KKu>~34beLOlUiEI$dO&c)8EFjS|F9Ol&358JLyBs&v_M`m^B%|Iaxmn
z1b0MTr$edx=q-A!oqouR+%!x8kSo6^gWjd>OVIm(K@d5>A(q`yTuyqFXq*+M927!3
zo!2_z_<vL@=xFoPaY~DO>fG@!*_wa$)Ol}mVTJPPBEz@IyBnJx1#RVxY_q&wKT`Cr
z9mq3A5gY(7RirQyg0BR&O`p;3K55;%xqux;9-9(FG-A~Q`~)=8ZsgqrXr$c;wi60#
z3EpCV<(>Zc<V{)Nb!IwUXP^Ls$U`rPmQ_v#XK5cuE~V{}ylU-Y<sJdO&iCL%|Bykk
zZ&Q)RobWZ&^>tg-4n(pGJ1@Q3qRU0;B?YGUCwmngO2nxDb!hWg7Zm-ivue9_?7#;D
z4MhV~W(`qqf_3+R*r+MsL_%BoURzCviH;P0%w96m+_Xf8jP@=I0?M;zNxOP)f}q1<
zzpUE;k!RQPIcMo@1asN1<l!!u4{iv>nKHdnK4J}k%EkTQ2GJ3y4;r)R#yLl$eHOW1
z%m88^%W(kRa3BrSVLbSH8M!Cqd~AIr)a&KNcsT%=X$<#iaIZGpbv~_Tn`JdJrC?l=
z_li250|%PLuHbI;%-=M7WlgnnyVF1$4`te%)?XJeGR^G|(v0cu+!(jJYUC17a6B8!
z+cu)Ny7bnGegIl7DL;*WvK8Zf-v<_WBEd~OcbpCzmqagQ-VUNBzLEYAx<|9%2rBlf
z8pi2oN&C;ryDUM|et>Y<r<r;zv+q~oS3#JNM7`z99g80QZrBh~ap|Z%VnBIUC>z%E
zKV9qPg!}7_+?!_s<<+|E{Fhc8V7;h2#!0!&S9-+8eHmT>zP~E+w%GVeE|AnmV{Lu!
zm;Vq?dsbwBHq0F4k@nT`QuNtvJn?(2F7#_u#i1l2%+3RbdXLcqJdXDh*?QbOx5esY
zz^p^ujeAeIS(%?TnQj8X`y+xbD)@|!*GZm#ZUuW()8_8!BKb^{nKN^OeCJ-5!HD!0
zSD<^U!I7=Z+t_|-bt?Kh<-Nh`1sy$~)$w9Ka^vb8^P`Z?|N2wRn!w0-X}S-*2WK8W
z1YS_%m{>$FrN`e+q-kOE`cuqb$NLwH12smOU0*YMh`y<e44lO#+bN2unuKk=FnD6i
zpl_uS3(GFdyrw0ihn`~^c$NDb#l0~aNFB@P_n@EtNWz*K4XPOQGg9kpGiF9jF`K(-
zVEXmXq}JNWD)Hfh*w;BzU<~&3^I4ZewG&kB=)uiF>qPl?aTgooYs6FV@5MRur#K5G
zW;)Dx!@`w|jfH~RLq;t~k0(oGvI*0HhogIiXZMCQ9_|e@NeCP~_kmq)p>9k)VAsC)
z?7AtpYrEX8*;GG!akp4N8~TQ+myzmE-u@bE&(mt6<-P<rOEc!MvRegg@KR@Q2p{+2
zZO-ef7X`0kBlN>Y-}Lb2pT{wAs365aFr#4Z$(x=|mjJ~^u|%c6K29W7g&oh7-q))N
zt8xT{9q=1PWd2R0hHncn^7MIR(Ccn-Sou1AeLSMKZBpY)^Mo=_V5lzrfk}u!X4e0)
zYO-Obzc)$AF0+waoLU#6g6&MNl8`h6KOI2bW-|<!>!|Frgww#_r?grI6(OQoM9$CT
zYs?*EKA;VclB+eGyW0E_u3Lp=(06z!RieNQ<JLNTnI63LC~toHR#Tfaqhtsr=AiV!
zGVHiQEfyM9QL4?Vz_Kl3RSZLK(Z{g16J0j~Tl|)G_cb01ZkYXjIxJ5w7fJFil7Eap
zq)}e}K;{82i8wQD)}567HM8W8TVnup#21uYTsle2zi>KlU4ia##9*6L<1PX?Z4{UA
zk$6wsox+(c62&41oz+h>f5_JJY4OIZgZ@uj$z=)~d{?gylh-QlhfZ4Bf>#M?#ge@|
zJ2RAVwyE{%obvaKmZfHDYy}*q*Vj%yzsst3`(Rs(Nt;<}_^V6OHg{BN5F>;Al%;hS
z`q1{l?YQ=~$zZp(fUyoRpjz8yKaI!JzdmHMq;zR&a05de7;lh3)u{Yx)jub(On#m1
zgDN;qn{;gn+kcza7EoOdxnh~m1os@pVyxD)Lh|5ehKDI)aO)`hBC*aq+3Z3S+uu=X
zz=l-cQ1s?!fBq=;`;zjrlVYEVdmGWQAQWJB=PyqZrL0djWq2^h`rJ;=Q0AunvGjYY
zy@+eY224tFP<oi5r2P{Sr9R1!?`NJFlV<x{PykZg6zugECSMS*4~Fs$Z2g+Kt9j*%
zScYSg_Ch%ahw+cdE#VDMa(mv6_6Su*QQ?)<q?<ifxzON_UQ-=7)oE(V%Rp(AkMJ2e
zF@8OMyP0#-IkI$yFQbtmo<f(+qe>7pz0k%#SxBF$(D)KZi!{Y|(+;QUI4b2=N*2J~
zyURM`-3!y@uS`7{=dEDHk)L@guI_4xS*ryX)yLE2Zz&>)u+@)0szxJ^?O*d)u=}ot
zDk$G43a2W43f9Ui&u@v=c-5aw`%SS~`l-2fjlG100b^8i@-#6FG$G&)6dzry{cs^9
ze5P}Hiuy%TcL#u^so%8+2PP1_`SNL`NLamavU8z)dMxY!Sl-kW0Fs5i`Tn&!@nbQR
zs;&)wkZ}&GEJq%ktcPzK2uCRO*t8?2|JDPaU32u%4e;T<Fq6jdtco92%d4nT=Ktqo
z>0Ib`UtueFEFt{WQ7A4}D}EHhZp=(kC1u2^RS!1vuweXmm@j;akw)pUB#Av2J6yUb
z9E2HfzRa)(?bf3$dGxN_TZ}9&K2!13NsZt7VUo4@=&wbi-}9eLgN%Ab)#%@^c(3G>
zKbO)&cPsp;_<8KsYQ3FxZL9Ss>#XD~v|Pf;1Grx}7%$nD{1`u?K)q7jawr8cS^4dr
z(U;Sc(?hGt1@pg{>-RFGT(a5LP6GUruTdx%8`{ixaSy&s#J9N~4H|Eknhu!t4|T)k
ztw4}s+n2z%Njy$;DUbzwFwF_Q*W5hjzid{d$)D{m)nXbj%PGCW>hxikqe1ThoW7Qi
zEeT7C{A;hG;k-VcpihA@o`%VFjgJVj-8c+@V7Trh{$h6<jO=cDXi-RapS$2^`XZ@w
z)v;Oh(h|J%5mr93dxQX`r0<=l-n#|BRgde7g;Rt*Yr`xRtk;{V^k9!@5=F1j+cm98
zTT%^%+ThktMSXq=Bbp9LHnXNKqrvd&ebf@qo#8hDEv}fn!`^l^p@s^MzJw3&o0Jz4
z|D2)vS|L^K_{pE_U8Ja#+z#Rz778X7=INm-?=6?^Jl|ZsuzPuC9>XOzYfFAs8bwti
zioin<Sa|IKO)u+pn@~!Vvn4)cFBp0i&PNR(T1M6DLL95C02|h{&I*FN7RJ87N97FU
zgL#_1i#h+-H$B2V$%VG5Ym>5Q@GQXFuQ5HOzTaL%FE0*%P-1OeKBj9W7GiX1UIlRG
zdGBBdzcBa5W7pWUYyE4if{x@7zCqPm19A+1nR!RMnZFW6Xwl*4T+G<0s_aCjwTT;B
z+Ro&*<b%l_hMgG?{z*?)g2nAoj=GDpE$DumK2Bcf!VWx$R1xLN2`bo)S>US8N*f~t
z8l|?~6J6xmKL~3y^m`A?@hmj__(383!z#=68C%<PzkUAz+%%}DvZSn(FV-|e_IjXU
zu2KLjr4Q@c80f5df)c;!<L#S-=tRwXU#f{H;GA${IVrB&Y9sjiFe6Hsb*8nT$!FsO
ziZSjqN+D)m-ojOO1q(Nef5K@qn>y2LpMc1SWo9ngEEKAvRgV%>H!GN_7!zN(V+hmJ
zE(4Pt1tZ~E4A#T*g3+fR#^i)y&{|9wTOX^FQK@LUK@~(+fAa7W9E#Tp-+*haVN7@D
z!eCLcwTz_5xzpFZ97yTTf~dR9V;D8APRC|?8bd#3{Atr_H6{C%QKa;D0dPp2W%YUN
zORcaP7JMJX{$TSxS;^)h;W_8cKivI0K0DTG0UP&wNP{XvVfCMnFzS1N`hxs<|45^A
zN;HrHE8Kc23lEqE(p|Xp+Ni~xm;#ehbe0e7?A(R${>Xw=5m4BF4lc59#EgacLBzLw
z+mJTQXu}q5u@54W)bS3DZ|*k8DMW!~d3iE=b`qh6LNDG_^K9neZABL3S##dY^&bE}
zzr(WsIHJb{k_^h64~}#<g9?|<DTGeR7JDs3TY=FA;--I6W+bFznbr~8J&SZD`nu4F
z3SxYWUzuyfA}=@QRDP>038;ysN5*RSZmYC>YffIe_!p@u;Yep*j4>8Dk@JpSBt|%6
z&Uo+4nGewEbb{CJ)dapE_`JVVp(i0K{L5qSQsVvdoCM-%PV<&gu~3ov=BaVg_1{DW
zs2sp$+Rh?dvENd0MJJcAnezlNzJnw@$okr@V2=IuJ8Y2k5GOF}i9Z$v<{QHDZ4JUK
zNtAI!eRKYUFuYtaDqu+9%M>1CH5*SW#4x0=N;Fv3Yv9_g1ysr%g-Y>;j9As1`L-|n
zc;pp?2{-&=HPsrOGoiEr!WNQb-S<;s6Fw5QlsnCBA>dlqNswE?oKfY)NTB@ySLb+t
zq+AXQ7~FyZn$sMSmzKwt(Lgv!<e7cfvs<#m@aCyab0$i0g&f4$BI04Zn=^W%GoQc9
z8lnf9FLRQ{`84qk;gt<N;hq8~_#B@NtJcKK8$z(tt$-cG4XW}Q?4Y&Y5`c5^9sb~?
z#yR3rB$ni<s8yL^swK(82iKH{tBvZ?LA0hBG$#|y=kAe^=*HPuq+$}J9=RoCP>!86
z2G@Z!V4f_uW+$?wim#G+^rXD&s{*6*_k_KkZ<Ohe#UCX8`M9Id?mq$@3x9}i{SD<C
z5k+)S!EW9tLkNhFEJ%Mbv@eZciSsAJR`ew{>vPDnb5IkOrzf@mClW;2E652>)M}{S
z?rt+{<N~Hxx@m>+!Ao7t>*M~F+guMfjKm}2cuaW`4F={4>o7|BTu1;g61~hzdy{-J
zR6tWAY4^h3O08NEx%dc9bE-dotEXy#Ev#Bmxc^VhAlg^=ZWY(#*lpN&ctf#l!U=as
z;JPt$25I&-1J!NO^MG>FY<a#+dMYov012nP;`N2e)E`tFmk~K-*sR__hawB0Zx8R!
z^s5Y(Z!FXbt`0)}J0GoDHUGcxF|n$JmT1}X$8MhPmtK6NrUJQwv~jR5usn0=e*vxT
Bn&AKd

diff --git a/tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu b/tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu
index ffeba34f4..fcee155f7 100644
--- a/tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu
+++ b/tools/test/unit/gemm/batched_strided_sgemm_128x128x8.cu
@@ -34,7 +34,6 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_256x384x64x3_nn) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
                                      cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
       SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
 }
 
@@ -44,7 +43,6 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_128x384x192x2_nn) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
     SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
 }
 
@@ -54,7 +52,6 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_127x384x192x2_nn) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
     SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(127/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
 }
 
@@ -64,7 +61,6 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_127x388x190x2_nn) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
     SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(127/*m*/, 388/*n*/, 190/*k*/, 2 /*batch_size*/);
 }
 
@@ -74,7 +70,6 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_256x384x64x3_nt) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
     cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
     SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
 }
 
@@ -84,7 +79,6 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_128x384x192x2_nt) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kColumnMajor,
     cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
     SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
 }
 
@@ -96,7 +90,6 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_256x384x64x3_tn) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
     SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
 }
 
@@ -106,7 +99,6 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_128x384x192x2_tn) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kColumnMajor, cutlass::Shape<8, 128, 128> >
     SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
 }
 
@@ -118,7 +110,6 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_256x384x64x3_tt) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
     SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(256/*m*/, 384/*n*/, 64/*k*/, 3 /*batch_size*/);
 }
 
@@ -128,8 +119,8 @@ TEST(Sgemm_strided_batched_128x128x8, sgemm_128x384x192x2_tt) {
   typedef cutlass::gemm::SgemmTraits<cutlass::MatrixLayout::kRowMajor,
     cutlass::MatrixLayout::kRowMajor, cutlass::Shape<8, 128, 128> >
     SgemmTraits;
-  //think about using run_gemm directly
   run_batched_strided_gemm<SgemmTraits>(128/*m*/, 384/*n*/, 192/*k*/, 2 /*batch_size*/);
 }
 
 ////////////////////////////////////////////////////////////////////////////////////////////////////
+

From 0826572c4cdef98f1e946fc1b3ad52c355c6cbaf Mon Sep 17 00:00:00 2001
From: akerr <akerr@nvidia.com>
Date: Wed, 19 Sep 2018 21:11:48 -0700
Subject: [PATCH 4/4] Reduced range of random values to avoid bit-level
 inconsistencies for large matrices.

---
 tools/test/perf/testbench_options.h | 12 ++++++------
 1 file changed, 6 insertions(+), 6 deletions(-)

diff --git a/tools/test/perf/testbench_options.h b/tools/test/perf/testbench_options.h
index 25dff1526..eb939cb0b 100644
--- a/tools/test/perf/testbench_options.h
+++ b/tools/test/perf/testbench_options.h
@@ -263,18 +263,18 @@ struct InitialDistribution {
 
   /// Basic uniform random distribution
   InitialDistribution(int64_t _seed = 700) : seed(_seed) {
-    dist_A.set_uniform(-8, 8);
-    dist_B.set_uniform(-8, 8);
-    dist_C.set_uniform(-8, 8);
+    dist_A.set_uniform(-4, 4);
+    dist_B.set_uniform(-4, 4);
+    dist_C.set_uniform(-4, 4);
   }
 
   /// Extracts initial distribution from command line arguments
   InitialDistribution(cutlass::CommandLine const &args) {
     // Set initial values
     seed = 700;
-    dist_A.set_uniform(-8, 8);
-    dist_B.set_uniform(-8, 8);
-    dist_C.set_uniform(-8, 8);
+    dist_A.set_uniform(-4, 4);
+    dist_B.set_uniform(-4, 4);
+    dist_C.set_uniform(-4, 4);
 
     // Update with command line arguments
     args.get_cmd_line_argument("seed", seed, seed);